<html><head><meta http-equiv="Content-Type" content="text/html charset=us-ascii"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Hello all,<div><br></div><div>I have been following these two guides: <a href="http://aubio.org/news/20091111-2339_shazam">http://aubio.org/news/20091111-2339_shazam</a> and <a href="http://blog.pkh.me/p/6-las-lossy-audio-spotter.html">http://blog.pkh.me/p/6-las-lossy-audio-spotter.html</a> in an attempt to understand the Shazam audio fingerprinting algorithm.  (First link explains the Shazam methodology, and the second link explains how to run some of the ffmpeg fft functions).</div><div><br></div><div>One critical components is to pick the bin number with the highest amplitude, e.g., re^2 + im^2, and use the bin numbers as well as the time deltas as the hash during audio search.</div><div><br></div><div>The problem is, my bins 0 and 1 always have the highest amplitude.  I have tried this on 5 or so clips and that's always the case.  Does it make sense or did I miss something fundamentally about fft and audio processing?</div><div><br></div><div><br></div><div>Thanks in advance.</div><div>
<br></div></body></html>