<div dir="ltr"><div>Hi!</div><div><br></div><div>My question is about AV sync when transporting HE-AAC over MPEG TS,</div><div>and how this is handled in ffmpeg.</div><div><br></div><div>A presentation time stamp (PTS) specifies the presentation time of the</div><div>first sample in its associated frame.</div><div><br></div><div>With HE-AAC, does this mean the first of the 1024 samples received</div><div>from the core AAC decoder, or the first of the 2048 samples received</div><div>from the SBR filter bank?</div><div><br></div><div>HE-AAC should be backwards compatible. An AAC-only decoder that does</div><div>not know about HE can't compensate for the SBR filter bank delay. The</div><div>only way for lip sync to be correct for all decoders, is to let the</div><div>PTS refer to the first sample of the core codec, and have HE-AAC</div><div>decoders adjust the PTS when decoding SBR.</div><div><br></div><div>SBR decoding delay is 962 samples, which is about 20 ms @48kHz.</div><div><br></div><div>For MPEG-4 systems, Part 24 specifies to do it this way. I'm not aware</div><div>of a similar spec for MPEG TS. How is this handled in ffmpeg?</div><div><br></div><div>Regards,</div><div>Lars</div></div>