CN101189661A - 用于产生数据流和产生多通道表示的设备和方法 - Google Patents
用于产生数据流和产生多通道表示的设备和方法 Download PDFInfo
- Publication number
- CN101189661A CN101189661A CNA200680019473XA CN200680019473A CN101189661A CN 101189661 A CN101189661 A CN 101189661A CN A200680019473X A CNA200680019473X A CN A200680019473XA CN 200680019473 A CN200680019473 A CN 200680019473A CN 101189661 A CN101189661 A CN 101189661A
- Authority
- CN
- China
- Prior art keywords
- hyperchannel
- data stream
- fingerprint
- piece
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 26
- 230000001360 synchronised effect Effects 0.000 claims abstract description 24
- 238000012360 testing method Methods 0.000 claims description 30
- 230000005540 biological transmission Effects 0.000 claims description 27
- 238000005070 sampling Methods 0.000 claims description 15
- 238000011002 quantification Methods 0.000 claims description 9
- 238000013461 design Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 7
- 230000000153 supplemental effect Effects 0.000 claims description 5
- 238000012546 transfer Methods 0.000 claims description 5
- 239000000284 extract Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 238000007792 addition Methods 0.000 claims 4
- 230000002123 temporal effect Effects 0.000 abstract description 3
- 230000005236 sound signal Effects 0.000 description 24
- 238000012545 processing Methods 0.000 description 16
- 230000000875 corresponding effect Effects 0.000 description 14
- 238000005259 measurement Methods 0.000 description 11
- 230000008859 change Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000003780 insertion Methods 0.000 description 5
- 230000037431 insertion Effects 0.000 description 5
- 241001269238 Data Species 0.000 description 4
- 230000002596 correlated effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 230000003111 delayed effect Effects 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- FFBHFFJDDLITSX-UHFFFAOYSA-N benzyl N-[2-hydroxy-4-(3-oxomorpholin-4-yl)phenyl]carbamate Chemical compound OC1=C(NC(=O)OCC2=CC=CC=C2)C=CC(=C1)N1CCOCC1=O FFBHFFJDDLITSX-UHFFFAOYSA-N 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Time-Division Multiplex Systems (AREA)
- Synchronisation In Digital Transmission Systems (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Studio Circuits (AREA)
Abstract
为了具有多通道附加数据的数据流和具有在至少一个基本通道(3)上的数据的数据流在时间上的同步,在编码器侧针对至少一个基本通道(3)来执行指纹信息计算(2),以与多通道附加数据在时间上连接的方式将指纹信息插入(4)数据流。在解码器侧,根据至少一个基本通道来计算指纹信息,并例如通过相关,将指纹信息与从数据流中提取出的指纹信息一起使用来计算并补偿具有多通道附加信息的数据流和具有至少一个基本通道的数据流之间的时间偏移量,以获得同步的多通道表示。
Description
技术领域
本发明涉及音频信号处理,更具体地,涉及基于产生原始多通道信号的多通道重构的多通道处理技术,多通道重构是基于至少一个基本通道和/或下混通道和多通道附加信息的。
背景技术
正在发展中的技术允许通过减少数据来更加有效地传输音频信号、以及通过扩展(如通过使用多通道技术)而增加收听愉悦度。近来,已知这种一般传输技术的扩展的示例被称为心理声学编码(BCC)和“空间音频编码”,如在J.Herre,C.Faller,S.Disch,C.Ertel,J.Hilbert,A.Hoelzer,K.Linzmeier,C.Sprenger,P.Kroon:“Spatial Audio Coding:Next Generaion Efficient and Compatible Coding of Multi-ChannelAudio”,117th AES Convention,San Francisco 2004,Preprint 6186中所描述的。
以下将对用于减少多通道音频信号传输所需的数据量的各种技术进行更加详细的讨论。
这种技术被称为联合立体声技术。为此,参见示出了联合立体声设备60的图3。例如,该设备可以是实现了强度立体声(IS)技术或心理声学编码(BCC)的设备。这种设备通常接收至少两个通道CH1、CH2、...CHn作为输入信号,并输出单个载波通道和参数多通道信息。定义参数数据,使得可以在解码器中计算原始通道(CH1、CH2、...、CHn)的近似。
通常,载波通道包括子带采样、谱系数、时域采样等,这提供了下层信号的相对精细的表示,而参数数据并不包括任何这种采样或谱系数,而是包括用于控制所确定的重构算法的控制参数,如通过乘法、时移、频移等进行加权。因此,参数多通道信息包括信号或有关通道的相对粗略的表达。以数字表示,载波通道所需的数据量是大约60到70kbit/s的量,而通道的参数辅助信息所需的数据量在1.5至2.5kbit/s的范围内。应注意,上述数字应用于压缩数据。当然,未压缩的CD通道需要大约其10倍数量级的数据速率。参数数据的示例是已知的缩放因数、强度立体声信息或BCC参数,以下将进行描述。
在AES预订本3799“Intensity Stereo Coding”,J.Herre,K.H.Brandenburg,D.Lederer,February 1994,Amsterdam中描述了强度立体声编码技术。通常,强度立体声的概念是基于要针对两个立体声音频通道的数据执行的主轴变换的。如果大多数数据点集中在第一主轴的周围,则可以通过在编码前将两个信号旋转预定角度来获得编码增益。然而,这并不总是应用于实际的立体声再现技术。因此,对该技术进行修改,在比特流中不传输第二正交分量。因此,针对左右通道的重构信号包括相同传输信号的不同加权或缩放的版本。然而,重构信号的振幅不同,但是相位信息相同。然而,通过典型地以频率选择方式操作的选择性缩放操作,来保持两个原始音频通道的能量-时间包络。这与高频声音的人类感知相对应,而通过能量包络来确定主要空间信息。
此外,在实际的实施方式中,根据左通道和右通道的和信号、而不是这两个分量的旋转来产生传输信号,即载波通道。此外,以频率选择方式(即对于每个缩放因子频带,即对于每个编码器频率部分,独立地)执行该处理(即,执行缩放操作的强度立体声参数的产生)。优选地,将这两个通道合并以形成合并或“载波”通道,除了合并通道之外,还形成强度立体声信息。强度立体声信息取决于第一通道的能量、第二通道的能量或合并通道的能量。
在AES会议论文5574“Binaural Cue Coding applied to stereo andmulti-channel audio compression”,T.Faller,F.Baumgarte,May 2002,Munich中描述了BCC技术。在BCC编码中,将多个音频输入通道转换为谱表达,即使用具有重叠窗的基于DFT的变换。将所产生的频谱分为非重叠部分,每个非重叠部分都具有索引。每个部分具有与等效矩形带宽(ERB)成比例的带宽。针对每个部分和每个帧k,确定通道间电平差(ICLD)和通道间时间差(ICTD)。将ICLD和ICTD量化并编码,以最终获得BCC比特流,作为辅助信息。相对于参考通道,给出每个通道的通道间电平差和通道间时间差。然后,基于要处理的信号的特定部分,根据预定公式来计算参数。
在解码器侧,解码器通常接收单声道信号和BCC比特流。将单声道信号变换至频域并输入也接收解码后的ICLD和ICTD值的空间合成块。在空间合成块中,BCC参数(ICLD和ICTD)用于执行单声道信号的加权操作,以合成多通道信号,在频率/时间转换之后,该多通道信号表示原始多通道音频信号的重构。
在BCC的情况下,联合立体声模块60操作用于输出通道辅助信息,从而参数通道数据是量化并编码后的ICLD或ICTD参数,其中,将原始通道之一用作对通道辅助信息进行编码的参考通道。
通常,载波信号由所参与的原始通道之和构成。
当然,上述技术仅提供了解码器的单声道表示,该解码器仅能够处理载波通道,但不能够处理参数数据以生成多于一个输入通道的一个或更多个近似。
BCC技术也在美国专利公开US 2003/0219130 A1、US2003/0026441 A1和US 2003/0035553 A1中得到描述。此外,参见专家公开“Binaural Cue Coding.Part II:Schemes and Applications”,T.Faller and F.Baumgarte,IEEE Trans.On Audio and Speech Proc.,vol.11,no.6,November 2003。
以下,将参照图4至6来更加详细地呈现用于多通道音频编码的典型BCC方案。
图5示出了用于多通道音频信号的编码/传输的BCC方案。在所谓下混块114中,对BCC编码器112的输入110处的多通道音频输入信号进行下混。在本例中,输入110处的原始多通道信号是5通道环绕信号,具有左前通道、右前通道、左环绕通道、右环绕通道和中心通道。在本发明的优选实施例中,下混块114通过将这五个通道简单相加为单声道信号来产生和信号。
现有技术中已知其它下混方案,从而使用多通道输入信号而获得了具有单个通道的下混通道。
该单个通道在和信号线115上输出。在辅助信息线117上输出由BCC分析块116所获得的辅助信息。
在BCC分析块中,如上所述地计算通道间电平差(ICLD)和通道间时间差(ICTD)。近来,BCC分析块116也能够计算通道间相关值(ICC值)。将和信号和辅助信息以量化和编码后的格式传输至BCC解码器120。BCC解码器将所传输的和信号分为多个子带,并执行缩放、延时和其它处理步骤,以提供多通道音频通道的子带以进行输出。执行该处理,使得输出121处的重构多通道信号的ICLD、ICTD和ICC参数(提示)与BCC编码器112中的输入110处的原始多通道信号的相应提示相匹配。为此,BCC解码器120包括BCC合成块122和辅助信息处理块123。
以下将参照图6来示出BCC合成块122的内部结构。将线115上的和信号馈入时间/频率转换单元或滤波器组FB 125。在块125的输出处,存在N个子带信号,或者在极端的情况下,如果音频滤波器组125执行1:1变换(即从N个时域采样中产生N个谱系数的变换),则存在谱系数的块。
BCC合成块122还包括延时级126、等级修改级127、相关处理级128和反向滤波器组级IFB 129。在级129的输出处,例如,可以向一组扬声器124输出在5个通道环绕系统的情况下具有5个通道的重构多通道音频信号,如图5或4所示。
通过元件125,将输入信号sn转换到频域或滤波器组域。复制元件125输出的信号,从而获得如复制节点130所示的相同信号的多个版本。原始信号的版本个数等于输出信号中的输出通道的个数。然后,原始信号的每个版本在节点130处经过所确定的延时d1,d2,...,di,...dN。由图5中的辅助信息处理块123来计算,并根据如图5的BCC分析块116所计算得到的通道间时间差,来推导出延时参数。
同样作用于乘法参数a1,a2,...,ai,...,aN,基于如由BCC分析块116所计算得到的通道间电平差,由辅助信息处理块123来计算该乘法参数a1,a2,...,ai,...,aN。
由BCC分析块116所计算的ICC参数用于控制块128的功能,从而在块128的输出处获得延时的和等级受控的信号之间的确定关联。应注意,级126、127、128的顺序可以不同于图6中所示的顺序。
应注意,在对音频信号的逐帧处理中,也执行逐帧的BCC分析,即随时间可变的BCC分析,并且还获得了逐频率的BCC分析,如由图6的滤波器组所呈现的。这表示,对于每个频谱带,获得了BCC参数。这还表示,在音频滤波器组126将输入信号分为例如32个带通信号的情况下,BCC分析块针对32个频带中的每个,获得了一组BCC参数。当然,图5的BCC分析块122(图6中更加详细地示出了)也基于作为示例给出的32个频带来执行重构。
参照图4,下面将呈现用于确定各个BCC参数的场景。通常,可以在通道对之间定义ICLD、ICTD和ICC参数。然而,优选在参考通道和每个其它通道之间确定ICLD和ICTD参数。这在图4A中示出了。
可以以各种方式来定义ICC参数。通常,如图4B所示,可以在编码器中在任何通道对之间确定ICC参数。
然而,建议一次仅计算最强的两个通道之间的ICC参数,如图4C所示,图4C示出了如下示例:一次计算通道1和2之间的ICC参数,另一次计算通道1和5之间的ICC参数。然后,解码器合成了解码器中最强通道之间的通道间相关,并使用特定启发式规则来计算和合成剩余通道对的通道间相关。
例如,关于基于所传输ICLD参数的乘法参数ai,...,aN的计算,参考AES会议论文No.5574。ICLD参数表示原始多通道信号的能量分布。不失一般性地,如图4A所示,优选采用表示各个通道和左前通道之间的能量差的四个ICLD参数。在辅助信息处理块122中,根据ICLD参数推导出乘法参数ai,...,aN。从而所有重构输出通道的总能量相同(或与所传输的和信号的能量成比例)。
通常,如从图5中显而易见的,在这种特定参数多通道编码方案中,产生至少一个基本通道和辅助信息。典型地,使用也从图5中显而易见的基于块的方案,通过块级111来对输入110处的原始多通道信号进行块处理,从而从例如1152个采样的块中形成用于该块的下混信号和/或和信号和/或至少一个基本通道,而同时,通过BCC分析,为该块产生相应的多通道参数。在下混通道之后,典型地,再次利用基于块的编码器(如MP3编码器或AAC编码器)对和信号进行编码,以获得进一步的数据速率降低。同样,例如通过差编码、缩放/量化和熵编码来对参数数据进行编码。
然后,在整个编码器(包括BCC编码器112和下游基本通道编码器)的输出处,写入公共数据流,其中,至少一个基本通道块在前一个至少一个基本通道块之后,并且还通过例如比特流多路复用器而插入了编码后的多通道附加信息。
进行该插入,从而基本通道数据和多通道附加信息的数据流总是包括基本通道数据块,并包括与该块相关联的多通道附加数据块,然后,这些块形成了公共传输帧。然后,将该传输帧经由传输路径发送至解码器。
在输入侧,解码器再次包括数据流解复用器,以将数据流的帧分为基本通道数据块和关联的多通道附加信息块。然后,例如通过MP3解码器或AAC解码器,对基本数据块进行解码。然后,将解码后的基本数据的块与(也进行了解码的)多通道附加信息的块一起提供给BCC解码器102。
这样,由于基本通道数据和附加信息的公共传输,自动地设置了附加信息与基本通道数据的时间关联,并且可由以逐帧方式操作的解码器容易地恢复时间关联。因此,由于单个数据流中两个数据类型的公共传输,解码器自动发现与基本通道数据块相关联的附加信息,从而实现高质量多通道重构。因此,将不会存在多通道附加信息具有相对于基本通道数据的时间偏移量(offset)的问题。然而,如果存在这种偏移量,则这将会导致多通道重构的明显质量损坏,这是因为在这种情况下,与多通道附加数据一起处理基本通道数据块,但是这些多通道附加数据并不属于基本数据块,而是属于前一或后一块。
在没有写入公共数据流、而是存在具有基本通道数据的独立数据流并存在与多通道附加信息独立的另一数据流时,将出现不再给出多通道附加数据和基本通道数据之间的关联这种场景。例如,这种场景可以出现在顺序操作的传输系统中,如无线电或因特网中。这里,将要传输的音频节目分为单独发送或以组合方式发送的音频基本数据(单声道或立体声下混音频信号)和扩展数据(多通道附加信息)。即使发射机在时间上同步地发出了这两个数据流,在至接收机的传输路径上也会潜伏有许多“意外”,而这导致了具有多通道附加数据的数据流实质上关于所传输的比特个数更加紧凑,例如,比具有基本通道数据的数据流更快地传输至接收机。
此外,优选使用具有非恒定输出数据速率的编码器/解码器来实现特别良好的比特效率。这里,不能预测基本通道数据块的解码将会花费多长时间。此外,该过程也取决于实际使用的用于解码的硬件组件,因为它们必然将在例如PC或数字接收机中出现。
此外,还存在系统和/或算法固有的混淆,这是因为尤其在比特库技术中,平均地产生恒定输出数据速率,但是通常而言,将特定可良好编码的块所不需要的比特撤出用于例如由于音频信号特别短暂而特别难以进行编码的另一块的比特库。
另一方面,将以上所描述的公共数据流分为两个单独的数据流具有特定的优点。例如,经典接收机,即例如纯单声道或立体声接收机,能够在任何时刻与多通道附加信息的内容和版本无关地接收和再现音频基本数据。因而划分为独立数据流确保了整个概念的后向兼容性。
相反地,更新一代的接收机可以评估这些多通道附加数据,并将它们与音频基本数据组合,从而向用户提供完全的扩展,这里是多通道声音。
音频基本数据和扩展数据的分离传输的特别令人感兴趣的应用场景存在于数字无线电中。这里,多通道附加信息通过很小的附加传输努力,帮助将所发射的立体声音频信号扩展为诸如5.1的多通道格式。这里,节目提供商在发射机侧上产生来自多通道声源的多通道附加信息,例如,在DVD音频/视频上找到这些多通道声源。接下来,与照常发射的音频立体声信号并行地传输该多通道附加信息,然而该音频立体声信号现在并不简单的是立体声信号,而是包括通过某种下混从多通道信号中推导出的两个基本通道。然而,对于收听者,两个基本通道的立体声信号听起来像通常的立体声信号,这是因为在多通道分析中,最终采取与从多个音轨中混合得到立体声信号的声音大师(sound master)所采取的那些步骤相类似的步骤。
分离的极大优点在于与已经存在的数字无线电传输系统的兼容性。不能评估该附加信息的经典接收机将能够照常接收并再现两通道声音信号,而不存在定性的限制。然而,除先前接收的立体声声音信号之外,更新设计的接收机可以评估该多通道信息,对它进行解码,并从中重构原始5.1多通道信号。
为了允许多通道附加信息的同步传输以作为对先前所使用的立体声信号的补充,如前所述,可以将多通道附加信息与数字无线电系统的编码后的下混音频信号组合,即,存在单个数据流,之后对其进行缩放(如果必要),还可以由现有的接收机来进行读取,但是忽略关于多通道附加信息的附加数据。
因而接收机也仅看到(有效的)音频数据流,如果该接收机是具有更新设计的接收机,则还可以通过相应的上游数据分发器,再次与关联音频数据块同步地从数据流中提取多通道声音附加信息,对它进行解码,并作为5.1多通道声音输出。
然而,这种方式的缺点在于现有基础结构和/或现有数据路径的扩展,从而它们可以传输由下混信号和扩展构成的数据信号,而不仅是如先前所述的立体声音频信号。所以,如果为立体声数据保留标准传输格式,则可以通过同样在无线电传输中的公共数据流来保证同步。
然而,如果必须改变现有的无线电基础结构,即如果问题并不仅仅存在于解码器侧,还存在于无线电发射机侧和标准化传输协议中,则市场方面的突破是个大问题。因而该概念由于一旦进行了标准化和实现便要改变系统的问题而非常不利。
另一备选方案是不将多通道附加信息与所使用的音频编码系统连接,因而并不将多通道附加信息插入实际的音频数据流中。在这种情况下,通过不同的并行数字附加通道来进行传输,然而,该通道不必必须在时间上同步。当通过工作室中存在的一般音频分布基础结构、以未降低的形式(如AES/EBU数据格式的PCM数据)来传递下混数据时,可能会出现以上情况。设计这些基础结构以在各种源之间数字地分布音频信号。为此,通常使用被称为“横导轨(cross rail)”的功能单元。可选地或附加地,由于声音调节和动态压缩的原因,也以PCM格式来处理音频信号。所有这些步骤导致了从发射机到接收机的路径上的不可计算的延时。
另一方面,基本通道数据和多通道附加信息的分离传输尤其是令人感兴趣的,这是因为不必改变现有的立体声基础结构,即,在此并不适用关于第一可能性所描述的不符合标准的缺点。无线电系统仅必须传输附加通道,而不必改变对于已经存在的立体声通道的基础结构。因而仅在接收机侧,以存在后向兼容性的方式,即以具有新接收机的用户获得比具有旧接收机的用户更好的声音质量的方式,来执行附加努力。
如已经讨论的,不再能够根据所接收的音频信号和附加信息来确定时间偏移量大小的排序。因此,在接收机中不再保证时间上正确的多通道信号的重构和关联。这种延时问题的另一示例是,在例如数字无线电的接收机中,要将已经运行的两通道传输系统扩展为多通道传输时的情况。这里,通常是以下情况:通过接收机中已有的两通道音频解码器来对下混信号进行解码,并不知道该解码器的延时时间,因而不能进行补偿。在极端的情况下,下混音频信号甚至可以通过包含模拟部分的传输链(即,在一点进行数/模转换,以及在进一步的存储/传输转换之后再次进行模/数转换),到达多通道重构音频解码器。在无线电传输中经常出现类似情况。此外,最初并没有可用的与可以如何相对于多通道附加数据执行下混信号的适合延时补偿有关的线索。此外,如果用于A/D转换的采样频率和用于D/A转换的采样频率彼此略有不同,则将会存在与两个采样速率的相互比率相对应的必要补偿延时的慢时间漂移。
为了附加数据与基本数据的同步,可以使用公知为术语“时间同步方法”的各种技术。它们基于将时间戳插入两个数据流,从而基于这些时间戳,可以在接收机中实现对彼此关联的数据的正确关联。然而,时间戳的插入已经导致了通常的立体声基础结构的改变。
发明内容
本发明的目的是提供用于产生数据流和/或用于产生多通道表示的概念,通过该概念,可实现基本通道数据和多通道附加信息的同步。
通过根据权利要求1所述的用于产生多通道信息的设备、根据权利要求17所述的用于产生多通道表示的设备、根据权利要求26所述的用于产生数据流的方法、根据权利要求27所述的用于产生多通道表示的方法、根据权利要求28所述的计算机程序或根据权利要求29所述的数据流表示来实现该目的。
本发明基于以下发现:通过在“发射机侧”修改多通道数据流,可以实现基本通道数据流和多通道附加信息数据流的单独传输和时间同步合并,从而将给出了至少一个基本通道的事件发展的指纹信息插入具有多通道附加信息的数据流,从而可以从数据流中推导出多通道附加信息和指纹信息之间的连接。因此,所确定的多通道附加信息属于所确定的基本通道信息。还必须在分离的数据流传输中确保这种关联。
根据本发明,通过根据使用其标记了确切属于这些基本通道数据的多通道附加信息的基本通道数据来确定指纹信息,在发射机侧发信号通知多通道附加信息与基本通道数据的这种关联。以逐块数据处理的方式实现了多通道附加信息与指纹信息之间连接的这种标记和/或信令,其中,通过将所考虑的多通道附加信息块所属于的基本通道数据块的块指纹与属于该基本通道数据块的多通道附加信息相关联来进行逐块数据处理。
换言之,在重构中必须要与多通道附加信息一起处理的基本通道数据块的指纹与该多通道附加信息相关联。在基于块的传输中,可以将基本通道数据块的块指纹插入多通道附加数据流的块结构中,从而每块多通道附加信息包含关联的基本数据的块指纹。可以在先前所使用的多通道附加信息块之后,直接写入块指纹,或者可以在先前存在的块之前写入块指纹,或者可以在该块内的任何已知地方写入块指纹,从而在多通道重构中,可以为了同步目的而读出块指纹。因此,在数据流中存在通常的多通道附加数据以及相应插入的块指纹。
可选地,也可以写入数据流,从而例如具有附加信息(如块计数器)的所有块指纹位于根据本发明所产生的数据流的开始处,使得数据流的第一部分仅包含块指纹,以及数据流的第二部分包含逐块写入并与块指纹信息相关联的多通道附加数据。该可选方案具有以下缺点:需要参考信息,然而其中,也可以通过顺序来隐含地给出块指纹与逐块写入的多通道附加信息的关联,从而不需要附加信息。
在这种情况下,为了同步的目的,在多通道重构中,可以在最初简单地读入大量块指纹,以获得参考指纹信息。逐渐地,添加测试指纹,直至存在用于关联的最小个数的测试指纹为止。在该持续时间内,如果使用差分来执行多通道重构中的关联,但在数据流中不包括差分块指纹,而是包括绝对块指纹,则可以已经对参考指纹集进行了例如差分编码。
通常而言,在接收机侧对具有基本通道数据的数据流进行处理,即例如首先对它进行解码,然后将它提供给多通道重构器。优选地,设计该多通道重构器,从而当没有获得任何附加信息来输出优选两个基本通道作为立体声信号时,该多通道重构器简单地执行直通开关。并行地,进行解码后的基本通道数据中的参考指纹信息的提取和测试指纹信息的计算,然后执行关联计算以计算基本通道数据相对于多通道附加数据的偏移量。依据实施方式,可以存在该偏移量实际上是正确偏移量的另一相关计算的验证。在通过第二相关获得的偏移量并没有与通过第一相关计算获得的偏移量相差多于预定阈值时,该偏移量实际上是正确偏移量。
当是这种情况时,可以假设偏移量是正确的。接下来,在接收到同步多通道附加信息之后,从立体声输出切换至多通道输出。
当假设用户没有注意到同步所需的时间时,该过程是优选的。因而在获得基本通道数据的时刻对基本通道数据进行处理,从而当然可以在发生同步(即发生偏移量计算)的时间段内仅输出立体声,这是因为还没有发现任何同步多通道附加信息。
在计算偏移量所需的“初始延时”不是问题的另一实施例中,可以执行再现,从而在并未已经并行输出立体声数据的情况下,执行整体同步计算,以提供从基本通道数据的第一块开始的同步多通道附加信息。然后,收听者将具有从第一块开始的同步5.1体验。
在本发明的优选实施例中,同步时间通常约为5秒,这是因为需要大约200个参考指纹作为用于最佳偏移量计算的参考指纹信息。如果大约5秒的延时不是问题(如在单向传输的情况下),则例如可以从开始(但是仅在偏移量计算所需的时间之后)给出5.1再现。对于交互式应用,例如在对话等情况下,不期望该延时,从而在这种情况下,在完成再现时,将使立体声再现切换至多通道再现。例如,发现仅提供立体声再现比提供具有非同步多通道附加信息的多通道再现要好。
根据本发明,通过发射机侧的措施和接收机侧的措施来解决基本通道数据和多通道附加数据之间的时间关联问题。
在发射机侧,根据相应的单声道或立体声下混音频信号来计算时间变量和适合的指纹信息。优选地,将该指纹信息作为同步辅助来定期插入所发送的多通道附加数据流。优选地,作为例如逐块组织的空间音频编码辅助信息的中间的数据字段来进行插入,或者使得指纹信号作为数据块的第一或最后信息而发送,从而可以容易地添加或去除指纹信息。
在接收侧,根据相应的立体声音频信号(即,基本通道数据)来计算时间变量和适合的指纹信息,其中,根据本发明,优选多个双基本通道。此外,从多通道附加信息中提取指纹。然后通过相关方法,例如计算测试指纹信息和参考指纹信息之间的互相关,来计算多通道附加信息和所接收的音频信号之间的时间偏移量。可选地,还执行试验和误差方法,其中,将根据基于各个块光栅(raster)从基本通道数据计算的各条指纹信息与参考指纹信息进行比较,以确定基于其关联测试指纹信息与参考指纹信息最佳匹配的测试块光栅的时间偏移量。
最后,通过下游延时补偿级,具有多通道附加信息的基本通道的音频信号被同步以用于后续的多通道重构。依据实施方式,仅对初始延时进行补偿。然而优选地,与再现并行地执行偏移量计算,以使得能够按需重新调整延时,以及在尽管初始延时被补偿但基本通道数据和多通道附加信息在时间上漂移分开的情况下,基于关联计算的结果来重新调整延时。因而也可以主动地调整延时补偿级。
本发明的有利之处在于,不必在基本通道数据和/或用于基本通道数据的处理路径中做出改变。馈入接收机中的基本通道数据流与传统的基本通道数据流没有任何不同。仅在多通道数据流侧做出改变。修改之处在于插入了指纹信息。但是由于当前并没有用于多通道数据流的标准化方法,所以多通道附加数据流的改变并不会导致不必要地违背已经标准化实现并建立的解决方案,然而如果修改了基本通道数据流则会违背已经标准化实现并建立的解决方案。
本发明的场景提供了多通道附加信息分布的特别灵活性。尤其在多通道附加信息是参数信息时(这相对于所需数据速率和/或存储容量非常紧凑),也可以向数字接收机提供与立体声信号完全分离的这种数据。例如,对于出现在库存中的立体声记录(已经在固定状态播放器上或者来自独立的提供商的CD上,或者将它们存储在它们的再现设备上),用户可以获得多通道附加信息。该存储并不会出现任何问题,这是因为,特别是对于参数多通道附加信息,存储器需求并不是非常大。如果用户插入CD或选择了立体声条目,则可以从多通道附加数据存储器中获取相应的多通道附加数据流,并由于多通道附加数据流中的指纹信息而与立体声信号同步,以实现多通道重构。因而本发明的解决方案允许将可能来自完全不同的源的多通道附加数据与立体声信号同步,而完全与立体声信号的类型无关(即,与它是否来自数字无线电接收机、是否来自CD、是否来自DVD、或是否经由因特网而到达无关),然后将立体声信号用作基于其来执行多通道重构的基本通道数据。
附图说明
以下将参照附图,对本发明的优选实施例进行更加详细的解释,其中:
图1示出了用于产生数据流的本发明的设备的电路框图;
图2示出了用于产生多通道表示的本发明的设备的电路框图;
图3示出了用于产生通道数据和参数多通道信息的已知联合立体声编码器;
图4示出了确定用于BCC编码/解码的ICLD、ICTD和ICC参数的方案的表示;
图5示出了BCC编码器/解码器链的框图表示;
图6示出了图5的BCC合成块的实现的框图;
图7a以块序列示出了原始多通道信号的示意表示;
图7b以块序列示出了一个或更多个基本通道的示意表示;
图7c示出了具有多通道信息和关联块指纹的本发明数据流的示意表示;
图7d示出了图7c的数据流块的示例性表示;
图8示出了根据优选实施例的产生多通道表示的本发明设备的详细表示;
图9示出了用于示出通过测试指纹信息与参考指纹信息之间的关联进行偏移量确定的示意表示;
图10示出了与数据输出并行的偏移量确定的优选实现的流程图;
图11示出了在编码器和解码器侧的指纹信息和/或编码指纹信息的计算的示意表示。
具体实施方式
图1示出了用于产生原始多通道信号的多通道重构的数据流的设备,其中,根据本发明的优选实施例,多通道信号具有至少两个通道。该设备包括指纹生成器2,可以经由输入线3,将根据原始多通道信号所推导出的至少一个基本通道提供给所述指纹生成器2。基本通道的个数等于或大于1并小于原始多通道信号的通道个数。如果原始多通道信号仅是仅具有两个通道的立体声信号,则仅根据两个立体声通道推导出单个基本通道。然而,如果原始多通道信号是具有三个或更多个通道的信号,则基本通道的个数也可以等于2。该实施方式是优选的,因为之后可以在没有多通道附加数据的情况下执行音频再现,作为通常的立体声再现。在本发明的优选实施例中,原始多通道信号是具有五个通道和LFE通道(LFE=低频增强,其中,该通道也称为超低音扬声器)的环绕信号。这五个通道是左环绕通道Ls、左通道L、中心通道C、右通道R、以及后右和/或右环绕通道Rs。两个基本通道则是左基本通道和右基本通道。专家也将所述一个和/或更多个基本通道称为下混通道。
指纹生成器2设计用于根据所述至少一个基本通道而产生指纹信息,其中,指纹信息给出了所述至少一个基本通道的时间进程。依据所述实施方式,计算指纹信息涉及或多或少的努力。例如,可以使用基于统计方法、以许多努力计算出的指纹,该指纹被称为术语“音频ID”。然而可选地,也可以使用表示一个或更多个基本通道的时间进程的任何其它量。
根据本发明,基于块的处理是优选的。这里,指纹信息包括块指纹序列,其中,块指纹是块中一个和/或多个基本通道的能量的测量。然而可选地,例如,也可以使用块的所确定采样或块的采样组合作为块指纹,因为利用足够多的块指纹作为指纹信息,将会对至少一个基本通道的时间特性进行再现(尽管是粗略的再现)。通常而言,根据至少一个基本通道的采样数据来推导出指纹信息,并且指纹信息给出具有或多或少大误差的所述至少一个基本通道的时间进程,从而如之后将进行讨论的,可以在解码器/接收机侧执行根据基本通道所计算的测试指纹信息的相关,以最终确定具有多通道附加信息的数据流与基本通道之间的偏移量。
在输出侧,指纹生成器2提供指纹信息,该指纹信息被供应给数据流生成器4。数据流生成器4设计用于根据指纹信息和典型的时间可变的多通道附加信息而产生数据流,其中,多通道附加信息和所述至少一个基本通道允许对原始多通道信号的多通道重构。数据流生成器设计用于在输出5处产生数据流,从而可以根据数据流推导出多通道附加信息和指纹信息之间的连接。根据本发明,因而以根据所述至少一个基本通道所推导出的指纹信息来标记多通道附加信息的数据流,从而可以通过指纹信息来确定特定多通道附加信息与基本通道数据的关联,其中,由数据流生成器4提供该指纹信息与多通道附加信息的关联。
图2示出了用于从至少一个基本通道和包括指纹信息(给出了所述至少一个基本通道的时间进程)和多通道附加信息(用于与所述至少一个基本通道一起允许对原始多通道信号的多通道重构)的数据流中产生原始多通道信号的多通道表示的本发明的设备,其中,可以根据数据流推导出多通道附加信息和指纹信息之间的连接。将所述至少一个基本通道经由输入10提供给接收机和/或解码器侧的指纹生成器11。在输出侧,指纹生成器11将测试指纹信息经由输出12提供给同步器13。优选地,通过同样在图1的块2中执行的完全相同的算法,根据至少一个基本通道来推导出测试指纹信息。然而依据实施方式,算法不必相同。
例如,指纹生成器2可以以绝对编码来产生块指纹,而解码器侧的指纹生成器11执行差分指纹确定,从而与块相关联的测试块指纹是两个绝对指纹之差。在这种情况下,即当绝对块指纹经由具有指纹信息的数据流到来时,指纹提取器14将从数据流中提取指纹信息,同时形成差分,从而将数据作为与测试指纹信息进行比较的参考指纹信息经由输出15提供给同步器13。
通常而言,优选地,用于解码器侧的测试指纹信息的计算算法和用于编码器侧的指纹信息(在图2中,也被称为参考指纹信息)的计算算法至少是相似的,从而同步器13能够使用这两条信息,以同步方式将经由输入16接收的数据流中的多通道附加数据与所述至少一个基本通道上的数据相关联。作为同步器输出处的多通道表示,获得了同步后的多通道表示,它包括基本通道数据和与之同步的多通道附加数据。
在该方面,优选地,同步器13确定基本通道数据与多通道附加数据之间的时间偏移量,然后将多通道附加数据延时该偏移量。已经发现,多通道附加数据通常到达较早、即过早,这可能是由于与基本通道数据的数据量相比的典型与多通道附加数据相对应的较小数据量。因此,如果对多通道附加数据进行延时,则将所述至少一个基本通道上的数据经由基本通道数据线17,从输入10提供给同步器13,该数据实际仅“经过”同步器13,并再次在输出18处输出。将经由输入16接收的多通道附加数据经由多通道附加数据线19馈入同步器,延时所确定的偏移量,并在同步器的输出20处与基本通道数据一起提供给多通道重构器21,然后该重构器执行实际的音频呈现,以在输出侧产生例如五个音频通道和超低音扬声器通道(图2中未示出)。
因此,线18和20上的数据构成了同步后的多通道表示,其中,除了在同步器13中或之前可以做出依据实施方式而从数据流中去除指纹信息的事实之外,线20上的数据流与输入16处的数据流相对应(除了可能呈现的多通道附加数据编码之外)。可选地,也可以在指纹提取器14中已经进行了指纹去除,从而不会存在线19,而是线19’直接从指纹提取器9至同步器13。在这种情况下,同步器13因而并行地由指纹提取器提供多通道附加数据和参考指纹信息。
因此,同步器设计用于使用测试指纹信息和参考指纹信息、并使用多通道信息与从数据流中推导出的数据流中所包含的指纹信息的连接,将多通道附加信息与所述至少一个基本通道进行同步。如将在以下进一步解释的,优选地,通过指纹信息是位于多通道附加信息组之前、多通道附加信息组之后、还是多通道附加信息组内,来简单地确定多通道附加信息和指纹信息之间的时间连接。依据指纹位于多通道附加信息组之前、之后、还是之内,在编码器侧确定该多通道信息属于该指纹信息。
优选使用块处理。此外,优选进行指纹的插入,以使多通道附加数据块总是跟随块指纹,即多通道附加信息块与块指纹交替,反之亦然。然而可选地,也可能使用将完全的指纹信息写入数据流的开始处的独立部分的数据流格式,独立部分之后跟随完整的数据流。在这种情况下,块指纹和多通道附加信息块将不会交替。将指纹与多通道附加信息的关联的可选方式是本领域技术人员已知的。根据本发明,仅需要在解码器侧根据数据流推导出多通道附加信息与指纹信息之间的连接,从而可以使用指纹信息将多通道附加信息与基本通道数据同步。
接下来,相对于图7a至7d来示出逐块处理的优选实施方式。图7a示出了原始的多通道信号,例如5.1信号,该信号包括块B1至B8序列,其中,在图7a示出的示例的块中包含多通道信息MKi。当假设5通道信号时,每个块(如块B1)包含例如每个单独通道的前1152个音频采样。例如,在图5的BCC编码器112中,优选这种块大小,其中,通过图5中称为“块”的元件111来实现块形成(即加窗),以从连续信号中获得块序列。
将所述至少一个基本通道应用于图5中称为“和信号”的下混块114的输出,和信号具有参考数字115。基本通道数据可以再次表示为块B1至B8序列,其中,图7b的块B1至B8与图7a中的块B1至B8相对应。然而,现在块不再包含原始的5.1信号(如果保持时域表示),而仅包含单声道信号或具有两个立体声基本通道的立体声信号。因此,块B1再次包括第一立体声基本通道和第二立体声基本通道的1152个时间采样,其中,通过逐采样的加/减和加权(如果可应用)、即通过例如在图5的下混块114中所执行的运算,来计算左立体声基本通道和右立体声基本通道的这1152个采样中的每一个。相应地,具有多通道信息的数据流再次包括块B1至B8,其中,图7c中的每个块与图7a中的原始多通道信号和/或图7b的一个或更多个基本通道的相应块相对应。为了实现例如原始多通道信号MK1的块B1的重构,被称为BK1的基本通道数据流的块B1中的基本通道数据必须与图7c中的块B1的多通道信息P1组合。在图6示出的实施例中,通过BCC合成块来执行该组合,为了获得对基本通道数据的逐块处理,BCC合成块再次在其输入处包括块形成级。
如图7c所示,P3指示多通道信息,它与基本通道的值BK3的块一起允许对原始多通道信号的值MK3的块的重构进行重构。
根据本发明,现在,图7c的数据流的每个块Bi都具有块指纹。对于块B3,这表示优选在多通道信息块P3之后写入块指纹F3。现在,根据值BK3的块的块B3来确切地推导出该块指纹。可选地,块指纹F3也可以经历差分编码,从而块指纹F3等于基本通道的块BK3的块指纹与基本通道的值BK2的块的块指纹之差。在本发明的优选实施例中,将能量测量和/或差分能量测量用作块指纹。
在开始所描述的场景中,将具有图7b中一个或更多个基本通道的数据流与图7c的具有多通道信息和指纹信息的数据流分离地传输至多通道重构器。如果不采取别的行动,则可能出现以下情况:在多通道重构器处,例如在图5的BCC合成块122处,下一个要处理的是块BK5。然而,由于一些时间模糊,还可能是以下情况:在多通道信息中,块BK7是下一个而不是块BK5。没有进一步的措施,因而利用多通道信息P7来进行基本通道数据BK5的块的重构,而这将导致伪像(artifact)。根据本发明,如将在以下进一步解释的,现在计算两块的偏移量,从而将图7c中的数据流延时两块,从而存在根据图7b的数据流和图7c的数据流的多通道表示,然而,它们现在已经彼此同步。
依据实施方式和指纹信息的设计/精度,本发明的偏移量确定并不限于作为整数多个块来计算偏移量,而是在足够精确的相关计算和使用足够多的数量的块指纹(当然以相关计算的时间为代价)的情况下,也可以实现等于块的一部分并可以到达一个采样的偏移量精度。然而发现这种高精度并不是必需的,而发现+/-半块(对于1152个采样的块长度而言)的同步精度已经导致了收听者认为没有伪像的多通道重构。
图7d示出了块Bi(例如,图7c中数据流的块B3)的优选实施例。块以同步字开始,例如,同步字具有一字节的长度。接下来是一些长度信息,这是因为如本领域已知的,优选在多通道信息P3的计算之后,对多通道信息P3进行缩放、量化和熵编码,从而从开始并未获知多通道信息的长度(例如,该多通道信息的长度可以是参数信息,但是也可以是波形信号,例如辅助通道的波形信号),因而必须在数据流中进行发信号通知。然后,在多通道信息P3的结尾处插入本发明的块指纹。在图7d中所示的实施例中,块指纹占用了一个字节,即八个比特。由于每块采取单个能量测量,所以在仅有量化而没有使用熵编码的实施例中,在量化中使用量化器输出宽度为八比特的量化器。因而将量化后的能量值输入图7d的8比特字段“块FA”,而不进行进一步的处理。接下来,尽管没有在图7d中示出,但是还存在用于数据流的下一块的同步字节,该同步字节同样后面跟随长度字节,长度字节后面跟随BK4的多通道信息P4,其中,基本通道数据块BK4的多通道信息P4的该块同样后面跟随基于基本通道数据BK4的块指纹。
如图7d所示,可以将绝对能量测量或差分能量测量引入作为能量测量。在该情况下,将把基本通道数据BK3的能量测量和基本通道数据BK2的能量测量之差添加至数据流的块B3,作为块指纹。
图8示出了图2的同步器、指纹生成器11和指纹提取器9与多通道重构器21合作的详细表示。将基本通道数据馈入基本通道数据缓冲器25,并进行立即缓冲。相应地,将附加信息和/或具有附加信息和指纹信息的数据流提供给附加信息缓冲器26。通常而言,以FIFO缓冲器的形式来构造这两个缓冲器,然而其中,缓冲器26具有其它能力:可以通过参考指纹提取器9来提取指纹信息,并将该指纹信息进一步从数据流中去除,这使得可以在缓冲器输出线27上仅输出多通道附加信息,而不没有插入的指纹。然而,也可以通过时间移位器28或任何其它元件来执行数据流中指纹的去除,从而在多通道重构中,多通道重构器21不会被指纹字节所干扰。如果在参考侧和测试侧均使用了绝对指纹,则指纹生成器11所计算的指纹信息可以直接馈入图2的同步器13内的相关器29,如由指纹提取器9所确定的指纹信息。然后,相关器计算偏移量值,并经由偏移量线30将该偏移量值提供给时间移位器28。进一步设计同步器13,以在产生了有效偏移量值并将其提供给时间移位器28时驱动使能器31,从而使能器31闭合开关32,将来自缓冲器26的多通道附加数据流经由时间移位器28和开关32来馈入多通道重构器21。
在本发明的优选实施例中,仅进行多通道附加信息的时间移位(延时)。同时,与正确偏移量值的计算并行地执行了多通道重构,因此多通道重构器21的输出的收听者并不会注意到用于正确的偏移量值的计算的时间延时。然而,该多通道重构仅是“微不足道的(trivial)”多通道重构,这是因为优选由多通道重构器21简单地输出两个立体声基本通道。因此,如果开关32打开,则仅有一个立体声输出。然而,如果开关32闭合,则多通道重构器21除了立体声基本通道之外,也接收多通道附加信息,并可以执行现在已经同步了的多通道输出。收听者将仅注意到立体声质量被切换至多通道质量这一点。
然而,在最初时间延时并不是主要问题的应用的情况下,可以保持多通道重构器21的输出,直至存在有效偏移量。然后可以将第一块(图7b的BK1)与现在正确延时的多通道附加数据P1(图7c)一起提供给多通道重构器21,从而仅在存在多通道数据时开始输出。在该实施例中,在开关打开的情况下,将没有多通道重构器21的输出。
接下来,将相对于图9来示出图8的相关器29的功能。在测试指纹计算器11的输出处,如在图9的最上面的子图像中看到的,提供了测试指纹信息序列。因此,对于每块基本通道,存在块指纹,其中,将该块指定为1、2、3、4、i。依据相关算法,对于相关来说仅需要离散值序列。然而,其它相关算法也可以获得在离散值之间进行内插的曲线,作为输入值,如图9所示出的。相应地,参考指纹确定器9也产生了从数据流中提取出的离散参考指纹序列。例如,如果差分编码后的指纹信息被包含在数据流中,以及如果相关器要基于绝对指纹来进行操作,则激活图8中的差分解码器35。然而,优选地,在数据流中包含绝对指纹,作为能量测量,这是因为多通道重构器21可以有利地使用与每块的总能量有关的该信息以用于电平修正目的。此外,优选执行基于差分指纹的相关。在这种情况下,块9将会在相关器之前执行差分处理,并且块11也将在相关器之前执行差分处理,如已经讨论的。
相关器29现在将获得在图9的两个上面的子图像中示出的离散值曲线和/或序列,并提供了在图9的下面的子图像中示出的相关结果。该结果是相关结果,其偏移量分量确切地提供了两个指纹信息曲线之间的偏移量。此外,由于偏移量是正的,所以多通道附加信息必须沿正时间方向移位,即必须进行延时。当然,要注意,只要多通道重构器在其两个输入处包含同步多通道表示,基本通道数据也可以沿负时间方向移位,或者可以多通道附加信息沿正方向移位一些部分、并且基本通道附加数据沿负时间方向移位偏移量的一些部分。
接下来,将相对于图10来示出与音频输出并行的偏移量计算的优选实施例。对基本通道数据进行缓冲,以能够总是计算一个指纹,仅针对其块进行计算,将测试块指纹提供给多通道重构器以用于多通道重构。接下来,再次将基本通道数据的下一块馈入缓冲器25,从而可再次根据该块来计算测试块指纹。例如,对于200个块来执行该处理。然而,在“微不足道的”多通道重构的情况下,多通道重构器简单地输出这200个块,作为立体声输出数据,从而收听者将不会注意到任何延时。
依据实施方式,也可以使用少于或多于200个的块。根据本发明,发现在100和300块之间的个数、优选为200的块产生提供了计算时间、相关计算努力和偏移量精度之间的合理折衷的结果。
当对块36进行处理时,该过程进行至块37,其中,通过相关器29来执行200个所计算的测试块指纹和200个所计算的参考块指纹之间的相关。现在存储所获得的偏移量结果。然后,在与块36相对应的块38中计算基本通道数据的例如下一200块。相应地,再次从具有多通道附加信息的数据流中提取200个块。接下来,再次执行块39中的相关,以及存储所获得的偏移量结果。然后,在块40中确定基于第二200个块的偏移量结果和基于第一200个块的偏移量结果之间的偏差。如果该偏差低于预定阈值,则块41通过偏移量线30将偏移量提供给图8的时间移位器28,并闭合开关42,从而存在从此刻起至多通道输出的切换。例如,偏差阈值的预定值是一个或两个块的值。这是基于以下事实的:当在一个计算和另一个计算之间,偏移量并没有改变多于一个或两个块时,在相关计算中没有执行误差。
不同于该实施例,也可以使用具有多个块(例如200个块)的窗长的滑动窗。例如,以200个块进行计算,并获得结果。然后,该过程前进一个块,并且在用于相关计算的多个块中撤回一个块,并作为替代使用新块。然后,如先前所获得的结果一样,将所获得的结果存储在直方图中。对于多个相关计算(如100或200)来进行该过程,从而逐渐地填充直方图。然后将直方图的峰值用作所计算的偏移量,以提供最初的偏移量或获得用于动态重新调整的偏移量。
与输出并行发生的偏移量计算将在块42中分离,如果必要,当发现具有多通道信息的数据流与具有基本通道数据的数据流有一些漂移时,通过经由线30向图8的时间移位器28提供更新后的偏移量值,来获得自适应和/或动态的偏移量跟踪。对于自适应跟踪,应注意,依据实施方式,也可以执行偏移量的平滑改变,从而当例如发现了两个块的偏差时,首先将偏移量递增1,然后如果必要,再次递增,使得跳跃不会过大。
接下来,关于图11示出了如图1所示的编码器侧的指纹生成器2的优选实施例和用在解码器侧的图2的指纹生成器11的优选实施例。
通常,将多通道音频信号分为固定大小的块,以用于获取多通道附加数据。现在,同步地计算每块的指纹,以获取多通道附加数据,该多通道附加数据适于尽可能唯一地特征化信号的时间结构。在这点上的实施例是使用音频块的当前下混音频信号的能量内容,例如以对数形式,即以分贝相关表示。在这种情况下,指纹是音频信号的时间包络的测量。为了减小所传输的信息量和增加测量值的精度,也可以将该同步信息表示为前一块能量值之差,该块在后续进行了适合的熵编码(例如,霍夫曼编码)、自适应缩放和量化。时间包络的指纹计算如下:
首先,如图11中的点1处所示,执行可能用于立体声信号的当前块中的下混音频信号的能量计算。这里,例如,将左和右下混通道二者的1152个音频采样的每个进行平方和相加。sleft(i)表示左基本通道的时间i处的时间采样,而sright(i)表示时间i处的右基本通道的时间采样。在单声道下混信号中,省略求和。此外,优选地,去除下混音频信号的直流分量,该直流分量在计算之前对于本发明并没有意义。
在步骤2中,为了后续的对数表示而执行对能量的最小限制。为了进行能量的分贝相关评估,优选使用最小能量偏移量,从而在零能量的情况下存在合理的对数计算。在16比特的音频信号分辨率中,以dB为单位的该能量测量编号是0到90(dB)的数值范围。
如图11中的3处所示,优选不使用绝对能量包络值来确切确定多通道附加信息和所接收的音频信号之间的时间偏移量,而是使用信号包络的斜率(陡度)。因此,仅将能量范围的斜率用于相关测量。从技术上讲,通过与先前块能量值的能量值的差分形成来计算该信号推导。例如,在编码器中执行该步骤。然后,指纹包括差分编码的值。可选地,也可以仅在解码器侧实现该步骤。这里,因而所传输的指纹包括非差分编码值。这里,仅在解码器中进行差分形成。后者的可能性具有以下优点:指纹包含与下混信号的绝对能量有关的信息。然而,典型地,需要稍长的指纹字长度。
此外,优选对能量(信号包络)进行缩放以用于最佳控制。引入附加缩放(=增益)是有用的,从而在对该指纹的后续量化中,可以最大化地使用数值范围并可以提高低能量值的分辨率。这可以以固定且稳定的加权量来实现、或经由适于包络信号的动态增益调整来实现。
此外,如图11中的5处所示,进行指纹的量化。为了准备将该指纹插入多通道附加信息中,将该指纹量化为8比特。实践中,这种降低了的指纹分辨率被证实为关于比特需求和延时检测可靠性的良好折衷。通过特征饱和曲线,将大于255的数字溢出限制于最大值255。
如图11中的6处所示,然后可以进行对指纹的最佳熵编码。通过对指纹的统计特性进行评估,可以进一步减小对量化后指纹的比特需求。例如,适合的熵方法是霍夫曼编码或算术编码。可以通过不同的代码长度来表示指纹值的统计上不同的频率,因而可以降低对指纹表示的平均比特需求。
在多通道音频数据的帮助下,执行每个音频块的多通道附加数据的计算。接下来,利用通过适合地嵌入比特流来添加的同步信息,对在过程中计算的多通道附加信息进行扩展。
在本发明的解决方案的帮助下,现在接收机能够检测下混信号和附加数据的时间偏移量,并以+/-音频块的量级来实现时间修正自适应,即立体声音频信号和多通道附加信息之间的延时补偿。因此,可以几乎完全地(即除了几乎不可预期的+/-音频帧的时间差之外,这对于重构后的多通道音频信号的质量来说是不值一提的)重构接收机中的多通道关联。
依据环境,可以在硬件或软件中实现用于产生和/或解码的本发明的方法。可以在数字存储介质(具体地,具有可以电读取的控制信号的软盘或CD)上实现,数字存储介质与可编程计算机系统协作以使得执行本方法。通常,本发明也包括计算机程序产品,具有存储在机器可读载体上的、用于在计算机程序产品在计算机上运行时来执行该方法的程序代码。换言之,因而本发明可以被实现为具有程序代码的计算机程序,在计算机程序在计算机上运行时,该程序代码用于执行该方法。
Claims (33)
1.一种用于为原始多通道信号的多通道重构而产生数据流的设备,其中,所述多通道信号具有至少两个通道,所述设备包括:
指纹生成器(2),用于根据从所述原始多通道信号推导出的至少一个基本通道来产生指纹信息,其中,基本通道的个数等于或大于1并小于原始多通道信号的通道个数,所述指纹信息给出了所述至少一个基本通道的时间进程;以及
数据流生成器(4),用于根据指纹信息来产生时间可变的多通道附加信息的数据流,所述时间可变的多通道附加信息和所述至少一个基本通道一起允许对原始多通道信号进行多通道重构,其中,所述数据流生成器(4)设计用于产生数据流,以便可从所述数据流中推导出所述多通道附加信息和所述指纹信息之间的时间连接。
2.如权利要求1所述的设备,其中
所述指纹生成器(2)设计用于逐块地对所述至少一个基本通道进行处理,以获得所述指纹信息,
逐块地对所述多通道附加信息进行计算,以便将所述多通道附加信息与所述至少一个基本通道的块一起用于多通道重构,以及
所述数据流生成器(4)设计用于将所述多通道附加信息和所述指纹信息逐块地写入数据流。
3.如权利要求2所述的设备,其中,所述指纹生成器(2)设计用于产生给出了块中基本通道的时间进程的块指纹,作为所述至少一个基本通道的块的指纹信息,
所述多通道附加信息的块与所述基本通道的块一起用于多通道重构,以及
所述数据流生成器(4)设计用于逐块地写入数据流,从而多通道附加信息的块和指纹信息的块具有彼此预定的关系。
4.如权利要求2所述的设备,其中,所述指纹生成器(2)设计用于计算块指纹序列,作为时间上连续的所述至少一个基本通道的块的指纹信息,
针对时间上连续的所述至少一个基本通道的块,逐块地给出多通道附加信息,以及
所述数据流生成器设计用于以与多通道附加信息的块序列的预定关系写入块指纹序列。
5.如权利要求4所述的设备,其中,所述指纹生成器(2)设计用于计算所述至少一个基本通道的两个块的两个指纹值之差,作为块指纹。
6.如前述权利要求之一所述的设备,其中,所述指纹生成器(2)设计用于执行对指纹值的量化和熵编码,以获得所述指纹信息。
7.如权利要求6所述的设备,其中,所述指纹生成器(2)设计用于利用缩放信息对指纹值进行缩放,并进一步与所述指纹信息相关联地将所述缩放信息写入数据流。
8.如前述权利要求之一所述的设备,其中,所述指纹生成器(2)设计用于逐块地计算所述指纹信息,以及
所述数据流生成器(4)设计用于逐块地写入所述数据流,从而所述数据流的块包括多通道附加信息的块和与所述多通道附加信息的块相关联的指纹信息的块以及所述至少一个基本通道的块。
9.如前述权利要求之一所述的设备,其中,存在至少两个基本通道,以及
其中,所述指纹生成器(2)设计用于逐采样地或逐频谱值地将所述至少两个基本通道相加,或者在所述相加之前将它们进行平方。
10.如前述权利要求之一所述的设备,其中,所述指纹生成器(2)设计用于使用与所述至少一个基本通道的能量包络有关的数据,作为指纹信息。
11.如权利要求10所述的设备,其中,所述指纹生成器(2)设计用于使用与所述至少一个基本通道的能量包络有关的数据,作为指纹信息,以及
所述指纹生成器(2)还设计用于使用能量的最小限制,并提供最小限制的能量的对数表示。
12.如权利要求11所述的设备,其中,所述至少一个基本通道以编码的形式被传输至多通道重构器,
使用有损编码器产生所述编码的形式,以及
还存在基本通道解码器,用于提供所述至少一个基本通道的解码的形式,作为所述指纹生成器(2)的输入信号。
13.如前述权利要求之一所述的设备,其中,所述多通道附加数据是多通道参数数据,每个多通道参数数据与所述至少一个基本通道的相应块逐块相关联。
14.如权利要求13所述的设备,还包括:
多通道分析器(112),用于逐块地产生所述至少一个基本通道的块序列和所述多通道附加信息的块序列,
其中,所述指纹生成器(2)设计用于根据所述至少一个基本通道的每块的值来计算块指纹值。
15.如权利要求14所述的设备,其中,所述数据流生成器(4)设计用于将所述数据流写入除标准数据通道之外存在的独立数据通道,通过所述独立数据通道,将所述至少一个基本通道传输至多通道重构装置。
16.如权利要求15所述的设备,其中,所述标准数据通道是用于数字立体声无线电信号的标准化通道、或者用于经由因特网的传输的标准化通道。
17.一种用于根据至少一个基本通道和数据流而产生原始多通道信号的多通道表示(18,20)的设备,所述数据流包括给出了所述至少一个基本通道的时间进程的指纹信息和与所述至少一个基本通道一起允许对原始多通道信号进行多通道重构的多通道附加信息,其中,可从数据流中推导出所述多通道附加信息和所述指纹信息之间的连接,所述设备包括:
指纹生成器(11),用于根据所述至少一个基本通道而产生测试指纹信息;
指纹提取器(9),用于从数据流中提取指纹信息以获得参考指纹信息;以及
同步器(13),用于使用测试指纹信息、参考指纹信息和根据从数据流推导出的包含在数据流中的多通道信息与指纹信息的连接,将所述多通道附加信息和所述至少一个基本通道在时间上同步,以获得同步的多通道表示。
18.如权利要求17所述的设备,还包括:
多通道重构器(21),用于使用所述同步的多通道表示来对所述多通道表示进行重构,以获得对原始多通道信号的重构。
19.如权利要求17或18所述的设备,其中
所述数据流包括在时间上与作为参考指纹信息的参考指纹值序列连接的多通道附加数据的块序列,
所述提取器(9)设计用于基于时间连接,确定多通道附加数据块的关联指纹值;
所述指纹生成器(11)设计用于确定测试指纹值序列,作为所述至少一个基本通道的块序列的测试指纹信息;
所述同步器(13)设计用于基于测试指纹值的序列和参考指纹值的序列之间的偏移量(30)来计算多通道附加数据的块与所述至少一个基本通道的块之间的偏移量,以及通过使用所计算的偏移量而对所述多通道附加信息的块序列进行延时(28)来补偿所述偏移量。
20.如权利要求17至19之一所述的设备,其中
所述指纹生成器(11)设计用于执行指纹值的量化以获得测试指纹信息。
21.如权利要求17至20之一所述的设备,其中
所述指纹生成器(11)设计用于利用来自数据流的缩放信息来对指纹值进行缩放。
22.如权利要求17至21之一所述的设备,其中,存在至少两个基本通道,以及
其中,所述指纹生成器(11)设计用于逐采样地或逐频谱值地将所述至少两个基本通道相加,或者在所述相加之前将它们进行平方。
23.如权利要求17至22之一所述的设备,其中,所述指纹生成器(11)设计用于使用与所述至少一个基本通道的能量包络有关的数据,作为指纹信息。
24.如权利要求17至23之一所述的设备,其中,所述指纹生成器(11)设计用于使用与所述至少一个基本通道的能量包络有关的数据,作为指纹信息,以及
所述指纹生成器(11)还设计用于使用能量的最小限制,并提供最小限制的能量的对数表示。
25.如权利要求17至24之一所述的设备,其中,逐块地组织数据流,并且多通道附加信息的块和块指纹被包含在数据流的块中,
所述指纹生成器(11)设计用于计算所述至少一个基本通道的两个块指纹之差,作为测试指纹信息,以及
所述指纹提取器(9)还设计用于计算数据流中的两个块指纹之差,并将该差作为参考指纹信息提供给同步器(13)。
26.如权利要求17至25之一所述的设备,其中
所述同步器(13)设计用于与音频输出并行地计算所述多通道附加数据与所述至少一个基本通道之间的偏移量,并自适应地补偿所述偏移量。
27.如权利要求18所述的设备,还设计用于在还没有同步的多通道附加数据时再现所述至少一个基本通道,以及在存在同步的多通道附加数据时从所述至少一个基本通道的单声道或立体声再现切换(32)至多通道再现。
28.如权利要求17至27之一所述的设备,设计用于通过彼此分离的比特流获得数据流和所述至少一个基本通道,其中,通过彼此不同的两个逻辑通道或物理通道来接收、或者通过在不同时间有效的相同传输通道来获得比特流。
29.一种用于为原始多通道信号的多通道重构而产生数据流的方法,其中,所述多通道信号具有至少两个通道,所述方法包括:
根据从所述原始多通道信号中推导出的至少一个基本通道来产生(2)指纹信息,其中,基本通道的个数等于或大于1并小于原始多通道信号的通道个数,所述指纹信息给出了所述至少一个基本通道的时间进程;以及
根据指纹信息来产生(4)时间可变的多通道附加信息的数据流,所述时间可变的多通道附加信息和所述至少一个基本通道一起允许对原始多通道信号进行多通道重构,其中,产生数据流,以便可从所述数据流中推导出所述多通道附加信息和所述指纹信息之间的时间连接。
30.一种用于根据至少一个基本通道和数据流而产生原始多通道信号的多通道表示(18,20)的方法,所述数据流包括给出了所述至少一个基本通道的时间进程的指纹信息和与所述至少一个基本通道一起允许对原始多通道信号进行多通道重构的多通道附加信息,其中,可从数据流中推导出所述多通道附加信息和所述指纹信息之间的连接,所述方法包括:
根据所述至少一个基本通道来产生(11)测试指纹信息;
从数据流中提取(9)指纹信息以获得参考指纹信息;以及
使用测试指纹信息、参考指纹信息和从数据流推导出的包含在数据流中的多通道信息与指纹信息的连接,将所述多通道附加信息和所述至少一个基本通道在时间上同步(13),以获得同步的多通道表示。
31.一种具有程序代码的计算机程序,用于当所述计算机程序在计算机上运行时,执行如权利要求29或权利要求30所述的方法。
32.一种数据流,包括指纹信息和多通道附加信息,其中,所述指纹信息给出了从原始多通道信号中推导出的至少一个基本通道的时间进程,所述基本通道的个数等于或大于1并小于原始多通道信号的通道个数,所述多通道附加信息与所述至少一个基本通道一起允许对原始多通道信号进行多通道重构,可从数据流中推导出所述多通道附加信息和所述指纹信息之间的连接。
33.如权利要求32所述的数据流,包括在将数据流馈入如权利要求17所述的设备时,用于产生原始多通道信号的同步多通道表示的控制信号。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102005014477.2 | 2005-03-30 | ||
DE102005014477A DE102005014477A1 (de) | 2005-03-30 | 2005-03-30 | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung |
PCT/EP2006/002369 WO2006102991A1 (de) | 2005-03-30 | 2006-03-15 | Vorrichtung und verfahren zum erzeugen eines datenstroms und zum erzeugen einer multikanal-darstellung |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101189661A true CN101189661A (zh) | 2008-05-28 |
CN101189661B CN101189661B (zh) | 2011-10-26 |
Family
ID=36598142
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200680019473XA Active CN101189661B (zh) | 2005-03-30 | 2006-03-15 | 用于产生数据流和产生多通道表示的设备和方法 |
Country Status (12)
Country | Link |
---|---|
US (1) | US7903751B2 (zh) |
EP (1) | EP1864279B1 (zh) |
JP (1) | JP5273858B2 (zh) |
CN (1) | CN101189661B (zh) |
AT (1) | ATE434253T1 (zh) |
AU (1) | AU2006228821B2 (zh) |
CA (1) | CA2603027C (zh) |
DE (2) | DE102005014477A1 (zh) |
HK (1) | HK1111259A1 (zh) |
MY (1) | MY139836A (zh) |
TW (1) | TWI318845B (zh) |
WO (1) | WO2006102991A1 (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102244805A (zh) * | 2009-10-25 | 2011-11-16 | 特克特朗尼克公司 | 借助签名曲线的av延迟测量和校正 |
CN103177725A (zh) * | 2008-10-06 | 2013-06-26 | 爱立信电话股份有限公司 | 用于输送对齐的多通道音频的方法和设备 |
CN103620679A (zh) * | 2011-03-18 | 2014-03-05 | 弗兰霍菲尔运输应用研究公司 | 具有灵活配置功能的音频编码器和解码器 |
CN105684085A (zh) * | 2013-10-21 | 2016-06-15 | 索尼公司 | 信息处理设备、方法及程序 |
CN106446761A (zh) * | 2015-07-07 | 2017-02-22 | 爱德克斯公司 | 图案重构 |
CN108352165A (zh) * | 2015-11-09 | 2018-07-31 | 索尼公司 | 解码装置、解码方法以及程序 |
CN109935236A (zh) * | 2013-04-05 | 2019-06-25 | 杜比国际公司 | 音频编码器和解码器 |
CN112995708A (zh) * | 2021-04-21 | 2021-06-18 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种多视频同步方法及装置 |
CN112986963A (zh) * | 2021-02-08 | 2021-06-18 | 武汉徕得智能技术有限公司 | 一种激光脉冲测距回波信号多路缩放结果选择控制方法 |
CN114003546A (zh) * | 2022-01-04 | 2022-02-01 | 之江实验室 | 一种多通道开关量复合编码设计方法和装置 |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2339329A3 (de) | 2007-02-21 | 2012-04-04 | Agfa HealthCare N.V. | System und Verfahren zur optischen Kohärenztomographie |
US8612237B2 (en) * | 2007-04-04 | 2013-12-17 | Apple Inc. | Method and apparatus for determining audio spatial quality |
KR20100096220A (ko) * | 2007-12-03 | 2010-09-01 | 노키아 코포레이션 | 패킷 생성 장치, 인코딩 신호의 동기화 장치, 패킷 생성 방법 및 인코딩 신호의 동기화 방법 |
DE102008009025A1 (de) * | 2008-02-14 | 2009-08-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen eines Fingerabdrucks eines Audiosignals, Vorrichtung und Verfahren zum Synchronisieren und Vorrichtung und Verfahren zum Charakterisieren eines Testaudiosignals |
DE102008009024A1 (de) * | 2008-02-14 | 2009-08-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum synchronisieren von Mehrkanalerweiterungsdaten mit einem Audiosignal und zum Verarbeiten des Audiosignals |
JP5243527B2 (ja) * | 2008-07-29 | 2013-07-24 | パナソニック株式会社 | 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム |
CN102177726B (zh) * | 2008-08-21 | 2014-12-03 | 杜比实验室特许公司 | 用于音频和视频签名生成和检测的特征优化和可靠性估计 |
ES2434828T3 (es) * | 2008-10-06 | 2013-12-17 | Telefonaktiebolaget L M Ericsson (Publ) | Método y aparato para el suministro de audio por multicanales alineados |
CN102369573A (zh) * | 2009-03-13 | 2012-03-07 | 皇家飞利浦电子股份有限公司 | 嵌入和提取辅助数据 |
GB2470201A (en) * | 2009-05-12 | 2010-11-17 | Nokia Corp | Synchronising audio and image data |
US9426574B2 (en) * | 2010-03-19 | 2016-08-23 | Bose Corporation | Automatic audio source switching |
EP2458890B1 (en) * | 2010-11-29 | 2019-01-23 | Nagravision S.A. | Method to trace video content processed by a decoder |
US9075806B2 (en) * | 2011-02-22 | 2015-07-07 | Dolby Laboratories Licensing Corporation | Alignment and re-association of metadata for media streams within a computing device |
US8706834B2 (en) | 2011-06-30 | 2014-04-22 | Amazon Technologies, Inc. | Methods and apparatus for remotely updating executing processes |
US8639989B1 (en) | 2011-06-30 | 2014-01-28 | Amazon Technologies, Inc. | Methods and apparatus for remote gateway monitoring and diagnostics |
US10754813B1 (en) | 2011-06-30 | 2020-08-25 | Amazon Technologies, Inc. | Methods and apparatus for block storage I/O operations in a storage gateway |
US8806588B2 (en) | 2011-06-30 | 2014-08-12 | Amazon Technologies, Inc. | Storage gateway activation process |
US9294564B2 (en) | 2011-06-30 | 2016-03-22 | Amazon Technologies, Inc. | Shadowing storage gateway |
US8832039B1 (en) | 2011-06-30 | 2014-09-09 | Amazon Technologies, Inc. | Methods and apparatus for data restore and recovery from a remote data store |
US8639921B1 (en) | 2011-06-30 | 2014-01-28 | Amazon Technologies, Inc. | Storage gateway security model |
US8793343B1 (en) | 2011-08-18 | 2014-07-29 | Amazon Technologies, Inc. | Redundant storage gateways |
US8789208B1 (en) | 2011-10-04 | 2014-07-22 | Amazon Technologies, Inc. | Methods and apparatus for controlling snapshot exports |
US9635132B1 (en) | 2011-12-15 | 2017-04-25 | Amazon Technologies, Inc. | Service and APIs for remote volume-based block storage |
KR20130101629A (ko) * | 2012-02-16 | 2013-09-16 | 삼성전자주식회사 | 보안 실행 환경 지원 휴대단말에서 컨텐츠 출력 방법 및 장치 |
EP2670157B1 (en) * | 2012-06-01 | 2019-10-02 | Koninklijke KPN N.V. | Fingerprint-based inter-destination media synchronization |
CN102820964B (zh) * | 2012-07-12 | 2015-03-18 | 武汉滨湖电子有限责任公司 | 一种基于系统同步与参考通道的多通道数据对齐的方法 |
EP2693392A1 (en) | 2012-08-01 | 2014-02-05 | Thomson Licensing | A second screen system and method for rendering second screen information on a second screen |
CN102937938B (zh) * | 2012-11-29 | 2015-05-13 | 北京天诚盛业科技有限公司 | 指纹处理装置及其控制方法和控制装置 |
US20150302086A1 (en) * | 2014-04-22 | 2015-10-22 | Gracenote, Inc. | Audio identification during performance |
US20160344902A1 (en) * | 2015-05-20 | 2016-11-24 | Gwangju Institute Of Science And Technology | Streaming reproduction device, audio reproduction device, and audio reproduction method |
EP3249646B1 (en) * | 2016-05-24 | 2019-04-17 | Dolby Laboratories Licensing Corp. | Measurement and verification of time alignment of multiple audio channels and associated metadata |
US10015612B2 (en) | 2016-05-25 | 2018-07-03 | Dolby Laboratories Licensing Corporation | Measurement, verification and correction of time alignment of multiple audio channels and associated metadata |
EP3324406A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
EP3324407A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000155598A (ja) * | 1998-11-19 | 2000-06-06 | Matsushita Electric Ind Co Ltd | 多チャンネル・オーディオ信号の符号化/復号化方法と装置 |
MY149792A (en) * | 1999-04-07 | 2013-10-14 | Dolby Lab Licensing Corp | Matrix improvements to lossless encoding and decoding |
US7013301B2 (en) * | 2003-09-23 | 2006-03-14 | Predixis Corporation | Audio fingerprinting system and method |
US6990453B2 (en) * | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
TW510144B (en) | 2000-12-27 | 2002-11-11 | C Media Electronics Inc | Method and structure to output four-channel analog signal using two channel audio hardware |
US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US7116787B2 (en) | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7006636B2 (en) | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US20030035553A1 (en) | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
WO2003091990A1 (en) * | 2002-04-25 | 2003-11-06 | Shazam Entertainment, Ltd. | Robust and invariant audio pattern matching |
KR20050003457A (ko) * | 2002-05-16 | 2005-01-10 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 신호 처리 방법 및 장치 |
EP1652385B1 (en) * | 2003-07-25 | 2007-09-12 | Koninklijke Philips Electronics N.V. | Method and device for generating and detecting fingerprints for synchronizing audio and video |
KR101079066B1 (ko) | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
DE102004046746B4 (de) * | 2004-09-27 | 2007-03-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Synchronisieren von Zusatzdaten und Basisdaten |
US7567899B2 (en) * | 2004-12-30 | 2009-07-28 | All Media Guide, Llc | Methods and apparatus for audio recognition |
-
2005
- 2005-03-30 DE DE102005014477A patent/DE102005014477A1/de not_active Withdrawn
-
2006
- 2006-03-15 DE DE502006003997T patent/DE502006003997D1/de active Active
- 2006-03-15 WO PCT/EP2006/002369 patent/WO2006102991A1/de active Application Filing
- 2006-03-15 AT AT06707562T patent/ATE434253T1/de active
- 2006-03-15 JP JP2008503398A patent/JP5273858B2/ja active Active
- 2006-03-15 CN CN200680019473XA patent/CN101189661B/zh active Active
- 2006-03-15 EP EP06707562A patent/EP1864279B1/de active Active
- 2006-03-15 CA CA2603027A patent/CA2603027C/en active Active
- 2006-03-15 AU AU2006228821A patent/AU2006228821B2/en active Active
- 2006-03-17 MY MYPI20061193A patent/MY139836A/en unknown
- 2006-03-27 TW TW095110552A patent/TWI318845B/zh active
-
2007
- 2007-09-28 US US11/863,523 patent/US7903751B2/en active Active
-
2008
- 2008-06-03 HK HK08106159.6A patent/HK1111259A1/xx unknown
Cited By (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103177725B (zh) * | 2008-10-06 | 2017-01-18 | 爱立信电话股份有限公司 | 用于输送对齐的多通道音频的方法和设备 |
CN103177725A (zh) * | 2008-10-06 | 2013-06-26 | 爱立信电话股份有限公司 | 用于输送对齐的多通道音频的方法和设备 |
CN102244805A (zh) * | 2009-10-25 | 2011-11-16 | 特克特朗尼克公司 | 借助签名曲线的av延迟测量和校正 |
CN102244805B (zh) * | 2009-10-25 | 2016-07-27 | 特克特朗尼克公司 | 借助签名曲线的av延迟测量和校正 |
CN107342091B (zh) * | 2011-03-18 | 2021-06-15 | 弗劳恩霍夫应用研究促进协会 | 计算机可读介质 |
US9524722B2 (en) | 2011-03-18 | 2016-12-20 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frame element length transmission in audio coding |
CN103620679A (zh) * | 2011-03-18 | 2014-03-05 | 弗兰霍菲尔运输应用研究公司 | 具有灵活配置功能的音频编码器和解码器 |
CN103620679B (zh) * | 2011-03-18 | 2017-07-04 | 弗劳恩霍夫应用研究促进协会 | 具有灵活配置功能的音频编码器和解码器 |
US9773503B2 (en) | 2011-03-18 | 2017-09-26 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder having a flexible configuration functionality |
US9779737B2 (en) | 2011-03-18 | 2017-10-03 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Frame element positioning in frames of a bitstream representing audio content |
CN107342091A (zh) * | 2011-03-18 | 2017-11-10 | 弗劳恩霍夫应用研究促进协会 | 计算机可读介质 |
CN109935236B (zh) * | 2013-04-05 | 2023-05-30 | 杜比国际公司 | 音频编码器和解码器 |
US11676622B2 (en) | 2013-04-05 | 2023-06-13 | Dolby International Ab | Method, apparatus and systems for audio decoding and encoding |
CN109935236A (zh) * | 2013-04-05 | 2019-06-25 | 杜比国际公司 | 音频编码器和解码器 |
US10484728B2 (en) | 2013-10-21 | 2019-11-19 | Sony Corporation | Information processing apparatus, method, and program |
CN105684085A (zh) * | 2013-10-21 | 2016-06-15 | 索尼公司 | 信息处理设备、方法及程序 |
CN105684085B (zh) * | 2013-10-21 | 2019-11-05 | 索尼公司 | 信息处理设备、方法及程序 |
US11115694B2 (en) | 2013-10-21 | 2021-09-07 | Sony Corporation | Information processing apparatus, method, and program |
CN106446761A (zh) * | 2015-07-07 | 2017-02-22 | 爱德克斯公司 | 图案重构 |
CN108352165A (zh) * | 2015-11-09 | 2018-07-31 | 索尼公司 | 解码装置、解码方法以及程序 |
CN108352165B (zh) * | 2015-11-09 | 2023-02-03 | 索尼公司 | 解码装置、解码方法以及计算机可读存储介质 |
CN112986963A (zh) * | 2021-02-08 | 2021-06-18 | 武汉徕得智能技术有限公司 | 一种激光脉冲测距回波信号多路缩放结果选择控制方法 |
CN112986963B (zh) * | 2021-02-08 | 2024-05-03 | 武汉徕得智能技术有限公司 | 一种激光脉冲测距回波信号多路缩放结果选择控制方法 |
CN112995708A (zh) * | 2021-04-21 | 2021-06-18 | 湖南快乐阳光互动娱乐传媒有限公司 | 一种多视频同步方法及装置 |
CN114003546A (zh) * | 2022-01-04 | 2022-02-01 | 之江实验室 | 一种多通道开关量复合编码设计方法和装置 |
CN114003546B (zh) * | 2022-01-04 | 2022-04-12 | 之江实验室 | 一种多通道开关量复合编码设计方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
EP1864279A1 (de) | 2007-12-12 |
MY139836A (en) | 2009-10-30 |
CA2603027A1 (en) | 2006-10-05 |
HK1111259A1 (en) | 2008-08-01 |
TWI318845B (en) | 2009-12-21 |
JP2008538239A (ja) | 2008-10-16 |
EP1864279B1 (de) | 2009-06-17 |
TW200644704A (en) | 2006-12-16 |
CN101189661B (zh) | 2011-10-26 |
CA2603027C (en) | 2012-09-11 |
ATE434253T1 (de) | 2009-07-15 |
DE102005014477A1 (de) | 2006-10-12 |
US20080013614A1 (en) | 2008-01-17 |
WO2006102991A1 (de) | 2006-10-05 |
AU2006228821A1 (en) | 2006-10-05 |
US7903751B2 (en) | 2011-03-08 |
DE502006003997D1 (de) | 2009-07-30 |
AU2006228821B2 (en) | 2009-07-23 |
JP5273858B2 (ja) | 2013-08-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101189661B (zh) | 用于产生数据流和产生多通道表示的设备和方法 | |
US7542896B2 (en) | Audio coding/decoding with spatial parameters and non-uniform segmentation for transients | |
KR101049751B1 (ko) | 오디오 코딩 | |
CN101479785B (zh) | 用于编码和解码基于对象的音频信号的方法和装置 | |
CN101971249B (zh) | 用于计算音频信号的指纹、用于同步、以及用于表征测试音频信号的装置和方法 | |
CN101952885B (zh) | 用于同步多声道扩展数据与音频信号以及用于处理音频信号的装置和方法 | |
RU2367033C2 (ru) | Многоканальное иерархическое аудиокодирование с компактной дополнительной информацией | |
EP1527442B1 (en) | Audio decoding apparatus and audio decoding method based on spectral band replication | |
JP5455647B2 (ja) | オーディオデコーダ | |
KR20070001139A (ko) | 오디오 분배 시스템, 오디오 인코더, 오디오 디코더 및이들의 동작 방법들 | |
CN105074821A (zh) | 音频编码器和解码器 | |
CN107112024A (zh) | 音频信号的编码和解码 | |
CA2849974C (en) | System and method for increasing transmission bandwidth efficiency ("ebt2") | |
RU2383941C2 (ru) | Способ и устройство для кодирования и декодирования аудиосигналов | |
CN101292285A (zh) | 编码和解码多声道音频信号的方法及其装置 | |
KR20090066190A (ko) | 대화형 오디오 송/수신 장치 및 그 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |