CN108431890B - 多音频信号的编码 - Google Patents
多音频信号的编码 Download PDFInfo
- Publication number
- CN108431890B CN108431890B CN201680072828.5A CN201680072828A CN108431890B CN 108431890 B CN108431890 B CN 108431890B CN 201680072828 A CN201680072828 A CN 201680072828A CN 108431890 B CN108431890 B CN 108431890B
- Authority
- CN
- China
- Prior art keywords
- signal
- frame
- samples
- audio signal
- shift value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 667
- 238000000034 method Methods 0.000 claims description 123
- 238000012545 processing Methods 0.000 claims description 58
- 238000012952 Resampling Methods 0.000 claims description 52
- 230000002123 temporal effect Effects 0.000 claims description 49
- 238000005070 sampling Methods 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 19
- 238000004891 communication Methods 0.000 claims description 8
- 230000000875 corresponding effect Effects 0.000 description 139
- 230000001364 causal effect Effects 0.000 description 119
- 230000004044 response Effects 0.000 description 113
- 230000008859 change Effects 0.000 description 67
- 238000010586 diagram Methods 0.000 description 37
- 230000003111 delayed effect Effects 0.000 description 28
- 230000006870 function Effects 0.000 description 17
- 230000008569 process Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 5
- 238000009499 grossing Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 230000007704 transition Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 238000006073 displacement reaction Methods 0.000 description 2
- 238000013213 extrapolation Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
本发明提供一种装置,其包含处理器、存储器和组合器。所述处理器经配置以接收对应于多通道音频信号的第一组合帧和第二组合帧。所述存储器经配置以存储所述第一组合帧的第一预看部分数据。所述第一预看部分数据是从所述处理器接收。所述组合器经配置以在多通道编码器处产生帧。所述帧包含所述第一预看部分数据的样本的子集、对应于所述第一组合帧的经更新样本数据的一或多个样本和对应于所述第二组合帧的第二组合帧数据的样本的群组。
Description
优先权主张
本申请案主张2015年12月18日申请的名为“多音频信号的编码(ENCODING OFMULTIPLE AUDIO SIGNALS)”的美国临时专利申请案第62/269,660号和2016年12月8日申请的名为“多音频信号的编码(ENCODING OF MULTIPLE AUDIO SIGNALS)”的美国非临时专利申请案第15/372,980号的优先权权益,前述申请案中的每一个的内容明确地以全文引用的方式并入本文中。
技术领域
本发明大体涉及多个音频信号的编码。
背景技术
技术的进步已带来更小且更强大的计算装置。举例来说,当前存在各种便携式个人计算装置,包含较小、轻型且用户容易携带的无线电话(例如移动和智能型电话)、平板计算机和手提式计算机。这些装置可经由无线网络传达语音和数据分组。另外,许多此类装置并入有额外功能性,例如数字静态摄像机、数字摄像机、数字记录器和音频文件播放器。而且,此类装置可处理可执行指令,包含软件应用程序,例如可用以存取因特网的网页浏览器应用程序。因而,这些装置可包含显著的计算能力。
计算装置可包含接收音频信号的多个麦克风。一般来说,声源距多个麦克风中的第一麦克风的距离比距第二麦克风的距离更近。因此,由于麦克风距声源的距离,从第二麦克风接收的第二音频信号可相对于从第一麦克风接收的音频信号延迟。在立体声编码中,来自麦克风的音频信号可经编码以产生中间通道信号和一或多个侧通道信号。中间通道信号可对应于第一音频信号和第二音频信号的和。侧通道信号可对应于第一音频信号与第二音频信号之间的差。由于在相对于第一音频信号接收第二音频信号时的延迟,第一音频信号可不与第二音频信号对准。第一音频信号相对于第二音频信号的未对准可增加所述两个音频信号之间的差。由于差的增加,可使用较高数目的位来对侧通道信号进行编码。
发明内容
在特定方面中,一种装置包含处理器、存储器和组合器。所述处理器经配置以接收对应于多通道音频信号的第一组合帧和第二组合帧。所述存储器经配置以存储所述第一组合帧的第一预看部分数据。第一预看部分数据是从处理器接收。所述组合器经配置以在多通道编码器处产生帧。所述帧包含第一预看部分数据的样本的子集、对应于第一组合帧的经更新样本数据的一或多个样本和对应于第二组合帧的第二组合帧数据的样本的群组。
在另一特定方面中,一种编码方法包含在装置处存储第一组合帧的第一预看部分数据。第一组合帧和第二组合帧对应于多通道音频信号。所述方法还包含在所述装置的多通道编码器处产生帧。所述帧包含第一预看部分数据的样本的子集、对应于第一组合帧的经更新样本数据的一或多个样本和对应于第二组合帧的第二组合帧数据的样本的群组。
在另一特定方面中,计算机可读存储装置存储指令,所述指令在由处理器执行时使处理器执行包含存储第一组合帧的第一预看部分数据的操作。第一组合帧和第二组合帧对应于多通道音频信号。所述方法还包含在多通道编码器处产生帧。所述帧包含第一预看部分数据的样本的子集、对应于第一组合帧的经更新样本数据的一或多个样本和第二组合帧数据的样本的群组。
在另一特定方面中,装置包含编码器和发射器。所述编码器经配置以确定指示第一音频信号相对于第二音频信号的移位的最终移位值。响应于确定最终移位值为正抑或为负,编码器可选择(或识别)第一音频信号或第二音频信号中的一个作为参考信号且选择(或识别)第一音频信号或第二音频信号中的另一个作为目标信号。编码器可基于非因果性移位值(例如,最终移位值的绝对值)来移位目标信号。编码器还经配置以基于第一音频信号(例如,参考信号)的第一样本和第二音频信号(例如,目标信号)的第二样本产生至少一个经编码信号。第二样本相对于第一样本而时间移位达基于最终移位值的量。发射器经配置以发射至少一个经编码信号。
在另一特定方面中,通信方法包含在第一装置处确定指示第一音频信号相对于第二音频信号的移位的最终移位值。所述方法还包含在第一装置处基于第一音频信号的第一样本和第二音频信号的第二样本产生至少一个经编码信号。第二样本可相对于第一样本而时间移位达基于最终移位值的量。所述方法进一步包含将至少一个经编码信号从第一装置发送到第二装置。
在另一特定方面中,计算机可读存储装置存储指令,所述指令在由处理器执行时使所述处理器执行包含确定指示第一音频信号相对于第二音频信号的移位的最终移位值的操作。所述操作还包含基于第一音频信号的第一样本和第二音频信号的第二样本产生至少一个经编码信号。第二样本相对于第一样本而时间移位达基于最终移位值的量。所述操作进一步包含发送至少一个经编码信号到装置。
本发明的其它方面、优势和特征将在审阅整个申请案之后变得显而易见,所述申请案包括以下部分:附图说明、具体实施方式和权利要求书。
附图说明
图1为包含可操作以编码多个音频信号的装置的系统的特定说明性实例的框图;
图2为说明包含图1的装置的系统的另一实例的图;
图3为说明可由图1的装置编码的样本的特定实例的图;
图4为说明可由图1的装置编码的样本的特定实例的图;
图5为说明可操作以编码多个音频信号的系统的另一实例的图;
图6为说明可操作以编码多个音频信号的系统的另一实例的图;
图7为说明可操作以编码多个音频信号的系统的另一实例的图;
图8为说明可操作以编码多个音频信号的系统的另一实例的图;
图9A为说明可操作以编码多个音频信号的系统的另一实例的图;
图9B为说明可操作以编码多个音频信号的系统的另一实例的图;
图9C为说明可操作以编码多个音频信号的系统的另一实例的图;
图10A为说明可操作以编码多个音频信号的系统的另一实例的图;
图10B为说明可操作以编码多个音频信号的系统的另一实例的图;
图11为说明可操作以编码多个音频信号的系统的另一实例的图;
图12为说明可操作以编码多个音频信号的系统的另一实例的图;
图13为说明编码多个音频信号的特定方法的流程图;
图14为说明包含图1的装置的系统的另一实例的图;
图15为说明包含图1的装置的系统的另一实例的图;
图16为说明编码多个音频信号的特定方法的流程图;
图17为说明可操作以编码多个音频信号的系统的另一实例的图;
图18为说明可操作以编码多个音频信号的系统的另一实例的图;
图19为说明可操作以编码多个音频信号的系统的另一实例的图;
图20为说明可操作以编码多个音频信号的系统的另一实例的图;
图21为说明可操作以编码多个音频信号的系统的另一实例的图;
图22为说明可操作以编码多个音频信号的系统的另一实例的图;
图23为说明可操作以编码多个音频信号的系统的另一实例的图;
图24A为说明可由图1的装置编码的帧的特定实例的图;
图24B为说明可由图1的装置编码的帧的特定实例的图;
图24C为说明可由图1的装置编码的帧的特定实例的图;
图25为说明可操作以编码多个音频信号的系统的另一实例的图;
图26为说明可操作以编码多个音频信号的系统的另一实例的图;
图27为说明编码多个音频信号的特定方法的流程图;
图28为可操作以编码多个音频信号的装置的特定说明性实例的框图;和
图29为可操作以编码多个音频信号的基站的框图。
具体实施方式
本发明公开可操作以编码多个音频信号的系统和装置。一种装置可包含经配置以编码多个音频信号的编码器。可使用多个记录装置(例如,多个麦克风)在时间上并行地捕获多个音频信号。在一些实例中,可通过对同时或在不同时间记录的若干音频通道进行多路复用来以合成方式(例如,以人工方式)产生多个音频信号(或多通道音频)。作为说明性实例,音频通道的并行记录或多路复用可产生2通道配置(即,立体通道:左和右)、5.1通道配置(左通道、右通道、中央通道、左环绕通道、右环绕通道和低频加重(LFE)通道)、7.1通道配置、7.1+4通道配置、22.2通道配置或N通道配置。
电话会议室(或远程呈现室)中的音频捕获装置可包含获取空间音频的多个麦克风。空间音频可包含话语以及经编码和经发射的背景音频。取决于布置麦克风的方式以及来源(例如,讲话者)相对于麦克风和房间大小所处的位置,来自给定来源(例如,讲话者)的话语/音频可于不同时间到达多个麦克风。举例来说,声源(例如,讲话者)距与装置相关联的第一麦克风的距离可比距与装置相关联的第二麦克风的距离更近。由此,从声源发射的声音到达第一麦克风的时间可早于到达第二麦克风的时间。所述装置可经由第一麦克风接收第一音频信号,且可经由第二麦克风接收第二音频信号。
在一些实例中,麦克风可从多个声源接收音频。多个声源可包含主要声源(例如,讲话者)和一或多个次要声源(例如,经过的汽车、交通、背景音乐、街道噪声)。从主要声源发射的声音到达第一麦克风的时间可早于到达第二麦克风的时间。
可以片段或帧编码音频信号。帧可对应于多个样本(例如,1920个样本或2000个样本)。中侧(MS)译码和参数立体声(PS)译码为可提供优于双重-单一译码技术的经改进效率的立体声译码技术。在双重-单一通道译码中,在不利用通道间相关性的情况下独立地对左(L)通道(或信号)和右(R)通道(或信号)译码。MS译码通过在译码之前将左通道和右通道转换成和通道与差通道(例如,侧通道)来减少相关L/R通道对之间的冗余。和信号与差信号为以MS译码来译码的波形。在和信号上比在侧信号上耗费相对更多的位。PS译码通过将L/R信号转换为和信号与侧参数集合来减少每一子频带中的冗余。侧参数可指示通道间强度差(IID)、通道间相位差(IPD)、通道间时差(ITD)等。和信号为连同侧参数经译码和发射的波形。在混合系统中,侧通道可在较低频带(例如,小于2千赫兹到3千赫兹(kHz))中经波形译码和在较高频带(例如,大于或等于2kHz到3kHz)中经PS译码,其中,通道间相位保持在感知上并不太重要。
可在频域或在子频带域中进行MS译码和PS译码。在一些实例中,左通道与右通道可为不相关的。举例来说,左通道和右通道可包含不相关的合成信号。当左通道与右通道不相关时,MS译码、PS译码或这两者的译码效率可接近于双重-单一译码的译码效率。
取决于记录配置,左通道与右通道之间可存在时间移位以及其它空间效应(例如回音和室内混响)。如果通道之间的时间移位和相位失配未得到补偿,那么和通道与差通道可含有减少与MS或PS技术相关的译码增益的可比能量。译码增益的减少可基于时间(或相位)移位量。和信号与差信号的可比能量可限制MS译码在某些帧中的使用,其中通道在时间上移位但为高度相关的。在立体声译码中,可基于以下方程式产生中间通道(例如,和通道)和侧通道(例如,差通道):
M=(L+R)/2,S=(L-R)/2, 方程式1
其中M对应于中间通道,S对应于侧通道,L对应于左通道且R对应于右通道。
在一些情况下,可基于以下方程式产生中间通道和侧通道:
M=c(L+R),S=c(L-R), 方程式2
其中c对应于可在帧与帧之间变化、在一个频率或子频带与另一频率或子频带之间变化的复合值或实值或其组合。
在一些情况下,可基于以下方程式产生中间通道和侧通道:
M=(c1*L+c2*R),S=(c3*L-c4*R), 方程式3
其中c1、c2、c3和c4为可在帧与帧之间变化、在一个子频带或频率与另一子频带或频率之间变化的复合值或实值或其组合。
基于方程式1、方程式2或方程式3产生中间通道和侧通道可被称作执行“降混”算法。基于方程式1、方程式2或方程式3从中间通道和侧通道产生左通道和右通道的反向过程可被称作执行“上混”算法。值c、值c1、值c2、值c3或值c4中的每一者可被称作“降混参数值”或“上混参数值”。
用以针对特定帧在MS译码或双重-单一译码之间进行选择的特用方法可包含:产生中间信号和侧信号;计算中间信号和侧信号的能量和基于所述能量确定是否执行MS译码。举例来说,可响应于侧信号与中间信号的能量比小于阈值的确定而执行MS译码。为进行说明,如果右通道经移位至少第一时间(例如,在48kHz下约0.001秒或48个样本),那么对于某些帧来说,中间信号(对应于左信号与右信号的和)的第一能量可与侧信号(对应于左信号和右信号的差)的第二能量相当。当第一能量与第二能量相当时,可使用较高数目的位来对侧通道进行编码,从而降低MS译码相对于双重-单一译码的译码效率。因此,当第一能量与第二能量相当时(例如,当第一能量与第二能量的比率大于或等于阈值时),使用双重-单一译码。在替代性方法中,可基于阈值同左通道与右通道的正规化交叉相关值的比较来针对特定帧在MS译码与双重-单一译码之间作出决定。
在一些实例中,编码器可确定指示第一音频信号相对于第二音频信号的时间失配(例如,移位)的失配值(例如,时间移位值、增益值、能量值、通道间预测值)。移位值(例如,失配值)可对应于在第一麦克风处对第一音频信号的接收与在第二麦克风处对第二音频信号的接收之间的时间延迟(例如,时间失配)的量。另外,编码器可在逐帧的基础上(例如,基于各20毫秒(ms)话语/音频帧)确定移位值。举例来说,移位值可对应于第二音频信号的第二帧相对于第一音频信号的第一帧延迟的时间量。可替代地,移位值可对应于第一音频信号的第一帧相对于第二音频信号的第二帧延迟的时间量。
当声源距第一麦克风的距离比距第二麦克风的距离更近时,第二音频信号的帧可相对于第一音频信号的帧延迟。在此情况下,第一音频信号可被称作“参考音频信号”或“参考通道”且经延迟第二音频信号可被称作“目标音频信号”或“目标通道”。可替代地,当声源距离第二麦克风的距离比距第一麦克风的距离更近时,第一音频信号的帧可相对于第二音频信号的帧延迟。在此情况下,第二音频信号可被称作参考音频信号或参考通道,且经延迟第一音频信号可被称作目标音频信号或目标通道。
取决于声源(例如,讲话者)在会议室或远程呈现室中所处的位置或声源(例如,讲话者)位置相对于麦克风改变的方式,参考通道和目标通道可在一个帧与另一帧之间改变;类似地,时间失配(例如,移位)值还可在一个帧与另一帧之间改变。然而,在一些实施方案中,时间移位值可始终为正,以指示“目标”通道相对于“参考”通道的延迟的量。另外,移位值可对应于“非因果性移位”值,经延迟目标通道通过所述“非因果性移位”值而在时间上“经拉回”,使得目标通道与“参考”通道对准(例如,最大限度地对准)。举例来说,在时间T0处,可选择参考通道的一部分用于编码;然而,由于目标通道滞后于参考通道,故可将目标通道的一部分存储于待在时间T1处(在时间T0之后)编码的“预看”存储器中,所述部分与参考通道的部分对应于同一声音。在此实例中,“拉回”目标通道是指在时间T0处而非在时间T1处编码目标通道的部分。“非因果性移位”可对应于经延迟音频通道(例如,滞后音频通道)相对于超前音频通道的移位,以在时间上将经延迟音频通道与超前音频通道对准。可对参考通道和非因果性经移位目标通道执行确定中间通道和侧通道的降混算法。
编码器可基于第一音频通道和应用于第二音频通道的多个移位值确定移位值。举例来说,可在第一时间(m1)处接收第一音频通道的第一帧X。可在对应于第一移位值(例如,shift1=n1-m1)的第二时间(n1)处接收第二音频通道的第一特定帧Y。另外,可在第三时间(m2)处接收第一音频通道的第二帧。可在对应于第二移位值(例如,shift2=n2-m2)的第四时间处(n2)接收第二音频通道的第二特定帧。
装置可以第一采样率(例如,32kHz采样率(即,每帧640个样本))执行成框或缓冲算法以产生帧(例如,20ms样本)。响应于对第一音频信号的第一帧和第二音频信号的第二帧同时到达装置的确定,编码器可将移位值(例如,shift1)估计为等于零样本。可在时间上将左通道(例如,对应于第一音频信号)与右通道(例如,对应于第二音频信号)对准。在一些情况下,即使当对准时,由于各种原因(例如,麦克风校准),左通道和右通道可在能量方面有所不同。
在一些实例中,由于各种原因(例如,声源,例如讲话者,距麦克风中的一个的距离可比距另一麦克风的距离更近且两个麦克风之间的距离可大于阈值(例如,1厘米到20厘米)),左通道和右通道可在时间上失配(例如,未对准)。声源相对于麦克风的定位可引入左通道和右通道中的不同的延迟。此外,在左通道与右通道之间可存在增益差、能量差或电平差。
在一些实例中,当多个讲话者交替讲话时(例如,在无重叠的情况下),音频信号从多个声源(例如,讲话者)到达麦克风的时间可变化。在此情况下,编码器可基于讲话者动态地调整时间移位值以识别参考通道。在一些其它实例中,多个讲话者可同时讲话,其可产生变化的时间移位值,视哪位讲话者最大声、距麦克风最近等而定。
在一些实例中,当两个信号潜在地展示较小相关性(或不相关)时,可合成或人工产生第一音频信号和第二音频信号。应理解,本文所描述的实例为说明性的且可在类似或不同情形中确定第一音频信号与第二音频信号之间的关系时具指导性。
编码器可基于第一音频信号的第一帧与第二音频信号的多个帧的比较产生比较值(例如,差值或交叉相关值)。多个帧中的每帧可对应于特定移位值。编码器可基于比较值产生第一经估计移位值(例如,第一经估计失配值)。举例来说,第一经估计移位值可对应于指示第一音频信号的第一帧与第二音频信号的对应第一帧之间的较高时间相似性(或较小差)的比较值。正移位值(例如,第一经估计移位值)可指示第一音频信号为超前音频信号(例如,在时间上超前的音频信号)和第二音频信号为滞后音频信号(例如,在时间上滞后的音频信号)。滞后音频信号的帧(例如,样本)可相对于超前音频信号的帧(例如,样本)在时间上经延迟。
编码器可通过在多个阶段中优化一系列经估计移位值来确定最终移位值(例如,最终失配值)。举例来说,编码器可首先基于产生从第一音频信号和第二音频信号的经立体声预处理和经重采样版本的比较值来估计“暂定”移位值。编码器可产生与接近经估计“暂定”移位值的移位值相关联的内插比较值。编码器可基于内插比较值确定第二经估计“内插”移位值。举例来说,第二经估计“内插”移位值可对应于指示相较于剩余内插比较值和第一经估计“暂定”移位值具有较高时间相似性(或较小差)的特定内插比较值。如果当前帧(例如,第一音频信号的第一帧)的第二经估计“内插”移位值与前一帧(例如,先于第一帧的第一音频信号的帧)的最终移位值不同,那么当前帧的“内插”移位值经进一步“修正”以改进第一音频信号与经移位第二音频信号之间的时间相似性。特定来说,第三经估计“修正”移位值可对应于通过查究当前帧的第二经估计“内插”移位值和前一帧的最终经估计移位值对时间相似性的更准确测量。第三经估计“修正”移位值经进一步调节以通过限制帧之间的移位值中的任何伪改变来估计最终移位值且所述第三经估计“修正”移位值经进一步控制以不会在如本文所描述的两个相继(或连续)帧中从负移位值切换到正移位值(或反过来也一样)。
在一些实例中,编码器可抑制在连续帧中或相邻帧中在正移位值与负移位值之间切换或反过来也一样。举例来说,编码器可基于第一帧的经估计“内插”或“修正”移位值和先于第一帧的特定帧中的对应经估计“内插”或“修正”或最终移位值将最终移位值设置成指示无时间移位的特定值(例如,0)。为进行说明,响应于确定当前帧的经估计“暂定”或“内插”或“修正”移位值中的一个为正且前一帧(例如,先于第一帧的帧)的经估计“暂定”或“内插”或“修正”或“最终”经估计移位值中的另一个为负,编码器可设置当前帧(例如,第一帧)的最终移位值以指示无时间移位,即,shift1=0。替代地,响应于确定当前帧的经估计“暂定”或“内插”或“修正”移位值中的一个为负且前一帧(例如,先于第一帧的帧)的经估计“暂定”或“内插”或“修正”或“最终”经估计移位值中的另一个为正,编码器还可设置当前帧(例如,第一帧)的最终移位值以指示无时间移位,即,shift1=0。如本文中所提及,“时间性移位(temporal-shift)”可对应于时间移位(time-shift)、时间偏移、失配、样本移位、样本偏移或偏移。
编码器可基于移位值选择第一音频信号或第二音频信号的帧作为“参考”或“目标”。举例来说,响应于确定最终移位值为正,编码器可产生参考通道或具有指示第一音频信号为“参考”信号且第二音频信号为“目标”信号的第一值(例如,0)的信号指示符。替代地,响应于确定最终移位值为负,编码器可产生参考通道或具有指示第二音频信号为“参考”信号且第一音频信号为“目标”信号的第二值(例如,1)的信号指示符。
参考信号可对应于超前信号,而目标信号可对应于滞后信号。在特定方面中,参考信号可为通过第一经估计移位值指示为超前信号的同一信号。在替代方面中,参考信号可与通过第一经估计移位值指示为超前号的信号不同。无论第一经估计移位值是否指示参考信号对应于超前信号,参考信号可被视为超前信号。举例来说,通过相对于参考信号移位(例如,调整)另一信号(例如,目标信号),参考信号可被视为超前信号。
在一些实例中,编码器可基于对应于待编码帧的失配值(例如,经估计移位值或最终移位值)和对应于先前经编码帧的失配(例如,移位)值识别或确定目标信号或参考信号中的至少一个。编码器可将失配值存储于存储器中。目标通道可对应于两个音频通道的在时间上滞后的音频通道,且参考通道可对应于两个音频通道的在时间上超前的音频通道。在一些实例中,基于来自存储器的失配值,编码器可识别在时间上滞后的通道且可不最大限度地使目标通道与参考通道对准。举例来说,编码器可基于一或多个失配值使目标通道与参考通道部分对准。在一些其它实例中,通过在经编码的多个帧(例如,四个帧)上将总失配值(例如,100个样本)“非因果性”地分布成较小失配值(例如,25个样本、25个样本、25个样本和25个样本),编码器可在一系列帧上逐渐调整目标通道。
编码器可估计与参考信号和非因果性经移位目标信号相关联的相对增益(例如,相对增益参数)。举例来说,响应于确定最终移位值为正,编码器可估计增益值以正规化或均衡第一音频信号相对于偏移一非因果性移位值(例如,最终移位值的绝对值)的第二音频信号的能量或功率电平。替代地,响应于确定最终移位值为负,编码器可估计增益值以正规化或均衡非因果性经移位第一音频信号相对于第二音频信号的功率电平。在一些实例中,编码器可估计增益值以正规化或均衡“参考”信号相对于非因果性经移位“目标”信号的能量或功率电平。在其它实例中,编码器可基于参考信号相对于目标信号(例如,未经移位目标信号)估计增益值(例如,相对增益值)。
编码器可基于参考信号、目标信号(例如,经移位目标信号或未经移位目标信号)、非因果性移位值和相对增益参数产生至少一个经编码信号(例如,中间信号、侧信号或这两者)。侧信号可对应于第一音频信号的第一帧的第一样本与第二音频信号的所选帧的所选样本之间的差。编码器可基于最终移位值选择所选帧。由于第一样本与所选样本之间的差相比于第一样本与第二音频信号的其它样本(其对应于第二音频信号中与第一帧同时由装置接收的帧)之间的差减小,可使用较少位来对侧通道信号进行编码。装置的发射器可发射至少一个经编码信号、非因果性移位值、相对增益参数、参考通道或信号指示符或其组合。
编码器可基于以下各者产生至少一个经编码信号(例如,中间信号、侧信号或这两者):参考信号、目标信号(例如,经移位目标信号或未经移位目标信号)、非因果性移位值、相对增益参数、第一音频信号的特定帧的低频带参数、特定帧的高频带参数或其组合。特定帧可先于第一帧。来自一或多个先前一帧的某些低频带参数、高频带参数或其组合可用以编码第一帧的中间信号、侧信号或这两者。基于低频带参数、高频带参数或其组合编码中间信号、侧信号或这两者可改进非因果性移位值和通道间相对增益参数的估计。低频带参数、高频带参数或其组合可包含间距参数、浊音参数、译码器型参数、低频带能量参数、高频带能量参数、倾斜参数、间距增益参数、FCB增益参数、译码模式参数、语音活动参数、噪声估计参数、信噪比参数、共振峰参数、话语/音乐决策参数、非因果性移位、通道间增益参数或其组合。装置的发射器可发射至少一个经编码信号、非因果性移位值、相对增益参数、参考通道(或信号)指示符或其组合。如本文中所提及,音频“信号”对应于音频“通道”。如本文中所提及,“移位值”对应于偏移值、失配值、时间失配值、时间偏移值、样本移位值或样本偏移值。如本文中所提及,“移位”目标信号可对应于移位表示目标信号的数据的一或多个位置、将数据复制到一或多个存储器缓冲器、移动与目标信号相关联的一或多个存储器指标或其组合。
参考图1,公开系统的特定说明性实例且一般将其指定为100。系统100包含经由网络120通信耦合到第二装置106的第一装置104。网络120可包含一或多个无线网络、一或多个有线网络或其组合。
第一装置104可包含编码器114、发射器110、一或多个输入接口112或其组合。输入接口112的第一输入接口可经耦合到第一麦克风146。一或多个输入接口112的第二输入接口可经耦合到第二麦克风148。编码器114可包含时间均衡器108且可经配置以降混并编码多个音频信号,如本文所描述。第一装置104还可包含经配置以存储分析数据190的存储器153。第二装置106可包含解码器118。解码器118可包含经配置以上混并呈现多个通道的时间平衡器124。第二装置106可经耦合到第一扬声器142、第二扬声器144或这两者。
在操作期间,第一装置104可经由第一输入接口从第一麦克风146接收第一音频信号130且可经由第二输入接口从第二麦克风148接收第二音频信号132。第一音频信号130可对应于右通道信号或左通道信号中的一个。第二音频信号132可对应于右通道信号或左通道信号中的另一个。第一麦克风146和第二麦克风148可从声源152(例如,用户、扬声器、环境噪声、乐器等)接收音频。在特定方面中,第一麦克风146、第二麦克风148或这两者可从多个声源接收音频。多个声源可包含主要(或最主要)声源(例如,声源152)和一或多个次要声源。一或多个次要声源可对应于交通、背景音乐、另一讲话者、街道噪声等。声源152(例如,主要声源)距第一麦克风146的距离可比距第二麦克风148的距离更近。因此,在一或多个输入接口112处,相比于经由第二麦克风148,可经由第一麦克风146在更早的时间接收来自声源152的音频信号。在经由多个麦克风的多通道信号获取中的此固有延迟可在第一音频信号130与第二音频信号132之间引入时间移位。
第一装置104可将第一音频信号130、第二音频信号132或这两者存储于存储器153中。时间均衡器108可确定指示第一音频信号130(例如,“目标”)相对于第二音频信号132(例如,“参考”)的移位(例如,非因果性移位)的最终移位值116(例如,非因果性移位值),如参考图10A到10B进一步描述。最终移位值116(例如,最终失配值)可指示第一音频信号与第二音频信号之间的时间失配(例如,时间延迟)的量。如本文中所提及,“时间延迟(timedelay)”可对应于“时间失配”或“时间延迟(temporal delay)”。时间失配可指示经由第一麦克风146对第一音频信号130的接收与经由第二麦克风148对第二音频信号132的接收之间的时间延迟。举例来说,最终移位值116的第一值(例如,正值)可指示第二音频信号132相对于第一音频信号130延迟。在此实例中,第一音频信号130可对应于超前信号且第二音频信号132可对应于滞后信号。最终移位值116的第二值(例如,负值)可指示第一音频信号130相对于第二音频信号132延迟。在此实例中,第一音频信号130可对应于滞后信号且第二音频信号132可对应于超前信号。最终移位值116的第三值(例如,0)可指示在第一音频信号130与第二音频信号132之间无延迟。
在一些实施方案中,最终移位值116的第三值(例如,0)可指示第一音频信号130与第二音频信号132之间的延迟已切换正负号。举例来说,第一音频信号130的第一特定帧可先于第一帧。第二音频信号132的第一特定帧和第二特定帧可对应于由声源152发射的同一声音。可在第一麦克风146处比在第二麦克风148处更早地检测到同一声音。第一音频信号130与第二音频信号132之间的延迟可从使第一特定帧相对于第二特定帧延迟切换到使第二帧相对于第一帧延迟。替代地,第一音频信号130与第二音频信号132之间的延迟可从使第二特定帧相对于第一特定帧延迟切换到使第一帧相对于第二帧延迟。响应于确定第一音频信号130与第二音频信号132之间的延迟已切换正负号,时间均衡器108可设置最终移位值116以指示第三值(例如,0),如参考图10A到10B进一步描述。
时间均衡器108可基于最终移位值116产生参考信号指示符164(例如,参考通道指示符),如参考图12进一步描述。举例来说,响应于确定最终移位值116指示第一值(例如,正值),时间均衡器108可产生具有指示第一音频信号130为“参考”信号的第一值(例如,0)的参考信号指示符164。响应于确定最终移位值116指示第一值(例如,正值),时间均衡器108可确定第二音频信号132对应于“目标”信号。替代地,响应于确定最终移位值116指示第二值(例如,负值),时间均衡器108可产生具有指示第二音频信号132为“参考”信号的第二值(例如,1)的参考信号指示符164。响应于确定最终移位值116指示第二值(例如,负值),时间均衡器108可确定第一音频信号130对应于“目标”信号。响应于确定最终移位值116指示第三值(例如,0),时间均衡器108可产生具有指示第一音频信号130为“参考”信号的第一值(例如,0)的参考信号指示符164。响应于确定最终移位值116指示第三值(例如,0),时间均衡器108可确定第二音频信号132对应于“目标”信号。替代地,响应于确定最终移位值116指示第三值(例如,0),时间均衡器108可产生具有指示第二音频信号132为“参考”信号的第二值(例如,1)的参考信号指示符164。响应于爬到最终移位值116指示第三值(例如,0),时间均衡器108可确定第一音频信号130对应于“目标”信号。在一些实施方案中,响应于确定最终移位值116指示第三值(例如,0),时间均衡器108可使参考信号指示符164保持不变。举例来说,参考信号指示符164可与对应于第一音频信号130的第一特定帧的参考信号指示符相同。时间均衡器108可产生指示最终移位值116的绝对值的非因果性移位值162(例如,非因果性失配值)。
时间均衡器108可基于“目标”信号的样本和基于“参考”信号的样本产生增益参数160(例如,编解码器增益参数)。举例来说,时间均衡器108可基于非因果性移位值162选择第二音频信号132的样本。如本文中所提及,基于移位值选择音频信号的样本可对应于通过基于移位值调整(例如,移位)音频信号来产生经修改(例如,经时间移位)音频信号和选择经修改音频信号的样本。举例来说,时间均衡器108可通过基于非因果性移位值162移位第二音频信号132来产生经时间移位的第二音频信号且可选择经时间移位的第二音频信号的样本。时间均衡器108可基于非因果性移位值162调整(例如,移位)第一音频信号130或第二音频信号132的单个音频信号(例如,单个通道)。替代地,时间均衡器108可选择第二音频信号132中与非因果性移位值162无关的样本。响应于确定第一音频信号130为参考信号,时间均衡器108可基于第一音频信号130的第一帧的第一样本确定所选样本的增益参数160。替代地,响应于确定第二音频信号132为参考信号,时间均衡器108可基于所选样本确定第一样本的增益参数160。作为一实例,增益参数160可基于以下方程式中的一个:
其中,gD对应于用于降混处理的相对增益参数160,Ref(n)对应于“参考”信号的样本,N1对应于第一帧的非因果性移位值162,且Targ(n+N1)对应于“目标”信号的样本。可(例如)基于方程式4a到4f中的一个修改增益参数160(gD)以并入长期平滑/迟滞逻辑,以避免帧之间的增益跳跃较大。当目标信号包含第一音频信号130时,第一样本可包含目标信号的样本且所选样本可包含参考信号的样本。当目标信号包含第二音频信号132时,第一样本可包含参考信号的样本,且所选样本可包含目标信号的样本。
在一些实施方案中,时间均衡器108可基于在不考虑参考信号指示符164的情况下将第一音频信号130视为参考信号和将第二音频信号132视为目标信号来产生增益参数160。举例来说,时间均衡器108可基于方程式4a到4f中的一个产生增益参数160,其中Ref(n)对应于第一音频信号130的样本(例如,第一样本)且Targ(n+N1)对应于第二音频信号132的样本(例如,所选样本)。在替代实施方案中,时间均衡器108可基于在不考虑参考信号指示符164的情况下将第二音频信号132视为参考信号和将第一音频信号130视为目标信号来产生增益参数160。举例来说,时间均衡器108可基于方程式4a到4f中的一个产生增益参数160,其中Ref(n)对应于第二音频信号132的样本(例如,所选样本)且Targ(n+N1)对应于第一音频信号130的样本(例如,第一样本)。
时间均衡器108可基于第一样本、所选样本和用于降混处理的相对增益参数160产生一或多个经编码信号102(例如,中间通道信号、侧通道信号或这两者)。举例来说,时间均衡器108可基于以下方程式中的一个产生中间信号:
M=Ref(n)+gDTarg(n+N1), 方程式5a
M=Ref(n)+Targ(n+N1), 方程式5b
其中M对应于中间通道信号,gD对应于用于降混处理的相对增益参数160,Ref(n)对应于“参考”信号的样本,N1对应于第一帧的非因果性移位值162,且Targ(n+N1)对应于“目标”信号的样本。
时间均衡器108可基于以下方程式中的一个产生侧通道信号:
S=Ref(n)-gDTarg(n+N1), 方程式6a
S=gDRef(n)-Targ(n+N1), 方程式6b
其中S对应于侧通道信号,gD对应于用于降混处理的相对增益参数160,Ref(n)对应于“参考”信号的样本,N1对应于第一帧的非因果性移位值162,且Targ(n+N1)对应于“目标”信号的样本。
发射器110可经由网络120将经编码信号102(例如,中间通道信号、侧通道信号或这两者)、参考信号指示符164、非因果性移位值162、增益参数160或其组合发射到第二装置106。在一些实施方案中,发射器110可将经编码信号102(例如,中间通道信号、侧通道信号或这两者)、参考信号指示符164、非因果性移位值162、增益参数160或其组合存储于网络120的装置或本地装置处,以供稍后进一步处理或解码。
解码器118可解码经编码信号102。时间平衡器124可执行上混以产生第一输出信号126(例如,对应于第一音频信号130)、第二输出信号128(例如,对应于第二音频信号132)或这两者。第二装置106可经由第一扬声器142输出第一输出信号126。第二装置106可经由第二扬声器144输出第二输出信号128。
系统100因此可使得时间均衡器108能够使用比中间信号更少的位来对侧通道信号进行编码。第一音频信号130的第一帧的第一样本和第二音频信号132的所选样本可对应于由声源152发射的同一声音,且因此第一样本与所选样本之间的差可低于第一样本与第二音频信号132的其它样本之间的差。侧通道信号可对应于第一样本与所选样本之间的差。
参考图2,公开一系统的特定说明性方面且一般将其指定为200。系统200包含经由网络120耦合到第二装置106的第一装置204。第一装置204可对应于图1的第一装置104。系统200与图1的系统100的不同之处在于第一装置204经耦合到超过两个麦克风。举例来说,第一装置204可经耦合到第一麦克风146、第N麦克风248和一或多个额外麦克风(例如,图1的第二麦克风148)。第二装置106可经耦合到第一扬声器142、第Y扬声器244、一或多个额外扬声器(例如,第二扬声器144)或其组合。第一装置204可包含编码器214。编码器214可对应于图1的编码器114。编码器214可包含一或多个时间均衡器208。举例来说,一或多个时间均衡器208可包含图1的时间均衡器108。
在操作期间,第一装置204可接收超过两个音频信号。举例来说,第一装置204可经由第一麦克风146接收第一音频信号130,经由第N麦克风248接收第N音频信号232,且经由额外麦克风(例如,第二麦克风148)接收一或多个额外音频信号(例如,第二音频信号132)。
一或多个时间均衡器208可产生一或多个参考信号指示符264、最终移位值216、非因果性移位值262、增益参数260、经编码信号202或其组合,如参考图14到15进一步描述。举例来说,一或多个时间均衡器208可确定第一音频信号130为参考信号和第N音频信号232和额外音频信号中的每一者为目标信号。一或多个时间均衡器208可产生参考信号指示符164、最终移位值216、非因果性移位值262、增益参数260和对应于第一音频信号130和第N音频信号232与额外音频信号中的每一者的经编码信号202,如参考图14所描述。
参考信号指示符264可包含参考信号指示符164。最终移位值216可包含指示第二音频信号132相对于第一音频信号130的移位的最终移位值116、指示第N音频信号232相对于第一音频信号130的移位的第二最终移位值或这两者,如参考图14进一步描述。非因果性移位值262可包含对应于最终移位值116的绝对值的非因果性移位值162、对应于第二最终移位值的绝对值的第二非因果性移位值或这两者,如参考图14进一步描述。增益参数260可包含第二音频信号132的所选样本的增益参数160、第N音频信号232的所选样本的第二增益参数或这两者,如参考图14进一步描述。经编码信号202可包含经编码信号102中的至少一个。举例来说,经编码信号202可包含对应于第一音频信号130的第一样本和第二音频信号132的所选样本的侧通道信号、对应于第一样本和第N音频信号232的所选样本的第二侧通道或这两者,如参考图14进一步描述。经编码信号202可包含对应于第一样本、第二音频信号132的所选样本和第N音频信号232的所选样本的中间通道信号,如参考图14进一步描述。
在一些实施方案中,一或多个时间均衡器208可确定多个参考信号和对应目标信号,如参考图15所描述。举例来说,参考信号指示符264可包含对应于每对参考信号和目标信号的参考信号指示符。为进行说明,参考信号指示符264可包含对应于第一音频信号130和第二音频信号132的参考信号指示符164。最终移位值216可包含对应于每对参考信号和目标信号的最终移位值。举例来说,最终移位值216可包含对应于第一音频信号130和第二音频信号132的最终移位值116。非因果性移位值262可包含对应于每对参考信号和目标信号的非因果性移位值。举例来说,非因果性移位值262可包含对应于第一音频信号130和第二音频信号132的非因果性移位值162。增益参数260可包含对应于每对参考信号和目标信号的增益参数。举例来说,增益参数260可包含对应于第一音频信号130和第二音频信号132的增益参数160。经编码信号202可包含对应于每对参考信号和目标信号的中间通道信号和侧通道信号。举例来说,经编码信号202可包含对应于第一音频信号130和第二音频信号132的经编码信号102。
发射器110可经由网络120将参考信号指示符264、非因果性移位值262、增益参数260、经编码信号202或其组合发射到第二装置106。解码器118可基于参考信号指示符264、非因果性移位值262、增益参数260、经编码信号202或其组合产生一或多个输出信号。举例来说,解码器118可经由第一扬声器142输出第一输出信号226,经由第Y扬声器244输出第Y输出信号228,经由一或多个额外扩音器(例如,第二扬声器144)输出一或多个额外输出信号(例如,第二输出信号128),或其组合。
系统200可因此使得一或多个时间均衡器208能够编码超过两个音频信号。举例来说,通过基于非因果性移位值262产生侧通道信号,经编码信号202可包含使用比对应中间通道更少的位来编码的多个侧通道信号。
参考图3,展示样本的说明性实例且一般将其指定为300。样本300的至少子集可由第一装置104编码,如本文所描述。
样本300可包含对应于第一音频信号130的第一样本320、对应于第二音频信号132的第二样本350或这两者。第一样本320可包含样本322、样本324、样本326、样本328、样本330、样本332、样本334、样本336、一或多个额外样本或其组合。第二样本350可包含样本352、样本354、样本356、样本358、样本360、样本362、样本364、样本366、一或多个额外样本或其组合。
第一音频信号130可对应于多个帧(例如,帧302、帧304、帧306或其组合)。多个帧中的每一者可对应于第一样本320的样本的子集(例如,对应于20ms,例如32kHz下的640个样本或48kHz下的960个样本)。举例来说,帧302可对应于样本322、样本324、一或多个额外样本或其组合。帧304可对应于样本326、样本328、样本330、样本332、一或多个额外样本或其组合。帧306可对应于样本334、样本336、一或多个额外样本或其组合。
可在图1的一或多个输入接口112处在与接收样本352大致相同的时间接收样本322。可在图1的一或多个输入接口112处在与接收样本354大致相同的时间接收样本324。可在图1的一或多个输入接口112处在与接收样本356大致相同的时间接收样本326。可在图1的一或多个输入接口112处在与接收样本358大致相同的时间接收样本328。可在图1的一或多个输入接口112处在与接收样本360大致相同的时间接收样本330。可在图1的一或多个输入接口112处在与接收样本362大致相同的时间接收样本332。可在图1的一或多个输入接口112处在与接收样本364大致相同的时间接收样本334。可在图1的一或多个输入接口112处在与接收样本366大致相同的时间接收样本336。
最终移位值116的第一值(例如,正值)可指示第一音频信号130与第二音频信号132之间的时间失配量,其指示第二音频信号132相对于第一音频信号130的时间延迟(例如,时间失配)。举例来说,最终移位值116的第一值(例如,+X ms或+Y个样本,其中X和Y包含正实数)可指示帧304(例如,样本326-332)对应于样本358-364。第二音频信号132的样本358-364可相对于样本326-332在时间上经延迟。样本326到332和样本358-364可对应于从声源152发射的同一声音。样本358-364可对应于第二音频信号132的帧344。图1到15中的一或多者中具有交叉影线的样本的说明可指示样本对应于同一声音。举例来说,在图3中说明具有交叉影线的样本326-332和样本358-364以指示样本326-332(例如,帧304)和样本358-364(例如,帧344)对应于从声源152发射的同一声音。
应理解,如图3中所展示,Y个样本的时间偏移为说明性的。举例来说,时间偏移可对应于大于或等于0的样本的数目Y。在时间偏移Y=0个样本的第一情况下,样本326-332(例如,对应于帧304)和样本356-362(例如,对应于帧344)可展示无任何帧偏移的高相似性。在时间偏移Y=2个样本的第二情况下,帧304和帧344可偏移2个样本。在此情况下,可以Y=2个样本或X=(2/Fs)ms先于第二音频信号132在一或多个输入接口112处接收第一音频信号130,其中Fs对应于以kHz为单位的采样率。在一些情况下,时间偏移Y可包含非整数值,例如,Y=1.6个样本,其对应于32kHz下的X=0.05ms。
图1的时间均衡器108可基于最终移位值116确定第一音频信号130对应于参考信号且第二音频信号132对应于目标信号。参考信号(例如,第一音频信号130)可对应于超前信号且目标信号(例如,第二音频信号132)可对应于滞后信号。举例来说,通过基于最终移位值116使第二音频信号132相对于第一音频信号130移位,可将第一音频信号130视为参考信号。
时间均衡器108可将第二音频信号132移位以指示将用样本358-264(相比于样本356到362)来对样本326-332进行编码。举例来说,时间均衡器108可将样本358-364的位置移位到样本356-362的位置。时间均衡器108可将一或多个指标从指示样本356-362的位置更新到指示样本358-364的位置。相比于复制对应于样本356-362的数据,时间均衡器108可将对应于样本358-364的数据复制到缓冲器。时间均衡器108可通过对样本326-332和样本358-364进行编码来产生经编码信号102,如参考图1所描述。
参考图4,展示样本的说明性实例且一般将其指定为400。实例400与实例300不同之处在于第一音频信号130相对于第二音频信号132经延迟。
最终移位值116的第二值(例如,负值)可指示第一音频信号130与第二音频信号132之间的时间失配量指示第一音频信号130相对于第二音频信号132的时间延迟(例如,时间失配)。举例来说,最终移位值116的第二值(例如,-X ms或-Y个样本,其中X和Y包含正实数)可指示帧304(例如,样本326-332)对应于样本354-360。样本354-360可对应于第二音频信号132的帧344。样本326-332相对于样本354-360在时间上经延迟。样本354-360(例如,帧344)和样本326-332(例如,帧304)可对应于从声源152发射的同一声音。
应理解,如图4中所展示,-Y个样本的时间偏移为说明性的。举例来说,时间偏移可对应于小于或等于0的样本的数目-Y。在时间偏移Y=0个样本的第一情况下,样本326-332(例如,对应于帧304)和样本356-362(例如,对应于帧344)可展示无任何帧偏移的高相似性。在时间偏移Y=-6个样本的第二情况下,帧304和帧344可偏移6个样本。在此情况下,可以Y=-6个样本或X=(-6/Fs)ms在一或多个输入接口112处继第二音频信号132之后接收第一音频信号130,其中Fs对应于以kHz为单位的样本频率。在一些情况下,时间偏移Y可包含非整数值,例如,Y=-3.2个样本,其对应于32kHz下的X=-0.1ms。
图1的时间均衡器108可确定第二音频信号132对应于参考信号且第一音频信号130对应于目标信号。特定来说,时间均衡器108可从最终移位值116估计非因果性移位值162,如参考图5所描述。时间均衡器108可基于最终移位值116的正负号将第一音频信号130或第二音频信号132中的一个识别(例如,指定)为参考信号且将第一音频信号130或第二音频信号132中的另一个识别(例如,指定)为目标信号。
参考信号(例如,第二音频信号132)可对应于超前信号且目标信号(例如,第一音频信号130)可对应于滞后信号。举例来说,通过基于最终移位值116使第一音频信号130相对于第二音频信号132移位,可将第二音频信号132视为参考信号。
时间均衡器108可移位第一音频信号130以指示将用样本326-332(相比于样本324-330)来对样本354-360进行编码。举例来说,时间均衡器108可将样本326-332的位置移位到样本324-330的位置。时间均衡器108可将一或多个指标从指示样本324-330的位置更新到指示样本326-332的位置。相比于复制对应于样本324-330的数据,时间均衡器108可将对应于样本326-332的数据复制到缓冲器。时间均衡器108可通过对样本354-360和样本326-332进行编码来产生经编码信号102,如参考图1所描述。
参看图5,展示系统的说明性实例且一般将其指定为500。系统500可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统500的一或多个组件。时间均衡器108可包含重采样器504、信号比较器506、内插器510、移位优化器511、移位改变分析器512、绝对移位产生器513、参考信号指定器508、增益参数产生器514、信号产生器516或其组合。
在操作期间,重采样器504可产生一或多个经重采样信号,如参考图6进一步描述。举例来说,重采样器504可通过基于重采样(例如,递减采样或递增采样)因数(D)(例如,≥1)重采样(例如,递减采样或递增采样)第一音频信号130来产生第一经重采样信号530(经递减采样信号或经递增采样信号)。重采样器504可通过基于重采样因数(D)重采样第二音频信号132来产生第二经重采样信号532。重采样器504可将第一经重采样信号530、第二经重采样信号532或这两者提供到信号比较器506。
信号比较器506可产生比较值534(例如,差值、相似性值、相干值或交叉相关值)、暂定移位值536(例如,暂定失配值)或这两者,如参考图7进一步描述。举例来说,信号比较器506可基于第一经重采样信号530和应用于第二经重采样信号532的多个移位值产生比较值534,如参考图7进一步描述。信号比较器506可基于比较值534确定暂定移位值536,如参考图7进一步描述。第一经重采样信号530相比于第一音频信号130可包含更少样本或更多样本。第二经重采样信号532相比于第二音频信号132可包含更少样本或更多样本。在替代方面中,第一经重采样信号530可与第一音频信号130相同且第二经重采样信号532可与第二音频信号132相同。相比于基于原始信号(例如,第一音频信号130和第二音频信号132)的样本,基于经重采样信号(例如,第一经重采样信号530和第二经重采样信号532)的更少样本确定比较值534可使用更少的资源(例如,时间、操作次数或这两者)。相比于基于原始信号(例如,第一音频信号130和第二音频信号132)的样本,基于经重采样信号(例如,第一经重采样信号530和第二经重采样信号532)的更多样本确定比较值534可增加精确度。信号比较器506可将比较值534、暂定移位值536或这两者提供到内插器510。
内插器510可扩展暂定移位值536。举例来说,内插器510可产生经内插移位值538(例如,经内插失配值),如参考图8进一步描述。举例来说,内插器510可通过对比较值534进行内插来产生对应于接近暂定移位值536的移位值的内插比较值。内插器510可基于经内插比较值和比较值534确定经内插移位值538。比较值534可基于移位值的较粗糙粒度。举例来说,比较值534可基于移位值的集合的第一子集,以使得第一子集的第一移位值与第一子集的每第二移位值之间的差大于或等于阈值(例如,≥1)。阈值可基于重采样因数(D)。
经内插比较值可基于接近于经重采样暂定移位值536的移位值的较精细粒度。举例来说,经内插比较值可基于移位值的集合的第二子集,以使得第二子集的最大移位值与经重采样暂定移位值536之间的差小于阈值(例如,≥1),且第二子集的最小移位值与经重采样暂定移位值536之间的差小于阈值。相比于基于移位值的集合的较精细粒度(例如,全部)确定比较值534,基于移位值的集合的较粗糙粒度(例如,第一子集)确定比较值534可使用更少的资源(例如,时间、操作或这两者)。确定对应于移位值的第二子集的经内插比较值可基于接近暂定移位值536的移位值的较小集合的较精细粒度扩展暂定移位值536,而无需确定对应于移位值的集合的每一移位值的比较值。因此,基于移位值的第一子集确定暂定移位值536和基于经内插比较值确定经内插移位值538可平衡经估计移位值的资源使用和优化。内插器510可将经内插移位值538提供到移位优化器511。
移位优化器511可通过优化经内插移位值538来产生经修正移位值540,如参考图9A到9C进一步描述。举例来说,移位优化器511可确定经内插移位值538是否指示第一音频信号130与第二音频信号132之间的移位的改变大于移位改变阈值,如参考图9A进一步描述。可通过经内插移位值538与同图3的帧302相关联的第一移位值之间的差来指示移位改变。响应于确定差小于或等于阈值,移位优化器511可将经修正移位值540设置成经内插移位值538。替代地,响应于确定差大于阈值,移位优化器511可确定多个移位值对应于小于或等于移位改变阈值的差,如参考图9A进一步描述。移位优化器511可基于第一音频信号130和应用于第二音频信号132的多个移位值确定比较值。移位优化器511可基于比较值确定经修正移位值540,如参考图9A进一步描述。举例来说,移位优化器511可基于比较值和经内插移位值538选择多个移位值中的一移位值,如参考图9A进一步描述。移位优化器511可设置经修正移位值540以指示所选移位值。对应于帧302的第一移位值与经内插移位值538之间的非零差可指示第二音频信号132的一些样本对应于两个帧(例如,帧302和帧304)。举例来说,可在编码期间重复第二音频信号132的一些样本。替代地,非零差可指示第二音频信号132的一些样本既不对应于帧302也不对应于帧304。举例来说,可在编码期间丢失第二音频信号132的一些样本。将经修正移位值540设置成多个移位值中的一个可防止连续(或邻近)帧之间的较大移位改变,从而在编码期间减少样本丢失或样本重复的量。移位优化器511可将经修正移位值540提供到移位改变分析器512。
在一些实施方案中,移位优化器511可调整经内插移位值538,如参考图9B所描述。移位优化器511可基于经调整内插移位值538确定经修正移位值540。在一些实施方案中,移位优化器511可确定经修正移位值540,如参考图9C所描述。
移位改变分析器512可确定经修正移位值540是否指示第一音频信号130与第二音频信号132之间的时序切换或反转,如参考图1所描述。特定来说,时序反转或切换可指示:对于帧302来说,在一或多个输入接口112处先于第二音频信号132接收第一音频信号130,且对于后帧(例如,帧304或帧306)来说,在一或多个输入接口处先于第一音频信号130接收第二音频信号132。替代地,时序反转或切换可指示:对于帧302来说,在一或多个输入接口112处先于第一音频信号130接收第二音频信号132;且对于后帧(例如,帧304或帧306)来说,在一或多个输入接口处先于第二音频信号132接收第一音频信号130。换句话说,时序切换或反转可指示对应于帧302的最终移位值具有与对应于帧304的经修正移位值540的第二正负号不同的第一正负号(例如,正到负的转变或正到负的转变)。移位改变分析器512可确定第一音频信号130与第二音频信号132之间的延迟是否已基于经修正移位值540和与帧302相关的第一移位值切换正负号,如参考图10A进一步描述。响应于确定第一音频信号130与第二音频信号132之间的延迟已切换正负号,移位改变分析器512可将最终移位值116设置成指示无时间移位的值(例如,0)。替代地,响应于确定第一音频信号130与第二音频信号132之间的延迟并未切换正负号,移位改变分析器512可将最终移位值116设置成经修正移位值540,如参考图10A进一步描述。移位改变分析器512可通过优化经修正移位值540来产生经估计移位值,如参考图10A、11进一步描述。移位改变分析器512可将最终移位值116设置成经估计移位值。设置最终移位值116以指示无时间移位可通过抑制第一音频信号130和第二音频信号132在针对第一音频信号130的连续(或相邻)帧的相反方向上时间移位来减少解码器处的失真。移位改变分析器512可将最终移位值116提供到参考信号指定器508、提供到绝对移位产生器513或这两者。在一些实施方案中,移位改变分析器512可确定最终移位值116,如参考图10B所描述。
绝对移位产生器513可通过将绝对函数应用于最终移位值116来产生非因果性移位值162。绝对移位产生器513可将非因果性移位值162提供到增益参数产生器514。
参考信号指定器508可产生参考信号指示符164,如参考图12到13进一步描述。举例来说,参考信号指示符164可具有指示第一音频信号130为参考信号的第一值或指示第二音频信号132为参考信号的第二值。参考信号指定器508可将参考信号指示符164提供到增益参数产生器514。
增益参数产生器514可基于非因果性移位值162选择目标信号(例如,第二音频信号132)的样本。举例来说,增益参数产生器514可通过基于非因果性移位值162移位目标信号(例如,第二音频信号132)来产生经时间移位的目标信号(例如,经时间移位的第二音频信号)且可选择经时间移位的目标信号的样本。为进行说明,响应于确定非因果性移位值162具有第一值(例如,+X ms或+Y个样本,其中X和Y包含正实数),增益参数产生器514可选择样本358-364。响应于确定非因果性移位值162具有第二值(例如,-X ms或-Y个样本),增益参数产生器514可选择样本354-360。响应于确定非因果性移位值162具有指示无时间移位的值(例如,0),增益参数产生器514可选择样本356-362。
增益参数产生器514可基于参考信号指示符164确定第一音频信号130是否为参考信号或第二音频信号132是否为参考信号。增益参数产生器514可基于帧304的样本326-332和第二音频信号132的所选样本(例如,样本354-360、样本356-362或样本358-364)产生增益参数160,如参考图1所描述。举例来说,增益参数产生器514可基于方程式4a到方程式4f中的一或多者产生增益参数160,其中gD对应于增益参数160,Ref(n)对应于参考信号的样本,且Targ(n+N1)对应于目标信号的样本。为进行说明,当非因果性移位值162具有第一值(例如,+X ms或+Y个样本,其中X和Y包含正实数)时,Ref(n)可对应于帧304的样本326-332,且Targ(n+tN1)可对应于帧344的样本358-364。在一些实施方案中,Ref(n)可对应于第一音频信号130的样本,且Targ(n+N1)可对应于第二音频信号132的样本,如参考图1所描述。在替代实施方案中,Ref(n)可对应于第二音频信号132的样本,且Targ(n+N1)可对应于第一音频信号130的样本,如参考图1所描述。
增益参数产生器514可将增益参数160、参考信号指示符164、非因果性移位值162或其组合提供到信号产生器516。信号产生器516可产生经编码信号102,如参考图1所描述。举例来说,经编码信号102可包含第一经编码信号帧564(例如,中间通道帧)、第二经编码信号帧566(例如,侧通道帧)或这两者。信号产生器516可基于方程式5a或方程式5b产生第一经编码信号帧564,其中M对应于第一经编码信号帧564,gD对应于增益参数160,Ref(n)对应于参考信号的样本,且Targ(n+N1)对应于目标信号的样本。信号产生器516可基于方程式6a或方程式6b产生第二经编码信号帧566,其中S对应于第二经编码信号帧566,gD对应于增益参数160,Ref(n)对应于参考信号的样本,且Targ(n+N1)对应于目标信号的样本。
时间均衡器108可将第一经重采样信号530、第二经重采样信号532、比较值534、暂定移位值536、经内插移位值538、经修正移位值540、非因果性移位值162、参考信号指示符164、最终移位值116、增益参数160、第一经编码信号帧564、第二经编码信号帧566或其组合存储于存储器153中。举例来说,分析数据190可包含第一经重采样信号530、第二经重采样信号532、比较值534、暂定移位值536、经内插移位值538、经修正移位值540、非因果性移位值162、参考信号指示符164、最终移位值116、增益参数160、第一经编码信号帧564、第二经编码信号帧566或其组合。
参考图6,展示系统的说明性实例且一般将其指定为600。系统600可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统600的一或多个组件。
重采样器504可通过重采样(例如,递减采样或递增采样)图1的第一音频信号130来产生第一经重采样信号530的第一样本620。重采样器504可通过重采样(例如,递减采样或递增采样)图1的第二音频信号132来产生第二经重采样信号532的第二样本650。
可以第一采样率(Fs)采样第一音频信号130以产生图3的样本320。第一采样率(Fs)可对应于与宽带(WB)带宽相关联的第一速率(例如,16千赫兹(kHz))、与超宽带(SWB)带宽相关联的第二速率(例如,32kHz)、与全频带(FB)带宽相关联的第三速率(例如,48kHz)或另一速率。可以第一采样率(Fs)采样第二音频信号132以产生图3的第二样本350。
在一些实施方案中,重采样器504可在重采样第一音频信号130(或第二音频信号132)之前预处理第一音频信号130(或第二音频信号132)。重采样器504可通过基于无限脉冲响应(IIR)滤波器(例如,一阶IIR滤波器)对第一音频信号130(或第二音频信号132)进行滤波来预处理第一音频信号130(或第二音频信号132)。IIR滤波器可基于以下方程式:
Hpre(z)=1/(1-αz-1), 方程式7
其中α为正数,例如0.68或0.72。在重采样之前执行去加重可减少例如混叠、信号调节或这两者的效应。可基于重采样因数(D)重采样第一音频信号130(例如,经预处理第一音频信号130)和第二音频信号132(例如,经预处理第二音频信号132)。重采样因数(D)可基于第一采样率(Fs)(例如,D=Fs/8,D=2Fs等)。
在替代实施方案中,在重采样之前可使用抗混叠滤波器对第一音频信号130和第二音频信号132进行低通滤波或进行抽选(decimated)。抽选滤波器(decimation filter)可基于重采样因数(D)。在特定实例中,响应于确定第一采样率(Fs)对应于特定频率(例如,32kHz),重采样器504可选择具有第一截止频率(例如,π/D或π/4)的抽选滤波器。相较于将抽选滤波器应用于多个信号,通过去加重多个信号(例如,第一音频信号130和第二音频信号132)来减少混叠可在计算上花费更少。
第一样本620可包含样本622、样本624、样本626、样本628、样本630、样本632、样本634、样本636、一或多个额外样本或其组合。第一样本620可包含图3的第一样本320的子集(例如,第1/8个)。样本622、样本624、一或多个额外样本或其组合可对应于帧302。样本626、样本628、样本630、样本632、一或多个额外样本或其组合可对应于帧304。样本634、样本636、一或多个额外样本或其组合可对应于帧306。
第二样本650可包含样本652、样本654、样本656、样本658、样本660、样本662、样本664、样本666、一或多个额外样本或其组合。第二样本650可包含图3的第二样本350的子集(例如,第1/8个)。样本654-660可对应于样本354-360。举例来说,样本654-660可包含样本354-360的子集(例如,第1/8个)。样本656-662可对应于样本356-362。举例来说,样本656-662可包含样本356-362的子集(例如,第1/8个)。样本658-664可对应于样本358-364。举例来说,样本658-664可包含样本358-364的子集(例如,第1/8个)。在一些实施方案中,重采样因数可对应于第一值(例如,1),其中图6的样本622-636和样本652-666可分别类似于图3的样本322-336和样本352-366。
重采样器504可将第一样本620、第二样本650或这两者存储于存储器153中。举例来说,分析数据190可包含第一样本620、第二样本650或这两者。
参考图7,展示系统的说明性实例且一般将其指定为700。系统700可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统700的一或多个组件。
存储器153可存储多个移位值760。移位值760可包含第一移位值764(例如,-X ms或-Y个样本,其中X和Y包含正实数)、第二移位值766(例如,+X ms或+Y个样本,其中X和Y包含正实数)或这两者。移位值760可在从较小移位值(例如,最小移位值,T_MIN)到较大移位值(例如,最大移位值,T_MAX)的范围内。移位值760可指示第一音频信号130与第二音频信号132之间的预期时间移位(例如,最大预期时间移位)。
在操作期间,信号比较器506可基于第一样本620和应用于第二样本650的移位值760确定比较值534。举例来说,样本626-632可对应于第一时间(t)。为进行说明,图1的一或多个输入接口112可在大致第一时间(t)处接收对应于帧304的样本626-632。第一移位值764(例如,-X ms或-Y个样本,其中X和Y包含正实数)可对应于第二时间(t-1)。
样本654-660可对应于第二时间(t-1)。举例来说,一或多个输入接口112可在大致第二时间(t-1)处接收样本654-660。信号比较器506可基于样本626-632和样本654-660确定对应于第一移位值764的第一比较值714(例如,差值或交叉相关值)。举例来说,第一比较值714可对应于样本626-632和样本654-660的交叉相关绝对值。作为另一实例,第一比较值714可指示样本626-632与样本654-660之间的差。
第二移位值766(例如,+X ms或+Y个样本,其中X和Y包含正实数)可对应于第三时间(t+1)。样本658-664可对应于第三时间(t+1)。举例来说,一或多个输入接口112可在大致第三时间(t+1)处接收样本658-664。信号比较器506可基于样本626-632和样本658-664确定对应于第二移位值766的第二比较值716(例如,差值或交叉相关值)。举例来说,第二比较值716可对应于样本626-632和样本658-664的交叉相关绝对值。作为另一实例,第二比较值716可指示样本626-632与样本658-664之间的差。信号比较器506可将比较值534存储于存储器153中。举例来说,分析数据190可包含比较值534。
信号比较器506可识别比较值534的所选比较值736,其具有相比于比较值534的其它值更高(或更低)的值。举例来说,响应于确定第二比较值716大于或等于第一比较值714,信号比较器506可选择第二比较值716作为所选比较值736。在一些实施方案中,比较值534可对应于交叉相关值。响应于确定第二比较值716大于第一比较值714,信号比较器506可确定样本626-632与样本658-664的相关度高于与样本654-660的相关度。信号比较器506可选择指示较高相关度的第二比较值716作为所选比较值736。在其它实施方案中,比较值534可对应于差值。响应于确定第二比较值716低于第一比较值714,信号比较器506可确定样本626-632与样本658-664的相似性大于与样本654-660的相似性(例如,样本626-632与样本658-664的差小于与样本654-660的差)。信号比较器506可选择指示较小差的第二比较值716作为所选比较值736。
相比于比较值534中的其它值,所选比较值736可指示更高的相关度(或更小的差)。信号比较器506可识别对应于所选比较值736的移位值760的暂定移位值536。举例来说,响应于确定第二移位值766对应于所选比较值736(例如,第二比较值716),信号比较器506可将第二移位值766识别为暂定移位值536。
信号比较器506可基于以下方程式确定所选比较值736:
其中maxXCorr对应于所选比较值736且k对应于移位值。w(n)*l′对应于经去加重、经重采样和窗化窗化第一音频信号130,且w(n)*r′对应于经去加重、经重采样和窗化第二音频信号132。举例来说,w(n)*l′可对应于样本626-632,w(n-1)*r′可对应于样本654-660,w(n)*r′可对应于样本656-662,且w(n+1)*r′可对应于样本658-664。-K可对应于移位值760的较低移位值(例如,最小移位值),且K可对应于移位值760的较高移位值(例如,最大移位值)。在方程式8中,与第一音频信号130是否对应于右(r)通道信号或左(l)通道信号无关,w(n)*l′对应于第一音频信号130。在方程式8中,与第二音频信号132是否对应于右(r)通道信号或左(l)通道信号无关,w(n)*r′对应于第二音频信号132。
信号比较器506可基于以下方程式确定暂定移位值536:
其中T对应于暂定移位值536。
信号比较器506可基于图6的重采样因数(D)将暂定移位值536从经重采样的样本映射到原始样本。举例来说,信号比较器506可基于重采样因数(D)更新暂定移位值536。为进行说明,信号比较器506可将暂定移位值536设置成暂定移位值536(例如,3)与重采样因数(D)(例如,4)的乘积(例如,12)。
参考图8,展示系统的说明性实例且一般将其指定为800。系统800可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统800的一或多个组件。存储器153可经配置以存储移位值860。移位值860可包含第一移位值864、第二移位值866或这两者。
在操作期间,内插器510可产生接近暂定移位值536(例如,12)的移位值860,如本文所描述。经映射移位值可对应于基于重采样因数(D)从经重采样的样本映射到原始样本的移位值760。举例来说,经映射移位值的第一经映射移位值可对应于第一移位值764与重采样因数(D)的乘积。经映射移位值中的第一经映射移位值与经映射移位值中的各第二经映射移位值之间的差可大于或等于阈值(例如,重采样因数(D),例如4)。移位值860可具有比移位值760更精细的粒度。举例来说,移位值860中的较低值(例如,最小值)与暂定移位值536之间的差可小于阈值(例如,4)。阈值可对应于图6的重采样因数(D)。移位值860可在从第一值(例如,暂定移位值536-(阈值-1))到第二值(例如,暂定移位值536+(阈值-1))的范围内。
内插器510可通过对比较值534执行内插来产生对应于移位值860的内插比较值816,如本文所描述。由于比较值534的较低粒度,对应于移位值860中的一或多者的比较值可不包含在比较值534内。使用内插比较值816可使得能够搜索对应于移位值860中的一或多者的内插比较值,以确定对应于接近暂定移位值536的特定移位值的经内插比较值是否指示比图7的第二比较值716更高的相关度(或较低差)。
图8包含说明经内插比较值816和比较值534(例如,交叉相关值)的实例的图表820。内插器510可执行基于汉宁窗化正弦内插(hanning windowed sinc interpolation)的内插、基于IIR滤波器的内插、样条内插、另一形式的信号内插或其组合。举例来说,内插器510可基于以下方程式执行汉宁窗化正弦内插:
其中b对应于窗化正弦函数,对应于暂定移位值536。可对应于比较值534的特定比较值。举例来说,当i对应于4时,可指示对应于第一移位值(例如,8)的比较值534的第一比较值。当i对应于0时,可指示对应于暂定移位值536(例如,12)的第二比较值716。当i对应于-4时,可指示对应于第三移位值(例如,16)的比较值534的第三比较值。
R(k)32kHz可对应于经内插比较值816的特定内插值。内插比较值816的每一内插值可对应于窗化正弦函数(b)与第一比较值、第二比较值716和第三比较值中的每一者的乘积的和。举例来说,内插器510可确定窗化正弦函数(b)与第一比较值的第一乘积、窗化正弦函数(b)与第二比较值716的第二乘积和窗化正弦函数(b)与第三比较值的第三乘积。内插器510可基于第一乘积、第二乘积和第三乘积的和确定特定内插值。内插比较值816的第一内插值可对应于第一移位值(例如,9)。窗化正弦函数(b)可具有对应于第一移位值的第一值。内插比较值816的第二内插值可对应于第二移位值(例如,10)。窗化正弦函数(b)可具有对应于第二移位值的第二值。窗化正弦函数(b)的第一值可与第二值不同。因此,第一内插值可与第二内插值不同。
在方程式10中,8kHz可对应于比较值534的第一频率。举例来说,第一频率可指示对应于帧(例如,图3的帧304)的包含于比较值534中的比较值的数目(例如,8)。32kHz可对应于内插比较值816的第二频率。举例来说,第二频率可指示对应于帧(例如,图3的帧304)的包含于内插比较值816中的内插比较值的数目(例如,32)。
内插器510可选择内插比较值816中的内插比较值838(例如,最大值或最小值)。内插器510可选择移位值860中对应于内插比较值838的移位值(例如,14)。内插器510可产生指示所选移位值(例如,第二移位值866)的内插移位值538。
使用粗略方法确定暂定移位值536和查究暂定移位值536以确定内插移位值538可在不损害搜索效率或精确性的情况下降低搜索复杂度。
参考图9A,展示系统的说明性实例且一般将其指定为900。系统900可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统900的一或多个组件。系统900可包含存储器153、移位优化器911或这两者。存储器153可经配置以存储对应于帧302的第一移位值962。举例来说,分析数据190可包含第一移位值962。第一移位值962可对应于暂定移位值、内插移位值、经修正移位值、最终移位值或与帧302相关联的非因果性移位值。帧302在第一音频信号130中可先于帧304。移位优化器911可对应于图1的移位优化器511。
图9A还包含一般指定为920的说明性操作方法的流程图。方法920可通过以下各者执行:图1的时间均衡器108、编码器114、第一装置104;图2的一或多个时间均衡器208、编码器214、第一装置204;图5的移位优化器511;移位优化器911;或其组合。
方法920包含在901处确定第一移位值962与内插移位值538之间的差的绝对值是否大于第一阈值。举例来说,移位优化器911可确定第一移位值962与内插移位值538之间的差的绝对值是否大于第一阈值(例如,移位改变阈值)。
方法920还包含,响应于在901处确定绝对值小于或等于第一阈值,在902处设置经修正移位值540以指示内插移位值538。举例来说,响应于确定绝对值小于或等于移位改变阈值,移位优化器911可设置经修正移位值540以指示内插移位值538。在一些实施方案中,当第一移位值962等于内插移位值538时,移位改变阈值可具有指示经修正移位值540将待设置成内插移位值538的第一值(例如,0)。在替代实施方案中,移位改变阈值可具有指示在902处经修正移位值540将待设置成内插移位值538的具有较大从由度的第二值(例如,≥1)。举例来说,针对第一移位值962与内插移位值538之间的差的范围,可将经修正移位值540设置成内插移位值538。为进行说明,当第一移位值962与内插移位值538之间的差(例如,-2、-1、0、1、2)的绝对值小于或等于移位改变阈值(例如,2)时,可将经修正移位值540设置成内插移位值538。
方法920进一步包含,响应于在901处确定绝对值大于第一阈值,在904处确定第一移位值962是否大于内插移位值538。举例来说,响应于确定绝对值大于移位改变阈值,移位优化器911可确定第一移位值962是否大于内插移位值538。
方法920还包含,响应于在904处确定第一移位值962大于内插移位值538,在906处将较低移位值930设置成第一移位值962与第二阈值之间的差,且将较大移位值932设置成第一移位值962。举例来说,响应于确定第一移位值962(例如,20)大于内插移位值538(例如,14),移位优化器911可将较低移位值930(例如,17)设置成第一移位值962(例如,20)与第二阈值(例如,3)之间的差。另外,或在替代方案中,响应于确定第一移位值962大于内插移位值538,移位优化器911可将较大移位值932(例如,20)设置成第一移位值962。第二阈值可基于第一移位值962与内插移位值538之间的差。在一些实施方案中,可将较低移位值930设置成内插移位值538与阈值(例如,第二阈值)之间的差,且可将较大移位值932设置成第一移位值962与阈值(例如,第二阈值)之间的差。
方法920进一步包含,响应于在904处确定第一移位值962小于或等于内插移位值538,在910处将较低移位值930设置成第一移位值962和将较大移位值932设置成第一移位值962与第三阈值的和。举例来说,响应于确定第一移位值962(例如,10)小于或等于内插移位值538(例如,14),移位优化器911可将较低移位值930设置成第一移位值962(例如,10)。另外,或在替代方案中,响应于确定第一移位值962小于或等于内插移位值538,移位优化器911可将较大移位值932(例如,13)设置成第一移位值962(例如,10)与第三阈值(例如,3)的和。第三阈值可基于第一移位值962与内插移位值538之间的差。在一些实施方案中,可将较低移位值930设置成第一移位值962与阈值(例如,第三阈值)之间的差,且可将较大移位值932设置成内插移位值538与阈值(例如,第三阈值)之间的差。
方法920还包含在908处基于第一音频信号130和应用于第二音频信号132的移位值960确定比较值916。举例来说,移位优化器911(或信号比较器506)可基于第一音频信号130和应用于第二音频信号132的移位值960产生比较值916,如参考图7所描述。为进行说明,移位值960可在从较低移位值930(例如,17)到较大移位值932(例如,20)的范围内。移位优化器911(或信号比较器506)可基于样本326-332和第二样本350的特定子集产生比较值916的特定比较值。第二样本350的特定子集可对应于移位值960的特定移位值(例如,17)。特定比较值可指示样本326-332与第二样本350的特定子集之间的差(或相关性)。
方法920进一步包含在912处基于比较值916确定经修正移位值540,所述比较值916是基于第一音频信号130和第二音频信号132产生。举例来说,移位优化器911可基于比较值916确定经修正移位值540。为进行说明,在第一情况下,当比较值916对应于交叉相关值时,移位优化器911可确定图8的对应于内插移位值538的内插比较值838大于或等于比较值916的最高比较值。替代地,当比较值916对应于差值时,移位优化器911可确定内插比较值838小于或等于比较值916的最低比较值。在此情况下,响应于确定第一移位值962(例如,20)大于内插移位值538(例如,14),移位优化器911可将经修正移位值540设置成较低移位值930(例如,17)。替代地,响应于确定第一移位值962(例如,10)小于或等于内插移位值538(例如,14),移位优化器911可将经修正移位值540设置成较大移位值932(例如,13)。
在第二情况下,当比较值916对应于交叉相关值时,移位优化器911可确定内插比较值838小于比较值916的最高比较值且可将经修正移位值540设置成移位值960中对应于最高比较值的特定移位值(例如,18)。替代地,当比较值916对应于差值时,移位优化器911可确定内插比较值838大于比较值916的最低比较值且可将经修正移位值540设置成移位值960中对应于最低比较值的特定移位值(例如,18)。
可基于第一音频信号130、第二音频信号132和移位值960产生比较值916。可使用如通过信号比较器506执行的类似程序基于比较值916来产生经修正移位值540,如参考图7所描述。
因此,方法920可使移位优化器911能够限制与连续(或邻近)帧相关联的移位值的改变。移位值的减少的改变可在编码期间减少样本丢失或样本重复。
参考图9B,展示系统的说明性实例且一般将其指定为950。系统950可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统950的一或多个组件。系统950可包含存储器153、移位优化器511或这两者。移位优化器511可包含内插移位调整器958。内插移位调整器958可经配置以基于第一移位值962选择性地调整内插移位值538,如本文所描述。移位优化器511可基于内插移位值538(例如,经调整的内插移位值538)确定经修正移位值540,如参考图9A、9C所描述。
图9B还包含一般指定为951的说明性操作方法的流程图。方法951可通过以下各者执行:图1的时间均衡器108、编码器114、第一装置104;图2的一或多个时间均衡器208、编码器214、第一装置204;图5的移位优化器511;图9A的移位优化器911;内插移位调整器958;或其组合。
方法951包含在952处基于第一移位值962与不受限内插移位值956之间的差产生偏移957。举例来说,内插移位调整器958可基于第一移位值962与不受限内插移位值956之间的差产生偏移957。不受限内插移位值956可对应于内插移位值538(例如,在通过内插移位调整器958调整之前)。内插移位调整器958可将不受限内插移位值956存储于存储器153中。举例来说,分析数据190可包含不受限内插移位值956。
方法951还包含在953处确定偏移957的绝对值是否大于阈值。举例来说,内插移位调整器958可确定偏移957的绝对值是否满足阈值。阈值可对应于内插移位限制MAX_SHIFT_CHANGE(例如,4)。
方法951包含,响应于在953处确定偏移957的绝对值大于阈值,在954处基于第一移位值962、偏移957的正负号和阈值设置内插移位值538。举例来说,响应于确定偏移957的绝对值未能满足(例如,大于)阈值,内插移位调整器958可限定内插移位值538。为进行说明,内插移位调整器958可基于第一移位值962、偏移957的正负号(例如,+1或-1)和阈值调整内插移位值538(例如,内插移位值538=第一移位值962+正负号(偏移957)*阈值)。
方法951包含,响应于953处确定偏移957的绝对值小于或等于阈值,在955处将内插移位值538设置成不受限内插移位值956。举例来说,响应于确定偏移957的绝对值满足(例如,小于或等于)阈值,内插移位调整器958可抑制改变内插移位值538。
因此,方法951可能够限定内插移位值538,使得内插移位值538相对于第一移位值962的改变满足内插移位限制。
参考图9C,展示系统的说明性实例且一般将其指定为970。系统970可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统970的一或多个组件。系统970可包含存储器153、移位优化器921或这两者。移位优化器921可对应于图5的移位优化器511。
图9C还包含一般指定为971的说明性操作方法的流程图。方法971可通过以下各者执行:图1的时间均衡器108、编码器114、第一装置104;图2的一或多个时间均衡器208、编码器214、第一装置204;图5的移位优化器511;图9A的移位优化器911;移位优化器921;或其组合。
方法971包含在972处确定第一移位值962与内插移位值538之间的差是否非零。举例来说,移位优化器921可确定第一移位值962与内插移位值538之间的差是否非零。
方法971包含,响应于在972处确定第一移位值962与内插移位值538之间的差为零,在973处将经修正移位值540设置成内插移位值538。举例来说,响应于确定第一移位值962与内插移位值538之间的差为零,移位优化器921可基于内插移位值538确定经修正移位值540(例如,经修正移位值540=内插移位值538)。
方法971包含,响应于在972处确定第一移位值962与内插移位值538之间的差非零,在975处确定偏移957的绝对值是否大于阈值。举例来说,响应于确定第一移位值962与内插移位值538之间的差非零,移位优化器921可确定偏移957的绝对值是否大于阈值。偏移957可对应于第一移位值962与不受限内插移位值956之间的差,如参考图9B所描述。阈值可对应于内插移位限制MAX_SHIFT_CHANGE(例如,4)。
方法971包含,响应于在972处确定第一移位值962与内插移位值538之间的差非零或在975处确定偏移957的绝对值小于或等于阈值,在976处将较低移位值930设置成第一阈值与第一移位值962和内插移位值538中的最小值之间的差,且将较大移位值932设置成第二阈值与第一移位值962和内插移位值538中的最大值的和。举例来说,响应于确定偏移957的绝对值小于或等于阈值,移位优化器921可基于第一阈值与第一移位值962和内插移位值538中的最小值之间的差确定较低移位值930。移位优化器921还可基于第二阈值与第一移位值962和内插移位值538中的最大值的和确定较大移位值932。
方法971还包含在977处基于第一音频信号130和应用于第二音频信号132的移位值960产生比较值916。举例来说,移位优化器921(或信号比较器506)可基于第一音频信号130和应用于第二音频信号132的移位值960产生比较值916,如参考图7所描述。移位值960可在从较低移位值930到较大移位值932的范围内。方法971可前进到979。
方法971包含,响应于在975处确定偏移957的绝对值大于阈值,在978处基于第一音频信号130和应用于第二音频信号132的不受限内插移位值956产生比较值915。举例来说,移位优化器921(或信号比较器506)可基于第一音频信号130和应用于第二音频信号132的不受限内插移位值956产生比较值915,如参考图7所描述。
方法971还包含在979处基于比较值916、比较值915或其组合确定经修正移位值540。举例来说,移位优化器921可基于比较值916、比较值915或其组合确定经修正移位值540,如参考图9A所描述。在一些实施方案中,移位优化器921可基于比较值915与比较值916的比较确定经修正移位值540以避免由于移位变化引起的局部极大值。
在一些情况下,第一音频信号130、第一经重采样信号530、第二音频信号132、第二经重采样信号532或其组合的固有间距可干扰移位估计过程。在这些情况中,可执行间距去加重或间距滤波以减少由于间距所引起的干扰且改进多个通道之间的移位估计可靠性。在一些情况下,在第一音频信号130、第一经重采样信号530、第二音频信号132、第二经重采样信号532或其组合中可存在可干扰移位估计过程的背景噪声。在这些情况中,噪声抑制或噪声抵消可用以改进多个通道之间的移位估计可靠性。
参考图10A,展示系统的说明性实例且一般将其指定为1000。系统1000可对应于
图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统1000的一或多个组件。
图10A还包含一般指定为1020的说明性操作方法的流程图。方法1020可通过移位改变分析器512、时间均衡器108、编码器114、第一装置104或其组合执行。
方法1020包含在1001处确定第一移位值962是否等于0。举例来说,移位改变分析器512可确定对应于帧302的第一移位值962是否具有指示无时间移位的第一值(例如,0)。方法1020包含,响应于在1001处确定第一移位值962等于0,前进到1010。
方法1020包含,响应于在1001处确定第一移位值962非零,在1002处确定第一移位值962是否大于0。举例来说,移位改变分析器512可确定对应于帧302的第一移位值962是否具有指示第二音频信号132相对于第一音频信号130在时间上延迟的第一值(例如,正值)。
方法1020包含,响应于在1002处确定第一移位值962大于0,在1004处确定经修正移位值540是否小于0。举例来说,响应于确定第一移位值962具有第一值(例如,正值),移位改变分析器512可确定经修正移位值540是否具有指示第一音频信号130相对于第二音频信号132在时间上延迟的第二值(例如,负值)。方法1020包含,响应于在1004处确定经修正移位值540小于0,前进到1008。方法1020包含,响应于在1004处确定经修正移位值540大于或等于0,前进到1010。
方法1020包含,响应于在1002处确定第一移位值962小于0,在1006处确定经修正移位值540是否大于0。举例来说,响应于确定第一移位值962具有第二值(例如,负值),移位改变分析器512可确定经修正移位值540是否具有指示第二音频信号132相对于第一音频信号130在时间上延迟的第一值(例如,正值)。方法1020包含,响应于在1006处确定经修正移位值540大于0,前进到1008。方法1020包含,响应于在1006处确定经修正移位值540小于或等于0,前进到1010。
方法1020包含在1008处将最终移位值116设置成0。举例来说,移位改变分析器512可将最终移位值116设置成指示无时间移位的特定值(例如,0)。响应于确定超前信号和滞后信号在产生帧302后的时间段期间切换,可将最终移位值116设置成特定值(例如,0)。举例来说,可基于指示第一音频信号130为超前信号且第二音频信号132为滞后信号的第一移位值962来编码帧302。经修正移位值540可指示第一音频信号130为滞后信号且第二音频信号132为超前信号。响应于确定由第一移位值962指示的超前信号与由经修正移位值540指示的超前信号不同,移位改变分析器512可将最终移位值116设置成特定值。
方法1020包含在1010处确定第一移位值962是否等于经修正移位值540。举例来说,移位改变分析器512可确定第一移位值962和经修正移位值540是否指示第一音频信号130与第二音频信号132之间的同一时间延迟。
方法1020包含,响应于在1010处确定第一移位值962等于经修正移位值540,在1012处将最终移位值116设置成经修正移位值540。举例来说,移位改变分析器512可将最终移位值116设置成经修正移位值540。
方法1020包含,响应于在1010处确定第一移位值962不等于经修正移位值540,在1014处产生经估计移位值1072。举例来说,移位改变分析器512可通过优化经修正移位值540来确定经估计移位值1072,如参考图11进一步描述。
方法1020包含在1016处将最终移位值116设置成经估计移位值1072。举例来说,移位改变分析器512可将最终移位值116设置成经估计移位值1072。
在一些实施方案中,响应于确定第一音频信号130与第二音频信号132之间的延迟并未切换,移位改变分析器512可设置非因果性移位值162以指示第二经估计移位值。举例来说,响应于在1001处确定第一移位值962等于0、在1004处确定经修正移位值540大于或等于0或在1006处确定经修正移位值540小于或等于0,移位改变分析器512可设置非因果性移位值162以指示经修正移位值540。
响应于确定第一音频信号130与第二音频信号132之间的延迟在图3的帧302与帧304之间切换,移位改变分析器512可因此设置非因果性移位值162以指示无时间移位。防止非因果性移位值162在连续帧之间切换方向(例如,正到负或负到正)可减少在编码器114处的降混信号产生的失真,避免为了解码器处的上混合成而使用额外的延迟,或这两者。
参考图10B,展示系统的说明性实例且一般将其指定为1030。系统1030可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统1030的一或多个组件。
图10B还包含一般指定为1031的说明性操作方法的流程图。方法1031可通过移位改变分析器512、时间均衡器108、编码器114、第一装置104或其组合执行。
方法1031包含在1032处确定第一移位值962是否大于零且经修正移位值540是否小于零。举例来说,移位改变分析器512可确定第一移位值962是否大于零且经修正移位值540是否小于零。
方法1031包含,响应于在1032处确定第一移位值962大于零且经修正移位值540小于零,在1033处将最终移位值116设置成零。举例来说,响应于确定第一移位值962大于零且经修正移位值540小于零,移位改变分析器512可将最终移位值116设置成指示无时间移位的第一值(例如,0)。
方法1031包含,响应于在1032处确定第一移位值962小于或等于零或经修正移位值540大于或等于零,在1034处确定第一移位值962是否小于零且经修正移位值540是否大于零。举例来说,响应于确定第一移位值962小于或等于零或经修正移位值540大于或等于零,移位改变分析器512可确定第一移位值962是否小于零和经修正移位值540是否大于零。
方法1031包含,响应于确定第一移位值962小于零且经修正移位值540大于零,前进到1033。方法1031包含,响应于确定第一移位值962大于或等于零或经修正移位值540小于或等于零,在1035处将最终移位值116设置成经修正移位值540。举例来说,响应于确定第一移位值962大于或等于零或经修正移位值540小于或等于零,移位改变分析器512可将最终移位值116设置成经修正移位值540。
参考图11,展示系统的说明性实例且一般将其指定为1100。系统1100可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统1100的一或多个组件。图11还包含说明一般指定为1120的操作方法的流程图。方法1120可通过移位改变分析器512、时间均衡器108、编码器114、第一装置104或其组合来执行。方法1120可对应于图10A的步骤1014。
方法1120包含在1104处确定第一移位值962是否大于经修正移位值540。举例来说,移位改变分析器512可确定第一移位值962是否大于经修正移位值540。
方法1120还包含,响应于在1104处确定第一移位值962大于经修正移位值540,在1106处将第一移位值1130设置成经修正移位值540与第一偏移之间的差,且将第二移位值1132设置成第一移位值962与第一偏移的和。举例来说,响应于确定第一移位值962(例如,20)大于经修正移位值540(例如,18),移位改变分析器512可基于经修正移位值540(例如,经修正移位值540-第一偏移)确定第一移位值1130(例如,17)。替代地或另外,移位改变分析器512可基于第一移位值962(例如,第一移位值962+第一偏移)确定第二移位值1132(例如,21)。方法1120可前进到1108。
方法1120进一步包含,响应于在1104处确定第一移位值962小于或等于经修正移位值540,将第一移位值1130设置成第一移位值962与第二偏移之间的差,且将第二移位值1132设置成经修正移位值540与第二偏移的和。举例来说,响应于确定第一移位值962(例如,10)小于或等于经修正移位值540(例如,12),移位改变分析器512可基于第一移位值962(例如,第一移位值962-第二偏移)确定第一移位值1130(例如,9)。替代地或另外,移位改变分析器512可基于经修正移位值540(例如,经修正移位值540+第二偏移)确定第二移位值1132(例如,13)。第一偏移(例如,2)可与第二偏移(例如,3)不同。在一些实施方案中,第一偏移可与第二偏移相同。第一偏移、第二偏移或这两者的较高值可改进搜索范围。
方法1120还包含在1108处基于第一音频信号130和应用于第二音频信号132的移位值1160产生比较值1140。举例来说,移位改变分析器512可基于第一音频信号130和应用于第二音频信号132的移位值1160产生比较值1140,如参考图7所描述。为进行说明,移位值1160可在从第一移位值1130(例如,17)到第二移位值1132(例如,21)的范围内。移位改变分析器512可基于样本326-332和第二样本350的特定子集产生比较值1140的特定比较值。第二样本350的特定子集可对应于移位值1160的特定移位值(例如,17)。特定比较值可指示样本326-332与第二样本350的特定子集之间的差(或相关性)。
方法1120进一步包含在1112处基于比较值1140确定经估计移位值1072。举例来说,当比较值1140对应于交叉相关值时,移位改变分析器512可选择比较值1140中的最高比较值作为经估计移位值1072。替代地,当比较值1140对应于差值时,移位改变分析器512可选择比较值1140中的最低比较值作为经估计移位值1072。
因此,方法1120可使移位改变分析器512能够通过优化经修正移位值540来产生经估计移位值1072。举例来说,移位改变分析器512可基于原始样本确定比较值1140且可选择对应于指示最高相关性(或最低差)的比较值1140的比较值的经估计移位值1072。
参考图12,展示系统的说明性实例且一般将其指定为1200。系统1200可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统1200的一或多个组件。图12还包含说明一般指定为1220的操作方法的流程图。方法1220可通过参考信号指定器508、时间均衡器108、编码器114、第一装置104或其组合执行。
方法1220包含在1202处确定最终移位值116是否等于0。举例来说,参考信号指定器508可确定最终移位值116是否具有指示无时间移位的特定值(例如,0)。
方法1220包含,响应于在1202处确定最终移位值116等于0,在1204处使参考信号指示符164保持不变。举例来说,响应于确定最终移位值116具有指示无时间移位的特定值(例如,0),参考信号指定器508可使参考信号指示符164保持不变。为进行说明,参考信号指示符164可指示同一音频信号(例如,第一音频信号130或第二音频信号132)为与帧304和与帧302相关联的参考信号。
方法1220包含,响应于在1202处确定最终移位值116非零,在1206处确定最终移位值116是否大于0。举例来说,响应于确定最终移位值116具有指示时间移位的特定值(例如,非零值),参考信号指定器508可确定最终移位值116是否具有指示第二音频信号132相对于第一音频信号130延迟的第一值(例如,正值)或指示第一音频信号130相对于第二音频信号132延迟的第二值(例如,负值)。
方法1220包含,响应于确定最终移位值116具有第一值(例如,正值),在1208处将参考信号指示符164设置成具有指示第一音频信号130为参考信号的第一值(例如,0)。举例来说,响应于确定最终移位值116具有第一值(例如,正值),参考信号指定器508可将参考信号指示符164设置成指示第一音频信号130为参考信号的第一值(例如,0)。响应于确定最终移位值116具有第一值(例如,正值),参考信号指定器508可确定第二音频信号132对应于目标信号。
方法1220包含,响应于确定最终移位值116具有第二值(例如,负值),在1210处将参考信号指示符164设置成具有指示第二音频信号132为参考信号的第二值(例如,1)。举例来说,响应于确定最终移位值116具有指示第一音频信号130相对于第二音频信号132延迟的第二值(例如,负值),参考信号指定器508可将参考信号指示符164设置成指示第二音频信号132为参考信号的第二值(例如,1)。响应于确定最终移位值116具有第二值(例如,负值),参考信号指定器508可确定第一音频信号130对应于目标信号。
参考信号指定器508可将参考信号指示符164提供到增益参数产生器514。增益参数产生器514可基于参考信号确定目标信号的增益参数(例如,增益参数160),如参考图5所描述。
目标信号可相对于参照信号在时间上经延迟。参考信号指示符164可指示第一音频信号130或第二音频信号132是否对应于参考信号。参考信号指示符164可指示增益参数160是否对应于第一音频信号130或第二音频信号132。
参考图13,展示说明特定操作方法的流程图且一般将其指定为1300。方法1300可通过参考信号指定器508、时间均衡器108、编码器114、第一装置104或其组合执行。
方法1300包含在1302处确定最终移位值116是否大于或等于零。举例来说,参考信号指定器508可确定最终移位值116是否大于或等于零。方法1300还包含,响应于在1302处确定最终移位值116大于或等于零,前进到1208。方法1300进一步包含,响应于在1302处确定最终移位值116小于零,前进到1210。方法1300与图12的方法1220的不同之处在于:响应于确定最终移位值116具有指示无时间移位的特定值(例如,0),将参考信号指示符164设置成指示第一音频信号130对应于参考信号的第一值(例如,0)。在一些实施方案中,参考信号指定器508可执行方法1220。在其它实施方案中,参考信号指定器508可执行方法1300。
因此,方法1300可能够在最终移位值116指示无时间移位时,将参考信号指示符164设置成指示第一音频信号130对应于参考信号的特定值(例如,0),而与第一音频信号130是否对应于帧302的参考信号无关。
参考图14,展示系统的说明性实例且一般将其指定为1400。系统1400可对应于图1的系统100、图2的系统200或这两者。举例来说,图1的系统100、第一装置104,图2的系统200、第一装置204或其组合可包含系统1400的一或多个组件。第一装置204经耦合到第一麦克风146、第二麦克风148、第三麦克风1446和第四麦克风1448。
在操作期间,第一装置204可经由第一麦克风146接收第一音频信号130,经由第二麦克风148接收第二音频信号132,经由第三麦克风1446接收第三音频信号1430,经由第四麦克风1448接收第四音频信号1432,或其组合。声源152距第一麦克风146、第二麦克风148、第三麦克风1446或第四麦克风1448中的一个的距离可比距剩余麦克风的距离更近。举例来说,声源152距第一麦克风146的距离可比距第二麦克风148、第三麦克风1446和第四麦克风1448中的每一者的距离更近。
如参考图1所描述,一或多个时间均衡器208可确定指示第一音频信号130、第二音频信号132、第三音频信号1430或第四音频信号1432的特定音频信号相对于剩余音频信号中的每一者的移位的最终移位值。举例来说,一或多个时间均衡器208可确定指示第二音频信号132相对于第一音频信号130的移位的最终移位值116、指示第三音频信号1430相对于第一音频信号130的移位的第二最终移位值1416、指示第四音频信号1432相对于第一音频信号130的移位的第三最终移位值1418,或其组合。
一或多个时间均衡器208可基于最终移位值116、第二最终移位值1416和第三最终移位值1418选择第一音频信号130、第二音频信号132、第三音频信号1430或第四音频信号1432中的一个作为参考信号。举例来说,响应于确定最终移位值116、第二最终移位值1416和第三最终移位值1418中的每一者具有指示对应的音频信号相对于特定音频信号在时间上经延迟或在对应的音频信号与特定音频信号之间不存在时间延迟的第一值(例如,非负值),一或多个时间均衡器208可选择特定信号(例如,第一音频信号130)作为参考信号。为进行说明,移位值(例如,最终移位值116、第二最终移位值1416或第三最终移位值1418)的正值可指示对应信号(例如,第二音频信号132、第三音频信号1430或第四音频信号1432)相对于第一音频信号130在时间上经延迟。移位值(例如,最终移位值116、第二最终移位值1416或第三最终移位值1418)的零值可指示在对应信号(例如,第二音频信号132、第三音频信号1430或第四音频信号1432)与第一音频信号130之间不存在时间延迟。
一或多个时间均衡器208可产生参考信号指示符164以指示第一音频信号130对应于参考信号。一或多个时间均衡器208可确定第二音频信号132、第三音频信号1430和第四音频信号1432对应于目标信号。
替代地,一或多个时间均衡器208可确定最终移位值116、第二最终移位值1416或第三最终移位值1418中的至少一个具有指示特定音频信号(例如,第一音频信号130)相对于另一音频信号(例如,第二音频信号132、第三音频信号1430或第四音频信号1432)经延迟的第二值(例如,负值)。
一或多个时间均衡器208可从最终移位值116、第二最终移位值1416和第三最终移位值1418选择移位值的第一子集。第一子集的每一移位值可具有指示第一音频信号130相对于对应音频信号在时间上经延迟的值(例如,负值)。举例来说,第二最终移位值1416(例如,-12)可指示第一音频信号130相对于第三音频信号1430在时间上经延迟。第三最终移位值1418(例如,-14)可指示第一音频信号130相对于第四音频信号1432在时间上经延迟。移位值的第一子集可包含第二最终移位值1416和第三最终移位值1418。
一或多个时间均衡器208可选择第一子集中指示第一音频信号130到对应音频信号的较高延迟的特定移位值(例如,较低移位值)。第二最终移位值1416可指示第一音频信号130相对于第三音频信号1430的第一延迟。第三最终移位值1418可指示第一音频信号130相对于第四音频信号1432的第二延迟。响应于确定第二延迟比第一延迟长,一或多个时间均衡器208可从移位值的第一子集选择第三最终移位值1418。
一或多个时间均衡器208可选择对应于特定移位值的音频信号作为参考信号。举例来说,一或多个时间均衡器208可选择对应于第三最终移位值1418的第四音频信号1432作为参考信号。一或多个时间均衡器208可产生参考信号指示符164以指示第四音频信号1432对应于参考信号。一或多个时间均衡器208可确定第一音频信号130、第二音频信号132和第三音频信号1430对应于目标信号。
一或多个时间均衡器208可基于对应于参考信号的特定移位值更新最终移位值116和第二最终移位值1416。举例来说,一或多个时间均衡器208可基于第三最终移位值1418更新最终移位值116以指示第四音频信号1432相对于第二音频信号132的第一特定延迟(例如,最终移位值116=最终移位值116-第三最终移位值1418)。为进行说明,最终移位值116(例如,2)可指示第一音频信号130相对于第二音频信号132的延迟。第三最终移位值1418(例如,-14)可指示第一音频信号130相对于第四音频信号1432的延迟。最终移位值116与第三最终移位值1418之间的第一差(例如,16=2-(-14))可指示第四音频信号1432相对于第二音频信号132的延迟。一或多个时间均衡器208可基于第一差更新最终移位值116。一或多个时间均衡器208可基于第三最终移位值1418更新第二最终移位值1416(例如,2)以指示第四音频信号1432相对于第三音频信号1430的第二特定延迟(例如,第二最终移位值1416=第二最终移位值1416-第三最终移位值1418)。为进行说明,第二最终移位值1416(例如,-12)可指示第一音频信号130相对于第三音频信号1430的延迟。第三最终移位值1418(例如,-14)可指示第一音频信号130相对于第四音频信号1432的延迟。第二最终移位值1416与第三最终移位值1418之间的第二差(例如,2=-12-(-14))可指示第四音频信号1432相对于第三音频信号1430的延迟。一或多个时间均衡器208可基于第二差更新第二最终移位值1416。
一或多个时间均衡器208可反转第三最终移位值1418以指示第四音频信号1432相对于第一音频信号130的延迟。举例来说,一或多个时间均衡器208可将第三最终移位值1418从指示第一音频信号130相对于第四音频信号1432的延迟的第一值(例如,-14)更新到指示第四音频信号1432相对于第一音频信号130的延迟的第二值(例如,+14)(例如,第三最终移位值1418=-第三最终移位值1418)。
一或多个时间均衡器208可通过将绝对值函数应用于最终移位值116来产生非因果性移位值162。一或多个时间均衡器208可通过将绝对值函数应用于第二最终移位值1416来产生第二非因果性移位值1462。一或多个时间均衡器208可通过将绝对值函数应用于第三最终移位值1418来产生第三非因果性移位值1464。
一或多个时间均衡器208可基于参考信号产生每一目标信号的增益参数,如参考图1所描述。在第一音频信号130对应于参考信号的实例中,一或多个时间均衡器208可基于第一音频信号130产生第二音频信号132的增益参数160,基于第一音频信号130产生第三音频信号1430的第二增益参数1460,基于第一音频信号130产生第四音频信号1432的第三增益参数1461,或其组合。
一或多个时间均衡器208可基于第一音频信号130、第二音频信号132、第三音频信号1430和第四音频信号1432产生经编码信号(例如,中间通道信号帧)。举例来说,经编码信号(例如,第一经编码信号帧1454)可对应于参考信号(例如,第一音频信号130)的样本与目标信号(例如,第二音频信号132、第三音频信号1430和第四音频信号1432)的样本的和。目标信号中的每一者的样本可基于对应移位值相对于参考信号的样本经时间移位,如参考图1所描述。一或多个时间均衡器208可确定增益参数160与第二音频信号132的样本的第一乘积、第二增益参数1460与第三音频信号1430的样本的第二乘积和第三增益参数1461与第四音频信号1432的样本的第三乘积。第一经编码信号帧1454可对应于第一音频信号130的样本、第一乘积、第二乘积和第三乘积的和。即,可基于以下方程式产生第一经编码信号帧1454:
M=Ref(n)+gD1Targ1(n+N1)+gD2Targ2(n+N2)+gD3Targ3(n+N3),
方程式11a
M=Ref(n)+Targ1(n+N1)+Targ2(n+N2)+Targ3(n+N3),
方程式11b
其中M对应于中间通道帧(例如,第一经编码信号帧1454),Ref(n)对应于参考信号(例如,第一音频信号130)的样本,gD1对应于增益参数160,gD2对应于第二增益参数1460,gD3对应于第三增益参数1461,N1对应于非因果性移位值162,N2对应于第二非因果性移位值1462,N3对应于第三非因果性移位值1464,Targ1(n+N1)对应于第一目标信号(例如,第二音频信号132)的样本,Targ2(n+N2)对应于第二目标信号(例如,第三音频信号1430)的样本,且Targ3(n+N3)对应于第三目标信号(例如,第四音频信号1432)的样本。
一或多个时间均衡器208可产生对应于目标信号中的每一者的经编码信号(例如,侧通道信号帧)。举例来说,一或多个时间均衡器208可基于第一音频信号130和第二音频信号132产生第二经编码信号帧566。举例来说,第二经编码信号帧566可对应于第一音频信号130的样本与第二音频信号132的样本的差,如参考图5所描述。类似地,一或多个时间均衡器208可基于第一音频信号130和第三音频信号1430产生第三经编码信号帧1466(例如,侧通道帧)。举例来说,第三经编码信号帧1466可对应于第一音频信号130的样本与第三音频信号1430的样本的差。一或多个时间均衡器208可基于第一音频信号130和第四音频信号1432产生第四经编码信号帧1468(例如,侧通道帧)。举例来说,第四经编码信号帧1468可对应于第一音频信号130的样本与第四音频信号1432的样本的差。可基于以下方程式中的一个产生第二经编码信号帧566、第三经编码信号帧1466和第四经编码信号帧1468:
SP=Ref(n)-gDPTargP(n+NP), 方程式12a
SP=gDPRef(n)-TargP(n+NP), 方程式12b
其中SP对应于侧通道帧,Ref(n)对应于参考信号(例如,第一音频信号130)的样本,gDP对应于与相关联目标信号相对应的增益参数,NP对应于与相关联目标信号相对应的非因果性移位值,且TargP(n+NP)对应于相关联目标信号的样本。举例来说,SP可对应于第二经编码信号帧566,gDP可对应于增益参数160,NP可对应于非因果性移位值162,且TargP(n+NP)可对应于第二音频信号132的样本。作为另一实例,SP可对应于第三经编码信号帧1466,gDP可对应于第二增益参数1460,NP可对应于第二非因果性移位值1462,且TargP(n+NP)可对应于第三音频信号1430的样本。作为又一实例,SP可对应于第四经编码信号帧1468,gDP可对应于第三增益参数1461,NP可对应于第三非因果性移位值1464,且TargP(n+NP)可对应于第四音频信号1432的样本。
一或多个时间均衡器208可将第二最终移位值1416、第三最终移位值1418、第二非因果性移位值1462、第三非因果性移位值1464、第二增益参数1460、第三增益参数1461、第一经编码信号帧1454、第二经编码信号帧566、第三经编码信号帧1466、第四经编码信号帧1468或其组合存储于存储器153中。举例来说,分析数据190可包含第二最终移位值1416、第三最终移位值1418、第二非因果性移位值1462、第三非因果性移位值1464、第二增益参数1460、第三增益参数1461、第一经编码信号帧1454、第三经编码信号帧1466、第四经编码信号帧1468或其组合。
发射器110可发射第一经编码信号帧1454、第二经编码信号帧566、第三经编码信号帧1466、第四经编码信号帧1468、增益参数160、第二增益参数1460、第三增益参数1461、参考信号指示符164、非因果性移位值162、第二非因果性移位值1462、第三非因果性移位值1464或其组合。参考信号指示符164可对应于图2的参考信号指示符264。第一经编码信号帧1454、第二经编码信号帧566、第三经编码信号帧1466、第四经编码信号帧1468或其组合可对应于图2的经编码信号202。最终移位值116、第二最终移位值1416、第三最终移位值1418或其组合可对应于图2的最终移位值216。非因果性移位值162、第二非因果性移位值1462、第三非因果性移位值1464或其组合可对应于图2的非因果性移位值262。增益参数160、第二增益参数1460、第三增益参数1461或其组合可对应于图2的增益参数260。
参考图15,展示系统的说明性实例且一般将其指定为1500。系统1500与图14的系统1400的不同之处在于一或多个时间均衡器208可经配置以确定多个参考信号,如本文所描述。
在操作期间,一或多个时间均衡器208可经由第一麦克风146接收第一音频信号130,经由第二麦克风148接收第二音频信号132,经由第三麦克风1446接收第三音频信号1430,经由第四麦克风1448接收第四音频信号1432,或其组合。一或多个时间均衡器208可基于第一音频信号130和第二音频信号132确定最终移位值116、非因果性移位值162、增益参数160、参考信号指示符164、第一经编码信号帧564、第二经编码信号帧566或其组合,如参考图1和图5所描述。类似地,一或多个时间均衡器208可基于第三音频信号1430和第四音频信号1432确定第二最终移位值1516、第二非因果性移位值1562、第二增益参数1560、第二参考信号指示符1552、第三经编码信号帧1564(例如,中间通道信号帧)、第四经编码信号帧1566(例如,侧通道信号帧)或其组合。
发射器110可发射第一经编码信号帧564、第二经编码信号帧566、第三经编码信号帧1564、第四经编码信号帧1566、增益参数160、第二增益参数1560、非因果性移位值162、第二非因果性移位值1562、参考信号指示符164、第二参考信号指示符1552或其组合。第一经编码信号帧564、第二经编码信号帧566、第三经编码信号帧1564、第四经编码信号帧1566或其组合可对应于图2的经编码信号202。增益参数160、第二增益参数1560或这两者可对应于图2的增益参数260。最终移位值116、第二最终移位值1516或这两者可对应于图2的最终移位值216。非因果性移位值162、第二非因果性移位值1562或这两者可对应于图2的非因果性移位值262。参考信号指示符164、第二参考信号指示符1552或这两者可对应于图2的参考信号指示264。
参考图16,展示说明特定操作方法的流程图且一般将其指定为1600。方法1600可通过图1的时间均衡器108、编码器114、第一装置104或其组合执行。
方法1600包含在1602处在第一装置处确定指示第一音频信号相对于第二音频信号的移位的最终移位值。举例来说,图1的第一装置104的时间均衡器108可确定指示第一音频信号130相对于第二音频信号132的移位的最终移位值116,如参考图1所描述。作为另一实例,时间均衡器108可确定指示第一音频信号130相对于第二音频信号132的移位的最终移位值116、指示第一音频信号130相对于第三音频信号1430的移位的第二最终移位值1416、指示第一音频信号130相对于第四音频信号1432的移位的第三最终移位值1418或其组合,如参考图14所描述。作为又一实例,时间均衡器108可确定指示第一音频信号130相对于第二音频信号132的移位的最终移位值116、指示第三音频信号1430相对于第四音频信号1432的移位的第二最终移位值1516或这两者,如参考图15所描述。
方法1600还包含在1604处基于第一音频信号的第一样本和第二音频信号的第二样本在第一装置处产生至少一个经编码信号。举例来说,图1的第一装置104的时间均衡器108可基于图3的样本326-332和图3的样本358-364产生经编码信号102,如参考图5进一步描述。样本358-364可相对于样本326-332经时间移位达基于最终移位值116的量。
作为另一实例,时间均衡器108可基于图3的样本326-332、样本358-364、第三音频信号1430的第三样本、第四音频信号1432的第四样本或其组合产生第一经编码信号帧1454,如参考图14所描述。样本358-364、第三样本和第四样本可分别相对于样本326-332经时间移位达基于最终移位值116、第二最终移位值1416和第三最终移位值1418的量。
时间均衡器108可基于图3的样本326-332和样本358-364产生第二经编码信号帧566,如参考图5和图14所描述。时间均衡器108可基于样本326-332和第三样本产生第三经编码信号帧1466。时间均衡器108可基于样本326-332和第四样本产生第四经编码信号帧1468。
作为又一实例,时间均衡器108可基于样本326-332和样本358-364产生第一经编码信号帧564和第二经编码信号帧566,如参考图5和图15所描述。时间均衡器108可基于第三音频信号1430的第三样本和第四音频信号1432的第四样本产生第三经编码信号帧1564和第四经编码信号帧1566,如参考图15所描述。第四样本可基于第二最终移位值1516相对于第三样本经时间移位,如参考图15所描述。
方法1600进一步包含在1606处将至少一个经编码信号从第一装置发送到第二装置。举例来说,图1的发射器110可至少将经编码信号102从第一装置104发送到第二装置106,如参考图1进一步描述。作为另一实例,发射器110可至少发送第一经编码信号帧1454、第二经编码信号帧566、第三经编码信号帧1466、第四经编码信号帧1468或其组合,如参考图14所描述。作为又一实例,发射器110可至少发送第一经编码信号帧564、第二经编码信号帧566、第三经编码信号帧1564、第四经编码信号帧1566或其组合,如参考图15所描述。
因此,方法1600可能够基于第一音频信号的第一样本和第二音频信号的第二样本产生经编码信号,第二音频信号的第二样本基于指示第一音频信号相对于第二音频信号的移位的移位值而相对于第一音频信号经时间移位。对第二音频信号的样本进行时间移位可减少第一音频信号与第二音频信号之间的差,此举可改进联合通道译码效率。可基于最终移位值116的正负号(例如,负或正)将第一音频信号130或第二音频信号132中的一个指定为参考信号。第一音频信号130或第二音频信号132中的另一个(例如,目标信号)可基于非因果性移位值162(例如,最终移位值116的绝对值)经时间移位或偏移。
参考图17,展示系统的说明性实例且一般将其指定为1700。系统1700可对应于图1的系统100。举例来说,图1的系统100、第一装置104或两所述者可包含系统1700的一或多个组件。
系统1700包含经由移位估计器1704耦合到帧间移位变化分析器1706、耦合到参考信号指定器508或这两者的信号预处理器1702。在特定方面中,信号预处理器1702可对应于重采样器504。在特定方面中,移位估计器1704可对应于图1的时间均衡器108。举例来说,移位估计器1704可包含时间均衡器108的一或多个组件。
帧间移位变化分析器1706可经由目标信号调整器1708耦合到增益参数产生器514。参考信号指定器508可经耦合到帧间移位变化分析器1706、经耦合到增益参数产生器514或这两者。目标信号调整器1708可经耦合到中侧产生器1710。在特定方面中,中侧产生器1710可对应于图5的信号产生器516。增益参数产生器514可经耦合到中侧产生器1710。中侧产生器1710可经耦合到带宽扩展(BWE)空间平衡器1712、中间BWE译码器1714、低频带(LB)信号再生器1716或其组合。LB信号再生器1716可经耦合到LB侧核心译码器1718、LB中间核心译码器1720或这两者。LB中间核心译码器1720可经耦合到中间BWE译码器1714、LB侧核心译码器1718或这两者。中间BWE编码器1714可经耦合到BWE空间平衡器1712。
在操作期间,信号预处理器1702可接收音频信号1728。举例来说,信号预处理器1702可从一或多个输入接口112接收音频信号1728。音频信号1728可包含第一音频信号130、第二音频信号132或这两者。信号预处理器1702可产生第一经重采样信号530、第二经重采样信号532或这两者,如参考图18进一步描述。信号预处理器1702可将第一经重采样信号530、第二经重采样信号532或这两者提供到移位估计器1704。
移位估计器1704可基于第一经重采样信号530、第二经重采样信号532或这两者产生最终移位值116(T)、非因果性移位值162或这两者,如参考图19进一步描述。移位估计器1704可将最终移位值116提供到帧间移位变化分析器1706、参考信号指定器508或这两者。
参考信号指定器508可产生参考信号指示符164,如参考图5、12和13所描述。响应于确定参考信号指示符164指示第一音频信号130对应于参考信号,参考信号指示符164可确定参考信号1740包含第一音频信号130且目标信号1742包含第二音频信号132。替代地,响应于确定参考信号指示符164指示第二音频信号132对应于参考信号,参考信号指示符164可确定参考信号1740包含第二音频信号132且目标信号1742包含第一音频信号130。参考信号指定器508可将参考信号指示符164提供到帧间移位变化分析器1706、提供到增益参数产生器514或这两者。
帧间移位变化分析器1706可基于目标信号1742、参考信号1740、第一移位值962(Tprev)、最终移位值116(T)、参考信号指示符164或其组合产生目标信号指示符1764,如参考图21进一步描述。帧间移位变化分析器1706可将目标信号指示符1764提供到目标信号调整器1708。
目标信号调整器1708可基于目标信号指示符1764、目标信号1742或这两者产生经调整目标信号1752。目标信号调整器1708可基于从第一移位值962(Tprev)到最终移位值116(T)的时间移位演变调整目标信号1742。举例来说,第一移位值962可包含对应于帧302的最终移位值。响应于确定最终移位值从具有第一值的对应于帧302的第一移位值962(例如,Tprev=2)改变,所述第一移位值962低于对应于帧304的最终移位值116(例如,T=4),目标信号调整器1708可内插目标信号1742,使得目标信号1742的对应于帧边界的样本的子集经由平滑和缓慢移位下降以产生经调整目标信号1752。替代地,响应于确定最终移位值从大于最终移位值116(例如,T=2)的第一移位值962(例如,Tprev=4)改变,目标信号调整器1708可内插目标信号1742,使得目标信号1742的对应于帧边界的样本的子集经由平滑和缓慢移位而重复以产生经调整目标信号1752。可基于混合正弦内插器(hybrid Sinc-interpolator)和拉格朗日内插器(Lagrange-interpolator)执行平滑和缓慢移位。响应于确定最终移位值并未从第一移位值962变成最终移位值116(例如,Tprev=T),目标信号调整器1708可在时间上偏移目标信号1742以产生经调整目标信号1752。目标信号调整器1708可将经调整目标信号1752提供到增益参数产生器514、中侧产生器1710或这两者。
增益参数产生器514可基于参考信号指示符164、经调整目标信号1752、参考信号1740或其组合产生增益参数160,如参考图20进一步描述。增益参数产生器514可将增益参数160提供到中侧产生器1710。
中侧产生器1710可基于经调整目标信号1752、参考信号1740、增益参数160或其组合产生中间信号1770、侧信号1772或这两者。举例来说,中侧产生器1710可基于方程式5a或方程式5b产生中间信号1770,其中M对应于中间信号1770,gD对应于增益参数160,Ref(n)对应于参考信号1740的样本且Targ(n+N1)对应于经调整目标信号1752的样本。中侧产生器1710可基于方程式6a或方程式6b产生侧信号1772,其中S对应于侧信号1772,gD对应于增益参数160,Ref(n)对应于参考信号1740的样本且Targ(n+N1)对应于经调整目标信号1752的样本。
中侧产生器1710可将侧信号1772提供到BWE空间平衡器1712、LB信号再生器1716或这两者。中侧产生器1710可将中间信号1770提供到中间BWE译码器1714、LB信号再生器1716或这两者。LB信号再生器1716可基于中间信号1770产生LB中间信号1760。举例来说,LB信号再生器1716可通过对中间信号1770进行滤波来产生LB中间信号1760。LB信号再生器1716可将LB中间信号1760提供到LB中间核心译码器1720。LB中间核心译码器1720可基于LB中间信号1760产生参数(例如,核心参数1771、参数1775或这两者)。核心参数1771、参数1775或这两者可包含激励参数、浊音参数等。LB中间核心译码器1720可将核心参数1771提供到中间BWE译码器1714,将参数1775提供到LB侧核心译码器1718,或这两者。核心参数1771可与参数1775相同或不同。举例来说,核心参数1771可包含参数1775中的一或多者,可不包含参数1775中的一或多者,可包含一或多个额外参数,或其组合。中间BWE译码器1714可基于中间信号1770、核心参数1771或其组合产生经译码中间BWE信号1773。中间BWE译码器1714可将经译码中间BWE信号1773提供到BWE空间平衡器1712。
LB信号再生器1716可基于侧信号1772产生LB侧信号1762。举例来说,LB信号再生器1716可通过对侧信号1772进行滤波来产生LB侧信号1762。LB信号再生器1716可将LB侧信号1762提供到LB侧核心译码器1718。
参考图18,展示系统的说明性实例且一般将其指定为1800。系统1800可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统1800的一或多个组件。
系统1800包含信号预处理器1702。信号预处理器1702可包含经耦合到重采样因数估计器1830的多路分用器(deMUX)1802、去加重器1804、去加重器1834或其组合。去加重器1804可经由重采样器1806耦合到去加重器1808。去加重器1808可经由重采样器1810耦合到倾斜平衡器1812。去加重器1834可经由重采样器1836耦合到去加重器1838。去加重器1838可经由重采样器1840耦合到倾斜平衡器1842。
在操作期间,deMUX 1802可通过多路分用音频信号1728来产生第一音频信号130和第二音频信号132。deMUX 1802可将与第一音频信号130、第二音频信号132或这两者相关联的第一采样率1860提供到重采样因数估计器1830。deMUX 1802可将第一音频信号130提供到去加重器1804,将第二音频信号132提供到去加重器1834,或这两者。
重采样因数估计器1830可基于第一采样率1860、第二采样率1880或这两者产生第一因数1862(d1)、第二因数1882(d2)或这两者。重采样因数估计器1830可基于第一采样率1860、第二采样率1880或这两者确定重采样因数(D)。举例来说,重采样因数(D)可对应于第一采样率1860与第二采样率1880的比率(例如,重采样因数(D)=第二采样率1880/第一采样率1860或重采样因数(D)=第一采样率1860/第二采样率1880)。第一因数1862(d1)、第二因数1882(d2)或这两者可为重采样因数(D)的因数。举例来说,重采样因数(D)可对应于第一因数1862(d1)与第二因数1882(d2)的乘积(例如,重采样因数(D)=第一因数1862(d1)*第二因数1882(d2))。在一些实施方案中,第一因数1862(d1)可具有第一值(例如,1),第二因数1882(d2)可具有第二值(例如,1),或这两者,此举略过重采样阶段,如本文所描述。
去加重器1804可通过基于IIR滤波器(例如,一阶IIR滤波器)对第一音频信号130进行滤波来产生经去加重信号1864,如参考图6所描述。去加重器1804可将经去加重信号1864提供到重采样器1806。重采样器1806可通过基于第一因数1862(d1)重采样经去加重信号1864产生经重采样信号1866。重采样器1806可将经重采样信号1866提供到去加重器1808。去加重器1808可通过基于IIR滤波器对经重采样信号1866进行滤波来产生经去加重信号1868,如参考图6所描述。去加重器1808可将经去加重信号1868提供到重采样器1810。重采样器1810可通过基于第二因数1882(d2)重采样经去加重信号1868来产生经重采样信号1870。
在一些实施方案中,第一因数1862(d1)可具有第一值(例如,1),第二因数1882(d2)可具有第二值(例如,1),或这两者,此举略过重采样阶段。举例来说,当第一因数1862(d1)具有第一值(例如,1)时,经重采样信号1866可与经去加重信号1864相同。作为另一实例,当第二因数1882(d2)具有第二值(例如,1)时,经重采样信号1870可与经去加重信号1868相同。重采样器1810可将经重采样信号1870提供到倾斜平衡器1812。倾斜平衡器1812可通过对经重采样信号1870执行倾斜平衡来产生第一经重采样信号530。
去加重器1834可通过基于IIR滤波器(例如,一阶IIR滤波器)对第二音频信号132进行滤波来产生经去加重信号1884,如参考图6所描述。去加重器1834可将经去加重信号1884提供到重采样器1836。重采样器1836可通过基于第一因数1862(d1)重采样经去加重信号1884来产生经重采样信号1886。重采样器1836可将经重采样信号1886提供到去加重器1838。去加重器1838可通过基于IIR滤波器对经重采样信号1886进行滤波来产生经去加重信号1888,如参考图6所描述。去加重器1838可将经去加重信号1888提供到重采样器1840。重采样器1840可通过基于第二因数1882(d2)重采样经去加重信号1888来产生经重采样信号1890。
在一些实施方案中,第一因数1862(d1)可具有第一值(例如,1),第二因数1882(d2)可具有第二值(例如,1),或这两者,此举略过重采样阶段。举例来说,当第一因数1862(d1)具有第一值(例如,1)时,经重采样信号1886可与经去加重信号1884相同。作为另一实例,当第二因数1882(d2)具有第二值(例如,1)时,经重采样信号1890可与经去加重信号1888相同。重采样器1840可将经重采样信号1890提供到倾斜平衡器1842。倾斜平衡器1842可通过对经重采样信号1890执行倾斜平衡来产生第二经重采样信号532。在一些实施方案中,倾斜平衡器1812和倾斜平衡器1842可分别补偿由于去加重器1804和去加重器1834所引起的低通(LP)效应。
参考图19,展示系统的说明性实例且一般将其指定为1900。系统1900可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统1900的一或多个组件。
系统1900包含移位估计器1704。移位估计器1704可包含信号比较器506、内插器510、移位优化器511、移位改变分析器512、绝对移位产生器513或其组合。应理解,系统1900可包含比图19中所说明的组件更少或更多的组件。系统1900可经配置以执行本文所描述的一或多个操作。举例来说,系统1900可经配置以执行参考图5的时间均衡器108、图17的移位估计器1704或这两者所描述的一或多个操作。应理解,可基于一或多个经低通滤波信号、一或多个经高通滤波信号或其组合估计非因果性移位值162,所述信号是基于第一音频信号130、第一经重采样信号530、第二音频信号132、第二经重采样信号532或其组合产生。
参考图20,展示系统的说明性实例且一般将其指定为2000。系统2000可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统2000的一或多个组件。
系统2000包含增益参数产生器514。增益参数产生器514可包含经耦合到增益平滑器2008的增益估计器2002。增益估计器2002可包含基于包络的增益估计器2004、基于相干性的增益估计器2006或这两者。增益估计器2002可基于方程式4a到4f中的一或多者产生增益,如参考图1所描述。
在操作期间,响应于确定参考信号指示符164指示第一音频信号130对应于参考信号,增益估计器2002可确定参考信号1740包含第一音频信号130。替代地,响应于确定参考信号指示符164指示第二音频信号132对应于参考信号,增益估计器2002可确定参考信号1740包含第二音频信号132。
基于包络的增益估计器2004可基于参考信号1740、经调整目标信号1752或这两者产生基于包络的增益2020。举例来说,基于包络的增益估计器2004可基于参考信号1740的第一包络和经调整目标信号1752的第二包络确定基于包络的增益2020。基于包络的增益估计器2004可将基于包络的增益2020提供到增益平滑器2008。
基于相干性的增益估计器2006可基于参考信号1740、经调整目标信号1752或这两者产生基于相干性的增益2022。举例来说,基于相干性的增益估计器2006可确定对应于参考信号1740、经调整目标信号1752或这两者的经估计的相干性。基于相干性的增益估计器2006可基于经估计的相干性确定基于相干性的增益2022。基于相干性的增益估计器2006可将基于相干性的增益2022提供到增益平滑器2008。
增益平滑器2008可基于以下产生增益参数160:基于包络的增益2020、基于相干性的增益2022、第一增益2060或其组合。举例来说,增益参数160可对应于基于包络的增益2020、基于相干性的增益2022、第一增益2060或其组合的平均值。第一增益2060可与帧302相关联。
参考图21,展示系统的说明性实例且一般将其指定为2100。系统2100可对应于图1的系统100。举例来说,图1的系统100、第一装置104或这两者可包含系统2100的一或多个组件。图21还包含状态图2120。状态图2120可说明帧间移位变化分析器1706的操作。
状态图2120包含在状态2102下将图17的目标信号指示符1764成指示第二音频信号132。状态图2120包含在状态2104下将目标信号指示符1764设置成指示第一音频信号130。响应于确定第一移位值962具有第一值(例如,零)且最终移位值116具有第二值(例如,负值),帧间移位变化分析器1706可从状态2104转变到状态2102。举例来说,响应于确定第一移位值962具有第一值(例如,零)且最终移位值116具有第二值(例如,负值),帧间移位变化分析器1706可将目标信号指示符1764从指示第一音频信号130改变成指示第二音频信号132。响应于确定第一移位值962具有第一值(例如,负值)且最终移位值116具有第二值(例如,零),帧间移位变化分析器1706可从状态2102转变到状态2104。举例来说,响应于确定第一移位值962具有第一值(例如,负值)且最终移位值116具有第二值(例如,零),帧间移位变化分析器1706可将目标信号指示符1764从指示第二音频信号132改变成指示第一音频信号130。帧间移位变化分析器1706可将目标信号指示符1764提供到目标信号调整器1708。在一些实施方案中,帧间移位变化分析器1706可将通过目标信号指示符1764指示的目标信号(例如,第一音频信号130或第二音频信号132)提供到目标信号调整器1708以用于平滑和缓慢移位。目标信号可对应于图17的目标信号1742。
如参考图1到21所描述,图1的时间均衡器108可基于参考信号1740的样本和经调整目标信号1752的样本(例如,经时间移位和经调整的样本)产生中间信号1770(或图17的侧信号1772)。如参考图22到27所描述,时间移位可产生包含至少一个“损毁”部分的中间信号1770(或侧信号1772)。在特定方面中,损毁部分包含来自参考信号1740的样本信息且不包含来自目标信号1742的样本信息。在一些情况下,可从其它信息预测在非因果性移位之后来自目标信号的不可用样本。举例来说,时间均衡器108可基于其它信息产生预测样本。预测可不完全。举例来说,预测样本可不同于目标信号的不可用样本。如参考图22到27所描述,图17的LB信号再生器1716可产生对应于损毁部分的经更新部分,所述损毁部分包含来自参考信号1740的样本信息且包含来自目标信号1742的样本信息。LB信号再生器1716可通过将中间信号1770(或侧信号1772)的非损毁部分与经更新部分组合来产生LB中间信号1760(或LB侧信号1762)。
参考图22,展示系统的说明性实例且一般将其指定为2200。系统2200对应于图17的系统1700的实施,其中LB信号再生器1716包含侧分析器2212、中间分析器2208或这两者。系统2200可对应于多通道编码器(例如,图1的编码器114)。举例来说,系统2200的一或多个组件可包含于多通道编码器(例如,编码器114)中。
在操作期间,LB信号再生器1716可接收侧信号1772、中间信号1770或这两者,如参考图17所描述。侧分析器2212可基于侧信号1772产生LB侧信号1762,如参考图23进一步描述。举例来说,侧分析器2212可通过对侧信号1772进行处理(例如,滤波、重采样、加重或其组合)来产生LB侧信号1762,如参考图23所描述。中间分析器2208可基于中间信号1770产生LB中间信号1760,如参考图23进一步描述。举例来说,中间分析器2208可通过对中间信号1770进行处理(例如,滤波、重采样、加重或其组合)来产生LB中间信号1760,如参考图23所描述。侧分析器2212可将LB侧信号1762提供到LB侧核心译码器1718。中间分析器2208可将LB中间信号1760提供到LB中间核心译码器1720。在替代实施方案中,可跳过用于中间信号1770、侧信号1772或这两者的处理步骤(例如,滤波、重采样或加重)中的一或多者。在一些实施方案中,在处理中间信号1770、侧信号1772或这两者中可跳过重采样。举例来说,相比于分别译码LB中间信号1760,图1的时间均衡器108可译码整个中间信号1770。作为另一实例,相比于分别译码LB侧信号1762,时间均衡器108可译码整个侧信号1772。
因此,系统2200使得LB信号(例如,LB侧信号1762或LB中间信号1760)能够基于另一信号(例如,侧信号1772或中间信号1770)产生。举例来说,另一信号(例如,侧信号1772或中间信号1770)可经滤波、经重采样、经加重或其组合以产生LB信号(例如,LB侧信号1762或LB中间信号1760)。
参考图23,展示系统的说明性实例且一般将其指定为2300。系统2300可对应于图1的系统100。举例来说,图1的第一装置104、编码器114、第二装置106或其组合可包含系统2300的一或多个组件。
系统2300包含经耦合到存储器153的分析器2310。分析器2310可对应于图22的中间分析器2208、图22的侧分析器2212或这两者。分析器2310可包含处理器2312、组合器2320或这两者。处理器2312可经配置以通过对信号进行处理(例如,滤波、重采样、加重或其组合)来产生经处理信号,如本文进一步描述。组合器2320可经配置以基于存储于存储器153中的数据的一或多个样本和从处理器2312所接收的数据的一或多个样本产生LB信号的帧,如本文所描述。
在操作期间,分析器2310可接收中间信号1770、侧信号1772或这两者。举例来说,中间信号1770(或侧信号1772)可包含第一组合帧(C1)2370、第二组合帧(C2)2371或这两者,如参考图24A进一步描述。第一组合帧(C1)2370还可被称作组合帧(C1)且第二组合帧(C2)2371还可被称作组合帧(C2)。第二组合帧(C2)2371可在第一组合帧(C1)2370之后(例如,在第一组合帧(C1)2370之后在分析器2310处接收)。
分析器2310可从中侧产生器1710接收第一组合帧(C1)2370(例如,第一组合帧(C1)2370的第一版本)。第一组合帧(C1)2370可包含第一预看部分,如参考图24B进一步描述。处理器2312可通过处理第一组合帧(C1)2370产生经处理帧,如参考图26进一步描述。第一组合帧(C1)2370可为中间信号1770(或侧信号1772)的一系列帧中的初始帧。举例来说,第一组合帧(C1)2370可对应于中间信号1770(或侧信号1772)的0ms到20ms。第二组合帧(C2)2371可对应于中间信号1770(或侧信号1772)的20ms到40ms。经处理帧的一部分(例如,0ms到20ms-LA)可对应于LB中间信号1760(或LB侧信号1762)的第一输出帧(Z1)2372。第一输出帧(Z1)2372可被称作第一输出帧(Z1)。LA可对应于第一组合帧(C1)2370的特定大小(例如,默认大小)的预看部分,如参考图24B进一步描述。处理第一组合帧(C1)2370可包含使用滤波器对第一组合帧(C1)2370进行滤波,如参考图26进一步描述。处理器2312可在处理第一组合帧(C1)2370期间确定滤波器的滤波器状态2392。举例来说,滤波器状态2392可对应于初始化第一组合帧(C1)2370的特定部分的处理后的初始化滤波器状态,如参考图24B进一步描述。处理器2312可将滤波器状态2392存储于存储器153中。处理器2312可将经处理帧的一部分(例如,20ms-LA到20ms)作为第一预看部分数据(J1)2350存储于存储器153中。举例来说,分析数据190可包含第一预看部分数据(J1)2350。第一预看部分数据(J1)2350还可被称作部分(J1)。分析器2310可将第一输出帧(Z1)2372提供到LB侧核心译码器1718或LB中间核心译码器1720。举例来说,当第一组合帧(C1)2370对应于中间信号1770时,分析器2310可将第一输出帧(Z1)2372提供到LB中间核心译码器1720。作为另一实例,当第一组合帧(C1)2370对应于侧信号1772时,分析器2310可将第一输出帧(Z1)2372提供到LB侧核心译码器1718。
处理器2312可从中侧产生器1710接收第二组合帧(C2)2371。分析器2310可基于第一输入帧(A1)2308、第二输入帧(B1)2328和第二特定输入帧(B2)2330产生第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317,如参考图24C进一步描述。第一输入帧(A1)2308还可被称作输入帧(A1)、第二输入帧(B1)2328还可被称作输入帧(B1)且第二特定输入帧(B2)2330还可被称作输入帧(B2)。帧部分(P1)2317还可被称作帧部分(P1)。
处理器2312可基于第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317产生经更新样本数据(S1)2352,如参考图24C进一步描述。处理器2312可通过执行类似于对输入帧执行以产生第一组合帧(C1)2370的第一版本的操作的操作来产生第一组合帧(C1)2370的第二版本。作为一实例,如果使用方程式3产生第一组合帧(C1)2370的第一版本,那么可将用以产生第一组合帧(C1)2370的第一版本的c1、c2、c3、c4的相同值用以产生第一组合帧(C1)2370的第二版本。经更新样本数据(S1)可被称作经预处理帧部分(S1)。处理器2312可通过处理第二组合帧(C2)2371来产生第二组合帧数据(H2)2356,如参考图26进一步描述。在特定方面中,处理器2312可基于滤波器状态2392产生经更新样本数据(S1),如参考图24C进一步描述。举例来说,处理器2312可从存储器153检索滤波器状态2392。处理器2312可复位滤波器以具有滤波器状态2392。处理器2312可使用具有滤波器状态2392的滤波器产生经更新样本数据(S1)。举例来说,滤波器的初始化状态可对应于初始化至少帧部分(P1)2317的处理后的滤波器状态2392。在特定方面中,滤波器状态可在处理期间动态地更新。第二组合帧数据(H2)2356还可被称作经预处理组合帧(H2)。
组合器2320可基于第一预看部分数据(J1)2350的一或多个样本、经更新样本数据(S1)2352的一或多个样本、第二组合帧数据(H2)2356的样本的群组或其组合产生LB中间信号1760(或LB侧信号1762)的第二输出帧(Z2)2373,如参考图24C进一步描述。第二输出帧(Z2)2373可被称作第二输出帧(Z2)。第二输出帧(Z2)2373可对应于LB中间信号1760(或LB侧信号1762)的20ms-LA到40ms-LA,如参考图25进一步描述。
因此,系统2300可能够基于中间信号1770(或侧信号1772)和一或多个输入帧产生LB中间信号1760(或LB侧信号1762)。LB中间信号1760(或LB侧信号1762)可包含已由处理器2312处理(例如,经滤波、经重采样或经加重)的一或多个样本。
参考图24A,展示帧的说明性实例且一般将其指定为2400。帧2400的至少子集可由图1的第一装置104编码。
图1的第一装置104可接收图17的参考信号1740的一连串参考输入帧。参考输入帧可包含输入帧(A1)、输入帧(A2)、输入帧(A3)或其组合。图1的第一装置104可接收图17的目标信号1742的一连串目标输入帧。目标输入帧可包含输入帧(B1)、输入帧(B2)、输入帧(B3)或其组合。
图1的时间均衡器108可基于参考输入帧和目标输入帧产生中间信号1770(或侧信号1772)的一系列组合帧,如参考图1所描述。组合帧可包含组合帧(C1)、组合帧(C2)、组合帧(C3)或其组合。
处理器2312可通过处理组合帧来产生一系列经预处理组合帧,如参考图26进一步描述。经预处理组合帧可包含经预处理组合帧(H1)、经预处理组合帧(H2)、经预处理组合帧(H3)或其组合。处理器2312可将经预处理组合帧的一系列部分J1、J2、J3或其组合作为预看部分数据存储于存储器153中,如参考图24B到24C进一步描述。
分析器2310可基于参考输入帧和目标输入帧产生一系列帧部分P0、P1、P2或其组合,如参考图24B到24C进一步描述。处理器2312可通过处理帧部分P0、P1、P2或其组合来产生一系列经预处理帧部分S0、S1、S2或其组合,如参考图26进一步描述。
组合器2320可基于以下产生一系列输出帧Z1、Z2、Z3或其组合:存储于存储器153中的所述系列的部分J1、J2、J3或其组合;所述系列的经预处理帧部分S0、S1、S2或其组合;所述系列的经预处理组合帧H1、H2、H3或其组合,如参考图24B到24C进一步描述。
在第一时间段2402期间,时间均衡器108可基于输入帧(A1)和输入帧(B1)产生组合帧(C1),如参考图1所描述。处理器2312可通过处理组合帧(C1)来产生经预处理组合帧(H1)。处理器2312可将经预处理组合帧(H1)的部分J1作为预看部分数据(J1)存储于存储器153中。组合帧(C1)为组合帧的初始帧。分析器2310可输出经预处理组合帧(H1)的部分(图24B中的I1)作为输出帧(Z1)。
在第二时间段2404期间,时间均衡器108可基于输入帧(A2)和输入帧(B2)产生组合帧(C2),如参考图1所描述。处理器2312可通过处理组合帧(C2)来产生经预处理组合帧(H2)。处理器2312可将经预处理组合帧(H2)的部分J2作为预看部分数据(J2)存储于存储器153中。分析器2310可基于输入帧(A1)、输入帧(B1)、预看部分(J1)、输入帧(B2)或其组合产生至少帧部分(P1)2317,如参考图24B到24C进一步描述。处理器2312可通过处理至少帧部分(P1)2317来产生经预处理帧部分(S1),如参考图26进一步描述。组合器2320可基于部分J1、经预处理帧部分(S1)和经预处理组合帧(H2)产生输出帧(Z2)。
分析器2310可产生一或多个后续输出帧。举例来说,在第三时间段2406期间,时间均衡器108可基于输入帧(A3)和输入帧(B3)产生组合帧(C3),如参考图1所描述。处理器2312可通过处理组合帧(C3)来产生经预处理组合帧(H3)。处理器2312可将经预处理组合帧(H3)的部分J3作为预看部分数据(J3)存储于存储器153中。分析器2310可基于输入帧(A2)、输入帧(B2)、预看部分(J2)、输入帧(B3)或其组合产生帧部分(P2),如参考图24B到24C进一步描述。处理器2312可通过处理帧部分(P2)来产生经预处理帧部分(S2),如参考图26进一步描述。组合器2320可基于部分J2、经预处理帧部分(S2)和经预处理组合帧(H3)产生输出帧(Z3)。
参考图24B到24C描述图24A中描绘的信号的产生和处理的实例。在图24B到24C中,将帧描绘为与简化图形波形覆叠,所述简化图形波形表示与帧相关联的音频内容的实例。出于说明和解释的目的提供此类波形作为非限制性实例,且不应将此类波形视为引入对任何帧或部分的内容或编码的任何限制。类似地,为了清楚说明而夸示一些帧和/或帧部分且其未必按比例绘制。
参考图24B,展示帧的说明性实例且一般将其指定为2401。帧2401的至少子集可由图1的第一装置104编码。
帧2401包含一系列第一输入帧(A)2420。第一输入帧(A)2420可对应于参考信号1740。第一输入帧(A)2420可包含第一输入帧(A1)2308、第一特定输入帧(A2)2410和输入帧(A3)。
第一输入帧(A1)2308可对应于参考信号1740的20ms片段,例如从时间t=0ms到时间t=20ms。第一特定输入帧(A2)2410可对应于参考信号1740的下一20ms片段,例如从时间t=20ms到时间t=40ms。输入帧(A3)可对应于参考信号1740之后续20ms片段,例如从时间t=40ms到时间t=60ms。
帧2401包含一系列第二输入帧(B)2450。第二输入帧(B)2450可对应于目标信号1742。第二输入帧(A)2450可包含第二输入帧(B1)2328、第二特定输入帧(B2)2330和输入帧(B3)。
第二输入帧(B1)2328可对应于目标信号1742的20ms片段,例如从时间t=0ms到时间t=20ms。第二特定输入帧(B2)2330可对应于目标信号1742的下一20ms片段,例如从时间t=20ms到时间t=40ms。输入帧(B3)可对应于目标信号1742之后续20ms片段,例如从时间t=40ms到时间t=60ms。第二输入帧(B1)2328可具有对应于在目标信号1742与参考信号1740之间所检测到的延迟的样本移位。举例来说,第二输入帧(B1)2328的一或多个样本可具有样本移位,所述样本移位对应于在经由第二麦克风148对一或多个样本的接收与经由第一麦克风146对第一输入帧(A1)2308的一或多个样本的接收之间所检测到的延迟。所检测的延迟可对应于非因果性移位值162,如参考图1所描述。
帧2401包含一系列非因果性经移位输入帧(B+SH)2452。所述系列的经移位输入帧(B+SH)2452可包含经移位输入帧B1+SH、经移位输入帧B2+SH、经移位输入帧B3+SH或其组合。经移位输入帧B1+SH可包含基于非因果性移位值经时间移位的第二输入帧(B1)2328的样本。举例来说,第一输入帧(A1)可对应于图3的帧304。在此实例中,第二输入帧(B1)2328的样本可基于非因果性移位值162移位以产生经移位输入帧B1+SH。经移位输入帧B1+SH的经时间移位样本与第一输入帧(A1)2308的第一样本的第一相关性(或第一差)可大于(或低于)与第二输入帧(B1)2328的样本的第二相关性(或第二差),如参考图1所描述。时间移位可导致经移位输入帧(B+SH)2452的包含无效或不可用数据的部分,其在经移位输入帧(B+SH)2452中指示为交叉影线区域。举例来说,经移位输入帧B1+SH的第一部分(例如,从20ms-非因果性移位值162到20ms)可包含无效数据。
图1的时间均衡器108可基于第一输入帧(A)2420和第二输入帧(B)2450产生一系列组合帧(C)2470,如参考图1所描述。组合帧2470可对应于中间信号1770(或侧信号1772)。中间信号1770(或侧信号1772)可对应于多通道音频信号。参考信号1740可对应于中间信号1770(或侧信号1772)的第一通道。目标信号1742可对应于中间信号1770(或侧信号1772)的第二通道。
组合帧(C)2470可包含第一组合帧(C1)2370、第二组合帧(C2)2371或这两者。第一组合帧(C1)2370可包含参考信号1740的第一输入帧(A1)2308与目标信号1742的第二输入帧(B1)2328的组合。举例来说,图1的时间均衡器108可基于方程式5a到5b(或方程式6a到6b)产生第一组合帧(C1)2370,其中M(或S)指示第一组合帧(C1)2370,Ref(n)指示第一输入帧(A1)2308的第一样本,N1指示非因果性移位值162,且Targ(n+N1)指示第二输入帧(B1)2328的经时间移位样本。为进行说明,Targ(n+N1)可指示经移位输入帧(B1-SH)的第二样本。
第一组合帧(C1)2370可基于第一样本和第二样本的组合。举例来说,第一组合帧(C1)2370可包含非损毁部分(D1、E1、F1)和损毁部分(G1)。非损毁部分(D1、E1、F1)可基于第一输入帧(A1)2308的第一部分(例如,从0ms到20ms-非因果性移位值162)和经移位输入帧(B1+SH)的第一部分(例如,从0ms到20ms-非因果性移位值162)。损毁部分(G1)可基于第一输入帧(A1)2308的第二部分(例如,从20ms-非因果性移位值162到20ms)和经移位输入帧(B1+SH)的第二部分(例如,从20ms-非因果性移位值162到20ms)。经移位输入帧(B1+SH)的第二部分可包含无效数据。在替代性实施方案中,第一组合帧(C1)2370的损毁部分(G1)可基于第一输入帧(A1)2308的第二部分且可不基于经移位输入帧(B1+SH)。第一组合帧(C1)2370的损毁部分(G1)可包含来自第一输入帧(A1)2308的样本信息且可不包含来自第二输入帧(B1)2328的样本信息。在替代性实施方案中,第一组合帧(C1)2370的损毁部分(G1)可基于第一输入帧(A1)2308的第二部分(例如,从20ms-非因果性移位值162到20ms)和经移位输入帧(B1+SH)的预测部分。经移位输入帧(B1+SH)的预测部分(例如,从20ms-非因果性移位值162到20ms)可基于第一输入帧(A1)2308的第二部分、经移位输入帧(B1+SH)的第一部分(例如,从0ms到20ms-非因果性移位值162)的外插或这两者。在特定方面中,经移位输入帧(B+SH)2452可对应于经调整目标信号1752。目标信号调整器1708可基于第一输入帧(A1)2308的第二部分、经移位输入帧(B1+SH)的第一部分(例如,从0ms到20ms-非因果性移位值162)的外插或这两者产生经移位输入帧(B1+SH)的预测部分(例如,从20ms-非因果性移位值162到20ms)。
第一组合帧(C1)2370可包含预看(LA)部分2490(例如,E1、F1、G1)。LA部分2490可具有特定大小(例如,U ms或V个样本)。Tmax 2492可指示特定(例如,最大)被支持非因果性移位值。LA部分2490可包含对应于Tmax 2492的Tmax部分(F1+G1)。由于非因果性移位(例如,在最大被支持非因果性移位下,非因果性移位值162=Tmax 2492),Tmax部分(F1+G1)表示可具有损毁样本的组合帧的最大部分。
第二特定帧(例如,帧344)可相对于第一特定帧(例如,帧304)延迟。举例来说,第二特定帧(例如,帧344)相对于第一特定帧(例如,帧304)的延迟可对应于非因果性移位值162。Tmax 2492可指示特定(例如,最大)被支持非因果性移位值。
在操作期间(例如,在图24A的第一时间段2402期间),分析器2310可从图17的中侧产生器1710接收第一组合帧(C1)2370。处理器2312可通过处理第一组合帧(C1)2370来产生经预处理组合帧(H1),如参考图26进一步描述。
经预处理组合帧(H1)可包含对应于第一组合帧(C1)2370的部分(D1)的部分(I1)。经预处理组合帧(H1)可包含对应于LA部分2490(E1、F1、G1)的部分(J1)。第一预看部分数据(J1)2350可包含分别对应于第一组合帧(C1)2370的LA部分2490的部分E1、部分F1和部分G1的经预处理版本的部分(K1)、部分(L1)和部分(M1)。处理器2312可通过使用滤波器对部分(E1)进行处理来产生部分(K1)。处理器2312可在部分(K1)产生后确定图23的滤波器状态2392。
处理器2312可在产生部分(K1)之后通过分别对部分F1和部分G1进行处理(包含滤波)来产生部分(L1)和部分(M1)。滤波器可在产生部分L1和M1后具有第二滤波器状态。举例来说,处理器2312可在产生部分L1之后产生部分M1且滤波器可在产生部分M1后具有第二滤波器状态。第一滤波器状态可对应于初始化Tmax部分(F1和G1)的处理后的滤波器的初始化状态。处理器2312可将滤波器状态2392存储于存储器153中。
处理器2312可将部分(J1)存储于存储器153中。分析器2310可输出部分I1作为第一输出帧(Z1)2372。可将LA部分2490(E1、F1、G1)用于产生对应于第一输出帧(Z1)2372的一或多个译码参数(例如,线性预测译码(LPC)参数、间距参数或另一译码参数)。举例来说,处理器2312可基于对应于LA部分2490(E1、F1、G1)的部分(J1)确定与第一输出帧(Z1)2372相关联的一或多个译码参数。部分(M1)可对基于部分(J1)产生的译码参数有极小的影响(或无影响)。第一输出帧(Z1)2372并不含有解码对应于LA部分2490的样本的信息。第二输出帧(Z2)2373可包含解码对应于LA部分2490的样本的信息,如参考图24C进一步描述。
参考图24C,展示帧的说明性实例且一般将其指定为2403。帧2403的至少子集可由图1的第一装置104编码。
在操作期间(例如,在图24A的第二时间段2404期间),分析器2310可在2499处从图1的中侧产生器1710接收第二组合帧(C2)2371。响应于接收第二组合帧(C2)2371,分析器2310可在2497处从存储器153存取(例如,接收)第一预看部分数据(J1)2350。分析器2310还可存取(例如,接收)第一输入帧(A1)2308、第二输入帧(B1)2328和第二特定输入帧(B2)2330。第一预看部分数据(J1)2350可包含分别对应于第一组合帧(C1)2370的LA部分2490的部分E1、部分F1和部分G1的经预处理版本的部分(K1)、部分(L1)和部分(M1)。第一输入帧(A1)2308可包含部分(N1)、部分(O1)或这两者。第二输入帧(B1)2328可包含部分(N2)。第二特定输入帧(B2)2330可包含部分(O2)。部分(K1)可对应于第一预看部分数据(J1)2350的样本的第一子集。部分(L1)和部分(M1)可对应于第一预看部分数据(J1)2350的样本的第二子集。
分析器2310可在2498处使用来自第一输入帧(A1)2308、第二输入帧(B1)2328和第二特定输入帧(B2)2330的样本产生经校正样本。分析器2310可基于方程式5a到5b(或方程式6a到6b)产生至少帧部分(P1)2317,如本文所描述。帧部分(P1)2317可包含部分(Q1)、经更新样本信息(R1)或这两者。分析器2310可通过将部分(N1)和部分(O1)与部分(N2)和部分(O2)组合来产生帧部分(P1)2317。举例来说,分析器2310可基于方程式5a到5b(或方程式6a到6b)产生部分(Q1),其中M(或S)指示部分(Q1),Ref(n)指示部分(N1)的样本,N1指示非因果性移位值162,且Targ(n+N1)指示部分(N2)的经时间移位样本。分析器2310可基于方程式5a到5b(或方程式6a到6b)产生经更新样本信息(R1),其中M(或S)指示经更新样本信息(R1),Ref(n)指示部分(O1)的样本,N1指示非因果性移位值162,且Targ(n+N1)指示部分(O2)的经时间移位样本。部分(Q1)可大体上类似于第一组合帧(C1)2370的部分(F1)。经更新样本信息(R1)可包含不包含在第一组合帧(C1)的部分(G1)内的第二特定输入帧(B2)2330的样本信息。举例来说,经更新样本信息(R1)可对应于部分(G1)的损毁样本的校正版本。
处理器2312可通过处理至少帧部分(P1)2317来产生经预处理帧部分(S1)2352,如参考图26进一步描述。在特定方面中,处理器2312可从存储器153检索滤波器状态2392。处理器2312可复位滤波器以具有滤波器状态2392。处理器2312可使用具有滤波器状态2392的滤波器产生经更新样本数据(S1)。举例来说,滤波器状态2392可对应于初始化至少帧部分(P1)2317的处理之后的滤波器的初始化状态。使用具有滤波器在产生部分(K1)后所具有的同一状态(例如,滤波器状态2392)的滤波器产生经更新样本数据(S1)可在部分(K1)与经更新样本数据(S1)之间的边界处保持连续性。
处理器2312可通过处理第二组合帧(C2)2356来产生经预处理组合帧(H2)。经预处理组合帧(H2)可包含部分(I2)(例如,从20ms到40ms-LA)和部分(J2)(例如,从40ms-LA到40ms)。部分(J2)可对应于第二组合帧(C2)2356的预看部分。
滤波器的状态可在处理至少帧部分(P1)2317期间动态地更新。举例来说,滤波器可在产生经更新样本数据(S1)后具有第二滤波器状态。处理器2312可使用具有第二滤波器状态的滤波器处理第二组合帧(C2)2356。举例来说,第二滤波器状态可对应于初始化第二组合帧(C2)2356的处理之后的滤波器的初始化状态。使用具有滤波器在产生经更新样本数据(S1)后所具有的同一状态(例如,第二滤波器状态的滤波器产生经预处理组合帧(H2)可在经更新样本数据(S1)与部分(I2)之间的边界处保持连续性。
组合器2320可通过将第一预看部分数据(J1)2350的部分(K1)、经预处理帧部分(S1)2352和经预处理组合帧(H2)的部分(I2)组合来产生第二输出帧(Z2)2373,如参考图25进一步描述。
在特定实例中,如参考图1所描述,当第一输入帧(A)2420(例如,第一输入帧(A1)2308)和第二输入帧(B)2450(例如,第二输入帧(B1)2328)在时间上对准以使得非因果性移位值162具有指示无时间移位的第一值(例如,SH=0)时,组合帧(C)2470(例如,第一组合帧(C1)2370)可不包含损毁样本。在此实例中,组合器2320可通过将第一预看部分(J1)(例如,从20ms-LA到20ms)与第二组合帧数据(H2)2356的部分(I2)(例如,20ms到40ms-LA)组合来产生第二输出帧(Z2)2373。处理器2312可跳过(例如,抑制)产生经更新样本数据(S1)2352、第一组合帧2370的第二版本的至少帧部分(P1)2317或这两者。
参考图25,展示系统的说明性实例且一般将其指定为2500。系统2500对应于系统2300的实施,在系统2300中,分析器2310包含经耦合到处理器2312的样本校正器2522,且在系统2300中,组合器2320包含经耦合到帧产生器2518的替换器2514。
在操作期间,分析器2310可从中侧产生器1710接收第二组合帧(C2)2371,如参考图23所描述。响应于检测到第二组合帧(C2)2371的接收,样本校正器2522可存取对应于第二组合帧(C2)2371的目标信号1742的输入帧(例如,第二特定输入帧(B2)2330)。样本校正器2522还可存取对应于前一组合帧(例如,第一组合帧(C1)2370)的输入帧(例如,第一输入帧(A1)2308和第二输入帧(B1)2328)。
样本校正器2522可产生包含校正样本的第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317,如本文所描述。帧部分(P1)2317可包含对应于第一组合帧(C1)2370的至少损毁部分(例如,部分(G1))的经更新样本。帧部分(P1)2317可包含第一组合帧(C1)2370的经更新样本(例如,从20ms-第一移位值到20ms)。在特定实施方案中,第一移位值可包含非因果性移位值162。在替代性实施方案中,第一移位值可对应于Tmax2492。非因果性移位值162可从一个帧到下一帧变化,且Tmax 2492可具有从一个帧到下一帧相同的值。
帧部分(P1)2317可包含对应于参考信号1740的样本信息和对应于目标信号1742的样本信息。举例来说,样本校正器2522可基于方程式5a到5b(或方程式6a到6b)产生第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317,其中M(或S)指示至少帧部分(P1)2317,如参考图1所描述。Ref(n)可指示第一输入帧(A1)2308的第一样本(例如,从20ms-第一移位值到20ms)。Targ(n+N1)可指示对应于第一样本的目标信号1742的时间移位样本。举例来说,Targ(n+N1)可指示目标信号1742的第二样本(例如,从20ms-第一移位值+非因果性移位值162到20ms+非因果性移位值162)。当第一移位值包含Tmax 2492且Tmax 2492大于非因果性移位值162时,第二输入帧(B1)2328可包含第二样本中的一或多者(例如,图24C中描绘的(N2))。第二特定输入帧(B2)2330可包含第二样本的剩余样本(例如,图24C中描绘的(O2))。样本校正器2522可将第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317提供到处理器2312。
处理器2312可通过处理第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317来产生经更新样本数据(S1)2352,如参考图26进一步描述。举例来说,处理可包含滤波、重采样或加重中的至少一个。处理器2312可从存储器153检索滤波器状态2392。处理器2312可复位滤波器以具有滤波器状态2392。处理器2312可通过使用滤波器处理至少帧部分(P1)2317来产生经更新样本数据(S1)2352。滤波器可在初始化至少帧部分(P1)2317的处理后具有滤波器状态2392。处理器2312可将经更新样本数据(S1)2352提供到替换器2514。
替换器2514可基于经更新样本数据(S1)2352和第一预看部分数据(J1)2350产生经更新部分2554。举例来说,替换器2514可通过经更新样本数据(S1)2352的至少部分(例如,一或多个样本)来替换第一预看部分数据(J1)2350的部分(例如,L1+M1)。在特定实施方案中,第一移位值可对应于Tmax 2492。在替代性实施方案中,第一移位值可对应于非因果性移位值162。因此,经更新部分2554可对应于具有用经更新样本信息(R1)替换的第二部分(G1)2482的第一组合帧(C1)2370的LA部分2490(例如,从20ms-LA到20ms)。替换器2514可将经更新部分2554提供到帧产生器2518。
处理器2312可通过处理第二组合帧(C2)2371的部分2572(例如,从20ms到40ms)来产生第二组合帧数据(H2)2356,如参考图26进一步描述。部分2572可包含第二组合帧(C2)2371的部分或全部。处理器2312可将第二组合帧数据(H2)2356提供到帧产生器2518。帧产生器2518可通过将经更新部分2554与第二组合帧数据(H2)2356的样本(I2)(例如,20ms到40ms-LA)的群组组合(例如,串接)来产生第二输出帧(Z2)2373。帧产生器2518可将第二输出帧(Z2)2373提供到LB中间核心译码器1720(或LB侧核心译码器1718)。处理器2312可将第二组合帧数据(H2)2356的部分(J2)(例如,40ms-LA到40ms)存储于存储器153中。部分(J2)还可被称作第二预看部分数据(J2)2558。第二预看部分数据(J2)2558可替换第一预看部分数据(J1)2350。
因此,系统2500使得中间信号1770(或侧信号1772)的损毁部分能够由经更新样本数据替换。LB中间信号1760(或LB侧信号1762)可基于不包含损毁部分的经更新样本数据产生。
参考图26,展示系统的说明性实例且一般将其指定为2600。系统2600包含处理器2312。处理器2312包含滤波器2602(例如,高通滤波器)、重采样器2604(例如,递减采样器)、加重调整器2606、一或多个额外处理器2608或其组合。
滤波器2602可接收音频信号2670。音频信号2670可包含例如第一组合帧(C1)2370的帧或部分、第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317或第二组合帧(C2)2371,如参考图23所描述。滤波器2602可通过对音频信号2670进行滤波来产生经滤波信号2672。滤波器2602可将经滤波信号2672提供到重采样器2604。
重采样器2604可通过重采样(例如,递减采样)经滤波信号2672来产生LB核心信号2674(例如,经递减采样的信号)。举例来说,经滤波信号2672可对应于第一采样率(Fs)且LB核心信号2674可对应于第二采样率(例如,12.8kHz或16kHz)。重采样器2604可将LB核心信号2674提供到加重调整器2606。加重调整器2606可通过调整LB核心信号2674的加重(例如,加重或去加重)来产生经加重核心信号2676(例如,经加重信号)。举例来说,加重调整器2606可将倾斜应用于LB核心信号2674以平衡衰减(roll-off)。加重调整器2606可将经加重核心信号2676提供到一或多个处理器2608。
在特定实施方案中,当音频信号2670对应于侧信号1772的数据(例如,第一组合帧(C1)2370、第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317或第二组合帧(C2)2371)时,重采样器2604可略过加重调整器2606以将LB核心信号2674提供到处理器2608。
一或多个处理器2608可通过执行经加重核心信号2676(或LB核心信号2674)的额外处理来产生经预处理信号2678。额外处理可包含频谱分析、话音活动检测(VAD)、线性预测(LP)分析、间距估计、噪声估计、话语/音乐检测、瞬态检测或其组合。
经预处理信号2678可包含例如组合帧数据(H1)、第一预看部分数据(J1)2350、经更新样本数据(S1)2352或第二组合帧数据(H2)2356。举例来说,当音频信号2670对应于第一组合帧(C1)2370时,经预处理信号2678可对应于包含第一预看部分数据(J1)2350的组合帧数据(H1)。当音频信号2670对应于第一组合帧(C1)2370的第二版本的至少帧部分(P1)2317时,经预处理信号2678可对应于经更新样本数据(S1)2352。当音频信号2670对应于第二组合帧(C2)2371时,经预处理的信号2678可对应于第二组合帧数据(H2)2356。
如本文所描述,处理器2312的滤波器可指滤波器2602、重采样器2604、加重调整器2606、额外处理器2608中的一或多者或其组合。处理器2312的滤波器可在初始化信号的处理后具有初始滤波器状态。在特定方面中,处理器2312可设置(例如,复位)滤波器以具有初始滤波器状态。滤波器可通过处理信号来产生经处理信号。滤波器可在产生经处理信号后具有经处理滤波器状态。经处理滤波器状态可与初始滤波器状态不同或相同。在特定方面中,处理器2312可将经处理滤波器状态存储于图1的存储器153中。
在特定方面中,滤波器2602可在初始化音频信号2670的一部分的处理后具有特定初始滤波器状态且可在通过处理音频信号2670的部分来产生经滤波信号2672的一部分后具有特定经处理滤波器状态。重采样器2604可在初始化经滤波信号2672的部分的处理后具有初始重采样器状态且可在通过处理经滤波信号2672的部分来产生LB核心信号2674的一部分后具有经处理重采样器状态。加重调整器2606可在初始化LB核心信号2674的部分的处理后具有初始加重调整器状态且可在通过处理LB核心信号2674的部分来产生经加重核心信号2676的一部分后具有经处理加重调整器状态。一或多个额外处理器2608可在初始化经加重核心信号2676的部分的处理后具有初始额外处理器状态且可在通过处理经加重核心信号2676的部分来产生经预处理的信号2678的一部分后具有经处理额外处理器状态。
在初始化音频信号2670的部分的处理后,处理器2312的滤波器的初始状态可对应于特定初始滤波器状态、初始重采样器状态、初始加重调整器状态或初始额外处理器状态。在产生经预处理的信号2678的部分后,处理器2312的滤波器的经处理滤波器状态可对应于特定经处理滤波器状态、经处理重采样器状态、经处理加重调整器状态或经处理额外处理器状态。
在特定实施方案中,可将滤波器2602(例如,具有50赫兹(Hz)截止频率的高通滤波器)应用于图17的音频信号1728以产生滤波音频信号。举例来说,可将滤波器2602应用于第一音频信号130以产生第一经滤波音频信号且应用于第二音频信号132以产生第二经滤波音频信号。可将经滤波音频信号提供到17的信号预处理器1702。信号预处理器1702可通过重采样第一经滤波音频信号来产生第一经重采样信号530,如参考图5所描述。信号预处理器1702可通过重采样第二经滤波音频信号来产生第二经重采样信号532,如参考图5所描述。可将音频信号2670提供到重采样器2604。重采样器2604可通过重采样音频信号2670来产生LB核心信号2674。
参考图27,展示说明操作的特定方法的流程图且一般将其指定为2700。方法2700可由以下各者执行:图1的编码器114、第一装置104、系统100;图17的LB信号再生器1716、系统1700;图22的侧分析器2212、中间分析器2208、系统2200;图23的分析器2310、处理器2312、组合器2320;图25的样本校正器2522;或其组合。
方法2700包含在2702处在装置处存储第一组合帧的第一预看部分数据。举例来说,图23的分析器2310可将第一组合帧(C1)2370的第一预看部分数据(J1)2350存储于第一装置104的存储器153中,如参考图23所描述。第一组合帧(C1)2370和第二组合帧(C2)2371可对应于多通道音频信号(例如,图17的中间信号1770或侧信号1772)。
方法2700还包含在2702处在装置的多通道编码器处产生帧。举例来说,图23的分析器2310可在第一装置104的编码器114(例如,多通道编码器)处产生第二输出帧(Z2)2373,如参考图23所描述。第二输出帧(Z2)2373可包含第一预看部分数据(J1)2350的样本(K1)的子集、对应于第一组合帧(C1)2370的经更新样本数据(S1)2352的一或多个样本和对应于第二组合帧(C2)2371的第二组合帧数据(H2)2356的样本(I2)的群组,如参考图23所描述。因此,方法2700可能够在不损毁一或多个输出信号的样本的情况下实施非因果性移位。
参考图28,描绘装置(例如,无线通信装置)的特定说明性实例的框图且一般将其指定为2800。在各种方面中,装置2800可具有比图28中所说明的组件更少或更多的组件。在说明性方面中,装置2800可对应于图1的第一装置104或第二装置106。在说明性方面中,装置2800可执行参考图1到27的系统和方法所描述的一或多个操作。
在特定方面中,装置2800包含处理器2806(例如,中央处理单元(CPU))。装置2800可包含一或多个额外处理器2810(例如,一或多个数字信号处理器(DSP))。处理器2810可包含媒体(例如,话语和音乐)译码器-解码器(编解码器)2808和回波消除器2812。媒体编解码器2808可包含图1的解码器118、编码器114或这两者。编码器114可包含时间均衡器108。
装置2800可包含存储器153和编解码器2834。尽管媒体编解码器2808经说明为处理器2810的组件(例如,专用电路和/或可执行程序代码),但在其它方面中,媒体编解码器2808的一或多个组件(例如解码器118、编码器114或这两者)可包含于处理器2806、编解码器2834、另一处理组件或其组合中。
装置2800可包含经耦合到天线2842的发射器110。装置2800可包含经耦合到显示控制器2826的显示器2828。一或多个扬声器2848可经耦合到编解码器2834。一或多个麦克风2846可经由一或多个输入接口112耦合到编解码器2834。在特定方面中,扬声器2848可包含:图1的第一扬声器142、第二扬声器144;图2的第Y扬声器244;或其组合。在特定方面中,麦克风2846可包含:图1的第一麦克风146、第二麦克风148;图2的第N麦克风248;图11的第三麦克风1146、第四麦克风1148;或其组合。编解码器2834可包含数-模转换器(DAC)2802和模-数转换器(ADC)2804。
存储器153可包含指令2860,所述指令2860可由处理器2806、处理器2810、编解码器2834、装置2800的另一处理单元或其组合执行,以执行参考图1到27所描述的一或多个操作。存储器153可存储分析数据190。
可经由专用硬件(例如,电路)、通过执行指令以执行一或多个任务的处理器或其组合来实施装置2800的一或多个组件。作为一实例,存储器153或处理器2806的一或多个组件、处理器2810和/或编解码器2834可为存储器装置(例如,计算机可读存储装置),例如随机存取存储器(RAM)、磁电阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、闪存存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可卸除式磁盘或光盘只读存储器(CD-ROM)。存储器装置可包含(例如,存储)指令(例如,指令2860),所述指令在由计算机(例如,编解码器2834中的处理器、处理器2806和/或处理器2810)执行时可使计算机执行参考图1到27所描述的一或多个操作。作为一实例,存储器153或处理器2806的一或多个组件、处理器2810和/或编解码器2834可为包含指令(例如,指令2860)的非暂时性计算机可读媒体,所述指令在由计算机(例如,编解码器2834中的处理器、处理器2806和/或处理器2810)执行时使计算机执行参考图1到27所描述的一或多个操作。
在特定方面中,装置2800可包含于系统级封装或系统单芯片装置(例如,移动站调制解调器(MSM))2822中。在特定方面中,处理器2806、处理器2810、显示控制器2826、存储器153、编解码器2834和发射器110包含于系统级封装或系统单芯片装置2822中。在特定方面中,例如触摸屏和/或小键盘的输入装置2830和电力供应器2844经耦合到系统单芯片装置2822。此外,在特定方面中,如图28中所说明,显示器2828、输入装置2830、扬声器2848、麦克风2846、天线2842和电力供应器2844在系统单芯片装置2822外部。然而,显示器2828、输入装置2830、扬声器2848、麦克风2846、天线2842和电力供应器2844中的每一者可经耦合到系统单芯片装置2822的组件(例如接口或控制器)。
装置2800可包含无线电话、移动通信装置、移动装置、移动电话、智能型电话、蜂窝式电话、手提式计算机、台式计算机、计算机、平板计算机、机顶盒、个人数字助理(PDA)、显示装置、电视、游戏控制台、音乐播放器、无线电、视频播放器、娱乐单元、通信装置、固定位置数据单元、个人媒体播放器、数字视频播放器、数字视频光盘(DVD)播放器、调谐器、摄像机、导航装置、解码器系统、编码器系统或其任何组合。
在特定方面中,参考图1到27所描述的系统的一或多个组件和装置2800可经集成到解码系统或设备(例如,本文中的电子装置、编解码器或处理器)中、经集成到编码系统或设备中或经集成到所述两者中。在其它方面中,参考图1到27所描述的系统的一或多个组件和装置2800可经集成到以下各者中:无线电话、平板计算机、台式计算机、手提式计算机、机顶盒、音乐播放器、视频播放器、娱乐单元、电视、游戏控制台、导航装置、通信装置、个人数字助理(PDA)、固定位置数据单元、个人媒体播放器或另一类型的装置。
应注意,由参考图1到27所描述的系统的一或多个组件和装置2800所执行的各种功能经描述为由某些组件或模块执行。组件和模块的此划分仅是为了说明。在替代性方面中,由特定组件或模块所执行的功能可划分于多个组件或模块中。此外,在替代性方面中,参考图1到28所描述的两个或更多个的组件或模块可经集成到单一组件或模块中。参考图1到28所描述的每一组件或模块可使用以下各者来实施:硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、DSP、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合。
结合所描述的方面,设备包含用于确定指示第一音频信号相对于第二音频信号移位的最终移位值的装置。举例来说,用于确定的装置可包含:图1的时间均衡器108、编码器114、第一装置104;媒体编解码器2808;处理器2810;装置2800;经配置以确定移位值的一或多个装置(例如,执行存储在计算机可读存储装置处的指令的处理器);或其组合。
设备还包含用于发射至少一个经编码信号的装置,所述至少一个经编码信号是基于第一音频信号的第一样本和第二音频信号的第二样本产生。举例来说,用于发射的装置可包含发射器110、经配置以发射至少一个经编码信号的一或多个装置或其组合。第二样本(例如,图3的样本358-364)可相对于第一样本(例如,图3的样本326-332)经时间移位达基于最终移位值(例如,最终移位值116)的量。
进一步结合所描述的方面,设备包含用于存储第一组合帧的第一预看部分数据的装置。用于存储的装置可包含:图1的编码器114、第一装置104、存储器153;图17的LB信号再生器1716;图22的侧分析器2212、中间分析器2208;图23的分析器2310、处理器2312;媒体编解码器2808;处理器2810;装置2800;经配置以存储第一组合帧(C1)2370的第一预看部分数据(J1)2350的一或多个装置(例如,执行存储在计算机可读存储装置处的指令的处理器);或其组合。第一组合帧(C1)2370和第二组合帧(C2)2371可对应于多通道音频信号(例如,中间信号1770或侧信号1772)。
设备还包含用于在多通道编码器处产生帧的装置。举例来说,用于产生的装置可包含:图1的编码器114、第一装置104;图17的LB信号再生器1716;图22的侧分析器2212、中间分析器2208;图23的分析器2310、处理器2312、组合器2320;图25的样本校正器2522、替换器2514、帧产生器2518;媒体编解码器2808;处理器2810;装置2800;经配置以在编码器114处产生第二输出帧(Z2)2373的一或多个装置(例如,执行存储在计算机可读存储装置处的指令的处理器);或其组合。第二输出帧(Z2)2373可包含第一预看部分数据(J1)2350的样本(K1)的子集、对应于第一组合帧(C1)2370的经更新样本数据(S1)2352中的一或多个样本和对应于第二组合帧(C2)2371的第二组合帧数据(H2)2356的样本的群组。
参考图29,描绘基站2900的特定说明性实例的框图。在各种实施方案中,基站2900可具有比图29中所说明的组件更多的组件或更少的组件。在说明性实例中,基站2900可包含图1的第一装置104、第二装置106,图2的第一装置204,或其组合。在说明性实例中,基站2900可根据参考图1到28所描述的方法或系统中的一或多者操作。
基站2900可为无线通信系统的部分。无线通信系统可包含多个基站和多个无线装置。无线通信系统可为长期演进(LTE)系统、码分多址(CDMA)系统、全球移动通信系统(GSM)系统、无线局域网(WLAN)系统或一些其它无线系统。CDMA系统可实施宽带CDMA(WCDMA)、CDMA 1X、演进数据优化(EVDO)、分时同步CDMA(TD-SCDMA)或一些其它版本的CDMA。
无线装置还可被称作用户设备(UE)、移动站、终端、接入终端、用户单元、站等。无线装置可包含蜂窝式电话、智能型电话、平板计算机、无线调制解调器、个人数字助理(PDA)、手持型装置、手提式计算机、智能笔记型计算机、迷你笔记型计算机、平板计算机、无线电话、无线本地回路(WLL)站、蓝牙装置等。无线装置可包含或对应于图28的装置2800。
可由基站2900的一或多个组件(和/或在未展示的其它组件中)执行各种功能,例如发送和接收消息和数据(例如,音频数据)。在特定实例中,基站2900包含处理器2906(例如,CPU)。基站2900可包含转码器2910。转码器2910可包含音频编解码器2908。举例来说,转码器2910可包含经配置以执行音频编解码器2908的操作的一或多个组件(例如,电路)。作为另一实例,转码器2910可经配置以执行一或多个计算机可读指令以执行音频编解码器2908的操作。尽管音频编解码器2908经说明为转码器2910的组件,但在其它实例中,音频编解码器2908的一或多个组件可包含于处理器2906、另一处理组件或其组合中。举例来说,解码器2938(例如,声码器解码器)可包含于接收器数据处理器2964中。作为另一实例,编码器2936(例如,声码器编码器)可包含于发射数据处理器2982中。
转码器2910可起作用以在两个或更多个的网络之间转码消息和数据。转码器2910可经配置以将消息和音频数据从第一格式(例如,数字格式)转换成第二格式。为进行说明,解码器2938可解码具有第一格式的经编码信号且编码器2936可将经解码信号编码成具有第二格式的经编码信号。另外或替代地,转码器2910可经配置以执行数据速率调适。举例来说,转码器2910可在不改变音频数据格式的情况下降频转换数据速率或升频转换数据速率。为进行说明,转码器2910可将64kbit/s的信号降频转换成16kbit/s的信号。
音频编解码器2908可包含编码器2936和解码器2938。编码器2936可包含图1的编码器114、图2的编码器214或这两者。解码器2938可包含图1的解码器118。
基站2900可包含存储器2932。存储器2932可包含图1的存储器153。例如计算机可读存储装置的存储器2932可包含指令。所述指令可包含由处理器2906、转码器2910或其组合执行以执行参考图1到28的方法和系统所描述的一或多个操作的一或多个指令。基站2900可包含经耦合到天线阵列的多个发射器和接收器(例如,收发器),例如第一收发器2952和第二收发器2954。天线阵列可包含第一天线2942和第二天线2944。天线阵列可经配置以与一或多个无线装置(例如图28的装置2800)无线通信。举例来说,第二天线2944可从无线装置接收数据流2914(例如,位流)。数据流2914可包含消息、数据(例如,经编码话语数据)或其组合。
基站2900可包含例如空载发射连接的网络连接2960。网络连接2960可经配置以与核心网络或无线通信网络中的一或多个基站通信。举例来说,基站2900可经由网络连接2960从核心网络接收第二数据流(例如,消息或音频数据)。基站2900可处理第二数据流以产生消息或音频数据且经由天线阵列中的一或多个天线将消息或音频数据提供到一或多个无线装置或经由网络连接2960将消息或音频数据提供到另一基站。在特定实施方案中,作为说明性非限制性实例,网络连接2960可为广域网(WAN)连接。在一些实施方案中,核心网络可包含或对应于公众交换式电话网络(PSTN)、分组基干网络或这两者。
基站2900可包含经耦合到网络连接2960和处理器2906的媒体网关2970。媒体网关2970可经配置以在不同电信技术的媒体流之间进行转换。举例来说,媒体网关2970可在不同发射协议、不同译码方案或这两者之间进行转换。为进行说明,作为说明性非限制性实例,媒体网关2970可从PCM信号转换成实时输送协议(RTP)信号。媒体网关2970可在以下各者之间转换数据:分组交换式网络(例如,因特网通讯协议语音(VoIP)网络、IP多媒体子系统(IMS)、例如LTE、WiMax和UMB的第四代(4G)无线网络等)、电路交换式网络(例如,PSTN)和混合网络(例如,例如GSM、GPRS和EDGE的第二代(2G)无线网络、例如WCDMA、EV-DO和HSPA的第三代(3G)无线网络等)。
另外,媒体网关2970可包含例如转码器2910的转码器,且可经配置以在编解码器不兼容时转码数据。举例来说,作为说明性非限制性实例,媒体网关2970可在从适应多频率(AMR)编解码器与G.711编解码器之间进行转码。媒体网关2970可包含路由器和多个物理接口。在一些实施方案中,媒体网关2970还可包含控制器(未展示)。在特定实施方案中,媒体网关控制器可在媒体网关2970外部、基站2900外部或这两者的外部。媒体网关控制器可控制并协调多个媒体网关的操作。媒体网关2970可从媒体网关控制器接收控制信号,且可起作用以在不同发射技术之间进行桥接,且可将服务添加到终端用户能力和连接。
基站2900可包含经耦合到收发器2952、2954的解调器2962、接收器数据处理器2964和处理器2906,且接收器数据处理器2964可经耦合到处理器2906。解调器2962可经配置以解调从收发器2952、2954接收的调制信号且将经解调制数据提供到接收器数据处理器2964。接收器数据处理器2964可经配置以从经解调制数据提取消息或音频数据且将消息或音频数据发送到处理器2906。
基站2900可包含发射数据处理器2982和发射多输入多输出(MIMO)处理器2984。发射数据处理器2982可经耦合到处理器2906和发射MIMO处理器2984。发射MIMO处理器2984可经耦合到收发器2952、2954和处理器2906。在一些实施方案中,发射MIMO处理器2984可经耦合到媒体网关2970。作为说明性非限制性实例,发射数据处理器2982可经配置以从处理器2906接收消息或音频数据且基于译码方案(例如CDMA或正交分频多路复用(OFDM))译码消息或音频数据。发射数据处理器2982可将经译码数据提供到发射MIMO处理器2984。
可使用CDMA或OFDM技术将经译码数据与例如导频数据的其它数据一起多路复用以产生经多路复用数据。接着可通过发射数据处理器2982基于特定调制方案(例如,二进制相移键控(“BPSK”)、正交相移键控(“QSPK”)、M阶相移键控(“M-PSK”)、M阶正交振幅调制(“M-QAM”)等)来调制(即,符号映射)经多路复用数据以产生调制符号。在特定实施方案中,可使用不同调制方案来调制经译码数据和其它数据。可通过处理器2906所执行的指令来确定每一数据流的数据速率、译码和调制。
发射MIMO处理器2984可经配置以从发射数据处理器2982接收调制符号,且可进一步处理调制符号且可对数据执行波束成形。举例来说,发射MIMO处理器2984可将波束成形权重应用于调制符号。波束成形权重可对应于天线阵列中的一或多个天线,调制符号是从所述一或多个天线发射。
在操作期间,基站2900的第二天线2944可接收数据流2914。第二收发器2954可从第二天线2944接收数据流2914且可将数据流2914提供到解调器2962。解调器2962可解调数据流2914的调制信号且将经解调制数据提供到接收器数据处理器2964。接收器数据处理器2964可从经解调制数据提取音频数据且将所提取音频数据提供到处理器2906。
处理器2906可将音频数据提供到转码器2910以用于转码。转码器2910的解码器2938可将音频数据从第一格式解码成经解码音频数据且编码器2936可将经解码音频数据编码成第二格式。在一些实施方案中,编码器2936可使用比从无线装置接收的数据速率更高的数据速率(例如,升频转换)或更低的数据速率(例如,降频转换)来对音频数据进行编码。在其它实施方案中,音频数据可未经转码。尽管转码(例如,解码和编码)经说明为由转码器2910执行,但转码操作(例如,解码和编码)可由基站2900的多个组件执行。举例来说,可由接收器数据处理器2964执行解码且可由发射数据处理器2982执行编码。在其它实施方案中,处理器2906可将音频数据提供到媒体网关2970以用于转换成另一发射协议、译码方案或这两者。媒体网关2970可经由网络连接2960将经转换数据提供到另一基站或核心网络。
编码器2936可确定指示第一音频信号130与第二音频信号132之间的时间延迟(例如,时间失配)的量的最终移位值116。编码器2936可通过基于最终移位值116编码第一音频信号130和第二音频信号132来产生经编码信号102、增益参数160或这两者。举例来说,编码器2936可存储第一组合帧(C1)2370的第一预看部分数据(J1)2350。编码器2936可产生第二输出帧(Z2)2373、第一预看部分数据(J1)2350的样本(K1)的子集、对应于第一组合帧(C1)2370的经更新样本数据(S1)2352的一或多个样本和第二组合帧数据(H2)2356的样本(I2)的群组。
编码器2936可基于最终移位值116产生参考信号指示符164和非因果性移位值162。解码器118可通过基于参考信号指示符164、非因果性移位值162、增益参数160或其组合解码经编码信号来产生第一输出信号126和第二输出信号128。可经由处理器2906将在编码器2936处产生的经编码音频数据(例如经转码数据)提供到发射数据处理器2982或网络连接2960。
可将来自转码器2910的经转码音频数据提供到发射数据处理器2982,以用于根据例如OFDM的调制方案译码,以产生调制符号。发射数据处理器2982可将调制符号提供到发射MIMO处理器2984以用于进一步处理和波束成形。发射MIMO处理器2984可应用波束成形权重并可经由第一收发器2952将调制符号提供到天线阵列中的一或多个天线,例如第一天线2942。因此,基站2900可将对应于从无线装置接收的数据流2914的经转码数据流2916提供到另一无线装置。经转码数据流2916可具有与数据流2914不同的编码格式、数据速率或这两者。在其它实施方案中,可将经转码数据流2916提供到网络连接2960以用于发射到另一基站或核心网络。
基站2900可因此包含存储指令的计算机可读存储装置(例如,存储器2932),所述指令在由处理器(例如,处理器2906或转码器2910)执行时使处理器执行包含存储第一组合帧的第一预看部分数据的操作,所述第一组合帧和第二组合帧对应于多通道音频信号。所述操作还包含在多通道编码器处产生帧,所述帧包含第一预看部分数据的样本的子集、对应于第一组合帧的经更新样本数据的一或多个样本和第二组合帧数据的样本的群组。
所属领域的一般技术人员将进一步了解,结合本文中所公开的方面描述的各种说明性逻辑块、配置、模块、电路和算法步骤可实施为电子硬件、由例如硬件处理器的处理装置执行的计算机软件,或这两者的组合。上文已大体上在其功能性方面描述各种说明性组件、块、配置、模块、电路和步骤。此功能性经实施为硬件抑或软件取决于特定应用和强加于整个系统的设计约束而定。对于每一特定应用来说,所属领域的一般技术人员可以变化的方式实施所描述的功能性,但不应将所述实施决策解释为导致脱离本发明的范围。
结合本文中所公开的方面而描述的方法或算法的步骤可直接体现于硬件、由处理器执行的软件模块,或其两者的组合中。软件模块可驻留于存储器装置中,例如随机存取存储器(RAM)、磁电阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、闪存存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可卸除式磁盘或光盘只读存储器(CD-ROM)。示范性存储器装置经耦合到处理器,使得处理器可从存储器装置读取信息并将信息写入到存储器装置。在替代例中,存储器装置可与处理器成一体式。处理器和存储媒体可驻留于专用集成电路(ASIC)中。ASIC可驻留于计算装置或用户终端中。在替代例中,处理器和存储媒体可作为离散组件驻留于计算装置或用户终端中。
提供所公开方面的先前描述以使得所属领域的一般技术人员能够制作或使用所公开方面。所属领域的一般技术人员将易于了解对这些方面的各种修改,且本文中所定义的原理可在不脱离本发明的范围的情况下应用于其它方面。因此,本发明并不打算限于本文中所展示的方面,而应符合可能与如所附权利要求书所定义的原理和新颖特征相一致的最广泛范围。
Claims (32)
1.一种用于多音频信号的编码的装置,其包括:
处理器,其经配置以接收对应于多通道音频信号的第一组合帧和第二组合帧;
存储器,其经配置以存储所述第一组合帧的第一预看部分数据,所述第一预看部分数据是从所述处理器接收;和
组合器,其经配置以在多通道编码器处产生帧,所述帧包含所述第一预看部分数据的样本的子集、对应于所述第一组合帧的经更新样本数据的一或多个样本和对应于所述第二组合帧的第二组合帧数据的样本的群组。
2.根据权利要求1所述的装置,其中所述第一组合帧包含所述多通道音频信号的第一音频通道的第一输入帧与所述多通道音频信号的第二音频通道的第二输入帧的组合。
3.根据权利要求2所述的装置,其进一步包括:
样本校正器,其经配置以基于第一输入帧、第二输入帧和所述第二音频通道的第二特定输入帧产生所述第一组合帧的第二版本的至少一特定部分,
其中所述第二组合帧包含所述第一音频通道的第一特定输入帧与所述第二特定输入帧的特定组合;且
其中所述处理器经进一步配置以通过处理所述第一组合帧的所述第二版本的至少所述特定部分来产生所述经更新样本数据。
4.根据权利要求1所述的装置,其中所述第一预看部分数据的样本的所述子集不包含来自所述多通道音频信号的第二音频通道的样本信息。
5.根据权利要求4所述的装置,其中所述经更新样本数据的所述一或多个样本包含所述样本信息。
6.根据权利要求1所述的装置,其中所述第一预看部分数据的样本的所述子集包含对应于所述多通道音频信号的第二音频通道的预测样本信息。
7.根据权利要求1所述的装置,其中所述处理器经进一步配置以通过处理所述第二组合帧的帧部分产生所述第二组合帧数据。
8.根据权利要求1所述的装置,其中所述处理器包含高通滤波器、重采样器或加重调整器中的至少一个。
9.根据权利要求1所述的装置,其中所述处理器包含:
高通滤波器,其经配置以通过对输入信号进行滤波来产生经滤波信号;和
重采样器,其经配置以通过重采样所述经滤波信号来产生经重采样信号;
其中所述处理器经配置以基于所述经重采样信号产生经预处理信号。
10.根据权利要求9所述的装置,其中所述重采样器包含递减采样器,所述递减采样器经配置以通过对所述经滤波信号递减采样来产生所述经重采样信号。
11.根据权利要求9所述的装置,其中所述处理器进一步包含加重调整器,所述加重调整器经配置以通过调整所述经重采样信号的加重来产生经加重信号,其中所述经预处理信号是基于所述经加重信号。
12.根据权利要求9所述的装置,其中所述输入信号包含所述第一组合帧的第一部分、所述第一组合帧的第二版本的至少一特定部分或所述第二组合帧的帧部分。
13.根据权利要求9所述的装置,其中所述经预处理信号包含所述第一预看部分数据、所述经更新样本数据或所述第二组合帧数据。
14.根据权利要求1所述的装置,其中所述处理器经配置以:
使用滤波器产生所述第一预看部分数据的样本的所述子集;
确定所述滤波器在所述第一预看部分数据的样本的所述子集产生后的第一滤波器状态;
将所述第一滤波器状态存储于所述存储器中;
在产生所述第一预看部分数据的样本的所述子集之后,使用所述滤波器产生所述第一预看部分数据的样本的第二子集,其中所述滤波器在所述第一预看部分数据的样本的所述第二子集产生后具有第二滤波器状态;
复位所述滤波器以具有所述第一滤波器状态;和
使用具有所述第一滤波器状态的所述滤波器产生所述经更新样本数据。
15.根据权利要求1所述的装置,其进一步包括:
第一麦克风,其经配置以接收第一音频通道;
第二麦克风,其经配置以接收第二音频通道,所述第一音频通道对应于所述第一音频通道和所述第二音频通道中的超前音频通道,且所述第二音频通道对应于所述第一音频通道和所述第二音频通道中的滞后音频通道;和
时间均衡器,其经配置以:
确定指示所述第一音频通道与所述第二音频通道之间的时间失配量的值;且
基于所述第一音频通道的第一样本和所述第二音频通道的第二样本产生所述多通道音频信号,所述第二样本基于所述值相对于所述第一样本移位。
16.根据权利要求1所述的装置,其中所述经更新样本数据是基于用以产生所述第一组合帧的一或多个降混参数值。
17.根据权利要求1所述的装置,其进一步包括:
第一麦克风,其经配置以接收第一音频通道;及
第二麦克风,其经配置以接收第二音频通道,所述第一音频通道对应于所述第一音频通道和所述第二音频通道中的超前音频通道,且所述第二音频通道对应于所述第一音频通道和所述第二音频通道中的滞后音频通道,其中所述多通道音频信号是基于所述第一音频通道及所述第二音频通道的。
18.根据权利要求1所述的装置,所述组合器进一步经配置以在所述多通道编码器处产生第二帧,所述第二帧包含对应于所述第一组合帧的第一组合帧数据的样本的群组,所述第二帧对应于第一输出帧,其中所述第一输出帧具有比第一组合帧短的持续时间。
19.根据权利要求18所述的装置,其中所述第一输出帧对应于所述第一组合帧,且其中在所述多通道编码器处产生的所述帧对应于第二输出帧,所述第二输出帧对应于所述第一输出帧之后的一段时间。
20.根据权利要求18所述的装置,其中对应于所述第一组合帧的所述第一组合帧数据的样本的所述群组包括第一预处理组合帧的一部分。
21.一种用于多音频信号的编码的方法,其包括:
在装置处存储第一组合帧的第一预看部分数据,所述第一组合帧和第二组合帧对应于多通道音频信号;和
由所述装置的组合器在所述装置的多通道编码器处产生帧,所述帧包含所述第一预看部分数据的样本的子集、对应于所述第一组合帧的经更新样本数据的一或多个样本和对应于所述第二组合帧的第二组合帧数据的样本的群组。
22.根据权利要求21所述的方法,其中所述第一组合帧包含所述多通道音频信号的第一音频通道的第一输入帧与所述多通道音频信号的第二音频通道的第二输入帧的组合,其中所述第一预看部分数据的样本的所述子集不包含所述多通道音频信号的第一音频通道的样本信息,且其中所述经更新样本数据的所述一或多个样本包含所述样本信息。
23.根据权利要求21所述的方法,其进一步包括:
通过处理所述第二组合帧的帧部分来产生所述第二组合帧数据,其中所述处理包含滤波、重采样或加重中的至少一个;以及
存储所述第二组合帧数据的至少一个样本作为第二预看部分数据。
24.根据权利要求21所述的方法,其进一步包括通过用所述经更新样本数据的所述一或多个样本替换所述第一预看部分数据的至少一个样本来产生经更新部分,其中所述帧是通过将所述经更新部分与第二组合帧数据的样本的所述群组串接而产生。
25.一种计算机可读存储介质,其存储当由处理器执行时使所述处理器执行包括以下各者的操作的指令:
存储第一组合帧的第一预看部分数据,所述第一组合帧和第二组合帧对应于多通道音频信号;和
由所述处理器在多通道编码器处产生帧,所述帧包含所述第一预看部分数据的样本的子集、对应于所述第一组合帧的经更新样本数据的一或多个样本和第二组合帧数据的样本的群组。
26.根据权利要求25所述的计算机可读存储介质,其中所述第一组合帧包含所述多通道音频信号的第一音频通道的第一输入帧与所述多通道音频信号的第二音频通道的第二输入帧的组合,其中第一输入帧的第一特定部分包含所述多通道音频信号的所述第一音频通道的一或多个第一样本,其中第二输入帧的第二特定部分包含所述多通道音频信号的所述第二音频通道的一或多个第二样本,且其中所述一或多个第一样本具有对应于在经由第一麦克风对所述第一样本的接收与经由第二麦克风对所述第二样本的接收之间检测到的延迟的样本移位。
27.根据权利要求25所述的计算机可读存储介质,其中所述第一预看部分数据的样本的所述子集不包含所述多通道音频信号的第一音频通道的样本信息,且其中所述经更新样本数据的所述一或多个样本包含所述样本信息。
28.根据权利要求25所述的计算机可读存储介质,其中所述操作进一步包括通过处理所述第二组合帧的帧部分来产生所述第二组合帧数据。
29.根据权利要求28所述的计算机可读存储介质,其中所述处理包含:
通过对所述第二组合帧的所述帧部分进行滤波来产生经滤波信号;
通过重采样所述经滤波信号来产生经重采样信号;和
通过调整所述经重采样信号的加重来产生经加重信号,
其中所述第二组合帧数据是基于所述经加重信号。
30.根据权利要求28所述的计算机可读存储介质,其中所述操作进一步包括通过用所述经更新样本数据的所述一或多个样本替换所述第一预看部分数据的至少一个样本来产生经更新部分,且其中所述帧是基于所述经更新部分和所述第二组合帧数据而产生。
31.一种用于多音频信号的编码的设备,其包括:
用于存储第一组合帧的第一预看部分数据的装置,所述第一组合帧和第二组合帧对应于多通道音频信号;和
用于在多通道编码器处产生帧的装置,所述帧包含所述第一预看部分数据的样本的子集、对应于所述第一组合帧的经更新样本数据的一或多个样本和对应于所述第二组合帧的第二组合帧数据的样本的群组。
32.根据权利要求31所述的设备,其中所述用于存储的装置和所述用于产生的装置经集成到以下中的至少一个中:移动电话、通信装置、计算机、音乐播放器、视频播放器、娱乐单元、导航装置、个人数字助理PDA、解码器或机顶盒。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201562269660P | 2015-12-18 | 2015-12-18 | |
US62/269,660 | 2015-12-18 | ||
US15/372,980 | 2016-12-08 | ||
US15/372,980 US10115403B2 (en) | 2015-12-18 | 2016-12-08 | Encoding of multiple audio signals |
PCT/US2016/065873 WO2017106041A1 (en) | 2015-12-18 | 2016-12-09 | Encoding of multiple audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108431890A CN108431890A (zh) | 2018-08-21 |
CN108431890B true CN108431890B (zh) | 2020-03-24 |
Family
ID=57708791
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201680072828.5A Active CN108431890B (zh) | 2015-12-18 | 2016-12-09 | 多音频信号的编码 |
Country Status (11)
Country | Link |
---|---|
US (1) | US10115403B2 (zh) |
EP (1) | EP3391369B1 (zh) |
JP (2) | JP6622410B2 (zh) |
KR (1) | KR102032668B1 (zh) |
CN (1) | CN108431890B (zh) |
AU (1) | AU2016370363B2 (zh) |
BR (1) | BR112018012154A2 (zh) |
ES (1) | ES2803774T3 (zh) |
HU (1) | HUE050695T2 (zh) |
TW (1) | TWI696172B (zh) |
WO (1) | WO2017106041A1 (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2870865C (en) * | 2012-04-17 | 2020-08-18 | Sirius Xm Radio Inc. | Server side crossfading for progressive download media |
KR102230668B1 (ko) * | 2016-01-22 | 2021-03-22 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 미드/사이드 결정이 개선된 전역 ild를 갖는 mdct m/s 스테레오의 장치 및 방법 |
US10304468B2 (en) * | 2017-03-20 | 2019-05-28 | Qualcomm Incorporated | Target sample generation |
US10891960B2 (en) * | 2017-09-11 | 2021-01-12 | Qualcomm Incorproated | Temporal offset estimation |
CN109361828B (zh) * | 2018-12-17 | 2021-02-12 | 北京达佳互联信息技术有限公司 | 一种回声消除方法、装置、电子设备及存储介质 |
CN109645957B (zh) * | 2018-12-21 | 2021-06-08 | 南京理工大学 | 一种鼾声来源分类方法 |
US10932122B1 (en) * | 2019-06-07 | 2021-02-23 | Sprint Communications Company L.P. | User equipment beam effectiveness |
WO2024014586A1 (ko) * | 2022-07-15 | 2024-01-18 | 엘지전자 주식회사 | 무선 오디오 수신 장치, 무선 오디오 전송 장치 및 이를 구비하는 무선 오디오 출력 시스템 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101533641A (zh) * | 2009-04-20 | 2009-09-16 | 华为技术有限公司 | 对多声道信号的声道延迟参数进行修正的方法和装置 |
WO2011029984A1 (en) * | 2009-09-11 | 2011-03-17 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
CN102160113A (zh) * | 2008-08-11 | 2011-08-17 | 诺基亚公司 | 多声道音频编码器和解码器 |
CN103262158A (zh) * | 2010-09-28 | 2013-08-21 | 华为技术有限公司 | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 |
CN104160442A (zh) * | 2012-02-24 | 2014-11-19 | 杜比国际公司 | 音频处理 |
CN105684078A (zh) * | 2013-09-30 | 2016-06-15 | 奥兰治 | 对音频信号进行重采样以用于低延迟编码/解码 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10282995A (ja) * | 1997-04-01 | 1998-10-23 | Matsushita Electric Ind Co Ltd | 欠落音声補間符号化方法、欠落音声補間符号化装置、及び記録媒体 |
JP4369946B2 (ja) * | 2002-11-21 | 2009-11-25 | 日本電信電話株式会社 | ディジタル信号処理方法、そのプログラム、及びそのプログラムを格納した記録媒体 |
JP3965141B2 (ja) * | 2003-08-15 | 2007-08-29 | 株式会社国際電気通信基礎技術研究所 | 音声認識装置 |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
EP2395504B1 (en) | 2009-02-13 | 2013-09-18 | Huawei Technologies Co., Ltd. | Stereo encoding method and apparatus |
US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
WO2013160729A1 (en) * | 2012-04-26 | 2013-10-31 | Nokia Corporation | Backwards compatible audio representation |
EP2959479B1 (en) * | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
EP2840811A1 (en) * | 2013-07-22 | 2015-02-25 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for processing an audio signal; signal processing unit, binaural renderer, audio encoder and audio decoder |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
-
2016
- 2016-12-08 US US15/372,980 patent/US10115403B2/en active Active
- 2016-12-09 WO PCT/US2016/065873 patent/WO2017106041A1/en active Application Filing
- 2016-12-09 BR BR112018012154-1A patent/BR112018012154A2/pt active Search and Examination
- 2016-12-09 JP JP2018531322A patent/JP6622410B2/ja active Active
- 2016-12-09 EP EP16820456.8A patent/EP3391369B1/en active Active
- 2016-12-09 AU AU2016370363A patent/AU2016370363B2/en active Active
- 2016-12-09 CN CN201680072828.5A patent/CN108431890B/zh active Active
- 2016-12-09 HU HUE16820456A patent/HUE050695T2/hu unknown
- 2016-12-09 KR KR1020187016925A patent/KR102032668B1/ko active IP Right Grant
- 2016-12-09 ES ES16820456T patent/ES2803774T3/es active Active
- 2016-12-15 TW TW105141537A patent/TWI696172B/zh active
-
2019
- 2019-11-21 JP JP2019210278A patent/JP6710805B2/ja active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102160113A (zh) * | 2008-08-11 | 2011-08-17 | 诺基亚公司 | 多声道音频编码器和解码器 |
CN101533641A (zh) * | 2009-04-20 | 2009-09-16 | 华为技术有限公司 | 对多声道信号的声道延迟参数进行修正的方法和装置 |
WO2011029984A1 (en) * | 2009-09-11 | 2011-03-17 | Nokia Corporation | Method, apparatus and computer program product for audio coding |
CN103262158A (zh) * | 2010-09-28 | 2013-08-21 | 华为技术有限公司 | 对解码的多声道音频信号或立体声信号进行后处理的装置和方法 |
CN104160442A (zh) * | 2012-02-24 | 2014-11-19 | 杜比国际公司 | 音频处理 |
CN105684078A (zh) * | 2013-09-30 | 2016-06-15 | 奥兰治 | 对音频信号进行重采样以用于低延迟编码/解码 |
Also Published As
Publication number | Publication date |
---|---|
KR102032668B1 (ko) | 2019-10-15 |
BR112018012154A2 (pt) | 2018-11-27 |
EP3391369A1 (en) | 2018-10-24 |
JP2020042294A (ja) | 2020-03-19 |
JP6622410B2 (ja) | 2019-12-18 |
JP6710805B2 (ja) | 2020-06-17 |
US20170178635A1 (en) | 2017-06-22 |
TWI696172B (zh) | 2020-06-11 |
EP3391369B1 (en) | 2020-04-01 |
WO2017106041A1 (en) | 2017-06-22 |
HUE050695T2 (hu) | 2020-12-28 |
TW201729179A (zh) | 2017-08-16 |
CN108431890A (zh) | 2018-08-21 |
US10115403B2 (en) | 2018-10-30 |
ES2803774T3 (es) | 2021-01-29 |
JP2019502949A (ja) | 2019-01-31 |
AU2016370363B2 (en) | 2019-11-14 |
KR20180094905A (ko) | 2018-08-24 |
AU2016370363A1 (en) | 2018-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11094330B2 (en) | Encoding of multiple audio signals | |
CN108431890B (zh) | 多音频信号的编码 | |
US10714101B2 (en) | Target sample generation | |
TWI688243B (zh) | 時間性偏移估計 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |