CN108701464B - 多个音频信号的编码 - Google Patents
多个音频信号的编码 Download PDFInfo
- Publication number
- CN108701464B CN108701464B CN201780010398.9A CN201780010398A CN108701464B CN 108701464 B CN108701464 B CN 108701464B CN 201780010398 A CN201780010398 A CN 201780010398A CN 108701464 B CN108701464 B CN 108701464B
- Authority
- CN
- China
- Prior art keywords
- channel
- domain
- frequency
- band
- adjusted target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 213
- 238000000034 method Methods 0.000 claims description 61
- 230000005540 biological transmission Effects 0.000 claims description 12
- 230000000977 initiatory effect Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 2
- 230000000875 corresponding effect Effects 0.000 description 34
- 230000004044 response Effects 0.000 description 28
- 238000012952 Resampling Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 15
- 230000002123 temporal effect Effects 0.000 description 15
- 230000003111 delayed effect Effects 0.000 description 13
- 238000005070 sampling Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 230000008859 change Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 8
- 230000009977 dual effect Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000001914 filtration Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000009499 grossing Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 238000007670 refining Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 235000008694 Humulus lupulus Nutrition 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明提供一种用于对音频信号进行编码的装置,所述装置包含编码器和发射器。所述编码器经配置以确定指示参考信道与目标信道之间的时间失配量的失配值。所述编码器也经配置以至少基于所述失配值和译码模式确定是否对所述目标信道执行第一时间移位操作以产生经调整目标信道。所述编码器经进一步配置以对所述参考信道执行第一变换操作以产生频域参考信道并对所述经调整目标信道执行第二变换操作以产生频域经调整目标信道。所述编码器也经配置以基于所述频域参考信道和所述频域经调整目标信道估计一或多个立体声提示。所述发射器经配置以发射所述一或多个立体声提示到接收器。
Description
优先权要求
本申请要求来自共同拥有的题为“多个音频信号的编码(ENCODING OF MULTIPLEAUDIO SIGNALS)”、2016年2月12日提交的美国临时专利申请第62/294,946号和题为“多个音频信号的编码(ENCODING OF MULTIPLE AUDIO SIGNALS)”、2017年2月2日提交的美国非临时专利申请第15/422,988号的优先权的权益,前述申请中的每一个的内容明确地被以引用的方式全部并入本文中。
技术领域
本发明大体上涉及多个音频信号的编码。
背景技术
技术的进步已带来更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含无线电话(例如,移动和智能型电话)、平板计算机和膝上型计算机,所述便携式个人计算装置为小的轻质的且容易由用户携带。这些装置可通过无线网络传达语音和数据封包。另外,许多此类装置并入额外功能性,例如数码相机、数码相机、数字记录器和音频文件播放器。并且,此类装置可处理可执行指令,所述指令包含可用以存取因特网的软件应用程序,例如网页浏览器应用程序。因而,这些装置可包含显著计算能力。
计算装置可包含接收音频信号的多个麦克风。一般来说,与多个麦克风的第二麦克风相比,声源更接近于第一麦克风。因此,由于麦克风距声源的相应距离,从第二麦克风接收的第二音频信号可相对于从第一麦克风接收的音频信号延迟。在其它实施方案中,第一音频信号可相对于第二音频信号延迟。在立体声编码中,来自麦克风的音频信号可经编码以产生中间信道信号和一或多个旁信道信号。中间信道信号可对应于第一音频信号和第二音频信号的总和。旁信道信号可对应于第一音频信号与第二音频信号之间的差值。由于接收第二音频信号相对于接收第一音频信号的延迟,第一音频信号可不与第二音频信号对准。第一音频信号相对于第二音频信号的未对准可增加两种音频信号之间的差值。由于差值增加,因此较高数目个位可用以编码旁信道信号。在一些实施方案中,第一音频信号和第二音频信号可包含信号的低频带和高频带部分。
发明内容
在特定实施方案中,装置包含编码器和发射器。编码器经配置以确定指示参考信道与目标信道之间的时间失配量的失配值。编码器也经配置以至少基于所述失配值和译码模式确定是否对目标信道执行第一时间移位操作以产生经调整目标信道。编码器经进一步配置以对参考信道执行第一变换操作以产生频域参考信道并对经调整目标信道执行第二变换操作以产生频域经调整目标信道。编码器经进一步配置以基于第一时间移位操作确定是否对变换域中的频域经调整目标信道执行第二时间移位(例如,无关联)操作以产生经修改频域经调整目标信道。编码器也经配置以基于频域参考信道和经修改频域经调整目标信道估计一或多个立体声提示。发射器经配置以发射一或多个立体声提示到接收器。应注意,根据一些实施方案,如本文中所使用的“频域信道”可包含子频带域、FFT变换域或经修改离散余弦变换(MDCT)域。在本发明中,用于目标信道的不同变化形式的术语(即,“经调整目标信道”、“频域经调整目标信道”、“经修改频域经调整目标信道”)是出于明晰的目的。在一些实施例中,频域经调整目标信道和经修改频域经调整目标信道可非常相似。应注意,这些术语不应理解为限制性或信号是以特定序列产生。
在另一特定实施方案中,一种通信的方法包含在第一装置处确定指示参考信道与目标信道之间的时间失配量的失配值。方法还包含至少基于失配值和译码模式确定是否对目标信道执行第一时间移位操作以产生经调整目标信道。方法进一步包含对参考信道执行第一变换操作以产生频域参考信道和对经调整目标信道执行第二变换操作以产生频域经调整目标信道。方法进一步包含基于第一时间移位操作确定是否对变换域中的频域经调整目标信道执行第二时间移位操作以产生经修改频域经调整目标信道。方法还包含基于频域参考信道和经修改频域经调整目标信道估计一或多个立体声提示。方法进一步包含发送一或多个立体声提示到第二装置。
在另一特定实施方案中,计算机可读存储装置存储指令,所述指令在由处理器执行时使得处理器执行包含以下的操作:在第一装置处确定指示参考信道与目标信道之间的时间失配量的失配值。操作还包含至少基于失配值和译码模式确定是否对目标信道执行第一时间移位操作以产生经调整目标信道。操作进一步包含对参考信道执行第一变换操作以产生频域参考信道和对经调整目标信道执行第二变换操作以产生频域经调整目标信道。操作还包含基于第一时间移位操作确定是否对变换域中的频域经调整目标信道执行第二时间移位操作以产生经修改频域经调整目标信道。操作还包含基于频域参考信道和经修改频域经调整目标信道估计一或多个立体声提示。操作进一步包含起始发射一或多个立体声提示到第二装置。
在另一特定实施方案中,一种设备包含用于确定指示参考信道与目标信道之间的时间失配量的失配值的装置。设备还包含用于至少基于失配值和译码模式确定是否对目标信道执行第一时间移位操作以产生经调整目标信道的装置。设备进一步包含用于对参考信道执行第一变换操作以产生频域参考信道的装置和用于对经调整目标信道执行第二变换操作以产生频域经调整目标信道的装置。设备还包含用于基于第一时间移位操作确定是否对变换域中的频域经调整目标信道执行第二时间移位操作以产生经修改频域经调整目标信道的装置。设备还包含用于基于频域参考信道和经修改频域经调整目标信道估计一或多个立体声提示的装置。设备进一步包含用于发送一或多个立体声提示到接收器的装置。
本发明的其它实施方案、优势和特征将在审阅整个申请案之后变得显而易见,所述整个申请案包含以下部分:图式简单说明、实施方式和权利要求书。
附图说明
图1为包含可操作以编码多个音频信号的编码器的系统的特定说明性实例的框图;
图2为说明图1的编码器的图;
图3为说明图1的编码器的频域立体声译码器的第一实施方案的图;
图4为说明图1的编码器的频域立体声译码器的第二实施方案的图;
图5为说明图1的编码器的频域立体声译码器的第三实施方案的图;
图6为说明图1的编码器的频域立体声译码器的第四实施方案的图;
图7为说明图1的编码器的频域立体声译码器的第五实施方案的图;
图8为说明图1的编码器的信号预处理器的图;
图9为说明图1的编码器的移位估计器的图;
图10为说明编码多个音频信号的特定方法的流程图;
图11为说明可操作以解码音频信号的解码器的图;
图12为可操作以编码多个音频信号的装置的特定说明性实例的框图;且
图13为可操作以编码多个音频信号的基站的框图。
具体实施方式
揭示可操作以编码多个音频信号的系统和装置。装置可包含经配置以编码多个音频信号的编码器。可使用多个记录装置(例如,多个麦克风)同时及时地捕获多个音频信号。在一些实例中,可通过多工若干同时或非同时记录的音频信道合成地(例如,人工)产生多个音频信号(或多信道音频)。如说明性实例,音频信道的并行记录或多工可产生2信道配置(即,立体声:左和右)、5.1信道配置(左、右、中央、左环绕、右环绕和低频重音(LFE)信道)、7.1信道配置、7.1+4信道配置、22.2信道配置或N信道配置。
电话会议室(或远程呈现室)中的音频捕获装置可包含获取空间音频的多个麦克风。空间音频可包含经编码并经发射的话音以及背景音频。视如何布置麦克风以及来源(例如,讲话者)相对于麦克风所处的位置和房间尺寸,来自给定来源(例如,讲话者)的话音/音频可于不同时间到达多个麦克风处。举例来说,相比于与装置相关联的第二麦克风,声源(例如,讲话者)可更接近与装置相关联的第一麦克风。由此,与第二麦克风相比,从声源发出的声音可更早到达第一麦克风。装置可经由第一麦克风接收第一音频信号,且可经由第二麦克风接收第二音频信号。
中侧(MS)译码和参数立体声(PS)译码为相较于双单信道译码技术可提供经改善的效率的立体声译码技术。在双单信道译码中,左(L)信道(或信号)和右(R)信道(或信号)经独立地译码,而不利用信道间相关。在译码之前,通过将左信道和右信道变换为总信道和差信道(例如,旁信道),MS译码减少相关L/R信道对之间的冗余。总和信号和差信号经波形译码或基于MS译码中的模型而译码。总和信号比旁信号耗费相对更多的位。PS译码通过将L/R信号变换成总和信号和一组旁参数而减少每一子频带或频带中的冗余。旁参数可指示信道间强度差(IID)、信道间相位差(IPD)、信道间时差(ITD)、旁或残余预测增益等。总和信号经波形译码且连同旁参数发射。在混合系统中,旁信道可在较低频带(例如,小于2千赫兹(kHz))中经波形译码和在较高频带(例如,大于或等于2kHz)中经PS译码,其中信道间相位保持在感知上不太重要。在一些实施方案中,PS译码也可在波形译码之前用于较低频带中以减少信道间冗余。
可在频域或子频带域中完成MS译码和PS译码。在一些实例中,左信道和右信道可不相关。举例来说,左信道和右信道可包含不相关的合成信号。当左信道和右信道不相关时,MS译码、PS译码或两者的译码效率可接近于双单信道译码的译码效率。
取决于记录配置,可在左信道与右信道之间存在时间失配以及其它空间效果(例如回声和室内回响)。如果不补偿信道之间的时间和相位失配,那么总信道和差信道可含有减少与MS或PS技术相关联的译码增益的可比能量。译码增益的减少可基于时间(或相位)移位的量。总和信号和差信号的可比能量可限制信道经时间上移位但高度相关的某些帧中的MS译码的使用。在立体声译码中,可基于下列式产生中信道(例如,总信道)和旁信道(例如,差信道):
M=(L+R)/2,S=(L-R)/2, 式1
其中M对应于中信道,S对应于旁信道,L对应于左信道,且R对应于右信道。
在一些情况中,可基于下列式产生中信道和旁信道:
M=c(L+R),S=c(L-R), 式2
其中c对应于复合值,其为频率相依的。基于式1或式2产生的中信道和旁信道可被称为执行“降混”算法。基于式1或式2从中信道和旁信道来产生左信道和右信道的反向处理可称为执行“升混”算法。
在一些情况中,中信道可基于其它式,例如:
M=(L+gDR)/2,或 式3
M=g1L+g2R 式4
其中g1+g2=1.0,且其中gD为增益参数。在其它实例中,降混可在频带中执行,其中mid(b)=c1L(b)+c2R(b),其中c1和c2为复数,其中side(b)=c3L(b)-c4R(b),且其中c3和c4为复数。
用以对于特定帧在MS译码或双单信道译码之间选择的特用方法可包含产生中信道和旁信道,计算中信道和旁信道的能量,和基于所述能量确定是否执行MS译码。举例来说,可响应于旁信道与中信道的能量比小于阈值的确定执行MS译码。举例来说,如果右信道经移位至少第一时间(例如,约0.001秒或在48kHz下的48个样本),那么对于有声话音帧,中信道(对应于左信号与右信号的总和)的第一能量可与旁信道(对应于左信号与右信号之间的差)的第二能量相当。当第一能量与第二能量相当时,较高数目个位可用于编码旁信道,由此相对于双单信道译码减少MS译码的译码效率。当第一能量与第二能量相当时(例如,当第一能量与第二能量的比大于或等于阈值时),可因此使用双单信道译码。在替代方法中,可针对特定帧基于阈值与左信道和右信道的正规化交叉相关值的比较来在MS译码与双单信道译码之间作出决定。
在一些实例中,编码器可确定指示第一音频信号与第二音频信号之间的时间失配量的失配值。如本文所使用,“时间移位值”、“移位值”和“失配值”可被互换地使用。举例来说,编码器可确定指示第一音频信号相对于第二音频信号的移位(例如,时间失配)的时间移位值。移位值可对应于在第一麦克风处第一音频信号的接收与在第二麦克风处第二音频信号的接收之间的时间延迟的量。另外,编码器可在逐帧的基础上(例如,基于每一20毫秒(ms)话音/音频帧)确定移位值。举例来说,移位值可对应于第二音频信号的第二帧相对于第一音频信号的第一帧经延迟的一时间量。替代地,移位值可对应于第一音频信号的第一帧相对于第二音频信号的第二帧经延迟的时间量。
当声源距第一麦克风的距离比距第二麦克风的距离更近时,第二音频信号的帧可相对于第一音频信号的帧经延迟。在此情况下,第一音频信号可被称为“参考音频信号”或“参考信道”且经延迟第二音频信号可被称为“目标音频信号”或“目标信道”。替代地,当与第一麦克风相比,声源更接近第二麦克风时,第一音频信号的帧可相对于第二音频信号的帧经延迟。在此情况下,第二音频信号可被称为参考音频信号或参考信道,且经延迟第一音频信号可被称为目标音频信号或目标信道。
视声源(例如,讲话者)位于会议室或远程呈现室内的位置和声源(例如,讲话者)位置如何相对于麦克风改变,参考信道和目标信道可在帧间变化;类似地,时间失配值也可在帧间变化。然而,在一些实施方案中,移位值可始终为正,以指示“目标”信道相对于“参考”信道的延迟的量。另外,移位值可对应于“无关联移位”值,经延迟目标信道通过所述“无关联移位”值在时间上“经拉回”,以使得目标信道与“参考”信道在编码器处对准(例如,最大限度地对准)。可对参考信道和无关联经移位目标信道执行确定中信道和旁信道的降混算法。
编码器可基于参考音频信道和应用于目标音频信道的多个移位值而确定移位值。举例来说,可在第一时间(m1)处接收参考音频信道的第一帧X。可在对应于第一移位值(例如,shift1=n1-m1)的第二时间(n1)处接收目标音频信道的第一特定帧Y。另外,可在第三时间(m2)处接收参考音频信道的第二帧。可在对应于第二移位值(例如,shift2=n2-m2)的第四时间(n2)处接收目标音频信道的第二特定帧。
装置可以第一采样速率(例如,32kHz采样速率(即,640个样本每帧))执行成框或缓冲算法以产生帧(例如,20ms样本)。响应于对第一音频信号的第一帧和第二音频信号的第二帧同时到达装置的确定,编码器可将移位值(例如,shift1)估计为等于零样本。可在时间上对准左信道(例如,对应于第一音频信号)和右信道(例如,对应于第二音频信号)。在一些情况下,即使当对准时,左信道和右信道可由于各种原因(例如,麦克风校准)在能量方面存在不同。
在一些实例中,左信道和右信道可由于各种原因(例如,与麦克风中的另一者相比,声源(例如,讲话者)可更接近麦克风中的一者,且两个麦克风相隔距离可大于阈值(例如,1到20厘米)距离)在时间上不对准。相对于麦克风的声源位置可在第一信道和第二信道中引入不同的延迟。此外,可在第一信道与第二信道之间存在增益差、能量差或电平差。
在一些实例中,在存在超过两个信道的情况下,参考信道最初基于信道的电平或能量而被选择,且随后基于不同信道对之间的时间失配值(例如,t1(ref,ch2)、t2(ref,ch3)、t3(ref,ch4)、……t3(ref,chN))而被改进,其中ch1为最初参考信道且t1(.)、t2(.)等为估计失配值的函数。如果所有时间失配值为正,那么ch1被视为参考信道。如果失配值中的任一个为负值,那么参考信道经重配置成与产生负值的失配值相关联的信道且上述过程继续直到实现参考信道的最佳选择(即,基于最大限度地去相关最大数目的旁信道)为止。滞后可用于克服参考信道选择中的任何急剧变化。
在一些实例中,当多个讲话者交替讲话时(例如,在不重叠的情况下),音频信号从多个声源(例如,讲话者)到达麦克风的时间可变化。在此情况下,编码器可基于讲话者来动态调整时间移位值,以识别参考信道。在一些其它实例中,多个讲话者可同时讲话,取决于哪个讲话者最大声、距麦克风最近等,此可产生变化的时间移位值。在此情况下,参考和目标信道的识别可基于当前帧中的变化的时间移位值、先前帧中的经估计时间失配值,和第一和第二音频信号的能量(或时间演变)。
在一些实例中,当两个信号可能展示较少(例如,无)相关时,可合成或人工地产生第一音频信号和第二音频信号。应理解,本文所描述的实例为说明性的,且在类似或不同情境中确定第一音频信号与第二音频信号之间的关系方面可为具指导性的。
编码器可基于第一音频信号的第一帧与第二音频信号的多个帧之间的比较来产生比较值(例如,差值或交叉相关值)。多个帧的每一帧可对应于特定移位值。编码器可基于比较值产生第一经估计移位值。举例来说,第一经估计移位值可对应于指示第一音频信号的第一帧与第二音频信号的相应第一帧之间的较高时间类似性(或较低差)的比较值。
编码器可通过在多个阶段中改进一系列经估计移位值而确定最终移位值。举例来说,基于由第一音频信号和第二音频信号的经立体声预处理且经再采样的版本产生的比较值,编码器可首先估计“试验性”移位值。编码器可产生与接近经估计“试验性”移位值的移位值相关联的内插比较值。编码器可基于内插比较值确定第二经估计“内插”移位值。举例来说,第二经估计“内插”移位值可对应于指示相较于剩余内插比较值和第一经估计“试验性”移位值具有较高时间类似性(或较小差)的特定内插比较值。如果当前帧(例如,第一音频信号的第一帧)的第二经估计的“内插”移位值不同于前一帧(例如,先于第一帧的第一音频信号的帧)的最终移位值,那么当前帧的“内插”移位值经进一步“修正”,以改善第一音频信号与经移位的第二音频信号之间的时间类似性。特定来说,通过在当前帧的第二经估计的“内插”移位值和前一帧的最终经估计的移位值周围搜索,第三经估计的“修正”移位值可对应于时间类似性的较精确测量值。进一步调节第三经估计“修正”移位值以通过限制帧之间的移位值中的任何伪改变来估计最终移位值且进一步控制第三经估计“修正”移位值以不在如本文所描述的两个相继(或连续)帧中将负移位值切换成正移位值(或反之亦然)。
在一些实例中,编码器可避免在连续帧中或相邻帧中的正移位值与负移位值之间的切换(反之亦然)。举例来说,基于第一帧的经估计的“内插”或“修正”移位值和先于第一帧的特定帧中的相应经估计的“内插”或“修正”或最终移位值,编码器可将最终移位值设定为指示无时间移位的特定值(例如,0)。举例来说,为响应当前帧的经估计的“试验性”或“内插”或“修正”移位值中的一个为正且前一帧(例如,先于第一帧的帧)的经估计的“试验性”或“内插”或“修正”或“最终”估计移位值中的另一者为负的确定,编码器可设定当前帧(例如,第一帧)的最终移位值以指示无时间移位,即shift1=0。或者,为响应当前帧的经估计的“试验性”或“内插”或“修正”移位值中的一个为负且前一帧(例如,先于第一帧的帧)的经估计的“试验性”或“内插”或“修正”或“最终”估计移位值中的另一者为正的确定,编码器也可设定当前帧(例如,第一帧)的最终移位值以指示无时间移位,即shift1=0。
编码器可基于移位值来选择第一音频信号或第二音频信号的帧作为“参考”或“目标”。举例来说,为响应最终移位值为正的确定,编码器可产生具有指示第一音频信号为“参考”信道且第二音频信号为“目标”信道的第一值(例如,0)的参考信道或信号指示符。或者,为响应最终移位值为负的确定,编码器可产生具有指示第二音频信号为“参考”信道且第一音频信号为“目标”信道的第二值(例如,1)的参考信道或信号指示符。
编码器可估计与参考信道和无关联经移位目标信道相关联的相对增益(例如,相对增益参数)。举例来说,为响应最终移位值为正的确定,编码器可估计增益值以相对于通过无关联移位值(例如,最终移位值的绝对值)偏移的第二音频信号正规化或均衡第一音频信号的能量或功率电平。或者,为响应最终移位值为负的确定,编码器可估计增益值以相对于第二音频信号正规化或均衡第一音频信号的功率或振幅电平。在一些实例中,编码器可估计增益值以相对于无关联经移位“目标”信道正规化或均衡“参考”信道的振幅或功率电平。在其它实例中,编码器可相对于目标信道(例如,未移位的目标信道)基于参考信道来估计增益值(例如,相对增益值)。
编码器可基于参考信道、目标信道、无关联移位值和相对增益参数产生至少一个经编码信号(例如,中信道、旁信道或两者)。在其它实施方案中,编码器可基于参考信道和时间失配经调整目标信道产生至少一个经编码信号(例如,中信道、旁信道,或两者)。旁信道可对应于第一音频信号的第一帧的第一样本与第二音频信号的所选择帧的所选择样本之间的差。编码器可基于最终移位值选择所选帧。由于第一样本与所选择样本之间的减小的差,相比于对应于第二音频信号的帧(与第一帧同时由装置接收)的第二音频信号的其它样本,更少的位可用于编码旁信道信号。装置的发射器可发射至少一个经编码信号、无关联移位值、相对增益参数、参考信道或信号指示符或其组合。
编码器可基于参考信道、目标信道、无关联移位值、相对增益参数、第一音频信号的特定帧的低频带参数、特定帧的高频带参数或其组合产生至少一个经编码信号(例如,中信道、旁信道,或两者)。特定帧可先于第一帧。来自一或多个前面帧的某些低频带参数、高频带参数或其组合可用于编码第一帧的中信道、旁信道或两者。基于低频带参数、高频带参数或其组合编码中信道、旁信道或两者可包含估计无关联移位值和信道间相对增益参数。低频带参数、高频带参数或其组合可包含音调参数、语音参数、译码器类型参数、低频带能量参数、高频带能量参数、倾角参数、音调增益参数、FCB增益参数、译码模式参数、语音活动参数、噪声估计参数、信杂比参数、共振峰成形参数、话音/音乐决定参数、无关联移位、信道间增益参数或其组合。装置的发射器可发射至少一个经编码信号、无关联移位值、相对增益参数、参考信道(或信号)指示符或其组合。
在本发明中,例如“确定”、“计算”、“移位”、“调整”等的术语可用于描述如何执行一或多个操作。应注意这些术语不应理解为限制性且其它技术可用以执行类似操作。
参看图1,揭示系统的特定说明性实例且一般将其指示为100。系统100包含经由网络120以通信方式耦合到第二装置106的第一装置104。网络120可包含一或多个无线网络、一或多个有线网络或其组合。
第一装置104可包含编码器114、发射器110、一或多个输入接口112或其组合。输入接口112的第一输入接口可耦合到第一麦克风146。输入接口112的第二输入接口可耦合到第二麦克风148。编码器114可包含时间均衡器108和基于时域(TD)、频域(FD)和经修改离散余弦变换(MDCT)的信号可调式“灵活”立体声译码器109。信号可调式灵活立体声译码器109可经配置以降混并编码多个音频信号,如本文所描述。第一装置104还可包含经配置以存储分析数据191的存储器153。第二装置106可包含解码器118。解码器118可包含经配置以升混和再现多个信道的时间平衡器124。第二装置106可经耦合到第一扬声器142、第二扬声器144或两者。
在操作期间,第一装置104可经由第一输入接口从第一麦克风146接收第一音频信号130,并可经由第二输入接口从第二麦克风148接收第二音频信号132。第一音频信号130可对应于右信道信号或左信道信号中的一个。第二音频信号132可对应于右信道信号或左信道信号中的另一者。与第二麦克风148相比,声源152(例如,用户、扬声器、环境噪声、乐器等)可更接近第一麦克风146。因此,可在一或多个输入接口112处经由第一麦克风146以比经由通过第二麦克风148更早的时间接收来自声源152的音频信号。可将通过多个麦克风获取的多信道信号的此固有延迟引入第一音频信号130与第二音频信号132之间的时间移位。
时间均衡器108可确定指示参考信道与目标信道之间的时间失配量的失配值(例如,“最终移位值”116或“无关联移位值”)。根据一个实施方案,第一音频信号130为参考信道且第二音频信号132为目标信道。根据另一实施方案,第二音频信号132为参考信道且第一音频信号130为目标信道。参考信道和目标信道可在逐帧的基础上切换。作为非限制性实例,如果第一音频信号130的帧在第二音频信号132的相应帧到达第二麦克风148之前到达第一麦克风146,那么第一音频信号130可为参考信道且第二音频信号132可为目标信道。或者,如果第二音频信号132的帧在第一音频信号130的相应帧到达第一麦克风146之前到达第二麦克风148,那么第二音频信号132可为参考信道且第一音频信号130可为目标信道。目标信道可对应于两个音频信号130、132的滞后音频信道,且参考信道可对应于两个音频信道130、132之前导音频信道。因此,参考信道和目标信道的指定可取决于声源152相对于麦克风146、148的位置。
最终移位值116的第一值(例如,正值)可指示第二音频信号132相对于第一音频信号130经延迟。最终移位值116的第二值(例如,负值)可指示第一音频信号130相对于第二音频信号132经延迟。最终移位值116的第三值(例如,0)可指示第一音频信号130与第二音频信号132之间无延迟。
在一些实施方案中,最终移位值116的第三值(例如,0)可指示第一音频信号130与第二音频信号132之间的延迟已交换正负。举例来说,第一音频信号130的第一特定帧可先于第一帧。第二音频信号132的第一特定帧和第二特定帧可对应于由声源152发出的相同声音。第一音频信号130与第二音频信号132之间的延迟可从第一特定帧相对于第二特定帧延迟切换到第二帧相对于第一帧延迟。或者,第一音频信号130与第二音频信号132之间的延迟可从第二特定帧相对于第一特定帧延迟切换到第一帧相对于第二特定帧延迟。响应于对第一音频信号130与第二音频信号132之间的延迟已切换正负的确定,时间均衡器108可将最终移位值116设定成指示第三值(例如,0)。
时间均衡器108可基于最终移位值116产生参考信道指示符。举例来说,为响应最终移位值116指示第一值(例如,正值)的确定,时间均衡器108产生具有指示第一音频信号130为“参考”信道190的第一值(例如,0)的参考信道指示符。为响应最终移位值116指示第一值(例如,正值)的确定,时间均衡器108可确定第二音频信号132对应于“目标”信道(未图示)。或者,为响应最终移位值116指示第二值(例如,负值)的确定,时间均衡器108可产生具有指示第二音频信号132为“参考”信道190的第二值(例如,1)的参考信道指示符。为响应最终移位值116指示第二值(例如,负值)的确定,时间均衡器108可确定第一音频信号130对应于“目标”信道。响应于对最终移位值116指示第三值(例如,0)的确定,时间均衡器108可产生具有指示第一音频信号130为“参考”信道190的第一值(例如,0)的参考信道指示符。为响应最终失配值116指示第三值(例如,0)的确定,时间均衡器108可确定第二音频信号132对应于“目标”信道。或者,为响应最终移位值116指示第三值(例如,0)的确定,时间均衡器108可产生具有指示第二音频信号132为“参考”信道190的第二值(例如,1)的参考信道指示符。为响应最终移位值116指示第三值(例如,0)的确定,时间均衡器108可确定第一音频信号130对应于“目标”信道。在一些实施方案中,为响应最终移位值116指示第三值(例如,0)的确定,时间均衡器108可保持参考信道指示符不变。举例来说,参考信道指示符可与对应于第一音频信号130的第一特定帧的参考信道指示符相同。时间均衡器108可产生指示最终移位值116的绝对值的无关联移位值。
时间均衡器108可基于目标信道、参考信道190、第一移位值(例如,用于前一帧的移位值)、最终移位值116、参考信道指示符或其组合产生目标信道指示符。目标信道指示符可指示第一音频信号130或第二音频信号132中的哪一者为目标信道。时间均衡器108可至少基于目标信道指示符、目标信道、立体声降混或译码模式或其组合确定是否将目标信道在时间上移位以产生经调整目标信道192。举例来说,时间均衡器108可基于从第一移位值到最终移位值116的时间移位演变调整目标信道(例如,第一音频信号130或第二音频信号132)。时间均衡器108可内插目标信道,以使得对应于帧边界的目标信道的样本的子集通过平滑且缓慢移位丢弃以产生经调整目标信道192。
因此,时间均衡器108可将目标信道时间移位以产生经调整目标信道192,以使得参考信道190和经调整目标信道192大体上经同步。时间均衡器108可产生时域降混参数168。时域降混参数可指示目标信道与参考信道190之间的移位值。在其它实施方案中,时域降混参数可包含类似于降混增益等的额外参数。举例来说,时域降混参数168可包含第一移位值262、参考信道指示符264,或两者,如参考图2进一步描述。关于图2更详细描述时间均衡器108。时间均衡器108可提供参考信道190和经调整目标信道192到时域或频域或混合独立信道(例如,双单信道)立体声译码器109,如所示。
信号可调式“灵活”立体声译码器109可将一或多个时域信号(例如,参考信道190和经调整目标信道192)变换成频域信号。信号可调式“灵活”立体声译码器109经进一步配置以基于第一时间移位操作确定是否对变换域中的频域经调整目标信道执行第二时间移位(例如,无关联)操作以产生经修改频域经调整目标信道。时域信号190、192和频域信号可用于估计立体声提示162。立体声提示162可包含使得能够再现与左信道和右信道相关联的空间性质的参数。根据一些实施方案,立体声提示162可包含例如以下各者的参数:信道间强度差(IID)参数(例如,信道间电平差(ILD))、信道间时差(ITD)参数、信道间相位差(IPD)参数、时间失配或无关联移位参数、频谱倾角参数、信道间语音参数、信道间音调参数、信道间增益参数等。立体声提示162可在信号可调式“灵活”立体声译码器109处在其它信号产生期间使用。立体声提示162也可作为编码信号的部分而发射。关于图3到7更详细地描述立体声提示162的估计和使用。
信号可调式“灵活”立体声译码器109也可至少部分地基于频域信号产生旁频带位流164和中频带位流166。为达成说明的目的,除非另外指出,否则假定参考信道190为左信道信号(l或L)且经调整目标信道192为右信道信号(r或R)。参考信道190的频域表示可标示为Lfr(b)且经调整目标信道192的频域表示可标示为Rfr(b),其中b表示频域表示的频带。根据一个实施方案,旁频带信道Sfr(b)可从参考信道190和经调整目标信道192的频域表示在频域中产生。举例来说,旁频带信道Sfr(b)可表达为(Lfr(b)-Rfr(b))/2。旁频带信道Sfr(b)可经提供到旁频带编码器以产生旁频带位流164。根据一个实施方案,中频带信道m(t)可在时域中产生并变换成频域。举例来说,中频带信道m(t)可表达为(l(t)+r(t))/2。关于图3、4和7更详细地描述在频域中产生中频带信道之前在时域中产生中频带信道。根据另一实施方案,中频带信道Mfr(b)可由频域信号产生(例如,略过时域中频带信道产生)。关于图5到6更详细地描述从频域信号产生中频带信道Mfr(b)。可将时域/频域中频带信道提供到中频带编码器以产生中频带位流166。
可使用多个技术编码旁频带信道Sfr(b)和中频带信道m(t)或Mfr(b)。根据一个实施方案,时域中频带信道m(t)可使用时域技术(例如代数码激励线性预测(ACELP))编码,从而带宽扩展以用于较高频带译码。在旁频带译码之前,中频带信道m(t)(经译码或未经译码)可转换为频域(例如,变换域)以产生中频带信道Mfr(b)。
旁频带译码的一个实施方案包含使用频率中频带信道Mfr(b)和对应于频带(b)的立体声提示162(例如,ILD)中的信息从频域中频带信道Mfr(b)预测旁频带SPRED(b)。举例来说,预测旁频带SPRED(b)可表达为Mfr(b)*(ILD(b)-1)/(ILD(b)+1)。可依据旁频带信道Sfr和预测旁频带SPRED计算错误信号e。举例来说,错误信号e可表达为Sfr-SPRED或Sfr。可使用时域或变换域译码技术译码错误信号e以产生经译码错误信号eCODED。对于某些频带,错误信号e可表达为来自前一帧的那些频带中的中频带信道M_PASTfr的按比例调整版本。举例来说,经译码错误信号eCODED可表达为gPRED*M_PASTfr,其中gPRED可经估计以使得e-gPRED*M_PASTfr的能量大体上减少(例如,减到最小)。使用的M_PAST帧可基于用于分析/合成的窗形状且可受限制以仅使用偶数窗跃点。
发射器110可经由网络120发射立体声提示162、旁频带位流164、中频带位流166、时域降混参数168或其组合到第二装置106。替代地或另外,发射器110可在网络120的装置或本地装置处存储立体声提示162、旁频带位流164、中频带位流166、时域降混参数168或其组合以供稍后进一步处理或解码。由于无关联移位(例如,最终移位值116)可在编码过程期间被确定,因此除每一频带中的无关联移位以外发射IPD(例如,作为立体声提示162的部分)可为冗余的。因此,在一些实施方案中,可针对相同帧但在相互独占式频带中估计IPD和无关联移位。在其它实施方案中,除用于每频带较精细调整的移位以外还可估计较低分辨率IPD。替代地,可不针对其中确定无关联移位的帧确定IPD。在一些其它实施例中,在无关联移位满足阈值的情况下,IPD可经确定但不被使用或复位为零。
解码器118可基于立体声提示162、旁频带位流164、中频带位流166和时域降混参数168执行解码操作。举例来说,频域立体声解码器125和时间平衡器124可执行升混以产生第一输出信号126(例如,对应于第一音频信号130)、第二输出信号128(例如,对应于第二音频信号132),或两者。第二装置106可经由第一扬声器142输出第一输出信号126。第二装置106可经由第二扬声器144输出第二输出信号128。在替代性实例中,第一输出信号126和第二输出信号128可作为立体声信号对发射到单个输出扬声器。
系统100可因此使得信号可调式“灵活”立体声译码器109能够将参考信道190和经调整目标信道192变换成频域以产生立体声提示162、旁频带位流164和中频带位流166。时间均衡器108的将第一音频信号130在时间上移位以与第二音频信号132对准的时间移位技术可结合频域信号处理来实施。举例来说,时间均衡器108在编码器114处估计每一帧的移位(例如,无关联移位值),根据无关联移位值移位(例如,调整)目标信道,并使用移位的经调整信道用于变换域中的立体声提示估计。
参看图2,展示第一装置104的编码器114的说明性实例。编码器114包含时间均衡器108和信号可调式“灵活”立体声译码器109。
时间均衡器108包含经由移位估计器204耦合到帧间移位变化分析器206、耦合到参考信道指定器208或两者的信号预处理器202。在特定实施方案中,信号预处理器202可对应于重采样器。帧间移位变化分析器206可经由目标信道调整器210耦合到信号可调式“灵活”立体声译码器109。参考信道指定器208可耦合到帧间移位变化分析器206。基于时间失配值,TD立体声、频域立体声或MDCT立体声降混用于信号可调式“灵活”立体声译码器109。
在操作期间,信号预处理器202可接收音频信号228。举例来说,信号预处理器202可从输入接口112接收音频信号228。音频信号228可包含第一音频信号130、第二音频信号132或两者。信号预处理器202可产生第一经重采样的信道230、第二经重采样的信道232或两者。关于图8更详细地描述信号预处理器202的操作。信号预处理器202可将第一经重采样的信道230、第二经重采样的信道232或两者提供到移位估计器204。
移位估计器204可基于第一经重采样的信道230、第二经重采样的信道232或两者产生最终移位值116(T)、无关联移位值或两者。关于图9更详细地描述移位估计器204的操作。移位估计器204可向帧间移位变化分析器206、参考信道指定器208或两者提供最终移位值116。
参考信道指定器208可产生参考信道指示符264。参考信道指示符264可指示音频信号130、132中的哪一者为参考信道190,且信号130、132中的哪一者为目标信道242。参考信道指定器208可向帧间移位变化分析器206提供参考信道指示符264。
帧间移位变化分析器206可基于目标信道242、参考信道190、第一移位值262(Tprev)、最终移位值116(T)、参考信道指示符264或其组合产生目标信道指示符266。帧间移位变化分析器206可向目标信道调整器210提供目标信道指示符266。
目标信道调整器210可基于目标信道指示符266、目标信道242或两者产生经调整目标信道192。基于从第一移位值262(Tprev)到最终移位值116(T)的时间移位演变,目标信道调整器210可调整目标信道242。举例来说,第一移位值262可包含对应于前一帧的最终移位值。为响应最终移位值从具有小于对应于前一帧的最终移位值116(例如,T=4)的对应于前一帧的第一值(例如,Tprev=2)的第一移位值262变化的确定,目标信道调整器210可内插目标信道242,以使得对应于帧边界的目标信道242的样本的子集通过平滑且缓慢移位丢弃,以产生经调整的目标信道192。或者,为响应最终移位值从大于最终移位值116(例如,T=2)的第一移位值262(例如,Tprev=4)变化的确定,目标信道调整器210可内插目标信道242,以使得对应于帧边界的目标信道242的样本的子集通过平滑且缓慢移位重复,以产生经调整的目标信道192。基于混合正弦内插器(hybrid Sinc-interpolator)和拉格朗日内插器(Lagrange-interpolator),可进行平滑和缓慢移位。为响应最终移位值并未从第一移位值262改变成最终移位值116(例如,Tprev=T)的确定,目标信道调整器210可在时间上偏移目标信道242以产生经调整目标信道192。目标信道调整器210可向信号可调式“灵活”立体声译码器109提供经调整目标信道192。
参考信道190也可经提供到信号可调式“灵活”立体声译码器109。信号可调式“灵活”立体声译码器109可基于参考信道190和经调整目标信道192产生立体声提示162、旁频带位流164和中频带位流166,如关于图1所描述和如关于图3到7所进一步描述。
参看图3到7,展示结合如图2中所描述的时域降混操作工作的信号可调式“灵活”立体声译码器109的几个实例详细实施方案109a到109e。在一些实例中,参考信道190可包含左信道信号和经调整目标信道192可包含右信道信号。然而,应理解在其它实例中,参考信道190可包含右信道信号且经调整目标信道192可包含左信道信号。在其它实施方案中,参考信道190可为在逐帧基础上选择的左或右信道中的任一个,且类似地在经调整用于时间失配之后,经调整目标信道192可为左或右信道中的另一者。出于下文描述的目的,我们提供当参考信道190包含左信道信号(L)且经调整目标信道192包含右信道信号(R)时的特定情况的实例。对于其它情况的类似描述可经平常地扩展。也应理解,图3到7中所说明的各个组件(例如,变换、信号产生器、编码器、估计器等)可使用硬件(例如,专用电路)、软件(例如,由处理器执行的指令)或其组合而实施。
在图3中,可对参考信道190执行变换302且可对经调整目标信道192执行变换304。变换302、304可通过产生频域(或子频带域)信号的变换操作而执行。作为非限制性实例,执行变换302、304可包含执行离散傅立叶变换(DFT)操作、快速傅立叶变换(FFT)操作、MDCT操作等。根据一些实施方案,正交镜像滤波器组(QMF)操作(使用滤波器组,例如复杂低延迟滤波器组)可用于将输入信号(例如,参考信道190和经调整目标信道192)分裂成多个子频带。变换302可应用于参考信道190以产生频域参考信道(Lfr(b))330,且变换304可应用于经调整目标信道192以产生频域经调整目标信道(Rfr(b))332。信号可调式“灵活”立体声译码器109a经进一步配置以基于第一时间移位操作确定是否对变换域中的频域经调整目标信道执行第二时间移位(例如,无关联)操作以产生经修改频域经调整目标信道332。频域参考信道330和(经修改)频域经调整目标信道332可经提供到立体声提示估计器306和到旁频带信道产生器308。
立体声提示估计器306可基于频域参考信道330和频域经调整目标信道332提取(例如,产生)立体声提示162。举例来说,IID(b)可取决于频带(b)中的左信道的能量EL(b)和频带(b)中的右信道的能量ER(b)。举例来说,IID(b)可表达为20*log10(EL(b)/ER(b))。在编码器处估计并发射的IPD可提供在频带(b)中的左信道与右信道之间的频域中的相位差的估计。立体声提示162可包含额外(或替代)参数,例如ICC、ITD等。立体声提示162可经发射到图1的第二装置106,经提供到旁频带信道产生器308,并经提供到旁频带编码器310。
旁频带产生器308可基于频域参考信道330和(经修改)频域经调整目标信道332而产生频域旁频带信道(Sfr(b))334。可在频域仓/频带中估计频域旁频带信道334。在每一频带中,增益参数(g)是不同的且可基于信道间电平差值(例如,基于立体声提示162)。举例来说,频域旁频带信道334可表达为(Lfr(b)-c(b)*Rfr(b))/(1+c(b)),其中c(b)可为ILD(b)或ILD(b)的函数(例如,c(b)=10^(ILD(b)/20))。可将频域旁频带信道334提供到旁频带编码器310。
参考信道190和经调整目标信道192也可提供到中频带信道产生器312。中频带信道产生器312可基于参考信道190和经调整目标信道192产生时域中频带信道(m(t))336。举例来说,时域中频带信道336可表达为(l(t)+r(t))/2,其中l(t)包含参考信道190且r(t)包含经调整目标信道192。变换314可应用于时域中频带信道336以产生频域中频带信道(Mfr(b))338,且可将频域中频带信道338提供到旁频带编码器310。时域中频带信道336也可提供到中频带编码器316。
旁频带编码器310可基于立体声提示162、频域旁频带信道334和频域中频带信道338产生旁频带位流164。中频带编码器316可通过编码时域中频带信道336而产生中频带位流166。在特定实例中,旁频带编码器310和中频带编码器316可包含用以分别产生旁频带位流164和中频带位流166的ACELP编码器。对于较低频带,可使用变换域译码技术编码频域旁频带信道334。对于较高频带,频域旁频带信道334可表达为从先前帧的中频带信道(经量化或未经量化)的预测。
参看图4,展示信号可调式“灵活”立体声译码器109的第二实施方案109b。信号可调式“灵活”立体声译码器109的第二实施方案109b可以大体上类似于信号可调式“灵活”立体声译码器109的第一实施方案109a的方式操作。然而,在第二实施方案109b中,变换404可应用于中频带位流166(例如,时域中频带信道336的经编码版本)以产生频域中频带位流430。旁频带编码器406可基于立体声提示162、频域旁频带信道334和频域中频带位流430产生旁频带位流164。
参看图5,展示信号可调式“灵活”立体声译码器109的第三实施方案109c。信号可调式“灵活”立体声译码器109的第三实施方案109c可以大体上类似于信号可调式“灵活”立体声译码器109的第一实施方案109a的方式操作。然而,在第三实施方案109c中,可将频域参考信道330和频域经调整目标信道332提供到中频带信道产生器502。信号可调式“灵活”立体声译码器109c经进一步配置以基于第一时间移位操作确定是否对变换域中的频域经调整目标信道执行第二时间移位(例如,无关联)操作以产生经修改频域经调整目标信道332。根据一些实施方案,立体声提示162也可提供到中频带信道产生器502。中频带信道产生器502可基于频域参考信道330和频域经调整目标信道332而产生频域中频带信道Mfr(b)530。根据一些实施方案,频域中频带信道Mfr(b)530也可基于立体声提示162而产生。基于频域参考信道330产生中频带信道530、经调整目标信道332和立体声提示162的一些方法如下。
Mfr(b)=(Lfr(b)+Rfr(b))/2
Mfr(b)=c1(b)*Lfr(b)+c2*Rfr(b),其中c1(b)和c2(b)为复值。
在一些实施方案中,复值c1(b)和c2(b)是基于立体声提示162。举例来说,在中侧降混的一个实施方案中,当估计IPD时,c1(b)=(cos(-γ)-i*sin(-γ))/20.5且c2(b)=(cos(IPD(b)-γ)+i*sin(IPD(b)-γ))/20.5,其中i为表示-1的平方根的虚数。
出于有效旁频带信道编码的目的,可将频域中频带信道530提供到中频带编码器504和旁频带编码器506。在此实施方案中,中频带编码器504可在编码之前进一步将中频带信道530变换到任何其它变换/时域。举例来说,中频带信道530(Mfr(b))可经反向变换回到时域,或变换到MDCT域以用于译码。
出于有效旁频带信道编码的目的,可将频域中频带信道530提供到中频带编码器504和旁频带编码器506。在此实施方案中,中频带编码器504可在编码之前进一步将中频带信道530变换到变换域或时域。举例来说,中频带信道530(Mfr(b))可经反向变换回到时域或变换到MDCT域以用于译码。
旁频带编码器506可基于立体声提示162、频域旁频带信道334和频域中频带信道530产生旁频带位流164。中频带编码器504可基于频域中频带信道530而产生中频带位流166。举例来说,中频带编码器504可编码频域中频带信道530以产生中频带位流166。
参看图6,展示信号可调式“灵活”立体声译码器109的第四实施方案109d。信号可调式“灵活”立体声译码器109的第四实施方案109d可以大体上类似于信号可调式“灵活”立体声译码器109的第三实施方案109c的方式操作。然而,在第四实施方案109d中,可将中频带位流166提供到旁频带编码器602。在替代实施方案中,基于中频带位流的经量化中频带信道可经提供到旁频带编码器602。旁频带编码器602可经配置以基于立体声提示162、频域旁频带信道334和中频带位流166产生旁频带位流164。
参看图7,展示信号可调式“灵活”立体声译码器109的第五实施方案109e。信号可调式“灵活”立体声译码器109的第五实施方案109e可以大体上类似于信号可调式“灵活”立体声译码器109的第一实施方案109a的方式操作。然而,在第五实施方案109e中,可将频域中频带信道338提供到中频带编码器702。中频带编码器702可经配置以编码频域中频带信道338以产生中频带位流166。
参看图8,展示信号预处理器202的说明性实例。信号预处理器202可包含耦合到重采样因数估计器830、去加重器804、去加重器834或其组合的多路分用器(DeMUX)802。去加重器804可经由重采样器806耦合到去加重器808。去加重器808可经由重采样器810耦合到倾斜平衡器812。去加重器834可经由重采样器836耦合到去加重器838。去加重器838可经由重采样器840耦合到倾斜平衡器842。
在操作期间,deMUX 802可通过解多工音频信号228来产生第一音频信号130和第二音频信号132。deMUX 802可向重采样因数估计器830提供与第一音频信号130、第二音频信号132或两者相关联的第一采样速率860。deMUX 802可向去加重器804提供第一音频信号130,向去加重器834提供第二音频信号132,或两者。
重采样因数估计器830可基于第一采样速率860、第二采样速率880或两者产生第一因数862(d1)、第二因数882(d2)或两者。重采样因数估计器830可基于第一采样速率860、第二采样速率880或两者确定重采样因数(D)。举例来说,重采样因数(D)可对应于第一采样速率860与第二采样速率880的比(例如,重采样因数(D)=第二采样速率880/第一采样速率860或重采样因数(D)=第一采样速率860/第二采样速率880)。第一因数862(d1)、第二因数882(d2)或两者可为重采样因数(D)的因数。举例来说,重采样因数(D)可对应于第一因数862(d1)与第二因数882(d2)的乘积(例如,重采样因数(D)=第一因数862(d1)*第二因数882(d2))。在一些实施方案中,如本文所描述,第一因数862(d1)可具有第一值(例如,1),第二因数882(d2)可具有第二值(例如,1),或两者,此举略过重采样阶段。
去加重器804可通过基于IIR滤波器(例如,一阶IIR滤波器)滤波第一音频信号130产生去加重信号864。去加重器804可将经去加重的信号864提供到重采样器806。重采样器806可通过基于第一因数862(d1)重采样经去加重的信号864产生经重采样的信道866。重采样器806可向去加重器808提供经重采样的信道866。去加重器808可通过基于IIR滤波器滤波经重采样的信道866产生去加重信号868。去加重器808可将经去加重的信号868提供到重采样器810。重采样器810可基于第二因数882(d2)通过重采样经去加重的信号868产生经重采样的信道870。
在一些实施方案中,第一因数862(d1)可具有第一值(例如,1),第二因数882(d2)可具有第二值(例如,1),或两者,此举略过重采样阶段。举例来说,当第一因数862(d1)具有第一值(例如,1)时,经重采样的信道866可与经去加重信号864相同。作为另一实例,当第二因数882(d2)具有第二值(例如,1)时,经重采样的信道870可与经去加重信号868相同。重采样器810可向倾斜平衡器812提供经重采样的信道870。倾斜平衡器812可通过对经重采样的信道870执行倾斜平衡而产生第一经重采样的信道230。
去加重器834可通过基于IIR滤波器(例如,一阶IIR滤波器)滤波第二音频信号132产生经去加重信号884。去加重器834可将经去加重的信号884提供到重采样器836。重采样器836可通过基于第一因数862(d1)重采样经去加重的信号884产生经重采样的信道886。重采样器836可向去加重器838提供经重采样的信道886。去加重器838可通过基于IIR滤波器滤波经重采样的信道886产生经去加重信号888。去加重器838可将经去加重的信号888提供到重采样器840。重采样器840可基于第二因数882(d2)通过重采样经去加重的信号888产生经重采样的信道890。
在一些实施方案中,第一因数862(d1)可具有第一值(例如,1),第二因数882(d2)可具有第二值(例如,1),或两者,此举略过重采样阶段。举例来说,当第一因数862(d1)具有第一值(例如,1)时,经重采样的信道886可与经去加重信号884相同。作为另一实例,当第二因数882(d2)具有第二值(例如,1)时,经重采样的信道890可与经去加重信号888相同。重采样器840可向倾斜平衡器842提供经重采样的信道890。倾斜平衡器842可通过对经重采样的信道890执行倾斜平衡而产生第二经重采样的信道532。在一些实施方案中,倾斜平衡器812和倾斜平衡器842可分别补偿因去加重器804和去加重器834所致的低通(LP)效应。
参看图9,展示移位估计器204的说明性实例。移位估计器204可包含信号比较器906、内插器910、移位改进器911、移位变化分析器912、绝对移位产生器913或其组合。应理解移位估计器204可包含比图9中所说明的组件少或多的组件。
信号比较器906可产生比较值934(例如,不同值、类似性值、相干值或交叉相关值)、试验性移位值936或两者。举例来说,信号比较器906可基于第一经重采样的信道230和应用于第二经重采样的信道232的多个移位值产生比较值934。信号比较器906可基于比较值934确定试验性移位值936。第一经重采样信道230可包含比第一音频信号130更少的样本或更多的样本。第二经重采样信道232可包含比第二音频信号132更少的样本或更多的样本。相比于基于原始信号(例如,第一音频信号130和第二音频信号132)的样本,基于经重采样的信道(例如,第一经重采样的信道230和第二经重采样的信道232)的较少样本确定比较值934可使用更少的资源(例如,时间、操作的数目,或两者)。相比于基于原始信号(例如,第一音频信号130和第二音频信号132)的样本,基于经重采样的信道(例如,第一经重采样的信道230和第二经重采样的信道232)的更多样本确定比较值934可增加精确度。信号比较器906可向内插器910提供比较值934、试验性移位值936或两者。
内插器910可扩展试验性移位值936。举例来说,内插器910可产生经内插移位值938。举例来说,通过内插比较值934,内插器910可产生对应于接近试验性移位值936的移位值的经内插的比较值。内插器910可基于经内插的比较值和比较值934确定经内插移位值938。比较值934可基于移位值的较粗略的粒度。举例来说,比较值934可基于移位值的集合的第一子集,以使得第一子集的第一移位值与第一子集的每一第二移位值之间的差大于或等于阈值(例如,≥1)。阈值可基于重采样因数(D)。
经内插的比较值可基于接近于经重采样的试验性移位值936的移位值的较精细的粒度。举例来说,内插比较值可基于移位值的集合的第二子集,以使得第二子集的最大移位值与经重采样试验性移位值936之间的差小于阈值(例如,≥1),且第二子集的最小移位值与经重采样试验性移位值936之间的差小于阈值。相比于基于移位值的集合的较精细粒度(例如,所有)确定比较值934,基于移位值的集合的较粗略粒度(例如,第一子集)确定比较值934可使用更少的资源(例如,时间、操作或两者)。在不确定对应于移位值的集合的每一移位值的比较值情况下,基于接近于试验性移位值936的移位值的较小集合的较精细粒度,确定对应于移位值的第二子集的内插比较值可扩展试验性移位值936。因此,基于移位值的第一子集确定试验性移位值936和基于经内插比较值确定经内插移位值938可平衡资源使用率和经估计移位值的改进。内插器910可将内插移位值938提供到移位改进器911。
移位改进器911可通过改进经内插移位值938产生经修正的移位值940。举例来说,移位改进器911可确定内插失配值938是否指示第一音频信号130与第二音频信号132之间的移位变化大于移位变化阈值。移位变化可由经内插移位值938和与前一帧相关联的第一移位值之间的差指示。为响应差少于或等于阈值的确定,移位改进器911可将经修正的移位值940设定为经内插移位值938。替代地,为响应差大于阈值的确定,移位改进器911可确定对应于小于或等于移位变化阈值的差的多个移位值。移位改进器911可基于第一音频信号130和应用于第二音频信号132的多个移位值确定比较值。移位改进器911可基于比较值确定经修正的移位值940。举例来说,移位改进器911可基于比较值和内插移位值938选择多个移位值的移位值。移位改进器911可设定经修正的移位值940以指示所选择的移位值。对应于前一帧的第一移位值与经内插移位值938之间的非零差可指示第二音频信号132的一些样本对应于两个帧。举例来说,可在编码期间复制第二音频信号132的一些样本。或者,非零差可指示第二音频信号132的一些样本既不对应于前一帧也不对应于当前帧。举例来说,在编码期间可丢失第二音频信号132的一些样本。将经修正的移位值940设为多个移位值中的一个可防止在连续(或相邻)帧之间的较大移位变化,由此减少在编码期间样本丢失或样本复制的量。移位改进器911可将经修正的移位值940提供到移位变化分析器912。
在一些实施方案中,移位改进器911可调整经内插移位值938。移位改进器911可基于经调整内插移位值938确定经修正的移位值940。在一些实施方案中,移位改进器911可确定经修正的移位值940。
移位变化分析器912可确定经修正的移位值940是否指示第一音频信号130与第二音频信号132之间的时序交换或反向,如参看图1所描述。明确地说,时序的反向或交换可指示,对于前一帧,第一音频信号130是在第二音频信号132之前在输入接口112处接收,且对于后续帧,第二音频信号132是在第一音频信号130之前在输入接口处接收。或者,时序的反向或交换可指示,对于前一帧,第二音频信号132是在第一音频信号130之前在输入接口112处接收,且对于后续帧,第一音频信号130是在第二音频信号132之前在输入接口处接收。换句话说,时序的交换或反向可指示对应于前一帧的最终移位值具有与对应于当前帧的经修正的移位值940的第二正负号不同的第一正负号(例如,正到负的转变或反之亦然)。移位变化分析器912可基于经修正的移位值940和与前一帧相关联的第一移位值确定第一音频信号130与第二音频信号132之间的延迟是否已交换正负号。为响应第一音频信号130与第二音频信号132之间的延迟已交换正负号的确定,移位变化分析器912可将最终移位值116设定为指示无时间移位的值(例如,0)。或者,为响应第一音频信号130与第二音频信号132之间的延迟并未交换正负号的确定,移位变化分析器912可将最终移位值116设定成经修正的移位值940。移位变化分析器912可通过改进经修正的移位值940产生经估计移位值。移位变化分析器912可将最终移位值116设为经估计的移位值。通过避免第一音频信号130的连续(或相邻)帧的第一音频信号130和第二音频信号132在相对方向上的时间移位,将最终移位值116设为指示无时间移位可减少解码器处的失真。绝对移位产生器913可通过将绝对函数应用于最终移位值116来产生无关联移位值162。
参看图10,展示通信的方法1000。方法1000可由图1的第一装置104、图1到2的编码器114、图1到7的信号可调式“灵活”立体声译码器109、图2和8的信号预处理器202、图2和9的移位估计器204或其组合执行。
方法1000包含在1002处在第一装置处确定指示参考信道与目标信道之间的时间失配量的失配值。举例来说,参看图2,时间均衡器108可确定指示第一音频信号130与第二音频信号132之间的时间失配量的失配值(例如,最终移位值116)。最终移位值116的第一值(例如,正值)可指示第二音频信号132相对于第一音频信号130经延迟。最终移位值116的第二值(例如,负值)可指示第一音频信号130相对于第二音频信号132经延迟。最终移位值116的第三值(例如,0)可指示第一音频信号130与第二音频信号132之间无延迟。
方法1000包含在1004处至少基于失配值和译码模式确定是否对目标信道执行第一时间移位操作以产生经调整目标信道。举例来说,参看图2,目标信道调整器210可确定是否调整目标信道242并可基于从第一移位值262(Tprev)到最终移位值116(T)的时间移位演变调整目标信道242。举例来说,第一移位值262可包含对应于前一帧的最终移位值。为响应最终移位值从具有小于对应于前一帧的最终移位值116(例如,T=4)的对应于前一帧的第一值(例如,Tprev=2)的第一移位值262变化的确定,目标信道调整器210可对目标信道242进行内插,以使得对应于帧边界的目标信道242的样本的子集通过平滑且缓慢移位丢弃,以产生经调整的目标信道192。或者,为响应最终移位值从大于最终移位值116(例如,T=2)的第一移位值262(例如,Tprev=4)变化的确定,目标信道调整器210可内插目标信道242,以使得对应于帧边界的目标信道242的样本的子集通过平滑且缓慢移位重复,以产生经调整的目标信道192。基于混合正弦内插器(hybrid Sinc-interpolator)和拉格朗日内插器(Lagrange-interpolator),可进行平滑和缓慢移位。为响应最终移位值并未从第一移位值262改变成最终移位值116(例如,Tprev=T)的确定,目标信道调整器210可在时间上偏移目标信道242以产生经调整目标信道192。
在1006处,可对参考信道执行第一变换操作以产生频域参考信道。在1008处,可对经调整目标信道执行第二变换操作以产生频域经调整目标信道。举例来说,参看图3到7,可对参考信道190执行变换302且可对经调整目标信道192执行变换304。变换302、304可包含频域变换操作。作为非限制性实例,变换302、304可包含DFT操作、FFT操作等。根据一些实施方案,QMF操作(例如,使用复杂低延迟滤波器组)可用于将输入信号(例如,参考信道190和经调整目标信道192)分裂成多个子频带,且在一些实施方案中,可使用另一频域变换操作将子频带进一步转换为频域。变换302可应用于参考信道190以产生频域参考信道(Lfr(b))330,且变换304可应用于经调整目标信道192以产生频域经调整目标信道(Rfr(b))332。
在1010处,可基于频域参考信道和频域经调整目标信道估计一或多个立体声提示。举例来说,参看图3到7,频域参考信道330和频域经调整目标信道332可经提供到立体声提示估计器306和旁频带信道产生器308。立体声提示估计器306可基于频域参考信道330和频域经调整目标信道332提取(例如,产生)立体声提示162。举例来说,IID(b)可为频带(b)中的左信道的能量EL(b)和频带(b)中的右信道的能量ER(b)的函数。举例来说,IID(b)可表达为20*log10(EL(b)/ER(b))。在编码器处估计并发射的IPD可提供在频带(b)中的左信道与右信道之间的频域中的相位差的估计。立体声提示162可包含额外(或替代)参数,例如,ICC、ITD等。
在1012处,一或多个立体声提示可经发送到第二装置。举例来说,参看图1,第一装置104可发射立体声提示162到图1的第二装置106。
方法1000还可包含基于参考信道和经调整目标信道产生时域中频带信道。举例来说,参看图3、4和7,中频带信道产生器312可基于参考信道190和经调整目标信道192产生时域中频带信道336。举例来说,时域中频带信道336可表达为(l(t)+r(t))/2,其中l(t)包含参考信道190且r(t)包含经调整目标信道192。方法1000还可包含编码时域中频带信道以产生中频带位流。举例来说,参看图3和4,中频带编码器316可通过编码时域中频带信道336产生中频带位流166。方法1000可进一步包含发送中频带位流到第二装置。举例来说,参看图1,发射器110可发送中频带位流166到第二装置106。
方法1000还可包含基于频域参考信道、频域经调整目标信道和一或多个立体声提示产生旁频带信道。举例来说,参看图3,旁频带产生器308可基于频域参考信道330和频域经调整目标信道332产生频域旁频带信道334。可在频域仓/频带中估计频域旁频带信道334。在每一频带中,增益参数(g)是不同的且可基于信道间电平差值(例如,基于立体声提示162)。举例来说,频域旁频带信道334可表达为(Lfr(b)-c(b)*Rfr(b))/(1+c(b)),其中c(b)可为ILD(b)或ILD(b)的函数(例如,c(b)=10^(ILD(b)/20))。
方法1000还可包含对时域中频带信道执行第三变换操作以产生频域中频带信道。举例来说,参看图3,变换314可应用于时域中频带信道336以产生频域中频带信道338。方法1000还可包含基于旁频带信道、频域中频带信道和一或多个立体声提示产生旁频带位流。举例来说,参看图3,旁频带编码器310可基于立体声提示162、频域旁频带信道334和频域中频带信道338产生旁频带位流164。
方法1000还可包含基于频域参考信道和频域经调整目标信道和另外或替代地基于立体声提示产生频域中频带信道。举例来说,参看图5到6,中频带信道产生器502可基于频域参考信道330和频域经调整目标信道332和另外或替代地基于立体声提示162产生频域中频带信道530。方法1000还可包含编码频域中频带信道以产生中频带位流。举例来说,参看图5,中频带编码器504可编码频域中频带信道530以产生中频带位流166。
方法1000还可包含基于频域参考信道、频域经调整目标信道和一或多个立体声提示产生旁频带信道。举例来说,参看图5到6,旁频带产生器308可基于频域参考信道330和频域经调整目标信道332产生频域旁频带信道334。根据一个实施方案,方法1000包含基于旁频带信道、中频带位流和一或多个立体声提示产生旁频带位流。举例来说,参看图6,可将中频带位流166提供到旁频带编码器602。旁频带编码器602可经配置以基于立体声提示162、频域旁频带信道334和中频带位流166产生旁频带位流164。根据另一实施方案,方法1000包含基于旁频带信道、频域中频带信道和一或多个立体声提示产生旁频带位流。举例来说,参看图5,旁频带编码器506可基于立体声提示162、频域旁频带信道334和频域中频带信道530产生旁频带位流164。
根据一个实施方案,方法1000还可包含通过减少采样参考信道产生第一减少采样信道和通过减少采样目标信道产生第二减少采样信道。方法1000还可包含基于第一减少采样信道和应用于第二减少采样信道的多个移位值确定比较值。移位值可基于比较值。
图10的方法1000可使得信号可调式“灵活”立体声译码器109能够将参考信道190和经调整目标信道192变换成频域以产生立体声提示162、旁频带位流164和中频带位流166。时间均衡器108的将第一音频信号130在时间上移位以与第二音频信号132对准的时间移位技术可结合频域信号处理来实施。举例来说,时间均衡器108在编码器114处估计每一帧的移位(例如,无关联移位值),根据无关联移位值移位(例如,调整)目标信道,并使用移位的经调整信道用于变换域中的立体声提示估计。
参看图11,展示说明解码器118的特定实施方案的图。编码音频信号经提供到解码器118的多路分用器(DEMUX)1102。编码音频信号可包含立体声提示162、旁频带位流164和中频带位流166。多路分用器1102可经配置以从编码音频信号提取中频带位流166并提供中频带位流166到中频带解码器1104。多路分用器1102也可经配置以从编码音频信号提取旁频带位流164和立体声提示162。可将旁频带位流164和立体声提示162提供到旁频带解码器1106。
中频带解码器1104可经配置以解码中频带位流166以产生中频带信道(mCODED(t))1150。如果中频带信道1150为时域信号,那么变换1108可应用于中频带信道1150以产生频域中频带信道(MCODED(b))1152。可将频域中频带信道1152提供到升混频器1110。然而,如果中频带信道1150为频域信号,那么中频带信道1150可直接提供到升混频器1110且变换1108可被略过或可不存在于解码器118中。
旁频带解码器1106可基于旁频带位流164和立体声提示162产生旁频带信道(SCODED(b))1154。举例来说,可针对低频带和高频带解码错误(e)。旁频带信道1154可表达为SPRED(b)+eCODED(b),其中SPRED(b)=MCODED(b)*(ILD(b)-1)/(ILD(b)+1)。旁频带信道1154也可经提供到升混频器1110。
升混频器1110可基于频域中频带信道1152和旁频带信道1154执行升混操作。举例来说,升混频器1110可基于频域中频带信道1152和旁频带信道1154产生第一升混信号(Lfr)1156和第二升混信号(Rfr)1158。因此,在所描述实例中,第一升混信号1156可为左信道信号,且第二升混信号1158可为右信道信号。第一升混信号1156可表达为MCODED(b)+SCODED(b),且第二升混信号1158可表达为MCODED(b)-SCODED(b)。可将升混信号1156、1158提供到立体声提示处理器1112。
立体声提示处理器1112可将立体声提示162应用于升混信号1156、1158以产生信号1160、1162。举例来说,立体声提示162可应用于频域中的升混左和右信道。当可用时,IPD(相位差值)可在左和右信道上扩展以维持信道间相位差值。反向变换1114可应用于信号1160以产生第一时域信号l(t)1164,且反向变换1116可应用于信号1162以产生第二时域信号r(t)1166。反向变换1114、1116的非限制性实例包含反向离散余弦变换(IDCT)操作、快速傅立叶逆变换(IFFT)操作等。根据一个实施方案,第一时域信号1164可为参考信道190的重构建版本,且第二时域信号1166可为经调整目标信道192的重构建版本。
根据一个实施方案,在升混频器1110处执行的操作可在立体声提示处理器1112处执行。根据另一个实施方案,在立体声提示处理器1112处执行的操作可在升混频器1110处执行。根据又一个实施方案,升混频器1110和立体声提示处理器1112可实施于单个处理元件(例如,单个处理器)内。
另外,可将第一时域信号1164和第二时域信号1166提供到时域升混频器1120。时域升混频器1120可对时域信号1164、1166(例如,反向变换的左和右信号)执行时域升混。时域升混频器1120可执行反向移位调整以撤销在时间均衡器108(更具体地说,目标信道调整器210)中执行的移位调整。时域升混可基于时域降混参数168。举例来说,时域升混可基于第一移位值262和参考信道指示符264。另外,时域升混频器1120可执行在可存在的时域降混模块处执行的其它操作的反向操作。
参考图12,描绘装置(例如,无线通信装置)的特定说明性实例的框图,且通常将所述装置指示为1200。在各种实施例中,装置1200可具有比图12中所说明的更少或更多的组件。在说明性实施例中,装置1200可对应于图1的第一装置104或第二装置106。在说明性实施例中,装置1200可执行参考图1到11的系统和方法所描述的一或多个操作。
在特定实施例中,装置1200包含处理器1206(例如,中央处理单元(CPU))。装置1200可包含一或多个额外处理器1210(例如,一或多个数字信号处理器(DSP))。处理器1210可包含媒体(例如,话音和音乐)译码器解码器(编码解码器)1208和回音消除器1212。媒体编码解码器1208可包含图1的解码器118、编码器114或两者。编码器114可包含时间均衡器108。
装置1200可包含存储器153和编码解码器1234。尽管媒体编码解码器1208经说明为处理器1210的组件(例如,专用电路和/或可执行程序代码),但在其它实施例中,媒体编码解码器1208的一或多个组件(例如,解码器118、编码器114或两者)可包含于处理器1206、编码解码器1234、另一处理组件或其组合中。
装置1200可包含耦合到天线1242的发射器110。装置1200可包含耦合到显示控制器1226的显示器1228。可将一或多个扬声器1248耦合到编码解码器1234。可经由输入接口112将一或多个麦克风1246耦合到编码解码器1234。在特定实施方案中,扬声器1248可包含图1的第一扬声器142、第二扬声器144,或其组合。在特定实施方案中,麦克风1246可包含图1的第一麦克风146、第二麦克风148,或其组合。编码解码器1234可包含数字/模拟转换器(DAC)1202和模拟/数字转换器(ADC)1204。
存储器153可包含可由处理器1206执行的指令1260、处理器1210、编码解码器1234、装置1200的另一处理单元或其组合,以执行参看图1到11描述的一或多个操作。存储器153可存储分析数据191。
装置1200的一或多个组件可经由专用硬件(例如,电路)、由执行指令以执行一或多个任务的处理器实施,或其组合。作为实例,存储器153或处理器1206、处理器1210和/或编码解码器1234的一或多个组件可为存储器装置,例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可卸除式磁盘或光盘只读存储器(CD-ROM)。存储器装置可包含在由计算机(例如,编码解码器1234中的处理器、处理器1206和/或处理器1210)执行时可使得计算机执行参看图1到11描述的一或多个操作的指令(例如,指令1260)。作为实例,存储器153或处理器1206、处理器1210和/或编码解码器1234的一或多个组件可为包含在由计算机(例如,编码解码器1234中的处理器、处理器1206和/或处理器1210)执行时使得计算机执行参看图1到11描述的一或多个操作的指令(例如,指令1260)的非暂时性计算机可读媒体。
在特定实施例中,装置1200可包含于系统级封装或系统单芯片装置(例如,移动台调制解调器(MSM))1222中。在特定实施例中,处理器1206、处理器1210、显示控制器1226、存储器153、编码解码器1234和发射器110包含于系统级封装或系统单芯片装置1222中。在特定实施例中,例如触控屏幕和/或小键盘的输入装置1230和电力供应器1244耦合到系统单芯片装置1222。此外,在特定实施例中,如图12中所说明,显示器1228、输入装置1230、扬声器1248、麦克风1246、天线1242和电力供应器1244在系统单芯片装置1222的外部。然而,显示器1228、输入装置1230、扬声器1248、麦克风1246、天线1242和电力供应器1244中的每一个可耦合到系统单芯片装置1222的组件,例如,接口或控制器。
装置1200可包含:无线电话、移动通信装置、移动电话、智能型电话、蜂窝式电话、膝上型计算机、台式计算机、计算机、平板计算机、机顶盒、个人数字助理(PDA)、显示装置、电视、游戏控制台、音乐播放器、收音机、视频播放器、娱乐单元、通信装置、固定位置数据单位、个人媒体播放器、数字视频播放器、数字视频光盘(DVD)播放器、调谐器、相机、导航装置、解码器系统、编码器系统或其任何组合。
在特定实施方案中,本文所揭示的系统和装置的一或多个组件可集成于解码系统或设备(例如,电子装置、编码解码器或其中的处理器)中,集成于编码系统或设备中,或集成于两者中。在其它实施方案中,本文所揭示的系统和装置的一或多个组件可集成于以下各者中:无线电话、平板计算机、台式计算机、膝上型计算机、机顶盒、音乐播放器、视频播放器、娱乐单元、电视、游戏控制台、导航装置、通信装置、个人数字助理(PDA)、固定位置数据单元、个人媒体播放器或另一类型的装置。
应注意,由本文所揭示的系统和装置的一或多个组件执行的各种功能经描述为由某些组件或模块执行。组件和模块的此划分仅为了说明。在替代实施方案中,由特定组件或模块执行的功能可划分于多个组件或模块的中。此外,在替代实施方案中,两个或多于两个组件或模块可集成到单个组件或模块中。每一组件或模块可使用硬件(例如,现现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、DSP、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合而实施。
结合所描述实施方案,设备包含用于确定指示参考信道与目标信道之间的时间失配量的失配值的装置。举例来说,用于确定的装置可包含图1的时间均衡器108、编码器114、第一装置104、媒体编码解码器1208、处理器1210、装置1200、经配置以确定失配值的一或多个装置(例如,执行存储于计算机可读存储装置处的指令的处理器)或其组合。
设备还可包含用于基于失配值对目标信道执行时间移位操作以产生经调整目标信道的装置。举例来说,用于执行时间移位操作的装置可包含图1的时间均衡器108、编码器114、图2的目标信道调整器210、媒体编码解码器1208、处理器1210、装置1200、经配置以执行时间移位操作的一或多个装置(例如,执行存储在计算机可读存储装置处的指令的处理器)或其组合。
设备还可包含用于对参考信道执行第一变换操作以产生频域参考信道的装置。举例来说,用于执行第一变换操作的装置可包含图1的信号可调式“灵活”立体声译码器109、编码器114、图3到7的变换302、媒体编码解码器1208、处理器1210、装置1200、经配置以执行变换操作的一或多个装置(例如,执行存储在计算机可读存储装置处的指令的处理器)或其组合。
设备还可包含用于对经调整目标信道执行第二变换操作以产生频域经调整目标信道的装置。举例来说,用于执行第二变换操作的装置可包含图1的信号可调式“灵活”立体声译码器109、编码器114、图3到7的变换304、媒体编码解码器1208、处理器1210、装置1200、经配置以执行变换操作的一或多个装置(例如,执行存储在计算机可读存储装置处的指令的处理器)或其组合。
设备还可包含用于基于频域参考信道和频域经调整目标信道估计一或多个立体声提示的装置。举例来说,用于估计的装置可包含图1的信号可调式“灵活”立体声译码器109、编码器114、图3到7的立体声提示估计器306、媒体编码解码器1208、处理器1210、装置1200、经配置以估计立体声提示的一或多个装置(例如,执行存储在计算机可读存储装置处的指令的处理器)或其组合。
设备还可包含用于发送一或多个立体声提示的装置。举例来说,用于发送的装置可包含图1和12的发射器110、图12的天线1242,或两者。
参考图13,描绘基站1300的特定说明性实例的框图。在各种实施方案中,基站1300可相比图13中所说明的具有较多组件或较少组件。在说明性实例中,基站1300可包含图1的第一装置104或第二装置106。在说明性实例中,基站1300可根据参看图1到12所描述的方法或系统中的一或多个操作。
基站1300可为无线通信系统的部分。无线通信系统可包含多个基站和多个无线装置。无线通信系统可为长期演变(LTE)系统、码分多址(CDMA)系统、全球移动通信系统(GSM)系统、无线局域网(WLAN)系统,或一些其它无线系统。CDMA系统可实施带宽带CDMA(WCDMA)、CDMA 1X、演变数据优化(EVDO)、分时同步CDMA(TD-SCDMA),或一些其它版本的CDMA。
无线装置也可被称为用户设备(UE)、移动台、终端机、存取终端机、用户单元、工作台等。无线装置可包含蜂窝式电话、智能型电话、平板计算机、无线调制解调器、个人数字助理(PDA)、手持型装置、膝上型计算机、智能笔记本电脑、迷你笔记型计算机、平板计算机、无接线电话、无线区域回路(WLL)台、蓝牙装置等。无线装置可包含或对应于图12的装置1200。
各种功能可由基站1300的一或多个组件(和/或在未展示的其它组件中)执行,例如发送和接收消息和数据(例如,音频数据)。在特定实例中,基站1300包含处理器1306(例如,CPU)。基站1300可包含转码器1310。转码器1310可包含音频编码解码器1308。举例来说,转码器1310可包含经配置以执行音频编码解码器1308的操作的一或多个组件(例如,电路)。作为另一实例,转码器1310可经配置以执行一或多个计算机可读指令以执行音频编码解码器1308的操作。尽管音频编码解码器1308经说明为转码器1310的组件,但在其它实例中,音频编码解码器1308的一或多个组件可包含于处理器1306、另一处理组件或其组合中。举例来说,解码器1338(例如,声码器解码器)可包含于接收器数据处理器1364中。作为另一实例,编码器1336(例如,声码器编码器)可包含于发射数据处理器1382中。编码器1336可包含图1的编码器114。解码器1338可包含图1的解码器118。
转码器1310可起到在两个或多于两个网络之间转码消息和数据的作用。转码器1310可经配置以将消息和音频数据从第一格式(例如,数字格式)转换成第二格式。为进行说明,解码器1338可解码具有第一格式的经编码信号,且编码器1336可将经解码信号编码成具有第二格式的经编码信号。另外地或替代地,转码器1310可经配置以执行数据速率调适。举例来说,转码器1310可在不改变音频数据的格式的情况下下转换数据速率或上转换数据速率。举例来说,转码器1310可将64千位/s信号下转换成16千位/s信号。
基站1300可包含存储器1332。例如计算机可读存储装置的存储器1332可包含指令。指令可包含可由处理器1306、转码器1310或其组合执行的一或多个指令,以执行参考图1到12的方法和系统所描述的一或多个操作。举例来说,操作可包含确定指示参考信道与目标信道之间的时间失配量的失配值。操作还可包含基于失配值对目标信道执行时间移位操作以产生经调整目标信道。操作还可包含对参考信道执行第一变换操作以产生频域参考信道和对经调整目标信道执行第二变换操作以产生频域经调整目标信道。操作可进一步包含基于频域参考信道和频域经调整目标信道估计一或多个立体声提示。操作还可包含起始发射一或多个立体声提示到接收器。
基站1300可包含耦合到天线阵列的多个发射器和接收器(例如,收发器),例如第一收发器1352和第二收发器1354。天线阵列可包含第一天线1342和第二天线1344。天线阵列可经配置以与一或多个无线装置(例如,图12的装置1200)无线通信。举例来说,第二天线1344可从无线装置接收数据流1314(例如,位流)。数据流1314可包含消息、数据(例如,经编码话音数据)或其组合。
基站1300可包含例如回程连接的网络连接1360。网络连接1360可经配置以与无线通信网络的核心网络或一或多个基站通信。举例来说,基站1300可经由网络连接1360从核心网络接收第二数据流(例如,消息或音频数据)。基站1300可处理第二数据流以产生消息或音频数据,且经由天线阵列的一或多个天线将消息或音频数据提供到一或多个无线装置,或经由网络连接1360将其提供到另一基站。在特定实施方案中,网络连接1360可为广域网(WAN)连接,作为说明性的非限制性实例。在一些实施方案中,核心网络可包含或对应于公众交换电话网络(PSTN)、封包基干网络或两者。
基站1300可包含耦合到网络连接1360和处理器1306的媒体网关1370。媒体网关1370可经配置以在不同电信技术的媒体流式发射之间进行转换。举例来说,媒体网关1370可在不同发射协议、不同译码方案或两者之间转换。举例来说,作为说明性非限制性实例,媒体网关1370可从PCM信号转换成实时输送协议(RTP)信号。媒体网关1370可在封包交换网络(例如,因特网通讯协议语音(VoIP)网络、IP多媒体子系统(IMS)、第四代(4G)无线网络(例如LTE、WiMax和UMB等))、电路交换网络(例如,PSTN)和混合网络(例如,第二代(2G)无线网络(例如,GSM、GPRS和EDGE)、第三代(3G)无线网络(例如,WCDMA、EV-DO和HSPA等))之间转换数据。
另外,媒体网关1370可包含例如转码器610的转码器,且可经配置以在编码解码器不兼容时转码数据。举例来说,媒体网关1370可在适应性多重速率(AMR)编码解码器与G.711编码解码器之间进行转码,作为说明性非限制性实例。媒体网关1370可包含路由器和多个物理接口。在一些实施方案中,媒体网关1370还可包含控制器(未图示)。在特定实施方案中,媒体网关控制器可在媒体网关1370外部、在基站1300外部或在两者外部。媒体网关控制器可控制并协调操作多个媒体网关。媒体网关1370可从媒体网关控制器接收控制信号,且可起到在不同发射技术之间进行桥接的作用,且可将服务添加到最终用户能力和连接。
基站1300可包含耦合到收发器1352、1354、接收器数据处理器1364和处理器1306的解调器1362,且接收器数据处理器1364可耦合到处理器1306。解调器1362可经配置以解调制从收发器1352、收发器1354接收的调制信号且向接收器数据处理器1364提供经解调制数据。接收器数据处理器1364可经配置以从经解调数据提取消息或音频数据,且将所述消息或音频数据发送到处理器1306。
基站1300可包含发射数据处理器1382和发射多输入多输出(MIMO)处理器1384。可将发射数据处理器1382耦合到处理器1306和发射MIMO处理器1384。发射MIMO处理器1384可耦合到收发器1352、收发器1354和处理器1306。在一些实施方案中,可将发射MIMO处理器1384耦合到媒体网关1370。作为说明性非限制性实例,发射数据处理器1382可经配置以从处理器1306接收消息或音频数据,且基于例如CDMA或正交分频多工(OFDM)的译码方案译码消息或音频数据。发射数据处理器1382可将经译码数据提供到发射MIMO处理器1384。
可使用CDMA或OFDM技术将经译码数据与例如导频数据的其它数据多工,以产生经多工数据。多工数据接着可由发射数据处理器1382基于特定调制方案(例如,二进制相移键控(“BPSK”)、正交相移键控(“QSPK”)、M-元相移键控(“M-PSK”)、M-元正交振幅调制(“M-QAM”)等)调制(即,符号映射)以产生调制符号。在特定实施方案中,可使用不同调制方案调制经译码数据和其它数据。针对每一数据流的数据速率、译码和调制可由处理器1306执行的指令确定。
发射MIMO处理器1384可经配置以从发射数据处理器1382接收调制符号,且可进一步处理调制符号,且可对所述数据执行波束成形。举例来说,发射MIMO处理器1384可将波束成形权重应用于调制符号。
在操作期间,基站1300的第二天线1344可接收数据流1314。第二收发器1354可从第二天线1344接收数据流1314,且可向解调器1362提供数据流1314。解调器1362可解调制数据流1314的经调制信号,且向接收器数据处理器1364提供经解调制数据。接收器数据处理器1364可从经解调数据提取音频数据,且向处理器1306提供经提取音频数据。
处理器1306可将音频数据提供到转码器1310以用于转码。转码器1310的解码器1338可将音频数据从第一格式解码成经解码音频数据,且编码器1336可将经解码音频数据编码成第二格式。在一些实施方案中,编码器1336可使用比从无线装置所接收的数据速率更高数据速率(例如,上转换)或更低数据速率(例如,下转换)对音频数据进行编码。在其它实施方案中,音频数据可未经转码。尽管转码(例如,解码和编码)经说明为通过转码器1310执行,但转码操作(例如,解码和编码)可由基站1300的多个组件执行。举例来说,解码可由接收器数据处理器1364执行,且编码可由发射数据处理器1382执行。在其它实施方案中,处理器1306可将音频数据提供到媒体网关1370用于转换成另一发射协议、译码方案或两者。媒体网关1370可经由网络连接1360将经转换数据提供到另一基站或核心网络。
编码器1336可确定指示第一音频信号130与第二音频信号132之间的时间失配量的最终移位值116。编码器1336可对第二音频信号132(例如,目标信道)执行时间移位操作以产生经调整目标信道。编码器1336可对第一音频信号130(例如,参考信道)执行第一变换操作以产生频域参考信道并可对经调整目标信道执行第二变换操作以产生频域经调整目标信道。编码器1336可基于频域参考信道和频域经调整目标信道估计一或多个立体声提示。在编码器1336处产生的经编码音频数据可经由处理器1306提供到发射数据处理器1382或网络连接1360。
可将来自转码器1310的经转码音频数据提供到发射数据处理器1382,用于根据例如OFDM的调制方案译码,以产生调制符号。发射数据处理器1382可将调制符号提供到发射MIMO处理器1384以供进一步处理和波束成形。发射MIMO处理器1384可应用波束成形权重,且可经由第一收发器1352将调制符号提供到天线阵列的一或多个天线,例如第一天线1342。因此,基站1300可将对应于从无线装置接收的数据流1314的经转码数据流1316提供到另一无线装置。经转码数据流1316可具有与数据流1314相比不同的编码格式、数据速率或两者。在其它实施方案中,可将经转码数据流1316提供到网络连接1360,以供发射到另一基站或核心网络。
熟悉此项技术者将进一步了解,结合本文所揭示的实施例所描述的各种说明性逻辑块、配置、模块、电路和算法步骤可实施为电子硬件、由例如硬件处理器的处理装置执行的计算机软件或两者的组合。上文大体在功能性方面描述各种说明性组件、块、配置、模块、电路和步骤。此功能性经实施为硬件或是软件取决于特定应用和强加于整个系统的设计约束而定。对于每一特定应用来说,所属领域的技术人员可以变化的方式实施所描述的功能性,但不应将所述实施决策解释为导致脱离本发明的范围。
结合本文中所揭示的实施例而描述的方法或算法的步骤可直接体现于硬件中、由处理器执行的软件模块中,或两者的组合中。软件模块可存在于存储器装置中,例如随机存取存储器(RAM)、磁阻随机存取存储器(MRAM)、从旋力矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、抽取式磁盘或光盘只读存储器(CD-ROM)。示范性存储器装置耦合到处理器,以使得处理器可从存储器装置读取信息和将信息写入到存储器装置。在替代例中,存储器装置可与处理器成一体式。处理器和存储媒体可驻留于专用集成电路(ASIC)中。ASIC可驻留于计算装置或用户终端机中。在替代例中,处理器和存储媒体可作为离散组件驻留于计算装置或用户终端机中。
提供对所揭示实施方案的先前描述,以使得所属领域的技术人员能够制作或使用所揭示的实施方案。所属领域的技术人员将容易地显而易见对这些实施方案的各种修改且在不脱离本发明的范围的情况下本文中所定义的原理可应用于其它实施方案。因此,本发明并非希望限于本文中所展示的实施方案,而应符合可能与如以下权利要求书所定义的原理和新颖特征相一致的最广泛范围。
Claims (40)
1.一种用于对音频信号进行编码的装置,其包括:
编码器,其经配置以:
确定指示参考信道与目标信道之间的时间失配量的失配值;
至少基于所述失配值对所述目标信道执行第一时间移位操作以产生经调整目标信道;
对所述参考信道执行第一变换操作以产生频域参考信道;
对所述经调整目标信道执行第二变换操作以产生频域经调整目标信道;
确定指示在变换域中所述参考信道与所述经调整目标信道之间的时间移位的第二失配值;
基于所述第二失配值在所述变换域中对所述频域经调整目标信道执行第二时间移位操作以产生经修改频域经调整目标信道;以及
基于所述频域参考信道和所述经修改频域经调整目标信道估计一或多个立体声提示;以及
发射器,其经配置以发射所述一或多个立体声提示。
2.根据权利要求1所述的装置,其中所述编码器经配置以基于所述参考信道和所述经调整目标信道产生时域中频带信道。
3.根据权利要求2所述的装置,其中所述编码器经配置以编码所述时域中频带信道以产生中频带位流,且其中所述发射器经配置以发射所述中频带位流到接收器。
4.根据权利要求2所述的装置,其中所述编码器经配置以:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;
对所述时域中频带信道执行第三变换操作以产生频域中频带信道;以及
基于所述旁频带信道、所述频域中频带信道和所述一或多个立体声提示产生旁频带位流,其中所述发射器经配置以发射所述旁频带位流到接收器。
5.根据权利要求1所述的装置,其中所述编码器经配置以基于所述频域参考信道和所述频域经调整目标信道产生频域中频带信道。
6.根据权利要求5所述的装置,其中所述编码器经配置以编码所述频域中频带信道以产生中频带位流,且其中所述发射器经配置以发射所述中频带位流到接收器。
7.根据权利要求6所述的装置,其中所述编码器经配置以:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;以及
基于所述旁频带信道、所述中频带位流和所述一或多个立体声提示产生旁频带位流,其中所述发射器经配置以发射所述旁频带位流到所述接收器。
8.根据权利要求5所述的装置,其中所述编码器经配置以:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;以及
基于所述旁频带信道、所述频域中频带信道和所述一或多个立体声提示产生旁频带位流,其中所述发射器经配置以发射所述旁频带位流到接收器。
9.根据权利要求1所述的装置,其中所述编码器经配置以:
通过减少采样所述参考信道产生第一减少采样信道;
通过减少采样所述目标信道产生第二减少采样信道;以及
基于所述第一减少采样信道和应用于所述第二减少采样信道的多个失配值确定比较值,其中所述失配值是基于所述比较值。
10.根据权利要求1所述的装置,其中所述失配值对应于经由第一麦克风接收所述参考信道的第一帧与经由第二麦克风接收所述目标信道的第二帧之间的时间延迟量。
11.根据权利要求1所述的装置,其中所述立体声提示包含使得能够再现与左信道和右信道相关联的空间性质的一或多个参数。
12.根据权利要求1所述的装置,其中所述立体声提示包含一或多个信道间强度参数、信道间强度差IID参数、信道间相位参数、信道间相位差IPD参数、无关联移位参数、频谱倾角参数、信道间语音参数、信道间音调参数、信道间增益参数或其组合。
13.根据权利要求1所述的装置,其中所述编码器集成到移动装置中。
14.根据权利要求1所述的装置,其中所述编码器集成到基站中。
15.根据权利要求1所述的装置,其中所述第二时间移位操作包括无关联移位。
16.一种用于对音频信号进行编码的方法,其包括:
在第一装置处确定指示参考信道与目标信道之间的时间失配量的失配值;
至少基于所述失配值对所述目标信道执行第一时间移位操作以产生经调整目标信道;
对所述参考信道执行第一变换操作以产生频域参考信道;
对所述经调整目标信道执行第二变换操作以产生一频域经调整目标信道;
确定指示在变换域中所述参考信道与所述经调整目标信道之间的时间移位的第二失配值;
基于所述第二失配值在所述变换域中对所述频域经调整目标信道执行第二时间移位操作以产生经修改频域经调整目标信道;
基于所述频域参考信道和所述经修改频域经调整目标信道估计一或多个立体声提示;以及
发射所述一或多个立体声提示。
17.根据权利要求16所述的方法,其包括基于所述参考信道和经调整目标信道产生时域中频带信道。
18.根据权利要求17所述的方法,其包括:
编码所述时域中频带信道以产生中频带位流;以及
发送所述中频带位流到第二装置。
19.根据权利要求17所述的方法,其包括:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;
对所述时域中频带信道执行第三变换操作以产生频域中频带信道;
基于所述旁频带信道、所述频域中频带信道和所述一或多个立体声提示产生旁频带位流;以及
发送所述旁频带位流到第二装置。
20.根据权利要求16所述的方法,其包括基于所述频域参考信道和所述频域经调整目标信道产生频域中频带信道。
21.根据权利要求20所述的方法,其包括:
编码所述频域中频带信道以产生中频带位流;以及
发送所述中频带位流到第二装置。
22.根据权利要求21所述的方法,其包括:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;
基于所述旁频带信道、所述中频带位流和所述一或多个立体声提示产生旁频带位流;以及
发送所述旁频带位流到所述第二装置。
23.根据权利要求20所述的方法,其包括:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;
基于所述旁频带信道、所述频域中频带信道和所述一或多个立体声提示产生旁频带位流;以及
发送所述旁频带位流到第二装置。
24.根据权利要求16所述的方法,其包括:
通过减少采样所述参考信道产生第一减少采样信道;
通过减少采样所述目标信道产生第二减少采样信道;以及
基于所述第一减少采样信道和应用于所述第二减少采样信道的多个失配值确定比较值,其中所述失配值是基于所述比较值。
25.根据权利要求16所述的方法,其中所述第一装置包括移动装置。
26.根据权利要求16所述的方法,其中所述第一装置包括基站。
27.根据权利要求16所述的方法,其中所述第二时间移位操作包括无关联移位。
28.一种非暂时性计算机可读存储装置,其存储当由处理器执行时使得所述处理器执行包括以下各者的操作的指令:
在第一装置处确定指示参考信道与目标信道之间的时间失配量的失配值;
基于所述失配值对所述目标信道执行第一时间移位操作以产生经调整目标信道;
对所述参考信道执行第一变换操作以产生频域参考信道;
对所述经调整目标信道执行第二变换操作以产生频域经调整目标信道;
确定指示在变换域中所述参考信道与所述经调整目标信道之间的时间移位的第二失配值;
基于所述第二失配值在所述变换域中对所述频域经调整目标信道执行第二时间移位操作以产生经修改频域经调整目标信道;
基于所述频域参考信道和所述经修改频域经调整目标信道估计一或多个立体声提示;以及
起始发射所述一或多个立体声提示。
29.根据权利要求28所述的非暂时性计算机可读存储装置,其中所述操作包括基于所述参考信道和所述经调整目标信道产生时域中频带信道。
30.根据权利要求29所述的非暂时性计算机可读存储装置,其中所述操作包括:
编码所述时域中频带信道以产生中频带位流;以及
起始发射所述中频带位流到第二装置。
31.根据权利要求29所述的非暂时性计算机可读存储装置,其中所述操作包括:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;
对所述时域中频带信道执行第三变换操作以产生频域中频带信道;
基于所述旁频带信道、所述频域中频带信道和所述一或多个立体声提示产生旁频带位流;以及
起始发射所述旁频带位流到第二装置。
32.根据权利要求28所述的非暂时性计算机可读存储装置,其中所述操作包括基于所述频域参考信道和所述频域经调整目标信道产生频域中频带信道。
33.根据权利要求32所述的非暂时性计算机可读存储装置,其中所述操作包括:
编码所述频域中频带信道以产生中频带位流;以及
起始发射所述中频带位流到第二装置。
34.根据权利要求33所述的非暂时性计算机可读存储装置,其中所述操作包括:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;
基于所述旁频带信道、所述中频带位流和所述一或多个立体声提示产生旁频带位流;以及
起始发射所述旁频带位流到所述第二装置。
35.根据权利要求32所述的非暂时性计算机可读存储装置,其中所述操作包括:
基于所述频域参考信道、所述频域经调整目标信道和所述一或多个立体声提示产生旁频带信道;
基于所述旁频带信道、所述频域中频带信道和所述一或多个立体声提示产生旁频带位流;以及
起始发射所述旁频带位流到第二装置。
36.根据权利要求28所述的非暂时性计算机可读存储装置,其中所述第二时间移位操作包括无关联移位。
37.一种用于对音频信号进行编码的设备,其包含:
用于确定指示参考信道与目标信道之间的时间失配量的失配值的装置;
用于基于所述失配值对所述目标信道执行第一时间移位操作以产生经调整目标信道的装置;
用于对所述参考信道执行第一变换操作以产生频域参考信道的装置;
用于对所述经调整目标信道执行第二变换操作以产生频域经调整目标信道的装置;
用于确定指示在变换域中所述参考信道与所述经调整目标信道之间的时间移位的第二失配值的装置;
用于基于所述第二失配值在所述变换域中对所述频域经调整目标信道执行第二时间移位操作以产生经修改频域经调整目标信道的装置;
用于基于所述频域参考信道和所述经修改频域经调整目标信道估计一或多个立体声提示的装置;以及
用于发送所述一或多个立体声提示的装置。
38.根据权利要求37所述的设备,其中用于确定所述失配值的所述装置、用于执行所述第一时间移位操作的所述装置、用于执行所述第一变换操作的所述装置、用于执行所述第二变换操作的所述装置、用于执行所述第二时间移位操作的所述装置、用于估计的所述装置和用于发送的所述装置集成到移动装置中。
39.根据权利要求37所述的设备,其中用于确定所述失配值的所述装置、用于执行所述第一时间移位操作的所述装置、用于执行所述第一变换操作的所述装置、用于执行所述第二变换操作的所述装置、用于执行所述第二时间移位操作的所述装置、用于估计的所述装置和用于发送的所述装置集成到基站中。
40.根据权利要求37所述的设备,其中所述第二时间移位操作包括无关联移位。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201662294946P | 2016-02-12 | 2016-02-12 | |
US62/294,946 | 2016-02-12 | ||
US15/422,988 US9978381B2 (en) | 2016-02-12 | 2017-02-02 | Encoding of multiple audio signals |
US15/422,988 | 2017-02-02 | ||
PCT/US2017/016418 WO2017139190A1 (en) | 2016-02-12 | 2017-02-03 | Encoding of multiple audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108701464A CN108701464A (zh) | 2018-10-23 |
CN108701464B true CN108701464B (zh) | 2023-04-04 |
Family
ID=59561681
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780010398.9A Active CN108701464B (zh) | 2016-02-12 | 2017-02-03 | 多个音频信号的编码 |
Country Status (10)
Country | Link |
---|---|
US (1) | US9978381B2 (zh) |
EP (1) | EP3414760B1 (zh) |
JP (1) | JP6856655B2 (zh) |
KR (1) | KR102230623B1 (zh) |
CN (1) | CN108701464B (zh) |
BR (1) | BR112018016247A2 (zh) |
CA (1) | CA3011741C (zh) |
ES (1) | ES2821676T3 (zh) |
TW (1) | TWI651716B (zh) |
WO (1) | WO2017139190A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10074373B2 (en) * | 2015-12-21 | 2018-09-11 | Qualcomm Incorporated | Channel adjustment for inter-frame temporal shift variations |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
CN108269577B (zh) * | 2016-12-30 | 2019-10-22 | 华为技术有限公司 | 立体声编码方法及立体声编码器 |
CN109427337B (zh) * | 2017-08-23 | 2021-03-30 | 华为技术有限公司 | 立体声信号编码时重建信号的方法和装置 |
CN109427338B (zh) * | 2017-08-23 | 2021-03-30 | 华为技术有限公司 | 立体声信号的编码方法和编码装置 |
US10891960B2 (en) * | 2017-09-11 | 2021-01-12 | Qualcomm Incorproated | Temporal offset estimation |
US10854209B2 (en) * | 2017-10-03 | 2020-12-01 | Qualcomm Incorporated | Multi-stream audio coding |
EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
CN109600700B (zh) * | 2018-11-16 | 2020-11-17 | 珠海市杰理科技股份有限公司 | 音频数据处理方法、装置、计算机设备和存储介质 |
US20220406322A1 (en) * | 2021-06-16 | 2022-12-22 | Soundpays Inc. | Method and system for encoding and decoding data in audio |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE519981C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
KR101434198B1 (ko) * | 2006-11-17 | 2014-08-26 | 삼성전자주식회사 | 신호 복호화 방법 |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
KR101629862B1 (ko) * | 2008-05-23 | 2016-06-24 | 코닌클리케 필립스 엔.브이. | 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더 |
US8355921B2 (en) * | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
WO2010013450A1 (ja) * | 2008-07-29 | 2010-02-04 | パナソニック株式会社 | 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム |
WO2010017833A1 (en) * | 2008-08-11 | 2010-02-18 | Nokia Corporation | Multichannel audio coder and decoder |
US8219408B2 (en) * | 2008-12-29 | 2012-07-10 | Motorola Mobility, Inc. | Audio signal decoder and method for producing a scaled reconstructed audio signal |
US8504378B2 (en) | 2009-01-22 | 2013-08-06 | Panasonic Corporation | Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same |
WO2010091555A1 (zh) | 2009-02-13 | 2010-08-19 | 华为技术有限公司 | 一种立体声编码方法和装置 |
CN102656627B (zh) | 2009-12-16 | 2014-04-30 | 诺基亚公司 | 多信道音频处理方法和装置 |
PL3035330T3 (pl) | 2011-02-02 | 2020-05-18 | Telefonaktiebolaget Lm Ericsson (Publ) | Określanie międzykanałowej różnicy czasu wielokanałowego sygnału audio |
WO2013120531A1 (en) * | 2012-02-17 | 2013-08-22 | Huawei Technologies Co., Ltd. | Parametric encoder for encoding a multi-channel audio signal |
WO2014108738A1 (en) | 2013-01-08 | 2014-07-17 | Nokia Corporation | Audio signal multi-channel parameter encoder |
TWI557727B (zh) | 2013-04-05 | 2016-11-11 | 杜比國際公司 | 音訊處理系統、多媒體處理系統、處理音訊位元流的方法以及電腦程式產品 |
GB2515089A (en) | 2013-06-14 | 2014-12-17 | Nokia Corp | Audio Processing |
AU2014350366B2 (en) * | 2013-11-13 | 2017-02-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoder for encoding an audio signal, audio transmission system and method for determining correction values |
US9685164B2 (en) * | 2014-03-31 | 2017-06-20 | Qualcomm Incorporated | Systems and methods of switching coding technologies at a device |
-
2017
- 2017-02-02 US US15/422,988 patent/US9978381B2/en active Active
- 2017-02-03 CN CN201780010398.9A patent/CN108701464B/zh active Active
- 2017-02-03 JP JP2018541416A patent/JP6856655B2/ja active Active
- 2017-02-03 EP EP17706610.7A patent/EP3414760B1/en active Active
- 2017-02-03 KR KR1020187023232A patent/KR102230623B1/ko active IP Right Grant
- 2017-02-03 BR BR112018016247-7A patent/BR112018016247A2/pt unknown
- 2017-02-03 WO PCT/US2017/016418 patent/WO2017139190A1/en active Application Filing
- 2017-02-03 ES ES17706610T patent/ES2821676T3/es active Active
- 2017-02-03 CA CA3011741A patent/CA3011741C/en active Active
- 2017-02-10 TW TW106104348A patent/TWI651716B/zh active
Also Published As
Publication number | Publication date |
---|---|
JP6856655B2 (ja) | 2021-04-07 |
CA3011741A1 (en) | 2017-08-17 |
US9978381B2 (en) | 2018-05-22 |
BR112018016247A2 (pt) | 2018-12-18 |
WO2017139190A1 (en) | 2017-08-17 |
CN108701464A (zh) | 2018-10-23 |
JP2019505017A (ja) | 2019-02-21 |
TW201732779A (zh) | 2017-09-16 |
EP3414760A1 (en) | 2018-12-19 |
US20170236521A1 (en) | 2017-08-17 |
KR20180111846A (ko) | 2018-10-11 |
CA3011741C (en) | 2023-01-10 |
ES2821676T3 (es) | 2021-04-27 |
TWI651716B (zh) | 2019-02-21 |
KR102230623B1 (ko) | 2021-03-19 |
EP3414760B1 (en) | 2020-07-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108701464B (zh) | 多个音频信号的编码 | |
US10891961B2 (en) | Encoding of multiple audio signals | |
CN110622242B (zh) | 用于立体声解码的立体声参数 | |
CN110800051B (zh) | 具有时域信道间带宽延展的高频带残值预测 | |
CN110770825B (zh) | 时域通道间预测 | |
CN110168637B (zh) | 多个音频信号的译码 | |
CN110447072B (zh) | 声道间带宽扩展 | |
KR102581558B1 (ko) | 채널간 위상차 파라미터 수정 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |