CN116721668A - 编码音频数据的装置和方法 - Google Patents
编码音频数据的装置和方法 Download PDFInfo
- Publication number
- CN116721668A CN116721668A CN202310746061.1A CN202310746061A CN116721668A CN 116721668 A CN116721668 A CN 116721668A CN 202310746061 A CN202310746061 A CN 202310746061A CN 116721668 A CN116721668 A CN 116721668A
- Authority
- CN
- China
- Prior art keywords
- band
- channel
- spectral mapping
- spectral
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000003595 spectral effect Effects 0.000 claims abstract description 265
- 238000013507 mapping Methods 0.000 claims abstract description 226
- 230000005284 excitation Effects 0.000 claims abstract description 108
- 238000007476 Maximum Likelihood Methods 0.000 claims abstract description 11
- 230000015572 biosynthetic process Effects 0.000 claims description 21
- 238000003786 synthesis reaction Methods 0.000 claims description 21
- 230000005236 sound signal Effects 0.000 description 80
- 230000000875 corresponding effect Effects 0.000 description 37
- 238000012545 processing Methods 0.000 description 15
- 230000004044 response Effects 0.000 description 14
- 230000001364 causal effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 12
- 230000002123 temporal effect Effects 0.000 description 11
- 230000003111 delayed effect Effects 0.000 description 9
- 238000001228 spectrum Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000012952 Resampling Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000010363 phase shift Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/005—Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/12—Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/02—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo four-channel type, e.g. in which rear channel signals are derived from two-channel stereo signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/15—Aspects of sound capture and related signal processing for recording or reproduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Otolaryngology (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Mobile Radio Communication Systems (AREA)
- Transmitters (AREA)
- Error Detection And Correction (AREA)
Abstract
本公开公开了编码音频数据的装置和方法。该装置包括:编码器,其经配置以:基于当前帧中的时间移位值识别非参考目标信道;产生该非参考目标信道的高频带部分;基于对应于该非参考目标信道的非参考高频带激励产生经合成非参考高频带信道;基于应用于该经合成非参考高频带信道的最大似然性度量及该非参考目标信道的该高频带部分产生一或多个频谱映射参数;将该一或多个频谱映射参数应用于该经合成非参考高频带信道以产生频谱状经合成非参考高频带信道;及基于该一或多个频谱映射参数及该频谱状经合成非参考高频带信道产生经编码位流;及发射器,其经配置以将该经编码位流发射到第二装置。
Description
本申请是申请日为2018年2月8日、申请号为:201880013501.X、发明名称为“信道间带宽扩展频谱映射及调整”的发明专利申请的分案申请。
优先权主张
本申请案要求2017年3月9日申请的标题为“信道间带宽扩展频谱映射及调整(INTER-CHANNEL BANDWIDTH EXTENSION SPECTRAL MAPPING AND ADJUSTMENT)”的美国临时专利申请案第62/469,432号以及2018年2月7日申请的标题为“信道间带宽扩展频谱映射及调整(INTER-CHANNEL BANDWIDTH EXTENSION SPECTRAL MAPPING AND ADJUSTMENT)”的美国非临时专利申请案第15/890,670号的优先权,前述申请案中的每一者的内容以全文引用的方式并入本文中。
技术领域
本发明大体上涉及多个音频信号的编码。
背景技术
技术的进步已带来更小且更强大的计算装置。举例来说,当前存在多种携带型个人计算装置,包含无线电话(例如移动电话及智能型电话)、平板计算机及膝上型计算机,所述携带型个人计算装置为小的轻质的且容易由用户携带。此些装置可经由无线网络来传达语音及数据包。另外,许多此类装置并入额外功能,例如数字静态摄像机、数字视频摄像机、数字记录器及音频档案播放器等。而且,此些装置可处理可执行指令,所述指令包含可用以存取因特网的软件应用,例如网页浏览器应用等。因而,此些装置可以包含显著计算能力。
计算装置可包含或耦合到多个麦克风以接收音频信号。一般来说,与多个麦克风的第二麦克风相比,声源更接近于第一麦克风。因此,由于麦克风距声源的各别距离,从第二麦克风接收的第二音频信号可相对于从第一麦克风接收的第一音频信号延迟。在其它实施方案中,第一音频信号可相对于第二音频信号延迟。在立体编码中,来自麦克风的音频信号可经编码以产生中间信道信号及一或多个侧信道信号。中间信道信号可对应于第一音频信号与第二音频信号的总和。侧信道信号可对应于第一音频信号与第二音频信号之间的差。
发明内容
在特定实施方案中,一种装置包括:编码器,其经配置以:基于当前帧中的时间移位值识别非参考目标信道;产生所述非参考目标信道的高频带部分;基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道;基于应用于所述经合成非参考高频带信道的最大似然性度量及所述非参考目标信道的所述高频带部分产生一或多个频谱映射参数;将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道;及基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流;及发射器,其经配置以将所述经编码位流发射到第二装置。
在特定实施方案中,一种编码音频数据的方法包括:基于当前帧中的时间移位值识别非参考目标信道基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道;基于应用于所述经合成非参考高频带信道的最大似然性度量及所述非参考目标信道的高频带部分估计一或多个频谱映射参数;将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道;基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流;及将所述经编码位流发射到第二装置。
在特定实施方案中,一种装置包括:用于基于当前帧中的时间移位值识别非参考目标信道的部件;用于产生所述非参考目标信道的高频带部分的部件;用于基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道的部件;用于基于应用于所述经合成非参考高频带信道的最大似然性度量及所述非参考目标信道的所述高频带部分估计一或多个频谱映射参数的部件;用于将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道的部件;用于基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流的部件;及用于将所述经编码位流发射到第二装置的部件。
在特定实施方案中,一种装置包括:解码器,其经配置以:从所接收低频带位流产生参考信道及非参考目标信道,所述低频带位流是从第二装置的编码器接收;基于当前帧中的时间移位值识别非参考目标信道;基于应用于对应于所述非参考目标信道的非参考高频带激励的最大似然性度量产生经合成非参考高频带信道;从所接收频谱映射位流提取一或多个频谱映射参数,所述频谱映射位流是从所述第二装置的所述编码器接收;通过将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道来产生频谱状经合成非参考高频带信道;及至少基于所述频谱状经合成非参考高频带信道、所述参考信道及所述非参考目标信道产生输出信号。
在特定实施方案中,一种装置包含编码器,其经配置以基于高频带参考信道指示符选择左信道或右信道作为非参考目标信道。所述编码器也经配置以基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道。所述编码器也经配置以产生所述非参考目标信道的高频带部分。所述编码器经进一步配置以基于所述经合成非参考高频带信道及所述非参考目标信道的所述高频带部分估计一或多个频谱映射参数。所述编码器也经配置以将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道。所述编码器经进一步配置以基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流。所述装置也包含经配置以将所述经编码位流发射到第二装置的发射器。
在另一特定实施方案中,一种方法包含在第一装置的编码器处基于高频带参考信道指示符选择左信道或右信道作为非参考目标信道。所述方法还包含基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道。所述方法还包含产生所述非参考目标信道的高频带部分。所述方法进一步包含基于所述经合成非参考高频带信道及所述非参考目标信道的所述高频带部分估计一或多个频谱映射参数。所述方法还包含将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道。所述方法进一步包含基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流。所述方法还包含将所述经编码位流发射到第二装置。
在另一特定实施方案中,一种非暂时性计算机可读媒体包含在由第一装置的编码器执行时使得所述编码器执行包含以下项的操作的指令:基于高频带参考信道指示符选择左信道或右信道作为非参考目标信道。所述操作还包含基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道。所述操作还包含产生所述非参考目标信道的高频带部分。所述操作还包含基于所述经合成非参考高频带信道及所述非参考目标信道的所述高频带部分估计一或多个频谱映射参数。所述操作还包含将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道。所述操作还包含基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流。所述操作还包含启动所述经编码位流到第二装置的发射。
在另一特定实施方案中,一种装置包含用于基于高频带参考信道指示符选择左信道或右信道作为非参考目标信道的装置。所述装置还包含用于基于对应于非参考目标信道的非参考高频带激励产生经合成非参考高频带信道的装置。所述装置还包含用于产生所述非参考目标信道的高频带部分的装置。所述装置进一步包含用于基于所述经合成非参考高频带信道及所述非参考目标信道的所述高频带部分估计一或多个频谱映射参数的装置。所述装置还包含用于将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道的装置。所述装置进一步包含用于基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流的装置。所述装置还包含用于将经编码位流发射到第二装置的装置。
在另一特定实施方案中,一种装置包含经配置以从所接收低频带位流产生参考信道及非参考信道的解码器。所述低频带位流是从第二装置的编码器接收。所述解码器还经配置以基于对应于所述非参考信道的非参考高频带激励产生经合成非参考高频带信道。所述解码器经进一步配置以从所接收频谱映射位流提取一或多个频谱映射参数。所述频谱映射位流是从所述第二装置的所述编码器接收。所述解码器还经配置以通过将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道来产生频谱状经合成非参考高频带信道。所述解码器经进一步配置以至少基于所述频谱状非参考高频带信道、所述参考信道及所述非参考目标信道产生输出信号。所述装置还包含经配置以显现所述输出信号的播放装置。在一些实施中,所述参考信道及所述非参考目标信道可为基于降混位流产生于所述解码器处的信道。根据一个实施方案,所述解码器可在未产生所述参考信道及所述非参考目标信道的情况下产生所述左信道及所述右信道的所述低频带部分。
在另一特定实施方案中,一种方法包含在装置的解码器处从所接收低频带位流产生参考信道及非参考信道。所述低频带位流是从第二装置的编码器接收。所述方法也包含基于对应于所述非参考信道的非参考高频带激励产生经合成非参考高频带信道。所述方法进一步包含从所接收频谱映射位流提取一或多个频谱映射参数。所述频谱映射位流是从所述第二装置的所述编码器接收。所述方法还包含通过将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道来产生频谱状经合成非参考高频带信道。所述方法进一步包含至少基于所述频谱状非参考高频带信道、所述参考信道及所述非参考目标信道产生输出信号。所述方法也包含在播放装置处显现所述输出信号。
在另一特定实施方案中,一种非暂时性计算机可读媒体包含在由装置的解码器执行时使得所述解码器执行包含以下项的操作的指令:从所接收低频带位流产生参考信道及非参考信道。所述低频带位流是从第二装置的编码器接收。所述操作也包含基于对应于所述非参考信道的非参考高频带激励产生经合成非参考高频带信道。所述操作还包含从所接收频谱映射位流提取一或多个频谱映射参数。所述频谱映射位流是从所述第二装置的所述编码器接收。所述操作还包含通过将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道来产生频谱状经合成非参考高频带信道。所述操作还包含至少基于所述频谱状非参考高频带信道、所述参考信道及所述非参考目标信道产生输出信号。所述操作还包含将所述输出信号提供到播放装置用于显现。
在另一特定实施方案中,一种装置包含用于从所接收低频带位流产生非参考信道的装置。所述低频带位流是从第二装置的编码器接收。所述装置还包含用于基于对应于非参考信道的非参考高频带激励产生经合成非参考高频带信道的装置。所述装置还包含用于从所接收频谱映射位流提取一或多个频谱映射参数的装置。所述频谱映射位流是从所述第二装置的所述编码器接收。所述装置还包含用于通过将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道来产生频谱状经合成非参考高频带信道的装置。所述装置还包含用于至少基于所述频谱状非参考高频带信道、所述参考信道及所述非参考目标信道产生输出信号的装置。所述装置还包含用于显现所述输出信号的装置。
在检阅整个申请案之后,本发明的其它实施方案、优势及特征将变得显而易见,所述整个申请案包含以下章节:附图说明、具体实施方式及权利要求书。
附图说明
图1为包含可用以估计一或多个频谱映射参数的编码器及可用以提取一或多个频谱映射参数的解码器的系统的特定说明性实例的框图;
图2A为说明图1的编码器的图;
图2B为说明中间信道带宽扩展(BWE)编码器的图;
图3A为说明图1的解码器的图;
图3B为说明中间信道BWE解码器的图;
图4为说明图1的编码器的信道间带宽扩展编码器的第一部分的图;
图5为说明图1的编码器的信道间带宽扩展编码器的第二部分的图;
图6为说明图1的信道间带宽扩展解码器的图;
图7为估计一或多个频谱映射参数的方法的特定实例;
图8为提取一或多个频谱映射参数的方法的特定实例;
图9为可用以估计一或多个频谱映射参数的移动装置的特定说明性实例的框图;且
图10为可用以估计一或多个频谱映射参数的基站的框图。
具体实施方式
下文参考图式描述本发明的特定方面。在描述中,共同特征通过共同参考编号指示。如本文所使用,各种术语仅仅用于描述特定实施的目的,且并不意味着限制实施。举例来说,除非内容以其它方式明确地指示,否则单数形式“一”、“一个”及“所述”意味着同样包含复数形式。可进一步理解,术语“包括”及“包括着”可与“包含”或“包含着”互换使用。另外,应理解,术语“其中”可与“在……的情况下”互换使用。如本文中所使用,用以修饰元件(诸如,结构、组件、操作等等)的序数术语(例如,“第一”、“第二”、“第三”等等)本身不指示元件关于另一元件的任何优先权或次序,而是仅将元件与具有相同名称的另一元件区别开(除非使用序数术语)。如本文所使用,术语“集合”指特定元素中的一或多者,且术语“多个”指特定元素中的多个(例如,两个或两个以上)。
在本发明中,例如“确定”、“计算”、“移位”、“调整”等的术语可用于描述如何执行一或多个操作。应注意,此些术语不应解释为限制性的且其它技术可用以执行类似操作。另外,如本文中所提及,“产生”、“计算”、“使用”、“选择”、“存取”与“确定”可互换地使用。举例来说,“产生”、“计算”或“确定”参数(或信号)可指积极地产生、计算或确定参数(或信号),或可指使用、选择或存取已(例如)由另一组件或装置产生的参数(或信号)。
揭示可操作以编码多个音频信号的系统及装置。装置可包含经配置以编码多个音频信号的编码器。可使用多个记录装置(例如,多个麦克风)同时及时地俘获多个音频信号。在一些实例中,通过多路发射若干同时或非同时记录的音频信道可合成地(例如,人工)产生多个音频信号(或多信道音频)。如说明性实例,音频信道的并行记录或多路发射可产生2信道配置(即,立体声:左及右)、5.1信道配置(左、右、中央、左环绕、右环绕及低频重音(LFE)信道)、7.1信道配置、7.1+4信道配置、22.2信道配置或N信道配置。
电话会议室(或远程呈现室)中的音频俘获装置可包含获取空间音频的多个麦克风。空间音频可包含话语以及经编码且经发射的背景音频。视如何布置麦克风以及来源(例如,讲话者)相对于麦克风及房间大小所处的位置,来自给定来源(例如,讲话者)的话语/音频可于不同时间到达多个麦克风处。举例来说,相比于与装置相关联的第二麦克风,声源(例如,讲话者)可更接近与装置相关联的第一麦克风。因此,与第二麦克风相比,从声源发出的声音可更早到达第一麦克风。装置可经由第一麦克风接收第一音频信号且可经由第二麦克风接收第二音频信号。
中侧(MS)译码及参数立体(PS)译码为可提供优于双单信道译码技术的经改进性能的立体译码技术。在双单信道译码中,左(L)信道(或信号)及右(R)信道(或信号)经独立地译码,而不利用信道间相关。在译码之前,通过将左信道及右信道转换为总信道及差信道(例如,侧信道),MS译码减少相关L/R信道对之间的冗余。总信号及差信号经波形译码或基于MS译码中的模型而译码。总信号比侧信号耗费相对更多的位。PS译码通过将L/R信号转换为总信号及一组侧参数来减少每一子带中的冗余。侧参数可指示信道间强度差(IID)、信道间相位差(IPD)、信道间时差(ITD)、侧或残余预测增益等。总信号为经译码的波形且与侧参数一起发射。在混合型系统中,侧信道可在较低频带中(例如,小于2千赫兹(kHz))经波形译码,并在较高频带(例如,大于或等于2kHz)中经PS译码,其中信道间相位保持在感知上并不关键。在一些实施方案中,PS译码也可在波形译码之前用于较低频带中以减少信道间冗余。
可在频域或子带域中完成MS译码及PS译码。在一些实例中,左信道及右信道可不相关。举例来说,左信道及右信道可包含不相关的合成信号。当左信道及右信道不相关时,MS译码、PS译码或两者的译码效率可接近于双单信道译码的译码效率。
取决于记录配置,可在左信道与右信道之间存在时间性移位以及其它空间效应(例如回声及室内混响等)。如果并不补偿信道之间的时间移位及相位失配,那么总信道及差信道可含有减少与MS或PS技术相关联的译码增益的可比能量。译码增益的减少可基于时间(或相位)移位的量。总信号及差信号的可比能量可限制信道经时间移位但高度相关的某些帧中的MS译码的使用。在立体译码中,中间信道(例如,总信道)及侧信道(例如,差信道)可基于以下公式产生:
M=(L+R)/2,S=(L-R)/2, 公式1
其中M对应于中间信道,S对应于侧信道,L对应于左信道且R对应于右信道。
在一些状况下,中间信道及侧信道可基于以下公式产生:
M=c(L+R),S=c(L-R), 公式2
其中c对应于频率相关的复合值。基于公式1或公式2而产生中间信道及侧信道可被称作“降混”。基于公式1或公式2而从中间信道及侧信道产生左信道及右信道的相反过程可被称作“升混”。
在一些状况下,中间信道可基于其它公式,例如:
M=(L+gDR)/2,或 公式3
M=g1L+g2R 公式4
其中g1+g2=1.0,且其中gD为增益参数。在其它实例中,降混可在频带中执行,其中中间(b)=c1L(b)+c2R(b),其中c1及c2为复数,其中侧(b)=c3L(b)-c4R(b),且其中c3及c4为复数。
用以在MS译码或双单信道译码之间选择特定帧的特别途径可包含:产生中间信号及侧信号,计算中间信号及侧信号的能量,并基于所述能量确定是否执行MS译码。举例来说,可执行MS译码以响应侧信号与中间信号的能量比小于阈值的确定。为了说明,如果右信道经移位至少第一时间(例如,约0.001秒或48kHz下的48个样本),那么中间信号(对应于左信号与右信号的总和)的第一能量可与用于有声话语帧的侧信号(对应于左信号与右信号之间的差)的第二能量相当。当第一能量与第二能量相当时,较高数目个位可用以编码侧信道,从而降低MS译码相对于双单信道译码的译码效率。可因此在第一能量与第二能量相当时使用双单信道译码(例如,当第一能量与第二能量的比大于或等于阈值时)。在替代途径中,可基于左信道与右信道的阈值及归一化交叉相关值的比较来在MS译码与双单信道译码之间决定何者用于特定帧。
在一些实例中,编码器可确定指示第一音频信号与第二音频信号之间的时间未对准的量的失配值。如本文所使用,“时间移位值”、“移位值”及“失配值”可被互换地使用。举例来说,编码器可确定指示第一音频信号相对于第二音频信号的移位(例如,时间失配)的时间移位值。时间失配值可对应于在第一麦克风处第一音频信号的接收与在第二麦克风处第二音频信号的接收之间的时间延迟的量。此外,编码器可在逐帧基础上确定时间失配值,例如,基于每20毫秒(ms)话语/音频帧。举例来说,时间失配值可对应于第二音频信号的第二帧相对于第一音频信号的第一帧延迟的时间的量。替代地,时间失配值可对应于第一音频信号的第一帧相对于第二音频信号的第二帧延迟的时间的量。
当与第二麦克风相比,声源更接近第一麦克风时,第二音频信号的帧可相对于第一音频信号的帧延迟。在此情况下,第一音频信号可被称为“参考音频信号”或“参考信道”且经延迟第二音频信号可被称为“目标音频信号”或“目标信道”。替代地,当与第一麦克风相比,声源更接近第二麦克风时,第一音频信号的帧可相对于第二音频信号的帧延迟。在此情况下,第二音频信号可被称为参考音频信号或参考信道,且经延迟第一音频信号可被称为目标音频信号或目标信道。
视声源(例如讲话者)位于会议室或远程呈现室内的位置及声源(例如讲话者)位置如何相对于麦克风改变而定,参考信道及目标信道可从一个帧改变到另一帧;类似地,时间延迟值也可从一个帧改变到另一帧。然而,在一些实施方案中,时间失配值可始终为正的,以指示“目标”信道相对于“参考”信道的延迟量。此外,时间失配值可对应于“非因果移位”值,经延迟目标信道通过所述“非因果移位”值在时间上“经拉回”,使得目标信道与“参考”信道对准(例如最大限度地对准)。可对参考信道及经非因果移位的目标信道执行确定中间信道及侧信道的降混算法。
编码器可基于参考音频信道及应用于目标音频信道的多个时间失配值而确定时间失配值。举例来说,可在第一时间(m1)处接收参考音频信道的第一帧X。可在对应于第一时间失配值的第二时间(n1)处接收目标音频信道的第一特定帧Y,例如,shift1=n1-m1。另外,可在第三时间(m2)接收参考音频信道的第二帧。可在对应于第二时间失配值的第四时间(n2)处接收目标音频信道的第二特定帧,例如,移位shift2=n2-m2。
装置可以第一取样速率(例如,32kHz取样速率(即,每帧640个样本))进行成框或缓冲算法,以产生帧(例如,20ms样本)。为响应第一音频信号的第一帧及第二音频信号的第二帧同时到达装置的确定,编码器可估计如等于零样本的时间失配值(例如shift1)。可在时间上对准左信道(例如,对应于第一音频信号)及右信道(例如,对应于第二音频信号)。在一些状况下,即使当对准时,左信道及右信道可归因于各种原因(例如麦克风校准)在能量方面存在不同。
在一些实例中,左信道及右信道可由于各种原因(例如,与麦克风中的另一者相比,声源(例如讲话者等)可更接近麦克风中的一者,且两个麦克风相隔距离可大于阈值(例如,1到20厘米)距离)在时间上未对准。声源相对于麦克风的位置可在左信道及右信道中引入不同的延迟。此外,在左信道与右信道之间可存在增益差、能量差或水平差。
在一些实例中,在存在超过两个信道的情况下,参考信道最初基于信道的水平或能量而被选择,且随后基于不同信道对之间的时间失配值(例如,t1(ref,ch2),t2(ref,ch3),t3(ref,ch4),…t3(ref,chN))而被改进,其中ch1为最初参考信道且t1(.)、t2(.)等为估计失配值的函数。如果所有时间失配值为正的,那么ch1被视为参考信道。如果失配值中的任一者为负值,那么参考信道经重配置成与产生负值的失配值相关联的信道且上述过程继续直到实现参考信道的最佳选择(即,基于最大限度地去相关最大数目的侧信道)为止。迟滞可用以克服参考信道选择中的任何急剧变化。
在一些实例中,当多个讲话者交替地讲话时(例如,在不重叠情况下),音频信号从多个声源(例如,讲话者)到达麦克风的时间可变化。在此状况下,编码器可基于讲话者动态地调节时间失配值以识别参考信道。在一些其它实例中,多个讲话者可同时讲话,取决于哪个讲话者最大声、距麦克风最近等,此可导致变化时间性失配值。在此状况下,参考及目标信道的识别可基于当前帧中的变化的时间移位值及先前帧中的经估计时间失配值,及第一及第二音频信号的能量或时间演进。
在一些实例中,当两种信号可能展示较少(例如,无)相关时,可合成或人工产生第一音频信号及第二音频信号。应理解,本文所描述的实例为说明性且可在类似或不同情境中确定第一音频信号与第二音频信号之间的关系中具指导性。
编码器可基于第一音频信号的第一帧与第二音频信号的多个帧的比较产生比较值(例如,差值或交叉相关值)。所述多个帧中的每一帧可对应于特定时间失配值。编码器可基于比较值产生第一经估计时间失配值。举例来说,第一估计时间失配值可对应于指示第一音频信号的第一帧与第二音频信号的对应第一帧之间较高时间类似性(或较低差)的比较值。
编码器可通过在多个阶段中优化序列经估计时间失配值来确定最终时间失配值。举例来说,编码器可首先基于从第一音频信号及第二音频信号的立体声经预处理及经重新取样版本产生的比较值而估计“暂订”时间失配值。编码器可产生与接近于经估计“暂订”时间失配值的时间失配值相关联的经内插比较值。编码器可基于经内插的比较值确定第二经估计“内插”时间失配值。举例来说,第二经估计“内插”时间失配值可对应于指示比剩余经内插的比较值及第一经估计“暂订”时间失配值更高的时间类似性(或较低差)的特定内插比较值。如果当前帧(例如第一音频信号的第一帧)的第二经估计“内插”时间失配值与前一帧(例如先于第一帧的第一音频信号的帧)的最终时间失配值不同,那么当前帧的“内插”时间失配值经进一步“修正”以改进第一音频信号与经移位第二音频信号之间的时间类似性。具体来说,第三经估计“修正”时间失配值可通过查究当前帧的第二经估计“内插”时间失配值及前一帧的最终经估计时间失配值来对应于时间类似性的更准确量度。第三经估计“修正”时间失配值经进一步调节以通过限制帧之间的时间失配值中的任何伪改变来估计最终时间失配值,且受进一步控制以不在如本文中所描述的两个连续(或相连)帧中从负时间失配值切换到正时间失配值(或反之亦然)。
在一些实例中,编码器可制止在相连帧中或在邻近帧中在正时间失配值与负时间失配值之间切换或反之亦然。举例来说,编码器可将最终时间失配值设定成特定值(例如0),所述特定值基于第一帧的经估计“内插”或“修正”时间失配值及先于第一帧的特定帧中的对应经估计“内插”或“修正”或最终时间失配值而指示无时间性移位。为了说明,为响应当前帧的经估计的“暂订”或“内插”或“修正”失配值中的一者为正数的且前一帧(例如,前于第一帧的帧)的经估计的“暂订”或“内插”或“修正”或“最终”估计失配值中的另一者为负数的确定,编码器可设定当前帧(例如,第一帧)的最终失配值以指示无时间性移位,即shift1=0。替代地,为响应当前帧的经估计的“暂订”或“内插”或“修正”失配值中的一者为负数的且前一帧(例如,前于第一帧的帧)的经估计的“暂订”或“内插”或“修正”或“最终”估计失配值中的另一者为正数的确定,编码器也可设定当前帧(例如,第一帧)的最终失配值以指示无时间性移位,即移位1=0。
编码器可基于时间失配值而将第一音频信号或第二音频信号的帧选作“参考”或“目标”。举例来说,响应于确定最终时间失配值为正数,编码器可产生具有指示第一音频信号为“参考”信号且第二音频信号为“目标”信号的第一值(例如,0)的参考信道或信号指示符。替代地,响应于确定最终时间失配值为负数,编码器可产生具有指示第二音频信号为“参考”信号且第一音频信号为“目标”信号的第二值(例如,1)的参考信道或信号指示符。
编码器可估计与参考信号相关的相对增益(例如,相对增益参数)及非因果经移位目标信号。举例来说,响应于确定最终时间失配值为正数,编码器可估计增益值以标准化或均衡第一音频信号相对于第二音频信号的按非因果时间失配值(例如最终时间失配值的绝对值)偏移的振幅或功率电平。替代地,响应于确定最终时间失配值为负数,编码器可估计增益值以标准化或均衡非因果经移位第一音频信号相对于第二音频信号的振幅或功率电平。在一些实例中,编码器可估计增益值以标准化或均衡“参考”信号相对于非因果经移位“目标”信号的振幅或功率电平。在其它实例中,编码器可基于相对于目标信号(例如,未移位目标信号)的参考信号估计增益值(例如,相对增益值)。
编码器可基于参考信号、目标信号、非因果时间失配值及相对增益参数产生至少一个经编码信号(例如,中间信号、侧信号或两者)。在其它实施方案中,编码器可基于参考信道及时间失配经调整目标信道产生至少一个经编码信号(例如,中间信道、侧信道或两者)。侧信号可对应于第一音频信号的第一帧的第一样本与第二音频信号的所选择帧的所选择样本之间的差。编码器可基于最终时间失配值选择所选帧。由于第一样本与所选择的样本之间的减小的差,相比于对应于第二音频信号的帧(与第一帧同时由装置接收)的第二音频信号的其它样本,更少的位可用于编码侧信道信号。装置的发射器可发射至少一个经编码信号、非因果时间失配值、相对增益参数、参考信道或信号指示符或其组合。
编码器可基于参考信号、目标信号、非因果时间失配值、相对增益参数、第一音频信号的特定帧的低频带参数、特定帧的高频带参数或其一组合产生至少一个经编码信号(例如,中间信号、侧信号或两者)。所述特定帧可先于第一帧。来自一或多个前述帧的某些低频带参数、高频带参数或其组合可用于编码第一帧的中间信号、侧信号或两者。基于低频带参数、高频带参数或其组合对中间信号、侧信号或两者进行编码可改进非因果时间失配值及信道间相对增益参数的估计值。低频带参数、高频带参数或其组合可包含音调参数、语音参数、译码器类型参数、低频带能量参数、高频带能量参数、包络参数(例如,倾角参数)、音调增益参数、FCB增益参数、译码模式参数、语音活动参数、噪声估计参数、讯杂比参数、共振峰参数、话语/音乐判断参数、非因果移位、信道间增益参数或其组合。装置的发射器可发射至少一个经编码信号、非因果时间失配值、相对增益参数、参考信道(或信号)指示符或其组合。在本发明中,例如“确定”、“计算”、“移位”、“调整”等的术语可用于描述如何执行一或多个操作。应注意,此些术语不应解释为限制性的且其它技术可用以执行类似操作。
参看图1,揭示系统的特定说明性实例且所述系统整体指定为100。系统100包含经由网络120以通信方式耦合到第二装置106的第一装置104。网络120可包含:一或多个无线网络、一或多个有线网络或其组合。
第一装置104可包含存储器153、编码器200、发射器110及一或多个输入接口112。存储器153可为包含指令191的非暂时性计算机可读媒体。指令191可为可由编码器200执行以执行本文中所描述的操作中的一或多者。输入接口112中的第一输入接口可耦合到第一麦克风146。输入接口112中的第二输入接口可耦合到第二麦克风148。编码器200可包含信道间带宽扩展(ICBWE)编码器204。ICBWE编码器204可经配置以基于经合成非参考高频带及非参考目标信道估计一或多个频谱映射参数。与ICBWE编码器204的操作相关联的额外细节关于图2及4到5进行描述。
第二装置106可包含解码器300。解码器300可包含ICBWE解码器306。ICBWE解码器306可经配置以从所接收频谱映射位流提取一或多个频谱映射参数。与ICBWE解码器306的操作相关联的额外细节关于图3及6进行描述。第二装置106可耦合到第一扬声器142、第二扬声器144或两者。尽管图中未示,但第二装置106可包含其它组件,例如处理器(例如,中央处理单元)、麦克风、接收器、发射器、天线、存储器等。
在操作期间,第一装置104可经由第一输入接口从第一麦克风146接收第一音频信道130(例如,第一音频信号),且可经由第二输入接口从第二麦克风148接收第二音频信道132(例如,第二音频信号)。第一音频信道130可对应于右信道或左信道中的一者。第二音频信道132可对应于右信道或左信道中的另一者。与第二麦克风148相比,声源152(例如,用户、扬声器、环境噪声、乐器等)可更接近第一麦克风146。因此,相比于经由第二麦克风148,来自声源152的音频信号可在较早时间经由第一麦克风146在输入接口112处接收。经由多个麦克风的多信道信号获取中的此自然延迟可能会在第一音频信道130与第二音频信道132之间引入时间未对准。
根据一个实施方案,第一音频信道130可为“参考信道”,且第二音频信道132可为“目标信道”。目标信道可经调整(例如,经时间移位)以大体上与参考信道对准。根据另一实施方案,第二音频信道132可为参考信道,且第一音频信道130可为目标信道。根据一个实施方案,参考信道及目标信道可在逐帧基础上变化。举例来说,对于第一帧,第一音频信道130可为参考信道,且第二音频信道132可为目标信道。然而,对于第二帧(例如,后续帧),第一音频信道130可为目标信道,且第二音频信道132可为参考信道。为便于描述,除非下文另外指出,否则第一音频信道130为参考信道,且第二音频信道132为目标信道。应注意,关于音频信道130、132描述的参考信道可独立于下文描述的高频带参考信道指示符。举例来说,高频带参考信道指示符可指示信道130、132中任一者的高频带为高频带参考信道,且高频带参考信道指示符可指示可为与参考信道相同或不同的信道的高频带参考信道。
如关于图2A、4及5更详细描述,编码器200可产生降混位流216、ICBWE位流242、高频带中间信道位流244及低频带位流246。发射器110可经由网络120将降混位流216、ICBWE位流242、高频带中间信道位流244或其一组合发射到第二装置106。替代地或另外,发射器110可将降混位流216、ICBWE位流242、高频带中间信道位流244或其一组合存储在网络120的装置或本地装置处,以供稍后进一步处理或解码。
解码器300可基于降混位流216、ICBWE位流242、高频带中间信道位流244及低频带位流246执行解码操作。举例来说,解码器300可基于降混位流216、低频带位流246、ICBWE位流242及高频带中间信道位流244产生第一信道(例如,第一输出信道126)及第二信道(例如,第二输出信道128)。第二装置106可经由第一扬声器142输出第一输出信道126。第二装置106可经由第二扬声器144输出第二输出信道128。在替代性实例中,第一输出信道126及第二输出信道128可作为立体声信号对发射到单个输出扬声器。
如下文所述,图1的ICBWE编码器204可基于最大似然性度量或开环或闭环频谱失真减少度量而估计频谱映射参数,使得频谱状经合成非参考高频带信道的频谱形状(例如,频谱包络或频谱倾角)大体上类似于非参考目标信道的频谱形状(例如,频谱包络)。可在ICBWE位流242中将频谱映射参数发射到解码器300,并在解码器300处使用以产生在左信道及右信道之间具有经减少伪影及改进式空间平衡的输出信号126、128。
参看图2A,展示可操作以估计频谱映射参数的编码器200的特定实施方案。编码器200包含降混器202、ICBWE编码器204、中间信道BWE编码器206、低频带编码器208及滤波器组290。
可将左信道212及右信道214提供到降混器202。根据一个实施方案,左信道212及右信道214可为频域信道(例如,变换域信道)。根据另一实施方案,左信道212及右信道214可为时域信道。降混器202可经配置以降混左信道212及右信道214以产生降混位流216、中间信道222及低频带侧信道224。尽管低频带侧信道224展示为经估计,但在其它替代性实施方案中,可以替代方式产生并编码全带宽侧信道,且可将对应位流发射到解码器。降混位流216可包含基于左信道212及右信道214的降混参数(例如,移位参数、目标增益参数、参考信道指示符、信道间水平差、信道间相位差等)。降混位流216可从编码器200发射到例如图3A的解码器300的解码器。
中间信道222可表示信道212、214的整个频带,且低频带侧信道224可表示信道212、214的低频带部分。作为非限制性实例,中间信道222可在信道212、214为超宽频信道的情况下表示信道212、214的整个频带(20Hz到16kHz),且低频带侧信道224可表示信道212、214的低频带部分(例如,20Hz到8kHz或20Hz到6.4kHz)。中间信道222可被提供到重取样滤波器组290,且低频带侧信道224可被提供到低频带编码器208。
重取样滤波器组290可经配置以将中间信道222的高频分量及低频分量分开。为了说明,重取样滤波器组290可将中间信道222的高频分量分开以产生高频带中间信道292,且滤波器组290可将中间信道222的低频分量分开以产生低频带中间信道294。在译码模式为超宽频的情境中,高频带中间信道292可从8kHz跨越到16kHz,且低频带中间信道294可从20Hz跨越到8kHz。应了解,本文中所描述的译码模式及频率范围仅为达成说明的目的,且不应被理解为限制性的。在其它实施方案中,译码模式可为不同的(例如,宽频译码模式、完全频带译码模式等)及/或频率范围可为不同的。在其它实施方案中,降混器202可经配置以直接提供低频带中间信道294及高频带中间信道292。在此些实施方案中,滤波器组290处的滤波操作可绕过。高频带中间信道292可被提供到中间信道BWE编码器206,且低频带中间信道294可被提供到低频带编码器208。
低频带编码器208可经配置以编码低频带中间信道294及低频带侧信道224以产生低频带位流246。在一些实施方案中,可绕过包含以下项的以下步骤中的一或多者:产生低频带侧信道224、编码低频带侧信道224,及包含对应于低频带侧信道的信息作为低频带位流246的部分。根据一个实施方案,低频带编码器208可包含中间信道低频带编码器(例如,图中未示且基于ACELP或TCX译码),其经配置以通过编码低频带中间信道294来产生低频带中间信道位流。低频带编码器208也可包含侧信道低频带编码器(例如,图中未示且基于ACELP或TCX译码),其经配置以通过编码低频带侧信道224来产生低频带侧信道位流。低频带位流246可从编码器200发射到解码器(例如,图3A的解码器300)。
低频带编码器208也可产生被提供到中间信道BWE编码器206的低频带激励信号232。中间信道BWE编码器206可经配置以编码高频带中间信道292以产生高频带中间信道位流244。举例来说,中间信道BWE编码器206可基于低频带激励信号232及高频带中间信道292而估计线性预测系数(LPC)、增益形状参数、增益帧参数等,以产生高频带中间信道位流244。根据一个实施方案,中间信道BWE编码器206可使用时域带宽扩展编码高频带中间信道292。高频带中间信道位流244可从编码器200发射到解码器(例如,图3A的解码器300)。
中间信道BWE编码器206可将一或多个参数234提供到信道间BWE编码器204。一或多个参数234可包含谐波高频带激励(例如,图2B的谐波高频带激励237)、经调制噪声(例如,图4的经调制噪声482)、经量化增益形状、经量化线性预测系数(LPC)、经量化增益帧等。也可将左信道212及右信道214提供到信道间BWE编码器204。信道间BWE编码器204可经配置以提取与信道212、214相关联的增益映射参数、与信道212、214相关联的频谱状映射参数等,以促进将一或多个参数234映射到信道212、214。经提取参数可包含于ICBWE位流242中。ICBWE位流242可从编码器200发射到解码器。与ICBWE编码器204相关联的操作关于图4到5更详细描述。因此,图2A的ICBWE编码器204可估计频谱状映射参数,将频谱状映射参数量化到ICBWE位流242中,并将ICBWE位流242发射到解码器。
图2A的编码器200可接收两个信道212、214,并执行信道212、214的降混以产生中间信道222、降混位流216,及(在一些实施方案中)低频带侧信道224。编码器200可使用低频带编码器208编码中间信道222及低频带侧信道224以产生低频带位流246。编码器200也可使用ICBWE编码器204产生映射信息,其指示如何从高频带中间信道(解码器处)映射经解码高频带左信道及右信道(解码器处)。
图2A的ICBWE编码器204可基于最大似然性度量或开环或闭环频谱失真减少度量而估计频谱映射参数,使得频谱状经合成非参考高频带信道的频谱包络大体上类似于非参考目标信道的频谱包络。频谱映射参数可在ICBWE位流242中发射到解码器300,且在解码器300处使用以产生具有经减少的假影的输出信号。
参看图2B,展示中间信道BWE编码器206的特定实施方案。中间信道BWE编码器206包含线性预测系数(LPC)估计器251、LPC量化器252及LPC合成滤波器259。高频带中间信道292被提供到LPC估计器251,且LPC估计器251可经配置以基于高频带中间信道292预测高频带LPC 271。高频带LPC 271被提供到LPC量化器252。LPC量化器252可经配置以量化高频带LPC以产生经量化高频带LPC 457及高频带LPC位流272。经量化LPC 457被提供到LPC合成滤波器259,且高频带LPC位流被提供到多路复用器265。
中间信道BWE编码器206也包含高频带激励产生器299,其包含非线性BWE产生器253、随机噪声产生器254、信号倍增器255、噪声包络调制器256、求和器257及倍增器258。来自低频带编码器208的低频带激励232被提供到非线性BWE产生器253。非线性BWE产生器253可对低频带激励232执行非线性扩展以产生谐波高频带激励237。谐波高频带激励237可包含于一或多个参数234中。谐波高频带激励237被提供到信号倍增器255及噪声包络调制器256。信号倍增器可经配置以基于增益因子(Gain(1))调整谐波高频带激励237,以产生增益经调整谐波高频带激励273。增益经调整谐波高频带激励273被提供到求和器257。
随机噪声产生器254可经配置以产生被提供到噪声包络调制器256的噪声274。噪声包络调制器256可经配置以基于谐波高频带激励237调制噪声274以产生经调制噪声482。经调制噪声482被提供到信号倍增器258。信号倍增器258可经配置以基于增益因子(Gain(2))调整经调制噪声482以产生增益经调整经调制噪声275。增益经调整经调制噪声275被提供到求和器257,且求和器257可经配置以添加增益经调整谐波高频带激励273及增益经调整经调制噪声275以产生高频带激励276。高频带激励276被提供到LPC合成滤波器259。
应注意,在一些实施中,Gain(1)及Gain(2)可为每一向量值对应于子帧中的对应信号的比例因子的向量。
LPC合成滤波器259可经配置以将经量化LPC 457应用于高频带激励276以产生经合成高频带中间信道277。经合成高频带中间信道277被提供到高频带增益形状估计器260,且被提供到高频带增益形状缩放器262。高频带中间信道292也被提供到高频带增益形状估计器260。高频带增益形状估计器260可经配置以基于高频带中间信道292及经合成高频带中间信道277产生高频带增益形状参数278。高频带增益形状参数278被提供到高频带增益形状量化器261。
高频带增益形状量化器261可经配置以量化高频带增益形状参数278并产生经量化高频带增益形状参数279。经量化高频带增益形状参数279被提供到高频带增益形状缩放器262。高频带增益形状量化器261也可经配置以产生被提供到多路复用器265的高频带增益形状位流280。
高频带增益形状缩放器262可经配置以基于经量化高频带增益形状参数279缩放经合成高频带中间信道277,以产生经缩放经合成高频带中间信道281。经缩放经合成高频带中间信道281被提供到高频带增益帧估计器263。高频带增益帧估计器263可经配置以基于经缩放经合成高频带中间信道281估计高频带增益帧参数282。高频带增益帧参数282被提供到高频带增益帧量化器264。
高频带增益帧量化器264可经配置以量化高频带增益帧参数282以产生高频带增益帧位流283。高频带增益帧位流283被提供到多路复用器265。多路复用器265可经配置以组合高频带LPC位流272、高频带增益形状位流280、高频带增益帧位流283及其它信息以产生高频带中间信道位流244。根据一个实施方案,其它信息可包含与经调制噪声482、谐波高频带激励237、经量化高频带LPC 457等相关联的信息。如关于图4更详细所描述,ICBWE编码器204可将提供到多路复用器265的信息用于信号处理操作。
参看图3A,展示可操作以执行频谱形状映射的解码器300的特定实施方案。解码器300包含中间信道BWE解码器302、低频带解码器304、ICBWE解码器306、低频带升混器308、信号组合器310、信号组合器312及信道间移位器314。
从编码器200发射的低频带位流246可提供到低频带解码器304。如上文所描述,低频带位流246可包含低频带中间信道位流及低频带侧信道位流。低频带解码器304可经配置以解码低频带中间信道位流以产生被提供到低频带升混器308的低频带中间信道326。低频带解码器304也可经配置以解码低频带侧信道位流以产生被提供到低频带升混器308的低频带侧信道328。低频带解码器304也可经配置以产生被提供到中间信道BWE解码器302的低频带激励信号325。
中间信道BWE解码器302可经配置以基于低频带激励信号325解码高频带中间信道位流244以产生一或多个参数322(例如,谐波高频带激励、经调制噪声、经量化增益形状、经量化线性预测系数(LPC)、经量化增益帧等)及高频带中间信道324。一或多个参数322可对应于图2A的一或多个参数234。根据一个实施方案,中间信道BWE解码器302可使用时域带宽扩展解码来解码高频带中间信道位流244。一或多个参数322及高频带中间信道324被提供到ICBWE解码器306。
ICBWE位流242也可提供到ICBWE解码器306。ICBWE解码器306可经配置以基于ICBWE位流242、一或多个参数322及高频带中间信道324产生高频带左信道330及高频带右信道332。因此,基于ICBWE位流242及来自中间信道BWE解码的信号及参数,ICBWE解码器306可产生经解码高频带左信道及经解码高频带右信道330、332。与ICBWE解码器306相关联的操作关于图6更详细描述。高频带左信道330被提供到信号组合器310,且高频带右信道332被提供到信号组合器312。低频带升混器308可经配置以基于降混位流216升混低频带中间信道326及低频带侧信道328,以产生低频带左信道334及低频带右信道336。低频带左信道334被提供到信号组合器310,且低频带右信道336被提供到信号组合器312。
信号组合器310可经配置以组合高频带左信道330及低频带左信道334以产生未经移位左信道340。未经移位左信道340被提供到信道间移位器314。信号组合器312可经配置以组合高频带右信道332及低频带右信道336以产生未经移位右信道342。未经移位右信道342被提供到信道间移位器314。应注意,在一些实施方案中,与信道间移位器314相关联的操作可绕过。举例来说,如果对应编码器处的降混器未经配置以在中间信道及侧信道产生之前移位信道中的任一者,那么可绕过与信道间移位器314相关联的操作。信道间移位器314可经配置以基于与降混位流216相关联的移位信息移位未经移位左信道340以产生左信道350。信道间移位器314也可经配置以基于与降混位流216相关联的移位信息移位未经移位右信道342,以产生右信道352。举例来说,信道间移位器314可使用来自降混位流216的移位信息来移位未经移位左信道340、未经移位右信道342或其一组合,以产生左信道及右信道350、352。根据一个实施方案,左信道350为左信道212的经解码版本,且右信道352为右信道214的经解码版本。
参看图3B,展示中间信道BWE解码器302的特定实施方案。中间信道BWE解码器302包含LPC反量化器360、高频带激励产生器362、LPC合成滤波器364、高频带增益形状反量化器366、高频带增益形状缩放器368、高频带增益帧反量化器370及高频带增益帧缩放器372。
高频带LPC位流272被提供到LPC反量化器360。LPC反量化器可从高频带LPC位流272提取经量化高频带LPC 640。如关于图6所描述,经量化高频带LPC 640可由ICBWE解码器306用于信号处理操作。
低频带激励信号325被提供到高频带激励产生器362。高频带激励产生器362可基于低频带激励信号325产生谐波高频带激励630,且可产生经调制噪声632。如关于图6所描述,谐波高频带激励630及经调制噪声632可由ICBWE解码器306用于信号处理操作。高频带激励产生器362也可产生高频带激励380。高频带激励产生器362可经配置以大体上类似于图2B的高频带激励产生器299的方式操作。举例来说,高频带激励产生器362可对低频带激励信号325执行类似操作以产生高频带激励380(如高频带激励产生器299对低频带激励232执行的操作)。根据一个实施方案,高频带激励380可大体上类似于图2B的高频带激励276。高频带激励380被提供到LPC合成滤波器364。LPC合成滤波器364可将经量化高频带LPC 640应用于高频带激励380以产生经合成高频带中间信道382。经合成高频带中间信道382被提供到高频带增益形状缩放器368。
高频带增益形状位流280被提供到高频带增益形状反量化器366。高频带增益形状反量化器366可经配置以从高频带增益形状位流280提取经量化高频带增益形状648。经量化高频带增益形状648被提供到高频带增益形状缩放器368及ICBWE解码器306,用于信号处理操作,如关于图6所描述。高频带增益形状缩放368可经配置以基于经量化高频带增益形状648缩放经合成高频带中间信道382以产生经缩放经合成高频带中间信道384。经缩放经合成高频带中间信道384被提供到高频带增益帧缩放器372。
高频带增益帧位流283被提供到高频带增益帧反量化器370。高频带增益帧反量化器370可经配置以从高频带增益帧位流283提取经量化高频带增益帧652。经量化高频带增益帧652被提供到高频带增益帧缩放器372及ICBWE解码器306,用于信号处理操作,如关于图6所描述。高频带增益帧缩放器372可将经量化高频带增益帧652应用于经缩放经合成高频带中间信道384以产生经解码高频带中间信道662。经解码高频带中间信道662被提供到ICBWE解码器306用于信号处理操作,如关于图6所描述。
参看图4到5,展示ICBWE编码器204的特定实施方案。图4中展示ICBWE编码器204的第一部分204a,且图5中展示ICBWE编码器204的第二部分204b。
ICBWE编码器204的第一部分204a包含高频带参考信道确定单元404及高频带参考信道指示符编码器406。左信道212及右信道214被提供到高频带参考信道确定单元404。高频带参考信道确定单元404可经配置以确定左信道212或右信道214是否为高频带参考信道。举例来说,高频带参考信道确定单元404可产生高频带参考信道指示符440,其指示左信道212或右信道214是否用以估计高频带非参考信道459。高频带参考信道指示符440可基于左信道212及右信道214能量、左信道212及右信道214之间的信道间移位、在降混模块处产生的参考信道指示符、基于非因果移位估计的参考信道指示符,及高频带左信道能量及高频带右信道能量进行估计。
根据一个实施方案,高频带参考信道指示符440可使用多阶段技术进行确定,其中每一阶段改进先前阶段的输出以确定高频带参考信道指示符440。举例来说,在第一阶段,高频带参考信道确定单元404可基于参考信号产生高频带参考信道指示符440。为了说明,高频带参考信道确定单元404可响应于确定参考信号指示第二音频信号132(例如,右侧音频信号)被指定为参考信号,产生高频带参考信道指示符440以指示右信道214被指定为高频带参考信道。替代地,高频带参考信道确定单元404可响应于确定参考信号指示第一音频信号130(例如,左侧音频信号)被指定为参考信号,产生高频带参考信道指示符440以指示左信道212被指定为高频带参考信道。
在第二阶段,高频带参考信道确定单元404可基于增益参数、与左信道212相关联的第一能量、与右信道214相关联的第二能量,或其一组合改进(例如,更新)高频带参考信道指示符440。举例来说,高频带参考信道确定单元404可响应于确定增益参数满足第一阈值,第一能量(例如,左侧完全频带能量)与右侧能量(例如,右侧完全频带能量)的比满足第二阈值或两者,设定(例如,更新)高频带参考信道指示符440以指示左信道212被指定为参考信道且右信道214被指定为非参考信道。作为另一实例,高频带参考信道确定单元404可响应于确定增益参数未能满足第一阈值,第一能量(例如,左侧完全频带能量)与右侧能量(例如,右侧完全频带能量)的比未能满足第二阈值或两者,设定(例如,更新)高频带参考信道指示符440以指示右信道214被指定为参考信道且左信道212被指定为非参考信道。
在第三阶段,高频带参考信道确定单元404可基于左侧能量及右侧能量改进(例如,进一步更新)高频带参考信道指示符440。举例来说,高频带参考信道确定单元404可响应于确定左侧能量(例如,左侧HB能量)与右侧能量(例如,右侧HB能量)的比满足阈值,设定(例如,更新)高频带参考信道指示符440以指示左信道212被指定为参考信道且右信道214被指定为非参考信道。作为另一实例,高频带参考信道确定单元404可响应于确定左侧能量(例如,左侧HB能量)与右侧能量(例如,右侧HB能量)的比未能满足阈值,设定(例如,更新)高频带参考信道指示符440以指示右信道214被指定为参考信道且左信道212被指定为非参考信道。高频带参考信道指示符编码器406可编码高频带参考信道指示符440以产生高频带参考信道指示符位流442。
ICBWE编码器204的第一部分204a也包含非参考高频带激励产生器408、线性预测系数(LPC)合成滤波器410、高频带目标信道产生器412、频谱映射估计器414及频谱映射量化器416。非参考高频带激励产生器408包含信号倍增器418、信号倍增器420及信号组合器422。
非线性谐波高频带激励237被提供到信号倍增器418,且经调制噪声482被提供到信号倍增器420。在特定实施方案中,非线性谐波高频带激励237可是基于谐波建模(例如,(.)^2或|.|)的,其不同于用于中间高频带激励232产生的谐波建模。在替代性实施方案中,非线性谐波高频带激励237可是基于非参考低频带激励信号的。经调制噪声482可是基于非线性谐波高频带激励信号237或高频带激励信号232的包络经调制噪声的。在另一替代性实施方案中,经调制噪声482可为基于白化非线性谐波高频带激励信号237的经时间成形的随机噪声。时间成形可是基于语音因子控制的一阶自适应性滤波器的。
信号倍增器418将增益(Gain(a))应用于谐波高频带激励237,以产生增益经调整谐波高频带激励452,且信号倍增器420将增益(Gain(b))应用于经调制噪声482以产生增益经调整经调制噪声454。增益经调整谐波高频带激励452及增益经调整经调制噪声454被提供到信号组合器422。信号组合器422可经配置以将增益经调整谐波高频带激励452与增益经调整经调制噪声454组合以产生非参考高频带激励456。非参考高频带激励456可以类似于高频带中间信道激励的方式产生。然而,增益(Gain(a)及Gain(b))可为用以基于高频带参考信道与高频带非参考信道的相对能量、高频带非参考信道的噪声底限等产生高频带中间信道激励的增益的修改版本。
应注意,在一些实施方案中,Gain(a)及Gain(b)可为向量每一值对应于子帧中的对应信号的比例因子的向量。
混合增益(Gain(a)及Gain(b))也可基于对应于高频带中间信道、高频带非参考信道的或从低频带语音因子或语音信息导出的语音因子。混合增益(Gain(a)及Gain(b))也可基于对应于高频带中间信道及高频带非参考信道的频谱包络。在另一替代性实施方案中,混合增益(Gain(a)及Gain(b))可基于信号中讲话者或背景源的数目,及左(或参考、目标)信道及右(或目标、参考)信道的有声-无声特性。
非参考高频带激励456被提供到LPC合成滤波器410。LPC合成滤波器410可经配置以基于非参考高频带激励456及经量化高频带LPC 457(例如,高频带中间信道的LPC)产生经合成非参考高频带458。举例来说,LPC合成滤波器410可将经量化高频带LPC457应用于非参考高频带激励456以产生经合成非参考高频带458。经合成非参考高频带458被提供到频谱映射估计器414。
高频带参考信道指示符440可被提供(作为控制信号)到开关424,其接收左信道212及右信道214作为输入。基于高频带参考信道指示符440,开关424可将左信道212或右信道214提供到高频带目标信道产生器412作为非参考信道459。举例来说,如果高频带参考信道指示符440指示左信道212为参考信道,那么开关424可将右信道214提供到高频带目标信道产生器412作为非参考信道459。如果高频带参考信道指示符440指示右信道214为参考信道,那么开关424可将左信道212提供到高频带目标信道产生器412作为非参考信道459。
高频带目标信道产生器412可对非参考信道459的低频带信号分量滤波,以产生非参考高频带信道460(例如,非参考信道459的高频带部分)。在一些实施方案中,非参考高频带信道460可基于进一步信号处理操作进行频谱翻转(例如,频谱翻转操作)。非参考高频带信道460被提供到频谱映射估计器414。频谱映射估计器414可经配置以产生频谱映射参数462,其将非参考高频带信道460的频谱(或能量)映射到经合成非参考高频带458的频谱。举例来说,频谱映射估计器414可产生滤波器系数,其将非参考高频带信道460的频谱映射到经合成非参考高频带458的频谱。举例来说,频谱映射估计器414确定频谱映射参数462,其将经合成非参考高频带458的频谱包络映射为大体上接近于非参考高频带信道460的频谱包络(例如,非参考高频带信号)。频谱映射参数462被提供到频谱映射量化器416。频谱映射量化器416可经配置以量化频谱映射参数462以产生高频带频谱映射位流464及经量化频谱映射参数466。经量化频谱映射参数466可被应用于滤波器(例如),其中ui为经量化频谱映射参数466。
ICBWE编码器204的第二部分204b包含频谱映射施加器502、增益映射估计器与量化器504,及多路复用器590。经合成非参考高频带458及经量化频谱映射参数466被提供到频谱映射施加器502。频谱映射施加器502可经配置以基于经合成非参考高频带458及经量化频谱映射参数466产生频谱状经合成非参考高频带514。举例来说,频谱映射施加器502可将经量化频谱映射参数应用于经合成非参考高频带458以产生频谱状经合成非参考高频带514。在其它替代性实施方案中,频谱映射施加器502可将频谱映射参数462(例如,经去量化参数)应用于经合成非参考高频带458,以产生频谱状经合成非参考高频带514。频谱状经合成非参考高频带514可用以估计高频带增益映射参数。举例来说,频谱状经合成非参考高频带514被提供到增益映射估计器与量化器504。
因此,频谱映射估计器414可使用频谱形状应用,其使用滤波器滤波。频谱映射估计器414可估计并量化用于参数(ui)的值。在实例实施方案中,滤波器h(z)可为一阶滤波器,且信号的频谱包络可近似于滞后索引一(lag(1))与滞后索引零(lag(0))的自相关系数的比。如果t(n)表示第n个样本非参考高频带信道460,x(n)表示经合成非参考高频带458的第n样本,且y(n)表示频谱状经合成非参考高频带514的第n样本,那么其中/>为用于信号卷积操作的符号。
信号s(n)的频谱包络可表示为其中/>为lag(n)处的信号的自相关。因为/>所以/>为解决(ui,i=0,1),使得y(n)的包络近似于t(n)的包络,t(n)的包络(T)可等于/>而且,其可展示为/>此时/>因此,编码器200可确定包络(T),使得
应注意,当ryy值经扩展时,可能存在许多近似值以获得值u的多个可能近似值。可针对上文等式获得反复及分析型解决方案两者。本文中描述分析型解决方案的非限制性实例。通过将上文等式扩展至u的幂数达至二的术语,结果为:
a*u2+b*u+c=0,其中
用于(u)的两个可能解决方案可归因于二次等式的本质而存在。因为两个可能解决方案可能为真实或假想的,所以如果b2-4*a*c是≥0,那么存在两个真实解决方案。以其它方式,存在两个假想解决方案。在一些实施方案中,为了启用参数a、b及c的经控制演进来估计频谱映射参数(u),中间标准化相关性值T、rxx(1)/rxx(0)、rxx(2)/rxx(0),及rxx(3)/rxx(0)在时间上进行修匀或调节(例如,使用一阶IIR滤波器或移动平均值滤波器)。
因为非参考信道大体来说在较高频率下具有较陡的频谱能量滚降,所以较小(u)值可为优选的(包含负值)。较小(u)值包络所述信号,使得在较高频率下存在较陡的频谱能量滚降。根据一个实施方案,可使用绝对值<1(即,|ufinal|<1)的(u)的值。
如果不存在真实解决方案,那么先前帧的(u)可被用作当前帧的(u)。如果存在一或多个真实解决方案,且不存在绝对值小于一的真实解决方案,那么先前帧的ufinal值可用于当前帧。如果存在一或多个真实解决方案,且存在绝对值小于一的一个真实解决方案,那么当前帧可使用真实解决方案作为ufinal值。如果存在一或多个真实解决方案且存在绝对值小于一的多于一个真实解决方案,那么当前帧可使用最小(u)值作为ufinal值,或当前帧可使用最接近于先前帧的(u)值的(u)值。
在替代性实施方案中,频谱映射参数可基于非参考高频带信道及非参考高频带激励456的频谱分析进行估计,以最大化频谱状非参考HB信号与非参考HB目标信道之间的频谱匹配。在另一实施方案中,频谱映射参数可是基于非参考高频带信道及经合成高频带中间信道520或高频带中间信道292的LP分析。
非参考高频带信道516、经合成高频带中间信道520及高频带中间信道292也被提供到增益映射估计器与量化器504。增益映射估计器与量化器504可基于频谱状经合成非参考高频带514、非参考高频带信道516、经合成高频带中间信道520及高频带中间信道292产生高频带增益映射位流522及经量化高频带增益映射位流524。举例来说,增益映射估计器与量化器504可基于经合成高频带中间信道520及频谱状经合成非参考高频带514产生调整增益参数集合。为了说明,增益映射估计器与量化器504可确定对应于经合成高频带中间信道510的能量(或功率)与频谱状经合成非参考高频带514的能量(或功率)之间的差(或比)的经合成高频带增益。所述调整增益参数集合可指示经合成高频带增益。
增益映射估计器与量化器504可基于调整增益参数集合及经预测调整增益参数集合产生第一调整增益参数集合。举例来说,第一调整增益参数集合可指示所述调整增益参数集合与经预测调整增益参数集合之间的差。作为另一实例,第一调整增益参数集合可对应于经预测调整增益参数集合及经合成高频带中间信道520的第一能量与频谱状经合成非参考高频带514的第二能量的比的乘积(例如,第一调整增益参数集合=经预测调整增益参数集合*(经合成高频带中间信道520的第一能量/频谱状经合成非参考高频带514的第二能量)。
高频带参考信道指示符位流442、高频带频谱映射位流464及高频带增益映射位流522被提供到多路复用器590。多路复用器590可经配置以通过多路发射高频带参考信道指示符位流442、高频带频谱映射位流464及高频带增益映射位流522来产生ICBWE位流242。ICBWE位流242可被发射到解码器,例如图3A的解码器300等。
参看图6,展示ICBWE解码器306的特定实施方案。ICBWE解码器306包含非参考高频带激励产生器602、LPC合成滤波器604、频谱映射施加器606、频谱映射反量化器608、高频带增益形状缩放器610、非参考高频带增益缩放器612、增益映射反量化器616、参考高频带增益缩放器618及高频带信道映射器620。非参考高频带激励产生器602包含信号倍增器622、信号倍增器624及信号组合器626。
谐波高频带激励630(从低频带位流246产生)被提供到信号倍增器622,且经调制噪声632被提供到信号倍增器624。信号倍增器622将增益(Gain(a))应用于谐波高频带激励630以产生增益经调整谐波高频带激励634,且信号倍增器624将增益(Gain(b))应用于经调制噪声632以产生增益经调整经调制噪声636。应注意,在一些实施方案中,Gain(a)及Gain(b)可为向量每一值对应于子帧中的对应信号的比例因子的向量。混合增益(Gain(a)及Gain(b))也可基于对应于经合成高频带中间信道、经合成高频带非参考信道的或从低频带语音因子或语音信息导出的语音因子。混合增益(Gain(a)及Gain(b))也可基于对应于经合成高频带中间信道、经合成高频带非参考信道的或从低频带语音因子或语音信息导出的频谱包络。在另一替代性实施方案中,混合增益(Gain(a)及Gain(b))可基于信号中讲话者或背景源的数目,及左(或参考、目标)信道及右(或目标、参考)信道的有声-无声特性。增益经调整谐波高频带激励634及增益经调整经调制噪声636被提供到信号组合器626。信号组合器626可经配置以组合增益经调整谐波高频带激励634及增益经调整经调制噪声636以产生非参考高频带激励638。因此,非参考高频带激励638可以大体上类似于ICBWE编码器204的非参考高频带激励456的方式产生。
非参考高频带激励638被提供到LPC合成滤波器604。LPC合成滤波器604可经配置以基于高频带中间信道的非参考高频带激励638及经量化高频带LPC 640(来自发射自编码器200的位流)产生经合成非参考高频带642。举例来说,LPC合成滤波器604可将经量化高频带LPC 640应用于非参考高频带激励638以产生经合成非参考高频带642。经合成非参考高频带642被提供到频谱映射施加器606。
来自编码器200的高频带频谱映射位流464被提供到频谱映射反量化器608。频谱映射反量化器608可经配置以解码高频带频谱映射位流464以产生经解量化频谱映射位流644。经解量化频谱映射位流644被提供到频谱映射施加器606。频谱映射施加器606可经配置以将经解量化频谱映射位流644应用于经合成非参考高频带642(以大体上类似于ICBWE编码器204处的方式)以产生频谱状经合成非参考高频带646。举例来说,经量化频谱映射位流644可经应用作为滤波器(例如),其中u为经量化频谱映射参数。频谱状经合成非参考高频带646被提供到高频带增益形状缩放器610。
高频带增益形状缩放器610可经配置以基于经量化高频带增益形状(来自从编码器200发射的位流)缩放频谱状经合成非参考高频带646,以产生经缩放信号650。经缩放信号650被提供到非参考高频带增益缩放器612。倍增器651可经配置以将经量化高频带增益帧652(例如,中间信道增益帧)与经量化高频带增益映射参数660(来自高频带增益映射位流522)相乘以产生所得信号656。所得信号656可通过应用经量化高频带增益帧652及经量化高频带增益映射参数660的产品或使用两个依序增益阶段来产生。所得信号656被提供到非参考高频带增益缩放器612。非参考高频带增益缩放器612可经配置以通过所得信号656缩放经缩放信号650,以产生经解码高频带非参考信道658。经解码高频带非参考信道658被提供到高频带信道映射器620。根据另一实施方案,经预测参考信道增益映射参数可应用于中间信道以产生经解码高频带非参考信道658。
来自编码器200的高频带增益映射位流522被提供到增益映射反量化器616。增益映射反量化器616可经配置以解码高频带增益映射位流522以产生经量化高频带增益映射参数660。经量化高频带增益映射参数660被提供到参考高频带增益缩放器618,且经解码高频带中间信道662(从高频带中间信道位流244产生)被提供到参考高频带增益缩放器618。参考高频带缩放器618可经配置以基于经量化高频带增益映射参数660缩放经解码高频带中间信道662,以产生经解码高频带参考信道664。经解码高频带参考信道664被提供到高频带信道映射器620。
高频带信道映射器620可经配置以将经解码高频带参考信道664或经解码高频带非参考信道658指定为高频带左信道330。举例来说,高频带信道映射器620可基于来自编码器200的高频带参考信道指示符位流442确定高频带左信道330是否为参考信道(或非参考信道)。在使用类似技术的情况下,高频带信道映射器620可经配置以将经解码高频带参考信道664及经解码高频带非参考信道658的另一者指定为高频带右信道332。
关于图1到6描述的技术可实现改进式高频带估计,以供用于音频编码及音频解码。举例来说,频谱映射参数466可用以产生具有近似于高频带信道(例如,非参考高频带信道460)的频谱包络的频谱包络的经合成高频带信道(例如,频谱状经合成非参考高频带514)。因此,频谱映射参数466可在解码器466处用以产生近似于编码器200处的高频带信道的频谱包络的经合成高频带信道(例如,频谱状经合成非参考高频带646)。因此,当在解码器300处重构高频带时,可出现经减少的假影,此是由于高频带可具有类似于编码器侧上的低频带的频谱包络。
参看图7,展示估计频谱映射参数的方法700。方法700可由图1的第一装置104执行。详细来说,方法700可由编码器200执行。
方法700包含:在702,在第一装置的编码器处基于高频带参考信道指示符选择左信道或右信道作为非参考目标信道。举例来说,参看图4,开关424可基于高频带参考信道指示符440选择左信道212或右信道214作为非参考高频带信道460。
方法700包含:在704,基于对应于非参考目标信道的非参考高频带激励产生经合成非参考高频带信道。举例来说,参看图4,LPC合成滤波器410可通过将经量化高频带LPC457应用于非参考高频带激励456来产生经合成非参考高频带458。在一些实施方案中,方法700也包含:产生非参考目标信道的高频带部分。
方法700还包含:在706,基于经合成非参考高频带信道及非参考目标信道的高频带部分,估计一或多个频谱映射参数。举例来说,参看图4,频谱映射估计器414可基于经合成非参考高频带458及非参考高频带信道460估计频谱映射参数462。
根据一个实施方案,一或多个频谱映射参数是基于非参考目标信道在滞后索引一处的第一自相关值及非参考目标信道在滞后索引零处的第二自相关值进行估计。一或多个频谱映射参数可包含至少两个频谱映射参数候选者的特定频谱映射参数。在一个实施方案中,如果至少两个频谱映射参数候选者为非真实候选者,那么特定频谱映射参数可对应于先前帧的频谱映射参数。在另一实施方案中,如果至少两个频谱映射参数候选者中的每一频谱映射参数候选者具有大于一的绝对值,那么特定频谱映射参数可对应于先前帧的频谱映射参数。在另一实施方案中,如果至少两个频谱映射参数候选者中的仅一个频谱映射参数候选者具有小于一的绝对值,那么特定频谱映射参数可对应于具有小于一的绝对值的频谱映射参数候选者。在另一实施方案中,如果至少两个频谱映射参数候选者中的多于一者具有小于一的绝对值,那么特定频谱映射参数可对应于具有最小值的频谱映射参数候选者。在另一实施方案中,如果至少两个频谱映射参数候选者中的多于一者具有小于一的绝对值,那么特定频谱映射参数可对应于先前帧的频谱映射参数。
方法700还包含:在708,将一或多个频谱映射参数应用于经合成非参考高频带信道,以产生频谱状经合成非参考高频带信道。应用一或多个频谱参数可对应于基于频谱映射滤波器对经合成非参考高频带信道进行滤波。频谱状经合成非参考高频带信道可具有类似于非参考目标信道的频谱包络的频谱包络。举例来说,参看图5,频谱映射施加器502可将经量化频谱映射参数466应用于经合成非参考高频带458,以产生频谱状经合成非参考高频带514。频谱状经合成非参考高频带514可具有类似于非参考高频带信道460的频谱包络的频谱包络。频谱状经合成非参考高频带信道可用以估计增益映射参数。
方法700还包含:在710,基于一或多个频谱映射参数及频谱状经合成非参考高频带信道产生经编码位流。举例来说,参看图4,频谱映射量化器416可基于频谱映射参数462产生高频带频谱映射位流464。另外,参看图5,增益映射估计器与量化器504可基于频谱状经合成非参考高频带514产生高频带增益映射位流522。
方法700进一步包含:在712,将经编码位流发射到第二装置。举例来说,参看图1,发射器110可将ICBWE位流242(包含高频带频谱映射位流464)发射到第二装置106。
方法700可启用改进式高频带估计用于音频编码及音频解码。举例来说,频谱映射参数466可用以产生具有近似于高频带信道(例如,非参考高频带信道460)的频谱包络的频谱包络的经合成高频带信道(例如,频谱状经合成非参考高频带514)。因此,频谱映射参数466可在解码器466处用以产生近似于编码器200处的高频带信道的频谱包络的经合成高频带信道(例如,频谱状经合成非参考高频带646)。因此,当在解码器300处重构高频带时,可出现经减少的假影,此是由于高频带可具有类似于编码器侧上的低频带的频谱包络。
参看图8,展示提取频谱映射参数的方法800。方法800可由图1的第二装置106执行。详细来说,方法800可由解码器300执行。
方法800包含:在802,在装置的解码器处从所接收位流产生参考信道及非参考目标信道。位流可从第二装置的编码器接收。举例来说,参看图1,解码器300可从低频带位流246产生非参考信道。参考信道及非参考目标信道可为解码器300处产生的升混信道。作为非限制性实例,如果低频带参考信道为左信道的低频带部分,那么左信道的高频带部分可对应于高频带参考信道。根据一个实施方案,解码器300可在无参考信道及非参考目标信道的情况下产生左信道及右信道。
方法800还包含:在804,基于对应于非参考目标信道的非参考高频带激励产生经合成非参考高频带信道。举例来说,参看图6,LPC合成滤波器604可通过将经量化高频带LPC640应用于非参考高频带激励638来产生经合成非参考高频带642。
方法800进一步包含:在806,从所接收频谱映射位流提取一或多个频谱映射参数。频谱映射位流可从第二装置的编码器接收。举例来说,参看图6,频谱映射反量化器608可从高频带频谱映射位流464提取经量化频谱映射位流644。
方法800还包含:在808,通过将一或多个频谱映射参数应用于经合成非参考高频带信道,来产生频谱状非参考高频带信道。频谱状经合成非参考高频带信道可具有类似于非参考目标信道的频谱包络的频谱包络。举例来说,参看图6,频谱映射施加器606可将经量化频谱映射位流644应用于经合成非参考高频带,以产生频谱状经合成非参考高频带646。频谱状经合成非参考高频带信道646可具有类似于非参考目标信道的频谱包络的频谱包络。
方法800还包含:在810,至少基于频谱状非参考高频带信道、参考信道及非参考目标信道产生输出信号。举例来说,参看图1,解码器300可基于频谱状经合成非参考高频带646产生输出信号126、128中的至少一者。
方法800进一步包含:在812,在播放装置处显现输出信号。举例来说,参看图1,扬声器142、144可分别显现并输出所述输出信号126、128。
方法800可启用改进式高频带估计用于音频编码及音频解码。举例来说,频谱映射参数466可用以产生具有近似于高频带信道(例如,非参考高频带信道460)的频谱包络的频谱包络的经合成高频带信道(例如,频谱状经合成非参考高频带514)。因此,频谱映射参数466可在解码器466处用以产生近似于编码器200处的高频带信道的频谱包络的经合成高频带信道(例如,频谱状经合成非参考高频带646)。因此,当在解码器300处重构高频带时,可出现经减少的假影,此是由于高频带可具有类似于编码器侧上的低频带的频谱包络。
参看图9,描绘装置(例如,无线通信装置)的特定说明性实例的框图,且通常将所述装置指定为900。在各种实施方案中,装置900可相比图9中所说明的具有较多或较少组件。在说明性实施方案中,装置900可对应于图1的第一装置104或图1的第二装置106。在说明性实施方案中,装置900可执行参考图1到8的系统及方法所描述的一或多个操作。
在特定实施方案中,装置900包含处理器906(例如,中央处理单元(CPU))。装置900可包含一或多个额外处理器910(例如,一或多个数字信号处理器(DSP))。处理器910可包含媒体(例如,话语及音乐)译码解码器(编解码器)908及回音消除器912。媒体编解码器908可包含解码器300、编码器200或其一组合。编码器200可包含ICBWE编码器204,且解码器300可包含ICBWE解码器306。
装置900可包含存储器153及编解码器934。尽管媒体编解码器908说明为处理器910的组件(例如,专用电路及/或可执行程序代码),但在其它实施方案中,媒体编解码器908的一或多个组件(例如解码器300、编码器200或其一组合等)可包含于处理器906、编解码器934、另一处理组件或其一组合中。
装置900可包含耦合到天线942的发射器110。装置900可包含耦合到显示器控制器926的显示器928。一或多个扬声器948可耦合到编解码器934。一或多个麦克风946可经由输入接口112耦合到编解码器934。在特定实施方案中,扬声器948可包含图1的第一扬声器142、第二扬声器144,或其一组合。在特定实施方案中,麦克风946可包含图1的第一麦克风146、第二麦克风148,或其一组合。编解码器934可包含数字到模拟转换器(DAC)902及模拟到数字转换器(ADC)904。
存储器153可包含指令191,其可由处理器906、处理器910、编解码器934、装置900的另一处理单元或其一组合执行,以执行参考图1到8所描述的一或多个操作。
装置900的一或多个组件可通过执行用以执行一或多个任务或其一组合的指令的处理器经由专用硬件(例如,电路)实施。作为实例,存储器153、处理器906、处理器910及/或编解码器934的一或多个组件可为存储器装置,例如随机存取存储器(RAM)、磁电阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、可卸除式磁盘或光盘只读存储器(CD-ROM)。存储器装置可包含在由计算机(例如,编解码器934中的处理器、处理器906及/或处理器910)执行时可使得计算机执行参考图1到8所描述的一或多个操作的指令(例如,指令960)。作为实例,存储器153或处理器906、处理器910及/或编解码器934中的一或多个组件可为包含指令(例如,指令960)的非暂时性计算机可读媒体,当由计算机(例如,编解码器934中的处理器、处理器906及/或处理器910)执行时,所述指令使得计算机执行参考图1到8所描述的一或多个操作。
在特定实施方案中,装置900可包含于系统级封装或系统单芯片装置(例如,移动台数据机(MSM))922中。在特定实施方案中,处理器906、处理器910、显示器控制器926、存储器153、编解码器934及发射器110包含于封装内系统或系统单芯片装置922中。在特定实施方案中,例如触控屏幕及/或小键盘的输入装置930及电力供应器944耦合到系统单芯片装置922。此外,在特定实施方案中,如图9中所说明,显示器928、输入装置930、扬声器948、麦克风946、天线942及电力供应器944位于系统单芯片装置922外部。然而,显示器928、输入装置930、扬声器948、麦克风946、天线942及电力供应器944中的每一者可耦合到系统单芯片装置922的组件,例如接口或控制器。
装置900可包含:无线电话、移动通信装置、移动电话、智能型电话、蜂窝式电话、膝上型计算机、台式计算机、计算机、平板计算机、机顶盒、个人数字助理(PDA)、显示装置、电视、游戏控制台、音乐播放器、收音机、视频播放器、娱乐单元、通信装置、固定位置数据单元、个人媒体播放器、数字视频播放器、数字视频光盘(DVD)播放器、调谐器、摄像机、导航装置、解码器系统、编码器系统或其任何组合。
参考图10,描绘了基站1000的特定例示性实例的框图。在各种实施方案中,基站1000可相比图10中所说明的具有较多组件或较少组件。在说明性实例中,基站1000可包含图1的第一装置104或第二装置106。在说明性实例中,基站1000可根据参看图1到8所描述的方法或系统中的一或多者操作。
基站1000可为无线通信系统的部分。无线通信系统可包含多个基站及多个无线装置。无线通信系统可为长期演进(LTE)系统、码分多址接入(CDMA)系统、全球移动通信系统(GSM)系统、无线局域网(WLAN)系统或一些其它无线系统。CDMA系统可实施宽频CDMA(WCDMA)、CDMA 1X、演进数据最佳化(EVDO)、时分同步CDMA(TD-SCDMA),或一些其它版本的CDMA。
无线装置也可被称作用户装备(UE)、移动台、终端机、存取终端机、订户单元、工作台等。所述无线装置可包含:蜂窝式电话、智能型电话、平板计算机、无线数据机、个人数字助理(PDA)、手持型装置、膝上型计算机、智能本、迷你笔记型计算机、平板计算机、无接线电话、无线区域回路(WLL)站、蓝牙装置等。无线装置可包含或对应于图10的装置1000。
各种功能可由基站1000的一或多个组件(及/或,图中未示的其它组件中)执行,例如发送及接收消息及数据(例如,音频数据)。在特定实例中,基站1000包含处理器1006(例如,CPU)。基站1000可包含转码器1010。转码器1010可包含音频编解码器1008。举例来说,转码器1010可包含经配置以执行音频编解码器1008的操作的一或多个组件(例如,电路)。作为另一实例,转码器1010可经配置以执行一或多个计算机可读指令以执行音频编解码器1008的操作。尽管音频编解码器1008说明为转码器1010的组件,但在其它实例中,音频编解码器1008的一或多个组件可包含于处理器1006、另一处理组件,或其一组合中。举例来说,解码器1038(例如,声码器解码器)可包含于接收器数据处理器1064中。作为另一实例,编码器1036(例如,声码器编码器)可包含于发射数据处理器1082中。
转码器1010可起到在两个或两个以上网络之间转码消息及数据的作用。转码器1010可经配置以将消息及音频数据从第一格式(例如,数字格式)转换到第二格式。为进行说明,解码器1038可解码具有第一格式的经编码信号,且编码器1036可将经解码信号编码成具有第二格式的经编码信号。另外地或替代地,转码器1010可经配置以执行数据速率适应。举例来说,转码器1010可在不改变音频数据的格式的情况下降频转换数据速率或升频转换数据速率。为进行说明,转码器1010可将64千位/秒信号降频转换成16千位/秒信号。
音频编解码器1008可包含编码器1036及解码器1038。编码器1036可包含图1的编码器200。解码器1038可包含图1的解码器300。
基站1000可包含存储器1032。例如计算机可读存储装置的存储器1032可包含指令。指令可包含可由处理器1006、转码器1010或其组合执行的一或多个指令,以执行参考图1到8的方法及系统所描述的一或多个操作。基站1000可包含耦合到天线阵列的多个发射器及接收器(例如,收发器),例如第一收发器1052及第二收发器1054等。天线阵列可包含第一天线1042及第二天线1044。天线阵列可经配置以无线方式与一或多个无线装置通信,例如图10的装置1000等。举例来说,第二天线1044可从无线装置接收数据流1014(例如,位流)。数据流1014可包含消息、数据(例如,经编码话语数据),或其一组合。
基站1000可包含例如空载传输连接的网络连接1060。网络连接1060可经配置以与无线通信网络的核心网络或一或多个基站通信。举例来说,基站1000可经由网络连接1060从核心网络接收第二数据流(例如,消息或音频数据)。基站1000可处理第二数据流以产生消息或音频数据,且经由天线阵列的一或多个天线将消息或音频数据提供到一或多个无线装置,或经由网络连接1060将其提供到另一基站。在特定实施方案中,网络连接1060可为广域网(WAN)连接,作为说明性的非限制性实例。在一些实施中,核心网络可包含或对应于公众交换电话网络(PSTN)、包基干网络或两者。
基站1000可包含耦合到网络连接1060及处理器1006的媒体网关1070。媒体网关1070可经配置以在不同电信技术的媒体流之间转换。举例来说,媒体网关1070可在不同发射协议、不同译码方案或两者之间转换。为进行说明,作为说明性非限制性实例,媒体网关1070可从PCM信号转换成实时输送协议(RTP)信号。媒体网关1070可在包交换式网络(例如,因特网通信协议语音(VoIP)网络、IP多媒体子系统(IMS)、例如LTE、WiMax及UMB的第四代(4G)无线网络等)、电路交换式网络(例如,PSTN)及混合型网络(例如,例如GSM、GPRS及EDGE的第二代(2G)无线网络、例如WCDMA、EV-DO及HSPA的第三代(3G)无线网络等)之间转换数据。
另外,媒体网关1070可包含转码且可经配置以当编码解码器不兼容时转码数据。举例来说,作为说明性非限制性实例,媒体网关1070可在自适应多速率(AMR)编解码器与G.711编解码器之间进行转码。媒体网关1070可包含路由器及多个实体接口。在一些实施方案中,媒体网关1070也可包含控制器(未展示)。在特定实施方案中,媒体网关控制器可在媒体网关1070外部、在基站1000外部或在其两者外部。媒体网关控制器可控制并协调操作多个媒体网关。媒体网关1070可从媒体网关控制器接收控制信号,且可起到在不同发射技术之间桥接器的作用,且可添加对终端用户能力及连接的服务。
基站1000可包含耦合到收发器1052、1054、接收器数据处理器1064,及处理器1006的解调器1062,且接收器数据处理器1064可耦合到处理器1006。解调器1062可经配置以解调制接收自收发器1052、1054的经调制信号,且将经解调制数据提供到接收器数据处理器1064。接收器数据处理器1064可经配置以从经解调制数据提取消息或音频数据,且将所述消息或音频数据发送到处理器1006。
基站1000可包含发射数据处理器1082及发射多输入多输出(MIMO)处理器1084。发射数据处理器1082可耦合到处理器1006及发射MIMO处理器1084。发射MIMO处理器1084可耦合到收发器1052、1054及处理器1006。在一些实施方案中,发射MIMO处理器1084可耦合到媒体网关1070。发射数据处理器1082可经配置以从处理器1006接收消息或音频数据,且基于例如CDMA或正交频分多工(OFDM)的译码方案译码所述消息或所述音频数据,作为例示性的非限制性实例。发射数据处理器1082可将经译码数据提供到发射MIMO处理器1084。
可使用CDMA或OFDM技术将经译码数据与例如导频数据的其它数据多路发射在一起以产生经多路发射数据。经多路发射数据接着可基于特定调制方案(例如,二进制相移键控(“BPSK”)、正交相移键控(“QSPK”)、M-元相移键控(“M-PSK”)、M-元正交振幅调制(“M-QAM”)等)通过发射数据处理器1082调制(即,符号映射)以产生调制符号。在特定实施方案中,可使用不同调制方案调制经译码数据及其它数据。用于每一数据流的数据速率、译码,及调制可通过处理器1006所执行的指令来确定。
发射MIMO处理器1084可经配置以从发射数据处理器1082接收调制符号,且可进一步处理调制符号,且可对所述数据执行波束成形。举例来说,发射MIMO处理器1084可将波束成形权重应用于调制符号。波束成形权重可对应于天线阵列的一或多个天线(从所述天线发射调制符号)。
在操作期间,基站1000的第二天线1044可接收数据流1014。第二收发器1054可从第二天线1044接收数据流1014,且可将数据流1014提供到解调器1062。解调器1062可解调制数据流1014的经调制信号,且将经解调制数据提供到接收器数据处理器1064。接收器数据处理器1064可从经解调制数据提取音频数据,且将经提取音频数据提供到处理器1006。
处理器1006可将音频数据提供到转码器1010以用于转码。转码器1010的解码器1038可将音频数据从第一格式解码成经解码音频数据,且编码器1036可将经解码音频数据编码成第二格式。在一些实施方案中,编码器1036可使用从无线装置接收的较高数据速率(例如,升频转换)或较低数据速率(例如,降频转换)编码音频数据。在其它实施方案中,音频数据可未经转码。尽管转码(例如,解码及编码)被说明为由转码器1010执行,但转码操作(例如,解码及编码)可由基站1000的多个组件执行。举例来说,解码可由接收器数据处理器1064执行,且编码可由发射数据处理器1082执行。在其它实施方案中,处理器1006可将音频数据提供到媒体网关1070以供转换成另一发射协议、译码方案或两者。媒体网关1070可藉助于网络连接1060将经转换数据提供到另一基站或核心网络。
可经由处理器1006将在编码器1036处产生的经编码音频数据(例如经转码数据)提供到发射数据处理器1082或网络连接1060。可将来自转码器1010的经转码音频数据提供到发射数据处理器1082,用于根据例如OFDM的调制方案译码,以产生调制符号。发射数据处理器1082可将调制符号提供到发射MIMO处理器1084,以供进一步处理及波束成形。发射MIMO处理器1084可应用波束成形权重,且可经由第一收发器1052将调制符号提供到天线阵列的一或多个天线,例如第一天线1042。因此,基站1000可将对应于从无线装置接收的数据流1014的经转码数据流1016提供到另一无线装置。经转码数据流1016可具有与数据流1014不同的编码格式、数据速率,或所述两者。在其它实施方案中,可将经转码数据流1016提供到网络连接1060,用于发射到另一基站或核心网络。
在特定实施方案中,本文中揭示的系统及装置的一或多个组件可集成于解码系统或设备(例如,其中的电子装置、编解码器或处理器)中、集成于编码系统或设备中,或集成于所述两者中。在其它实施方案中,本文所揭示的系统及装置的一或多个组件可集成到以下各者中:无线电话、平板计算机、台式计算机、膝上型计算机、机顶盒、音乐播放器、视频播放器、娱乐单元、电视、游戏控制台、导航装置、通信装置、个人数字助理(PDA)、固定位置数据单元、个人媒体播放器或另一类型的装置。
结合所描述的技术,第一设备包含用于基于高频带参考信道指示符选择左信道或右信道作为非参考目标信道的装置。举例来说,用于选择的所述装置可包含图1、2A及9的编码器200、图1、2A、4及5的编码器204、图4的开关424、图9的编解码器908、图9的处理器906、可由处理器执行的指令191、图10的编码器1036、一或多个其它装置、电路或其任何组合。
第一设备还包含用于基于对应于非参考目标信道的非参考高频带激励产生经合成非参考高频带信道的装置。举例来说,用于产生经合成非参考高频带信道的所述装置可包含图1、2A及9的编码器200、1、2A、4及5的ICBWE编码器204、图4的LPC合成滤波器410、图9的编解码器908、图9的处理器906、可由处理器执行的指令191、图10的编码器1036、一或多个其它装置、电路或其任何组合。
第一设备还包含用于基于经合成非参考高频带信道及非参考目标信道的高频带部分估计一或多个频谱映射参数的装置。举例来说,用于估计的所述装置可包含图1、2A及9的编码器200、图1、2A、4及5的ICBWE编码器204、图4的频谱映射估计器414、图9的编解码器908、图9的处理器906、可由处理器执行的指令191、图10的编码器1036、一或多个其它装置、电路或其任何组合。
第一设备也包含用于将一或多个频谱映射参数应用于经合成非参考高频带信道以产生频谱状经合成非参考高频带信道的装置。举例来说,用于应用的所述装置可包含图1、2A及9的编码器200、图1、2A、4及5的ICBWE编码器204、图5的频谱映射施加器502、图9的编解码器908、图9的处理器906、可由处理器执行的指令191、图10的编码器1036、一或多个其它装置、电路或其任何组合。
第一设备还包含用于基于一或多个频谱映射参数及频谱状经合成非参考高频带信道产生经编码位流的装置。举例来说,用于产生频谱映射参数位流的所述装置可包含图1、2A及9的编码器200、图1、2A、4及5的ICBWE编码器204、图4的频谱映射量化器416、图9的编解码器908、图9的处理器906、可由处理器执行的指令191、图10的编码器1036、一或多个其它装置、电路或其任何组合。
第一设备还包含用于将经编码位流发射到第二装置的装置。举例来说,用于发射的所述装置可包含图1及9的发射器110、图10的收发器1052、一或多个其它装置、电路或其任何组合。
结合所描述的技术,第二设备包含用于从所接收低频带位流产生参考信道及非参考目标信道的装置。举例来说,用于产生非参考信道的所述装置可包含图1、3A及9的解码器300、图10的解码器1038、一或多个其它装置、电路或其任何组合。
第二设备还包含用于基于对应于非参考目标信道的非参考高频带激励产生经合成非参考高频带信道的装置。举例来说,用于产生经合成非参考高频带信道的所述装置可包含图1、3A及9的解码器300、图1、3A、6及9的ICBWE解码器306、图6的LPC合成滤波器604、图10的解码器1038、一或多个其它装置、电路或其任何组合。
第二设备还包含用于从所接收频谱映射位流提取一或多个频谱映射参数的装置。举例来说,用于提取的所述装置可包含图1、3A及9的解码器300、图1、3A、6及9的ICBWE解码器306、图6的频谱映射反量化器608、图10的解码器1038、一或多个其它装置、电路或其任何组合。
第二设备还包含用于通过将一或多个频谱映射参数应用于经合成非参考高频带信道来产生频谱状经合成非参考高频带信道的装置。举例来说,用于产生频谱状经合成非参考高频带信道的所述装置可包含图1、3A及9的解码器300、图1、3A、6及9的ICBWE解码器306、图6的频谱映射施加器606、图10的解码器1038、一或多个其它装置、电路或其任何组合。
第二设备还包含用于至少基于频谱状非参考高频带信道、参考信道及非参考目标信道产生输出信号的装置。举例来说,用于产生输出信号的所述装置可包含图1、3A及9的解码器300、图1、3A、6及9的ICBWE解码器306、图10的解码器1038、一或多个其它装置、电路或其任何组合。
第二设备还包含用于再现输出信号的装置。举例来说,用于显现输出信号的装置可包含图1的第一扬声器142、图1的第二扬声器144、图9的扬声器948、一或多个其它装置、电路,或其任何组合。
应注意,通过本文所揭示的系统及装置的一或多个组件执行的各种功能经描述为通过某些组件或模块执行。组件及模块的此划分仅用于说明。在替代性实施方案中,由特定组件或模块执行的功能可被划分于多个组件或模块之中。此外,在替代性实施中,两个或多于两个组件或模块可被集成到单个组件或模块中。每一组件或模块可使用硬件(例如,现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、DSP、控制器等)、软件(例如,可由处理器执行的指令)或其任何组合实施。
所属领域的一般技术人员将进一步了解,结合本文中所揭示的实施而描述的各种说明性逻辑块、配置、模块、电路及算法步骤可实施为电子硬件、由例如硬件处理器的处理装置执行的计算机软件或两者的组合。上文大体在功能性方面描述各种说明性组件、块、配置、模块、电路及步骤。此功能性经实施为硬件或是软件取决于特定应用及强加于整个系统的设计约束而定。所属领域的一般技术人员可针对每一特定应用来以变化方式实施所描述的功能性,但此类实施决策不应被解译为导致脱离本发明的范畴。
结合本文中所揭示的实施所描述的方法或算法的步骤可直接体现于硬件中、由处理器执行的软件模块中或两者的组合中。软件模块可存在于存储器装置中,例如随机存取存储器(RAM)、磁电阻随机存取存储器(MRAM)、自旋力矩转移(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、抽取式磁盘或光盘只读存储器(CD-ROM)。例示性存储器装置耦合到处理器,以使得处理器可从存储器装置读取信息及将信息写入到存储器装置。在替代方案中,存储器装置可与处理器成一体式。处理器及存储媒体可驻存于专用集成电路(ASIC)中。ASIC可驻存于计算装置或用户终端机中。在替代例中,处理器及存储媒体可作为离散组件驻存于计算装置或用户终端机中。
提供对所揭示实施的先前描述,以使得所属领域的一般技术人员能够制作或使用所揭示的实施。对此些实施的各种修改对于所属领域的一般技术人员将容易地显而易见,且在不背离本发明的范畴的情况下,本文中所定义的原理可应用于其它实施。因此,本发明并非意味着限于本文中所展示的实施,而应符合可能与如以下权利要求书所定义的原理及新颖特征相一致的最广泛范畴。
Claims (36)
1.一种装置,其包括:
编码器,其经配置以:
基于当前帧中的时间移位值识别非参考目标信道;
产生所述非参考目标信道的高频带部分;
基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道;
基于应用于所述经合成非参考高频带信道的最大似然性度量及所述非参考目标信道的所述高频带部分产生一或多个频谱映射参数;
将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道;及
基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流;及
发射器,其经配置以将所述经编码位流发射到第二装置。
2.根据权利要求1所述的装置,其中所述编码器进一步经配置以:
将第一增益应用于谐波高频带激励以产生增益经调整谐波高频带激励;
将第二增益应用于经调制噪声以产生增益经调整经调制噪声;及
组合所述增益经调整谐波高频带激励及所述增益经调整经调制噪声以产生所述非参考高频带激励。
3.根据权利要求1所述的装置,其中所述经合成非参考高频带信道是使用线性预测系数合成滤波器产生。
4.根据权利要求1所述的装置,其中所述编码器经进一步配置以基于频谱映射滤波器对所述经合成非参考高频带信道进行滤波。
5.根据权利要求1所述的装置,其中所述编码器经进一步配置以基于所述频谱状经合成非参考高频带信道估计增益映射参数,所述增益映射参数不同于所述一个或多个频谱映射参数。
6.根据权利要求5所述的装置,其中所述增益映射参数进一步是基于高频带中间信道、经合成高频带中间信道及非参考高频带信道。
7.根据权利要求1所述的装置,其中所述一或多个频谱映射参数是基于所述非参考目标信道在滞后索引一处的第一自相关值及所述非参考目标信道在滞后索引零处的第二自相关值进行估计。
8.根据权利要求1所述的装置,其中所述一或多个频谱映射参数包含对应于至少两个频谱映射参数候选者所满足的准则的频谱映射参数,以使所述非参考目标信道的频谱形状和所述频谱状经合成非参考高频带信道的的频谱形状匹配。
9.根据权利要求8所述的装置,其中如果所述至少两个频谱映射参数候选者为非真实候选者,那么所述频谱映射参数对应于先前帧的频谱映射参数。
10.根据权利要求8所述的装置,其中如果所述至少两个频谱映射参数候选者中的每一频谱映射参数候选者具有大于一的绝对值,那么所述频谱映射参数对应于先前帧的频谱映射参数。
11.根据权利要求8所述的装置,其中如果所述至少两个频谱映射参数候选者中的仅一个频谱映射参数候选者具有小于一的绝对值,那么所述频谱映射参数对应于具有小于一的绝对值的频谱映射参数候选者。
12.根据权利要求8所述的装置,其中如果所述至少两个频谱映射参数候选者中的多于一者具有小于一的绝对值,那么所述频谱映射参数对应于具有最小值的频谱映射参数候选者。
13.根据权利要求8所述的装置,其中如果所述至少两个频谱映射参数候选者中的多于一者具有小于一的绝对值,那么所述频谱映射参数对应于先前帧的频谱映射参数。
14.根据权利要求1所述的装置,其中所述经编码位流对应于信道间带宽扩展ICBWE位流,所述ICBWE位流是基于高频带参考信道指示符位流、高频带频谱映射位流及高频带增益映射位流。
15.根据权利要求1所述的装置,其中所述编码器还被配置为:基于第一音频信道和第二音频信道之间的时间失配产生参考信道指示符;并且基于所述参考信道指示符,选择所述第一音频信道或所述第二音频信道作为非参考目标信道。
16.根据权利要求1所述的装置,其中所述编码器及所述发射器集成于移动装置中。
17.根据权利要求1所述的装置,其中所述编码器及所述发射器集成于基站中。
18.一种编码音频数据的方法,所述方法包括:
基于当前帧中的时间移位值识别非参考目标信道
基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道;
基于应用于所述经合成非参考高频带信道的最大似然性度量及所述非参考目标信道的高频带部分估计一或多个频谱映射参数;
将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道;
基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流;及
将所述经编码位流发射到第二装置。
19.根据权利要求18所述的方法,其进一步包括:
将第一增益应用于谐波高频带激励以产生增益经调整谐波高频带激励;
将第二增益应用于经调制噪声以产生增益经调整经调制噪声;及
组合所述增益经调整谐波高频带激励及所述增益经调整经调制噪声以产生所述非参考高频带激励。
20.根据权利要求18所述的方法,其进一步包括基于线性预测系数合成滤波器产生所述经合成非参考高频带信道。
21.根据权利要求18所述的方法,其中所述一或多个频谱映射参数包含对应于至少两个频谱映射参数候选者所满足的准则的频谱映射参数,以使所述非参考目标信道的频谱形状和所述频谱状经合成非参考高频带信道的的频谱形状匹配。
22.根据权利要求21所述的方法,其中如果所述至少两个频谱映射参数候选者为非真实候选者,那么所述频谱映射参数对应于先前帧的频谱映射参数。
23.根据权利要求21所述的方法,其中如果所述至少两个频谱映射参数候选者中的每一频谱映射参数候选者具有大于一的绝对值,那么所述频谱映射参数对应于先前帧的频谱映射参数。
24.根据权利要求21所述的方法,其中如果所述至少两个频谱映射参数候选者中的仅一个频谱映射参数候选者具有小于一的绝对值,那么所述频谱映射参数对应于具有小于一的绝对值的频谱映射参数候选者。
25.根据权利要求21所述的方法,其中如果所述至少两个频谱映射参数候选者中的多于一者具有小于一的绝对值,那么所述频谱映射参数对应于具有最小值的频谱映射参数候选者。
26.根据权利要求21所述的方法,其中如果所述至少两个频谱映射参数候选者中的多于一者具有小于一的绝对值,那么所述频谱映射参数对应于先前帧的频谱映射参数。
27.根据权利要求18所述的方法,其中在移动装置处执行估计所述一或多个频谱映射参数及应用所述一或多个频谱映射参数。
28.根据权利要求18所述的方法,其中在基站处执行估计所述一或多个频谱映射参数及应用所述一或多个频谱映射参数。
29.一种装置,其包括:
用于基于当前帧中的时间移位值识别非参考目标信道的部件;
用于产生所述非参考目标信道的高频带部分的部件;
用于基于对应于所述非参考目标信道的非参考高频带激励产生经合成非参考高频带信道的部件;
用于基于应用于所述经合成非参考高频带信道的最大似然性度量及所述非参考目标信道的所述高频带部分估计一或多个频谱映射参数的部件;
用于将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道以产生频谱状经合成非参考高频带信道的部件;
用于基于所述一或多个频谱映射参数及所述频谱状经合成非参考高频带信道产生经编码位流的部件;及
用于将所述经编码位流发射到第二装置的部件。
30.根据权利要求29所述的装置,其中用于估计所述一或多个频谱映射参数的所述部件及用于应用所述一或多个频谱映射参数的所述部件集成于移动装置中。
31.根据权利要求29所述的装置,其中用于估计所述一或多个频谱映射参数的所述部件及用于应用所述一或多个频谱映射参数的所述部件集成于基站中。
32.一种装置,其包括:
解码器,其经配置以:
从所接收低频带位流产生参考信道及非参考目标信道,所述低频带位流是从第二装置的编码器接收;
基于当前帧中的时间移位值识别非参考目标信道;
基于应用于对应于所述非参考目标信道的非参考高频带激励的最大似然性度量产生经合成非参考高频带信道;
从所接收频谱映射位流提取一或多个频谱映射参数,所述频谱映射位流是从所述第二装置的所述编码器接收;
通过将所述一或多个频谱映射参数应用于所述经合成非参考高频带信道来产生频谱状经合成非参考高频带信道;及
至少基于所述频谱状经合成非参考高频带信道、所述参考信道及所述非参考目标信道产生输出信号。
33.根据权利要求32所述的装置,其进一步包括经配置以显现所述输出信号的播放装置。
34.根据权利要求32所述的装置,其中所述编码器进一步经配置以:
基于经量化高频带增益形状来缩放所述频谱状经合成非参考高频带信道以产生经缩放信号;以及
基于所述经缩放信号产生经解码高频带非参考信道,其中所述输出信号至少基于所述经解码高频带非参考信道。
35.根据权利要求32所述的装置,其中所述解码器集成于移动装置中。
36.根据权利要求32所述的装置,其中所述解码器集成于基站中。
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762469432P | 2017-03-09 | 2017-03-09 | |
US62/469,432 | 2017-03-09 | ||
US15/890,670 US10553222B2 (en) | 2017-03-09 | 2018-02-07 | Inter-channel bandwidth extension spectral mapping and adjustment |
US15/890,670 | 2018-02-07 | ||
CN201880013501.XA CN110337691B (zh) | 2017-03-09 | 2018-02-08 | 信道间带宽扩展频谱映射及调整 |
PCT/US2018/017359 WO2018164805A1 (en) | 2017-03-09 | 2018-02-08 | Inter-channel bandwidth extension spectral mapping and adjustment |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880013501.XA Division CN110337691B (zh) | 2017-03-09 | 2018-02-08 | 信道间带宽扩展频谱映射及调整 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116721668A true CN116721668A (zh) | 2023-09-08 |
Family
ID=63445733
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880013501.XA Active CN110337691B (zh) | 2017-03-09 | 2018-02-08 | 信道间带宽扩展频谱映射及调整 |
CN202310746061.1A Pending CN116721668A (zh) | 2017-03-09 | 2018-02-08 | 编码音频数据的装置和方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880013501.XA Active CN110337691B (zh) | 2017-03-09 | 2018-02-08 | 信道间带宽扩展频谱映射及调整 |
Country Status (7)
Country | Link |
---|---|
US (3) | US10553222B2 (zh) |
EP (1) | EP3593348B1 (zh) |
CN (2) | CN110337691B (zh) |
ES (1) | ES2894625T3 (zh) |
SG (1) | SG11201906584WA (zh) |
TW (1) | TWI713819B (zh) |
WO (1) | WO2018164805A1 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10109284B2 (en) | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
CN111586547B (zh) * | 2020-04-28 | 2022-05-06 | 北京小米松果电子有限公司 | 音频输入模组的检测方法及装置、存储介质 |
CN117198313B (zh) * | 2023-08-17 | 2024-07-02 | 珠海全视通信息技术有限公司 | 侧音消除方法、装置、电子设备、存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6999926B2 (en) * | 2000-11-16 | 2006-02-14 | International Business Machines Corporation | Unsupervised incremental adaptation using maximum likelihood spectral transformation |
US7512180B2 (en) * | 2003-06-25 | 2009-03-31 | Microsoft Corporation | Hierarchical data compression system and method for coding video data |
BRPI0514998A (pt) * | 2004-08-26 | 2008-07-01 | Matsushita Electric Ind Co Ltd | equipamento de codificação de sinal de canal múltiplo e equipamento de decodificação de sinal de canal múltiplo |
US8484036B2 (en) * | 2005-04-01 | 2013-07-09 | Qualcomm Incorporated | Systems, methods, and apparatus for wideband speech coding |
SI1875463T1 (sl) * | 2005-04-22 | 2019-02-28 | Qualcomm Incorporated | Sistemi, postopki in naprava za glajenje faktorja ojačenja |
JPWO2007088853A1 (ja) * | 2006-01-31 | 2009-06-25 | パナソニック株式会社 | 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法 |
US8886523B2 (en) * | 2010-04-14 | 2014-11-11 | Huawei Technologies Co., Ltd. | Audio decoding based on audio class with control code for post-processing modes |
JP6616316B2 (ja) * | 2014-03-24 | 2019-12-04 | サムスン エレクトロニクス カンパニー リミテッド | 高帯域符号化方法及びその装置、並びに高帯域復号方法及びその装置 |
US9984699B2 (en) * | 2014-06-26 | 2018-05-29 | Qualcomm Incorporated | High-band signal coding using mismatched frequency ranges |
US9626983B2 (en) * | 2014-06-26 | 2017-04-18 | Qualcomm Incorporated | Temporal gain adjustment based on high-band signal characteristic |
US9837089B2 (en) * | 2015-06-18 | 2017-12-05 | Qualcomm Incorporated | High-band signal generation |
US10109284B2 (en) | 2016-02-12 | 2018-10-23 | Qualcomm Incorporated | Inter-channel encoding and decoding of multiple high-band audio signals |
US10553222B2 (en) * | 2017-03-09 | 2020-02-04 | Qualcomm Incorporated | Inter-channel bandwidth extension spectral mapping and adjustment |
-
2018
- 2018-02-07 US US15/890,670 patent/US10553222B2/en active Active
- 2018-02-08 CN CN201880013501.XA patent/CN110337691B/zh active Active
- 2018-02-08 WO PCT/US2018/017359 patent/WO2018164805A1/en unknown
- 2018-02-08 CN CN202310746061.1A patent/CN116721668A/zh active Pending
- 2018-02-08 ES ES18706149T patent/ES2894625T3/es active Active
- 2018-02-08 SG SG11201906584WA patent/SG11201906584WA/en unknown
- 2018-02-08 EP EP18706149.4A patent/EP3593348B1/en active Active
- 2018-02-09 TW TW107104695A patent/TWI713819B/zh active
-
2019
- 2019-11-04 US US16/673,733 patent/US10872613B2/en active Active
-
2020
- 2020-12-11 US US17/120,067 patent/US11705138B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3593348B1 (en) | 2021-09-15 |
WO2018164805A1 (en) | 2018-09-13 |
US10553222B2 (en) | 2020-02-04 |
EP3593348A1 (en) | 2020-01-15 |
US11705138B2 (en) | 2023-07-18 |
CN110337691A (zh) | 2019-10-15 |
CN110337691B (zh) | 2023-06-23 |
US10872613B2 (en) | 2020-12-22 |
TWI713819B (zh) | 2020-12-21 |
SG11201906584WA (en) | 2019-09-27 |
US20200066283A1 (en) | 2020-02-27 |
US20180261232A1 (en) | 2018-09-13 |
ES2894625T3 (es) | 2022-02-15 |
TW201833904A (zh) | 2018-09-16 |
US20210098006A1 (en) | 2021-04-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9978381B2 (en) | Encoding of multiple audio signals | |
CN109313906B (zh) | 音频信号之间的声道间相位差的编码和解码 | |
TWI775838B (zh) | 用於在多源環境中之非諧波語音偵測及頻寬擴展之裝置、方法、電腦可讀媒體及設備 | |
CN110337691B (zh) | 信道间带宽扩展频谱映射及调整 | |
CN111164681B (zh) | 音频信号的解码 | |
CN110622242A (zh) | 用于立体声解码的立体声参数 | |
CN110800051B (zh) | 具有时域信道间带宽延展的高频带残值预测 | |
CN110770825B (zh) | 时域通道间预测 | |
KR102263550B1 (ko) | 다중 오디오 신호들의 코딩 | |
CN111149156B (zh) | 音频信号的解码 | |
KR102581558B1 (ko) | 채널간 위상차 파라미터 수정 | |
KR102208602B1 (ko) | 채널간 대역폭 확장 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |