CN110622242B - 用于立体声解码的立体声参数 - Google Patents
用于立体声解码的立体声参数 Download PDFInfo
- Publication number
- CN110622242B CN110622242B CN201880030918.7A CN201880030918A CN110622242B CN 110622242 B CN110622242 B CN 110622242B CN 201880030918 A CN201880030918 A CN 201880030918A CN 110622242 B CN110622242 B CN 110622242B
- Authority
- CN
- China
- Prior art keywords
- channel
- value
- frame
- decoded
- generate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 claims description 106
- 230000004044 response Effects 0.000 claims description 36
- 230000003595 spectral effect Effects 0.000 claims description 2
- 238000004378 air conditioning Methods 0.000 claims 9
- 230000005236 sound signal Effects 0.000 description 178
- 230000005540 biological transmission Effects 0.000 description 25
- 230000000875 corresponding effect Effects 0.000 description 17
- 230000001364 causal effect Effects 0.000 description 11
- 230000003111 delayed effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000002123 temporal effect Effects 0.000 description 10
- 230000010363 phase shift Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000009977 dual effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000001934 delay Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 238000010295 mobile communication Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 235000019800 disodium phosphate Nutrition 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003139 buffering effect Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/05—Generation or adaptation of centre channel in multi-channel audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
- Error Detection And Correction (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种设备包含接收器及解码器。所述接收器经配置以接收包含经编码中间声道及经量化值的位流,所述经量化值表示与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值。所述移位的所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。所述解码器经配置以解码所述经编码中间声道以产生经解码中间声道,及基于所述经解码中间声道产生第一声道。所述解码器经进一步配置以基于所述经解码中间声道及所述经量化值产生第二声道。所述第一声道对应于所述参考声道且所述第二声道对应于所述目标声道。
Description
优先权主张
本申请案主张2017年5月11日申请的名为“用于立体声解码的立体声参数(STEREOPARAMETERS FOR STEREO DECODING)”的共同拥有美国临时专利申请案第62/505,041号及2018年4月25日申请的名为“用于立体声解码的立体声参数(STEREO PARAMETERS FORSTEREO DECODING)”的美国非临时专利申请案第15/962,834号的优先权益,前述申请案中的每一者的内容的全文以引用的方式明确地并入本文中。
技术领域
本发明大体上涉及解码音频信号。
背景技术
技术的进步已产生更小且更强大的计算装置。举例来说,当前存在多种便携式个人计算装置,包含例如移动及智能电话的无线电话、平板计算机及膝上型计算机,其体积小、重量轻且容易由用户携带。这些装置可经由无线网络传达语音及数据包。另外,许多此类装置结合额外功能性,例如数字静态相机、数字视频相机、数字记录器及音频文件播放器。此外,此类装置可处理可用以存取互联网的可执行指令,包含软件应用程序,例如网页浏览器应用程序。因而,这些装置可包含显著的计算能力。
计算装置可包含或可耦合至多个麦克风以接收音频信号。通常,声源与多个麦克风中的第一麦克风的接近程度大于与多个麦克风中的第二麦克风的接近程度。因此,由于第一麦克风及第二麦克风与声源相隔的相应距离,从第二麦克风接收的第二音频信号可相对于从第一麦克风接收的第一音频信号延迟。在其它实施方案中,第一音频信号可相对于第二音频信号延迟。在立体声编码中,可编码来自麦克风的音频信号以产生中间声道信号及一或多个旁声道信号。中间声道信号可对应于第一音频信号与第二音频信号的总和。旁声道信号可对应于第一音频信号与第二音频信号之间的差。由于在接收第二音频信号相对于第一音频信号方面的延迟,第一音频信号可能不与第二音频信号对准。延迟可由被传输至解码器的经编码移位值(例如立体声参数)指示。第一音频信号与第二音频信号的精确对准会使能够进行高效编码以用于传输至解码器。然而,相较于传输低精确度数据,传输指示音频信号的对准的高精确度数据会使用增加的传输资源。还可编码指示第一音频信号与第二音频信号之间的特性的其它立体声参数且将其传输至解码器。
解码器可至少基于中间声道信号及立体声参数重构第一音频信号及第二音频信号,立体声参数是经由包含一系列帧的位流在解码器处被接收。音频信号重构期间的解码器处的精确度可基于编码器的精确度。举例来说,经编码高精确度移位值可在解码器处被接收,且可使解码器能够以高精确度在第一音频信号及第二音频信号的经重构版本中重现延迟。如果移位值在解码器处不可用,例如当经由位流传输的数据的帧由于有噪声的传输条件而损坏时,那么可请求移位值且将其重新传输至解码器以使能够精确地重现音频信号之间的延迟。举例来说,解码器在重现延迟方面的精确度可超过人类的可听感知力限制以感知延迟的变化。
发明内容
根据本发明的一项实施方案,一种设备包含接收器,其经配置以接收位流的至少一部分。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值,且所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述设备还包含解码器,其经配置以解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分。所述解码器还经配置以至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分,及至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分。所述解码器经进一步配置以响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种解码信号的方法包含接收位流的至少一部分。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值,且所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述方法还包含解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分。所述方法进一步包含至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分,及至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分。所述方法还包含响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种非暂时性计算机可读媒体包含指令,所述指令在由解码器内的处理器执行时致使所述处理器执行操作,所述操作包含接收位流的至少一部分。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值,且所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述操作还包含解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分。所述操作进一步包含至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分,及至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分。所述操作还包含响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种设备包含用于接收位流的至少一部分的装置。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值,且所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述设备还包含用于解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分的装置。所述设备进一步包含用于至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分的装置,及用于至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分的装置。所述设备还包含用于响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分的装置。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种设备包含接收器,其经配置以从编码器接收位流的至少一部分。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值。所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述设备还包含解码器,其经配置以解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分。所述解码器还经配置以对所述经解码中间声道的所述第一部分执行变换操作以产生经解码频域中间声道的第一部分。所述解码器经进一步配置以上混所述经解码频域中间声道的所述第一部分以产生左频域声道的第一部分及右频域声道的第一部分。所述解码器还经配置以至少基于所述左频域声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分。所述解码器经进一步配置以至少基于所述右频域声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分。所述解码器还经配置以确定所述第二帧不可用于解码操作。所述解码器经进一步配置以响应于确定所述第二帧不可用而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种解码信号的方法包含在解码器处从编码器接收位流的至少一部分。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值。所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述方法还包含解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分。所述方法进一步包含对所述经解码中间声道的所述第一部分执行变换操作以产生经解码频域中间声道的第一部分。所述方法还包含上混所述经解码频域中间声道的所述第一部分以产生左频域声道的第一部分及右频域声道的第一部分。所述方法进一步包含至少基于所述左频域声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分。所述方法进一步包含至少基于所述右频域声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分。所述方法还包含确定所述第二帧不可用于解码操作。所述方法进一步包含响应于确定所述第二帧不可用而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种非暂时性计算机可读媒体包含指令,所述指令在由解码器内的处理器执行时致使所述处理器执行操作,所述操作包含从编码器接收位流的至少一部分。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值。所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述操作还包含解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分。所述操作进一步包含对所述经解码中间声道的所述第一部分执行变换操作以产生经解码频域中间声道的第一部分。所述操作还包含上混所述经解码频域中间声道的所述第一部分以产生左频域声道的第一部分及右频域声道的第一部分。所述操作进一步包含至少基于所述左频域声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分。所述操作进一步包含至少基于所述右频域声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分。所述操作还包含确定所述第二帧不可用于解码操作。所述操作进一步包含响应于确定所述第二帧不可用而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种设备包含用于从编码器接收位流的至少一部分的装置。所述位流包含第一帧及第二帧。所述第一帧包含中间声道的第一部分及立体声参数的第一值。所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值。所述设备还包含用于解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分的装置。所述设备还包含用于对所述经解码中间声道的所述第一部分执行变换操作以产生经解码频域中间声道的第一部分的装置。所述设备还包含用于上混所述经解码频域中间声道的所述第一部分以产生左频域声道的第一部分及右频域声道的第一部分的装置。所述设备还包含用于至少基于所述左频域声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分的装置。所述设备还包含用于至少基于所述右频域声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分的装置。所述设备还包含用于确定所述第二帧不可用于解码操作的装置。所述设备还包含用于响应于所述第二帧不可用的确定而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分的装置。所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
根据另一实施方案,一种设备包含接收器及解码器。所述接收器经配置以接收包含经编码中间声道及经量化值的位流,所述经量化值表示与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值。所述移位的所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。所述解码器经配置以解码所述经编码中间声道以产生经解码中间声道,及基于所述经解码中间声道产生第一声道。所述解码器经进一步配置以基于所述经解码中间声道及所述经量化值产生第二声道。所述第一声道对应于所述参考声道且所述第二声道对应于所述目标声道。
根据另一实施方案,一种解码信号的方法包含在解码器处接收包含中间声道及经量化值的位流,所述经量化值表示与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值。所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。所述方法还包含解码所述中间声道以产生经解码中间声道。所述方法进一步包含基于所述经解码中间声道产生第一声道,及基于所述经解码中间声道及所述经量化值产生第二声道。所述第一声道对应于所述参考声道且所述第二声道对应于所述目标声道。
根据另一实施方案,一种非暂时性计算机可读媒体包含指令,所述指令在由解码器内的处理器执行时致使所述处理器执行操作,所述操作包含在解码器处接收包含中间声道及经量化值的位流,所述经量化值表示与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值。所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。所述操作还包含解码所述中间声道以产生经解码中间声道。所述操作进一步包含基于所述经解码中间声道产生第一声道,及基于所述经解码中间声道及所述经量化值产生第二声道。所述第一声道对应于所述参考声道且所述第二声道对应于所述目标声道。
根据另一实施方案,一种设备包含用于在解码器处接收包含中间声道及经量化值的位流的装置,所述经量化值表示与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值。所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。所述设备还包含用于解码所述中间声道以产生经解码中间声道的装置。所述设备进一步包含用于基于所述经解码中间声道产生第一声道的装置,及用于基于所述经解码中间声道及所述经量化值产生第二声道的装置。所述第一声道对应于所述参考声道且所述第二声道对应于所述目标声道。
根据另一实施方案,一种设备包含接收器,其经配置以从编码器接收位流。所述位流包含中间声道及经量化值,所述经量化值表示与所述编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值,所述值相比于所述经量化值具有较大精确度。所述设备还包含解码器,其经配置以解码所述中间声道以产生经解码中间声道。所述解码器还经配置以对所述经解码中间声道执行变换操作以产生经解码频域中间声道。所述解码器经进一步配置以上混所述经解码频域中间声道以产生第一频域声道及第二频域声道。所述解码器还经配置以基于所述第一频域声道产生第一声道。所述第一声道对应于所述参考声道。所述解码器经进一步配置以基于所述第二频域声道产生第二声道。所述第二声道对应于所述目标声道。如果所述经量化值对应于频域移位,那么所述第二频域声道在频域中被移位所述经量化值,且如果所述经量化值对应于时域移位,那么所述第二频域声道的时域版本被移位所述经量化值。
根据另一实施方案,一种方法包含在解码器处从编码器接收位流。所述位流包含中间声道及经量化值,所述经量化值表示与所述编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值,所述值相比于所述经量化值具有较大精确度。所述方法还包含解码所述中间声道以产生经解码中间声道。所述方法进一步包含对所述经解码中间声道执行变换操作以产生经解码频域中间声道。所述方法还包含上混所述经解码频域中间声道以产生第一频域声道及第二频域声道。所述方法还包含基于所述第一频域声道产生第一声道。所述第一声道对应于所述参考声道。所述方法进一步包含基于所述第二频域声道产生第二声道。所述第二声道对应于所述目标声道。如果所述经量化值对应于频域移位,那么所述第二频域声道在频域中被移位所述经量化值,且如果所述经量化值对应于时域移位,那么所述第二频域声道的时域版本被移位所述经量化值。
根据另一实施方案,一种非暂时性计算机可读媒体包含用于解码信号的指令。所述指令在由解码器内的处理器执行时致使所述处理器执行操作,所述操作包含从编码器接收位流。所述位流包含中间声道及经量化值,所述经量化值表示与所述编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值,所述值相比于所述经量化值具有较大精确度。所述操作还包含解码所述中间声道以产生经解码中间声道。所述操作进一步包含对所述经解码中间声道执行变换操作以产生经解码频域中间声道。所述操作还包含上混所述经解码频域中间声道以产生第一频域声道及第二频域声道。所述操作还包含基于所述第一频域声道产生第一声道。所述第一声道对应于所述参考声道。所述操作进一步包含基于所述第二频域声道产生第二声道。所述第二声道对应于所述目标声道。如果所述经量化值对应于频域移位,那么所述第二频域声道在频域中被移位所述经量化值,且如果所述经量化值对应于时域移位,那么所述第二频域声道的时域版本被移位所述经量化值。
根据另一实施方案,一种设备包含用于从编码器接收位流的装置。所述位流包含中间声道及经量化值,所述经量化值表示与所述编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位。所述经量化值是基于所述移位的值,所述值相比于所述经量化值具有较大精确度。所述设备还包含用于解码所述中间声道以产生经解码中间声道的装置。所述设备还包含用于对所述经解码中间声道执行变换操作以产生经解码频域中间声道的装置。所述设备还包含用于上混所述经解码频域中间声道以产生第一频域声道及第二频域声道的装置。所述设备还包含用于基于所述第一频域声道产生第一声道的装置。所述第一声道对应于所述参考声道。所述设备还包含用于基于所述第二频域声道产生第二声道的装置。所述第二声道对应于所述目标声道。如果所述经量化值对应于频域移位,那么所述第二频域声道在频域中被移位所述经量化值,且如果所述经量化值对应于时域移位,那么所述第二频域声道的时域版本被移位所述经量化值。
在审阅整个申请案之后,本发明的其它实施方案、优势及特征将变得显而易见,所述整个申请案包含以下章节:附图说明、具体实施方式,及权利要求书。
附图说明
图1为包含解码器的系统的特定说明性实例的框图,解码器可操作以估计缺失帧的立体声参数且使用经量化立体声参数来解码音频信号;
图2为绘示图1的解码器的图解;
图3为预测解码器处的缺失帧的立体声参数的说明性实例的图解;
图4A为解码音频信号的方法的非限制性说明性实例;
图4B为图4A的解码音频信号的方法的更详细版本的非限制性说明性实例;
图5A为解码音频信号的方法的另一非限制性说明性实例;
图5B为图5A的解码音频信号的方法的更详细版本的非限制性说明性实例;
图6为包含解码器的装置的特定说明性实例的框图,解码器用以估计缺失帧的立体声参数且使用经量化立体声参数来解码音频信号;且
图7为基站的框图,基站可操作以估计缺失帧的立体声参数且使用经量化立体声参数来解码音频信号。
具体实施方式
下文参考附图来描述本发明的特定方面。在所述描述中,共同特征是由共同参考编号指示。如本文中所使用,各种术语是仅出于描述特定实施方案的目的而使用,且并不意图限制实施方案。举例来说,除非上下文另有清楚指示,否则单数形式“一(a/an)”及“所述”意图同样包含复数形式。可进一步理解,术语“包括(comprises及comprising)”可与“包含(includes或including)”互换地使用。另外,应理解,术语“其中(wherein)”可与“其中(where)”互换地使用。如本文中所使用,用以修饰例如结构、组件、操作等等的元件的序数术语(例如“第一”、“第二”、“第三”等等)本身并不指示所述元件相对于另一元件的任何优先权或次序,而是仅仅区别所述元件与具有相同名称的另一元件(假使没有使用序数术语)。如本文中所使用,术语“集合”是指特定元件中的一或多个,且术语“多个”是指特定元件中的多个(例如两个或多于两个)。
在本发明中,例如“确定”、“计算”、“移位”、“调整”等等的术语可用以描述如何执行一或多个操作。应注意,此类术语不应被认作限制性的,且其它技术可用以执行相似操作。另外,如本文中所提及,“产生”、“计算”、“使用”、“选择”、“存取”及“确定”可互换地使用。举例来说,“产生”、“计算”或“确定”参数(或信号)可指主动地产生、计算或确定所述参数(或所述信号),或可指使用、选择或存取已经例如由另一组件或装置产生的所述参数(或所述信号)。
本发明揭示可操作以编码多个音频信号的系统及装置。装置可包含经配置以编码多个音频信号的编码器。可使用多个记录装置--例如多个麦克风--在时间上同时地捕获多个音频信号。在一些实例中,可通过多路复用在同一时间或在不同时间记录的若干音频声道来合成地(例如人工地)产生多个音频信号(或多声道音频)。作为说明性实例,音频声道的同时记录或多路复用可产生2声道配置(即,立体声:左及右)、5.1声道配置(左、右、中央、左环绕、右环绕及低频加重(low frequency emphasis;LFE)声道)、7.1声道配置、7.1+4声道配置、22.2声道配置或N声道配置。
电话会议室(或远程呈现室)内的音频捕获装置可包含获取空间音频的多个麦克风。空间音频可包含话语以及被编码及传输的背景音频。取决于多个麦克风如何被布置以及给定源(例如谈话者)相对于所述麦克风及室尺寸位于何处,来自所述源(例如谈话者)的话语/音频可在不同时间到达所述麦克风。举例来说,声源(例如谈话者)和与装置相关联的第一麦克风的接近程度可大于和与装置相关联的第二麦克风的接近程度。因此,从声源发出的声音到达第一麦克风的时间可早于到达第二麦克风的时间。装置可经由第一麦克风接收第一音频信号,且可经由第二麦克风接收第二音频信号。
中间-旁(mid-side;MS)译码及参数立体声(parametric stereo;PS)译码为可提供优于双单声道译码技术的改善性能的立体声译码技术。在双单声道译码中,独立地译码左(L)声道(或信号)及右(R)声道(或信号),而不利用声道间相关性。MS译码通过在译码之前将左声道及右声道变换为总和声道及差声道(例如旁声道)而缩减相关L/R声道对之间的冗余。总和信号及差信号被波形译码或基于MS译码中的模型被译码。在总和信号上所耗费的位相对多于在旁信号上所耗费的位。PS译码通过将L/R信号变换为总和信号及旁参数集合而缩减每一子频带中的冗余。旁参数可指示声道间强度差(inter-channel intensitydifference;IID)、声道间相位差(inter-channel phase difference;IPD)、声道间时差(inter-channel time difference;ITD)、旁或残差预测增益等等。总和信号被波形译码且连同旁参数一起被传输。在混合系统中,旁声道可在下频带(例如小于2千赫兹(kHz))中被波形译码且在上频带(例如大于或等于2kHz)中被PS译码,其中声道间相位保留在感知上较不关键。在一些实施方案中,PS译码还可在波形译码之前用于下频带中以缩减声道间冗余。
MS译码及PS译码可在频域中或在子频带域中或在时域中进行。在一些实例中,左声道与右声道可能不相关。举例来说,左声道及右声道可包含不相关合成信号。当左声道与右声道不相关时,MS译码、PS译码或两者的译码效率可接近双单声道译码的译码效率。
取决于记录配置,可在左声道与右声道之间存在时间移位,以及存在其它空间效应,例如回音及室内混响。如果不补偿声道之间的时间移位及相位失配,那么总和声道及差声道可含有相当的能量,从而缩减与MS或PS技术相关联的译码增益。译码增益的缩减可基于时间(或相位)移位的量。总和信号及差信号的相当的能量可限制声道在时间上移位但高度地相关的某些帧中的MS译码的使用。在立体声译码中,可基于以下公式产生中间声道(例如总和声道)及旁声道(例如差声道):
M=(L+R)/2,S=(L-R)/2, 公式1
其中M对应于中间声道,S对应于旁声道,L对应于左声道,且R对应于右声道。
在一些状况下,可基于以下公式产生中间声道及旁声道:
M=c(L+R),S=c(L-R), 公式2
其中c对应于频率相依的复合值。基于公式1或公式2产生中间声道及旁声道可被称作“下混(downmixing)”。基于公式1或公式2从中间声道及旁声道产生左声道及右声道的反向过程可被称作“上混(upmixing)”。
在一些状况下,中间声道可基于其它公式,例如:
M=(L+gDR)/2,或 公式3
M=g1L+g2R 公式4
其中g1+g2=1.0,且其中gD为增益参数。在其它实例中,可在频带中执行下混,其中mid(b)=c1L(b)+c2R(b),其中c1及c2为复数,其中side(b)=c3L(b)-c4R(b),且其中c3及c4为复数。
用以针对特定帧而在MS译码或双单声道译码之间选择的特别途径可包含产生中间信号及旁信号,计算中间信号及旁信号的能量,及基于所述能量确定是否执行MS译码。举例来说,可响应于确定旁信号与中间信号的能量比率小于阈值而执行MS译码。出于说明起见,如果右声道被移位至少第一时间(例如约0.001秒或48kHz下48个样本),那么针对有声话语帧,中间信号的第一能量(对应于左信号与右信号的总和)可与旁信号的第二能量(对应于左信号与右信号之间的差)相当。当第一能量与第二能量相当时,可使用较高数目个位以编码旁声道,由此相对于双单声道译码而缩减MS译码的译码性能。当第一能量与第二能量相当时(例如当第一能量与第二能量的比率大于或等于阈值时),可因此使用双单声道译码。在替代途径中,可基于左声道及右声道的阈值及归一化交叉相关性值的比较针对特定帧而在MS译码与双单声道译码之间作出决定。
在一些实例中,编码器可确定指示第一音频信号与第二音频信号之间的时间未对准的量的失配值。如本文中所使用,“时间移位值”、“移位值”及“失配值”可互换地使用。举例来说,编码器可确定指示第一音频信号相对于第二音频信号的移位(例如时间失配)的时间移位值。时间失配值可对应于第一麦克风处的第一音频信号的接收与第二麦克风处的第二音频信号的接收之间的时间延迟的量。此外,编码器可在逐帧基础上--例如基于每一20毫秒(ms)话语/音频帧--确定时间失配值。举例来说,时间失配值可对应于第二音频信号的第二帧相对于第一音频信号的第一帧延迟的时间量。替代地,时间失配值可对应于第一音频信号的第一帧相对于第二音频信号的第二帧延迟的时间量。
当声源与第一麦克风的接近程度大于与第二麦克风的接近程度时,第二音频信号的帧可相对于第一音频信号的帧延迟。在此状况下,第一音频信号可被称作“参考音频信号”或“参考声道”,且经延迟第二音频信号可被称作“目标音频信号”或“目标声道”。替代地,当声源与第二麦克风的接近程度大于与第一麦克风的接近程度时,第一音频信号的帧可相对于第二音频信号的帧延迟。在此状况下,第二音频信号可被称作参考音频信号或参考声道,且经延迟第一音频信号可被称作目标音频信号或目标声道。
取决于声源(例如谈话者)在会议室或远程呈现室内位于何处或声源(例如谈话者)位置相对于麦克风如何改变,参考声道及目标声道可从一个帧至另一帧而改变;相似地,时间延迟值还可从一个帧至另一帧而改变。然而,在一些实施方案中,时间失配值可始终为正以指示“目标”声道相对于“参考”声道的延迟量。此外,时间失配值可对应于“非因果移位(non-causal shift)”值,经延迟目标声道在时间上被“拉回”所述值,使得所述目标声道与“参考”声道对准(例如最大限度地对准)。可对参考声道及经非因果移位目标声道执行用以确定中间声道及旁声道的下混算法。
编码器可基于参考音频声道及应用于目标音频声道的多个时间失配值确定时间失配值。举例来说,可在第一时间(m1)接收参考音频声道的第一帧X。可在对应于第一时间失配值的第二时间(n1)接收目标音频声道的第一特定帧Y,例如shift1=n1-m1。另外,可在第三时间(m2)接收参考音频声道的第二帧。可在对应于第二时间失配值的第四时间(n2)接收目标音频声道的第二特定帧,例如shift2=n2-m2。
装置可以第一取样速率(例如32kHz取样速率(即,每帧640个样本))执行成帧或缓冲算法以产生帧(例如20ms样本)。编码器可响应于确定第一音频信号的第一帧及第二音频信号的第二帧在同一时间到达装置而将时间失配值(例如shift1)估计为等于零个样本。左声道(例如对应于第一音频信号)与右声道(例如对应于第二音频信号)可在时间上对准。在一些状况下,即使当对准时,左声道与右声道也可由于各种原因(例如麦克风校准)而在能量方面不同。
在一些实例中,左声道与右声道可由于各种原因(例如,例如谈话者的声源与麦克风中的一者的接近程度可大于与麦克风中的另一者的接近程度,且两个麦克风相隔的距离可大于阈值(例如1至20厘米)距离)而在时间上未对准。声源相对于麦克风的位置可在左声道及右声道中引入不同延迟。另外,可在左声道与右声道之间存在增益差、能量差或电平差。
在一些实例中,在存在多于两个声道的情况下,参考声道最初基于声道的电平或能量被选择,且随后基于不同声道对之间的时间失配值--例如t1(ref,ch2)、t2(ref,ch3)、t3(ref,ch4)、…--被改进,其中ch1最初为参考声道且t1(.)、t2(.)等等为用以估计失配值的函数。如果所有时间失配值为正,那么ch1被视为参考声道。如果失配值中的任一者为负值,那么参考声道被重新配置为与引起负值的失配值相关联的声道,且继续以上过程直到实现参考声道的最佳选择(例如基于使最大数目个旁声道最大限度地去相关)。可使用迟滞以克服参考声道选择的任何突然变化。
在一些实例中,当多个谈话者交替地谈话(例如无重叠)时,音频信号从多个声源(例如谈话者)到达麦克风的时间可变化。在此类状况下,编码器可基于谈话者动态地调整时间失配值以识别参考声道。在一些其它实例中,多个谈话者可在同一时间谈话,这可取决于哪一谈话者最大声、最接近于麦克风等等而引起变化时间失配值。在此类状况下,参考声道及目标声道的识别可基于当前帧中的变化时间移位值及先前帧中的经估计时间失配值,且基于第一音频信号及第二音频信号的能量或时间演进。
在一些实例中,当第一音频信号及第二音频信号潜在地展示较少(例如无)相关性时,可合成或人工地产生所述两个信号。应理解,本文中所描述的实例是说明性的,且可在相似或不同情形中确定第一音频信号与第二音频信号之间的关系方面具指导性。
编码器可基于第一音频信号的第一帧与第二音频信号的多个帧的比较而产生比较值(例如差值或交叉相关性值)。多个帧中的每一帧可对应于特定时间失配值。编码器可基于比较值产生第一经估计时间失配值。举例来说,第一经估计时间失配值可对应于指示第一音频信号的第一帧与第二音频信号的对应第一帧之间的较高时间相似性(或较低差)的比较值。
编码器可通过在多个阶段中改进一系列经估计时间失配值而确定最终时间失配值。举例来说,编码器可首先基于从第一音频信号及第二音频信号的经立体声预处理及重新取样版本产生的比较值估计“暂定”时间失配值。编码器可产生与和经估计“暂定”时间失配值紧接的时间失配值相关联的经内插比较值。编码器可基于经内插比较值确定第二经估计“经内插”时间失配值。举例来说,第二经估计“经内插”时间失配值可对应于相比于剩余经内插比较值及第一经估计“暂定”时间失配值指示较高时间相似性(或较低差)的特定经内插比较值。如果当前帧(例如第一音频信号的第一帧)的第二经估计“经内插”时间失配值不同于前一帧(例如先于第一帧的第一音频信号的帧)的最终时间失配值,那么当前帧的“经内插”时间失配值进一步“经修正”以改善第一音频信号与经移位第二音频信号之间的时间相似性。具体地说,第三经估计“经修正”时间失配值可通过查究当前帧的第二经估计“经内插”时间失配值及前一帧的最终经估计时间失配值而对应于时间相似性的更准确的度量。第三经估计“经修正”时间失配值进一步经调节以通过限制帧之间的时间失配值的任何伪(spurious)改变而估计最终时间失配值,且进一步经控制以不在如本文中所描述的两个逐次(或连续)帧中从负时间失配值切换到正时间失配值(或反之亦然)。
在一些实例中,编码器可制止在连续帧中或在邻近帧中在正时间失配值与负时间失配值之间切换,或反之亦然。举例来说,编码器可基于第一帧的经估计“经内插”或“经修正”时间失配值及先于第一帧的特定帧中的对应经估计“经内插”或“经修正”或最终时间失配值而将最终时间失配值设定为指示无时间移位的特定值(例如0)。出于说明起见,编码器可响应于确定当前帧(例如第一帧)的一个经估计“暂定”或“经内插”或“经修正”时间失配值为正且前一帧(例如先于第一帧的帧)的另一经估计“暂定”或“经内插”或“经修正”或“最终”经估计时间失配值为负而将当前帧的最终时间失配值设定为指示无时间移位,即,shift1=0。替代地,编码器还可响应于确定当前帧(例如第一帧)的一个经估计“暂定”或“经内插”或“经修正”时间失配值为负且前一帧(例如先于第一帧的帧)的另一经估计“暂定”或“经内插”或“经修正”或“最终”经估计时间失配值为正而将当前帧的最终时间失配值设定为指示无时间移位,即,shift1=0。
编码器可基于时间失配值而将第一音频信号或第二音频信号的帧选择为“参考”或“目标”。举例来说,响应于确定最终时间失配值为正,编码器可产生具有指示第一音频信号为“参考”信号且第二音频信号为“目标”信号的第一值(例如0)的参考声道或信号指示符。替代地,响应于确定最终时间失配值为负,编码器可产生具有指示第二音频信号为“参考”信号且第一音频信号为“目标”信号的第二值(例如1)的参考声道或信号指示符。
编码器可估计与参考信号及经非因果移位目标信号相关联的相对增益(例如相对增益参数)。举例来说,响应于确定最终时间失配值为正,编码器可估计用以归一化或均衡第一音频信号相对于第二音频信号的振幅或功率电平的增益值,所述增益值被偏移达到所述非因果时间失配值(例如最终时间失配值的绝对值)。替代地,响应于确定最终时间失配值为负,编码器可估计用以归一化或均衡经非因果移位第一音频信号相对于第二音频信号的振幅或功率电平的增益值。在一些实例中,编码器可估计用以归一化或均衡“参考”信号相对于经非因果移位“目标”信号的振幅或功率电平的增益值。在其它实例中,编码器可基于参考信号相对于目标信号(例如未移位目标信号)估计增益值(例如相对增益值)。
编码器可基于参考信号、目标信号、非因果时间失配值及相对增益参数产生至少一个经编码信号(例如中间信号、旁信号或两者)。在其它实施方案中,编码器可基于参考声道及经时间失配调整目标声道产生至少一个经编码信号(例如中间声道、旁声道或两者)。旁信号可对应于第一音频信号的第一帧的第一样本与第二音频信号的经选择帧的经选择样本之间的差。编码器可基于最终时间失配值选择经选择帧。由于与对应于由装置在与第一帧同时接收的第二音频信号的帧的第二音频信号的其它样本相比较,第一样本与经选择样本之间的差缩减,故可使用较少位以编码旁声道信号。装置的发射器可传输至少一个经编码信号、非因果时间失配值、相对增益参数、参考声道或信号指示符或其组合。
编码器可基于参考信号、目标信号、非因果时间失配值、相对增益参数、第一音频信号的特定帧的低频带参数、特定帧的高频带参数或其组合而产生至少一个经编码信号(例如中间信号、旁信号或两者)。特定帧可先于第一帧。可使用来自一或多个先前帧的某些低频带参数、高频带参数或其组合以编码第一帧的中间信号、旁信号或两者。基于低频带参数、高频带参数或其组合而编码中间信号、旁信号或两者可改善非因果时间失配值及声道间相对增益参数的估计。低频带参数、高频带参数或其组合可包含音调参数、发声参数、译码器类型参数、低频带能量参数、高频带能量参数、倾角参数、音调增益参数、FCB增益参数、译码模式参数、语音活动参数、噪声估计参数、信噪比参数、共振峰参数、话语/音乐决策参数、非因果移位、声道间增益参数或其组合。装置的发射器可传输至少一个经编码信号、非因果时间失配值、相对增益参数、参考声道(或信号)指示符或其组合。在本发明中,例如“确定”、“计算”、“移位”、“调整”等等的术语可用以描述如何执行一或多个操作。应注意,此类术语不应被认作限制性的,且其它技术可用以执行相似操作。
根据一些实施方案,最终时间失配值(例如移位值)为指示目标声道与参考声道之间的“真”移位的“未量化”值。尽管所有数字值由于由存储或使用数字值的系统提供的精确度而“经量化”,但如本文中所使用,数字值在通过用以缩减数字值的精确度(例如用以缩减与数字值相关联的范围或带宽)的量化操作而产生的情况下“经量化”,且否则“未量化”。作为非限制性实例,第一音频信号可为目标声道,且第二音频信号可为参考声道。如果目标声道与参考声道之间的真移位为三十七个样本,那么目标声道可在编码器处被移位三十七个样本以产生与参考声道在时间上对准的经移位目标声道。在其它实施方案中,两个声道皆可经移位使得所述声道之间的相对移位等于最终移位值(在此实例中为37个样本)。对声道进行此相对移位达所述移位值会实现在时间上对准所述声道的效应。高效率编码器可尽可能地对准声道以缩减译码熵,且因此增加译码效率,这是因为译码熵对声道之间的移位改变敏感。经移位目标声道及参考声道可用以产生被编码且作为位流的部分而传输至解码器的中间声道。另外,最终时间失配值可被量化且作为位流的部分而传输至解码器。举例来说,可使用为四的“底限(floor)”来量化最终时间失配值,使得经量化最终时间失配值等于九(例如大致37/4)。
解码器可解码中间声道以产生经解码中间声道,且解码器可基于经解码中间声道产生第一声道及第二声道。举例来说,解码器可使用包含于位流中的立体声参数来上混经解码中间声道以产生第一声道及第二声道。第一声道及第二声道可在解码器处在时间上对准;然而,解码器可基于经量化最终时间失配值而使所述声道中的一或多者相对于彼此移位。举例来说,如果第一声道对应于编码器处的目标声道(例如第一音频信号),那么解码器可使第一声道移位三十六个样本(例如4*9)以产生经移位第一声道。在感知上,经移位第一声道及第二声道分别相似于目标声道及参考声道。举例来说,如果编码器处的目标声道与参考声道之间的三十七样本移位对应于10ms移位,那么解码器处的经移位第一声道与第二声道之间的三十六样本移位在感知上相似于且可在感知上不可区别于三十七样本移位。
参看图1,展示系统100的特定说明性实例。系统100包含第一装置104,其经由网络120以通信方式耦合至第二装置106。网络120可包含一或多个无线网络、一或多个有线网络或其组合。
第一装置104包含编码器114、发射器110及一或多个输入接口112。输入接口112中的第一输入接口可耦合至第一麦克风146。输入接口112中的第二输入接口可耦合至第二麦克风148。第一装置104还可包含经配置以存储分析数据的存储器153,如下文所描述。第二装置106可包含解码器118及存储器154。第二装置106可耦合至第一喇叭142、第二喇叭144或两者。
在操作期间,第一装置104可经由第一输入接口从第一麦克风146接收第一音频信号130,且可经由第二输入接口从第二麦克风148接收第二音频信号132。第一音频信号130可对应于右声道信号或左声道信号中的一者。第二音频信号132可对应于右声道信号或左声道信号中的另一者。如本文中所描述,第一音频信号130可对应于参考声道,且第二音频信号132可对应于目标声道。然而,应理解,在其它实施方案中,第一音频信号130可对应于目标声道,且第二音频信号132可对应于参考声道。在其它实施方案中,可能完全不存在参考声道及目标声道的指派。在此类状况下,可对所述声道中的任一者或两者执行编码器处的声道对准及解码器处的声道去对准,使得所述声道之间的相对移位是基于移位值。
第一麦克风146及第二麦克风148可从声源152(例如用户、扬声器、环境噪声、乐器等等)接收音频。在特定方面中,第一麦克风146、第二麦克风148或两者可从多个声源接收音频。多个声源可包含主要(或最主要)声源(例如声源152)及一或多个次要声源。一或多个次要声源可对应于交通、背景音乐、另一谈话者、街道噪声等等。声源152(例如主要声源)与第一麦克风146的接近程度可大于与第二麦克风148的接近程度。因此,在输入接口112处经由第一麦克风146从声源152接收音频信号的时间可早于经由第二麦克风148从声源152接收音频信号的时间。经由多个麦克风的多声道信号获取的此自然延迟可在第一音频信号130与第二音频信号132之间引入时间移位。
第一装置104可将第一音频信号130、第二音频信号132或两者存储于存储器153中。编码器114可确定指示针对第一帧190的第一音频信号130相对于第二音频信号132的移位(例如非因果移位)的第一移位值180(例如非因果移位值)。第一移位值180可为表示针对第一帧190的参考声道(例如第一音频信号130)与目标声道(例如第二音频信号132)之间的移位的值(例如未量化值)。第一移位值180可存储于存储器153中作为分析数据。编码器114还可确定指示针对第二帧192的第一音频信号130相对于第二音频信号132的移位的第二移位值184。第二帧192可在第一帧190之后(例如在时间上迟于第一帧190)。第二移位值184可为表示针对第二帧192的参考声道(例如第一音频信号130)与目标声道(例如第二音频信号132)之间的移位的值(例如未量化值)。第二移位值184也可存储于存储器153中作为分析数据。
因此,移位值180、184(例如失配值)可分别指示针对第一帧190及第二帧192的第一音频信号130与第二音频信号132之间的时间失配(例如时间延迟)量。如本文中所提及,“时间延迟(time delay)”可对应于“时间延迟(temporal delay)”。时间失配可指示第一音频信号130经由第一麦克风146的接收与第二音频信号132经由第二麦克风148的接收之间的时间延迟。举例来说,移位值180、184的第一值(例如正值)可指示第二音频信号132相对于第一音频信号130延迟。在此实例中,第一音频信号130可对应于前导信号且第二音频信号132可对应于滞后信号。移位值180、184的第二值(例如负值)可指示第一音频信号130相对于第二音频信号132延迟。在此实例中,第一音频信号130可对应于滞后信号且第二音频信号132可对应于前导信号。移位值180、184的第三值(例如0)可指示第一音频信号130与第二音频信号132之间无延迟。
编码器114可量化第一移位值180以产生第一经量化移位值181。出于说明起见,如果第一移位值180(例如真移位值)等于三十七个样本,那么编码器114可基于底限而量化第一移位值180以产生第一经量化移位值181。作为非限制性实例,如果底限等于四,那么第一经量化移位值181可等于九(例如大致37/4)。如下文所描述,第一移位值180可用以产生中间声道的第一部分191,且第一经量化移位值181可被编码至位流160中且被传输至第二装置106。如本文中所使用,信号或声道的“部分”包含:信号或声道的一或多个帧;信号或声道的一或多个子帧;信号或声道的一或多个样本、位、区块、字或其它片段;或其任何组合。以相似方式,编码器114可量化第二移位值184以产生第二经量化移位值185。出于说明起见,如果第二移位值184等于三十六个样本,那么编码器114可基于底限而量化第二移位值184以产生第二经量化移位值185。作为非限制性实例,第二经量化移位值185也可等于九(例如36/4)。如下文所描述,第二移位值184可用以产生中间声道的第二部分193,且第二经量化移位值185可被编码至位流160中且被传输至第二装置106。
编码器114还可基于移位值180、184产生参考信号指示符。举例来说,编码器114可响应于确定第一移位值180指示第一值(例如正值)而将参考信号指示符产生为具有指示第一音频信号130为“参考”信号且第二音频信号132对应于“目标”信号的第一值(例如0)。
编码器114可基于移位值180、184在时间上对准第一音频信号130与第二音频信号132。举例来说,对于第一帧190,编码器114可使第二音频信号132在时间上移位第一移位值180以产生与第一音频信号130在时间上对准的经移位第二音频信号。尽管第二音频信号132被描述为在时域中经历时间移位,但应理解,第二音频信号132可在频域中经历相移以产生经移位第二音频信号132。举例来说,第一移位值180可对应于频域移位值。对于第二帧192,编码器114可使第二音频信号132在时间上移位第二移位值184以产生与第一音频信号130在时间上对准的经移位第二音频信号。尽管第二音频信号132被描述为在时域中经历时间移位,但应理解,第二音频信号132可在频域中经历相移以产生经移位第二音频信号132。举例来说,第二移位值184可对应于频域移位值。
编码器114可基于参考声道的样本及目标声道的样本而针对每一帧产生一或多个额外立体声参数(例如除了移位值180、184以外的其它立体声参数)。作为非限制性实例,编码器114可针对第一帧190产生第一立体声参数182且针对第二帧192产生第二立体声参数186。立体声参数182、186的非限制性实例可包含其它移位值、声道间相位差参数、声道间电平差参数、声道间时差参数、声道间相关性参数、频谱倾角参数、声道间增益参数、声道间发声参数或声道间音调参数。
出于说明起见,如果立体声参数182、186对应于增益参数,那么对于每一帧,编码器114可基于参考信号(例如第一音频信号130)的样本且基于目标信号(例如第二音频信号132)的样本产生增益参数(例如译码器-解码器增益参数)。举例来说,对于第一帧190,编码器114可基于第一移位值180(例如非因果移位值)选择第二音频信号132的样本。如本文中所提及,基于移位值选择音频信号的样本可对应于通过基于移位值调整(例如移位)音频信号而产生经修改(例如经时移或经频移)音频信号且选择经修改音频信号的样本。举例来说,编码器114可通过基于第一移位值180移位第二音频信号132而产生经时移第二音频信号,且可选择经时移第二音频信号的样本。编码器114可响应于确定第一音频信号130为参考信号而基于第一音频信号130的第一帧190的第一样本确定经选择样本的增益参数。作为实例,增益参数可基于以下方程式中的一者:
其中gD对应于用于下混处理的相对增益参数,Ref(n)对应于“参考”信号的样本,N1对应于第一帧190的第一移位值180,且Targ(n+N1)对应于“目标”信号的样本。可例如基于方程式1a至1f中的一者修改增益参数(gD),以结合长期平滑/迟滞逻辑以避免帧之间的大增益跳跃。
编码器114可量化立体声参数182、186以产生被编码至位流160中且被传输至第二装置106的经量化立体声参数183、187。举例来说,编码器114可量化第一立体声参数182以产生第一经量化立体声参数183,且编码器114可量化第二立体声参数186以产生第二经量化立体声参数187。经量化立体声参数183、187分别相比于立体声参数182、186可具有较低分辨率(例如较少精确度)。
对于每一帧190、192,编码器114可基于移位值180、184、其它立体声参数182、186及音频信号130、132产生一或多个经编码信号。举例来说,对于第一帧190,编码器114可基于第一移位值180(例如未量化移位值)、第一立体声参数182及音频信号130、132产生中间声道的第一部分191。另外,对于第二帧192,编码器114可基于第二移位值184(例如未量化移位值)、第二立体声参数186及音频信号130、132产生中间声道的第二部分193。根据一些实施方案,编码器114可基于移位值180、184、其它立体声参数182、186及音频信号130、132而针对每一帧190、192产生旁声道(未展示)。
举例来说,编码器114可基于以下方程式中的一者产生中间声道的部分191、193:
M=Ref(n)+gDTarg(n+N1), 方程式2a
M=Ref(n)+Targ(n+N1), 方程式2b
M=Ref(n-N2)+Targ(n+N1-N2),其中N2可采取任一任意值,方程式2c其中M对应于中间声道,gD对应于用于下混处理的相对增益参数(例如立体声参数182、186),Ref(n)对应于“参考”信号的样本,N1对应于移位值180、184,且Targ(n+N1)对应于“目标”信号的样本。
编码器114可基于以下方程式中的一者产生旁声道:
S=Ref(n)-gDTarg(n+N1), 方程式3a
S=gDRef(n)-Targ(n+N1), 方程式3b
S=Ref(n-N2)-gD Targ(n+N1-N2),其中N2可采取任一任意值,
方程式3c
其中S对应于旁声道信号,gD对应于用于下混处理的相对增益参数(例如立体声参数182、186),Ref(n)对应于“参考”信号的样本,N1对应于移位值180、184,且Targ(n+N1)对应于“目标”信号的样本。
发射器110可经由网络120将位流160传输至第二装置106。第一帧190及第二帧192可被编码至位流160中。举例来说,中间声道的第一部分191、第一经量化移位值181及第一经量化立体声参数183可被编码至位流160中。另外,中间声道的第二部分193、第二经量化移位值185及第二经量化立体声参数187可被编码至位流160中。旁声道信息也可被编码于位流160中。尽管未展示,但额外信息也可针对每一帧190、192被编码至位流160中。作为非限制性实例,参考声道指示符可针对每一帧190、192被编码至位流160中。
由于不良传输条件,被编码至位流160中的一些数据可能会在传输中丢失。数据包丢失可能会由于不良传输条件而发生,帧擦除可能会由于不良无线电条件而发生,数据包可能会由于高抖动而迟到等等。根据非限制性说明性实例,第二装置106可接收位流160的第一帧190以及第二帧192的中间声道的第二部分193。因此,第二经量化移位值185及第二经量化立体声参数187可能会由于不良传输条件而在传输中丢失。
第二装置106可因此接收如由第一装置102所传输的位流160的至少一部分。第二装置106可将位流160的经接收部分存储于存储器154中(例如缓冲器中)。举例来说,第一帧190可存储于存储器154中,且第二帧192的中间声道的第二部分193也可存储于存储器154中。
解码器118可解码第一帧190以产生对应于第一音频信号130的第一输出信号126,及产生对应于第二音频信号132的第二输出信号128。举例来说,解码器118可解码中间声道的第一部分191以产生经解码中间声道的第一部分170。解码器118还可对经解码中间声道的第一部分170执行变换操作以产生经频域(frequency-domain;FD)解码中间声道的第一部分171。解码器118可上混经频域解码中间声道的第一部分171以产生与第一输出信号126相关联的第一频域声道(未展示)及与第二输出信号128相关联的第二频域声道(未展示)。在上混期间,解码器118可将第一经量化立体声参数183应用于经频域解码中间声道的第一部分171。
应注意,在其它实施方案中,解码器118可能不执行变换操作,而是基于中间声道、一些立体声参数(例如下混增益)且另外在可用时还基于时域中的经解码旁声道执行上混,以产生与第一输出声道126相关联的第一时域声道(未展示)及与第二输出声道128相关联的第二时域声道(未展示)。
如果第一经量化移位值181对应于频域移位值,那么解码器118可使第二频域声道移位第一经量化移位值181以产生第二经移位频域声道(未展示)。解码器118可对第一频域声道执行反变换操作以产生第一输出信号126。解码器118还可对第二经移位频域声道执行反变换操作以产生第二输出信号128。
如果第一经量化移位值181对应于时域移位值,那么解码器118可对第一频域声道执行反变换操作以产生第一输出信号126。解码器118还可对第二频域声道执行反变换操作以产生第二时域声道。解码器118可使第二时域声道移位第一经量化移位值181以产生第二输出信号128。因此,解码器118可使用第一经量化移位值181以模拟第一输出信号126与第二输出信号128之间的可感知差。第一喇叭142可输出第一输出信号126,且第二喇叭144可输出第二输出信号128。在一些状况下,可在时域中执行上混以直接产生第一时域声道及第二时域声道的实施方案中省略反变换操作,如上文所描述。还应注意,解码器118处的时域移位值的存在可仅仅指示解码器经配置以执行时域移位,且在一些实施方案中,尽管时域移位可在解码器118处可用(指示解码器在时域中执行移位操作),但供接收到位流的编码器可能已执行频域移位操作或时域移位操作以用于对准声道。
如果解码器118确定第二帧192不可用于解码操作(例如确定第二经量化移位值185及第二经量化立体声参数187不可用),那么解码器118可基于与第一帧190相关联的立体声参数而针对第二帧192产生输出信号126、128。举例来说,解码器118可基于第一经量化移位值181估计或内插第二经量化移位值185。另外,解码器118可基于第一经量化立体声参数183估计或内插第二经量化立体声参数187。
在估计第二经量化移位值185及第二经量化立体声参数187之后,解码器118可以与针对第一帧190产生输出信号126、128的方式相似的方式针对第二帧192产生输出信号126、128。举例来说,解码器118可解码中间声道的第二部分193以产生经解码中间声道的第二部分172。解码器118还可对经解码中间声道的第二部分172执行变换操作以产生第二经频域解码中间声道173。基于经估计量化移位值及经估计量化立体声参数187,解码器118可上混第二经频域解码中间声道173,对经上混信号执行反变换,且移位所得信号以产生输出信号126、128。关于图2更详细地描述解码操作的实例。
系统100可在编码器114处尽可能地对准声道以缩减译码熵,且因此增加译码效率,这是因为译码熵对声道之间的移位改变敏感。举例来说,编码器114可使用未量化移位值以准确地对准声道,这是因为未量化移位值具有相对高分辨率。在解码器118处,相较于使用未量化移位值,经量化立体声参数可用以使用缩减数目个位来模拟输出信号126、128之间的可感知差,且可使用一或多个先前帧的立体声参数来内插或估计缺失立体声参数(由于不良传输)。根据一些实施方案,移位值180、184(例如未量化移位值)可用以使目标声道在频域中移位,且经量化移位值181、185可用以使目标声道在时域中移位。举例来说,用于时域立体声编码的移位值相比于用于频域立体声编码的移位值可具有较低分辨率。
参看图2,展示绘示解码器118的特定实施方案的图解。解码器118包含中间声道解码器202、变换单元204、上混器206、反变换单元210、反变换单元212及移位器214。
可将图1的位流160提供至解码器118。举例来说,可将第一帧190的中间声道的第一部分191及第二帧192的中间声道的第二部分193提供至中间声道解码器202。另外,可将立体声参数201提供至上混器206及移位器214。立体声参数201可包含与第一帧190相关联的第一经量化移位值181及与第一帧190相关联的第一经量化立体声参数183。如上文关于图1所描述,由于不良传输条件,解码器118可能不会接收到与第二帧192相关联的第二经量化移位值185及与第二帧192相关联的第二经量化立体声参数187。
为了解码第一帧190,中间声道解码器202可解码中间声道的第一部分191以产生经解码中间声道的第一部分170(例如时域中间声道)。根据一些实施方案,可将两个不对称窗口应用于经解码中间声道的第一部分170以产生时域中间声道的经窗口化部分。将经解码中间声道的第一部分170提供至变换单元204。变换单元204可经配置以对经解码中间声道的第一部分170执行变换操作以产生经频域解码中间声道的第一部分171。将经频域解码中间声道的第一部分171提供至上混器206。根据一些实施方案,可完全跳过窗口化及变换操作,且可将经解码中间声道的第一部分170(例如时域中间声道)直接提供至上混器206。
上混器206可上混经频域解码中间声道的第一部分171以产生频域声道250的部分及频域声道254的部分。上混器206可在上混操作期间将第一经量化立体声参数183应用于经频域解码中间声道的第一部分171以产生频域声道250、254的部分。根据第一经量化移位值181包含频域移位(例如第一经量化移位值181对应于第一经量化频域移位值281)的实施方案,上混器206可基于第一经量化频域移位值281执行频域移位(例如相移)以产生频域声道254的部分。将频域声道250的部分提供至反变换单元210,且将频域声道254的部分提供至反变换单元212。根据一些实施方案,上混器206可经配置以在可在时域中应用立体声参数(例如基于目标增益值)的情况下对时域声道进行操作。
反变换单元210可对频域声道250的部分执行反变换操作以产生时域声道260的部分。将时域声道260的部分提供至移位器214。反变换单元212可对频域声道254的部分执行反变换操作以产生时域声道264的部分。还将时域声道264的部分提供至移位器214。在时域中执行上混操作的实施方案中,可跳过上混操作之后的反变换操作。
根据第一经量化移位值181对应于第一经量化频域移位值281的实施方案,移位器214可绕过移位操作且传递时域声道260、264的部分分别作为输出信号126、128的部分。根据第一经量化移位值181包含时域移位(例如第一经量化移位值181对应于第一经量化时域移位值291)的实施方案,移位器214可使时域声道264的部分移位第一经量化时域移位值291以产生第二输出信号128的部分。
因此,解码器118可使用具有缩减精确度的经量化移位值(相较于编码器114处使用的未量化移位值)以针对第一帧190产生输出信号126、128的部分。使用经量化移位值以使输出信号128相对于输出信号126移位可恢复用户在编码器114处对移位的感知。
为了解码第二帧192,中间声道解码器202可解码中间声道的第二部分193以产生经解码中间声道的第二部分172(例如时域中间声道)。根据一些实施方案,可将两个不对称窗口应用于经解码中间声道的第二部分172以产生时域中间声道的经窗口化部分。将经解码中间声道的第二部分172提供至变换单元204。变换单元204可经配置以对经解码中间声道的第二部分172执行变换操作以产生经频域解码中间声道的第二部分173。将经频域解码中间声道的第二部分173提供至上混器206。根据一些实施方案,可完全跳过窗口化及变换操作,且可将经解码中间声道的第二部分172(例如时域中间声道)直接提供至上混器206。
如上文关于图1所描述,由于不良传输条件,解码器118可能不会接收到第二经量化移位值185及第二经量化立体声参数187。结果,针对第二帧192的立体声参数可能不会由上混器206及移位器214可存取。上混器206包含立体声参数内插器208,其经配置以基于第一经量化频域移位值281内插(或估计)第二经量化移位值185。举例来说,立体声参数内插器208可基于第一经量化频域移位值281产生第二经内插频域移位值285。立体声参数内插器208还可经配置以基于第一经量化立体声参数183内插(或估计)第二经量化立体声参数187。举例来说,立体声参数内插器208可基于第一经量化立体声参数183产生第二经内插立体声参数287。
上混器206可上混经频域解码中间声道的第二部分173以产生频域声道252的部分及频域声道256的部分。上混器206可在上混操作期间将第二经内插立体声参数287应用于经频域解码中间声道的第二部分173以产生频域声道252、256的部分。根据第一经量化移位值181包含频域移位(例如第一经量化移位值181对应于第一经量化频域移位值281)的实施方案,上混器206可基于第二经内插频域移位值285执行频域移位(例如相移)以产生频域声道256的部分。将频域声道252的部分提供至反变换单元210,且将频域声道256的部分提供至反变换单元212。
反变换单元210可对频域声道252的部分执行反变换操作以产生时域声道262的部分。将时域声道262的部分提供至移位器214。反变换单元212可对频域声道256的部分执行反变换操作以产生时域声道266的部分。还将时域声道266的部分提供至移位器214。在上混器206对时域声道进行操作的实施方案中,可将上混器206的输出提供至移位器214,且可跳过或省略反变换单元210、212。
移位器214包含移位值内插器216,其经配置以基于第一经量化时域移位值291内插(或估计)第二经量化移位值185。举例来说,移位值内插器216可基于第一经量化时域移位值291产生第二经内插时域移位值295。根据第一经量化移位值181对应于第一经量化频域移位值281的实施方案,移位器214可绕过移位操作且传递时域声道262、266的部分分别作为输出信号126、128的部分。根据第一经量化移位值181对应于第一经量化时域移位值291的实施方案,移位器214可使时域声道266的部分移位第二经内插时域移位值295以产生第二输出信号128。
因此,解码器118可基于立体声参数或来自先前帧的立体声参数的变化而近似立体声参数(例如移位值)。举例来说,解码器118可从一或多个先前帧的立体声参数外推针对在传输(例如第二帧192)期间丢失的帧的立体声参数。
参看图3,展示用于预测解码器处的缺失帧的立体声参数的图解300。根据图解300,可能会成功地将第一帧190从编码器114传输至解码器118,且可能不会成功地将第二帧192从编码器114传输至解码器118。举例来说,第二帧192可能会由于不良传输条件而在传输中丢失。
解码器118可从第一帧190产生经解码中间声道的第一部分170。举例来说,解码器118可解码中间声道的第一部分191以产生经解码中间声道的第一部分170。在使用关于图2所描述的技术的情况下,解码器118还可基于经解码中间声道的第一部分170产生左声道的第一部分302及右声道的第一部分304。左声道的第一部分302可对应于第一输出信号126,且右声道的第一部分304可对应于第二输出信号128。举例来说,解码器118可使用第一经量化立体声参数183及第一经量化移位值181以产生声道302、304。
解码器118可基于第一经量化移位值181内插(或估计)第二经内插频域移位值285(或第二经内插时域移位值295)。根据其它实施方案,可基于与两个或多于两个先前帧(例如第一帧190及在第一帧之前的至少一帧或在第二帧192之后的帧、位流160中的一或多个其它帧,或其任何组合)相关联的经量化移位值估计(例如内插或外推)第二经内插移位值285、295。解码器118还可基于第一经量化立体声参数183内插(或估计)第二经内插立体声参数287。根据其它实施方案,可基于与两个或多于两个其它帧(例如第一帧190及在第一帧之前或之后的至少一帧)相关联的经量化立体声参数估计第二经内插立体声参数287。
另外,解码器118可基于经解码中间声道的第一部分170(或与两个或多于两个先前帧相关联的中间声道)内插(或估计)经解码中间声道的第二部分306。在使用关于图2所描述的技术的情况下,解码器118还可基于经解码中间声道的经估计第二部分306产生左声道的第二部分308及右声道的第二部分310。左声道的第二部分308可对应于第一输出信号126,且右声道的第二部分310可对应于第二输出信号128。举例来说,解码器118可使用第二经内插立体声参数287及第二经内插频域量化移位值285以产生左声道及右声道。
参看图4A,展示解码信号的方法400。方法400可由图1的第二装置106、图1及2的解码器118或两者执行。
方法400包含:在402处,在解码器处接收包含中间声道及经量化值的位流,经量化值表示与编码器相关联的第一声道(例如参考声道)和与编码器相关联的第二声道(例如目标声道)之间的移位。经量化值是基于移位的值。所述值与编码器相关联且相比于经量化值具有较大精确度。
方法400还包含:在404处,解码中间声道以产生经解码中间声道。方法400进一步包含:在406处,基于经解码中间声道产生第一声道(第一经产生声道);及在408处,基于经解码中间声道及经量化值产生第二声道(第二经产生声道)。第一经产生声道对应于与编码器相关联的第一声道(例如参考声道),且第二经产生声道对应于与编码器相关联的第二声道(例如目标声道)。在一些实施方案中,第一声道及第二声道两者可基于移位的经量化值。在一些实施方案中,解码器可能不在移位操作之前明确地识别参考声道及目标声道。
因此,图4A的方法400可使能够对准编码器旁声道以缩减译码熵,且因此增加译码效率,这是因为译码熵对声道之间的移位改变敏感。举例来说,编码器114可使用未量化移位值以准确地对准声道,这是因为未量化移位值具有相对高分辨率。可将经量化移位值传输至解码器118以缩减数据传输资源使用量。在解码器118处,可使用经量化移位参数以模拟输出信号126、128之间的可感知差。
参看图4B,展示解码信号的方法450。在一些实施方案中,图4B的方法450为图4A的解码音频信号的方法400的更详细版本。方法450可由图1的第二装置106、图1及2的解码器118或两者执行。
方法450包含:在452处,在解码器处从编码器接收位流。位流包含中间声道及经量化值,经量化值表示与编码器相关联的参考声道和与编码器相关联的目标声道之间的移位。经量化值可基于移位的值(例如未量化值),所述值相比于经量化值具有较大精确度。举例来说,参看图1,解码器118可从编码器114接收位流160。位流160可包含中间声道的第一部分191及第一经量化移位值181,第一经量化移位值181表示第一音频信号130(例如参考声道)与第二音频信号132(例如目标声道)之间的移位。第一经量化移位值181可基于第一移位值180(例如未量化值)。
第一移位值180相比于第一经量化移位值181可具有较大精确度。举例来说,第一经量化移位值181可对应于第一移位值180的低分辨率版本。第一移位值可由编码器114使用以在时间上匹配目标声道(例如第二音频信号132)与参考声道(例如第一音频信号130)。
方法450还包含:在454处,解码中间声道以产生经解码中间声道。举例来说,参看图2,中间声道解码器202可解码中间声道的第一部分191以产生经解码中间声道的第一部分170。方法400还包含:在456处,对经解码中间声道执行变换操作以产生经解码频域中间声道。举例来说,参看图2,变换单元204可对经解码中间声道的第一部分170执行变换操作以产生经频域解码中间声道的第一部分171。
方法450还可包含:在458处,上混经解码频域中间声道以产生频域声道的第一部分及第二频域声道。举例来说,参看图2,上混器206可上混经频域解码中间声道的第一部分171以产生频域声道250的部分及频域声道254的部分。方法450还可包含:在460处,基于频域声道的第一部分产生第一声道。第一声道可对应于参考声道。举例来说,反变换单元210可对频域声道250的所述部分执行反变换操作以产生时域声道260的部分,且移位器214可传递时域声道260的所述部分作为第一输出信号126的部分。第一输出信号126可对应于参考声道(例如第一音频信号130)。
方法450还可包含:在462处,基于第二频域声道产生第二声道。第二声道可对应于目标声道。根据一项实施方案,如果经量化值对应于频域移位,那么第二频域声道可在频域中被移位达到所述经量化值。举例来说,参看图2,上混器206可使频域声道254的部分移位达到所述第一经量化频域移位值281而至第二经移位频域声道(未展示)。反变换单元212单元可对第二经移位频域声道执行反变换以产生第二输出信号128的部分。第二输出信号128可对应于目标声道(例如第二音频信号132)。
根据另一实施方案,如果经量化值对应于时域移位,那么第二频域声道的时域版本可被移位达到所述经量化值。举例来说,反变换单元212可对频域声道254的所述部分执行反变换操作以产生时域声道264的部分。移位器214可使时域声道264的部分移位达到所述第一经量化时域移位值291以产生第二输出信号128的部分。第二输出信号128可对应于目标声道(例如第二音频信号132)。
因此,图4B的方法450可能促成对准编码器旁声道以缩减译码熵,且因此增加译码效率,这是因为译码熵对声道之间的移位改变敏感。举例来说,编码器114可使用未量化移位值以准确地对准声道,这是因为未量化移位值具有相对高分辨率。可将经量化移位值传输至解码器118以缩减数据传输资源使用量。在解码器118处,可使用经量化移位参数以模拟输出信号126、128之间的可感知差。
参看图5A,展示解码信号的另一方法500。方法500可由图1的第二装置106、图1及2的解码器118或两者执行。
方法500包含:在502处,接收位流的至少一部分。位流包含第一帧及第二帧。第一帧包含中间声道的第一部分及立体声参数的第一值,且第二帧包含中间声道的第二部分及立体声参数的第二值。
方法500还包含:在504处,解码中间声道的第一部分以产生经解码中间声道的第一部分。方法500进一步包含:在506处,至少基于经解码中间声道的第一部分及立体声参数的第一值产生左声道的第一部分;及在508处,至少基于经解码中间声道的第一部分及立体声参数的第一值产生右声道的第一部分。所述方法还包含:在510处,响应于第二帧不可用于解码操作而至少基于立体声参数的第一值产生左声道的第二部分及右声道的第二部分。左声道的第二部分及右声道的第二部分对应于第二帧的经解码版本。
根据一项实施方案,方法500包含:响应于第二帧可用于解码操作而基于立体声参数的第一值及立体声参数的第二值产生立体声参数的经内插值。根据另一实施方案,方法500包含:响应于第二帧不可用于解码操作而至少基于立体声参数的第一值、左声道的第一部分及右声道的第一部分至少产生左声道的第二部分及右声道的第二部分。
根据一项实施方案,方法500包含:响应于第二帧不可用于解码操作而至少基于立体声参数的第一值、中间声道的第一部分、左声道的第一部分或右声道的第一部分至少产生中间声道的第二部分及旁声道的第二部分。方法500还包含:响应于第二帧不可用于解码操作而基于中间声道的第二部分、旁声道的第二部分及立体声参数的第三值产生左声道的第二部分及右声道的第二部分。立体声参数的第三值是至少基于立体声参数的第一值、立体声参数的经内插值及译码模式。
因此,方法500可使解码器118能够基于立体声参数或来自先前帧的立体声参数的变化而近似立体声参数(例如移位值)。举例来说,解码器118可从一或多个先前帧的立体声参数外推针对在传输(例如第二帧192)期间丢失的帧的立体声参数。
参看图5B,展示解码信号的另一方法550。在一些实施方案中,图5B的方法550为图5A的解码音频信号的方法500的更详细版本。方法550可由图1的第二装置106、图1及2的解码器118或两者执行。
方法550包含:在552处,在解码器处从编码器接收位流的至少一部分。位流包含第一帧及第二帧。第一帧包含中间声道的第一部分及立体声参数的第一值,且第二帧包含中间声道的第二部分及立体声参数的第二值。举例来说,参看图1,第二装置106可从编码器114接收位流160的部分。位流包含第一帧190及第二帧192。第一帧190包含中间声道的第一部分191、第一经量化移位值181及第一经量化立体声参数183。第二帧192包含中间声道的第二部分193、第二经量化移位值185及第二经量化立体声参数187。
方法550还包含:在554处,解码中间声道的第一部分以产生经解码中间声道的第一部分。举例来说,参看图2,中间声道解码器202可解码中间声道的第一部分191以产生经解码中间声道的第一部分170。方法550还可包含:在556处,对经解码中间声道的第一部分执行变换操作以产生经解码频域中间声道的第一部分。举例来说,参看图2,变换单元204可对经解码中间声道的第一部分170执行变换操作以产生经频域解码中间声道的第一部分171。
方法550还可包含:在558处,上混经解码频域中间声道的第一部分以产生左频域声道的第一部分及右频域声道的第一部分。举例来说,参看图1,上混器206可上混经频域解码中间声道的第一部分171以产生频域声道250及频域声道254。如本文中所描述,频域声道250可为左声道,且频域声道254可为右声道。然而,在其它实施方案中,频域声道250可为右声道,且频域声道254可为左声道。
方法550还可包含:在560处,至少基于左频域声道的第一部分及立体声参数的第一值产生左声道的第一部分。举例来说,上混器206可使用第一经量化立体声参数183以产生频域声道250。反变换单元210可对频域声道250执行反变换操作以产生时域声道260,且移位器214可传递时域声道260作为第一输出信号126(例如根据方法550的左声道的第一部分)。
方法550还可包含:在562处,至少基于右频域声道的第一部分及立体声参数的第一值产生右声道的第一部分。举例来说,上混器206可使用第一经量化立体声参数183以产生频域声道254。反变换单元212可对频域声道254执行反变换操作以产生时域声道264,且移位器214可传递(或选择性地移位)时域声道264作为第二输出信号128(例如根据方法550的右声道的第一部分)。
方法550还包含:在564处,确定第二帧不可用于解码操作。举例来说,解码器118可确定第二帧192的一或多个部分不可用于解码操作。出于说明起见,第二经量化移位值185及第二经量化立体声参数187可能会基于不良传输条件而在传输(从第一装置104至第二装置106)中丢失。方法550还包含:在566处,响应于确定第二帧不可用而至少基于立体声参数的第一值产生左声道的第二部分及右声道的第二部分。左声道的第二部分及右声道的第二部分可对应于第二帧的经解码版本。
举例来说,立体声参数内插器208可基于第一经量化频域移位值281内插(或估计)第二经量化移位值185。出于说明起见,立体声参数内插器208可基于第一经量化频域移位值281产生第二经内插频域移位值285。立体声参数内插器208还可基于第一经量化立体声参数183内插(或估计)第二经量化立体声参数187。举例来说,立体声参数内插器208可基于第一经量化立体声参数183产生第二经内插立体声参数287。
上混器206可上混第二经频域解码中间声道173以产生频域声道252及频域声道256。上混器206可在上混操作期间将第二经内插立体声参数287应用于第二经频解码域中间声道173以产生频域声道252、256。根据第一经量化移位值181包含频域移位(例如第一经量化移位值181对应于第一经量化频域移位值281)的实施方案,上混器206可基于第二经内插频域移位值285执行频域移位(例如相移)以产生频域声道256。
反变换单元210可对频域声道252执行反变换操作以产生时域声道262,且反变换单元212可对频域声道256执行反变换操作以产生时域声道266。移位值内插器216可基于第一经量化时域移位值291内插(或估计)第二经量化移位值185。举例来说,移位值内插器216可基于第一经量化时域移位值291产生第二经内插时域移位值295。根据第一经量化移位值181对应于第一经量化频域移位值281的实施方案,移位器214可绕过移位操作且传递时域声道262、266分别作为输出信号126、128。根据第一经量化移位值181对应于第一经量化时域移位值291的实施方案,移位器214可使时域声道266移位第二经内插时域移位值295以产生第二输出信号128。
因此,方法550可使解码器118能够基于针对一或多个先前帧的立体声参数内插(或估计)针对在传输(例如第二帧192)期间丢失的帧的立体声参数。
参看图6,描绘装置(例如无线通信装置)的特定说明性实例的框图且将所述装置整体上指定为600。在各种实施方案中,装置600可具有比图6所绘示的组件更少或更多的组件。在说明性实施方案中,装置600可对应于图1的第一装置104、图1的第二装置106或其组合。在说明性实施方案中,装置600可执行参考图1至3、4A、4B、5A及5B的系统及方法所描述的一或多个操作。
在特定实施方案中,装置600包含处理器606(例如中央处理单元(centralprocessing unit;CPU))。装置600可包含一或多个额外处理器610(例如一或多个数字信号处理器(digital signal processor;DSP))。处理器610可包含媒体(例如话语及音乐)译码器-解码器(coder-decoder;CODEC)608及回音消除器612。媒体CODEC 608可包含解码器118、编码器114或其组合。
装置600可包含存储器153及CODEC 634。尽管媒体CODEC 608被绘示为处理器610的组件(例如专用电路系统及/或可执行编程代码),但在其它实施方案中,媒体CODEC 608的一或多个组件,例如解码器118、编码器114或其组合,可包含于处理器606、CODEC 634、另一处理组件或其组合中。
装置600可包含耦合至天线642的发射器110。装置600可包含耦合至显示控制器626的显示器628。一或多个扬声器648可耦合至CODEC 634。一或多个麦克风646可经由输入接口112耦合至CODEC 634。在特定实施方案中,扬声器648可包含图1的第一喇叭142、图1的第二喇叭144或其组合。在特定实施方案中,麦克风646可包含图1的第一麦克风146、图1的第二麦克风148或其组合。CODEC 634可包含数/模转换器(digital-to-analog converter;DAC)602及模/数转换器(analog-to-digital converter;ADC)604。
存储器153可包含可由处理器606、处理器610、CODEC 634、装置600的另一处理单元或其组合执行以执行参考图1至3、4A、4B、5A、5B所描述的一或多个操作的指令660。指令660可执行以致使处理器(例如处理器606、处理器606、CODEC 634、解码器118、装置600的另一处理单元或其组合)执行图4A的方法400、图4B的方法450、图5A的方法500、图5B的方法550或其组合。
装置600的一或多个组件可经由专用硬件(例如电路系统)实施、由执行指令以执行一或多个任务的处理器实施,或其组合。作为实例,存储器153或处理器606、处理器610及/或CODEC 634的一或多个组件可为存储器装置,例如随机存取存储器(random accessmemory;RAM)、磁阻式随机存取存储器(magnetoresistive random access memory;MRAM)、自旋力矩转移MRAM(spin-torque transfer MRAM;STT-MRAM)、闪速存储器、只读存储器(read-only memory;ROM)、可编程只读存储器(programmable read-only memory;PROM)、可擦除可编程只读存储器(erasable programmable read-only memory;EPROM)、电可擦除可编程只读存储器(electrically erasable programmable read-only memory;EEPROM)、寄存器、硬盘、抽取式磁盘,或紧密光盘只读存储器(compact disc read-only memory;CD-ROM)。存储器装置可包含指令(例如指令660),所述指令在由计算机(例如CODEC 634中的处理器、处理器606及/或处理器610)执行时可致使所述计算机执行参考图1至3、4A、4B、5A、5B所描述的一或多个操作。作为实例,存储器153或处理器606、处理器610及/或CODEC 634的一或多个组件可为包含指令(例如指令660)的非暂时性计算机可读媒体,所述指令在由计算机(例如CODEC 634中的处理器、处理器606及/或处理器610)执行时致使所述计算机执行参考图1至3、4A、4B、5A、5B所描述的一或多个操作。
在特定实施方案中,装置600可包含于系统级封装或系统单芯片装置(例如移动站调制解调器(mobile station modem;MSM))622中。在特定实施方案中,处理器606、处理器610、显示控制器626、存储器153、CODEC 634及发射器110包含于系统级封装或系统单芯片装置622中。在特定实施方案中,例如触摸屏及/或小键盘的输入装置630以及电源644耦合至系统单芯片装置622。此外,在特定实施方案中,如图6所绘示,显示器628、输入装置630、扬声器648、麦克风646、天线642及电源644在系统单芯片装置622外部。然而,显示器628、输入装置630、扬声器648、麦克风646、天线642及电源644中的每一者可耦合至系统单芯片装置622的组件,例如接口或控制器。
装置600可包含无线电话、移动通信装置、移动电话、智能电话、蜂窝电话、膝上型计算机、桌上型计算机、计算机、平板计算机、机顶盒、个人数字助理(personal digitalassistant;PDA)、显示装置、电视、游戏控制台、音乐播放器、收音机、视频播放器、娱乐单元、通信装置、固定位置数据单元、个人媒体播放器、数字视频播放器、数字视频光盘(digital video disc;DVD)播放器、调谐器、相机、导航装置、解码器系统、编码器系统,或其任何组合。
在特定实施方案中,本文中所揭示的系统及装置的一或多个组件可集成至解码系统或设备(例如电子装置、CODEC,或其中的处理器)中,集成至编码系统或设备中,或两者。在其它实施方案中,本文中所揭示的系统及装置的一或多个组件可集成至以下各者中:无线电话、平板计算机、桌上型计算机、膝上型计算机、机顶盒、音乐播放器、视频播放器、娱乐单元、电视、游戏控制台、导航装置、通信装置、个人数字助理(PDA)、固定位置数据单元、个人媒体播放器,或另一类型的装置。
结合本文中所描述的技术,第一设备包含用于接收位流的装置。位流包含中间声道及经量化值,经量化值表示与编码器相关联的参考声道和与编码器相关联的目标声道之间的移位。经量化值是基于移位的值。所述值与编码器相关联且相比于经量化值具有较大精确度。举例来说,用于接收位流的装置可包含:图1的第二装置106;第二装置106的接收器(未展示);图1、2或6的解码器118;图6的天线642;一或多个其它电路、装置、组件、模块;或其组合。
第一设备还可包含用于解码中间声道以产生经解码中间声道的装置。举例来说,用于解码中间声道的装置可包含:图1、2或6的解码器118;图2的中间声道解码器202;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第一设备还可包含用于基于经解码中间声道产生第一声道的装置。第一声道对应于参考声道。举例来说,用于产生第一声道的装置可包含:图1、2或6的解码器118;图2的反变换单元210;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第一设备还可包含用于基于经解码中间声道及经量化值产生第二声道的装置。第二声道对应于目标声道。用于产生第二声道的装置可包含:图1、2或6的解码器118;图2的反变换单元212;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
结合本文中所描述的技术,第二设备包含用于从编码器接收位流的装置。位流可包含中间声道及经量化值,经量化值表示与编码器相关联的参考声道和与编码器相关联的目标声道之间的移位。经量化值可基于移位的值,所述值相比于经量化值具有较大精确度。举例来说,用于接收位流的装置可包含:图1的第二装置106;第二装置106的接收器(未展示);图1、2或6的解码器118;图6的天线642;一或多个其它电路、装置、组件、模块;或其组合。
第二设备还可包含用于解码中间声道以产生经解码中间声道的装置。举例来说,用于解码中间声道的装置可包含:图1、2或6的解码器118;图2的中间声道解码器202;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第二设备还可包含用于对经解码中间声道执行变换操作以产生经解码频域中间声道的装置。举例来说,用于执行变换操作的装置可包含:图1、2或6的解码器118;图2的变换单元204;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第二设备还可包含用于上混经解码频域中间声道以产生第一频域声道及第二频域声道的装置。举例来说,用于上混的装置可包含:图1、2或6的解码器118;图2的上混器206;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第二设备还可包含用于基于第一频域声道产生第一声道的装置。第一声道可对应于参考声道。举例来说,用于产生第一声道的装置可包含:图1、2或6的解码器118;图2的反变换单元210;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第二设备还可包含用于基于第二频域声道产生第二声道的装置。第二声道可对应于目标声道。如果经量化值对应于频域移位,那么第二频域声道可在频域中被移位经量化值。如果经量化值对应于时域移位,那么第二频域声道的时域版本可被移位经量化值。用于产生第二声道的装置可包含:图1、2或6的解码器118;图2的反变换单元212;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
结合本文中所描述的技术,第三设备包含用于接收位流的至少一部分的装置。位流包含第一帧及第二帧。第一帧包含中间声道的第一部分及立体声参数的第一值,且第二帧包含中间声道的第二部分及立体声参数的第二值。用于接收的装置可包含:图1的第二装置106;第二装置106的接收器(未展示);图1、2或6的解码器118;图6的天线642;一或多个其它电路、装置、组件、模块;或其组合。
第三设备还可包含用于解码中间声道的第一部分以产生经解码中间声道的第一部分的装置。举例来说,用于解码的装置可包含:图1、2或6的解码器118;图2的中间声道解码器202;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第三设备还可包含用于至少基于经解码中间声道的第一部分及立体声参数的第一值产生左声道的第一部分的装置。举例来说,用于产生左声道的第一部分的装置可包含:图1、2或6的解码器118;图2的反变换单元210;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第三设备还可包含用于至少基于经解码中间声道的第一部分及立体声参数的第一值产生右声道的第一部分的装置。举例来说,用于产生右声道的第一部分的装置可包含:图1、2或6的解码器118;图2的反变换单元212;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第三设备还可包含用于响应于第二帧不可用于解码操作而至少基于立体声参数的第一值产生左声道的第二部分及右声道的第二部分的装置。左声道的第二部分及右声道的第二部分对应于第二帧的经解码版本。用于产生左声道的第二部分及右声道的第二部分的装置可包含:图1、2或6的解码器118;图2的立体声移位值内插器216;图2的立体声参数内插器208;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
结合本文中所描述的技术,第四设备包含用于从编码器接收位流的至少一部分的装置。位流可包含第一帧及第二帧。第一帧可包含中间声道的第一部分及立体声参数的第一值,且第二帧可包含中间声道的第二部分及立体声参数的第二值。用于接收的装置可包含:图1的第二装置106;第二装置106的接收器(未展示);图1、2或6的解码器118;图6的天线642;一或多个其它电路、装置、组件、模块;或其组合。
第四设备还可包含用于解码中间声道的第一部分以产生经解码中间声道的第一部分的装置。举例来说,用于解码中间声道的第一部分的装置可包含:图1、2或6的解码器118;图2的中间声道解码器202;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第四设备还可包含用于对经解码中间声道的第一部分执行变换操作以产生经解码频域中间声道的第一部分的装置。举例来说,用于执行变换操作的装置可包含:图1、2或6的解码器118;图2的变换单元204;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第四设备还可包含用于上混经解码频域中间声道的第一部分以产生左频域声道的第一部分及右频域声道的第一部分的装置。举例来说,用于上混的装置可包含:图1、2或6的解码器118;图2的上混器206;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第四设备还可包含用于至少基于左频域声道的第一部分及立体声参数的第一值产生左声道的第一部分的装置。举例来说,用于产生左声道的第一部分的装置可包含:图1、2或6的解码器118;图2的反变换单元210;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第四设备还可包含用于至少基于右频域声道的第一部分及立体声参数的第一值产生右声道的第一部分的装置。举例来说,用于产生右声道的第一部分的装置可包含:图1、2或6的解码器118;图2的反变换单元212;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
第四设备还可包含用于响应于第二帧不可用的确定而至少基于立体声参数的第一值产生左声道的第二部分及右声道的第二部分的装置。左声道的第二部分及右声道的第二部分可对应于第二帧的经解码版本。用于产生左声道的第二部分及右声道的第二部分的装置可包含:图1、2或6的解码器118;图2的立体声移位值内插器216;图2的立体声参数内插器208;图2的移位器214;图6的处理器606;图6的处理器610;图6的CODEC 634;图6的指令660,其可由处理器执行;一或多个其它电路、装置、组件、模块;或其组合。
应注意,由本文中所揭示的系统及装置的一或多个组件执行的各种功能被描述为由某些组件或模块执行。组件及模块的此划分是仅出于说明起见。在替代实施方案中,由特定组件或模块执行的功能可被划分于多个组件或模块之中。此外,在替代实施方案中,两个或多于两个组件或模块可集成为单一组件或模块。每一组件或模块可使用硬件(例如现场可编程门阵列(field-programmable gate array;FPGA)装置、专用集成电路(application-specific integrated circuit;ASIC)、DSP、控制器等等)、软件(例如可由处理器执行的指令)或其任何组合予以实施。
参看图7,描绘基站700的特定说明性实例的框图。在各种实施方案中,基站700可具有比图7所绘示的组件更多的组件或更少的组件。在说明性实例中,基站700可包含图1的第二装置106。在说明性实例中,基站700可根据参考图1至3、4A、4B、5A、5B及6所描述的方法或系统中的一或多者而操作。
基站700可为无线通信系统的部分。无线通信系统可包含多个基站及多个无线装置。无线通信系统可为长期演进(Long Term Evolution;LTE)系统、码分多址接入(CodeDivision Multiple Access;CDMA)系统、全球移动通信系统(Global System for MobileCommunications;GSM)系统、无线局域网(wireless local area network;WLAN)系统,或某一其它无线系统。CDMA系统可实施宽带CDMA(Wideband CDMA;WCDMA)、CDMA 1X、演进数据优化(Evolution-Data Optimized;EVDO)、时分同步CDMA(Time Division SynchronousCDMA;TD-SCDMA),或CDMA的某一其它版本。
无线装置也可被称作用户设备(user equipment;UE)、移动站、终端、接入终端、订户单元、站等等。无线装置可包含蜂窝电话、智能电话、平板计算机、无线调制解调器、个人数字助理(PDA)、手持型装置、膝上型计算机、智能笔记本计算机、迷你笔记本计算机、平板计算机、无线电话、无线本地回路(wireless local loop;WLL)站、蓝牙装置等等。无线装置可包含或对应于图6的装置600。
基站700的一或多个组件可执行(及/或在未展示的其它组件中执行)各种功能,例如发送及接收消息及数据(例如音频数据)。在特定实例中,基站700包含处理器706(例如CPU)。基站700可包含转码器710。转码器710可包含音频CODEC 708。举例来说,转码器710可包含经配置以执行音频CODEC 708的操作的一或多个组件(例如电路系统)。作为另一实例,转码器710可经配置以执行一或多个计算机可读指令以执行音频CODEC708的操作。尽管音频CODEC 708被绘示为转码器710的组件,但在其它实例中,音频CODEC 708的一或多个组件可包含于处理器706、另一处理组件或其组合中。举例来说,解码器738(例如声码器解码器)可包含于接收器数据处理器764中。作为另一实例,编码器736(例如声码器编码器)可包含于传输数据处理器782中。编码器736可包含图1的编码器114。解码器738可包含图1的解码器118。
转码器710可用于在两个或多于两个网络之间转码消息及数据。转码器710可经配置以将消息及音频数据从第一格式(例如数字格式)转换为第二格式。出于说明起见,解码器738可解码具有第一格式的经编码信号,且编码器736可将经解码信号编码成具有第二格式的经编码信号。另外或替代地,转码器710可经配置以执行数据速率适配。举例来说,转码器710可在不改变音频数据的格式的情况下降频转换数据速率或升频转换数据速率。出于说明起见,转码器710可将64kbit/s信号降频转换成16kbit/s信号。
基站700可包含存储器732。例如计算机可读存储装置的存储器732可包含指令。所述指令可包含可由处理器706、转码器710或其组合执行以执行参考图1至3、4A、4B、5A、5B、6的方法及系统所描述的一或多个操作的一或多个指令。
基站700可包含耦合至天线阵列的多个发射器及接收器(例如收发器),例如第一收发器752及第二收发器754。天线阵列可包含第一天线742及第二天线744。天线阵列可经配置成以无线方式与一或多个无线装置--例如图6的装置600--通信。举例来说,第二天线744可从无线装置接收数据流714(例如位流)。数据流714可包含消息、数据(例如经编码话语数据)或其组合。
基站700可包含网络连接760,例如回程连接。网络连接760可经配置以与核心网络或无线通信网络的一或多个基站通信。举例来说,基站700可经由网络连接760从核心网络接收第二数据流(例如消息或音频数据)。基站700可处理第二数据流以产生消息或音频数据,且经由天线阵列的一或多个天线将消息或音频数据提供至一或多个无线装置,或经由网络连接760将消息或音频数据提供至另一基站。在特定实施方案中,作为说明性非限制性实例,网络连接760可为广域网(wide area network;WAN)连接。在一些实施方案中,核心网络可包含或对应于公共交换电话网(PSTN)、数据包骨干网或两者。
基站700可包含耦合至网络连接760及处理器706的媒体网关770。媒体网关770可经配置以在不同电信技术的媒体流之间转换。举例来说,媒体网关770可在不同传输协议、不同译码方案或两者之间转换。出于说明起见,作为说明性非限制性实例,媒体网关770可从PCM信号至实时输送协议(Real-Time Transport Protocol;RTP)信号进行转换。媒体网关770可在以下各者之间转换数据:数据包交换网(例如互联网语音协议(Voice OverInternet Protocol;VoIP)网络、IP多媒体子系统(IP Multimedia Subsystem;IMS)、第四代(fourth generation;4G)无线网络,例如LTE、WiMax及UMB等等);电路交换网(例如PSTN);及混合网络(例如第二代(second generation;2G)无线网络,例如GSM、GPRS及EDGE;第三代(third generation;3G)无线网络,例如WCDMA、EV-DO及HSPA等等)。
另外,媒体网关770可包含例如转码器710的转码器,且可经配置以在译码器-解码器不兼容时转码数据。举例来说,作为说明性非限制性实例,媒体网关770可在自适应多速率(Adaptive Multi-Rate;AMR)译码器-解码器与G.711译码器-解码器之间进行转码。媒体网关770可包含路由器及多个物理接口。在一些实施方案中,媒体网关770还可包含控制器(未展示)。在特定实施方案中,媒体网关控制器可在媒体网关770外部,在基站700外部,或两者。媒体网关控制器可控制及协调多个媒体网关的操作。媒体网关770可从媒体网关控制器接收控制信号,且可用于在不同传输技术之间进行桥接,且可向最终用户能力及连接添加服务。
基站700可包含耦合至收发器752、754、接收器数据处理器764及处理器706的解调器762,且接收器数据处理器764可耦合至处理器706。解调器762可经配置以解调从收发器752、754接收的经调制信号,及将经解调数据提供至接收器数据处理器764。接收器数据处理器764可经配置以从经解调数据提取消息或音频数据,及将消息或音频数据发送至处理器706。
基站700可包含传输数据处理器782及传输多输入多输出(multiple input-multiple output;MIMO)处理器784。传输数据处理器782可耦合至处理器706及传输MIMO处理器784。传输MIMO处理器784可耦合至收发器752、754及处理器706。在一些实施方案中,传输MIMO处理器784可耦合至媒体网关770。作为说明性非限制性实例,传输数据处理器782可经配置以从处理器706接收消息或音频数据,及基于例如CDMA或正交频分多路复用(orthogonal frequency-division multiplexing;OFDM)的译码方案译码消息或音频数据。传输数据处理器782可将经译码数据提供至传输MIMO处理器784。
可使用CDMA或OFDM技术将经译码数据与例如导频数据的其它数据一起多路复用以产生经多路复用数据。可接着由传输数据处理器782基于特定调制方案(例如二元相移键控(“Binary phase-shift keying;BPSK”)、正交相移键控(“Quadrature phase-shiftkeying;QSPK”)、M元相移键控(“M-ary phase-shift keying;M-PSK”)、M元正交调幅(“M-ary Quadrature amplitude modulation;M-QAM”)等等)调制(即,符号映射)经多路复用数据以产生调制符号。在特定实施方案中,可使用不同调制方案来调制经译码数据及其它数据。针对每一数据流的数据速率、译码及调制可由处理器706所执行的指令确定。
传输MIMO处理器784可经配置以从传输数据处理器782接收调制符号,且可进一步处理调制符号且可对数据执行波束成形。举例来说,传输MIMO处理器784可将波束成形权重应用于调制符号。
在操作期间,基站700的第二天线744可接收数据流714。第二收发器754可从第二天线744接收数据流714,且可将数据流714提供至解调器762。解调器762可解调数据流714的经调制信号,且将经解调数据提供至接收器数据处理器764。接收器数据处理器764可从经解调数据提取音频数据,且将经提取音频数据提供至处理器706。
处理器706可将音频数据提供至转码器710以供转码。转码器710的解码器738可将音频数据从第一格式解码成经解码音频数据,且编码器736可将经解码音频数据编码成第二格式。在一些实施方案中,相比于从无线装置接收的数据速率,编码器736可使用较高数据速率(例如升频转换)或较低数据速率(例如降频转换)来编码音频数据。在其它实施方案中,可能不转码音频数据。尽管转码(例如解码及编码)被绘示为由转码器710执行,但转码操作(例如解码及编码)可由基站700的多个组件执行。举例来说,解码可由接收器数据处理器764执行,且编码可由传输数据处理器782执行。在其它实施方案中,处理器706可将音频数据提供至媒体网关770以供转换为另一传输协议、译码方案或两者。媒体网关770可经由网络连接760将经转换数据提供至另一基站或核心网络。
可经由处理器706将在编码器736处产生的经编码音频数据提供至传输数据处理器782或网络连接760。可将来自转码器710的经转码音频数据提供至传输数据处理器782以供根据例如OFDM的调制方案而译码以产生调制符号。传输数据处理器782可将调制符号提供至传输MIMO处理器784以供进一步处理及波束成形。传输MIMO处理器784可应用波束成形权重,且可经由第一收发器752将调制符号提供至天线阵列的一或多个天线,例如第一天线742。因此,基站700可将对应于从无线装置接收的数据流714的经转码数据流716提供至另一无线装置。经转码数据流716相比于数据流714可具有不同的编码格式、数据速率或两者。在其它实施方案中,可将经转码数据流716提供至网络连接760以供传输至另一基站或核心网络。
所属领域的技术人员应进一步了解,结合本文中所揭示的实施方案而描述的各种说明性逻辑块、配置、模块、电路及算法步骤可被实施为电子硬件、由例如硬件处理器的处理装置执行的计算机软件,或两者的组合。上文已大体上在功能性方面描述各种说明性组件、块、配置、模块、电路及步骤。此类功能性被实施为硬件还是软件取决于特定应用及强加于整个系统的设计约束。所属领域的技术人员可针对每一特定应用而以变化的方式实施所描述的功能性,但不应将此类实施决策解释为造成脱离本发明的范围。
结合本文中所揭示的实施方案所描述的方法或算法的步骤可直接体现于硬件中、体现于由处理器执行的软件模块中,或体现于两者的组合中。软件模块可驻留于例如以下各者的存储器装置中:随机存取存储器(RAM)、磁阻式随机存取存储器(MRAM)、自旋力矩转移MRAM(STT-MRAM)、闪速存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、寄存器、硬盘、抽取式磁盘,或紧密光盘只读存储器(CD-ROM)。示范性存储器装置耦合至处理器,使得处理器可从存储器装置读取信息及将信息写入至存储器装置。在替代方案中,存储器装置可与处理器成一体式。处理器及存储媒体可驻留于专用集成电路(ASIC)中。ASIC可驻留于计算装置或用户终端中。在替代方案中,处理器及存储媒体可作为离散组件驻留于计算装置或用户终端中。
提供对所揭示实施方案的先前描述以使所属领域的技术人员能够制作或使用所揭示实施方案。在不脱离本发明的范围的情况下,对这些实施方案的各种修改对于所属领域的技术人员来说将容易显而易见,且本文中所定义的原理可应用于其它实施方案。因此,本发明并不意图限于本文中所展示的实施方案,而是应符合可能与如由所附权利要求书所定义的原理及新颖特征相一致的最广泛范围。
Claims (39)
1.一种用于立体声解码的设备,其包括:
接收器,其经配置以接收位流的至少一部分,所述位流包括第一帧及第二帧,所述第一帧包含中间声道的第一部分及立体声参数的第一值,其中所述立体声参数的所述第一值包括经量化值,所述经量化值表示针对所述第一帧的、与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位,所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值;及
解码器,其经配置以:
解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分;
至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分;
至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分;及
响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分,所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
2.根据权利要求1所述的设备,其中所述解码器经进一步配置以响应于所述第二帧可用于所述解码操作而基于所述立体声参数的所述第一值及所述立体声参数的所述第二值产生所述立体声参数的经内插值。
3.根据权利要求1所述的设备,其中所述解码器经进一步配置以响应于所述第二帧不可用于所述解码操作而至少基于所述立体声参数的所述第一值、所述中间声道的所述第一部分、所述左声道的所述第一部分或所述右声道的所述第一部分至少产生所述中间声道的所述第二部分及旁声道的第二部分。
4.根据权利要求3所述的设备,其中所述解码器经进一步配置以响应于所述第二帧不可用于所述解码操作而基于所述中间声道的所述第二部分、所述旁声道的所述第二部分及所述立体声参数的第三值产生所述左声道的所述第二部分及所述右声道的所述第二部分。
5.根据权利要求4所述的设备,其中所述立体声参数的所述第三值是至少基于所述立体声参数的所述第一值、所述立体声参数的经内插值,及译码模式。
6.根据权利要求1所述的设备,其中所述解码器经进一步配置以响应于所述第二帧不可用于所述解码操作而至少基于所述立体声参数的所述第一值、所述左声道的所述第一部分及所述右声道的所述第一部分至少产生所述左声道的所述第二部分及所述右声道的所述第二部分。
7.根据权利要求1所述的设备,其中所述解码器经进一步配置以:
对所述经解码中间声道的所述第一部分执行变换操作以产生经解码频域中间声道的第一部分;
基于所述立体声参数的所述第一值上混所述经解码频域中间声道的所述第一部分以产生左频域声道的第一部分及右频域声道的第一部分;
对所述左频域声道的所述第一部分执行第一时域操作以产生所述左声道的所述第一部分;及
对所述右频域声道的所述第一部分执行第二时域操作以产生所述右声道的所述第一部分。
8.根据权利要求7所述的设备,其中,响应于所述第二帧不可用于所述解码操作,所述解码器经配置以:
基于所述经解码中间声道的所述第一部分产生所述经解码中间声道的第二部分;
对所述经解码中间声道的所述第二部分执行第二变换操作以产生所述经解码频域中间声道的第二部分;
上混所述经解码频域中间声道的所述第二部分以产生所述左频域声道的第二部分及所述右频域声道的第二部分;
对所述左频域声道的所述第二部分执行第三时域操作以产生所述左声道的所述第二部分;及
对所述右频域声道的所述第二部分执行第四时域操作以产生所述右声道的所述第二部分。
9.根据权利要求8所述的设备,其中所述解码器经进一步配置以基于所述立体声参数的所述第一值估计所述立体声参数的所述第二值,其中所述立体声参数的所述经估计第二值用以上混所述经解码频域中间声道的所述第二部分。
10.根据权利要求8所述的设备,其中所述解码器经进一步配置以基于所述立体声参数的所述第一值内插所述立体声参数的所述第二值,其中所述立体声参数的所述经内插第二值用以上混所述经解码频域中间声道的所述第二部分。
11.根据权利要求8所述的设备,其中所述解码器经配置以对所述经解码中间声道的所述第一部分执行内插操作以产生所述经解码中间声道的所述第二部分。
12.根据权利要求8所述的设备,其中所述解码器经配置以对所述经解码中间声道的所述第一部分执行估计操作以产生所述经解码中间声道的所述第二部分。
13.根据权利要求1所述的设备,其中所述经量化值是基于所述移位的值,所述移位的所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。
14.根据权利要求1所述的设备,其中所述立体声参数还包括声道间相位差参数。
15.根据权利要求1所述的设备,其中所述立体声参数还包括声道间电平差参数。
16.根据权利要求1所述的设备,其中所述立体声参数还包括声道间时差参数。
17.根据权利要求1所述的设备,其中所述立体声参数还包括声道间相关性参数。
18.根据权利要求1所述的设备,其中所述立体声参数还包括频谱倾角参数。
19.根据权利要求1所述的设备,其中所述立体声参数还包括声道间增益参数。
20.根据权利要求1所述的设备,其中所述立体声参数还包括声道间发声参数。
21.根据权利要求1所述的设备,其中所述立体声参数还包括声道间音调参数。
22.根据权利要求1所述的设备,其中所述接收器及所述解码器集成至移动装置中。
23.根据权利要求1所述的设备,其中所述接收器及所述解码器集成至基站中。
24.一种用于立体声解码的方法,其包括:
在解码器处接收位流的至少一部分,所述位流包括第一帧及第二帧,所述第一帧包含中间声道的第一部分及立体声参数的第一值,其中所述立体声参数的所述第一值包括经量化值,所述经量化值表示针对所述第一帧的、与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位,所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值;
解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分;
至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分;
至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分;及
响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分,所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
25.根据权利要求24所述的方法,其进一步包括:
对所述经解码中间声道的所述第一部分执行变换操作以产生经解码频域中间声道的第一部分;
基于所述立体声参数的所述第一值上混所述经解码频域中间声道的所述第一部分以产生左频域声道的第一部分及右频域声道的第一部分;
对所述左频域声道的所述第一部分执行第一时域操作以产生所述左声道的所述第一部分;及
对所述右频域声道的所述第一部分执行第二时域操作以产生所述右声道的所述第一部分。
26.根据权利要求25所述的方法,其进一步包括响应于所述第二帧不可用于所述解码操作而:
基于所述经解码中间声道的所述第一部分产生所述经解码中间声道的第二部分;
对所述经解码中间声道的所述第二部分执行第二变换操作以产生所述经解码频域中间声道的第二部分;
上混所述经解码频域中间声道的所述第二部分以产生所述左频域声道的第二部分及所述右频域声道的第二部分;
对所述左频域声道的所述第二部分执行第三时域操作以产生所述左声道的所述第二部分;及
对所述右频域声道的所述第二部分执行第四时域操作以产生所述右声道的所述第二部分。
27.根据权利要求26所述的方法,其进一步包括基于所述立体声参数的所述第一值估计所述立体声参数的所述第二值,其中所述立体声参数的所述经估计第二值用以上混所述经解码频域中间声道的所述第二部分。
28.根据权利要求26所述的方法,其进一步包括基于所述立体声参数的所述第一值内插所述立体声参数的所述第二值,其中所述立体声参数的所述经内插第二值用以上混所述经解码频域中间声道的所述第二部分。
29.根据权利要求26所述的方法,其进一步包括对所述经解码中间声道的所述第一部分执行内插操作以产生所述经解码中间声道的所述第二部分。
30.根据权利要求26所述的方法,其进一步包括对所述经解码中间声道的所述第一部分执行估计操作以产生所述经解码中间声道的所述第二部分。
31.根据权利要求24所述的方法,其中所述经量化值是基于所述移位的值,所述移位的所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。
32.根据权利要求24所述的方法,其中所述解码器集成至移动装置中。
33.根据权利要求24所述的方法,其中所述解码器集成至基站中。
34.一种非暂时性计算机可读媒体,其包括指令,所述指令在由解码器内的处理器执行时致使所述处理器执行操作,所述操作包括:
接收位流的至少一部分,所述位流包括第一帧及第二帧,所述第一帧包含中间声道的第一部分及立体声参数的第一值,其中所述立体声参数的所述第一值包括经量化值,所述经量化值表示针对所述第一帧的、与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位,所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值;
解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分;
至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分;
至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分;及
响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分,所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
35.根据权利要求34所述的非暂时性计算机可读媒体,其中所述经量化值是基于所述移位的值,所述移位的所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。
36.一种用于立体声解码的设备,其包括:
用于接收位流的至少一部分的装置,所述位流包括第一帧及第二帧,所述第一帧包含中间声道的第一部分及立体声参数的第一值,其中所述立体声参数的所述第一值包括经量化值,所述经量化值表示针对所述第一帧的、与编码器相关联的参考声道和与所述编码器相关联的目标声道之间的移位,所述第二帧包含所述中间声道的第二部分及所述立体声参数的第二值;
用于解码所述中间声道的所述第一部分以产生经解码中间声道的第一部分的装置;
用于至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生左声道的第一部分的装置;
用于至少基于所述经解码中间声道的所述第一部分及所述立体声参数的所述第一值产生右声道的第一部分的装置;及
用于响应于所述第二帧不可用于解码操作而至少基于所述立体声参数的所述第一值产生所述左声道的第二部分及所述右声道的第二部分的装置,所述左声道的所述第二部分及所述右声道的所述第二部分对应于所述第二帧的经解码版本。
37.根据权利要求36所述的设备,其中所述经量化值是基于所述移位的值,所述移位的所述值与所述编码器相关联且相比于所述经量化值具有较大精确度。
38.根据权利要求36所述的设备,其中所述用于产生所述左声道的所述第二部分及所述右声道的所述第二部分的装置集成至移动装置中。
39.根据权利要求36所述的设备,其中所述用于产生所述左声道的所述第二部分及所述右声道的所述第二部分的装置集成至基站中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310638403.8A CN116665682A (zh) | 2017-05-11 | 2018-04-27 | 用于立体声解码的立体声参数 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762505041P | 2017-05-11 | 2017-05-11 | |
US62/505,041 | 2017-05-11 | ||
US15/962,834 US10224045B2 (en) | 2017-05-11 | 2018-04-25 | Stereo parameters for stereo decoding |
US15/962,834 | 2018-04-25 | ||
PCT/US2018/029872 WO2018208515A1 (en) | 2017-05-11 | 2018-04-27 | Stereo parameters for stereo decoding |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310638403.8A Division CN116665682A (zh) | 2017-05-11 | 2018-04-27 | 用于立体声解码的立体声参数 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110622242A CN110622242A (zh) | 2019-12-27 |
CN110622242B true CN110622242B (zh) | 2023-06-16 |
Family
ID=64097350
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310638403.8A Pending CN116665682A (zh) | 2017-05-11 | 2018-04-27 | 用于立体声解码的立体声参数 |
CN201880030918.7A Active CN110622242B (zh) | 2017-05-11 | 2018-04-27 | 用于立体声解码的立体声参数 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310638403.8A Pending CN116665682A (zh) | 2017-05-11 | 2018-04-27 | 用于立体声解码的立体声参数 |
Country Status (9)
Country | Link |
---|---|
US (5) | US10224045B2 (zh) |
EP (1) | EP3622508A1 (zh) |
KR (2) | KR102628065B1 (zh) |
CN (2) | CN116665682A (zh) |
AU (1) | AU2018266531C1 (zh) |
BR (1) | BR112019023204A2 (zh) |
SG (1) | SG11201909348QA (zh) |
TW (3) | TWI790230B (zh) |
WO (1) | WO2018208515A1 (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US10847172B2 (en) * | 2018-12-17 | 2020-11-24 | Microsoft Technology Licensing, Llc | Phase quantization in a speech encoder |
US10957331B2 (en) | 2018-12-17 | 2021-03-23 | Microsoft Technology Licensing, Llc | Phase reconstruction in a speech decoder |
JP7354275B2 (ja) * | 2019-03-14 | 2023-10-02 | ブームクラウド 360 インコーポレイテッド | 優先度を持つ空間認識マルチバンド圧縮システム |
CN113676397B (zh) * | 2021-08-18 | 2023-04-18 | 杭州网易智企科技有限公司 | 空间位置数据处理方法、装置、存储介质及电子设备 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102388417A (zh) * | 2009-03-17 | 2012-03-21 | 杜比国际公司 | 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码 |
CN102428513A (zh) * | 2009-03-18 | 2012-04-25 | 三星电子株式会社 | 多声道信号的编码/解码装置及方法 |
CN103493127A (zh) * | 2012-04-05 | 2014-01-01 | 华为技术有限公司 | 用于参数空间音频编码和解码的方法、参数空间音频编码器和参数空间音频解码器 |
CN103718466A (zh) * | 2011-08-04 | 2014-04-09 | 杜比国际公司 | 通过使用参量立体声改善fm立体声无线电接收器 |
WO2016142376A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE444613T1 (de) | 2004-06-02 | 2009-10-15 | Panasonic Corp | Vorrichtung und verfahren zum empfangen von audiodaten |
US8359196B2 (en) | 2007-12-28 | 2013-01-22 | Panasonic Corporation | Stereo sound decoding apparatus, stereo sound encoding apparatus and lost-frame compensating method |
JP5764488B2 (ja) | 2009-05-26 | 2015-08-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America | 復号装置及び復号方法 |
CN103098131B (zh) * | 2010-08-24 | 2015-03-11 | 杜比国际公司 | 调频立体声无线电接收器的间歇单声道接收的隐藏 |
AR085445A1 (es) * | 2011-03-18 | 2013-10-02 | Fraunhofer Ges Forschung | Codificador y decodificador que tiene funcionalidad de configuracion flexible |
US8654984B2 (en) * | 2011-04-26 | 2014-02-18 | Skype | Processing stereophonic audio signals |
CN102810313B (zh) | 2011-06-02 | 2014-01-01 | 华为终端有限公司 | 音频解码方法及装置 |
EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
JP6804528B2 (ja) * | 2015-09-25 | 2020-12-23 | ヴォイスエイジ・コーポレーション | ステレオ音声信号をプライマリチャンネルおよびセカンダリチャンネルに時間領域ダウンミックスするために左チャンネルと右チャンネルとの間の長期相関差を使用する方法およびシステム |
US10366695B2 (en) | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
US10224045B2 (en) | 2017-05-11 | 2019-03-05 | Qualcomm Incorporated | Stereo parameters for stereo decoding |
-
2018
- 2018-04-25 US US15/962,834 patent/US10224045B2/en active Active
- 2018-04-27 CN CN202310638403.8A patent/CN116665682A/zh active Pending
- 2018-04-27 EP EP18724713.5A patent/EP3622508A1/en active Pending
- 2018-04-27 WO PCT/US2018/029872 patent/WO2018208515A1/en unknown
- 2018-04-27 BR BR112019023204A patent/BR112019023204A2/pt unknown
- 2018-04-27 KR KR1020197033240A patent/KR102628065B1/ko active IP Right Grant
- 2018-04-27 AU AU2018266531A patent/AU2018266531C1/en active Active
- 2018-04-27 SG SG11201909348Q patent/SG11201909348QA/en unknown
- 2018-04-27 CN CN201880030918.7A patent/CN110622242B/zh active Active
- 2018-04-27 KR KR1020247000286A patent/KR20240006717A/ko active Application Filing
- 2018-04-30 TW TW107114648A patent/TWI790230B/zh active
- 2018-04-30 TW TW111148802A patent/TWI828479B/zh active
- 2018-04-30 TW TW111148803A patent/TWI828480B/zh active
-
2019
- 2019-02-11 US US16/272,903 patent/US10783894B2/en active Active
-
2020
- 2020-07-01 US US16/918,887 patent/US11205436B2/en active Active
-
2021
- 2021-12-20 US US17/556,981 patent/US11823689B2/en active Active
-
2023
- 2023-11-17 US US18/513,188 patent/US20240161757A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102388417A (zh) * | 2009-03-17 | 2012-03-21 | 杜比国际公司 | 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码 |
CN102428513A (zh) * | 2009-03-18 | 2012-04-25 | 三星电子株式会社 | 多声道信号的编码/解码装置及方法 |
CN103718466A (zh) * | 2011-08-04 | 2014-04-09 | 杜比国际公司 | 通过使用参量立体声改善fm立体声无线电接收器 |
CN103493127A (zh) * | 2012-04-05 | 2014-01-01 | 华为技术有限公司 | 用于参数空间音频编码和解码的方法、参数空间音频编码器和参数空间音频解码器 |
WO2016142376A1 (en) * | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder for decoding an encoded audio signal and encoder for encoding an audio signal |
Also Published As
Publication number | Publication date |
---|---|
CN110622242A (zh) | 2019-12-27 |
US10224045B2 (en) | 2019-03-05 |
CN116665682A (zh) | 2023-08-29 |
KR20200006978A (ko) | 2020-01-21 |
EP3622508A1 (en) | 2020-03-18 |
US20240161757A1 (en) | 2024-05-16 |
WO2018208515A1 (en) | 2018-11-15 |
KR20240006717A (ko) | 2024-01-15 |
US11823689B2 (en) | 2023-11-21 |
KR102628065B1 (ko) | 2024-01-22 |
US11205436B2 (en) | 2021-12-21 |
US20190214028A1 (en) | 2019-07-11 |
US20220115026A1 (en) | 2022-04-14 |
TWI828480B (zh) | 2024-01-01 |
TWI828479B (zh) | 2024-01-01 |
US20180330739A1 (en) | 2018-11-15 |
TW202315426A (zh) | 2023-04-01 |
SG11201909348QA (en) | 2019-11-28 |
TW201902236A (zh) | 2019-01-01 |
AU2018266531A1 (en) | 2019-10-31 |
TWI790230B (zh) | 2023-01-21 |
TW202315425A (zh) | 2023-04-01 |
US10783894B2 (en) | 2020-09-22 |
AU2018266531C1 (en) | 2023-04-06 |
BR112019023204A2 (pt) | 2020-05-19 |
AU2018266531B2 (en) | 2022-08-18 |
US20200335114A1 (en) | 2020-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102230623B1 (ko) | 다중의 오디오 신호들의 인코딩 | |
CN110622242B (zh) | 用于立体声解码的立体声参数 | |
TWI778073B (zh) | 用於具有時域頻道間頻寬延展之高頻帶殘值預測的音訊信號寫碼裝置、方法、包含指令的非暫時性電腦可讀媒體及設備 | |
CN110770825B (zh) | 时域通道间预测 | |
KR102581558B1 (ko) | 채널간 위상차 파라미터 수정 | |
KR102208602B1 (ko) | 채널간 대역폭 확장 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40013247 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |