CN110249385A - 多信道解码 - Google Patents

多信道解码 Download PDF

Info

Publication number
CN110249385A
CN110249385A CN201880008378.2A CN201880008378A CN110249385A CN 110249385 A CN110249385 A CN 110249385A CN 201880008378 A CN201880008378 A CN 201880008378A CN 110249385 A CN110249385 A CN 110249385A
Authority
CN
China
Prior art keywords
intermediate channels
frame
interpolation weight
time domain
stereo parameter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201880008378.2A
Other languages
English (en)
Other versions
CN110249385B (zh
Inventor
V·S·C·S·奇比亚姆
V·阿提
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of CN110249385A publication Critical patent/CN110249385A/zh
Application granted granted Critical
Publication of CN110249385B publication Critical patent/CN110249385B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Stereophonic System (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Peptides Or Proteins (AREA)

Abstract

一种方法包含通过将两个第一不对称视窗应用到时域中间信道的第一帧且将两个第二不对称视窗应用到所述时域中间信道的第二帧而产生视窗化时域中间信道。所述方法包含将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据。所述方法包含使用所述变换域中间信道数据集、来自位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插参数而执行上混操作。

Description

多信道解码
优先权要求
本申请案要求来自2017年2月3日申请、题为“多信道译码(MULTI CHANNELCODING)”的共同拥有的美国临时专利申请案第62/454,652号及2018年1月30日申请、题为“多信道译码(MULTI CHANNEL CODING)”的美国临时专利申请案第15/844,136号的优先权,前述申请案中的每一者的内容以全文引用的方式并入本文中。
技术领域
本发明大体上涉及音频译码。
背景技术
计算装置可包含用以接收音频信号的多个麦克风。在多信道编码解码系统中,译码器(例如,编码器、解码器或两者)可经配置以在例如作为说明性非限制性实例的以下各者的一或多个域中起作用:变换域、时域、混合域,或另一域。在立体声编码中,来自麦克风的音频信号可经编码以产生中间信道信号及一或多个旁侧信道信号。举例来说,当立体声(2信道)信号经译码时,可在变换域(例如离散傅里叶变换(DFT)域)中的一或多个频带中估计空间参数集。另外或替代地,可针对一或多个子帧在时域中估计另一空间参数集。可在变换域抑或时域中执行其它波形译码。中间信道信号可对应于第一音频信号及第二音频信号的总和。另外,在立体声解码中,中间信道信号及一或多个旁侧信道信号可经解码以产生多个输出信号。
在多信道编码解码系统中,可对音频信号执行DFT变换以将音频信号从时域转换到变换域。可使用视窗(例如,分析视窗)来对音频信号的一部分执行DFT变换。视窗可包含将某延迟引入到译码过程(例如,编码及解码)的预看部分。基于编码过程及解码过程的预看部分所引入的延迟促成用以对音频信号进行编码及解码的多信道编码解码系统的延迟总量。
发明内容
在特定实施中,一种装置包含解码器,其经配置以解码位流以产生时域中间信道。所述解码器还经配置以通过以下操作产生视窗化时域中间信道:将至少两个第一不对称视窗应用到所述时域中间信道的第一帧;及将至少两个第二不对称视窗应用到所述时域中间信道的第二帧。所述解码器经进一步配置以将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据。所述解码器还经配置以使用所述变换域中间信道数据集、来自所述位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作。所述第二帧邻近于所述第一帧。
在另一特定实施方案中,一种方法包含在解码器处解码位流以产生时域中间信道。所述方法还包含通过以下操作产生视窗化时域中间信道:将至少两个第一不对称视窗应用到所述时域中间信道的第一帧;及将至少两个第二不对称视窗应用到所述时域中间信道的第二帧。所述方法进一步包含将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据。所述方法还包含使用所述变换域中间信道数据集、来自所述位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作。所述第二帧邻近于所述第一帧。
在另一特定实施方案中,一种非暂时性计算机可读媒体包含指令,所述指令在由处理器执行时使得所述处理器执行操作,所述操作包含在解码器处解码位流以产生时域中间信道。所述操作还包含通过以下操作产生视窗化时域中间信道:将至少两个第一不对称视窗应用到所述时域中间信道的第一帧;及将至少两个第二不对称视窗应用到所述时域中间信道的第二帧。所述操作进一步包含将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据。所述操作还包含使用所述变换域中间信道数据集、来自所述位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作。所述第二帧邻近于所述第一帧。
在另一特定实施中,一种设备包含用于解码位流以产生时域中间信道的装置。所述设备还包含用于产生视窗化时域中间信道的装置。所述视窗化时域中间信道是通过将至少两个第一不对称视窗应用到时域中间信道的第一帧且通过将至少两个第二不对称视窗应用到所述时域中间信道的第二帧而产生。所述设备进一步包含用于将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集的装置,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据。所述设备还包含用于使用以下各者执行上混操作的装置:变换域中间信道数据集、来自位流的立体声参数以及使用相关联于第一帧的第一立体声参数值与相关联于第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数。所述第二帧邻近于所述第一帧。
本发明的其它方面、优点及特征将在审阅申请案之后变得显而易见,所述申请案包含以下部分:[附图说明]、[具体实施方式]及[权利要求书]。
附图说明
图1为包含可操作以解码多个音频信号的解码器的系统的特定说明性实例的框图;
图2为说明图1的编码器的实例的图式;
图3为说明图1的解码器的实例的图式;
图4包含通过图1的系统的解码器应用的不对称视窗化方案;
图5为说明操作解码器的方法的实例的流程图;
图6为可操作以编码多个音频信号的装置的特定说明性实例的框图;且
图7为可操作以编码多个音频信号的基站的特定说明性实例的框图。
具体实施方式
下文参考图式描述本发明的特定方面。在本说明书中,共同特征由共同参考编号指定。如本文所使用,各种术语仅仅用于描述特定实施方案的目的,且并不意欲限制实施方案。举例来说,除非上下文以其它方式清楚地指示,否则单数形式“一”及“所述”意欲同样包含复数形式。可进一步理解,术语“包括(comprise/comprises/comprising)”可与“包含(include/includes/including)”互换地使用。另外,应理解,术语“其中(wherein)”可与“其中(where)”互换地使用。如本文所使用,用以修饰例如结构、组件、操作等的元素的序数术语(例如“第一”、“第二”、“第三”等)本身不指示元素关于另一元素的任何优先权或次序,而是仅将元素与具有相同名称的另一元素区别开(除非使用序数术语)。如本文所使用,术语“集合”指特定元素中的一或多者,且术语“多个”指特定元素中的多个(例如,两个或两个以上)。
在本发明中,例如“确定”、“计算”、“移位”、“调整”等的术语可用于描述如何执行一或多个操作。应注意,此等术语不应解译为限制性且其它技术可用以执行类似操作。另外,如本文中所提及,“产生”、“计算”、“使用”、“选择”、“存取”与“确定”可互换地使用。举例来说,“产生”、“计算”或“确定”参数(或信号)可指主动地产生、计算或确定参数(或信号),或可指使用、选择或存取已例如由另一组件或装置产生的参数(或信号)。
在本发明中,揭示可操作以对多个音频信号进行译码(例如,编码、解码或两者)的系统及装置。在一些实施方案中,编码器/解码器视窗化(windowing)对于用以减小解码延迟的多信道信号译码可能失配,如本文中进一步描述。
装置可包含经配置以对多个音频信号进行编码的编码器,经配置以对多个音频信号进行解码的解码器或两者。可使用多个记录装置(例如,多个麦克风)同时及时地俘获多个音频信号。在一些实例中,通过多路复用同时或非同时记录的若干音频信道可合成地(例如,人工)产生多个音频信号(或多信道音频)。作为说明性实例,音频信道的并行记录或多路复用可产生2信道配置(即,立体声:左及右)、5.1信道配置(左、右、中央、左环绕、右环绕及低频重音(LFE)信道)、7.1信道配置、7.1+4信道配置、22.2信道配置或N信道配置。
在一些系统中,编码器与解码器可作为一对操作。编码器可执行一或多个操作以对音频信号进行编码,且解码器可执行一或多个操作(例如,以反向次序)以产生经解码音频输出。为了说明,编码器及解码器中的每一者可经配置以执行变换操作(例如,DFT操作)及反变换操作(例如,IDFT操作)。举例来说,编码器可将音频信号从时域变换到变换域以在例如DFT频带的传送域频带中估计一或多个参数(例如,信道间立体声参数)。编码器也可基于所估计的一或多个参数而对一或多个音频信号进行波形译码。作为另一实例,解码器可在将一或多个所接收参数应用于所接收音频信号之前将所接收音频信号从时域变换到变换域。
在每一变换操作之前且在每一反变换操作之后,信号(例如,音频信号)“视窗化”以产生视窗化样本,且视窗化样本用以执行变换操作或反变换操作。如本文所使用,将视窗应用于信号或视窗化信号包含按比例缩放信号的一部分以产生信号的时间范围的样本。按比例缩放所述部分可包含使信号的所述部分乘以对应于视窗的形状的值。
在解码器处,对于多信道信号的每一帧,一种方法包含应用两个不对称视窗(即,第一视窗及第二视窗)以产生视窗化多信道信号且将视窗化多信道信号变换到变换域(例如,DFT域)以产生变换域视窗化数据。在变换域中,通过使用平滑化/内插使邻接帧之间的立体声参数值平滑化而应用多信道信号的立体声参数到变换域视窗化数据(即,平滑化立体声参数值,以计算相关联于帧的第一视窗的数据的立体声参数值并不对帧及先前帧的立体声参数值同等地加权)。
解码器接收位流,所述位流编码中信道、立体声参数且另外并视情况编码用以确定旁侧信道(例如,旁侧信道或错误信道)的信息。解码器解码位流以产生时域中间信道信号(且在一些状况下,时域旁侧信道信号)。时域信号视窗化(即,将视窗化函数应用到时域信号)以准备时域信号以供变换到变换域(例如,DFT变换到DFT域)。视窗化时域信号经变换到变换域以产生变换域中间信道数据(且在一些状况下变换域旁侧信道数据)。
上混操作使用变换域中间信道数据及接收到或所计算的变换域旁侧信道数据执行以产生变换域左信道数据及变换域右信道数据。立体声参数在上混操作期间应用。每一帧的每一各别立体声参数的仅一个值提供于位流中。然而,由于每帧使用两个视窗,因此时域中间信道信号的每一帧对应于两个变换域中间信道数据集(例如,每帧两个中间信道系数集)。因此,每帧的单一立体声参数用以确定每帧的两个立体声参数值(一个参数值用于对应于帧的第一视窗的数据,且另一参数值用于对应于帧的第二视窗的数据)。举例来说,指派给帧的立体声参数值可应用到第二视窗,且可对待应用于帧的第一视窗的立体声参数值进行内插。在一些实施方案中,经内插立体声参数值通过对指派到帧的立体声参数值及指派到前一帧的立体声参数值进行平均(或经均匀加权平滑化)来确定。举例来说,帧(N)的第一视窗使用前一帧(N-1)的立体声参数值与当前帧(N)的立体声参数值中间的立体声参数值。为了说明,对于帧(N)及参数(P),此可在数学上表达为:
P_window_2(N)=P(N);且
P_window_1(N)=0.5*P(N)+0.5*P(N-1)
当解码器使用不对称视窗时,均匀加权平滑化归因于在两个视窗之间使用的较短重叠而产生音频假影。因此,为了减小或避免此等音频假影,不均匀加权平滑化(例如,基于时间-频率栅格在时间以及在频带两者上)可与不对称视窗一起使用以偏移不相等内部重叠(单一帧的视窗的重叠)及外部重叠(一个帧的视窗与邻接帧的视窗的重叠)的效应。不均匀加权平滑化应用不相等权重以确定待应用到特定帧的变换域数据集中的至少一者的立体声参数值。举例来说,不均匀加权平滑化可数学上表示为:
P_window_2(N)=a*P(N)+b*P(N-1);且
P_window_1(N)=c*P(N)+d*P(N-1)
其中a、b、c及d为平滑化系数。大体来说,a+b=1且c+d=1;然而,为了不均匀地加权,足够的是a≠b且c≠d。在一些实施方案中,所有平滑化应用到第一视窗(P_window_1),在所述状况下,a=1且b=0。在其它实施方案中,平滑化应用到帧的两个视窗,在所述状况下,a及b具有介于0与1之间的非零值。在此等实施方案中,大体来说,a>b且a>c。
c及d的值可基于外部重叠与内部重叠的大小的差而予以选择。举例来说,由于帧的视窗的内部重叠大于帧的视窗的外部重叠,因此c的值可小于d的值。换句话说,当应用参数时,对于对称视窗化状况,(P_window_2(N)-P_window_1(N))的值=(P_window_1(N)-P_window_2(N-1))。但在不对称视窗化状况下,如本文中所描述,(P_window_2(N)-P_window_1(N))≠(P_window_1(N)-P_window_2(N-1))。
在某些实施方案中,a、b、c及d的值可基于不对称视窗化的内部重叠与外部重叠的两个重叠部分的旁侧频带排斥量来选择。作为说明性实例,当内部重叠大于外部重叠的旁侧频带排斥量时,内部重叠的旁侧频带排斥量大于外部重叠。在此说明性实例中,a的值可为一,且b的值可为零。在知晓内部重叠的旁侧频带排斥量为外部重叠的旁侧频带排斥量的“f”倍的情况下,c及d可经选择,使得d/c=f。若c+d=1,那么c=f/(1+f)且d=1/(1+f)。在另一实例实施方案中,a、b、c及d的值可基于信号特性(例如,基于帧为非作用中/背景/噪声、有声、暂态、音乐抑或音调内容)在逐帧基础上选择。举例来说,在第一帧或第二帧中存在暂态声音的情况下,a、b、c及d的值相较于第一帧或第二帧中存在强声语音或音乐的情况予以不同选择(或偏置)。在某些其它实施中,值a、b、c及d对于不同立体声参数(例如,信道间层级差ILD、信道间相位差IPD)可不同。
确定并应用每一变换域数据集的立体声参数且执行上混操作产生每帧的两个变换域左信道数据集及每帧的两个变换域右信道数据集。反变换操作可经执行以产生左信道时域信号及右信道时域信号。合成视窗(具有与在变换操作之前由解码器先前应用的不对称形状大体上相同的不对称形状)应用到左信道时域信号及右信道时域信号,且邻接视窗的重叠部分相加在一起以产生准备好以供播出的左信道信号及右信道信号。
参考图1,描绘系统100的特定说明性实例。系统100包含经由网络120以通信方式耦合到第二装置106的第一装置104。网络120可包含一或多个无线网络、一或多个有线网络或其组合。
第一装置104可包含编码器114、发射器110、一或多个输入接口112或其组合。输入接口112的第一输入接口可耦合到第一麦克风146。输入接口112的第二输入接口可耦合到第二麦克风148。编码器114可包含一或多个滤波器组(例如,滤波器108)及变换装置109,且可经配置以编码多个音频信号,如本文中所描述。
第一装置104也可包含经配置以存储第一编码器视窗参数152的存储器153。第一视窗参数152可界定待应用到例如第一音频信号130或第二音频信号132的音频信号的至少一部分的第一视窗或第一视窗化方案202。举例来说,滤波器108可为频率重取样滤波器。在一些实例实施方案中,滤波器108可为高通滤波器以使DC或例如使低于50到60Hz的频率衰减。编码器114可将第一视窗(基于第一视窗参数152)应用到音频信号的至少一部分以产生提供到变换装置109的视窗化样本111。变换装置109可经配置以对视窗化样本执行变换操作,例如变换操作(例如,DFT操作)或反变换操作(例如,IDFT操作)。
第二装置106可包含解码器118、存储器175、接收器178、一或多个输出接口177或其组合。第二装置106的接收器178可经由网络120从第一装置104接收经编码音频信号(例如,一或多个位流)、一或多个参数或两者。解码器118可包含一或多个视窗化单元(例如,视窗172)、立体声参数内插器173及变换装置174,且可经配置以显现多个信道。第二装置106可耦合到第一扬声器142、第二扬声器144或两者。
存储器175可经配置以存储第二视窗参数176。第二视窗参数176可界定第二视窗或第二解码器视窗化方案(例如,不对称视窗化方案)以由视窗172应用到例如经编码音频信号(例如,在解码器处进行合成)的音频信号的至少一部分。举例来说,视窗172可将第二视窗(基于第二视窗参数176)应用到经编码音频信号的至少一部分以产生提供到变换装置174的不对称视窗化样本。变换装置174可经配置以对不对称视窗化样本执行变换操作,例如变换操作(例如,DFT操作)或反变换操作(例如,IDFT操作)。
由编码器114使用的第一视窗参数152(第一装置104的)与由解码器118使用的第二视窗参数176(第二装置106的)可失配。举例来说,作为说明性非限制性实例,第一视窗(由第一视窗参数152界定)可在视窗的重叠部分大小(例如,预看量)、补零的量、视窗的跃点大小、视窗的中心、视窗的平坦部分的大小、视窗的形状或其组合方面不同于第二视窗(由第二视窗参数176界定)。在一些实施方案中,第一视窗由编码器114使用以产生第一视窗化样本(例如,对称视窗化样本),且第二视窗由解码器118使用以产生第二视窗化样本(例如,不对称视窗化样本)。第一视窗化样本与第二视窗化样本可具有相同频率分辨率或可具有不同频率分辨率。
在操作期间,第一装置104可经由第一输入接口从第一麦克风146接收第一音频信号130,并可经由第二输入接口从第二麦克风148接收第二音频信号132。第一音频信号130可对应于右信道信号或左信道信号中的一者。第二音频信号132可对应于右信道信号或左信道信号中的另一者。在一些实施方案中,相比于第二麦克风148,声源152(例如,用户、说话者、环境噪声、乐器等)可更接近第一麦克风146。因此,相比于经由第二麦克风148,来自声源152的音频信号可在较早时间经由第一麦克风146在输入接口112处接收。经由多个麦克风获取的多信道信号的此固有延迟可在第一音频信号130与第二音频信号132之间引入时间性移位。在一些实施方案中,编码器114可经配置以调整(例如,移位)第一音频信号130或第二音频信号132中的至少一者,以在时间上及时地对准第一音频信号130与第二音频信号132。举例来说,编码器118可相对于第二帧(第二音频信号132的)移位第一帧(第一音频信号130的)。
编码器114可将第一视窗(基于第一视窗参数152)应用到音频信号的至少一部分以产生提供到变换装置109的视窗化样本111。视窗化样本111可产生于时域中。变换装置109(例如,频域立体声译码器)可将例如视窗化样本(例如,第一音频信号130及第二音频信号132)的一或多个时域信号变换到频域信号。频域信号可用以估计立体声提示162。立体声提示162可包含使得能够显现相关联于左信道及右信道的空间属性的参数。根据一些实施方案,立体声提示162可包含参数,例如信道间强度差(IID)参数(例如,信道间位准差(ILD)、信道间时差(ITD)参数、信道间相位差(IPD)参数、信道间相关性(ICC)参数、非因果移位参数、频谱倾斜参数、信道间发声参数、信道间间距参数、信道间增益参数等,作为说明性非限制性实例)。立体声提示162可在其它信号产生期间于变换装置109处使用。立体声提示162也可作为经编码信号的部分而发射。关于图2更详细地描述立体声提示162的估计及使用。
编码器114也可至少部分地基于频域信号而产生旁侧频带位流164及中频带位流166。出于说明的目的,除非另外指出,否则假定第一音频信号130为左信道信号(l或L),且第二信号132为右信道信号(r或R)。第一音频信号130的频域表示可表明为Lfr(b),且第二音频信号132的频域表示可表明为Rfr(b),其中b表示一组频域表示。根据一个实施方案,可在频域中从第一音频信号130及第二音频信号132的频域表示产生旁侧频带信号Sfr(b)。举例来说,旁侧频带信号Sfr(b)可表达为(Lfr(b)-Rfr(b))/2或(Lfr(b)-g*Rfr(b))/2,其中g为可基于针对频带b计算的ILD的正规化增益参数。旁侧频带信号Sfr(b)可经提供到旁侧频带编码器以产生旁侧频带位流164。根据一个实施方案,中频带信号m(t)可在时域中产生,且变换到频域中。举例来说,中频带信号m(t)可表达为(l(t)+r(t))/2。产生中频带信号及旁侧频带信号关于图2更详细地描述。时域/频域中频带信号可被提供到中频带编码器以产生中频带位流166。
可使用多个技术来对旁侧频带信号Sfr(b)及中频带信号m(t)或Mfr(b)进行编码。根据一个实施方案,时域中频带信号m(t)可使用例如代数码激励线性预测(ACELP)的时域技术进行编码,其中频宽扩展用于较高频带译码。在旁侧频带译码之前,中频带信号m(t)(经译码或未经译码)可转换到频域(例如,变换域)以产生中频带信号Mfr(b)。
旁侧频带译码的一个实施方案包含使用对应于频带(b)的频率中频带信号Mfr(b)中的信息及立体声提示162(例如,ILD)从频域中频带信号Mfr(b)预测旁侧频带SPRED(b)。举例来说,经预测旁侧频带SPRED(b)可表达为Mfr(b)*(ILD(b)-1)/(ILD(b)+1)。频带(b)中的错误信号e(b)可依据旁侧频带信号Sfr(b)及经预测旁侧频带SPRED(b)来计算。举例来说,错误信号e(b)可表达为Sfr(b)-SPRED(b)。可使用变换域译码技术译码错误信号e(b)以产生经译码错误信号eCODED(b)。对于上部频带,错误信号e(b)可表达为来自先前帧的频带(b)中的中频带信号M_PASTfr(b)的经按比例缩放版本。举例来说,经译码错误信号eCODED(b)可表达为gPRED(b)×M_PASTfr(b),其中在一些实施方案中,可估计gPRED(b)使得e(b)-gPRED(b)×M_PASTfr(b)的能量大体上被减少(例如,最小化)。
发射器110可经由网络120发射立体声提示162、旁侧频带位流164、中频带位流166或其一组合到第二装置106。替代地或另外,发射器110可在网络120的装置或本地装置处存储立体声提示162、旁侧频带位流164、中频带位流166或其组合以供稍后进行进一步处理或解码。
解码器118可基于立体声提示162、旁侧频带位流164及中频带位流166执行解码操作。举例来说,解码器118可经配置以解码中频带位流166以产生时域中间信道180。视窗172可通过将两个不对称视窗应用到时域中间信道的每一帧而产生视窗化时域中间信道182。举例来说,视窗172可使用第二视窗参数176以产生视窗化时域中间信道182。
为了说明,不对称视窗化方案190的实例。时域中间信道180包含帧(N-1)197、帧(N)198及帧(N+1)199。根据视窗化方案190,两个不对称视窗可应用到每一帧197、198、199。为了说明,不对称视窗191可应用到帧198的第一部分,且不对称视窗192可应用到帧198的第二部分。另外,不对称视窗193可应用到帧197的第二部分,且不对称视窗194可应用到帧199的第一部分。为易于说明,应用到帧197的第一部分的不对称视窗并未展示,且应用到帧199的第二部分的不对称视窗并未展示。不对称视窗191、192可重叠以产生帧198的内部重叠195。不对称视窗192、194可重叠以产生帧198的外部重叠196。因为视窗191、192、194不对称,所以内部重叠195大于帧198的外部重叠196。
不对称“视窗漂移”可由更深内部重叠(例如,内部重叠195)及较短外部重叠(例如,外部重叠196)引起,所述较短外部重叠在帧间分布内插强度。在编码器114处,内插可越过每一视窗均一地执行。在解码器118处,内插/平滑化可按帧经约束或偏置为一,且内插/平滑化可根据存在更深视窗重叠的个例对准。另外,解码器118处的内插/平滑化参数可经计算,使得立体声参数在编码器114处估计的视窗位置与立体声参数于解码器118处在上混制程中应用的视窗位置紧密地对准。
在产生视窗化时域中间信道182之后,变换装置174可经配置以将视窗化时域中间信道182变换到变换域以产生变换域中间信道数据集。作为非限制性实例,变换装置174可执行离散傅里叶变换(DFT)操作以将视窗化时域中间信道182变换到变换域(例如,DFT域)。根据一个实施方案,变换域中间信道数据集可包含对应于第一帧(例如,帧198)的第一中间信道视窗(例如,视窗191)的第一变换域中间信道数据184及对应于第一帧的第二中间信道视窗(例如,视窗192)的第二变换域中间信道数据186。
解码器118可经配置以使用以下各者执行上混操作:变换域中间信道数据集、来自位流的立体声参数(例如,立体声提示162),及使用相关联于第一帧(例如,帧198)的第一立体声参数值(x)与相关联于第二帧(例如,帧197)的第二立体声参数值(y)之间的不均匀加权内插确定的经内插立体声参数。举例来说,立体声参数内插器173可经配置以基于第一乘积与第二乘积的总和确定第一中间信道视窗(例如,视窗191)的第一经内插立体声参数值187。第一乘积可基于第一内插权重(α)及第一立体声参数值(x),且第二乘积可为基于第二内插权重(β)及第二立体声参数值(y)。因此,第一经内插立体声参数值187可表达为(α*x+β*y)。第一内插权重(α)及第二内插权重(β)可不相等,使得内插经不均匀地加权。解码器118可经配置以在上混操作期间应用第一经内插立体声参数值187到第一中间信道视窗(例如,视窗191)。举例来说,解码器118可将立体声提示162(在编码器114处产生)的经内插版本应用到第一中间信道视窗(例如,到频域信号)。
根据一些实施方案,第一内插权重(α)及第二内插权重(β)基于由编码器114检测到的瞬态越过不同帧调适性地加权。为了说明,编码器114可检测帧间的瞬态,例如容积的快速增大(例如,“弹出”)。基于瞬态,立体声参数值在帧间可具有快速改变。因此,在经检测瞬态情境下,第一内插权重(α)的值相较于对于先前帧的第一内插权重(α)的值对于特定帧可较高(例如,经更重度加权)。类似地,第二内插权重(β)的值相较于对于先前帧的第二内插权重(β)的值对于特定帧可较低(例如,经较低度加权)。
立体声参数内插器173也可经配置以基于第三乘积与第四乘积确定第二中间信道视窗(例如,视窗192)的第二经内插立体声参数值188。第三乘积可基于第三内插权重(δ)及第一立体声参数值(x),且第四乘积可基于第四内插权重(λ)及第二立体声参数值(y)。因此,第二经内插立体声参数值188可表达为(δ*x+λ*y)。解码器118可经配置以在上混操作期间将第二经内插立体声参数值188应用到第二中间信道视窗(例如,视窗192)。举例来说,解码器118可将立体声提示162(在编码器114处产生)的经内插版本应用到第二中间信道视窗(例如,到频域信号)。
第三内插权重(δ)可大于或等于第一内插权重(α),且第四内插权重(λ)可小于第二内插权重(β)。因此,第二经内插立体声参数值188可朝向第一立体声参数值(x)(例如,相关联于帧198的立体声参数值)更重度地加权,且第一经内插立体声参数值187可朝向第二立体声参数值(y)(例如,相关联于帧197的立体声参数值)更重度地加权。根据一个实施方案,第三内插权重(δ)等于一,且第四内插权重(λ)等于零。在此实施方案中,第二经内插立体声参数值188等于第一立体声参数值(x)。
第一内插权重(α)、第二内插权重(β)、第三内插权重(δ)及第四内插权重(λ)可相异于针对由编码器114使用以产生位流的对应视窗的内插权重。为了阐明,鉴于在编码器及解码器处使用的不同视窗化方案,在编码器处且解码器处执行的内插方案可不同。作为实例,当编码器对对应于帧N的某视窗使用立体声参数值x且对帧N-1的对应视窗使用参数值y时,且当编码器在降混操作期间使用某内插方案,例如将αe*x+βe*y用于对应于帧N的其它视窗时,解码器可仍将相同参数值x用于帧N的某视窗且将参数值y用于帧N-1的对应视窗。但,解码器可使用内插方案,例如将参数的(α*x+β*y)用于帧N的其它视窗,其中α并非与αe相同,或β并非与βe相同,或两者。应注意,在一些实施方案中,x及y应用于解码器及编码器上的视窗位置可能并不相同,因此应用αe*x+βe*y及α*x+β*y的视窗位置也不相同。换句话说,对于所述状况,当αe=βe=0.5时,(x-αe*x+βe*y)=(αe*x+y-βe*y)。但,在解码器上,(x-α*x+β*y)≠(α*x+y-β*y)。因此,当与编码器上一般在解码器上应用经内插参数时,x与y之间的差并非以相同比率分裂。
根据另一实施方案,三个或三个以上视窗可针对每一帧而产生,其中视窗中的至少两者为不对称的。作为非限制性实例,帧的第一视窗可不对称,帧的中间视窗可不对称,且帧的最后视窗可为对称的。作为另一非限制性实例,第一视窗可不对称,中间视窗可为对称的,且最后视窗可能不对称。可存在针对每一帧的多个内部重叠及所述帧与邻接帧之间的一个外部重叠。内部重叠相较于外部重叠可具有较大重叠长度,且相关联于外部重叠的延迟可相对低。关于最后视窗的x的参数值可予以使用,且关于先前帧的最后视窗的参数值y可予以使用。x与y之间的差可能并非在当前帧的最后视窗与前一帧的最后视窗之间跨越所有视窗均一地分布。确切来说,当前帧的第一视窗可并不成比例地更靠近y。
在应用立体声提示162之后,解码器118可产生第一输出信号126(例如,对应于第一音频信号130)、第二输出信号128(例如,对应于第二音频信号132)或两者。举例来说,解码器118也可经配置以基于上混操作产生左信道数据及右信道数据。解码器118可对左信道数据执行第一反变换操作以产生左时域信道,且解码器118可对右信道数据执行第二反变换操作以产生右时域信道。根据一个实施方案,第一反变换操作包含第一反离散傅里叶变换(IDFT)操作,且第二反变换操作包含第二IDFT操作。解码器118也可基于左时域信道及右时域信道产生输出。举例来说,第二装置106可经由第一扬声器142输出第一输出信号126。第二装置106可经由第二扬声器144输出第二输出信号128。在替代性实例中,第一输出信号126及第二输出信号128可作为立体声信号对发射到单个输出扬声器。
根据一个实施方案,解码器118可以类似于如上文关于中间信道描述的方式的方式相对于旁侧信道操作。举例来说,解码器118可经配置以基于旁侧频带位流产生时域旁侧信道。视窗172可通过将两个不对称视窗应用到时域旁侧信道的每一帧而产生视窗化时域旁侧信道。变换装置174可变换视窗化时域旁侧信道到变换域以产生变换域旁侧信道数据集。变换域旁侧信道数据集可包含对应于第一帧的第一旁侧信道视窗的第一变换域旁侧信道数据,及对应于第一帧的第二旁侧信道视窗的第二变换域旁侧信道数据。上述上混操作可进一步基于变换域旁侧信道数据集。
尽管已将第一装置104及第二装置106描述为单独的装置,但在其它实施方案中,第一装置104可包含参考第二装置106所描述的一或多个组件。另外或替代地,第二装置106可包含参考第一装置104所描述的一或多个组件。举例来说,单个装置可包含编码器114、解码器118、发射器110、接收器178、一或多个输入接口112、一或多个输出接口177及存储器。单个装置的存储器可包含界定待由编码器114应用的第一视窗的第一视窗参数152及界定待由解码器176应用的第二视窗的第二视窗参数176。
在特定实施方案中,第二装置106包含接收器178,其经配置以接收由编码器114(第一装置104的)基于多个分析视窗而编码的立体声参数(例如,立体声提示162),所述多个分析视窗在所述多个分析视窗之间具有第一长度的重叠部分。接收器178也可经配置以接收中频带信号,例如如参看图2所描述由编码器114使用立体声参数(例如,立体声提示162)基于降混操作产生的中频带位流166。
如进一步参考图3所描述,第二装置106进一步包含解码器118,其经配置以使用立体声参数来执行上混操作以产生至少两个音频信号,例如第一输出信号126及第二输出信号128。第二多个分析视窗经配置以产生帧间解码延迟,其小于对应于多个分析视窗的视窗重叠。至少两个音频信号基于第二多个分析视窗产生,所述第二多个分析视窗在第二多个分析视窗之间具有第二长度的重叠部分。所述第二长度不同于所述第一长度。举例来说,第二长度小于第一长度。在一些实施方案中,使用立体声参数及中频带信号来执行上混操作。在一些实施方案中,接收器经配置以接收包含立体声参数的音频信号,且解码器118经配置以在对音频信号进行解码期间应用第二多个分析视窗,以产生视窗化时域音频解码信号。
在一些实施方案中,所述多个分析视窗相关联于第一跃点长度且所述第二多个分析视窗相关联于第二跃点长度。第一跃点长度不同于第二跃点长度。另外或替代地,多个分析视窗可包含不同于第二多个分析视窗的数目个视窗。在一些实施方案中,多个分析视窗中的第一视窗与第二多个分析视窗中的第二视窗大小相同。在特定实施方案中,多个分析视窗中的每一视窗为对称的,且第二多个分析视窗的第一特定视窗不对称(例如,个别地或关于第二多个分析视窗的第二特定视窗)。
在一些实施方案中,第二多个分析视窗的视窗重叠不对称。另外或替代地,多个分析视窗中的一对连续视窗中的第一视窗不对称。第一视窗与第二视窗的第一重叠部分的第三长度不同于第二视窗与第二对连续视窗中的第三视窗的第二重叠部分的第四长度。
在一些实施方案中,第二装置106包含编码器,编码器经配置以在对第二音频信号进行编码期间应用多个分析视窗以产生视窗化时域音频编码信号。第二装置106可进一步包含发射器,其经配置以发射基于视窗化时域音频编码信号产生的输出音频信号。
系统100可减少解码器118处的音频假影。举例来说,解码器118使用基于内插权重的不均匀加权平滑化,以减小可归因于不对称视窗(例如,视窗191、192)以其它方式存在的音频假影。不均匀加权平滑化可与不对称视窗一起使用以偏移不相等内部重叠(单一帧的视窗的重叠)及外部重叠(一个帧的视窗与邻接帧的视窗的重叠)的效应。不均匀加权平滑化应用不相等权重以确定待应用到特定帧的变换域数据集中的至少一者的立体声参数值。
参考图2,展示说明编码器114的特定实施方案的图式。第一信号280及第二信号282可对应于左信道信号及右信道信号。在一些实施方案中,左信道信号或右信道信号中的一者(“经调整目标”信号)已相对于左信道信号或右信道信号中的另一者(“参考”信号)经时间移位,以增大译码效率(例如,以减少旁侧信号能量)。在一些实例中,参考信号280可包含左信道信号且经调整目标信号282可包含右信道信号。然而,应理解,在其它实例中,参考信号280可包含右信道信号且经调整目标信号282可包含左信道信号。在其它实施方案中,参考信道280可为在逐框基础上选择的左或右信道中的任一者,且类似地经调整目标信号282可为在经调整用于时间移位之后的左信道或右信道中的另一者。出于下文描述的目的,提供参考信号280包含左信道信号(L)且经调整目标信号282包含右信道信号(R)的特定状况的实例。对于其它状况的类似描述可经轻微地扩展。还应理解,可使用硬件(例如,专用电路)、软件(例如,由处理器执行的指令)或其任何组合来实施图2中所说明的各种组件(例如,变换、信号产生器、编码器、估计器等)。
参考信号280及经调整目标信号282可提供到滤波器108(例如,一或多个滤波器组)。滤波器108可对信号280、282执行重新取样或高通滤波操作。
可对参考信号290执行视窗化及变换202,且可对经调整目标信号292执行视窗化及变换204。视窗化及变换202、204可由产生频域(或子频带域或经滤波低频带核心及高频带频宽扩展)信号的变换操作执行。作为非限制性实例,执行视窗化及变换202、204可包含离散傅里叶变换(DFT)操作、快速傅里叶变换(FFT)操作、经修改离散余弦变换(MDCT)等。根据一些实施方案,正交镜像滤波器组(QMF)操作(使用滤波器组,例如复杂低延迟滤波器组)可用于将输入信号(例如,参考信号290及经调整目标信号292)分裂成多个子频带,且可使用另一频域变换操作将子频带转换到频域中。视窗化及变换202可应用到参考信号290以产生视窗化频域参考信号(Lfr(b))230,且视窗化及变换204可应用到经调整目标信号292以产生视窗化频域经调整目标信号(Rfr(b))232。视窗化频域参考信号230及视窗化频域经调整目标信号232可经提供到立体声提示估计器206及旁侧频带信号产生器208。
立体声提示估计器206可基于视窗化频域参考信号230及视窗化频域经调整目标信号232提取(例如,产生)立体声提示162。为了说明,IID(b)可为频带(b)中的左信道的能量EL(b)及频带(b)中的右信道的能量ER(b)的函数。举例来说,IID(b)可表达为20*log10(EL(b)/ER(b))。在编码器处估计且发射的IPD可提供在频带(b)中的左信道与右信道之间的相位差在频域中的估计。立体声提示162可包含额外(或替代)参数,例如ICC、ITD等。可将立体声提示162发射到图1的第二装置106,提供到旁侧频带信号产生器208,且提供到旁侧频带编码器210。
旁侧频带产生器208可基于视窗化频域参考信号230及视窗化频域经调整目标信号232产生频域旁侧频带信号(Sfr(b))234。可在频域区间/频带中估计频域旁侧频带信号234。在每一频带中,增益参数(g)可不同且可基于信道间位准差(例如,基于立体声提示162)。举例来说,频域旁侧频带信号234可表达为(Lfr(b)-c(b)*Rfr(b))/(1+c(b)),其中c(b)可为ILD(b)或ILD(b)的函数(例如,c(b)=10^(ILD(b)/20))。频域旁侧频带信号234可提供到反变换、视窗化及重叠相加单元250。举例来说,频域旁侧频带信号234可经反变换回到时域以产生时域旁侧频带信号S(t)235或经变换到MDCT域以供译码。可将时域旁侧频带信号235提供到旁侧频道编码器210。
视窗化频域参考信号230及视窗化频域经调整目标信号232可经提供到中频带信号产生器212。根据一些实施方案,也可将立体声提示162提供到中频带信号产生器212。中频带信号产生器212可基于视窗化频域参考信号230及视窗化频域经调整目标信号232产生频域中频带信号Mfr(b)238。根据一些实施方案,也可基于立体声提示162而产生频域中频带信号Mfr(b)238。基于视窗化频域参考信道230、视窗化经调整目标信道232及立体声提示162产生中频带信号238的一些方法是如下。
Mfr(b)=(Lfr(b)+Rfr(b))/2
Mfr(b)=c1(b)*Lfr(b)+c2*Rfr(b),其中c1(b)及c2(b)为复数值。
在一些实施方案中,复数值c1(b)及c2(b)是基于立体声提示162。
频域中频带信号238可经提供到反变换、视窗化或重叠相加单元252。举例来说,频域中频带信号238可经反变换回到时域以产生时域中频带信号236或经变换到MDCT域以供译码。时域中频带信号236可被提供到中频带编码器216,且频域中频带信号238出于有效旁侧频带信号编码而可经提供到旁侧频带编码器210。
旁侧频带编码器210可基于立体声提示162、时域旁侧频带信号235及频域中频带信号238而产生旁侧频带位流164。中频带编码器216可基于时域中频带信号236产生中频带位流166。举例来说,中频带编码器216可编码时域中频带信号236以产生中频带位流166。
视窗化及变换202及204可经配置以应用相关联于图1的第一视窗参数152的视窗化方案。举例来说,立体声提示参数162可包含基于图1的视窗化样本111计算的参数值。另外,反变换、视窗化及重叠相加单元250、252可经配置以对视窗化样本执行反变换(使用相关联于图1的第一视窗参数152的视窗化方案所产生),以将频域信号传回到重叠视窗化时域信号。
在一些实施方案中,立体声提示估计器206、旁侧频带产生器208及中频带信号产生器212中的一或多者可包含于降混器中。另外或替代地,尽管编码器114描述为包含旁侧频带编码器210,但在其它实施方案中,编码器114可不包含旁侧频带编码器210。
参考图3,展示说明解码器118的特定实施方案的图式。经编码音频信号被提供到解码器118的解多路复用器(DEMUX)302。经编码音频信号可包含立体声提示162、旁侧频带位流164及中频带位流166。解多路复用器(未图示)可经配置以从经编码音频信号提取中频带位流166,且提供中频带位流166到中频带解码器304。解多路复用器也可经配置以从经编码音频信号提取旁侧频带位流164及立体声提示162。可将旁侧频带位流164及立体声提示162提供到旁侧频带解码器306。
中频带解码器304可经配置以解码中频带位流166以产生时域中间信道180(例如,中频带信号(mCODED(t)))。时域中间信道180可提供到视窗172。视窗172可经配置以通过将两个不对称视窗(例如,视窗191、192)应用到时域中间信道180的每一帧而产生视窗化时域中间信道182。
变换308可被应用到视窗化时域中间信道182。举例来说,变换308可将视窗化时域中间信道182变换到变换域以产生变换域中间信道数据集(例如,第一变换域中间信道数据184及第二变换域中间信道数据186)。第一变换域中间信道数据184及第二变换域中间信道数据186可被提供到上混器118。
旁侧频带解码器306可基于旁侧频带位流164及立体声提示162产生时域旁侧信道(SCODED(t))352。举例来说,错误(e)可针对低频带及高频带予以解码。时域旁侧信道352可表达为SPRED(t)+eCODED(t),其中SPRED(t)=MCODED(t)*(ILD(t)-1)/(ILD(t)+1)。时域旁侧信道354可被提供到视窗172。视窗172可经配置以通过将两个不对称视窗(例如,视窗191、192)应用到时域旁侧信道354中的每一帧而产生视窗化时域旁侧信道354。
变换309可被应用到视窗化时域旁侧信道354。变换309可变换视窗化时域旁侧信道354到变换域以产生变换域旁侧信道数据355的集合。变换域旁侧信道数据355的集合可包含对应于第一帧(例如,帧198)的第一旁侧信道视窗(例如,视窗191)的第一变换域旁侧信道数据,及对应于第一帧的第二旁侧信道视窗(例如,视窗192)的第二变换域旁侧信道数据。变换域旁侧信道数据355的集合也可提供到上混器118。
上混器118可经配置以使用以下各者来执行上混操作:变换域中间信道数据184、186的集合,来自位流的立体声参数(例如,立体声提示162),变换域旁侧信道数据355的集合,及使用相关联于第一帧(例如,帧198)的第一立体声参数值(x)与相关联于第二帧(例如,帧197)的第二立体声参数值(y)之间的经均匀加权的内插确定的经内插立体声参数。举例来说,立体声参数内插器173可经配置以基于第一乘积与第二乘积的总和确定第一中间信道视窗(例如,视窗191)的第一经内插立体声参数值187。第一乘积可基于第一内插权重(α)及第一立体声参数值(x),且第二乘积可基于第二内插权重(β)及第二立体声参数值(y)。因此,第一经内插立体声参数值187可表达为(α*x+β*y)。第一内插权重(α)及第二内插权重(β)可不相等,使得内插经不均匀地加权。立体声参数内插器173可经配置以在上混操作期间应用第一经内插立体声参数值187到第一中间信道视窗(例如,视窗191)。举例来说,立体声参数内插器173可将立体声提示162的经内插版本(在编码器114处产生)应用到第一中间信道视窗(例如,到频域信号)。
立体声参数内插器173也可经配置以基于第三乘积与第四乘积的总和确定第二中间信道视窗(例如,视窗192)的第二经内插立体声参数值188。第三乘积可基于第三内插权重(δ)及第一立体声参数值(x),且第四乘积可基于第四内插权重(λ)及第二立体声参数值(y)。因此,第二经内插立体声参数值188可表达为(δ*x+λ*y)。立体声参数内插器173可经配置以在上混操作期间应用第二经内插立体声参数值188到第二中间信道视窗(例如,视窗192)。举例来说,解码器118可将立体声提示162(在编码器114处产生)的经内插版本应用到第二中间信道视窗(例如,到频域信号)。
第三内插权重(δ)可大于或等于第一内插权重(α),且第四内插权重(λ)可小于第二内插权重(β)。因此,第二经内插立体声参数值188可朝向第一立体声参数值(x)(例如,相关联于帧198的立体声参数值)更重度地加权,且第一经内插立体声参数值187可朝向第二立体声参数值(y)(例如,相关联于帧197的立体声参数值)更重度地加权。根据一个实施方案,第三内插权重(δ)等于一,且第四内插权重(λ)等于零。在此实施方案中,第二经内插立体声参数值188等于第一立体声参数值(x)。第一内插权重(α)、第二内插权重(β)、第三内插权重(δ)及第四内插权重(λ)可相异于针对由编码器114使用以产生位流的对应视窗的内插权重。
在应用立体声提示162的经内插版本之后,上混器可产生信号360、362。举例来说,立体声提示162的经内插版本可应用到频域中的经上混的左信道及右信道。当可用时,IPD(相位差)可在左及右信道上分布以维持信道间相位差。反变换314可应用到信号360以产生第一时域信号l(t)364(例如,左信道信号),且反变换316可应用到信号362以产生第二时域信号r(t)366(例如,右信道信号)。反变换314、316的非限制性实例包含反离散余弦变换(IDCT)操作、快速傅里叶反变换(IFFT)操作等。视窗化及重叠相加380、382可分别应用到信号364、366以分别产生第一输出信号126及第二输出信号128。视窗化及重叠相加380、382可以如上文所描述的类似方式将两个不对称视窗应用到信号364、366的每一帧。
视窗172可经配置以应用相关联于图1的第二视窗参数176的视窗化方案。相关联于由视窗172使用的不对称视窗化方案的第二视窗化参数176可不同于由编码器(例如图1的编码器114)使用的对称视窗化方案。
应注意,图2的编码器及图3的解码器可包含编码器或解码器框架的一部分,而非全部。举例来说,图2的编码器、图3的解码器或两者也可包含高频带(HB)处理的并行路径。另外或替代地,在一些实施方案中,可在图2的编码器处执行时域降混。另外或替代地,时域上混可遵循图3的解码器以获得经解码器移位补偿的左及右信道。
参考图4,描绘在解码器处实施的不对称视窗化方案的实例。举例来说,描绘由例如图1的解码器118的解码器实施的视窗化方案且通常将所述方案指定为400。在一些实施方案中,可基于第二视窗参数176实施视窗化方案400。
视窗化方案400可将不对称视窗应用到帧(N-1)402、帧(N)404及帧(N+1)406。根据视窗化方案400,两个不对称视窗可应用到每一帧402到406。为了说明,不对称视窗412可应用到帧404的第一部分,且不对称视窗414可应用到帧414的第二部分。另外,不对称视窗410可应用到帧402的第二部分,且不对称视窗416可应用到帧406的第一部分。为易于说明,应用到帧402的第一部分的不对称视窗并未展示,且应用到帧406的第二部分的不对称视窗并未展示。不对称视窗412、414可重叠以产生帧404的内部重叠430。不对称视窗414、416可重叠以产生帧404的外部重叠432。因为视窗412、414、416不对称,所以内部重叠430大于帧404的外部重叠432。
图1的立体声参数内插器173可基于第一乘积与第二乘积的总和确定视窗412(例如,第一中间信道视窗)的第一经内插立体声参数值。第一乘积可基于第一内插权重(α)及相关联于帧404的第一立体声参数值(x),且第二乘积可基于第二内插权重(β)及相关联于帧402的第二立体声参数值(y)。因此,第一经内插立体声参数值可表达为(α*x+β*y)。第一内插权重(α)及第二内插权重(β)可不相等,使得内插经不均匀地加权。第一经内插立体声参数值可在上混操作期间应用到视窗412。
立体声参数内插器173也可经配置以基于第三乘积与第四乘积的总和确定视窗414(例如,第二中间信道视窗)的第二经内插立体声参数值。第三乘积可基于第三内插权重(δ)及第一立体声参数值(x),且第四乘积可基于第四内插权重(λ)及第二立体声参数值(y)。因此,第二经内插立体声参数值188可表达为(δ*x+λ*y)。第二经内插立体声参数值可在上混操作期间应用到视窗414。
第三内插权重(δ)可大于或等于第一内插权重(α),且第四内插权重(λ)可小于第二内插权重(β)。因此,第二经内插立体声参数值可朝向第一立体声参数值(x)(例如,相关联于帧404的立体声参数值)更重度地加权,且第一经内插立体声参数值可朝向第二立体声参数值(y)(例如,相关联于帧402的立体声参数值)更重度地加权。根据一个实施方案,第三内插权重(δ)等于一,且第四内插权重(λ)等于零。在此实施方案中,第二经内插立体声参数值等于第一立体声参数值(x)。第一内插权重(α)、第二内插权重(β)、第三内插权重(δ)及第四内插权重(λ)可相异于针对由编码器114使用以产生位流的对应视窗的内插权重。
δ及λ的值可基于外部重叠432与内部重叠430的大小的差而予以选择。举例来说,由于帧404的视窗412、414的内部重叠430大于帧404的视窗412、414的外部重叠432,因此,δ的值可小于λ的值。
在某些实施方案中,α、β、δ及λ的值可基于不对称视窗化的内部重叠与外部重叠的两个重叠部分的旁侧频带排斥量来选择。不均匀加权内插可对应于具有内插权重(例如,α、β、δ及λ)的重叠相依内插,所述内插权重是基于相关联于应用到时域中间信道180的帧的不对称视窗的重叠量来选择。作为说明性实例,当内部重叠大于外部重叠的旁侧频带排斥量时,内部重叠的旁侧频带排斥量大于外部重叠。在此说明性实例中,α可等于一,且β可等于零。因为内部重叠的旁侧频带排斥量为外部重叠的旁侧频带排斥量的“f”倍,所以δ及λ可经选择,使得δ/λ=f。如果δ+λ=1,那么δ=f/(1+f)且λ=1/(1+f)。
如果立体声参数的对称(例如,均匀地加权)内插在使用不对称视窗化时执行,那么可引起立体声参数的第一斜度型样。第一斜度型样可由点线470表示。举例来说,如果每一视窗412、414经均匀地加权(例如,基于立体声参数值(x)及立体声参数值(y)经均匀地加权),那么相关联于视窗412的斜度490可大于(例如,陡于)相关联于视窗414的斜度492。又,斜度490在将对称内插用于对称视窗化(例如,斜度496或斜度498)时可大于(例如,陡于)斜度492。然而,如果执行立体声参数的不对称(例如,不均匀加权)内插,那么可引起第二斜度型样。参数演进的第二斜度型样通过实线472表示。举例来说,如果视窗412、414经不均匀地加权,那么相关联于视窗412的斜度494可小于斜度490且更靠近于将对称内插用于对称视窗化(例如,斜度496)时发现的参数演进的斜度。因此,立体声参数的不对称内插通过在重叠部分中的任一者处保持斜度值为小的而减小陡的参数演进。举例来说,针对不对称视窗化412、414的立体声参数的不对称内插更紧密地镜射相关联于针对对称视窗的参数演进的倾斜496、498。
尽管视窗化方案400描述斜度型样为线性的,但应注意,参数演进中的一些可能并非为完美线性的,且可简单地为单调递增/递减曲线。因此,所使用的型样(例如,斜度490、492、494、496及498)也可为是单调的曲线。如本文所使用,术语“斜度”在此上下文中松散地界定为相对于重叠部分的量的参数变化量的指示符,此参数变化发生在所述重叠部分上。根据一个实施方案,相关联于不均匀加权内插的每一内插权重经选择以减小斜度(例如,斜度490、492、494、496及498)的绝对值。作为说明,当β及δ的值设定为1且α及λ的值设定为0时,展示于第二斜度型样472中的斜度型样可被达成。在α并非为零的状况下,第二斜度型样472也可具有两个斜度集合(一个斜度集合为内部重叠430处的斜度494,且另一斜度集合为帧N-1与帧N之间的外部重叠处的斜度493)。在替代性实施方案中,α、β、λ及δ的值可经选择,使得内部重叠及外部重叠处的斜度相等。在此等实施方案中,为了在两个重叠处达成参数变化的相同斜度,内部重叠量及外部重叠量用以确定内插因数集合α、β、λ及δ。
视窗化方案400基于内插权重使用不均匀加权平滑化,以减小可归因于不对称视窗(例如,视窗412、414)以其它方式存在的音频假影。不均匀加权平滑化可与不对称视窗412、414一起使用以偏移不相等内部重叠(单一帧的视窗的重叠)及外部重叠(一个帧的视窗与邻接帧的视窗的重叠)的效应。不均匀加权平滑化应用不相等权重以确定待应用到特定帧的变换域数据集中的至少一者的立体声参数值。
参考图5,揭示了操作解码器的方法的特定说明性实例的流程图,且通常将其指定为500。解码器可对应于图1或3的解码器118。举例来说,可通过图1的第二装置106执行方法500。
方法500包含在502处于解码器处解码位流以产生时域中间信道。举例来说,参考图1,解码器118可经配置以解码中频带位流166以产生时域中间信道180。
方法500还包含在504处通过以下操作产生视窗化时域中间信道:将至少两个第一不对称视窗应用到时域中间信道的第一帧,及将至少两个第二不对称视窗应用到时域中间信道的第二帧。举例来说,参考图1,视窗172可通过将两个不对称视窗应用到时域中间信道的每一帧而产生视窗化时域中间信道182。视窗172可使用第二视窗参数176以产生视窗化时域中间信道182。为了说明,不对称视窗化方案190的实例。根据相关联于时域中间信道180的实施方案,视窗化方案190可在时域中使用。举例来说,时域中间信道180包含帧(N-1)197、帧(N)198及帧(N+1)199。根据视窗化方案190,两个不对称视窗可应用到每一帧197、198、199。为了说明,不对称视窗191可应用到帧198的第一部分,且不对称视窗192可应用到帧198的第二部分。
解码器118可选择内插权重集合。基于内插权重集合,横越至少两个第一不对称视窗与至少两个不对称视窗的不同重叠部分的斜度的绝对值之间的差小于每一内插权重等于0.5的情况下的差。斜度指示相对于时域中间信道的不对称视窗重叠的量的立体声参数变化的量。
方法500还包含在506处将视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,变换域中间信道数据集包含对应于第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于第一帧的第二中间信道视窗的第二变换域中间信道数据。举例来说,参考图1,变换装置174可将视窗化时域中间信道182变换到变换域以产生变换域中间信道数据集。作为非限制性实例,变换装置174可执行离散傅里叶变换(DFT)操作以将视窗化时域中间信道182变换到变换域(例如,DFT域)。根据一个实施方案,变换域中间信道数据集可包含对应于第一帧(例如,帧198)的第一中间信道视窗(例如,视窗191)的第一变换域中间信道数据184及对应于第一帧的第二中间信道视窗(例如,视窗192)的第二变换域中间信道数据186。
方法500还包含在508处使用以下各者执行上混操作:变换域中间信道数据集、来自位流的立体声参数,及使用相关联于第一帧的第一立体声参数值与相关联于第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数。第二帧可邻近于第一帧。举例来说,参考图1,解码器118可使用以下各者执行上混操作:变换域中间信道数据集、来自位流的立体声参数(例如,立体声提示162),及使用相关联于第一帧(例如,帧198)的第一立体声参数值(x)与相关联于第二帧(例如,帧197)的第二立体声参数值(y)之间的不均匀加权内插确定的经内插立体声参数。
举例来说,立体声参数内插器173可基于第一乘积与第二乘积的总和确定第一中间信道视窗(例如,视窗191)的第一经内插立体声参数值187。第一乘积可基于第一内插权重(α)及第一立体声参数值(x),且第二乘积可基于第二内插权重(β)及第二立体声参数值(y)。因此,第一经内插立体声参数值187可表达为(α*x+β*y)。第一内插权重(α)及第二内插权重(β)可不相等,使得内插经不均匀地加权。解码器118可在上混操作期间将第一经内插立体声参数值187应用到第一中间信道视窗(例如,视窗191)。举例来说,解码器118可将立体声提示162(在编码器114处产生)的经内插版本应用到第一中间信道视窗(例如,到频域信号)。
立体声参数内插器173也可基于第三乘积与第四乘积的总和确定第二中间信道视窗(例如,视窗192)的第二经内插立体声参数值188。第三乘积可基于第三内插权重(δ)及第一立体声参数值(x),且第四乘积可基于第四内插权重(λ)及第二立体声参数值(y)。因此,第二经内插立体声参数值188可表达为(δ*x+λ*y)。解码器118可在上混操作期间将第二经内插立体声参数值188应用到第二中间信道视窗(例如,视窗192)。举例来说,解码器118可将立体声提示162(在编码器114处产生)的经内插版本应用到第二中间信道视窗(例如,到频域信号)。
第三内插权重(δ)可大于或等于第一内插权重(α),且第四内插权重(λ)可小于第二内插权重(β)。因此,第二经内插立体声参数值188可朝向第一立体声参数值(x)(例如,相关联于帧198的立体声参数值)更重度地加权,且第一经内插立体声参数值187可朝向第二立体声参数值(y)(例如,相关联于帧197的立体声参数值)更重度地加权。根据一个实施方案,第三内插权重(δ)等于一,且第四内插权重(λ)等于零。在此实施方案中,第二经内插立体声参数值188等于第一立体声参数值(x)。第一内插权重(α)、第二内插权重(β)、第三内插权重(δ)及第四内插权重(λ)可相异于针对由编码器114使用以产生位流的对应视窗的内插权重。
根据一个实施方案,方法500还包含基于上混操作产生左信道数据及右信道数据。方法500也可包含对左信道数据执行第一反变换操作以产生左时域信道,及对右信道数据执行第二反变换操作以产生右时域信道。方法500也可包含基于左时域信道及右时域信道产生输出。
根据方法500的一个实施方案,一组内插权重经选择以匹配于横越第一不对称视窗与第二不对称视窗的不同重叠部分的斜度的绝对值。斜度可指示相对于时域中间信道180的不对称视窗重叠的量的立体声参数变化的量。
方法500可减少解码器118处的音频假影。举例来说,解码器118使用基于内插权重的不均匀加权平滑化,以减小可归因于不对称视窗(例如,视窗191、192)以其它方式存在的音频假影。不均匀加权平滑化可与不对称视窗一起使用以偏移不相等内部重叠(单一帧的视窗的重叠)及外部重叠(一个帧的视窗与邻接帧的视窗的重叠)的效应。不均匀加权平滑化应用不相等权重以确定待应用到特定帧的变换域数据集中的至少一者的立体声参数值。
在特定方面中,图5的方法500可由以下各者实施:现场可编程门阵列(FPGA)装置、专用集成电路(ASIC)、例如中央处理单元(CPU)的处理单元、数字信号处理器(DSP)、控制器、另一硬件装置、固件装置,或其任何组合。作为实例,可由如关于图6所描述的执行指令的处理器执行图5的方法500。
参考图6,描绘装置(例如,无线通信装置)的特定说明性实例的框图,且通常将所述装置指定为600。在各种实施方案中,装置600相比图6中所说明可具有较多或较少组件。在说明性实例中,装置600可对应于图1的系统。举例来说,装置600可对应于图1的第一装置104或第二装置106。在说明性实例中,装置600可根据图5的方法操作。
在特定实施方案中,装置600包含处理器606(例如,CPU)。装置600可包含一或多个额外处理器,例如处理器610(例如,DSP)。处理器610可包含编解码器608,例如语音编解码器、音乐编解码器或其组合。处理器610可包含经配置以执行语音/音乐编解码器608的操作的一或多个组件(例如,电路)。作为另一实例,处理器610可经配置以执行一或多个计算机可读指令以执行语音/音乐编解码器608的操作。因此,编解码器608可包含硬件及软件。尽管语音/音乐编解码器608被说明为处理器610的组件,但在其它实例中,语音/音乐编解码器608的一或多个组件可包含于处理器606、编解码器634、另一处理组件或其一组合中。
语音/音乐编解码器608可包含解码器692,例如声码器解码器。举例来说,解码器692可对应于图1的解码器118。在特定方面中,解码器692经配置以解码位流以产生时域中间信道。解码器692也可经配置以通过将两个不对称视窗应用到时域中间信道的每一帧而产生视窗化时域中间信道。解码器692可经进一步配置以将视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据。解码器692也可经配置以使用变换域中间信道数据的所述集合、来自位流的立体声参数以及使用相关联于第一帧的第一立体声参数值与相关联于第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作。
解码器692可使用具有第二视窗特性的取样视窗解码经编码信号,所述第二视窗特性不同于用以编码信号的取样视窗的第一视窗特性。举例来说,解码器692可经配置以基于一或多个所存储的视窗参数691(例如,图1的第二视窗参数176)使用取样视窗。语音/音乐编解码器608可包含编码器691,例如图1的编码器114。编码器691可经配置以使用具有第一视窗特性的取样视窗来对音频信号进行编码。
装置600可包含存储器632及编解码器634。编解码器634可包含数字到模拟转换器(DAC)602及模拟到数字转换器(ADC)604。扬声器636、麦克风阵列638或所述两者可耦合到编解码器634。编解码器634可从麦克风阵列638接收模拟信号,使用模拟到数字转换器604将模拟信号转换到数字信号,且将数字信号提供到语音/音乐编解码器608。语音/音乐编解码器608可处理数字信号。在一些实施方案中,语音/音乐编解码器608可将数字信号提供到编解码器634。编解码器634可使用数字到模拟转换器602将数字信号转换到模拟信号且可将模拟信号提供到扬声器636。
装置600可包含经由收发器650(例如,发射器、接收器或两者)耦合到天线642的无线控制器640。装置600可包含存储器632,例如计算机可读存储装置。存储器632可包含例如一或多个指令的指令660,所述一或多个指令由处理器606、处理器610或其一组合执行以执行关于图1到4描述的技术、图5的方法或其组合中的一或多个。
作为说明性实例,存储器632可存储指令,所述指令在由处理器606、处理器610或其一组合执行时使得处理器606、处理器610或其一组合执行操作,所述操作包含解码位流以产生时域中间信道。操作也可包含通过将两个不对称视窗应用到时域中间信道的每一帧而产生视窗化时域中间信道。操作也可包含将视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据。操作也可包含使用变换域中间信道数据的集合、来自位流的立体声参数以及使用相关联于第一帧的第一立体声参数值与相关联于第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作。
在一些实施方案中,存储器632可包含程序代码(例如,经解译或经编译程式指令),其可由处理器606、处理器610或其一组合执行以使得处理器606、处理器610或其一组合执行如参考图1的第二装置106或者图1或3的解码器118所描述的功能,从而执行方法图5的方法500的至少一部分,或其组合。
存储器632可包含指令660,其可由处理器606、处理器610、编解码器634、装置600的另一处理单元或其组合执行以执行本文中所揭示的方法及过程。图1的系统100的一或多个组件可通过执行指令(例如,指令660)的处理器经由专用硬件(例如,电路)实施以执行一或多个任务或其组合。作为实例,存储器632或处理器606、处理器610、编解码器634中的一或多个组件或其一组合可为存储器装置,例如随机存取存储器(RAM)、磁电阻随机存取存储器(MRAM)、自旋扭矩转移MRAM(STT-MRAM)、快闪存储器、只读存储器(ROM)、可编程只读存储器(PROM)、可擦除可编程只读存储器(EPROM)、电可擦除可编程只读存储器(EEPROM)、暂存器、硬盘、抽取式磁盘或光盘只读存储器(CD-ROM)。存储器装置可包含指令(例如,指令660),其在由计算机(例如,编解码器634中的处理器、处理器606、处理器610或其一组合)执行时可使得计算机执行图5的方法的至少一部分。作为实例,存储器632或处理器606、处理器610、编解码器634的一或多个组件可为包含指令(例如,指令660)的非暂时性计算机可读媒体,所述指令在由计算机(例如,编解码器634中的处理器、处理器606、处理器610或其组合)执行时使得计算机执行图5的方法的至少一部分或其组合。
在特定实施方案中,装置600可包含于封装内系统或系统单芯片装置622中。在一些实施方案中,存储器632、处理器606、处理器610、显示器控制器626、编解码器634、无线控制器640及收发器650包含于系统级封装或系统单芯片装置622中。在一些实施方案中,输入装置630及电力供应器644耦合到系统单芯片装置622。此外,在特定实施方案中,如图6中所说明,显示器628、输入装置630、扬声器636、麦克风阵列638、天线642及电力供应器644在系统单芯片装置622外部。在其它实施方案中,显示器628、输入装置630、扬声器636、麦克风阵列638、天线642及电力供应器644中的每一者可耦合到系统单芯片装置622的组件,例如系统单芯片装置622的接口或控制器。在说明性实例中,装置600对应于通信装置、移动通信装置、智能电话、蜂窝式电话、膝上型计算机、计算机、平板计算机、个人数字助理、机顶盒、显示装置、电视、游戏控制台、音乐播放器、无线电、数字视讯播放器、数字视讯光盘(DVD)播放器、光学光盘播放器、调谐器、摄影机、导航装置、解码器系统、编码器系统、基站、载具,或其任何组合。
结合所描述的方面,一种设备可包含用于解码位流以产生时域中间信道的装置。举例来说,用于解码的装置可包含或对应于图1及3的解码器118,图6的解码器692,图6的处理器606,图1的178,用以解码的一或多个其它结构、装置、电路、模块或指令,或其一组合。
设备也可包含用于产生视窗化时域中间信道的装置。视窗化时域中间信道是通过将至少两个不对称视窗应用到时域中间信道的第一帧且通过将至少两个不对称视窗应用到所述时域中间信道的第二帧而产生。举例来说,用于产生的装置可包含或对应于图1及3的解码器118,图1及3的视窗172,图6的解码器692,图6的处理器606,图1的178,一或多个其它结构,用以产生视窗化时域中间信道的一或多个其它结构、装置、电路、模块或指令,或其一组合。
设备还可包含用于将视窗化时域中间信道变换到变换域以产生变换域中间信道数据集的装置,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于第一帧的第二中间信道视窗的第二变换域中间信道数据。举例来说,用于变换的装置可包含或对应于图1及3的解码器118,图1的变换装置174,图3的变换308、309,图6的解码器692,图6的处理器606,图1的178,用以变换的一或多个其它结构、装置、电路、模块或指令,或其组合。
设备还可包含用于使用以下各者执行上混操作的装置:变换域中间信道数据集、来自位流的立体声参数以及使用相关联于第一帧的第一立体声参数值与相关联于第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数。举例来说,用于执行上混操作的装置可包含或对应于图1及3的解码器118,图1及3的立体声参数内插器173,图3的上混器310,图6的解码器692,图6的处理器606,图1的178、用以解码的一或多个其它结构、装置、电路、模块或指令,或其组合。
在上文所描述的描述内容的方面中,已将所执行的各种功能描述为由某些组件或模块(例如图1的系统100的组件或模块)执行。然而,组件及模块的此划分仅是为了说明。在替代性实例中,由特定组件或模块执行的功能可替代地于多个组件或模块当中划分。此外,在其它替代性实例中,图1的两个或多于两个组件或模块可集成到单个组件或模块中。说明于图1中的每一组件或模块可使用硬件(例如,ASIC、DSP、控制器、FPGA装置等)、软件(例如,由处理器执行的指令)或其任何组合来实施。
参考图7,描绘基站700的特定说明性实例的框图。在各种实施中,与图7中所说明的组件相比,基站700可具有更多组件或更少组件。在说明性实例中,基站700可根据图5的方法500操作。
基站700可为无线通信系统的部分。无线通信系统可包含多个基站及多个无线装置。无线通信系统可为长期演进(LTE)系统、第四代(4G)LTE系统、第五代(5G)系统、码分多址近接(CDMA)系统、全球移动通信系统(GSM)系统、无线局域网(WLAN)系统或某一其它无线系统。CDMA系统可实施宽带CDMA(WCDMA)、CDMA1X、演进数据最佳化(EVDO)、时分同步CDMA(TD-SCDMA),或一些其它版本的CDMA。
无线装置还可被称作用户装备(UE)、移动台、终端机、存取终端机、订户单元、工作台等。所述无线装置可包含:蜂窝式电话、智能电话、平板计算机、无线数据机、个人数字助理(PDA)、手持型装置、膝上型计算机、智能本、迷你笔记型计算机、平板计算机、无接线电话、无线区域回路(WLL)站、蓝牙装置等。无线装置可包含或对应于图6的装置600。
各种功能可通过基站700(及/或未图示的其它组件中)的一或多个组件执行,例如发送及接收消息及数据(例如,音频数据)。在特定实例中,基站700包含处理器706(例如,CPU)。基站700可包含转码器710。转码器710可包含音频编解码器708(例如,语音及音乐编解码器)。举例来说,转码器710可包含经配置以执行音频编解码器708的操作的一或多个组件(例如,电路)。作为另一实例,转码器710经配置以执行一或多个计算机可读指令以执行音频编解码器708的操作。尽管音频编解码器708经说明为转码器710的组件,但在其它实例中,音频编解码器708的一或多个组件可包含于处理器706、另一处理组件,或其一组合中。举例来说,解码器118(例如,声码器解码器)可包含于接收器数据处理器764中。作为另一实例,编码器114(例如,声码器编码器)可包含于发射数据处理器782中。
转码器710可起到在两个或多于两个网络之间转码消息及数据的作用。转码器710经配置以将消息及音频数据从第一格式(例如,数字格式)转换到第二格式。为了说明,解码器118可解码具有第一格式的经编码信号,且编码器114可将经解码信号编码成具有第二格式的经编码信号。另外或替代地,转码器710经配置以执行数据速率调适。举例来说,转码器710可在不改变音频数据的格式的情况下降频转换数据速率或升频转换数据速率。为了说明,转码器710可将64千位/秒信号降频转换成16千位/秒信号。音频编解码器708可包含编码器114及解码器118。解码器118可包含立体声参数调节器618。
基站700包含存储器732。存储器732(计算机可读存储装置的实例)可包含指令。指令可包含可由处理器706、转码器710或其组合执行以执行图5的方法500的一或多个指令。基站700可包含耦合到天线阵列的多个发射器及接收器(例如,收发器),例如第一收发器752及第二收发器754。天线阵列可包含第一天线742及第二天线744。天线阵列经配置而以无线方式与一或多个无线装置例如图6的装置600通信。举例来说,第二天线744可从无线装置接收数据流714(例如,位流)。数据流714可包含消息、数据(例如,经编码语音数据),或其一组合。
基站700可包含例如空载发射连接的网络连接760。网络连接760经配置以与无线通信网络的核心网络或一或多个基站通信。举例来说,基站700可经由网络连接760从核心网络接收第二数据流(例如,消息或音频数据)。基站700可处理第二数据流以产生消息或音频数据,且经由天线阵列中的一或多个天线将消息或音频数据提供到一或多个无线装置,或经由网络连接760将其提供到另一基站。在特定实施方案中,作为说明性的非限制性实例,网络连接760可为广域网(WAN)连接。在一些实施方案中,核心网络可包含或对应于公众交换电话网络(PSTN)、包基干网络或两者。
基站700可包含耦合到网络连接760及处理器706的媒体网关770。媒体网关770经配置以在不同电信技术的媒体流之间转换。举例来说,媒体网关770可在不同发射协议、不同译码方案或两者之间转换。为了说明,作为说明性的非限制性实例,媒体网关770可从PCM信号到实时输送协议(RTP)信号进行转换。媒体网关770可在以下各者之间转换数据:包交换式网络(例如,因特网通信协议语音(VoIP)网络,IP多媒体子系统(IMS),例如LTE、WiMax及UMB的第四代(4G)无线网络,第五代(5G)无线网络等)、电路交换式网络(例如,PSTN),及混合式网络(例如,例如GSM、GPRS及EDGE的第二代(2G)无线网络,例如WCDMA、EV-DO及HSPA的第三代(3G)无线网络等)。
另外,媒体网关770可包含例如转码器710的转码器,且经配置以在编解码器不兼容时转码数据。举例来说,作为说明性的非限制性实例,媒体网关770可在自适应性多重速率(AMR)编解码器与G.711编解码器之间进行转码。媒体网关770可包含路由器及多个物理接口。在一些实施方案中,媒体网关770还可包含控制器(未图示)。在特定实施中,媒体网关控制器可在媒体网关770外部、在基站700外部或在其两者外部。媒体网关控制器可控制并协调多个媒体网关的操作。媒体网关770可从媒体网关控制器接收控制信号,且可起到在不同发射技术之间进行桥接的作用,且可添加服务到终端用户能力及连接。
基站700可包含耦合到收发器752、754的解调器762、接收器数据处理器764及处理器706,且接收器数据处理器764可耦合到处理器706。解调器762经配置以解调制从收发器752、754接收的经调制信号,并将经解调制数据提供到接收器数据处理器764。接收器数据处理器764经配置以从经解调制数据提取消息或音频数据,并将所述消息或音频数据发送到处理器706。
基站700可包含发射数据处理器782及发射多输入多输出(MIMO)处理器784。发射数据处理器782可耦合到处理器706及发射MIMO处理器784。发射MIMO处理器784可耦合到收发器752、754及处理器706。在一些实施方案中,发射MIMO处理器784可耦合到媒体网关770。作为说明性的非限制性实例,发射数据处理器782经配置以从处理器706接收消息或音频数据,且基于例如CDMA或正交分频多路复用(OFDM)的译码方案译码所述消息或所述音频数据。发射数据处理器782可提供经译码数据到发射MIMO处理器784。
可使用CDMA或OFDM技术将经译码数据与例如导频数据的其它数据多路复用在一起以产生经多路复用数据。经多路复用数据可接着基于特定调制方案(即,二元相移键控(“BPSK”)、正交相移键控(“QSPK”)、M元相移键控(“M-PSK”)、M元正交振幅调制(“M-QAM”)等)由发射数据处理器782调制(即,符号映射)以产生调制符号。在特定实施方案中,经译码数据及其它数据可使用不同调制方案调制。用于每一数据流的数据速率、译码,及调制可通过处理器706所执行的指令来确定。
发射MIMO处理器784经配置以从发射数据处理器782接收调制符号,且可进一步处理调制符号,且可对所述数据执行波束成形。举例来说,发射MIMO处理器784可将波束成形权重应用于调制符号。
在操作期间,基站700的第二天线744可接收数据流714。第二收发器754可从第二天线744接收数据流714,且可将所述数据流714提供到解调器762。解调器762可解调制数据流714的经调制信号,且将经解调制数据提供到接收器数据处理器764。接收器数据处理器764可从经解调制数据提取音频数据,并将经提取音频数据提供到处理器706。
处理器706可将音频数据提供到转码器710以用于转码。转码器710的解码器118可将音频数据从第一格式解码成经解码音频数据,且编码器114可将经解码音频数据编码成第二格式。在一些实施方案中,编码器114可使用比从无线装置所接收的数据速率高的数据速率(例如,升频转换)或低的数据速率(例如,降频转换)对音频数据进行编码。在其它实施方案中,音频数据可未经转码。尽管转码(例如,解码及编码)说明为由转码器710执行,但转码操作(例如,解码及编码)可由基站700的多个组件执行。举例来说,解码可由接收器数据处理器764执行,且编码可由发射数据处理器782执行。在其它实施方案中,处理器706可将音频数据提供到媒体网关770以用于转换到另一发射协议、译码方案或两者。媒体网关770可经由网络连接760将经转换数据提供到另一基站或核心网络。
可经由处理器706将在编码器114处产生的经编码音频数据(例如经转码数据)提供到发射数据处理器782或网络连接760。可将来自转码器710的经转码音频数据提供到发射数据处理器782,用于根据例如OFDM的调制方案译码,以产生调制符号。发射数据处理器782可将调制符号提供到发射MIMO处理器784以供进一步处理及波束成形。发射MIMO处理器784可应用波束成形权重,且可经由第一收发器752将调制符号提供到天线阵列中的一或多个天线,例如第一天线742。因此,基站700可将对应于从无线装置接收的数据流714的经转码数据流716提供到另一无线装置。经转码数据流716可具有与数据流714不同的编码格式、数据速率,或前述两者。在其它实施方案中,可将经转码数据流716提供到网络连接760,以供发射到另一基站或核心网络。
所属领域的一般技术人员将进一步了解,结合本文所揭示的方面所描述的各种说明性逻辑块、配置、模块、电路及算法步骤可作为电子硬件、由处理器执行的计算机软件,或两者的组合进行实施。上文大体在功能性方面描述各种说明性组件、块、配置、模块、电路及步骤。此功能性被实施为硬件抑或处理器可执行指令取决于特定应用及强加于整个系统的设计约束。对于每一特定应用来说,所属领域的一般技术人员可以变化的方式实施所描述的功能性,但不将此等实施决策解释为导致脱离本发明的范畴。
结合本文中所揭示的方面所描述的方法或算法的步骤可直接包含于硬件、由处理器执行的软件模块或所述两者的组合中。软件模块可驻存于RAM、快闪存储器、ROM、PROM、EPROM、EEPROM、暂存器、硬盘、抽取式磁盘、CD-ROM,或此项技术中已知的任何其它形式的非暂时存储媒体中。特定存储媒体可耦合到处理器,使得处理器可从存储媒体读取信息且向存储媒体写入信息。在替代方案中,存储媒体可与处理器成一体式。处理器及存储媒体可驻存于ASIC中。ASIC可驻存于计算装置或用户终端机中。在替代方案中,处理器及存储媒体可作为离散组件驻存于计算装置或用户终端机中。
提供先前描述内容以使得所属领域的一般技术人员能够进行或使用所揭示方面。所属领域的一般技术人员将易于了解对此等方面的各种修改,且本文中定义的原理可应用于其它方面而不脱离本发明的范畴。因此,本发明并不意欲限于本文中所展示的方面,且应符合可能与如由以下申请专利范围所定义的原理及新颖特征相一致的最广泛范畴。

Claims (51)

1.一种装置,其包括:
解码器,其经配置以:
解码位流以产生时域中间信道;
通过以下操作产生视窗化时域中间信道:
将至少两个第一不对称视窗应用到所述时域中间信道的第一帧;及
将至少两个第二不对称视窗应用到所述时域中间信道的第二帧;
将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据;及
使用所述变换域中间信道数据集、来自所述位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作,其中所述第二帧邻近于所述第一帧。
2.根据权利要求1所述的装置,其中所述解码器经进一步配置以:
基于第一乘积与第二乘积的总和确定所述第一中间信道视窗的第一经内插立体声参数值,所述第一乘积基于第一内插权重及所述第一立体声参数值,所述第二乘积基于第二内插权重及所述第二立体声参数值,其中所述第一内插权重不等于所述第二内插权重;及
在所述上混操作期间将所述第一经内插立体声参数值应用到所述第一中间信道视窗。
3.根据权利要求2所述的装置,其中所述第一内插权重等于一,且其中所述第二内插权重等于零。
4.根据权利要求2所述的装置,其中所述第一内插权重等于零,且其中所述第二内插权重等于一。
5.根据权利要求2所述的装置,其中所述第一中间信道视窗的至少一部分延伸到所述第二帧。
6.根据权利要求2所述的装置,其中所述解码器经进一步配置以:
基于第三乘积与第四乘积的总和确定所述第二中间信道视窗的第二经内插立体声参数值,所述第三乘积是基于第三内插权重及所述第一立体声参数值,且所述第四乘积是基于第四内插权重及所述第二立体声参数值,所述第三内插权重大于或等于所述第一内插权重,且所述第四内插权重小于所述第二内插权重;及
在所述上混操作期间将所述第二经内插立体声参数值应用到所述第二中间信道视窗。
7.根据权利要求6所述的装置,其中所述第二中间信道视窗并不与所述第二帧重叠。
8.根据权利要求6所述的装置,其中所述第三内插权重等于一,且其中所述第四内插权重等于零。
9.根据权利要求6所述的装置,其中所述第一内插权重、所述第二内插权重、所述第三内插权重及所述第四内插权重相异于针对由编码器使用以产生所述位流的视窗的对应内插权重。
10.根据权利要求1所述的装置,其中所述不均匀加权内插对应于具有内插权重的重叠相依内插,所述内插权重基于相关联于应用到所述时域中间信道的帧的不对称视窗的重叠量来选择。
11.根据权利要求1所述的装置,其中相关联于所述不均匀加权内插的每一内插权重经选择以减小斜度的绝对值,所述斜度指示相对于所述时域中间信道的不对称视窗重叠量的立体声参数变化量。
12.根据权利要求1所述的装置,其中一组内插权重经选择以匹配于横越所述第一不对称视窗与所述第二不对称视窗的不同重叠部分的斜度的绝对值,所述斜度指示相对于所述时域中间信道的不对称视窗重叠量的立体声参数变化量。
13.根据权利要求12所述的装置,其中所述组内插权重基于译码器类型且基于所述时域中间信道的所述第一帧及所述时域中间信道的所述第二帧的信号特性来选择。
14.根据权利要求1所述的装置,其中所述解码器经进一步配置以选择一组内插权重,其中基于所述组内插权重,横越所述至少两个第一不对称视窗与所述至少两个第二不对称视窗的不同重叠部分的斜度的绝对值之间的差小于每一内插权重等于0.5的情况下的差,所述斜度指示相对于所述时域中间信道的不对称视窗重叠量的立体声参数变化量。
15.根据权利要求1所述的装置,其中所述立体声参数包含以下各者中的至少一者:信道间强度差IID参数、信道间时差ITD参数、信道间相位差IPD参数、信道间相关性ICC参数、非因果移位参数、频谱倾斜参数、信道间发声参数、信道间间距参数或信道间增益参数。
16.根据权利要求1所述的装置,其中所述解码器经进一步经配置以执行离散傅里叶变换DFT操作以将所述视窗化时域中间信道变换到所述变换域。
17.根据权利要求1所述的装置,其中所述解码器经进一步配置以:
基于所述上混操作产生左信道数据及右信道数据;
对所述左信道数据执行第一反变换操作以产生左时域信道;
对所述右信道数据执行第二反变换操作以产生右时域信道;及
基于所述左时域信道及所述右时域信道产生输出。
18.根据权利要求17所述的装置,其中所述第一反变换操作包含第一反离散傅里叶变换IDFT操作,且其中所述第二反变换操作包含第二IDFT操作。
19.根据权利要求1所述的装置,其中所述解码器经进一步配置以:
基于所述位流产生时域旁侧信道;
通过将两个不对称视窗应用到所述时域旁侧信道的每一帧产生视窗化时域旁侧信道;及
将所述视窗化时域旁侧信道变换到所述变换域以产生变换域旁侧信道数据集,所述变换域旁侧信道数据集包含对应于所述第一帧的第一旁侧信道视窗的第一变换域旁侧信道数据及对应于所述第一帧的第二旁侧信道视窗的第二变换域旁侧信道数据,
其中所述上混操作进一步基于所述变换域旁侧信道数据集。
20.根据权利要求1所述的装置,其中所述解码器集成到基站中。
21.根据权利要求1所述的装置,其中所述解码器集成到移动装置中。
22.一种方法,其包括:
在解码器处解码位流以产生时域中间信道;
通过以下操作产生视窗化时域中间信道:
将至少两个第一不对称视窗应用到所述时域中间信道的第一帧;及
将至少两个第二不对称视窗应用到所述时域中间信道的第二帧;
将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据;及
使用所述变换域中间信道数据集、来自所述位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作,其中所述第二帧邻近于所述第一帧。
23.根据权利要求22所述的方法,其进一步包括:
基于第一乘积与第二乘积的总和确定所述第一中间信道视窗的第一经内插立体声参数值,所述第一乘积是基于第一内插权重及所述第一立体声参数值,所述第二乘积是基于第二内插权重及所述第二立体声参数值,其中所述第一内插权重不等于所述第二内插权重;及
在所述上混操作期间将所述第一经内插立体声参数值应用到所述第一中间信道视窗。
24.根据权利要23求所述的方法,其中所述第一内插权重等于一,且其中所述第二内插权重等于零。
25.根据权利要求23所述的方法,其中所述第一内插权重等于零,且其中所述第二内插权重等于一。
26.根据权利要求23所述的方法,其中所述第一中间信道视窗的至少一部分与所述第二帧的一部分重叠。
27.根据权利要求23所述的方法,其进一步包括:
基于第三乘积与第四乘积的总和确定所述第二中间信道视窗的第二经内插立体声参数值,所述第三乘积是基于第三内插权重及所述第一立体声参数值,且所述第四乘积是基于第四内插权重及所述第二立体声参数值,所述第三内插权重大于或等于所述第一内插权重,且所述第四内插权重小于所述第二内插权重;及
在所述上混操作期间将所述第二经内插立体声参数值应用到所述第二中间信道视窗。
28.根据权利要求27所述的方法,其中所述第二中间信道视窗并不与所述第二帧重叠。
29.根据权利要求27所述的方法,其中所述第三内插权重等于一,且其中所述第四内插权重等于零。
30.根据权利要求27所述的方法,其中所述第一内插权重、所述第二内插权重、所述第三内插权重及所述第四内插权重相异于针对由编码器使用以产生所述位流的对应视窗的内插权重。
31.根据权利要求22所述的方法,其中所述立体声参数包含以下各者中的至少一者:信道间强度差IID参数、信道间时差ITD参数、信道间相位差IPD参数、信道间相关性ICC参数、非因果移位参数、频谱倾斜参数、信道间发声参数、信道间间距参数或信道间增益参数。
32.根据权利要求22所述的方法,其进一步包括执行离散傅里叶变换DFT操作以将所述视窗化时域中间信道变换到所述变换域。
33.根据权利要求22所述的方法,其进一步包括:
基于所述上混操作产生左信道数据及右信道数据;
对所述左信道数据执行第一反变换操作以产生左时域信道;
对所述右信道数据执行第二反变换操作以产生右时域信道;及
基于所述左时域信道及所述右时域信道产生输出。
34.根据权利要求33所述的方法,其中所述第一反变换操作包含第一反离散傅里叶变换IDFT操作,且其中所述第二反变换操作包含第二IDFT操作。
35.根据权利要求22所述的方法,其进一步包括:
基于所述位流产生时域旁侧信道;
通过将两个不对称视窗应用到所述时域旁侧信道的每一帧产生视窗化时域旁侧信道;及
将所述视窗化时域旁侧信道变换到所述变换域以产生变换域旁侧信道数据集,所述变换域旁侧信道数据集包含对应于所述第一帧的第一旁侧信道视窗的第一变换域旁侧信道数据及对应于所述第一帧的第二旁侧信道视窗的第二变换域旁侧信道数据,
其中所述上混操作进一步基于所述变换域旁侧信道数据集。
36.根据权利要求22所述的方法,其中所述上混操作于基站处执行。
37.根据权利要求22所述的方法,其中所述上混操作于移动装置处执行。
38.一种包括指令的非暂时性计算机可读媒体,所述指令在由处理器执行时使得所述处理器执行包括以下操作的操作:
在解码器处解码位流以产生时域中间信道;
通过以下操作产生视窗化时域中间信道:
将至少两个第一不对称视窗应用到所述时域中间信道的第一帧;及
将至少两个第二不对称视窗应用到所述时域中间信道的第二帧;
将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据;及
使用所述变换域中间信道数据集、来自所述位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作,其中所述第二帧邻近于所述第一帧。
39.根据权利要求38所述的非暂时性计算机可读媒体,其中所述操作进一步包括:
基于第一乘积与第二乘积的总和确定所述第一中间信道视窗的第一经内插立体声参数值,所述第一乘积是基于第一内插权重及所述第一立体声参数值,所述第二乘积是基于第二内插权重及所述第二立体声参数值,其中所述第一内插权重不等于所述第二内插权重;及
在所述上混操作期间将所述第一经内插立体声参数值应用到所述第一中间信道视窗。
40.根据权利要求39所述的非暂时性计算机可读媒体,其中所述第一中间信道视窗的至少一部分延伸到所述第二帧。
41.根据权利要求39所述的非暂时性计算机可读媒体,其中所述操作进一步包括:
基于第三乘积与第四乘积的总和确定所述第二中间信道视窗的第二经内插立体声参数值,所述第三乘积是基于第三内插权重及所述第一立体声参数值,且所述第四乘积是基于第四内插权重及所述第二立体声参数值,所述第三内插权重大于或等于所述第一内插权重,且所述第四内插权重小于所述第二内插权重;及
在所述上混操作期间将所述第二经内插立体声参数值应用到所述第二中间信道视窗。
42.根据权利要求41所述的非暂时性计算机可读媒体,其中所述第二中间信道视窗并不与所述第二帧重叠。
43.根据权利要求41所述的非暂时性计算机可读媒体,其中所述第三内插权重等于一,且其中所述第四内插权重等于零。
44.根据权利要求41所述的非暂时性计算机可读媒体,其中所述第一内插权重、所述第二内插权重、所述第三内插权重及所述第四内插权重相异于针对由编码器使用以产生所述位流的视窗的对应内插权重。
45.一种设备,其包括:
用于解码位流以产生时域中间信道的装置;
用于产生视窗化时域中间信道的装置,所述视窗化时域中间信道是通过以下操作而产生:
将至少两个第一不对称视窗应用到所述时域中间信道的第一帧;及
将至少两个第二不对称视窗应用到所述时域中间信道的第二帧;
用于将所述视窗化时域中间信道变换到变换域以产生变换域中间信道数据集的装置,所述变换域中间信道数据集包含对应于所述第一帧的第一中间信道视窗的第一变换域中间信道数据及对应于所述第一帧的第二中间信道视窗的第二变换域中间信道数据;及
用于使用所述变换域中间信道数据集、来自所述位流的立体声参数以及使用相关联于所述第一帧的第一立体声参数值与相关联于所述第二帧的第二立体声参数值之间的不均匀加权内插确定的经内插立体声参数而执行上混操作的装置,其中所述第二帧邻近于所述第一帧。
46.根据权利要求45所述的设备,其进一步包括:
用于基于第一乘积与第二乘积的总和确定所述第一中间信道视窗的第一经内插立体声参数值的装置,所述第一乘积是基于第一内插权重及所述第一立体声参数值,所述第二乘积是基于第二内插权重及所述第二立体声参数值,其中所述第一内插权重不等于所述第二内插权重;及
用于在所述上混操作期间将所述第一经内插立体声参数值应用到所述第一中间信道视窗的装置。
47.根据权利要求46所述的设备,其中所述第一中间信道视窗的至少一部分延伸到所述第二帧。
48.根据权利要求46所述的设备,其进一步包括:
用于基于第三乘积与第四乘积的总和确定所述第二中间信道视窗的第二经内插立体声参数值的装置,所述第三乘积是基于第三内插权重及所述第一立体声参数值,且所述第四乘积是基于第四内插权重及所述第二立体声参数值,所述第三内插权重大于或等于所述第一内插权重,且所述第四内插权重小于所述第二内插权重;及
用于在所述上混操作期间将所述第二经内插立体声参数值应用到所述第二中间信道视窗的装置。
49.根据权利要求48所述的设备,其中所述第二中间信道视窗并不与所述第二帧重叠。
50.根据权利要求45所述的设备,其中所述用于执行所述上混操作的装置集成到基站中。
51.根据权利要求45所述的设备,其中所述用于执行所述上混操作的装置集成到移动装置中。
CN201880008378.2A 2017-02-03 2018-01-31 多信道解码 Active CN110249385B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201762454652P 2017-02-03 2017-02-03
US62/454,652 2017-02-03
US15/884,136 2018-01-30
US15/884,136 US10210874B2 (en) 2017-02-03 2018-01-30 Multi channel coding
PCT/US2018/016216 WO2018144590A1 (en) 2017-02-03 2018-01-31 Multi channel decoding

Publications (2)

Publication Number Publication Date
CN110249385A true CN110249385A (zh) 2019-09-17
CN110249385B CN110249385B (zh) 2023-05-30

Family

ID=63037342

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880008378.2A Active CN110249385B (zh) 2017-02-03 2018-01-31 多信道解码

Country Status (9)

Country Link
US (1) US10210874B2 (zh)
EP (1) EP3577647B1 (zh)
KR (1) KR102264105B1 (zh)
CN (1) CN110249385B (zh)
AU (1) AU2018217052B2 (zh)
BR (1) BR112019015509A2 (zh)
SG (1) SG11201905527UA (zh)
TW (1) TWI696173B (zh)
WO (1) WO2018144590A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020094263A1 (en) 2018-11-05 2020-05-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1914668A (zh) * 2004-01-28 2007-02-14 皇家飞利浦电子股份有限公司 用于信号时间标度的方法及设备
CN101552006A (zh) * 2009-05-12 2009-10-07 武汉大学 加窗信号mdct域的能量及相位调整方法及其装置
CN101944362A (zh) * 2010-09-14 2011-01-12 北京大学 一种基于整形小波变换的音频无损压缩编码、解码方法
WO2011029984A1 (en) * 2009-09-11 2011-03-17 Nokia Corporation Method, apparatus and computer program product for audio coding
CN102428514A (zh) * 2010-02-18 2012-04-25 杜比实验室特许公司 使用高效下混合的音频解码器和解码方法
US20130028426A1 (en) * 2010-04-09 2013-01-31 Heiko Purnhagen MDCT-Based Complex Prediction Stereo Coding
WO2013186343A2 (en) * 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio
CN105074819A (zh) * 2013-02-20 2015-11-18 弗劳恩霍夫应用研究促进协会” 使用多重叠部分来生成经编码的信号或对经编码的音频信号进行解码的设备及方法
CN105706165A (zh) * 2013-07-22 2016-06-22 弗朗霍夫应用科学研究促进协会 用于多声道音频编码的噪声填充

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE430360T1 (de) 2004-03-01 2009-05-15 Dolby Lab Licensing Corp Mehrkanalige audiodekodierung
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
EP2717262A1 (en) * 2012-10-05 2014-04-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding
EP2720222A1 (en) * 2012-10-10 2014-04-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns
US9607624B2 (en) * 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1914668A (zh) * 2004-01-28 2007-02-14 皇家飞利浦电子股份有限公司 用于信号时间标度的方法及设备
CN101552006A (zh) * 2009-05-12 2009-10-07 武汉大学 加窗信号mdct域的能量及相位调整方法及其装置
WO2011029984A1 (en) * 2009-09-11 2011-03-17 Nokia Corporation Method, apparatus and computer program product for audio coding
CN102428514A (zh) * 2010-02-18 2012-04-25 杜比实验室特许公司 使用高效下混合的音频解码器和解码方法
US20130028426A1 (en) * 2010-04-09 2013-01-31 Heiko Purnhagen MDCT-Based Complex Prediction Stereo Coding
CN101944362A (zh) * 2010-09-14 2011-01-12 北京大学 一种基于整形小波变换的音频无损压缩编码、解码方法
WO2013186343A2 (en) * 2012-06-14 2013-12-19 Dolby International Ab Smooth configuration switching for multichannel audio
CN105074819A (zh) * 2013-02-20 2015-11-18 弗劳恩霍夫应用研究促进协会” 使用多重叠部分来生成经编码的信号或对经编码的音频信号进行解码的设备及方法
CN105706165A (zh) * 2013-07-22 2016-06-22 弗朗霍夫应用科学研究促进协会 用于多声道音频编码的噪声填充

Also Published As

Publication number Publication date
EP3577647B1 (en) 2020-12-16
KR102264105B1 (ko) 2021-06-10
SG11201905527UA (en) 2019-08-27
TWI696173B (zh) 2020-06-11
EP3577647A1 (en) 2019-12-11
AU2018217052B2 (en) 2022-06-30
US10210874B2 (en) 2019-02-19
KR20190111951A (ko) 2019-10-02
US20180226080A1 (en) 2018-08-09
CN110249385B (zh) 2023-05-30
WO2018144590A1 (en) 2018-08-09
BR112019015509A2 (pt) 2020-03-17
AU2018217052A1 (en) 2019-07-11
TW201835896A (zh) 2018-10-01

Similar Documents

Publication Publication Date Title
CA3011741C (en) Encoding of multiple audio signals
JP2019522233A (ja) オーディオ信号間のチャネル間位相差の符号化および復号
CN109328383B (zh) 使用中间采样率的音频解码
US10224042B2 (en) Encoding of multiple audio signals
CN110800051B (zh) 具有时域信道间带宽延展的高频带残值预测
TW201907730A (zh) 時域頻道之間的預測
CN109804430A (zh) 参数音频解码
CN110100280A (zh) 信道间相位差参数的修改
CN110249385A (zh) 多信道解码
TWI724290B (zh) 通信器件,解碼信號之方法,非暫時性電腦可讀媒體及通信裝置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40007489

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant