CN108780649A - 使用宽带对准参数与多个窄带对准参数编码或解码多声道信号的设备及方法 - Google Patents
使用宽带对准参数与多个窄带对准参数编码或解码多声道信号的设备及方法 Download PDFInfo
- Publication number
- CN108780649A CN108780649A CN201780018903.4A CN201780018903A CN108780649A CN 108780649 A CN108780649 A CN 108780649A CN 201780018903 A CN201780018903 A CN 201780018903A CN 108780649 A CN108780649 A CN 108780649A
- Authority
- CN
- China
- Prior art keywords
- signal
- parameter
- channel
- frequency
- sound channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 61
- 238000001228 spectrum Methods 0.000 claims description 84
- 238000004458 analytical method Methods 0.000 claims description 28
- 230000003595 spectral effect Effects 0.000 claims description 16
- 238000003786 synthesis reaction Methods 0.000 claims description 15
- 230000015572 biosynthetic process Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 7
- 125000004122 cyclic group Chemical group 0.000 claims description 6
- 238000011049 filling Methods 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 5
- 241000208340 Araliaceae Species 0.000 claims description 4
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 claims description 4
- 235000003140 Panax quinquefolius Nutrition 0.000 claims description 4
- 235000008434 ginseng Nutrition 0.000 claims description 4
- 238000009432 framing Methods 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 2
- 230000003111 delayed effect Effects 0.000 claims 1
- 230000008569 process Effects 0.000 description 25
- 238000000527 sonication Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 238000003860 storage Methods 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000001914 filtration Methods 0.000 description 4
- 238000005259 measurement Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 230000002123 temporal effect Effects 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000005070 sampling Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000005314 correlation function Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Radar Systems Or Details Thereof (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
- Control Of Eletrric Generators (AREA)
- Emergency Protection Circuit Devices (AREA)
- Mobile Radio Communication Systems (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Stereo-Broadcasting Methods (AREA)
Abstract
用于编码具有至少两个声道的多声道信号的设备,包含:参数确定器(100),用于从多声道信号确定宽带对准参数及多个窄带对准参数;信号对准器(200),用于使用宽带对准参数及多个窄带对准参数对准至少两个声道以获得已对准的声道;信号处理器(300),用于使用已对准的声道计算中间信号及侧边信号;信号编码器(400),用于编码中间信号以获得经编码的中间信号并用于编码侧边信号以获得经编码的侧边信号;及输出接口(500),用于生成经编码的多声道信号,经编码的多声道信号包含经编码的中间信号、经编码的侧边信号、宽带对准参数的信息、及多个窄带对准参数的信息。
Description
技术领域
本申请涉及立体声处理,或大体涉及多声道处理,其中多声道信号具有在立体声信号的情况下的两个声道,如左声道及右声道,或具有多于两个声道,如三、四、五或任何其它数目的声道。
背景技术
相比于立体声音乐的存储及广播,立体声语音及特别是会话式立体声语音受到远较少的科学关注。实际上,在语音通信中,至今仍主要使用单声道传输。然而,随着网络带宽及容量的增加,预期基于立体声技术的通信将变得更普及且将带来更佳的收听体验。
为了高效存储或广播,在音乐的感知音频编码中已对立体声音频材料的高效编码进行长时间研究。在波形保留至关重要的高比特率下,已经长期采用称作中间/侧边(M/S)立体声的和-差立体声。对于低比特率,已经引入强度立体声及最近以来的参数立体声编码。在不同标准中采用最新技术,如HeAACv2及Mpeg USAC。其产生两声道信号的降混并关联紧凑空间边信息。
联合立体声编码通常建立在高频分辨率(即低时间分辨率,信号的时间-频率变换)上,且于是与在大部分语音编码器中执行的低延迟及时域处理不兼容。此外,产生的比特率通常为高。
另一方面,参数立体声采用位于编码器前端的额外滤波器组作为预处理器及位于解码器后端的额外滤波器组作为后处理器。因此,参数立体声可与如ACELP的常规语音编码器一起使用,如在MPEG USAC中进行的那样。此外,听觉场景的参数化可以最少量边信息达成,这适用于低比特率。但如同例如在MPEG USAC中,参数立体声并未被特别设计用于低延迟且不会针对不同会话式情境传递一致的质量。在空间场景的常规参数表示中,立体声影像的宽度被应用于两个合成声道上的解相关器人工复制并受由编码器计算及传输的声道间相干性(IC)参数的控制。对于大部分立体声语音,此种加宽立体声影像的方式不适于重新创建作为相当直接声音的语音的自然环境,原因在于相当直接声音是由位于空间内的特定位置的单个源产生(偶尔具有来自室内的一些混响)。相比之下,乐器具有比语音远更自然的宽度,其可通过将声道解相关而更佳地模拟。
当利用不重合麦克风纪录语音时也会出现问题,如在当麦克风彼此远离或用于双耳纪录或渲染时的A-B配置中。这些情境可被预期用于在电话会议中捕捉语音或用于在多点控制单元(MCU)中以遥远扬声器创建虚拟听觉场景。信号的到达时间从一个声道到另一个声道是不同的,不同于在重合麦克风上进行的纪录,例如X-Y(强度纪录)或M-S(中间-侧边纪录)。该未经时间对准的两个声道的相干性计算则可能被错误地估计,使得人工环境合成失败。
有关立体声处理的先前技术参考文献为专利号为5,434,948或8,811,621的美国专利。
文件WO 2006/089570 A1公开了近透明或透明的多声道编码器/解码器方案。多声道编码器/解码器方案额外产生波形类型残差信号。此残差信号连同一个或多个多声道参数一起被传输至解码器。与纯粹参数多声道解码器相反,加强式解码器由于额外残差信号而产生具有改进输出质量的多声道输出信号。在编码器侧,左声道及右声道两者均由分析滤波器组滤波。然后,对于每个子频带信号,针对子频带计算对准值及增益值。然后在进一步处理之前执行此种对准。在解码器侧,执行去对准及增益处理,然后对应信号被合成滤波器组合成,以便产生经解码的左信号及经解码的右信号。
已发现这些先前技术过程不能为音频信号及特别是在有多于一个扬声器情况下(即在会议情境或会话式语音场景中)语音信号提供优化。
发明内容
本发明的目的在于提供用于编码或解码多声道信号的改进概念。
此目的通过权利要求1的用于编码多声道信号的设备、权利要求20的用于编码多声道信号的方法、权利要求21的用于解码经编码的多声道信号的设备、或权利要求33的用于解码经编码的多声道信号的方法、或权利要求34的计算机程序而达成。
用于编码具有至少两个声道的多声道信号的设备包含:参数确定器,一方面用于确定宽带对准参数及另一方面用于确定多个窄带对准参数。这些参数被信号对准器使用,信号对准器用于使用这些参数对准至少两个声道以获得已对准的声道。然后,信号处理器使用已对准的声道计算中间信号及侧边信号,中间信号及侧边信号随后被编码并转发至经编码的输出信号,该经编码的输出信号额外具有作为参数边信息的宽带对准参数及多个窄带对准参数。
在解码器侧,信号解码器解码经编码的中间信号及经编码的侧边信号以获得经解码的中间及侧边信号。然后这些信号被信号处理器处理用于计算经解码的第一声道及经解码的第二声道。然后使用包括在经编码的多声道信号中的宽带对准参数的信息及多个窄带参数的信息去对准这些经解码的声道以获得经解码的多声道信号。
在特定实施例中,宽带对准参数为声道间时间差参数且多个窄带对准参数为声道间相位差。
本发明基于如下发现:特别对于在有多于一个扬声器情况下的语音信号,但也对于在有多个音频源情况下的其它音频信号,可使用被施加至一个或两个声道的全频谱的诸如声道间时间差参数的宽带对准参数考虑均映射入多声道信号的两个声道的音频源的不同位置。除了此宽带对准参数之外,已发现从子频带到子频带不同的若干窄带对准参数额外地导致信号在两个声道中的更佳对准。
因此,对应于每个子频带中的相同时间延迟的宽带对准连同对应于用于不同子频带的不同相位旋转的相位对准,在两个声道被转换成中间/侧边表示之前,导致该两个声道的优化对准,该中间/侧边表示然后被进一步编码。由于已获得优化对准的事实,一方面,中间信号的能量尽可能地高,另一方面,侧边信号的能量尽可能地小,从而可获得具有最低可能比特率或对于某个比特率具有最高可能音频质量的优化编码结果。
特别地,对于会话式语音材料,典型地扬声器看来似乎在两个不同位置处是活跃的。此外,情况是这样的:通常只有一个扬声器从第一位置说话,及然后第二扬声器从第二位置或地点说话。不同位置对两个声道诸如第一或左声道及第二或右声道上的影响由归因于不同位置的不同到达时间以及因此的两个声道间的某个时间延迟反映,且此时间延迟因时间而异。通常,此影响在两个声道信号中被反映为可通过宽带对准参数处理的宽带去对准。
另一方面,可通过用于个别频带的个别相位对准参数考虑特别是来自混响或进一步噪声源的其它效应,这些参数被叠加在两个声道的宽带不同到达时间或宽带去对准上。
有鉴于此,宽带对准参数及在宽带对准参数之上的多个窄带对准参数的使用导致在编码器侧的用以获得良好且极为紧凑的中间/侧边表示的优化声道对准,而另一方面,在解码器侧的解码之后的对应去对准导致用于某个比特率的良好音频质量或用于某个要求的音频质量的小比特率。
本发明的优点为其提出远比现有立体声编码方案更适合用于立体声语音会话的新颖立体声编码方案。根据本发明,特别是在语音源的情况但也在其它音频源的情况下,特别地利用多声道信号的声道中发生的声道间时间差而组合参数立体声技术及联合立体声编码技术。
多个实施例提供有用的优点,如后面所述。
新颖方法为混合来自于常规M/S立体声及参数立体声的元素的混合办法。在常规M/S中,声道被动地降混以产生中间信号及侧边信号。通过在对声道进行求和及微分之前使用也可被称为主成分分析(PCA)的卡洛南-洛伊变换(KLT)旋转声道可进一步扩展该过程。以主代码编码对中间信号编码,而侧边信号被传递至次编码器。演进M/S立体声可通过在目前或先前帧中编码的中间声道而进一步使用侧边信号的预测。旋转及预测的主要目标为最大化中间信号的能量,同时最小化侧边信号的能量。M/S立体声为波形保留,且就此方面而言,对任何立体声情境是极为稳健的,但就位消耗量而言可能是极为昂贵的。
为了低比特率下的最高效率,参数立体声计算并编码参数,例如,声道间声级差(ILD)、声道间相位差(IPD)、声道间时间差(ITD)及声道间相干性(IC)。这些参数紧密地表示立体声影像且为听觉场景的线索(声源位置、声像(panning)、立体声宽度…)。目标然后为参数化立体声场景及仅编码可位于解码器处并借助于传输的立体声线索再度被空间化的降混信号。
本发明办法混合两种概念。首先,立体声线索ITD及IPD被计算及施加至两个声道上。目标是表示不同频带的宽带的时间差及相位。然后两个声道以时间及相位对准,然后执行M/S编码。发现ITD及IPD对于建模立体声语音是有用的,且是M/S中的基于KLT旋转的良好替代。不同于纯粹参数编码,周围环境不再通过IC建模,反而通过经编码和/或经预测的侧边信号直接建模。已发现此种办法尤其在处理语音信号时更稳健。
ITD的计算及处理为本发明的关键部分。已在先前技术双耳线索编码(BCC)中利用ITD,但一旦ITD随时间改变时该技术是无效率的。为了避免此缺点,设计特定窗口化用于平滑化两个不同ITD间的过渡,且能从一个扬声器无缝切换至在不同位置的另一个扬声器。
进一步实施例涉及下述过程,在编码器侧,使用已经以稍早确定的宽带对准参数对准的声道执行用来确定多个窄带对准参数的参数确定。
对应地,在使用典型地单个宽带对准参数执行宽带去对准之前,执行在解码器侧的窄带去对准。
在进一步实施例中,较佳地,在编码器侧但甚至更要紧地在解码器侧,在全部对准之后,及尤其在使用宽带对准参数的时间对准之后,执行从一个区块至下一区块的某种窗口化及重叠相加操作或任一种交叉衰落。如此避免了当时间或宽带对准参数从区块至区块地改变时的任何可听伪声,如卡嚓声。
在其它实施例中,施加不同频谱分辨率。更具体地,声道信号经受具有高频分辨率的时间-频谱转换,如DFT频谱,而对于具有较低频谱分辨率的参数频带确定参数,如窄带对准参数。典型地,参数频带具有比信号频谱更多一个频谱线,及典型地具有来自DFT频谱的一组频谱线。此外,参数频带从低频增至高频以便考虑心理声学议题。
进一步实施例涉及诸如声级间差的声级(level)参数的额外使用或用于处理诸如立体声填充参数等的侧边信号的其它过程。经编码的侧边信号可由实际侧边信号本身表示,或由使用当前帧或任何其它帧的中间信号执行的预测残差信号表示,或由仅在频带的子集中的侧边信号或侧边预测残差信号及仅用于剩余频带的预测参数表示,或甚至无需高频分辨率侧边信号信息而由用于全部频带的预测参数表示。因此,在如上最后的替代例中,经编码的侧边信号仅由用于每个参数频带或仅参数频带的子集的预测参数表示,使得对于剩余参数频带不存在关于原侧边信号的任何信息。
此外,较佳地,多个窄带对准参数并非用于反映宽带信号的全带宽的全部参数频带而仅用于一组较低频带,如参数频带的较低50%。另一方面,立体声填充参数不被用于数个较低频带,原因在于对于这些频带,侧边信号本身或预测残差信号被传输以便确保至少对于较低频带波形校正表示是可用的。另一方面,对于较高频带,侧边信号并非以波形正确表示传输以便进一步降低比特率,但侧边信号典型地由立体声填充参数表示。
此外,较佳地,基于相同DFT频谱在一个且相同频域内执行整个参数分析及对准。为此,此外,较佳地使用相位变换广义互相关(GCC-PHAT)技术用于声道间时间差确定。在本过程的较佳实施例中,执行基于频谱形状信息(该信息较佳地为频谱平坦度量)的相关频谱的平滑化,以使得在类噪声信号的情况下平滑化将为弱,及在类音调信号的情况下平滑化将变得较强。
此外,较佳地,执行特定相位旋转,其中对声道振幅进行说明。特别地,相位旋转分布在两个声道间,用于编码器侧的对准,及当然,用于解码器侧的去对准,在解码器侧具有较高振幅的声道被视为引导声道且将受相位旋转影响较小,即,相比于具有较低振幅的声道将更少被旋转。
此外,使用利用定标因子的能量定标执行和-差计算,定标因子从两个声道的能量得出,以及此外,受限于某个范围,以便确保中间/侧边计算不会过度影响能量。然而,另一方面,应注意,出于本发明目的,此种能量守恒(energy conservation)不像在先前技术过程中那么重要,因为事先对准时间及相位。因此,归因于从左及右的中间信号及侧边信号的计算(在编码器侧)或归因于从中间及侧边的左及右信号的计算(在解码器侧)的能量起伏波动不像先前技术中那么显著。
附图说明
随后,参考附图讨论本发明的较佳实施例,其中:
图1为用于编码多声道信号的设备的较佳实施例的框图;
图2为用于解码经编码的多声道信号的设备的较佳实施例;
图3为用于某些实施例的不同频率分辨率及其它频率相关方面的例示;
图4a示出为了对准声道而在用于编码的设备中执行的过程的流程图;
图4b示出在频域中执行的过程的较佳实施例;
图4c示出使用具有零填补部分及重叠范围的分析窗口在用于编码的设备中执行的过程的较佳实施例;
图4d示出在用于编码的设备内执行的另外的过程的流程图;
图4e示出显示声道间时间差估计的较佳实施例的流程图;
图5示出流程图,该流程图示出在用于编码的设备中执行的过程的另一实施例;
图6a示出编码器的实施例的框图;
图6b示出解码器的对应实施例的流程图;
图7示出具有低重叠正弦窗口的较佳窗口情境,具有零填补用于立体声时间-频率分析及合成;
图8示出显示不同参数值的比特消耗量的表;
图9a示出较佳实施例中的由用于解码经编码的多声道信号的设备执行的过程;
图9b示出用于解码经编码的多声道信号的设备的较佳实施例;及
图9c示出在经编码的多声道信号的解码情况下在宽带去对准的情况下执行的过程。
具体实施方式
图1示出用于编码具有至少两个声道的多声道信号的设备。多声道信号10一方面被输入参数确定器100且另一方面被输入信号对准器200。参数确定器100从多声道信号一方面确定宽带对准参数及另一方面确定多个窄带对准参数。这些参数经由参数线路12输出。此外,如图所示,这些参数也经由另一参数线路14被输出至输出接口500。在参数线路14上,额外参数如声级参数从参数确定器100被转发至输出接口500。信号对准器200用于使用经由参数线路10接收的宽带对准参数及多个窄带对准参数,对准多声道信号10的至少两个声道,以在信号对准器200的输出处获得已对准的声道20。这些已对准的声道20被转发至信号处理器300,信号处理器300用于从经由线路20接收的已对准的声道计算中间信号31及侧边信号32。用于编码的设备还包含用于编码来自线路31的中间信号及来自线路32的侧边信号以获得线路41上的编码中间信号及线路42上的编码侧边信号的信号编码器400。这些信号均被转发至输出接口500用于在输出线路50处产生经编码的多声道信号。在输出线路50处的经编码的信号包含来自线路41的编码中间信号、来自线路42的编码侧边信号、来自线路14的窄带对准参数及宽带对准参数、以及选择性地,来自线路14的声级参数,以及此外选择性地,由信号编码器400产生并经由参数线路43被转发至输出接口500的立体声填充参数。
较佳地,信号对准器用于在参数确定器100实际上计算窄带参数之前,使用宽带对准参数对准来自多声道信号的声道。因此,在此实施例中,信号对准器200经由连接线15将宽带对准声道发送回参数确定器100。然后,参数确定器100从相对于宽带特性已对准的多声道信号确定多个窄带对准参数。然而,在其它实施例中,无需使用此种特定过程顺序而确定参数。
图4a示出较佳实施例,其中执行引发连接线15的特定步骤顺序。在步骤16中,使用两个声道确定宽带对准参数,并获得宽带对准参数,如声道间时差或ITD参数。然后,在步骤21中,两个声道被图1的信号对准器200使用宽带对准参数加以对准。然后,在步骤17中,使用参数确定器100内的已对准声道确定窄带参数,以确定多个窄带对准参数,如用于多声道信号的不同频带的多个声道间相位差参数。然后,在步骤22中,每个参数频带中的频谱值使用用于此特定频带的对应窄带对准参数加以对准。当针对每个频带在步骤22中执行此过程时,对于每个频带窄带对准参数是可用的,然后对准的第一及第二或左/右声道可用于由图1的信号处理器300进行的进一步信号处理。
图4b示出图1的多声道编码器的又一实施例,其中在频域中执行若干过程。
更具体地,多声道编码器进一步包含时间-频谱转换器150,其用于将时域多声道信号转换成频域内的至少两个声道的频谱表示。
此外,如152处所示,在图1中以100、200及300示出的参数确定器、信号对准器及信号处理器全部操作于频域中。
此外,多声道编码器及,特别地,信号处理器进一步包含用于至少产生中间信号的时域表示的频谱-时间转换器154。
较佳地,频谱-时间转换器额外地也将由块152表示的过程所确定的侧边信号的频谱表示转换成时域表示,且然后,图1的信号编码器400,取决于图1的信号编码器400的特定实施例,用于进一步将中间信号和/或侧边信号编码为时域信号。
较佳地,图4b的时间-频谱转换器150用于实施图4c的步骤155、156及157。特别地,步骤155包含提供在其一端具有至少一个零填补部分的分析窗口,及特别地,例如,具有如在后文中图7所示的在初始窗口部分的零填补部分及在终结窗口部分的零填补部分。此外,分析窗口额外地具有在窗口的第一半处及在窗口的第二半处的重叠范围或重叠部分,及此外,较佳地,视情况而定,中间部分为非重叠范围。
在步骤156中,使用具有重叠范围的分析窗口对每个声道进行窗口化。更具体地,使用分析窗口对每个声道进行窗口化,使得获得声道的第一区块。随后,获得相同声道的具有与第一区块的某个重叠范围的第二区块,等等,使得例如在五次窗口化操作之后,每个声道的五个窗口化样本区块是可用的,然后如图4c中157处所示,每个声道的五个窗口化样本区块被个别被变换成频谱表示。对其它声道也执行相同过程,因而在步骤157结束时,频谱值区块的序列及特别是复合频谱值(如DFT频谱值或复合子频带样本)是可用的。
在由图1的参数确定器100执行的步骤158中,确定宽带对准参数,以及在由图1的信号对准器200执行的步骤159中,使用宽带对准参数执行循环移位。在再次由图1的参数确定器100执行的步骤160中,针对个别频带/子频带确定窄带对准参数,及在步骤161中,使用针对特定频带确定的对应窄带对准参数而对于每个频带旋转已对准的频谱值。
图4d示出由信号处理器300执行的进一步过程。更具体地,信号处理器300用于计算中间信号及侧边信号,如在步骤301所示。在步骤302中,可执行侧边信号的某种进一步处理,及然后在步骤303中,中间信号及侧边信号的每个区块被变换回时域,及在步骤304中,合成窗口被施加至由步骤303获得的每个区块,及在步骤305中,一方面执行用于中间信号的重叠相加操作,及另一方面执行用于侧边信号的重叠相加操作,以最终获得时域中间/侧边信号。
更具体地,步骤304及305的操作导致从中间信号或侧边信号的一个区块至中间信号和侧边信号的下一区块的一种交叉衰落被执行,使得即便当出现任何参数变化时,如出现声道间时间差参数或声道间相位差参数,然而这将在由图4d中的步骤305获得的时域中间/侧边信号中是听不到的。
新颖的低延迟立体声编码为利用一些空间线索的联合中间/侧边(M/S)立体声编码,其中中间声道被主单声道核心编码器编码,及侧边声道在次核心编码器中被编码。编码器及解码器原理在图6a、6b中描绘。
立体声处理主要在频域(FD)中执行。选择性地,在频率分析之前,可在时域(TD)中执行一些立体声处理。对于ITD计算情况是这样,其可在频率分析之前计算及应用,以用于在追求立体声分析及处理之前按时间对准声道。另外,ITD处理可在频域直接进行。由于常见语音编码器如ACELP不含任何内部时间-频率分解,立体声编码在核心编码器之前借助于分析-合成滤波器组增加额外复合经调制的滤波器组及在核心解码器之后增加分析-合成滤波器组的另一阶段。在较佳实施例中,采用具有低重叠区的过取样DFT。然而,在其它实施例中,可使用具有相似的时间分辨率的任何复值的时间-频率分解。
立体声处理包含计算空间线索:声道间时间差(ITD)、声道间相位差(IPD)、及声道间声级差(ILD)。ITD及IPD被用在输入立体声信号上以用于按时间及相位对准两个声道L及R。在宽带或时域中计算ITD,而针对参数频带中的每个或部分计算IPD及ILD,其对应频率空间的非一致分解。一旦两个声道对准,施加联合M/S立体声,然后进一步从中间信号预测侧边信号。预测增益是从ILD得出的。
中间信号被主核心编码器进一步编码。在较佳实施例中,主核心编码器为3GPPEVS标准,或从其得出的可在语音编码模式ACELP与基于MDCT变换的音乐模式间切换的编码。较佳地,ACELP及以基于MDCT的编码器分别受时域带宽扩展(TD-BWE)及或智能间隙填补(IGF)模块的支持。
首先通过中间声道使用从ILD得出的预测增益预测侧边信号。可进一步通过中间信号的延迟版本预测残差,或通过次核心编码器直接编码残差,在较佳实施例中,在MDCT域执行。在编码器的立体声处理可通过图5概述,如后面所述。
图2示出用于解码在输入线路50处接收的经编码的多声道信号的设备的实施例的框图。
更特别地,信号由输入接口600接收。连接至输入接口600的为信号解码器700及信号去对准器900。此外,信号处理器800一方面连接至信号解码器700及另一方面连接至信号去对准器。
更特别地,经编码的多声道信号包含经编码的中间信号、经编码的侧边信号、宽带对准参数的信息、及多个窄带参数的信息。因此,线路50上的经编码的多声道信号可恰为与由图1的输出接口500所输出的相同信号。
然而,要紧地,此处应注意,与图1中所示相反,包括在某种形式的经编码信号中的宽带对准参数及多个窄带对准参数可恰为被图1中的信号对准器200所使用的对准参数,但另外,也可以是其逆值,即,可被恰由信号对准器200执行的相同操作使用但具有逆值以获得去对准的参数。
因此,对准参数的信息可以是如由图1中的信号对准器200使用的对准参数,或可以是其逆值,即,实际“去对准参数”。此外,这些参数典型地以某种形式量化,如后面参考图8所讨论。
图2的输入接口600从经编码的中间/侧边信号分离宽带对准参数及多个窄带对准参数的信息并经由参数线路610将该信息转发至信号去对准器900。另一方面,经编码的中间信号经由线路601被转发至信号解码器700,及经编码的侧边信号经由信号线路602被转发至信号解码器700。
信号解码器用于解码经编码的中间信号及解码经编码的侧边信号以获得线路701上的经解码的中间信号及线路702上的经解码的侧边信号。这些信号被信号处理器800用于从经解码的中间信号及经译码的侧边信号计算经解码的第一声道信号或经解码的左信号及计算经解码的第二声道或经解码的右声道信号,及经解码的第一声道及经解码的第二声道分别在线路801、802上输出。信号去对准器900用于使用宽带对准参数的信息去对准线路801上的经解码的第一声道及经解码的右声道802,及此外使用多个窄带对准参数的信息以获得经解码的多声道信号,即,在线路901及902上具有至少两个已解码且已去对准的声道的解码信号。
图9a示出由图2的信号去对准器900执行的较佳步骤顺序。更具体地,步骤910接收已对准的左及右声道,如从图2的线路801、802上可获得的。在步骤910中,信号去对准器900使用窄带对准参数的信息去对准个别子频带,以便在911a及911b获得经相位去对准的经解码第一及第二或左及右声道,在步骤912中,使用宽带对准参数去对准声道,因此在913a及913b获得经相位及时间去对准的声道。
在步骤914中,执行任何进一步处理,包含使用窗口化或任何重叠相加操作,或通常使用任何交叉衰落操作,以便在915a及915b获得伪声降低的或无伪声的解码信号,即,至没有任何伪声的经解码的声道,然而一方面针对宽带及另一方面针对多个窄带已存在典型地时变去对准参数。
图9b示出图2中所示的多声道解码器的较佳实施例。
特别地,图2的信号处理器800包含时间-频谱转换器810。
此外,信号处理器包含中间/侧边至左/右转换器820以便从中间信号M及侧边信号S计算左信号L及右信号R。
然而,重要地是,为了在块820中通过中间/侧边至左/右转换计算L及R,不一定要使用侧边信号S。相反地,如后面所述,开始只使用从声道间声级差参数ILD得出的增益参数计算左/右信号。一般而言,预测增益也可被视为为ILD的一种形式。增益可从ILD得出,但也可直接计算出。较佳地不再计算ILD,但直接计算预测增益并在解码器中传输且使用预测增益而非ILD参数。
因此,在此实施例中,侧边信号S只用于声道更新器830,如由旁通线路821所示,声道更新器830使用经传输的侧边信号S操作以提供较佳的左/右信号。
因此,转换器820使用经由声级参数输入822获得的声级参数操作,而实际上未使用侧边信号S,但然后声道更新器830使用侧边821,且取决于特定实施例使用经由线路831接收的立体声填充参数操作。然后信号对准器900包含相位去对准器及能量定标器910。能量定标受由定标因子计算器940得出的定标因子控制。声道更新器830的输出馈入定标因子计算器940。基于经由输入911接收的窄带对准参数,执行相位去对准,及在块920中,基于经由线路921接收的宽带对准参数,执行时间去对准。最后,执行频谱-时间转换930以便最终获得解码信号。
图9c示出较佳实施例中的在图9b的块920及930内典型执行的又一步骤顺序。
更具体地,窄带去对准声道被输入对应图9b的块920的宽带去对准功能内。在块931中执行DFT或任何其它变换。实际计算时域样本之后,执行使用合成窗口的选择性合成窗口化。合成窗口较佳地恰与分析窗口相同,或从分析窗口得出(例如,内插或抽样)但以某种方式取决于分析窗口。相依性较佳地为使得对于重叠范围中的每个点由两个重叠窗口界定的乘数因子加和为1。如此,在块932中的合成窗口之后,进行重叠操作及随后相加操作。另外,替代合成窗口化及重叠/相加操作,执行用于每个声道的随后区块间的任何交叉衰落,以便如图9a的上下文中已讨论的获得伪声降低的解码信号。
当考虑图6b时,变得清楚的是,针对中间信号的实际解码操作(即一方面“EVS解码器”),及针对侧边信号的逆向量量化VQ-1及逆MDCT操作(IMDCT)对应图2的信号解码器700。
此外,块810中的DFT操作对应图9b中的元件810,及逆立体声处理及逆时移的功能对应图2的块800、900,及图6b的逆DFT操作930对应图9b中的块930中的对应操作。
接着更详细地讨论图3。特别地,图3示出具有个别频谱线的DFT频谱。较佳地,DFT频谱或图3中所示的任何其它频谱为复合频谱,及每个线为具有振幅及相位或具有实部及虚部的复频谱线。
此外,频谱也被划分成不同参数频带。每个参数频带具有至少一个及较佳地多于一个频谱线。此外,参数频带从较低频增至较高频。典型地,宽带对准参数为用于整个频谱,即用于包含图3中的示例实施例中的全部频带1至6的频谱的单个宽带对准参数。
此外,提供多个窄带对准参数,使得对于每个参数频带有单个对准参数。这表示用于频带的对准参数总是适用于对应频带内的全部频谱值。
此外,除了窄带对准参数之外,声级参数也被提供给每个参数频带。
与为频带1至频带6的每个及每个参数频带提供声级参数相比,较佳地只提供多个窄带对准参数给有限数目的较低频带,如频带1、2、3及4。
此外,立体声填充参数被提供给某个数目的频带,较低频带除外,如在示例实施例中,提供给频带4、5及6,但存在用于较低参数频带1、2及3的侧边信号频谱值,且因此,针对这些较低频带不存在立体声填充参数,使用侧边信号本身或表示侧边信号的预测残差信号获得波形匹配。
如已描述,如在图3中的实施例中,在较高频带中存在有更多频谱线,参数频带6中有七条频谱线而参数频带2中仅有三条频谱线。然而,当然,参数频带数目、频谱线数目、及参数频带内的频谱线数目、及针对某些参数的不同限值将为不同。
然而,图8示出某个实施例中的参数的分布及被提供以参数的频带数目,在该实施例中与图3相比,实际存在12个频带。
如图所示,提供声级参数ILD给12个频带中的每个,且声级参数被量化至由每频带五比特表示的量化准确度。
此外,窄带对准参数IPD只被提供给较低频带上至2.5kHz的更宽频率。此外,声道间时间差或宽带对准参数只被提供作为全频谱的单个参数,但针对全频带具有由8比特表示的极高量化准确度。
此外,提供相当粗略量化的立体声填充参数,由每频带3比特表示,且并非用于低于1kHz的较低频带,因为对于较低频带包括实际编码的侧边信号或侧边信号残差频谱值。
随后,关于图5概述在编码器侧的较佳处理。在第一步骤中,执行左及右声道的DFT分析。该过程对应图4c的步骤155至157。在步骤158中,计算宽带对准参数,及特别地较佳的宽带对准参数声道间时间差(ITD)。如在170中所示,执行频域中的L及R的时移。另外,也在时域中执行此种时移。然后执行逆DFT,在时域中执行时移,及执行额外正DFT以便在使用宽带对准参数的对准之后再次具有频谱表示。
在经移位的L及R表示上为每个参数频带计算ILD参数,即声级参数及相位参数(IPD参数),如步骤171所示。此步骤例如对应图4c的步骤160。依据声道间相位差参数的函数旋转时移的L及R表示,如图4c的步骤161或图5所示。接着,如步骤301中所示,计算中间及侧边信号,及较佳地,额外有能量转换操作,如后面所述。在随后步骤174中,利用作为ILD的函数的M及选择性地利用过去的M信号,即稍早帧的中间信号,执行S的预测。接着,执行中间信号及侧边信号的逆DFT,其对应较佳实施例中图4d的步骤303、304、305。
在最后步骤175中,时域中间信号m及选择性地,残差信号如步骤175中所示的被编码。此过程对应由图1中的信号编码器400执行的过程。
在逆立体声处理中,在解码器处,侧边(Side)信号在DFT域中产生,且首先从中间(Mid)信号预测为:
其中g为针对每个参数频带计算的增益且为传输的声道间声级差(ILD)的函数。
然后,预测残差Side-g·Mid可以两种不同方式精炼:
--通过残差信号的次编码:
其中gcod为针对全频谱传输的全局增益。
--通过残差预测,也称作立体声填充,以来自前一DFT帧的先前解码中间信号频谱预测残差侧边频谱:
其中gpred为每参数频带传输的预测增益。
在相同DFT频谱内可混合两种编码精炼。在较佳实施例中,残差编码应用于较低参数频带,而残差预测应用于剩余频带。在如图1中描绘的较佳实施例中,在时域中合成残差侧边信号及通过MDCT对其进行变换之后在MDCT域执行残差编码。不同于DFT,MDCT是关键取样的且更适用于音频编码。MDCT系数通过格型向量量化而被直接地向量量化,但可选地可由被熵编码器跟随的标量量化器编码。可选地,残差侧边信号也在时域中通过语音编码技术被编码,或在DFT域被直接编码。
1.时间-频率分析:DFT
重要的是,来自由DFT进行的立体声处理的额外时间-频率分解允许良好听觉场景分析,而不会显著增加编码系统的总延迟。在默认情况下,使用10毫秒(核心编码器的20毫秒成帧的两倍)的时间分辨率。分析及合成窗口是相同且对称的。窗口在图7中以16kHz的取样率表示。可观察到,重叠区受限用以减少造成的延迟,及当在频域中应用ITD时,也加入零填补以逆平衡循环移位,如后面所述。
2.立体声参数
立体声参数最大可以立体声DFT的时间分辨率传输。最小可减少至核心编码器的成帧分辨率,即20毫秒。在默认情况下,当未检测到瞬态时,跨2个DFT窗口每20毫秒计算参数。参数频带构成遵循大致为等效矩形带宽(ERB)的两倍或四倍的频谱的非一致且非重叠分解。在默认情况下,4倍ERB标度被用于16kHz频率带宽的共12个频带(32kbps取样率,超宽带立体声)。图8概述配置的示例,对此立体声边信息以约5kbps传输。
3.ITD的计算及声道时间对准
通过使用相位变换广义互相关(GCC-PHAT)估计到达时间延迟(TDOA)计算ITD:
其中L及R分别为左及右声道的频谱。可与用于随后立体声处理的DFT相独立地执行或可分享频率分析。用于计算ITD的伪码如下:
图4e示出用于实施稍早示出的伪码的流程图,以便获得作为宽带对准参数的示例的声道间时间差的稳健有效的计算。
在块451中,执行针对第一声道(l)及第二声道(r)的时域信号的DFT分析。此DFT分析典型地将为例如与图5或图4c的步骤155至157的上下文中已经讨论的相同的DFT分析。
针对每频率仓执行互相关,如块452中所示。
因此,针对左及右声道的全频谱范围获得互相关频谱。
在步骤453中,然后从L及R的振幅频谱计算频谱平坦度量,及在步骤454中,选取较大的频谱平坦度量。然而,在步骤454中的选择并非必需是选择较大者,而从两个声道的单个SFM的确定也可以是只有左声道或只有右声道的计算及选择,或可以是两个SFM值的加权平均的计算。
在步骤455中,依据频谱平坦度量,然后互相关频谱随着时间而被平滑化。
较佳地,通过振幅频谱的几何平均除以振幅频谱的算术平均计算频谱平坦度量。如此,SFM值限于0至1间。
在步骤456中,然后平滑化的互相关频谱通过其振幅而被归一化,及在步骤457中,计算已归一化的平滑化的互相关频谱的逆DFT。在步骤458中,较佳地执行某个时域滤波,但取决于实施例,也可不考虑此时域滤波但将其视为较佳的,如后面所述。
在步骤459中,通过滤波广义互相关函数的峰值拾取及通过执行某个阈值化操作而执行ITD估计。
若未获得某个阈值,则IDT被设定为零,且对此对应区块不执行时间对准。
ITD计算也可概述如下。取决于频谱平坦度量,在被平滑化之前,在频域中计算互相关。SFM限于0至1间。在类噪声信号的情况下,SFM将为高(即,约1)且平滑化将为弱。在类音调信号的情况下,SFM将为低且平滑化将变强。然后,在变换回时域之前,平滑化的互相关通过其幅值而被归一化。归一化对应互相关的相位变换,且已知在低噪声及相对高混响环境中,显示比正常互相关更佳的性能。如此得到的时域函数首先被滤波以达成更稳健的峰值峰化。对应最大振幅的索引对应左及右声道间的时间差(ITD)的估计。若最大振幅低于给定阈值,则ITD的估计视为不可靠且被设定为零。
若在时域中施加时间对准,则在分离的DFT分析中计算ITD。如下地进行移位:
要求在编码器的额外延迟,其至多等于可处理的最大绝对ITD。ITD随时间的变化通过DFT的分析窗口化而被平滑化。
可选地,可在频域中执行时间对准。在此种情况下,ITD计算及循环移位在相同DFT域中,与此另一个立体声处理分享的域。循环移位通过下式给定:
需要DFT窗口的零填补来以循环移位模拟时移。零填补的大小对应可处理的最大绝对ITD。在较佳实施例中,通过将3.125毫秒的零加在两端,零填补均匀地分裂在分析窗口两侧。ITD最大可能绝对值则为6.25毫秒。在A-B麦克风设置中,其对应两个麦克风间约2.15米的最大距离的最恶劣情况。ITD随时间的变化通过合成窗口化及DFT的重叠相加而被平滑化。
重要的是,时移之后为已移位信号的窗口化。这是与先前技术双耳线索编码(BCC)的主要区别,时移被施加至窗口化信号上,但在合成阶段不被进一步窗口化。因此,ITD随时间的任何变化在解码信号中产生伪声瞬态/卡嚓声。
4.IPD的计算及声道旋转
在时间对准两个声道之后,计算IPD,及依赖于立体声配置,此用于每个参数频带或至少上至给定ipd_max_band。
然后,IPD应用于两个声道用以对准其相位:
其中β=atan2(sin(IPDi[b])、cos(IPDi[b])+c)、及b为频率索引k所属的参数频带索引。参数β负责在两个声道间分布相位旋转量同时使其相位对准。β依赖于IPD但也依赖于声道的相对振幅声级ILD。若声道具有较高振幅,则将被视为引导声道且比具有较低振幅的声道将较少地受相位旋转的影响。
5.和-差及侧边信号编码
对两个声道的经时间及相位对准的频谱执行和差变换,使得能量保存在中间信号。
其中限于1/1.2与1.2间,即-1.58与+1.58db。当调整M及S的能量时,此限制避免了伪声。值得注意的是,当时间及相位经事先对准时,此种能量守恒较不重要。可选地,界限可增大或减小。
进一步以M预测侧边信号S:
S′(f)=S(f)-g(ILD)M(f)
其中其中可选地,通过最小化残差及由先前方程式推出的ILD的均方差(MSE)可找到最佳预测增益g。
残差信号S’(f)可通过两种手段建模:以M的延迟频谱对其进行预测,或在MDCT域中直接在MDCT域对其进行编码。
6.立体声解码
中间信号X及侧边信号S首先被转换成左及右声道L及R如下:
Li[k]=Mi[k]+gMi[k],对于band_limits[b]≤k<band_limits[b+1]
Ri[k]=Mi[k]-gMi[k],对于band_limits[b]≤k<band_limits[b+1]
其中每参数频带增益g从ILD参数得出:
其中
针对低于cod_max_band的参数频带,以经解码的侧边信号更新两个声道:
Li[k]=Li[k]+cod_gaini·Si[k],对于0≤k<band_limits[cod_max_band]
Ri[k]=Ri[k]-cod_gaini·Si[k],对于0≤k<band_limits[cod_max_band]
针对较高参数频带,侧边信号被预测且声道被更新为:
Li[k]=Li[k]+cod_predi[b]·Mi-1[k],对于band_limits[b]≤k<band_limits[b+1]
Ri[k]=Ri[k]-cod_predi[b]·Mi-1[k],对于band_limits[b]≤k<band_limits[b+1]
最后,声道乘以复值,目标在于恢复立体声信号的原能量及声道间相位:
Li[k]=a·ej2πβ·Li[k]
其中
其中a如先前所定义地定义并限定,及其中β=atan2(sin(IPDi[b]),cos(IPDi[b])+c),及其中atan2(x,y)为x对y的四象限反正切。
最后,依赖于被传输的ITD,在时域或频域中时移声道。通过逆DFT及重叠相加合成时域声道。
本发明的特定特征涉及空间线索与和-差联合立体声编码的组合。更具体地,空间线索IDT及IPD被计算并应用于立体声声道(左及右)上。此外,和-差(M/S信号)被计算,及较佳地,以M进行S的预测。
在解码器侧,连同和-差联合立体声编码组合宽带及窄带空间线索。更特别地,使用至少一个空间线索如ILD利用中间信号预测侧边信号,及计算逆和-差以获得左及右声道,及此外,宽带及窄带空间线索被应用于左及右声道上。
较佳地,在使用ITD处理后,编码器具有关于经时间对准的声道的窗口和重叠-相加。此外,在应用声道间时间差之后,解码器额外具有经移位或经去对准的声道版本的窗口化及重叠-相加操作。
利用GCC-Phat方法的声道间时间差的计算是特别稳健的方法。
新颖过程对于先前技术是有益的,原因在于以低延迟达成立体声音频或多声道音频的比特率编码。该过程被特别地设计以对于输入信的不同性质及多声道或立体声纪录的不同设置是稳健的。特别地,本发明为比特率立体声语音编码提供良好质量。
较佳过程可用于全部类型立体声或多声道音频内容(如语音及音乐等)的广播的分布以给定低比特率具有恒定感官品质。此种应用领域为数字无线电、因特网串流、或音频通信应用。
所发明的编码音频信号可存储于数字存储介质或非瞬时存储介质上,或可在如无线传输介质或有线传输介质(如因特网)的传输介质上传输。
虽然一些方面已经在设备的上下文中描述,显然这些方面也表示对应方法的描述,其中块或装置对应方法步骤或方法步骤的特征。类似地,在方法步骤的上下文中描述的方面也表示对应设备的对应块或项或特征的描述。
取决于某些实施例要求,本发明的实施例可以硬件或软件实施。可使用其上存储有电子可读控制信号的数字存储介质(例如软盘、DVD、CD、ROM、PROM、EPROM、EEPROM或FLASH存储器)执行实施,电子可读控制信号与可编程计算机系统协作(或能协作,使得执行相应的方法。
依据本发明的一些实施例包含一种具有电子可读控制信号的数据载体,电子可读控制信号可与可编程计算机系统协作,使得执行本文描述的方法之一。
概略言之,本发明的实施例可被实施为具有程序代码的计算机程序产品,当计算机程序产品在计算机上运行时,程序代码可操作用于执行方法之一。程序代码例如可存储在机器可读取载体上。
其它实施例包含存储于机器可读取载体上或非瞬时存储介质上的用于执行本文描述的方法之一的计算机程序。
换言之,因此,本发明方法的实施例为具有程序代码的计算机程序,当计算机程序在计算机上运行时,程序代码用于执行本文描述的方法之一。
因此,本发明方法的进一步实施例为包含用于执行本文描述的方法之一的计算机程序纪录于其上的数据载体(或数字存储介质,或计算机可读介质)。
因此,本发明方法的进一步实施例为表示用于执行本文描述的方法之一的计算机程序的数据流或信号序列。该数据流或信号序列例如可被配置为经由数据通信连接(例如经由因特网)而被传送。
又一实施例包含处理构件,例如计算机,或可编程逻辑设备,其被配置为或适于执行本文描述的方法之一。
又一实施例包含具有安装于其上的用于执行本文描述的方法之一的计算机程序的计算机。
在一些实施例中,可使用编程逻辑设备(例如,现场可编程门阵列)执行本文描述的方法的部分或全部功能。在一些实施例中,现场可编程门阵列可与微处理器协作以便执行本文描述的方法之一。通常,这些方法较佳地由任何硬件设备执行。
前述实施例仅用于说明本发明的原理。应当理解的是,本文描述的布置及细节的修改及变化对于本领域的其他技术人员将是显而易见的。因此,其意图仅受随附的专利权利要求范围所限,而不受此处实施例的描述及解释给出的特定细节所限。
Claims (34)
1.一种用于编码具有至少两个声道的多声道信号的设备,包含:
参数确定器(100),用于从多声道信号确定宽带对准参数及多个窄带对准参数;
信号对准器(200),用于使用所述宽带对准参数及所述多个窄带对准参数对准所述至少两个声道以获得已对准的声道;
信号处理器(300),用于使用所述已对准的声道计算中间信号及侧边信号;
信号编码器(400),用于编码所述中间信号以获得经编码的中间信号并用于编码所述侧边信号以获得经编码的侧边信号;及
输出接口(500),用于生成经编码的多声道信号,所述经编码的多声道信号包括所述经编码的中间信号、所述经编码的侧边信号、所述宽带对准参数的信息、以及所述多个窄带对准参数的信息。
2.如权利要求1所述的设备,
其中所述参数确定器(100)用于使用所述至少两个声道的宽带表示确定所述宽带对准参数,所述宽带表示包括所述至少两个声道中的每个的至少两个子频带,及
其中所述信号对准器(200)用于执行所述至少两个声道的宽带表示的宽带对准以获得所述至少两个声道的经对准的宽带表示。
3.如权利要求1或2所述的设备,
其中所述参数确定器(100)用于确定用于所述至少两个声道的经对准的宽带表示的至少一个子频带的单独窄带对准参数,及
其中所述信号对准器(200)用于使用用于对应子频带的窄带参数各个地对准所述经对准的宽带表示的每个子频带以获得包括用于所述至少两个声道中的每个的多个经对准的子频带的经对准的窄带表示。
4.如前述权利要求中任一项所述的设备,
其中所述信号处理器(300)用于使用用于所述至少两个声道中的每个的多个经对准的子频带计算用于所述中间信号的多个子频带及用于所述侧边信号的多个子频带。
5.如前述权利要求中任一项所述的设备,
其中所述参数确定器(100)用于针对所述多声道信号的多个子频带中的每个计算声道间时间差参数作为所述宽带对准参数或计算声道间相位差作为所述多个窄带对准参数。
6.如前述权利要求中任一项所述的设备,
其中所述参数确定器(100)用于针对所述多声道信号的多个子频带中的每个计算预测增益或声道间声级差,及
其中所述信号编码器(400)用于使用子频带中的中间信号并使用所述子频带的声道间声级差或预测增益执行所述子频带中的侧边信号的预测。
7.如前述权利要求中任一项所述的设备,
其中所述信号编码器(400)用于计算并编码从所述侧边信号得出的预测残差信号、至少两个声道间的预测增益或声道间声级差、所述中间信号及经延迟的中间信号,或其中使用子频带中的至少两个声道间的声道间声级差计算所述子频带中的预测增益,或
其中所述信号编码器用于使用语音编码器或切换的音乐/语音编码器或时域带宽扩展编码器或频域间隙填充编码器编码所述中间信号。
8.如前述权利要求中任一项所述设备,进一步包括:
时间-频谱转换器(150),用于生成频谱域中的所述至少两个声道的频谱表示,
其中所述参数确定器(100)及所述信号对准器(150)及所述信号处理器(300)用于在频谱域中操作,及
其中所述信号处理器(300)更进一步包括用于生成所述中间信号的时域表示的频谱-时间转换器(154),及
其中所述信号编码器(400)用于编码所述中间信号的时域表示。
9.如前述权利要求中任一项所述的设备,
其中所述参数确定器(100)用于使用频谱表示计算所述宽带对准参数,
其中所述信号对准器(200)用于使用所述宽带对准参数将循环移位(159)施加至所述至少两个声道的频谱表示以获得用于所述至少两个声道的宽带经对准的频谱值,或
其中所述参数确定器(100)用于从所述宽带经对准的频谱值计算所述多个窄带对准参数,及
其中所述信号对准器(200)用于使用所述多个窄带对准参数旋转(161)所述宽带经对准的频谱值。
10.如权利要求8或9所述的设备,
其中所述时间-频谱转换器(150)用于将分析窗口施加至所述至少两个声道中的每个,其中所述分析窗口在其左侧或右侧具有零填补部分,其中所述零填补部分确定所述宽带对准参数的最大值或
其中所述分析窗口具有首重叠区、中间非重叠区、及尾重叠区或
其中所述时间-频谱转换器(150)用于施加重叠窗口的序列,其中窗口的重叠部分的长度与所述窗口的非重叠部分的长度一起等于所述信号编码器(400)的成帧分数。
11.如权利要求8至10中任一项所述的设备,
其中所述频谱-时间转换器(154)用于使用合成窗口,所述合成窗口与由所述时间-频谱转换器(150)使用的分析窗口相同或从所述分析窗口得出。
12.如前述权利要求中任一项所述的设备,
其中所述信号处理器(300)用于计算所述中间信号或所述侧边信号的时域表示,其中计算所述时域表示包括:
窗口化(340)所述中间信号或所述侧边信号的样本的当前区块以获得窗口化的当前区块,
窗口化(340)所述中间信号或所述侧边信号的样本的随后区块以获得窗口化的随后区块,及
将重叠范围中的所述窗口化的当前区块的样本与所述窗口化的随后区块的样本相加(350)以获得针对所述重叠范围的时域表示。
13.如前述权利要求中任一项所述的设备,
其中所述信号编码器(400)用于编码第一集合的子频带中的侧边信号或从所述侧边信号得出的预测残差信号以及所述第一集合的子频带中的中间信号,并用于在与所述第一集合的子频带不同的第二集合的子频带中编码稍早的增益参数得出的侧边信号以及中间信号,
其中未针对所述第二集合的子频带编码侧边信号或预测残差信号。
14.如权利要求13所述的设备,
其中所述第一集合的子频带具有频率比所述第二集合的子频带中的频率更低的子频带。
15.如前述权利要求中任一项所述的设备,
其中所述信号编码器(400)用于使用MDCT变换及量化,如侧边信号的MDCT系数的向量或标量或任何其它量化,编码所述侧边信号。
16.如前述权利要求中任一项所述的设备,
其中所述参数确定器(100)用于针对具有带宽的个别频带确定所述多个窄带对准参数,其中具有第一中心频率的第一频带的第一带宽低于具有第二中心频率的第二频带的第二带宽,其中所述第二中心频率大于所述第一中心频率或
其中所述参数确定器(100)仅针对上至边界频率的频带确定窄带对准参数,所述边界频率低于所述中间信号或所述侧边信号的最大频率,及
其中所述对准器(200)用于使用所述宽带对准参数仅对准具有高于所述边界频率的频率的子频带中的至少两个声道及使用所述宽带对准参数及窄带对准参数对准具有低于所述边界频率的频率的子频带中的至少两个声道。
17.如前述权利要求中任一项所述的设备,
其中所述参数确定器(100)用于通过使用广义互相关估计到达时间延迟计算所述宽带对准参数,及其中所述信号对准器(200)用于使用时移在时域中或使用循环移位在频域中施加宽带对准参数,或
其中所述参数确定器(100)用于使用以下步骤计算宽带参数:
计算(452)第一声道与第二声道间的互相关频谱;
为所述第一声道或所述第二声道或两个声道计算(453,454)频谱形状的信息;
取决于所述频谱形状的信息平滑化(455)所述互相关频谱;
选择性地归一化(456)经平滑化的互相关频谱;
确定(457,458)经平滑化且选择性地归一化的互相关频谱的时域表示;及
分析(459)所述时域表示以获得声道间时间差作为所述宽带对准参数。
18.如前述权利要求中任一项所述的设备,
其中所述信号处理器(300)用于使用能量定标因子计算所述中间信号及所述侧边信号及其中所述能量定标因子受限于至多2与至少0.5之间,或
其中所述参数确定器(100)用于通过确定频带内的第一声道及第二声道的频谱值的积的复数和的角度而计算用于所述频带的归一化对准参数,或
其中所述信号对准器(200)用于执行窄带对准使得所述第一声道及第二声道均经受声道旋转,其中具有较高振幅的声道的声道旋转以比具有较小振幅的声道更小的程度被旋转。
19.一种用于编码具有至少两个声道的多声道信号的方法,包括:
从多声道信号确定(100)宽带对准参数及多个窄带对准参数;
使用所述宽带对准参数及所述多个窄带对准参数对准(200)至少两个声道以获得已对准的声道;
使用所述已对准的声道计算(300)中间信号及侧边信号;
编码(400)所述中间信号以获得经编码的中间信号并编码所述侧边信号以获得经编码的侧边信号;及
生成(500)经编码的多声道信号,所述经编码的多声道信号包括所述经编码的中间信号、所述经编码的侧边信号、所述宽带对准参数的信息、及所述多个窄带对准参数的信息。
20.一种经编码的多声道信号,包括经编码的中间信号、经编码的侧边信号、宽带对准参数的信息、及多个窄带对准参数的信息。
21.一种用于解码包括经编码的中间信号、经编码的侧边信号、宽带对准参数的信息、及多个窄带对准参数的信息的经编码的多声道信号的设备,包括:
信号解码器(700),用于解码经编码的中间信号以获得经解码的中间信号并用于解码经编码的侧边信号以获得经解码的侧边信号;
信号处理器(800),用于从所述经解码的中间信号及所述经解码的侧边信号计算经解码的第一声道及经解码的第二声道;及
信号去对准器(900),用于使用所述宽带对准参数的信息及所述多个窄带对准参数的信息去对准所述经解码的第一声道及所述经解码的第二声道以获得经解码的多声道信号。
22.如权利要求21所述的设备,
其中所述信号去对准器(900)用于使用与对应子频带相关联的窄带对准参数去对准所述经解码的第一声道及经解码的第二声道的多个子频带中的每个以获得用于所述第一声道及第二声道的经去对准的子频带,及
其中所述信号去对准器用于使用所述宽带对准参数的信息去对准第一及第二经解码的声道的经去对准的子频带的表示。
23.如权利要求21或22所述的设备,
其中所述信号去对准器(900)用于使用以下步骤计算所述经解码的第一声道或经解码的第二声道的时域表示:
窗口化左声道或右声道的样本的当前区块以获得窗口化的当前区块,
窗口化所述第一声道及所述第二声道的样本的随后区块以获得窗口化的随后区块,及
将重叠范围中的所述窗口化的当前区块的样本及所述窗口化的随后区块的样本相加以获得针对所述重叠范围的时域表示。
24.如权利要求21至23中任一项所述的设备,
其中所述信号去对准器(900)用于针对具有带宽的个别子频带施加多个个别窄带对准参数的信息,其中具有第一中心频率的第一频带的第一带宽低于具有第二中心频率的第二频带的第二带宽,其中所述第二中心频率大于所述第一中心频率,或
其中所述信号去对准器用于仅针对上至边界频率的频带施加用于个别频带的多个个别窄带对准参数的信息,所述边界频率低于第一经解码的声道或第二经解码的声道的最大频率,及
其中所述信号去对准器(900)用于使用所述宽带对准参数的信息仅去对准具有高于所述边界频率的频率的子频带中的至少两个声道并使用所述宽带对准参数的信息及使用所述窄带对准参数的信息去对准具有低于所述边界频率的频率的子频带中的至少两个声道。
25.如权利要求21至24中任一项所述的设备,
其中所述信号处理器(800)包括:
时间-频谱转换器(810),用于计算所述经解码的中心信号和经解码的侧边信号的频域表示,
其中所述信号处理器(800)用于在频域中计算所述经解码的第一声道及所述经解码的第二声道,及
其中所述信号去对准器包括频谱-时间转换器(930),所述频谱-时间转换器(930)用于将仅使用所述多个窄带对准参数的信息或使用所述多个窄带对准参数且使用所述宽带对准参数的信息而对准的信号转换至时域。
26.如权利要求21至25中任一项所述的设备,
其中所述信号去对准器(900)用于使用所述宽带对准参数的信息执行时域中的去对准并使用经时间对准的声道的时间随后区块执行窗口化操作(932)或重叠及相加操作(933),或
其中所述信号去对准器(900)用于使用所述宽带对准参数的信息执行频谱域中的去对准并使用经去对准的声道执行频谱-时间转换(931)并使用经去对准的声道的时间随后区块执行合成窗口化(932)和重叠及相加操作(933)。
27.如前述权利要求中任一项所述的设备,
其中所述信号解码器用于生成时域中间信号及时域侧边信号,
其中所述信号处理器(800)用于使用分析窗口执行窗口化以生成用于所述中间信号或所述侧边信号的经窗口化的样本的随后区块,
其中所述信号处理器包括时间-频谱转换器(810),所述时间-频谱转换器(810)用于转换时间-随后区块以获得频谱值的随后区块;及
其中所述信号去对准器(900)用于使用所述窄带对准参数的信息及所述宽带对准参数的信息对频谱值的区块执行去对准。
28.如权利要求21至27中任一项所述的设备,
其中经编码的信号包括多个预测增益或声级参数,
其中所述信号处理器(800)用于使用所述中间声道的频谱值及用于与所述频谱值相关联(820)的频带的预测增益或声级参数及通过使用经解码的侧边信号(830)的频谱值计算左声道及右声道的频谱值。
29.如权利要求21至28中任一项所述的设备,
其中所述信号处理器(800)用于使用用于与频谱值相关联(830)的频带的立体声填充参数计算左声道及右声道的频谱值。
30.如权利要求21至29中任一项所述的设备,
其中所述信号去对准器(900)或所述信号处理器(800)用于使用定标因子对频带执行能量定标(910),其中所述定标因子取决于(920)经解码的中间信号及经解码的侧边信号的能量,及
其中所述定标因子受限于至多2.0与至少0.5之间。
31.如权利要求28至30中任一项所述的设备,
其中所述信号处理器(800)用于使用从所述声级参数得出的增益因子计算左声道及右声道的频谱值,其中所述增益因子是使用非线性函数从所述声级参数得出的。
32.如权利要求21至31中任一项所述的设备,
其中所述信号去对准器(900)用于使用第一声道及第二声道的频谱值的旋转使用用于声道的所述窄带对准参数的信息去对准经解码的第一声道及经解码的第二声道的频带,其中具有较高振幅的一个声道的频谱值相比于具有较低振幅的另一声道的频带的频谱值更少地被旋转。
33.一种用于解码包括经编码的中间信号、经编码的侧边信号、宽带对准参数的信息、及多个窄带对准参数的信息的经编码的多声道信号的方法,包括:
解码(700)经编码的中间信号以获得经解码的中间信号并解码经编码的侧边信号以获得经解码的侧边信号;
从所述经解码的中间信号及所述经解码的侧边信号计算(800)经解码的第一声道及经解码的第二声道;及
使用所述宽带对准参数的信息及所述多个窄带对准参数的信息去对准(900)所述经解码的第一声道及所述经解码的第二声道以获得经解码的多声道信号。
34.一种计算机程序,当在计算机或处理器上运行时,用于执行如权利要求19所述的方法或如权利要求33所述的方法。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP16152450 | 2016-01-22 | ||
EP16152453 | 2016-01-22 | ||
EP16152453.3 | 2016-01-22 | ||
EP16152450.9 | 2016-01-22 | ||
PCT/EP2017/051205 WO2017125558A1 (en) | 2016-01-22 | 2017-01-20 | Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108780649A true CN108780649A (zh) | 2018-11-09 |
CN108780649B CN108780649B (zh) | 2023-09-08 |
Family
ID=57838406
Family Applications (6)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780002248.3A Active CN107710323B (zh) | 2016-01-22 | 2017-01-20 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
CN201780019674.8A Active CN108885879B (zh) | 2016-01-22 | 2017-01-20 | 使用帧控制同步来编码或解码多声道音频信号的装置和方法 |
CN202210761486.5A Pending CN115148215A (zh) | 2016-01-22 | 2017-01-20 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
CN201780018898.7A Active CN108885877B (zh) | 2016-01-22 | 2017-01-20 | 用于估计声道间时间差的设备及方法 |
CN201780018903.4A Active CN108780649B (zh) | 2016-01-22 | 2017-01-20 | 使用宽带对准参数与多个窄带对准参数编码或解码多声道信号的设备及方法 |
CN202311130088.4A Pending CN117238300A (zh) | 2016-01-22 | 2017-01-20 | 使用帧控制同步来编码或解码多声道音频信号的装置和方法 |
Family Applications Before (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201780002248.3A Active CN107710323B (zh) | 2016-01-22 | 2017-01-20 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
CN201780019674.8A Active CN108885879B (zh) | 2016-01-22 | 2017-01-20 | 使用帧控制同步来编码或解码多声道音频信号的装置和方法 |
CN202210761486.5A Pending CN115148215A (zh) | 2016-01-22 | 2017-01-20 | 使用频谱域重新取样来编码或解码音频多通道信号的装置及方法 |
CN201780018898.7A Active CN108885877B (zh) | 2016-01-22 | 2017-01-20 | 用于估计声道间时间差的设备及方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311130088.4A Pending CN117238300A (zh) | 2016-01-22 | 2017-01-20 | 使用帧控制同步来编码或解码多声道音频信号的装置和方法 |
Country Status (20)
Country | Link |
---|---|
US (7) | US10535356B2 (zh) |
EP (5) | EP3405951B1 (zh) |
JP (10) | JP6412292B2 (zh) |
KR (4) | KR102230727B1 (zh) |
CN (6) | CN107710323B (zh) |
AU (5) | AU2017208580B2 (zh) |
BR (4) | BR112017025314A2 (zh) |
CA (4) | CA3011914C (zh) |
ES (4) | ES2727462T3 (zh) |
HK (1) | HK1244584B (zh) |
MX (4) | MX2018008887A (zh) |
MY (4) | MY189205A (zh) |
PL (4) | PL3284087T3 (zh) |
PT (3) | PT3405949T (zh) |
RU (4) | RU2705007C1 (zh) |
SG (3) | SG11201806241QA (zh) |
TR (1) | TR201906475T4 (zh) |
TW (4) | TWI629681B (zh) |
WO (4) | WO2017125559A1 (zh) |
ZA (3) | ZA201804625B (zh) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9773505B2 (en) * | 2008-09-18 | 2017-09-26 | Electronics And Telecommunications Research Institute | Encoding apparatus and decoding apparatus for transforming between modified discrete cosine transform-based coder and different coder |
EP3405951B1 (en) | 2016-01-22 | 2019-11-13 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
CN107731238B (zh) * | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
BR112019009315A2 (pt) | 2016-11-08 | 2019-07-30 | Fraunhofer Ges Forschung | aparelho e método para mixagem de redução ou mixagem de aumento de um sinal de múltiplos canais com o uso de compensação de fase |
US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
CN112074902B (zh) * | 2018-02-01 | 2024-04-12 | 弗劳恩霍夫应用研究促进协会 | 使用混合编码器/解码器空间分析的音频场景编码器、音频场景解码器及相关方法 |
TWI708243B (zh) * | 2018-03-19 | 2020-10-21 | 中央研究院 | 於分散式語音辨識中基於小波轉換之語音特徵壓縮及重建系統與方法 |
ES2909343T3 (es) * | 2018-04-05 | 2022-05-06 | Fraunhofer Ges Forschung | Aparato, método o programa informático para estimar una diferencia de tiempo entre canales |
CN110556116B (zh) | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
WO2020009082A1 (ja) * | 2018-07-03 | 2020-01-09 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置及び符号化方法 |
JP7092048B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 多地点制御方法、装置及びプログラム |
EP3719799A1 (en) | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
CN110459205B (zh) * | 2019-09-24 | 2022-04-12 | 京东科技控股股份有限公司 | 语音识别方法及装置、计算机可存储介质 |
CN110740416B (zh) * | 2019-09-27 | 2021-04-06 | 广州励丰文化科技股份有限公司 | 一种音频信号处理方法及装置 |
US20220156217A1 (en) * | 2019-11-22 | 2022-05-19 | Stmicroelectronics (Rousset) Sas | Method for managing the operation of a system on chip, and corresponding system on chip |
CN110954866B (zh) * | 2019-11-22 | 2022-04-22 | 达闼机器人有限公司 | 声源定位方法、电子设备及存储介质 |
CN111131917B (zh) * | 2019-12-26 | 2021-12-28 | 国微集团(深圳)有限公司 | 音频频谱实时同步方法、播放装置 |
TWI750565B (zh) * | 2020-01-15 | 2021-12-21 | 原相科技股份有限公司 | 真無線多聲道揚聲裝置及其多音源發聲之方法 |
CN111402906B (zh) * | 2020-03-06 | 2024-05-14 | 深圳前海微众银行股份有限公司 | 语音解码方法、装置、引擎及存储介质 |
US11276388B2 (en) * | 2020-03-31 | 2022-03-15 | Nuvoton Technology Corporation | Beamforming system based on delay distribution model using high frequency phase difference |
CN111525912B (zh) * | 2020-04-03 | 2023-09-19 | 安徽白鹭电子科技有限公司 | 一种数字信号的任意重采样方法及系统 |
CN113223503B (zh) * | 2020-04-29 | 2022-06-14 | 浙江大学 | 一种基于测试反馈的核心训练语音选择方法 |
WO2021260826A1 (ja) * | 2020-06-24 | 2021-12-30 | 日本電信電話株式会社 | 音信号復号方法、音信号復号装置、プログラム及び記録媒体 |
CN115917644A (zh) * | 2020-06-24 | 2023-04-04 | 日本电信电话株式会社 | 声音信号编码方法、声音信号编码装置、程序以及记录介质 |
AU2021317755B2 (en) * | 2020-07-30 | 2023-11-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding an audio signal or for decoding an encoded audio scene |
MX2023003963A (es) | 2020-10-09 | 2023-05-25 | Fraunhofer Ges Forschung | Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando un suavizado de parametro. |
CA3194876A1 (en) | 2020-10-09 | 2022-04-14 | Franz REUTELHUBER | Apparatus, method, or computer program for processing an encoded audio scene using a bandwidth extension |
JP2023549038A (ja) | 2020-10-09 | 2023-11-22 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | パラメータ変換を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム |
US20240064483A1 (en) * | 2021-01-18 | 2024-02-22 | Panasonic Intellectual Property Corporation Of America | Signal processing device and signal processing method |
WO2022262960A1 (en) | 2021-06-15 | 2022-12-22 | Telefonaktiebolaget Lm Ericsson (Publ) | Improved stability of inter-channel time difference (itd) estimator for coincident stereo capture |
CN113435313A (zh) * | 2021-06-23 | 2021-09-24 | 中国电子科技集团公司第二十九研究所 | 一种基于dft的脉冲频域特征提取方法 |
WO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、及び、符号化方法 |
CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
WO2024053353A1 (ja) * | 2022-09-08 | 2024-03-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 信号処理装置、及び、信号処理方法 |
WO2024074302A1 (en) | 2022-10-05 | 2024-04-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Coherence calculation for stereo discontinuous transmission (dtx) |
CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09507354A (ja) * | 1993-12-30 | 1997-07-22 | ディーエスシー、カミューニケイシャンズ、コーパレイシャン | 統合マルチ・ファブリック・デジタル・クロスコネクトのタイミング・アーキテクチャ |
EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
US20070027684A1 (en) * | 2005-07-28 | 2007-02-01 | Byun Kyung J | Method for converting dimension of vector |
CN101223578A (zh) * | 2005-07-19 | 2008-07-16 | 弗劳恩霍夫应用研究促进协会 | 用于消除参数多通道音频编码与矩阵环绕多通道编码之间的差距的构思 |
US20090313028A1 (en) * | 2008-06-13 | 2009-12-17 | Mikko Tapio Tammi | Method, apparatus and computer program product for providing improved audio processing |
CN101989429A (zh) * | 2009-07-31 | 2011-03-23 | 华为技术有限公司 | 转码方法、装置、设备以及系统 |
CN102144259A (zh) * | 2008-07-11 | 2011-08-03 | 弗劳恩霍夫应用研究促进协会 | 用于产生带宽扩展输出数据的装置和方法 |
US20110237883A1 (en) * | 2010-03-26 | 2011-09-29 | Minkyung Chun | Electronic endoscope system |
CN102388417A (zh) * | 2009-03-17 | 2012-03-21 | 杜比国际公司 | 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码 |
CN105023578A (zh) * | 2010-04-09 | 2015-11-04 | 杜比国际公司 | 解码器系统和解码方法 |
Family Cites Families (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
US6073100A (en) * | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
US5903872A (en) | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
US6549884B1 (en) * | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
FI119955B (fi) * | 2001-06-21 | 2009-05-15 | Nokia Corp | Menetelmä, kooderi ja laite puheenkoodaukseen synteesi-analyysi puhekoodereissa |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
WO2003107591A1 (en) * | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
CN100481735C (zh) * | 2002-08-21 | 2009-04-22 | 广州广晟数码技术有限公司 | 用于从编码后的音频数据流中解码重建多声道音频信号的解码方法 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
EP1769491B1 (en) | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
WO2007052612A1 (ja) * | 2005-10-31 | 2007-05-10 | Matsushita Electric Industrial Co., Ltd. | ステレオ符号化装置およびステレオ信号予測方法 |
US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
MX2008010836A (es) * | 2006-02-24 | 2008-11-26 | France Telecom | Un metodo para codificacion binaria de indices de cuantificacion de una envoltura de señal, un metodo para descodificar una envoltura de señal, y modulos de codificacion y descodificacion correspondiente. |
DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
GB2453117B (en) * | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
CN101903944B (zh) * | 2007-12-18 | 2013-04-03 | Lg电子株式会社 | 用于处理音频信号的方法和装置 |
EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
CN101267362B (zh) * | 2008-05-16 | 2010-11-17 | 亿阳信通股份有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
JP5122681B2 (ja) * | 2008-05-23 | 2013-01-16 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | パラメトリックステレオアップミクス装置、パラメトリックステレオデコーダ、パラメトリックステレオダウンミクス装置、及びパラメトリックステレオエンコーダ |
EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
KR101400535B1 (ko) * | 2008-07-11 | 2014-05-28 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 시간 워프 활성 신호의 제공 및 이를 이용한 오디오 신호의 인코딩 |
ES2683077T3 (es) * | 2008-07-11 | 2018-09-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada |
PL2146344T3 (pl) * | 2008-07-17 | 2017-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób kodowania/dekodowania sygnału audio obejmujący przełączalne obejście |
US8504378B2 (en) * | 2009-01-22 | 2013-08-06 | Panasonic Corporation | Stereo acoustic signal encoding apparatus, stereo acoustic signal decoding apparatus, and methods for the same |
US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
RU2542668C2 (ru) * | 2009-01-28 | 2015-02-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Звуковое кодирующее устройство, звуковой декодер, кодированная звуковая информация, способы кодирования и декодирования звукового сигнала и компьютерная программа |
US9111527B2 (en) * | 2009-05-20 | 2015-08-18 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, and methods therefor |
JP5031006B2 (ja) | 2009-09-04 | 2012-09-19 | パナソニック株式会社 | スケーラブル復号化装置及びスケーラブル復号化方法 |
EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
PL3779975T3 (pl) | 2010-04-13 | 2023-12-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder audio i powiązane sposoby przetwarzania wielokanałowych sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
US8463414B2 (en) * | 2010-08-09 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus for estimating a parameter for low bit rate stereo transmission |
AU2011288406B2 (en) * | 2010-08-12 | 2014-07-31 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Resampling output signals of QMF based audio codecs |
BR112013008463B8 (pt) | 2010-10-06 | 2022-04-05 | Fraunhofer Ges Zur Foerderung Der Angewandten Forschubg E V | Aparelho e método para processar um sinal de áudio e para prover uma granularidade temporal maior para um codec de fala e áudio unificado combinado (usac) |
FR2966634A1 (fr) | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
WO2012105885A1 (en) * | 2011-02-02 | 2012-08-09 | Telefonaktiebolaget L M Ericsson (Publ) | Determining the inter-channel time difference of a multi-channel audio signal |
DK2671221T3 (en) * | 2011-02-03 | 2017-05-01 | ERICSSON TELEFON AB L M (publ) | DETERMINING THE INTERCHANNEL TIME DIFFERENCE FOR A MULTI-CHANNEL SIGNAL |
MY160265A (en) * | 2011-02-14 | 2017-02-28 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V | Apparatus and Method for Encoding and Decoding an Audio Signal Using an Aligned Look-Ahead Portion |
BR112013020482B1 (pt) * | 2011-02-14 | 2021-02-23 | Fraunhofer Ges Forschung | aparelho e método para processar um sinal de áudio decodificado em um domínio espectral |
EP2710592B1 (en) * | 2011-07-15 | 2017-11-22 | Huawei Technologies Co., Ltd. | Method and apparatus for processing a multi-channel audio signal |
EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
EP3288033B1 (en) | 2012-02-23 | 2019-04-10 | Dolby International AB | Methods and systems for efficient recovery of high frequency audio content |
CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN103366751B (zh) * | 2012-03-28 | 2015-10-14 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
EP2834813B1 (en) | 2012-04-05 | 2015-09-30 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
KR101621287B1 (ko) | 2012-04-05 | 2016-05-16 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 다채널 오디오 신호 및 다채널 오디오 인코더를 위한 인코딩 파라미터를 결정하는 방법 |
KR20150012146A (ko) * | 2012-07-24 | 2015-02-03 | 삼성전자주식회사 | 오디오 데이터를 처리하기 위한 방법 및 장치 |
WO2014043476A1 (en) * | 2012-09-14 | 2014-03-20 | Dolby Laboratories Licensing Corporation | Multi-channel audio content analysis based upmix detection |
EP2898506B1 (en) * | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
CN104885383B (zh) * | 2012-12-27 | 2017-08-29 | 松下电器(美国)知识产权公司 | 影像显示方法 |
WO2014128194A1 (en) | 2013-02-20 | 2014-08-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
EP2959479B1 (en) * | 2013-02-21 | 2019-07-03 | Dolby International AB | Methods for parametric multi-channel encoding |
TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
CN107113147B (zh) * | 2014-12-31 | 2020-11-06 | Lg电子株式会社 | 在无线通信系统中分配资源的方法和设备 |
WO2016108655A1 (ko) * | 2014-12-31 | 2016-07-07 | 한국전자통신연구원 | 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 |
EP3067886A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
EP3405951B1 (en) * | 2016-01-22 | 2019-11-13 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
US10224042B2 (en) | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
-
2017
- 2017-01-20 EP EP17701669.8A patent/EP3405951B1/en active Active
- 2017-01-20 AU AU2017208580A patent/AU2017208580B2/en active Active
- 2017-01-20 JP JP2018510479A patent/JP6412292B2/ja active Active
- 2017-01-20 BR BR112017025314-3A patent/BR112017025314A2/pt active Search and Examination
- 2017-01-20 WO PCT/EP2017/051208 patent/WO2017125559A1/en active Application Filing
- 2017-01-20 AU AU2017208575A patent/AU2017208575B2/en active Active
- 2017-01-20 KR KR1020187024171A patent/KR102230727B1/ko active IP Right Grant
- 2017-01-20 ES ES17700706T patent/ES2727462T3/es active Active
- 2017-01-20 MX MX2018008887A patent/MX2018008887A/es active IP Right Grant
- 2017-01-20 CA CA3011914A patent/CA3011914C/en active Active
- 2017-01-20 RU RU2018130151A patent/RU2705007C1/ru active
- 2017-01-20 AU AU2017208576A patent/AU2017208576B2/en active Active
- 2017-01-20 RU RU2018130272A patent/RU2711513C1/ru active
- 2017-01-20 PL PL17700706T patent/PL3284087T3/pl unknown
- 2017-01-20 CA CA3011915A patent/CA3011915C/en active Active
- 2017-01-20 PL PL19157001.9T patent/PL3503097T3/pl unknown
- 2017-01-20 TR TR2019/06475T patent/TR201906475T4/tr unknown
- 2017-01-20 RU RU2018130275A patent/RU2704733C1/ru active
- 2017-01-20 EP EP17700706.9A patent/EP3284087B1/en active Active
- 2017-01-20 ES ES17701669T patent/ES2768052T3/es active Active
- 2017-01-20 KR KR1020187024233A patent/KR102343973B1/ko active IP Right Grant
- 2017-01-20 WO PCT/EP2017/051212 patent/WO2017125562A1/en active Application Filing
- 2017-01-20 MX MX2018008890A patent/MX2018008890A/es active IP Right Grant
- 2017-01-20 ES ES17700707T patent/ES2773794T3/es active Active
- 2017-01-20 EP EP17700705.1A patent/EP3405948B1/en active Active
- 2017-01-20 CN CN201780002248.3A patent/CN107710323B/zh active Active
- 2017-01-20 MY MYPI2018001321A patent/MY189205A/en unknown
- 2017-01-20 ES ES17700705T patent/ES2790404T3/es active Active
- 2017-01-20 JP JP2018538601A patent/JP6626581B2/ja active Active
- 2017-01-20 CA CA3012159A patent/CA3012159C/en active Active
- 2017-01-20 JP JP2018538602A patent/JP6641018B2/ja active Active
- 2017-01-20 EP EP17700707.7A patent/EP3405949B1/en active Active
- 2017-01-20 MY MYPI2017001705A patent/MY181992A/en unknown
- 2017-01-20 CN CN201780019674.8A patent/CN108885879B/zh active Active
- 2017-01-20 CN CN202210761486.5A patent/CN115148215A/zh active Pending
- 2017-01-20 PL PL17701669T patent/PL3405951T3/pl unknown
- 2017-01-20 BR BR112018014799-0A patent/BR112018014799A2/pt active Search and Examination
- 2017-01-20 PT PT177007077T patent/PT3405949T/pt unknown
- 2017-01-20 PL PL17700707T patent/PL3405949T3/pl unknown
- 2017-01-20 CN CN201780018898.7A patent/CN108885877B/zh active Active
- 2017-01-20 PT PT177016698T patent/PT3405951T/pt unknown
- 2017-01-20 JP JP2018538633A patent/JP6730438B2/ja active Active
- 2017-01-20 SG SG11201806241QA patent/SG11201806241QA/en unknown
- 2017-01-20 WO PCT/EP2017/051205 patent/WO2017125558A1/en active Application Filing
- 2017-01-20 MY MYPI2018001318A patent/MY189223A/en unknown
- 2017-01-20 WO PCT/EP2017/051214 patent/WO2017125563A1/en active Application Filing
- 2017-01-20 CN CN201780018903.4A patent/CN108780649B/zh active Active
- 2017-01-20 BR BR112018014689-7A patent/BR112018014689A2/pt active Search and Examination
- 2017-01-20 BR BR112018014916-0A patent/BR112018014916A2/pt active Search and Examination
- 2017-01-20 SG SG11201806216YA patent/SG11201806216YA/en unknown
- 2017-01-20 MY MYPI2018001323A patent/MY196436A/en unknown
- 2017-01-20 SG SG11201806246UA patent/SG11201806246UA/en unknown
- 2017-01-20 PT PT17700706T patent/PT3284087T/pt unknown
- 2017-01-20 AU AU2017208579A patent/AU2017208579B2/en active Active
- 2017-01-20 MX MX2017015009A patent/MX371224B/es active IP Right Grant
- 2017-01-20 MX MX2018008889A patent/MX2018008889A/es active IP Right Grant
- 2017-01-20 KR KR1020177037759A patent/KR102083200B1/ko active IP Right Grant
- 2017-01-20 RU RU2017145250A patent/RU2693648C2/ru active
- 2017-01-20 CN CN202311130088.4A patent/CN117238300A/zh active Pending
- 2017-01-20 KR KR1020187024177A patent/KR102219752B1/ko active IP Right Grant
- 2017-01-20 CA CA2987808A patent/CA2987808C/en active Active
- 2017-01-20 EP EP19157001.9A patent/EP3503097B1/en active Active
- 2017-01-23 TW TW106102409A patent/TWI629681B/zh active
- 2017-01-23 TW TW106102410A patent/TWI643487B/zh active
- 2017-01-23 TW TW106102398A patent/TWI628651B/zh active
- 2017-01-23 TW TW106102408A patent/TWI653627B/zh active
- 2017-11-22 US US15/821,108 patent/US10535356B2/en active Active
-
2018
- 2018-03-20 HK HK18103855.8A patent/HK1244584B/zh unknown
- 2018-07-11 ZA ZA2018/04625A patent/ZA201804625B/en unknown
- 2018-07-12 US US16/034,206 patent/US10861468B2/en active Active
- 2018-07-13 US US16/035,456 patent/US10706861B2/en active Active
- 2018-07-13 US US16/035,471 patent/US10424309B2/en active Active
- 2018-07-17 ZA ZA2018/04776A patent/ZA201804776B/en unknown
- 2018-07-20 ZA ZA2018/04910A patent/ZA201804910B/en unknown
- 2018-09-27 JP JP2018181254A patent/JP6856595B2/ja active Active
-
2019
- 2019-04-04 US US16/375,437 patent/US10854211B2/en active Active
- 2019-08-09 AU AU2019213424A patent/AU2019213424B8/en active Active
- 2019-12-26 JP JP2019235359A patent/JP6859423B2/ja active Active
-
2020
- 2020-02-19 US US16/795,548 patent/US11410664B2/en active Active
- 2020-07-02 JP JP2020114535A patent/JP7053725B2/ja active Active
-
2021
- 2021-03-18 JP JP2021044222A patent/JP7258935B2/ja active Active
- 2021-03-25 JP JP2021051011A patent/JP7161564B2/ja active Active
-
2022
- 2022-03-31 JP JP2022057862A patent/JP7270096B2/ja active Active
- 2022-05-23 US US17/751,303 patent/US11887609B2/en active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09507354A (ja) * | 1993-12-30 | 1997-07-22 | ディーエスシー、カミューニケイシャンズ、コーパレイシャン | 統合マルチ・ファブリック・デジタル・クロスコネクトのタイミング・アーキテクチャ |
EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
CN101223578A (zh) * | 2005-07-19 | 2008-07-16 | 弗劳恩霍夫应用研究促进协会 | 用于消除参数多通道音频编码与矩阵环绕多通道编码之间的差距的构思 |
US20070027684A1 (en) * | 2005-07-28 | 2007-02-01 | Byun Kyung J | Method for converting dimension of vector |
US20090313028A1 (en) * | 2008-06-13 | 2009-12-17 | Mikko Tapio Tammi | Method, apparatus and computer program product for providing improved audio processing |
CN102144259A (zh) * | 2008-07-11 | 2011-08-03 | 弗劳恩霍夫应用研究促进协会 | 用于产生带宽扩展输出数据的装置和方法 |
CN102388417A (zh) * | 2009-03-17 | 2012-03-21 | 杜比国际公司 | 基于自适应地可选择的左/右或中央/侧边立体声编码和参数立体声编码的组合的高级立体声编码 |
CN101989429A (zh) * | 2009-07-31 | 2011-03-23 | 华为技术有限公司 | 转码方法、装置、设备以及系统 |
US20110237883A1 (en) * | 2010-03-26 | 2011-09-29 | Minkyung Chun | Electronic endoscope system |
CN105023578A (zh) * | 2010-04-09 | 2015-11-04 | 杜比国际公司 | 解码器系统和解码方法 |
Non-Patent Citations (2)
Title |
---|
N.R. CHONG,等: "The effects of noise on the waveform interpolation speech coder", 《TENCON "97 BRISBANE - AUSTRALIA. PROCEEDINGS OF IEEE TENCON "97. IEEE REGION 10 ANNUAL CONFERENCE. SPEECH AND IMAGE TECHNOLOGIES FOR COMPUTING AND TELECOMMUNICATIONS (CAT. NO.97CH36162)》 * |
解恺,等: "基于目标辐射噪声的信号起伏检测算法研究", 《电子与信息学报》 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108780649A (zh) | 使用宽带对准参数与多个窄带对准参数编码或解码多声道信号的设备及方法 | |
EP3776541B1 (en) | Apparatus, method or computer program for estimating an inter-channel time difference |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |