CN1312658C - 在感知上改善的声音信号编码方法和设备 - Google Patents

在感知上改善的声音信号编码方法和设备 Download PDF

Info

Publication number
CN1312658C
CN1312658C CNB018173799A CN01817379A CN1312658C CN 1312658 C CN1312658 C CN 1312658C CN B018173799 A CNB018173799 A CN B018173799A CN 01817379 A CN01817379 A CN 01817379A CN 1312658 C CN1312658 C CN 1312658C
Authority
CN
China
Prior art keywords
signal
frequency
coefficient
smooth
level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CNB018173799A
Other languages
English (en)
Other versions
CN1470048A (zh
Inventor
S·布鲁恩
S·安德森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Telefonaktiebolaget LM Ericsson AB
Original Assignee
Telefonaktiebolaget LM Ericsson AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Telefonaktiebolaget LM Ericsson AB filed Critical Telefonaktiebolaget LM Ericsson AB
Publication of CN1470048A publication Critical patent/CN1470048A/zh
Application granted granted Critical
Publication of CN1312658C publication Critical patent/CN1312658C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • H04B1/667Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using a division in frequency subbands
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

本发明涉及对声源信号(X)进行编码,这样根据编码信息重构的对应信号(z)具有在感知上高的声音品质。声源信号(x)由发射机(300)中的编码装置编码为至少一个基本编码信号(P)。所述至少一个基本编码信号(P)由此表示声信号(X)在感知上重要的特征。发射机(300)中的编码装置可包括至少一个频谱平滑单元(305a),该单元接收至少一个信号分量,而基本编码信号P基于信号分量,并响应于此产生对应的平滑信号分量。随后从未显示的相应平滑信号分量产生至少一个增强编码信号P(E)

Description

在感知上改善的声音信号编码方法和设备
技术领域
本发明一般涉及声源信号的编码,这样,与已知的编码方案相比,基于编码信息而重构的相应信号具有更高的可感知声音品质。更具体地说,本发明涉及声音信号编码产生编码信息,以通过传输媒体进行传输,以及对已通过传输媒体传输的编码信息进行解码。本发明还涉及通信系统、计算机程序以及计算机可读媒体。
背景技术
语音编解码器(编解码器=编码器和解码器)有许多不同的应用。编码和解码方案用于在固定和移动通信系统以及视频会议系统中的高效比特率的声音信号传输。语音编解码器也可以用于安全电话和话音存储器。
固定和移动电话以及视频会议的发展趋势便是改善重构声音信号的品质。这种趋势也反映出用户期望这些系统所提供的声音品质达到或超过现有固定电话网络的品质。实现这种期望的一个办法便是增宽声音信号的频带,并因此向接收机传送更多源信号中所包括的信息。事实上,语音信号的大部分能量的频谱分布于0kHz至4kHz之间(即当前技术水平编解码器典型的带宽)。然而,还有大量能量分布在4kHz至8kHz的频带中。此频带中的频率分量所表示的信息可由收听人感觉为音质“清晰”,如同说话人就在收听人“眼前”。
随着频率的增加,人类听觉的频率分辨率会相应降低。因此,只需相对较少的比特便可模拟分布于4kHz至8kHz之间的频率分量,并具有足够的精度。尽管如此,至今仍未出现一种具有比特率有效的宽带编解码器,可以提供具有令人满意感知品质的重构声音信号。现有的ITU-TG.722宽带编码标准以48、56和64kbps的比特率运行,与采用的比特率相比,它仅能提供无法令人满意的品质(ITU-T=国际电信联盟,标准化部分)。
美国专利5956686描述了一种自适应变换编码/解码装置,在该装置中,包络的频谱被分成若干频带,以便在各个频带的包络上应用不同的编码方法。这样就有可能在频谱包络的频带间利用不同的冗余。同时也调节频谱包络以适应编码和/或传输方法,从而补偿各频带中的时间波动。
美国专利5526464描述了一种编码激发线性预测编码方法,其中将残余信号分成若干频带。为每个频带提供特定的码本,码本的大小随着频带的增加而减少。采样率随着频率的减少而降低,以便降低码本搜索的复杂性。
因此,在本领域存在所应用的编码方案考虑到不同频带的变化属性的例示。然而,不同的属性只用于获取源信号的比特效率编码。现在还未有任何用于在使用为第一频带优化的编码方案对第二频带中的信号进行编码时,补偿所应用的编码中固有的不足的特殊方法的讲授。
现在,大多数的语音编码模型均设计用于窄带信号(一般在0-4kHz)。如果这些语音编码模型应用于对具有诸如0-8kHz等更大带宽的声音信号进行编码,则只有相关频带部分、即较低频部分的编码是优化的。
这种现象的一个原因是编码参数的量化一般涉及时域中目标信号和再现信号的相关性。由于与低频率分量相比,语音信号较高的频率分量具有低功率密度,因此,此类相关性将主要基于低频区域中的信号匹配。因此,高频分量在接收机端的再现较差。
不幸地是,人类听力的缺陷或者话音信号的特征均不能原谅这种较差的再现。声音产生时,声道就好像是滤波器,对肺部产生的气流进行滤波。所谓的共振峰对应于此滤波器的共振频率。在话音信号的较低频带中,目标信号具有明显的共振峰。然而,对于较高的频率,共振峰更加分散。由于所采用的语音模型的局限性,通过传统的窄带编码器进行编码的具有相对较大带宽的声音信号将被再现为在其上部频带中也具有明显频谱结构(即波峰与波谷)的信号。一般具有这种特征的声音信号会让收听人觉得是一种不自然的金属声。
有时会将第二解码器应用于第一解码器的输出信号,或者与第一解码器同时应用,以便进一步改善重构信号的品质。如果在使用传统窄带编码器对宽带源信号进行编码时采取了此措施,则高端频带中的频谱结构有时会更加明显。虽然对于窄带声音信号而言,这可以较理想地改善声音品质,但是,对于宽带声音信号,效果可能相反。
发明内容
因此,本发明的目的是提供一种改善的声音信号编码方案以缓和上述问题。
根据本发明的一个方面,通过本说明书开始所述的方法实现本发明的目的,对声源信号进行编码,以产生代表声音信号的编码信息,从而通过传输媒体进行传输,其特征在于主编码信号和目标信号分别包括多个系数,每个系数表示一个频率分量。产生至少一个平滑信号,它对应于主编码信号和目标信号,该平滑信号是主编码信号和目标信号的选择性修改形式,其中减少了表示超出阈值的频率信息的系数值中的变化。
根据本发明的另一方面,通过一种计算机程序实现所述目的,该计算机程序可直接载入计算机内部存储器,它包括当在计算机上运行所述程序时,用于控制上段中所述方法的软件。
根据本发明的又一方面,通过其上记录了程序的计算机可读媒体可实现所述目的,其中程序使计算机控制上面倒数笫二段所述的方法。
根据本发明的再一方面,通过如本说明书开始所述解码声源信号估计量的方法实现所述目的,其特征在于平滑主解码频谱包括多个系数,每个系数表示一个频率分量。平滑主解码频谱是至少一个主解码频谱之一的选择性修改形式,其中减少了表示超出阈值的频率信息的系数值中的变化。
根据本发明的另一方面,通过一种计算机程序实现所述目的,该计算机程序可直接载入计算机内部存储器,它包括当在计算机上运行所述程序时,用于控制上段所述方法的软件。
根据本发明的又一方面,通过其上记录了程序的计算机可读媒体可实现所述目的,其中程序使计算机控制上面倒数第二段所述的方法。
根据本发明的再一方面,通过如本说明书开始所述的发射机实现所述目的,其特征在于设计至少一个频谱平滑单元,通过选择性地修改主编码信号,从主编码信号中产生平滑输出信号,从而减少其表示超出阈值的频率信息的系数值中的变化。
根据本发明的另一方面,通过本说明书开始所述的接收机实现所述目的,其特征在于平滑主解码频谱包括多个系数,每个系数表示一个频谱分量。接收机中的频谱平滑单元设计为通过选择性地修改至少一个主解码频谱,产生平滑主解码频谱,从而减少表示超出阈值的频率信息的系数值中的变化。
根据本发明的又一方面,通过将声源信号从第一节点传输到第二节点的通信系统实现所述目的。在第一节点中,通信系统包括提议的发射机,用于对声源信号进行编码以产生编码信息。在第二节点中,通信系统包括提议的接收机,用于接收发射机所产生的编码信息,以及用于将编码信息的估计量解码为声源信息的估计量。传输媒体用于从发射机向接收机传送至少一个增强编码信号。
所提议的在将由接收机重构声音信号所依据的一个或多个信号中,减少了表示超出阈值的频率信息的系数值中的变化,这改善了诸如声音或音乐等典型声音信号在感觉上的自然度。具体地说,先有编码技术产生的金属音可以大幅度减轻。这是极需的一种效果,因为感知的声音品质是将来宽带应用成功的一个关键因素。
附图说明
现在将通过示例,并参照附图以优选实施例对本发明作出更为详尽的解释。
图1A显示一个频率图,其中具有主解码频谱的系数,每个系数表示声源信号的一个频率分量;
图1B显示如何计算图1A中表示超出阈值频率的频带中的频率分量的系数的平均系数值;
图1C显示如何用图1B中的平均系数值替换超出阈值频率的频带中的频率分量的原系数值;
图2A显示用于在重叠频带中添加系数值的窗函数的第一示例;
图2B显示了用于在重叠频带中添加系数植的窗函数的第二示例;
图3显示根据本发明的发射机-接收机对的方框图;
图4显示根据本发明第一实施例的频谱平滑单元的方框图;
图5显示根据本发明第二实施例的频谱平滑单元的方框图;
图6A显示根据本发明第二实施例,将由频谱平滑单元进一步编码的主解码频谱的中间系数的频率图;
图6B在频率图中显示根据本发明第二实施例得到的平滑解码频谱的系数;
图7显示根据本发明实施例的通信系统方框图;
图8以流程图的形式说明根据本发明编码声音信号的一般方法;以及
图9以流程图的形式说明了根据本发明将编码信息解码为声音信号估计量的一般方法。
具体实施方式
附图1A在频率图中显示了沿x轴的主解码频谱 的系数KY。每个系数KY表示声源信号中频率分量的幅度,该声源信号已根据任意编码方案进行编码,通过传输媒体发送并根据适当的解码方案进行解码。因此,主解码频谱 表示声音信号x在感知上的重要特征。
图1B显示如何将超出阈值频率fT由系数KY表示的主解码频谱
Figure C0181737900143
分成频带i、ii和iii。第一频带i包括了阈值频率fT与第一边缘频率fi之间的频率分量,第二频带ii包括了第一边缘频率fi与第二边缘频率fii之间的频率分量,第三频带iii包括了第二边缘频率fii与第三边缘频率fiii之间的频率分量。在各频带i、ii和iii中的各个虚线表示所述频带的算术平均系数值。在本发明的备选实施例中,确定的是中值系数而不是算术平均值。
平滑主解码频谱 生成为主解码频谱 的选择性修改形式,其中减少了表示超出阈值fT的频率信息的系数值KYE中的变化。在图1C所示的例示中,图1B中的平均系数值Ki、Kii和Kiii替换了超出阈值频率fT的频带i、ii和iii中频率分量的原系数值,并由此实现了系数值KYE中变化的减小。
图1B和1C显示了本发明的实施例,其中频带i、ii和iii并未重叠且具有不同的带宽。由于人听觉分辨率大体上是随着频率的提高而呈对数关系下降,因此,从感知角度来说,根据对数频标划分频带i、ii和iii是合乎情理的。例如,Bark刻度通过以下边缘频率划分频谱:0kHz、0.1kHz、0.2kHz、0.3kHz、0.4kHz、0.51kHz、0.63kHz、0.77kHz、0.92kHz、1.08kHz、1.27kHz、1.48kHz、1.72kHz、2kHz、2.32kHz、2.7kHz、3.15kHz、3.7kHz、4.4kHz、5.3kHz、6.4kHz、7.7kHz、9.5kHz、12kHz和15.5kHz。Mel倒谱刻度定义了另一组频带,旨在模仿人类听觉的临界频带。感知线性预测方法(PLP)还提供了另一种方式,可获取表示感知所推动的频谱定标和压缩的一组频带。
当然,频带也可以是等距的,或者可以只有一个单频带覆盖超出阈值频率fT的整个频谱。
此外,不考虑频带的相关带宽,相邻的频带可以至少部分彼此重叠。如果这样,则在可以通过将相关系数值加在一起以得到频带间重叠区域中结果系数值之前,各频带内的系数必须乘以窗函数。
图2A显示这种窗函数W1的第一例示,该函数具有梯形形状,定义在下边频f1和上边频fu之间。窗函数W1在非重叠频率区域中具有恒定幅度,例如1,并且其幅度在相邻频带重叠的下部过渡区域和对应的上部过渡区域中逐渐降低。窗函数W1在各过渡区的中点最好等于恒定幅度的一半(如0.5)。当然,中点当然必须相对于所用的任一非线性频率刻度定义。
图2B显示窗函数W2的另一例示,用于在重叠频带中添加系数值,该函数具有非梯形形状,其它与上面参照图2A所述的窗函数W1特征相同。在过渡区域中具有非线性形状(如正弦或余弦波的第一个四分之一部分)的窗函数对于某些应用在频率属性上有优势。
图3显示了根据本发明的发射机-接收机对方框图。发射机300将声源信号x编码成编码表示P(E),然后通过传输媒体306发送到接收机310。
发射机300包括编码装置,用于产生至少一个基本编码信号P,该信号表示声音信号x在感知上的重要特征。接收机310有可能直接从基本编码信号P的估计量重构声源信号x的估计量 然而,根据本发明的优选实施例,发射机300也包括第一频谱平滑单元305a,它接收至少一个信号分量,而基本编码信号P基于信号分量并响应于此而生成对应的平滑信号分量。从未显示的对应平滑信号分量产生增强编码信号P(E)。增强的编码信号P(E)构成声源信号x的改善表示,接收机310可以从中重构在感知上改善的声源信号x的估计量 通过选择性地修改信号分量的频谱,第一频谱单元305a从基本编码信号P中的至少一个信号分量产生对应的平滑信号,从而减少表示超出阈值的频率信息的频谱系数值中的变化。第一频谱平滑单元305a因而以一种与上面参照图1A-1C所述修改主解码频谱 相同方式,修改信号分量的频谱。
增强的编码信号P(E)经传输媒体306发送,并以发送的增强编码信号形式由接收机310作为增强编码信号P(E)的估计量接收。接收机310利用发送的增强编码信号
Figure C0181737900165
通过第二频谱平滑单元305b重构在感知上改善的声源信号x估计量 通过对从发送的增强编码信号
Figure C0181737900167
中解码的主频谱
Figure C0181737900168
进行选择性修改,第二频谱平滑单元305b产生在感知上改善的声源信号x的估计量 从而减少了表示超出阈值的频率信息的平滑主解码频谱
Figure C01817379001610
的系数值中的变化。
图4显示根据本发明第一实施例设计的图3所示频谱平滑单元305a和305b的方框图。然而,为简单起见,此处只涉及第二频谱平滑单元305b中的变化。频谱平滑单元305b包括第一缓冲存储器401,该存储器中存储主解码频谱
Figure C01817379001611
的系数KY,其中每个系数表示一个频率分量。处理单元402从对应于超出阈值fT的频率分量的第一缓存存储器401接收系数kY n+1-kY m,并计算至少一个频带i、ii、iii中的各频带的这些系数kY n+1-kY m的平均系数值Ki、Kii、Kiii。各个算得的平均系数值Ki、Kii、Kiii随后会反复存储到第二缓冲存储器403,存储次数等于特定频带i、ii、iii中主解码频谱
Figure C01817379001612
的系数KY的数量。这种存储的目的是使得用相关平均系数值Ki、Kii、Kiii迅速替换主解码频谱 的系数KY成为可能。通过读出单元404从第一缓冲存储器401读出达到阈值fT的系数kY 1-kY n以及从第二缓冲存储器403读出超出阈值fT的平滑系数kY n+1-kY m,可以实现系数替换。这些系数kY 1-kY n、Ki、Kii、和Kiii随后一起构成平滑主解码频谱
Figure C0181737900171
的系数KYE,在读出单元404的输出端上提供。
图5显示根据本发明第二实施例设计的图3所示频谱平滑单元305a和305b的方框图。同样,为简单起见,此处只涉及第二频谱平滑单元305b中的变化。
频谱平滑单元305b包括第一变换器501,用于通过输入端接收主频谱第一变换器501在第一输出端上产生一个对应的角频谱Ys arg,并在第二输出端上产生一个对应的幅度频谱|Ys|。幅度频谱|Ys|由系数值kY 1,...kY m表示。可选地是,频谱平滑单元305b包括对数变换器502,该变换器接收表示超出阈值频率fT的频率分量的幅度频谱|Ys|的那些系数kY n+1...kY m,而将表示较低频率分量的幅度频谱|Ys|的系数kY 1-kY n转发到组合器507。对数变换器502在输入端上接收表示超出阈值频率fT的频率分量的幅度频谱|Ys|的系数kY n+1...kY m,并响应于此在输出端上提供对数变换。第一逆变换器503在输入端上接收此变换部分的幅度频谱,并响应于此在输出端上提供倒谱编码信号,该倒谱编码信号具有一组倒谱系数,其中每个系数表示倒谱域中的一个分量。如果未包括对数变换器502,则幅度频谱|Ys|的系数kY n+1...kY m将直接从第一变换器501馈送到第一逆变换器503。随后的删除单元504将删除倒谱编码信号中n阶及更高阶的倒谱系数,用零值系数替换这些删除的系数并将信号再传送到第二变换器505以产生对应的频谱信号。
如果对数变换器502已在较早时候执行了相应的对数变换,则此倒谱信号将在随后的逆对数变换器506中进行逆对数变换。逆对数变换器506产生对数平滑系数kY n+1...kY m。因此,将来自第二变换器505的平滑系数kY n+1...kY m或来自逆对数变换器506的对数平滑系数kY n+1...kY m,以及表示小于阈值频率fT的频率分量的幅度频谱|Ys|的系数kY 1-kY n,转发给组合器507。组合器响应于系数kY 1-kY n和平滑系数kY n+1...kY m,提供平滑幅度频谱|YSE|。第二逆变换器508在第一输入端上接收角频谱Ys arg,同时在笫二输入端上接收平滑幅度频谱|YSE|,并响应于此在输出端上产生增强编码信号
图6A在(对数)幅度频谱图中显示了主解码频谱 的频谱系数Ks的例示。在图中可以看到,在相邻系数Ks之间,主解码频谱 包含的系数具有较大的变化。因为在表示声信息的频带的更高端中不希望出现这种变化,所以如参照图5所述,在频谱平滑单元305b中减小了此变化。频谱平滑单元305b接收主解码频谱 并因此提供平滑主解码频谱
Figure C0181737900184
在该频谱中,减少了表示超出阈值fT的频率信息的系数值KYE中的变化。换句话说,由于删除单元504的变量n选择该值,因此,在表示超出阈值fT的频率信息(对应于频谱指数kY n)的平滑主解码频谱 中,系数值KYE的变化将减小。
图6B在频率图中显示了经由频谱平滑单元305b修改为表示对应的平滑主解码频谱 的系数值KYE之后,图6A中的主解码频谱 的幅度频谱系数Ks
作为倒谱变换以及倒谱编码信号中随后的删除高阶系数的一种替代方法,频谱平滑可通过对表示主频谱
Figure C0181737900188
的频谱系数进行线性低通滤波来实现,或者通过对表示超出阈值fT的频率分量的主频谱 进行中滤波频谱系数来实现。
图7显示根据本发明实施例的通信系统方框图,通过通信系统,声源信号x可作为低比特率编码信号从第一节点发送到第二节点,并在第二节点中重构为声源信号x的估计量 系统包括发射机300、传输媒体306和接收机310。
发射机300又包括信号编码器702,该编码器具有输入端和输出端,输入端用于接收声源信号x,输出端用于提供表示声音信号x在感知上重要特征的基本编码信号P1。信号编码器702也提供目标信号r和主编码信号y,目标信号r表示声源信号x的滤波(普通意义上)形式,而主编码信号y表示基于基本编码信号P1的重构信号。根据上述方法,可以作以下选择:目标信号r和主编码信号y在频谱平滑单元305a与305c中均不进行频谱平滑处理,或者对其中之一进行频谱平滑处理,或者对两个信号都进行频谱平滑处理。
根据本发明的优选实施例,第一频谱平滑单元305a接收主编码信号y,并响应于此产生平滑主编码信号yE。然而,发射机中也可包括额外的频谱平滑单元305c以接收目标信号r,并相应地产生平滑目标信号rE。根据本发明的另一优选实施例,只包括了改善目标信号r的频谱平滑单元305c(而不包括改善主编码信号y的频谱平滑单元305a)。本发明的这些不同实施例在图7中以虚线和虚线框表示。
频谱平滑单元305a和305c都根据本发明上述方法运行,以便通过减少在表示超出阈值fT的频率信息的信号频谱系数值中的变化,产生平滑主编码信号yE(并有可能产生平滑目标信号rE)。
发射机300中的均衡编码器703接收平滑主编码信号yE和目标信号r(E)(可能已进行平滑处理)。均衡编码器703将目标信号r(E)(可能已进行平滑处理)和平滑主编码信号yE变换到频域,并计算所变换的信号的频谱之间的比率频谱(ratio spectrum)C,以表示目标信号r(E)(可能已进行平滑处理)和平滑主编码信号yE之间的对数频谱差。比率频谱C的幅度因此表明第一编码信号P1描述声音信号x的适当程度。
在均衡编码器703的输出端上提供比率频谱C,并将其转发到量化器704,该量化器将响应于比率信号C在其输出端上提供第二编码信号PC。第二编码信号PC表示包含一组系数的离散和量化信号。
最后,发射机300包括一个输出单元(未显示),用于将第一编码信号P1及第二编码信号PC传送到传输媒体306。如果至少发射机300和接收机310之一是移动装置,则通常情况下,传输媒体306至少部分由一个或多个无线电资源构成。当然,根据本发明,固定或移动通信适用的任何其它传输媒体类型也同样很适用。
接收机310随后接收信号P1、PC的估计量,作为表示第一编码信号P1的第一发送信号
Figure C0181737900191
及表示第二编码信号PC的第二发送信号
Figure C0181737900192
接收机310利用第一发送信号 和第二发送信号
Figure C0181737900194
来重构在感知上改善的声源信号x的估计量 为此,接收机310包括均衡解码器707、重构单元708、频谱平滑单元305b及均衡器709。
重构单元708通过输入端接收第一发送信号
Figure C0181737900196
并响应于此在其输出端上生成主解码频谱
Figure C0181737900197
表示声源信号x的频谱估计量。主解码频谱
Figure C0181737900198
被转发到频谱平滑单元305b。此单元305b根据所提议的方法产生平滑主解码频谱
Figure C0181737900201
均衡解码器707接收第二发送信号 并响应于此在其输出端上提供估计的均衡频谱 估计均衡频谱 与平滑主解码频谱 被转发到均衡器709。均衡器709将估计均衡频谱
Figure C0181737900206
与平滑主解码频谱 相乘。然后,均衡器709产生相乘结果的逆变换,以在时域中形成信号。此信号构成源信号x的改善估计量 并且在均衡器709的输出端上发送。
改善的估计量 也可构成源信号x的间接表示。例如,在线性预测编码器的情况下,改善的估计量
Figure C01817379002010
将改为激励信号,从该信号可通过合成滤波器产生源信号x的估计量。
由于许多编码系统中的编解码器(如GSM EFR编码器和AMR编码器)在分段成帧或子帧的语音信号上以块方式操作,因此,最好在块方式中应用对应于语音信号分段的均衡算子C(由估计的均衡频谱
Figure C01817379002011
近似)(GSM=全球移动通信系统;EFR=增强型全速率;AMR=自适应多速率)。当然,这同样适用于表示源信号x的估计平滑频谱的频率变换YE
图8以流程图方式说明了根据本发明编码声音信号的一般方法。第一步骤801接收声音信号x。在随后的步骤802中,生成表示声音信号x在感知上的重要特征的基本编码信号P。在接着的步骤803中,减小至少一个信号分量的系数值中的变化,其中基本编码信号P基于这些信号分量,并响应于此生成对应的平滑信号分量。从未显示的对应平滑信号分量产生增强的基本编码信号P(E)。最后,在步骤804中,将增强编码信号P传送到传输媒体以便传输到接收机。
图9以流程图方式说明了根据本发明将编码信息解码成声音信号的估计量的一般方法。第一步骤901从传输媒体接收至少一个发送(可能已增强)的编码信号
Figure C01817379002012
随后,在步骤902中从所述至少一个发送(可能已增强)的编码信号
Figure C01817379002013
生成主解码频谱
Figure C01817379002014
接着,在步骤903中从主解码频谱 形成平滑主解码频谱
Figure C01817379002016
最后,步骤904至少依据平滑主解码频谱
Figure C01817379002017
生成源信号的估计量 估计量
Figure C01817379002019
对收听人而言具有感知上的高声音品质。
以上本发明提议的实施例全部涉及在频域的操作。然而,根据本发明的优选实施例,可在时域采取对应的操作,即通过子带滤波器将表示声源信号的信号分成至少两个不同的信号分量。信号分量随后可分别进行功率调整以获得所需的平滑。接着,将调整了功率的信号分量组合成单个平滑基本编码信号,因而构成声源信号的表示,在该表示中,减小了超出阈值频率的信号分量的频率变化。
在本说明书中使用的术语“包括”是用于指定所述功能、整数、步骤或组件的存在。然而,该术语并未排除一个或一个以上的其它功能、整数、步骤或组件或由它们构成的组的存在或添加。
本发明并不局限于附图中所述的实施例,而是可以在权利要求书所述范围内自由变化。

Claims (39)

1.一种对声源信号进行编码以产生代表声源信号的编码信息,以便通过传输媒体进行传输的方法,它包括:
响应于所述声源信号产生
基本编码信号,它表示所述声源信号在感知上的重要特征;
目标信号,它是通过对所述声源信号进行滤波以产生代表所述声源信号的经滤波的形式;以及
主编码信号,它表示根据所述基本编码信号重构的信号;
至少响应于所述主编码信号和所述目标信号之一产生相应的平滑信号,所述平滑信号构成所述主编码信号和所述目标信号在感知上改善了的表示;以及
根据以下组合之一产生第二编码信号:
所述平滑主编码信号和所述目标信号;或
所述主编码信号和所述平滑目标信号;或
所述平滑主编码信号和所述平滑目标信号;
其特征在于,
所述主编码信号包括多个系数,其中每个系数表示一个频率分量;
所述目标信号包括多个系数,其中每个系数表示一个频率分量;以及
所述平滑主编码信号是所述主编码信号的选择性修改形式,其中减小了表示超出阈值的频率信息的系数值中的变化,并且所述平滑目标信号是所述目标信号的选择性修改形式,其中减小了表示超出阈值的频率信息的系数值中的变化。
2.如权利要求1所述的方法,其特征在于,通过以下方式从所述主编码信号获得平滑主编码信号:
将表示超出所述阈值的频率分量的所述主编码信号的所述系数分成多个频带;
在所述各个频带内计算所述系数的平均系数值;以及
将各频带中的所述系数替换为所述各个平均系数值。
3.如权利要求2所述的方法,其特征在于,所述频带是等距的。
4.如权利要求2或3所述的方法,其特征在于,所述频带部分重叠。
5.如权利要求4所述的方法,其特征在于,通过以下步骤获得所述频带的重叠区域中的结果系数值:
将各频带与窗函数相乘以获得对应的加窗频带;以及
在各重叠区域中添加相邻加窗频带的系数值。
6.如权利要求5所述的方法,其特征在于,所述窗函数在非重叠频率区域具有恒定的幅度,并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。
7.如权利要求1所述的方法,其特征在于,所述主编码信号的所述选择性修改涉及:
产生具有一组倒谱系数的倒谱编码信号,每个倒谱系数表示倒谱域中的一个分量;以及
删除所述倒谱编码信号中预定阶和更高阶的倒谱系数。
8.如权利要求7所述的方法,其特征在于,这样选择所述预定阶,使得表示超出所述阈值的频率信息的所述平滑主编码信号的系数值中的变化减少。
9.如权利要求1所述的方法,其特征在于,所述第二编码信号表示所述基本编码信号描述所述声源信号的合适程度。
10.如权利要求9所述的方法,其特征在于,所述第二编码信号与所述组合形式相对应,表示目标信号和所述平滑主编码信号之间的频谱比率、或者平滑目标信号和所述主编码信号之间的频谱比率、或者平滑目标信号和平滑主编码信号之间的频谱比率。
11.如权利要求9所述的方法,其特征在于,所述第二编码信号与所述组合形式相对应,表示目标信号和所述平滑主编码信号之间的对数频谱差、或者平滑目标信号和所述主编码信号之间的对数频谱差、或者平滑目标信号和平滑主编码信号之间的对数频谱差。
12.如权利要求10所述的方法,其特征在于,通过以下方式获得所述第二编码信号:
响应于所述声源信号产生频率变换的目标信号;
响应于所述声源信号产生频率变换的主编码信号;
产生介于所述频率变换目标信号与所述频率变换主编码信号之间的比率频谱;以及
根据所述比率频谱形成所述第二编码信号。
13.一种从通过传输媒体发送的编码信息解码出声源信号的表示的估计量的方法,它包括:
接收表示所述至少一个编码信号的估计量的至少一个已发送编码信号;
从所述至少一个已发送编码信号解码出至少一个主解码频谱;
从所述至少一个主解码频谱产生平滑主解码频谱;以及
至少根据所述平滑主解码频谱产生所述声源信号的所述估计量;其特征在于,:
所述平滑主解码频谱包括多个系数,其中每个系数表示一个频率分量,所述平滑主解码频谱是所述至少一个主解码频谱之一的选择性修改形式,其中减少了表示超出阈值的频率信息的所述系数值中的变化。
14.如权利要求13所述的方法,其特征在于,所述声源信号的所述表示构成所述声源信号本身。
15.如权利要求13所述的方法,其特征在于,所述声源信号的所述表示构成激励信号,所述声源信号可以从该激励信号获得。
16.如权利要求13至15中任何一项所述的方法,其特征在于,通过以下步骤从所述至少一个主解码频谱获得所述平滑主解码信号
将表示超出所述阈值的频率分量的所述至少一个主解码频谱之一的所述系数分成多个频带;
计算所述各个频带内所述系数的平均系数值;以及
将各频带内的所述系数替换为所述各个平均系数值。
17.如权利要求16所述的方法,其特征在于,所述频带是等距的。
18.如权利要求16所述的方法,其特征在于,所述频带部分重叠。
19.如权利要求18所述的方法,其特征在于,通过以下步骤获得所述频带的重叠区域中的结果系数值:
将各频带乘以窗函数以获得相应的加窗频带;以及
在各重叠区域中添加相邻加窗频带的系数值。
20.如权利要求19所述的方法,其特征在于,所述窗函数在非重叠频率区域具有恒定的幅度,并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。
21.如权利要求13至15中任何一项所述的方法,其特征在于,所述至少一个主解码频谱的所述选择性修改涉及:
产生具有一组倒谱系数的倒谱编码信号,每个倒谱系数表示倒谱域中的一个分量;以及
删除所述倒谱编码信号中预定阶和更高阶的倒谱系数。
22.如权利要求21所述的方法,其特征在于,这样选择所述预定阶,使得表示超出所述阈值的频率信息的所述平滑主解码频谱的系数值中的变化减少。
23.如权利要求13所述的方法,其特征在于,所述至少一个已发送编码信号包括:
第一编码信号的第一估计量,构成所述声源信号的编码表示;以及
第二编码信号的第二估计量,表示所述第一编码信号描述所述声源信号的合适程度。
24.如权利要求23所述的方法,其特征在于,所述第二编码信号与所述组合形式相对应,表示目标信号和所述平滑主编码信号之间的频谱比率、或者平滑目标信号和所述主编码信号之间的频谱比率、或者平滑目标信号和平滑主编码信号之间的频谱比率。
25.如权利要求23所述的方法,其特征在于,所述第二编码信号与所述组合形式相对应,表示目标信号和所述平滑主编码信号之间的对数频谱差、或者平滑目标信号和所述主编码信号之间的对数频谱差、或者平滑目标信号和平滑主编码信号之间的对数频谱差。
26.如权利要求23所述的方法,其特征在于,通过以下步骤获得所述声源信号的估计量:
响应于所述第一估计量产生所述至少一个主解码频谱;
响应于所述至少一个主解码频谱产生所述平滑主解码频谱;
响应于所述第二估计量产生均衡频谱;以及
响应于所述均衡频谱和所述平滑主解码频谱产生所述声源信号的所述估计量。
27.一种发射机,用于对声源信号进行编码以产生根据所述声源信号的编码信息,从而通过传输媒体进行传输,所述发射机包括:
主编码器,它具有:输入端,用于接收所述声源信号;以及第一输出端,用于提供表示所述声源信号在感知上的重要特征的基本编码信号,可从中重构所述声源信号的估计量;第二输出端,用于提供表示所述声源信号的滤波形式的目标信号;第三输出端,用于根据所述基本编码信号提供表示重构信号的主编码信号;
至少一个频谱平滑单元,用于响应于所述主编码信号产生平滑主编码信号,该信号构成所述主编码信号在感知上改善了的表示;
量化器,用于根据所述平滑主编码信号和所述目标信号产生第二编码信号,
其特征在于,至少一个频谱平滑单元被设计为通过选择性地修改所述主编码信号,从所述主编码信号产生平滑输出信号,从而减少其表示超出阈值的频率信息的系数值中的变化。
28.如权利要求27所述的发射机,其特征在于,所述至少一个频谱平滑单元包括:
第一缓冲存储器,用于存储所述输入信号的系数,每个系数表示一个频率分量;
处理单元,将超出所述阈值的频率分量所对应的系数分成多个频带,并且为至少一个频带中的各个频带计算存储在所述第一缓冲存储器中的所述系数的平均系数值;
第二缓冲存储器,用于反复存储所述各频带的所述各个平均系数值,存储次数与所述特定频带中所述至少一个基本编码信号的对应系数的数量相同;以及
读出单元,用于从所述第一缓冲存储器读出不大于所述阈值的系数,以及从所述第二缓冲存储器读出超出所述阈值的系数,以形成所述输出信号的所述系数。
29.如权利要求28所述的发射机,其特征在于,所述频带是等距的。
30.如权利要求28或29所述的发射机,其特征在于,所述频带至少部分重叠。
31.如权利要求30所述的发射机,其特征在于,它包括系数组合器,用于通过以下步骤在所述频带的重叠区域中得到结果系数值:
将各频带与窗函数相乘以获得对应的加窗频带;以及
在各重叠区域中添加相邻加窗频带的系数值。
32.如权利要求31所述的发射机,其特征在于,所述窗函数在非重叠频率区域具有恒定的幅度,并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。
33.一种接收机,用于从接收自传输媒体的编码信息解码出声源信号的表示的估计量,它包括频谱平滑单元,该单元具有接收从所述接收的编码信息得到的主解码频谱的输入端,以及提供平滑主解码频谱的输出端;其特征在于,所述平滑主解码频谱包括多个系数,其中每个系数表示一个频率分量,所述频谱平滑单元被设计为通过选择性修改所述主解码频谱,产生所述平滑主解码频谱,从而减少表示超出阈值的频率信息的系数值中的变化;
所述接收机还包括:
重构单元,具有接收所述编码信息中第一发送信号的输入端;以及提供所述主解码频谱的输出端;
均衡解码器,具有接收所述编码信息中第二发送信号的输入端和提供估计的均衡频谱的输出端;以及
均衡器,具有接收所述平滑主解码频谱的第一输入端、接收所述估计均衡频谱的第二输入端以及提供所述声源信号的所述估计量的输出端。
34.如权利要求33所述的接收机,其特征在于,所述频谱平滑单元包括:
第一缓冲存储器,用于存储所述主解码频谱的系数,其中每个系数表示一个频率分量;
处理单元,将超出所述阈值的频率分量所对应的系数分成多个频带,并且为至少一个频带中的各个频带计算存储在所述第一缓冲存储器中的所述系数的平均系数值;
第二缓冲存储器,用于反复存储所述各频带的所述各个平均系数值,存储次数与所述特定频带中所述至少一个基本编码信号的对应系数的数量相同;以及
读出单元,用于从所述第一缓冲存储器读出不大于所述阈值的系数,以及从所述第二缓冲存储器读出超出所述阈值的系数,以形成所述平滑主解码频谱的所述系数。
35.如权利要求34所述的接收机,其特征在于,所述频带是等距的。
36.如权利要求34或35所述的接收机,其特征在于,所述频带至少部分重叠。
37.如权利要求36所述的接收机,其特征在于,它包括系数组合器,用于通过以下步骤在所述频带的重叠区域中得到结果系数值:
将各频带与窗函数相乘以获得对应的加窗频带;以及
在各重叠区域中添加相邻加窗频带的系数值。
38.如权利要求37所述的接收机,其特征在于,所述窗函数在非重叠频率区域具有恒定的幅度,并且在相邻频带重叠的上部和下部过渡区域中幅度逐渐降低。
39.一种通信系统,用于将声源信号从第一节点传输到第二节点,它包括:
如权利要求27-32中任何一项所述的发射机,用于对所述声源信号进行编码以产生编码信息;
如权利要求33-38中任何一项所述的接收机,它具有接收由所述发射机产生的编码信息的输入端,并将所述编码信息解码成所述声源信号的估计量;以及
传输媒体,用于将所述发射机产生的编码信息从所述发射机传送到所述接收机。
CNB018173799A 2000-10-20 2001-09-07 在感知上改善的声音信号编码方法和设备 Expired - Lifetime CN1312658C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP00850172.8 2000-10-20
EP00850172A EP1199812A1 (en) 2000-10-20 2000-10-20 Perceptually improved encoding of acoustic signals

Publications (2)

Publication Number Publication Date
CN1470048A CN1470048A (zh) 2004-01-21
CN1312658C true CN1312658C (zh) 2007-04-25

Family

ID=8175680

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB018173799A Expired - Lifetime CN1312658C (zh) 2000-10-20 2001-09-07 在感知上改善的声音信号编码方法和设备

Country Status (12)

Country Link
US (1) US6611798B2 (zh)
EP (2) EP1199812A1 (zh)
JP (1) JP5222452B2 (zh)
KR (1) KR100832144B1 (zh)
CN (1) CN1312658C (zh)
AT (1) ATE380378T1 (zh)
AU (2) AU8460601A (zh)
CA (1) CA2424373C (zh)
DE (1) DE60131766T2 (zh)
ES (1) ES2296791T3 (zh)
PT (1) PT1328923E (zh)
WO (1) WO2002033692A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105321521A (zh) * 2014-06-30 2016-02-10 美的集团股份有限公司 基于终端运行环境的音频信号编码方法和系统

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002054744A1 (en) * 2000-12-29 2002-07-11 Nokia Corporation Audio signal quality enhancement in a digital network
IL144158A (en) 2001-07-05 2011-06-30 Mosaid Technologies Inc Socket for connecting an analog telephone to a digital communications network that carries digital voice signals
US7308406B2 (en) * 2001-08-17 2007-12-11 Broadcom Corporation Method and system for a waveform attenuation technique for predictive speech coding based on extrapolation of speech waveform
AU2003234763A1 (en) * 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
DE10254612A1 (de) * 2002-11-22 2004-06-17 Humboldt-Universität Zu Berlin Verfahren zur Ermittlung spezifisch relevanter akustischer Merkmale von Schallsignalen für die Analyse unbekannter Schallsignale einer Schallerzeugung
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7075434B2 (en) * 2003-09-22 2006-07-11 Michael Shafir Encoding and decoding method and system
US7536302B2 (en) * 2004-07-13 2009-05-19 Industrial Technology Research Institute Method, process and device for coding audio signals
KR100619893B1 (ko) * 2004-07-23 2006-09-19 엘지전자 주식회사 휴대단말기의 개선된 저전송률 선형예측코딩 장치 및 방법
KR20060067016A (ko) 2004-12-14 2006-06-19 엘지전자 주식회사 음성 부호화 장치 및 방법
US7930176B2 (en) 2005-05-20 2011-04-19 Broadcom Corporation Packet loss concealment for block-independent speech codecs
US8599925B2 (en) * 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7490036B2 (en) * 2005-10-20 2009-02-10 Motorola, Inc. Adaptive equalizer for a coded speech signal
DE602007005729D1 (de) 2006-06-19 2010-05-20 Sharp Kk Signalverarbeitungsverfahren, Signalverarbeitungsvorrichtung und Aufzeichnungsmedium
JP4871894B2 (ja) * 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US7774205B2 (en) * 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
BRPI0917953B1 (pt) * 2008-08-08 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho de atenuação de espectro, aparelho de codificação, aparelho terminal de comunicação, aparelho de estação base e método de atenuação de espectro.
WO2013022426A1 (en) * 2011-08-08 2013-02-14 Hewlett-Packard Development Company, L.P. Method and system for compression of a real-time surveillance signal
JP6791258B2 (ja) * 2016-11-07 2020-11-25 ヤマハ株式会社 音声合成方法、音声合成装置およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1234896A (zh) * 1997-07-11 1999-11-10 索尼株式会社 信息解码方法和装置、信息编码方法和装置以及供应媒体
EP1006510A2 (en) * 1994-03-18 2000-06-07 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US920832A (en) 1906-11-26 1909-05-04 Vickers Sons & Maxim Ltd Automatic gun.
US5307441A (en) 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
US5206884A (en) * 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
IT1241358B (it) * 1990-12-20 1994-01-10 Sip Sistema di codifica del segnale vocale con sottocodice annidato
SG49883A1 (en) 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5526464A (en) 1993-04-29 1996-06-11 Northern Telecom Limited Reducing search complexity for code-excited linear prediction (CELP) coding
US5574825A (en) 1994-03-14 1996-11-12 Lucent Technologies Inc. Linear prediction coefficient generation during frame erasure or packet loss
JP3237089B2 (ja) 1994-07-28 2001-12-10 株式会社日立製作所 音響信号符号化復号方法
JP3970327B2 (ja) * 1996-02-15 2007-09-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴイ 複雑さが軽減された信号送信システム
DE69730779T2 (de) * 1996-06-19 2005-02-10 Texas Instruments Inc., Dallas Verbesserungen bei oder in Bezug auf Sprachkodierung
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
TW408298B (en) * 1997-08-28 2000-10-11 Texas Instruments Inc Improved method for switched-predictive quantization
JPH11296196A (ja) * 1998-04-13 1999-10-29 Hitachi Ltd 音声符号化方法および音声符号化処理装置
JP2000047695A (ja) * 1998-07-29 2000-02-18 Oki Electric Ind Co Ltd 符号化装置及び復号化装置
US6182030B1 (en) * 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1006510A2 (en) * 1994-03-18 2000-06-07 Mitsubishi Denki Kabushiki Kaisha Signal encoding and decoding system
CN1234896A (zh) * 1997-07-11 1999-11-10 索尼株式会社 信息解码方法和装置、信息编码方法和装置以及供应媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105321521A (zh) * 2014-06-30 2016-02-10 美的集团股份有限公司 基于终端运行环境的音频信号编码方法和系统
CN105321521B (zh) * 2014-06-30 2019-06-04 美的集团股份有限公司 基于终端运行环境的音频信号编码方法和系统

Also Published As

Publication number Publication date
PT1328923E (pt) 2008-02-28
EP1199812A1 (en) 2002-04-24
CA2424373A1 (en) 2002-04-25
US20020049584A1 (en) 2002-04-25
ES2296791T3 (es) 2008-05-01
US6611798B2 (en) 2003-08-26
EP1328923A1 (en) 2003-07-23
WO2002033692A1 (en) 2002-04-25
KR20030048061A (ko) 2003-06-18
EP1328923B1 (en) 2007-12-05
DE60131766T2 (de) 2008-11-13
AU2001284606B2 (en) 2007-01-25
AU8460601A (en) 2002-04-29
KR100832144B1 (ko) 2008-05-27
ATE380378T1 (de) 2007-12-15
DE60131766D1 (de) 2008-01-17
CN1470048A (zh) 2004-01-21
JP2004515801A (ja) 2004-05-27
JP5222452B2 (ja) 2013-06-26
CA2424373C (en) 2011-08-30

Similar Documents

Publication Publication Date Title
CN1312658C (zh) 在感知上改善的声音信号编码方法和设备
JP7438268B2 (ja) 快適雑音の生成のサポート
RU2381571C2 (ru) Синтезирование монофонического звукового сигнала на основе кодированного многоканального звукового сигнала
JP3898218B2 (ja) 差動符号化法を実行する伝送システム
KR101346462B1 (ko) 신호 부호화 장치 및 방법, 신호 복호 장치 및 방법, 및 기록 매체
CN102177542B (zh) 能量保留多通道音频编码
CN1942928B (zh) 用于处理音频信号的模块和方法
JP4777918B2 (ja) 音声処理装置及び音声を処理する方法
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
KR101161866B1 (ko) 오디오 코딩 장치 및 그 방법
KR101693280B1 (ko) 오디오 데이터 처리 방법, 장치 및 시스템
CN109473114A (zh) 元数据驱动的动态范围控制
KR20040063076A (ko) 부호화 장치 및 복호화 장치
US5845251A (en) Method, system and product for modifying the bandwidth of subband encoded audio data
AU2001284606A1 (en) Perceptually improved encoding of acoustic signals
KR20190057052A (ko) 잡음 환경에 적응적인 신호 처리방법 및 장치와 이를 채용하는 단말장치
KR20230018550A (ko) 시간-도메인 스테레오 코딩 및 디코딩 방법, 및 관련 제품
JPH11242499A (ja) 音声符号化/復号化方法および音声信号の成分分離方法
KR102632523B1 (ko) 시간-도메인 스테레오 파라미터에 대한 코딩 방법, 및 관련 제품

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term

Granted publication date: 20070425

CX01 Expiry of patent term