CN101836250B - 用于处理信号的方法及装置 - Google Patents

用于处理信号的方法及装置 Download PDF

Info

Publication number
CN101836250B
CN101836250B CN200880112671XA CN200880112671A CN101836250B CN 101836250 B CN101836250 B CN 101836250B CN 200880112671X A CN200880112671X A CN 200880112671XA CN 200880112671 A CN200880112671 A CN 200880112671A CN 101836250 B CN101836250 B CN 101836250B
Authority
CN
China
Prior art keywords
signal
information
frequency
spread foundation
reconstruction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880112671XA
Other languages
English (en)
Other versions
CN101836250A (zh
Inventor
吴贤午
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101836250A publication Critical patent/CN101836250A/zh
Application granted granted Critical
Publication of CN101836250B publication Critical patent/CN101836250B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program

Abstract

公开了一种处理信号的方法。本发明包括接收第一信号和第二信号的至少一个,获得模式信息和指示第一信号是否被修改的修改标记信息,如果按照模式信息确定为音频编码方案,则通过所述音频编码方案解码所述第一信号,如果基于所述修改标记信息所述第一信号被修改,则通过将修改重建信息应用于所述第一信号来重建所述第一信号,基于扩展信息确定对应于所述第一信号的部分区域的扩展基础信号,以及使用所述扩展基础信号和所述扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。按照本发明的信号处理方法和装置,在通过第一编码方案解码第一信号之后,在执行编码时使用用于重建在时域中修改的所述第一信号的修改重建信息来调整所述第一信号。因此,能够提供编码效率提高的信号。

Description

用于处理信号的方法及装置
技术领域
本发明特别地适用于按照信号特征通过适宜的方案编码或者解码信号。
背景技术
通常,语音编码器能够以低于12kps的低比特率编码语音信号,而音频编码器能够以高于48kbp的高比特率提供高质量的音频信号。
发明内容
技术问题
但是,常规的音频编码器在处理语音信号方面是低效的。并且,常规的语音编码器不适用于处理音频信号。
技术解决方案
因此,本发明涉及一种用于处理信号的装置及其方法,其基本上消除了由于相关技术的限制和缺点而导致的一个或多个的问题。
本发明的一个目的是提供一种用于处理信号的装置及其方法,通过该装置及其方法可以使用确定编码方案的模式信息和在第一信号的时域上调整间隔的修改重建信息,按照声源的特征有效地处理信号。
本发明的另一个目的提供一种用于处理信号的装置及其方法,通过该装置及其方法可以按照声源的特征以以下的方式有效地处理信号,即,使用带宽扩展技术以各种方式确定用于重建由编码器侧去除的高频区域的扩展基础信号。
有益效果
因此,本发明提供以下的效果或者优点。
首先,在用于处理信号的装置及其方法中,在第一信号通过第一编码方案编码之前,第一信号的时域的时间间隔的大小被修改。然后通过第一编码方案编码第一信号。因此,本发明能够按照声源的特征提高编码效率。
其次,在用于处理信号的装置及其方法中,按照信号的特征将对应于下混信号的部分频率区域的信号用作用于带宽扩展的扩展基础信号。因此,本发明能够重建具有各种带宽的下混信号的高频区域。
附图说明
该伴随的附图被包括以提供对本发明进一步的理解,并且被结合进和构成本说明书的一部分,其图示本发明的实施例,并且与该说明书一起起到解释本发明原理的作用。
在附图中:
图1是按照本发明的一个实施例用于编码信号的装置的示意图;
图2是按照本发明的一个实施例的带宽扩展编码单元的示意图;
图3是在图2中所示的带宽扩展编码单元中用于编码信号的方法的流程图;
图4是按照本发明另一个实施例在图1中所示的信号编码装置的部分示意图;
图5是在图2中所示的信号编码装置中用于编码信号的方法的流程图;
图6是按照本发明的另一个实施例用于解码信号的装置的示意图;
图7是按照本发明另一个实施例在第一编码方案解码单元和第一信号修正单元中用于信号流的示意图;
图8是按照图7用于信号解码方法的流程图;
图9A至9G是按照本发明另一个实施例用于处理修改的信号的方法的示意图;
图10A和图10B是在应用在图9中示出的信号处理方法前后测量存在或者不存在预回声出现的图形;
图11是按照本发明的另一个实施例的带宽扩展信号解码单元的示意图;
图12是在图11中所示的带宽扩展信号解码单元中用于信号解码方法的流程图;
图13A至13D是按照本发明另一个实施例用于产生带宽扩展信号的方法的示意图;
图14A至14D是按照本发明再一实施例用于产生多信道信号的方法的示意图;和
图15是按照本发明又一实施例用于产生多信道信号的方法的示意图。
具体实施方式
本发明的附加的特点和优点将在随后的描述中阐述,并且从该描述中在某种程度上将是清晰可见的,或者可以通过本发明的实践习得。通过尤其在著述的说明书及其权利要求以及所附的附图中指出的结构,可以实现和获得本发明的目的和其他的优点。
为了实现这些和其他的优点,以及按照本发明的目的,如在此处实施和广泛地描述的,按照本发明的处理信号的方法,包括:接收从由第一信号和第二信号组成的组中选择的至少一个,获得模式信息和指示第一信号是否被修改的修改标记信息,如果按照模式信息确定为音频编码方案,则通过音频编码方案解码第一信号,如果基于修改标记信息第一信号被修改,则通过将修改重建信息应用到第一信号来重建第一信号,基于扩展信息确定对应于第一信号的部分区域的扩展基础信号,以及使用扩展基础信号和扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。
按照本发明,音频编码方案可以包括在频域中基于时频变换的编码方案,以及语音编码方案是基于线性预测编码方案的编码方案。
按照本发明,音频编码方案可以包括将第一信号重建到时域,并且将该修改重建信息应用到第一信号。
按照本发明,修改标记信息可以指示第一信号在时域是否被修改。
为了进一步实现这些和其他的优点,以及按照本发明的目的,一种处理信号的方法,包括:接收扩展信息和从由音频编码方案解码的第一信号和由语音编码方案解码的第二信号组成的组中选择的至少一个下混信号,确定对应于下混信号的部分区域的扩展基础信号,以及使用扩展基础信号和扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。
按照本发明,高频区域信号的带宽可以不等于扩展基础信号的带宽。
按照本发明,扩展信息可以包括从由应用到下混信号的滤波器的范围扩展基础信号的开始频率和扩展基础信号的结束频率组成的组中选择的至少一个。
按照本发明,该扩展基础信号可以包括对应于下混信号的部分频率区域的信号。
按照本发明,使用扩展信息确定扩展基础区域可以基于带宽扩展标记信息来执行,所述带宽扩展标记信息指示是否使用扩展信息重建下混信号的高频区域信号。
为了进一步实现这些和其他的优点,以及按照本发明的目的,一种用于处理信号的装置,包括:信号接收单元,接收扩展信息和从由音频编码方案解码的第一信号和由语音编码方案解码的第二信号组成的组中选择的至少一个下混信号;扩展基础区域确定单元,确定在下混信号中的扩展基础信号;以及高频区域信号重建单元,使用扩展基础信号和扩展信息产生具有通过重建高频区域信号扩展的带宽的扩展下混信号。
应该明白,上文的概述和下面的详细说明是示范性和说明性的,并且意欲提供权利要求所述的对本发明的进一步的说明。
现在将详细地参考本发明的优选实施例,在伴随的附图中图示其例子。首先,在本说明书和权利要求书中使用的术语或者用词不被解释为局限于常规的或者字典含义,并且应该被解释为基于发明人能够恰当地定义该术语的概念以最好的方式描述发明人的发明的原则,匹配本发明的技术思想的含义和概念。在本公开中公开的实施例和在伴随的附图中所示的结构仅是一个优选实施例,并且不表示本发明的所有技术思想。因此,应该理解,本发明覆盖对本发明的修改和变化,只要这些修改和变化落入在提交本申请的时间点上所附的权利要求书及其等效的范围之内。
首先,应该理解,在本发明中,概念“编码”包括编码和解码两者。
其次,在本公开中,“信息”是通常包括值、参数、系数、要素等的术语,并且有时可以将其含义理解为不同的,本发明不限于此。在本公开中将立体声信号作为信号的例子,本发明的例子不限于此。例如,在本公开中的信号可以包括具有至少三个或更多的信道的多信道信号。
在本公开中,第一信号指示由第一编码方案编码的信号,并且第二信号指示由第二编码方案编码的信号。第一信号可以包括音频信号,并且第二信号可以包括语音信号,本发明不限于此。另外,在以下的说明中描述的第一编码方案用于具有音频编码方案相同的含义,并且第二编码方案用于具有语音编码方案相同的含义。
图1示出按照本发明实施例的信号编码装置100。参考图1,信号编码装置100包括多信道编码单元110、带宽扩展信号编码单元120、信号修改单元130、第一编码方案编码单元140、第二编码方案编码单元150和多路复用单元160。
多信道编码单元110接收具有多个信道(在下文中缩写为多信道)的信号输入。多信道编码单元110通过对输入的多信道信号下混产生下混信号,并且也产生对应于多信道信号的空间信息。该空间信息可以包括信道水平差信息(CLD)、信道预测系数(CPC)、信道间相关信息(ICC)、下混增益信息(DMG)等。
带宽扩展信号编码单元120接收下混信号的输入,去除对应于高频的区域,并且然后仅编码对应于低频区域的信号。带宽扩展信号编码单元120产生对应于去除的高频区域的扩展信息,使其包括在空间信息中,并且然后传送包括在空间信息中的扩展信息。稍后将参考图2和图3描述这个过程的细节。
基于信号的特征确定是否通过第一编码方案或者第二编码方案编码输入信号。并且,产生确定编码方案的模式信息(在该图中未示出)。在这种情况下,第一编码方案可以对应于音频编码方案(音频信号方案)。音频编码方案可以包括使用MDCT(修改的离散余弦变换)的方案,本发明不限于此。第二编码方案可以对应于语音编码方案。语音编码方案可以遵循AMR-WB(自适应多速率宽带)标准,本发明不限于此。并且,该模式信息可以包括指示由第一编码方案执行编码的第一模式,和指示由第二编码方案执行编码的第二模式。
信号修改单元130接收确定要由第一编码方案编码的信号的输入,在按照第一编码方案编码信号之前,基于信号的特征(例如,信号大小、段长等)产生修改重建信息,并且然后应用该修改重建信息来修改相应的信号。稍后将参考图4和图5描述这个过程的细节。
第一编码方案编码单元140按照第一编码方案编码由信号修改单元130修改的信号。由第一编码方案编码单元140产生的信号称作第一信号。第一信号可以包括音频信号或者可以进一步包括少许语音信号。并且,第一编码方案编码单元140可以包括频域编码单元。
第二编码方案编码单元150基于该信号的特征按照第二编码方案编码信号。由第二编码方案编码单元150产生的信号称作第二信号。第二信号可以包括语音信号或者可以进一步包括少许音频信号。第二编码方案编码单元150可以进一步使用线性预测编码(LPC)方案。在输入信号在时间轴上具有高的冗余度情况下,可以通过用于从过去信号预测当前信号的线性预测来模拟。在这种情况下,可以通过采用线性预测编码方案提高编码效率。另外,第二编码方案编码单元150可以包括时域编码单元。
多路复用单元160使用包括编码的模式信息、修改重建信息和扩展信息的空间信息产生比特流来传送第一信号和第二信号。在这种情况下,可以将模式信息表示为标记信息。另外,进一步包括修改标记信息以指示信号是否已经被信号修改单元130修改。
图2示出按照本发明一个实施例的带宽扩展编码单元120,并且图3是在带宽扩展编码单元120中用于编码信号的方法的流程图。
参考图2,带宽扩展编码单元120包括高频区域去除单元121、扩展信息产生单元122和空间信息插入单元123。
高频区域去除单元121接收由多信道编码单元110产生的下混信号和空间信息。在这种情况下,下混信号可以包括在频域中的信号,并且可以包括低频信号和高频信号。高频区域去除单元121产生去除的下混信号和包括高频区域的开始和结束频率的重建信息,其中,去除的下混信号是通过从下混信号(在下文中,“下混信号”指示具有由高频区域去除单元121去除高频信号的低频信号的下混信号)的频率信号中去除高频区域的高频信号产生的。
能够基于输入信号的特征确定重建信息。高频信号的开始频率是对应于输入信号的整个带宽一半的频率。相反地,重建信息能够按照输入信号的特征将开始频率确定为等于或高于整个带宽的一半的频率,或者等于或者低于整个带宽的一半的频率。例如,如果将下混信号的整个带宽信号用于多信道编码的下混信号比通过使用带宽扩展技术去除高频区域的编码更有效的情形,重建信息能够使用开始频率指示位于带宽的端部的频率。能够使用信号大小、在编码的情况下使用的段长和信源类型的至少一个确定重建信息,本发明不限于此。
扩展信息产生单元122使用下混信号和空间信息产生确定扩展基础信号的扩展信息(其将用于解码)。扩展基础信号是用于重建在编码时被高频区域去除单元121去除的下混合信号的高频信号的下混合信号的频率信号。并且,扩展基础信号可以包括低频信号或者低频信号的部分信号。
扩展信息可以匹配由高频区域去除单元121剩余的下混信号的信息,本发明不限于此。例如,扩展信息可以包括对应于下混信号的部分信号的信息。在扩展信息是对应于下混信号的部分信号的信息的情况下,扩展信息可以包括扩展基础信号的开始频率和扩展基础信号的结束频率。并且,扩展信息能够进一步包括应用于下混信号的频率信号的滤波器范围。
空间信息插入单元123产生空间信息,所述空间信息以由高频区域去除单元121产生的重建信息和由扩展信息产生单元122产生的扩展信息被插入在由多信道编码单元110产生的空间信息中的方式配置。
参考图3,首先,从输入信号中产生下混信号和空间信息[S310]。去除下混信号的高频区域,并且产生重建[S320]。如在先前的描述中提及的,该重建信息可以使用信号大小、在编码的情况下使用的段长和声源类型的至少一个确定。并且,该重建信息指示去除的信号的开始和结束频率。
随后,基于输入信号的特征使用下混信号和空间信息产生用于确定供解码使用的扩展基础信号的扩展信息[S330]。扩展信息可以是对应于下混信号的部分信号的信息。扩展信息可以包括扩展基础信号的开始频率和扩展基础信号的结束频率,并且能够进一步包括应用于下混信号的频率信号的滤波器范围。并且,能够将重建信息和扩展信息插入在空间信息中[S340]。
按照本发明一个实施例的信号编码装置100可变地确定被带宽扩展编码单元120去除的下混信号的高频区域信号,从而能够按照输入信号的特征更有效地执行编码。按照本发明一个实施例的信号编码装置100产生和传送扩展信息,从而能够可变地使用低频信号以重建高频区域信号。
图4是按照本发明另一个实施例在图1中所示的信号编码装置的部分示意图,和图5是按照本发明另一个实施例用于编码信号的方法的流程图。
参考图4,按照指示输入信号的编码方案的模式信息,确定是否通过第一编码方案或者第二编码方案编码输入信号。如果确定第二编码方案,则第二编码方案编码单元420与信号编码装置100的第二编码方案编码单元150相同。其细节将省略。
如果按照模式信息输入信号被确定是由第一编码方案编码,则信号修改单元410基于输入信号的特征修改该信号。该特征可以包括信号的大小、在编码时分段的段长等。例如,由于由第一编码方案编码单元使用的MDCT的变换单元的大小与用于语音信号编码的分段大小不同,所以可以显著地降低在编码时的效率。如果是这样,通过修改段的大小或者由第一编码方案编码单元430应用的窗口的大小,信号修改单元410能够提高第一编码方案编码单元430的编码效率。为了修改段的大小或者应用的窗口的大小,能够调整在时域中的时间单位间隔。在这种情况下,能够产生用于产生修改信号所需的信息作为修改重建信息。另外,信号修改单元410能够产生指示信号是否被修改的修改标记信息。
如果确定第一编码方案,则第一编码方案编码单元430与信号编码装置100的第一信号编码方案编码单元140相同,并且多路复用单元440与信号编码装置的多路复用单元160相同。因此,其细节在以下的描述中省略。
参考图5,基于输入信号的特征确定模式。然后产生指示所确定的模式的模式信息[S510]。在这种情况下,该模式信息可以指示遵循第一编码方案的第一模式,或者遵循第二编码方案的第二模式。随后,确定模式信息是否指示第一模式[S520]。
如果模式信息指示第一模式,则基于输入信号的特征确定是否修改输入信号[S530]。如在先前的描述中提及的,为了确定是否修改,能够考虑输入信号的大小、用于编码分段的段长等。例如,如果由第一编码方案编码单元使用的窗口的大小与用于输入信号编码的段的大小不同或者产生预回声,则该输入信号被修改,并然后由第一编码方案编码。因此,解决了预回声,或者能够更加有效地编码输入信号。
如果输入信号的修改被确定,则在输入信号由第一编码方案编码之前,通过应用修改重建信息修改该信号。然后能够产生指示该信号是否被修改的修改标记信息[S540]。在这种情况下,该修改重建信息可以通过第一编码方案调整应用到编码中的窗口的长度。修改重建信息可以应用到在时域中。修改重建信息可以是用于调整输入信号的大小的增益值。在这种情况下,可以基于线性预测域系数(LPC)确定该增益值。
通过将修改重建信息应用到其中而修改的信号由第一编码方案编码[S550]。如在先前的描述中提及的,由第一编码方案编码的信号可以是第一信号。并且,第一信号可以包括音频信号或者可以进一步包括少许音频信号。
同时,在第一模式确定步骤S520中没有确定为第一模式的信号不经过修改信号的步骤,而是由第二编码方案编码[S535]。编码的信号可以是第二信号。并且,第二信号可以包括语音信号或者可以进一步包括少许语音信号。
图6示出用于解码信号的装置600。参考图6,信号解码装置600包括接收单元610、信息获得单元620、第一编码方案解码单元630、第一信号修正单元640、第二编码方案解码单元650、带宽扩展解码单元660和多信道解码单元670。
接收单元610能够接收由信号编码装置100编码的所有信号。接收单元610能够接收第一和第二信号的至少一个。接收单元610能够进一步接收模式信息、修改标记信息、扩展信息、下混信号和空间信息的至少一个。
信息获得单元620能够从接收单元610获得用于确定编码方案的模式信息、指示第一信号是否被修改的修改标记信息和扩展信息。
第一编码方案解码单元630通过第一编码方案解码信号。第一编码方案解码单元630能够通过使用修改重建信息修改信号来解码信号。由第一编码方案解码单元630解码的信号可以是第一信号。在这种情况下,第一信号能够包括音频信号或者可以进一步包括少许语音信号。第一编码方案解码单元630是音频编码方案解码单元,并且能够包括频域解码单元。并且,第一编码方案解码单元630能够使用MDCT。
只有在编码时基于修改标记信息修改第一信号时,第一信号修改单元640才修改第一信号。第一信号修改单元640能够使用修改重建信息以应用于第一信号。稍后将参考图7和图8解释此过程的细节。
第二编码方案解码单元650通过第二编码方案解码信号。由第二编码方案解码单元650解码的信号可以是第二信号。在这种情况下,第二信号可以包括语音信号或者可以进一步包括少许音频信号。第二编码方案解码单元650可以是语音编码方案解码单元。第二编码方案解码单元650可以包括时域解码单元,其能够进一步使用线性预测编码(LPC)方案。
带宽扩展解码单元660接收由第一编码方案解码单元630解码的信号的至少一个下混信号,和由第二编码方案解码单元650解码的信号,并且然后能够重建对应于在编码时去除的高频区域的信号。稍后将参考图11至13解释此过程的细节。
多信道解码单元670接收具有重建的高频区域的下混信号和空间信息,并且然后通过将空间信息应用于下混信号解码具有多信道的信号。
图7是按照本发明另一个实施例在第一编码方案解码单元和第一信号修正单元中用于信号流程的示意图,和图8是按照图7用于信号解码方法的流程图。
首先,参考图7,将模式信息和修改标记信息输入到第一编码方案解码单元730。修改标记信息指示第一信号在编码时是否被修改。尤其是,修改标记信息指示第一信号是否在时域或者频域被修改。如果基于修改标记信息确定第一信号没有被修改,则第一信号由第一编码方案解码单元730按照第一编码方案解码,并且然后输出无需输入到第一信号修改单元740。如在先前的描述中提及的,第一编码方案解码单元730按照音频编码方案解码。
如果基于修改标记信息确定第一信号被修改,则输入的第一信号在产生修改重建信息的同时由第一编码方案解码。在该修改重建信息从编码器传送的情况下,能够从比特流中提取修改重建信息。相反地,如果未从编码器传送修改重建信息,则有可能基于第一信号的特征由第一编码方案解码单元730产生修改重建信息。可以为第一信号提供修改重建信息以在按照第一编码方案编码时在时域中调整时间单位间隔。可以提供修改重建信息以调整应用到第一信号的窗口的长度。修改重建信息可以是在时域中应用的信息。另外,修改重建信息可以是用于调整输入信号大小的增益值。在这种情况下,可以基于线性预测域系数(LPC)确定该增益值。
第一信号修改单元740接收修改重建信息和第一信号,并且然后能够在时域中通过重建第一信号的修改的时间单位间隔解码原始信号。
参考图8,首先,获得模式信息和修改标记信息[S810]。如果该模式信息指示第一模式,则通过第一编码方案解码第一信号[S820]。随后,获得指示第一信号是否被修改的修改标记信息[S830]。如果该修改标记信息被设置为1[在步骤S830中,“是”],则第一信号通过应用修改重建信息被修改[S840]。如在先前的描述中提及的,修改重建信息可以是用于在第一信号的时域中调整时间单位间隔的值,用于调整第一信号的大小的增益值,或者用于调整应用于第一信号的窗口长度的值。
相反地,如果修改标记信息未被设置为1[在步骤S830中,“否”],则第一信号可以原样输出无需修正[S840]。
因此,在按照本发明的信号解码装置和方法中,当编码由第一编码方案解码的第一信号时,如果在时域中的时间单位间隔被修改,则该修改的第一信号可以被重建为在使用修改重建信息修改之前的信号。因此,可以按照信号的特征有效地执行解码。
同时,如果第一信号由第一编码方案编码单元使用具有比该信号的长度更长的窗口以在转换间隔中变换,则能够在频域中通过位分配控制噪声。另一方面,由于在时域中噪声均匀分布在窗口内,如果具有低能级的信号位于前端位置,则噪声比信号相对高,由此产生用户听到该噪声的预回声效果。
因此,按照本发明的另一个实施例,提出了类似相关领域的频域,在时域中调整噪声(噪声整形)的方法以解决该预回声问题。
图9示出按照本发明另一个实施例处理第一信号的方法。图9A至9D示出按照本发明另一个实施例编码第一信号的方法。图9E至9G示出对应于编码方法的解码方法。
在图9A中,输入信号x(t)被分成用于在时域中处理的信号单元X。参考图9A,可以将输入信号x(t)分割为四个子块。对应于子块的信号可以分别地包括分段信号X0、X1、X2和X3。参考图9B,能够确定在时域中用于调整子块的每个分段信号大小的修改重建信息W(w0,w1,w2,w3)。该修改重建信息可以是每分段信号确定的时域中的增益值。在这种情况下,该增益值可以是实际上应用于该分段信号,或者以与应用于分段信号的值相反形式配置的值。如果应用于分段信号的增益值变得越大,则使用更多的位执行量化。因此,可以产生较小的量化噪声。
参考图9C,能够通过将修改重建信息(w0,w1,w2,w3)应用于分段信号(X0,X1,X2,X3)产生修改信号X′。图9D示出通过使用转换为频域的修改信号,从使用相关领域的频域掩码特征执行感知编码中获得的量化噪声Qt。图9D图示的,该量化噪声可以是在整个时域中具有均匀分布的能量的信号。另外,优选地,在频域中用于位分配的声学模型操作使用分段信号X代替修改信号X′。
在传送给解码器侧的第一信号已经在频域中重建之后,如果重建的信号是倒置的,则能够获得将量化噪声Qt包括在调整信号X′[在图中未示出]中的传送信号。
图9E示出应用于传送信号的修改重建信息V。该修改重建信息V可以是与应用于块信号的增益值倒置的值(1/w0,1/w1,1/w2,1/w3)。
图9F示出从将修改重建信息V应用于传送信号获得的重建信号Y。重建信号V可以是在编码器侧中具有与修改信号X′相同形状的信号。但是,当调整按照修改重建信息编码的量化噪声Qt时,如图9G所示,能够获得在时域调整的调整量化噪声Qr。
因此,按照本发明的另一个实施例,确定应用于在时域中信号的修改重建信息,并且然后可以使用该修改重建信息确定每个块的临时的位分配信息。另外,通过在具有很小信号能级的区域中降低量化噪声的能级,能够防止预回声效果。
图10A和图10B是在应用图9A至9G中示出的信号处理方法前后测量预回声出现的图形。
参考图10A,由于在常规的信号处理器中在时域中噪声均匀分布在整个频带上,如果在信号的前面部分存在具有很小能级的信号,则出现预回声效果使得用户能够听到前面部分的噪声。
在图10B中示出,如果在时域中使用修改重建信息调整量化噪声,则在存在具有很小能级的信号的区域中,量化噪声的能级被调整去降低。因此,可以解决预回声效果的问题。
图11是按照本发明另一个实施例的带宽扩展信号解码单元的示意图。
参考图11,带宽扩展信号解码单元110包括信号接收单元1110、扩展基础区域确定单元1120、高频区域重建单元1130和带宽扩展单元1140。
信号接收单元1110接收由第一编码方案解码的第一信号和由第二编码方案解码的第二信号的至少一个下混信号和扩展信息。输入给信号接收单元1110的下混信号包括以高频区域由编码器侧去除的方式由原始信号的流频率区域的信号配置的信号。
扩展基础区域确定单元1120能够基于由信号接收单元1110接收的扩展信息确定下混信号的扩展基础信号。在这种情况下,该下混信号可以是出现在频域中的信号,并且该扩展基础信号可以是在频域中位于下混信号的部分频率区域中的信号。扩展信息用于确定该扩展基础信号,并且可以包括扩展基础信号的开始和结束频率,或者用于滤除下混信号的部分的滤波器的范围。
高频区域重建单元1130从信号接收单元1110接收下混信号和扩展信息,以及从扩展基础区域确定单元1120接收扩展基础信号。该扩展基础信号能够使用扩展信息重建由编码器侧去除的下混信号的高频区域信号。在这种情况下,能够进一步使用接收的重建信息。高频区域信号可以是不包括在下混信号中,而是包括在原始信号中的信号。当重建高频区域信号时,能够产生带宽被扩展的扩展下混信号。
该高频区域信号可以不是下混信号的整数倍数。并且,高频区域信号的带宽可以不与扩展基础信号的带宽相同。
在按照本发明一个实施例的信号处理装置和方法中,不使用具有由编码器侧去除的高频区域的整个下混信号,而是对应于下混信号的部分频率区域的信号作为扩展基础信号,虽然重建的高频区域不是下混信号的整数倍数,但其能够使用带宽扩展技术。
高频区域重建单元1130可以进一步包括时间扩展的下混信号产生单元和频率信号扩展单元。该时间扩展的下混信号产生单元能够通过将扩展信息应用于扩展基础信号将下混信号扩展到时域。并且,该频率信号扩展单元能够通过递减时间扩展的下混信号的采样数目(抽取)在下混信号的频域中扩展信号。
因此,按照本发明另一个实施例的带宽扩展解码单元1100进一步包括时间扩展的下混信号产生单元和频率信号产生单元,其能够按照修改重建信息调整带宽扩展的范围。
如果高频区域重建单元1130不包括低频区域信号,而是包括重建的高频区域信号,则带宽扩展单元1140产生扩展下混信号,其中带宽被以带宽扩展单元1140将下混信号和高频区域信号合成在一起的方式扩展。在这种情况下,该高频区域信号可能不对应于下混信号的整数倍数。因此,按照本发明一个实施例的带宽扩展技术可用于上采样为不在倍数关系中的信号。
图12是按照本发明另一个实施例在带宽扩展信号解码单元中用于信号解码方法的流程图。
参考图12,接收下混信号和扩展信息[S1210]。在这种情况下,下混信号可以是在频域中的信号,或者仅包括低频区域信号的信号,高频区域信号从由编码器侧产生的下混信号中去除。并且,扩展信息可以包括应用于下混信号的滤波器范围、扩展基础信号的开始频率和扩展基础信号的结束频率的至少一个。
随后,使用下混信号和扩展信息确定扩展基础信号[S1220]。在这种情况下,扩展基础信号可以是对应于下混信号的部分频率区域的信号。并且,扩展基础信号的确定可以基于指示是否使用扩展信息重建下混信号的高频区域信号的带宽扩展标记信息执行。尤其是,只有在带宽扩展标记信息被设置为1的时候,才能够确定扩展基础信号。
使用扩展基础信号和扩展信息重建高频区域信号[S1230]。在这种情况下,该高频区域信号可以包括不包括在从编码器侧传送的下混信号中而是包括在输入给编码器的原始信号中的信号。如在先前的描述中提及的,由于扩展基础信号是不对应于整个下混信号,而是对应于下混信号的部分频率区域的信号,因此高频区域信号可以是不为下混信号整数倍数的信号。
随后,通过将下混信号和重建的高频区域信号合成在一起,产生具有扩展带宽的扩展下混信号[S1240]。
如果该扩展基础信号不是基于带宽扩展标记信息确定的,即,如果带宽扩展标记信息被设置为0,则使用下混信号和重建信息产生高频区域信号[S1245]。并且,扩展下混信号是通过将下混信号和高频区域信号组合在一起产生的[S1240]。在这种情况下,扩展下混信号可以是具有总计达到下混信号整数倍数带宽的信号,尤其是,下混信号的两倍。另外,可以在高频区域信号的重建同时地产生扩展下混信号,而不是分别地执行[S1240]。
图13A至13D是按照本发明另一个实施例用于产生带宽扩展信号的方法的示意图,其中“Fc”指示扩展基础信号的结束频率。图13A示出按照常规方法的带宽扩展处理方法。
参考图13A,在编码时,整个频带除以2,扩展基础信号(对应于整个频率的1/2的低频区域的信号)通过由第一或者第二编码方案编码来传送,并且对应于总计达到整个信号的1/2的频率区域的扩展信号通过使用扩展信息编码来传送。
在解码时,通过使用由第一或者第二编码方案解码的扩展基础信号和扩展信息以与编码相反的方式解码扩展信号来重建整个信号。
参考图13B,扩展基础信号通过选择对应于整个频带的1/4的信号编码。使用扩展基础信号将对应于整个频带的2/4至3/4区域的信号(扩展信号1)编码为扩展信息。并且,使用扩展基础信号将对应于整个频带的4/4区域的信号(再扩展信号)编码为扩展信息。
因此,在执行解码时,扩展基础信号通过第一或者第二编码方案解码,并且然后使用扩展基础信号和扩展信息重建扩展信号1。随后,使用扩展信息和扩展信号1,重建对应于下混信号的高频区域的再扩展信号。因此,在执行带宽扩展编码时仅使用对应于整个频率区域的1/4的信号作为扩展基础信号能够提高压缩比。
参考图13C,使用对应于整个频率区域的1/4的扩展基础信号将分别对应于2/4、3/4和4/4区域的扩展信号1、扩展信号2和扩展信号3编码为扩展信息。在解码时,使用扩展基础信号和扩展信息顺序地解码扩展信号1、扩展信号2和扩展信号3。
在按照本发明另一个实施例的带宽扩展方法中,如图13C所示,扩展基础信号、扩展信号1、扩展信号2和扩展信号3可以具有相同的带宽,本发明不限于此。例如,这些信号可以具有彼此不同的带宽。并且,能够通过设置扩展基础信号的比例因子以频率区域被修正很大或者很小的方式解码扩展信号1、扩展信号2和扩展信号3。
图13D示出按照本发明另一个实施例的信号解码方法。
参考图13D,作为扩展基础信号,其能够选择通过第一或者第二编码方案解码的信号的部分信号(Fb至Fc区域的一个)。因此,其能够重建高频区域,该高频区域不对应于使用扩展基础信号编码的下混信号的整数倍数。
图14A至14D是按照本发明再一个实施例用于产生多信道信号的方法的示意图。在这种情况下,通过带宽扩展获得的信号被定义为扩展信号、扩展信号1或者扩展信号2,并且通过经由多信道解码器等信道扩展获得的信号称作立体声信号。
参考图14A,扩展基础信号通过带宽扩展重建下混信号的高频区域信号[步骤1]。随后,通过信道扩展从重建的下混信号中解码立体声信号[步骤2]。
在图14B中图示,通过信道扩展从扩展基础信号中产生立体声信号[步骤1]。随后,通过基于立体声信号扩展带宽,重建整个频率区域的立体声信号[步骤2和步骤3]。这适合于在整个下混信号的低频区域中具有更多信息和声音图像的信号。
参考图14C,立体声信号以类似于以前的方法的方式通过信道扩展从扩展基础信号中产生[步骤1]。随后,为了通过扩展带宽重建整个频率区域的立体声信号,使用扩展基础信号解码扩展信号1和扩展信号2[步骤2和步骤3]。由于扩展基础信号是具有该信号核心特征的信号,优选地,从扩展基础信号中解码扩展信号2。尤其是,其适合于在立体声信号的左和右信道信号之间具有高度相关的信号的解码。例如,适合于语音信号的解码。
参考图14D,通过信道扩展从扩展基础信号中解码立体声信号[步骤1]。然后通过带宽扩展从扩展基础信号解码扩展信号1[步骤2]。随后,使用扩展基础信号、扩展信号1和立体声信号,重建扩展信号2[步骤3-1至3-3]。因此,能够编码更多的有机立体声信号。
图15是按照本发明另一个实施例用于产生多信道信号的方法的示意图。
参考图15,按照本发明产生多信道信号的方法包括使用基础信号重建单声信号、单声扩展信号、立体声信号和立体声扩展信号的方法。在这种情况下,基础信号可以包括残留信号。
本发明应用的解码/编码方法可以作为计算机可读的代码在程序记录介质中实现。并且,具有本发明数据结构的多媒体数据可以存储在计算机可读的记录介质中。计算机可读的记录介质包括各种存储设备,由计算机系统可读的数据存储在该存储设备中。计算机可读的介质例如包括ROM、RAM、CD-ROM、磁带、软性磁盘、光数据存储设备等,并且还包括载波型实施(例如,经由因特网的传输)。并且,由编码方法产生的比特流存储在计算机可读的记录介质中,或者可以经由有线/无线通信网络传送。
虽然在此处已经参考优选实施例描述和图示了本发明,但对于那些本领域技术人员来说显而易见,在不脱离本发明的精神和范围的情况下,可以在其中进行各种修改和变化。因此,本发明意欲覆盖落入所附的权利要求和其等效范围之内的本发明的改进和变化。
工业实用性
因此,本发明适用于信号的编码和解码。

Claims (13)

1.一种处理音频信号的方法,包括:
接收第一信号和第二信号的至少一个;
获得模式信息和修改标记信息,所述模式信息用于确定编码方案,所述修改标记信息指示所述第一信号是否被修改;
如果所述模式信息指示音频编码方案,则通过所述音频编码方案解码所述第一信号;
如果所述修改标记信息指示所述第一信号被修改,则基于修改重建信息通过修改应用于所述第一信号的窗口的大小来重建所述第一信号;
基于扩展信息确定对应于所述第一信号的部分区域的扩展基础信号;和
使用所述扩展基础信号和所述扩展信息产生具有通过重建高频区域信号而扩展的带宽的扩展下混信号,
其中,通过在时域中扩展所述扩展基础信号以生成时间扩展的扩展基础信号并且通过抽取所述时间扩展的扩展基础信号来重建所述高频区域信号。
2.根据权利要求1的方法,其中,所述音频编码方案包括在频域中使用时间-频率变换的编码方案。
3.根据权利要求2的方法,其中,所述音频编码方案包括将所述第一信号重建到时域,并且其中将所述修改重建信息应用于所述第一信号。
4.根据权利要求1的方法,其中,所述修改标记信息指示第一信号在时域中是否被修改。
5.根据权利要求1的方法,其中,所述高频区域信号的带宽与所述扩展基础信号的带宽不相同。
6.根据权利要求1的方法,其中,所述扩展信息包括应用于所述下混信号的滤波器范围、所述扩展基础信号的开始频率和所述扩展基础信号的结束频率的至少一个。
7.根据权利要求1的方法,其中,所述修改重建信息包括所述第一信号的增益值调整水平。
8.根据权利要求7的方法,其中,基于线性预测域系数确定所述增益值。
9.一种用于处理音频信号的装置,包括:
接收单元,接收第一信号和第二信号的至少一个;
信息获得单元,获得用于确定编码方案的模式信息和指示所述第一信号是否被修改的修改标记信息;
音频编码方案解码单元,如果所述模式信息指示音频编码方案,则通过音频编码方案解码所述第一信号;
第一信号修改单元,如果所述修改标记信息指示所述第一信号被修改,则基于修改重建信息通过修改应用于所述第一信号的窗口的大小来修改所述第一信号;
扩展基础区域确定单元,基于扩展信息在所述下混信号中确定扩展基础信号;和
高频区域信号重建单元,使用所述扩展基础信号和所述扩展信息产生具有通过重建高频区域信号而扩展的带宽的扩展下混信号,
其中,通过在时域中扩展所述扩展基础信号以生成时间扩展的扩展基础信号并且通过抽取所述时间扩展的扩展基础信号来重建所述高频区域信号。
10.根据权利要求9的装置,其中,所述音频编码方案包括在频域中使用时间-频率变换的编码方案。
11.根据权利要求9的装置,其中,所述音频编码方案解码单元包括将所述第一信号重建到时域的时域重建单元。
12.根据权利要求11的装置,其中,所述第一信号修改单元将所述修改重建信息应用到从所述时域重建单元输入的所述第一信号。
13.根据权利要求9的装置,其中,所述扩展基础区域确定单元将在所述下混信号中位于部分频率区域中的信号确定为扩展基础信号。
CN200880112671XA 2007-11-21 2008-11-21 用于处理信号的方法及装置 Active CN101836250B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US98945207P 2007-11-21 2007-11-21
US98945007P 2007-11-21 2007-11-21
US60/989,450 2007-11-21
US60/989,452 2007-11-21
PCT/KR2008/006882 WO2009066959A1 (en) 2007-11-21 2008-11-21 A method and an apparatus for processing a signal

Publications (2)

Publication Number Publication Date
CN101836250A CN101836250A (zh) 2010-09-15
CN101836250B true CN101836250B (zh) 2012-11-28

Family

ID=40667696

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880112671XA Active CN101836250B (zh) 2007-11-21 2008-11-21 用于处理信号的方法及装置
CN200880117301.5A Active CN101868821B (zh) 2007-11-21 2008-11-21 用于处理信号的方法和装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200880117301.5A Active CN101868821B (zh) 2007-11-21 2008-11-21 用于处理信号的方法和装置

Country Status (11)

Country Link
US (3) US8527282B2 (zh)
EP (2) EP2218068A4 (zh)
JP (2) JP2011504250A (zh)
KR (2) KR101586317B1 (zh)
CN (2) CN101836250B (zh)
AU (2) AU2008326956B2 (zh)
BR (1) BRPI0820488A2 (zh)
CA (2) CA2705968C (zh)
MX (1) MX2010002629A (zh)
RU (2) RU2010125221A (zh)
WO (2) WO2009066959A1 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
AU2015246158B2 (en) * 2009-03-17 2017-10-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
MX2011009660A (es) 2009-03-17 2011-09-30 Dolby Int Ab Codificacion estereo avanzada basada en una combinacion de codificacion izquierda/derecha o media/lateral seleccionable de manera adaptable y de codificacion estereo parametrica.
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
IL205394A (en) * 2010-04-28 2016-09-29 Verint Systems Ltd A system and method for automatically identifying a speech encoding scheme
KR102632248B1 (ko) 2010-07-19 2024-02-02 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
KR101697550B1 (ko) 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
BR112013016438B1 (pt) 2010-12-29 2021-08-17 Samsung Electronics Co., Ltd Método de codificação, método de decodificação, e mídia de gravação legível por computador não transitória
EP2710588B1 (en) * 2011-05-19 2015-09-09 Dolby Laboratories Licensing Corporation Forensic detection of parametric audio coding schemes
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
KR101897455B1 (ko) 2012-04-16 2018-10-04 삼성전자주식회사 음질 향상 장치 및 방법
US9552818B2 (en) * 2012-06-14 2017-01-24 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
JP6141978B2 (ja) 2012-08-03 2017-06-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン マルチチャネル・ダウンミックス/アップミックス構成のためのパラメトリックコンセプトを採用したマルチインスタンス方式の空間音響オブジェクト符号化用のデコーダおよびその方法
PL3232437T3 (pl) 2012-12-13 2019-05-31 Fraunhofer Ges Forschung Urządzenie do kodowania głosowego audio, urządzenie do dekodowania głosowego audio, sposób kodowania głosowego audio i sposób dekodowania głosowego audio
KR101757349B1 (ko) 2013-01-29 2017-07-14 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 부대역들의 시간적 평활을 이용하여 주파수 향상 신호를 발생시키는 장치 및 방법
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830054A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP3067886A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
EA034371B1 (ru) 2015-08-25 2020-01-31 Долби Лэборетериз Лайсенсинг Корпорейшн Аудиодекодер и способ декодирования
CN105792031B (zh) * 2016-03-08 2019-01-11 烽火通信科技股份有限公司 一种OTN中GMP映射产生Cn值的方法
CN117392988A (zh) 2016-09-28 2024-01-12 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
CN110691824B (zh) 2017-06-01 2021-05-25 日东化成株式会社 防污涂料组合物、在表面具有利用该组合物形成的防污涂膜的涂装物

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1527995A (zh) * 2001-11-14 2004-09-08 ���µ�����ҵ��ʽ���� 编码设备和解码设备
CN1629937A (zh) * 1997-06-10 2005-06-22 编码技术股份公司 采用频带复现增强源编码
EP1668959B1 (en) * 2003-10-02 2007-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Compatible multi-channel coding/decoding

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US127729A (en) * 1872-06-11 Improvement in power-indicators for steam-engines
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
DE19900819A1 (de) * 1999-01-12 2000-07-13 Bosch Gmbh Robert Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
US7039044B1 (en) * 1999-10-14 2006-05-02 Mindspeed Technologies, Inc. Method and apparatus for early detection of DTMF signals in voice transmissions over an IP network
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7346499B2 (en) * 2000-11-09 2008-03-18 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
AU2003281128A1 (en) 2002-07-16 2004-02-02 Koninklijke Philips Electronics N.V. Audio coding
JP2004198485A (ja) 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
WO2004072956A1 (en) * 2003-02-11 2004-08-26 Koninklijke Philips Electronics N.V. Audio coding
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
ES2281795T3 (es) 2003-04-17 2007-10-01 Koninklijke Philips Electronics N.V. Sintesis de señal de audio.
KR20050121733A (ko) 2003-04-17 2005-12-27 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 발생
DE602004007786T2 (de) * 2003-05-01 2008-04-30 Nokia Corp. Verfahren und vorrichtung zur quantisierung des verstärkungsfaktors in einem breitbandsprachkodierer mit variabler bitrate
DE602004027750D1 (de) 2003-10-23 2010-07-29 Panasonic Corp Spektrum-codierungseinrichtung, spektrum-decodierungseinrichtung, übertragungseinrichtung für akustische signale, empfangseinrichtung für akustische signale und verfahren dafür
US7613607B2 (en) * 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
DE102004021062A1 (de) 2004-04-29 2005-11-24 Siemens Ag Verfahren zur Herstellung von Leiterplatten und/oder entsprechenden Konstrukten
CN1954364B (zh) * 2004-05-17 2011-06-01 诺基亚公司 带有不同编码帧长度的音频编码
JP2007538281A (ja) * 2004-05-17 2007-12-27 ノキア コーポレイション 異なる符号化モデルを用いる音声符号化
EP1749296B1 (en) * 2004-05-28 2010-07-14 Nokia Corporation Multichannel audio extension
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
WO2006107833A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
AU2006266655B2 (en) 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP4699117B2 (ja) * 2005-07-11 2011-06-08 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
JP2009524099A (ja) 2006-01-18 2009-06-25 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
KR20070081735A (ko) * 2006-02-13 2007-08-17 엘지전자 주식회사 오디오 신호의 인코딩/디코딩 방법 및 장치
KR20080087909A (ko) * 2006-01-19 2008-10-01 엘지전자 주식회사 신호 디코딩 방법 및 장치
ATE527833T1 (de) * 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
TWI333346B (en) * 2006-11-28 2010-11-11 Inst Information Industry Communication apparatus, method, application program, and computer readable medium thereof for switching channels in a beacon network
EP2122157A1 (de) * 2007-03-09 2009-11-25 Beru AG Verfahren und vorrichtung zur glühkerzenerregungssteuerung
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
AU2008326956B2 (en) * 2007-11-21 2011-02-17 Lg Electronics Inc. A method and an apparatus for processing a signal
WO2010040381A1 (en) * 2008-10-06 2010-04-15 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for delivery of aligned multi-channel audio

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1629937A (zh) * 1997-06-10 2005-06-22 编码技术股份公司 采用频带复现增强源编码
CN1527995A (zh) * 2001-11-14 2004-09-08 ���µ�����ҵ��ʽ���� 编码设备和解码设备
EP1668959B1 (en) * 2003-10-02 2007-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Compatible multi-channel coding/decoding

Non-Patent Citations (8)

* Cited by examiner, † Cited by third party
Title
3GPP.《3rd Generation Partnership Project
3GPP.《3rd Generation Partnership Project Technical Specification Group Service and System Aspects Audio codec processing functions Extended AMR Wideband codec;Transcoding functions》.《3rd Generation Partnership Project Transcoding functions》.2004, *
Audio codec processing functions
Extended AMR Wideband codec
Jeroen Breebaart et.al.spatial psychoacoustics as the basis for innovations in the field of audio coding and processing.《19th INTERNATIONAL CONGRESS ON ACOUSTICS》.2007,第1-6页. *
Technical Specification Group Service and System Aspects
Transcoding functions》.《3rd Generation Partnership Project
Transcoding functions》.2004,

Also Published As

Publication number Publication date
EP2218068A1 (en) 2010-08-18
EP2210253A4 (en) 2010-12-01
AU2008326957B2 (en) 2011-06-30
WO2009066959A1 (en) 2009-05-28
US8583445B2 (en) 2013-11-12
JP2011504249A (ja) 2011-02-03
MX2010002629A (es) 2010-06-02
WO2009066960A1 (en) 2009-05-28
KR101221918B1 (ko) 2013-01-15
RU2449387C2 (ru) 2012-04-27
EP2218068A4 (en) 2010-11-24
CA2705968A1 (en) 2009-05-28
CN101868821A (zh) 2010-10-20
KR20100095585A (ko) 2010-08-31
US20100274557A1 (en) 2010-10-28
US20100305956A1 (en) 2010-12-02
RU2010125251A (ru) 2011-12-27
AU2008326957A1 (en) 2009-05-28
KR20100085018A (ko) 2010-07-28
RU2010125221A (ru) 2011-12-27
US8527282B2 (en) 2013-09-03
AU2008326956B2 (en) 2011-02-17
JP2011504250A (ja) 2011-02-03
CA2697830C (en) 2013-12-31
US20100211400A1 (en) 2010-08-19
BRPI0820488A2 (pt) 2017-05-23
CA2697830A1 (en) 2009-05-28
KR101586317B1 (ko) 2016-01-18
CN101868821B (zh) 2015-09-23
CA2705968C (en) 2016-01-26
US8504377B2 (en) 2013-08-06
CN101836250A (zh) 2010-09-15
AU2008326956A1 (en) 2009-05-28
EP2210253A1 (en) 2010-07-28

Similar Documents

Publication Publication Date Title
CN101836250B (zh) 用于处理信号的方法及装置
US8817992B2 (en) Multichannel audio coder and decoder
JP5934922B2 (ja) 復号装置
CN101933086B (zh) 处理音频信号的方法和设备
CN100546233C (zh) 用于支持多声道音频扩展的方法和设备
EP1749296B1 (en) Multichannel audio extension
KR101823278B1 (ko) 결합하여 인코딩된 잔류 신호들을 이용하는 오디오 인코더, 오디오 디코더, 방법들 및 컴퓨터 프로그램
CN102007534B (zh) 用于处理音频信号的方法和装置
KR101444102B1 (ko) 스테레오 오디오의 부호화, 복호화 방법 및 장치
KR101967122B1 (ko) 신호 처리 장치 및 방법, 및 프로그램
EP2431971B1 (en) Audio decoding method and audio decoder
US20070081597A1 (en) Temporal and spatial shaping of multi-channel audio signals
US20020049586A1 (en) Audio encoder, audio decoder, and broadcasting system
EP2625688B1 (en) Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
CN102165520B (zh) 处理信号的方法和装置
CN101202043B (zh) 音频信号的编码方法和装置与解码方法和装置
CN1571993A (zh) 用于改善高频重建的方法
CN105103225A (zh) 立体声音频编码器和解码器
CN105308680A (zh) 音频编码器和解码器
CN101506875B (zh) 用于组合多个参数编码的音频源的设备和方法
CN101292285A (zh) 编码和解码多声道音频信号的方法及其装置
KR20080066537A (ko) 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치
KR101786863B1 (ko) 고 주파수 복원 알고리즘들을 위한 주파수 대역 테이블 설계
WO2024051955A1 (en) Decoder and decoding method for discontinuous transmission of parametrically coded independent streams with metadata
KR20070108312A (ko) 오디오 신호의 인코딩/디코딩 방법 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant