CN101868821B - 用于处理信号的方法和装置 - Google Patents

用于处理信号的方法和装置 Download PDF

Info

Publication number
CN101868821B
CN101868821B CN200880117301.5A CN200880117301A CN101868821B CN 101868821 B CN101868821 B CN 101868821B CN 200880117301 A CN200880117301 A CN 200880117301A CN 101868821 B CN101868821 B CN 101868821B
Authority
CN
China
Prior art keywords
signal
information
frequency
decoding scheme
expansion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200880117301.5A
Other languages
English (en)
Other versions
CN101868821A (zh
Inventor
吴贤午
郑亮源
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101868821A publication Critical patent/CN101868821A/zh
Application granted granted Critical
Publication of CN101868821B publication Critical patent/CN101868821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234309Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by transcoding between formats or standards, e.g. from MPEG-2 to MPEG-4 or from Quicktime to Realvideo
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/63Control signaling related to video distribution between client, server and network components; Network processes for video distribution between server and clients or between remote clients, e.g. transmitting basic layer and enhancement layers over different transmission paths, setting up a peer-to-peer communication via Internet between remote STB's; Communication protocols; Addressing
    • H04N21/637Control signals issued by the client directed to the server or network components
    • H04N21/6377Control signals issued by the client directed to the server or network components directed to server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8126Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts
    • H04N21/8133Monomedia components thereof involving additional data, e.g. news, sports, stocks, weather forecasts specifically related to the content, e.g. biography of the actors in a movie, detailed information about an article seen in a video program

Abstract

本发明公开了一种处理信号的方法。本发明包括接收扩展信息和用音频译码方案解码的第一向下混频信号和用语音译码方案解码的第二向下混频信号的至少一个向下混频信号;基于扩展信息来确定对应于向下混频信号的部分区域的扩展基信号;以及生成扩展向下混频信号,所述扩展向下混频信号具有通过使用扩展基信号和扩展信息重构高频区域信号而扩展的带宽。根据本发明的信号处理方法和装置,使用对应于向下混频信号的部分频率区域的信号作为扩展基信号。因此,通过使用具有可变带宽的扩展基信号来重构向下混频信号的高频区域。

Description

用于处理信号的方法和装置
技术领域
本发明特别适合于根据信号的特性通过适当的方案对信号进行编码或解码。
背景技术
通常,语音编码器能够以低于12kps的低比特率对语音信号进行编码,而音频编码器能够以48kbp以上的高比特率提供高质量的音频信号。
发明内容
技术问题
然而,传统音频编码器在处理语音信号时效率低。并且,传统语音编码器不适合于处理音频信号。
技术解决方案
因此,本发明涉及一种基本上消除了由于相关技术的限制和缺点而引起的一个或多个问题的用于处理信号的装置及其方法。
本发明的目的是提供一种用于处理信号的装置及其方法,由此,可以使用确定译码方案的模式信息和调整第一信号的时域上的间隔的修改重构信息,根据声源的特性来高效地处理信号。
本发明的另一目的是提供一种用于处理信号的装置及其方法,由此,可以以不同地确定用于被编码器侧去除的高频率区域的重构的扩展基信号从而使用带宽扩展技术的方式,根据声源的特性高效地处理信号。
有利效果
因此,本发明提供以下效果或优点。
首先,在用于处理信号的装置及其方法中,在由第一译码方案对第一信号进行编码之前,修改第一信号的时域的时间间隔的大小。然后由第一译码方案对第一信号进行编码。因此,本发明能够根据声源的特性提高编码效率。
其次,在用于处理信号的装置及其方法中,使用根据信号特性的与向下混频信号的部分频率区域相对应的信号作为用于带宽扩展的扩展基信号。因此,本发明能够重构具有各种带宽的向下混频信号的高频区域。
附图说明
被包括进来以便提供对本发明的进一步理解的附图被并入本说明书中并构成本说明书的一部分,在附图中示出了本发明的实施例,并连同说明书一起用于解释本发明的原理。
在所述附图中:
图1是根据本发明的一个实施例的用于编码信号的装置的示意图;
图2是根据本发明的一个实施例的带宽扩展编码单元的示意图;
图3是用于在图2所示的带宽扩展编码单元中对信号进行编码的方法的流程图;
图4是根据本发明的另一实施例的图1所示的信号编码装置的部分示意图;
图5是用于在图2所示的信号编码装置中对信号进行编码的方法的流程图;
图6是根据本发明的另一实施例的用于对信号进行解码的装置的示意图;
图7是用于根据本发明的另一实施例的第一译码方案解码单元和第一信号修改单元中的信号流的示意图;
图8是用于根据图7的信号解码方法的流程图;
图9A至9G是用于根据本发明的另一实施例的处理已修改信号的方法的图示;
图10A和图10B是在应用图9所示的信号处理方法前后测量前向回波事件的存在和不存在的图表;
图11是根据本发明的另一实施例带宽扩展信号解码单元的示意图;
图12是用于图11所示的带宽扩展信号解码单元中的信号解码方法的流程图;
图13A至13D是用于根据本发明的另一实施例的生成带宽扩展信号的方法的图示;
图14A至14D是用于根据本发明的另一实施例的生成多通道信号的方法的图示;以及
图15是用于根据本发明的另一实施例的生成多通道信号的方法的图示。
具体实施方式
本发明的其它特征和优点将在后面的说明中得到部分阐述,其部分地将通过说明而变得显而易见,或者可以通过对本发明的实践而了解到。本发明的目标及其它优点将由在书面说明及其权利要求以及附图中特别指出的结构来实现和获得。
为了实现这些和其它优点及依照本发明的目的,如所体现和广泛描述的那样,根据本发明的处理信号的方法包括对从由第一信号和第二信号组成的组选择的至少一个进行接收,获得模式信息和指示第一信号是否被修改的修改标识信息,如果其被根据所述模式信息而确定为音频译码方案,则由音频译码方案对第一信号进行解码,如果基于所述修改标识信息来修改第一信号,则通过对第一信号应用修改重构信息来重构第一信号,基于扩展信息来确定对应于第一信号的部分区域的扩展基信号,并生成具有通过使用扩展基信号和扩展信息来重构高频区域信号而扩展的带宽的扩展向下混频信号。
根据本发明,所述音频译码方案可以包括基于时频变换的频域中的译码方案,并且所述语音译码方案是基于线性预测译码方案的译码方案。
根据本发明,所述音频译码方案包括将第一信号重构到时域中,并且所述修改重构信息被应用于第一信号。
根据本发明,所述修改标识信息可以指示第一信号是否在时域中被修改。
为了进一步实现这些和其它优点,以及依照本发明的目的,一种处理信号的方法包括对扩展信息和对从由经音频译码方案解码的第一信号和经语音译码方案解码的第二信号组成的组中选择的至少一个向下混频信号进行选择,确定对应于向下混频信号的部分区域的扩展基信号,并生成扩展向下混频信号,所述扩展向下混频信号具有通过使用扩展基信号和扩展信息来重构高频区域信号而扩展的带宽。
根据本发明,高频区域的带宽可以不等于扩展基信号的带宽。
根据本发明,所述扩展信息可以包括从由应用于向下混频信号的一系列滤波器、扩展基信号的起始频率、和扩展基信号的截止频率组成的组中选择的至少一个。
根据本发明,所述扩展基信号包括对应于向下混频信号的部分频率区域的信号。
根据本发明,可以基于指示是否使用扩展信息来重构向下混频信号的高频区域信号的带宽扩展标识信息,来执行使用扩展信息的扩展基区域的确定。
为了进一步实现这些和其它优点,以及依照本发明的目的,一种用于处理信号的装置包括:信号接收单元,其接收扩展信息和从由经音频译码方案解码的第一信号和经由语音译码方案解码的第二信号组成的组中选择的至少一个向下混频信号;扩展基区域确定单元,其确定在向下混频信号中的扩展基信号;以及高频区域信号重构单元,其生成扩展向下混频信号,所述扩展向下混频信号具有通过使用扩展基信号和扩展信息来重构高频区域信号而扩展的带宽。
应理解的是本发明的前述一般说明及以下详细说明均是示例性和说明性的,且意图提供权利要求所述的本发明的进一步说明。
发明模式
现在将对本发明的优选实施例进行详细的参考,其示例在附图中示出。首先,不应将在本说明书和权利要求中使用的术语或词语理解为限于一般或辞典上的意义,而是应基于发明人能够适当地定义术语的概念以最好地描述发明人的发明的原则,将其理解为与本发明的技术思想匹配的意义和概念。在本公开中公开的实施例和在附图中示出的配置仅仅是一个优选实施例,且不表示本发明的所有技术思想。因此,应理解的是本发明涵盖对本发明的修改和变更,只要它们在提交本申请的时间点在所附权利要求书及其等价物的范围内即可。
首先,应理解的是本发明中的概念‘译码’包括编码和解码两者。
其次,本公开中的‘信息’是一般包括值、参数、系数、元素等的术语且偶尔可以将其理解为不同的意义,本发明不限于此。以立体声信号作为本公开中的信号的示例,本发明的示例不限于此。例如,本公开中的信号可以包括具有至少三个或多个通道的多通道信号。
在本公开中,第一信号指示由第一译码方案编码的信号,且第二信号指示由第二译码方案编码的信号。第一信号可以包括音频信号,且第二信号可以包括语音信号,本发明不限于此。此外,将在以下说明中描述的第一译码方案用作具有与音频译码方案相同的意义,并将第二译码方案用作具有与语音译码方案相同的意义。
图1示出根据本发明的实施例的信号编码装置100。参照图1,信号编码装置100包括多通道编码单元110、带宽扩展信号编码单元120、信号修改单元130、第一译码方案编码单元140、第二译码方案编码单元150和复用单元160。
多通道编码单元110接收具有多个通道(在下文中缩写为多通道)的信号的输入。多通道编码单元110通过对输入的多通道信号进行向下混频来生成向下混频信号,而且生成对应于多通道信号的空间信号。所述空间信息可以包括通道声级差信息(CLD)、通道预测系数(CPC)、通道间相关性信息(ICC)、向下混频增益信息(DMG)等。
带宽扩展信号编码单元120接收向下混频信号的输入,去除对应于高频的区域,并随后仅将对应于低频区域的信号进行编码。带宽扩展信号编码单元120生成对应于被去除的高频区域的扩展信息,使其被包括在空间信息中,并随后传输包括在空间信息中的扩展信息。稍后将参照图2和图3来描述此过程的细节。
基于信号的特性来确定是用第一译码方案还是第二译码方案来对输入信号进行编码。并且,生成确定译码方案的模式信息(图中未示出)。在这种情况下,第一译码方案可以对应于音频译码方案(音频信号方案)。该音频译码方案可以包括使用MDCT(改进的离散余弦变换)的方案,本发明不限于此。第二译码方案可以对应于语音译码方案。语音译码方案可以遵循AMR-WB(自适应多速率带宽)标准,本发明不限于此。并且,所述模式信息可以包括指示由第一译码方案执行编码的第一模式和指示由第二译码方案执行编码的第二模式。
信号修改单元130接收被确定为由第一译码方案编码的信号的输入,在根据第一译码方案对该信号编码之前基于信号的特性(例如,信号大小、片断长度等)生成修改重构信息,并随后应用该修改重构信息来修改相应的信号。稍后将参照图4和图5来描述此过程的细节。
第一译码方案编码单元140根据第一译码方案对经信号修改单元130修改的信号进行编码。由第一译码方案编码单元140生成的信号称为第一信号。第一信号可以包括音频信号,或者还可以包括少许语音信号。并且,第一译码方案编码单元140可以包括频域编码单元。
第二译码方案编码单元150基于信号特性来根据第二译码方案对信号进行编码。由第二译码方案编码单元150生成的信号称为第二信号。第二信号可以包括语音信号,或者还可以包括少许音频信号。第二译码方案编码单元150还可以使用线性预测译码(LPC)方案。在输入信号具有时间轴上的高冗余的情况下,可以通过用于根据过去的信号来预测当前信号的线性预测对其进行建模。在这种情况下,可以通过采用线性预测译码方案来提高编码效率。此外,第二译码方案编码单元150可以包括时域编码单元。
复用单元160使用包括已编码模式信息、修改重构信息和扩展信息、第一信号和第二信号的空间信息来生成要传送的比特流。在这种情况下,可以将模式信息表示为标识信息。此外,还包括修改标识信息以指示信号是否已被信号修改单元130修改。
图2示出根据本发明的一个实施例的带宽扩展编码单元120,并且图3是用于在带宽扩展编码单元120中对信号进行编码的方法的流程图。
参照图2,带宽扩展编码单元120包括高频区域去除单元121、扩展信息生成单元122和空间信息插入单元123。
高频区域去除单元121接收由多通道编码单元110生成的空间信息和向下混频信号。在这种情况下,所述向下混频信号可以包括频域中的信号且可以包括低频信号和高频信号。高频区域去除单元121生成高频区域的包括起始和截止频率的重构信息,以及已去除向下混频信号,其中,通过从向下混频信号的频率信号中去除高频区域的高频信号来生成所述已去除向下混频信号(在下文中,‘向下混频信号’指示具有已被高频区域去除单元121去除高频信号的低频信号的向下混频信号)。
能够基于输入信号的特性来确定重构信息。高频信号的起始频率是对应于输入信号的整个带宽的一半的频率。相反,所述重构信息能够根据输入信号的特性将起始频率确定为等于或高于整个带宽的一半的频率,或者等于或低于整个带宽的一半的频率。例如,如果将向下混频信号的整个带宽信号用于多通道编码向下混频信号比通过使用带宽扩展技术去除高频区域来编码更加高效,则重构信息能够使用起始频率来指示位于带宽的结尾部分的频率。能够使用信号大小、在编码的情况下使用的片断长度、和源的类型中的至少一个来确定重构信息,并且本发明不限于此。
扩展信息生成单元122使用向下混频信号和空间信息来生成确定扩展基信号的扩展信息,其将被用于解码。扩展基信号是用来重构向下混频信号的高频信号的向下混频信号的频率信号,所述高频信号在编码时被高频区域去除单元121去除。并且,所述扩展基信号可以包括低频信号或低频信号的部分信号。
扩展信息可以与高频区域去除单元121剩余的向下混频信号的信息匹配,本发明不限于此。例如,扩展信息可以包括对应于向下混频信号的部分信号的信息。在扩展信息是对应于向下混频信号的部分信号的信息的情况下,扩展信息可以包括扩展基信号的起始频率和扩展基信号的截止频率。并且,扩展信息还能够包括应用于向下混频信号的频率信号的一系列滤波器。
空间信息插入单元123生成以将由高频区域去除单元121生成的重构信息和由扩展信息生成单元122生成的扩展信息插入由多通道编码单元110生成的空间信息中的方式来配置的空间信息。
参照图3,首先,根据输入信号生成向下混频信号和空间信息[S310]。去除向下混频信号的高频区域并生成重构[S320]。如前述说明所述,可以使用信号大小、在编码的情况下使用的片断长度、和声源的类型中的至少一个来确定重构信息。并且,重构信息指示已去除信号的起始和截止频率。
随后,基于输入信号的特性,使用向下混频信号和空间信息来生成用于对将被用于解码的扩展基信号进行确定的扩展信息[S330]。扩展信息可以是对应于向下混频信号的部分信号的信息。扩展信息可以包括扩展基信号的起始频率和扩展基信号的截止频率,还能够包括应用于向下混频信号的频率信号的一系列滤波器。并且,可以将重构信息和扩展信息插入空间信息中[S340]。
根据本发明的一个实施例的信号编码装置100可变地确定被带宽扩展编码单元120去除的向下混频信号的高频区域信号,从而能够根据输入信号的特性更高效地执行编码。根据本发明的一个实施例的信号编码装置100生成并传输扩展信息,从而能够可变地将低频信号用于高频区域信号的重构。
图4是根据本发明的另一实施例的图1所示的信号编码装置的部分示意图,并且图5是根据本发明的另一实施例的用于对信号进行编码的方法的流程图。
参照图4,根据指示输入信号的译码方案的模式信息,确定是用第一译码方案还是第二译码方案来对输入信号进行编码。如果确定第二译码方案,则第二译码方案编码单元420与信号编码装置100的第二译码方案编码单元150相同。应省略其细节。
如果根据模式信息确定将用第一译码方案对输入信号进行编码,则信号修改单元410基于输入信号的特性来修改信号。该特性可以包括信号的大小、在编码中分段的片断长度等。例如,由于第一译码方案编码单元所使用的MDCT的变换单元的大小不同于用于语音信号编码的片断的大小,所以编码的效率可能被显著降低。如果是这样,通过修改片断的大小或修改由第一译码方案编码单元430应用的窗口的大小,信号修改单元410能够提高第一译码方案编码单元430的编码效率。为了修改片断的大小或应用窗口的大小,可以调整时域中的时间单位间隔。在这种情况下,可以生成要生成作为修改重构信息的已修改信号所需的信息。此外,信号修改单元410能够生成指示信号是否被修改的修改标识信息。
如果确定第一译码方案,则第一译码方案编码单元430与信号编码装置100的第一信号译码方案编码单元140相同,且复用单元440与信号编码装置的复用单元160相同。因此,在以下说明中将省略其细节。
参照图5,基于输入信号的特性来确定模式。然后生成指示所确定的模式的模式信息[S510]。在这种情况下,模式信息可以指示遵循第一译码方案的第一模式,或遵循第二译码方案的第二模式。随后,确定该模式信息是否指示第一模式[S520]。
如果模式信息指示第一模式,则基于输入信号的特性来确定是否修改输入信号[S530]。如前述说明所述,为了确定是否进行了修改,可以考虑输入信号的大小、为了编码而分段的片断长度等。例如,如果第一译码方案编码单元所使用的窗口的大小不同于用于输入信号编码的片断的大小,或者生成前向回波,则修改输入信号并随后用第一译码方案进行编码。因此,解决了前向回波,或者可以更高效地对输入信号进行编码。
如果确定了输入信号的修改,则通过在用第一译码方案对输入信号进行编码之前,应用修改重构信息来修改该信号。然后,能够生成指示信号是否被修改的修改标识信息[S540]。在这种情况下,修改重构信息可以调整在用第一译码方案进行编码时应用的窗口的长度。可以在时域中应用修改重构信息。修改重构信息可以是用于调整输入信号的大小的增益值。在这种情况下,可以基于线性预测域系数(LPC)来确定该增益值。
用第一译码方案对通过向其应用修改重构信息而修改的信号进行编码[S550]。如前述说明所述,用第一译码方案编码的信号可以是第一信号。并且,第一信号可以包括音频信号,或者还可以包括少许音频信号。
同时,在第一模式确定步骤S520中,未被确定为第一模式的信号不经历修改信号的步骤,而是用第二译码方案对其进行编码[S535]。已编码信号可以是第二信号。并且,第二信号可以包括语音信号,或者还可以包括少许语言信号。
图6示出用于对信号进行解码的装置600。参照图6,信号解码装置600包括接收单元610、信息获得单元620、第一译码方案解码单元630、第一信号修改单元640、第二译码方案解码单元650、带宽扩展解码单元660和多通道解码单元670。
接收单元610能够接收经信号编码装置100编码的所有信号。接收单元610能够接收第一和第二信号中的至少一个。接收单元610还能够接收模式信息、修改标识信息、扩展信息、向下混频信号和空间信息中的至少一个。
信息获得单元620能够从接收单元610获得用于确定译码方案的模式信息、指示第一信号是否被修改的修改标识信息、和扩展信息。
第一译码方案解码单元630用第一译码方案对信号进行解码。第一译码方案解码单元630能够通过使用修改重构信息修改信号来对信号进行解码。由第一译码方案解码单元630解码的信号可以是第一信号。在这种情况下,第一信号可以包括音频信号,或者还可以包括少许语音信号。第一译码方案解码单元630是音频译码方案解码单元,且可以包括频域解码单元。并且,第一译码方案解码单元630能够使用MDCT。
只有当基于修改标识信息,在编码中对第一信号进行修改时,第一信号修改单元640才修改第一信号。第一信号修改单元640能够使用修改重构信息来应用到第一信号。稍后将参照图7和图8来解释此过程的细节。
第二译码方案解码单元650由第二译码方案对信号进行解码。由第二译码方案解码单元650解码的信号可以是第二信号。在这种情况下,第二信号可以包括语音信号,或者还可以包括少许音频信号。第二译码方案解码单元650可以是语音译码方案解码单元。第二译码方案解码单元650可以包括能够进一步使用线性预测译码(LPC)方案的时域解码单元。
带宽扩展解码单元660接收由第一译码方案解码单元630解码的信号和由第二译码方案解码单元650解码的信号的至少一个向下混频信号,然后能够重构与在编码中被去除的高频区域相对应的信号。稍后将参照图11至13来解释此过程的细节。
多通道解码单元670接收具有重构的高频区域的向下混频信号和空间信息,并随后通过将空间信息应用于向下混频信号来对具有多通道的信号进行解码。
图7是根据本发明的另一个实施例的在第一译码方案解码单元和第一信号修改单元中的信号流的示意图,并且图8是用于根据图7的信号解码方法的流程图。
首先,参照图7,将模式信息和修改标识信息输入到第一译码方案解码单元730。该修改标识信息指示第一信号在编码的情况下是否被修改。特别地,修改标识信息指示第一信号是在时域还是频域中被修改。如果基于该修改标识信息确定第一信号未被修改,则通过第一译码方案解码单元730根据第一译码方案对第一信号进行解码,并且第一信号随后被输出而不是输入到第一信号修改单元740。如前述说明所述,第一译码方案解码单元730根据音频译码方案进行解码。
如果基于修改标识信息确定第一信号被修改,则用第一译码方案对输入的第一信号进行解码,同时生成修改重构信息。在从编码器传输修改重构信息的情况下,可以从比特流中提取修改重构信息。相反,如果不是从编码器传输修改重构信息,则可以由第一译码方案解码单元730基于第一信号的特性生成修改重构信息。可以为第一信号提供修改重构信息,以便在根据第一译码方案编码时调整时域中的时间单位间隔。修改重构信息可以被提供用于调整应用于第一信号的窗口的长度。修改重构信息可以是在时域中应用的信息。此外,修改重构信息可以是用于调整输入信号的大小的增益值。在这种情况下,可以基于线性预测域系数(LPC)来确定该增益值。
第一信号修改单元740接收修改重构信息和第一信号,然后能够通过在时域中重构第一信号的已修改时间单位间隔来对原始信号进行解码。
参照图8,首先,获得模式信息和修改标识信息[S10]。如果模式信息指示第一模式,则用第一译码方案对第一信号进行解码[S820],随后,获得指示第一信号是否被修改的修改标识信息[S830]。如果修改标识信息被设置为1[步骤S830中的‘是’],则通过应用修改重构信息来修改第一信号[S840]。如前述说明所述,修改重构信息可以是用于调整第一信号的时域中的时间单位间隔的值、用于调整第一信号的大小的增益值、或用于调整应用于第一信号的窗口长度的值。
相反,如果修改标识信息未被设置为1[步骤S830中的‘否’],则可以将第一信号照原样输出而不进行修改[S840]。
因此,在根据本发明的信号解码装置和方法中,当对用第一译码方案解码的第一信号进行编码时,如果时域中的时间单位间隔被修改,则可以使用修改重构信息将已修改第一信号重构成修改之前的信号。因此,可以根据信号的特性高效地执行解码。
同时,如果使用具有比信号长的长度的窗口,通过第一译码方案编码单元以过渡间隔对第一信号进行变换,则能够在频域中通过位分配来控制噪声。另一方面,由于噪声均匀地分布在时域中的窗口内,如果具有低能级的信号位于较前的位置,则噪声相对而言比信号声音大,由此,生成使用户听到噪声的前向回波效应。
因此,根据本发明的另一实施例,提出一种在类似于相关技术的频域的时域中调整噪声(噪声整形)的方法,以解决前向回波问题。
图9示出根据本发明的另一实施例的处理第一信号的方法。图9A至9D示出根据本发明的另一实施例的对第一信号进行编码的方法。图9E至9G示出对应于该编码方法的解码方法。
在图9A中,将输入信号x(t)划分成信号单元X以便在时域中处理。参照图9A,可以将输入信号x(t)分段成四个子块。对应于子块的信号可以分别包括分段信号X0、X1、X2和X3。参照图9B,能够确定用于在时域中调整子块的每个分段信号的大小的修改重构信息W(w0、w1、w2、w3)。修改重构信息可以是每个分段信号确定的时域中的增益值。在这种情况下,所述增益值可以是实际上应用于分段信号或以应用于分段信号的值的倒数形式配置的值。如果应用于分段信号的增益值变大,则使用更多的位来执行量化。因此,可以生成较小的量化噪声。
参照图9C,能够通过将修改重构信息(w0、w1、w2、w3)应用于分段信号(X0、X1、X2、X3)来生成修改信号X′。图9D示出通过使用被转换到频域的修改信号,从使用相关技术的频域掩蔽特性来执行感知编码中获得的量化噪声Qt。如图9D所示,量化噪声可以是在整个时域中具有均匀分布的能量的信号。此外,优选的是,用于频域中的位分配的心理声学模型运算使用分段信号X而不是修改信号X′。
在已在频域中重构被传输到解码器侧的第一信号之后,如果将重构信号倒相,则能够获得在其中,在调整信号X′中包括量化噪声Qt的传送信号[图中未示出]。
图9E示出应用于传送信号的修改重构信息V。修改重构信息V可以是作为应用于块信号的增益值的倒数的值(1/w0、1/w1、1/w2、1/w3)。
图9示出通过将修改重构信息V应用于传送信号而获得的重构信号Y。重构信号V可以是具有编码器侧的修改信号X′的相同形状的信号。然而,调整根据修改重构信息编码的量化噪声Qt时,如图9G所示,能够获得在时域中调整的已调整量化噪声Qr。
因此,根据本发明的另一实施例,应用到时域中的信号上的修改重构信息被确定,并且然后使用修改重构信息来确定每个块的暂时的位分配信息。然而,通过降低具有信号的小能级的区域中的量化噪声的能级,能够防止前向回波效应。
图10A和图10B是在应用图9A至9G所示的信号处理方法前后测量前向回波事件的图表。
参照图10A,由于在传统信号处理器中噪声在时域中的整个频带上均匀地分布,所以如果具有小能级的信号存在于信号的较前的部分处,则发生前向回波效应而使得用户能够听到该较前的部分的噪声。
如图10B所示,如果在时域中使用修改重构信息来调整量化噪声,则将存在具有小能级的信号的区域中的量化噪声的能级调整为降低。因此,可以解决前向回波效应的问题。
图11是根据本发明的另一实施例的带宽扩展信号解码单元的示意图。
参照图11,带宽扩展信号解码单元110包括信号接收单元1110、扩展基区域确定1120、高频区域重构单元1130和带宽扩展单元1140。
信号接收单元1110接收用第一译码方案解码的第一信号和用第二译码方案解码的第二信号的至少一个向下混频信号,和扩展信息。输入到信号接收单元1110的向下混频信号包括以高频区域被编码器侧去除的方式,利用原始信号的低频区域的信号来构成的信号。
扩展基区域确定单元1120能够基于由信号接收单元1110接收到的扩展信息来确定向下混频信号的扩展基信号。在这种情况下,向下混频信号可以是出现在频域中的信号,且扩展基信号可以是位于频域中的向下混频信号的部分频率区域中的信号。扩展信息用来确定扩展基信号,且可以包括扩展基信号的起始和截止频率,或用于对一部分向下混频信号进行滤波的一系列滤波器。
高频区域重构单元1130从信号接收单元1110接收向下混频信号和扩展信息,而且从扩展基区域确定单元1120接收扩展基信号。扩展基信号能够使用扩展信息来重构被编码器侧去除的向下混频信号的高频区域信号。在这种情况下,还可以使用接收到的重构信息。高频区域信号可以是未被包括在向下混频信号中而是在原始信号中的信号。在重构高频区域信号时,可以生成其带宽被扩展的扩展向下混频信号。
高频区域信号可以不是向下混频信号的整数倍。并且,高频区域信号的带宽可以不同于扩展基信号的带宽。
在根据本发明的一个实施例的信号处理装置和方法中,不使用具有被编码器侧去除的高频区域的整个向下混频信号来作为扩展基信号,而是使用对应于向下混频信号的部分频率区域的信号,虽然重构高频区域不是向下混频信号的整数倍,但是可以使用带宽扩展技术。
高频区域重构单元1130还可以包括时间扩展向下混频信号生成单元和频率信号扩展单元。时间扩展向下混频信号生成单元能够通过将扩展信息应用于扩展基信号来将向下混频信号扩展到时域中。并且,频率信号扩展单元能够通过使时间扩展向下混频信号的样本数目递减(抽取(decimation))来扩展向下混频信号的频域中的信号。
因此,根据还可以包括时间扩展向下混频信号生成单元和频率信号生成单元的本发明的另一实施例的带宽扩展解码单元1100能够根据修改重构信息来调整带宽扩展程度。
如果高频区域重构单元1130不包括低频区域信号而是包括重构高频区域信号,则带宽扩展单元1140以带宽扩展单元1140将向下混频信号与高频区域信号组合在一起的方式,生成其带宽被扩展的扩展向下混频信号。在这种情况下,高频区域信号可以不对应于向下混频信号的整数倍。因此,根据本发明的一个实施例的带宽扩展技术可用于向上采样成不是倍数关系的信号。
图12是根据本发明的另一实施例的带宽扩展信号解码单元中的信号解码方法的流程图。
参照图12,接收向下混频信号和扩展信息[S1210]。在这种情况下,向下混频信号可以是频域中的信号,或者可以是高频区域信号被编码器侧从生成的向下混频信号中去除的仅包括低频区域信号的信号。并且,扩展信息可以包括应用于向下混频信号的一系列滤波器、扩展基信号的起始频率和扩展基信号的截止频率中的至少一个。
随后,使用向下混频信号和扩展信息来确定扩展基信号[S1220]。在这种情况下,扩展基信号可以是对应于向下混频信号的部分频率区域的信号。并且,可以基于指示是否使用扩展信号来重构向下混频信号的高频区域信号的带宽扩展标识信息来执行扩展基信号的确定。特别地,只有当带宽扩展标识信息被设置为1时,才能确定扩展基信号。
使用扩展基信号和扩展信息来重构高频区域信号[S1230]。在这种情况下,高频区域信号可以包括未被包括在从编码器侧传输的向下混频信号中而是包括在输入到编码器中的原始信号中的信号。如前述说明所述,由于扩展基信号是不对应于整个向下混频信号,而是对应于向下混频信号的部分频率区域的信号,所以高频区域信号可以是不是向下混频信号的整数倍的信号。
随后,通过将向下混频信号与重构高频区域组合在一起,生成具有扩展带宽的扩展向下混频信号[S1240]。
如果未基于带宽扩展标识信息来确定扩展基信号,即,如果带宽扩展标识信息被设置为0,则使用向下混频信号和重构信息来生成高频区域信号[S1245]。并且,通过将向下混频信号与高频区域信号组合在一起来生成扩展向下混频信号[S1240]。在这种情况下,扩展向下混频信号可以是具有等于向下混频信号的整数倍的带宽,且更特别地等于向下混频信号的两倍的带宽的信号。此外,可以与高频区域信号的重构同时地生成扩展向下混频信号[S1240]而不是单独地执行。
图13A至13D是用于根据本发明的另一实施例的生成带宽扩展信号的方法的图示,其中,‘Fc’指示扩展基信号的截止频率。图13A示出根据传统方法的带宽扩展处理方法。
参照图13A,在编码中,用整个频带除以2,并通过用第一或第二译码方案进行编码来传输扩展基信号(对应于整个频率的1/2的低频区域的信号),并通过使用扩展信息进行编码来传输对应于等于整个信号的1/2的频率区域的扩展信号。
在解码中,通过以与编码相反的方式,使用由第一或第二译码方案解码的扩展基信号和扩展信息来对扩展信号进行解码,从而重构整个信号。
参照图13B,通过选择对应于整个频带的1/4的信号来对扩展基信号进行编码。使用扩展基信号将对应于整个频带的2/4至3/4区域的信号(扩展信号)编码为扩展信息。并且,使用扩展基信号将对应于整个频带的4/4区域的信号(再扩展信号)编码为扩展信息。
因此,在执行解码时,用第一或第二译码方案对扩展基信号进行解码,并随后使用扩展基信号和扩展信息来重构扩展信号1。随后,使用扩展信息和扩展信号1,重构对应于向下混频信号的高频区域的再扩展信号。因此,能够仅在执行带宽扩展译码时,使用对应于整个频率区域的1/4的信号作为扩展基信号来提高压缩比。
参照图13C,使用对应于整个频率区域的1/4的扩展基信号将分别对应于2/4、3/4和4/4区域的扩展信号1、扩展信号2和扩展信号3编码成扩展信息。在解码时,使用扩展基信号和扩展信息顺序地对扩展信号1、扩展信号2和扩展信号3进行解码。
在根据本发明的另一实施例的带宽扩展方法中,如图13C所示,扩展基信号、扩展信号1、扩展信号2和扩展信号3可以具有相同带宽,本发明不限于此。例如,这些信号可以具有相互不同的带宽。并且,能够通过将频率区域修改变大或变小的方式来设置扩展基信号的比例系数,从而对扩展信号1、扩展信号2和扩展信号3进行解码。
图13D示出根据本发明的另一实施例的信号解码方法。
参照图13D,作为扩展基信号,可以选择用第一或第二译码方案解码的信号的部分信号(Fb至Fc区域之一)。因此,可以重构高频区域,其不对应于使用扩展基信号编码的向下混频信号的整数倍。
图14A至图14D是用于根据本发明的另一实施例的生成多通道信号的方法的图示。在这种情况下,将通过带宽扩展获得的信号定义为扩展信号、扩展信号1或扩展信号2,并将通过经由多通道解码器等进行通道扩展获得的信号称为立体声信号。
参照图14A,扩展基信号通过带宽扩展来重构向下混频信号的高频区域信号[步骤1]。随后,从通过通道扩展重构的向下混频信号中解码立体声信号[步骤2]。
如图14B所示,通过通道扩展,从扩展基信号生成立体声信号[步骤1]。随后,通过基于立体声信号来扩展带宽,重构整个频率区域的立体声信号[步骤2和步骤3]。这适合于在整个向下混频信号的低频区域中具有更多信息和声音图像的信号。
参照图14C,以类似于前一种方法的方式通过通道扩展从扩展基信号生成立体声信号[步骤1]。随后,为了通过扩展带宽来重构整个频率区域的立体声信号,使用扩展基信号对扩展信号1和扩展信号2进行解码[步骤2和步骤3]。由于扩展基信号是具有信号的核心特性的信号,所以优选的是从扩展基信号中解码扩展信号2。特别地,其适合于在立体声的左右通道信号之间具有高相关性的信号的解码。例如,其适合于语音信号的解码。
参照图14D,通过通道扩展,从扩展基信号中解码立体声信号[步骤1]。然后通过带宽扩展从扩展基信号中解码扩展信号1[步骤2]。随后,使用扩展基信号、扩展信号1和立体声信号,重构扩展信号2[步骤3-1至3-3]。因此,可以对有机的立体声信号进行译码。
图15是用于根据本发明的另一实施例的生成多通道信号的方法的图示。
参照图15,生成根据本发明的多通道信号的方法包括使用基信号来重构单声道信号、单声道扩展信号、立体声信号和立体声扩展信号的方法。在这种情况下,基信号可以包括残余信号。
可以在程序记录介质中将本发明应用的解码/编码方法实现为计算机可读代码。并且,可以将具有本发明的数据结构的多媒体数据存储在计算机可读记录介质中。该计算机可读记录介质包括其中存储有计算机系统可读的数据的各种存储设备。计算机可读介质包括例如ROM、RAM、CD-ROM、磁带、软盘、光学数据存储设备等,且还包括载波型实施方式(例如经由因特网的传输)。并且,由编码方法生成的比特流被存储在计算机可读记录介质中,或者可以经由有线/无线通信网络来传输。
虽然在本文中已参照本发明的优选实施例描述并示出了本发明,但对于本领域的技术人员来说显而易见的是在不脱离本发明的精神和范围的情况下可以对其进行各种修改和变更。因此,本发明意图在于涵盖在所附权利要求书及其等价物的范围内的本发明的修改和变更。
工业实用性
因此,本发明可适用于信号的编码和解码。

Claims (13)

1.一种处理信号的方法,包括:
接收空间信息以及包含第一信号和第二信号中的至少一个的信号,其中,所述空间信息包括通道声级差信息(CLD)、通道预测系数(CPC)、通道间相关性信息(ICC)以及向下混频增益信息(DMG)中的至少一个;
接收模式信息和修改标识信息,所述模式信息表示第一译码方案和第二译码方案中的一个,并且所述修改标识信息指示是否修改所述第一信号;
当所述模式信息表示所述第一译码方案时,使用所述第一译码方案对所述第一信号进行解码;
当所述修改标识信息指示修改了所述第一信号,则获得指示用于调整应用到所述第一信号的窗口的长度的值的修改重构信息;
通过使用所述修改重构信息来调整所述窗口的长度;
通过使用调整的窗口的长度来对所述第一信号进行解码;
当所述模式信息表示所述第二译码方案时,使用所述第二译码方案对所述第二信号进行解码;
基于扩展信息确定扩展基信号,所述扩展基信号与解码的信号的部分区域相对应;
生成扩展向下混频信号,所述扩展向下混频信号具有使用所述扩展基信号和所述扩展信息通过利用时间-扩展和抽取来重构高频区域信号而扩展的带宽,
其中
所述第一译码方案对应于音频译码方案,并且
所述第二译码方案对应于语音译码方案。
2.如权利要求1所述的方法,其中,所述高频区域信号的带宽不同于所述扩展基信号的带宽。
3.如权利要求1所述的方法,其中,基于扩展信息确定所述扩展基信号,所述扩展信息包括应用于所述第一信号或所述第二信号中的至少一个的一系列滤波器、所述扩展基信号的起始频率、和所述扩展基信号的截止频率中的至少一个。
4.如权利要求1所述的方法,其中,所述扩展基信号是对应于所述第一信号或所述第二信号的部分频率区域的信号。
5.如权利要求1所述的方法,还包括:
在生成所述扩展向下混频信号之后,使用所述扩展向下混频信号和所述扩展信息来生成所述扩展向下混频信号的高频区域信号;以及
生成再扩展向下混频信号,所述再扩展向下混频信号具有通过将所述扩展向下混频信号的频率信号与所述高频区域信号组合在一起而扩展的带宽。
6.如权利要求1所述的方法,其中,所述音频译码方案包括使用时频变换的频域中的译码方案,并且其中,所述语音译码方案是使用线性预测译码方案的译码方案。
7.如权利要求1所述的方法,其中,基于指示是否重构了所述第一信号和所述第二信号的高频区域信号的带宽扩展标识信息来执行使用所述扩展信息确定扩展基区域。
8.一种用于处理信号的装置,包括:
信号接收单元,所述信号接收单元接收空间信息,模式信息,包含第一信号和第二信号中的至少一个的信号,以及指示是否修改了所述第一信号的修改标识信息,其中,所述空间信息包括通道声级差信息(CLD)、通道预测系数(CPC)、通道间相关性信息(ICC)和向下混频增益信息(DMG)中的至少一个,并且所述模式信息表示第一译码方案和第二译码方案中的一个;
第一译码方案单元,当所述模式信息表示所述第一译码方案时,所述第一译码方案单元使用所述第一译码方案对所述第一信号进行解码,包括:
当所述修改标识信息指示修改了所述第一信号,则获得指示用于调整应用到所述第一信号的窗口的长度的值的修改重构信息;
通过使用所述修改重构信息来调整所述窗口的长度;
通过使用调整的窗口的长度来对所述第一信号进行解码;
第二译码方案单元,当所述模式信息表示所述第二译码方案时,所述第二译码方案单元使用所述第二译码方案对所述第二信号进行解码;
扩展基区域确定单元,所述扩展基区域确定单元基于扩展信息确定扩展基信号,所述扩展基信号与所述解码的信号的部分区域相对应;
高频区域信号重构单元,所述高频区域信号重构单元生成扩展向下混频信号,所述扩展向下混频信号具有使用所述扩展基信号和所述扩展信息通过利用时间-扩展和抽取来重构高频区域信号而扩展的带宽,
其中,
所述第一译码方案对应于音频译码方案,并且
所述第二译码方案对应于语音译码方案。
9.如权利要求8所述的装置,其中,基于扩展信息确定所述扩展基信号,所述扩展信息包括应用于所述第一信号或所述第二信号中的至少一个的一系列滤波器、所述扩展基信号的起始频率、和所述扩展基信号的截止频率中的至少一个。
10.如权利要求8所述的装置,其中,所述扩展基区域确定单元确定所述第一信号或所述第二信号的部分频率区域的信号为所述扩展基信号。
11.如权利要求8所述的装置,其中,所述高频区域重构单元重构未被包括在所述第一信号和所述第二信号中而是包括在输入到编码器的原始信号中的高频区域信号。
12.如权利要求8所述的装置,其中,所述高频区域重构单元重构具有与所述扩展基信号的带宽不同的带宽的所述高频区域信号。
13.如权利要求8所述的装置,其中,所述音频译码方案包括使用时频变换的频域中的译码方案,并且其中,所述语音译码方案包括使用线性预测译码方案的译码方案。
CN200880117301.5A 2007-11-21 2008-11-21 用于处理信号的方法和装置 Active CN101868821B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US98945007P 2007-11-21 2007-11-21
US98945207P 2007-11-21 2007-11-21
US60/989,452 2007-11-21
US60/989,450 2007-11-21
PCT/KR2008/006884 WO2009066960A1 (en) 2007-11-21 2008-11-21 A method and an apparatus for processing a signal

Publications (2)

Publication Number Publication Date
CN101868821A CN101868821A (zh) 2010-10-20
CN101868821B true CN101868821B (zh) 2015-09-23

Family

ID=40667696

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880117301.5A Active CN101868821B (zh) 2007-11-21 2008-11-21 用于处理信号的方法和装置
CN200880112671XA Active CN101836250B (zh) 2007-11-21 2008-11-21 用于处理信号的方法及装置

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN200880112671XA Active CN101836250B (zh) 2007-11-21 2008-11-21 用于处理信号的方法及装置

Country Status (11)

Country Link
US (3) US8504377B2 (zh)
EP (2) EP2218068A4 (zh)
JP (2) JP2011504250A (zh)
KR (2) KR101586317B1 (zh)
CN (2) CN101868821B (zh)
AU (2) AU2008326956B2 (zh)
BR (1) BRPI0820488A2 (zh)
CA (2) CA2705968C (zh)
MX (1) MX2010002629A (zh)
RU (2) RU2010125221A (zh)
WO (2) WO2009066960A1 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011504250A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
CN105225667B (zh) * 2009-03-17 2019-04-05 杜比国际公司 编码器系统、解码器系统、编码方法和解码方法
AU2015246158B2 (en) * 2009-03-17 2017-10-26 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding.
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5652658B2 (ja) 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
IL205394A (en) * 2010-04-28 2016-09-29 Verint Systems Ltd A system and method for automatically identifying a speech encoding scheme
SG10201505469SA (en) * 2010-07-19 2015-08-28 Dolby Int Ab Processing of audio signals during high frequency reconstruction
KR101826331B1 (ko) 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
KR101697550B1 (ko) 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP3023985B1 (en) * 2010-12-29 2017-07-05 Samsung Electronics Co., Ltd Methods for audio signal encoding and decoding
CN103548077B (zh) * 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
US9070361B2 (en) * 2011-06-10 2015-06-30 Google Technology Holdings LLC Method and apparatus for encoding a wideband speech signal utilizing downmixing of a highband component
KR101897455B1 (ko) 2012-04-16 2018-10-04 삼성전자주식회사 음질 향상 장치 및 방법
EP2862165B1 (en) * 2012-06-14 2017-03-08 Dolby International AB Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
MX351687B (es) * 2012-08-03 2017-10-25 Fraunhofer Ges Forschung Método y descodificador para codificación de objeto de audio especial de multi-instancias que emplea un concepto paramétrico para casos de mezcla descendente/mezcla ascendente de multicanal.
CN107516531B (zh) 2012-12-13 2020-10-13 弗朗霍弗应用研究促进协会 语音声响编码装置和解码装置、语音声响编码和解码方法
CN105229738B (zh) * 2013-01-29 2019-07-26 弗劳恩霍夫应用研究促进协会 用于使用能量限制操作产生频率增强信号的装置及方法
US8804971B1 (en) * 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830050A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
KR20230042410A (ko) 2013-12-27 2023-03-28 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP3067887A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN111970630B (zh) 2015-08-25 2021-11-02 杜比实验室特许公司 音频解码器和解码方法
CN105792031B (zh) * 2016-03-08 2019-01-11 烽火通信科技股份有限公司 一种OTN中GMP映射产生Cn值的方法
CN117351966A (zh) 2016-09-28 2024-01-05 华为技术有限公司 一种处理多声道音频信号的方法、装置和系统
KR102444702B1 (ko) 2017-06-01 2022-09-16 닛토 가세이 가부시끼 가이샤 방오도료 조성물, 이 조성물을 이용하여 형성되는 방오 도막을 표면에 갖는 도장물

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416563A (zh) * 2000-11-09 2003-05-07 皇家菲利浦电子有限公司 用于更高感觉质量的电话语音的宽带扩展
CN1774957A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
EP1668959B1 (en) * 2003-10-02 2007-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Compatible multi-channel coding/decoding

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US127729A (en) * 1872-06-11 Improvement in power-indicators for steam-engines
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
DE19900819A1 (de) 1999-01-12 2000-07-13 Bosch Gmbh Robert Verfahren zum Dekodieren gestörter Funksignale von Mehrkanal-Audiosendungen
JP2000267699A (ja) * 1999-03-19 2000-09-29 Nippon Telegr & Teleph Corp <Ntt> 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置
US7039044B1 (en) * 1999-10-14 2006-05-02 Mindspeed Technologies, Inc. Method and apparatus for early detection of DTMF signals in voice transmissions over an IP network
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
JP3926726B2 (ja) * 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
KR100935961B1 (ko) 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
RU2325046C2 (ru) 2002-07-16 2008-05-20 Конинклейке Филипс Электроникс Н.В. Аудиокодирование
JP2004198485A (ja) 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
CN1748247B (zh) 2003-02-11 2011-06-15 皇家飞利浦电子股份有限公司 音频编码
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
RU2005135648A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Генерация аудиосигналов
KR100732659B1 (ko) * 2003-05-01 2007-06-27 노키아 코포레이션 가변 비트 레이트 광대역 스피치 음성 코딩시의 이득양자화를 위한 방법 및 장치
KR20060090995A (ko) 2003-10-23 2006-08-17 마쓰시다 일렉트릭 인더스트리얼 컴패니 리미티드 스펙트럼 부호화 장치, 스펙트럼 복호화 장치, 음향 신호송신 장치, 음향 신호 수신장치 및 이들의 방법
US7613607B2 (en) * 2003-12-18 2009-11-03 Nokia Corporation Audio enhancement in coded domain
FI118834B (fi) * 2004-02-23 2008-03-31 Nokia Corp Audiosignaalien luokittelu
FI119533B (fi) 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
DE102004021062A1 (de) 2004-04-29 2005-11-24 Siemens Ag Verfahren zur Herstellung von Leiterplatten und/oder entsprechenden Konstrukten
ES2291877T3 (es) * 2004-05-17 2008-03-01 Nokia Corporation Codificacion de audio con diferentes modelos de codificacion.
ATE457512T1 (de) * 2004-05-17 2010-02-15 Nokia Corp Audiocodierung mit verschiedenen codierungsrahmenlängen
WO2006000842A1 (en) * 2004-05-28 2006-01-05 Nokia Corporation Multichannel audio extension
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
DE602004020765D1 (de) * 2004-09-17 2009-06-04 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten Tonsignalen
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) * 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
WO2006107837A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
EP1905002B1 (en) * 2005-05-26 2013-05-22 LG Electronics Inc. Method and apparatus for decoding audio signal
EP1913576A2 (en) * 2005-06-30 2008-04-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
JP4699117B2 (ja) * 2005-07-11 2011-06-08 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置、信号復号化装置、信号符号化方法、及び信号復号化方法。
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7974713B2 (en) * 2005-10-12 2011-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Temporal and spatial shaping of multi-channel audio signals
US20110057818A1 (en) 2006-01-18 2011-03-10 Lg Electronics, Inc. Apparatus and Method for Encoding and Decoding Signal
WO2007083957A1 (en) * 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for decoding a signal
KR20070081735A (ko) * 2006-02-13 2007-08-17 엘지전자 주식회사 오디오 신호의 인코딩/디코딩 방법 및 장치
EP1853092B1 (en) 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
US8135047B2 (en) * 2006-07-31 2012-03-13 Qualcomm Incorporated Systems and methods for including an identifier with a packet associated with a speech signal
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
TWI333346B (en) * 2006-11-28 2010-11-11 Inst Information Industry Communication apparatus, method, application program, and computer readable medium thereof for switching channels in a beacon network
EP2122157A1 (de) * 2007-03-09 2009-11-25 Beru AG Verfahren und vorrichtung zur glühkerzenerregungssteuerung
DE102007018032B4 (de) * 2007-04-17 2010-11-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Erzeugung dekorrelierter Signale
JP2011504250A (ja) * 2007-11-21 2011-02-03 エルジー エレクトロニクス インコーポレイティド 信号処理方法及び装置
EP2340535B1 (en) * 2008-10-06 2013-08-21 Telefonaktiebolaget L M Ericsson (PUBL) Method and apparatus for delivery of aligned multi-channel audio

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1416563A (zh) * 2000-11-09 2003-05-07 皇家菲利浦电子有限公司 用于更高感觉质量的电话语音的宽带扩展
CN1774957A (zh) * 2003-04-17 2006-05-17 皇家飞利浦电子股份有限公司 音频信号生成
EP1668959B1 (en) * 2003-10-02 2007-01-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Compatible multi-channel coding/decoding

Also Published As

Publication number Publication date
KR101221918B1 (ko) 2013-01-15
CN101836250A (zh) 2010-09-15
JP2011504249A (ja) 2011-02-03
CN101836250B (zh) 2012-11-28
CA2697830C (en) 2013-12-31
CN101868821A (zh) 2010-10-20
EP2218068A4 (en) 2010-11-24
KR20100095585A (ko) 2010-08-31
EP2218068A1 (en) 2010-08-18
AU2008326957B2 (en) 2011-06-30
KR20100085018A (ko) 2010-07-28
AU2008326957A1 (en) 2009-05-28
US8583445B2 (en) 2013-11-12
RU2010125221A (ru) 2011-12-27
US20100211400A1 (en) 2010-08-19
WO2009066959A1 (en) 2009-05-28
AU2008326956A1 (en) 2009-05-28
US20100274557A1 (en) 2010-10-28
MX2010002629A (es) 2010-06-02
BRPI0820488A2 (pt) 2017-05-23
RU2010125251A (ru) 2011-12-27
RU2449387C2 (ru) 2012-04-27
EP2210253A4 (en) 2010-12-01
WO2009066960A1 (en) 2009-05-28
US8504377B2 (en) 2013-08-06
JP2011504250A (ja) 2011-02-03
EP2210253A1 (en) 2010-07-28
KR101586317B1 (ko) 2016-01-18
US20100305956A1 (en) 2010-12-02
US8527282B2 (en) 2013-09-03
CA2705968C (en) 2016-01-26
AU2008326956B2 (en) 2011-02-17
CA2705968A1 (en) 2009-05-28
CA2697830A1 (en) 2009-05-28

Similar Documents

Publication Publication Date Title
CN101868821B (zh) 用于处理信号的方法和装置
CN102007534B (zh) 用于处理音频信号的方法和装置
CN109448741B (zh) 一种3d音频编码、解码方法及装置
JP5485909B2 (ja) オーディオ信号処理方法及び装置
CN101297353B (zh) 编码和解码多声道音频信号的方法及其装置
JP4272897B2 (ja) 符号化装置、復号化装置およびその方法
CN107180638A (zh) 压缩和解压缩高阶高保真度立体声响复制信号表示的方法及装置
TWI546799B (zh) 音頻編碼器及解碼器
IL201469A (en) Formulation of a temporary envelope for spatial drilling using WIENER DOMAIN filter for frequency
CN105103225A (zh) 立体声音频编码器和解码器
KR101697550B1 (ko) 멀티채널 오디오 대역폭 확장 장치 및 방법
CN111210832A (zh) 基于频谱包络模板的带宽扩展音频编解码方法及装置
US20230178084A1 (en) Method, apparatus and system for enhancing multi-channel audio in a dynamic range reduced domain
CN101243488B (zh) 用于编码和解码音频信号的装置及其方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant