KR100891666B1 - Apparatus for processing audio signal and method thereof - Google Patents

Apparatus for processing audio signal and method thereof Download PDF

Info

Publication number
KR100891666B1
KR100891666B1 KR1020070063182A KR20070063182A KR100891666B1 KR 100891666 B1 KR100891666 B1 KR 100891666B1 KR 1020070063182 A KR1020070063182 A KR 1020070063182A KR 20070063182 A KR20070063182 A KR 20070063182A KR 100891666 B1 KR100891666 B1 KR 100891666B1
Authority
KR
South Korea
Prior art keywords
signal
additional information
mix
information
source
Prior art date
Application number
KR1020070063182A
Other languages
Korean (ko)
Other versions
KR20080029757A (en
Inventor
오현오
정양원
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20080029757A publication Critical patent/KR20080029757A/en
Application granted granted Critical
Publication of KR100891666B1 publication Critical patent/KR100891666B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

본 발명은 믹스 신호의 처리 방법 및 장치에 관한 것이다. 이를 위해 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 임베드된 부가 정보를 추출하는 단계와; 사용자 믹스 파라미터를 획득하는 단계와; 상기 믹스 신호, 상기 부가 정보 및 상기 사용자 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 단계를 포함하되, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법을 제공한다.The present invention relates to a method and apparatus for processing a mixed signal. To this end, the present invention includes the steps of extracting additional information embedded in a non-perceptual region of a mix signal including one or more source signals; Obtaining a user mix parameter; And generating a remix signal using the mix signal, the additional information, and the user mix parameter, wherein the additional information indicates a relationship between the source signal to be remixed among the source signals and the mix signal. A signal processing method is provided.

리믹싱, 부가 정보, 소스 신호 Remix, side information, source signal

Description

믹스 신호의 처리 방법 및 장치{APPARATUS FOR PROCESSING AUDIO SIGNAL AND METHOD THEREOF} Method and apparatus for processing mixed signal {APPARATUS FOR PROCESSING AUDIO SIGNAL AND METHOD THEREOF}

도 1은 본 발명의 일 실시예에 따른 제1 리믹스 신호 인코딩 장치에 대한 블록도.1 is a block diagram of an apparatus for encoding a first remix signal according to an embodiment of the present invention.

도 2는 스테레오 신호를 이용하는 경우, 도 1의 제1 리믹스 신호 인코딩 장치에 대한 상세 블록도.FIG. 2 is a detailed block diagram of the first remix signal encoding apparatus of FIG. 1 when using a stereo signal. FIG.

도 3은 본 발명의 일 실시예에 따른 믹스 신호를 처리하기 위한 도메인.3 is a domain for processing a mix signal according to an embodiment of the present invention.

도 4는 본 발명의 일 실시예에 따른 제2 리믹스 신호 인코딩 장치에 대한 블록도.4 is a block diagram of a second remix signal encoding apparatus according to an embodiment of the present invention.

도 5는 본 발명의 일 실시예에 따른 제1 리믹스 신호 디코딩 장치에 대한 블록도.5 is a block diagram of a first remix signal decoding apparatus according to an embodiment of the present invention;

도 6은 스테레오 신호를 이용하는 경우, 도 5의 제1 리믹스 신호 디코딩 장치에 대한 상세도.FIG. 6 is a detailed view of the first remix signal decoding apparatus of FIG. 5 when using a stereo signal. FIG.

도 7은 본 발명의 일 실시예에 따른 제2 리믹스 신호 디코딩 장치에 대한 블록도.7 is a block diagram of a second remix signal decoding apparatus according to an embodiment of the present invention.

도 8A는 통상적인 인코딩 장치 및 본 발명의 일 실시예에 따른 리믹스 신호 인코딩 장치의 결합을 나타내는 블록도.8A is a block diagram illustrating a combination of a conventional encoding apparatus and a remix signal encoding apparatus according to an embodiment of the present invention.

도 8B는 종래의 디코딩 장치와 결합하여 이용되는 본 발명의 일 실시예에 따른 제2 리믹스 신호 디코딩 장치에 대한 블록도.8B is a block diagram of a second remix signal decoding apparatus according to an embodiment of the present invention used in combination with a conventional decoding apparatus.

도 9는 본 발명의 일 실시예에 따른 리믹스 신호 디코딩 장치에 상세 블록도.9 is a detailed block diagram of a remix signal decoding apparatus according to an embodiment of the present invention.

도 10은 부가 정보를 임베드하는 본 발명의 일 실시예에 따른 인코딩 장치에 대한 블록도.10 is a block diagram of an encoding apparatus according to an embodiment of the present invention for embedding additional information.

도 11은 본 발명의 일 실시예에 따른 도 10의 인코딩 장치를 구성하는 임베딩부에 대한 상세 블록도.FIG. 11 is a detailed block diagram illustrating an embedding unit constituting the encoding apparatus of FIG. 10 according to an embodiment of the present invention. FIG.

도 12는 본 발명의 일 실시예에 따른 부가 정보를 임베드하는 제1 방법에 대한 도면.12 is a diagram for a first method of embedding additional information according to an embodiment of the present invention.

도 13은 본 발명의 일 실시예에 따른 부가 정보를 임베드하는 제2 방법에 대한 도면.13 is a diagram of a second method for embedding additional information according to an embodiment of the present invention.

도 14는 본 발명의 일 실시예에 따른 부가 정보를 재구성한 데이터 구조에 대한 도면.14 is a diagram of a data structure reconstructed additional information according to an embodiment of the present invention.

도 15는 본 발명의 일 실시예에 따른 임베드된 부가 정보를 이용하여 믹스 신호를 디코딩하는 디코딩 장치에 대한 블록도.15 is a block diagram of a decoding apparatus for decoding a mixed signal using embedded side information according to an embodiment of the present invention.

도 16은 원신호를 보존하며 부가 정보를 임베드하는 본 발명의 일 실시예에 따른 인코딩 장치를 구성하는 임베딩부에 대한 상세 블록도.FIG. 16 is a detailed block diagram of an embedding unit constituting an encoding apparatus according to an embodiment of the present invention for preserving an original signal and embedding additional information. FIG.

도 17은 본 발명의 일 실시예에 따른 원신호를 보존하며 부가정보를 임베딩하는 방법을 나타내는 블록도.17 is a block diagram illustrating a method of preserving an original signal and embedding additional information according to an embodiment of the present invention.

도 18은 원신호를 완전히 복원하는 본 발명의 일 실시예에 따른 디코딩 장치에 대한 블록도.18 is a block diagram of a decoding apparatus according to an embodiment of the present invention for completely restoring an original signal.

도 19는 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제1 방법을 나타내는 도면.FIG. 19 illustrates a first method of embedding additional information in a mix signal of two channels according to an embodiment of the present invention. FIG.

도 20은 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제2 방법을 나타내는 도면.20 illustrates a second method of embedding additional information in a mix signal of two channels according to an embodiment of the present invention.

도 21은 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제3 방법을 나타내는 도면.FIG. 21 illustrates a third method of embedding additional information in a mix signal of two channels according to an embodiment of the present invention. FIG.

도 22 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제4 방법을 나타내는 도면.FIG. 22 illustrates a fourth method of embedding additional information in a mix signal of two channels according to an embodiment of the present invention. FIG.

도 23은 본 발명의 일 실시예에 따른 임베드된 부가 정보를 제거하는 방법을 나타내는 블록도.FIG. 23 is a block diagram illustrating a method of removing embedded side information according to an embodiment of the present invention. FIG.

도 24는 본 발명의 일실시예에 따른 부가 정보가 임베드된 믹스 신호의 인코딩 장치에 대한 블록도.24 is a block diagram of a device for encoding a mixed signal with additional information embedded according to an embodiment of the present invention.

도 25는 본 발명의 일실시예에 따른 도 24의 인코딩 장치의 상세 블록도.25 is a detailed block diagram of the encoding apparatus of FIG. 24 according to an embodiment of the present invention.

도 26은 본 발명의 일실시예에 따른 믹스 신호에 부가 정보를 임베딩하는 디코딩 장치에 대한 블록도.FIG. 26 is a block diagram of a decoding apparatus for embedding additional information in a mix signal according to an embodiment of the present invention. FIG.

본 발명은 믹스 신호를 인코딩/디코딩하는 방법 및 장치에 관한 것이다. 현재까지는 스테레오 신호가 가장 흔하게 생성되고, 소비자들에게 가장 널리 이용된다. 최근에는 멀티채널 신호가 점점 널리 이용되고 있다. 그러나, 상기 믹스 신호는 상기 믹스 신호를 구성하는 소스 신호 단위가 아니라, 채널 신호 단위로 처리된다는 한계가 있다. 따라서, 채널 신호 단위로 믹스 신호를 처리하는 경우, 믹스 신호를 구성하는 특정 소스 신호만을 독립적으로 처리할 수 없는 문제점이 있다. 예를 들면, 영화를 보면서 배우들 음성에 대한 볼륨은 일정하게 유지하면서, 배경음악의 볼륨만을 높이는 것은 불가능하다. The present invention relates to a method and apparatus for encoding / decoding a mix signal. To date, stereo signals are most commonly generated and most widely used by consumers. In recent years, multichannel signals have been increasingly used. However, there is a limitation that the mixed signal is processed in the channel signal unit, not in the source signal unit constituting the mix signal. Therefore, when processing the mixed signal in the channel signal unit, there is a problem that only a specific source signal constituting the mixed signal can not be processed independently. For example, while watching a movie, it is impossible to increase the volume of background music while keeping the volume of actors' voices constant.

그리고 기록매체에 믹스 신호를 저장하는 경우, 상기 믹스 신호에 대한 부가 정보를 저장할 수 있는 보조데이터 영역이 존재하지 않는 경우가 있다. 따라서, 이와 같은 경우에는, 미디오 신호를 소스 신호 단위로 처리할 수 없는 문제점이 있다. 또한, 부가 정보를 별도로 저장하거나, 또는 별도로 전송하는 경우에는 일반적인 믹스 신호 포맷과의 호환성 문제가 있다.When the mixed signal is stored in the recording medium, there is a case where an auxiliary data area for storing additional information about the mixed signal does not exist. Therefore, in this case, there is a problem that the media signal cannot be processed in the unit of the source signal. In addition, when additional information is stored separately or transmitted separately, there is a compatibility problem with a general mix signal format.

상기와 같은 문제점을 해결하기 위하여, 본 발명은 부가 정보를 이용하여 믹스 신호를 소스 신호 단위로 처리하기 위하여, 상기 믹스 신호에 대한 부가 정보를 임베드하는 부호화/복호화 방법 및 장치를 제공하는데 그 목적이 있다.In order to solve the above problems, an object of the present invention is to provide an encoding / decoding method and apparatus for embedding additional information on the mixed signal in order to process the mixed signal by the source signal using the additional information. have.

상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 임베드된 부가 정보를 추출하는 단계와; 사용자 믹스 파라미터를 획득하는 단계와; 상기 믹스 신호, 상기 부가 정보 및 상기 사용자 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 단계를 포함하되, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법을 제공한다.In order to achieve the above object, the present invention comprises the steps of extracting additional information embedded in the non-perceptual region of the mix signal comprising one or more source signals; Obtaining a user mix parameter; And generating a remix signal using the mix signal, the additional information, and the user mix parameter, wherein the additional information indicates a relationship between the source signal to be remixed among the source signals and the mix signal. A signal processing method is provided.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 단계와; 상기 소스 신호들 중 리믹스될 소스 신호를 획득하는 단계와; 상기 믹스 신호 및 상기 리믹스될 소스 신호를 이용하여 부가 정보를 생성하는 단계와; 상기 부가 정보를 상기 믹스 신호의 비지각적 영역에 임베딩하는 단계를 포함하되, 상기 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법을 제공한다.In addition, to achieve the above object, the present invention comprises the steps of obtaining a mix signal comprising at least one source signal; Obtaining a source signal to be remixed among the source signals; Generating side information using the mix signal and the source signal to be remixed; Embedding the additional information in a non-perceptual region of the mix signal, wherein the additional information indicates a relationship between the source signal to be remixed and the mix signal.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 임베드된 결합 신호를 추출하는 단계와; 상기 결합 신호를 무손실 복호화하여 상기 비지각적 영역에 대응되는 신호를 복원하는 단계와; 상기 복원된 신호를 이용하여 상기 결합 신호가 추출된 믹스 신호를 복원하는 단계를 포함하되, 상기 결합 신호는 상기 믹스 신호의 비지각적 영역에 위치하는 신호를 무손실 부호화한 신호 및 부가 정보를 포함하는 것을 특징으로 하는 신호 처리 방법을 제공한다.In addition, to achieve the above object, the present invention includes the steps of extracting a combined signal embedded in the non-perceptual region of the mixed signal comprising one or more source signals; Lossless decoding the combined signal to restore a signal corresponding to the non-perceptual region; Restoring the mixed signal from which the combined signal is extracted using the restored signal, wherein the combined signal includes a signal and additional information obtained by losslessly encoding a signal located in a non-perceptual region of the mixed signal; A signal processing method is provided.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 위치하는 신호를 무손실 부호화하는 단계와; 상기 무손실 부호화된 신호 및 부가 정보를 결합하여 결합 신호를 생성하는 단 계와; 상기 결합 신호를 상기 비지각적 영역에 임베드하는 단계를 포함하되, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법을 제공한다.In addition, to achieve the above object, the present invention comprises the steps of lossless coding a signal located in the non-perceptual region of the mixed signal comprising one or more source signals; Generating a combined signal by combining the lossless coded signal and additional information; And embedding the combined signal in the non-perceptual region, wherein the additional information indicates a relationship between the source signal to be remixed among the source signals and the mix signal.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 존재하는 부가 정보를 추출하는 단계와; 상기 믹스 신호를 부호화하는 단계와; 상기 부호화된 믹스 신호 및 상기 부가 정보를 이용하여 비트스트림을 생성하는 단계를 포함하되, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호 및 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법을 제공한다.In addition, in order to achieve the above object, the present invention comprises the steps of extracting additional information present in the non-perceptual region of the mix signal including one or more source signals; Encoding the mix signal; And generating a bitstream using the encoded mixed signal and the additional information, wherein the additional information indicates a relationship between a source signal to be remixed among the source signals and the mixed signal. Provide a method.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 부호화된 믹스 신호 및 부가 정보를 획득하는 단계와; 상기 부호화된 믹스 신호를 복호화하는 단계와; 상기 복호화된 믹스 신호의 비지각적 영역에 상기 부가 정보를 임베드하는 단계를 포함하되, 상기 믹스 신호는 하나 이상의 소스 신호를 포함하고, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법을 제공한다.In addition, in order to achieve the above object, the present invention includes the steps of obtaining an encoded mix signal and additional information; Decoding the encoded mix signal; Embedding the additional information in the non-perceptual region of the decoded mix signal, wherein the mix signal comprises one or more source signals, wherein the additional information is one of the source signals to be remixed and the mixed signal; It provides a signal processing method characterized in that the relationship with.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 임베드된 부호화된 부가 정보를 추출하는 임베디드신호디코딩부; 상기 부호화된 부가 정보를 디코딩하여 부가 정보를 생성하는 부가정보디코딩부; 및 상기 부가 정보, 상기 믹스 신호 및 사용자 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 리믹스렌더링부를 포함하되, 상기 부가 정 보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내고, 상기 사용자 믹스 파라미터는 사용자로부터 획득된 제어정보를 이용하여 생성되는 것을 특징으로 하는 신호 처리 장치를 제공한다.In addition, in order to achieve the above object, the present invention includes an embedded signal decoding unit for extracting the encoded additional information embedded in the non-perceptual region of the mixed signal including one or more source signals; An additional information decoding unit to decode the encoded additional information to generate additional information; And a remix rendering unit configured to generate a remix signal using the additional information, the mix signal, and the user mix parameter, wherein the additional information indicates a relationship between the source signal to be remixed among the source signals and the mix signal. The user mix parameter provides a signal processing apparatus, which is generated using control information obtained from a user.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호 및 리믹스될 소스 신호를 이용하여 부가 정보를 생성하는 부가정보생성부; 및 상기 부가 정보를 상기 믹스 신호의 비지각적 영역에 임베딩하는 임베딩부를 포함하되, 상기 리믹스될 소스 신호는 상기 소스 신호들 중에서 선택되고, 상기 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 장치를 제공한다.In addition, in order to achieve the above object, the present invention provides an additional information generation unit for generating additional information using a mix signal including at least one source signal and the source signal to be remixed; And an embedding unit to embed the additional information in the non-perceptual region of the mix signal, wherein the source signal to be remixed is selected from the source signals, and the additional information is a relationship between the source signal to be remixed and the mix signal. It provides a signal processing apparatus characterized in that.

이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시예를 첨부한 도면을 참조하여 설명한다.Hereinafter, with reference to the accompanying drawings, preferred embodiments of the present invention that can specifically realize the above object will be described.

본 발명은 믹스 신호를 소스(object) 신호 단위로 처리할 수 있는 알고리즘을 제공한다. 믹스 신호를 소스 신호 단위로 처리하는 경우, 매우 다양한 효과를 생성할 수 있다. 예를 들면, 영화를 보면서 배우들 음성에 대한 볼륨은 일정하게 유지하면서, 배경음악의 볼륨만을 높이는 것이 가능하다. 본 발명에서 소스 신호란 믹스 신호를 구성하는 하나 이상의 소스(source)(예를 들면, 피아노)를 포함한다. 소스 신호 단위의 처리란 믹스 신호를 처리함에 있어서, 상기 믹스 신호를 구성하는 특정한 소스 신호와 관련된 특성들(예를 들면, 로컬화(localization), 게인(gain))이 "개별적으로(individually)" 수정될 수 있다는 것을 의미한다. 상기 "개별적으로"란 특정한 소스와 관련된 특성을 수정하는 것이 다른 소스 신호들의 특 성에 영향을 미치지 않거나, 지각적으로 느끼기 어려운 작은 영향만을 미치는 것을 의미한다. 설명의 편의상 이하에서 믹스 신호를 예로 하여 기술할 것이나, 본 발명은 믹스 신호에만 한정되지 않는다. 본 발명에서는 통상적인 믹스 신호의 포맷(예를 들면, PCM, MP3, MPEG-AAC)뿐만 아니라, 적은 양의 부가 정보(side information)가 전송된다. 상기 부가 정보를 이용하여, 전송된 믹스 신호에 포함된 소스 신호들을 리믹싱(re-mixing)할 수 있다. The present invention provides an algorithm that can process a mixed signal in an object signal unit. When the mix signal is processed in units of source signals, a wide variety of effects can be produced. For example, while watching a movie, it is possible to increase only the volume of the background music while keeping the volume of the actors' voices constant. In the present invention, the source signal includes one or more sources (eg, pianos) constituting the mix signal. Processing in source signal units means that in processing a mix signal, characteristics (eg, localization, gain) associated with a particular source signal constituting the mix signal are " individually ". It can be modified. By “individually” it is meant that modifying the characteristics associated with a particular source does not affect the characteristics of other source signals, or only a small effect that is difficult to perceive. For convenience of explanation, hereinafter, the mixed signal will be described as an example, but the present invention is not limited only to the mixed signal. In the present invention, a small amount of side information is transmitted as well as a typical mix signal format (for example, PCM, MP3, MPEG-AAC). The additional information may be used to re-mix source signals included in the transmitted mixed signal.

도 1은 본 발명의 일 실시예에 따른 제1 리믹스 신호 인코더의 블록도이다. 상기 제1 리믹스 신호 인코더는 부가정보생성부(103) 및 부가정보인코딩부(105)를 포함한다. 1 is a block diagram of a first remix signal encoder according to an embodiment of the present invention. The first remix signal encoder includes an additional information generator 103 and an additional information encoder 105.

도 1을 참조하면, 부가정보생성부(103)는 통상적인 믹스 신호(101) 및 상기 믹스 신호를 구성하는 소스 신호(102)를 이용하여 부가 정보(104)를 생성한다. 상기 믹스 신호(101)는 모노(mono), 스테레오(stereo) 및 멀티채널 믹스 신호(multi-channel audio signal)가 될 수 있다. 상기 소스 신호(102)는 상기 믹스 신호(101)를 구성하는 소스 신호들 중 일부 또는 전부가 될 수 있다. 상기 부가 정보(104)는 상기 믹스 신호를 소스 신호 단위로 처리하는데 이용되는 정보를 말한다. 상기 부가 정보(104)는 상기 믹스 신호를 리믹싱하기 위한 믹스 파라미터를 포함한다. 상기 믹스 파라터에는 인코더에서 소스 신호를 이용하여 생성된 인코더 믹스 파라미터(Encoder mix parameter)를 포함하며, 선택적으로 믹스 신호만을 이용하여 생성된 블라인드 믹스 파라미터(Blind mix parameter)를 포함할 수 있다. 상기 믹스 파라미터의 예로는 각각의 소스 신호에 대한 게인 값 및 서브밴드 파위(subband power) 등이 될 수 있다. 상기 부가 정보(104)에 대한 구체적인 정의 및 생성 방법은 도 2에서 기술된다. 본 발명은 또한 믹스 신호를 구성하는 소스 신호(102)만을 이용하여 부가 정보(104)를 생성하는 것을 포함한다. 부가정보인코딩부(105)는 생성된 부가 정보(104)를 인코딩하여 부호화된 부가 정보 신호(106)를 생성한다. 상기 믹스 신호(101) 및 상기 부가 정보 신호(106)는 디코딩 장치로 전송된다.Referring to FIG. 1, the additional information generator 103 generates additional information 104 using a typical mix signal 101 and a source signal 102 constituting the mixed signal. The mix signal 101 may be a mono, stereo and multi-channel audio signal. The source signal 102 may be some or all of the source signals constituting the mix signal 101. The additional information 104 refers to information used to process the mixed signal in source signal units. The additional information 104 includes mix parameters for remixing the mix signal. The mix parameter may include an encoder mix parameter generated using a source signal in an encoder, and optionally, a blind mix parameter generated using only a mix signal. Examples of the mix parameter may include a gain value and a subband power for each source signal. A detailed definition and generation method for the additional information 104 is described in FIG. 2. The present invention also includes generating the additional information 104 using only the source signal 102 constituting the mix signal. The side information encoding unit 105 encodes the generated side information 104 to generate an encoded side information signal 106. The mix signal 101 and the side information signal 106 are transmitted to a decoding apparatus.

도 2는 믹스 신호가 스테레오 신호인 경우, 도 1의 제1 리믹스 신호 인코딩 장치에 대한 상세 블록도이다. 전술한 것처럼, 본 발명에서 사용되는 믹스 신호는 모노, 스테레오 및 멀티채널 믹스 신호가 될 수 있으나, 편의상 스테레오 신호(201)를 기준으로 설명한다.FIG. 2 is a detailed block diagram of the first remix signal encoding apparatus of FIG. 1 when the mixed signal is a stereo signal. As described above, the mixed signal used in the present invention may be a mono, stereo and multichannel mixed signal, but for convenience, the mixed signal will be described based on the stereo signal 201.

상기 스테레오 신호(stereo signal)(201)

Figure 112007046536320-pat00001
Figure 112007046536320-pat00002
는 상기 스테레오 신호를 구성하는 소스 신호들의 합으로 표현될 수 있다. 여기서, n은 타임 인덱스를 의미한다. 따라서, 상기 스테레오 신호(201)는 아래의 [수학식 1]과 같이 표현될 수 있다.The stereo signal 201
Figure 112007046536320-pat00001
And
Figure 112007046536320-pat00002
May be expressed as a sum of source signals constituting the stereo signal. Here, n means time index. Therefore, the stereo signal 201 may be expressed as Equation 1 below.

Figure 112007046536320-pat00003
Figure 112007046536320-pat00003

여기서, I는 스테레오 신호 내에 포함되는 소스 신호들의 개수이고,

Figure 112007046536320-pat00004
은 소스 신호들을 나타낸다.
Figure 112007046536320-pat00005
Figure 112007046536320-pat00006
는 각각의 소스 신호에 대한 진폭 패닝(amplitude panning) 및 게인(gain)을 결정하는 값이다. 모든
Figure 112007046536320-pat00007
들은 서로 독립적이다. 상기
Figure 112007046536320-pat00008
는 모두 순수한 소스 신호이거나, 또는 순수한 소스 신호에 약간의 잔향(reverberation) 및 효과음 신호성분(sound effect signal components)을 포함할 수 있다. 예를 들면, 특정한 잔향 신호성분은 2개의 소스 신호, 즉, 왼쪽 채널로 믹스된 신호와 오른쪽 채널로 믹스된 신호로 표현될 수 있다.Here, I is the number of source signals included in the stereo signal,
Figure 112007046536320-pat00004
Represents source signals.
Figure 112007046536320-pat00005
And
Figure 112007046536320-pat00006
Is a value that determines the amplitude panning and gain for each source signal. all
Figure 112007046536320-pat00007
They are independent of each other. remind
Figure 112007046536320-pat00008
Are all pure source signals, or may include some reverberation and sound effect signal components in the pure source signal. For example, the specific reverberation signal component may be represented by two source signals, that is, a signal mixed with the left channel and a signal mixed with the right channel.

본 발명의 목적은 M개(0 <= M <= I)의 소스 신호들이 리믹스 되도록, 상기 소스 신호를 포함하는 스테레오 신호를 수정하는 것이다. 상기 소스 신호들은 서로 다른 게인 팩터들을 가지면서 스테레오 신호로 리믹스될 수 있다. 리믹스 신호는 아래의 [수학식 2]와 같이 표현될 수 있다.It is an object of the present invention to modify a stereo signal comprising the source signal such that M (0 <= M <= I) source signals are remixed. The source signals may be remixed into a stereo signal with different gain factors. The remix signal may be expressed as Equation 2 below.

Figure 112007046536320-pat00009
Figure 112007046536320-pat00009

여기서,

Figure 112007046536320-pat00010
Figure 112007046536320-pat00011
는 리믹스되는 M개의 소스 신호들에 대한 새로운 게인 팩터들이다. 상기
Figure 112007046536320-pat00012
Figure 112007046536320-pat00013
는 디코더 단에서 제공될 수 있다. 이 경우에, 부가정보생성부(206)는 스테레오 신호(201) 및 M개의 소스 신호(202)를 이용하여 부가 정보(207)를 생성할 수 있다. here,
Figure 112007046536320-pat00010
And
Figure 112007046536320-pat00011
Are new gain factors for the M source signals to be remixed. remind
Figure 112007046536320-pat00012
And
Figure 112007046536320-pat00013
May be provided at the decoder stage. In this case, the additional information generator 206 may generate the additional information 207 using the stereo signal 201 and the M source signals 202.

상술하였듯이, 본 발명의 목적은 통상적인 스테레오 신호와 약간의 부가 정보가 주어지는 경우에, 상기 스테레오 신호를 소스 신호 단위로 리믹스하는 것이다. 본 발명에서와 같이 매우 적은 양의 부가 정보를 이용하여 [수학식 1]로 표현되는 믹스 신호로부터 [수학식 2]로 표현되는 리믹스 신호를 완벽하게 생성하는 것은 가능하지 않다. 따라서, 본 발명은 각각의 소스 신호들

Figure 112007046536320-pat00014
에 대한 접근 없이, [수학식 1]로 표현되는 통상적인 믹스 신호가 주어지는 경우에, [수학식 2]로 표현되는 리믹스 신호를 지각적으로 모방하는 것을 목적으로 한다.As described above, an object of the present invention is to remix the stereo signal in the unit of the source signal when given a conventional stereo signal and some additional information. As in the present invention, it is not possible to completely generate the remix signal represented by Equation 2 from the mixed signal represented by Equation 1 using a very small amount of additional information. Thus, the present invention provides the respective source signals
Figure 112007046536320-pat00014
It is aimed to perceptually mimic the remix signal represented by [Equation 2], given an ordinary mix signal represented by [Equation 1] without access to.

도 2를 참조하면, 제1 리믹스 신호 인코딩 장치에 통상적인 스테레오 신호(201) 및 상기 스테레오 신호(201)에 포함되는 M개의 소스 신호(202)가 입력된다. 상기 스테레오 신호(201)는 부가 정보와 동기화되기 위해 어느 정도 딜레이 되어, 출력 신호로서 직접 이용될 수 있다. 부가 정보를 생성하기 위해, 상기 스테레오 신호(201) 및 소스 신호들(202)은 필터뱅크(203)를 통하여 시간-주파수 도메인의 서브밴드별 신호(204 및 205)로 분해된다. 즉, 상기 스테레오 신호(201) 및 소스 신호는 시간-주파수 도메인에서 처리되는데, 상기 시간-주파수 도메인에 대해서는 도 3에서 후술한다. 상기 서브밴드별 신호(204)는 각 서브밴드의 중심 주파수에서 유사하게 프로세싱된다. 특정한 주파수에서 스테레오 신호(201)의 서브밴드 쌍(204)은

Figure 112007046536320-pat00015
Figure 112007046536320-pat00016
로 표시된다. 여기서 k는 서브밴드 신호들의 시간 인덱스(time index)이다. 유사하게, M개의 소스 신호들(202)의 서브밴드 신호들(205)은
Figure 112007046536320-pat00017
,
Figure 112007046536320-pat00018
,...,
Figure 112007046536320-pat00019
로 표시된다. 명료한 표현을 위해, 서브밴드(주파수) 인덱스를 사용하지 않았다.Referring to FIG. 2, a stereo signal 201 and M source signals 202 included in the stereo signal 201 are input to a first remix signal encoding apparatus. The stereo signal 201 may be delayed to some extent to be synchronized with the side information and used directly as an output signal. To generate the additional information, the stereo signal 201 and the source signals 202 are decomposed into subband-specific signals 204 and 205 in the time-frequency domain through the filter bank 203. That is, the stereo signal 201 and the source signal are processed in the time-frequency domain, which will be described later with reference to FIG. 3. The subband-specific signal 204 is similarly processed at the center frequency of each subband. At a particular frequency, the subband pair 204 of the stereo signal 201
Figure 112007046536320-pat00015
And
Figure 112007046536320-pat00016
Is displayed. Where k is the time index of the subband signals. Similarly, the subband signals 205 of the M source signals 202 may be
Figure 112007046536320-pat00017
,
Figure 112007046536320-pat00018
, ...,
Figure 112007046536320-pat00019
Is displayed. For clarity, no subband (frequency) index is used.

상기 소스 신호들(202)의 서브밴드 신호들(205)이 주어지면, 부가정보생성부(206)는 서브밴드별로 숏-타임 서브밴드 파워(short-time subband power),

Figure 112007046536320-pat00020
를 생성한다. 또한, 상기 부가정보생성부(206)는 스테레오 신호(201)의 서브밴드 쌍(204)을 이용하여, 서브밴드별로 게인 팩터
Figure 112007046536320-pat00021
Figure 112007046536320-pat00022
를 생성한다. 상기 게인 팩터
Figure 112007046536320-pat00023
Figure 112007046536320-pat00024
는 외부에서 직접 주어질 수 있다. 상기 서브밴드별 숏-타임 서브밴드 파워 및 게인 팩터를 이용하여 서브밴드별 부가 정보(207)가 생성된다. 상기 부가정보생성부(206)는 상기 숏-타임 서브밴드 파워 및 게인 팩터들 이외에 상기 스테레오 신호에 관련된 다른 정보를 부가 정보(207)로 생성할 수 있다. 부가정보인코딩부(208)는 상기 서브밴드별 부가정보(207)를 이용하여 부호화된 부가 정보 신호(209)를 생성한다. Given the subband signals 205 of the source signals 202, the side information generator 206 may perform short-time subband power for each subband,
Figure 112007046536320-pat00020
Create In addition, the additional information generator 206 uses a subband pair 204 of the stereo signal 201 to obtain a gain factor for each subband.
Figure 112007046536320-pat00021
And
Figure 112007046536320-pat00022
Create The gain factor
Figure 112007046536320-pat00023
And
Figure 112007046536320-pat00024
Can be given directly from the outside. Subband-specific additional information 207 is generated using the short-time subband power and gain factor for each subband. The additional information generator 206 may generate other information related to the stereo signal as additional information 207 in addition to the short-time subband power and gain factors. The additional information encoding unit 208 generates an additional information signal 209 encoded using the additional information 207 for each subband.

많은 스테레오 신호(201)에 대하여, 게인 팩터

Figure 112007046536320-pat00025
Figure 112007046536320-pat00026
는 고정적이 될 것이다. 만일
Figure 112007046536320-pat00027
Figure 112007046536320-pat00028
가 시간 k에 따라 가변적이라면, 상기 게인 팩터들은 시 간의 함수로 생성될 것이다. 상기 게인 팩터들은 직접 양자화 및 부호화되지 않고, 먼저 양자화 및 부호화에 더 적합한 다른 값들로 전환될 수 있다. 또한,
Figure 112007046536320-pat00029
는 스테레오 신호(201)의 서브밴드 파워에 상대적인 값으로 정규화될 수 있다. 이것은 스테레오 신호를 효율적으로 부호화하기 위해 통상적인 인코딩 장치가 이용되는 경우에, 본 발명을 상대적으로 변화에 강하도록 만들어준다. 예를 들면,
Figure 112007046536320-pat00030
Figure 112007046536320-pat00031
는 아래의 [수학식 3]으로 표현되는 게인 및 데시벨(dB) 단위의 레벨차로 전환되어 전송될 수 있다. For many stereo signals 201, the gain factor
Figure 112007046536320-pat00025
And
Figure 112007046536320-pat00026
Will be fixed. if
Figure 112007046536320-pat00027
And
Figure 112007046536320-pat00028
If is variable over time k, the gain factors will be generated as a function of time. The gain factors are not directly quantized and coded, but may first be converted to other values more suitable for quantization and coding. Also,
Figure 112007046536320-pat00029
Can be normalized to a value relative to the subband power of the stereo signal 201. This makes the present invention relatively resistant to changes when conventional encoding devices are used to encode stereo signals efficiently. For example,
Figure 112007046536320-pat00030
And
Figure 112007046536320-pat00031
May be converted into a level difference in units of gain and decibel (dB) expressed by Equation 3 below, and then transmitted.

Figure 112007046536320-pat00032
Figure 112007046536320-pat00032

또한,

Figure 112007046536320-pat00033
는 부가 정보로서 직접 부호화되는 것이 아니라, 아래의 [수학식 4]로 표현되는 스테레오 신호에 상대적으로 정의된 값으로 변환되어 전송될 수 있다. Also,
Figure 112007046536320-pat00033
Is not directly encoded as additional information, but may be converted into a value defined relative to the stereo signal represented by Equation 4 below and transmitted.

Figure 112007046536320-pat00034
Figure 112007046536320-pat00034

숏-타임 서브밴드 파워를 생성하기 위해, 본 발명은 단일-폴 평균(single-pole averaging)을 사용한다. 즉,

Figure 112007046536320-pat00035
는 아래의 [수학식 5]와 같이 계산될 수 있다. To produce short-time subband power, the present invention uses single-pole averaging. In other words,
Figure 112007046536320-pat00035
May be calculated as shown in Equation 5 below.

Figure 112007046536320-pat00036
Figure 112007046536320-pat00036

여기서, α∈[0,1]는 아래의 [수학식 6]와 같이 지수적으로 감소하는 추정 윈도우(estimation window)의 시간-상수를 결정한다.Here, α∈ [0,1] determines the time-constant of the estimation window (estimation window) which decreases exponentially as shown in Equation 6 below.

Figure 112007046536320-pat00037
Figure 112007046536320-pat00037

여기서,

Figure 112007046536320-pat00038
는 서브밴드 샘플링 주파수를 나타낸다. 예를 들면, T=40 ms를 이용할 수 있다. 이하에서,
Figure 112007046536320-pat00039
는 숏-타임 평균(short-time averaging)을 나타낸다. 만일
Figure 112007046536320-pat00040
Figure 112007046536320-pat00041
가 주어지지 않는다면, 상기
Figure 112007046536320-pat00042
Figure 112007046536320-pat00043
는 부가정보생성부(206)에서 생성될 필요가 있다.
Figure 112007046536320-pat00044
이므로,
Figure 112007046536320-pat00045
는 아래의 [수학식 7]과 같이 계산된다.here,
Figure 112007046536320-pat00038
Denotes a subband sampling frequency. For example, T = 40 ms can be used. In the following,
Figure 112007046536320-pat00039
Denotes short-time averaging. if
Figure 112007046536320-pat00040
And
Figure 112007046536320-pat00041
If is not given,
Figure 112007046536320-pat00042
And
Figure 112007046536320-pat00043
Needs to be generated in the additional information generation unit 206.
Figure 112007046536320-pat00044
Because of,
Figure 112007046536320-pat00045
Is calculated as shown in Equation 7 below.

Figure 112007046536320-pat00046
Figure 112007046536320-pat00046

유사하게,

Figure 112007046536320-pat00047
는 아래의 [수학식 8]과 같이 계산된다.Similarly,
Figure 112007046536320-pat00047
Is calculated as shown in Equation 8 below.

Figure 112007046536320-pat00048
Figure 112007046536320-pat00048

도 3은 본 발명의 일 실시예에 따른 믹스 신호를 처리하기 위한 도메인을 도시한다. 전술한 것처럼, 믹스 신호 및 부가 정보는 도 3에 도시된 것과 같은 시간-주파수 도메인의 서브밴드별 신호로서 처리된다. 상기 시간-주파수 도메인의 서브밴드별 신호는 지각적으로 유도된다. 예를 들면, 약 20ms의 길이를 가지는 사인파 분석창 및 통합창(sine analysis and synthesis window)을 가지는 STFT(Short Time Fourier transform)를 이용하여 서브밴드별 신호를 생성할 수 있다. 이때, STFT 계수들은 하나의 그룹이 ERB(equivalent rectangular bandwidth)의 약 2배가 되는 대역폭을 갖도록 그룹화될 수 있다. 3 illustrates a domain for processing a mix signal according to an embodiment of the present invention. As described above, the mix signal and the side information are processed as subband-specific signals in the time-frequency domain as shown in FIG. Subband-specific signals in the time-frequency domain are perceptually derived. For example, a signal for each subband may be generated by using a short time fourier transform (STFT) having a sine wave analysis window and a sine analysis and synthesis window having a length of about 20 ms. In this case, the STFT coefficients may be grouped such that one group has a bandwidth that is about twice the equivalent rectangular bandwidth (ERB).

도 4는 본 발명의 일 실시예에 따른 제2 리믹스 신호 인코딩 장치에 대한 블록도이다. 상기 제2 리믹스 신호 인코딩 장치는 다운믹싱부(402), 부가정보생성부(403) 및 부가정보인코딩부(406)을 포함한다.4 is a block diagram of a second remix signal encoding apparatus according to an embodiment of the present invention. The second remix signal encoding apparatus includes a downmixing unit 402, an additional information generating unit 403, and an additional information encoding unit 406.

도 4를 참조하면, 다운믹싱부(402)는 복수의 소스 신호들(401)을 더하여 하나의 합 신호(sum signal)(404)을 생성한다. 제2 리믹스 신호 인코딩 장치는 제1 리믹스 신호 인코딩 장치와는 달리, 스테레오 신호를 전송하는 대신에 상기 합 신호(404)를 전송한다. 부가정보생성부(403)는 상기 소스 신호들(401)을 이용하여 부가 정보(405)를 생성한다. 상기 부가 정보(405)는 각 소스 신호에 대응하는 서브밴드 파워 및 게인 팩터를 포함한다. 또한, 상기 부가 정보(405)는 리믹스렌더링부에서의 딜레이에 대응하는 파라미터를 포함할 수 있다. 제1 리믹스 신호 인코딩 장치에서와 유사하게, 상기 부가 정보(405)는 양자화 및 부호화에 더 적합한 다른 값으로 변환되어 전송될 수 있다. 부가정보인코딩부(406)는 생성된 부가 정보(405)를 이용하여 부호화된 부가 정보 신호(407)를 생성한다. 생성된 상기 합 신호(404) 및 부가 정보 신호(407)는 디코딩 장치로 전송된다. 본 발명은 또한 다운믹싱부(402)를 가지지 않는 인코딩 장치를 포함한다. 이 경우에, 소스 신호들(401)은 합 신호(404)로 변환되지 않고, 각 소스 신호들(401)이 직접 전송된다.Referring to FIG. 4, the downmixing unit 402 generates a sum signal 404 by adding a plurality of source signals 401. Unlike the first remix signal encoding apparatus, the second remix signal encoding apparatus transmits the sum signal 404 instead of the stereo signal. The additional information generator 403 generates the additional information 405 using the source signals 401. The additional information 405 includes subband power and gain factor corresponding to each source signal. In addition, the additional information 405 may include a parameter corresponding to a delay in the remix rendering unit. Similar to the first remix signal encoding apparatus, the additional information 405 may be converted into another value more suitable for quantization and encoding and transmitted. The additional information encoding unit 406 generates an encoded additional information signal 407 using the generated additional information 405. The generated sum signal 404 and the side information signal 407 are transmitted to the decoding apparatus. The present invention also includes an encoding apparatus that does not have a downmixing unit 402. In this case, the source signals 401 are not converted to the sum signal 404, and each source signal 401 is transmitted directly.

도 5는 본 발명의 일 실시예에 따른 제1 리믹스 신호 디코딩 장치에 대한 블록도이다. 상기 제1 리믹스 신호 디코딩 장치는 부가정보디코딩부(503) 및 리믹스렌더링부(505)를 포함한다.5 is a block diagram of an apparatus for decoding a first remix signal according to an embodiment of the present invention. The first remix signal decoding apparatus includes an additional information decoder 503 and a remix renderer 505.

도 5를 참조하면, 믹스 신호(501) 및 부가 정보 신호(502)가 제1 리믹스 신호 디코딩 장치에 입력된다. 상기 믹스 신호(501)는 모노, 스테레오 또는 멀티채널 믹스 신호가 될 수 있다. 부가정보디코딩부(503)는 부가 정보 신호(502)를 디코딩하여 부가 정보(504)를 생성한다. 상기 부가 정보(504)는 전송된 믹스 신호(501)에 포함된 소스 신호들의 게인 팩터 및 서브밴드 파워 등을 포함한다. 리믹스렌더링부(505)에는 사용자가 직접 제공하는 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(user-mix parameter, 506)가 입력될 수 있다. 리믹스렌더링부(505)는 믹스 신호(501), 전송된 부가 정보(504) 및 사용자 믹스 파라미터(506)를 이용하여 리믹스 신호(507)를 생성한다. 상기 리믹스 신호를 생성하는 방법에 관한 구체적인 설명은 도 6에서 후술한다. 리믹스 신호(507)는 전송된 믹스 신호의 채널 수와 동일한 채널 수를 가지는 동채널 믹스 신호(Eq-channel mix signal)로 생성되거나, 또는 믹스 신호의 채널 수보다 많은 채널 수를 가지는 업채널 믹스 신호(Up-channel mix signal)로 생성될 수 있다.Referring to FIG. 5, the mix signal 501 and the additional information signal 502 are input to the first remix signal decoding apparatus. The mix signal 501 may be a mono, stereo or multichannel mix signal. The additional information decoding unit 503 decodes the additional information signal 502 to generate additional information 504. The additional information 504 includes a gain factor and a subband power of source signals included in the transmitted mixed signal 501. The remix renderer 505 may input a user-mix parameter 506 generated using control information directly provided by the user. The remix renderer 505 generates the remix signal 507 using the mix signal 501, the transmitted additional information 504, and the user mix parameter 506. A detailed description of the method of generating the remix signal will be described later with reference to FIG. 6. The remix signal 507 is generated as an Eq-channel mix signal having the same number of channels as the number of channels of the transmitted mix signal, or an upchannel mix signal having more channels than the number of channels of the mix signal. (Up-channel mix signal) can be generated.

도 6은 스테레오 신호를 이용하는 경우, 도 5의 제1 리믹스 신호 디코딩 장치에 대한 상세도이다. 전술한 것처럼, 전송된 믹스 신호는 모노, 스테레오 및 멀티채널 믹스 신호가 될 수 있으나, 편의상 스테레오 신호(601)를 기준으로 설명한다. FIG. 6 is a detailed diagram of the first remix signal decoding apparatus of FIG. 5 when using a stereo signal. As described above, the transmitted mixed signal may be a mono, stereo and multichannel mixed signal, but will be described with reference to the stereo signal 601 for convenience.

도 6을 참조하면, 스테레오 신호(601)는 필터뱅크(603)을 통하여 시간-주파수 도메인의 서브밴드별 신호(604)로 분해된다. 도 6에 도시된 것처럼, 특정한 주파수에서의 서브밴드별 신호(604)은

Figure 112007046536320-pat00049
Figure 112007046536320-pat00050
로 표현된다. 부가정보디코딩부(605)는 전송된 부가 정보 신호(602)를 복호화하여, 서브밴드별 부가 정보(606)를 생성한다. 또한, 리믹스렌더링부(607)에 사용자가 제공하는 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(608)가 입력될 수 있으며, 상기 사용자 믹 스 파라미터(608)는 서브밴드별로 제공될 수 있다. 전술한 것처럼, 상기 부가 정보(606)는 리믹스 될 M개의 소스 신호에 대한 서브밴드별 게인 팩터(
Figure 112007046536320-pat00051
Figure 112007046536320-pat00052
) 및
Figure 112007046536320-pat00053
로 표현되는 서브밴드 파워를 포함한다. 리믹스렌더링부(607)는 서브밴드별로 생성된 스테레오 신호(604), 전송된 부가 정보(606) 및 사용자 믹스 파라미터(608)를 이용하여, 서브밴드별 리믹스 신호(609),
Figure 112007046536320-pat00054
Figure 112007046536320-pat00055
를 생성한다. 상기 리믹스 신호(609)를 생성하는 방법은 아래에서 더욱 상세하게 기술된다. 상기 리믹스 신호(609)는 역필터뱅크(610)를 통해 시간 도메인(time domain)의 스테레오 신호(611),
Figure 112007046536320-pat00056
Figure 112007046536320-pat00057
로 변환된다. Referring to FIG. 6, the stereo signal 601 is decomposed into a subband-specific signal 604 in the time-frequency domain through the filter bank 603. As shown in FIG. 6, the subband-specific signal 604 at a particular frequency
Figure 112007046536320-pat00049
And
Figure 112007046536320-pat00050
It is expressed as The additional information decoding unit 605 decodes the transmitted additional information signal 602 to generate additional information 606 for each subband. In addition, a user mix parameter 608 generated using control information provided by a user may be input to the remix renderer 607, and the user mix parameter 608 may be provided for each subband. As described above, the additional information 606 is a subband-specific gain factor for M source signals to be remixed.
Figure 112007046536320-pat00051
And
Figure 112007046536320-pat00052
) And
Figure 112007046536320-pat00053
It includes the subband power represented by. The remix renderer 607 uses the stereo signal 604 generated for each subband, the additional information 606 transmitted, and the user mix parameter 608, and the remix signal 609 for each subband,
Figure 112007046536320-pat00054
And
Figure 112007046536320-pat00055
Create The method of generating the remix signal 609 is described in more detail below. The remix signal 609 is a stereo signal 611 in the time domain through the inverse filter bank 610,
Figure 112007046536320-pat00056
And
Figure 112007046536320-pat00057
Is converted to.

리믹스렌더링부(607)에서 생성된 리믹스 신호(609)를 생성하는 방법은 다음과 같다. 상기 [수학식 1] 및 [수학식 2]는 서브밴드별 신호(604 및 609)에 대해서도 유효하다. 이 경우에, 소스 신호

Figure 112007046536320-pat00058
는 서브밴드별 소스 신호
Figure 112007046536320-pat00059
로 교체된다. 즉, 서브밴드별 믹스 신호(604)는 아래의 [수학식 9]과 같이 표현될 수 있다. A method of generating the remix signal 609 generated by the remix renderer 607 is as follows. [Equation 1] and [Equation 2] are also valid for the subband signals 604 and 609. In this case, the source signal
Figure 112007046536320-pat00058
Is the subband-specific source signal
Figure 112007046536320-pat00059
Is replaced by. That is, the mix signal 604 for each subband may be expressed by Equation 9 below.

Figure 112007046536320-pat00060
Figure 112007046536320-pat00060

서브밴드별 리믹스 신호(609)는 아래의 [수학식 10]과 같이 표현될 수 있다. The subband remix signal 609 may be expressed by Equation 10 below.

Figure 112007046536320-pat00061
Figure 112007046536320-pat00061

리믹스 신호(609)를 생성하기 위해, 최소자승추정법(least squares estimation)이 이용될 수 있다. 서브밴드별 믹스 신호(604),

Figure 112007046536320-pat00062
Figure 112007046536320-pat00063
가 주어지면, 아래의 [수학식 11]와 같이 서로 다른 게인들을 가지는 서브밴드별 리믹스 신호(609)가 상기 서브밴드별 믹스 신호(604)의 선형 조합으로 추정될 수 있다.To generate the remix signal 609, least squares estimation may be used. Per subband mix signal 604,
Figure 112007046536320-pat00062
And
Figure 112007046536320-pat00063
Given by Equation 11 below, the subband remix signal 609 having different gains may be estimated as a linear combination of the subband mix signals 604.

Figure 112007046536320-pat00064
Figure 112007046536320-pat00064

여기서,

Figure 112007046536320-pat00065
,
Figure 112007046536320-pat00066
,
Figure 112007046536320-pat00067
Figure 112007046536320-pat00068
는 가중 팩터들(weighting factors)이다. 이때, 생성되는 추정 에러(estimation error)는 아래의 [수학식 12]과 같이 정의될 수 있다.here,
Figure 112007046536320-pat00065
,
Figure 112007046536320-pat00066
,
Figure 112007046536320-pat00067
And
Figure 112007046536320-pat00068
Is the weighting factors. In this case, the generated estimation error may be defined as shown in Equation 12 below.

Figure 112007046536320-pat00069
Figure 112007046536320-pat00069

상기 가중 팩터들,

Figure 112007046536320-pat00070
,
Figure 112007046536320-pat00071
,
Figure 112007046536320-pat00072
Figure 112007046536320-pat00073
는 평균제곱오차(mean square error),
Figure 112007046536320-pat00074
Figure 112007046536320-pat00075
가 최소가 되도록 서브밴드별로 생성될 수 있다. 이때, 추정 에러,
Figure 112007046536320-pat00076
Figure 112007046536320-pat00077
Figure 112007046536320-pat00078
Figure 112007046536320-pat00079
에 직교(orthogonal)될 때, 상기 평균제곱오차가 최소가 된다는 것을 이용할 수 있다. 생성되는
Figure 112007046536320-pat00080
Figure 112007046536320-pat00081
는 아래의 [수학식 13]과 같이 표현될 수 있다.The weighting factors,
Figure 112007046536320-pat00070
,
Figure 112007046536320-pat00071
,
Figure 112007046536320-pat00072
And
Figure 112007046536320-pat00073
Is the mean square error,
Figure 112007046536320-pat00074
And
Figure 112007046536320-pat00075
May be generated for each subband such that is minimized. In this case, the estimation error,
Figure 112007046536320-pat00076
And
Figure 112007046536320-pat00077
end
Figure 112007046536320-pat00078
And
Figure 112007046536320-pat00079
When orthogonal to, it can be used that the mean square error is minimized. Generated
Figure 112007046536320-pat00080
And
Figure 112007046536320-pat00081
May be expressed as Equation 13 below.

Figure 112007046536320-pat00082
Figure 112007046536320-pat00082

여기서,

Figure 112007046536320-pat00083
,
Figure 112007046536320-pat00084
Figure 112007046536320-pat00085
는 직접 생성될 수 있지만,
Figure 112007046536320-pat00086
Figure 112007046536320-pat00087
은 전송된 부가 정보(606)(예를 들면,
Figure 112007046536320-pat00088
,
Figure 112007046536320-pat00089
,
Figure 112007046536320-pat00090
) 및 사용자가 제공하는 제어 정보(608)(예를 들면, 게인 팩터
Figure 112007046536320-pat00091
Figure 112007046536320-pat00092
)를 이용하여, 아래의 [수학식 14]와 같이 생성될 수 있다.here,
Figure 112007046536320-pat00083
,
Figure 112007046536320-pat00084
And
Figure 112007046536320-pat00085
Can be generated directly,
Figure 112007046536320-pat00086
And
Figure 112007046536320-pat00087
Is transmitted additional information 606 (e.g.,
Figure 112007046536320-pat00088
,
Figure 112007046536320-pat00089
,
Figure 112007046536320-pat00090
) And control information 608 provided by the user (e.g., gain factor
Figure 112007046536320-pat00091
And
Figure 112007046536320-pat00092
) Can be generated as shown in Equation 14 below.

Figure 112007046536320-pat00093
Figure 112007046536320-pat00093

유사하게,

Figure 112007046536320-pat00094
Figure 112007046536320-pat00095
가 아래의 [수학식 15]와 같이 생성될 수 있다. Similarly,
Figure 112007046536320-pat00094
And
Figure 112007046536320-pat00095
May be generated as shown in Equation 15 below.

Figure 112007046536320-pat00096
Figure 112007046536320-pat00096

여기서,

Figure 112007046536320-pat00097
Figure 112007046536320-pat00098
는 아래의 [수학식 16]과 같이 표현될 수 있다. here,
Figure 112007046536320-pat00097
And
Figure 112007046536320-pat00098
May be expressed as Equation 16 below.

Figure 112007046536320-pat00099
Figure 112007046536320-pat00099

만일, 상기 믹스 신호(604)의 위상이 서로 동기되거나(coherent) 또는 거의 동기화된다면, 아래의 [수학식 17]와 같이 표현되는 값이 1에 근접하게 된다.If the phases of the mix signal 604 are coherent or nearly synchronized with each other, a value expressed by Equation 17 below approaches 1.

Figure 112007046536320-pat00100
Figure 112007046536320-pat00100

이때, 상기 가중치들은 아래의 [수학식 18]과 같이 표현될 수 있다. In this case, the weights may be expressed as Equation 18 below.

Figure 112007046536320-pat00101
Figure 112007046536320-pat00101

이와 같이 생성된 서브밴드별 리믹스 신호(609)는 전술한 것처럼 역필터뱅크(610)를 통해 시간-도메인의 리믹스 신호(611)로 변환된다. 상기 리믹스 신호(611)는 사용자가 제공한 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(

Figure 112007046536320-pat00102
Figure 112007046536320-pat00103
)를 이용하여 각각의 소스 신호를 독립적으로 리믹스하여 생성된 리믹스 신호와 유사하게 들린다.The subband remix signal 609 generated as described above is converted into the remix signal 611 of the time-domain through the inverse filter bank 610 as described above. The remix signal 611 may generate a user mix parameter generated using control information provided by a user.
Figure 112007046536320-pat00102
And
Figure 112007046536320-pat00103
It sounds similar to the remix signal generated by independently remixing each source signal with

지금까지는 2채널 스테레오 신호의 리믹싱에 초점을 맞추었다. 그러나, 전술한 것처럼 본 발명은 스테레오 신호에 제한되지 않고, 멀티채널 믹스 신호, 예를 들면 5.1채널 믹스 신호를 리믹싱하는 것까지 확대될 수 있다. 당업자들은 본 명세서에서 기술된 스테레오 신호와 유사하게, 멀티채널 믹스 신호를 리믹싱할 수 있다. 이 경우에, [수학식 11]는 아래의 [수학식 19]과 같이 쓰여질 수 있다.So far, the focus has been on remixing two-channel stereo signals. However, as described above, the present invention is not limited to stereo signals, but may be extended to remixing multichannel mixed signals, for example, 5.1 channel mixed signals. Those skilled in the art can remix multichannel mix signals, similar to the stereo signals described herein. In this case, Equation 11 may be written as Equation 19 below.

Figure 112007046536320-pat00104
Figure 112007046536320-pat00104

선택적으로, 믹스 신호의 채널들 중 특정한 채널은 리믹스하지 않고 남겨두도록 할 수 있다. 예를 들면, 5.1 서라운드 채널에 대하여, 2개의 뒤쪽 채널은 수정하지 않고, 앞쪽 채널에만 리믹싱을 적용하도록 할 수 있다. 이 경우에, 2 또는 3채널 리믹싱 알고리즘이 앞쪽 채널에 적용된다.Optionally, one of the channels of the mix signal can be left without remixing. For example, for a 5.1 surround channel, it is possible to apply remixing only to the front channel without modifying the two back channels. In this case, a two or three channel remix algorithm is applied to the front channel.

도 7은 본 발명의 일 실시예에 따른 제2 리믹스 신호 디코딩 장치에 대한 블록도이다. 상기 제2 리믹스 신호 디코딩 장치는 부가정보디코딩부(703), 공간정보통합부(705) 및 리믹스렌더링부(707)를 포함한다.7 is a block diagram of a second remix signal decoding apparatus according to an embodiment of the present invention. The second remix signal decoding apparatus includes an additional information decoding unit 703, a spatial information integration unit 705, and a remix rendering unit 707.

도 7을 참조하면, 소스 신호들의 합 신호(701) 및 부가 정보 신호(702)가 제2 리믹스 신호 디코딩 장치로 입력된다. 부가정보디코딩부(703)는 부가 정보 신호(702)를 디코딩하여, 부가 정보(704)를 생성한다. 상기 부가 정보(704)는 게인 팩터, 딜레이 상수 및 서브밴드 파워 등을 포함한다. 부가정보통합부(705)는 상기 부가 정보(704)를 이용하여, 상기 합 신호(701)를 복수의 소스 신호들(706)로 분리한다. 리믹스렌더링부(707)는 상기 소스 신호들(706)을 이용하여 리믹스 신호(709)를 생성할 수 있다. 이때, 상기 리믹스렌더링부(707)는 부가 정보로 전송된 믹스 파라미터를 이용하여 리믹스 신호(709)를 생성할 수 있다. 또한, 상기 리믹스렌더링부(707)는 선택적으로 사용자가 제공하는 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(708)를 이용하여 리믹스 신호(709)를 생성할 수 있다.Referring to FIG. 7, the sum signal 701 of the source signals and the additional information signal 702 are input to the second remix signal decoding apparatus. The additional information decoding unit 703 decodes the additional information signal 702 to generate additional information 704. The additional information 704 includes a gain factor, a delay constant, a subband power, and the like. The additional information integrator 705 separates the sum signal 701 into a plurality of source signals 706 by using the additional information 704. The remix renderer 707 may generate the remix signal 709 using the source signals 706. In this case, the remix renderer 707 may generate the remix signal 709 using the mix parameter transmitted as additional information. In addition, the remix renderer 707 may selectively generate the remix signal 709 using the user mix parameter 708 generated using control information provided by the user.

도 8A는 통상적인 인코딩 장치 및 본 발명의 일 실시예에 따른 리믹스 신호 인코딩 장치의 결합을 나타내는 블록도이다. 믹스 신호(801)는 통상적인 인코딩 장치(803)에 의해 부호화되어, 부호화된 믹스 신호(805)로 변환될 수 있다. 상기 믹스 신호(801)는 채널별 신호 또는 소스 신호가 될 수 있다. 상기 통상적인 인코딩 장치(803)는 AAC, MP3 인코더 등과 같은 종래의 인코딩 장치뿐만 아니라, 앞으로 개발될 인코딩 장치를 포함한다. 본 발명에 따른 리믹스 신호 인코딩 장치(804)는 상기 믹스 신호(801) 및 상기 믹스 신호에 포함되는 소스 신호(802)를 이용하여 부가 정보 신호(806)를 생성한다. 다중화부(807)는 부호화된 믹스 신호(805) 및 부가 정보 신호(806)를 이용하여 비트스트림(808)을 생성한다. 전술한 것처럼, 상기 부가 정보 신호(806)는 종래 장치들과 호환성을 가지도록, 종래 믹스 신호 포맷 내의 보조 데이터 영역에 삽입될 수 있다.8A is a block diagram illustrating a combination of a conventional encoding apparatus and a remix signal encoding apparatus according to an embodiment of the present invention. The mixed signal 801 may be encoded by the conventional encoding apparatus 803 and converted into the encoded mixed signal 805. The mix signal 801 may be a channel-specific signal or a source signal. The conventional encoding device 803 includes not only conventional encoding devices such as AAC, MP3 encoder, etc., but also encoding devices to be developed in the future. The remix signal encoding apparatus 804 according to the present invention generates the additional information signal 806 using the mixed signal 801 and the source signal 802 included in the mixed signal. The multiplexer 807 generates the bitstream 808 using the encoded mix signal 805 and the side information signal 806. As described above, the additional information signal 806 may be inserted into an auxiliary data area in a conventional mix signal format to be compatible with conventional devices.

도 8B는 통상적인 디코딩 장치 및 본 발명의 일 실시예에 따른 리믹스 신호 디코딩 장치의 결합에 대한 블록도이다. 역다중화부(810)는 전송된 비트스트림(809)으로부터 부호화된 믹스 신호(811) 및 부가 정보 신호(812)를 분리한다. 그 다음에, 통상적인 디코딩 장치(813)는 상기 부호화된 믹스 신호(811)를 디코딩하여, 본 발명에 따른 리믹스 신호 디코딩 장치(815)에서 이용될 수 있는 믹스 신호(814)를 생성한다. 상기 통상적인 디코딩 장치(813)는 AAC, MP3 디코더 등과 같 은 종래의 인코딩 장치뿐만 아니라, 앞으로 개발될 인코딩 장치를 포함한다. 상기 믹스 신호(814)는 채널별 신호 또는 소스 신호가 될 수 있다. 본 발명에 따른 리믹스 신호 디코딩 장치(817)는 부가 정보 신호(812) 및 사용자 믹스 파라미터(817) 중 적어도 하나를 이용하여 상기 믹스 신호(814)를 리믹스 신호(816)로 변환할 수 있다. 8B is a block diagram of a combination of a conventional decoding device and a remix signal decoding device according to an embodiment of the present invention. The demultiplexer 810 separates the encoded mix signal 811 and the side information signal 812 from the transmitted bitstream 809. The conventional decoding device 813 then decodes the encoded mix signal 811 to produce a mix signal 814 that can be used in the remix signal decoding device 815 according to the present invention. The conventional decoding device 813 includes not only a conventional encoding device such as an AAC, an MP3 decoder, etc. but also an encoding device to be developed in the future. The mix signal 814 may be a channel-specific signal or a source signal. The remix signal decoding apparatus 817 according to the present invention may convert the mix signal 814 into the remix signal 816 using at least one of the additional information signal 812 and the user mix parameter 817.

도 9는 본 발명의 일 실시예에 따른 리믹스 신호 디코딩 장치에 상세 블록도이다. 도 9를 참조하면, 리믹스 신호 디코딩 장치는 믹스신호디코딩부(901), 파라미터생성부(902), 및 리믹스렌더링부(908)를 포함한다. 선택적으로 이펙터(Effecter, 911)를 포함할 수 있다. 상기 파라미터생성부(902)는 블라인드믹스 파라미터생성부(903), 사용자믹스파라미터생성부(904), 및 리믹스파라미터생성부(905)를 포함할 수 있다. 상기 리믹스파라미터생성부(905)는 이퀴믹스파라미터생성부(906)를 포함하며, 선택적으로 업믹스파라미터생성부(907)를 포함할 수 있다. 또한, 상기 리믹스렌더링부(908)는 이퀴믹스렌더링부(909)를 포함하며, 선택적으로 업믹스렌더링부(910)를 포함할 수 있다.9 is a detailed block diagram of a remix signal decoding apparatus according to an embodiment of the present invention. Referring to FIG. 9, the remix signal decoding apparatus includes a mixed signal decoder 901, a parameter generator 902, and a remix renderer 908. It may optionally include an effector (911). The parameter generator 902 may include a blind mix parameter generator 903, a user mix parameter generator 904, and a remix parameter generator 905. The remix parameter generation unit 905 may include an equimix parameter generation unit 906 and may optionally include an upmix parameter generation unit 907. In addition, the remix renderer 908 may include an equimix renderer 909 and optionally include an upmix renderer 910.

상기 믹스신호디코딩부(901)는 인코딩 단에서 전송된 부호화된 믹스 신호를 디코딩하여 믹스 신호를 생성한다. 상기 파라미터생성부(902)는 인코딩 단에서 전송된 부가 정보 및 사용자 제어정보(또는, 구성정보)를 수신한다. 상기 사용자 제어정보는 인코더 단에서 전송되지 않고, 디코더 단에서 생성될 수 있다. 상기 사용자믹스파라미터생성부(904)는 사용자 제어정보를 이용하여 사용자 믹스 파라미터를 생성한다. 인코더 단에서 전송된 부가 정보에는 인코더 믹스 파라믹터(Encoder Mix Parameter)가 포함될 수 있다. 또한, 상기 블라인드믹스파라미터생성부(903)는 상기 믹스 신호를 이용하여 블라인드 믹스 파라미터(Blind-Mix Parameter)를 생성할 수 있다. 상기 인코더 믹스 파라미터와 상기 블라인드 믹스 파라미터는 택일적으로 리믹스파라미터생성부(905)로 입력된다.The mixed signal decoding unit 901 decodes the encoded mixed signal transmitted from the encoding end to generate a mixed signal. The parameter generator 902 receives additional information and user control information (or configuration information) transmitted from an encoding stage. The user control information is not transmitted at the encoder stage but may be generated at the decoder stage. The user mix parameter generator 904 generates a user mix parameter by using user control information. The additional information transmitted from the encoder stage may include an encoder mix parameter. In addition, the blind mix parameter generator 903 may generate a blind mix parameter using the mix signal. The encoder mix parameter and the blind mix parameter are alternatively input to the remix parameter generator 905.

상기 리믹스파라미터생성부(905)는 부가 정보 및 사용자 믹스 파라미터를 이용하여 리믹스 파라미터를 생성한다. 상기 리믹스 파라미터는 리믹스 신호의 채널에 적용될 수 있도록 생성될 수 있다. 리믹스파라미터생성부(905)에 포함되는 이퀴믹스파라미터생성부(906)는 믹스 신호의 채널 수와 동일한 채널 수를 가지는 리믹스 신호를 생성하는데 이용되는 리믹스 파라미터를 생성하고, 상기 리믹스파라미터생성부(905)에 포함될 수 있는 업믹스파라미터생성부(907)는 믹스 신호의 채널 수보다 더 많은 채널 수를 가지는 리믹스 신호를 생성하는데 이용되는 리믹스 파라미터를 생성한다. 상기 리믹스 파라미터는 리믹스렌더링부(908)에 입력된다.The remix parameter generator 905 generates a remix parameter using additional information and a user mix parameter. The remix parameter may be generated to be applied to a channel of the remix signal. Equimix parameter generation unit 906 included in the remix parameter generation unit 905 generates a remix parameter used to generate a remix signal having the same channel number as the number of channels of the mix signal, the remix parameter generation unit 905 The upmix parameter generation unit 907, which may be included in the control unit, generates a remix parameter used to generate a remix signal having a larger number of channels than the number of channels of the mixed signal. The remix parameter is input to the remix renderer 908.

상기 리믹스렌더링부(908)에 포함되는 이퀴믹스렌더링부(909)는 상기 리믹스 파라미터 및 믹스 신호를 이용하여, 상기 믹스 신호의 채널 수와 동일한 채널 수를 가지는 이퀴채널 리믹스 신호(Eq-channel remix signal)를 생성한다. 상기 리믹스렌더링부(908)에 포함될 수 있는 업믹스렌더링부(910)는 상기 업믹스파라미터생성부(907)에서 생성된 리믹스 파라미터 및 믹스 신호를 이용하여, 상기 믹스 신호의 채널 수보다 더 많은 채널 수를 가지는 업채널 리믹스 신호(Up-channel remix signal)를 생성한다. 상기 업믹스렌더링부(910)는 상기 이퀴채널렌더링부(909)에서 생성된 리믹스 신호를 이용하여 업채널 리믹스 신호를 생성할 수도 있다. Equimix renderer 909 included in the remix renderer 908, using the remix parameter and the mix signal, having an equal number of channels equal to the number of channels of the mix signal (Eq-channel remix signal ) The upmix renderer 910, which may be included in the remix renderer 908, uses more channels than the number of channels of the mix signal by using the remix parameter and the mix signal generated by the upmix parameter generator 907. Generate an up-channel remix signal having a number. The upmix renderer 910 may generate an upchannel remix signal using the remix signal generated by the Equichannel renderer 909.

따라서, 상기 디코딩 장치는 인코딩 단에서 전송한 믹스 신호를 그대로 출력하거나, 이퀴채널 리믹스 신호로 출력하거나, 또는 업채널 리믹스 신호로 출력할 수 있다. 선택적으로 상기 리믹스렌더링부는 이펙터(911)로부터 제공되는 정보를 이용하여, 상기 리믹스 신호에 다양한 효과를 줄 수 있다.Accordingly, the decoding apparatus may output the mixed signal transmitted from the encoding stage as it is, output as an equal channel remix signal, or output as an up channel remix signal. Optionally, the remix rendering unit may give various effects to the remix signal by using information provided from the effector 911.

도 10은 본 발명의 일 실시예에 따른 부가 정보를 임베드하는 인코딩 장치에 대한 블록도이다. 상기 인코딩 장치는 부가정보생성부(1103), 부가정보인코딩부(1005) 및 임베딩부(1007)를 포함한다.10 is a block diagram of an encoding apparatus for embedding additional information according to an embodiment of the present invention. The encoding apparatus includes an additional information generating unit 1103, an additional information encoding unit 1005, and an embedding unit 1007.

도 10을 참조하면, 믹스 신호(1001) 및 소스 신호(1002)가 상기 인코딩 장치로 입력된다. 전술한 것처럼, 상기 믹스 신호(1001)는 모노, 스테레오 또는 멀티채널 믹스 신호가 될 수 있다. 본 명세서에서는 편의상 스테레오 신호를 예로 하여 기술할 것이나, 본 발명이 이에 한정되지는 않는다. 부가정보생성부(side information generating unit, 1003)는 상기 믹스 신호(1001) 및 소스 신호(1002)를 이용하여 부가 정보(1004)를 생성한다. 상기 부가 정보(1004)는 상기 부가 정보는 상기 믹스 신호에 포함된 소스 신호가 상기 믹스 신호 채널에 믹스되는 정도를 나타내는 믹스 정보, 상기 믹스 신호에 포함된 소스 신호들간의 시간 지연 정보 또는 상기 소스 신호와 상기 믹스 신호 채널간의 시간 지연 정보, 및 상기 믹스 신호에 포함된 소스 신호들간의 상호 상관 정보 또는 상기 소스 신호와 상기 믹스 신호 채널간의 상호 상관 정보를 포함한다.Referring to FIG. 10, a mix signal 1001 and a source signal 1002 are input to the encoding apparatus. As described above, the mix signal 1001 may be a mono, stereo or multichannel mix signal. In the present specification, a stereo signal will be described as an example for convenience, but the present invention is not limited thereto. The side information generating unit 1003 generates the side information 1004 using the mixed signal 1001 and the source signal 1002. The additional information 1004 may include mix information indicating a degree to which a source signal included in the mix signal is mixed in the mix signal channel, time delay information between source signals included in the mix signal, or the source signal. And time delay information between the mixed signal channel, cross correlation information between source signals included in the mix signal, or cross correlation information between the source signal and the mixed signal channel.

부가정보인코딩부(side information encoding unit, 1005)는 상기 부가 정보(1004)를 이용하여, 전송(transmission) 및 저장(storage)을 위한 부가 정보 신 호(1006)를 생성한다. 임베딩부(embedding unit, 1007)는 상기 부가 정보 신호(1006)를 믹스 신호(1001)에 임베드한다. 이때, "디지털 신호 임베드기법(Digital signal Embedded Method)"이 사용될 수 있다. 상기 "디지털 신호 임베드기법"을 사용하면, PCM 유형의 믹스 신호(1001)에 음질왜곡(sound quality distortion) 없이 부가 정보를 임베드할 수 있다. 부가 정보가 임베드된 믹스 신호는 지각적으로 원래의 믹스 신호와 거의 구별되지 않는다. 즉, 부가 정보가 임베드되어 있는 출력신호(output signal)

Figure 112007046536320-pat00105
Figure 112007046536320-pat00106
(1008)는 디코더 장치에서 입력신호(input signal)
Figure 112007046536320-pat00107
Figure 112007046536320-pat00108
(1001)과 동일한 신호라 볼 수 있다.The side information encoding unit 1005 generates an additional information signal 1006 for transmission and storage using the side information 1004. An embedding unit 1007 embeds the additional information signal 1006 in the mix signal 1001. In this case, a "digital signal embedded method" may be used. Using the "digital signal embedding technique", it is possible to embed additional information in the PCM type mix signal 1001 without sound quality distortion. The mixed signal in which the additional information is embedded is hardly distinguished from the original mix signal. That is, output signal in which additional information is embedded
Figure 112007046536320-pat00105
And
Figure 112007046536320-pat00106
1008 denotes an input signal at the decoder device
Figure 112007046536320-pat00107
And
Figure 112007046536320-pat00108
It can be regarded as the same signal as 1001.

상기 "디지털 신호 임베드기법"에는 비트치환부호화방법(Bit Replacement Coding Method) , 반향삽입방법(Echo Hiding Method), 대역확산통신법(Spread-Spectrum-based Method) 등이 있다. 상기 비트치환부호화방법은 양자화된 믹스 신호 샘플의 최하위 비트(Lowest bit)들을 변형하여 원하는 정보를 삽입하는 방법으로, 최하위 비트의 변형(modification)은 믹스 신호의 품질에 거의 영향을 주지 않는다는 특성을 이용하는 방법이다. 상기 반향삽입방법은 사람의 귀에 들리지 않을 정도의 작은 크기의 반향(echo)을 믹스 신호에 삽입하는 방법이다. 상기 대역확산통신법은 이산코사인변환(Discrete Cosine Transform), 이산푸리에변환(Discrete Fourier Transform) 등을 통해 믹스 신호를 주파수 영역으로 변환한 후에, 이진수로 만들어진 원하는 정보를 PN(Pseudo Noise) 시퀀스(sequence)로 대역 확 산(spread spectrum)하여 주파수 영역(frequency domain)으로 변환된 믹스 신호에 첨가하는 방법이다. 본 발명에서는 상기 임베드 방법 중 비트치환부호화방법을 중심으로 기술할 것이나, 본 발명이 상기 비트치환부호화방법에만 한정되는 것은 아니다.The "digital signal embedding method" includes a bit replacement coding method, an echo hiding method, a spread-spectrum-based method, and the like. The bit-subversion encoding method inserts desired information by transforming the lowest bits of the quantized mix signal sample, and uses the property that the modification of the least significant bit has little effect on the quality of the mixed signal. Way. The echo insertion method is a method of inserting an echo of a size small enough to be inaudible to the human ear to the mix signal. The spread spectrum communication method converts a mixed signal into a frequency domain through a discrete cosine transform, a discrete fourier transform, and the like, and then converts desired information made in binary into a PN (Pseudo Noise) sequence. This method is used to spread spectrum and add it to the mixed signal converted into the frequency domain. In the present invention, a description will be made mainly on the bit substitution encoding method of the embedding method, but the present invention is not limited to the bit substitution encoding method.

도 11은 본 발명의 일 실시예에 따른 도 10의 인코딩 장치를 구성하는 임베딩부에 대한 상세 블록도이다. 상기 임베딩부는 버퍼(buffer, 1103), 마스킹한계값계산부(masking threshold computing unit, 1105), 비트스트림재구성부(bitstream reshaping unit, 1107) 및 믹스신호인코딩부(mix signal encoding unit, 1109)를 포함한다. 상기 비트치환부호화방법에 의해 부가 정보를 믹스 신호 성분의 비지각적 영역에 임베드할 수 있다. 이때, 상기 비지각적 영역의 크기(이하, K값이라 한다)는 최하위 1비트만을 사용하는 것이 아니라 미리 정해진 방법(pre-decided method)에 따라 특정 영역의 K(K>0)비트를 사용할 수 있다. 예를 들면, 미리 정해진 방법에는 심리음향모델(Psychoacoustic Model)에 따른 마스킹 한계값(Masking Threshold)을 구하고, 상기 마스킹 한계값에 따라 적당한 비트를 할당하는(allocating) 것을 말한다. FIG. 11 is a detailed block diagram illustrating an embedding unit constituting the encoding apparatus of FIG. 10 according to an embodiment of the present invention. The embedding unit includes a buffer 1103, a masking threshold computing unit 1105, a bitstream reshaping unit 1107, and a mix signal encoding unit 1109. do. By using the bit substitution encoding method, additional information may be embedded in a non-perceptual region of a mixed signal component. In this case, the size of the non-perceptive region (hereinafter, referred to as K value) may use K (K> 0) bits of a specific region according to a pre-decided method instead of using only the lowest 1 bit. . For example, the predetermined method is to obtain a masking threshold according to a psychoacoustic model and to allocate an appropriate bit according to the masking threshold.

도 11을 참조하면, 믹스 신호(1101)는 상기 버퍼(1103)를 통하여 믹스신호인코딩부(1109)에 입력된다. 마스킹한계값계산부(1105)는 입력된 믹스 신호(1101)의 특성에 관한 정보(1104)를 이용하여, 일정한 구간(section)(예를 들면, 블록(block))별로 마스킹 한계값을 구한다. 또한, 상기 마스킹한계값계산부(1105)는 상기 마스킹 한계값을 이용하여, 청각적인 왜곡(aural distortion)이 발생하지 않 고도 변경(modify)할 수 있는 K값을 구한다. 즉, 상기 부가 정보(1102)를 상기 믹스 신호(1101)에 임베드하는데 사용할 수 있는 비트 수를 블록별로 할당하는 것이다. 본 명세서에서, 블록이란 프레임(frame) 내에 존재하는 하나의 K값을 이용하여 삽입된 데이터 단위를 말한다. 하나의 프레임에는 하나 이상의 복수의 블록이 존재할 수 있으며, 따라서 프레임의 길이가 고정되어 있으면 블록의 길이는 블록의 개수가 증가함에 따라 감소할 수 있다. 비트스트림재구성부(1007)는 상기 K값을 포함하도록 상기 부가 정보를 재구성할 수 있다. 이때, 상기 재구성된 부가 정보에는 싱크워드(sync word), 에러정정코드(error detection code) 또는 에러정정코드(error correction code) 등이 포함될 수 있다. 믹스신호인코딩부(1109)는 재구성된 부가 정보(1108)를 믹스 신호(1101)에 임베드하여, 부가 정보가 임베드된 믹스 신호(1110)를 출력한다. 전술한 것처럼, 상기 재구성된 부가 정보(1108)는 상기 믹스 신호의 K비트 내에 임베드될 수 있다. 상기 K값은 재구성된 부가 정보(1108)에 삽입되어 디코딩 장치로 전송되고, 디코딩 장치에서는 상기 K값을 이용하여 믹스 신호로부터 부가 정보를 추출할 수 있다.Referring to FIG. 11, the mix signal 1101 is input to the mix signal encoding unit 1109 through the buffer 1103. The masking limit value calculator 1105 calculates a masking limit value for each section (for example, a block) by using the information 1104 related to the characteristics of the input mix signal 1101. In addition, the masking limit value calculator 1105 uses the masking limit value to obtain a K value that can be modified without aural distortion. That is, the number of bits that can be used to embed the additional information 1102 in the mix signal 1101 is allocated for each block. In the present specification, a block refers to a data unit inserted using one K value existing in a frame. One or more blocks may exist in one frame. Therefore, if the length of the frame is fixed, the length of the blocks may decrease as the number of blocks increases. The bitstream reconstruction unit 1007 may reconstruct the additional information to include the K value. In this case, the reconstructed additional information may include a sync word, an error detection code, an error correction code, or the like. The mixed signal encoding unit 1109 embeds the reconstructed additional information 1108 into the mix signal 1101 and outputs the mixed signal 1110 in which the additional information is embedded. As described above, the reconstructed side information 1108 may be embedded within K bits of the mix signal. The K value is inserted into the reconstructed additional information 1108 and transmitted to the decoding apparatus, and the decoding apparatus may extract additional information from the mix signal using the K value.

부가 정보가 블록별로 믹스 신호에 임베드되는 과정에는 다양한 방법이 이용된다. 제1 방법은 단순히 상기 믹스 신호의 하위 K비트 만큼을 0으로 대체(substitude)한 후, 부가 정보를 더하는 방법이다. 예를 들면, K값이 3이고, 믹스 신호의 한 샘플 데이터가 11101101이며, 임베드해야할 부가 정보 데이터가 111인 경우, 상기 11101101의 하위 3비트를 0으로 대체하여 11101000으로 만들고, 그 다음에 상기 부가 정보 데이터 111을 더하여 11101111로 만드는 것이다.Various methods are used to embed additional information into the mixed signal for each block. The first method simply adds additional information after substituting the lower K bits of the mix signal with zeros. For example, if the K value is 3, one sample data of the mix signal is 11101101, and the additional information data to be embedded is 111, the lower 3 bits of the 11101101 are replaced with 0 to make 11101000, and then the addition The information data 111 is added to form 11101111.

제2 방법은 디더링(dithering) 방법을 이용하는 것인데, 먼저 부가 정보 데이터를 상기 믹스 신호의 하위 K비트로부터 뺀 뒤에, 상기 믹스 신호를 상기 K값에 근거하여 재양자화하고, 재양자화된 상기 믹스 신호에 대해 부가 정보 데이터를 더하는 방법이다. 예를 들면, K값이 3이고, 믹스 신호의 한 샘플 데이터가 11101101이며, 임베드해야할 부가 정보 데이터가 111인 경우, 상기 11101101에서 111을 빼서 11100110로 만들고, 하위 3비트 이상에 대해 재양자화하여 11101000(반올림 적용)으로 만들며, 그 다음에 상기 111을 더해서 11101111로 만드는 것이다.The second method uses a dithering method, first subtracting additional information data from the lower K bits of the mix signal, then requantizing the mix signal based on the K value, and applying the requantized mix signal to the mixed signal. It is a method of adding additional information data. For example, if the K value is 3, one sample data of the mix signal is 11101101, and the additional information data to be embedded is 111, 111 is subtracted from 11101101 to 11100110, and requantized for the lower 3 bits or more to 11101000. (Rounding), then add 111 to 11101111.

상기 믹스 신호에 임베드되는 부가 정보는 임의의 비트스트림이기 때문에 백색잡음적인 특성을 가지지 못할 수 있다. 믹스 신호에 백색잡음 형태의 신호가 더해지는 것이 음질 특성상 유리하기 때문에, 부가 정보를 백색화(whitening)하는 과정을 거친 후에 믹스 신호에 더할 수 있다. 상기 백색화는 싱크워드를 제외한 부가 정보 신호에 적용될 수 있다. 본 발명에서 백색화(whitening)란 믹스 신호의 음량이 모든 주파수 영역에서 동일하거나 거의 유사한 크기를 갖는 랜덤 신호로 만드는 것을 말한다. 또한, 부가 정보를 믹스 신호에 임베드하는 과정에, 부가 정보에 노이즈쉐이핑(Noise shaping) 기법을 적용하여 청각적 왜곡을 최소화할 수 있다. 본 발명에서 노이즈 쉐이핑이란 양자화 과정에서 생성되는 양자화 노이즈의 에너지가 가청주파수 대역 이상의 고주파수 대역으로 이동되도록 노이즈 특성을 변형시키거나, 해당 믹스 신호로부터 마스킹 한계값을 구해, 상기 마스킹 한계값에 대응되는 시변(time-varing)필터를 생성하고, 상기 필터에 의해 양자화 과정에서 발생하는 노이즈의 특성을 변형시키는 과정을 말한다.Since the additional information embedded in the mixed signal is an arbitrary bitstream, it may not have a white noise characteristic. Since it is advantageous in terms of sound quality to add a white noise type signal to the mixed signal, it may be added to the mixed signal after whitening the additional information. The whitening may be applied to an additional information signal except syncword. Whitening in the present invention refers to making the volume of the mixed signal into a random signal having the same or almost similar magnitude in all frequency domains. In addition, in the process of embedding the additional information into the mixed signal, the acoustic shaping technique may be applied to the additional information to minimize the acoustic distortion. In the present invention, the noise shaping is to change the noise characteristic so that the energy of the quantization noise generated in the quantization process is shifted to the high frequency band of the audible frequency band or more, or obtain a masking limit value from the corresponding mixed signal, and time-varying corresponding to the masking limit value. A process of generating a time-varing filter and modifying the characteristics of noise generated in the quantization process by the filter.

도 12는 본 발명의 일 실시예에 따른 부가 정보를 임베드하는 제1 방법을 도시한다. 부가 정보는 다양한 방식으로 믹스 신호에 임베드될 수 있는데, 도 12는 샘플플레인 순서로 부가 정보를 임베드하는 방식에 해당된다. 상기 제1 방법은 K비트 단위로 해당 블록에 대한 부가 정보를 분산하여 임베드하는 것이다. 도시된 것처럼 K값이 4이고, 한 블록(1205)이 N개의 샘플(1204)로 구성된 경우, 상기 부가 정보는 각 샘플의 하위 4비트에 임베드될 수 있다. 전술하였듯이, 본 발명은 각 샘플의 하위 4비트에만 부가 정보를 임베드하는 것에 한정되지 않는다. 그리고 각 샘플의 하위 K비트 내에서, 부가 정보는 도 12에 도시된 것처럼 상위 비트부터 임베드(MSB(Most Significant Bit) first)되거나, 또는 하위 비트부터 임베드(LSB(Least Significant Bit) first))될 수 있다.12 illustrates a first method of embedding additional information according to an embodiment of the present invention. The additional information may be embedded in the mix signal in various ways. FIG. 12 corresponds to a method of embedding the additional information in the sample plane order. The first method is to distribute and embed additional information about a corresponding block in units of K bits. If the value of K is 4 and one block 1205 is composed of N samples 1204 as shown, the additional information may be embedded in the lower four bits of each sample. As described above, the present invention is not limited to embedding additional information only in the lower 4 bits of each sample. And within the lower K bits of each sample, the side information may be embedded from the upper bit (Most Significant Bit (MSB) first) or the lower bit from the lower bit (LSB (Least Significant Bit) first) as shown in FIG. Can be.

도시된 화살표(1203)는 임베드되는 방향을 나타내고, 괄호안의 숫자는 데이터 정렬 순서를 나타낸다. 부가 정보가 임베드되는 영역에서 임베드가능한 비트 수보다 임베드해야할 부가 정보의 비트 수가 작은 경우에는, 남는 비트를 0으로 채우거나(1206), 랜덤 신호(Random signal)를 넣거나, 또는 원래의 믹스 신호로 대체할 수 있다. 예를 들면, 블록을 구성하는 샘플수(N)가 100이고 K값이 4인 경우, 상기 블록에 임베드가능한 비트 수(W)는 W=N*K=100*4=400비트가 된다. 만일 임베드해야할 부가 정보의 비트 수(V)가 390비트인 경우(즉, V<W인 경우), 나머지 10비트는 0으로 채우거나, 랜덤 신호를 넣거나, 원래의 믹스 신호로 대체하거나, 데이터 끝을 알려주는 말단비트열(tail sequence)로 채우거나, 또는 이들을 조합해서 채울 수 있다. 상기 말단비트열은 해당 블록에서 부가 정보의 끝을 알려주는 비트열을 말한 다. 비록, 도 12는 블록별로 남는 비트를 채우는 것을 도시하고 있으나, 본 발명은 삽입프레임별로 남는 비트를 상기와 같은 방법으로 채우는 것을 포함한다. The arrow 1203 shown indicates the direction in which it is embedded, and the numbers in parentheses indicate the data sort order. If the number of bits of additional information to be embedded is less than the embeddable number of bits in the area where the additional information is embedded, fill the remaining bits with zeros (1206), insert a random signal, or replace with the original mix signal. can do. For example, when the number of samples (N) constituting the block is 100 and the K value is 4, the number of bits (W) embedable in the block is W = N * K = 100 * 4 = 400 bits. If the number of bits (V) of additional information to be embedded is 390 bits (that is, V <W), the remaining 10 bits are filled with zeros, inserted random signals, replaced with the original mixed signal, or the end of data. It can be filled with a tail sequence that indicates or a combination thereof. The terminal bit string refers to a bit string indicating the end of additional information in the block. Although FIG. 12 illustrates filling the remaining bits for each block, the present invention includes filling the remaining bits for each insertion frame by the above method.

도 13은 본 발명의 일 실시예에 따른 부가 정보를 임베드하는 제2 방법을 도시한다. 상기 제2 방법은 상기 부가 정보(1301)를 비트플레인 순서로 믹스 신호에 임베드하는 것이다. 이때, 도 13에 도시된 것처럼 부가 정보는 블록별로 믹스 신호의 하위 비트부터 순차적으로 임베드될 수 있으나, 본 발명은 이에 한정되지 않는다. 예를 들면, 블록을 구성하는 샘플수(N)가 100이고 K값이 4인 경우, 먼저 최하위 비트플레인을 구성하는 100비트를 먼저 채우고, 그 다음에 두 번째 비트플레인을 구성하는 100비트를 채우는 식으로 진행할 수 있다. 13 shows a second method of embedding additional information according to an embodiment of the present invention. The second method is to embed the additional information 1301 in a mixed signal in bitplane order. In this case, as shown in FIG. 13, the additional information may be sequentially embedded from the lower bits of the mixed signal for each block, but the present invention is not limited thereto. For example, if the number of samples (N) constituting the block is 100 and the K value is 4, the first 100 bits constituting the lowest bitplane are filled first, followed by the 100 bits constituting the second bitplane. You can proceed.

도시된 화살표(1303)는 임베드되는 방향을 나타내고, 괄호안의 숫자는 데이터 정렬 순서를 나타낸다. 상기 제2 방법은 특히 임의의 위치에서 싱크워드(Sync Word)를 추출하는데 유리할 수 있다. 즉, 믹스 신호로부터 임베드된 부가 정보의 싱크워드를 찾을 때, LSB만을 추출하여 검색함으로써 가능해진다. 또한, 상기 제2 방법은 임베드해야할 부가 정보의 비트 수(V)에 따라 최소의 LSB만을 사용하는 효과를 기대할 수 있다. 이때도 부가 정보가 임베드되는 영역에서 임베드가능한 비트 수(W)보다 임베드해야할 부가 정보의 비트 수(V)가 작은 경우에는, 남는 비트를 상기와 같이 0으로 채우거나(506), 랜덤 신호를 넣거나, 원래의 믹스 신호로 대체하거나, 데이터의 끝을 알려주는 말단비트열로 채우거나, 또는 이들을 조합해서 채울 수 있다. 특히, 상기 방법 중 상기 믹스 신호를 그대로 이용하는 것이 유리하다. 비록, 도 13에서도 블록별로 남는 비트를 채우는 것을 도시하고 있으나, 본 발명은 삽입프레임별로 남는 비트를 상기와 같은 방법으로 채우는 것을 포함한다. Arrow 1303 shown indicates the direction in which it is embedded, and the numbers in parentheses indicate the data sort order. The second method may be particularly advantageous for extracting Sync Word at any location. That is, when searching for the syncword of the embedded side information from the mixed signal, it is possible by extracting and searching only the LSB. In addition, the second method can be expected to use the minimum LSB according to the number of bits (V) of the additional information to be embedded. In this case, when the number of bits (V) of the additional information to be embedded is smaller than the embeddable number of bits (W) in the region where the additional information is embedded, the remaining bits are filled with zero as described above (506) or a random signal is inputted. It can be replaced with the original mix signal, filled with a terminal bit that indicates the end of the data, or a combination thereof. In particular, it is advantageous to use the mix signal as it is in the method. Although FIG. 13 also shows filling the remaining bits for each block, the present invention includes filling the remaining bits for each insertion frame by the above method.

도 14는 본 발명의 일 실시예에 따른 부가 정보를 재구성한 데이터 구조를 도시한다. 전술하였듯이, 부가 정보는 비트스트림재구성부에서 싱크워드(Sync Word, 1403)와 K값(1404)을 포함하도록 재구성될 수 있다. 또한, 재구성 과정에서, 부가 정보 신호가 전송 또는 저장 과정에서 손상되었는지 유무를 판단할 수 있는 적어도 하나의 에러정정코드(error detection code) 또는 에러정정코드(error correction code)(1406, 및 1408)(이하, 에러정정코드만으로 기술한다)가 재구성된 부가 정보 신호에 포함될 수 있다. 상기 에러정정코드는 CRC(Cyclic Redundancy Check)를 포함한다. 상기 에러정정코드는 두 단계로 나누어 포함될 수 있는데, K값들이 포함된 헤더(1401)에 대한 에러정정코드1(1406)와 부가 정보 데이터(1407)에 대한 에러정정코드2(1408)가 포함될 수 있다. 그 외에 기타정보(1405)가 별도로 부가 정보 신호에 포함될 수 있다. 상기 기타정보(1405에는 부가 정보의 임베딩 방법에 대한 식별정보 등이 포함될 수 있다.14 illustrates a data structure reconstructing additional information according to an embodiment of the present invention. As described above, the additional information may be reconfigured to include a sync word 1403 and a K value 1404 in the bitstream reconstruction unit. Further, in the reconstruction process, at least one error detection code or error correction code 1406 and 1408 capable of determining whether the additional information signal is damaged during transmission or storage, Hereinafter, only the error correction code) may be included in the reconstructed additional information signal. The error correction code includes a cyclic redundancy check (CRC). The error correction code may be divided into two stages, including an error correction code 1 (1406) for the header 1401 including K values and an error correction code 2 (1408) for the additional information data 1407. have. In addition, other information 1405 may be separately included in the additional information signal. The other information 1405 may include identification information on a method of embedding additional information.

도 15는 본 발명의 일 실시예에 따른 임베드된 부가 정보를 이용하여 믹스 신호를 디코딩하는 디코딩 장치에 대한 블록도이다. 상기 디코딩 장치는 임베디드신호디코딩부(1502), 부가정보디코딩부(1504) 및 리믹싱부(1506)를 포함한다. 15 is a block diagram of a decoding apparatus for decoding a mixed signal using embedded side information according to an embodiment of the present invention. The decoding device includes an embedded signal decoding unit 1502, an additional information decoding unit 1504, and a remixing unit 1506.

도 15를 참조하면, 임베디드신호디코딩부(1502)는 믹스 신호(1501)로부터 부가 정보 신호(1503)를 검출할 수 있다. 부가정보디코딩부(1504)는 부가 정보 신호를 복호화하여, 부가 정보(1505)를 생성한다. 리믹스렌더링부(1506)는 상기 부가 정보(1505) 및 믹스 신호(1501)를 이용하여, 리믹스 신호(1508)을 생성한다. 이때, 상기 리믹스렌더링부(1506)는 사용자가 제공하는 제어 정보를 이용하여 생성된 ㅅ사용자 믹스 파라미터(1507)를 이용할 수 있다.Referring to FIG. 15, the embedded signal decoder 1502 may detect the additional information signal 1503 from the mix signal 1501. The additional information decoding unit 1504 decodes the additional information signal to generate additional information 1505. The remix renderer 1506 generates a remix signal 1508 using the additional information 1505 and the mix signal 1501. In this case, the remix rendering unit 1506 may use the user mix parameter 1507 generated using control information provided by the user.

도 16은 본 발명의 일 실시예에 따른 원래의 믹스 신호를 보존하며 부가 정보를 임베드하는 인코딩 장치를 구성하는 임베딩부에 대한 상세 블록도이다. 상기 인코딩 장치는 도 10에 도시된 인코딩 장치와 유사하므로, 동일한 부분에 대한 상세한 설명은 생략한다. 도 10에 도시된 인코딩 장치와의 차이점은 상기 인코딩 장치를 구성하는 임베딩부가 다르게 구성된다는 점이다. FIG. 16 is a detailed block diagram of an embedding unit constituting an encoding apparatus that preserves an original mix signal and embeds additional information according to an embodiment of the present invention. Since the encoding device is similar to the encoding device shown in FIG. 10, detailed description of the same parts will be omitted. The difference from the encoding device shown in FIG. 10 is that the embedding part constituting the encoding device is configured differently.

도 16을 참조하면, 믹스 신호(1601)는 버퍼(1603)를 통하여 믹스신호인코딩부(1609)에 입력된다. 마스킹한계값계산부(1605)는 상기 믹스 신호(1601)의 특성에 관한 정보(1604)를 이용하여 마스킹 한계값을 계산하고, 상기 마스킹 한계값을 이용하여 K값(1606)을 구한다. 비트스트림재구성부(1607)는 부가 정보 신호(1602)가 임베드될 영역의 믹스 신호 데이터(1611)들을 제거하지 않고, 상기 믹스 신호 데이터(1611)와 부가 정보 신호(1602)를 결합하도록 재구성한다. 상기 재구성 방법에 대해서는 도 17에서 더욱 상세히 설명된다. 믹스신호인코딩부(1609)는 재구성된 신호(1608)를 믹스 신호(1601)에 임베드할 수 있다. Referring to FIG. 16, the mix signal 1601 is input to the mix signal encoding unit 1609 through a buffer 1603. The masking limit value calculator 1605 calculates a masking limit value using information 1604 regarding the characteristics of the mix signal 1601, and calculates a K value 1606 using the masking limit value. The bitstream reconstruction unit 1607 reconstructs the mixed signal data 1611 and the additional information signal 1602 without removing the mixed signal data 1611 in the region where the additional information signal 1602 is to be embedded. The reconstruction method is described in more detail in FIG. 17. The mixed signal encoding unit 1609 may embed the reconstructed signal 1608 into the mixed signal 1601.

도 17은 본 발명의 일 실시예에 따른 원래의 믹스 신호를 보존하며 부가정보를 임베딩하는 방법을 나타내는 블록도이다. 설명의 편의를 위해, 믹스 신호의 한 채널(1701)을 구성하는 하나의 블록에 부가 정보를 삽입하는 것으로 설명한다. 도 17을 참조하면, 믹스 신호(1701)의 성분은 부가 정보가 임베드되지 않는 영역(1702)과 임베드되는 영역(1703)으로 나눌 수 있다. 상기 임베드되는 영역(1703) 의 믹스 신호는 무손실 부호화(lossless coding, 1704) 과정을 거친다. 그 다음에, 무손실 부호화된 믹스 신호 및 부가 정보 신호(1705)는 결합 및 인코딩되어, 결합 신호(1707)를 형성한다. 그 다음에, 상기 결합 신호(1707)는 믹스 신호에 임베드되어, 결합 신호가 임베드된 믹스 신호(1708)를 생성한다. 이렇게 함으로써, 디코딩 장치에서는 필요한 경우 상기 결합 신호(1707)를 이용하여, 원래의 믹스 신호(1701)를 완벽하게 복원할 수 있다. 상기 방법이 가능한 이유는 임베드해야할 부가 정보 신호의 데이터 량이 임베드 가능한 데이터 량보다 실제로 작기 때문에, 무손실 부호화된 믹스 신호를 삽입할 공간을 확보할 수 있기 때문이다. 단순히 부가 정보 신호를 임베드하는 방법은 비록 지각적으로 임베드된 신호와 원래의 신호가 동일하여 왜곡이 발생하지 않지만, 완전히 동일한 신호는 아니므로, 완전한 원래 신호의 복원이 필요한 경우, 상기 방법이 이용될 수 있다.17 is a block diagram illustrating a method of preserving an original mix signal and embedding additional information according to an embodiment of the present invention. For convenience of explanation, the additional information is inserted into one block constituting one channel 1701 of the mixed signal. Referring to FIG. 17, a component of the mix signal 1701 may be divided into an area 1702 in which additional information is not embedded and an area 1703 in which an additional information is embedded. The mixed signal of the embedded region 1703 undergoes a lossless coding process 1704. The lossless coded mix signal and side information signal 1705 are then combined and encoded to form a combined signal 1707. The combined signal 1707 is then embedded in the mix signal, producing a mixed signal 1708 with the combined signal embedded. By doing so, the decoding apparatus can completely recover the original mix signal 1701 using the combined signal 1707 when necessary. The above method is possible because the amount of data of the additional information signal to be embedded is actually smaller than the amount of embeddable data, so that a space for inserting a lossless coded mix signal can be secured. The method of simply embedding the side information signal is not exactly the same signal, although the perceptually embedded signal and the original signal are the same, so that if the restoration of the complete original signal is necessary, the method may be used. Can be.

도 18은 본 발명의 일 실시예에 따른 원래의 믹스 신호를 완전히 복원하는 디코딩 장치에 대한 블록도이다. 상기 디코딩 장치는 임베디드신호디코딩부(1802), 무손실디코딩부(1804) 및 리플레이싱부(1806)를 포함한다.18 is a block diagram of a decoding apparatus for completely reconstructing an original mixed signal according to an embodiment of the present invention. The decoding apparatus includes an embedded signal decoding unit 1802, a lossless decoding unit 1804, and a replacing unit 1806.

도 18을 참조하면, 임베디드신호디코딩부(1802)는 결합 신호가 임베드된 믹스 신호(1801)로부터, 상기 결합 신호(1803)를 추출한다. 무손실 디코딩부(1804)는 상기 결합 신호(1803)를 이용하여 결합 신호가 임베드된 영역에 대응되는 믹스 신호(1805)를 복원한다. 리플레이싱부(1806)는 상기 복원된 믹스 신호(1805)를 이용하여 원래의 신호(1807)를 생성한다. 도 18에 따른 복원과정과 부가 정보를 이용하 는 리믹싱 과정은 동시에 이용될 수 있다. 이 경우에,

Figure 112007046536320-pat00109
Figure 112007046536320-pat00110
를 이용하여 복호화를 수행하는 대신에,
Figure 112007046536320-pat00111
Figure 112007046536320-pat00112
를 이용하여 리믹싱 과정을 수행할 수 있기 때문에, 더욱 좋은 출력을 얻을 수 있다. Referring to FIG. 18, the embedded signal decoder 1802 extracts the combined signal 1803 from the mixed signal 1801 in which the combined signal is embedded. The lossless decoding unit 1804 restores the mixed signal 1805 corresponding to the region in which the combined signal is embedded using the combined signal 1803. The replacing unit 1806 generates the original signal 1807 using the restored mixed signal 1805. The restoration process according to FIG. 18 and the remixing process using additional information may be used simultaneously. In this case,
Figure 112007046536320-pat00109
And
Figure 112007046536320-pat00110
Instead of performing decryption using
Figure 112007046536320-pat00111
And
Figure 112007046536320-pat00112
Since the remixing process can be performed using, a better output can be obtained.

도 19는 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제1 방법을 도시한다. 도 19는 스테레오 믹스 신호에 부가 정보를 임베드하는 방법을 도시하고 있으나, 본 발명은 모노, 스테레오 또는 멀티채널 믹스 신호에 부가 정보를 임베드하는 방법을 포함한다. 설명의 편의상, 스테레오 신호를 예로하여 설명한다.19 illustrates a first method of embedding side information in a mix signal of two channels according to an embodiment of the present invention. Although FIG. 19 illustrates a method of embedding additional information in a stereo mix signal, the present invention includes a method of embedding additional information in a mono, stereo, or multichannel mix signal. For convenience of explanation, the stereo signal will be described as an example.

도 19에 도시된 것처럼, 상기 제1 방법은 부가 정보를 두 채널에 나누어 임베드하되, 그 순서는 샘플 단위로 두 채널에 번갈아 가며 임베드하는 방식으로 진행된다. 그리고 두 채널의 신호 특성이 다르므로, 각 채널에서의 마스킹 한계값을 별도로 구해, K값을 각 채널에 다르게 할당할 수 있다. 즉, 도시된 것처럼 한 채널에는 K1을 다른 채널에는 K2를 할당할 수 있다. 또한, 상기 K값은 블록별로 다를 수 있다. 예를 들면, 상기 부가 정보를 먼저 한 채널(여기서는 left 채널)의 샘플 0의 하위 K1비트에 먼저 채우고, 다른 채널(여기서는 right 채널)의 샘플 0의 하위 K2비트에 채운다. 그 다음에 다시 원래 채널(left 채널)의 샘플 1의 하위 K1비트를 채우고, 다른 채널(right 채널)의 샘플 1의 하위 K2비트를 채운다. 도면에서 블록 내의 숫자는 부가 정보를 채우는 순서를 나타낸다. 도 19는 MSB부터 채우는 것을 도시하였으나, LSB부터 채우는 것도 가능하다.As illustrated in FIG. 19, the first method divides and embeds additional information into two channels, and the order is alternately embedded in the two channels on a sample basis. Since the signal characteristics of the two channels are different, the masking limit value of each channel can be obtained separately, and the K value can be assigned to each channel differently. That is, as shown, K 1 may be allocated to one channel and K 2 to another channel. In addition, the K value may be different for each block. For example, the additional information is first filled in the lower K 1 bits of sample 0 of one channel (here, left channel) and then the lower K 2 bits of sample 0 of the other channel (here, right channel). It then fills the lower K 1 bits of sample 1 of the original channel (left channel) and the lower K 2 bits of sample 1 of the other channel (right channel). In the drawings, the numbers in the blocks indicate the order of filling the additional information. 19 shows filling from the MSB, it is also possible to fill from the LSB.

도 20은 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제2 방법을 도시한다. 상기 제2 방법은 상기 부가 정보를 두 채널에 임베드하되, 그 순서를 LSB부터 비트플레인 단위로 두 채널에 번갈아 가며 임베드하는 방식으로 진행된다. 그리고 두 채널의 신호 특성이 다르므로, 각 채널에서의 마스킹 한계값을 별도로 구해, K(K1 및 K2)값을 각 채널에 다르게 할당할 수 있다. 즉, 도시된 것처럼 한 채널에는 K1을 다른 채널에는 K2를 할당할 수 있다. 또한 상기 K값은 각 블록별로 다를 수도 있다. 예를 들면, 먼저 한 채널(여기서는 left 채널)의 샘플1의 최하위 1비트를 먼저 채우고, 다른 채널(여기서는 right 채널)의 샘플1의 최하위 1비트를 채운다. 그 다음에 다시 원래 채널(left 채널)의 샘플2의 최하위 1비트를 채우고, 다시 다른 채널(right 채널)의 샘플2의 최하위 1비트를 채운다. 도면에서 블록 내의 숫자는 부가 정보를 채우는 순서를 나타낸다. 상술한 것처럼, 두 채널에 부가 정보 비트스트림을 나누어 임베드하는 경우에 K값을 각 채널에 다르게 할당하는 것이 가능하데, 이 경우 비트스트림 내에 각 채널별로 K값을 별도로 전송하는 것이 가능하다. 또한 상기 K값이 복수로 전송하는 경우, 상기 K값을 부호화할 때 디퍼렌셜(differential) 부호화 방법을 이용할 수 있다. 20 illustrates a second method of embedding side information in a mix signal of two channels according to an embodiment of the present invention. The second method embeds the additional information into two channels, and alternates the order of embedding the additional information into two channels in units of bitplanes from the LSB. In addition, since the signal characteristics of the two channels are different, masking limit values of each channel may be separately obtained, and K (K 1 and K 2 ) values may be differently assigned to each channel. That is, as shown, K 1 may be allocated to one channel and K 2 to another channel. In addition, the K value may be different for each block. For example, the first 1 bit of sample 1 of one channel (here left channel) is filled first, and the lowest 1 bit of sample 1 of the other channel (here right channel) is filled first. It then fills the least significant 1 bit of sample 2 of the original channel (left channel) and again the least significant 1 bit of sample 2 of the other channel (right channel). In the drawings, the numbers in the blocks indicate the order of filling the additional information. As described above, in the case of embedding the additional information bitstream in two channels, it is possible to assign a K value differently to each channel. In this case, it is possible to separately transmit the K value for each channel in the bitstream. In addition, when the K value is transmitted in plural, a differential encoding method may be used when encoding the K value.

도 21은 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제3 방법을 도시한다. 상기 제3 방법은 각 채널의 프레임이 복수의 블록 (길이 B)으로 구성된 경우에 상기 부가 정보를 적어도 한 채널을 갖는 믹스 신호에 삽입하는 방법에 관한 것이다. 도시된 것처럼, K값은 각 채널별 및 블록별로 각각 다른 값을 가지거나, 또는 동일한 값을 가질 수 있다. 상기 K1, K2, K3 및 K4 값들은 프레임 전체에 대해 한차례 전송되는 프레임 헤더내에 저장될 수 있으며, 상기 프레임 헤더는 LSB에 위치될 수 있다. 이 경우에 상기 헤더는 비트플레인 단위로 삽입될 수 있으며, 부가 정보 데이터는 샘플단위로 번갈아가면서 삽입되거나, 또는 블록단위로 번갈아가면서 삽입될 수 있다. 도 21은 프레임내 블록 개수가 2인 경우를 도시하며, 따라서 상기 블록의 크기(B)는 N/2가 된다. 이 경우에 상기 프레임에 삽입된 비트수는 (K1 + K2 + K3 + K4)*B가 된다.21 illustrates a third method of embedding side information in a mix signal of two channels according to an embodiment of the present invention. The third method relates to a method of inserting the additional information into a mix signal having at least one channel when the frame of each channel is composed of a plurality of blocks (length B). As shown, the K value may have different values for each channel and each block, or may have the same value. K 1 , K 2 , K 3 and K 4 The values may be stored in a frame header that is transmitted once for the entire frame, which may be located in the LSB. In this case, the header may be inserted in units of bit planes, and the additional information data may be inserted alternately in a sample unit, or alternately in block units. FIG. 21 shows a case where the number of blocks in a frame is two, so that the size B of the block is N / 2. In this case, the number of bits inserted into the frame becomes (K1 + K2 + K3 + K4) * B.

도 22 본 발명의 일 실시예에 따른 두 채널의 믹스 신호에 부가 정보를 임베드하는 제4 방법을 도시한다. 상기 제4 방법은 부가 정보를 두 채널에 나누어 임베드하되, 그 순서를 LSB(또는 MSB)부터 비트플레인 순서로 두 채널에 번갈아가며 삽입하는 방법과 샘플단위로 번갈아가면 삽입하는 방법을 혼합한 것이다. 상기 방법은 프레임 단위로 이루어지거나, 또는 도시된 것처럼 블록단위로 이루어질 수 있다. 도 22에 도시된 것처럼, 1 내지 C(빗금친 부분)는 헤더에 대응되는 부분으로서, 삽입프레임싱크워드의 탐색을 용이하게 하기 위해 LSB(또는 MSB)에 비트플레인 순서로 삽입될 수 있다. C+1이상(빗금치지 않은 부분)은 헤더 이외의 부분으로서, 부가 정보 데이터를 독출하기 용이하도록 샘플단위로 두 채널에 번갈아가며 삽입할 수 있다. K값들은 각 채널 및 블록별로 다른 값을 가지거나, 또는 동일한 값을 가 질 수 있다. 22 illustrates a fourth method of embedding additional information in a mix signal of two channels according to an embodiment of the present invention. The fourth method is a method of embedding additional information into two channels, and then inserting the information alternately into the two channels in the order of LSB (or MSB) to bit plane and inserting them alternately by sample unit. The method may be performed in units of frames or in units of blocks as shown. As illustrated in FIG. 22, 1 to C (hatched portions) correspond to headers and may be inserted in the LSB (or MSB) in bitplane order to facilitate the search for the insertion frame syncword. C + 1 or more (non-hatched portion) is a part other than the header, and can be alternately inserted into two channels in a sample unit so that additional information data can be easily read. K values may have different values for each channel and block or may have the same value.

도 23은 본 발명의 일 실시예에 따른 임베드된 부가 정보를 제거하는 방법을 나타내는 블록도이다. 컨텐츠에 대한 저작권 보호 등을 목적으로 부가 정보가 삽입되어 있는 믹스 신호에서 부가 정보만을 제거하거나 변형시켜서 더 이상 리믹스를 위한 부가 정보가 남아있지 않도록 만드는 방법이다. 23 is a block diagram illustrating a method of removing embedded side information according to an embodiment of the present invention. For the purpose of copyright protection of contents, the method removes or modifies only the additional information from the mixed signal in which the additional information is inserted so that no additional information remains for remixing.

도 23을 참조하면, 분석부(2302)는 부가 정보가 임베드된 믹스 신호(2301)를 분석하여, 부가 정보가 임베드된 영역에 관한 정보 등과 같은 임베딩 정보(2303)를 추출한다. 제거부(2304)는 상기 임베딩 정보(2303)를 이용하여, 부가 정보가 임베드된 믹스 신호(2301)로부터 부가 정보를 제거하여, 부가 정보가 제거된 믹스 신호(2305)를 생성한다. 이때, 상기 부가 정보를 제거하기 위해 다양한 방법이 이용될 수 있다. 첫 번째 방법은 분석부(2302)를 통해 믹스 신호로부터 임베드된 부가 정보의 존재 여부를 확인하고, 임베드된 레벨 값 등을 찾아 제거 범위를 확정한다. 그 다음에, 정확히 부가 정보가 임베드된 비트열을 제거하는 것이다. 두 번째 방법은 분석부(2302)를 통해 음질에 왜곡을 미치지 않으면서, 임베드 가능한 랜덤 노이즈의 레벨값(K값과 유사)을 찾아서, 그에 해당하는 랜덤 신호를 첨가하여 삽입된 부가 정보를 파괴하는 것이다. 세 번째 방법은 올 패스 필터(all pass filter)를 이용하여 신호를 변형시키는 것이다. 네 번째 방법은 최하위 1 비트들을 임의의 랜덤 신호로 대체함으로써, 싱크워드 정보를 제거하는 것이다. Referring to FIG. 23, the analyzer 2302 analyzes a mix signal 2301 in which additional information is embedded, and extracts embedding information 2303 such as information about a region in which the additional information is embedded. The remover 2304 removes the additional information from the mixed signal 2301 in which the additional information is embedded by using the embedding information 2303 to generate the mixed signal 2305 in which the additional information is removed. In this case, various methods may be used to remove the additional information. In the first method, the presence of additional information embedded from the mixed signal is determined through the analyzer 2302, and the embedded level value is found to determine the removal range. Then, exactly remove the bit string in which the additional information is embedded. The second method finds a level value (similar to K value) of embeddable random noise without distorting the sound quality through the analysis unit 2302, and adds a corresponding random signal to destroy the inserted additional information. will be. The third method is to transform the signal using an all pass filter. The fourth method is to remove the syncword information by replacing the least significant 1 bits with an arbitrary random signal.

도 24는 본 발명의 일실시예에 따른 부가 정보가 임베드된 믹스 신호의 인코딩 장치에 대한 블록도이다. 도 24를 참조하면, 상기 인코딩 장치는 부가정보추출 부(2401), 믹스신호인코딩부(2402), 및 다중화부(2403)를 포함한다. 부가 정보가 임베드된 믹스 신호를 인코딩(예를 들면, AAC(Advanced Audio Coding) 인코딩)해야 하는 경우가 발생할 수 있다. 이때, 일반적인 AAC 인코딩을 하는 경우에, 임베디드 정보가 강인성이 매우 떨어지기 때문에, 인코딩하는 과정에서 완전히 소멸되어 없어질 수 있다. 그러나, 인코딩되기 전에 부가 정보가 임베드된 믹스 신호로부터 부가 정보를 추출한 후에 상기 믹스 신호를 압축 부호화하면, 압축된 믹스 신호와 함께 부가 정보를 전송할 수 있다. 이하에서, 이와 같은 방법을 상세히 설명한다.24 is a block diagram of an apparatus for encoding a mixed signal in which additional information is embedded according to an embodiment of the present invention. Referring to FIG. 24, the encoding apparatus includes an additional information extracting unit 2401, a mixed signal encoding unit 2402, and a multiplexing unit 2403. There may occur a case where the mixed information embedded with the additional information needs to be encoded (for example, Advanced Audio Coding (AAC) encoding). At this time, in the case of general AAC encoding, since the embedded information is very inferior in robustness, it may be completely destroyed in the encoding process. However, if the mixed signal is compressed and encoded after extracting the additional information from the mixed signal in which the additional information is embedded before encoding, the additional information may be transmitted together with the compressed mixed signal. In the following, such a method will be described in detail.

먼저, 부가정보추출부(2401)는 상기 부가 정보가 임베드된 믹스 신호로부터 부가 정보를 추출한다. 상기 부가 정보의 추출 방법은 도 1에서 설명된 방법이 이용될 수 있다. 그 다음에, 믹스신호인코딩부(2402)는 부가 정보가 추출된 믹스 신호를 압축 부호화하고, 다중화부(2403)는 부호화된 믹스 신호 및 부가 정보를 다중화하여 비트스트림을 생성한다. 만일, 부가 정보가 공간 정보라면, 상기 다중화된 비트스트림은 공간 정보를 가진 압축된 비트스트림이 될 수 있다. 예를 들면, AAC+MPEG Surround 신호가 될 수 있다.First, the additional information extractor 2401 extracts additional information from the mixed signal in which the additional information is embedded. As the method of extracting the additional information, the method described in FIG. 1 may be used. Next, the mix signal encoding unit 2402 compresses and encodes the mixed signal from which the side information is extracted, and the multiplexer 2403 multiplexes the encoded mix signal and the side information to generate a bitstream. If the additional information is spatial information, the multiplexed bitstream may be a compressed bitstream with spatial information. For example, it may be an AAC + MPEG Surround signal.

이때, 부가 정보가 PCM 유형의 믹스 신호와 시간적으로 정렬(align)되어 사용되는 신호라면, 부호화되는 믹스 신호의 프레임 단위와 부가 정보가 삽입되는 단위가 정렬될 필요가 있다. 부가 정보의 추출 과정에서 알 수 있는 프레임 싱크 정보를 이용하여 상기 믹스 신호의 인코딩 시작 위치를 맞추는 과정이 필요하다. 또한, 임베디드 정보의 프레임 길이 정보를 이용하여 상기 믹스 신호의 프레임 길이를 결정할 수 있다. 상기 프레임 길이 정보를 이용하는 방법에 관해서는 후술한다. 상기와 같은 방법으로 생성된 최종 비트열은 데이터 레이트가 매우 낮으면서도 부가 정보를 가지고 있어, 멀티채널 신호를 매우 낮은 비트율을 갖는 신호로 생성하여 저장 및 전송에 매우 편리하게 사용할 수 있다.In this case, if the additional information is a signal that is used by being aligned in time with the PCM type mix signal, the frame unit of the encoded mixed signal and the unit into which the additional information is inserted need to be aligned. It is necessary to adjust the encoding start position of the mixed signal by using the frame sync information known in the process of extracting additional information. In addition, the frame length of the mix signal may be determined using the frame length information of the embedded information. A method of using the frame length information will be described later. The final bit stream generated by the above method has a very low data rate but has additional information, and thus, a multi-channel signal can be generated as a signal having a very low bit rate and used very conveniently for storage and transmission.

도 25는 본 발명의 일실시예에 따른 도 24의 인코딩 장치의 상세 블록도이다. 도 25를 참조하면, 상기 인코딩 장치는 버퍼링부(2505)를 더 포함할 수 있다. 또한, 상기 인코딩 장치의 구성요소인 부가정보추출부(2501)는 싱크정보추출부(2502), 헤더정보추출부(2503), 및 패이로드추출부(2504)를 포함한다. 25 is a detailed block diagram of the encoding apparatus of FIG. 24 according to an embodiment of the present invention. Referring to FIG. 25, the encoding apparatus may further include a buffering unit 2505. Further, the additional information extracting unit 2501, which is a component of the encoding apparatus, includes a sync information extracting unit 2502, a header information extracting unit 2503, and a payload extracting unit 2504.

먼저, 싱크정보추출부(2502)는 부가 정보가 임베드된 믹스 신호(Lo', Ro')로부터 부가 정보의 싱크 정보를 추출한다. 상기 싱크 정보가 찾아지면, 해당 싱크 정보의 첫 번째 샘플에 대응되는 위치가 프레임 싱크 값이 되며, 상기 프레임 싱크 값을 버퍼링부(2505)에 전달한다. 버퍼링부(2505)는 상기 프레임 싱크 값을 이용하여 프레임의 시작 위치를 파악하고, 해당 위치로부터 믹스 신호 프레임 길이만큼의 데이터를 버퍼링하여 믹스신호인코딩부(2506)로 전달한다.First, the sync information extractor 2502 extracts sync information of additional information from the mixed signals Lo 'and Ro' embedded with additional information. When the sink information is found, a position corresponding to the first sample of the sink information becomes a frame sync value, and the frame sync value is transmitted to the buffering unit 2505. The buffering unit 2505 detects the start position of the frame by using the frame sync value, buffers data of the mixed signal frame length from the corresponding position, and transfers the data to the mix signal encoding unit 2506.

한편, 헤더정보추출부(2503)는 싱크 정보를 추출한 이후에 존재하는 부가 정보의 헤더 영역을 디코딩하여 복호화에 필요한 헤더 정보를 추출한다. 상기 헤더 정보는 부가 정보에 포함되는 데이터 정보에 해당되는 패이로드 정보(Payload information)를 복호화하는데 이용될 수 있다. 이때, 상기 헤더 영역으로부터 추출된 부가 정보의 프레임 길이 정보를 버퍼링부(2505) 또는 믹스신호인코딩부(2506)에 전달할 수 있다. 믹스신호인코딩부(2506)는 상기 프레임 길이 정보를 이용하여 믹스 신호의 프레임 길이를 결정할 수 있다.Meanwhile, the header information extracting unit 2503 decodes the header area of the additional information existing after extracting the sink information and extracts header information necessary for decoding. The header information may be used to decode payload information corresponding to data information included in the additional information. In this case, the frame length information of the additional information extracted from the header area may be transferred to the buffering unit 2505 or the mixed signal encoding unit 2506. The mixed signal encoding unit 2506 may determine the frame length of the mixed signal using the frame length information.

패이로드추출부(2504)는 부가 정보 중 싱크 정보 및 헤더 정보를 제외한 실제 데이터 정보를 추출한다. 믹스신호인코딩부(2506)는 상기 싱크 정보 및 프레임 길이 정보를 이용하여 믹스 신호를 부호화한다. 그 다음에, 다중화부(2507)는 상기 부호화된 믹스 신호 및 부가 정보를 이용하여 비트스트림을 생성한다. The payload extractor 2504 extracts actual data information except sync information and header information from the additional information. The mixed signal encoding unit 2506 encodes the mixed signal using the sync information and the frame length information. Next, the multiplexer 2507 generates a bitstream using the encoded mixed signal and additional information.

도 26은 본 발명의 일실시예에 따른 믹스 신호에 부가 정보를 임베딩하는 디코딩 장치에 대한 블록도이다. 도 26을 참조하면, 상기 디코딩 장치는 역다중화부(2601), 믹스신호디코딩부(2602), 및 임베딩부(2603)를 포함한다. 26 is a block diagram of a decoding apparatus for embedding additional information in a mixed signal according to an embodiment of the present invention. Referring to FIG. 26, the decoding apparatus includes a demultiplexer 2601, a mixed signal decoder 2602, and an embedding unit 2603.

역다중화부(2601)는 비트스트림을 역다중화하여 부호화된 믹스 신호 및 상기 믹스 신호에 임베딩할 부가 정보를 추출한다. 그 다음에, 믹스신호디코딩부(2602)는 상기 부호화된 믹스 신호를 복호화하여, 복호화된 믹스 신호(Ld 및Rd)를 출력한다. 임베딩부(2603)는 상기 복호화된 믹스 신호에 상기 부가 정보를 임베딩하여, 부가 정보가 임베드된 믹스 신호(Ld' 및 Rd')를 생성한다. 상기 믹스 신호는 CD 등의 PCM 신호 저장매체에 저장 및 전송될 수 있다.The demultiplexer 2601 demultiplexes the bitstream to extract an encoded mix signal and additional information to be embedded in the mix signal. Next, the mixed signal decoding unit 2602 decodes the encoded mixed signal and outputs the decoded mixed signals Ld and Rd. An embedding unit 2603 embeds the additional information in the decoded mix signal to generate the mixed signals Ld 'and Rd' with the additional information embedded therein. The mix signal may be stored and transmitted to a PCM signal storage medium such as a CD.

지금까지 본 발명에 대하여 몇몇 실시예들을 들어 구체적으로 설명하였으나, 상기 실시예들은 본 발명을 이해하기 위한 설명을 위해 제시된 것이며, 본 발명의 범위가 상기 실시예에 제한되는 것은 아니다. 당업자라면 본 발명의 기술적 사상의 범위를 벗어나지 않고도 다양한 변형이 가능함을 이해할 수 있을 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서 해석되어야 할 것이다.Although the present invention has been described in detail with reference to some embodiments, the above embodiments are presented for the purpose of understanding the present invention, and the scope of the present invention is not limited to the above embodiments. Those skilled in the art will understand that various modifications are possible without departing from the scope of the technical idea of the present invention, and the scope of the present invention should be interpreted by the appended claims.

이상에서 기술된 것과 같이, 믹스 신호를 코딩하는데 있어서, 낮은 비트율을 가지는 부가 정보를 이용하여 상기 믹스 신호에 포함된 특정한 소스 신호를 리믹스할 수 있다. 이때, 소스 신호를 리믹싱하기 위한 부가 정보가 필요한데, 본 발명은 상기 부가 정보를 믹스 신호에 임베드함으로써 보조 데이터 영역이 존재하지 않는 저장매체나, 보조 데이터 영역이 존재하지 않는 데이터 포맷에 리믹스 신호를 재생할 수 있는 방법 및 장치를 제공할 수 있는 효과가 있다.As described above, in coding the mixed signal, additional information having a low bit rate may be used to remix specific source signals included in the mixed signal. In this case, additional information for remixing the source signal is required, and the present invention embeds the additional information into the mix signal, thereby remixing the signal to a storage medium having no auxiliary data area or a data format having no auxiliary data area. There is an effect that can provide a method and apparatus that can be reproduced.

Claims (26)

하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 임베드된 부가 정보를 추출하는 단계; Extracting additional information embedded in a non-perceptual region of the mix signal including one or more source signals; 사용자 믹스 파라미터를 획득하는 단계; 및Obtaining a user mix parameter; And 상기 믹스 신호, 상기 부가 정보 및 상기 사용자 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 단계를 포함하되,Generating a remix signal using the mix signal, the additional information, and the user mix parameter, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법.The additional information indicates a relationship between the source signal to be remixed of the source signals and the mixed signal. 제 1 항에 있어서, 상기 부가 정보를 추출하는 단계는The method of claim 1, wherein the extracting of the additional information is performed. 상기 부가 정보의 헤더 영역으로부터 상기 부가 정보가 임베드된 영역의 크기 정보를 추출하는 단계; 및Extracting size information of an area in which the additional information is embedded from a header area of the additional information; And 상기 크기 정보를 이용하여 상기 믹스 신호로부터 상기 부가 정보를 추출하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.And extracting the additional information from the mix signal using the magnitude information. 제 2 항에 있어서,The method of claim 2, 상기 부가 정보의 헤더 영역은 상기 믹스 신호의 최하위 비트(Least Significant Bit, LSB)에 임베드된 것을 특징으로 하는 신호 처리 방법.The header area of the side information is embedded in the least significant bit (LSB) of the mixed signal. 제 2 항에 있어서,The method of claim 2, 상기 크기 정보는 상기 부가 정보가 임베드된 블록 내에서 고정된 값을 가지는 것을 특징으로 하는 신호 처리 방법.The size information has a fixed value in the block in which the additional information is embedded. 제 1 항에 있어서, 상기 신호 처리 방법은 The method of claim 1, wherein the signal processing method is 상기 믹스 신호에 임베드된 에러정정코드를 추출하는 단계; 및Extracting an error correction code embedded in the mix signal; And 상기 에러정정코드를 이용하여 상기 부가 정보의 손상 여부를 판단하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.And determining whether the additional information is damaged by using the error correction code. 제 1 항에 있어서, The method of claim 1, 상기 사용자 믹스 파라미터는 사용자로부터 획득된 제어 정보를 이용하여 생성되는 것을 특징으로 하는 신호 처리 방법.The user mix parameter is generated using the control information obtained from a user. 제 1 항에 있어서,The method of claim 1, 상기 부가 정보는 상기 소스 신호의 레벨 정보, 상기 소스 신호들간의 상대적인 레벨 정보, 또는 상기 소스 신호 및 상기 믹스 신호 채널간의 상대적인 레벨 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The additional information includes level information of the source signal, relative level information between the source signals, or relative level information between the source signal and the mixed signal channel. 제 1 항에 있어서,The method of claim 1, 상기 부가 정보는 상기 소스 신호가 상기 믹스 신호 채널에 믹스되는 정도를 나타내는 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The additional information includes information indicating the degree to which the source signal is mixed in the mixed signal channel. 제 1 항에 있어서,The method of claim 1, 상기 부가 정보는 상기 소스 신호들간의 시간 지연 정보 또는 상기 소스 신호와 상기 믹스 신호 채널간의 시간 지연 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The additional information includes time delay information between the source signals or time delay information between the source signal and the mixed signal channel. 제 1 항에 있어서,The method of claim 1, 상기 부가 정보는 상기 소스 신호들간의 상호 상관 정보 또는 상기 소스 신호와 상기 믹스 신호 채널간의 상호 상관 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The additional information includes cross correlation information between the source signals or cross correlation information between the source signal and the mixed signal channel. 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 단계;Obtaining a mix signal comprising one or more source signals; 상기 소스 신호들 중 리믹스될 소스 신호를 획득하는 단계;Obtaining a source signal to be remixed among the source signals; 상기 믹스 신호 및 상기 리믹스될 소스 신호를 이용하여 부가 정보를 생성하는 단계; 및Generating side information using the mix signal and the source signal to be remixed; And 상기 부가 정보를 상기 믹스 신호의 비지각적 영역에 임베딩하는 단계를 포함하되,Embedding the additional information in a non-perceptual region of the mix signal, 상기 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법.And the additional information indicates a relationship between the source signal to be remixed and the mix signal. 제 11 항에 있어서,The method of claim 11, 상기 부가 정보는 상기 비지각적 영역에 샘플플레인(sample plane) 순서 또는 비트플레인(bit plane) 순서로 임베드되는 것을 특징으로 하는 신호 처리 방법.The additional information is embedded in the non-perceptual region in a sample plane order or a bit plane order. 제 12항에 있어서,The method of claim 12, 상기 부가 정보는 상기 샘플플레인 또는 상기 비트플레인에 상위 비트부터 삽입되거나 또는 하위 비트부터 삽입되는 것을 특징으로 하는 신호 처리 방법.The additional information is inserted into the sample plane or the bit plane from the upper bit or the lower bit is inserted into the method. 제 11 항에 있어서,The method of claim 11, 상기 부가 정보가 임베드되는 영역의 크기는 상기 믹스 신호의 마스킹 한계값(masking threshold)을 이용하여 상기 부가 정보가 임베드되는 블록별로 구해지는 것을 특징으로 하는 신호 처리 방법.And a size of an area in which the additional information is embedded is obtained for each block in which the additional information is embedded using a masking threshold of the mixed signal. 제 14 항에 있어서,The method of claim 14, 상기 부가 정보는 상기 부가 정보가 임베드되는 영역을 0으로 대체한 후에, 상기 영역에 임베드되는 것을 특징으로 하는 신호 처리 방법.And the additional information is embedded in the area after replacing the area in which the additional information is embedded with zero. 제 14 항에 있어서,The method of claim 14, 상기 부가 정보는 상기 부가 정보가 임베드되는 영역에서 부가 정보를 빼고 상기 영역을 재양자화한 후에, 임베드되는 것을 특징으로 하는 신호 처리 방법.And the sub information is embedded after subtracting the sub information from the area in which the sub information is embedded and requantizing the area. 제 11 항에 있어서, 상기 임베딩 단계는,The method of claim 11, wherein the embedding step, 상기 부가 정보가 임베드되는 영역에서 임베드가능한 비트 수보다 임베드해야 할 부가 정보의 비트 수가 작은 경우에는, 남는 비트를 0으로 채우거나, 랜덤 신호로 채우거나, 원래의 믹스 신호로 채우거나, 말단비트열로 채우거나, 또는 이들을 조합해서 채우는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.When the number of bits of the additional information to be embedded is smaller than the embeddable number of bits in the region in which the additional information is embedded, the remaining bits are filled with zeros, filled with random signals, filled with original mixed signals, or end bit strings. The method further comprises the step of filling with or in combination thereof. 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 임베드된 결합 신호를 추출하는 단계;Extracting a combined signal embedded in a non-perceptual region of the mix signal comprising one or more source signals; 상기 결합 신호를 무손실 복호화하여 상기 비지각적 영역에 대응되는 신호를 복원하는 단계; 및Lossless decoding the combined signal to restore a signal corresponding to the non-perceptual region; And 상기 복원된 신호를 이용하여 상기 결합 신호가 추출된 믹스 신호를 복원하는 단계를 포함하되,Restoring the mixed signal from which the combined signal is extracted using the restored signal; 상기 결합 신호는 상기 믹스 신호의 비지각적 영역에 위치하는 신호를 무손실 부호화한 신호 및 부가 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The combined signal includes a signal obtained by losslessly encoding a signal located in a non-perceptual region of the mixed signal and additional information. 제 18 항에 있어서, The method of claim 18, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법.The additional information indicates a relationship between the source signal to be remixed of the source signals and the mixed signal. 제 19 항에 있어서, 상기 신호 처리 방법은The method of claim 19, wherein the signal processing method is 사용자 믹스 파라미터를 획득하는 단계; 및Obtaining a user mix parameter; And 상기 부가 정보, 상기 믹스 신호 및 상기 사용자 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.And generating a remix signal using the additional information, the mix signal, and the user mix parameter. 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 위치하는 신호를 무손실 부호화하는 단계;Losslessly encoding a signal located in a non-perceptual region of the mix signal comprising one or more source signals; 상기 무손실 부호화된 신호 및 부가 정보를 결합하여 결합 신호를 생성하는 단계; 및Generating a combined signal by combining the lossless coded signal and additional information; And 상기 결합 신호를 상기 비지각적 영역에 임베드하는 단계를 포함하되, Embedding the combined signal in the non-perceptual region, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법.The additional information indicates a relationship between the source signal to be remixed of the source signals and the mixed signal. 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 존재하는 부가 정보를 추출하는 단계;Extracting additional information present in the non-perceptual region of the mix signal including one or more source signals; 상기 믹스 신호를 부호화하는 단계; 및Encoding the mix signal; And 상기 부호화된 믹스 신호 및 상기 부가 정보를 이용하여 비트스트림을 생성하는 단계를 포함하되,Generating a bitstream using the encoded mix signal and the side information; 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호 및 상기 믹스 신 호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법.The additional information indicates a relationship between the source signal to be remixed of the source signals and the mix signal. 제 22 항에 있어서, 상기 부호화 단계는The method of claim 22, wherein the encoding step 상기 부가 정보의 싱크 정보를 추출하는 단계; 및Extracting sink information of the additional information; And 상기 싱크 정보를 이용하여 상기 믹스 신호의 프레임 시작 위치를 결정하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.And determining a frame start position of the mix signal using the sync information. 부호화된 믹스 신호 및 부가 정보를 획득하는 단계;Obtaining an encoded mix signal and side information; 상기 부호화된 믹스 신호를 복호화하는 단계; 및Decoding the encoded mix signal; And 상기 복호화된 믹스 신호의 비지각적 영역에 상기 부가 정보를 임베드하는 단계를 포함하되,Embedding the additional information in a non-perceptual region of the decoded mix signal, 상기 믹스 신호는 하나 이상의 소스 신호를 포함하고, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 방법.The mixed signal includes one or more source signals, and the additional information indicates a relationship between the source signal to be remixed among the source signals and the mix signal. 하나 이상의 소스 신호를 포함하는 믹스 신호의 비지각적 영역에 임베드된 부호화된 부가 정보를 추출하는 임베디드신호디코딩부;An embedded signal decoding unit for extracting encoded side information embedded in a non-perceptual region of a mix signal including one or more source signals; 상기 부호화된 부가 정보를 디코딩하여 부가 정보를 생성하는 부가정보디코딩부; 및An additional information decoding unit to decode the encoded additional information to generate additional information; And 상기 부가 정보, 상기 믹스 신호 및 사용자 믹스 파라미터를 이용하여 리믹 스 신호를 생성하는 리믹스렌더링부를 포함하되,A remix renderer configured to generate a remix signal using the additional information, the mix signal, and a user mix parameter, 상기 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내고, 상기 사용자 믹스 파라미터는 사용자로부터 획득된 제어정보를 이용하여 생성되는 것을 특징으로 하는 신호 처리 장치.The additional information indicates a relationship between the source signal to be remixed among the source signals and the mix signal, wherein the user mix parameter is generated using control information obtained from a user. 하나 이상의 소스 신호를 포함하는 믹스 신호 및 리믹스될 소스 신호를 이용하여 부가 정보를 생성하는 부가정보생성부; 및An additional information generator configured to generate additional information using a mix signal including one or more source signals and a source signal to be remixed; And 상기 부가 정보를 상기 믹스 신호의 비지각적 영역에 임베딩하는 임베딩부를 포함하되,An embedding unit for embedding the additional information in the non-perceptual region of the mix signal, 상기 리믹스될 소스 신호는 상기 소스 신호들 중에서 선택되고, 상기 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 것을 특징으로 하는 신호 처리 장치.The source signal to be remixed is selected from among the source signals, and the additional information indicates a relationship between the source signal to be remixed and the mix signal.
KR1020070063182A 2006-09-29 2007-06-26 Apparatus for processing audio signal and method thereof KR100891666B1 (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US84821806P 2006-09-29 2006-09-29
US60/848,218 2006-09-29
US82935006P 2006-10-13 2006-10-13
US60/829,350 2006-10-13
US86830406P 2006-12-01 2006-12-01
US60/868,304 2006-12-01

Publications (2)

Publication Number Publication Date
KR20080029757A KR20080029757A (en) 2008-04-03
KR100891666B1 true KR100891666B1 (en) 2009-04-02

Family

ID=39532255

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070063182A KR100891666B1 (en) 2006-09-29 2007-06-26 Apparatus for processing audio signal and method thereof

Country Status (1)

Country Link
KR (1) KR100891666B1 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5249408B2 (en) 2008-04-16 2013-07-31 エルジー エレクトロニクス インコーポレイティド Audio signal processing method and apparatus
KR101062351B1 (en) 2008-04-16 2011-09-05 엘지전자 주식회사 Audio signal processing method and device thereof
US8326446B2 (en) 2008-04-16 2012-12-04 Lg Electronics Inc. Method and an apparatus for processing an audio signal
US10783430B2 (en) * 2016-09-26 2020-09-22 The Boeing Company Signal removal to examine a spectrum of another signal
KR20220061467A (en) * 2020-11-06 2022-05-13 삼성전자주식회사 Electronic device and Method for processing the audio signal thereof

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005029467A1 (en) 2003-09-17 2005-03-31 Kitakyushu Foundation For The Advancement Of Industry, Science And Technology A method for recovering target speech based on amplitude distributions of separated signals
US20050157883A1 (en) 2004-01-20 2005-07-21 Jurgen Herre Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005029467A1 (en) 2003-09-17 2005-03-31 Kitakyushu Foundation For The Advancement Of Industry, Science And Technology A method for recovering target speech based on amplitude distributions of separated signals
US20050157883A1 (en) 2004-01-20 2005-07-21 Jurgen Herre Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
'A new sinusoidal modelling approach for parametric speech and audio coding', IEEE Image and signal processing and analysis 2003 (2003.09.18)
Patrick De Smet et al., 'Subband based audio mixing for internet streaming applications', ICASSP 2001

Also Published As

Publication number Publication date
KR20080029757A (en) 2008-04-03

Similar Documents

Publication Publication Date Title
KR101315077B1 (en) Scalable multi-channel audio coding
RU2449387C2 (en) Signal processing method and apparatus
JP5174027B2 (en) Mix signal processing apparatus and mix signal processing method
EP1455345B1 (en) Method and apparatus for encoding and/or decoding digital data using bandwidth extension technology
JP5461835B2 (en) Audio signal encoding / decoding method and encoding / decoding device
JP4925671B2 (en) Digital signal encoding / decoding method and apparatus, and recording medium
NO340421B1 (en) Frequency-based coding of audio channels in parametric multi-channel coding system
WO2008100100A1 (en) Methods and apparatuses for encoding and decoding object-based audio signals
JP2008536184A (en) Adaptive residual audio coding
JP2000501846A (en) Multi-channel prediction subband coder using psychoacoustic adaptive bit allocation
WO2007046660A1 (en) Method for encoding and decoding multi-channel audio signal and apparatus thereof
KR20070001139A (en) An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
US20050021328A1 (en) Audio coding
EP1932239A1 (en) Method and apparatus for encoding/decoding
KR100891666B1 (en) Apparatus for processing audio signal and method thereof
TWI501220B (en) Embedding and extracting ancillary data
JP4809234B2 (en) Audio encoding apparatus, decoding apparatus, method, and program
KR20060122692A (en) Method of encoding and decoding down-mix audio signal embeded with spatial bitstream
KR100923301B1 (en) Method and apparatus for encoding/decoding audio data using bandwidth extension technology
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
KR100891667B1 (en) Apparatus for processing a mix signal and method thereof
KR20040086878A (en) Method and apparatus for encoding/decoding audio data using bandwidth extension technology
KR20070098726A (en) Method and apparatus for encoding/decoding a media signal
Li et al. Efficient stereo bitrate allocation for fully scalable audio codec
KR20070108312A (en) Method and apparatus for encoding/decoding an audio signal

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130226

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140224

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150224

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160224

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee