KR100891665B1 - Apparatus for processing a mix signal and method thereof - Google Patents

Apparatus for processing a mix signal and method thereof Download PDF

Info

Publication number
KR100891665B1
KR100891665B1 KR1020070063180A KR20070063180A KR100891665B1 KR 100891665 B1 KR100891665 B1 KR 100891665B1 KR 1020070063180 A KR1020070063180 A KR 1020070063180A KR 20070063180 A KR20070063180 A KR 20070063180A KR 100891665 B1 KR100891665 B1 KR 100891665B1
Authority
KR
South Korea
Prior art keywords
signal
additional information
information
mix
source
Prior art date
Application number
KR1020070063180A
Other languages
Korean (ko)
Other versions
KR20080033839A (en
Inventor
정양원
오현오
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20080033839A publication Critical patent/KR20080033839A/en
Application granted granted Critical
Publication of KR100891665B1 publication Critical patent/KR100891665B1/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Mathematical Physics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 믹스 신호의 처리 방법 및 장치에 관한 것이다. 이를 위해, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 단계와; 제1 부가 정보를 획득하는 단계와; 믹스 파라미터를 획득하는 단계와; 상기 믹스 신호, 상기 제1 부가 정보, 및 상기 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 단계를 포함하되, 상기 제1 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 제2 부가 정보를 변형한 정보인 것을 특징으로 하는 신호 처리 방법을 제공한다.The present invention relates to a method and apparatus for processing a mixed signal. To this end, the present invention comprises the steps of obtaining a mix signal comprising at least one source signal; Obtaining first additional information; Obtaining a mix parameter; Generating a remix signal using the mix signal, the first additional information, and the mix parameter, wherein the first additional information is related to a source signal to be remixed among the source signals and the mix signal. A signal processing method is provided, wherein the second additional information indicated is modified information.

믹스 신호, 부가 정보, 부가 정보 변형 Mix signal, side information, side information transformation

Description

믹스 신호의 처리 방법 및 장치{APPARATUS FOR PROCESSING A MIX SIGNAL AND METHOD THEREOF} Method and apparatus for processing mixed signal {APPARATUS FOR PROCESSING A MIX SIGNAL AND METHOD THEREOF}

도 1은 본 발명의 일실시예에 따른 제1 리믹스 신호 인코딩 장치에 대한 블록도.1 is a block diagram of an apparatus for encoding a first remix signal according to an embodiment of the present invention.

도 2는 스테레오 신호를 이용하는 경우, 도 1의 제1 리믹스 신호 인코딩 장치에 대한 상세 블록도.FIG. 2 is a detailed block diagram of the first remix signal encoding apparatus of FIG. 1 when using a stereo signal. FIG.

도 3은 본 발명의 일실시예에 따른 믹스 신호를 처리하기 위한 도메인.3 is a domain for processing a mix signal according to an embodiment of the present invention.

도 4는 본 발명의 일실시예에 따른 제2 리믹스 신호 인코딩 장치에 대한 블록도.4 is a block diagram of a second remix signal encoding apparatus according to an embodiment of the present invention.

도 5는 본 발명의 일실시예에 따른 제1 리믹스 신호 디코딩 장치에 대한 블록도.5 is a block diagram of an apparatus for decoding a first remix signal according to an embodiment of the present invention.

도 6은 스테레오 신호를 이용하는 경우, 도 5의 제1 리믹스 신호 디코딩 장치에 대한 상세도.FIG. 6 is a detailed view of the first remix signal decoding apparatus of FIG. 5 when using a stereo signal. FIG.

도 7은 본 발명의 일실시예에 따른 제2 리믹스 신호 디코딩 장치에 대한 블록도.7 is a block diagram of a second remix signal decoding apparatus according to an embodiment of the present invention.

도 8A는 통상적인 인코딩 장치 및 본 발명의 일실시예에 따른 리믹스 신호 인코딩 장치의 결합을 나타내는 블록도.8A is a block diagram illustrating a combination of a conventional encoding apparatus and a remix signal encoding apparatus according to an embodiment of the present invention.

도 8B는 종래의 디코딩 장치와 결합하여 이용되는 본 발명의 일실시예에 따른 제2 리믹스 신호 디코딩 장치에 대한 블록도.8B is a block diagram of a second remix signal decoding apparatus according to an embodiment of the present invention used in combination with a conventional decoding apparatus.

도 9는 본 발명의 일실시예에 따른 리믹스 신호 디코딩 장치에 상세 블록도.9 is a detailed block diagram of a remix signal decoding apparatus according to an embodiment of the present invention.

도 10은 본 발명의 일실시예에 따른 리믹스 신호 인코딩 장치에 대한 블록도.10 is a block diagram of an apparatus for encoding a remix signal according to an embodiment of the present invention.

도 11은 도 10의 리믹스 신호 인코딩 장치에 대한 상세 블록도.FIG. 11 is a detailed block diagram of the remix signal encoding apparatus of FIG. 10. FIG.

도 12는 본 발명의 일실시예에 따른 리믹스 신호 인코딩 장치의 블록도.12 is a block diagram of a remix signal encoding apparatus according to an embodiment of the present invention.

도 13은 본 발명의 일실시예에 따른 부가 정보 처리부를 나타낸 블록도.13 is a block diagram illustrating an additional information processing unit according to an embodiment of the present invention.

도 14는 본 발명의 일실시예에 따른 부가 정보를 새로 적용할 믹스 신호에 적합하도록 변환하는 트랜스코더.14 is a transcoder for converting additional information to be suitable for a newly applied mix signal according to an embodiment of the present invention.

도 15는 본 발명의 일실시예에 따른 디코딩 장치의 블록도.15 is a block diagram of a decoding apparatus according to an embodiment of the present invention.

도 16은 본 발명의 일실시예에 따른 부가 정보 처리 방법을 나타낸 순서도.16 is a flowchart illustrating a method of processing additional information according to an embodiment of the present invention.

도 17은 본 발명의 일실시예에 따른 신호 처리 방법을 나타낸 순서도.17 is a flowchart illustrating a signal processing method according to an embodiment of the present invention.

본 발명은 믹스 신호의 처리 방법 및 장치에 관한 것이다. 현재까지는 믹스 신호로서 스테레오 신호가 가장 흔하게 생성되고, 소비자들에게 가장 널리 이용된다. 최근에는 멀티채널 신호가 점점 널리 이용되고 있다. 그러나, 상기 믹스 신호는 상기 믹스 신호를 구성하는 소스 신호 단위가 아니라, 채널 단위로 처리된다는 한계가 있다. 따라서, 채널 단위로 믹스 신호를 처리하는 경우, 믹스 신호를 구성하는 특정 소스 신호만을 독립적으로 처리할 수 없는 문제점이 있다. 예를 들면, 영화를 보면서 배우들 음성에 대한 볼륨은 일정하게 유지하면서, 배경음악의 볼륨만을 높이는 것은 불가능하다. The present invention relates to a method and apparatus for processing a mixed signal. To date, stereo signals are most commonly generated as mix signals and most widely used by consumers. In recent years, multichannel signals have been increasingly used. However, there is a limitation that the mixed signal is processed in units of channels, not in units of source signals constituting the mix signal. Therefore, when processing a mix signal in units of channels, there is a problem in that only a specific source signal constituting the mix signal cannot be independently processed. For example, while watching a movie, it is impossible to increase the volume of background music while keeping the volume of actors' voices constant.

상기와 같은 문제점을 해결하기 위해, 본 발명은 부가 정보를 낮은 정보량으로 변형하는 인코딩 방법 및 장치를 제공하는 데 그 목적이 있다. In order to solve the above problems, an object of the present invention is to provide an encoding method and apparatus for transforming additional information into a low information amount.

또한, 본 발명은 변형된 부가 정보를 이용하여 믹스 신호를 소스 신호 단위로 제어할 수 있는 믹스 신호 디코딩 방법 및 장치를 제공하는 데 그 목적이 있다. Another object of the present invention is to provide a method and apparatus for decoding a mixed signal, which can control a mixed signal in units of a source signal using modified additional information.

상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 단계와; 제1 부가 정보를 획득하는 단계와; 믹스 파라미터를 획득하는 단계와; 상기 믹스 신호, 상기 제1 부가 정보, 및 상기 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 단계를 포함하되, 상기 제1 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 제2 부가 정보를 변형한 정보인 것을 특징으로 하는 신호 처리 방법을 제공한다.In order to achieve the above object, the present invention comprises the steps of obtaining a mix signal comprising at least one source signal; Obtaining first additional information; Obtaining a mix parameter; Generating a remix signal using the mix signal, the first additional information, and the mix parameter, wherein the first additional information is related to a source signal to be remixed among the source signals and the mix signal. A signal processing method is provided, wherein the second additional information indicated is modified information.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 단계와; 상기 소스 신호들 중 리믹스될 소스 신호를 획득하는 단계와; 상기 믹스 신호 및 상기 리믹스될 소스 신호를 이용하여 제1 부가 정보를 생성하는 단계와; 상기 제1 부가 정보를 제2 부가 정보로 변형하는 단 계를 포함하되, 상기 제1 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 정보인 것을 특징으로 하는 신호 처리 방법을 제공한다.In addition, to achieve the above object, the present invention comprises the steps of obtaining a mix signal comprising at least one source signal; Obtaining a source signal to be remixed among the source signals; Generating first side information using the mix signal and the source signal to be remixed; And transforming the first additional information into second additional information, wherein the first additional information is information indicating a relationship between the source signal to be remixed and the mixed signal. do.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 제1 믹스 신호 및 제1 부가 정보를 획득하는 단계와; 제2 믹스 신호를 획득하는 단계와; 상기 제1 믹스 신호와 상기 제2 믹스 신호를 비교한 결과를 이용하여 상기 제1 부가 정보를 제2 부가 정보를 변형하는 단계를 포함하되, 상기 제1 부가 정보는 상기 제1 믹스 신호를 리믹스하기 위해 필요한 정보이고, 상기 제2 부가 정보는 상기 제2 믹스 신호를 리믹스하기 위해 필요한 정보인 것을 특징으로 하는 신호 처리 방법을 제공한다.In addition, in order to achieve the above object, the present invention comprises the steps of obtaining a first mix signal and the first additional information; Obtaining a second mix signal; And modifying the first additional information and the second additional information by using a result of comparing the first mixed signal and the second mixed signal, wherein the first additional information is used to remix the first mixed signal. The second additional information is information necessary for remixing the second mixed signal.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 믹스신호디코딩부; 제1 부가 정보를 획득하는 부가정보디코딩부; 및 상기 믹스 신호, 상기 제1 부가 정보, 및 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 리믹스렌더링부를 포함하되, 상기 제1 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 제2 부가 정보를 변형한 정보이고, 상기 믹스 파라미터는 사용자로부터 획득된 제어 정보를 이용하여 생성되는 것을 특징으로 하는 신호 처리 장치를 제공한다.In addition, in order to achieve the above object, the present invention provides a mixed signal decoding unit for obtaining a mixed signal including at least one source signal; An additional information decoding unit obtaining first additional information; And a remix rendering unit configured to generate a remix signal using the mix signal, the first additional information, and the mix parameter, wherein the first additional information is a relationship between the source signal to be remixed among the source signals and the mix signal. The second additional information indicating the modified information, and the mix parameter provides a signal processing apparatus, characterized in that generated using the control information obtained from the user.

또한, 상기의 목적을 달성하기 위하여, 본 발명은 하나 이상의 소스 신호를 포함하는 믹스 신호 및 리믹스될 소스 신호를 이용하여 제1 부가 정보를 생성하는 부가정보생성부; 상기 제1 부가 정보를 제2 부가 정보로 변형하는 부가정보변형부; 및 상기 제2 부가 정보를 부호화하는 부가정보인코딩부를 포함하되, 상기 제1 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 정보인 것 을 특징으로 하는 신호 처리 장치를 제공한다.In addition, in order to achieve the above object, the present invention provides an additional information generation unit for generating a first additional information using a mix signal including at least one source signal and the source signal to be remixed; An additional information transformation unit which transforms the first additional information into second additional information; And an additional information encoding unit encoding the second additional information, wherein the first additional information is information indicating a relationship between the source signal to be remixed and the mixed signal.

이하 상기의 목적을 구체적으로 실현할 수 있는 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 설명한다. Hereinafter, with reference to the accompanying drawings, preferred embodiments of the present invention that can specifically realize the above object will be described.

본 발명은 믹스 신호를 소스(Source) 신호 단위로 처리할 수 있는 알고리즘을 제공한다. 믹스 신호를 소스 신호 단위로 처리하는 경우, 매우 다양한 효과를 생성할 수 있다. 예를 들면, 영화를 보면서 배우들 음성에 대한 볼륨은 일정하게 유지하면서, 배경음악의 볼륨만을 높이는 것이 가능하다. 본 발명에서 소스 신호란 믹스 신호를 구성하는 하나 이상의 소스(source)(예를 들면, 피아노)를 포함한다. 소스 신호 단위의 처리란 믹스 신호를 처리함에 있어서, 상기 믹스 신호를 구성하는 특정한 소스 신호와 관련된 특성들(예를 들면, 로컬화(localization), 게인(gain))이 "개별적으로(individually)" 수정될 수 있다는 것을 의미한다. 상기 "개별적으로"란 특정한 오브젝트와 관련된 특성을 수정하는 것이 다른 소스 신호들의 특성에 영향을 미치지 않거나, 지각적으로 느끼기 어려운 작은 영향만을 미치는 것을 의미한다. The present invention provides an algorithm that can process a mix signal in a unit of a source signal. When the mix signal is processed in units of source signals, a wide variety of effects can be produced. For example, while watching a movie, it is possible to increase only the volume of the background music while keeping the volume of actors' voices constant. In the present invention, the source signal includes one or more sources (eg, pianos) constituting the mix signal. Processing in source signal units means that in processing a mix signal, characteristics (eg, localization, gain) associated with a particular source signal constituting the mix signal are " individually ". It can be modified. By “individually” it is meant that modifying the properties associated with a particular object does not affect the properties of other source signals or only has a small effect that is difficult to perceive.

상기 믹스 신호는 모노, 스테레오, 및 멀티채널 신호를 포함한다. 설명의 편의상 이하에서 스테레오 신호를 예로 하여 기술할 것이나, 본 발명은 스테레오 신호에만 한정되지 않는다. 본 발명에서는 통상적인 믹스 신호의 포맷(예를 들면, PCM, MP3, MPEG-AAC)뿐만 아니라, 적은 양의 부가 정보(side information)가 전송된다. 상기 믹스 신호 및 부가 정보를 이용하여 리믹스 신호를 생성할 수 있다. The mix signal includes mono, stereo, and multichannel signals. For convenience of explanation, hereinafter, a stereo signal will be described as an example, but the present invention is not limited to the stereo signal. In the present invention, a small amount of side information is transmitted as well as a typical mix signal format (for example, PCM, MP3, MPEG-AAC). The remix signal may be generated using the mixed signal and the additional information.

도 1은 본 발명의 일 실시예에 따른 제1 리믹스 신호 인코더의 블록도이다. 상기 제1 리믹스 신호 인코더는 부가정보생성부(103) 및 부가정보인코딩부(105)를 포함한다. 1 is a block diagram of a first remix signal encoder according to an embodiment of the present invention. The first remix signal encoder includes an additional information generator 103 and an additional information encoder 105.

도 1을 참조하면, 부가정보생성부(103)는 통상적인 믹스 신호(101) 및 상기 믹스 신호를 구성하는 소스 신호(102)를 이용하여 부가 정보(104)를 생성한다. 상기 믹스 신호(101)는 모노(mono), 스테레오(stereo) 및 멀티채널 오디오 신호(multi-channel audio signal)가 될 수 있다. 상기 소스 신호(102)는 상기 믹스 신호(101)를 구성하는 소스 신호들 중 일부 또는 전부가 될 수 있다. 상기 부가 정보(104)는 상기 믹스 신호를 소스 신호 단위로 처리하는데 이용되는 정보를 말한다. 상기 부가 정보(104)는 상기 믹스 신호를 리믹싱하기 위한 믹스 파라미터를 포함한다. 상기 믹스 파라터에는 인코더에서 소스 신호를 이용하여 생성된 인코더 믹스 파라미터(Encoder mix parameter)를 포함하며, 선택적으로 믹스 신호만을 이용하여 생성된 블라인드 믹스 파라미터(Blind mix parameter)를 포함할 수 있다. 상기 믹스 파라미터의 예로는 각각의 소스 신호에 대한 게인 값 및 서브밴드 파위(subband power) 등이 될 수 있다. 상기 부가 정보(104)에 대한 구체적인 정의 및 생성 방법은 도 2에서 기술된다. 본 발명은 또한 믹스 신호를 구성하는 소스 신호(102)만을 이용하여 부가 정보(104)를 생성하는 것을 포함한다. 부가정보인코딩부(105)는 생성된 부가 정보(104)를 인코딩하여 부호화된 부가 정보 신호(106)를 생성한다. 상기 믹스 신호(101) 및 상기 부가 정보 신호(106)는 디코딩 장치로 전송된다.Referring to FIG. 1, the additional information generator 103 generates additional information 104 using a typical mix signal 101 and a source signal 102 constituting the mixed signal. The mix signal 101 may be a mono, stereo, and multi-channel audio signal. The source signal 102 may be some or all of the source signals constituting the mix signal 101. The additional information 104 refers to information used to process the mixed signal in source signal units. The additional information 104 includes mix parameters for remixing the mix signal. The mix parameter may include an encoder mix parameter generated using a source signal in an encoder, and optionally, a blind mix parameter generated using only a mix signal. Examples of the mix parameter may include a gain value and a subband power for each source signal. A detailed definition and generation method for the additional information 104 is described in FIG. 2. The present invention also includes generating the additional information 104 using only the source signal 102 constituting the mix signal. The side information encoding unit 105 encodes the generated side information 104 to generate an encoded side information signal 106. The mix signal 101 and the side information signal 106 are transmitted to a decoding apparatus.

도 2는 믹스 신호가 스테레오 신호인 경우, 도 1의 제1 리믹스 신호 인코딩 장치에 대한 상세 블록도이다. 전술한 것처럼, 본 발명에서 사용되는 믹스 신호는 모노, 스테레오 및 멀티채널 오디오 신호가 될 수 있으나, 편의상 스테레오 신호(201)를 기준으로 설명한다.FIG. 2 is a detailed block diagram of the first remix signal encoding apparatus of FIG. 1 when the mixed signal is a stereo signal. As described above, the mixed signal used in the present invention may be a mono, stereo, and multi-channel audio signal, but for convenience, it will be described with reference to the stereo signal 201.

상기 스테레오 신호(stereo signal)(201)

Figure 112007046536094-pat00001
Figure 112007046536094-pat00002
는 상기 스테레오 신호를 구성하는 소스 신호들의 합으로 표현될 수 있다. 여기서, n은 타임 인덱스를 의미한다. 따라서, 상기 스테레오 신호(201)는 아래의 [수학식 1]과 같이 표현될 수 있다.The stereo signal 201
Figure 112007046536094-pat00001
And
Figure 112007046536094-pat00002
May be expressed as a sum of source signals constituting the stereo signal. Here, n means time index. Therefore, the stereo signal 201 may be expressed as Equation 1 below.

Figure 112007046536094-pat00003
Figure 112007046536094-pat00003

여기서, I는 스테레오 신호 내에 포함되는 소스 신호들의 개수이고,

Figure 112007046536094-pat00004
은 소스 신호들을 나타낸다.
Figure 112007046536094-pat00005
Figure 112007046536094-pat00006
는 각각의 소스 신호에 대한 진폭 패닝(amplitude panning) 및 게인(gain)을 결정하는 값이다. 모든
Figure 112007046536094-pat00007
들은 서로 독립적이다. 상기
Figure 112007046536094-pat00008
는 모두 순수한 소스 신호이거나, 또는 순수한 소스 신호에 약간의 잔향(reverberation) 및 효과음 신호성분(sound effect signal components)을 포함할 수 있다. 예를 들면, 특정한 잔향 신호성분은 2개의 소스 신호, 즉, 왼쪽 채널로 믹스된 신호와 오른쪽 채널로 믹스된 신호로 표현될 수 있다.Here, I is the number of source signals included in the stereo signal,
Figure 112007046536094-pat00004
Represents source signals.
Figure 112007046536094-pat00005
And
Figure 112007046536094-pat00006
Is a value that determines the amplitude panning and gain for each source signal. all
Figure 112007046536094-pat00007
They are independent of each other. remind
Figure 112007046536094-pat00008
Are all pure source signals, or may include some reverberation and sound effect signal components in the pure source signal. For example, the specific reverberation signal component may be represented by two source signals, that is, a signal mixed with the left channel and a signal mixed with the right channel.

본 발명의 목적은 M개(0 <= M <= I)의 소스 신호들이 리믹스 되도록, 상기 소스 신호를 포함하는 스테레오 신호를 수정하는 것이다. 상기 소스 신호들은 서로 다른 게인 팩터들을 가지면서 스테레오 신호로 리믹스될 수 있다. 리믹스 신호는 아래의 [수학식 2]와 같이 표현될 수 있다.It is an object of the present invention to modify a stereo signal comprising the source signal such that M (0 <= M <= I) source signals are remixed. The source signals may be remixed into a stereo signal with different gain factors. The remix signal may be expressed as Equation 2 below.

Figure 112007046536094-pat00009
Figure 112007046536094-pat00009

여기서,

Figure 112007046536094-pat00010
Figure 112007046536094-pat00011
는 리믹스되는 M개의 소스 신호들에 대한 새로운 게인 팩터들이다. 상기
Figure 112007046536094-pat00012
Figure 112007046536094-pat00013
는 디코더 단에서 제공될 수 있다. 이 경우에, 부가정보생성부(206)는 스테레오 신호(201) 및 M개의 소스 신호(202)를 이용하여 부가 정보(207)를 생성할 수 있다. here,
Figure 112007046536094-pat00010
And
Figure 112007046536094-pat00011
Are new gain factors for the M source signals to be remixed. remind
Figure 112007046536094-pat00012
And
Figure 112007046536094-pat00013
May be provided at the decoder stage. In this case, the additional information generator 206 may generate the additional information 207 using the stereo signal 201 and the M source signals 202.

상술하였듯이, 본 발명의 목적은 통상적인 스테레오 신호와 약간의 부가 정보가 주어지는 경우에, 상기 스테레오 신호를 소스 신호 단위로 리믹스하는 것이다. 본 발명에서와 같이 매우 적은 양의 부가 정보를 이용하여 [수학식 1]로 표현 되는 믹스 신호로부터 [수학식 2]로 표현되는 리믹스 신호를 완벽하게 생성하는 것은 가능하지 않다. 따라서, 본 발명은 각각의 소스 신호들

Figure 112007046536094-pat00014
에 대한 접근 없이, [수학식 1]로 표현되는 통상적인 믹스 신호가 주어지는 경우에, [수학식 2]로 표현되는 리믹스 신호를 지각적으로 모방하는 것을 목적으로 한다.As described above, an object of the present invention is to remix the stereo signal in the unit of the source signal when given a conventional stereo signal and some additional information. As in the present invention, it is not possible to completely generate the remix signal represented by Equation 2 from the mixed signal represented by Equation 1 using a very small amount of additional information. Thus, the present invention provides the respective source signals
Figure 112007046536094-pat00014
It is aimed to perceptually mimic the remix signal represented by [Equation 2], given an ordinary mix signal represented by [Equation 1] without access to.

도 2를 참조하면, 제1 리믹스 신호 인코딩 장치에 통상적인 스테레오 신호(201) 및 상기 스테레오 신호(201)에 포함되는 M개의 소스 신호(202)가 입력된다. 상기 스테레오 신호(201)는 부가 정보와 동기화되기 위해 어느 정도 딜레이 되어, 출력 신호로서 직접 이용될 수 있다. 부가 정보를 생성하기 위해, 상기 스테레오 신호(201) 및 소스 신호들(202)은 필터뱅크(203)를 통하여 시간-주파수 도메인의 서브밴드별 신호(204 및 205)로 분해된다. 즉, 상기 스테레오 신호(201) 및 소스 신호는 시간-주파수 도메인에서 처리되는데, 상기 시간-주파수 도메인에 대해서는 도 3에서 후술한다. 상기 서브밴드별 신호(204)는 각 서브밴드의 중심 주파수에서 유사하게 프로세싱된다. 특정한 주파수에서 스테레오 신호(201)의 서브밴드 쌍(204)은

Figure 112007046536094-pat00015
Figure 112007046536094-pat00016
로 표시된다. 여기서 k는 서브밴드 신호들의 시간 인덱스(time index)이다. 유사하게, M개의 소스 신호들(202)의 서브밴드 신호들(205)은
Figure 112007046536094-pat00017
,
Figure 112007046536094-pat00018
,...,
Figure 112007046536094-pat00019
로 표시된다. 명료한 표현을 위해, 서브밴드(주파수) 인덱스를 사용하지 않았다.Referring to FIG. 2, a stereo signal 201 and M source signals 202 included in the stereo signal 201 are input to a first remix signal encoding apparatus. The stereo signal 201 may be delayed to some extent to be synchronized with the side information and used directly as an output signal. To generate the additional information, the stereo signal 201 and the source signals 202 are decomposed into subband-specific signals 204 and 205 in the time-frequency domain through the filter bank 203. That is, the stereo signal 201 and the source signal are processed in the time-frequency domain, which will be described later with reference to FIG. 3. The subband-specific signal 204 is similarly processed at the center frequency of each subband. At a particular frequency, the subband pair 204 of the stereo signal 201
Figure 112007046536094-pat00015
And
Figure 112007046536094-pat00016
Is displayed. Where k is the time index of the subband signals. Similarly, the subband signals 205 of the M source signals 202 may be
Figure 112007046536094-pat00017
,
Figure 112007046536094-pat00018
, ...,
Figure 112007046536094-pat00019
Is displayed. For clarity, no subband (frequency) index is used.

상기 소스 신호들(202)의 서브밴드 신호들(205)이 주어지면, 부가정보생성 부(206)는 서브밴드별로 숏-타임 서브밴드 파워(short-time subband power),

Figure 112007046536094-pat00020
를 생성한다. 또한, 상기 부가정보생성부(206)는 스테레오 신호(201)의 서브밴드 쌍(204)을 이용하여, 서브밴드별로 게인 팩터
Figure 112007046536094-pat00021
Figure 112007046536094-pat00022
를 생성한다. 상기 게인 팩터
Figure 112007046536094-pat00023
Figure 112007046536094-pat00024
는 외부에서 직접 주어질 수 있다. 상기 서브밴드별 숏-타임 서브밴드 파워 및 게인 팩터를 이용하여 서브밴드별 부가 정보(207)가 생성된다. 상기 부가정보생성부(206)는 상기 숏-타임 서브밴드 파워 및 게인 팩터들 이외에 상기 스테레오 신호에 관련된 다른 정보를 부가 정보(207)로 생성할 수 있다. 부가정보인코딩부(208)는 상기 서브밴드별 부가정보(207)를 이용하여 부호화된 부가 정보 신호(209)를 생성한다. Given the subband signals 205 of the source signals 202, the side information generator 206 may perform short-time subband power for each subband,
Figure 112007046536094-pat00020
Create In addition, the additional information generator 206 uses a subband pair 204 of the stereo signal 201 to obtain a gain factor for each subband.
Figure 112007046536094-pat00021
And
Figure 112007046536094-pat00022
Create The gain factor
Figure 112007046536094-pat00023
And
Figure 112007046536094-pat00024
Can be given directly from the outside. Subband-specific additional information 207 is generated using the short-time subband power and gain factor for each subband. The additional information generator 206 may generate other information related to the stereo signal as additional information 207 in addition to the short-time subband power and gain factors. The additional information encoding unit 208 generates an additional information signal 209 encoded using the additional information 207 for each subband.

많은 스테레오 신호(201)에 대하여, 게인 팩터

Figure 112007046536094-pat00025
Figure 112007046536094-pat00026
는 고정적이 될 것이다. 만일
Figure 112007046536094-pat00027
Figure 112007046536094-pat00028
가 시간 k에 따라 가변적이라면, 상기 게인 팩터들은 시간의 함수로 생성될 것이다. 상기 게인 팩터들은 직접 양자화 및 부호화되지 않고, 먼저 양자화 및 부호화에 더 적합한 다른 값들로 전환될 수 있다. 또한,
Figure 112007046536094-pat00029
는 스테레오 신호(201)의 서브밴드 파워에 상대적인 값으로 정규화될 수 있다. 이것은 스테레오 신호를 효율적으로 부호화하기 위해 통상적인 인코딩 장치가 이용되는 경우에, 본 발명을 상대적으로 변화에 강하도록 만들어준다. 예를 들면,
Figure 112007046536094-pat00030
Figure 112007046536094-pat00031
는 아래의 [수학식 3]으로 표현되는 게인 및 데시벨(dB) 단위의 레벨차로 전환되어 전송될 수 있다. For many stereo signals 201, the gain factor
Figure 112007046536094-pat00025
And
Figure 112007046536094-pat00026
Will be fixed. if
Figure 112007046536094-pat00027
And
Figure 112007046536094-pat00028
If is variable over time k, the gain factors will be generated as a function of time. The gain factors are not directly quantized and coded, but may first be converted to other values more suitable for quantization and coding. Also,
Figure 112007046536094-pat00029
Can be normalized to a value relative to the subband power of the stereo signal 201. This makes the present invention relatively resistant to changes when conventional encoding devices are used to encode stereo signals efficiently. For example,
Figure 112007046536094-pat00030
And
Figure 112007046536094-pat00031
May be converted into a level difference in units of gain and decibel (dB) expressed by Equation 3 below, and then transmitted.

Figure 112007046536094-pat00032
Figure 112007046536094-pat00032

또한,

Figure 112007046536094-pat00033
는 부가 정보로서 직접 부호화되는 것이 아니라, 아래의 [수학식 4]로 표현되는 스테레오 신호에 상대적으로 정의된 값으로 변환되어 전송될 수 있다. Also,
Figure 112007046536094-pat00033
Is not directly encoded as additional information, but may be converted into a value defined relative to the stereo signal represented by Equation 4 below and transmitted.

Figure 112007046536094-pat00034
Figure 112007046536094-pat00034

숏-타임 서브밴드 파워를 생성하기 위해, 본 발명은 단일-폴 평균(single-pole averaging)을 사용한다. 즉,

Figure 112007046536094-pat00035
는 아래의 [수학식 5]와 같이 계산될 수 있다. To produce short-time subband power, the present invention uses single-pole averaging. In other words,
Figure 112007046536094-pat00035
May be calculated as shown in Equation 5 below.

Figure 112007046536094-pat00036
Figure 112007046536094-pat00036

여기서, α∈[0,1]는 아래의 [수학식 6]와 같이 지수적으로 감소하는 추정 윈도우(estimation window)의 시간-상수를 결정한다.Here, α∈ [0,1] determines the time-constant of the estimation window (estimation window) which decreases exponentially as shown in Equation 6 below.

Figure 112007046536094-pat00037
Figure 112007046536094-pat00037

여기서,

Figure 112007046536094-pat00038
는 서브밴드 샘플링 주파수를 나타낸다. 예를 들면, T=40 ms를 이용할 수 있다. 이하에서,
Figure 112007046536094-pat00039
는 숏-타임 평균(short-time averaging)을 나타낸다. 만일
Figure 112007046536094-pat00040
Figure 112007046536094-pat00041
가 주어지지 않는다면, 상기
Figure 112007046536094-pat00042
Figure 112007046536094-pat00043
는 부가정보생성부(206)에서 생성될 필요가 있다.
Figure 112007046536094-pat00044
이므로,
Figure 112007046536094-pat00045
는 아래의 [수학식 7]과 같이 계산된다.here,
Figure 112007046536094-pat00038
Denotes a subband sampling frequency. For example, T = 40 ms can be used. In the following,
Figure 112007046536094-pat00039
Denotes short-time averaging. if
Figure 112007046536094-pat00040
And
Figure 112007046536094-pat00041
If is not given,
Figure 112007046536094-pat00042
And
Figure 112007046536094-pat00043
Needs to be generated in the additional information generation unit 206.
Figure 112007046536094-pat00044
Because of,
Figure 112007046536094-pat00045
Is calculated as shown in Equation 7 below.

Figure 112007046536094-pat00046
Figure 112007046536094-pat00046

유사하게,

Figure 112007046536094-pat00047
는 아래의 [수학식 8]과 같이 계산된다.Similarly,
Figure 112007046536094-pat00047
Is calculated as shown in Equation 8 below.

Figure 112007046536094-pat00048
Figure 112007046536094-pat00048

도 3은 본 발명의 일 실시예에 따른 오디오 신호를 처리하기 위한 도메인을 도시한다. 전술한 것처럼, 오디오 신호 및 부가 정보는 도 3에 도시된 것과 같은 시간-주파수 도메인의 서브밴드별 신호로서 처리된다. 상기 시간-주파수 도메인의 서브밴드별 신호는 지각적으로 유도된다. 예를 들면, 약 20ms의 길이를 가지는 사인파 분석창 및 통합창(sine analysis and synthesis window)을 가지는 STFT(Short Time Fourier transform)를 이용하여 서브밴드별 신호를 생성할 수 있다. 이때, STFT 계수들은 하나의 그룹이 ERB(equivalent rectangular bandwidth)의 약 2배가 되는 대역폭을 갖도록 그룹화될 수 있다. 3 illustrates a domain for processing an audio signal according to an embodiment of the present invention. As mentioned above, the audio signal and the additional information are processed as subband-specific signals in the time-frequency domain as shown in FIG. Subband-specific signals in the time-frequency domain are perceptually derived. For example, a signal for each subband may be generated by using a short time fourier transform (STFT) having a sine wave analysis window and a sine analysis and synthesis window having a length of about 20 ms. In this case, the STFT coefficients may be grouped such that one group has a bandwidth that is about twice the equivalent rectangular bandwidth (ERB).

도 4는 본 발명의 일 실시예에 따른 제2 리믹스 신호 인코딩 장치에 대한 블록도이다. 상기 제2 리믹스 신호 인코딩 장치는 다운믹싱부(402), 부가정보생성부(403) 및 부가정보인코딩부(406)을 포함한다.4 is a block diagram of a second remix signal encoding apparatus according to an embodiment of the present invention. The second remix signal encoding apparatus includes a downmixing unit 402, an additional information generating unit 403, and an additional information encoding unit 406.

도 4를 참조하면, 다운믹싱부(402)는 복수의 소스 신호들(401)을 더하여 하나의 합 신호(sum signal)(404)을 생성한다. 제2 리믹스 신호 인코딩 장치는 제1 리믹스 신호 인코딩 장치와는 달리, 스테레오 신호를 전송하는 대신에 상기 합 신호(404)를 전송한다. 부가정보생성부(403)는 상기 소스 신호들(401)을 이용하여 부가 정보(405)를 생성한다. 상기 부가 정보(405)는 각 소스 신호에 대응하는 서브밴 드 파워 및 게인 팩터를 포함한다. 또한, 상기 부가 정보(405)는 리믹스 렌더링부에서의 딜레이에 대응하는 파라미터를 포함할 수 있다. 제1 리믹스 신호 인코딩 장치에서와 유사하게, 상기 부가 정보(405)는 양자화 및 부호화에 더 적합한 다른 값으로 변환되어 전송될 수 있다. 부가정보인코딩부(406)는 생성된 부가 정보(405)를 이용하여 부호화된 부가 정보 신호(407)를 생성한다. 생성된 상기 합 신호(404) 및 부가 정보 신호(407)는 디코딩 장치로 전송된다. 본 발명은 또한 다운믹싱부(402)를 가지지 않는 인코딩 장치를 포함한다. 이 경우에, 소스 신호들(401)은 합 신호(404)로 변환되지 않고, 각 소스 신호들(401)이 직접 전송된다.Referring to FIG. 4, the downmixing unit 402 generates a sum signal 404 by adding a plurality of source signals 401. Unlike the first remix signal encoding apparatus, the second remix signal encoding apparatus transmits the sum signal 404 instead of the stereo signal. The additional information generator 403 generates the additional information 405 using the source signals 401. The additional information 405 includes a subband power and a gain factor corresponding to each source signal. In addition, the additional information 405 may include a parameter corresponding to a delay in the remix renderer. Similar to the first remix signal encoding apparatus, the additional information 405 may be converted into another value more suitable for quantization and encoding and transmitted. The additional information encoding unit 406 generates an encoded additional information signal 407 using the generated additional information 405. The generated sum signal 404 and the side information signal 407 are transmitted to the decoding apparatus. The present invention also includes an encoding apparatus that does not have a downmixing unit 402. In this case, the source signals 401 are not converted to the sum signal 404, and each source signal 401 is transmitted directly.

도 5는 본 발명의 일 실시예에 따른 제1 리믹스 신호 디코딩 장치에 대한 블록도이다. 상기 제1 리믹스 신호 디코딩 장치는 부가정보디코딩부(503) 및 리믹스 렌더링부(505)를 포함한다.5 is a block diagram of an apparatus for decoding a first remix signal according to an embodiment of the present invention. The first remix signal decoding apparatus includes a side information decoder 503 and a remix renderer 505.

도 5를 참조하면, 믹스 신호(501) 및 부가 정보 신호(502)가 제1 리믹스 신호 디코딩 장치에 입력된다. 상기 믹스 신호(501)는 모노, 스테레오 또는 멀티채널 오디오 신호가 될 수 있다. 부가정보디코딩부(503)는 부가 정보 신호(502)를 디코딩하여 부가 정보(504)를 생성한다. 상기 부가 정보(504)는 전송된 오디오 신호(501)에 포함된 소스 신호들의 게인 팩터 및 서브밴드 파워 등을 포함한다. 리믹스 렌더링부(505)에는 사용자가 직접 제공하는 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(user-mix parameter, 506)가 입력될 수 있다. 리믹스 렌더링부(505)는 믹스 신호(501), 전송된 부가 정보(504) 및 사용자 믹스 파라미터(506)를 이용하여 리믹스 신호(507)를 생성한다. 상기 리믹스 신호를 생성하는 방법에 관한 구체적인 설명은 도 6에서 후술한다. 리믹스 신호(507)는 전송된 믹스 신호의 채널 수와 동일한 채널 수를 가지는 동채널 믹스 신호(Eq-channel mix signal)로 생성되거나, 또는 믹스 신호의 채널 수보다 많은 채널 수를 가지는 업채널 믹스 신호(Up-channel mix signal)로 생성될 수 있다.Referring to FIG. 5, the mix signal 501 and the additional information signal 502 are input to the first remix signal decoding apparatus. The mix signal 501 may be a mono, stereo or multichannel audio signal. The additional information decoding unit 503 decodes the additional information signal 502 to generate additional information 504. The additional information 504 includes a gain factor and subband power of source signals included in the transmitted audio signal 501. The remix renderer 505 may input a user-mix parameter 506 generated using control information directly provided by the user. The remix renderer 505 generates the remix signal 507 using the mix signal 501, the transmitted additional information 504, and the user mix parameter 506. A detailed description of the method of generating the remix signal will be described later with reference to FIG. 6. The remix signal 507 is generated as an Eq-channel mix signal having the same number of channels as the number of channels of the transmitted mix signal, or an upchannel mix signal having more channels than the number of channels of the mix signal. (Up-channel mix signal) can be generated.

도 6은 스테레오 신호를 이용하는 경우, 도 5의 제1 리믹스 신호 디코딩 장치에 대한 상세도이다. 전술한 것처럼, 전송된 믹스 신호는 모노, 스테레오 및 멀티채널 오디오 신호가 될 수 있으나, 편의상 스테레오 신호(601)를 기준으로 설명한다. FIG. 6 is a detailed diagram of the first remix signal decoding apparatus of FIG. 5 when using a stereo signal. As described above, the transmitted mixed signal may be a mono, stereo, and multichannel audio signal, but for convenience, the stereo signal 601 will be described.

도 6을 참조하면, 스테레오 신호(601)는 필터뱅크(603)을 통하여 시간-주파수 도메인의 서브밴드별 신호(604)로 분해된다. 도 6에 도시된 것처럼, 특정한 주파수에서의 서브밴드별 신호(604)은

Figure 112007046536094-pat00049
Figure 112007046536094-pat00050
로 표현된다. 부가정보디코딩부(605)는 전송된 부가 정보 신호(602)를 복호화하여, 서브밴드별 부가 정보(606)를 생성한다. 또한, 리믹스 렌더링부(607)에 사용자가 제공하는 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(608)가 입력될 수 있으며, 상기 사용자 믹스 파라미터(608)는 서브밴드별로 제공될 수 있다. 전술한 것처럼, 상기 부가 정보(606)는 리믹스 될 M개의 소스 신호에 대한 서브밴드별 게인 팩터(
Figure 112007046536094-pat00051
Figure 112007046536094-pat00052
) 및
Figure 112007046536094-pat00053
로 표현되는 서브밴드 파워를 포함한다. 리믹스 렌더링부(607)는 서브밴드별로 생성된 스테레오 신호(604), 전송된 부가 정보(606) 및 사 용자 믹스 파라미터(608)를 이용하여, 서브밴드별 리믹스 신호(609),
Figure 112007046536094-pat00054
Figure 112007046536094-pat00055
를 생성한다. 상기 리믹스 신호(609)를 생성하는 방법은 아래에서 더욱 상세하게 기술된다. 상기 리믹스 신호(609)는 역필터뱅크(610)를 통해 시간 도메인(time domain)의 스테레오 신호(611),
Figure 112007046536094-pat00056
Figure 112007046536094-pat00057
로 변환된다. Referring to FIG. 6, the stereo signal 601 is decomposed into a subband-specific signal 604 in the time-frequency domain through the filter bank 603. As shown in FIG. 6, the subband-specific signal 604 at a particular frequency
Figure 112007046536094-pat00049
And
Figure 112007046536094-pat00050
It is expressed as The additional information decoding unit 605 decodes the transmitted additional information signal 602 to generate additional information 606 for each subband. In addition, a user mix parameter 608 generated using control information provided by a user may be input to the remix renderer 607, and the user mix parameter 608 may be provided for each subband. As described above, the additional information 606 is a subband-specific gain factor for M source signals to be remixed.
Figure 112007046536094-pat00051
And
Figure 112007046536094-pat00052
) And
Figure 112007046536094-pat00053
It includes the subband power represented by. The remix rendering unit 607 uses the stereo signal 604 generated for each subband, the additional information 606 transmitted, and the user mix parameter 608, and the remix signal 609 for each subband,
Figure 112007046536094-pat00054
And
Figure 112007046536094-pat00055
Create The method of generating the remix signal 609 is described in more detail below. The remix signal 609 is a stereo signal 611 in the time domain through the inverse filter bank 610,
Figure 112007046536094-pat00056
And
Figure 112007046536094-pat00057
Is converted to.

리믹스 렌더링부(607)에서 생성된 리믹스 신호(609)를 생성하는 방법은 다음과 같다. 상기 [수학식 1] 및 [수학식 2]는 서브밴드별 신호(604 및 609)에 대해서도 유효하다. 이 경우에, 소스 신호

Figure 112007046536094-pat00058
는 서브밴드별 소스 신호
Figure 112007046536094-pat00059
로 교체된다. 즉, 서브밴드별 믹스 신호(604)는 아래의 [수학식 9]과 같이 표현될 수 있다. A method of generating the remix signal 609 generated by the remix renderer 607 is as follows. [Equation 1] and [Equation 2] are also valid for the subband signals 604 and 609. In this case, the source signal
Figure 112007046536094-pat00058
Is the subband-specific source signal
Figure 112007046536094-pat00059
Is replaced by. That is, the mix signal 604 for each subband may be expressed by Equation 9 below.

Figure 112007046536094-pat00060
Figure 112007046536094-pat00060

서브밴드별 리믹스 신호(609)는 아래의 [수학식 10]과 같이 표현될 수 있다. The subband remix signal 609 may be expressed by Equation 10 below.

Figure 112007046536094-pat00061
Figure 112007046536094-pat00061

리믹스 신호(609)를 생성하기 위해, 최소자승추정법(least squares estimation)이 이용될 수 있다. 서브밴드별 믹스 신호(604),

Figure 112007046536094-pat00062
Figure 112007046536094-pat00063
가 주어지면, 아래의 [수학식 11]와 같이 서로 다른 게인들을 가지는 서브밴드별 리믹스 신호(609)가 상기 서브밴드별 믹스 신호(604)의 선형 조합으로 추정될 수 있다.To generate the remix signal 609, least squares estimation may be used. Per subband mix signal 604,
Figure 112007046536094-pat00062
And
Figure 112007046536094-pat00063
Given by Equation 11 below, the subband remix signal 609 having different gains may be estimated as a linear combination of the subband mix signals 604.

Figure 112007046536094-pat00064
Figure 112007046536094-pat00064

여기서,

Figure 112007046536094-pat00065
,
Figure 112007046536094-pat00066
,
Figure 112007046536094-pat00067
Figure 112007046536094-pat00068
는 가중 팩터들(weighting factors)이다. 이때, 생성되는 추정 에러(estimation error)는 아래의 [수학식 12]과 같이 정의될 수 있다.here,
Figure 112007046536094-pat00065
,
Figure 112007046536094-pat00066
,
Figure 112007046536094-pat00067
And
Figure 112007046536094-pat00068
Is the weighting factors. In this case, the generated estimation error may be defined as shown in Equation 12 below.

Figure 112007046536094-pat00069
Figure 112007046536094-pat00069

상기 가중 팩터들,

Figure 112007046536094-pat00070
,
Figure 112007046536094-pat00071
,
Figure 112007046536094-pat00072
Figure 112007046536094-pat00073
는 평균제곱오차(mean square error),
Figure 112007046536094-pat00074
Figure 112007046536094-pat00075
가 최소가 되도록 서브밴드별로 생성될 수 있다. 이때, 추정 에러,
Figure 112007046536094-pat00076
Figure 112007046536094-pat00077
Figure 112007046536094-pat00078
Figure 112007046536094-pat00079
에 직교(orthogonal)될 때, 상기 평균제곱오차가 최소가 된다는 것을 이용할 수 있다. 생성되는
Figure 112007046536094-pat00080
Figure 112007046536094-pat00081
는 아래의 [수학식 13]과 같이 표현될 수 있다.The weighting factors,
Figure 112007046536094-pat00070
,
Figure 112007046536094-pat00071
,
Figure 112007046536094-pat00072
And
Figure 112007046536094-pat00073
Is the mean square error,
Figure 112007046536094-pat00074
And
Figure 112007046536094-pat00075
May be generated for each subband such that is minimized. In this case, the estimation error,
Figure 112007046536094-pat00076
And
Figure 112007046536094-pat00077
end
Figure 112007046536094-pat00078
And
Figure 112007046536094-pat00079
When orthogonal to, it can be used that the mean square error is minimized. Generated
Figure 112007046536094-pat00080
And
Figure 112007046536094-pat00081
May be expressed as Equation 13 below.

Figure 112007046536094-pat00082
Figure 112007046536094-pat00082

여기서,

Figure 112007046536094-pat00083
,
Figure 112007046536094-pat00084
Figure 112007046536094-pat00085
는 직접 생성될 수 있지만,
Figure 112007046536094-pat00086
Figure 112007046536094-pat00087
은 전송된 부가 정보(606)(예를 들면,
Figure 112007046536094-pat00088
,
Figure 112007046536094-pat00089
,
Figure 112007046536094-pat00090
) 및 사용자가 제공하는 제어 정보(608)(예를 들면, 게인 팩터
Figure 112007046536094-pat00091
Figure 112007046536094-pat00092
)를 이용하여, 아래의 [수학식 14]와 같이 생성될 수 있다.here,
Figure 112007046536094-pat00083
,
Figure 112007046536094-pat00084
And
Figure 112007046536094-pat00085
Can be generated directly,
Figure 112007046536094-pat00086
And
Figure 112007046536094-pat00087
Is transmitted additional information 606 (e.g.,
Figure 112007046536094-pat00088
,
Figure 112007046536094-pat00089
,
Figure 112007046536094-pat00090
) And control information 608 provided by the user (e.g., gain factor
Figure 112007046536094-pat00091
And
Figure 112007046536094-pat00092
) Can be generated as shown in Equation 14 below.

Figure 112007046536094-pat00093
Figure 112007046536094-pat00093

유사하게,

Figure 112007046536094-pat00094
Figure 112007046536094-pat00095
가 아래의 [수학식 15]와 같이 생성될 수 있다.Similarly,
Figure 112007046536094-pat00094
And
Figure 112007046536094-pat00095
May be generated as shown in Equation 15 below.

Figure 112007046536094-pat00096
Figure 112007046536094-pat00096

여기서,

Figure 112007046536094-pat00097
Figure 112007046536094-pat00098
는 아래의 [수학식 16]과 같이 표현될 수 있다. here,
Figure 112007046536094-pat00097
And
Figure 112007046536094-pat00098
May be expressed as Equation 16 below.

Figure 112007046536094-pat00099
Figure 112007046536094-pat00099

만일, 상기 믹스 신호(604)의 위상이 서로 동기되거나(coherent) 또는 거의 동기화된다면, 아래의 [수학식 17]와 같이 표현되는 값이 1에 근접하게 된다.If the phases of the mix signal 604 are coherent or nearly synchronized with each other, a value expressed by Equation 17 below approaches 1.

Figure 112007046536094-pat00100
Figure 112007046536094-pat00100

이때, 상기 가중치들은 아래의 [수학식 18]과 같이 표현될 수 있다. In this case, the weights may be expressed as Equation 18 below.

Figure 112007046536094-pat00101
Figure 112007046536094-pat00101

이와 같이 생성된 서브밴드별 리믹스 신호(609)는 전술한 것처럼 역필터뱅크(610)를 통해 시간-도메인의 리믹스 신호(611)로 변환된다. 상기 리믹스 신호(611)는 사용자가 제공한 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(

Figure 112007046536094-pat00102
Figure 112007046536094-pat00103
)를 이용하여 각각의 소스 신호를 독립적으로 리믹스하여 생성된 리믹스 신호와 유사하게 들린다.The subband remix signal 609 generated as described above is converted into the remix signal 611 of the time-domain through the inverse filter bank 610 as described above. The remix signal 611 may generate a user mix parameter generated using control information provided by a user.
Figure 112007046536094-pat00102
And
Figure 112007046536094-pat00103
It sounds similar to the remix signal generated by independently remixing each source signal with

지금까지는 2채널 스테레오 신호의 리믹싱에 초점을 맞추었다. 그러나, 전술한 것처럼 본 발명은 스테레오 신호에 제한되지 않고, 멀티채널 오디오 신호, 예를 들면 5.1채널 오디오 신호를 리믹싱하는 것까지 확대될 수 있다. 당업자들은 본 명세서에서 기술된 스테레오 신호와 유사하게, 멀티채널 오디오 신호를 리믹싱할 수 있다. 이 경우에, [수학식 11]는 아래의 [수학식 19]과 같이 쓰여질 수 있다.So far, the focus has been on remixing two-channel stereo signals. However, as described above, the present invention is not limited to stereo signals, but may be extended to remixing multichannel audio signals, for example, 5.1 channel audio signals. Those skilled in the art can remix multichannel audio signals, similar to the stereo signals described herein. In this case, Equation 11 may be written as Equation 19 below.

Figure 112007046536094-pat00104
Figure 112007046536094-pat00104

선택적으로, 믹스 신호의 채널들 중 특정한 채널은 리믹스하지 않고 남겨두도록 할 수 있다. 예를 들면, 5.1 서라운드 채널에 대하여, 2개의 뒤쪽 채널은 수정하지 않고, 앞쪽 채널에만 리믹싱을 적용하도록 할 수 있다. 이 경우에, 2 또는 3채널 리믹싱 알고리즘이 앞쪽 채널에 적용된다.Optionally, one of the channels of the mix signal can be left without remixing. For example, for a 5.1 surround channel, it is possible to apply remixing only to the front channel without modifying the two back channels. In this case, a two or three channel remix algorithm is applied to the front channel.

도 7은 본 발명의 일 실시예에 따른 제2 리믹스 신호 디코딩 장치에 대한 블록도이다. 상기 제2 리믹스 신호 디코딩 장치는 부가정보디코딩부(703), 공간정보 통합부(705) 및 리믹스 렌더링부(707)를 포함한다.7 is a block diagram of a second remix signal decoding apparatus according to an embodiment of the present invention. The second remix signal decoding apparatus includes a side information decoding unit 703, a spatial information integrating unit 705, and a remixing rendering unit 707.

도 7을 참조하면, 소스 신호들의 합 신호(701) 및 부가 정보 신호(702)가 제2 리믹스 신호 디코딩 장치로 입력된다. 부가정보디코딩부(703)는 부가 정보 신호(702)를 디코딩하여, 부가 정보(704)를 생성한다. 상기 부가 정보(704)는 게인 팩터, 딜레이 상수 및 서브밴드 파워 등을 포함한다. 부가정보통합부(705)는 상기 부가 정보(704)를 이용하여, 상기 합 신호(701)를 복수의 소스 신호들(706)로 분리한다. 리믹스 렌더링부(707)는 상기 소스 신호들(706)을 이용하여 리믹스 신호(709)를 생성할 수 있다. 이때, 상기 리믹스 렌더링부(707)는 부가 정보로 전송된 믹스 파라미터를 이용하여 리믹스 신호(709)를 생성할 수 있다. 또한, 상기 리믹스 렌더링부(707)는 선택적으로 사용자가 제공하는 제어 정보를 이용하여 생성된 사용자 믹스 파라미터(708)를 이용하여 리믹스 신호(709)를 생성할 수 있다.Referring to FIG. 7, the sum signal 701 of the source signals and the additional information signal 702 are input to the second remix signal decoding apparatus. The additional information decoding unit 703 decodes the additional information signal 702 to generate additional information 704. The additional information 704 includes a gain factor, a delay constant, a subband power, and the like. The additional information integrator 705 separates the sum signal 701 into a plurality of source signals 706 by using the additional information 704. The remix renderer 707 may generate the remix signal 709 using the source signals 706. In this case, the remix renderer 707 may generate the remix signal 709 using the mix parameter transmitted as additional information. In addition, the remix renderer 707 may selectively generate the remix signal 709 using the user mix parameter 708 generated by using control information provided by the user.

도 8A는 통상적인 인코딩 장치 및 본 발명의 일 실시예에 따른 리믹스 신호 인코딩 장치의 결합을 나타내는 블록도이다. 믹스 신호(801)는 통상적인 인코딩 장치(803)에 의해 부호화되어, 부호화된 믹스 신호(805)로 변환될 수 있다. 상기 믹스 신호(801)는 채널별 신호 또는 소스 신호가 될 수 있다. 상기 통상적인 인코딩 장치(803)는 AAC, MP3 인코더 등과 같은 종래의 인코딩 장치뿐만 아니라, 앞으로 개발될 인코딩 장치를 포함한다. 본 발명에 따른 리믹스 신호 인코딩 장치(804)는 상기 믹스 신호(801) 및 상기 믹스 신호에 포함되는 소스 신호(802)를 이용하여 부가 정보 신호(806)를 생성한다. 다중화부(807)는 부호화된 믹스 신호(805) 및 부가 정보 신호(806)를 이용하여 비트스트림(808)을 생성한다. 전술한 것처럼, 상기 부 가 정보 신호(806)는 종래 장치들과 호환성을 가지도록, 종래 믹스 신호 포맷 내의 보조 데이터 영역에 삽입될 수 있다.8A is a block diagram illustrating a combination of a conventional encoding apparatus and a remix signal encoding apparatus according to an embodiment of the present invention. The mixed signal 801 may be encoded by the conventional encoding apparatus 803 and converted into the encoded mixed signal 805. The mix signal 801 may be a channel-specific signal or a source signal. The conventional encoding device 803 includes not only conventional encoding devices such as AAC, MP3 encoder, etc., but also encoding devices to be developed in the future. The remix signal encoding apparatus 804 according to the present invention generates the additional information signal 806 using the mixed signal 801 and the source signal 802 included in the mixed signal. The multiplexer 807 generates the bitstream 808 using the encoded mix signal 805 and the side information signal 806. As described above, the additional information signal 806 may be inserted into an auxiliary data area in the conventional mix signal format so as to be compatible with conventional devices.

도 8B는 통상적인 디코딩 장치 및 본 발명의 일 실시예에 따른 리믹스 신호 디코딩 장치의 결합에 대한 블록도이다. 역다중화부(810)는 전송된 비트스트림(809)으로부터 부호화된 믹스 신호(811) 및 부가 정보 신호(812)를 분리한다. 그 다음에, 통상적인 디코딩 장치(813)는 상기 부호화된 믹스 신호(811)를 디코딩하여, 본 발명에 따른 리믹스 신호 디코딩 장치(815)에서 이용될 수 있는 믹스 신호(814)를 생성한다. 상기 통상적인 디코딩 장치(813)는 AAC, MP3 디코더 등과 같은 종래의 인코딩 장치뿐만 아니라, 앞으로 개발될 인코딩 장치를 포함한다. 상기 믹스 신호(814)는 채널별 신호 또는 소스 신호가 될 수 있다. 본 발명에 따른 리믹스 신호 디코딩 장치(817)는 부가 정보 신호(812) 및 사용자 믹스 파라미터(817) 중 적어도 하나를 이용하여 상기 믹스 신호(814)를 리믹스 신호(816)로 변환할 수 있다. 8B is a block diagram of a combination of a conventional decoding device and a remix signal decoding device according to an embodiment of the present invention. The demultiplexer 810 separates the encoded mix signal 811 and the side information signal 812 from the transmitted bitstream 809. The conventional decoding device 813 then decodes the encoded mix signal 811 to produce a mix signal 814 that can be used in the remix signal decoding device 815 according to the present invention. The conventional decoding device 813 includes not only conventional encoding devices such as AAC, MP3 decoder, etc., but also encoding devices to be developed in the future. The mix signal 814 may be a channel-specific signal or a source signal. The remix signal decoding apparatus 817 according to the present invention may convert the mix signal 814 into the remix signal 816 using at least one of the additional information signal 812 and the user mix parameter 817.

도 9는 본 발명의 일 실시예에 따른 리믹스 신호 디코딩 장치에 상세 블록도이다. 도 9를 참조하면, 리믹스 신호 디코딩 장치는 믹스신호디코딩부(901), 파라미터생성부(902), 및 리믹스렌더링부(908)를 포함한다. 선택적으로 이펙터(Effecter, 911)를 포함할 수 있다. 상기 파라미터생성부(902)는 블라인드믹스 파라미터생성부(903), 사용자믹스파라미터생성부(904), 및 리믹스파라미터생성부(905)를 포함할 수 있다. 상기 리믹스파라미터생성부(905)는 이퀴믹스파라미터생성부(906)를 포함하며, 선택적으로 업믹스파라미터생성부(907)를 포함할 수 있다. 또한, 상기 리믹스렌더링부(908)는 이퀴믹스렌더링부(909)를 포함하며, 선택적으로 업믹스렌더링부(910)를 포함할 수 있다.9 is a detailed block diagram of a remix signal decoding apparatus according to an embodiment of the present invention. Referring to FIG. 9, the remix signal decoding apparatus includes a mixed signal decoder 901, a parameter generator 902, and a remix renderer 908. It may optionally include an effector (911). The parameter generator 902 may include a blind mix parameter generator 903, a user mix parameter generator 904, and a remix parameter generator 905. The remix parameter generation unit 905 may include an equimix parameter generation unit 906 and may optionally include an upmix parameter generation unit 907. In addition, the remix renderer 908 may include an equimix renderer 909 and optionally include an upmix renderer 910.

상기 믹스신호디코딩부(901)는 인코딩 단에서 전송된 부호화된 믹스 신호를 디코딩하여 믹스 신호를 생성한다. 상기 파라미터생성부(902)는 인코딩 단에서 전송된 부가 정보 및 사용자 제어정보(또는, 구성정보)를 수신한다. 상기 사용자 제어정보는 인코더 단에서 전송되지 않고, 디코더 단에서 생성될 수 있다. 상기 사용자믹스파라미터생성부(904)는 사용자 제어정보를 이용하여 사용자 믹스 파라미터를 생성한다. 인코더 단에서 전송된 부가 정보에는 인코더 믹스 파라믹터(Encoder Mix Parameter)가 포함될 수 있다. 또한, 상기 블라인드믹스파라미터생성부(903)는 상기 믹스 신호를 이용하여 블라인드 믹스 파라미터(Blind-Mix Parameter)를 생성할 수 있다. 상기 인코더 믹스 파라미터와 상기 블라인드 믹스 파라미터는 택일적으로 리믹스파라미터생성부(905)로 입력된다.The mixed signal decoding unit 901 decodes the encoded mixed signal transmitted from the encoding end to generate a mixed signal. The parameter generator 902 receives additional information and user control information (or configuration information) transmitted from an encoding stage. The user control information is not transmitted at the encoder stage but may be generated at the decoder stage. The user mix parameter generator 904 generates a user mix parameter by using user control information. The additional information transmitted from the encoder stage may include an encoder mix parameter. In addition, the blind mix parameter generator 903 may generate a blind mix parameter using the mix signal. The encoder mix parameter and the blind mix parameter are alternatively input to the remix parameter generator 905.

상기 리믹스파라미터생성부(905)는 부가 정보 및 사용자 믹스 파라미터를 이용하여 리믹스 파라미터를 생성한다. 상기 리믹스 파라미터는 리믹스 신호의 채널에 적용될 수 있도록 생성될 수 있다. 리믹스파라미터생성부(905)에 포함되는 이퀴믹스파라미터생성부(906)는 믹스 신호의 채널 수와 동일한 채널 수를 가지는 리믹스 신호를 생성하는데 이용되는 리믹스 파라미터를 생성하고, 상기 리믹스파라미터생성부(905)에 포함될 수 있는 업믹스파라미터생성부(907)는 믹스 신호의 채널 수보다 더 많은 채널 수를 가지는 리믹스 신호를 생성하는데 이용되는 리믹스 파라미터를 생성한다. 상기 리믹스 파라미터는 리믹스렌더링부(908)에 입력된다.The remix parameter generator 905 generates a remix parameter using additional information and a user mix parameter. The remix parameter may be generated to be applied to a channel of the remix signal. Equimix parameter generation unit 906 included in the remix parameter generation unit 905 generates a remix parameter used to generate a remix signal having the same channel number as the number of channels of the mix signal, the remix parameter generation unit 905 The upmix parameter generation unit 907, which may be included in the control unit, generates a remix parameter used to generate a remix signal having a larger number of channels than the number of channels of the mixed signal. The remix parameter is input to the remix renderer 908.

상기 리믹스렌더링부(908)에 포함되는 이퀴믹스렌더링부(909)는 상기 리믹스 파라미터 및 믹스 신호를 이용하여, 상기 믹스 신호의 채널 수와 동일한 채널 수를 가지는 이퀴채널 리믹스 신호(Eq-channel remix signal)를 생성한다. 상기 리믹스렌더링부(908)에 포함될 수 있는 업믹스렌더링부(910)는 상기 업믹스파라미터생성부(907)에서 생성된 리믹스 파라미터 및 믹스 신호를 이용하여, 상기 믹스 신호의 채널 수보다 더 많은 채널 수를 가지는 업채널 리믹스 신호(Up-channel remix signal)를 생성한다. 상기 업믹스렌더링부(910)는 상기 이퀴채널렌더링부(909)에서 생성된 리믹스 신호를 이용하여 업채널 리믹스 신호를 생성할 수도 있다. Equimix renderer 909 included in the remix renderer 908, using the remix parameter and the mix signal, having an equal number of channels equal to the number of channels of the mix signal (Eq-channel remix signal ) The upmix renderer 910, which may be included in the remix renderer 908, uses more channels than the number of channels of the mix signal by using the remix parameter and the mix signal generated by the upmix parameter generator 907. Generate an up-channel remix signal having a number. The upmix renderer 910 may generate an upchannel remix signal using the remix signal generated by the Equichannel renderer 909.

따라서, 상기 디코딩 장치는 인코딩 단에서 전송한 믹스 신호를 그대로 출력하거나, 이퀴채널 리믹스 신호로 출력하거나, 또는 업채널 리믹스 신호로 출력할 수 있다. 선택적으로 상기 리믹스 렌더링부는 이펙터(911)로부터 제공되는 정보를 이용하여, 상기 리믹스 신호에 다양한 효과를 줄 수 있다.Accordingly, the decoding apparatus may output the mixed signal transmitted from the encoding stage as it is, output as an equal channel remix signal, or output as an up channel remix signal. Optionally, the remix renderer may give various effects to the remixed signal by using information provided from the effector 911.

도 10은 본 발명의 일실시예에 따른 인코딩 장치에 대한 블록도이다. 도 10을 참조하면, 상기 인코딩 장치는 부가정보처리부(1003)를 포함한다. 상기 인코딩 장치는 믹스 신호(1001)를 직접 디코딩 장치로 전송할 수도 있으나, 믹스 신호(1001)가 복수인 경우는 믹스 신호(1001)를 하나 또는 두 개의 다운믹스 신호로 다운믹싱하여 전송할 수도 있다. 도면에는 도시되지 않았으나, 믹스 신호의 전송 효율을 위해 믹스 신호(1001)는 부호화되어 전송될 수 있다.10 is a block diagram of an encoding apparatus according to an embodiment of the present invention. Referring to FIG. 10, the encoding apparatus includes an additional information processing unit 1003. The encoding apparatus may directly transmit the mixed signal 1001 to the decoding apparatus. However, when there are a plurality of the mixed signals 1001, the encoding apparatus 100 may downmix the mixed signal 1001 into one or two downmix signals and transmit the mixed signals 1001. Although not shown in the drawing, the mix signal 1001 may be encoded and transmitted for transmission efficiency of the mix signal.

부가정보처리부(1003)는 믹스 신호(1001) 및 소스 신호(1002)를 이용하여 부가 정보를 생성한다. 소스 신호(1002)는 믹스 신호(1001)에 포함되어 있거나 또는 믹스 신호(1001)에 포함되어 있지 않은 별개의 소스 신호일 수 있다. 상기 부가 정보는 레벨 정보, 시간 지연 정보, 상호 상관 정보, 믹스 정보 등을 포함한다.The additional information processing unit 1003 generates additional information using the mix signal 1001 and the source signal 1002. The source signal 1002 may be included in the mix signal 1001 or may be a separate source signal that is not included in the mix signal 1001. The additional information includes level information, time delay information, cross correlation information, mix information, and the like.

여기서, 레벨 정보는 리믹스될 소스 신호의 레벨을 포함할 수 있고, 리믹스될 소스 신호들간의 상대적인 레벨이나, 또는 리믹스될 소스 신호와 믹스 신호간의 상대적인 레벨을 포함할 수 있다. 또한, 믹스 신호의 레벨을 따로 부가 정보에 포함시킬 수 있다. 시간 지연 정보는 리믹스될 소스 신호들간의 시간 지연 정보, 또는 리믹스될 소스 신호와 믹스 신호간의 시간 지연 정보를 포함할 수 있다. 상호 상관 정보는 리믹스될 소스 신호들간의 상호 상관 정보, 또는 리믹스될 소스 신호와 믹스 신호간의 상호 상관 정보, 믹스 신호들 간의 상호 상관 정보를 포함할 수 있다. 믹스 정보는 특정 소스가 믹스 신호에 믹스되는 정도를 나타내는 정보로서, 예를 들면, 특정 소스가 오른쪽에 위치하는 효과가 나도록 믹스하고 싶은 경우, 왼쪽 채널보다 오른쪽 채널에 더 큰 크기로 포함되도록 믹스를 수행할 수 있다. 이와 같이 믹스 정보는 각 소스가 각 채널에 믹스되는 정도를 나타낼 수 있다. 믹스 정보는 크기뿐만 아니라, 믹스에 관련된 시간 지연, 상관 관계 등의 정보를 포함하는 것이 가능하다.Here, the level information may include the level of the source signal to be remixed, and may include a relative level between the source signals to be remixed or a relative level between the source signal and the mixed signal to be remixed. In addition, the level of the mix signal may be separately included in the additional information. The time delay information may include time delay information between the source signals to be remixed, or time delay information between the source signal and the mixed signal to be remixed. The cross-correlation information may include cross-correlation information between source signals to be remixed, cross-correlation information between a source signal and a mix signal to be remixed, and cross-correlation information between the mix signals. Mix information indicates how much of a particular source is mixed into the mix signal. For example, if you want to mix a particular source to the right, you can mix it so that the right channel is larger than the left channel. Can be done. As such, the mix information may indicate the degree to which each source is mixed to each channel. The mix information may include not only the size but also information such as time delay and correlation related to the mix.

디코딩 장치에서는 전송된 부가 정보와 믹스 신호를 이용하여 리믹스 신호를 생성한다. 이때, 사용자의 요구에 따라 특정 소스 신호를 더 크게 듣는다거나, 또는 더 작게 듣는 것이 가능하다. 또한, 특정한 효과를 얻기 위해, 특정 소스 신호의 소리 위치를 변경하는 것이 가능하다. 이와 같은 처리는 부가 정보와 믹스 신호를 통해 원래의 소스 신호들을 생성한 후, 리믹스 하는 과정을 통해 구성될 수 있 다. 또는, 원래의 소스 신호들을 생성하지 않고 부가 정보와, 사용자 제어 정보를 이용하여 믹스 신호에 변형을 가함으로써 리믹스 신호를 생성하는 것이 가능하다.The decoding apparatus generates a remix signal using the transmitted additional information and the mix signal. At this time, it is possible to hear a specific source signal louder or smaller according to the user's request. It is also possible to change the sound position of a particular source signal to achieve a particular effect. Such a process may be configured by generating original source signals through additional information and mixed signals and then remixing them. Alternatively, it is possible to generate the remix signal by modifying the mix signal using the additional information and the user control information without generating the original source signals.

부가정보처리부(1003)는 생성된 부가 정보를 변형할 수 있다. 즉, 부가정보처리부(1003)는 부가 정보를 정규화(normalization)하거나 또는 부가 정보 중 일부를 디폴트값으로 정함으로써 부가 정보량을 줄일 수 있다. 부가정보처리부(1003)는 변형된 부가 정보를 인코딩하여 디코딩 장치로 전송한다.The additional information processing unit 1003 may modify the generated additional information. That is, the additional information processing unit 1003 can reduce the amount of additional information by normalizing the additional information or setting some of the additional information as a default value. The additional information processing unit 1003 encodes the modified additional information and transmits the encoded additional information to the decoding apparatus.

도 11은 도 10의 인코딩 장치에 대한 상세 블록도이다. 도 11을 참조하면, 상기 인코딩 장치는 필터뱅크(1103) 및 부가정보처리부(1003)를 포함한다. 부가정보처리부(1003)는 부가정보생성부(1106), 부가정보변형부(1108) 및 부가정보인코딩부(1110)를 포함한다. 본 발명에서 믹스 신호는 모노, 스테레오 및 멀티채널 신호를 포함하며, 편의상 도 11에서는 믹스 신호(1101)를 기준으로 설명한다. 앞에서의 [수학식 1]과 같이, 믹스 신호(1101)

Figure 112007046536094-pat00105
Figure 112007046536094-pat00106
는 믹스 신호(1101)에 포함되는 소스 신호(1102)의 합으로 표현될 수 있다.FIG. 11 is a detailed block diagram of the encoding apparatus of FIG. 10. Referring to FIG. 11, the encoding apparatus includes a filter bank 1103 and an additional information processing unit 1003. The additional information processing unit 1003 includes an additional information generating unit 1106, an additional information modifying unit 1108, and an additional information encoding unit 1110. In the present invention, the mix signal includes mono, stereo, and multichannel signals, and for convenience, the mix signal 1101 will be described with reference to FIG. 11. As shown in Equation 1 above, the mix signal 1101
Figure 112007046536094-pat00105
And
Figure 112007046536094-pat00106
May be expressed as the sum of the source signals 1102 included in the mix signal 1101.

Figure 112007046536094-pat00107
Figure 112007046536094-pat00107

여기서, I는 믹스 신호 내에 포함되는 소스 신호들의 개수이고,

Figure 112007046536094-pat00108
은 소 스 신호들을 나타낸다.
Figure 112007046536094-pat00109
Figure 112007046536094-pat00110
는 각각의 소스 신호에 대한 진폭 패닝(amplitude panning) 및 게인(gain)을 결정하는 게인 팩터이다. 소스 신호(1102)는 서로 다른 게인 팩터들을 가지면서 믹스 신호(1101)에 믹스된다. 필터뱅크(1103)는 믹스 신호(1101) 및 소스 신호(1102)를 시간-주파수 도메인의 서브밴드별 신호(1104 및 1105)로 분해한다. 부가정보생성부(1106)는 서브밴드별 믹스 신호(1104) 및 서브밴드별 소스 신호(1105)를 이용하여, 게인 팩터
Figure 112007046536094-pat00111
,
Figure 112007046536094-pat00112
및 숏-타임 서브밴드 파워
Figure 112007046536094-pat00113
(1107) 등과 같은 서브밴드별 부가 정보를 생성한다.Here, I is the number of source signals included in the mix signal,
Figure 112007046536094-pat00108
Indicates source signals.
Figure 112007046536094-pat00109
And
Figure 112007046536094-pat00110
Is a gain factor that determines the amplitude panning and gain for each source signal. The source signal 1102 is mixed with the mix signal 1101 with different gain factors. The filter bank 1103 decomposes the mix signal 1101 and the source signal 1102 into subband-specific signals 1104 and 1105 in the time-frequency domain. The additional information generator 1106 uses a subband mixed signal 1104 and a subband source signal 1105 to obtain a gain factor.
Figure 112007046536094-pat00111
,
Figure 112007046536094-pat00112
And short-time subband power
Figure 112007046536094-pat00113
Subband-specific additional information such as 1107 is generated.

부가정보변형부(1108)는 상기 서브밴드별 부가 정보(1107)를 변형한다. 즉, 부가정보변형부(1108)는 서브밴드별 부가 정보(1107)를 새로운 게인 팩터 및 새로운 숏-타임 서브밴드 파워 등과 같은 새로운 부가 정보(1109)로 변형한다. 부가정보변형부(1108)는 새로운 부가 정보(1109)를 이용하여 표현되는 믹스 신호가 원래의 믹스 신호(1101)와 동일한 값을 갖도록 부가 정보를 변형한다. 즉, 게인 팩터와 소스 신호의 곱으로 표현되는 믹스 신호(1101)

Figure 112007046536094-pat00114
,
Figure 112007046536094-pat00115
를 값은 동일하나 새로운 게인 팩터와 새로운 소스 신 호를 이용하여
Figure 112007046536094-pat00116
,
Figure 112007046536094-pat00117
와 같이 표현할 수 있다. The additional information modifying unit 1108 transforms the additional information 1107 for each subband. That is, the side information transformation unit 1108 transforms the subband side information 1107 into new side information 1109 such as a new gain factor and a new short-time subband power. The side information transformation unit 1108 modifies the side information such that the mixed signal expressed using the new side information 1109 has the same value as the original mix signal 1101. That is, the mix signal 1101 is expressed as the product of the gain factor and the source signal.
Figure 112007046536094-pat00114
,
Figure 112007046536094-pat00115
Is the same, but using a new gain factor and a new source signal
Figure 112007046536094-pat00116
,
Figure 112007046536094-pat00117
It can be expressed as

이때, 새로운 게인 팩터

Figure 112007046536094-pat00118
,
Figure 112007046536094-pat00119
중 하나를 디폴트값으로 설정하면, 인코딩 장치는 디폴트값으로 설정된 게인 팩터를 전송할 필요가 없게 된다. 인코딩 장치는 부가 정보를 양자화 및 부호화에 더 적합한 다른 값으로 전환할 수도 있다. 부가정보인코딩부(1110)는 변형된 부가 정보(1109)를 인코딩하여 디코딩 장치로 전송하거나, 또는 변형된 부가 정보(1109)를 양자화 및 부호화에 적합한 값으로 전환한 후, 이를 인코딩하여 디코딩 장치로 전송한다. In this case, the new gain factor
Figure 112007046536094-pat00118
,
Figure 112007046536094-pat00119
If one of the default values is set, the encoding apparatus does not need to transmit the gain factor set to the default value. The encoding apparatus may convert the side information into another value more suitable for quantization and encoding. The additional information encoding unit 1110 encodes and transmits the modified additional information 1109 to the decoding apparatus, or converts the modified additional information 1109 to a value suitable for quantization and encoding, and then encodes the modified additional information 1109 to the decoding apparatus. send.

도 12는 본 발명의 일실시예에 따른 인코딩 장치의 블록도이다. 도 12를 참조하면, 인코딩 장치는 다운믹싱부(1202) 및 부가정보처리부(1003)를 포함하고, 상기 부가정보처리부(1003)는 부가정보생성부(1203), 부가정보변형부(1204) 및 부가정보인코딩부(1205)를 포함한다. 도 11에 도시된 인코딩 장치와 도 12에 도시된 인코딩 장치의 차이점은 부가 정보를 생성하기 위해 이용되는 정보에 있다. 도 11에 도시된 인코딩 장치는 소스 신호 및 믹스 신호를 이용하여 부가 정보를 생성하나, 도 12에 도시된 인코딩 장치는 소스 신호만을 이용하여 부가 정보를 생성한다.12 is a block diagram of an encoding apparatus according to an embodiment of the present invention. Referring to FIG. 12, the encoding apparatus includes a downmixing unit 1202 and an additional information processing unit 1003, and the additional information processing unit 1003 includes an additional information generation unit 1203, an additional information transformation unit 1204, and An additional information encoding unit 1205 is included. The difference between the encoding device shown in FIG. 11 and the encoding device shown in FIG. 12 lies in the information used to generate additional information. The encoding apparatus illustrated in FIG. 11 generates additional information using a source signal and a mix signal, but the encoding apparatus illustrated in FIG. 12 generates additional information using only a source signal.

상기 다운믹싱부(1202)는 소스 신호(1201)를 다운믹싱하여 디코딩 장치로 전 송한다. 부가정보처리부(1003)는 부가 정보를 생성하고 이를 인코딩하여 디코딩 장치로 전송한다. 상기 부가정보생성부(1203)는 소스 신호(1201) 전부 또는 일부를 이용하여 부가 정보를 생성할 수 있다. 상기 부가정보변형부(1204)는 부가정보생성부(1203)가 생성한 부가 정보를 전송 효율 등을 위해 새로운 부가 정보로 변형한다. 부가정보변형부(1204)는 변형된 부가 정보를 양자화 및 인코딩 등을 위해 적합한 값으로 전환할 수 있다. 상기 부가정보인코딩부(1205)는 변형된 부가 정보를 인코딩하여 디코딩 장치로 전송하거나, 또는 변형된 부가 정보를 양자화 등을 위해 전환한 후, 전환된 부가 정보를 인코딩하여 디코딩 장치로 전송한다.The downmixer 1202 downmixes the source signal 1201 and transmits the downmixed signal to the decoding apparatus. The additional information processing unit 1003 generates additional information, encodes it, and transmits the additional information to the decoding apparatus. The additional information generator 1203 may generate additional information by using all or part of the source signal 1201. The additional information transforming unit 1204 transforms the additional information generated by the additional information generating unit 1203 into new additional information for transmission efficiency. The side information transformation unit 1204 may convert the modified side information into a value suitable for quantization, encoding, and the like. The additional information encoding unit 1205 encodes the modified additional information and transmits the encoded additional information to the decoding apparatus, or converts the modified additional information for quantization, and then encodes the converted additional information and transmits the encoded additional information to the decoding apparatus.

도 13은 본 발명의 일실시예에 따른 부가정보처리부를 나타내는 블록도이다. 도 13을 참조하면, 부가정보처리부(1003)는 부가정보생성부(1301), 부가정보변형부(1302), 부가정보전환부(1303), 부가정보양자화부(1304) 및 부가정보인코딩부(1305)를 포함한다. 부가정보처리부(1003)는 부가 정보를 생성하고, 이를 처리하여 디코딩 장치로 전송한다. 부가정보처리부(1003)에 포함되어 있는 부가정보생성부(1301)는 믹스 신호 및 소스 신호 중 적어도 하나를 이용하여 부가 정보를 생성한다. 상기 부가 정보는 게인 팩터

Figure 112007046536094-pat00120
,
Figure 112007046536094-pat00121
및 숏-타임 서브밴드 파워
Figure 112007046536094-pat00122
를 포함한다. 부가정보변형부(1302)는 부가 정보를 변형하여 새로운 게인 팩터
Figure 112007046536094-pat00123
,
Figure 112007046536094-pat00124
및 새로운 숏-타임 서브밴드 파워
Figure 112007046536094-pat00125
등과 같은 새로운 부가 정보를 생성한다. 13 is a block diagram illustrating an additional information processing unit according to an embodiment of the present invention. Referring to FIG. 13, the additional information processing unit 1003 includes an additional information generation unit 1301, an additional information transformation unit 1302, an additional information conversion unit 1303, an additional information quantization unit 1304, and an additional information encoding unit ( 1305). The additional information processor 1003 generates additional information, processes the information, and transmits the additional information to the decoding apparatus. The additional information generation unit 1301 included in the additional information processing unit 1003 generates additional information using at least one of a mix signal and a source signal. The additional information is a gain factor
Figure 112007046536094-pat00120
,
Figure 112007046536094-pat00121
And short-time subband power
Figure 112007046536094-pat00122
It includes. The side information transformation unit 1302 transforms the side information to form a new gain factor.
Figure 112007046536094-pat00123
,
Figure 112007046536094-pat00124
And new short-time subband power
Figure 112007046536094-pat00125
Create new additional information such as

부가정보변형부(1108)는 부가 정보를 변형한다. 상기 부가 정보에 포함되는 레벨 정보는 다음과 같이 변형될 수 있다. 각 소스 신호의 레벨을 전송하기 위해

Figure 112007046536094-pat00126
, 또는
Figure 112007046536094-pat00127
을 전송한다. 여기서,
Figure 112007046536094-pat00128
은 i번째 소스 신호를 의미한다. 상기 소스 신호의 도메인은 시간 영역일 수 있고, 또는 서브밴드 도메인일 수 있다. 이와 같은 경우, 상기 레벨 값의 변화가 커서 양자화하는데 어려움을 격을 수 있다. 이를 해결하기 위해,
Figure 112007046536094-pat00129
와 같이 특정 소스 신호에 대한 상대적인 값을 전송하거나, 또는
Figure 112007046536094-pat00130
과 같이 믹스 신호의 레벨에 대한 상대적인 값을 전송할 수 있다. 여기서,
Figure 112007046536094-pat00131
은 믹스 신호를 의미한다. The additional information transformation unit 1108 transforms the additional information. The level information included in the additional information may be modified as follows. To transmit the level of each source signal
Figure 112007046536094-pat00126
, or
Figure 112007046536094-pat00127
Send it. here,
Figure 112007046536094-pat00128
Denotes the i-th source signal. The domain of the source signal may be a time domain or may be a subband domain. In such a case, it is difficult to quantize because the change in the level value is large. To solve this,
Figure 112007046536094-pat00129
Transmit a value relative to a particular source signal, such as
Figure 112007046536094-pat00130
As such, the relative value of the level of the mixed signal may be transmitted. here,
Figure 112007046536094-pat00131
Means mix signal.

또한, 믹스 신호를 구성하는데 발생할 수 있는 신호들간의 간섭 현상의 영향을 상쇄하기 위해, 아래의 [수학식 20]과 같은 값을 전송할 수 있다. In addition, in order to offset the influence of interference between signals that may occur in constructing the mixed signal, a value such as Equation 20 below may be transmitted.

Figure 112007046536094-pat00132
Figure 112007046536094-pat00132

여기서, N은 믹스 신호를 구성하는 소스 신호의 개수이다. 만약 믹스 신호가

Figure 112007046536094-pat00133
의 단순 합이 아닌 소스마다 특정 가중치(예를 들면, 게인 팩터)를 부여하여 구성된다면, 상기 [수학식 20]의 분모를 구성하는 소스 신호 레벨 합에도 그 가 중치를 적용하여 구성할 수 있다. Here, N is the number of source signals constituting the mix signal. If the mix signal
Figure 112007046536094-pat00133
If it is configured by giving a specific weight (for example, a gain factor) for each source instead of the simple sum of, the weighting value may be applied to the sum of the source signal levels constituting the denominator of Equation (20).

예를 들면, 두 개의 게인 팩터 중 하나를 이용하여 두 개의 게인 팩터 각각을 정규화(normalization)하여 새로운 게인 팩터를 생성한다. 이때, 게인 팩터 중 하나는 특정한 상수값(즉, 1)으로 변형된다. 또한, 부가정보변형부(1302)는 게인 팩터를 변형함과 동시에 소스 신호를 변형할 수 있다. 예컨대, 부가정보변형부(1108)는 게인 팩터 중

Figure 112007046536094-pat00134
를 이용하여 믹스 신호의 게인 팩터를 각각 정규화하여
Figure 112007046536094-pat00135
Figure 112007046536094-pat00136
으로,
Figure 112007046536094-pat00137
Figure 112007046536094-pat00138
으로 변형하고,
Figure 112007046536094-pat00139
를 새로운
Figure 112007046536094-pat00140
로 변형하여 아래의 [수학식 21]과 같이 변형할 수 있다.For example, one of two gain factors is used to normalize each of the two gain factors to create a new gain factor. At this time, one of the gain factors is transformed into a specific constant value (ie, 1). In addition, the additional information modifying unit 1302 may modify a gain factor and a source signal. For example, the additional information transformation unit 1108 may have a gain factor.
Figure 112007046536094-pat00134
Use to normalize the gain factor of each mix signal
Figure 112007046536094-pat00135
To
Figure 112007046536094-pat00136
to,
Figure 112007046536094-pat00137
To
Figure 112007046536094-pat00138
Transform to
Figure 112007046536094-pat00139
New
Figure 112007046536094-pat00140
It can be modified as shown in Equation 21 below.

Figure 112007046536094-pat00141
Figure 112007046536094-pat00141

Figure 112007046536094-pat00142
Figure 112007046536094-pat00142

상기 값은 원래의 믹스 신호와 동일한 값이다. 따라서 인코딩 장치는 게인 팩터

Figure 112007046536094-pat00143
,
Figure 112007046536094-pat00144
및 숏-타임 서브밴드 파워
Figure 112007046536094-pat00145
등과 같은 부가 정보를 새로 운 게인 팩터
Figure 112007046536094-pat00146
,
Figure 112007046536094-pat00147
및 새로운 숏-타임 서브밴드 파워
Figure 112007046536094-pat00148
등과 같은 새로운 부가 정보로 변형해도 디코딩 장치가 리믹스 신호를 생성하는데 아무런 차이가 없다. 새로운 게인 팩터 중,
Figure 112007046536094-pat00149
는 디폴트값으로 설정되므로 인코딩 장치는
Figure 112007046536094-pat00150
를 별도로 전송할 필요가 없다. 따라서 부가 정보량이 감소한다. The value is the same value as the original mix signal. So the encoding device has a gain factor
Figure 112007046536094-pat00143
,
Figure 112007046536094-pat00144
And short-time subband power
Figure 112007046536094-pat00145
New gain factor such as additional information
Figure 112007046536094-pat00146
,
Figure 112007046536094-pat00147
And new short-time subband power
Figure 112007046536094-pat00148
The decoding apparatus does not make any difference in generating the remixed signal even if it is transformed into new additional information such as. Among the new gain factors,
Figure 112007046536094-pat00149
Is set to the default value, so the encoding device
Figure 112007046536094-pat00150
There is no need to send it separately. Therefore, the amount of additional information is reduced.

부가정보전환부(1303)는 부가정보변형부(1302)가 변형한 부가 정보를 전송하기 편한 형태로 전환한다. 인코딩 장치는 부가 정보

Figure 112007046536094-pat00151
,
Figure 112007046536094-pat00152
Figure 112007046536094-pat00153
를 그대로 인코딩하여 디코딩 장치로 전송할 수도 있으나, 양자화 및 인코딩에 더 적합한 값으로 전환하여 전송할 수도 있다. 부가정보전환부(1303)는 앞의 [수학식 3] 및 [수학식 4]를 이용하여 부가 정보
Figure 112007046536094-pat00154
,
Figure 112007046536094-pat00155
,
Figure 112007046536094-pat00156
Figure 112007046536094-pat00157
,
Figure 112007046536094-pat00158
,
Figure 112007046536094-pat00159
로 전환할 수 있다.The additional information converting unit 1303 converts the additional information transforming unit 1302 into a form that is easy to transmit additional information. The encoding device has additional information
Figure 112007046536094-pat00151
,
Figure 112007046536094-pat00152
And
Figure 112007046536094-pat00153
May be encoded as it is and transmitted to the decoding apparatus, but may be converted to a value more suitable for quantization and encoding and then transmitted. The additional information conversion unit 1303 is the additional information by using the above [Equation 3] and [Equation 4]
Figure 112007046536094-pat00154
,
Figure 112007046536094-pat00155
,
Figure 112007046536094-pat00156
To
Figure 112007046536094-pat00157
,
Figure 112007046536094-pat00158
,
Figure 112007046536094-pat00159
You can switch to

이때,

Figure 112007046536094-pat00160
은 특정 상수값으로 디폴트 되어 있으므로 인코딩 장치는
Figure 112007046536094-pat00161
또는
Figure 112007046536094-pat00162
중 하나와
Figure 112007046536094-pat00163
만을 전송하면 된다. 부가정보양자화부(1304)는
Figure 112007046536094-pat00164
또는
Figure 112007046536094-pat00165
중 하나와
Figure 112007046536094-pat00166
를 양자화한다. 부가정보인코딩부(1305)는 양자화된 부가 정보를 인코딩하여 디코딩 장치로 전송한다.At this time,
Figure 112007046536094-pat00160
Is defaulted to a specific constant value, so the encoding device
Figure 112007046536094-pat00161
or
Figure 112007046536094-pat00162
With one of
Figure 112007046536094-pat00163
You only need to send it. The additional information quantization unit 1304
Figure 112007046536094-pat00164
or
Figure 112007046536094-pat00165
With one of
Figure 112007046536094-pat00166
Quantize The side information encoding unit 1305 encodes the quantized side information and transmits the encoded side information to the decoding apparatus.

상기 부가 정보는 전술한 게인 팩터, 숏-타임 서브밴드 파워, 시간 지연 정보, 상호 상관 정보, 믹스 정보 외에도 다양한 정보를 포함할 수 있다. 예를 들면, 부가 정보가 믹스 신호와 함께 생성되지 않은 경우, 타임 싱크 등의 불일치로 재생에 문제가 있을 수 있다. 따라서, 상기 부가 정보에 타이밍 정보를 포함할 수 있다. 또한, 상기 타이밍 정보는 믹스 신호에 포함되거나, 또는 부가 정보 및 믹스 신호에 모두 포함될 수 있다. 따라서, 상기 타이밍 정보를 이용하여 부가 정보가 믹스 신호와 함께 재생될 때에 싱크 문제를 해결할 수 있다. 여기서 타이밍 정보는 실제 시간에 대한 정보일 수 있고, 상대적인 시간에 대한 정보일 수 있으며, 또는 믹스 신호의 특성에 따라 판단할 수 있는 정보를 포함한다.The additional information may include various information in addition to the above-described gain factor, short-time subband power, time delay information, cross correlation information, and mix information. For example, if additional information is not generated together with the mixed signal, there may be a problem in reproduction due to inconsistency such as time sync. Therefore, timing information may be included in the additional information. In addition, the timing information may be included in the mixed signal or may be included in both the side information and the mixed signal. Therefore, the sync problem can be solved when the additional information is reproduced together with the mixed signal by using the timing information. Here, the timing information may be information about actual time, information about relative time, or include information that may be determined according to the characteristics of the mix signal.

같은 소스를 가지고 믹스한 믹스 신호라 하여도, 믹스 방법이나 부호화 방법에 의해 신호 간에 차이가 발생할 수 있다 .예를 들면, CD에 수록된 음악과 MP3로 변환된 음악 간에는 타임 싱크 등에서 차이가 발생할 수 있다. 이러한 경우, MP3와 함께 다중화된 부가 정보는 CD에 이용될 경우 타임 싱크 등의 문제로 재생의 정확도에 영향을 줄 수 있다. 이러한 경우, 다중화된 신호와 부가 정보를 새로 이용할 신호와 비교하여, 부가 정보를 새로 이용할 신호에 맞도록 변형하는 것도 가능하다.Even with a mixed signal mixed with the same source, a difference may occur between the signals due to the mixing method or the encoding method. For example, a difference may occur in time sync between music recorded on a CD and music converted to MP3. . In such a case, the additional information multiplexed with the MP3 may affect the accuracy of reproduction due to problems such as time sync when used in the CD. In this case, it is also possible to compare the multiplexed signal and the additional information with the newly used signal, and modify the additional information to match the newly used signal.

도 14는 본 발명의 일실시예에 따른 부가 정보를 새로 적용할 믹스 신호에 적합하도록 변환하는 트랜스코더이다. 도 14를 참조하면, 입력 1(1401)은 다중화된 신호이고, 입력 2(1402)는 부가 정보를 새로 적용할 믹스 신호이다. 경우에 따라서 입력 1(1401)은 믹스 신호와 부가 정보가 함께 입력될 수 있다. 트랜스코더(1403) 는 입력 1(1401)에 포함된 믹스 신호와 입력 2(1402)의 믹스 신호를 비교하여, 이를 토대로 부가 정보를 변환하는 역할을 수행한다. 출력(1404)은 변환된 부가 정보가 될 수 있고, 또는 입력 2의 신호와 부가 정보가 다중화되어 출력되는 것이 가능하다.14 is a transcoder for converting additional information to be suitable for a newly applied mix signal according to an embodiment of the present invention. Referring to FIG. 14, input 1 1401 is a multiplexed signal and input 2 1402 is a mix signal to which additional information is newly applied. In some cases, the input 1 1401 may be input with the mix signal and additional information. The transcoder 1403 compares the mix signal of the input 1 1401 and the mix signal of the input 2 1402, and converts additional information based on the mixed signal. The output 1404 may be converted additional information, or the signal of the input 2 and the additional information may be multiplexed and output.

또한, 인코딩 장치에서 부가 정보를 생성할 때, 어플리케이션(application)에 따라 부가 정보의 양을 조절하는 것이 가능하다. 예를 들어, 특정 오브젝트를 뮤팅하는 것이 가능한 어플리케이션이 특정 오브젝트를 패닝만 하는 어플리케이션보다 더 많은 정보가 필요하다. 따라서, 부가 정보를 생성하는 인코딩 장치에서 음질을 보장할 수 있는 최대 제어에 대한 가이드 정보를 디코딩 장치에 제공할 수 있다. 상기 가이드 정보는 모든 소스 신호에 동일하게 적용되거나, 또는 각 소스 신호마다 독립적으로 적용될 수 있다.In addition, when generating the additional information in the encoding apparatus, it is possible to adjust the amount of the additional information according to the application (application). For example, an application that is capable of muting a particular object needs more information than an application that only pans a particular object. Therefore, it is possible to provide the decoding apparatus with guide information on the maximum control capable of guaranteeing sound quality in the encoding apparatus generating the additional information. The guide information may be equally applied to all source signals or may be independently applied to each source signal.

또한, 상기 부가 정보에는 모노 또는 다채널의 특정 채널을 지칭하는 식별자를 포함할 수 있다. 멀티 소스가 입력되어, 믹스 신호 및 부가 정보가 생성되는 경우를 가정하자. 상기 멀티 소스는 소스에 따라 모노 일 수 있고, 2개의 채널을 갖는 스테레오일 수도 있고, 또는 2개 채널을 초과하는 멀티 채널일 수도 있다. 소스가 다채널을 갖는 경우, 각 채널을 독립된 소스로 가정하고 처리하는 것이 가능하다. In addition, the additional information may include an identifier indicating a specific channel of mono or multichannel. Assume that a multi-source is input so that a mix signal and additional information are generated. The multi-source may be mono depending on the source, may be stereo with two channels, or may be multi-channels exceeding two channels. If the source has multiple channels, it is possible to assume that each channel is an independent source and process it.

예를 들면, 스테레오 채널을 가지는 소스의 경우, K번째 입력 소스가 모노이고, K+1번째 입력 소스가 스테레오인 경우를 생각할 수 있다. 이 경우에, K번째 입력 소스가 n번째 처리 소스라하면, K+1번째 입력 스테레오 소스의 첫 번째 채널은 n+1번째 처리 소스로, K+1번째 입력 스테레오 소스의 두 번째 채널은 n+2번째 처리 소스로 인식하여, 하나의 입력 소스를 채널별로 각각 하나의 처리 소스, 즉 두 개의 처리 소스로 인식하여 부호화하는 것이 가능하다. For example, in the case of a source having a stereo channel, it is conceivable that the K th input source is mono and the K + 1 th input source is stereo. In this case, if the Kth input source is the nth processing source, then the first channel of the K + 1th input stereo source is the n + 1th processing source, and the second channel of the K + 1th input stereo source is n + 2 Recognizing as the first processing source, it is possible to recognize and encode one input source as one processing source, that is, two processing sources, for each channel.

이러한 경우, 총 N개의 처리 소스가 존재하는 경우, 각 처리 소스의 타입을 비트열에 포함할 필요가 있다. 예를 들면, n번째 처리 소스는 모노 신호이며, n+1번째 처리 소스는 스테레오 소스의 첫 번째 채널, n+2번째 처리 소스는 n+1번째 처리 소스와 함께 구성되는 스테레오 소스의 두 번째 채널과 같은 정보를 전송할 필요가 있다. 여기서, 스테레오 소스의 처리 소스가 항상 인접하여 전송되는 것을 가정하면, 처리 소스 타입은 모노, 첫 번째 채널, 두 번째 채널과 같이 3종류로 제한됨을 알 수 있다. In this case, when there are a total of N processing sources, it is necessary to include the type of each processing source in the bit string. For example, the nth processing source is a mono signal, the n + 1th processing source is the first channel of the stereo source, and the n + 2th processing source is the second channel of the stereo source configured with the n + 1th processing source. It is necessary to send information such as Here, assuming that the processing source of the stereo source is always transmitted adjacently, it can be seen that the processing source type is limited to three types such as mono, first channel, and second channel.

도 15는 본 발명의 일실시예에 따른 디코딩 장치의 블록도이다. 도 15를 참조하면, 상기 디코딩 장치는 역다중화부(1502), 믹스신호디코딩부(1505), 부가정보디코딩부(1504), 부가정보복원부(1505), 및 리믹스렌더링부(1506)를 포함한다.15 is a block diagram of a decoding apparatus according to an embodiment of the present invention. Referring to FIG. 15, the decoding apparatus includes a demultiplexer 1502, a mixed signal decoder 1505, an additional information decoder 1504, an additional information restorer 1505, and a remix renderer 1506. do.

다중화된 믹스 신호 및 제1 부가 정보(1501)가 역다중화부(1502)로 입력되면, 역다중화부(1502)는 부호화된 믹스 신호와 제1 부가 정보를 분리하여 부호화된 믹스 신호는 믹스신호디코딩부(1503)로, 부호화된 제1 부가 정보는 부가정보디코딩부(1504)로 전송한다. 상기 제1 부가 정보는 상기 믹스 신호를 리믹스하는데 이용되는 제2 부가 정보를 변형한 정보를 말한다.When the multiplexed mix signal and the first additional information 1501 are input to the demultiplexer 1502, the demultiplexer 1502 separates the encoded mix signal and the first additional information, and the encoded mixed signal is mixed signal decoded. In block 1503, the encoded first additional information is transmitted to the additional information decoding unit 1504. The first additional information refers to information obtained by modifying second additional information used to remix the mixed signal.

믹스신호디코딩부(1503)는 부호화된 믹스 신호를 복호화하여 믹스 신호를 생성하고, 부가정보디코딩부(1504)는 부호화된 제1 부가 정보를 복호화하여 제1 부가 정보를 생성한다. 그 다음에, 부가정보복원부(1505)는 생성된 제1 부가 정보를 원래의 제2 부가 정보로 복원한다. 상기 부가정보복원부(1505)는 선택적으로 존재한다. 즉, 본 발명에 따른 디코딩 장치는 제1 부가 정보를 이용하여 리믹스 신호를 생성하도록 구성될 수 있고, 또한 제2 부가 정보를 이용하여 리믹스 신호를 생성하도록 구성될 수 있다. 상기 제1 부가 정보 또는 제2 부가 정보와 복호화된 믹스 신호는 리믹스렌더링부(1506)로 전송된다. 리믹스렌더링부(1506)는 제1 부가 정보 또는 제2 부가정보, 믹스 신호 및 사용자 믹스 파라미터를 이용하여 리믹스 신호(1507)를 생성할 수 있다. 상기 사용자 믹스 파라미터는 사용자로부터 획득된 제어 정보를 이용하여 생성될 수 있다.The mix signal decoding unit 1503 generates a mix signal by decoding the encoded mix signal, and the side information decoding unit 1504 generates first side information by decoding the encoded first side information. Then, the additional information restoring unit 1505 restores the generated first additional information to the original second additional information. The additional information restoring unit 1505 is optionally present. That is, the decoding apparatus according to the present invention may be configured to generate the remix signal using the first additional information, and may also be configured to generate the remix signal using the second additional information. The first additional information or the second additional information and the decoded mix signal are transmitted to the remix renderer 1506. The remix renderer 1506 may generate the remix signal 1507 using the first additional information or the second additional information, the mix signal, and the user mix parameter. The user mix parameter may be generated using control information obtained from a user.

도 16은 본 발명의 일실시예에 따른 부가 정보 처리 방법을 나타낸 순서도이다. 도 16을 참조하면, 부가정보생성부(1301)는 믹스 신호 또는 소스 신호를 이용하여 부가 정보를 생성한다(S1601). 부가정보변형부(1302)는 생성된 부가 정보를 변형한다(S1602). 부가정보전환부(1303)는 변형된 부가 정보를 다른 형태로 전환한다(S1603). 부가정보양자화부(1304)는 전환된 부가 정보를 양자화한다(S1604). 부가정보인코딩부(1305)는 양자화된 부가 정보를 인코딩하여 디코딩 장치로 전송한다(S1505).16 is a flowchart illustrating a method of processing additional information according to an embodiment of the present invention. Referring to FIG. 16, the additional information generator 1301 generates additional information using a mix signal or a source signal (S1601). The additional information transformation unit 1302 transforms the generated additional information (S1602). The additional information switching unit 1303 converts the modified additional information into another form (S1603). The additional information quantization unit 1304 quantizes the converted additional information (S1604). The additional information encoding unit 1305 encodes and transmits the quantized additional information to the decoding apparatus (S1505).

예를 들면, 본 발명의 일실시예에 따른 부가 정보 변형 방법을 아래와 같다. 부가정보생성부(1301)는 믹스 신호 또는 소스 신호를 이용하여 부가 정보

Figure 112007046536094-pat00167
,
Figure 112007046536094-pat00168
,
Figure 112007046536094-pat00169
를 생성한다. 부가정보변형부(1302)는 생성된 부가 정보를 변형한 다. 즉, 부가정보변형부(1302)는 게인 팩터 중 하나의 값, 예컨대,
Figure 112007046536094-pat00170
를 이용하여 게인 팩터 각각을 정규화하여
Figure 112007046536094-pat00171
,
Figure 112007046536094-pat00172
을 생성한다.For example, a method of modifying additional information according to an embodiment of the present invention is as follows. The additional information generator 1301 uses the mixed signal or the source signal to provide additional information.
Figure 112007046536094-pat00167
,
Figure 112007046536094-pat00168
,
Figure 112007046536094-pat00169
Create The additional information transformation unit 1302 transforms the generated additional information. That is, the additional information transformation unit 1302 has one value of the gain factor, for example,
Figure 112007046536094-pat00170
To normalize each gain factor
Figure 112007046536094-pat00171
,
Figure 112007046536094-pat00172
Create

이때, 게인 팩터

Figure 112007046536094-pat00173
를 정규화하면 새로운 게인 팩터
Figure 112007046536094-pat00174
은 1이 된다. 부가정보변형부(1302)는 정규화에 사용된 게인 팩터를 이용하여 소스 신호
Figure 112007046536094-pat00175
Figure 112007046536094-pat00176
으로 변형하고, 변형된 소스 신호
Figure 112007046536094-pat00177
를 이용하여 서브밴드별 파워
Figure 112007046536094-pat00178
Figure 112007046536094-pat00179
으로 변형한다. 변형된 부가 정보
Figure 112007046536094-pat00180
,
Figure 112007046536094-pat00181
는 양자화 및 인코딩하기에 더 적합한 형태인
Figure 112007046536094-pat00182
또는
Figure 112007046536094-pat00183
, 그리고
Figure 112007046536094-pat00184
로 전환된다. 이 때, 정규화에 의해
Figure 112007046536094-pat00185
은 1이 되므로, 게인 팩터 중
Figure 112007046536094-pat00186
만 전환하면 된다. 따라서,
Figure 112007046536094-pat00187
Figure 112007046536094-pat00188
중 하나만 이용된다. 전환된 부가 정보
Figure 112007046536094-pat00189
또는
Figure 112007046536094-pat00190
, 그리고
Figure 112007046536094-pat00191
는 양자화되고 인코딩되어 디코딩 장치로 전송된다.Where the gain factor
Figure 112007046536094-pat00173
Normalizing a new gain factor
Figure 112007046536094-pat00174
Becomes 1 The side information transformation unit 1302 uses the gain factor used for normalization to source signal.
Figure 112007046536094-pat00175
To
Figure 112007046536094-pat00176
Modified, and the modified source signal
Figure 112007046536094-pat00177
Power per subband using
Figure 112007046536094-pat00178
To
Figure 112007046536094-pat00179
Transform into. Modified Side Information
Figure 112007046536094-pat00180
,
Figure 112007046536094-pat00181
Is a more suitable form for quantization and encoding.
Figure 112007046536094-pat00182
or
Figure 112007046536094-pat00183
, And
Figure 112007046536094-pat00184
Is switched to. At this time, by normalization
Figure 112007046536094-pat00185
Becomes 1, so the gain factor
Figure 112007046536094-pat00186
You only need to switch. therefore,
Figure 112007046536094-pat00187
And
Figure 112007046536094-pat00188
Only one of them is used. Switched Side Information
Figure 112007046536094-pat00189
or
Figure 112007046536094-pat00190
, And
Figure 112007046536094-pat00191
Is quantized, encoded and sent to the decoding apparatus.

도 17은 본 발명의 일실시예에 따른 신호 처리 방법을 나타낸 순서도이다. 도 17을 참조하면, 디코딩 장치는 변형된 부가 정보를 수신한다(S1701). 변형된 부가 정보는 변형된 게인 팩터 및 변형된 서브밴드 파워를 포함한다. 전술한 바와 같 이, 변형된 게인 팩터 중 하나의 값은 특정 값으로 디폴트 되어 있으므로, 디코딩 장치는 변형된 부가 정보 중 디폴트 되지 않은 게인 팩터 및 서브밴드 파워만을 수신하면 된다. 17 is a flowchart illustrating a signal processing method according to an embodiment of the present invention. Referring to FIG. 17, the decoding apparatus receives modified additional information (S1701). The modified side information includes a modified gain factor and a modified subband power. As described above, since the value of one of the modified gain factors is defaulted to a specific value, the decoding apparatus needs to receive only the non-default gain factor and subband power among the modified additional information.

인코딩 장치가 부가 정보를 변형하면 그에 따라 소스 신호도 변형되므로 새로운 소스 신호가 생성되었다고 볼 수 있다. 따라서 인코딩 장치는 새로 생성된 소스 신호 및 새로 생성된 소스 신호에 대한 부가 정보를 전송하는 것이 된다. 인코딩 장치가 부가 정보를 변형하는 경우 게인 팩터와 소스 신호가 모두 변형되므로, 게인 팩터와 소스 신호의 곱으로 구성되는 믹스 신호는 원 신호와 동일하다. 디코딩 장치는 변형된 부가 정보를 수신하여 이를 디코딩한다. 그 다음에 변형된 부가 정보를 이용하여 원래의 부가 정보를 생성한다. 디코딩 장치에는 사용자가 제공하는 제어 정보가 입력될 수 있다. When the encoding apparatus modifies the additional information, the source signal is also modified accordingly, so that a new source signal may be generated. Therefore, the encoding apparatus transmits the newly generated source signal and additional information about the newly generated source signal. When the encoding apparatus modifies the additional information, both the gain factor and the source signal are transformed, so that the mixed signal composed of the product of the gain factor and the source signal is the same as the original signal. The decoding apparatus receives the modified side information and decodes it. The modified additional information is then used to generate the original additional information. Control information provided by a user may be input to the decoding apparatus.

그 다음에 변형된 부가 정보는 원래의 부가 정보로 복원된다(S1702). 경우에 따라서는 원래의 부가 정보로 복원하지 않고, 변형된 부가 정보를 직접 이용할 수 있다. 디코딩 장치는 믹스 신호, 제어 정보, 원래의 부가 정보를 이용하여 리믹스 신호를 생성할 수 있다(S1703). 또한, 본 발명에 따른 디코딩 장치는 원래의 부가 정보가 아닌, 변형된 부가 정보를 이용하여 리믹스 신호를 생성하는 것도 가능하다. 디코딩 장치가 생성하는 리믹스 신호는 인코딩 장치의 부가 정보 변형 여부와 무관하다.Then, the modified additional information is restored to the original additional information (S1702). In some cases, the modified additional information can be directly used without restoring the original additional information. The decoding apparatus may generate a remix signal using the mix signal, the control information, and the original additional information (S1703). In addition, the decoding apparatus according to the present invention may generate a remix signal using the modified additional information instead of the original additional information. The remixed signal generated by the decoding apparatus is irrelevant to whether or not the additional information of the encoding apparatus is modified.

지금까지 본 발명에 대하여 몇몇 실시예들을 들어 구체적으로 설명하였으나, 상기 실시예들은 본 발명을 이해하기 위한 설명을 위해 제시된 것이며, 본 발명의 범위가 상기 실시예에 제한되는 것은 아니다. 당업자라면 본 발명의 기술적 사상의 범위를 벗어나지 않고도 다양한 변형이 가능함을 이해할 수 있을 것이며, 본 발명의 범위는 첨부된 특허청구범위에 의해서 해석되어야 할 것이다.Although the present invention has been described in detail with reference to some embodiments, the above embodiments are presented for the purpose of understanding the present invention, and the scope of the present invention is not limited to the above embodiments. Those skilled in the art will understand that various modifications are possible without departing from the scope of the technical idea of the present invention, and the scope of the present invention should be interpreted by the appended claims.

본 발명에 의하면 변형된 부가 정보를 이용하여 믹스 신호를 소스 신호 별로 조절할 수 있는 신호 처리 방법 및 장치를 제공할 수 있다.According to the present invention, it is possible to provide a signal processing method and apparatus capable of adjusting a mixed signal for each source signal using the modified additional information.

또한, 본 발명에 의하면 부가 정보를 변형하여 낮은 정보량으로 부가 정보를 생성하고 이를 전송함으로써, 데이터 전송량을 줄일 수 있는 효과가 있다.In addition, according to the present invention, by modifying the additional information to generate the additional information with a low information amount and to transmit it, there is an effect that can reduce the amount of data transmission.

Claims (22)

하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 단계; Obtaining a mix signal comprising one or more source signals; 제1 부가 정보를 획득하는 단계; Obtaining first side information; 믹스 파라미터를 획득하는 단계; 및Obtaining a mix parameter; And 상기 믹스 신호, 상기 제1 부가 정보, 및 상기 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 단계를 포함하되,Generating a remix signal using the mix signal, the first side information, and the mix parameter, 상기 제1 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 제2 부가 정보를 변형한 정보인 것을 특징으로 하는 신호 처리 방법.Wherein the first additional information is information obtained by modifying second additional information indicating a relationship between a source signal to be remixed among the source signals and the mixed signal. 제1 항에 있어서, 상기 신호 처리 방법은The method of claim 1, wherein the signal processing method is 상기 제1 부가 정보를 상기 제2 부가 정보로 복원하는 단계를 더 포함하고,Restoring the first additional information to the second additional information; 상기 리믹스 신호를 생성하는 단계는 상기 믹스 신호, 상기 제2 부가 정보, 및 상기 믹스 파라미터를 이용하여 이루어지는 것을 특징으로 하는 신호 처리 방법.The generating of the remix signal is performed using the mix signal, the second additional information, and the mix parameter. 제 1 항 또는 제 2 항에 있어서,The method according to claim 1 or 2, 상기 제1 부가 정보는 상기 소스 신호의 파워 정보, 및 상기 소스 신호와 상기 믹스 신호의 상관 관계 정보를 포함하고,The first additional information includes power information of the source signal and correlation information of the source signal and the mix signal. 상기 상관 관계 정보는 상기 소스 신호가 상기 믹스 신호의 제1 채널에 포함된 정도를 나타내고, 상기 믹스 신호의 제2 채널에 포함된 정도는 디폴트로 결정되는 것을 특징으로 하는 신호 처리 방법.The correlation information indicates a degree in which the source signal is included in the first channel of the mix signal, and a degree included in the second channel of the mix signal is determined by default. 제 1 항 또는 제 2 항에 있어서,The method according to claim 1 or 2, 상기 제1 부가 정보는 제2 부가 정보에 비해 비트레이트(bitrate)가 작은 것을 특징으로 하는 신호 처리 방법.The first additional information has a smaller bitrate than the second additional information. 제 4 항에 있어서,The method of claim 4, wherein 상기 제1 부가 정보는 상기 제2 부가 정보를 정규화하여 생성되는 것을 특징으로 하는 신호 처리 방법.The first additional information is generated by normalizing the second additional information. 제 1 항에 있어서,The method of claim 1, 상기 제1 부가 정보 또는 상기 제2 부가 정보는 상기 리믹스될 소스 신호의 레벨, 상기 리믹스될 소스 신호들 간의 레벨, 또는 상기 리믹스될 소스 신호와 상기 믹스 신호간의 레벨을 나타내는 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The first additional information or the second additional information includes information indicating a level of the source signal to be remixed, a level between the source signals to be remixed, or a level between the source signal to be remixed and the mixed signal. Signal processing method. 제 1 항에 있어서,The method of claim 1, 상기 제1 부가 정보 또는 상기 제2 부가 정보는 상기 리믹스될 소스 신호들 간의 시간 지연, 또는 상기 리믹스될 소스 신호와 상기 믹스 신호간의 시간 지연을 나타내는 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.Wherein the first additional information or the second additional information includes information indicating a time delay between the source signals to be remixed or a time delay between the source signal to be remixed and the mix signal. 제 1 항에 있어서,The method of claim 1, 상기 제1 부가 정보 또는 상기 제2 부가 정보는 상기 리믹스될 소스 신호들 간의 상호 상관, 또는 상기 리믹스될 소스 신호와 상기 믹스 신호간의 상호 상관을 나타내는 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The first additional information or the second additional information includes information indicating cross correlation between the source signals to be remixed or cross correlation between the source signals to be remixed and the mixed signal. 제 1 항에 있어서,The method of claim 1, 상기 제1 부가 정보 또는 상기 제2 부가 정보는 상기 리믹스될 소스 신호가 상기 믹스 신호에 믹스되는 정도를 나타내는 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.Wherein the first additional information or the second additional information includes information indicating a degree to which the source signal to be remixed is mixed with the mixed signal. 제 1 항에 있어서,The method of claim 1, 상기 제1 부가 정보 또는 제2 부가 정보는 상기 믹스 신호와 함께 상기 리믹스 신호를 생성할 때, 타임 싱크 문제를 해결하기 위한 타이밍 정보를 포함하는 것을 특징으로 하는 신호 처리 방법.The first additional information or the second additional information includes timing information for solving a time sync problem when generating the remix signal together with the mixed signal. 제 1 항에 있어서,The method of claim 1, 상기 제1 부가 정보 또는 제2 부가 정보는 상기 리믹스될 소스 신호의 최대 제어값에 대한 가이드 정보를 포함하는 것을 특징으로 하는 신호 처리 방법. The first additional information or the second additional information includes guide information on a maximum control value of the source signal to be remixed. 제 11 항에 있어서,The method of claim 11, 상기 가이드 정보는 상기 리믹스될 소스 신호 전체에 동일하게 적용되거나, 또는 각 리믹스될 소스 신호마다 독립적으로 적용되는 것을 특징으로 하는 신호 처리 방법.The guide information is equally applied to the entire source signal to be remixed, or is independently applied to each source signal to be remixed. 제 1 항에 있어서,The method of claim 1, 상기 제1 부가 정보 또는 제2 부가 정보는 각 소스 신호가 포함되는 채널을 나타내는 채널 식별 정보를 포함하는 것을 특징으로 하는 신호 처리 방법. The first additional information or the second additional information includes channel identification information indicating a channel in which each source signal is included. 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 단계;Obtaining a mix signal comprising one or more source signals; 상기 소스 신호들 중 리믹스될 소스 신호를 획득하는 단계;Obtaining a source signal to be remixed among the source signals; 상기 믹스 신호 및 상기 리믹스될 소스 신호를 이용하여 제1 부가 정보를 생성하는 단계; 및 Generating first side information using the mix signal and the source signal to be remixed; And 상기 제1 부가 정보를 제2 부가 정보로 변형하는 단계를 포함하되,Transforming the first additional information into second additional information, 상기 제1 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 정보인 것을 특징으로 하는 신호 처리 방법.And the first additional information is information representing a relationship between the source signal to be remixed and the mix signal. 제 14 항에 있어서, 상기 신호 처리 방법은The method of claim 14, wherein the signal processing method is 상기 제2 부가 정보를 양자화 및 부호화에 더 적합한 제3 부가 정보로 변환하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.And converting the second additional information into third additional information more suitable for quantization and encoding. 제 14 항에 있어서, 상기 신호 처리 방법은The method of claim 14, wherein the signal processing method is 상기 제3 부가 정보를 양자화 및 부호화하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.And quantizing and encoding the third additional information. 제 14 항에 있어서, 상기 변형 단계는15. The method of claim 14, wherein said modifying step 상기 제1 부가 정보를 정규화하는 상기 제2 부가 정보를 생성하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.Generating the second additional information to normalize the first additional information. 제1 믹스 신호 및 제1 부가 정보를 획득하는 단계;Obtaining a first mix signal and first side information; 제2 믹스 신호를 획득하는 단계; Obtaining a second mix signal; 상기 제1 믹스 신호와 상기 제2 믹스 신호를 비교한 결과를 이용하여 상기 제1 부가 정보를 제2 부가 정보로 변형하는 단계를 포함하되,And transforming the first additional information into second additional information by using a result of comparing the first mixed signal and the second mixed signal. 상기 제1 부가 정보는 상기 제1 믹스 신호를 리믹스하기 위해 필요한 정보이고, 상기 제2 부가 정보는 상기 제2 믹스 신호를 리믹스하기 위해 필요한 정보인 것을 특징으로 하는 신호 처리 방법.Wherein the first additional information is information necessary for remixing the first mixed signal, and the second additional information is information necessary for remixing the second mixed signal. 제 18 항에 있어서, 상기 신호 처리 방법은The method of claim 18, wherein the signal processing method is 상기 제2 부가 정보를 독립적으로 출력하거나, 또는 상기 제2 부가 정보와 상기 제2 믹스 신호를 다중화하여 출력하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.And independently outputting the second additional information or multiplexing the second additional information and the second mixed signal and outputting the second additional information. 하나 이상의 소스 신호를 포함하는 믹스 신호를 획득하는 믹스신호디코딩부;A mix signal decoding unit obtaining a mix signal including one or more source signals; 제1 부가 정보를 획득하는 부가정보디코딩부; 및An additional information decoding unit obtaining first additional information; And 상기 믹스 신호, 상기 제1 부가 정보, 및 믹스 파라미터를 이용하여 리믹스 신호를 생성하는 리믹스렌더링부를 포함하되,A remix renderer configured to generate a remix signal using the mix signal, the first additional information, and the mix parameter, 상기 제1 부가 정보는 상기 소스 신호들 중 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 제2 부가 정보를 변형한 정보이고, 상기 믹스 파라미터는 사용자로부터 획득된 제어 정보를 이용하여 생성되는 것을 특징으로 하는 신호 처리 장치.The first additional information is information obtained by modifying second additional information indicating a relationship between the source signal to be remixed and the mix signal among the source signals, and wherein the mix parameter is generated using control information obtained from a user. Signal processing device characterized in that. 제 20 항에 있어서, 상기 신호 처리 장치는The apparatus of claim 20, wherein the signal processing device is 상기 제1 부가 정보를 상기 제2 부가 정보로 복원하는 부가정보복원부를 더 포함하고,And an additional information restoring unit for restoring the first additional information to the second additional information. 상기 리믹스렌더링부는 상기 믹스 신호, 상기 제2 부가 정보, 및 상기 믹스 파라미터를 이용하여 상기 리믹스 신호를 생성하는 것을 특징으로 하는 신호 처리 장치.And the remix renderer generates the remix signal using the mix signal, the second additional information, and the mix parameter. 하나 이상의 소스 신호를 포함하는 믹스 신호 및 리믹스될 소스 신호를 이용하여 제1 부가 정보를 생성하는 부가정보생성부; An additional information generator configured to generate first additional information using a mix signal including one or more source signals and a source signal to be remixed; 상기 제1 부가 정보를 제2 부가 정보로 변형하는 부가정보변형부; 및An additional information transformation unit which transforms the first additional information into second additional information; And 상기 제2 부가 정보를 부호화하는 부가정보인코딩부를 포함하되,A side information encoding unit encoding the second side information, 상기 제1 부가 정보는 상기 리믹스될 소스 신호와 상기 믹스 신호와의 관계를 나타내는 정보인 것을 특징으로 하는 신호 처리 장치.And the first additional information is information indicating a relationship between the source signal to be remixed and the mix signal.
KR1020070063180A 2006-10-13 2007-06-26 Apparatus for processing a mix signal and method thereof KR100891665B1 (en)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US82935006P 2006-10-13 2006-10-13
US60/829,350 2006-10-13
US86590806P 2006-11-15 2006-11-15
US60/865,908 2006-11-15
US86830406P 2006-12-01 2006-12-01
US60/868,304 2006-12-01
US88971507P 2007-02-13 2007-02-13
US60/889,715 2007-02-13

Publications (2)

Publication Number Publication Date
KR20080033839A KR20080033839A (en) 2008-04-17
KR100891665B1 true KR100891665B1 (en) 2009-04-02

Family

ID=39573661

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070063180A KR100891665B1 (en) 2006-10-13 2007-06-26 Apparatus for processing a mix signal and method thereof

Country Status (1)

Country Link
KR (1) KR100891665B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008683A1 (en) 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US20070083365A1 (en) 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006008683A1 (en) 2004-07-14 2006-01-26 Koninklijke Philips Electronics N.V. Method, device, encoder apparatus, decoder apparatus and audio system
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US20070083365A1 (en) 2005-10-06 2007-04-12 Dts, Inc. Neural network classifier for separating audio sources from a monophonic audio signal

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Patrick De Smet et al., 'Subband based audio mixing for internet streaming applications', ICASSP 2001

Also Published As

Publication number Publication date
KR20080033839A (en) 2008-04-17

Similar Documents

Publication Publication Date Title
US8296158B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
JP5081838B2 (en) Audio encoding and decoding
JP4934427B2 (en) Speech signal decoding apparatus and speech signal encoding apparatus
RU2551797C2 (en) Method and device for encoding and decoding object-oriented audio signals
RU2355046C2 (en) Device and method for forming of multichannel signal or set of parametric data
RU2394283C1 (en) Methods and devices for coding and decoding object-based audio signals
JP5426680B2 (en) Signal processing method and apparatus
JP2011030228A (en) Device and method for generating level parameter, and device and method for generating multichannel representation
MX2014010098A (en) Phase coherence control for harmonic signals in perceptual audio codecs.
IL266580A (en) Method and apparatus for adaptive control of decorrelation filters
JP2015528926A (en) Generalized spatial audio object coding parametric concept decoder and method for downmix / upmix multichannel applications
RU2420026C2 (en) Methods and devices to code and to decode audio signals based on objects
KR100891667B1 (en) Apparatus for processing a mix signal and method thereof
KR100891665B1 (en) Apparatus for processing a mix signal and method thereof
JP2007025290A (en) Device controlling reverberation of multichannel audio codec
KR100891668B1 (en) Apparatus for processing a mix signal and method thereof
Jansson Stereo coding for the ITU-T G. 719 codec
KR100891670B1 (en) Method for signal, and apparatus for implementing the same

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130226

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140224

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150224

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160224

Year of fee payment: 8

LAPS Lapse due to unpaid annual fee