KR101505831B1 - 멀티 채널 신호의 부호화/복호화 방법 및 장치 - Google Patents

멀티 채널 신호의 부호화/복호화 방법 및 장치 Download PDF

Info

Publication number
KR101505831B1
KR101505831B1 KR1020070109729A KR20070109729A KR101505831B1 KR 101505831 B1 KR101505831 B1 KR 101505831B1 KR 1020070109729 A KR1020070109729 A KR 1020070109729A KR 20070109729 A KR20070109729 A KR 20070109729A KR 101505831 B1 KR101505831 B1 KR 101505831B1
Authority
KR
South Korea
Prior art keywords
signal
delete delete
parameter
decoding
parameters
Prior art date
Application number
KR1020070109729A
Other languages
English (en)
Other versions
KR20090043921A (ko
Inventor
김중회
오은미
콘스탄틴 오시포브
주기현
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020070109729A priority Critical patent/KR101505831B1/ko
Priority to US12/107,117 priority patent/US8254584B2/en
Publication of KR20090043921A publication Critical patent/KR20090043921A/ko
Priority to US13/557,848 priority patent/US8718284B2/en
Priority to US13/563,808 priority patent/US8861738B2/en
Application granted granted Critical
Publication of KR101505831B1 publication Critical patent/KR101505831B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H40/00Arrangements specially adapted for receiving broadcast information
    • H04H40/18Arrangements characterised by circuits or components specially adapted for receiving
    • H04H40/27Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95
    • H04H40/36Arrangements characterised by circuits or components specially adapted for receiving specially adapted for broadcast systems covered by groups H04H20/53 - H04H20/95 specially adapted for stereophonic broadcast receiving
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/44Arrangements characterised by circuits or components specially adapted for broadcast
    • H04H20/46Arrangements characterised by circuits or components specially adapted for broadcast specially adapted for broadcast systems covered by groups H04H20/53-H04H20/95
    • H04H20/47Arrangements characterised by circuits or components specially adapted for broadcast specially adapted for broadcast systems covered by groups H04H20/53-H04H20/95 specially adapted for stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems

Abstract

본 발명은 멀티 채널 신호의 복호화 방법에 관한 것으로, 멀티 채널 신호를 대표하는 다운믹스된 신호를 복원하고, 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 복원하며, 복원된 파라미터들을 이용하여 추가적인 파라미터를 추정하고, 복원된 파라미터들 및 추정된 파라미터를 이용하여 복원된 다운믹스된 신호를 업믹싱함으로써 멀티 채널 신호를 복원한다.

Description

멀티 채널 신호의 부호화/복호화 방법 및 장치{Method and Apparatus of Encoding/Decoding Multi-Channel Signal}
본 발명은 멀티 채널 신호의 부호화/복호화 방법 및 장치에 관한 것으로, 보다 상세하게는 스테레오 파라미터를 이용한 멀티 채널 신호의 부호화/복호화 방법 및 장치에 관한 것이다.
스테레오 신호를 부호화하는데 이용되는 방법으로 파라메트릭 스테레오(PS, Parametric Stereo) 기술이 있다. 파라메트릭 스테레오 기술은 입력되는 스테레오 신호를 다운믹싱하여 모노 신호를 생성하고, 스테레오 신호에 대한 부가 정보(side information)를 나타내는 스테레오 파라미터를 추출하며, 생성된 모노 신호와 추출된 스테레오 파라미터를 부호화하여 전송한다.
이 경우 이용되는 스테레오 파라미터에는 스테레오 신호에 포함된 적어도 두 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference), 스테레오 신호에 포함된 적어도 두 채널 신호의 파형의 유사성에 따른 두 채널 신호 사이의 상관도를 나타내는 ICC(Inter-channel Coherence), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차를 나타내는 IPD(Inter- channel Phase Difference), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차가 모노 신호를 기준으로 두 채널 사이에 어떻게 분포하는지를 나타내는 OPD(Overall Phase Difference) 등이 있다.
본 발명이 해결하고자 하는 과제는 낮은 비트레이트에서 전송된 멀티 채널 신호의 스테레오 파라미터를 효율적으로 복호화하여 음질을 향상시킬 수 있는 멀티 채널 신호의 복호화 방법 및 장치, 및 멀티 채널 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.
본 발명이 해결하고자 하는 다른 과제는 낮은 비트레이트에서 멀티 채널 신호의 부가 정보를 나타내는 스테레오 파라미터를 효율적으로 전송하는 멀티 채널 신호의 부호화 방법 및 장치, 및 멀티 채널 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.
상기 과제를 해결하기 위한 본 발명에 따른 멀티 채널 신호의 복호화 방법은 멀티 채널 신호를 대표하는 다운믹스된 신호를 복원하는 단계; 상기 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 복원하는 단계; 상기 복원된 파라미터들을 이용하여 추가적인 파라미터를 추정하는 단계; 및 상기 복원된 파라미터들 및 상기 추정된 파라미터를 이용하여 상기 복원된 다운믹스된 신호를 업믹싱함으로써 상기 멀티 채널 신호를 복원하는 단계를 포함한다.
또한, 상기 과제는 멀티 채널 신호를 대표하는 다운믹스된 신호를 복원하는 단계; 상기 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 복원하는 단계; 상기 복원된 파라미터들을 이용하여 추가적인 파라미터를 추정하는 단계; 및 상기 복원된 파라미터들 및 상기 추정된 파라미터를 이용하여 상기 복원된 다운믹스된 신호를 업믹싱함으로써 상기 멀티 채널 신호를 복원하는 단계를 포함하 는 멀티 채널 신호의 복호화 방법 을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.
또한, 상기 과제를 해결하기 위한 본 발명에 따른 멀티 채널 신호의 복호화 방법은 멀티 채널 신호를 대표하는 다운믹스된 신호가 부호화된 도메인에 대한 정보를 복원하는 단계; 상기 복원된 정보에 따라 시간 또는 주파수 도메인에서 상기 다운믹스된 신호를 복원하는 단계; 상기 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 복원하는 단계; 및 상기 복원된 파라미터들을 이용하여 상기 복원된 다운믹스된 신호를 업믹싱함으로써 상기 멀티 채널 신호를 복원하는 단계를 포함한다.
또한, 상기 과제는 멀티 채널 신호를 대표하는 다운믹스된 신호가 부호화된 도메인에 대한 정보를 복원하는 단계; 상기 복원된 정보에 따라 시간 또는 주파수 도메인에서 상기 다운믹스된 신호를 복원하는 단계; 상기 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 복원하는 단계; 및 상기 복원된 파라미터들을 이용하여 상기 복원된 다운믹스된 신호를 업믹싱함으로써 상기 멀티 채널 신호를 복원하는 단계를 포함하는 멀티 채널 신호의 복호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.
또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 멀티 채널 신호의 부호화 방법은 멀티 채널 신호를 다운믹싱한 신호를 부호화하는 단계; 상기 멀티 채널 신호로부터 상기 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 추출하는 단계; 상기 추출된 파라미터들 중 일부 파라미터로부터 추정될 수 있 는 나머지 파라미터를 제외하고, 상기 일부 파라미터를 부호화하는 단계; 및 상기 부호화된 다운믹스된 신호 및 상기 부호화된 일부 파라미터를 상기 멀티 채널 신호의 부호화 결과로써 출력하는 단계를 포함한다.
또한, 상기 다른 과제는 멀티 채널 신호를 다운믹싱한 신호를 부호화하는 단계; 상기 멀티 채널 신호로부터 상기 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 추출하는 단계; 상기 추출된 파라미터들 중 일부 파라미터로부터 추정될 수 있는 나머지 파라미터를 제외하고, 상기 일부 파라미터를 부호화하는 단계; 및 상기 부호화된 다운믹스된 신호 및 상기 부호화된 일부 파라미터를 상기 멀티 채널 신호의 부호화 결과로써 출력하는 단계를 포함하는 멀티 채널 신호의 부호화 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 의해 달성된다.
또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 멀티 채널 신호의 복호화 시스템은 멀티 채널 신호를 대표하는 다운믹스된 신호를 복원하는 다운믹스된 신호 복호화부; 상기 멀티 채널 신호의 채널 간의 특성 관계를 나타내는 파라미터들을 복원하는 파라미터 복호화부; 상기 복원된 파라미터를 이용하여 상기 복원된 다운믹스된 신호와 상기 멀티 채널 신호 간의 위상 차를 나타내는 OPD(Overall Phase Difference)를 추정하는 OPD 추정부; 및 상기 복원된 파라미터들 및 상기 추정된 OPD를 이용하여 상기 복원된 다운믹스된 신호를 업믹싱하는 업믹싱부를 포함한다.
또한, 상기 다른 과제를 해결하기 위한 본 발명에 따른 멀티 채널 신호의 부 호화 시스템은 멀티 채널 신호를 다운믹싱하는 다운믹싱부; 상기 다운믹스된 신호를 부호화하는 다운믹스된 신호 부호화부; 상기 멀티 채널 신호로부터 상기 멀티 채널 신호의 채널 간 특성 관계를 나타내는 파라미터들을 추출하는 파라미터 추출부; 상기 추출된 파라미터들 중 일부 파라미터로부터 추정될 수 있는 나머지 파라미터를 제외하고, 상기 일부 파라미터를 부호화하는 파라미터 부호화부; 및 상기 부호화된 다운믹스된 신호 및 상기 부호화된 일부 파라미터들을 다중화하여 상기 멀티 채널 신호의 부호화 결과로써 출력하는 다중화부를 포함한다.
본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 구성요소에 대해 사용하였다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.
도 1은 본 발명의 일 실시예에 따른 멀티 채널 신호의 부호화 시스템을 나타내는 블록도이다.
도 1을 참조하면, 멀티 채널 신호의 부호화 시스템은 변환부(11), 다운믹싱부(12), 모노 신호 부호화부(13), 파라미터 추출부(4), 파라미터 부호화부(15), 및 다중화부(16)를 포함한다. 여기서, 멀티 채널 신호의 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.
이하에서는, 설명의 편의상 도 1의 부호화 시스템에 입력되는 멀티 채널 신호는 좌채널 신호(L) 및 우채널 신호(R)를 포함하는 스테레오 신호인 것으로 가정한다. 그러나, 본 실시예에 따른 부호화 시스템은 스테레오 신호에 한정되지 않고, 멀티 채널 신호의 부호화에 이용될 수 있음을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있다.
변환부(11)는 좌채널 신호(L) 및 우채널 신호(R)를 분석 필터뱅크(analysis filterbank)를 통해 각각 시간 도메인에서 기 설정된 도메인으로 변환한다. 여기 서, 기 설정된 도메인은 신호의 크기와 위상을 모두 표현할 수 있는 도메인일 수 있다. 예를 들어, 기 설정된 도메인은 소정의 주파수 단위로 하여 분할된 각 서브 밴드에 대하여 각 신호를 시간 도메인으로 나타내어 구현할 수 있다.
다운믹싱부(12)는 변환부(11)에서 변환된 좌채널 신호 및 우채널 신호를 다운믹싱(down-mixing)하여 모노 신호를 출력한다. 여기서, 다운믹싱은 두 채널 이상의 스테레오 신호로부터 한 채널의 모노 신호를 생성하는 것이며, 다운믹싱을 통하여 부호화 과정에 할당되는 비트량을 줄일 수 있다. 여기서, 모노 신호는 스테레오 신호를 대표하는 신호일 수 있다. 다시 말해, 부호화단에서 스테레오 신호에 포함된 좌채널 신호 및 우채널 신호 각각을 부호화하지 않고, 대표적으로 다운믹싱된 모노 신호만을 부호화하여 전송할 수 있다. 다운믹싱은 보통 좌/우 채널의 신호의 합 신호에 에너지를 보존하기 위하여 정규하여 생성한다.
모노 신호 부호화부(13)는 다운믹싱된 모노 신호를 부호화한다. 여기서, 모노 신호 부호화부(13)는 입력된 스테레오 신호가 음성(speech) 신호인지 음악(music) 신호에 따라 다른 방식으로 모노 신호를 부호화할 수 있다. 이하에서는, 입력된 스테레오 신호에 따른 모노 신호 부호화부(13)의 구성의 예에 대하여 살펴보기로 한다.
본 발명의 일 실시예에서, 입력된 스테레오 신호가 음성 신호인 경우 모노 신호 부호화부(13)는 역변환부 및 부호화부를 포함할 수 있다. 역변환부는 다운믹싱된 모노 신호를 시간 도메인으로 역변환하고, 부호화부는 시간 도메인으로 역변환된 모노 신호를 시간 도메인에서 부호화한다. 예를 들어, 부호화부는 시간 도메 인으로 역변환된 모노 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화할 수 있다. 여기서, CELP 방식은 시간 도메인에서 입력 신호를 선형 예측 방식과 장기 예측 방식 등을 이용하여 부호화하는 방법이다.
본 발명의 다른 실시예에서, 입력된 스테레오 신호가 음악 신호인 경우 모노 신호 부호화부(13)는 역변환부 및 부호화부를 포함할 수 있다. 역변환부는 다운 믹싱된 모노 신호를 시간 도메인으로 역변환한다. 부호화부는 시간 도메인으로 역변환된 모노 신호를 시간 도메인에서 부호화하거나, 시간 도메인으로 역변환된 모노 신호를 다시 주파수 도메인으로 변환한 후 주파수 도메인에서 부호화한다.
본 발명의 또 다른 실시예에서, 입력된 스테레오 신호가 음악 신호인 경우 모노 신호 부호화부(13)는 다운믹싱부(12)에서 다운믹싱된 모노 신호를 주파수 도메인에서 부호화할 수 있다.
또 다른 실시 예로는, 신호의 특성에 따라 CELP와 같은 시간축 상에서 부호화하는 방법과 MDCT (Modified Discrete Cosine Transform) / FFT (Fast Fourier Transform)등을 이용하여 TCX (Transform Coded Excitation)과 같이 주파수 축 상에서 부호화하는 방법이 있다.
파라미터 추출부(14)는 변환부(11)에서 변환된 좌채널 신호 및 우채널 신호의 특성 관계를 나타내는 스테레오 파라미터(stereo parameter)들을 추출한다. 보다 상세하게는, 파라미터 추출부(14)는 좌채널 신호 및 우채널 신호에 대하여 두 채널 간 강도 차를 나타내는 IID, 두 채널 간 상관도를 나타내는 ICC, 두 채널 간 위상 차를 나타내는 IPD, 및 위상 차가 두 채널 사이에 어떻게 분포하는지 나타내 는 OPD를 추출할 수 있다.
종래의 스테레오 신호의 부호화 장치는 스테레오 파라미터 중 보통 IID 및 ICC 만을 추출하고, 추출된 IID 및 ICC 만을 부호화하여 스테레오 파라미터의 부호화에 할당되는 비트양을 줄였다. 그러나, 본 발명의 일 실시예에 따른 스테레오 신호의 부호화 시스템에 포함된 파라미터 추출부는 IID 및 ICC 뿐만 아니라, IPD 및 OPD와 같은 신호의 위상 정보를 나타내는 파라미터를 추출한다. 이와 같이, IID, ICC 및 추가적으로 추출된 위상 정보를 나타내는 파라미터를 이용하여 신호를 복호화할 경우, 신호의 음질이 향상될 수 있다. 여기서, 파라미터 추출부(14)의 구체적인 동작에 대해서는 도 2를 참조하여 설명하기로 한다.
파라미터 부호화부(15)는 파라미터 추출부(14)에서 추출된 스테레오 파라미터들을 양자화하고, 양자화된 결과를 부호화한다. 보다 상세하게는, 파라미터 부호화부(15)는 파라미터의 부호화에 할당되는 비트양을 줄이기 위하여, 파라미터 추출부(14)에서 추출된 스테레오 파라미터 중 IID, ICC, 및 IPD만 양자화하고, 양자화된 IID, ICC, 및 IDP만 부호화할 수 있다. 다시 말해, 파라미터 부호화부(15)는 파라미터 추출부(14)에서 추출된 OPD는 부호화하지 않고, 복호화 장치로 전송하지 않음으로써 스테레오 파라미터의 부호화에 할당되는 비트양을 줄일 수 있다.
이와 같이, 부호화단에서는 낮은 비트레이트에서 스테레오 파라미터를 전송하기 위하여, 추출된 스테레오 파라미터들 중 일부만을 전송한다. 그러나, 복호화단에서는 음질이 향상된 스테레오 신호를 출력하기 위하여, 추출된 스테레오 파라미터들을 모두 이용하여 업믹싱할 필요가 있다. 따라서, 복호화단은 부호화단으로 부터 전송받은 스테레오 파라미터들을 이용하여 부호화단에서 전송되지 않은 스테레오 파라미터를 추정할 필요가 있다.
부호화단에서 전송되는 IID는 스테레오 신호의 채널 간 크기 차를 나타내고, IPD는 스테레오 신호의 채널 간 위상 차를 나타내는바, 본 발명의 일 실시예에 따르면, 복호화단은 IID 및 IPD를 바탕으로 모노 신호와 스테레오 신호의 위상 차를 나타내는 OPD를 추정할 수 있다. 상술한 바와 같이, 모노 신호는 스테레오 신호를 대표하는 신호로 볼 수 있는바, 스테레오 신호의 채널 간 크기 차 및 위상 차를 알며, 모노 신호와 스테레오 신호의 위상 차를 추정할 수 있다. 이에 대한 구체적인 설명은 도 5의 복호화 시스템을 참조하여 설명하기로 한다.
보다 상세하게는, 파라미터 부호화부(15)는 양자화된 파라미터들에 대해 산술(arithmetic) 부호화를 수행한다. 여기서, 산술 부호화는 데이터 심볼들의 통계적 발생 빈도에 따라 각각의 심볼(symbol)이나 연속된 심볼을 적절한 길이의 부호로 표현하는 엔트로피 부호화 방법 중 하나이다. 여기서, 파라미터 부호화부(15)의 구체적인 부호화 동작에 대해서는 도 4a 및 4b를 참조하여 설명하기로 한다.
다중화부(16)는 모노 신호 부호화부(13) 및 파라미터 부호화부(15)에서 각각 출력된 부호화된 모노 신호 및 부호화된 파라미터를 다중화하여 비트스트림의 형태로 출력한다.
도 2는 도 1에 포함된 파라미터 추출부를 상세하게 나타내는 블록도이다.
도 2를 참조하면, 파라미터 추출부(14)는 IID 추출부(141), IPD/OPD 추출부(142), 및 ICC 추출부(143)를 포함한다. 파라미터 추출부(14)는 도 1의 변환 부(11)에서 변환된 좌채널 신호 및 우채널 신호를 입력받는다.
IID 추출부(141)는 변환된 좌채널 신호 및 우채널 신호 사이의 강도 차를 나타내는 파라미터인 IID를 추출하고, 추출된 IID를 도 1의 파라미터 부호화부(15)로 출력한다. 이 때, IID 추출부(141)는 다음 수학식 1을 이용하여 IID를 추출할 수 있다.
Figure 112007078019310-pat00001
여기서, b는 주파수 밴드 인덱스(index)를 나타내고, eL(b)는 주파수 도메인의 특정 주파수 밴드에서의 좌채널 신호의 평균 에너지 레벨을 나타내며, eR(b)는 주파수 도메인의 특정 주파수 밴드에서의 우채널 신호의 평균 에너지 레벨을 나타낸다. 따라서, IID는 주파수 도메인의 우채널 신호 및 좌채널 신호의 에너지 레벨의 비를 이용하여 구할 수 있다.
IPD/OPD 추출부(142)는 변환된 좌채널 신호 및 우채널 신호 사이의 위상 차를 나타내는 파라미터인 IPD 및 위상 차가 좌채널 신호 및 우채널 신호 사이에 어떻게 분포하는지를 나타내는 OPD를 추출하고, 추출된 IPD를 도 1의 파라미터 부호화부(15)로 출력한다.
도 3은 도 2에 포함된 IPD/OPD 추출부에서 IPD 및 OPD를 추출하는 방법을 나타내는 도면이다.
이하에서는, 도 2 및 3을 참조하여, IPD/OPD 추출부(142)의 동작을 살펴보기로 한다. 도 3의 L은 주파수 도메인의 좌채널 신호를 나타내고, R은 주파수 도메인의 우채널 신호를 나타내며, M은 다운믹싱된 모노 신호를 나타낸다. 이 때, IPD 및 OPD는 다음 수학식 2 및 3을 이용하여 각각 구할 수 있다.
IPD=∠(L·R)
여기서, LㅇR은 좌채널 신호 L과 우채널 신호 R의 내적(dot product)을 나타내며, IPD는 좌채널 신호 L과 우채널 신호 R이 이루는 각도를 나타낸다.
OPD=∠(L·M)
여기서, LㅇM은 좌채널 신호 L과 다운믹싱된 모노 신호 M의 내적을 나타내며, OPD는 좌채널 신호 L과 다운믹싱된 모노 신호 M이 이루는 각도를 나타낸다.
다시 도 2를 참조하면, ICC 추출부(143)는 변환된 좌채널 신호 및 우채널 신호 사이의 상관도를 나타내는 파라미터인 ICC를 추출하고, 추출된 ICC를 도 1의 파라미터 부호화부(15)로 출력한다.
도 4a 및 4b는 도 1에 포함된 파라미터 부호화부의 구체적인 부호화 동작을 나타내는 도면이다. 이하에서는, 도 1, 4a 및 4b를 참조하여 파라미터 부호화부(15)의 구체적인 부호화 동작에 대하여 설명하기로 한다.
종래의 산술 부호화 방법에서, 현재 프레임에서 양자화된 값인 심볼(symbol)의 부호화는 이전 프레임 또는 이전 주파수 밴드의 심볼과 현재 프레임에서 심볼의 차이 값을 구하고, 그 차이 값을 부호화하는 방법에 의해 수행되었다.
도 4a는 문맥(context)을 기반으로 산술 부호화하는 방법의 일 실시예를 나타내기 위한 도면이다.
본 발명의 일 실시예에 따른 산술 부호화 방법에 따르면, 현재 프레임에서 심볼이 출력될 확률은 문맥을 기반으로 하여 이전 프레임 또는 이전 주파수 밴드에서의 심볼에 따라 결정된다. 여기서, ai는 현재 심볼(current symbol)을 나타내고, bj는 이전 심볼(previous symbol)을 나타내며, i, j는 0부터 N-1(여기서, N은 양자화된 값의 수)일 수 있다. 따라서, 현재 프레임에서 심볼이 출력될 확률은 현재 심볼 ai와 이전 심볼 bj의 두 변수를 이용하여 P(ai|bj)로 나타낼 수 있다. 예를 들어, 화살표가 가리키는 블록은 i가 2이고, j가 3일 때의 확률 값인 P(a2|b3)를 나타낸다.
본 발명의 다른 실시예에 따른 산술 부호화 방법에 따르면, 현재 프레임에서 심볼이 출력될 확률은 문맥을 기반으로 하여 이전 프레임 또는 이전 주파수 밴드에서의 심볼 및 소정의 변수(f)에 따라 결정된다. 여기서, ai는 현재 심볼을 나타내고, bj는 소정의 프레임 또는 소정의 주파수 밴드에서의 이전 심볼을 나타내며, i, j는 0부터 N-1(여기서, N은 양자화된 값의 수)일 수 있다. 따라서, 현재 프레임에서 심볼이 출력될 확률은 현재 심볼 ai와 이전 심볼 bj의 두 변수 및 소정의 변수(f)를 이용하여 P(ai|bj, fi)로 나타낼 수 있다.
여기서, 소정의 변수(f)는 현재 심볼들 중 임의의 두 개의 심볼이 연속하여 증가하거나 감소하는지를 나타낸다. 보다 상세하게는, 현재 심볼들 중 임의의 두 개의 심볼의 변화량을 Δ(Δi=ai-ai-1)라고 할 때, 현재 심볼들 중 임의의 두 개의 심볼이 증가하는 경우 변화량(Δ)은 양의 값을 갖고, 현재 심볼들 중 임의의 두 개의 심볼이 감소하는 경우 변화량(Δ)은 음의 값을 갖는다.
따라서, 현재 심볼들 중 임의의 두 개의 심볼이 연속하여 증가하는 경우 변화량의 곱은 양의 값을 갖고, 현재 심볼들 중 임의의 두 개의 심볼이 연속하여 감소하는 경우에도 변화량의 곱은 양의 값을 갖는다(즉, Δi-1·Δi-2>0). 그러나, 그렇지 않는 경우에는 변화량의 곱은 음의 값을 갖는다(즉, Δi-1·Δi-2<0). 이와 같이, 현재 심볼들 중 임의의 두 개의 심볼이 연속하여 증가하거나 연속하여 감소하는 경우, 즉, 변화량의 곱이 양의 값을 갖는 경우 소정의 변수(f)는 1이고, 그렇지 않은 경우, 즉, 변화량의 곱이 음의 값을 갖는 경우 소정의 변수(f)는 0이다. 즉, 현재 프레임에서 심볼이 출력될 확률은 현재 심볼들 중 임의의 두 개의 심볼이 연속하여 증가하거나 감소하는 경우가 그렇지 않은 경우보다 높다.
도 4b는 문맥을 기반으로 산술 부호화하는 방법의 또 다른 실시예를 나타내기 위한 도면이다.
본 발명의 또 다른 실시예에 따른 산술 부호화 방법에 따르면, 현재 프레임에서 심볼이 출력될 확률은 문맥을 기반으로 하여 이전 프레임 또는 이전 주파수 밴드에서의 복수의 심볼 및 소정의 변수(f)에 따라 결정된다. 여기서, ai는 현재 심 볼을 나타내고, bj 및 bk는 소정의 프레임 또는 소정의 주파수 밴드에서의 이전 심볼을 나타내며, i, j, k는 0부터 N-1(여기서, N은 양자화된 값의 수)일 수 있다. 따라서, 현재 프레임에서 심볼이 출력될 확률은 현재 심볼 ai와 이전 심볼 bj, bk의 세 변수 및 소정의 변수(f)를 이용하여 P(ai|bj, bk, fi)로 나타낼 수 있다. 이 경우, 소정의 변수(f)는 상술한 바와 같으므로, 중복되는 설명은 편의상 생략하기로 한다.
이와 같이, 도 4b에 따른 산술 부호화 방법은 도 4a에 비해 이전 심볼이 생성되는 소정의 프레임 또는 소정의 밴드의 수가 증가한다. 따라서, 문맥 기반의 산술 부호화에서 기준이 되는 이전 프레임 또는 이전 주파수 밴드에서의 심볼의 수를 증가되므로, 현재 프레임에서 심볼이 출력될 확률은 보다 정확한 값을 갖게 된다.
도 5는 본 발명의 일 실시예에 따른 멀티 채널 신호의 복호화 시스템을 나타내는 블록도이다.
도 5를 참조하면, 멀티 채널 신호의 복호화 시스템은 역다중화부(51), 모노 신호 복호화부(52), 파라미터 복호화부(53), OPD 추정부(54), 업믹싱부(55), 및 역변환부(56)를 포함한다.
역다중화부(51)는 멀티 채널 신호의 부호화 결과인 비트스트림을 역다중화하여 모노 신호의 부호화 결과 및 스테레오 파라미터의 부호화 결과를 출력한다.
모노 신호 복호화부(52)는 역다중화부(51)에서 역다중화된 모노 신호의 부호화 결과를 복호화한다. 구체적으로, 모노 신호 복호화부(52)는 모노 신호가 시간 도메인에서 부호화된 경우에는 부호화된 모노 신호를 시간 도메인에서 복호화하고, 모노 신호가 주파수 도메인에서 부호화된 경우에는 부호화된 모노 신호를 주파수 도메인에서 복호화할 수 있다.
파라미터 복호화부(53)는 역다중화부(51)에서 역다중화된 스테레오 파라미터의 부호화 결과를 복호화한다. 보다 상세하게는, 역다중화된 스테레오 파라미터의 부호화 결과는 IID, IPD, 및 ICC의 부호화 결과를 포함할 수 있다. 따라서, 파라미터 복호화부(53)는 IID, IPD, 및 ICC의 부호화 결과를 복호화하여 IID, IPD, 및 ICC를 출력할 수 있다.
OPD 추정부(54)는 파라미터 복호화부(53)에서 복원된 IPD 및 IID를 이용하여 복원된 모노 신호와 멀티 채널 신호 간의 위상 차를 나타내는 OPD를 추정한다. 상술한 바와 같이, OPD는 부호화 장치로부터 전송되지 않으므로, 복호화 장치에서 복호화된 스테레오 신호의 음질을 향상시키기 위하여 부호화 장치로부터 전송받은 다른 파라미터를 이용하여 OPD를 추정할 필요가 있다. 이로써, 부호화 장치는 부호화 장치로부터 전송받은 파라미터 및 이를 기초로 추정된 OPD를 이용하여 모노 신호를 업믹싱함으로써, 업믹싱된 신호의 음질을 향상시킬 수 있다.
이하에서는 수학식 4 내지 12를 참조하여, OPD 추정부(54)의 동작에 대하여 살펴보기로 한다. 여기서, 후술된 수학식들은 본 발명의 일 실시예에 불과하고, 후술된 수학식들은 변형이 가능함을 본 실시예가 속하는 기술 분야에서 통상의 지식을 가진 자는 이해할 수 있다.
먼저, OPD 추정부(54)는 IID를 이용하여 제1 중간 변수 c를 다음 수학식 4에 따라 구할 수 있다.
Figure 112007078019310-pat00002
여기서, b는 주파수 밴드 인덱스를 나타낸다. 수학식 4와 같이, 제1 중간 변수 c는 특정 주파수 밴드에서의 IID 값을 20으로 나눈 수를 10의 지수 형태로 표현함으로써 구할 수 있다. 이 때, 제1 중간 변수 c를 이용하여 다음 수학식 5 및 6과 같이 제2 중간 변수 c1 및 제3 중간 변수 c2를 구할 수 있다.
Figure 112007078019310-pat00003
Figure 112007078019310-pat00004
여기서, b는 주파수 밴드 인덱스를 나타내며, 제3 중간 변수 c2는 제2 중간 변수 c1의 값에 c(b)를 곱한 값으로 구할 수 있다.
다음으로, OPD 추정부(54)는 복원된 모노 신호 M 및 수학식 5 및 6에서 구한 제2 및 제3 중간 변수 c1 및 c2를 이용하여 제1 우채널 신호와 제1 좌채널 신호를 다음 수학식 7, 8과 같이 나타낼 수 있다.
Figure 112007078019310-pat00005
여기서, n은 시간 슬롯 인덱스이며, k는 파라미터 밴드 인덱스를 나타낸다. 여기서, 제1 우채널 신호
Figure 112007078019310-pat00006
는 제2 중간 변수 c1과 복원된 모노 신호 M의 곱으로 나타낼 수 있다.
Figure 112007078019310-pat00007
여기서, n은 시간 슬롯 인덱스이며, k는 파라미터 밴드 인덱스를 나타낸다. 제1 좌채널 신호
Figure 112007078019310-pat00008
는 제2 중간 변수 c2와 복원된 모노 신호 M의 곱으로 나타낼 수 있다.
이 때, IPD를
Figure 112007078019310-pat00009
라고 할 때, 제1 모노 신호
Figure 112007078019310-pat00010
는 제1 우채널 신호
Figure 112007078019310-pat00011
및 제2 좌채널 신호
Figure 112007078019310-pat00012
를 이용하여 다음 수학식 9와 같이 나타낼 수 있다.
Figure 112007078019310-pat00013
또한, 수학식 7 내지 9를 이용하여, 시간 슬롯과 파라미터 밴드에 따른 제4 중간 변수 p는 다음 수학식 10과 같이 구할 수 있다.
Figure 112007078019310-pat00014
여기서, 제4 중간 변수 p는 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호의 크기의 합을 2로 나눈 값으로 한다. 이 때, OPD의 값을
Figure 112007078019310-pat00015
라 할 때, OPD는 다음 수학식 11과 같이 구할 수 있다.
Figure 112007078019310-pat00016
또한, OPD와 IPD의 차에 해당하는 값을
Figure 112007078019310-pat00017
라 할 때,
Figure 112007078019310-pat00018
은 다음 수학식 12와 같이 구할 수 있다.
Figure 112007078019310-pat00019
수학식 11에서 구한 OPD의 값인
Figure 112007078019310-pat00020
은 복호화된 모노 신호와 업믹싱될 좌채널 신호 사이의 위상 차이고, 수학식 12에서 구한 값인
Figure 112007078019310-pat00021
는 복호화된 모노 신호와 업믹싱될 우채널 신호 사이의 위상 차를 나타낸다.
이와 같이, OPD 추정부(54)는 멀티 채널 신호의 채널 간 크기 차를 나타내는 IID를 이용하여 복원된 모노 신호로부터 좌채널 신호 및 우채널 신호에 대한 제1 좌채널 신호 및 제1 우채널 신호를 생성하고, 멀티 채널 신호의 채널 간 위상 차를 나타내는 IPD를 이용하여 제1 좌채널 신호 및 제1 우채널 신호로부터 제1 모노 신호를 생성하며, 생성된 제1 좌채널 신호, 제1 우채널 신호, 및 제1 모노 신호를 이용하여 복원된 모노 신호와 멀티 채널 신호의 위상 차를 나타내는 OPD의 값을 추정할 수 있다.
업믹싱부(55)는 파라미터 복호화부(53)에서 복원된 파라미터들인 ICC, IID, IPD 및 OPD 추정부(54)에서 추정된 OPD를 이용하여 복원된 모노 신호를 업믹싱한다. 여기서, 업믹싱은 한 채널의 모노 신호로부터 두 채널 이상의 스테레오 신호를 생성하는 것으로 다운믹싱에 상반된다. 이하에서는, 업믹싱부(55)의 업믹싱 동작에 대하여 상세하게 살펴보기로 한다.
먼저, 업믹싱부(55)는 IIC의 값이
Figure 112007078019310-pat00022
일 때, 제2 및 제3 중간 변수 c1 및 c2를 이용하여 제1 위상
Figure 112007078019310-pat00023
및 제2 위상
Figure 112007078019310-pat00024
을 다음 수학식 13 및 14와 같이 구할 수 있다.
Figure 112007078019310-pat00025
Figure 112007078019310-pat00026
다음으로, 업믹싱부(55)는 복원된 모노 신호가 M이고, 디코릴레이션된 신호가 D일 때, 수학식 13 및 14를 통해 구한 제1 및 제2 위상, 제2 및 제3 중간 변수 c1 및 c2 및 수학식 11에서 구한 OPD의 값인
Figure 112007078019310-pat00027
, 수학식 12에서 구한 값인
Figure 112007078019310-pat00028
을 이용하여 다음 수학식 15, 16와 같이 업믹싱된 좌채널 신호 및 우채널 신호를 구할 수 있다.
Figure 112007078019310-pat00029
Figure 112007078019310-pat00030
이와 같이, 본 발명의 일 실시예에 따른 복호화 시스템은 부호화단으로부터 OPD 값을 수신하지 않음에도 불구하고, 부호화단으로부터 전송된 다른 파라미터들을 이용하여 OPD 값을 추정함으로써, 업믹싱에 이용되는 파라미터의 종류가 증가되어 업믹싱된 신호의 음질을 향상시킬 수 있다.
역변환부(56)는 업믹싱부(55)에서 업믹싱된 신호를 시간 도메인으로 역변환한다.
도 6a 및 6b는 도 5의 복호화 시스템의 위상 보간 동작의 예를 나타내는 도 면이다. 이하에서는 도 5, 6a 및 6b를 참조하여, 복호화 시스템의 위상 보간 동작에 대하여 살펴보기로 한다.
멀티 채널 신호의 부호화 결과를 복호화할 때, 시간에 따른 신호의 급격한 변화를 방지하기 위해 복호화된 신호의 위상을 보간한다. 예를 들어, 현재 시간 슬롯과 이전 시간 슬롯 사이는 4개의 시간 슬롯이 존재하고, 현재 시간 슬롯에서 신호의 위상이 60도이고, 이전 시간 슬롯에서 신호의 위상이 10도이라고 하자. 이 경우, 현재 시간 슬롯과 이전 시간 슬롯 사이의 4개의 시간 슬롯에서 신호의 위상은 현재 시간 슬롯에서의 신호와 이전 시간 슬롯에서의 신호의 위상 보간을 통하여 각각 20도, 30도, 40도, 50도라고 추정할 수 있다.
도 6a에서 P1은 이전 시간 슬롯에서의 신호의 위상을 나타내고, N1은 현재 시간 슬롯에서의 신호의 위상을 나타낸다.
일반적인 신호의 위상 보간 방법에 따르면, 현재 시간 슬롯에서의 신호의 위상 N1에서 이전 시간 슬롯에서의 신호의 위상 P1을 빼고, 그 결과를 현재 시간 슬롯과 이전 시간 슬롯의 사이에 존재하는 시간 슬롯의 개수로 나눈다. 예를 들어, N1이 350도이고, P1이 25도이며, 현재 시간 슬롯과 이전 시간 슬롯의 사이에 존재하는 시간 슬롯의 개수가 4개라고 하자. 이 경우, 점선으로 표시된 화살표 방향에 따라 위상 보간을 수행하여 현재 시간 슬롯과 이전 시간 슬롯 사이의 4개의 시간 슬롯에서 신호의 위상을 각각 90도, 155도, 220도, 285도라고 추정할 수 있다.
이에 비해, 본 발명의 일 실시예에 따른 위상 보간 방법에 따르면, 현재 시간 슬롯에서의 신호의 위상 N1과 이전 시간 슬롯에서의 신호의 위상 P1의 차이의 절대값이 180도 이상인 경우에는 위상 보간의 방향을 변경할 수 있다. 보다 상세하게는, 상술한 예에서 현재 시간 슬롯에서의 신호의 위상 N1과 이전 시간 슬롯에서의 신호의 위상 P1의 차이의 절대값은 320도로써, 180도 이상이다. 이 경우, 위상 보간의 방향을 실선으로 표시된 화살표 방향으로 변경하여, 현재 시간 슬롯과 이전 시간 슬롯 사이의 4개의 시간 슬롯에서 신호의 위상은 각각 18도, 11도, 4도, 357도(즉, -3도)라고 추정할 수 있다.
도 6b에서 P2는 이전 시간 슬롯에서의 신호의 위상을 나타내고, N2는 현재 시간 슬롯에서의 신호의 위상을 나타낸다.
상술한 바와 같이, 일반적인 신호의 위상 보간 방법에 따르면, 현재 시간 슬롯에서의 신호의 위상 N2에서 이전 시간 슬롯에서의 신호의 위상 P2를 빼고, 그 결과를 현재 시간 슬롯과 이전 시간 슬롯의 사이에 존재하는 시간 슬롯의 개수로 나눈다. 예를 들어, N2가 25도이고, P2가 350도이며, 현재 시간 슬롯과 이전 시간 슬롯의 사이에 존재하는 시간 슬롯의 개수가 4개라고 하자. 이 경우, 점선으로 표시된 화살표 방향에 따라 위상 보간을 수행하여 현재 시간 슬롯과 이전 시간 슬롯 사이의 4개의 시간 슬롯에서 신호의 위상을 각각 285도, 220도, 155도, 90도라고 추정할 수 있다.
이에 비해, 본 발명의 일 실시예에 따른 위상 보간 방법에 따르면, 상술한 바와 같이 현재 시간 슬롯에서의 신호의 위상 N2와 이전 시간 슬롯에서의 신호의 위상 P2의 차이의 절대값이 180도 이상인 경우에는 위상 보간의 방향을 변경할 수 있다. 보다 상세하게는, 상술한 예에서 현재 시간 슬롯에서의 신호의 위상 N2과 이 전 시간 슬롯에서의 신호의 위상 P2의 차이의 절대값은 320도로써, 180도 이상이다. 이 경우, 위상 보간의 방향을 실선으로 표시된 화살표 방향으로 변경하여, 현재 시간 슬롯과 이전 시간 슬롯 사이의 4개의 시간 슬롯에서 신호의 위상은 각각 357도(즉, -3도), 4도, 11도, 18도라고 추정할 수 있다.
이와 같이, 본 발명의 일 실시예에 따른 위상 보간 방법은 임의의 두 시간 슬롯에서의 신호의 위상 차이의 절대값이 180도 이상인 경우 위상 보간의 방향을 변경하여, 보간된 결과 값들 사이의 위상 차이를 줄여서 신호를 시간에 따라 점진적으로 변화시킬 수 있다.
도 7은 본 발명의 일 실시예에 따른 멀티 채널 신호의 부호화 방법을 나타내는 흐름도이다.
도 7을 참조하면, 본 실시예에 따른 멀티 채널 신호의 부호화 방법은 도 1에 도시된 멀티 채널 신호의 부호화 시스템에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 1에 도시된 멀티 채널 신호의 부호화 시스템에 관하여 이상에서 기술된 내용은 본 실시예에 따른 멀티 채널 신호의 부호화 방법에도 적용된다.
700 단계에서 다운믹싱부(12)는 멀티 채널 신호를 모노 신호로 다운믹싱하고, 모노 신호 부호화부(13)는 다운믹싱된 모노 신호를 부호화한다.
710 단계에서 파라미터 추출부(14)는 멀티 채널 신호로부터 멀티 채널 신호의 채널 간 특성 관계를 나타내는 파라미터들을 추출한다. 여기서, 추출된 파라미터는 멀티 채널 신호의 채널 간 크기 차를 나타내는 IID, 멀티 채널 신호의 채널 간 상관도를 나타내는 ICC, 멀티 채널 신호의 채널 간 위상 차를 나타내는 IPD, 및 멀티 채널 신호 중 한 채널과 모노 신호의 위상 차를 나타내는 OPD 등을 포함할 수 있다.
720 단계에서 파라미터 부호화부(15)는 추출된 파라미터들 중 일부 파라미터로부터 추정될 수 있는 나머지 파라미터를 제외하고, 일부 파라미터를 부호화한다. 보다 상세하게는, 파라미터 부호화부(15)는 상기 추출된 파라미터들 중 일부 파라미터를 양자화하고, 양자화된 결과의 문맥을 기반으로 양자화된 결과를 산술 부호화한다.
730 단계에서 다중화부(16)는 부호화된 모노 신호 및 부호화된 일부 파라미터들을 다중화하여 멀티 채널 신호의 부호화 결과로써 출력한다.
도 8은 본 발명의 일 실시예에 따른 멀티 채널 신호의 복호화 방법을 나타내는 흐름도이다.
도 8을 참조하면, 본 실시예에 따른 멀티 채널 신호의 복호화 방법은 도 5에 도시된 멀티 채널 신호의 복호화 시스템에서 시계열적으로 처리되는 단계들로 구성된다. 따라서, 이하 생략된 내용이라 하더라도 도 5에 도시된 멀티 채널 신호의 복호화 시스템에 관하여 이상에서 기술된 내용은 본 실시예에 따른 멀티 채널 신호의 복호화 방법에도 적용된다.
800 단계에서 모노 신호 복호화부(52)는 멀티 채널 신호를 대표하는 모노 신호를 복원한다.
810 단계에서 파라미터 복호화부(53)는 멀티 채널 신호의 채널 간의 특성 관 계를 나타내는 파라미터들을 복원한다.
820 단계에서 OPD 추정부(54)는 복원된 파라미터들을 이용하여 추가적인 파라미터를 추정한다. 여기서, 추가적인 파라미터는 복원된 모노 신호와 멀티 채널 신호 간의 위상 차를 나타내는 위상 파라미터일 수 있다. 여기서, OPD 추정부(54)는 멀티 채널 신호의 채널 간 크기 차로부터 생성된 중간 변수들과 복원된 모노 신호를 곱하여 제1 및 제2 신호를 생성하고, 멀티 채널 신호의 채널 간 위상 차, 및 제1 및 제2 신호로부터 제3 신호를 생성하며, 제1 내지 제3 신호로부터 위상 파라미터를 추정할 수 있다.
830 단계에서 업믹싱부(55)는 복원된 파라미터들 및 추정된 파라미터를 이용하여 복원된 모노 신호를 업믹싱함으로써 멀티 채널 신호를 복원한다.
본 발명은 상술한 실시예에 한정되지 않으며, 본 발명의 사상 내에서 당업자에 의한 변형이 가능함은 물론이다.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.
도 1은 본 발명의 일 실시예에 따른 멀티 채널 신호의 부호화 시스템을 나타내는 블록도이다.
도 2는 도 1에 포함된 파라미터 추출부를 상세하게 나타내는 블록도이다.
도 3은 도 2에 포함된 IPD/OPD 추출부에서 IPD 및 OPD를 추출하는 방법을 나타내는 도면이다.
도 4a 및 4b는 도 1에 포함된 파라미터 부호화부의 구체적인 부호화 동작을 나타내는 도면이다.
도 5는 본 발명의 일 실시예에 따른 멀티 채널 신호의 복호화 시스템을 나타내는 블록도이다.
도 6a 및 6b는 도 5에 포함된 OPD 추정부의 위상 보간의 예를 나타내는 도면이다.
도 7은 본 발명의 일 실시예에 따른 멀티 채널 신호의 부호화 방법을 나타내는 흐름도이다.
도 8은 본 발명의 일 실시예에 따른 멀티 채널 신호의 복호화 방법을 나타내는 흐름도이다.

Claims (32)

  1. 비트스트림에 포함된 다운믹스된 모노신호를 복호화하는 단계;
    상기 비트스트림에 포함되며, 채널 간의 특성 관계를 나타내는 파라미터들을 복호화하는 단계;
    상기 복호화된 파라미터들을 이용하여 좌채널 신호와 우채널 신호 중 하나와 상기 다운믹스된 모노신호간의 위상 차이를 나타내는 파라미터를 추정하는 단계; 및
    상기 복호화된 파라미터들 및 상기 추정된 파라미터를 이용하여 상기 복호화된 다운믹스된 모노신호를 업믹싱함으로써 스테레오 신호를 생성하는 단계를 포함하며,
    상기 복호화된 파라미터들은 채널 간의 레벨 차이를 나타내는 파라미터와 상기 채널 간의 위상 차이를 나타내는 파라미터를 포함하는 다운믹스된 모노신호로부터 스테레오 신호를 생성하는 방법.
  2. 삭제
  3. 제1항에 있어서,
    상기 파라미터를 추정하는 단계는
    상기 채널 간 크기 차로부터 생성된 중간 변수들과 상기 복호화된 다운믹스된 모노신호를 곱하여 제1 및 제2 신호를 생성하는 단계;
    상기 채널 간 위상 차, 및 상기 제1 및 제2 신호로부터 제3 신호를 생성하는 단계; 및
    상기 제1 내지 제3 신호로부터 상기 파라미터를 추정하는 단계를 포함하는 다운믹스된 모노신호로부터 스테레오 신호를 생성하는 방법.
  4. 제1항에 있어서,
    상기 다운믹스된 모노신호를 복호화하는 단계는
    상기 다운믹스된 모노신호가 부호화된 도메인에 대한 정보를 복호화하는 단계; 및
    상기 복호화된 정보에 따라 시간 또는 주파수 도메인에서 상기 다운믹스된 모노신호를 복호화하는 단계를 포함하는 다운믹스된 모노신호로부터 스테레오 신호를 생성하는 방법.
  5. 제1항에 있어서,
    상기 복호화된 파라미터들 및 상기 추정된 파라미터를 이용하여 상기 복호화된 다운믹스된 모노신호를 업믹싱함으로써 상기 스테레오 신호를 복호화하는 단계는
    업믹싱될 신호의 위상은 현재 프레임에서의 제1 위상과 소정의 시간 이전의 프레임에서의 제2 위상을 보간하여 산출되고,
    상기 제1 및 제2 위상 간의 차이의 절대값이 180도 이하인지 또는 180도 이상인지에 따라 보간의 방향을 변경하는 다운믹스된 모노신호로부터 스테레오 신호를 생성하는 방법.
  6. 제1항에 있어서,
    상기 채널 간의 특성 관계를 나타내는 파라미터들을 복호화하는 단계는
    문맥을 기반으로 산술 복호화함으로써 상기 채널 간의 특성 관계를 나타내는 상기 파라미터들을 복호화하는 다운믹스된 모노신호로부터 스테레오 신호를 생성하는 방법.
  7. 제1항에 있어서,
    상기 업믹싱된 신호를 시간 도메인으로 역변환하는 단계를 더 포함하는 다운믹스된 모노신호로부터 스테레오 신호를 생성하는 방법.
  8. 비트스트림에 포함된 다운믹스된 모노신호를 복호화하는 단계;
    상기 비트스트림에 포함되며, 채널 간의 특성 관계를 나타내는 파라미터들을 복호화하는 단계;
    상기 복호화된 파라미터들을 이용하여 좌채널 신호와 우채널 신호 중 하나와 상기 다운믹스된 모노신호간의 위상 차이를 나타내는 파라미터를 추정하는 단계; 및
    상기 복호화된 파라미터들 및 상기 추정된 파라미터를 이용하여 상기 복호화된 다운믹스된 모노신호를 업믹싱함으로써 스테레오 신호를 생성하는 단계를 포함하며,
    상기 복호화된 파라미터들은 채널 간의 레벨 차이를 나타내는 파라미터와 상기 채널 간의 위상 차이를 나타내는 파라미터를 포함하는 다운믹스된 모노신호로부터 스테레오 신호를 생성하는 방법을 실행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
  16. 삭제
  17. 삭제
  18. 삭제
  19. 삭제
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
KR1020070109729A 2007-10-30 2007-10-30 멀티 채널 신호의 부호화/복호화 방법 및 장치 KR101505831B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020070109729A KR101505831B1 (ko) 2007-10-30 2007-10-30 멀티 채널 신호의 부호화/복호화 방법 및 장치
US12/107,117 US8254584B2 (en) 2007-10-30 2008-04-22 Method, medium, and system encoding/decoding multi-channel signal
US13/557,848 US8718284B2 (en) 2007-10-30 2012-07-25 Method, medium, and system encoding/decoding multi-channel signal
US13/563,808 US8861738B2 (en) 2007-10-30 2012-08-01 Method, medium, and system encoding/decoding multi-channel signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070109729A KR101505831B1 (ko) 2007-10-30 2007-10-30 멀티 채널 신호의 부호화/복호화 방법 및 장치

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020140026218A Division KR101500972B1 (ko) 2014-03-05 2014-03-05 멀티 채널 신호의 부호화/복호화 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20090043921A KR20090043921A (ko) 2009-05-07
KR101505831B1 true KR101505831B1 (ko) 2015-03-26

Family

ID=40582875

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070109729A KR101505831B1 (ko) 2007-10-30 2007-10-30 멀티 채널 신호의 부호화/복호화 방법 및 장치

Country Status (2)

Country Link
US (3) US8254584B2 (ko)
KR (1) KR101505831B1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101453732B1 (ko) * 2007-04-16 2014-10-24 삼성전자주식회사 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
KR101600352B1 (ko) 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR101692394B1 (ko) * 2009-08-27 2017-01-04 삼성전자주식회사 스테레오 오디오의 부호화, 복호화 방법 및 장치
WO2011039668A1 (en) * 2009-09-29 2011-04-07 Koninklijke Philips Electronics N.V. Apparatus for mixing a digital audio
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
CN102157149B (zh) * 2010-02-12 2012-08-08 华为技术有限公司 立体声信号下混方法、编解码装置和编解码系统
PL3079152T3 (pl) 2010-07-02 2018-10-31 Dolby International Ab Dekodowanie audio z selektywnym późniejszym filtrowaniem
WO2012045203A1 (en) * 2010-10-05 2012-04-12 Huawei Technologies Co., Ltd. Method and apparatus for encoding/decoding multichannel audio signal
KR101227932B1 (ko) * 2011-01-14 2013-01-30 전자부품연구원 다채널 멀티트랙 오디오 시스템 및 오디오 처리 방법
TWI450266B (zh) * 2011-04-19 2014-08-21 Hon Hai Prec Ind Co Ltd 電子裝置及音頻資料的解碼方法
EP3067886A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
PT3353779T (pt) 2015-09-25 2020-07-31 Voiceage Corp Método e sistema para codificar um sinal de som estéreo que utiliza parâmetros de codificação de um canal primário para codificar um canal secundário
CN107731238B (zh) 2016-08-10 2021-07-16 华为技术有限公司 多声道信号的编码方法和编码器
US11817878B2 (en) 2018-11-20 2023-11-14 Maxlinear, Inc. Multi-channel decoder with distributed scheduling

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050095896A (ko) * 2003-02-11 2005-10-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR20070051915A (ko) * 2004-11-02 2007-05-18 코딩 테크놀러지스 에이비 스테레오 호환성의 멀티채널 오디오 코딩

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US7499721B2 (en) * 2001-08-31 2009-03-03 Samsung Electronics Co., Ltd. Apparatus and method for transmitting and receiving forward channel quality information in a mobile communication system
KR100561869B1 (ko) * 2004-03-10 2006-03-17 삼성전자주식회사 무손실 오디오 부호화/복호화 방법 및 장치
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US20060009985A1 (en) * 2004-06-16 2006-01-12 Samsung Electronics Co., Ltd. Multi-channel audio system
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US8046217B2 (en) * 2004-08-27 2011-10-25 Panasonic Corporation Geometric calculation of absolute phases for parametric stereo decoding
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
US8346564B2 (en) * 2005-03-30 2013-01-01 Koninklijke Philips Electronics N.V. Multi-channel audio coding
US7983922B2 (en) * 2005-04-15 2011-07-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing
US7751572B2 (en) * 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
KR100773562B1 (ko) * 2006-03-06 2007-11-07 삼성전자주식회사 스테레오 신호 생성 방법 및 장치
US7965848B2 (en) * 2006-03-29 2011-06-21 Dolby International Ab Reduced number of channels decoding
JP2009532712A (ja) * 2006-03-30 2009-09-10 エルジー エレクトロニクス インコーポレイティド メディア信号処理方法及び装置
KR100829560B1 (ko) * 2006-08-09 2008-05-14 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 방법 및 장치,멀티채널이 다운믹스된 신호를 2 채널로 출력하는 복호화방법 및 장치
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050095896A (ko) * 2003-02-11 2005-10-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
KR20070051915A (ko) * 2004-11-02 2007-05-18 코딩 테크놀러지스 에이비 스테레오 호환성의 멀티채널 오디오 코딩

Also Published As

Publication number Publication date
US8718284B2 (en) 2014-05-06
US20120294448A1 (en) 2012-11-22
US8861738B2 (en) 2014-10-14
US20090110201A1 (en) 2009-04-30
US20120288099A1 (en) 2012-11-15
US8254584B2 (en) 2012-08-28
KR20090043921A (ko) 2009-05-07

Similar Documents

Publication Publication Date Title
KR101505831B1 (ko) 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR101835850B1 (ko) 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
EP2947656B1 (en) Coding multi-channel audio signals using complex prediction and differential coding
EP3779975B1 (en) Audio decoder and related methods for processing multi-channel audio signals using a variable prediction direction
CN110047496B (zh) 立体声音频编码器和解码器
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US20080077412A1 (en) Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
KR101600352B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법
US9767811B2 (en) Device and method for postprocessing a decoded multi-channel audio signal or a decoded stereo signal
KR20080109299A (ko) 오디오 신호의 부호화/복호화 방법 및 장치
TW201209805A (en) Device and method for efficiently encoding quantization parameters of spectral coefficient coding
KR101500972B1 (ko) 멀티 채널 신호의 부호화/복호화 방법 및 장치
KR101635099B1 (ko) 멀티 채널 신호의 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
E90F Notification of reason for final refusal
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180227

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20190227

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20200227

Year of fee payment: 6