KR101873771B1

KR101873771B1 - 멀티 채널 신호의 부호화/복호화 장치 및 방법

Info

Publication number: KR101873771B1
Application number: KR1020160103126A
Authority: KR
Inventors: 심환; 오은미; 김미영; 안톤 브이. 포로브
Original assignee: 삼성전자주식회사
Priority date: 2016-08-12
Filing date: 2016-08-12
Publication date: 2018-07-03
Also published as: KR20160100889A

Abstract

멀티 채널 신호의 부호화/복호화 장치가 개시된다. 멀티 채널 신호의 부호화 장치는 멀티 채널 신호의 특성을 고려하여 멀티 채널 신호의 위상을 변형시킨다. 위상이 변형된 멀티 채널 신호에서 추출된 다운믹스 신호와 잔여 신호를 이용하여 멀티 채널 신호에 대한 부호화된 비트스트림을 생성한다.

Description

멀티 채널 신호의 부호화/복호화 장치 및 방법{APPARATUS FOR ENCODING/DECODING MULTICHANNEL SIGNAL AND METHOD THEREOF}

본 발명의 실시예들은 멀티 채널 신호의 부호화/복호화 장치 및 방법에 관한 것이다.

스테레오 신호를 부호화하는데 이용되는 방법으로 파라메트릭 스테레오(PS, Parametric Stereo) 기술이 있다. 파라메트릭 스테레오 기술은 입력되는 스테레오 신호를 다운믹싱하여 모노 신호를 생성하고, 스테레오 신호에 대한 부가 정보(side information)를 나타내는 스테레오 파라미터를 추출하고, 생성된 모노 신호와 추출된 스테레오 파라미터를 부호화하여 스테레오 신호를 부호화한다.

이 경우 이용되는 스테레오 파라미터에는, 스테레오 신호에 포함된 적어도 두 채널 신호의 에너지 레벨에 따른 강도 차를 나타내는 IID(Inter-channel Intensity Difference) 혹은 CLD(channel level differences), 스테레오 신호에 포함된 적어도 두 채널 신호의 파형의 유사성에 따른 두 채널 신호 사이의 상관도를 나타내는 ICC(Inter-channel Coherence 혹은 Inter-channel Correlation), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차를 나타내는 IPD(Inter-channel Phase Difference), 스테레오 신호에 포함된 적어도 두 채널 신호 사이의 위상 차가 모노 신호를 기준으로 두 채널 사이에 어떻게 분포하는지를 나타내는 OPD(Overall Phase Difference) 등이 있다.

실시예들은 멀티 채널 신호의 위상 또는 크기를 변형시킴으로써, 이득 발산을 막아 이득 발산에 따라 잔여 신호의 값이 변하지 않도록 함으로써, 다운믹스에서 발생하는 손실(loss)을 보상하는 기술을 제공할 수 있다.

멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 복수의 파라미터 및 복수 채널 각각마다 계산된 위상각을 이용하여 멀티 채널 신호의 위상을 변형시키는 위상 변형부, 복수의 파라미터를 이용하여 위상이 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호(residual signal)를 추출하는 신호 추출부 및 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 비트스트림 생성부를 포함하는 부호화 장치가 제공된다.

일측에 따르면, 위상 변형부는 멀티 채널 신호 각각의 위상이 서로 동일해지도록 멀티 채널 신호의 위상을 변형할 수 있다.

다른 측면에서, 위상 변형부는 채널간 위상차 정보가 미리 설정된 각도 이하의 값을 갖도록 미리 결정된 값만큼 멀티 채널 신호의 위상을 변형시킬 수 있다.

또 다른 측면에서, 위상 변형부는 위상각의 변형이 최소화 되도록 멀티 채널 신호의 위상을 변형시킬 수 있다.

멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 공간적 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부, 복수의 파라미터를 이용하여 멀티 채널 신호의 크기를 변형시키는 크기 변형부, 복수의 파라미터를 이용하여 크기가 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출하는 신호 추출부 및 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 비트스트림 생성부를 포함하는 부호화 장치가 제공된다.

멀티 채널 신호의 다운믹스 신호, 잔여 신호 및 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 복호화부, 복원된 파라미터를 이용하여 다운믹스 신호 및 잔여 신호를 멀티 채널 신호로 업믹싱하는 업믹싱부 및 복원된 파라미터를 이용하여 업믹싱된 멀티 채널 신호의 위상 및 크기 중 적어도 하나를 복원하는 복원부를 포함하는 복호화 장치가 제공된다.

부호화 장치의 파라미터 추출부가 멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 단계, 부호화 장치의 위상 변형부가 복수의 파라미터 및 복수 채널 각각마다 계산된 위상각을 이용하여 멀티 채널 신호의 위상을 변형시키는 단계, 부호화 장치의 신호 추출부가 복수의 파라미터를 이용하여 위상이 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출하는 단계 및 부호화 장치의 비트스트림 생성부가 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 단계를 포함하는 부호화 방법이 제공된다.

부호화 장치의 파라미터 추출부가 멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 공간적 특성 관계를 나타내는 복수의 파라미터를 추출하는 단계, 부호화 장치의 크기 변형부가 복수의 파라미터를 이용하여 멀티 채널 신호의 크기를 변형시키는 단계, 부호화 장치의 신호 추출부가 복수의 파라미터를 이용하여 크기가 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출하는 단계 및 부호화 장치의 비트스트림 생성부가 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 단계를 포함하는 부호화 방법이 제공된다.

복호화 장치의 복호화부가 멀티 채널 신호의 다운믹스 신호, 잔여 신호 및 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원하는 단계, 복호화 장치의 업믹싱부가 복원된 파라미터를 이용하여 다운믹스 신호 및 잔여 신호를 멀티 채널 신호로 업믹싱하는 단계 및 복호화 장치의 복원부가 복원된 파라미터를 이용하여 업믹싱된 멀티 채널 신호의 위상 및 크기 중 적어도 하나를 복원하는 단계를 포함하는 복호화 방법이 제공된다.

멀티 채널 신호의 위상 또는 크기를 변형시킴으로써, 이득 발산을 막아 이득 발산에 따라 잔여 신호의 값이 변하지 않도록 함으로써, 다운믹스에서 발생하는 손실(loss)을 보상할 수 있다.

도 1은 본 발명의 일실시예에 따른 부호화 장치의 내부 구성을 설명하기 위한 블록도이다.
도 2는 본 발명의 일실시예에 있어서, 스테레오 신호로서의 멀티 채널 신호의 위상 변형을 설명하기 위한 개념도이다.
도 3은 본 발명의 일실시예에 있어서, 멀티 채널 신호를 부호화하는 방법을 도시한 흐름도이다.
도 4는 본 발명의 다른 실시예에 따른 부호화 장치의 내부 구성을 설명하기 위한 블록도이다.
도 5는 본 발명의 일실시예에 있어서, 스테레오 신호로서의 멀티 채널 신호의 크기 변형을 설명하기 위한 개념도이다.
도 6은 본 발명의 다른 실시예에 있어서, 멀티 채널 신호를 부호화하는 방법을 도시한 흐름도이다.
도 7은 본 발명의 일실시예에 있어서, 복호화 장치의 내부 구성을 설명하기 위한 블록도이다.
도 8은 본 발명의 일실시예에 있어서, 복호화 방법을 도시한 흐름도이다.

이하에서, 본 발명에 따른 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.

도 1은 본 발명의 일실시예에 따른 부호화 장치의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 부호화 장치(100)는 멀티 채널 신호를 부호화하기 위해 도 1에 도시된 바와 같이, 파라미터 추출부(110), 위상 변형부(120), 신호 추출부(130) 및 비트스트림 생성부(140)를 포함한다. 이하, 각 구성 요소 별로 그 기능을 상술하기로 한다.

여기서, 멀티 채널 신호는 복수의 채널들의 신호를 의미하며, 본 명세서에서는 멀티 채널 신호에 포함된 복수의 채널들 각각을 채널 신호라고 하기로 한다.

파라미터 추출부(110)는 멀티 채널 신호로부터 상기 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 여기서, 복수의 파라미터는 복수 채널간의 에너지 차 파라미터(CLD: Channel Level Differences), 복수 채널 간의 위상 차 파라미터(IPD: Inter-channel Phase Difference) 및 복수 채널 간의 유사도 파라미터(ICC: Inter Channel Coherence) 중 둘 이상을 포함할 수 있다. 상기 파라미터에는 다운믹스와 각 채널의 위상 차 파라미터(OPD: Overall Phase Difference) 및 상응하는 공간 파라미터를 포함할 수 있다.

위상 변형부(120)는 복수의 파라미터 및 복수 채널 각각마다 계산된 위상각을 이용하여 멀티 채널 신호의 위상을 변형시킨다. 이때, 일실시예로, 위상 변형부(120)는 멀티 채널 신호 각각의 위상이 서로 동일해지도록 멀티 채널 신호의 위상을 변형시킬 수 있다. 다른 실시예로, 위상 변형부(120)는 채널간 위상차 정보가 미리 설정된 각도 이하의 값을 갖도록 미리 결정된 값만큼 상기 멀티 채널 신호의 위상을 변형시킬 수 있다. 일례로, 미리 설정된 각도는 90도일 수 있다. 또 다른 실시예로, 위상 변형부(120)는 위상각의 변형이 최소화 되도록 멀티 채널 신호의 위상을 변형시킬 수 있다. 각각의 실시예에 따른 위상 변형부(120)에 대해서는 이후 더욱 자세히 설명한다.

신호 추출부(130)는 복수의 파라미터를 이용하여 위상이 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호(residual signal)를 추출한다. 여기서 다운믹스 신호는 두 채널 이상의 멀티 채널 신호로부터 생성된 한 채널의 신호를 포함할 수 있다. 이때, 두 채널 이상의 멀티 채널 신호로부터 다운믹스 신호를 생성하는 것을 다운믹싱이라 하고, 이러한 다운믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트량을 줄일 수 있다. 즉, 다운믹스 신호는 멀티 채널 신호를 대표하는 신호일 수 있다. 이때, 잔여 신호는, 원신호를 다운믹스 신호와 복수의 파라미터로 부호화하는 과정 중에 상실되는 정보를 이용하여 생성될 수 있다. 파라메트릭 표현으로 발생하는 에러신호인 잔여 신호를 부호화하여 높은 비트레이트에서는 잔여 신호를 통해 고음질을 제공할 수 있다.

비트스트림 생성부(140)는 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성한다. 즉, 부호화 장치(100)는 멀티 채널 신호 각각을 부호화하지 않고, 복수의 파라미터를 이용하여 추출된 다운믹스 신호와 잔여 신호만을 부호화하여 전송할 수 있다. 일례로, 멀티 채널 신호가 음성(voice) 신호인 경우, 비트스트림 생성부(140)는 다운믹스 신호 및 잔여 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화하여 비트스트림을 생성할 수 있다. 또한, 다른 일례로서, 멀티 채널 신호가 음악(music) 신호인 경우, 비트스트림 생성부(140)는 기존의 MPEG-2/4 AAC나 mp3 등의 방법을 이용하여 다운믹스 신호 및 잔여 신호를 부호화하여 비트스트림을 생성할 수 있다. 상기 잔여 신호는 선택에 따라 전송하지 않을 수도 있다.

다른 실시예로, 부호화 장치(100)는 위상 변형부(120)를 별도로 포함하지 않고, 신호 추출부(130)에서 위상 변형과 다운믹스 신호 및 잔여 신호의 추출을 한번에 처리할 수도 있다. 즉, 다른 실시예에 따른 부호화 장치(100)는 멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부(110), 복수의 파라미터 및 복수 채널 각각마다 계산된 위상각을 이용하여 멀티 채널 신호의 위상을 변형시키고, 위상이 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출하는 신호 추출부(130) 및 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 비트스트림 생성부(140)만을 포함할 수도 있다.

도 2는 본 발명의 일실시예에 있어서, 스테레오 신호로서의 멀티 채널 신호의 위상 변형을 설명하기 위한 개념도이다.

도 2에서는 설명의 편의상 부호화 장치(100)에 입력되는 멀티 채널 신호가 좌채널 신호 및 우채널 신호를 포함하는 스테레오 신호인 것으로 가정한다. 그러나, 본 실시예에 따른 부호화 장치(100)가 스테레오 신호에 한정되지 않고 멀티 채널 신호의 부호화에도 이용될 수 있음은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에게 자명하다고 할 수 있다.

도 2에서는 좌채널 신호 'L', 우채널 신호 'R', 다운믹스 신호 'M' 및 잔여 신호 'S'간의 관계를 도시하고 있다. 이러한 스테레오 신호의 다운믹스나 업믹스 시, 좌채널 신호 'L' 및 우채널 신호 'R'가 역위상(out-of-phase) 또는 역위상에 근접(near out-of-phase)일 때, 'L'+'R'의 크기가 감소하고 때에 따라서는 0에 가까워질 수 있다. 이에 따르는 에너지 손실을 보상하기 위해서, 다운믹스 신호 'M'의 크기는 일반적으로 'L'과 'R'의 합에 'L'과 'R'의 각 에너지의 합을 반영하도록 계산된 이득(gain)을 곱해서 설정하게 된다. 이러한 이득은 역위상이나 역위상에 근접할수록 커지게 되고, 추출된 복수의 파라미터의 관계에 따라 발산이 일어나게 될 수 있으며, 구해진 이득은 잔여 신호 'S'에도 곱해지게 되므로 잔여신호의 크기가 커지게 된다. 따라서, 이러한 이득을 제한(gain limiting)할 필요가 있다. 그러나 이러한 이득 제한은 다운믹스 신호 'M' 뿐만 아니라 잔여 신호 'S'에도 영향을 주기 때문에 본 실시예에 따른 부호화 장치(100)는 스테레오 신호의 위상을 변형시켜 위상차 정보인 IPD의 값을 조절함으로써, 이득의 값을 조절할 수 있다. 즉, 도 2에서는 좌채널 신호 'L'의 위상을 변형시킨 위상 변형된 좌채널 신호 'L´'와 우채널 신호 'R'의 위상을 변형시킨 위상 변형된 우채널 신호 'R´'를 나타내고 있다. 이와 같이 위상 변형된 좌채널 신호 'L´'와 위상 변형된 우채널 신호 'R´'를 이용하여 다운믹스나 업믹스를 수행하는 경우, 도 2에 도시된 바와 같이, 역위상이 발생하지 않기 때문에 이득 발산을 막을 수 있다. 또한, 이득 발산을 막음으로써, 이득 발산에 따라 잔여 신호 'S'의 값이 변하지 않도록 함으로써, 다운믹스에서 발생하는 손실(loss)을 보상할 수 있다.

도 3은 본 발명의 일실시예에 있어서, 멀티 채널 신호를 부호화하는 방법을 도시한 흐름도이다. 본 실시예에 따른 부호화 방법은 도 1을 통해 설명한 부호화 장치(100)를 통해 수행될 수 있다. 도 3에서는 부호화 장치(100)를 통해 각각의 단계가 수행되는 과정을 설명함으로써, 부호화 방법을 설명한다.

단계(310)에서 부호화 장치(100)는 멀티 채널 신호로부터 상기 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 여기서, 복수의 파라미터는 복수 채널간의 에너지 차 파라미터, 복수 채널 간의 위상 차 파라미터 및 복수 채널 간의 유사도 파라미터 중 둘 이상을 포함할 수 있다. 이러한 단계(310)는 부호화 장치(100)의 파라미터 추출부(110)에서 수행될 수 있다.

단계(320)에서 부호화 장치(100)는 복수의 파라미터 및 복수 채널 각각마다 계산된 위상각을 이용하여 멀티 채널 신호의 위상을 변형시킨다. 이때, 일실시예로, 부호화 장치(100)는 멀티 채널 신호 각각의 위상이 서로 동일해지도록 멀티 채널 신호의 위상을 변형시킬 수 있다. 다른 실시예로, 부호화 장치(100)는 채널간 위상차 정보가 미리 설정된 각도 이하의 값을 갖도록 미리 결정된 값만큼 상기 멀티 채널 신호의 위상을 변형시킬 수 있다. 일례로, 미리 설정된 각도는 90도일 수 있다. 또 다른 실시예로, 부호화 장치(100)는 위상각의 변형이 최소화 되도록 멀티 채널 신호의 위상을 변형시킬 수 있다. 각각의 실시예에 따른 위상 변형에 대해서는 이후 더욱 자세히 설명한다. 이때, 단계(320)는 부호화 장치(100)의 위상 변형부(120)에서 수행될 수 있다.

단계(330)에서 부호화 장치(100)는 복수의 파라미터를 이용하여 위상이 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출한다. 여기서 다운믹스 신호는 두 채널 이상의 멀티 채널 신호로부터 생성된 한 채널의 신호를 포함할 수 있다. 이때, 두 채널 이상의 멀티 채널 신호로부터 다운믹스 신호를 생성하는 것을 다운믹싱이라 하고, 이러한 다운믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트량을 줄일 수 있다. 즉, 다운믹스 신호는 멀티 채널 신호를 대표하는 신호일 수 있다. 이때, 잔여 신호는, 원신호를 다운믹스 신호와 복수의 파라미터로 부호화하는 과정 중에 상실되는 정보를 이용하여 생성될 수 있다. 파라메트릭 표현으로 발생하는 에러신호인 잔여 신호를 부호화하여 높은 비트레이트에서는 잔여 신호를 통해 고음질을 제공할 수 있다. 이러한 단계(330)는 부호화 장치(100)의 비트스트림 생성부(140)에서 수행될 수 있다.

단계(340)에서 부호화 장치(100)는 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성한다. 즉, 부호화 장치(100)는 멀티 채널 신호 각각을 부호화하지 않고, 복수의 파라미터를 이용하여 추출된 다운믹스 신호와 잔여 신호만을 부호화하여 전송할 수 있다. 일례로, 멀티 채널 신호가 음성(voice) 신호인 경우, 부호화 장치(100)는 다운믹스 신호 및 잔여 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화하여 비트스트림을 생성할 수 있다. 또한, 다른 일례로서, 멀티 채널 신호가 음악(music) 신호인 경우, 부호화 장치(100)는 기존의 MPEG-2/4 AAC나 mp3 등의 방식을 이용하여 다운믹스 신호 및 잔여 신호를 부호화하여 비트스트림을 생성할 수 있다. 이러한 단계(340)은 부호화 장치(100)의 비트스트림 생성부(140)를 통해 수행될 수 있다. 상기 잔여 신호는 선택에 따라 전송하지 않을 수도 있다.

다른 실시예로, 부호화 방법은 위상을 변형시키는 단계(320)를 별도로 포함하지 않고, 신호를 추출하는 단계(330)에서 위상 변형과 다운믹스 신호 및 잔여 신호의 추출을 한번에 처리할 수도 있다. 즉, 다른 실시예에 따른 부호화 방법은 멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출하는 단계(310), 복수의 파라미터 및 복수 채널 각각마다 계산된 위상각을 이용하여 멀티 채널 신호의 위상을 변형시키고, 위상이 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출하는 단계(미도시) 및 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 단계(340)를 포함할 수도 있다.

도 1 내지 도 3에서는 멀티 채널 신호의 위상을 변형시켜 부호화하는 부호화 장치 및 방법을 설명하였다. 이후 도 4 내지 도 6에서는 멀티 채널 신호의 크기를 변형시켜 부호화하는 부호화 장치 및 방법에 대해 설명한다.

도 4는 본 발명의 다른 실시예에 따른 부호화 장치의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 부호화 장치(400)는 도 4에 도시된 바와 같이, 파라미터 추출부(410), 크기 변형부(420), 신호 추출부(430) 및 비트스트림 생성부(440)를 포함한다.

파라미터 추출부(410)는 멀티 채널 신호로부터 상기 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 여기서, 복수의 파라미터는 복수 채널간의 에너지 차 파라미터, 복수 채널 간의 위상 차 파라미터 및 복수 채널 간의 유사도 파라미터 중 둘 이상을 포함할 수 있다.

크기 변형부(420)는 복수의 파라미터를 이용하여 상기 멀티 채널 신호의 크기를 변형시킨다. 이때, 크기 변형부(420)는 멀티 채널 신호 중 적어도 하나의 채널 신호의 크기를 변형시킬 수 있다. 이때, 크기를 변형시키기 위한 값은 추출된 복수의 파라미터에 따라 결정될 수 있다. 예를 들어, 크기 변형부(420)는 이득이 임의의 최대값을 넘지 않도록 멀티 채널 신호 중 하나의 채널 신호의 크기를 변형시킬 수 있다.

신호 추출부(430)는 복수의 파라미터를 이용하여 크기가 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출한다. 여기서 다운믹스 신호는 두 채널 이상의 멀티 채널 신호로부터 생성된 한 채널의 신호를 포함할 수 있다. 이때, 두 채널 이상의 멀티 채널 신호로부터 다운믹스 신호를 생성하는 것을 다운믹싱이라 하고, 이러한 다운믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트량을 줄일 수 있다. 즉, 다운믹스 신호는 멀티 채널 신호를 대표하는 신호일 수 있다. 이때, 잔여 신호는, 원신호를 다운믹스 신호와 복수의 파라미터로 부호화하는 과정 중에 상실되는 정보를 이용하여 생성될 수 있다. 파라메트릭 표현으로 발생하는 에러신호인 잔여 신호를 부호화하여 높은 비트레이트에서는 잔여 신호를 통해 고음질을 제공할 수 있다.

비트스트림 생성부(440)는 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성한다. 즉, 부호화 장치(400)는 멀티 채널 신호 각각을 부호화하지 않고, 복수의 파라미터를 이용하여 추출된 다운믹스 신호와 잔여 신호만을 부호화하여 전송할 수 있다. 일례로, 멀티 채널 신호가 음성(voice) 신호인 경우, 비트스트림 생성부(440)는 다운믹스 신호 및 잔여 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화하여 비트스트림을 생성할 수 있다. 또한, 다른 일례로서, 멀티 채널 신호가 음악(music) 신호인 경우, 비트스트림 생성부(440)는 기존의 MPEG-2/4 AAC나 mp3 등의 방법을 이용하여 다운믹스 신호 및 잔여 신호를 부호화하여 비트스트림을 생성할 수 있다. 상기 잔여 신호는 선택에 따라 전송하지 않을 수도 있다.

다른 실시예로, 부호화 장치(400)는 크기 변형부(420)를 별도로 포함하지 않고, 신호 추출부(430)에서 크기 변형과 다운믹스 신호 및 잔여 신호의 추출을 한번에 처리할 수도 있다. 즉, 다른 실시예에 따른 부호화 장치(400)는 멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 공간적 특성 관계를 나타내는 복수의 파라미터를 추출하는 파라미터 추출부(410), 복수의 파라미터를 이용하여 멀티 채널 신호의 크기를 변형시키고, 크기가 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출하는 신호 추출부(430) 및 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 비트스트림 생성부(440)만을 포함할 수도 있다.

도 5는 본 발명의 일실시예에 있어서, 스테레오 신호로서의 멀티 채널 신호의 크기 변형을 설명하기 위한 개념도이다.

도 5에서도 설명의 편의를 위해 부호화 장치(400)에 입력되는 멀티 채널 신호가 좌채널 신호 및 우채널 신호를 포함하는 스테레오 신호인 것으로 가정한다.

도 5에서는 좌채널 신호 'L', 우채널 신호 'R' 및 다운믹스 신호 'M'간의 관계를 도시하고 있다. 이러한 스테레오 신호의 다운믹스나 업믹스 시, 좌채널 신호 'L' 및 우채널 신호 'R'가 역위상(out-of-phase) 또는 역위상에 근접(near out-of-phase)일 때, 'L'+'R'의 크기가 감소하고 때에 따라서는 0에 가까워질 수 있다. 이에 따르는 에너지 손실을 보상하기 위해서, 다운믹스 신호 'M'의 크기는 일반적으로 'L'과 'R'의 합에 'L'과 'R'의 각 에너지의 합을 반영하도록 계산된 이득(gain)을 곱해서 설정하게 된다. 이러한 이득은 역위상이나 역위상에 근접할수록 커지게 되고, 추출된 복수의 파라미터의 관계에 따라 발산이 일어나게 될 수 있으며, 구해진 이득은 잔여 신호 'S'에도 곱해지게 되므로 잔여신호의 크기가 커지게 된다. 따라서, 이러한 이득을 제한(gain limiting)할 필요가 있다. 그러나 이러한 이득 제한은 다운믹스 신호 'M' 뿐만 아니라 잔여 신호 'S'에도 영향을 주기 때문에 본 실시예에 따른 부호화 장치(400)는 이득값이 임의의 최대값을 넘지 않도록 스테레오 신호의 크기를 변형시킬 수 있다. 즉, 도 5에서 좌측 그래프는 좌채널 신호 'L' 및 우채널 신호 'R'가 역위상에 근접할 때의 모습을 나타내고, 우측 그래프는 이득이 임의의 최대값을 넘지 않도록 우채널 신호 'R'의 크기를 변형시킨 모습을 나타낸다. 이와 같이, 크기 변형된 우채널 신호 'R´'과 좌채널 신호 'L'을 이용하여 다운믹스나 업믹스를 수행하는 경우, 도 5에 도시된 바와 같이, 이득 발산을 막을 수 있다. 또한, 이득 발산을 막음으로써, 이득 발산에 따라 잔여 신호 'S'의 값이 변하지 않도록 함으로써, 다운믹스에서 발생하는 손실을 보상할 수 있다.

도 6은 본 발명의 다른 실시예에 있어서, 멀티 채널 신호를 부호화하는 방법을 도시한 흐름도이다. 본 실시예에 따른 부호화 방법은 도 4를 통해 설명한 부호화 장치(400)를 통해 수행될 수 있다. 도 6에서는 부호화 장치(400)를 통해 각각의 단계가 수행되는 과정을 설명함으로써, 부호화 방법을 설명한다.

단계(610)에서 부호화 장치(400)는 멀티 채널 신호로부터 상기 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 추출한다. 여기서, 복수의 파라미터는 복수 채널간의 에너지 차 파라미터, 복수 채널 간의 위상 차 파라미터 및 복수 채널 간의 유사도 파라미터 중 둘 이상을 포함할 수 있다. 이러한 단계(610)는 부호화 장치(400)의 파라미터 추출부(410)에서 수행될 수 있다.

단계(620)에서 부호화 장치(400)는 복수의 파라미터를 이용하여 상기 멀티 채널 신호의 크기를 변형시킨다. 이때, 부호화 장치(400)는 멀티 채널 신호 중 적어도 하나의 채널 신호의 크기를 변형시킬 수 있다. 이때, 크기를 변형시키기 위한 값은 추출된 복수의 파라미터에 따라 결정될 수 있다. 예를 들어, 부호화 장치(400)는 이득이 임의의 최대값을 넘지 않도록 멀티 채널 신호 중 하나의 채널 신호의 크기를 변형시킬 수 있다. 이러한 단계(620)는 부호화 장치(400)의 크기 변형부(420)에서 수행될 수 있다.

단계(630)에서 부호화 장치(400)는 복수의 파라미터를 이용하여 크기가 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출한다. 여기서 다운믹스 신호는 두 채널 이상의 멀티 채널 신호로부터 생성된 한 채널의 신호를 포함할 수 있다. 이때, 두 채널 이상의 멀티 채널 신호로부터 다운믹스 신호를 생성하는 것을 다운믹싱이라 하고, 이러한 다운믹싱을 통하여 부호화 과정에 생성되는 비트스트림의 비트량을 줄일 수 있다. 즉, 다운믹스 신호는 멀티 채널 신호를 대표하는 신호일 수 있다. 이때, 잔여 신호는, 원신호를 다운믹스 신호와 복수의 파라미터로 부호화하는 과정 중에 상실되는 정보를 이용하여 생성될 수 있다. 파라메트릭 표현으로 발생하는 에러신호인 잔여 신호를 부호화하여 높은 비트레이트에서는 잔여 신호를 통해 고음질을 제공할 수 있다. 이러한 단계(630)는 부호화 장치(400)의 신호 추출부(430)에서 수행될 수 있다.

단계(640)에서 부호화 장치(400)는 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성한다. 즉, 부호화 장치(400)는 멀티 채널 신호 각각을 부호화하지 않고, 복수의 파라미터를 이용하여 추출된 다운믹스 신호와 잔여 신호만을 부호화하여 전송할 수 있다. 일례로, 멀티 채널 신호가 음성(voice) 신호인 경우, 부호화 장치(400)는 다운믹스 신호 및 잔여 신호를 CELP(Code Excited Linear Prediction) 방식으로 부호화하여 비트스트림을 생성할 수 있다. 또한, 다른 일례로서, 멀티 채널 신호가 음악(music) 신호인 경우, 부호화 장치(400)는 기존의 MPEG-2/4 AAC나 mp3 등의 방법을 이용하여 다운믹스 신호 및 잔여 신호를 부호화하여 비트스트림을 생성할 수 있다. 이러한 단계(640)는 부호화 장치(400)의 비트스트림 생성부(440)에서 수행될 수 있다. 상기 잔여 신호는 선택에 따라 전송하지 않을 수도 있다.

다른 실시예로, 부호화 방법은 크기를 변형시키는 단계(620)를 별도로 포함하지 않고, 신호를 추출하는 단계(630)에서 크기 변형과 다운믹스 신호 및 잔여 신호의 추출을 한번에 처리할 수도 있다. 즉, 다른 실시예에 따른 부호화 방법은 멀티 채널 신호로부터 멀티 채널 신호를 구성하는 복수 채널 간의 공간적 특성 관계를 나타내는 복수의 파라미터를 추출하는 단계(610), 복수의 파라미터를 이용하여 멀티 채널 신호의 크기를 변형시키고, 크기가 변형된 멀티 채널 신호에서 다운믹스 신호와 잔여 신호를 추출하는 단계(미도시) 및 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 부호화하여 비트스트림을 생성하는 단계(640)를 포함할 수도 있다.

도 7은 본 발명의 일실시예에 있어서, 복호화 장치의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 복호화 장치(700)는 도 7에 도시된 바와 같이 복호화부(710), 업믹싱부(720) 및 복원부(730)를 포함한다.

복호화부(710)는 멀티 채널 신호의 다운믹스 신호, 잔여 신호 및 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원한다. 이때, 멀티 채널 신호는 도 1 내지 도 6을 통해 설명한 멀티 채널 신호에 대응될 수 있다. 예를 들어, 부호화 장치(100 또는 400)에서 멀티 채널 신호를 부호화하여 생성한 비트스트림을 복호화 장치(700)에서 수신하여, 수신한 비트스트림으로부터 멀티 채널 신호의 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 복호화하여 복원할 수 있다.

업믹싱부(720)는 복원된 파라미터를 이용하여 다운믹스 신호 및 잔여 신호를 멀티 채널 신호로 업믹싱한다. 여기서, 업믹싱은 하나의 채널 신호인 다운믹스 신호와 잔여 신호를 이용하여 두 채널 이상의 멀티 채널 신호를 생성하는 것으로 다운믹스 신호와 잔여 신호를 추출하기 위한 다운믹싱과 대응된다.

복원부(730)는 복원된 파라미터를 이용하여 업믹싱된 멀티 채널 신호의 위상 및 크기 중 적어도 하나를 복원한다. 즉, 복원부(730)는 도 1 내지 도 3을 통해 설명한 위상 변형을 이용하여 부호화된 멀티 채널 신호에 대해서는 위상을 복원할 수 있고, 도 4 내지 도 6을 통해 설명한 크기 변형을 이용하여 부호화된 멀티 채널 신호에 대해서는 크기를 복원할 수 있다. 이러한 복원 방법에 대해서는 이후 더욱 자세히 설명한다.

도 8은 본 발명의 일실시예에 있어서, 복호화 방법을 도시한 흐름도이다. 본 실시예에 따른 복호화 방법은 도 7을 통해 설명한 복호화 장치(700)를 통해 수행될 수 있다. 도 8에서는 복호화 장치(700)를 통해 각각의 단계가 수행되는 과정을 설명함으로써, 복호화 방법을 설명한다.

단계(810)에서 복호화 장치(700)는 멀티 채널 신호의 다운믹스 신호, 잔여 신호 및 멀티 채널 신호를 구성하는 복수 채널 간의 특성 관계를 나타내는 복수의 파라미터를 복원한다. 이때, 멀티 채널 신호는 도 1 내지 도 6을 통해 설명한 멀티 채널 신호에 대응될 수 있다. 예를 들어, 부호화 장치(100 또는 400)에서 멀티 채널 신호를 부호화하여 생성한 비트스트림을 복호화 장치(700)에서 수신하여, 수신한 비트스트림으로부터 멀티 채널 신호의 다운믹스 신호, 잔여 신호 및 복수의 파라미터를 복호화하여 복원할 수 있다. 이러한 단계(810)는 복호화 장치(700)의 복호화부(710)에서 수행될 수 있다.

단계(820)에서 복호화 장치(700)는 복원된 파라미터를 이용하여 다운믹스 신호 및 잔여 신호를 멀티 채널 신호로 업믹싱한다. 여기서, 업믹싱은 하나의 채널 신호인 다운믹스 신호와 잔여 신호를 이용하여 두 채널 이상의 멀티 채널 신호를 생성하는 것으로 다운믹스 신호와 잔여 신호를 추출하기 위한 다운믹싱과 대응된다. 이러한 단계(820)는 복호화 장치(700)의 업믹싱부(720)에서 수행될 수 있다.

단계(830)에서 복호화 장치(700)는 복원된 파라미터를 이용하여 업믹싱된 멀티 채널 신호의 위상 및 크기 중 적어도 하나를 복원한다. 즉, 복원부(730)는 도 1 내지 도 3을 통해 설명한 위상 변형을 이용하여 부호화된 멀티 채널 신호에 대해서는 위상을 복원할 수 있고, 도 4 내지 도 6을 통해 설명한 크기 변형을 이용하여 부호화된 멀티 채널 신호에 대해서는 크기를 복원할 수 있다. 이러한 단계(830)는 복호화 장치(700)의 복원부(730)에서 수행될 수 있고, 복원 방법에 대해서는 이후 더욱 자세히 설명한다.

아래 수학식 1은 복호화 장치 및 방법에서 멀티 채널 신호의 업믹싱에 이용될 수 있는 매트릭스 '

'의 일례를 나타낸다. 예를 들어, 다운믹스 신호의 값과 잔여 신호의 값을 원소로 갖는 매트릭스와 매트릭스 '

'간의 매트릭스 연산을 통해 업믹싱이 이루어질 수 있다.

여기서, 'resBands'는 잔여 신호의 대역(bands)을 나타내고, '

', '

' 및 '

' 는 각각 아래 수학식 2 내지 수학식 4와 같이 표현될 수 있다.

또한, 아래 수학식 5는 본 발명의 일실시예에 따른 부호화 장치 및 방법에서 멀티 채널 신호의 다운믹싱에 이용될 수 있는 매트릭스 '

'의 일례를 나타낸다. 예를 들어, 좌채널 신호의 값과 우채널 신호의 값을 원소로 갖는 매트릭스와 매트릭스 '

'간의 매트릭스 연산을 통해 다운믹싱이 이루어질 수 있다.

이때, 상술한 수학식들에서 'θ ₁'과 'θ ₂'를 통해 멀티 채널 신호의 위상이 변형될 수 있다. 즉, 'θ ₁'과 'θ ₂'는 도 1 및 도 3에서 설명한 채널 각각의 위상각에 대응될 수 있다. 즉, '

', '

' 및 '

'의 분모 값이 아래 수학식 6과 같이 임의의 값 ε보다 크도록 'θ ₁'과 'θ ₂'를 설정함으로써, 이득 제한을 최소화할 수 있다.

즉, 상술한 바와 같이, 본 실시예에 따른 부호화 장치는 멀티 채널 신호 각각의 위상이 서로 동일해지도록 멀티 채널 신호의 위상을 변형시킬 수 있다. 예를 들어, 'θ ₁ - θ ₂'의 값이 'IPD^l,m'의 값과 동일한 값을 갖는 경우, 완전한 위상 얼라이닝(aligning)이 이루어져 이득 발산을 막을 수 있다.

또한, 다른 실시예로 부호화 장치는 채널간 위상차 정보가 미리 설정된 각도 이하의 값을 갖도록 미리 결정된 값만큼 상기 멀티 채널 신호의 위상을 변형시킬 수도 있다. 예를 들어, 부호화 장치는 'IPD^l,m'의 값이 파이(π)보다 작거나 같은 경우에는 'θ ₁'과 'θ ₂'를 각각 'π/4' 및 '-(π/4)'로 설정하거나 또는 하여 'IPD^l,m'의 값이 파이(π)보다 큰 경우에는 'θ ₁'과 'θ ₂'를 각각 'π/4' 및 '-(π/4)'로 설정하여, 'cos(IPD^l,m - (θ ₁ - θ ₂))'의 값이 항상 0보다 크거나 같도록 할 수 있다. 이 경우, 미리 설정된 각도는 90도 일 수 있다. θ ₁, θ ₂값은 임의의 상수이거나 상기 추출된 복수의 파라미터에 의해 계산될 수 있다.

또 다른 실시예로 부호화 장치는 위상각의 변형이 최소화 되도록 멀티 채널 신호의 위상을 변형시킬 수도 있다. 즉, 변형되는 위상의 크기를 최소화함으로써, 복호화 장치의 업믹싱은 기존의 방법을 그대로 사용하고, 부호화 장치에서 다운믹싱하는 경우에만, 이러한 위상이 변형되도록 할 수도 있다.

본 발명의 다른 실시예에 따른 부호화 장치는 상술한 바와 같이, 멀티 채널 신호 중 적어도 하나의 채널 신호의 크기를 변형시킬 수 있다. 이때, 아래 수학식 7은 다른 실시예에 따른 부호화 장치에서 다운믹싱에 이용될 매트릭스의 일례를 나타내고, 수학식 8은 다른 실시예에 따른 복호화 장치에서 업믹싱에 이용될 매트릭스의 일례를 나타낸다.

여기서, 'L' 및, 'R'은 멀티 채널 신호가 스테레오 신호인 경우의 좌채널 신호의 값 및 우채널 신호의 값을, 'M'은 다운믹스 신호의 값을 그리고 'S'는 잔여 신호의 값을 각각 의미할 수 있다. 또한, 'A'는 아래 수학식 9와 같이 표현될 수 있다.

즉, 수학식 7에 따르면, 우채널 신호의 값인 크기를 'A'에 기초하여 변형시킴으로써, 이득의 값이 임의의 최대값을 넘지 않도록 제어할 수 있다.

상술한 수학식 1 내지 수학식 9는 하나의 일례일 뿐, '

', '

'를 계산하는 방법이나 'θ ₁'과 'θ ₂'를 결정하는 방법 등은 크기나 위상 파라미터(예를 들어 IPD)에 기초하여 다양하게 변경될 수 있다. 예를 들어, OPD 추정(estimation)을 사용하거나 IPD, CLD 및 ICC에 의존적으로 값을 설정할 수도 있으며 'θ ₁ = -θ ₂'으로 설정하여 간단히 할 수도 있다.

이와 같이, 본 발명의 실시예들에 따르면, 멀티 채널 신호의 위상 또는 크기를 변형시킴으로써, 이득 발산을 막아 이득 발산에 따라 잔여 신호의 값이 변하지 않도록 함으로써, 다운믹스에서 발생하는 손실을 보상할 수 있다.

또한, 본 발명의 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 일실시예들의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.

100: 부호화 장치
110: 파라미터 추출부
120: 위상 변형부
130: 신호 추출부
140: 비트스트림 생성부

Claims

비트스트림으로부터 모노 다운믹스 신호, 잔여 신호, 채널 간 위상 차 파라미터(IPD: Inter-channel Phase Difference) 및 채널 간 에너지 차 파라미터(CLD: channel level differences)를 복호화하는 복호화부; 및
상기 채널 간 위상 차 파라미터(IPD) 및 상기 채널 간 에너지 차 파라미터(CLD)로부터 다운믹스 신호 및 채널 간의 위상 차 파라미터(OPD: Overall Phase Difference)를 추정하고, 상기 다운믹스 신호 및 채널 간의 위상 차 파라미터(OPD) 및 상기 잔여 신호를 이용하여, 상기 모노 다운믹스 신호를 좌측 채널 및 우측 채널을 포함하는 스테레오 신호로 업믹싱하는 업믹싱부
를 포함하고,
상기 채널 간 위상 차 파라미터(IPD)는 좌측 채널 및 우측 채널 간의 위상 차이이고,
상기 다운믹스 신호 및 채널 간의 위상 차 파라미터(OPD)는 상기 모노 다운믹스 신호와 상기 좌측 채널 간의 위상 차이 및 상기 모노 다운믹스 신호와 상기 우측 채널 간의 위상 차이 중 하나인, 복호화 장치.
복호화 장치에 의해 수행되는 복호화 방법에 있어서,
비트스트림으로부터 모노 다운믹스 신호, 잔여 신호, 채널 간 위상 차 파라미터(IPD: Inter-channel Phase Difference) 및 채널 간 에너지 차 파라미터(CLD: channel level differences)를 복호화하는 단계; 및
상기 채널 간 위상 차 파라미터(IPD) 및 상기 채널 간 에너지 차 파라미터(CLD)로부터 다운믹스 신호 및 채널 간의 위상 차 파라미터(OPD: Overall Phase Difference)를 추정하고, 상기 다운믹스 신호 및 채널 간의 위상 차 파라미터(OPD) 및 상기 잔여 신호를 이용하여, 상기 모노 다운믹스 신호를 좌측 채널 및 우측 채널을 포함하는 스테레오 신호로 업믹싱하는 단계
를 포함하고,
상기 채널 간 위상 차 파라미터(IPD)는 좌측 채널 및 우측 채널 간의 위상 차이이고,
상기 다운믹스 신호 및 채널 간의 위상 차 파라미터(OPD)는 상기 모노 다운믹스 신호와 상기 좌측 채널 간의 위상 차이 및 상기 모노 다운믹스 신호와 상기 우측 채널 간의 위상 차이 중 하나인, 복호화 방법.
삭제