WO2015037961A1

WO2015037961A1 - 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치

Info

Publication number: WO2015037961A1
Application number: PCT/KR2014/008586
Authority: WO
Inventors: 주기현
Original assignee: 삼성전자 주식회사
Priority date: 2013-09-13
Filing date: 2014-09-15
Publication date: 2015-03-19
Also published as: KR102401002B1; US20160232903A1; KR20210083225A; KR20220071162A; KR20150031215A; US10468033B2; KR102270106B1; KR102512359B1

Abstract

무손실 부호화방법은, 에너지의 양자화 인덱스가 표현되는 범위에 근거하여 제1부호화방식과 제2부호화방식 중 하나를 선택하는 단계, 및 선택된 부호화방식을 이용하여 양자화 인덱스를 부호화하는 단계를 포함할 수 있다. 무손실 복호화방법은 비트스트림에 포함된 에너지의 차분 양자화 인덱스의 부호화 방식을 결정하는 단계, 및 결정된 부호화 방식에 대응하여 차분 양자화 인덱스를 에너지의 양자화 인덱스가 표현되는 범위에 근거한 제1복호화방식과 제2복호화방식 중 하나로 복호화하는 단계를 포함할 수 있다.

Description

에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 및 신호 복호화방법 및 장치

본 발명은 오디오 신호 혹은 스피치 신호 부호화 및 복호화에 관한 것으로서, 보다 구체적으로는, 복잡도의 증가 및 복원된 음질의 열화없이, 한정된 비트 범위에서 스펙트럼의 에너지 정보를 부호화하는데 소요되는 비트수를 감소시킴으로써 스펙트럼의 실제 주파수 성분을 부호화하는데 소요되는 비트수를 증가시킬 수 있는 에너지 무손실 부호화방법 및 장치, 신호 부호화방법 및 장치, 에너지 무손실 복호화방법 및 장치, 신호 복호화방법 및 장치와 이를 채용한 멀티미디어 기기에 관한 것이다.

오디오 신호 혹은 스피치 신호 신호의 부호화시 스펙트럼의 실제 주파수 성분 이외에 에너지 혹은 엔벨로프와 같은 부가정보가 비트스트림에 포함될 수 있다. 이때, 손실을 최소화하면서 부가정보의 부호화에 할당되는 비트수를 감소시킴으로써, 스펙트럼의 주파수 성분의 부호화에 할당되는 비트수를 증가시킬 수 있다.

즉, 오디오 신호 혹은 스피치 신호를 부호화하거나 복호화하는 경우, 특히 낮은 비트율에서 한정된 비트를 효율적으로 이용함으로써, 해당 비트 범위에서 최상의 음질을 갖는 오디오 신호 혹은 스피치 신호를 복원하는 것이 요구된다.

본 발명이 해결하고자 하는 과제는 복잡도의 증가 및 복원된 음질의 열화없이, 한정된 비트 범위에서 스펙트럼의 에너지 혹은 엔벨로프를 부호화하는데 소요되는 비트수를 감소시키는 반면 스펙트럼의 실제 주파수 성분을 부호화하는데 소요되는 비트수를 증가시킬 수 있는 에너지 무손실 부호화방법, 신호 부호화방법, 에너지 무손실 복호화방법 및 신호 복호화방법을 제공하는데 있다.

본 발명이 해결하고자 하는 다른 과제는 복잡도의 증가 및 복원된 음질의 열화없이, 한정된 비트 범위에서 스펙트럼의 에너지를 부호화하는데 소요되는 비트수를 감소시키는 반면 스펙트럼의 실제 주파수 성분을 부호화하는데 소요되는 비트수를 증가시킬 수 있는 에너지 무손실 부호화장치, 신호 부호화장치, 에너지 무손실 복호화장치 및 신호 복호화장치를 제공하는데 있다.

본 발명이 해결하고자 하는 다른 과제는 에너지 무손실 부호화방법, 신호 부호화방법, 에너지 무손실 복호화방법 혹은 신호 복호화방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 있다.

본 발명이 해결하고자 하는 다른 과제는 에너지 무손실 부호화장치, 신호 부호화장치, 에너지 무손실 복호화장치 혹은 신호 복호화장치를 채용하는 멀티미디어 기기를 제공하는데 있다.

상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 무손실 부호화방법은, 에너지의 양자화 인덱스가 표현되는 범위에 근거하여 제1 부호화방식과 제2 부호화방식 중 하나를 선택하는 단계; 및 상기 선택된 부호화방식을 이용하여 상기 양자화 인덱스를 부호화하는 단계를 포함할 수 있다.

상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 신호 부호화방법은, 시간영역의 오디오신호로부터 생성되는 스펙트럼 계수로부터 밴드 단위로 얻어지는 에너지를 양자화하는 단계; 에너지의 양자화 인덱스를 표현하는 비트수와 상기 에너지의 양자화 인덱스를 라아지 심볼 부호화방식과 스몰 심볼 부호화방식으로 부호화한 결과 발생하는 비트수를 고려하여, 상기 양자화 인덱스의 부호화방식을 선택하여 무손실 부호화하는 단계; 복원된 에너지에 근거하여 상기 밴드 단위로 부호화를 위한 비트를 할당하는 단계; 및 상기 할당된 비트에 근거하여 상기 스펙트럼 계수를 양자화 및 무손실 부호화하는 단계를 포함할 수 있다.

상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 무손실 복호화방법은, 비트스트림에 포함된 에너지의 차분 양자화 인덱스의 부호화 방식을 결정하는 단계; 및 상기 결정된 부호화 방식에 대응하여, 상기 차분 양자화 인덱스를 에너지의 양자화 인덱스가 표현되는 범위에 근거한 제1 복호화방식과 제2 복호화방식 중 하나로 복호화하는 단계를 포함할 수 있다.

상기 과제를 달성하기 위한 본 발명의 일실시예에 따른 무손실 복호화방법은, 비트스트림으로부터 얻어지는 에너지의 부호화된 차분 양자화 인덱스의 부호화방식을 결정하고, 결정된 부호화방식에 대응하여, 상기 부호화된 차분 양자화 인덱스를 라아지 심볼 복호화방식과 스몰 심볼 복호화방식 중 하나로 복호화하는 단계; 상기 복호화된 차분 양자화 인덱스를 역양자화하고, 복원된 에너에 근거하여 상기 밴드 단위로 복호화를 위한 비트를 할당하는 단계; 상기 비트스트림으로부터 얻어지는 스펙트럼 계수를 무손실 복호화하는 단계; 및 상기 무손실 복호화된 스펙트럼 계수를 상기 할당된 비트에 근거하여 역양자화하는 단계를 포함할 수 있다.

에너지를 나타내는 양자화 인덱스 중, 표현 범위가 큰 심볼을 펄스모드와 스케일모드 중 하나로 부호화할 수 있도록 함으로써, 에너지 부호화에 사용되는 비트수를 절감하여 스펙트럼 부호화에 더 많은 비트수를 할당할 수 있다.

도 1은 일실시예에 따른 오디오 부호화장치의 구성을 나타낸 블록도이다.

도 2는 일실시예에 따른 오디오 복호화장치의 구성을 나타낸 블록도이다.

도 3은 일실시예에 따른 에너지 무손실 부호화장치의 구성을 나타낸 블록도이다.

도 4는 도 3에 도시된 제1 무손실 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.

도 5는 실시예에 따른 부호화방식 및 부호화모드를 나타내는 테이블이다.

도 6은 라아지 심볼 부호화방식에서 사용되는 허프만 부호화 테이블의 일예를 나타내는 도면이다.

도 7은 펄스모드에 대한 비트할당의 일예를 나타내는 도면이다.

도 8은 도 3에 도시된 제2 무손실 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.

도 9는 도 8에 도시된 상위비트 부호화부의 세부적인 구성을 나타낸 블록블럭도이다.

도 10은 도 9에 도시된 제1 허프만 모드 부호화부에서 사용되는 컨텍스트들의 그루핑의 일예이다.

도 11은 실시예에 따른 부호화방식을 결정하기 위한 비트 계산 과정을 설명하는 플로우챠트이다.

도 12는 일실시예 따른 에너지 무손실 복호화장치의 구성을 나타낸 블록도이다.

도 13은 도 12에 도시된 제1 무손실 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.

도 14는 도 12에 도시된 제2 무손실 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.

도 15는 도 13에 도시된 상위비트 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.

도 16은 스몰 심볼 부호화방식을 설명하는 도면이다.

도 17은 본 발명의 일실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.

도 18은 본 발명의 다른 실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.

도 19는 본 발명의 다른 실시예에 따른 멀티미디어 기기의 구성을 나타낸 블록도이다.

본 발명은 다양한 변환을 가할 수 있고 여러가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 구체적으로 설명하고자 한다. 그러나 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 기술적 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해될 수 있다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 구성요소들이 용어들에 의해 한정되는 것은 아니다. 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

본 발명에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 본 발명에서 사용한 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나 이는 당 분야에 종사하는 기술자의 의도, 판례, 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.

단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 발명에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 본 발명의 실시예들을 첨부 도면을 참조하여 상세히 설명하기로 하며, 첨부 도면을 참조하여 설명함에 있어, 동일하거나 대응하는 구성요소는 동일한 도면번호를 부여하고 이에 대한 중복되는 설명은 생략하기로 한다.

도 1은 본 발명의 일실시예에 따른 신호 부호화장치의 구성을 나타낸 블록도이다.

도 1에 도시된 신호 부호화장치(100)는 변환부(110), 에너지 양자화부(120), 에너지 무손실 부호화부(130), 비트할당부(140), 스펙트럼 양자화부(150), 스펙트럼 무손실 부호화부(160) 및 다중화부(170)를 포함할 수 있다. 다중화부(170)는 옵션으로 포함될 수 있으며, 비트 패킹 기능을 수행하는 다른 구성요소로 대체될 수 있다. 또는, 무손실 부호화된 에너지 데이터와 무손실 부호화된 스펙트럼 데이터가 별도의 비트스트림을 형성하여 저장 혹은 전송될 수 있다. 한편, 스펙트럼 양자화 과정 이후 혹은 이전, 에너지값을 이용하여 정규화(normalization)를 수행하는 정규화부(미도시)를 더 구비할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다. 여기서, 신호는 오디오, 뮤직 혹은 스피치, 혹은 이들의 혼합신호를 나타내는 사운드 등의 미디어 신호를 의미할 수 있으나, 이하에서는 설명의 편의를 위하여 오디오 신호로서 지칭하기로 한다. 신호 부호화장치(100)로 입력되는 시간 도메인의 오디오 신호는 다양한 샘플링 레이트를 가질 수 있고, 샘플링 레이트별로 스펙트럼을 양자화하는데 사용되는 에너지의 밴드 구성이 달라질 수 있다. 이에 따라서, 무손실 부호화가 수행되는 양자화된 에너지의 개수가 변동될 수 있다. 샘플링 레이트의 예로는, 7.2kHz, 8kHz, 13.2kHz, 16.4kHz, 32kHZ, 48kHz 등이 있으며, 이에 한정되는 것은 아니다. 샘플링 레이트 및 타겟 비트율이 결정된 시간 도메인의 오디오 신호는 변환부(110)로 제공될 수 있다.

도 1에 있어서, 변환부(110)는 시간 도메인의 오디오 신호, 예를 들면 PCM(Pulse Code Modulation) 신호를 주파수 도메인으로 변환하여 오디오 스펙트럼을 생성할 수 있다. 이때, 시간/주파수 도메인 변환은 MDCT(Modified Discrete Cosine Transform) 등과 같은 공지된 다양한 방법을 사용하여 수행할 수 있다. 변환부(110)로부터 얻어지는 오디오 스펙트럼의 변환계수들, 예를 들면 MDCT 계수들은 에너지 양자화부(120) 및 스펙트럼 양자화부(150)로 제공될 수 있다.

에너지 양자화부(120)는 변환부(110)로부터 제공되는 변환계수들로부터, 밴드 단위로 에너지를 획득할 수 있다. 밴드는 오디오 스펙트럼의 샘플들을 그루핑한 단위로서, 임계대역을 반영하여 균일 혹은 비균일 길이를 가질 수 있다. 비균일한 경우, 한 프레임에 대하여 시작 샘플에서부터 마지막 샘플에 이르기까지 하나의 밴드에 포함되는 샘플의 개수가 점점 증가하도록 밴드를 설정할 수 있다. 또한 다중 비트율을 지원하는 경우, 서로 다른 비트율에서 대응하는 각 밴드에 포함되는 샘플의 갯수가 동일해지도록 설정할 수 있다. 한 프레임에 포함되는 밴드의 개수 혹은 밴드에 포함되는 샘플의 개수는 미리 결정될 수 있다. 에너지값은 밴드에 포함되는 변환계수들의 엔벨로프를 나타낼 수 있으며, 평균 진폭, 평균 에너지, 파워 혹은 norm 값 등을 의미할 수 있다. 여기서, 밴드는 파라미터 밴드 혹은 스케일 팩터 밴드를 의미할 수 있다.

밴드 b의 에너지 E_M(b)는 예를 들어 하기의 수학식 1에 의해 산출될 수 있다.

수학식 1

여기서, X_M(k)은 스펙트럼 계수를 의미하며, k_start(b) 및 k_end(b)는 각각 밴드의 시작 샘플 및 마지막 샘플을 의미한다.

에너지 양자화부(120)는 획득된 에너지에 대하여 양자화를 수행하여 인덱스를 생성할 수 있다. 일실시예에 따르면, 양자화에 앞서, 트랜지언트 모드에서는, 양자화될 에너지를 리오더링함으로써, 예를 들어 우수 서브프레임(인덱스 m=0, 2)에 대응하는 에너지는 주파수가 증가하는 순서가, 기수 서브프레임(인덱스 m=1, 3)에 대응하는 에너지는 주파수가 감소하는 순서가 되도록 리오더링함으로써, 효율적인 차분 에너지 부호화가 가능하도록 한다. 각 프레임에서, 에너지는 양자화 스텝 사이즈, 예를 들면 유니폼 스칼라 양자화기값 qint로 스칼라 양자화될 수 있다. qint는 가변적이며, 예를 들어, 대역폭 및 모드에 근거하여 선택될 수 있다.

에너지의 양자화 인덱스 I_M(b)는 예를 들어 하기의 수학식 2에 의해 산출될 수 있다.

수학식 2

일실시예에 따르면, 서브 벡터 에너지들의 양자화 인덱스는 차분적으로 부호화될 수 있는데, 이를 위하여 현재 밴드에 대하여 현재 밴드의 양자화 인덱스와 이전 밴드의 양자화 인덱스와의 차이 즉, 차분 인덱스(differential index)를 얻을 수 있다. 이때, 프레임에서 첫번째 밴드는 이전 밴드가 존재하지 않기 때문에 첫번째 밴드의 양자화 인덱스로부터 소정 값을 빼서 차분 인덱스를 얻을 수 있다. 이와 같은 첫번째 밴드의 차분 인덱스 △I_M(0), 나머지 밴드의 차분 인덱스 △I_M(b)는 예를 들어 하기의 수학식 3에 의해 산출될 수 있다.

수학식 3

여기서, I_ref 는 기준 밴드 에너지에 해당하며, 24로 설정될 수 있다.

일실시예에 따르면, 차분 인덱스 △I_M(b)는 소정 범위, 예를 들어 [-256, 256]의 범위로 제한될 수 있다. 이는 하기의 수학식 4에서와 같이 우선 음수의 차분 인덱스를 조정한 후 양수의 차분 인덱스를 조정함으로써 달성할 수 있다.

수학식 4

에너지 무손실 부호화부(130)는 에너지 양자화부(120)로부터 제공되는 인덱스, 차분 인덱스 혹은 제한된 차분 인덱스에 대하여 무손실 부호화를 수행할 수 있다. 일실시예에 따르면, 에너지 무손실 부호화부(130)는 차분 인덱스를 표현할 수 있는 능력(capability) 혹은 범위(range)와 비트 소비(bit conmsumption)에 따라서 제1 부호화방식과 제2 부호화방식 중 하나를 이용하여 프레임 단위로 무손실 부호화를 수행할 수 있다. 여기서, 제1 부호화 방식은 라아지 심볼 부호화방식(large symbol coding method)으로서, 제2 부호화 방식에서보다 인덱스를 표현할 수 있는 심볼의 갯수가 상대적으로 많은 경우 적용하며, 제2 부호화 방식은 스몰 심볼 부호화방식(small symbol coding method)으로서, 제1 부호화 방식에서보다 인덱스를 표현할 수 있는 심볼의 갯수가 상대적으로 적은 경우 적용될 수 있다. 부호화 방식으로서 라아지 심볼 부호화방식이 선택된 경우, 밴드 에너지는 펄스 모드와 스케일 모드 중 하나로 부호화될 수 있다. 부호화 방식으로서 스몰 심볼 부호화방식이 선택된 경우, 상위비트와 하위비트로 구분하여 부호화를 수행하며, 상위비트는 컨텍스트 기반 허프만 부호화 모드와 리사이즈드 허프만 부호화 모드 중 하나로 부호화되고, 하위비트는 비트패킹에 의해 처리될 수 있다. 부호화 방식을 나타내는 부호화 방식 인덱스 즉, 플래그 비트(DENG_CMODE)와, 각 부호화 방식에서 부호화 모드를 나타내는 부호화 모드 인덱스, 즉 플래그 비트(LC_MODE)는 비트스트림에 부가정보로서 포함되어 디코더단으로 전송될 수 있다. 이와 같은 에너지 혹은 엔벨로프 부호화 모드는 도 5에서와 같이 나타낼 수 있다.

일실시예에 따르면, 에너지 무손실 부호화부(130)는 스몰 심볼 부호화방식에서 컨텍스트 기반 허프만 부호화 모드와 리사이즈드 허프만 부호화 모드 각각의 경우 소비되는 비트량의 추정치에 근거하여 부호화 모드를 선택할 수 있다.

비트할당부(140)는 에너지 양자화부(120)로부터 제공되는 양자화 인덱스에 대하여 역양자화를 수행하여 에너지를 복원할 수 있다. 비트할당부(140)는 타겟 비트율에 따른 전체 비트수에 대하여, 각 밴드 단위로 복원된 에너지를 이용하여 마스킹 임계치를 계산하고, 마스킹 임계치를 이용하여 각 밴드의 지각적 부호화에 필요한 할당 비트수를 정수단위 혹은 소수점 단위로 결정할 수 있다. 구체적으로, 비트할당부(140)는 각 밴드 단위로 복원된 에너지를 이용하여 허용 비트수를 추정하여 비트를 할당하고, 할당 비트수가 허용 비트수를 초과하지 않도록 제한할 수 있다. 이때, 에너지가 큰 밴드에서부터 순차적으로 비트를 할당할 수 있다. 또한, 각 밴드의 에너지에 대하여 각 밴드의 지각적 중요도에 따라서 가중치를 부여함으로써 지각적으로 중요한 밴드에 더 많은 비트가 할당되도록 조정할 수 있다. 지각적 중요도는 일예로 ITU-T G.719 에서와 같은 심리음향 가중을 통하여 결정할 수 있다.

스펙트럼 양자화부(150)는 변환부(110)로부터 제공되는 변환계수들에 대하여, 각 밴드 단위로 결정된 할당 비트수를 이용하여 양자화를 수행하고, 스펙트럼의 양자화 인덱스를 생성할 수 있다.

스펙트럼 무손실 부호화부(160)는 스펙트럼 양자화부(150)로부터 제공되는 스펙트럼의 양자화 인덱스에 대하여 무손실 부호화를 수행할 수 있다. 무손실 부호화 알고리즘의 일예로서, 허프만 부호화 혹은 팩토리얼 펄스 코딩(Factorial Pulse Coding, 이하 FPC라 약함)와 같이 공지된 알고리즘을 사용할 수 있다. 무손실 부호화 결과 얻어지는 데이터는 비트스트림에 포함되어 저장 혹은 전송될 수 있다.

다중화부(170)는 에너지 무손실 부호화부(130)로부터 제공되는 에너지 데이터와 스펙트럼 무손실 부호화부(160)로부터 제공되는 스펙트럼 데이터를 비트스트림으로 생성할 수 있다.

도 2는 본 발명의 일실시예에 따른 오디오 복호화장치의 구성을 나타낸 블록도이다.

도 2에 도시된 오디오 복호화장치(200)는 역다중화부(210), 에너지 무손실 복호화부(220), 에너지 역양자화부(230), 비트 할당부(240), 스펙트럼 무손실 복호화부(250), 스펙트럼 역양자화부(260) 및 역변환부(270)를 포함할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다. 오디오 부호화장치(100)에서와 마찬가지로 역다중화부(210)옵션으로 구비되며, 비트 언패킹 기능을 수행하는 다른 구성요소로 대체될 수 있다. 한편, 스펙트럼 역양자화 과정 이후 혹은 이전, 에너지값을 이용하여 역정규화(normalization)를 수행하는 역정규화부(미도시)를 더 구비할 수 있다.

도 2에 있어서, 역다중화부(210)는 비트스트림을 파싱하여 부호화된 에너지 데이터는 에너지 무손실 복호화부(220)로, 부호화된 스펙트럼 데이터는 스펙트럼 무손실 복호화부(250)로 각각 제공할 수 있다.

에너지 무손실 복호화부(220)는 부호화된 에너지 데이터에 대하여 무손실 복호화를 수행하여 에너지의 양자화 인덱스를 얻을 수 있다. 일실시예에 따르면, 부호화단에서 차분 부호화가 수행된 경우 차분 양자화 인덱스를 얻을 수 있다. 이와 같이 차분 양자화 인덱스가 얻어진 경우, 하기의 수학식 5에 의해 각 밴드의 양자화 인덱스를 복원할 수 있다.

수학식 5

에너지 역양자화부(230)는 에너지 무손실 복호화부(220)로부터 제공되는 에너지의 양자화 인덱스에 대하여 역양자화를 수행하여 에너지를 복원할 수 있다. 구체적으로, 에너지 역양자화부(230)는 에너지의 양자화 인덱스에 양자화 스텝 사이즈, 예를 들면 유니폼 스칼라 양자화기값 qint를 곱하여 에너지를 복원할 수 있다.

비트 할당부(240)는 에너지 역양자화부(230)로부터 제공되는 복원된 에너지를 이용하여, 각 주파수 밴드 단위로, 정수 혹은 소수점 단위의 비트 할당을 수행할 수 있다. 구체적으로, 에너지가 큰 밴드에서부터 순차적으로 샘플별로 비트를 할당한다. 즉, 우선적으로 최대 에너지를 갖는 밴드에 대하여 샘플당 비트를 할당하고, 해당 밴드의 에너지를 소정 단위만큼 감소시켜 다른 밴드에 비트를 할당할 수 있도록 우선순위를 변경한다. 이와 같은 과정은 주어진 프레임에서 사용가능한 전체 비트수가 모두 소진할 때까지 반복적으로 수행된다. 비트할당부(240)의 동작은 오디오 부호화장치(100)의 비트할당부(140)와 실질적으로 동일하다.

스펙트럼 무손실 복호화부(250)는 부호화된 스펙트럼 데이터에 대하여 무손실 복호화를 수행하여 스펙트럼 양자화 인덱스를 얻을 수 있다.

스펙트럼 역양자화부(260)는 스펙트럼 무손실 복호화부(250)로부터 제공되는 스펙트럼 양자화 인덱스에 대하여 각 밴드 단위로 결정된 할당 비트수를 이용하여 역양자화를 수행하고, 스펙트럼 변환계수를 복원할 수 있다.

역변환부(250)는 스펙트럼 역양자화부(260)로부터 제공되는 스펙트럼 변환계수에 대하여 역변환을 수행하여 시간 도메인의 오디오 신호를 복원할 수 있다.

도 3은 본 발명의 일실시예 따른 에너지 무손실 부호화장치의 구성을 나타낸 블록도이다.

도 3에 도시된 에너지 무손실 부호화장치(300)는 부호화방식 결정부(310), 제1 무손실 부호화부(330) 및 제2 무손실 부호화부(350)를 포함할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다. 무손실 부호화의 입력은 양자화 인덱스 혹은 차분 양자화 인덱스 어느 것이라도 무방하나, 여기서는 차분 양자화 인덱스를 사용하는 것을 예로 들기로 한다.

도 3에 있어서, 부호화방식 결정부(310)는 차분 양자화 인덱스에 대한 부호화 방식을 제1 부호화방식과 제2 부호화방식 중 하나를 결정할 수 있다. 제1 부호화방식으로 선택된 경우 차분 양자화 인덱스를 제1 무손실 부호화부(330)로 제공할 수 있다. 제2 부호화방식으로 선택된 경우 차분 양자화 인덱스를 제2 무손실 부호화부(350)로 제공할 수 있다. 부호화방식 결정부(310)는 한 프레임의 모든 밴드에 존재하는 어느 하나의 양자화 인덱스라도 소정 범위, 예를 들면 [-32,31] (첫번째 인덱스의 경우 [46,17])로 표현될 수 없는 경우, 양자화 인덱스의 부호화방식을 제1 부호화방식으로 결정할 수 있다. 구체적으로, 제1 부호화방식은 64개보다 더 많은 256 혹은 512 심볼로 표현할 수 있는 데이터를 부호화할 수 있고, 제2 부호화방식은 64개 심볼로 한정되는 데이터를 부호화할 수 있다. 제1 부호화방식을 필요로 하지 않는 경우, 제1 부호화방식과 제2 부호화방식 중 비트 소비가 적은 부호화방식을 선택할 수 있다. 구체적으로, 현재 프레임에서 모든 밴드에 대하여 양자화 인덱스를 제2 부호화방식의 복수개의 모드로 부호화하고, 부호화 결과 사용된 가장 적은 비트와 제1 부호화방식의 수행 결과 사용된 비트를 비교하여, 비교 결과에 따라서 재차 제1 부호화방식과 제2 부호화방식 중 하나로 결정할 수 있다. 부호화방식 결정 결과에 대응하여, 차분 양자화 인덱스의 부호화방식을 나타내는 1 비트의 부가정보(D0)가 생성되어 비트스트림에 포함될 수 있다. 부호화방식 결정부(310)는 부호화방식이 제2 부호화방식으로 결정된 경우, N 비트의 차분 양자화 인덱스에 대하여 N0 비트의 상위비트와 N1 비트의 하위비트로 분리하여 제2 무손실 부호화부(350)로 제공할 수 있다. 여기서, N0는 N-N1으로, N1은 N-N0로 나타낼 수 있다. 일실시예에 따르면, N은 6, N0는 5, N1은 1로 설정할 수 있다.

제1 무손실 부호화부(330)는 부호화방식 결정부(310)에서 제1 부호화방식 즉, 라아지 심볼 부호화방식으로 결정된 경우, 펄스 모드와 스케일 모드 중 하나를 선택하여 양자화 인덱스를 부호화할 수 있다. 펄스 모드는 [-4, 3] 범위를 초과하는 양자화 인덱스가 존재하지 않는 경우 적합할 수 있다. 만약, 이 범위를 초과하는 경우, 펄스 모드는 사용될 수 없고, 대신 스케일 모드가 항상 사용될 수 있다. 또한, 첫번째 인덱스가 [-64, 63] 범위를 초과하는 경우 스케일 모드가 항상 사용될 수 있다. 한편, 라아지 심볼 부호화방식에서는 도 6에서와 같은 8개의 심볼을 갖는 허프만 부호화 테이블에 의한 허프만 부호화 모드가 사용될 수 있다.

펄스 모드에서는 두가지 지시자가 존재할 수 있다. 하나는 첫번째 인덱스가 독립적으로 전송되는지를 나타내는 제1 지시자(ind_Io)이고, 다른 하나는 범위 [-4, 3]을 초과하는 양자화 인덱스 즉, 펄스가 존재하는지를 나타내는 제2 지시자(ind_pls)이다. 만약, 첫번째 인덱스가 범위 [-4, 3]내에 존재하는 경우 제1 지시자는 0으로 설정되고, 첫번째 인덱스는 다른 인덱스와 함께 도 6에 도시된 허프만 테이블을 이용하여 허프만 부호화될 수 있다. 한편, 첫번째 인덱스가 범위 [-4, 3]를 벗어나는 경우 제1 지시자는 1로 설정되고, 첫번째 인덱스에 64를 가산한 다음 7 비트를 이용하여 패킹될 수 있다.

한편, 현재 프레임에 펄스가 존재하는 경우, 제2 지시자는 1로 설정되고, 펄스 위치(pls_pos) 및 펄스 크기(pls_amp)는 각각 5비트와 7비트를 이용하여 전송될 수 있다. 이후, 다른 모든 인덱스들은 도 6에서와 같은 허프만 테이블을 이용하여 부호화될 수 있다. 펄스모드에서의 비트할당의 일예는 도 7에 도시된 바와 같다. 도 7에 있어서, cmd₀는 부호화방법을 나타내고, cmd₁는 펄스모드 혹은 스케일모드를 나타내고, △I_M(0)는 첫번째 인덱스를 나타낸다.

스케일 모드에서는 모든 인덱스들의 최대 및 최소에 따라서 인덱스들을 3개의 상위비트와 몇개의 하위비트로 스플릿될 수 있다. 3개의 상위비트는 도 6에서와 같은 허프만 테이블을 이용하여 부호화될 수 있고, 하위비트는 패킹될 수 있다. 하위비트의 갯수는 bit_shift로 정의될 수 있다. bit_shift는 양자화 인덱스를 스케일함으로써 모든 양자화 인덱스가 범위 [-4, 3]내에 들어가도록 산출될 수 있다. 스케일링 결과, 모든 양자화 인덱스는 3비트로 표현될 수 있다.

제2 무손실 부호화부(350)는 차분 양자화 인덱스에 대하여 상위비트와 하위비트로 분리하여, 상위비트에 대해서는 허프만 부호화모드를 적용하고, 하위비트에 대해서는 비트패킹으로 처리할 수 있다.

도 4에 도시된 제1 무손실 부호화부(400)는 펄스모드 부호화부(410)와 스케일 모드 부호화부(430)로 구성될 수 있다.

도 4를 참조하면, 펄스모드 부호화부(410)는 입력되는 차분 양자화 인덱스 벡터 중에 일부분의 데이터가 유한 영역의 표현 범위를 벗어나게 될 때 효율적으로 활용될 수 있는 모드로서, 그 일부분의 데이터 즉, 펄스를 다르게 부호화하고, 나머지 데이터는 허프만 부호화모드로 부호화하는 것이다. 구체적으로, 펄스 모드는 첫번째 양자화 인덱스를 분리하여 전송할지 여부에 대한 정보와 전송하도록 결

정된 경우 첫번째 양자화 인덱스 △I_M(0), 펄스의 유무에 대한 정보, 펄스가 존재하는 경우 펄스의 위치 및 크기에 대한 정보를 부가정보로 전송하게 된다. 이러한 방식으로 전송되지 않는 나머지 양자화 인덱스는 허프만 부호화 방식에 근거하여 전송되게 된다.

스케일 모드 부호화부(430)는 차분 양자화 인덱스 벡터가 다수개의 큰 값을 가지게 될 때 활용될 수 있는 모드로서, 모든 벡터들을 허프만 부호화 모드로 표현 가능한 범위로 값을 줄여서 상위비트로 할당하고, 줄이는 과정에서 제거된 비트들로 하위비트를 구성하는 것이다. 구체적으로, 스케일 모드는 입력되는 차분 양자화 인덱스 벡터의 모든 값들을 스케일링하여 허프만 부호화방식으로 전송 가능한 범위로 줄이고, 스케일링을 위하여 라이트 쉬프트된 비트 갯수를 스케일 정보로 전송하고, 스케일링시 제거되는 하위비트들, 예를 들면 최하위비트는 비트 패킹을 통해 전송되고, 스케일링을 통하여 감소된 값들은 허프만 부호화 방식에 근거하여 전송되게 된다.

도 8에 도시된 제2 무손실 부호화부(800)는 상위비트 부호화부(810)와 하위비트 부호화부(830)로 구성될 수 있다.

도 8을 참조하면, 상위비트 부호화부(810)는 차분 양자화 인덱스의 상위비트를 부호화할 수 있고, 하위비트 부호화부(830)는 차분 양자화 인덱스의 하위비트를 패킹 처리할 수 있다.

여기서, 차분 양자화 인덱스는 상위비트와 하위비트로 스플릿되기 이전에, 첫번째 밴드에는 46를, 다른 밴드에는 32를 더하여 양수의 값을 갖도록 조정될 수 있다. 구체적으로, 수학식 4에 의해 얻어진 차분 양자화 인덱스는 첫번째 밴드에 대해서는 46의 옵셋을, 다른 밴드에는 32의 옵셋을 더하여 [0, 63]의 범위로 제한시킬 수 있다. 현재 프레임이 트랜지언트 프레임이 아닌 경우 제한된 차분 양자화 인덱스가 [0, 63]의 범위를 초과하고, 현재 프레임이 트랜지언트 프레임인 경우 제한된 차분 양자화 인덱스가 [0, 31]의 범위를 초과할 경우, 라아지 심볼 부호화방식을 이용하도록 한다.

구체적으로, 상위비트 부호화부(810)는 N0 비트로 표현되는 상위비트에 대하여 2^N0개의 심볼을 구성하고, 복수개의 허프만 부호화 모드 중 적은 비트가 소요되는 모드로 부호화할 수 있다. 상위비트 부호화부(810)는 예를 들면 2가지의 허프만 부호화 모드를 가질 수 있다. 이 경우, 상위비트의 부호화모드를 나타내는 1 비트의 부가정보(D1)가 생성되어 부호화방식을 나타내는 1 비트의 부가정보(D0)와 함께 비트스트림에 포함될 수 있다.

한편, 하위비트 부호화부(830)는 N1 비트로 표현되는 하위비트에 대하여 비트패킹방식을 적용하여 부호화를 수행할 수 있다. 하나의 프레임이 N_b개의 밴드로 이루어지는 경우, 전체 N1×N_b개의 비트를 사용하여 하위비트를 부호화할 수 있다.

도 9에 도시된 상위비트 부호화부(900)는 제1 허프만 모드 부호화부(910)와 제2 허프만 모드 부호화부(930)로 구성될 수 있다.

도 9를 참조하면, 제1 허프만 모드 부호화부(910)는 컨텍스트 기반 허프만 부호화에 기반하여, 제2 허프만 모드 부호화부(930)는 리사이즈 허프만 부호화에 기반하여 차분 양자화 인덱스의 상위비트를 부호화할 수 있다.

제1 허프만 모드 부호화부(910)는 일실시예에 따르면 컨텍스트로 사용되는 이전 밴드의 차분 양자화 인덱스의 범위를 복수개의 그룹으로 나누고, 각 그룹별로 미리 정해진 허프만 부호화 테이블을 기준으로 하여 현재 밴드의 차분 양자화 인덱스에 대한 허프만 부호화를 수행할 수 있다. 여기서, 허프만 부호화 테이블은 예를 들어 대형 데이터베이스를 이용한 트레이닝 프로세스를 통하여 생성할 수 있으며, 소정의 기준에 의거하여 데이터를 수집하고, 수집된 데이터에 근거하여 생성할 수 있다. 일실시예에 따르면, 이전 밴드의 차분 양자화 인덱스의 범위에 의거하여 현재 밴드의 차분 양자화 인덱스의 빈도수에 대한 데이터를 수집하여 각 그룹별로 허프만 테이블을 생성할 수 있다.

이전 밴드의 차분 양자화 인덱스를 컨텍스트로 사용하여 얻어진 현재 밴드의 차분 양자화 인덱스의 확률 분포에 대한 분석결과를 이용하여, 다양한 분포 모델을 선택할 수 있고, 따라서 유사한 분포모델을 갖는 양자화 레벨의 그룹핑이 수행될 수 있다. 각 그룹 인덱스 0 내지 2의 파라미터는 도 10에 도시된 바와 같이 되어 있다.

한편, 각 그룹에서의 확률 분포를 살펴보면, 그룹 인덱스 0 및 2의 확률 분포가 유사하며, x축에 의해 실질적으로 반전(혹은 플립)됨을 알 수 있다. 이는 부호화 효율에 대한 손실없이, 두개의 그룹 인덱스 0 및 2에 대해서는 동일한 확률 모델을 사용해도 무방함을 의미한다. 즉, 그룹 인덱그 0은 그룹 인덱스 2와 동일한 허프만 테이블을 사용할 수 있다. 이에 따르면, 그룹 인덱스 1에 대한 허프만 부호화 테이블 1 즉, 확률모델 1과, 그룹 인덱스 0 및 2가 공유하는 허프만 테이블 0 즉, 확률 모델 0이 사용될 수 있다. 이때, 그룹 인덱스 0에 대한 코드의 인덱스는 그룹 인덱스 2에 대하여 반대로 표현하면 된다. 즉, 컨텍스트인 이전 밴드의 차분 양자화 인덱스에 의하여 현재 밴드의 차분 양자화 인덱스에 대한 허프만 부호화 테이블이 그룹 인덱스 0으로 결정된 경우, 부호화단에서 현재 밴드의 차분 양자화 인덱스(d(i))는 반전처리 과정 즉, d'(i)=A-d(i)의 값으로 변경되어 그룹 인덱스 2의 허프만 부호화 테이블을 참조하여 허프만 부호화를 수행할 수 있다. 한편, 복호화단에서는 그룹 인덱스 2의 허프만 복호화 테이블을 참조하여 허프만 복호화를 수행한 다음, d'(i)는 d(i)=A-d'(i) 의 변환과정을 거쳐 최종 d(i) 값을 추출하게 된다. 여기서, A 값은 그룹 인덱스 0과 2의 확률 분포가 대칭되도록 만드는 값으로 설정될 수 있다. A 값은 부호화 및 복호화 과정에서 추출되는 것이 아니고, 미리 사전에 최적 값으로 설정될 있다. 한편, 그룹 인덱스 2의 허프만 부호화 테이블 대신에 그룹 0의 허프만 부호화 테이블을 활용하고, 그룹 인덱스 2에서 차분 양자화 인덱스를 변경시켜서 수행할 수도 있다. 일실시예에 따르면, d(i)가 범위 [0,31] 의 값을 가지는 경우, A 값은 31을 사용할 수 있다.

컨텍스트 기반 허프만 부호화 모드를 좀 더 구체적으로 설명하면, 3개 그룹의 차분 양자화 인덱스의 확률분포에 의해 결정된 2가지 허프만 부호화 테이블을 이용한다. 여기서, 현재 밴드의 차분 양자화 인덱스(d(i))를 허프만 부호화함에 있어서, 이전 밴드의 차분 양자화 인덱스(d(i-1))를 컨텍스트로 활용하며, 그룹 인덱스 1에 대한 허프만 테이블 1과 그룹 인덱스 2에 대한 허프만 테이블 0이 사용되는 것을 예로 들기로 한다.

먼저, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는지를 판단한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는 경우, 허프만 테이블 1로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하지 않는 경우, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하는지를 판단한다.

이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하지 않는 경우 즉, 그룹 인덱스 2에 속하는 경우, 허프만 테이블 0로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))이 그룹 인덱스 0에 속하는 경우, 현재 밴드의 차분 양자화 인덱스(d(i))을 반전처리하고, 허프만 테이블 0로부터 반전처리된 현재 밴드의 차분 양자화 인덱스(d'(i))에 대한 코드를 선택한다.

각 선택된 코드를 이용하여 현재 밴드의 차분 양자화 인덱스(d(i))에 대하여 허프만 부호화를 수행한다.

제2 허프만 모드 부호화부(930)는 컨텍스트없이 허프만 부호화를 수행하며, 통상적인 허프만 부호화에 비하여 좀 더 적은 갯수의 심볼로 허프만 부호화 테이블을 구성할 수 있다. 제2 허프만 모드 부호화부(930)는 차분 양자화 인덱스의 완전 복원을 가능하게 하면서 차분 양자화 인덱스의 스팬을 감소시킴으로써 새로운 차분 양자화 인덱스 △I'_M(b)를 얻을 수 있다. 현재 밴드의 차분 양자화 인덱스의 스팬은 이전 밴드(preceding band)의 차분 양자화 인덱스와 소정의 임계치에 근거하여 수정될 수 있다. 허프만 부호화를 위한 새로운 차분 양자화 인덱스 △I'_M(b)의 범위는 Range = [Range_Min, Range_Max] = [Min (△I'_M(b)), Max(I'_M(b))], (기서, b는 1,... N_bands-1 이다)와 같이 얻어질 수 있다

이와 같이 얻어진 범위에 근거하여, 범위 차이 Range_Diff는 하기의 수학식 6에서와 같이 산출될 수 있다.

수학식 6

제2 허프만 모드 부호화부(930)에서 수행되는 리사이즈드 허프만 부호화는 범위 차이 Range_Diff가 소정 값, 예를 들면 11 이하인 경우 새로운 차분 양자화 인덱스에 대하여 사용될 수 있다. 만약, 범위 차이 Range_Diff가 소정 값보다 큰 경우에는 리사이즈드 허프만 부호화는 사용될 수 없다.

도 11은 무손실 부호화를 위한 코딩 방식 및 코딩 모드를 결정하기 위하여 비트를 계산하는 과정을 나타내는 흐름도로서, 프레임 단위로 동작될 수 있다. 요약하면, 부호화방식 0 즉, 라아지 심볼 부호화방식과 부호화방식 1 즉, 스몰 심볼 부호화방식 각각의 최적 비트를 계산하고, 그 중 적은 값을 갖는 방식으로 결정한다.

도 11에 있어서, 먼저 부호화방식 0 즉, 라아지 심볼 부호화방식에 대하여 설명하면 다음과 같다.

1151 단계에서는 펄스 모드가 가능한지 여부를 확인하고, 펄스 모드가 가능하다면 1153 단계에서 펄스 모드를 수행하여 사용 비트(ebit0)을 계산한 다음, 이어 스케일 모드를 수행하여 사용 비트(ebit1)을 계산한다. 한편, 1155 단계에서는 펄스 모드가 가능하지 않다면 스케일 모드를 수행하여 사용 비트(ebit1)을 계산한다. 1157 단계에서는 ebit0와 ebit1 중 적은 값을 ebit로 할당하여, 적은 값에 대응하는 부호화 모드를 부호화방식 0의 부호화 모드로서 결정한다.

다음, 부호화방식 1 즉, 스몰 심볼 부호화방식에 대하여 설명하면 다음과 같다.

1110 단계에서는 부호화방식 1이 가능한지 여부를 확인하고, 차분 양자화 인덱스가 부호화방식 1이 가능한 입력으로 구성되어 있는 경우 필요 비트를 계산하게 된다. 예를 들어, N=6 (N0=5, N1=1)비트로 표현 가능한 값인지를 확인하여, 6비트로 표현 가능하지 않은 값인 경우에는 라아지 심볼 부호화방식으로 결정하여 사용사용비트를 구하고(1171 단계), 부호화방식 비트를 0으로 설정한 후 ebit에 대응하는 정보를 비트스트림에 저장한다. 한편, 6비트로 표현 가능한 값인 경우, 1131 및 1133 단계에서는 허프만 부호화 모드 0과 허프만 부호화 모드 1을 각각 수행하여 사용 비트(hbit0, hbit1)를 계산한다. 1135 단계에서는 hbit0와 hbit1 중 적은 값을 hbit로 할당하여, 적은 값에 대응하는 부호화 모드를 부호화방식 1의 부호화 모드로서 결정한다. 여기서, hbit 산출시 부호화모드를 나타내는 1 비트와 하위 비트 부호화에 사용되는 비트, Nb가 20인 경우 20비트를 더 고려할 수 있다.

1173 단계에서는 1135 단계에서 계산된 hbit와 1157 단계에서 계산된 ebit 중 적은 비트를 사용하는 부호화방식을 결정하고 이에 대응하여 부호화방식 비트를 설정하게 된다.

도 12는 본 발명의 일실시예 따른 에너지 무손실 복호화장치의 구성을 나타낸 블록도이다.

도 12에 도시된 에너지 무손실 복호화장치(1200)는 복호화방식 결정부(1210), 제1 무손실 복호화부(1230) 및 제2 무손실 복호화부(1250)를 포함할 수 있다. 각 구성요소는 적어도 하나 이상의 모듈로 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다.

도 12에 있어서, 복호화방식 결정부(1210)는 비트스트림을 파싱하여 부가정보로부터 부호화방식과 부호화모드에 대한 정보를 얻을 수 있다. 즉, 부호화방식과 관련된 플래그 비트로부터 라아지 심볼 복호화방식과 스몰 심볼 복호화방식 중 하나를 결정할 수 있다. 만약, 라아지 심볼 복호화방식으로 결정된 경우, 전송된 차분 양자화 인덱스는 제1 무손실 복호화부(1230)로, 스몰 심볼 복호화방식으로 결정된 경우, 전송된 차분 양자화 인덱스는 제2 무손실 복호화부(1250)로 제공할 수 있다.

제1 무손실 복호화부(1230)는 복호화방식 결정부(1210)로부터 제공된 차분 양자화 인덱스를 라아지 심볼 복호화방식에 근거하여 복호화를 수행할 수 있다. 라아지 심볼 복호화방식에 근거한 무손실 복호화를 위하여, 무손실 부호화시의 펄스모드 혹은 스케일모드의 역처리를 사용할 수 있다.

제2 무손실 복호화부(1250)에 있어서 복호화방식 결정부(1210)로부터 제공된 차분 양자화 인덱스를 스몰 심볼 복호화방식에 근거하여 복호화를 수행할 수 있다. 이를 위하여, 차분 양자화 인덱스의 상위비트와 하위비트에 대하여 별도로 무손실 복호화를 수행할 수 있다.

도 13에 도시된 제1 무손실 복호화부(1300)는 펄스모드 복호화부(1310)와 스케일 모드 복호화부(1330)로 구성될 수 있다.

도 13을 참조하면, 펄스모드 복호화부(1310)는 비트스트림에 포함된 부호화모드와 관련된 플래그 비트로부터 펄스모드로 결정된 경우 차분 양자화 인덱스를 복호화하며, 도 4의 펄스모드 부호화부(410)의 역과정을 수행할 수 있다.

스케일 모드 복호화부(1330)는 비트스트림에 포함된 부호화모드와 관련된 플래그 비트로부터 스케일모드로 결정된 경우 차분 양자화 인덱스를 복호화하며, 도 4의 스케일모드 부호화부(430)의 역과정을 수행할 수 있다.

도 14에 도시된 제2 무손실 복호화부(1400)는 상위비트 복호화부(1410)와 하위비트 복호화부(1430)로 구성될 수 있다.

도 14를 참조하면, 상위비트 복호화부(1410)는 차분 양자화 인덱스의 상위비트를 복호화할 수 있고, 하위비트 복호화부(1430)는 차분 양자화 인덱스의 하위비트를 언패킹하여 복원된 하위비트를 얻을 수 있다.

도 15는 도 14에 도시된 상위비트 복호화부의 세부적인 구성을 나타낸 블록블럭도이다.

도 15에 도시된 상위비트 복호화부는 제1 허프만 모드 복호화부(1510)와 제2 허프만 모드 복호화부(1530)로 구성될 수 있다.

도 15를 참조하면, 제1 허프만 모드 복호화부(1510)는 컨텍스트 기반 허프만 복호화에 기반하여, 제2 허프만 모드 복호화부(1530)는 리사이즈 허프만 복호화에 기반하여 차분 양자화 인덱스의 상위비트를 복호화할 수 있다.

구체적으로, 비트스트림에 포함된 부호화방식과 관련된 플래그 비트가 스몰 부호화방식을 나타내는 경우, 부호화모드와 관련된 플래그 비트를 추출할 수 있다. 부호화모드는 컨텍스트 기반 허프만 부호화모드와 리사이즈드 허프만 부호화모드 중 하나일 수 있다.

제1 허프만 모드 복호화부(1510)는 일실시예에 따르면 도 9의 제1 허프만 모드 부호화부(910)에서와 마찬가지로, 3개 그룹의 차분 양자화 인덱스의 확률분포에 의해 결정된 2가지 허프만 복호화 테이블을 이용한다. 여기서, 현재 밴드의 차분 양자화 인덱스(d(i))를 허프만 복호화함에 있어서, 이전 밴드의 차분 양자화 인덱스(d(i-1))를 컨텍스트로 활용하며, 그룹 인덱스 1에 대한 허프만 복호화 테이블 1과 그룹 2에 대한 허프만 복호화 테이블 0이 사용되는 것을 예로 들기로 한다.

먼저, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는지를 판단한다. 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 1에 속하는 경우, 허프만 복호화 테이블 1로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 한편, 이전 밴드의 차분 양자화 인덱스d(i-1))이 그룹 인덱스 1에 속하지 않는 경우, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하는지를 판단한다.

이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하지 않는 경우 즉, 그룹 인덱스 2에 속하는 경우, 허프만 복호화 테이블 0로부터 현재 밴드의 차분 양자화 인덱스(d(i))에 대한 코드를 선택한다. 한편, 이전 밴드의 차분 양자화 인덱스(d(i-1))가 그룹 인덱스 0에 속하는 경우, 현재 밴드의 차분 양자화 인덱스(d(i))을 반전처리하고, 허프만 복호화 테이블 0로부터 반전처리된 현재 밴드의 차분 양자화 인덱스(d'(i))에 대한 코드를 선택한다.

각 선택된 코드를 이용하여 현재 밴드의 차분 양자화 인덱스(d(i))에 대하여 허프만 복호화를 수행한다.

제2 허프만 모드 복호화부(1530)는 일실시예에 따르면 도 9의 제2 허프만 모드 부호화부(930)에서와 마찬가지로, 현재 프레임이 트랜지언트 프레임인지 여부에 따라서 서로 다른 방식으로 차분 양자화 인덱스에 대하여 허프만 복호화를 수행할 수 있다.

도 16은 제1 부호화방식 즉, 스몰 심볼 부호화방식에 의해 부호화되는 에너지 양자화 인덱스를 설명하는 도면으로서, N은 6, N0는 5, N1은 1인 경우를 예로 든 것이다. 도 16을 참조하면, 상위 5 비트는 허프만 부호화 모드를 사용하고, 하위 1 비트는 단순히 비트를 패킹할 수 있다.

도 17은 본 발명의 일실시예에 따른 부호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.

도 17에 도시된 멀티미디어 기기(1700)는 통신부(1710)와 부호화모듈(1730)을 포함할 수 있다. 또한, 부호화 결과 얻어지는 오디오 비트스트림의 용도에 따라서, 오디오 비트스트림을 저장하는 저장부(1750)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1700)는 마이크로폰(1770)을 더 포함할 수 있다. 즉, 저장부(1750)와 마이크로폰(1770)은 옵션으로 구비될 수 있다. 한편, 도 17에 도시된 멀티미디어 기기(1700)는 임의의 복호화모듈(미도시), 예를 들면 일반적인 복호화 기능을 수행하는 복호화모듈 혹은 본 발명의 일실시예에 따른 복호화모듈을 더 포함할 수 있다. 여기서, 부호화모듈(1730)은 멀티미디어 기기(1700)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다.

도 17을 참조하면, 통신부(1710)는 외부로부터 제공되는 오디오와 부호화된비트스트림 중 적어도 하나를 수신하거나, 복원된 오디오와 부호화모듈(1730)의 부호화결과 얻어지는 오디오 비트스트림 중 적어도 하나를 송신할 수 있다.

통신부(1710)는 무선 인터넷, 무선 인트라넷, 무선 전화망, 무선 랜(LAN), 와이파이(Wi-Fi), 와이파이 다이렉트(WFD, Wi-Fi Direct), 3G(Generation), 4G(4 Generation), 블루투스(Bluetooth), 적외선 통신(IrDA, Infrared Data Association), RFID(Radio Frequency Identification), UWB(Ultra WideBand), 지그비(Zigbee), NFC(Near Field Communication)와 같은 무선 네트워크 또는 유선 전화망, 유선 인터넷과 같은 유선 네트워크를 통해 외부의 멀티미디어 기기와 데이터를 송수신할 수 있도록 구성된다.

부호화모듈(1730)은 일실시예에 따르면, 통신부(1710) 혹은 마이크로폰(1770)을 통하여 제공되는 시간 도메인의 오디오 신호를 주파수 도메인의 오디오 스펙트럼으로 변환하고, 주파수 도메인의 오디오 스펙트럼으로부터 얻어지는 에너지 양자화 인덱스의 부호화 방법을 라아지 심볼 부호화방식과 스몰 심볼 부호화방식 중 하나로 결정하고, 부호화방식 결정 결과에 대응하여, 에너지 양자화 인덱스를 부호화할 수 있다. 구체적으로, 부호화방식을 결정함에 있어서 차분 코딩이 적용되는 경우, 현재 프레임에 포함된 모든 밴드의 차분 양자화 인덱스가 소정 비트로 표현되는지에 따라서, 라아지 심볼 부호화방식과 스몰 심볼 부호화방식 중 하나로 결정할 수 있다. 한편, 현재 프레임에 포함된 모든 밴드의 차분 양자화 인덱스가 소정 비트로 표현되더라도, 차분 양자화 인덱스를 라아지 심볼 부호화방식으로 부호화한 결과와 스몰 심볼 부호화방식으로 부호화한 결과에 따라서, 라아지 심볼 부호화방식과 스몰 심볼 부호화방식 중 비트소비가 적은 방식을 선택할 수 있다. 여기서, 라아지 심볼 부호화방식은 펄스모드와 스케일 모드를 포함할 수 있다. 스몰 심볼 부호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 분리하여 부호화를 수행하며, 상위비트는 복수의 허프만 부호화 모드를 포함할 수 있고, 하위비트는 비트패킹을 사용할 수 있다. 차분 양자화 인덱스에 대하여 결정된 부호화 방식과 부호화 모드는 부가정보로 생성할 수 있다.

저장부(1750)는 부호화 모듈(1730)에서 생성되는 부호화된 비트스트림을 저장할 수 있다. 한편, 저장부(1750)는 멀티미디어 기기(1700)의 운용에 필요한 다양한 프로그램을 저장할 수 있다.

마이크로폰(1770)은 사용자 혹은 외부의 오디오신호를 부호화모듈(1730)로 제공할 수 있다.

도 18은 본 발명의 일실시예에 따른 복호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.

도 18에 도시된 멀티미디어 기기(1800)는 통신부(1810)와 복호화모듈(1830)을 포함할 수 있다. 또한, 복호화 결과 얻어지는 복원된 오디오신호의 용도에 따라서, 복원된 오디오신호를 저장하는 저장부(1850)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1800)는 스피커(1870)를 더 포함할 수 있다. 즉, 저장부(1850)와 스피커(1870)는 옵션으로 구비될 수 있다. 한편, 도 18에 도시된 멀티미디어 기기(1800)는 임의의 부호화모듈(미도시), 예를 들면 일반적인 부호화 기능을 수행하는 부호화모듈 혹은 본 발명의 일실시예에 따른 부호화모듈을 더 포함할 수 있다. 여기서, 복호화모듈(1830)은 멀티미디어 기기(1800)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나의 이상의 프로세서(미도시)로 구현될 수 있다.

도 18을 참조하면, 통신부(1810)는 외부로부터 제공되는 부호화된 비트스트림과 오디오 신호 중 적어도 하나를 수신하거나 복호화 모듈(1830)의 복호화결과 얻어지는 복원된 오디오 신호와 부호화결과 얻어지는 오디오 비트스트림 중 적어도 하나를 송신할 수 있다. 한편, 통신부(1810)는 도 17의 통신부(1710)와 실질적으로 유사하게 구현될 수 있다.

복호화 모듈(1830)은 일실시예에 따르면, 통신부(1810)를 통하여 제공되는 비트스트림을 수신하고, 비트스트림에 포함된 부가정보에 근거하여 에너지의 차분 양자화 인덱스의 부호화 방식 및 부호화 모드를 판단하고, 부호화 방식 및 부호화 모드 판단 결과에 대응하여, 차분 양자화 인덱스를 복호화할 수 있다. 라아지 심볼 복호화 방식은 펄스모드와 스케일 모드를 포함할 수 있다. 스몰 심볼 복호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 분리하여 복호화를 수행하며, 상위비트는 복수의 허프만 복호화 모드를 포함할 수 있고, 하위비트는 비트언패킹을 사용할 수 있다.

저장부(1850)는 복호화 모듈(1830)에서 생성되는 복원된 오디오신호를 저장할 수 있다. 한편, 저장부(1850)는 멀티미디어 기기(1800)의 운용에 필요한 다양한 프로그램을 저장할 수 있다.

스피커(1870)는 복호화 모듈(1830)에서 생성되는 복원된 오디오신호를 외부로 출력할 수 있다.

도 19는 본 발명의 일실시예에 따른 부호화모듈과 복호화모듈을 포함하는 멀티미디어 기기의 구성을 나타낸 블록도이다.

도 19에 도시된 멀티미디어 기기(1900)는 통신부(1910), 부호화모듈(1920)과 복호화모듈(1930)을 포함할 수 있다. 또한, 부호화 결과 얻어지는 오디오 비트스트림 혹은 복호화 결과 얻어지는 복원된 오디오신호의 용도에 따라서, 오디오 비트스트림 혹은 복원된 오디오신호를 저장하는 저장부(1940)을 더 포함할 수 있다. 또한, 멀티미디어 기기(1900)는 마이크로폰(1950) 혹은 스피커(1960)를 더 포함할 수 있다. 여기서, 부호화모듈(1920)과 복호화모듈(1930)은 멀티미디어 기기(1900)에 구비되는 다른 구성요소(미도시)와 함께 일체화되어 적어도 하나 이상의 프로세서(미도시)로 구현될 수 있다.

도 19에 도시된 각 구성요소는 도 17에 도시된 멀티미디어 기기(1700)의 구성요소 혹은 도 18에 도시된 멀티미디어 기기(1800)의 구성요소와 중복되므로, 그 상세한 설명은 생략하기로 한다.

도 17 내지 도 19에 도시된 멀티미디어 기기(1700, 1800, 1900)에는, 전화, 모바일 폰 등을 포함하는 음성통신 전용단말, TV, MP3 플레이어 등을 포함하는 방송 혹은 음악 전용장치, 혹은 음성통신 전용단말과 방송 혹은 음악 전용장치의 융합 단말장치가 포함될 수 있으나, 이에 한정되는 것은 아니다. 또한, 멀티미디어 기기(1700, 1800, 1900)는 클라이언트, 서버 혹은 클라이언트와 서버 사이에 배치되는 변환기로서 사용될 수 있다.

한편, 멀티미디어 기기(1700, 1800, 1900)가 예를 들어 모바일 폰인 경우, 도시되지 않았지만 키패드 등과 같은 유저 입력부, 유저 인터페이스 혹은 모바일 폰에서 처리되는 정보를 디스플레이하는 디스플레이부, 모바일 폰의 전반적인 기능을 제어하는 프로세서를 더 포함할 수 있다. 또한, 모바일 폰은 촬상 기능을 갖는 카메라부와 모바일 폰에서 필요로 하는 기능을 수행하는 적어도 하나 이상의 구성요소를 더 포함할 수 있다.

한편, 멀티미디어 기기(1700, 1800, 1900)가 예를 들어 TV인 경우, 도시되지 않았지만 키패드 등과 같은 유저 입력부, 수신된 방송정보를 디스플레이하는 디스플레이부, TV의 전반적인 기능을 제어하는 프로세서를 더 포함할 수 있다. 또한, TV는 TV에서 필요로 하는 기능을 수행하는 적어도 하나 이상의 구성요소를 더 포함할 수 있다.

상기 실시예들은 컴퓨터에서 실행될 수 있는 프로그램으로 작성가능하고, 컴퓨터로 읽을 수 있는 기록매체를 이용하여 상기 프로그램을 동작시키는 범용 디지털 컴퓨터에서 구현될 수 있다. 또한, 상술한 본 발명의 실시예들에서 사용될 수 있는 데이터 구조, 프로그램 명령, 혹은 데이터 파일은 컴퓨터로 읽을 수 있는 기록매체에 다양한 수단을 통하여 기록될 수 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함할 수 있다. 컴퓨터로 읽을 수 있는 기록매체의 예로는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함될 수 있다. 또한, 컴퓨터로 읽을 수 있는 기록매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 전송 매체일 수도 있다. 프로그램 명령의 예로는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함할 수 있다.

이상과 같이 본 발명의 일실시예는 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명의 일실시예는 상기 설명된 실시예에 한정되는 것은 아니며, 이는 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 따라서, 본 발명의 스코프는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 이의 균등 또는 등가적 변형 모두는 본 발명 기술적 사상의 범주에 속한다고 할 것이다.

Claims

에너지의 양자화 인덱스가 표현되는 범위에 근거하여 제1 부호화방식과 제2 부호화방식 중 하나를 선택하는 단계; 및

상기 선택된 부호화방식을 이용하여 상기 양자화 인덱스를 부호화하는 단계를 포함하는 무손실 부호화방법.
제1 항에 있어서, 상기 방법은 프레임 단위로 수행되는 무손실 부호화방법.
제1 항에 있어서, 상기 부호화 방식 선택단계는 차분 부호화가 적용되는 경우,

현재 프레임에 포함된 모든 밴드의 적어도 하나의 차분 양자화 인덱스가 소정 비트로 표현되지 않는 경우, 상기 제1 부호화방식을 선택하는 단계;

상기 현재 프레임에 포함된 모든 밴드의 차분 양자화 인덱스가 소정 비트로 표현되는 경우, 상기 제1 부호화방식과 상기 제2 부호화방식 중 적은 비트 소비에 해당하는 방식을 선택하는 단계; 및

상기 선택된 부호화방식을 나타내는 부가정보를 생성하는 단계를 포함하는 무손실 부호화방법.
제1 항에 있어서, 상기 제1 부호화방식은 펄스 모드와 스케일 모드를 포함하는 무손실 부호화방법.
제1 항에 있어서, 상기 펄스 모드와 상기 스케일 모드는 허프만 부호화에 의해 수행되는 무손실 부호화방법.
제1 항에 있어서, 상기 제2 부호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 나누어 부호화를 수행하는 무손실 부호화방법.
제6 항에 있어서, 상기 상위비트는 복수개의 허프만 부호화 모드 중 하나를 사용하여 부호화를 수행하고, 상위비트의 부호화모드를 나타내는 부가정보를 생성하는 무손실 부호화방법.
제7 항에 있어서, 상기 상위비트는 복수개의 허프만 부호화 모드는 컨텍스트를 사용하는 모드와 사용하지 않은 모드를 포함하는 무손실 부호화방법.
제6 항에 있어서, 상기 하위비트는 비트패킹에 의해 부호화가 수행되는 무손실 부호화방법.
비트스트림에 포함된 에너지의 차분 양자화 인덱스의 부호화 방식을 결정하는 단계; 및

상기 결정된 부호화 방식에 대응하여, 상기 차분 양자화 인덱스를 에너지의 양자화 인덱스가 표현되는 범위에 근거한 제1 복호화방식과 제2 복호화방식 중 하나로 복호화하는 단계를 포함하는 무손실 복호화방법.
제10 항에 있어서, 상기 방법은 프레임 단위로 수행되는 무손실 복호화방법.
제10 항에 있어서, 상기 제1 복호화방식은 펄스 모드와 스케일 모드를 포함하며, 상기 비트스트림에 포함된 부호화모드에 대응하여 선택되는 무손실 복호화방법.
제12 항에 있어서, 상기 펄스 모드와 상기 스케일 모드는 허프만 복호화에 의해 수행되는 무손실 복호화방법.
제10 항에 있어서, 상기 제2 복호화방식은 차분 양자화 인덱스를 상위비트와 하위비트로 나누어 복호화를 수행하는 무손실 복호화방법.
제14 항에 있어서, 상기 상위비트는 상기 비트스트림에 포함된 부호화모드에 대응하여 복수개의 허프만 복호화 모드 중 하나를 사용하여 복호화를 수행하는 무손실 부호화방법.
제15 항에 있어서, 상기 복수개의 허프만 복호화 모드는 컨텍스트를 사용하는 모드와 사용하지 않은 모드를 포함하는 무손실 복호화방법.
제14 항에 있어서, 상기 하위비트는 비트언패킹에 의해 복호화가 수행되는 무손실 복호화방법.