KR20120013893A

KR20120013893A - 디코딩 방법 및 그에 따른 디코딩 장치

Info

Publication number: KR20120013893A
Application number: KR1020110069496A
Authority: KR
Inventors: 김현욱; 문한길; 이상훈
Original assignee: 삼성전자주식회사
Priority date: 2010-08-06
Filing date: 2011-07-13
Publication date: 2012-02-15
Also published as: KR101837083B1; KR20120013894A; KR20120013887A; KR20120013892A; KR20120013885A; KR101837084B1; KR101819027B1; KR20120013884A

Abstract

본원 발명은 비트스트림을 디코딩하는 단계, 상기 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 단계, 각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하는 단계, 및 n 개의 상기 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성하는 단계를 포함하며, 연산의 복잡도를 낮출 수 있는 오디오 신호의 복원 방법을 기재한다.

Description

디코딩 방법 및 그에 따른 디코딩 장치{Method for decoding of audio signal and apparatus for decoding thereof}

본원 발명은 디코딩 장치 및 그에 따른 디코딩 방법에 관한 것이다.

보다 상세하게는, 오디오 신호를 포함하는 비트 스트림을 디코딩하여 원래의 오디오 신호로 복원하는 디코딩 장치 및 그에 따른 디코딩 방법에 관한 것이다.

오디오 디코더는 오디오 비트 스트림을 수신하고, 수신된 비트 스트림을 디코딩하여 소리로 재생할 수 있는 오디오 신호로 복원한다. 여기서, 오디오 비트 스트림은 MP3 규격 등과 같은 소정 규격에 따라서 오디오 신호를 엔코딩하여 생성될 수 있다. 이 경우, 오디오 디코더는 MP3 디코더가 된다. 또한, 복원된 오디오 신호는 스테리오(stereo) 신호 또는 멀티 채널 오디오 신호일 수 있다.

MP3 디코더는 PQMF(Pseudo Quadrature Mirror Filter) 합성기를 이용한다. PQMF 합성기는 디코딩 된 오디오 신호를 원래의 멀티 채널 오디오 신호로 합성(synthesis)하기 위해서 PQMF 필터 뱅크(filter bank)를 이용한다. PQMF 필터 뱅크는 복원된 비트 스트림을 시간 도메인(time domain)에서 처리한다. 또한, 일반적으로 PQMF 필터 뱅크는 컨볼루션(convolution)과 같은 복잡한 연산을 이용하여 복원된 비트 스트림을 멀티 채널 오디오 신호로 합성한다.

따라서, MP3 디코더의 PQMF 합성기는 수행되는 연산의 복잡도가 매우 높아서, 고속 구동을 위해서는 대용량 메모리와 고사양의 프로세서가 필요하다. 또한, MP3 디코더는 시간 도메인에서 복원된 비트 스트림을 처리하므로, 변환 도메인(transform domain) 상에서 비트 스트림을 처리하는 멀티 채널 코덱(multi channel codec)과 호환성이 없다.

따라서, 다른 코덱, 예를 들어, 멀티 채널 코덱, 과 호환성을 가지면서, 연산의 복잡도를 낮출 수 있는 오디오 신호 디코더 및 오디오 신호의 복원 방법을 제공할 필요가 있다.

본원 발명은 변환 도메인 상에서 비트 스트림을 처리하는 코덱과의 호환성을 갖는 디코딩 장치 및 그에 따른 디코딩 방법의 제공을 목적으로 한다.

또한, 본원 발명은 디코딩 장치의 연상 복잡도를 낮출 수 있는 디코딩 장치 및 그에 따른 디코딩 방법의 제공을 목적으로 한다.

또한, 본원 발명은 음질을 향상시킬 수 있는 디코딩 장치 및 그에 따른 디코딩 방법의 제공을 목적으로 한다.

본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 디코딩 장치를 이용하여 오디오 신호를 복원하는 방법에 있어서, 비트스트림을 디코딩하는 단계, 상기 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 단계, 각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하는 단계, 및 n 개의 상기 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성하는 단계를 포함한다.

또한, 상기 변환 서브 밴드 신호를 생성하는 단계는 각각의 상기 서브 밴드 신호를 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함할 수 있다.

또한, 상기 합성 오디오 신호를 생성하는 단계는 주파수 도메인에서 수행될 수 있다.

또한, 상기 합성 오디오 신호를 생성하는 단계는 고속 퓨리에 변환 도메인에서 수행될 수 있다.

또한, 상기 합성 필터뱅크 계수에 대응되는 소정 값은 상기 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출될 수 있다.

또한, 상기 합성 필터뱅크 계수에 대응되는 소정 값은 상기 합성 필터뱅크 계수들에 근거하여 산출되는 합성 필터 값을 고속 퓨리에 변환한 값이 될 수 있다.

또한, 상기 변환 서브 밴드 신호를 생성하는 단계는 상기 n 개의 서브 밴드 신호들 각각을 역 변형 이산 코사인 변환하는 단계, 및 역 변형 이산 코사인 변환된 상기 n 개의 서브 밴드 신호들 각각을 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함할 수 있다.

또한, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 상기 합성 오디오 신호를 역 고속 퓨리에 변환하는 단계를 더 포함할 수 있다.

또한, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 상기 합성 오디오 신호를 역 변형 이산 코인 변환하는 단계를 더 포함할 수 있다.

또한, 상기 합성 오디오 신호를 생성하는 단계는 상기 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터에 맞춰서 조절하는 단계, 및 상기 조절된 변환 서브 밴드 신호를 상기 소정 값과 곱하여 상기 합성 오디오 신호를 생성하는 단계를 포함할 수 있다.

또한, 상기 합성 오디오 신호를 생성하는 단계는 상기 합성 오디오 신호를 멀티플렉싱하는 단계를 더 포함할 수 있다.

또한, 상기 비트 스트림을 디코딩하는 단계는 비트스트림을 언패킹하여 디코딩하는 단계, 디코딩된 상기 비트 스트림을 역양자화 및 재배열하는 단계, 및 역양자화 및 재배열된 상기 비트 스트림을 적어도 하나의 채널로 분리하는 단계를 포함할 수 있다.

본 발명의 일 실시예에 따른 디코딩 장치는 비트 스트림을 디코딩하고, 디코딩 된 상기 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 디코딩 코어부, 및 상기 서브 밴드 신호들 각각을 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하며, n 개의 상기 변환 서브 밴드 신호들 각각과 그에 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값들을 곱하여 합성 오디오 신호를 생성하는 합성부를 포함한다.

도 1은 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블록 다이어그램이다.
도 2는 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 일 블록 다이어그램이다.
도 3은 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 다른 블록 다이어그램이다.
도 4는 도 3의 합성부를 좀 더 상세하게 나타내는 일 도면이다.
도 5는 도 4의 합성부를 좀 더 상세하게 나타내는 일 도면이다.
도 6은 도 5의 곱하기 연산부에서 생성되는 신호들을 설명하기 위한 도면이다.
도 7은 도 6의 멀티플렉서의 동작을 설명하기 위한 도면이다.
도 8은 도 1의 합성부를 좀 더 상세하게 나타내는 다른 도면이다.
도 9는 본 발명의 일 실시예에 따른 오디오 신호 복원 방법을 나타내는 플로우차트이다.

이하에서는, 첨부된 도면을 참조하여, 본 발명에 따른 디코딩 장치 및 그에 따른 디코딩 방법에 대하여 상세히 설명한다.

도 1은 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블록 다이어그램이다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 디코딩 장치(100)는 디코딩 코어부(decoding core unit)(110) 및 합성부(synthesis unit)(130)를 포함한다.

디코딩 장치(100)는 소정 규격에 따라서 엔코딩되어 전송되는 오디오 비트 스트림을 복원하는 장치이다. 여기서, 소정 규격은 MP3 규격이 될 수 있다.

디코딩 코어부(110)는 엔코딩 된 비트 스트림을 수신하고, 수신된 비트 스트림을 디코딩한다.

합성부(130)는 디코딩 코어부(110)에서 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할한다. 구체적으로, 오디오 신호에 대응되는 비트 스트림을 다수개의 주파수 대역 별로 분할하여, 서브 밴드 신호를 생성한다. 예를 들어, 오디오 신호의 총 주파수 대역을 32개로 분할하여, 32개의 서브 밴도 신호를 생성할 수 있다. 그리고, 각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성한다.

합성부(130)는 계속하여, n 개의 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성한다. 이하, '합성 필터뱅크 계수들에 대응되는 소정 값'은 '계수 대응 소정 값'이라 한다. 여기서, 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 동작은, 디코딩 코어부(110)에서 수행될 수도 있다.

또한, 합성부(130)는 주파수 도메인에서, n 개의 변환 서브 밴드 신호들 각각과 대응되는 계수 대응 소정 값들과 곱하여 합성 오디오 신호를 생성한다. 구체적으로, 합성부(130)는 고속 퓨리에 변환 도메인(FFT domain: Fast Fourier transform domain)에서, n 개의 변환 서브 밴드 신호들 각각과 대응되는 계수 대응 소정 값 간의 곱하기 연산을 수행하여 합성 오디오 신호를 생성할 수 있다.

전술한 바와 같이, 본 발명의 일 실시예에 따른 디코딩 장치는 비트 스트림을 합성하기 위해서, 주파수 도메인에서 변환된 변환 서브 밴드 신호와 계수 대응 소정 값 간의 곱하기 연산을 수행한다. 따라서, 컨볼루션 연산을 통해 비트 스트림을 합성하는 디코딩 장치보다 연산의 복잡도를 크게 낮출 수 있다. 그에 따라서, 대용량 메모리 및 고사양의 프로세서를 구비하지 않고도, 디코딩 속도를 증가시킬 수 있다.

또한, 본 발명의 일 실시예에 따른 디코딩 장치는 시간 도메인을 거치지 않고 고속 퓨리에 변환 도메인과 같은 주파수 도메인에서 비트 스트림을 합성함으로써, 멀티 채널 코덱과의 호환성을 가질 수 있다.

도 2는 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 일 블록 다이어그램이다. 도 2의 디코딩 장치(200), 디코딩 코어부(210) 및 합성부(230)는 각각 도 1에서 설명한 디코딩 장치(100), 디코딩 코어부(110) 및 합성부(130)와 동일 대응된다. 따라서, 도 1에서와 중복되는 설명은 생략한다.

도 2를 참조하면, 디코딩 장치(200)는 디코딩 코어부(210) 및 합성부(230)를 포함한다.

디코딩 코어부(210)는 언패킹 부(unpacking unit)(211), 역 양자화부(requantization unit)(212) 및 채널 분리부(213)를 포함할 수 있다.

언패킹 부(211)는 수신된 비트 스트림은 언패킹(unpacking)한다. 구체적으로, 비트 스트림을 전송하는 엔코딩 장치(미도시)는 오디오 신호를 압축하고 소정 형태로 형태 변환하여 비트 스트림을 생성한다. 구체적으로, 언패킹 부(211)는 수신된 비트 스트림의 형태가 엔코딩 장치에서 형태 변환되기 이전의 형태를 갖도록, 수신된 비트 스트림의 형태를 역변환한다.

또한, 언패킹 부(211)는 언패킹 부(211)에서 언패킹된 비트 스트림을 디코딩한다. 구체적으로, 상기 디코딩은 허프만 디코딩(huffman decoding) 연산에 따라 수행될 수 있다. 허프만 디코딩 연산은, 허프만 부호화 테이블을 이용하여 비트 스트림을 복호화하는 연산로, MPEG(Moving Picture Experts Group) 또는 JPEG(Joint Photographic Experts Group) 등에서 주로 사용되는 무손실 압축 방법이다.

역 양자화 부(212)는 언패킹 부(211)에서 언패킹된 비트 스트림을 역 양자화(requantization)하고, 역 양자화된 비트 스트림을 소정 순서로 재배열(reordering)한다.

채널 분리부(213)는 역 양자화 부(212)에서 출력되는 비트 스트림을 적어도 하나의 채널로 분리한다. 예를 들어, 디코딩 장치(200)가 수신한 비트 스트림이 좌측 채널(left channel) 및 우측 채널(right channel)을 포함하는 스테레오(stereo) 오디오 신호를 포함한다면, 채널 분리부(213)는 수신한 비트 스트림에서 좌측 채널에 대응되는 신호와 우측 채널에 대응되는 신호를 분리하여, 출력할 수 있다. 또한, 수신된 비트 스트림이 5.1 채널(5.1 channel), 즉, 6개의 채널,을 포함하는 경우, 채널 분리부(213)는 비트 스트림을 6개의 채널들로 각각 분리할 수 있다.

도 2에서는, 채널 분리부(213)가 비트 스트림을 2개의 채널로 분리하여 출력하는 경우를 예로 들어 도시하였다. 이 경우, N1 노드로는 좌측 채널에 대응되는 비트 스트림이 출력되며, N2 노드로는 우측 채널에 대응되는 비트 스트림이 출력될 수 있다.

또한, 합성부(230)는 하나의 채널에 대응되는 비트 스트림을 합성하여, 합성 오디오 신호를 생성하는 적어도 하나의 합성부인 제1 및 제2 합성부(231, 232)를 포함할 수 있다. 도 2에서는 합성부(230)가 2개의 제1 및 제2 합성부(231, 232)를 포함하는 경우를 예로 들어 도시하였다.

합성부(230)는 채널 분리부(213)에서 분리된 비트 스트림들 각각에 대응되는 계수 대응 소정 값을 곱하여 합성 오디오 신호를 생성한다.

여기서, 합성 필터뱅크 계수는 디코딩 장치(200)가 수신한 비트 스트림 내에서 추출된 합성 필터뱅크 계수들에 근거하여 산출된다. 구체적으로, 합성 필터뱅크의 계수는 MP3 규격의 ISO/IEC 11172-3 부분의 table B.3에서 정의하는 필터 뱅크의 계수가 될 수 있다. 전술한 곱하기 연산에 이용되는 합성 필터 뱅크의 계수는 이하에서 도 5 및 도 6을 참조하여 상세히 설명한다.

합성부(230)에 구비되는 다수개의 합성부들인 제1 및 제2 합성부(231, 232)들 각각은 일 채널에 대응되는 변환 서브 밴드 신호들과, 상기 변환 서브 밴드 신호들에 대응되는 계수 대응 소정 값들을 곱하여, 합성 오디오 신호를 생성한다.

도 3은 도 1의 디코딩 장치를 좀 더 상세하게 나타내는 다른 블록 다이어그램이다.

도 3을 참조하면, 디코딩 장치(300), 디코딩 코어부(310), 및 합성부(330)는 각각 도 1 및 도 2의 디코딩 장치(100, 200), 디코딩 코어부(110, 210), 및 합성부(130, 230)에 동일 대응되므로, 도 1 및 도 2에서와 중복되는 설명은 생략한다. 구체적으로, 도 3의 합성부(330)는 도 2의 제1 합성부(231) 또는 제2 합성부(232) 중 어느 하나와 동일 대응된다.

전술한 바와 같이, 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 동작은 디코딩 코어부(310)에서 수행될 수 도 있고, 합성부(330)에서 수행될 수 도 있다. 도 3에서는 합성부(330)가 밴드 분할부(340)를 포함하여, 하나의 채널에 대응되는 디코딩된 비트 스트림을 전송받고, n 개의 서브 밴드 신호를 출력하는 경우를 예로 들어 도시하였다.

도 3을 참조하면, 합성부(330)는 밴드 변환부(350) 및 곱하기 연산부(370)를 포함한다. 또한, 밴드 분할부(340)를 더 포함할 수 있다.

밴드 분할부(340)는 하나의 채널에 대응되는 디코딩된 비트 스트림을 전송받고, n 개의 서브 밴드 신호를 출력한다. 또한, 디코딩 코어부(310)가 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 동작을 수행하는 경우, 합성부(330)는 밴드 분할부(340)를 포함하지 않으며, 밴드 변환부(350)는 디코딩 코어부(310)로부터 n 개의 서브 밴드 신호를 직접 전송받는다.

밴드 변환부(350)는 n 개의 서브 밴드 신호들이 입력되는 경우, 내부적으로 소정 서브 밴드 신호들 별로 곱하기 연산을 수행하는 제1 내지 제n 변환부들(351, 355, 359)을 포함한다. 제1 내지 제n 변환부들(351, 355, 359)은 n 개의 서브 밴드 신호들을 입력받고, 각각의 서브 밴드 신호를 고속 퓨리에 변환(FFT)한다. 제1 내지 제N 밴드 변환부들(351, 355, 359) 각각은 입력받은 신호의 FFT 변환을 수행한다.

밴드 변환부(350)의 구체적은 구성 및 동작은 이하에서 도 4 및 도 8을 참조하여 설명한다.

곱하기 연산부(370)는 디코딩 장치(300)로 수신된 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출되는 전술한 계수 대응 소정 값과 밴드 변환부(350)에서 출력되는 변환 서브 밴드 신호를 곱하여 합성 오디오 신호를 생성한다. 여기서, 곱하기 연산부(370)는 주파수 도메인에서 전술한 곱하기 연산을 수행할 수 있다.

도 4는 도 3의 합성부를 좀 더 상세하게 나타내는 일 도면이다. 도 4의 디코딩 코어부(410), 및 합성부(430)는 각각 도 3의 디코딩 코어부(310), 및 합성부(330)와 동일 대응되므로, 중복되는 설명은 생략한다.

또한, 도 4에서는 도 3의 밴드 분할부(340)가 수행하는 역할을 디코딩 코어부(410)가 수행하는 경우를 예로 들어 도시하였다. 따라서, 합성부(430)는 도 3의 합성부(330)와 달리 밴드 분할부(340)를 포함하지 않으며, 디코딩 코어부(410)로부터 n 개의 서브 밴드 신호들을 전송받는다.

도 4를 참조하면, 밴드 변환부(450)는 상기 n 개의 서브 밴드 신호들을 각각 입력받는 n 개의 IMDCT 부(inverse modified discrete cosine transform unit)(452, 456)를 포함하며, 상기 n 개의 IMDCT 부들의 출력을 각각 입력받는 n 개의 FFT 부(fast fourier transform unit)들(453, 457)을 포함한다.

IMDCT 부(예를 들어, 452)는 첫 번째 서브 밴드 신호를 입력받고, 이를 역 이산 변형 코사인 변환하여 출력한다.

FFT 부(예를 들어, 453)는 IMDCT 부(예를 들어, 452)에서 출력되는 신호를 입력받고, 이를 고속 퓨리에 변환하여 출력한다.

또한, 곱하기 연산부(470)는 밴드 변환부(450)에서 출력되는 제1 내지 제 n 변환 서브 밴드 신호들을 입력받는 제1 내지 제 n 밴드 곱하기 연산부들(471, 472)을 포함한다.

제1 내지 제 n 밴드 곱하기 연산부들(471, 472) 각각은 해당 서브 밴드별로 변환 서브 밴드 신호를 입력받고, 입력된 변환 서브 밴드 신호와 그에 대응되는 계수 대응 소정 값을 곱하여 출력한다. 예를 들어, 제1 밴드 곱하기 연산부(471)는 오디오 신호의 주파수 대역이 제1 서브 밴드에 해당하는 변환 제1 서브 밴드 신호를 입력받고, 상기 제1 서브 밴드 신호에 대응되는 계수 대응 소정 값과 제1 서브 밴드 신호 간의 곱하기 연산을 수행한다. 제2 내지 제n 밴드 곱하기 연산부들도 제1 밴드 곱하기 연산부(471)와 동일한 곱하기 연산을 수행한다.

또한, 합성부(430)는 도 3의 합성부(330)에 비하여 멀티플렉서(multiplexer)(480) 및 IFFT 부(inverse fast fourier transform unit)(490)를 더 포함할 수 있다.

멀티플렉서(480)는 제1 내지 제 n 밴드 곱하기 연산부들(471, 472)에서 출력되는 n 개의 합성 오디오 신호들을 입력받고, 이를 멀티플렉싱하여 출력한다. 1 내지 제 n 밴드 곱하기 연산부들(471, 472)에서 출력되는 n 개의 합성 오디오 신호들을 입력받고, 이를 하나의 신호로 통합하여 출력한다.

IFFT 부(490)는 멀티플렉서(480)에서 출려되는 신호를 역 고속 퓨리에 변환하여 출력한다.

도 5는 도 4의 합성부를 좀 더 상세하게 나타내는 일 도면이다.

도 5를 참조하면, 디코딩 코어부(510), 및 합성부(530)는 각각 도 4에서 설명한 디코딩 코어부(410), 및 합성부(430)와 동일 대응되므로, 도 4에서와 중복되는 설명은 생략한다.

밴드 변환부(550)는 내부적으로 구비되는 IMDCT 부(452) 및 FFT 부(453)를 이용하여, 서브 밴드 신호를 역 변형 이산 코사인 연산 및 고속 퓨리에 연산하여 변환 서브 밴드 신호를 출력한다.

도 5를 참조하면, 곱하기 연산부(570)는 제1 내지 제 n 변환 서브 밴드 신호들을 각각 입력받는 n 개의 위상 진폭 보상부(예를 들어, 575)들 및 위상 진폭 보상부와 직렬 연결되는 n 개의 합성 필터부(예를 들어, 576)들을 포함한다. 구체적으로, 도 4의 제1 밴드 곱하기 연산부(471)에 대응되는 제1 밴드 곱하기 연산부(571) 제1 서브 밴드에 대응되는 변환 서브 밴드 신호를 입력받는 위상 진폭 보상부(575) 및 상기 위상 진폭 보상부(575)와 직렬 연결되는 합성 필터부(576)를 포함한다.

도 6은 도 5의 곱하기 연산부에서 생성되는 신호들을 설명하기 위한 도면이다. 이하에서는 도 5 및 도 6을 참조하여, 곱하기 연산부(570)에 포함되는 제1 서브 밴드에 대응되는 변환 서브 밴드 신호를 처리하는 제1 밴드 곱하기 연산부(571)의 구성 및 동작을 설명한다.

위상 진폭 보상부(575)는 입력되는 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터(synthesis filter)에 맞춰 조절한다. 합성 필터는 합성 필터부(571)에 포함되어, 합성 오디오 신호를 생성하기 위한 필터이다.

합성 필터부(576)는 위상 진폭 보상부(575)에서 출력되는 변환 서브 밴드 신호와 그에 대응되는 계수 대응 소정 값 간에 곱하기 연산을 수행하여 합성 오디오 신호를 생성한다.

도 6의 그래프들 각각에서, x 축은 주파수를 나타내며, y 축은 오디오 신호에 대응되는 변환 서브 밴드 신호의 진폭값을 나타낸다. 또한, 도 6에서는, l 번째 서브 밴드를 처리하는 제 l 곱하기 연산부의 동작을 예로 들어 설명한다.

도 6의 (a)를 참조하면, 주파수 밴드 별로 구별되는 n 개의 변환 서브 밴드 신호들이 도시된다. 주파수 밴드는 M 간격이 되는 경우를 예로 들어 도시하였다. 예를 들어, 전술한 n=32가 될 수 있으며, 32개의 주파수 밴드가 존재할 수 있다.

l 번째 서브 밴드는 M(l-1) 내지 Ml 의 주파수 대역을 갖는다. 610 구간의 신호는 l 번째 변환 서브 밴드 신호를 나타낸다.

도 6의 (b)는 합성 필터부(576) 내에 포함되는 합성 필터를 설명하기 위한 도면이다.

합성 필터(synthesis filter)(620)에 있어서, 필터의 에너지는 특정 부분이 몰려있다. 구체적으로, l 번째 서브 밴드에 대응되는 변환 서브 밴드 신호와 곱하기 연산을 수행할 합성 필터(620)는 (1/2Ml-3/4M) 내지 (1/2Ml+1/4M) 의 주파수 대역에 필터의 에너지가 몰려있다. 전술한 합성 필터뱅크 계수는 합성 필터(620)를 정의하는 파라미터 값들로, 오디오 신호의 디코딩을 위한 소정 규격에 따라 다르게 설정될 수 있다. 전술한 바와 같이, 합성 필터뱅크의 계수는 MP3 규격의 ISO/IEC 11172-3 부분의 table B.3에서 정의하는 필터 뱅크의 계수가 될 수 있다.

도 6의 (a) 및 (b)에 도시된 바와 같이, l 번째 변환 서브 밴드 신호와 그에 대응되는 합성 필터(620)의 주파수 대역이 다르므로, l 번째 변환 서브 밴드 신호와 그에 대응되는 계수 대응 소정 값을 곱하기 위해서는, l 번째 변환 서브 밴드 신호를 합성 필터(620)에 맞춰 조절하여야 한다.

구체적으로, l 번째 변환 서브 밴드 신호의 위상(phase) 및 진폭 중 적어도 하나를 합성 필터의 주파수 대역에 맞춰 조절하여야 한다.

도 6의 (c)를 참조하면, l 번째 변환 서브 밴드 신호(631)를 합성 필터(620)의 주파수 대역에 맞춰 조절하여, 조절된 l 번째 변환 서브 밴드 신호(633)를 생성하는 과정이 도시된다.

구체적으로, l 번째 변환 서브 밴드 신호(631)의 위상, 즉, 주파수 대역,을 M(l-1) 내지 Ml에서 (1/2Ml-3/4M) 내지 (1/2Ml+1/4M)으로 이동시킬 수 있다. 또한, l 번째 변환 서브 밴드 신호(631)의 진폭(amplitude)을 합성 필터(620)가 처리할 수 있는 범위 내로 조절할 있다. 위상 및 진폭의 조절값은, 합성 필터를 규정하는 소정 규격, 또는 디코딩 장치의 제품 사양 등에 따라서 달라질 수 있다.

여기서, 변환 서브 밴드 신호의 진폭 및 위상 중 적어도 하나를 조절하는데 있어서, 홀수 번째 서브 밴드에 대응되는 변환 서브 밴드 신호의 위상 및 진폭 조절값은 짝수 번째 서브 밴드에 대응되는 변환 서브 밴드 신호의 위상 및 진폭 조절값과 다를 수 있다.

즉, 도 5의 l 번째 위상 진폭 보상부(미도시)는 l 번째 변환 서브 밴드 신호(631)를 입력받고, 합성 필터에 맞춰 조절된 l 번째 변환 서브 밴드 신호(633)를 생성한다.

합성 필터부(576) 내에 구비되는 합성 필터의 값은 이하의 [수학식 1]과 같이 정의될 수 있다.

[수학식 1]

[수학식 1]에서 gl(n)이 l 번째 서브 밴드에 대응되는 합성 필터 값이며, d(n)은 합성 필터뱅크의 계수를 나타낸다. 전술한 바와 같이, 합성 필터 뱅크의 계수 값은 MP3 스펙에서 정의될 수 있다. 그리고, k는 서브 밴드 값을 나타내며, 32 개의 서브 밴드로 주파수 구간을 분할할 경우, k는 0 내지 31의 자연수 값이 될 수 있다. 또한, n 값은 소정 스펙에서 정의될 수 있다.

합성 필터뱅크의 계수들은 디코딩 장치로 수신되는 비트 스트림에 포함되어 있으며, 디코딩 코어부(510), 합성 필터부(576) 또는 디코딩 장치의 전체 제어부(미도시) 중 어느 하나에서 추출될 수 있다.

또한, 합성 필터부(576)에서 수행하는 곱하기 연산의 대상이 되는 합성 필터뱅크의 계수에 대응하는 소정 값인 계수 대응 소정 값은, 전술한 합성 필터의 값(gl(n))을 고속 퓨리에 변환하여 얻을 수 있다.

[수학식 2]

[수학식 2]는 곱하기 연산의 대상이 되는 합성 필터뱅크의 계수에 대응하는 소정 값(Gl(k))을 나타낸다.

도 7은 도 6의 멀티플렉서의 동작을 설명하기 위한 도면이다.

1 내지 n 서브 밴드들에 대응되는 제 1 내지 제n 합성 오디오 신호들은 M 포인트 FFT(M-point FFT) 값을 가질 수 있다. 710 블록은 홀수 번째 서브 밴드들에 대응되는 합성 오디오 신호들을 나타내고, 720 블록은 짝수 번째 서브 밴드들에 대응되는 합성 오디오 신호들을 나타낸다.

도 7을 참조하면, 711은 1번째 서브 밴드에 대응되는 합성 오디오 신호를 나타내고, 731은 2 번째 서브 밴드에 대응되는 합성 오디오 신호를 나타내며, 712는 3번째 서브 밴드에 대응되는 합성 오디오 신호를 나타낸다. 도 7에서는 n 값이 32인 경우를 예로 들어 도시하였다.

멀티플렉서(580)는 1 내지 n 서브 밴드들에 대응되는 제 1 내지 제n 합성 오디오 신호들을 멀티플렉싱(multiplexing)하여, N 포인트 FFT 값을 갖는 오디오 신호(750)를 출력한 수 있다. 멀티플렉서(580)에서 출력되는 오디오 신호(750)에 있어서, 751, 752 및 753 신호 구간은 각각 제1, 제2 및 제3 합성 오디오 신호들에 대응되는 신호 구간일 수 있다.

즉, 멀티플렉서(580)는 작은 포인트(small point) FFT 값인 M 포인트 FFT 값을 갖는 합성 오디오 신호들을 통합하여, 큰 포인트(large point) FFT 값인 N 포인트 FFT 값을 갖는 오디오 신호를 생성할 수 있다.

IFFT 부(590)는 도 4의 IFFT 부(490)와 동일 대응되므로, 상세한 설명은 생략한다.

도 8은 도 1의 합성부를 좀 더 상세하게 나타내는 다른 도면이다.

도 8을 참조하면, 도시된 합성부(830)는 도 5의 합성부(530)와 유사하나, IMDCT 부(890)의 연결 관계에 있어서, 도 5의 합성부(530)와 차이가 있다. 또한, 도 5의 합성부(530)에 비하여 FFT 부(453) 및 IFFT 부(590)가 구비되지 않는다. 나머지 구성들은 도 5의 합성부(530)와 동일하므로, 상세한 설명은 생략하도록 한다. 또한, 디코딩 코어부(810)는 도 2의 디코딩 코어부(210)와 동일 대응될 수 있다. 또한, 디코딩 코어부(810)는 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하여 출력할 수 있다.

구체적으로, 도 5의 IMDCT부(예를 들어, 452)에 대응되는 IMDCT 부(890)는 멀티 플렉서(880)의 후속 단에 구비될 수 있다.

IMDCT 부(890)는 멀티플렉서(880에서 멀테플렉싱 된 합성 오디오 신호를 역 변형 이산 코사인 변환하여 IFFT 부(895)로 출력한다.

합성부(830)는 도 5의 밴드 변환부(550)와 대응되는 구성을 구비하지 않는다. 그에 따라서, 곱하기 연산부(870)는 디코딩 코어부(810)에서 출력되는 n 개의 서브 밴드 신호들을 입력받는다.

곱하기 연산부(870)의 위상 진폭 보상부(871)는 서브 밴드 신호를 입력받고, 이의 위상 및 진폭 중 적어도 하나를 추정한다. 그리고, 추정된 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터의 위상 및 진폭에 맞춰서 조절할 수 있다.

합성 필터부(872)는 위상-진폭 보상부(871)에서 출력되는 신호를 입력받고, 전술한 곱하기 연산을 수행한다.

디코딩 코어부(810)에서 수행되는 디코딩, 예를 들어, 허프만 디코딩, 및 채널 분리 코딩은 MDCT 도메인에서 이뤄지므로, IMDCT를 수행하기 이전에 곱하기 연산 및 멀티플렉싱을 수행하면, 디코딩 코어부(810) 내지 멀티플렉서(880)까지의 연산을 동일한 도메인에서 수행할 수 있다. 그에 따라서, 연산의 복잡도를 낮출 수 있고 연산 효율을 높일 수 있다.

전술한 바와 같이, 본 발명에 따른 디코딩 장치는 주파수 도메인에서 오디오 신호의 합성 동작을 완료함으로써, 주파수 도메인에서 코딩을 수행하는 다른 코덱과 호환성을 가질 수 있다.

또한, 오디오 신호를 합성하는데 있어서, 곱하기 연산을 이용하므로, 컨볼루션 연산을 포함한 기타 오디오 신호의 합성 연산에 비하여 복잡도를 낮출 수 있어서, 연산 속도를 높일 수 있다.

또한, 시간 도메인에서 보다 주파수 도메인에서 디코딩 동작을 수행하므로, 음질을 향상시킬 수 있다.

도 9는 본 발명의 일 실시예에 따른 오디오 신호 복원 방법을 나타내는 플로우차트이다. 이하에서는, 도 3 및 도 9를 참조하여 오디오 신호 복원 방법을 설명한다.

도 9를 참조하면, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법(900)은 디코딩 장치(300)를 이용하여 오디오 신호를 복원하는 방법이다.

본 발명의 일 실시예에 따른 오디오 신호 복원 방법(900)은 디코딩 장치(300)로 수신된 비트스트림을 디코딩한다(910 단계). 910 단계는 디코딩 코어부(310)에서 수행될 수 있다.

910 단계에서 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할한다(920 단계). 920 단계는 디코딩 코어부(310) 및 밴드 분할부(340)에서 수행될 수 있다.

920 단계에서 생성된 각각의 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성한다(930 단계). 930 단계 동작은, 밴드 변환부(350)에서 수행될 수 있다.

930 단계에서 생성된, n 개의 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성한다(940 단계). 940 단계는 곱하기 연산부(370)에서 수행될 수 있다.

본 발명의 일 실시예에 따른 오디오 신호 복원 방법은 도 1 내지 도 8을 참조하여 설명한 본 발명에 따른 디코딩 장치의 동작 구성 및 기술적 사상과 동일하다. 따라서, 본 발명의 일 실시예에 따른 오디오 신호 복원 방법의 상세 동작 설명은 생략하도록 한다.

또한 본 발명에 따른 신호 처리 방법은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드 또는 프로그램으로서 구현하는 것도 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.

이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구 범위에 기재된 내용과 동등한 범위내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.

100, 200, 300: 디코딩 장치
110, 210, 310: 디코딩 코어부
130, 230, 330: 합성부
211: 언패킹부
212: 역양자화부
213: 채널 분리부

Claims

디코딩 장치를 이용하여 오디오 신호를 복원하는 방법에 있어서,
비트스트림을 디코딩하는 단계;
상기 디코딩된 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 단계;
각각의 상기 서브 밴드 신호를 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하는 단계; 및
n 개의 상기 변환 서브 밴드 신호들 각각과 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값과 곱하여 합성 오디오 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 복원 방법.
제1항에 있어서, 상기 변환 서브 밴드 신호를 생성하는 단계는
각각의 상기 서브 밴드 신호를 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호의 복원 방법.
제1항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
주파수 도메인에서 수행되는 것을 특징으로 하는 오디오 신호의 복원 방법.
제3항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
고속 퓨리에 변환 도메인에서 수행되는 것을 특징으로 하는 오디오 신호의 복원 방법.
제1항에 있어서, 상기 합성 필터뱅크 계수에 대응되는 소정 값은
상기 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출되는 것을 특징으로 하는 오디오 신호 복원 방법.
제5항에 있어서, 상기 합성 필터뱅크 계수에 대응되는 소정 값은
상기 합성 필터뱅크 계수들에 근거하여 산출되는 합성 필터 값을 고속 퓨리에 변환한 값인 것을 특징으로 하는 오디오 신호 복원 방법.
제1항에 있어서, 상기 변환 서브 밴드 신호를 생성하는 단계는
상기 n 개의 서브 밴드 신호들 각각을 역 변형 이산 코사인 변환하는 단계; 및
역 변형 이산 코사인 변환된 상기 n 개의 서브 밴드 신호들 각각을 고속 퓨리에 변환하여 상기 변환 서브 밴드 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
제7항에 있어서,
상기 합성 오디오 신호를 역 고속 퓨리에 변환하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
제1항에 있어서,
상기 합성 오디오 신호를 역 변형 이산 코사인 변환하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
제1항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
상기 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터에 맞춰서 조절하는 단계; 및
상기 조절된 변환 서브 밴드 신호를 상기 소정 값과 곱하여 상기 합성 오디오 신호를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
제10항에 있어서, 상기 합성 오디오 신호를 생성하는 단계는
상기 합성 오디오 신호를 멀티플렉싱하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
제1항에 있어서, 상기 비트 스트림을 디코딩하는 단계는
비트스트림을 언패킹하여 디코딩하는 단계;
디코딩된 상기 비트 스트림을 역양자화 및 재배열하는 단계; 및
역양자화 및 재배열된 상기 비트 스트림을 적어도 하나의 채널로 분리하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 복원 방법.
비트 스트림을 디코딩하고, 디코딩 된 상기 비트 스트림을 n 개의 서브 밴드 신호로 분할하는 디코딩 코어부; 및
상기 서브 밴드 신호들 각각을 주파수 도메인에서 변환하여 변환 서브 밴드 신호를 생성하며, n 개의 상기 변환 서브 밴드 신호들 각각과 그에 대응되는 합성 필터뱅크 계수들에 대응되는 소정 값들을 곱하여 합성 오디오 신호를 생성하는 합성부를 포함하는 것을 특징으로 하는 디코딩 장치.
제13항에 있어서, 상기 합성부는
상기 합성 오디오 신호는 주파수 도메인에서 생성되는 것을 특징으로 하는 디코딩 장치.
제13항에 있어서, 상기 합성부는
각각의 상기 서브 밴드 신호를 고속 퓨리에 변환하여 변환 서브 밴드 신호를 생성하는 밴드 변환부; 및
상기 비트 스트림에서 추출된 합성 필터뱅크 계수들에 근거하여 산출되는 상기 소정 값과 그에 대응되는 상기 변환 서브 밴드 신호를 곱하여 상기 합성 오디오 신호를 생성하는 곱하기 연산부를 포함하는 것을 특징으로 하는 디코딩 장치.
제15항에 있어서, 상기 밴드 변환부는
각각의 상기 서브 밴드 신호를 역 변형 이산 코사인 변환하는 IMDCT 부; 및
상기 IMDCT 부의 출력 신호를 전송받아 고속 퓨리에 변환하여 변환 서브 밴드 신호를 생성하는 FFT 부를 포함하는 것을 특징으로 하는 디코딩 장치.
제16항에 있어서, 상기 합성부는
상기 n 개의 서브 밴드들에 대응되는 상기 합성 오디오 신호들을 멀티플렉싱하는 멀티플렉서; 및
상기 멀티플렉서의 출력 신호를 역 고속 퓨리에 변환하는 IFFT 부를 더 포함하는 것을 특징으로 하는 디코딩 장치.
제15항에 있어서, 상기 곱하기 연산부는
상기 변환 서브 밴드 신호의 위상 및 진폭 중 적어도 하나를 합성 필터에 맞춰서 조절하는 위상 및 진폭 보상부; 및
상기 위상 및 진폭 보상부에서 조절된 상기 변환 서브 밴드 신호와 상기 소정 값을 곱하여 상기 합성 오디오 신호를 생성하는 합성 필터부를 포함하는 것을 특징으로 하는 디코딩 장치.
제13항에 있어서, 상기 디코딩 코어부는
비트스트림을 언패킹하고, 소정 디코딩 방법으로 디코딩하는 언패킹부;
디코딩된 상기 비트 스트림을 역양자화 및 재배열하는 역 양자화부; 및
역양자화 및 재배열된 상기 비트 스트림을 적어도 하나의 채널로 분리하는 채널 분리부를 포함하는 것을 특징으로 하는 디코딩 장치.