KR101336879B1

KR101336879B1 - 통신 시스템에서 신호 부호화 장치 및 방법

Info

Publication number: KR101336879B1
Application number: KR1020100091025A
Authority: KR
Inventors: 이미숙; 김홍국; 이영한
Original assignee: 광주과학기술원; 한국전자통신연구원
Priority date: 2010-05-12
Filing date: 2010-09-16
Publication date: 2013-12-04
Also published as: KR20110125157A

Abstract

본 발명은, 통신 시스템에서 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform) 기반의 코덱(codec)을 광대역(wideband) 및 슈퍼광대역(super-wideband)으로 확장하여 음성 및 오디오 신호를 부호화하는 장치 및 방법에 관한 것으로, 사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 음성 및 오디오 신호를 MDCT 기반으로 주파수 영역의 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호로 변환하고, 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 이득을 산출하고, 상기 산출한 이득을 양자화하여 양자화된 이득을 산출하고, 상기 양자화된 이득을 통해 상기 각 서브대역의 주파수 계수를 표본화하여 표본화된 주파수 계수를 산출하고, 상기 표본화된 주파수 계수를 이용하여 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 패치 정보를 산출하며, 상기 양자화된 이득과 상기 패치 정보를 패킷화하여, 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 이득 정보를 부호화한다.

Description

통신 시스템에서 신호 부호화 장치 및 방법{Apparatus and method for coding signal in a communication system}

본 발명은 통신 시스템에 관한 것으로서, 특히 통신 시스템에서 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform, 이하 'MDCT'라 칭하기로 함) 기반의 코덱(codec)을 광대역(wideband) 및 슈퍼광대역(super-wideband)으로 확장하여 음성 및 오디오 신호를 부호화하는 장치 및 방법에 관한 것이다.

통신 시스템에서는 고속의 전송 속도를 가지는 다양한 서비스 품질(QoS: Quality of Service, 이하 'QoS'라 칭하기로 함)의 서비스들을 사용자들에게 제공하기 위한 활발한 연구가 진행되고 있다. 이러한 통신 시스템은, 다양한 형태의 QoS를 가지는 데이터를 한정된 자원을 통해 빠르게 전송하기 위한 방안들이 제안되고 있으며, 최근 네트워크의 발달과 고품질 서비스에 대한 사용자 요구가 증가함에 따라 협대역(narrowband)에서 광대역 및 슈퍼광대역을 통해 고품질의 서비스를 사용자에게 제공하기 위한 방안들이 제안되고 있다.

또한, 통신 기술의 발달에 힘입어 네트워크에서 음성 및 오디오를 전송할 수 있는 대역폭이 증가함에 따라 음악 스트리밍 서비스 등 고대역의 음성 및 오디오를 통한 고품질 서비스에 대한 사용자 요구가 증대하고 있으며, 이러한 사용자 요구를 만족시키기 위해 효율적으로 고품질 음성 및 오디오 신호를 압축하고 전송하기 위한 방안들이 제안되고 있다.

한편, 통신 시스템에서는, 광대역 및 슈퍼광대역으로 사용자에게 다양한 QoS의 서비스를 제공하도록 해당 데이터를 부호화하기 위한 다양한 방안들이 제안되고 있으며, 특히 고속으로 안정적인 데이터 처리 및 전송을 위한 다양한 부호화 방식의 코덱들이 제안되고 있다. 이러한 코덱을 통해 부호화를 수행하는 부호화기는, 계층(layer) 별로 구분하여 부호화를 수행하며, 각 계층은 주파수 대역 별로 분리된다.

여기서, 상기 부화화기는, 각 대역의 각 계층 별로 부호화를 수행하며, 상기 부호화기가 음성 또는 오디오 신호를 부호화할 경우, 각 계층 별로 각 대역의 신호, 예컨대 저대역 신호 및 고대역 신호는 각각 독립적으로 부호화한다. 특히, 전술한 바와 같이 음성 및 오디오 서비스 등에 대한 고품질 서비스를 사용자들에게 제공하도록 효율적으로 고품질 음성 및 오디오 신호를 압축하고 전송하기 위해 부호화기는, 광대역 및 슈퍼광대역을 다중의 서브대역(subband)으로 분할하여 독립적으로 부호화한다.

이렇게 독립적으로 부호화된 고대역 신호는 저대역의 신호와 유사한 비트율을 가지며, 이러한 부호화된 신호를 수신한 수신기는 저대역 신호를 복원한 후, 복원된 저대역의 신호를 이용하여 고대역 신호를 복원한다. 이때, 복원된 저대역 신호 및 고대역 신호, 특히 복원된 고대역 신호는 원신호(original signal)와의 이득 보상을 통해 복원되며, 이렇게 수신기에서의 신호 복원 시 이득 보상을 위해 송신기는 저대역 신호 및 고대역 신호의 이득 정보를 부호화하여 상기 수신기로 송신한다. 그리고, 상기 수신기는, 송신기에서 부호화되어 송신된 이득 정보를 이용하여 부호화된 저대역 신호와 고대역 신호의 복원 시 이득 보상을 수행한다. 그러므로, 상기 송신기의 부호화기는, 음성 및 오디오 신호를 각 대역의 각 계층 별로 독립적으로 부호화하며, 상기 각 대역의 각 계층 별로 독립적으로 부호화되는 음성 및 오디오 신호의 이득 정보를 대역폭 확장(BWE: BandWidth Extension, 이하 'BWE'라 칭하기로 함) 계층에서 부호화하고, 이렇게 부호화된 음성 및 오디오 신호와 이득 정보는 수신기로 송신된다.

하지만, 상기 부호화기가 고품질의 음성 및 오디오 서비스를 제공하기 위해 광대역 및 슈퍼광대역을 다중의 서브대역으로 분할하여 독립적으로 부호화하여 송신할 경우, BWE 계층에서 부호화된 이득 정보를 이용한 부호화된 음성 및 오디오 신호의 복원에는 문제점이 있다. 다시 말해, 상기 수신기가 복원된 저대역 신호를 이용하여 고대역 신호를 복원한 후, 상기 BWE 계층에서 부호화된 이득 정보를 이용한 상기 복원된 고대역 신호의 이득 보상에는 문제점이 있다. 여기서, 전술한 바와 같이 수신기가 복원된 저대역 신호를 이용하여 고대역 신호를 복원하고, 상기 복원된 고대역 신호의 이득 보상을 위해 상기 BWE 계층에서 부호화된 이득 정보를 이용할 경우, 상기 BWE 계층에서 부호화된 이득 정보가 실제 각 대역의 이득, 특히 실제 고대역의 이득을 지시하지 못함으로 이득 보상된 신호에는 오차가 발생하며, 이러한 오차에 의해 음질이 저하되는 문제점이 있다.

또한, 상기 부호화기가 고품질의 음성 및 오디오 서비스를 제공하기 위해 광대역 및 슈퍼광대역을 다중의 서브대역으로 분할하여 독립적으로 부호화함에 따라, 부호화된 신호의 복원 시에 이득 보상을 수행할 경우, 상기 분할된 서브대역 별로 상기 BWE 계층에서 부호화된 이득 정보를 이용하여 이득 보상을 수행함에 따라 상기 분할된 서브대역의 대역 경계에서 이득 불일치가 발생하며, 이러한 이득 불일치에 따른 오차에 의해 음질이 저하된다.

따라서, 통신 시스템에서 고품질의 음성 및 오디오 서비스를 광대역 및 슈퍼광대역을 통해 고속으로 제공하기 위해 광대역 및 슈퍼광대역으로 확장하여 음성 및 오디오 신호를 부호화하는 방안이 필요하다.

따라서, 본 발명의 목적은 통신 시스템에서 신호를 부호화하는 장치 및 방법을 제공함에 있다.

또한, 본 발명의 다른 목적은, 통신 시스템에서 광대역 및 슈퍼광대역으로 확장하여 신호를 부호화하는 장치 및 방법을 제공함에 있다.

그리고, 본 발명의 다른 목적은, 통신 시스템에서 이득 보상을 위한 이득 정보를 저대역 및 고대역을 포함하는 모든 광대역 및 슈퍼광대역에서 공유하도록 신호를 부호화하는 장치 및 방법을 제공함에 있다.

아울러, 본 발명의 또 다른 목적은, 통신 시스템에서 모든 광대역 및 슈퍼광대역의 계층에서 이득 정보를 공유하여 오차를 최소화한 이득 보상을 수행하도록 하여 고품질의 음성 및 오디오 서비스를 제공하는 신호 부호화 장치 및 방법을 제공함에 있다.

상기한 목적들을 달성하기 위한 본 발명의 장치는, 통신 시스템에서 신호 부호화 장치에 있어서, 사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 신호를 주파수 영역의 신호로 변환하는 변환부; 상기 변환된 주파수 영역의 신호에서 각 서브대역의 이득을 산출하여 양자화하고, 상기 각 서브대역의 주파수 계수를 표본화하는 표본화부; 상기 표본화된 주파수 계수를 이용하여 상기 변환된 주파수 영역의 신호에서 각 서브대역의 패치 정보를 탐색하는 탐색부; 및 상기 양자화된 이득과 상기 탐색된 패치 정보를 패킷화하여 상기 주파수 영역의 신호에서 각 서브대역의 이득 정보를 부호화하는 패킷화부;를 포함한다.

상기한 목적들을 달성하기 위한 본 발명의 방법은, 통신 시스템에서 신호 부호화 방법에 있어서, 사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 음성 및 오디오 신호를 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform) 기반으로 주파수 영역의 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호로 변환하는 단계; 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 이득을 산출하는 단계; 상기 산출한 이득을 양자화하여 양자화된 이득을 산출하는 단계; 상기 양자화된 이득을 통해 상기 각 서브대역의 주파수 계수를 표본화하여 표본화된 주파수 계수를 산출하는 단계; 상기 표본화된 주파수 계수를 이용하여 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 패치 정보를 산출하는 단계; 및 상기 양자화된 이득과 상기 패치 정보를 패킷화하여, 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 이득 정보를 부호화하는 단계;를 포함한다.

본 발명은, 통신 시스템에서 변형 이산코사인 변환 기반의 코덱을 슈퍼광대역으로 확장하여 음성 및 오디오 신호를 부호화함으로써, 이득 보상을 위한 이득 정보를 저대역 및 고대역을 포함하는 모든 광대역 및 슈퍼광대역에서 공유할 수 있도록 하며, 그에 따라 모든 광대역 및 슈퍼광대역의 계층에서 이득 정보를 공유하여 오차를 최소화한 이득 보상을 수행하도록 한다. 즉, 본 발명은, 통신 시스템에서 통신 환경에서 낮은 비트율로 오차를 최소화한 이득 보상을 통해 고품질의 음성 및 오디오 서비스를 제공할 수 있다.

도 1은 본 발명의 실시 예에 따른 통신 시스템에서 부호화기 구조를 개략적으로 도시한 도면.
도 2는 본 발명의 다른 실시 예에 따른 통신 시스템에서 부호화기 구조를 개략적으로 도시한 도면.
도 3은 본 발명의 실시 예에 따른 통신 시스템에서 신호 부호화 과정을 개략적으로 도시한 도면.

이하, 본 발명에 따른 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한다. 하기의 설명에서는 본 발명에 따른 동작을 이해하는데 필요한 부분만이 설명되며 그 이외 부분의 설명은 본 발명의 요지를 흩뜨리지 않도록 생략될 것이라는 것을 유의하여야 한다.

본 발명은, 통신 시스템에서 신호 부호화 장치 및 방법을 제안한다. 여기서, 본 발명의 실시 예에서는, 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform, 이하 'MDCT'라 칭하기로 함) 기반의 코덱(codec)을 광대역(wideband) 및 슈퍼광대역(super-wideband)으로 확장하여 음성 및 오디오 신호를 부호화하는 장치 및 방법을 제안한다. 다시 말해, 본 발명의 실시 예에서는, 다양한 서비스 품질(QoS: Quality of Service, 이하 'QoS'라 칭하기로 함)의 서비스들, 예컨대 고품질의 음성 및 오디오 서비스를 제공받고자 하는 사용자들의 요구에 상응하여, 고품질의 음성 및 오디오 서비스를 고속으로 제공하기 위해 음성 및 오디오 신호를 광대역 및 슈퍼광대역으로 확장하여 부호화한다.

또한, 본 발명의 실시 예에서는, 저대역 및 고대역을 포함하는 모든 광대역 및 슈퍼광대역 계층(layer)에서의 이득 보상(gain compensation)을 위한 이득 정보를 공유하도록 하여 오차를 최소화한 이득 보상을 통해 고품질의 음성 및 오디오 서비스를 제공하도록 음성 및 오디오 신호를 부호화한다. 여기서, 본 발명의 실시 예에 따른 부호화 장치, 예컨대 스케일러블(scalable) 부호화기는, 기본 계층(base layer)과 향상 계층(enhanced layer)으로 구분하여 신호를 부호화하며, 특히 광대역 및 슈퍼광대역을 다중의 서브대역(subband)으로 분할한 후, 각 서브대역 및 각 계층 별로 독립적으로 신호를 부호화한다. 그리고, 상기 향상 계층은, 저대역 향상(LBE: LowBand Enhancement, 이하 'LBE'라 칭하기로 함) 계층, 대역폭 확장(BWE: BandWidth Extension, 이하 'BWE'라 칭하기로 함) 계층, 및 고대역 향상(HBE: HighBand Enhancement, 이하 'HBE'라 칭하기로 함) 계층으로 나누어진다.

여기서, 상기 스케일러블 부호화기가 음성 또는 오디오 신호를 부호화할 경우, 상기 LBE 계층에서는 저대역에서의 음성 또는 오디오의 품질을 향상시키기 위해 원신호(original signal)보다 작은 진폭(amplitude)의 잔류 신호(residual signal)를 추가적으로 부호화하며, 고대역 신호는 저대역 신호와 독립적으로 부호화된다. 즉, 상기 스케일러블 부호화기는, 전술한 바와 같이 광대역 및 슈퍼광대역을 다중의 서브대역으로 분할하여 독립적으로 부호화하며, 이렇게 부호화된 고대역 신호는 저대역의 신호와 유사한 비트율을 갖는다.

예컨대, 상기 슈퍼광대역에서의 부호화 시, 상기 스케일러블 부호화기는, 저대역 주파수 계수를 4개의 서브대역으로 분할하여 고대역 주파수 계수로 이용하며, 이렇게 부호화된 고대역 신호의 복원 시 복원된 저대역 신호, 즉 저대역 주파수 계수를 이용하여 상기 부호화된 고대역 신호를 복원하며, 또한 부호화된 고대역 신호의 복원 시 원신호와의 이득 보상을 통해 복원한다. 다시 말해, 음성 및 오디오 서비스 등에 대한 고품질 서비스를 사용자들에게 제공하도록 효율적으로 고품질 음성 및 오디오 신호를 압축하고 전송하기 위해 스케일러블 부호화기는, 광대역 및 슈퍼광대역을 다중의 서브대역으로 분할하여 독립적으로 부호화한다.

이렇게 독립적으로 부호화된 고대역 신호는 저대역의 신호와 유사한 비트율을 가지며, 이러한 부호화된 신호를 수신한 수신기는 저대역 신호를 복원한 후, 복원된 저대역의 신호를 이용하여 고대역 신호를 복원한다. 이때, 복원된 저대역 신호 및 고대역 신호, 특히 복원된 고대역 신호는 원신호와의 이득 보상을 통해 복원되며, 수신기에서의 신호 복원 시 이득 보상을 위해 상기 스케일러블 부호화기는, 저대역 신호 및 고대역 신호의 이득 정보를 부호화하며, 상기 부호화된 이득 정보는 상기 수신기로 송신된다. 그리고, 상기 수신기는, 부호화되어 송신된 이득 정보를 이용하여 부호화된 저대역 신호와 고대역 신호의 복원 시 이득 보상을 수행한다.

그러므로, 본 발명의 실시 예에 따른 부호화기, 예컨대 상기 스케일러블 부호화기는, 모든 광대역 및 슈퍼광대역의 각 계층에서 독립적으로 음성 및 오디오 신호를 부호화하며, 이렇게 부호화된 음성 및 오디오 신호의 복원 시에 이득 보상을 위해 이용하는 이득 정보를 모든 광대역 및 슈퍼광대역의 각 계층에서 공유하도록 상기 이득 정보를 부호화한다. 여기서, 상기 부호화기는, MDCT 기반의 코덱을 광대역 및 슈퍼광대역으로 확장하여 음성 및 오디오 신호, 뿐만 아니라 부호화된 음성 및 오디오 신호에 대한 이득 정보도 부호화한다.

다시 말해, 본 발명의 실시 예에 따른 부호화기는, MDCT 기반의 음성 및 오디오 코덱을 광대역 및 슈퍼광대역으로 확장하여 부호화하며, 상기 부호화기는, 주파수 대역에서 대역 확장을 위해 음성 및 오디오 신호를 MDCT 기반으로 변환한 후, MDCT 기반으로 변환된 신호에서 이득 정보로 양자화된 이득을 획득하며, 표본화된 주파수 계수를 이용하여 패치 정보로 패치 인덱스를 획득한다. 그에 따라, 상기 부호화기는, LBE 계층 및 BWE 계층뿐만 아니라 HBE 계층, 즉 모든 광대역 및 슈퍼광대역의 계층에서 이득 정보를 공유하도록 하며, 분할된 각 서브대역에서의 이득 정보 부호화 시 각 서브대역 간의 상대적 이득 비율을 양자화하여 낮은 비트율로 서비스 품질을 향상시킨다. 이때, 상기 부호화기는, 상기 광대역 및 슈퍼광대역을 다중의 서브대역들로 분할하여 독립적으로 부호화함에 따라 낮은 비트율로 서비스 품질을 향상시키기 위해 이득 정보를 추출하는 각 서브대역의 개수와 패치 정보를 추출하는 각 서브대역의 개수를 상이하게 설정하여 이득 정보를 부호화하며, 그에 따라 상기 이득 정보는 전술한 바와 같이 각 서브대역 간 상대적 이득 비율의 양자화로 부호화된다. 상기 이득 정보는 BWE 계층에서 부호화되며, 사익 BWE 계층에서 부호화된 이득 정보는 모든 광대역 및 슈퍼광대역의 계층에서 공유된다.

그리고, 본 발명의 실시 예에서는, MDCT 기반의 음성 및 오디오 코덱을 광대역 및 슈퍼광대역으로 확장하여 부호화하기 위해, MDCT 기반으로 변환된 신호에서 저대역과 고대역의 상호 상관도 기반의 패치 인덱스를 산출하기 전에 이득 정보로 이득 파라미터를 양자화한 후, 주파수 계수를 표본화하여 상기 패치 인덱스를 산출하며, 모든 광대역 및 슈퍼 광대역의 계층에서 이득 정보를 공유, 특히 HBE 계층과 이득 정보인 이득 파라미터를 공유하도록 한다. 또한, 전술한 바와 같이, 상기 부호화기는, 분할된 서브대역 간 상대적 이득 비율 정보를 이득 정보로 부호화하여 비트율을 감소시키며, 상기 이득 정보를 추출하는 서브대역과 패치 정보를 추출하는 서브대역을 각각 분할하여 설정, 즉 서로 다른 서브대역 개수로 설정함으로써, 낮은 비트율로 고품질의 서비스를 제공하도록 한다. 여기서, 상기 부호화기는, 서브대역에서의 패치 정보 추출 시 발생하는 에러를 최소화하기 위해 최소평균자승오류(MMSE: Minimum Mean Square Error, 이하 'MMSE'라 칭하기로 함) 방식으로 상기 패치 정보를 추출, 패치 정보로 MMSE 기반의 패치 인덱스를 산출한다.

상기 부호화기는, 서브대역 간의 이득 불일치, 다시 말해 에너지 오차 발생을 최소화하여 고품질의 서비스, 예컨대 음성 및 오디오 서비스의 음질을 향상시키며, 부호화시 각 서브대역에서 이득 정보를 우선적으로 추출함에 따라 각 서브대역의 실질적인 이득 정보, 즉 에너지 정보가 추출된 후, 부호화되어 수신기로 전송되며, 그에 따라 부호화된 상위 계층의 고대역 신호 복원 시 이득 정보를 공유, 즉 상대적 이득 비율로 양자화된 이득 파라미터를 상위 계층, 특히 HBE 계층에서 재사용함으로써 이득 보상의 오차를 최소화하여 음질을 향상시킨다. 그러면 여기서, 도 1을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 부호화기 구조를 보다 구체적으로 설명하기로 한다.

도 1은 본 발명의 실시 예에 따른 통신 시스템에서 부호화기 구조를 개략적으로 도시한 도면이다. 여기서, 도 1은 MDCT 기반의 코덱을 광대역 및 슈퍼광대역으로 확장하여 신호를 부호화하는 부호화기 구조를 나타낸 도면이다.

도 1을 참조하면, 상기 부호화기는, 사용자들에게 제공하고자 하는 서비스, 예컨대 음성 및 오디오 서비스에 해당하는 신호, 예컨대 음성 및 오디오 신호를 MDCT 기반으로 변환하는 변환부들, 예컨대 변환부1(105) 및 변환부2(110), 상기 변환부들(105,110)에서 MDCT 기반으로 변환된 신호의 각 서브대역에서 패치 정보를 탐색(search)하는 탐색부1(115), 상기 탐색부1(115)에서 탐색된 패치 정보을 이용하여 MDCT 기반으로 변환된 신호의 각 서브대역 간 이득 불일치를 보상하기 위한 이득 정보를 산출하는 보상부(120), 및 상기 탐색부1(115)에서 탐색된 패치 정보와 상기 보상부(120)에서 산출한 이득 정보를 패킷화(packetization)하는 패킷화부1(125)를 포함한다.

여기서, 상기 부호화기는, 고품질의 서비스를 고속으로 사용자에게 제공하기 위해 서비스에 해당하는 신호가 전송되는 광대역 및 슈퍼광대역을 다중의 서브대역으로 분할한 후, 각 서브대역 및 각 계층 별로 독립적으로 신호를 부호화하며, 상기 탐색부1(115)과 보상부(120)는 상기 분할된 서브대역에서 패치 정보 및 이득 정보를 산출한다. 그리고, 상기 각 서브대역 및 각 계층 별로 독립적으로 부호화된 고대역 신호는, 전술한 바와 같이 복원된 저대역 신호를 이용하여 복원된다.

또한, 상기 부호화기는, 부호화 시 입력된 시간 영역(time domain)의 신호를 MDCT 기반으로 변환하여 전술한 바와 같은 동작을 수행, 다시 말해 시간 영역의 음성 및 오디오 신호를 MDCT 기반으로 변환하여 각 서브대역에서 패치 정보와 이득 정보를 산출한 후 패킷화함에 따라, MDCT 영역(MDCT domain)에서 부호화 동작을 수행하며, 포괄적 모드(generic mode) 및 사인파 모드(sinusoidal mode)로 동작, 특히 포괄적 모드로 동작한다. 상기 포괄적 모드에서 상기 부호화기는, 전술한 바와 같이 음성 및 오디오 신호를 분할된 각 서브대역에서 상관도 기반의 패치 인덱스, 즉 패치 정보를 탐색하고 또한 이득 불일치 보상을 위한 이득 파라미터, 즉 이득 정보를 산출한다. 그리고, 상기 사인파 모드는, 악기나 톤 신호와 같이 강한 주기성의 음성 및 오디오 신호, 즉 사인파 신호일 경우에 동작하는 모드로, 상기 부호화기는, 사인파 신호에 대한 크기, 주파수 계수상 위치 및 신호의 부호 정보를 추출한 후 패킷화하며, 상기 부호화기는, 사인파 모드로 독립적으로 동작하거나, 포괄적 모드와 동시에 동작할 수 있다.

상기 변환부들(105,110)은, 시간 영역의 음성 및 오디오 신호(x(n))를 MDCT 기반으로 변환, 즉 MDCT 영역의 신호(X(k))로 변환한다. 여기서, 상기 변환부1(105)은, 사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 고대역 신호, 예컨대 시간 영역의 고대역 음성 및 오디오 신호(

)가 입력되면, 상기 입력된 시간 영역의 고대역 음성 및 오디오 신호(

)를 MDCT 영역의 음성 및 오디오 신호(

)로 변환한다. 그리고, 상기 변환부2(110)는, 사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 저대역 신호, 예컨대 시간 영역의 저대역 음성 및 오디오 신호(

)가 입력되면, 상기 입력된 시간 영역의 저대역 음성 및 오디오 신호(

)를 MDCT 영역의 음성 및 오디오 신호(

)로 변환한다.

여기서, 상기 변환부들(105,110)이 MDCT 기반으로 시간 영역의 음성 및 오디오 신호(

,

)를 변환함에 따라, 시간 영역의 음성 및 오디오 신호(

,

)는 주파수 영역(frequency domain)의 음성 및 오디오 신호로 변환, 즉 변환된 MDCT 영역의 음성 및 오디오 신호(

,

)는 주파수 영역의 음성 및 오디오 신호가 된다.

그리고, 상기 변환부들(105,110)로 입력되는 시간 영역의 음성 및 오디오 신호(

,

)는, 상기 부호화기가 사용자들에게 제공하고자 하는 음성 및 오디오 서비스에 해당하는 음성 및 오디오 신호를 부호화하는 시간 영역의 신호를 의미하며, 상기 시간 영역의 음성 및 오디오 신호(

,

)는 이득 정보의 부호화를 위해 변환부들(105,110)로 입력된다. 즉, 상기 시간 영역의 저대역 음성 및 오디오 신호(

)는, 상기 부호화기가 기본 계층에서 부호화하는 음성 및 오디오 신호이며, 상기 시간 영역의 저대역 음성 및 오디오 신호(

)는, 광대역 및 슈퍼광대역에서 이득 정보의 공유를 위한 상기 이득 정보의 부호화를 위해 상기 변환부2(110)로 입력된다. 또한, 상기 시간 영역의 고대역 음성 및 오디오 신호(

)는, 상기 부호화기가 향상 계층에서 부호화하는 음성 및 오디오 신호이며, 상기 시간 영역의 고대역 음성 및 오디오 신호(

)는, 광대역 및 슈퍼광대역에서 이득 정보의 공유를 위한 상기 이득 정보의 부호화를 위해 상기 변환부1(105)로 입력된다.

아울러, 상기 변환부들(105,110)에서 MDCT 기반으로 변환된 MDCT 영역의 음성 및 오디오 신호(

,

)는, 이득 정보의 부호화를 위해 각 서브대역에서 음성 및 오디오의 MDCT 계수를 의미한다. 예컨대,

는 임의의 j번째 서브대역에 해당하는 MDCT 영역의 음성 및 오디오 신호, 즉 주파수 영역의 고대역 음성 및 오디오 신호에서 해당하는 k번째 고대역 MDCT 계수이며, 상기 고대역 MDCT 계수는, 시간 영역의 고대역 음성 및 오디오 신호(

)가 MDCT 기반으로 변환됨에 따라, 상기 시간 영역의 고대역 음성 및 오디오 신호(

)에서 임의의 서브대역에 해당하는 고대역 MDCT 계수를 의미한다. 그리고,

는, 전술한 바와 같이 저대역 음성 및 오디오 신호를 이용하여 고대역 음성 및 오디오 신호가 처리됨에 따라, 임의의 j번째 서브대역에 해당하는 MDCT 영역의 음성 및 오디오 신호, 즉 주파수 영역의 저대역 음성 및 오디오 신호에서 j번째 서브대역에 해당하는 k번째 저대역 MDCT 계수이며, 상기 저대역 MDCT 계수는, 시간 영역의 저대역 음성 및 오디오 신호(

)가 MDCT 기반으로 변환됨에 따라, 상기 시간 영역의 저대역 음성 및 오디오 신호(

)에서 임의의 서브대역에 해당하는 저대역 MDCT 계수를 의미한다.

상기 탐색부1(115)은, 상기 변환부들(105,110)에서 MDCT 기반으로 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 패치 정보를 탐색한다. 여기서, 상기 탐색부1(115)은, 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 상관도 기반 패치 인덱스(correlation-based fetch index)를 탐색한다. 그리고, 상기 탐색부1(115)은, 저대역 신호를 이용하여 고대역 신호의 각 서브대역에서 패치 인덱스를 탐색하며, 특히 저대역 주파수 계수로부터 고대역 주파수 계수를 탐색한다.

보다 구체적으로 설명하면, 상기 탐색부1(115)은, 상기 변환된 저대역 음성 및 오디오 신호(

)의 각 서브대역에 해당하는 주파수 계수, 즉 저대역 주파수 계수로부터 상기 변환된 고대역 음성 및 오디오 신호(

)의 각 서브대역에서 임의의 서브대역, 예컨대 j번째 서브대역에 해당하는 주파수 계수, 즉 고대역 주파수 계수를 탐색하며, 상기 탐색한 저대역 주파수 계수, 즉 저대역 MDCT 계수 및 고대역 주파수 계수, 즉 고대역 MDCT 계수를 이용하여 각 서브대역에서 상기 변환된 저대역 음성 및 오디오 신호(

)와 고대역 음성 및 오디오 신호(

) 간의 상호 상관도(cross-correlation)로 상관 계수를 산출한다. 여기서, 상기 각 서브대역에서 상기 변환된 저대역 음성 및 오디오 신호(

)와 고대역 음성 및 오디오 신호(

) 간의 상호 상관 계수는 수학식 1과 같이 나타낼 수 있다.

수학식 1에서,

는 j번째 서브대역에 해당하는 MDCT 계수를 의미하고,

는 상기 변환된 고대역 음성 및 오디오 신호에서 j번째 서브대역에 해당하는 k번째 고대역 MDCT 계수를 의미하고,

는 상기 변환된 저대역 음성 및 오디오 신호에서 k번째 저대역 MDCT 계수를 의미하고,

는 j번째 서브대역에서 상호 상관 계수를 의미하며,

는 j번째 서브대역에서 상관 계수의 인덱스를 의미한다.

그리고, 상기 탐색부1(115)은, 상기 산출한 상호 상관 계수에서 최대 상관 계수의 인덱스(

)를 산출하며, 상기 최대 상관 계수의 인덱스(

)는 수학식 2와 같이 나타낼 수 있다.

수학식 2에서,

는, 수학식 1을 통해 산출한 상호 상관 계수에서 최대 상관 계수에 해당하는 인덱스를 의미하고, 상기 j는 0, 1,…, (M-1)을 가지며, 이때 M은 상기 패치 정보를 추출하는 서브대역의 총 개수, 즉 상기 변환된 음성 및 오디오 신호(

,

)의 분할된 서브대역에서 상기 상호 상관 계수(

)를 산출하는 서브대역의 총 개수를 의미하며,

와

는 각각 j번째 서브대역의 경계를 의미한다.

이렇게 상기 탐색부1(115)은, 상기 변환된 음성 및 오디오 신호(

,

)의 분할된 서브대역에서 상호 상관 계수를 산출한 후, 상기 산출한 상호 상관 계수에서 최대 상관 계수의 인덱스(

)를 산출하며, 상기 산출된 최대 상관 계수의 인덱스(

)는 상기 보상부(120)와 패킷화부1(125)로 전송된다.

상기 보상부(120)는, 상기 변환된 음성 및 오디오 신호(

,

)의 이득 보상 시 이득 불일치를 보상하기 위한 이득 파라미터, 즉 이득 정보를 산출한다. 여기서, 상기 보상부(120)는, 상기 변환된 고대역 음성 및 오디오 신호(

)와 저대역 음성 및 오디오 신호(

) 간의 이득 불일치를 보상하기 위한 이득 파라미터를 산출하며, 상기 이득 파라미터는, 상기 산출된 최대 상관 계수의 인덱스(

)를 고려하여 산출된다. 즉, 상기 보상부(120)는, 상기 변환된 고대역 음성 및 오디오 신호(

)에서 j번째 서브대역에 해당하는 k번째 고대역 MDCT 계수, 즉

와, 상기 변환된 저대역 음성 및 오디오 신호(

)에서 j번째 서브대역에 해당하는 k번째 저대역 MDCT 계수에 상기 최대 상관 계수의 인덱스(

)를 고려한 j번째 서브대역에 해당하는 k번째 저대역 MDCT 계수, 즉

간 에너지 불일치를 보상하기 위한 이득 파라미터를 산출한다.

다시 말해, 상기 보상부(120)는, 상기 변환된 고대역 음성 및 오디오 신호(

)의 MDCT 계수와 상기 최대 상관 계수의 인덱스(

)를 고려한 변환된 저대역 음성 및 오디오 신호(

)의 MDCT 계수 간의 이득 파라미터를 산출하며, 이때 상기 이득 파라미터로 선형적 스팩트럼 영역(linear spectral domain)에서의 선형적 스케일링 팩터(linear scaling factor)(

)와, 로그 스펙트럼 영역(log spectral domain)에서의 로그 스케일링 팩터(log scaling factor)(

)를 각각 산출한다. 여기서, 상기 선형적 스케일링 팩터(

)는 수학식 3과 같이 나타낼 수 있고, 상기 로그 스케일링 팩터(

)는 수학식 4와 같이 나타낼 수 있다.

수학식 3 및 수학식 4에서,

는 j번째 서브대역에서 선형적 스케일링 팩터를 의미하고,

는 j번째 서브대역에서 로그 스케일링 팩터를 의미하며,

를 나타내고,

를 나타내며,

를 나타낸다.

여기서, 상기 보상부(120)는, 상기 최대 상관 계수의 인덱스(

)를 고려하여 상기 변환된 음성 및 오디오 신호(

,

)의 이득 보상 시 이득 불일치를 보상하기 위한 이득 파라미터, 즉 상기 선형적 스케일링 팩터(

)와 상기 로그 스케일링 팩터(

)를 산출하며, 이렇게 산출한 스케일링 팩터(

,

)를 통해 상기 변환된 음성 및 오디오 신호(

,

) 간 이득 보상을 위한 이득 정보를 산출하여 양자화, 즉 이득 보상 및 양자화(gain compensation/quantization)된 이득 파라미터로 스케일링 팩터(

,

)를 패킷화부1(125)로 전송한다.

상기 패킷화부1(125)은, 상기 최대 상관 계수의 인덱스(

)와, 상기 이득 정보로 이득 파라미터, 즉 상기 선형적 스케일링 팩터(

)와 상기 로그 스케일링 팩터(

)를 입력받고, 상기 입력된 정보를 패킷화한다. 즉, 상기 패킷화부1(125)은, 상기 변환부들(105,110)로 입력되는 음성 및 오디오 신호(

,

)의 이득 정보를 패킷화하여 출력한다. 여기서, 상기 패킷화된 이득 정보는, 모든 광대역 및 슈퍼광대역의 계층, 특히 HBE 계층에서 공유하도록 BWE 계층에서 부호화된 이득 정보로서, 부호화된 이득 정보는 수신기로 송신된다.

이렇게 상기 부호화기는, 상기 변환부들(105,110)에 의해, 이득 정보의 부호화를 위해 입력되는 상기 시간 영역의 음성 및 오디오 신호(

,

)를 MDCT 기반으로 변환하여 주파수 영역의 음성 및 오디오 신호(

,

)로 변환한 후, 상기 탐색부1(115)에 의해, 상기 주파수 영역의 음성 및 오디오 신호(

,

)에서 각 서브대역에 해당하는 주파수 계수로 MDCT 계수를 탐색하며, 상기 탐색한 MDCT 계수를 이용하여 상기 각 서브대역에서 상기 주파수 영역의 음성 및 오디오 신호(

,

) 간의 상호 상관 계수를 산출한 후, 상기 산출한 상호 상관 계수(

)에서 최대 상관 계수의 인덱스(

)를 산출한다. 즉, 상기 탐색부1(115)은 주파수 계수로 MDCT 계수를 탐색하여 상호 상관 계수 및 최대 상관 계수의 인덱스를 산출하며, 상기 패치 정보인 패치 인덱스로 최대 상관 계수의 인덱스를 출력한다. 또한, 상기 부호화기는, 상기 보상부(120)에 의해, 상기 패치 인덱스인 최대 상관 계수의 인덱스를 고려하여 상기 주파수 영역의 음성 및 오디오 신호(

,

) 간 보상 불일치를 보상하기 위한 보상 정보인 이득 파라미터를 산출, 즉 상기 선형적 스케일링 팩터(

)와 상기 로그 스케일링 팩터(

)를 산출하며, 상기 패킷화부1(125)에 의해, 상기 이득 정보를 부호화된 후, 수신기로 송신된다. 그러면 여기서, 도 2를 참조하여 본 발명의 다른 실시 예에 따른 통신 시스템에서 부호화기 구조를 보다 구체적으로 설명하기로 한다.

도 2는 본 발명의 다른 실시 예에 따른 통신 시스템에서 부호화기 구조를 개략적으로 도시한 도면이다. 여기서, 도 2는 MDCT 기반의 코덱을 광대역 및 슈퍼광대역으로 확장하여 신호를 부호화하는 부호화기 구조를 나타낸 도면이다.

도 2를 참조하면, 상기 부호화기는, 사용자들에게 제공하고자 하는 서비스, 예컨대 음성 및 오디오 서비스에 해당하는 신호, 예컨대 음성 및 오디오 신호를 MDCT 기반으로 변환하는 변환부들, 예컨대 변환부3(205) 및 변환부4(210), 상기 변환부들(205,210)에서 MDCT 기반으로 변환된 신호의 각 서브대역에서 이득 정보로 실제 이득을 양자화한 후 주파수 계수, 예컨대 MDCT 계수를 표본화(normalization)하는 표본화부(215), 상기 표본화부(215)에서 표본화된 MDCT 계수를 이용하여 상기 MDCT 기반으로 변환된 신호의 각 서브대역에서 패치 정보를 탐색하는 탐색부2(220), 및 상기 표본화부(215)에서 양자화된 이득 정보와 상기 탐색부2(220)에서 탐색된 탐색 정보를 패킷화하는 패킷화부2(225)를 포함한다.

여기서, 상기 부호화기는, 고품질의 서비스를 고속으로 사용자에게 제공하기 위해 서비스에 해당하는 신호가 전송되는 광대역 및 슈퍼광대역을 다중의 서브대역으로 분할한 후, 각 서브대역 및 각 계층 별로 독립적으로 신호를 부호화한다. 상기 표본화부(215)와 탐색부2(220)는 상기 분할된 서브대역에서 이득 정보 및 패치 정보를 산출한다. 그리고, 상기 각 서브대역 및 각 계층 별로 독립적으로 부호화된 고대역 신호는, 전술한 바와 같이 복원된 저대역 신호를 이용하여 복원된다.

또한, 상기 부호화기는, 부호화 시 입력된 시간 영역의 신호를 MDCT 기반으로 변환하여 전술한 바와 같은 동작을 수행, 다시 말해 시간 영역의 음성 및 오디오 신호를 MDCT 기반으로 변환하여 각 서브대역에서 이득 정보를 산출한 후 패치 정보를 산출하여 패킷화함에 따라, MDCT 영역에서 부호화 동작을 수행하며, 포괄적 모드 및 사인파 모드로 동작, 특히 포괄적 모드로 동작한다. 상기 포괄적 모드에서 상기 부호화기는, 전술한 바와 같이 일반적인 음성 및 오디오 신호를 분할된 각 서브대역에서 실제 이득을 양자화하여 이득 정보를 산출한 후, 상기 각 서브대역에서 MMSE 기반의 패치 인덱스, 즉 패치 정보를 탐색하여 산출한다. 여기서, 상기 입력된 시간 영역의 신호, 다시 말해 상기 시간 영역의 음성 및 오디오 신호는, 광대역 및 슈퍼광대역으로 확장된 MDCT 기반의 코덱을 통해 부호화되며, 상기 부호화기는, 이렇게 부호화된 음성 및 오디오 신호의 이득 보상 시 모든 광대역 및 슈퍼광대역 계층에서 공유하도록 이득 정보를 부호화한다.

상기 변환부들(205,210)은, 시간 영역의 음성 및 오디오 신호(x(n))를 MDCT 기반으로 변환, 즉 MDCT 영역의 신호(X(k))로 변환한다. 여기서, 상기 변환부3(205)은, 사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 고대역 신호, 예컨대 시간 영역의 고대역 음성 및 오디오 신호(

)를 MDCT 영역의 음성 및 오디오 신호(

)로 변환한다. 그리고, 상기 변환부4(210)는, 사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 저대역 신호, 예컨대 시간 영역의 저대역 음성 및 오디오 신호(

)를 MDCT 영역의 음성 및 오디오 신호(

)로 변환한다.

여기서, 상기 변환부들(205,210)이 MDCT 기반으로 시간 영역의 음성 및 오디오 신호(

,

)를 변환함에 따라, 상기 시간 영역의 음성 및 오디오 신호(

,

)는 주파수 영역의 음성 및 오디오 신호로 변환, 즉 변환된 MDCT 영역의 음성 및 오디오 신호(

,

)는 주파수 영역의 음성 및 오디오 신호가 된다.

그리고, 상기 변환부들(205,210)로 입력되는 음성 및 오디오 신호(

,

)는, 사용자들에게 제공하고자 하는 음성 및 오디오 서비스에 해당하는 음성 및 오디오 신호를 광대역 및 슈퍼광대역으로 확장된 MDCT 기반의 음성 및 오디오 코덱을 통해 부호화하는 시간 영역의 신호를 의미하며, 상기 시간 영역의 음성 및 오디오 신호(

,

)는, 상기 부호화기가 기본 계층에서 상기 확장된 MDCT 기반의 음성 및 오디오 코덱을 통해 부호화하는 음성 및 오디오 신호이며, 상기 시간 영역의 저대역 음성 및 오디오 신호(

)는, 광대역 및 슈퍼광대역에서 이득 정보의 공유를 위한 상기 이득 정보의 부호화를 위해 상기 변환부4(210)로 입력된다. 또한, 상기 시간 영역의 고대역 음성 및 오디오 신호(

)는, 상기 부호화기가 향상 계층에서 상기 확장된 MDCT 기반의 음성 및 오디오 코덱을 통해 부호화하는 음성 및 오디오 신호이며, 상기 시간 영역의 고대역 음성 및 오디오 신호(

)는, 광대역 및 슈퍼광대역에서 이득 정보의 공유를 위한 상기 이득 정보의 부호화를 위해 상기 변환부3(205)으로 입력된다.

아울러, 상기 변환부들(205,210)에서 MDCT 기반으로 변환된 MDCT 영역의 음성 및 오디오 신호(

,

는 임의의 j번째 서브대역에 해당하는 MDCT 영역의 음성 및 오디오 신호, 즉 주파수 영역의 고대역 음성 및 오디오 신호에서 j번째 서브대역에 해당하는 k번째 고대역 MDCT 계수이며, 상기 고대역 MDCT 계수는, 시간 영역의 고대역 음성 및 오디오 신호(

상기 표본화부(215)는, 상기 변환부들(105,110)에서 MDCT 기반으로 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 실제 이득, 특히 상기 변환된 고대역 음성 및 오디오 신호(

)의 각 서브대역에서 이득(

)을 산출하며, 상기 각 서브대역에서 이득(

)은 수학식 5와 같이 나타낼 수 있다.

수학식 5에서,

는 상기 MDCT 기반으로 변환된 음성 및 오디오 신호(

,

)의 j번째 서브대역에서 실제 이득을 의미하며,

로 나타낼 수 있으며,

는 상기 이득 정보를 추출하는 서브대역의 총 개수, 즉 상기 변환된 음성 및 오디오 신호(

,

)의 분할된 서브대역에서 상기 실제 이득(

)를 산출하는 서브대역의 총 개수를 의미한다. 그리고, 수학식 5에서,

는 j번째 서브대역의 이득에 해당하는 MDCT 계수를 의미하고,

는 수학식 1에서 설명한 바와 같이, 상기 변환된 고대역 음성 및 오디오 신호(

)에서 j번째 서브대역에 해당하는 k번째 고대역 MDCT 계수를 의미한다. 즉, 상기 표본화부(215)는, 상기 MDCT 기반으로 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 주파수 계수, 예컨대 MDCT 계수를 이용하여 실제 이득(

)을 산출한다.

또한, 상기 표본화부(215)는, 전술한 바와 같이 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 이득(

)을 산출한 후, 상기 산출한 각 서브대역에서의 이득을 양자화한다. 여기서, 상기 표본화부(215)는, 상기 각 서브대역에서 이득(

)을 이득 비율로 양자화, 즉 인접한 서브대역 간의 상대적 이득 비율로 양자화한다. 다시 말해, 상기 각 서브대역에서 이득(

)은 이득 비율 정보로 양자화되며, 상기 이득 비율 정보에서 상기 인접한 서브대역 간의 상대적 이득 비율은, 실제 산출한 이득, 즉 수학식 5에 나타낸 바와 같이 산출한 상기 각 서브대역에서 이득(

)의 동적 범위(dynamic range)보다 작으므로, 상기 부호화기에서의 이득 정보 부호화 동작 및 수신기에서의 이득 정보의 처리 동작의 오버로드(overload)를 감소시킬 수 있다.

즉, 상기 표본화부(215)는, 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 실제 이득(

)을 양자화하며, 상기 양자화된 각 서브대역에서의 이득(

)은 수학식 6과 같이 나타낼 수 있다.

수학식 6에서,

은, 상기 각 서브대역에서 실제 이득(

)의 양자화된 이득을 의미하고,

는 j=0일 경우의 양자화된 이득(

)을 의미하고,

는 x의 n-비트 스칼라 양자화를 의미하며,

는

일 경우의 양자화된 이득(

)을 의미한다.

그리고, 상기 표본화부(215)는, 상기 각 서브대역에서의 양자화된 이득(

)을 이용하여 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 주파수 계수, 예컨대 MDCT 계수를 표본화하며, 상기 표본화된 MDCT 계수는 수학식 7과 같이 나타낼 수 있다.

수학식 7에서,

는 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 표본화된 MDCT 계수로, j번째 서브대역에 해당하는 k번째 표본화된 고대역 MDCT 계수를 의미한다.

이렇게 상기 표본화부(215)는, 상기 변환된 주파수 영역의 음성 및 오디오 신호(

,

)의 각 서브대역에서 이득(

)을 산출한 후, 상기 산출한 이득(

)을 양자화하고, 양자화된 이득(

)을 통해 표본화된 MDCT 계수(

)를 탐색부2(220)로 전송하고, 이득 정보로 상기 양자화된 이득(

)을 패킷화부2(225)로 전송한다. 즉, 상기 표본화부(215)는, 이득 양자화 및 표본화(gain quantization/normalization)을 수행하여 상기 변환된 주파수 영역의 음성 및 오디오 신호(

,

)의 각 서브대역에서 양자화된 이득(

) 및 표본화된 MDCT 계수(

)를 산출한다.

상기 탐색부2(220)는, 상기 표본화부(215)에서 표본화된 MDCT 계수(

)를 이용하여 상기 MDCT 기반으로 변환된 주파수 영역의 음성 및 오디오 신호(

,

)의 각 서브대역에서 MMSE 기반의 패치 인덱스, 즉 패치 정보를 탐색하여 산출한다. 보다 구체적으로 설명하면, 상기 탐색부2(220)는, 상기 변환된 음성 및 오디오 신호(

,

), 특히 변환된 고대역 음성 및 오디오 신호(

)의 각 서브대역에서 패치 정보인 패치 인덱스(

)를 산출하며, 상기 패치 인덱스(

)는 MMSE를 기반으로 산출된다. 여기서, 상기 패치 인덱스(

)는 수학식 8과 같이 나타낼 수 있다.

또한, 수학식 8에서,

은 수학식 9와 같이 나타낼 수 있다.

수학식 8 및 수학식 9에서,

은 상기 변환된 음성 및 오디오 신호(

,

), 특히 변환된 고대역 음성 및 오디오 신호(

)의 각 서브대역에서 패치 인덱스로, l번째 서브대역의 패치 인덱스를 의미하며,

은 l번째 서브대역에서 상관 계수의 인덱스를 의미한다. 여기서,

은 MMSE를 기반으로 산출됨에 따라

의 최소 평균값을 의미, 즉 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 표본화된 MDCT 계수를 고려한 고대역 음성 및 오디오 신호와 저대역 음성 및 오디오 신호 간 에너지 이득 오차의 최소 평균을 의미한다. 즉,

은 최소 평균, 다시 말해 MMSE 기반의 패치 인덱스를 의미한다. 그리고, 전술한 바와 같이 이득 정보, 즉 상기 표본화부(215)에서 상기 이득 양자화 및 표본화를 통해 표본화된 MDCT 계수(

)를 산출하기 위한 서브대역의 개수와 상기 탐색부2(220)에서 MMSE를 기반의 패치 인덱스(

)를 산출하기 위한 서브대역의 개수를 상이하게 설정된다.

또한, 수학식 8 및 수학식 9에서,

은 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 표본화된 MDCT 계수를 고려한 고대역 음성 및 오디오 신호와 저대역 음성 및 오디오 신호 간 에너지 이득 오차를 의미하고,

는 상기 변환된 고대역 음성 및 오디오 신호(

)의 표본화된 MDCT 계수,

은 상관도를 고려한 상기 변환된 저대역 음성 및 오디오 신호(

)의 표본화도니 MDCT 계수를 의미한다. 여기서,

로 나타낼 수 있으며,

은 l번째 서브대역에 해당하는 MDCT 계수의 총 개수를 의미하며,

와

은 각각 l번째 서브대역의 경계를 의미한다.

이렇게 상기 탐색부2(220)는, 상기 표본화된 MDCT 계수(

)를 이용하여 상기 변환된 음성 및 오디오 신호(

,

)의 분할된 서브대역에서 패치 인덱스(

)를 MMSE 기반으로 산출하며, 상기 산출한 MMSE 기반의 패치 인덱스(

)는 상기 변환된 음성 및 오디오 신호(

,

)의 각 서브대역에서 패치 정보로 패킷화부2(225)로 전송된다.

상기 패킷화부2(225)는, 상기 이득 정보로 상기 변환된 주파수 영역의 음성 및 오디오 신호(

,

)의 각 서브대역에서 양자화된 이득(

)을 상기 표본화부(215)로부터 입력받고, 상기 패치 정보로 상기 변환된 음성 및 오디오 신호(

,

)의 분할된 서브대역에서 MMSE 기반의 패치 인덱스(

)를 상기 탐색부2(220)로부터 입력받으며, 상기 입력된 정보를 패킷화한다. 즉, 상기 패킷화부2(225)는, 상기 변환부들(205,210)로 입력되는 시간 영역의 음성 및 오디오 신호(

,

)에 대한 이득 정보를 패킷화하며, 상기 변환된 음성 및 오디오 신호(

,

)에서 각 서브대역의 이득 정보가 부호되어 출력된다. 여기서, 상기 패킷화된 이득 정보는, 모든 광대역 및 슈퍼광대역의 계층, 특히 HBE 계층에서 공유하도록 BWE 계층에서 부호화된 이득 정보로서, 상기 부호화된 이득 정보는 수신기로 송신된다. 그리고, 상기 부호화된 이득 정보는, 상기 MDCT 기반의 변환에 의해 변환된 주파수 영역의 음성 및 오디오 신호에 대한 이득 보상 시 모든 광대역 및 슈퍼광대역의 계층에서 공유된다.

이렇게 상기 부호화기는, 상기 변환부들(205,210)에 의해, 이득 정보의 부호화를 위해 입력되는 상기 시간 영역의 음성 및 오디오 신호(

,

)로 변환한 후, 상기 표본화부(215)에 의해, 상기 주파수 영역의 음성 및 오디오 신호(

,

)에서 각 서브대역의 실제 이득(

)을 산출하고, 상기 산출한 이득(

)을 양자화, 즉 양자화된 이득(

)을 산출한 후 상기 양자화된 이득을 이용하여 MDCT 계수를 표본화, 즉 표본화된 MDCT 계수(

)를 산출한다. 즉, 상기 표본화부(215)는, 상기 주파수 영역의 음성 및 오디오 신호(

,

)의 각 서브대역에서 양자화된 이득(

)과 표본화된 MDCT 계수(

)를 산출한 후, 상기 양자화된 이득(

)을 상기 주파수 영역의 음성 및 오디오 신호(

,

)의 각 서브대역에서 이득 정보로 출력한다.

또한, 상기 부호화기는, 상기 탐색부2(220)에 의해, 상기 표본화된 MDCT 계수(

)를 이용하여 패치 정보로 MMSE 기반의 패치 인덱스(

)를 산출하며, 상기 산출한 MMSE 기반의 패치 인덱스(

)를 패치 정보로 출력한다. 그리고, 상기 부호화기는, 상기 패킷화부2(225)에 의해, 이득 정보인 양자화된 이득(

)과 패치 정보인 MMSE 기반의 패치 인덱스(

)를 패킷화하며, 그에 따라 상기 시간 영역의 음성 및 오디오 신호(

,

)에 대한 이득 정보를 부호화한 후, 상기 부호화된 이득 정보를 수신기로 전송한다. 여기서, 상기 부호화된 이득 정보는, 상기 주파수 영역의 음성 및 오디오 신호(

,

)에서 각 서브대역의 이득 정보가 된다. 그리고, 상기 부호화된 이득 정보는, 모든 광대역 및 슈퍼광대역의 계층, 특히 HBE 계층에서 공유되며, 전술한 바와 같이 상대적 이득 비율로 실제 이득이 양자화됨에 따라 낮은 비트율로 서비스 품질을 향상시킨다. 그러면 여기서, 도 3을 참조하여 본 발명의 실시 예에 따른 통신 시스템에서 부호화기가 신호를 부호화하는 동작을 보다 구체적으로 설명하기로 한다.

도 3은 본 발명의 실시 예에 따른 통신 시스템에서 신호 부호화 과정을 개략적으로 도시한 도면이다.

도 3을 참조하면, 310단계에서, 상기 부호화기는, 사용자들에게 제공하고자 하는 서비스, 예컨대 음성 및 오디오 서비스에 해당하는 신호, 예컨대 음성 및 오디오 신호를 해당 계층에서 광대역 및 슈퍼광대역으로 확장된 MDCT 기반의 코덱을 통해 부호화한 후, 상기 부호화된 음성 및 오디오 신호가 광대역 및 슈퍼광대역을 통해 수신기로 송신될 경우, 상기 광대역 및 슈퍼광대역에서 상기 부호화된 음성 및 오디오 신호의 이득 정보를 공유하도록 상기 부호화된 음성 및 오디오 신호의 이득 정보를 부호화하기 위해, 시간 영역의 부호화된 음성 및 오디오 신호를 MDCT 기반으로 변환한다. 여기서, 상기 MDCT 기반으로 변환된 음성 및 오디오 신호는, 시간 영역의 신호에서 주파수 영역의 신호로 변환된다. 다시 말해, 상기 부호화된 음성 및 오디오 신호가 광대역 및 슈퍼광대역을 통해 수신기로 송신됨에 따라, 상기 시간 영역의 부호화된 음성 및 오디오 신호는, 고대역 음성 및 오디오 신호와 저대역 음성 및 오디오 신호가 되며, 상기 MDCT 기반의 변환에 의해 고대역 음성 및 오디오 신호와 저대역 음성 및 오디오 신호는 시간 영역의 신호에서 주파수 영역의 신호로 변환된다. 즉, 상기 부호화기는, 시간 영역의 부호화된 음성 및 오디오 신호를 주파수 영역의 부호화된 음성 및 오디오 신호로 변환한다.

그런 다음, 320단계에서, 상기 부호화기는, 상기 주파수 영역의 신호로 변환된 음성 및 오디오 신호에서 각 서브대역의 실제 이득을 산출한 후, 상기 산출한 변환된 음성 및 오디오 신호에서 각 서브대역의 이득을 상대적 이득 비율로 양자화하여 양자화된 이득을 산출하며, 상기 산출한 양자화된 이득을 이용하여 상기 주파수 영역의 신호로 변환된 음성 및 오디오 신호에서 각 서브대역의 주파수 계수, 예컨대 MDCT 계수를 표본화하여 표본화된 MDCT 계수를 산출한다. 여기서, 상기 양자화된 이득은, 상기 주파수 영역의 신호로 변환된 음성 및 오디오 신호에서 각 서브대역의 이득 정보가 되며, 상기 주파수 영역의 신호로 변환된 음성 및 오디오 신호에서 각 서브대역의 실제 이득, 양자화된 이득, 및 표본화된 MDCT 계수 산출에 대해서는 앞서 구체적으로 설명하였음으로 여기서는 그에 관한 구체적인 설명을 생략하기로 한다.

다음으로, 330단계에서, 상기 부호화기는, 상기 표본화된 MDCT 계수를 이용하여 상기 주파수 영역의 신호로 변환된 음성 및 오디오 신호에서 각 서브대역의 패치 정보로 패치 인덱스를 산출한다. 여기서, 상기 패치 인덱스는, 상기 표본화된 MDCT 계수를 이용하여 MMSE를 기반으로 산출, 즉 MMSE 기반의 패치 인덱스가 되며, 상기 주파수 영역의 신호로 변환된 음성 및 오디오 신호에서 각 서브대역의 패치 인덱스 산출에 대해서는 앞서 구체적으로 설명하였음으로 여기서는 그에 관한 구체적인 설명을 생략하기로 한다.

그리고, 340단계에서, 상기 부호화기는, 상기 산출한 양자화된 이득과 MMSE 기반의 패치 인덱스를 패킷화하여, 상기 시간 영역의 음성 및 오디오 신호에 대한 이득 정보를 부호화, 즉 상기 주파수 영역의 음성 및 오디오 신호에서 각 서브대역의 이득 정보를 부호화하고, 상기 부호화된 이득 정보는 수신기로 송신된다. 여기서, 상기 부호화된 이득 정보는, 상기 주파수 영역의 음성 및 오디오 신호에 대한 모든 광대역 및 슈퍼광대역의 계층, 특히 HBE 계층에서의 이득 보상 시 공유되며, 낮은 비트율로 고품질의 음성 및 오디오 서비스를 제공하도록 한다.

한편, 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로, 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 안되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.

Claims

통신 시스템에서 신호 부호화 장치에 있어서,
사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 신호를 주파수 영역의 신호로 변환하는 변환부;
상기 변환된 주파수 영역의 신호에서 각 서브대역의 이득을 산출하여 양자화하고, 상기 각 서브대역의 주파수 계수를 표본화하는 표본화부;
상기 표본화된 주파수 계수를 이용하여 상기 변환된 주파수 영역의 신호에서 각 서브대역의 패치 정보를 탐색하는 탐색부; 및
상기 양자화된 이득과 상기 탐색된 패치 정보를 패킷화하여 상기 주파수 영역의 신호에서 각 서브대역의 이득 정보를 부호화하는 패킷화부;를 포함하는 것을 특징으로 하는 신호 부호화 장치.
제1항에 있어서,
상기 변환부는, 상기 시간 영역의 신호를 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform) 기반으로 주파수 영역의 고대역 신호와 저대역 신호로 변환하는 것을 특징으로 하는 신호 부호화 장치.
제2항에 있어서,
상기 표본화부는, 상기 주파수 계수로 상기 각 서브대역의 변형 이산코사인 변환 계수를 표본화하는 것을 특징으로 하는 신호 부호화 장치.
제1항에 있어서,
상기 표본화부는, 상기 각 서브대역의 주파수 계수를 이용하여 상기 각 서브대역의 이득을 산출하고, 상기 산출한 이득을 상기 각 서브대역 간 상대적 이득 비율로 양자화하여 상기 양자화된 이득을 산출하는 것을 특징으로 하는 신호 부호화 장치.
제4항에 있어서,
상기 표본화부는, 상기 양자화된 이득을 이용하여 상기 변환된 주파수 영역의 신호에서 각 서브대역의 주파수 계수를 표본화하는 것을 특징으로 하는 신호 부호화 장치.
제1항에 있어서,
상기 탐색부는, 상기 표본화된 주파수 계수를 이용하여 최소평균자승오류(MMSE: Minimum Mean Square Error) 기반으로 상기 각 서브대역의 패치 인덱스를 산출하는 것을 특징으로 하는 신호 부호화 장치.
제6항에 있어서,
상기 패킷화부는, 상기 양자화된 이득과 상기 패치 인덱스를 패킷화하여, 대역폭 확장(BWE: BandWidth Extension) 계층(layer)에서 상기 이득 정보를 부호화하는 것을 특징으로 하는 신호 부호화 장치.
제7항에 있어서,
상기 부호화된 이득 정보는, 상기 주파수 영역의 신호에 대한 모든 광대역(wideband) 및 슈퍼광대역(super-wideband) 계층에서의 상기 이득 보상 시 공유되는 것을 특징으로 하는 신호 부호화 장치.
제1항에 있어서,
상기 시간 영역의 신호는, 광대역(wideband) 및 슈퍼광대역(super-wideband)으로 확장된 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform) 기반의 음성 및 오디오 코덱(codec)을 통해 부호화되는 것을 특징으로 하는 신호 부호화 장치.
통신 시스템에서 신호 부호화 방법에 있어서,
사용자들에게 제공하고자 하는 서비스에 해당하는 시간 영역의 음성 및 오디오 신호를 주파수 영역의 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호로 변환하는 단계;
상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 이득을 산출하는 단계;
상기 산출한 이득을 양자화하여 양자화된 이득을 산출하는 단계;
상기 양자화된 이득을 통해 상기 각 서브대역의 주파수 계수를 표본화하여 표본화된 주파수 계수를 산출하는 단계;
상기 표본화된 주파수 계수를 이용하여 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 패치 정보를 산출하는 단계; 및
상기 양자화된 이득과 상기 패치 정보를 패킷화하여, 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역의 이득 정보를 부호화하는 단계;를 포함하는 것을 특징으로 하는 신호 부호화 방법.
제10항에 있어서,
상기 변환하는 단계는, 상기 시간 영역의 음성 및 오디오 신호를 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform) 기반으로 상기 주파수 영역의 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호로 변환하는 것을 특징으로 하는 신호 부호화 방법.
제11항에 있어서,
상기 주파수 계수는, 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호의 변형 이산코사인 변환 계수인 것을 특징으로 하는 신호 부호화 방법.
제10항에 있어서,
상기 양자화된 이득을 산출하는 단계는, 상기 산출한 이득을 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에서 각 서브대역 간 상대적 이득 비율로 양자화하여 상기 양자화된 이득을 산출하는 것을 특징으로 하는 신호 부호화 방법.
제10항에 있어서,
상기 패치 정보를 산출하는 단계는, 상기 표본화된 주파수 계수를 이용하여 최소평균자승오류(MMSE: Minimum Mean Square Error) 기반으로 상기 각 서브대역에서 패치 정보를 산출하는 것을 특징으로 하는 신호 부호화 방법.
제10항에 있어서,
상기 부호화하는 단계는, 상기 저대역 음성 및 오디오 신호와 고대역 음성 및 오디오 신호에 대한 모든 광대역(wideband) 및 슈퍼광대역(super-wideband) 계층(layer)에서의 이득 보상 시 공유되도록 대역폭 확장(BWE: BandWidth Extension) 계층에서 상기 이득 정보를 부호화하는 것을 특징으로 하는 신호 부호화 방법.
제10항에 있어서,
상기 시간 영역의 음성 및 오디오 신호는, 광대역(wideband) 및 슈퍼광대역(super-wideband)으로 확장된 변형 이산코사인 변환(MDCT: Modified Discrete Cosine Transform) 기반의 음성 및 오디오 코덱(codec)을 통해 부호화되는 것을 특징으로 하는 신호 부호화 방법.