KR100593459B1

KR100593459B1 - 오디오 신호의 부호화 효율 개선 방법

Info

Publication number: KR100593459B1
Application number: KR1020057013257A
Authority: KR
Inventors: 주하 오잔페래
Original assignee: 노키아 코포레이션
Priority date: 1999-07-05
Filing date: 2000-07-05
Publication date: 2006-06-28
Also published as: EP1203370A1; CA2378435A1; EP2037451A1; CN1766990A; JP4426483B2; BRPI0012182B1; WO2001003122A1; US20060089832A1; FI991537A; EP1587062B1; KR100545774B1; KR20020019483A; ATE418779T1; CA2378435C; ES2244452T3; FI116992B; BR0012182A; US7457743B2; DE60041207D1; EP1203370B1

Abstract

본 발명은 오디오 신호의 부호화 정확성과 전송 효율성을 개선하기 위한 방법에 관한 것이다. 본 발명 방법에 따르면, 부호화된 오디오 신호의 일부분은 이전에 저장된 오디오 신호의 샘플들과 비교되고, 부호화된 오디오 신호에 최적 대응하는 샘플들의 레퍼런스 시퀀스가 식별된다. 예측 신호들은 적어도 2개의 다른 LTP 오더들(M)을 사용하는 장기간(long-term) 예측에 의해 레퍼런스 시퀀스로부터 생성되고, 피치 예측기 계수들(b(K))은 각각의 피치 예측기 오더를 위해 형성된다. 각각의 피치 예측기 오더에 대한 예측 신호들은 예측 에러를 판단하기 위해 부호화된 오디오 신호와 비교된다. 예측 신호들을 부호화하기 위해 요구되는 정보량은 본래 신호를 부호화하기 위해 요구된 정보량과 비교되고, 요구된 데이터량을 최소화하는 동안 오디오 신호의 최적 표현을 제공하는 부호화 방법이 선택된다.

예측 신호, 피치 예측기 오더

Description

오디오 신호의 부호화 효율 개선 방법{Method for improving the coding efficiency of an audio signal}

도 1은 본 발명의 바람직한 실시예에 따른 인코더를 도시한다.

도 2는 본 발명의 바람직한 실시예에 따른 디코더를 도시한다.

도 3은 본 발명의 바람직한 실시예에 따른 데이터 전송 시스템을 나타내는 개략 블록도이다.

도 4는 본 발명의 바람직한 실시예에 따른 방법을 도시하는 흐름도이다.

도 5a 및 도 5b는 본 발명의 바람직한 실시예에 따른 인코더에 의해 생성된 데이터 전송 프레임들의 예들이다.

본 발명은 첨부된 청구항 1항의 전제부에 따른 오디오 신호를 부호화하는(coding) 방법에 관한 것이다. 본 발명은 또한 첨부된 청구항 10항의 전제부에 따른 인코더, 첨부된 청구항 13항에 따른 데이터 전송 시스템, 첨부된 청구항 17의 전제부에 따른 디코더, 그리고 첨부된 청구항 24항의 전제부에 따른 데이터 구조에 관한 것이다.

일반적으로, 오디오 부호화 시스템들은 음성 신호와 같은 아날로그 오디오 신호로부터 부호화된 신호들을 생성한다. 전형적으로, 상기 부호화된 신호들은 상기 데이터 전송 시스템에 특유한 데이터 전송 방법들에 의해 수신기에 전송된다. 상기 수신기에 있어서, 오디오 신호는 상기 부호화된 신호들에 기초하여 생성된다. 전송되어질 정보의 양은 예를 들어, 상기 부호화가 수행될 수 있는 효율에 의해서 뿐만 아니라, 상기 시스템의 부호화된 정보에 사용된 대역폭에 의해 영향받는다.

부호화를 위하여, 디지털 샘플들은 아날로그 신호로부터 예를 들어 0.125ms의 규칙적인 간격으로 생성된다. 상기 샘플들은 전형적으로 고정된 크기의 그룹들, 예를 들어 대략 20ms의 지속시간을 갖는 그룹들로 처리된다. 이 샘플 그룹들은 또한 "프레임들"로서 지칭된다. 일반적으로, 프레임은 오디오 데이터가 처리되는 기본 단위이다.

오디오 부호화 시스템들의 목적은 이용가능한 대역폭의 범위내에서 가능한 한 좋은 사운드 품질을 생성하는 것이다. 이러한 목적을 위해, 오디오 신호, 특히 음성 신호에 나타나는 주기성이 사용될 수 있다. 음성의 주기성은 예를 들어 음성 코드들의 진동들로부터 기인한다. 전형적으로, 진동 주기는 대략 2ms 내지 20ms이다. 종래 기술에 따른 수많은 음성 코더들에 있어서, 장기 예측(LTP; long-term prediction)으로 알려진 기술이 사용되고, 그 목적은 상기 부호화 과정의 효율성을 향상시키기 위해 이 주기성을 평가하고 이용하는 것이다. 따라서, 인코딩 동안, 부호화되어질 신호의 부분(프레임)은 상기 신호의 이전 부호화된 부분들과 비교된다. 유사한 신호가 이전 부호화된 부분에 있는 경우, 상기 유사한 신호 및 부호화될 신 호간의 시간 지연(시간적 간격(lag))이 검토된다. 부호화될 신호를 나타내는 예측된 신호는 상기 유사한 신호에 기초하여 형성된다. 게다가, 상기 예측된 신호 및 부호화될 신호간의 차이를 나타내는 에러 신호가 생성된다. 따라서, 부호화는 바람직하게는 상기 지연 정보 및 상기 에러 신호만이 전송되는 그러한 방식으로 수행된다. 상기 수신기에 있어서, 올바른 샘플들이 메모리로부터 검색되고, 부호화될 신호의 부분을 예측하는데 사용되며 상기 지연에 기초하여 에러 신호와 결합된다. 수학적으로, 그러한 피치(pitch) 예측기는 공식 1에 도시된 바와 같은 전달 함수에 의해 예시될 수 있는 필터링 연산을 수행하는 것으로 간주될 수 있다.

공식 1

상기 공식 1은 1차 피치 예측기의 전달 함수를 예시한다. β는 상기 피치 예측기의 계수이고 α는 주기성을 나타내는 지연이다. 고차 피치 예측기 필터들에 있어서 공식 2에 도시된 바와 같이 보다 일반적인 전달 함수를 사용하는 것이 가능하다.

공식 2

상기 목적은 상기 부호화 에러, 즉 실제 신호 및 이전 샘플들을 이용하여 형성된 신호간의 차이가 가능한 한 작도록 하는 방식으로 각 프레임에 대해 계수들(βk)을 선택하는 것이다. 바람직하게는, 최소 에러가 최소 제곱법을 사용하여 달성되는 부호화에서 사용되도록 상기 계수들이 선택된다. 바람직하게는, 상기 계수들은 한 프레임씩 갱신된다.

미국 특허 US 5,528,629는 1차 장기 예측뿐만 아니라 단기 예측(STP; short-term prediction)을 사용하는 선행기술 음성 부호화 시스템을 개시한다.

선행기술 코더들은 오디오 신호의 주파수 및 그 주기성간의 관계에 주의를 기울이지 않는 단점을 갖는다. 따라서, 신호의 주기성이 모든 경우들에 있어서 효율적으로 이용될 수 없고 부호화된 정보의 양이 불필요하게 크게 되거나 수신기에서 재현된 오디오 신호의 사운드 품질이 저하된다.

몇몇 경우들에 있어서, 예를 들어 오디오 신호가 높은 주기 성질을 가지고 시간에 걸쳐 거의 변화하지 않는 경우, 지연 정보만이 상기 신호의 예측에 좋은 근거를 제공한다. 이 경우에 있어서, 고차 피치 예측기를 사용할 필요가 없다. 어떤 다른 경우들에 있어서, 그 반대가 진실이다. 상기 지연이 반드시 상기 샘플링 간격의 정수배는 아니다. 예를 들어, 상기 지연이 상기 오디오 신호의 2개의 연속하는 샘플들 사이에 놓일 수 있다. 이 경우에 있어서, 고차 피치 예측기들이 상기 신호의 보다 정확한 표현을 제공하기 위하여 상기 이산 샘플링 시간들 사이에 효과적으로 보간할 수 있다. 더욱이, 고차 피치 예측기들의 주파수 응답은 주파수의 함수로서 감소하는 경향이 있다. 이것은 고차 피치 예측기들이 오디오 신호의 더 낮은 주파수 성분들의 더 좋은 모델링을 제공한다는 것을 의미한다. 음성 부호화에 있어서, 이것은 효과적인데, 그것은 더 낮은 주파수 성분들이 더 높은 주파수 성분들보다 상기 음성 신호가 인식되는 품질에 더 중요한 영향을 미치기 때문이다. 따라서, 신호의 진화에 따라 오디오 신호를 예측하는데 사용되는 피치 예측기의 차수를 변화시키는 능력이 아주 바람직한 것으로 이해되어져야 한다. 고정 차수 피치 예측기 를 사용하는 인코더는 몇몇 경우들에 있어서, 지나치게 복잡할 수 있지만, 다른 경우들에 있어서 오디오 신호를 충분히 모델링하는데 실패한다.

본 발명의 일 목적은 데이터 전송 시스템에서 오디오 신호들의 전송 효율 및 부호화 정확도를 개선하는 방법을 구현하는 것이다. 여기서, 상기 오디오 데이터는 종래 기술의 방법들에서보다 더 큰 정확도로 부호화되고 더 효율성을 가지고 전달된다. 본 발명에 따른 인코더에 있어서, 상기 목적은 가능한 한 정확하게 한 프레임씩 부호화되는 오디오 신호를 예측하는 것이고, 전송될 정보의 양이 적게 남도록 보장하는 것이다. 본 발명에 따른 방법은 첨부된 청구항 1의 특징 부분에 제시된 것을 특징으로 한다. 본 발명에 따른 인코더는 첨부된 청구항 10의 특징 부분에 제시된 것을 특징으로 한다. 본 발명에 따른 데이터 전송 시스템은 첨부된 청구항 13의 특징 부분에 제시된 것을 특징으로 한다. 본 발명에 따른 디코더는 첨부된 청구항 17의 특징 부분에 제시된 것을 특징으로 한다. 더욱이, 본 발명에 따른 데이터 구조는 첨부된 청구항 24의 특징 부분에 제시된 것을 특징으로 한다.

본 발명은 종래 기술에 따른 해결책들에 비교되는 경우 상당한 장점들을 달성한다. 본 발명에 따른 방법은 종래 기술 방법들과 비교되는 경우 오디오 신호가 보다 정확하게 부호화되는 것을 가능하게 하고, 상기 부호화된 신호를 나타내는데 필요한 정보의 양이 적게 남도록 보장한다. 본 발명은 또한 종래 기술에 따른 방법들에서 보다 오디오 신호의 부호화가 더 유연한 방식으로 수행되도록 허용한다. 본 발명은 오디오 신호가 예측되는 정확도에 우선권을 주는 방식(질적 최대화)으로, 인코딩된 오디오 신호를 나타내는데 필요한 정보의 양의 감소에 우선권을 주는 방식(양적 최소화)으로, 또는 상기 2방식간의 트레이드-오프(trade-off)를 제공하는 방식으로 구현될 수 있다. 본 발명에 따른 방법을 이용하여, 오디오 신호에 존재하는 상이한 주파수들의 주기성을 더 잘 고려하는 것이 또한 가능하다.

이하, 본 발명은 첨부된 도면들을 참조하여 보다 상세하게 설명될 것이다.

도 1은 본 발명의 바람직한 실시예에 따른 인코더(1)를 도시하는 개략 블록도이다. 도 4는 본 발명에 따른 방법을 도시하는 흐름도(400)이다. 상기 인코더(1)는 예를 들어, 오디오 신호를 이동 통신 네트워크 또는 인터넷 네트워크와 같은 데이터 전송 시스템에서 전송되도록 부호화된 신호로 변환하는 무선 통신 디바이스(2; 도 3)의 음성 코더이다. 따라서, 디코더(33)는 바람직하게는 상기 이동 통신 네트워크의 기지국내에 위치된다. 대응하여, 아날로그 오디오 신호, 예를 들어 마이크로폰(29)에 의해 생성되고 필요한 경우 오디오 블록(30)에서 증폭되는 신호는 아날로그/디지털 변환기(4)에서 디지털 신호로 변환된다. 변환의 정밀도는 예를 들어 8 또는 12 비트이고, 연속 샘플들간의 간격(시간 해상도)은 예를 들어 0.125ms이다. 이 설명에서 제시된 수의 값들은 본 발명을 제한하지 않고 명백하게 하는 단지 예들인 것이 자명하다.

오디오 신호로부터 획득된 샘플들은 샘플 버퍼(미도시)내에 저장되고, 상기 버퍼는 예를 들어 무선 통신 디바이스(2)의 메모리 수단(5)과 같은 공지된 방식으로 구현될 수 있다. 바람직하기로는, 오디오 신호의 인코딩은 소정 수의 샘플들이 부호화되기 위하여 상기 인코더(1)에 전송되도록 한 프레임씩을 기초로 수행된다. 예를 들어, 샘플들은 20ms의 주기 내에서 생성된다(= 160 샘플들, 연속 샘플들간에 0.125ms의 시간 간격을 가정하는 경우). 한 프레임의 부호화될 샘플들은 바람직하기로는 변환 블록(6)에 전송되고, 상기 변환 블록에서 상기 오디오 신호는 예를 들어, 수정 이산 코사인 변환(MDCT; modified discrete cosine transform)에 의해 시간 도메인에서 변환 도메인(주파수 도메인)으로 변환된다. 상기 변환 블록(6)의 출력은 상기 주파수 도메인에서 상기 변환된 신호의 속성들을 나타내는 일군의 값들을 제공한다. 이 변환은 도 4의 흐름도에서 블록 404에 의해 표현된다.

시간 도메인 신호를 주파수 도메인으로 변환하는 대안적인 구현은 몇 개의 대역-통과 필터들로 구성된 필터 뱅크이다. 각 필터의 통과 대역은 비교적 좁고, 여기서 상기 필터들의 출력들에서 신호들의 크기들은 변환될 신호의 주파수 스펙트럼을 나타낸다.

지연 블록(7, lag block)은 샘플들의 이전 시퀀스 중 어느 것이 주어진 시간에 부호화될 프레임에 가장 잘 대응하는가를 결정한다(블록 402). 이러한 지연 결정 단계는 바람직하게는 지연 블록(7)이 참조 버퍼(8)내에 저장된 값들을 부호화될 프레임의 샘플들과 비교하고 예를 들어 최소 제곱법을 이용하여 부호화될 프레임의 샘플들과 상기 참조 버퍼에 저장된 대응하는 샘플들의 시퀀스간의 에러를 계산하는 방식으로 수행된다. 바람직하기로는, 연속 샘플들로 구성되고 최소 에러를 갖는 샘플들의 시퀀스가 샘플들의 참조 시퀀스로서 선택된다.

샘플들의 참조 시퀀스가 상기 지연 블록(7)에 의해 상기 저장된 샘플들로부 터 선택되는 경우(블록 403), 상기 지연 블록(7)은 피치 예측기 계수 평가를 수행하기 위하여 관련 정보를 계수 계산 블록(9)에 전달한다. 따라서, 상기 계수 계산 블록(9)내에서, 1, 3, 5 및 7과 같은 상이한 피치 예측기 차수들에 대해 상기 피치 예측기 계수들(b(k))은 샘플들의 참조 시퀀스내의 샘플들에 기초하여 계산된다. 상기 계산된 계수들(b(k))은 그 다음 피치 예측기 블록(10)에 전달된다. 도 4의 흐름도에 있어서, 이 단계들은 블록들(405 내지 411)에 도시된다. 여기에 제시된 차수들은 본 발명을 제한하지 않고 명백하게 하는 단지 예들로서 기능하는 것이 자명하다. 본 발명은 또한 다른 차수들을 가지고 적용될 수 있고, 이용 가능한 차수들의 개수는 또한 본 명세서에 제시된 4개의 차수들 전체와 상이할 수 있다.

상기 피치 예측기 계수들이 계산된 후에, 상기 계수들이 양자화되고, 여기서 양자화된 피치 예측기 계수들이 획득된다. 상기 피치 예측기 계수들은 바람직하기로는 상기 수신기의 상기 디코더(33)에서 생성된 재현된 신호가 에러없는 데이터 전송 조건들에서 원본에 가능한 한 밀접하게 대응하는 그러한 방식으로 양자화된다. 상기 피치 예측기 계수들을 양자화하는 경우, 반올림(rounding)에 의해 기인한 에러들을 최소화하기 위하여, 가능한 최고의 해상도(가능한 최소의 양자화 단계들)를 사용하는 것이 바람직하다.

샘플들의 참조 시퀀스내에 저장된 샘플들은 상기 피치 예측기 블록(10)에 전달되고, 여기서 계산되고 양자화된 피치 예측기 계수들(b(k))을 이용하여, 예측된 신호가 상기 참조 시퀀스의 샘플들로부터 각 피치 예측기 차수에 대해 생성된다. 각 예측된 신호는 해당 피치 예측기 차수를 이용하여 평가된 부호화될 신호의 예측 을 나타낸다. 본 발명의 바람직한 실시예에 있어서, 상기 예측된 신호들은 제2 변환 블록(11)에 전달되어 주파수 도메인으로 변환된다. 상기 제2 변환 블록(11)은 2 이상의 상이한 차수들을 이용하여 변환을 수행하고, 여기서 상이한 피치 예측기 차수들에 의해 예측된 신호들에 대응하는 변환된 값들의 세트들이 생성된다. 상기 피치 예측기 블록(10) 및 상기 제2 변환 블록(11)은 각 피치 예측기 차수에 대해 필요한 연산들을 수행하는 그러한 방식으로 구현될 수 있거나, 대안으로서 별개의 피치 예측기 블록(10) 및 별개의 제2 변환 블록(11)이 각 차수에 대해 구현될 수 있다.

계산 블록(12)에 있어서, 상기 예측된 신호의 주파수 도메인 변환된 값들은 변환 블록(6)으로부터 획득된 부호화될 오디오 신호의 주파수 도메인 변환된 표현과 비교된다. 예측 에러 신호는 부호화될 오디오 신호의 주파수 스펙트럼 및 상기 피치 예측기를 사용하여 예측된 신호의 주파수 스펙트럼간의 차이를 취함으로써 계산된다. 바람직하기로는, 상기 예측 에러 신호는 부호화될 신호의 주파수 성분들 및 상기 예측된 신호의 주파수 성분들 간의 차이에 대응하는 예측 에러 값들의 세트를 포함한다. 예를 들어 오디오 신호의 주파수 스펙트럼 및 예측된 신호간의 평균 차이를 나타내는 부호화 에러가 또한 계산된다. 바람직하기로는, 상기 부호화 에러는 최소 제곱법을 이용하여 계산된다. 오디오 신호의 사이코어코스틱(psychoacoustic) 모델링에 근거한 방법들을 포함하는 어떤 다른 적합한 방법이 부호화될 오디오 신호를 가장 잘 나타내는 예측 신호를 결정하는데 사용될 수 있다.

부호화(coding) 효율 측정(예측 이득)은 또한 전송 채널(블록(413))로 전송 되기 위한 정보를 결정하기 위하여 블록(12)에서 계산된다. 목표는 신호에서의 왜곡들(질적 최대화)뿐 아니라 전송되는 정보의 양(비트들)(양적 최소화)을 최소화하는 것이다.

수신 디바이스에 저장된 이전 샘플들을 기초로 하여 수신기에서 신호를 재생하기 위하여, 선택된 순서, 순서를 고려한 정보, 지연 및 수신기에 대한 예측에러에 대한 정보에 대한 예컨대 양자화된 피치 예측 계수들을 전송하는 것이 필요하다. 유리하게, 부호화 효율측정은 최초의 신호에 대한 정보를 전송하기 위하여 필요이상으로 더 적은 수의 비트들을 가지고 피치 예측블록(10)에서 부호화된 신호를 복호화하기 위하여 필요한 정보를 전송하는 것이 가능한지를 나타낸다. 이러한 결정은 예를 들면, 제1 기준값이 정의되고, 만약 복호화를 위해 필요한 정보가 특별한 피치 예측기를 사용해서 생성된다면 전송되는 정보의 양을 나타내는 방식으로 구현될 수 있다. 부가적으로, 제2 기준값이 정의되고, 만약 복호화를 위해 필요한 정보가 최초의 오디오신호에 기초하여 형성된다면 전송되는 정보의 양을 나타낸다. 부호화 효율측정은 유리하게는 제1 기준값에 대한 제2 기준값의 비율이다. 예측된 신호를 나타내는데 필요한 비트들의 수는 예를 들면, 예측 신호와 연관된 에러 정보의 양 및 정확도 뿐만 아니라, 피치 예측기의 순서(예컨대 전송되는 계수들의 수), 각 계수가 나타내어지는(양자화되는) 정확도에 의존한다. 반면에, 최초의 오디오 신호에 대한 정보를 전송하는데 필요한 비트들의 수는 예를 들면, 오디오 신호 주파수 영역 표현의 정확도에 의존한다.

만약 이러한 방식으로 결정된 부호화 효율이 1보다 더 크다면, 예측신호를 복호화하기 위해 필요한 정보는 최초 신호에 대한 정보보다 더 적은 수의 비트들로 전송될 수 있음을 나타낸다. 계산 블록(12)에서 이러한 다른 대안들의 전송을 위해 필요한 비트들의 수가 결정되고 전송되는 비트들의 수가 더 적은 대안이 선택된다(블록(414)).

본 발명의 제1 실시예에 따르면, 가장 작은 부호화 에러가 얻어지는 피치 예측 순서가 오디오신호을 부호화하기 위해 선택된다(블록(412)). 만약 선택된 피치 예측기에 대한 부호화 효율측정이 1보가 크다면, 예측신호에 대한 정보가 전송을 위해 선택된다. 만약 부호화 효율측정이 1보가 크지 않다면, 전송되는 정보는 최초 오디오 신호에 기초하여 형성된다. 본 발명의 이러한 실시예에 따르면, 예측에러를 최소화하는것이 강조된다(질적인 최대화).

본 발명의 제2 유리한 실시예에 따르면, 부호화 효율측정은 각 피치 에측기 순서에 대해서 계산된다. 부호화 효율 측정이 1보가 더 큰 그러한 순서들로부터 선택되는 가장 작은 부호화 에러를 제공하는 피치 예측기 순서는 그러면 오디오 신호를 부호화하는데 사용된다. 만약 피치 예측기 순서들이 아무것도 예측 이득을 제공하지 않는다면(예컨대 부호화 효율 측정이 1보다 크지 않다면), 유리하게도 전송되는 정보는 최초의 오디오 신호에 기초하여 형성된다. 본 발명의 이러한 실시예는 예측 에러 및 부호화 효율사이의 트래이드오프(tradeoff)를 가능하게 한다.

본 발명의 제3 실시예에 따르면, 부호화 효율 측정은 각 피치 예측기 순서에 대하여 계산되고, 부호화 효율 측정이 1보다 큰 그러한 순서들로부터 선택되고 가장 높은 부호화 효율을 제공하는 피치 예측기 순서는 오디오 신호를 부호화하기위 해 선택된다. 만약 피치 예측기 순서들중 아무것도 예측 이득을 제공하지 않는다면(예를 들면, 아무런 부호화 효율 측정이 1보다 크다면), 유리하게도, 전송되는 정보는 최초의 오디오 신호에 기초하여 형성된다. 따라서, 본 발명의 이러한 실시예는 부호화 효율의 최대화에 중점을 둔다(양적인 최소화).

본 발명의 제4 실시예에 따르면, 부호화 효율 측정은 각 피치 예측기 순서에 대하여 계산되고 가장 높은 부호화 효율을 제공하는 피치 순서는 부호화 효율이 1보다 크지 않다고 하더라도 오디오 신호를 부호화하기 위해 선택된다.

부호화 에러의 계산 및 피치 예측기 순서의 선택은 간격을 두고 수행되며, 바람직하게는 각 프레임에 대해 개별적으로 수행되며, 다른 프레임에 있어서 주어진 시간에 오디오 신호의 특성들에 최대로 대응하는 피치 예측기 순서를 사용하는 것이 가능하다.

위에서 기술한 바와 같이, 블록(12)에서 결정된 부호화 효율이 1보다 크지 않다면, 이것은 최초 신호의 주파수 스펙트럼을 전송하는 것이 유리하다는 것을 나타내며, 데이터 전송 채널로 전송되는 비트 스트링(501)은 다름 방식으로 유리하게 형성된다(블록(415)). 선택된 전송 대안에 관련된 계산 블록(12)으로부터의 정보는 선택 블록(13)으로 전송된다(도 1에서 라인 D1 및 D4). 선택된 블록(13)에서 최초의 오디오 신호를 나타내는 주파수 영역의 변형된 값들은 양자화 블록(14)으로 전송을 위해 선택된다. 양자화 블록(14)에 대한 최초의 오디오 신호의 주파수 영역으로의 변환된 값의 전송이 도 1의 블록 다이어그램에서 라인 A1에 의해 도시되어 있다. 양자화 블록(14)에서, 주파수 영역 변형된 신호 값들은 알려진 방식으로 양자 화된다. 양자화된 값은 멀티플렉싱 블록(15)으로 전달되며, 상기 멀티플렉싱 블록(15)에서 전송될 비트 스트링이 형성된다. 도 5a 및 도 5b는 본 발명의 관련되어 유리하게 적용될 수 있는 비트 스트링 구조의 예제를 나타낸다. 선택된 부호화 방법을 고려한 정보는 계산 블록(12)으로부터 멀티플렉싱 블록(15)로 전달(라인 D1, 및 D3)되며, 상기 멀티플렉싱 블록(15)에서 비트 스트링은 전송 대안에 따라 형성된다. 제1논리값, 예를 들면 로직 0상태는 최초 오디오 신호를 나타내는 주파수 영역 변형된 값들은 문제의 비트 스트링에서 전송된다는 것을 나타내기 위해 부호화 방법 정보(502)로서 사용된다. 부호화 방법 정보(502)에 부가하여, 값들 자체는 비트 스트링에서 전송되며, 주어진 정확도로 양자화된다. 이러한 값들을 전송하는데 사용되는 영역은 도 5a에서 참조번호(503)로 표시된다. 각각의 비트 스트링에서 전송되는 값들의 수는 샘플링 주파수 및 주어진 시간에 검사되는 프레임의 길이에 의존한다. 이러한 상황에서는, 피치 예측기 순서 정보, 피치 예측기 계수들, 지연 및 에러 정보는 비트 스트링(501)에서 전송된 최초 오디오 신호의 주파수 영역 값들에 기초하여 수신기에서 재생되기 때문에 전송되지 않는다.

만약 부호화 효율은 1보다 크다면, 선택된 피치 예측기를 사용하여 오디오 신호를 부호화하는 것이 유리하고 데이터 전송 채널로 전송되는 비트 스트링(501)(도 5b)은 다음과 같은 방식으로 형성되는 것이 유리하다(블록 (416)). 선택된 전송 대안에 관련된 정보는 계산 블록(12)로부터 선택 블록(13)으로 전송된다. 이것은 도 1의 블록 다이어그램에서 라인들 D1 및 D4에 의해 도시된다. 선택 블록(13)에서 양자화 된 피치 예측기 계수들은 멀티플렉싱 블록(15)로 전달되도록 선택된다. 이 것은 도 1의 블록 다이어그램에서 라인 B1에 의해 도시된다. 피치 예측기 게수들은 또한 선택 블록(13)을 경유하기보다는 다른 방식으로 멀티플렉싱 블록(15)으로 전달될 수 있다. 전송되는 비트 스트링은 멀티플렉싱 블록(15)에서 형성된다. 선택된 부호화 방법을 고려한 정보는 계산 블록(12)로부터 멀티플렉싱 블록(15)으로 전달되며(라인 D1 및 D3), 상기 멀티플렉싱 블록(15)에서 비트 스트링은 전송 대안에 따라서 형성된다. 제2 논리값, 예를 들면 로직 1상태는 부호화 방법 정보(502)로서 사용되며, 상기 양자화된 피치 예측기 계수들이 문제의 비트 스트링내에서 전달된다는 것을 나타낸다. 순서 영역(504)의 비트들은 선택된 피치 예측기 순서에 따라서 세팅된다. 예를 들면, 이용가능한 4개의 다른 순서들이 있다고 하면, 2비트들(00, 01, 10, 11)이면 주어진 시간에 어떤 순서가 선택되는지를 나타내기에 충분하다. 부가하여, 지연중인 정보는 지연 영역(505)의 비트 스트링에서 전송된다. 바람직한 실시예에서, 지연은 11비트들로 표시되나, 다른 길이들도 본 발명의 범위내에서 또한 적용가능함은 명확하다. 양자화된 피치 예측기 계수들은 계수 영역(506)내에서 비트 스트링으로 첨가된다. 선택된 피치 예측기 순서가 1이라면, 단지 하나의 계수가 전달되며, 만약 순서가 3이라면, 3개의 계수들이 전달되는 등등이다. 계수들의 전송에서 사용되는 비트들의 수는 다른 실시예들에서는 또한 변할 수 있다. 유리한 실시예에서, 제1 순서 계수가 3개의 비트들로 표현되고, 3번째 순서 계수들은 총 5비트들로, 5번째 순서 계수들은 총 9비트들로, 7번째 순서 계수들은 10비트들로 표현된다. 일반적으로, 선택된 순서가 높을수록, 양자화 피치 예측기 계수들의 전송에 필요한 비트들의 수는 더 커진다고 할 수 있다.

이전에 언급한 정보에 부가하여, 오디오 신호가 선택된 피치 예측기에 기초하여 부호화될 때, 에러 필드(507)에서 예측 에러 정보를 전송하는 것이 필요하다. 이러한 예측 에러 정보는 유리하게 차이신호로서 계산 블록(12)에서 만들어지며, 상기 차이신호는 샘플들의 레퍼런스 시퀀스와 함께 선택된 피치 예측기의 양자화 피치 예측기 계수를 사용한 부호화된 오디오 신호의 주파수 스펙트럼과 복호화될 수 있는(예를 들면, 재생된)신호의 주파수 스펙트럼의 차이를 나타낸다. 따라서, 에러 신호는 예를 들면 제1선택 블록(13)을 경유하여 양자화되기 위하여 양자화블록(14)로 전달된다. 상기 양자화 에러신호는 양자화 블록(14)로부터 멀티플렉싱 블록(15)로 전달되며, 상기 멀티플렉싱 블록(15)에서 양자화 예측 에러 값들은 비트스트링의 에러영역(507)으로 첨가된다.

본 발명에 따른 인코더(1)는 또한 국부 부호화 기능을 포함한다. 부호화된 오디오 신호는 양자화블록(14)로부터 역 양자화블록(17)으로 전달된다. 위에서 기술된 바와 같이, 부호화 효율이 1보다 크지 않은 경우에는, 오디오 신호는 그의 양자화된 주파수 스펙트럼 값들에 의해 표현된다. 이 경우에, 양자화된 주파수 스펙트럼 값들은 역 양자화 블록(17)으로 전달되며, 역 양자화 블록(17)에서 상기 양자화된 주파수 스펙트럼 값들은 가능한 정확하게 오디오 신호의 최초 주파수 스펙트럼을 회복하기 위하여 알려진 방식으로 역 양자화된다. 최초 오디오 신호의 주파수 스펙트럼을 나타내는 역 양자화된 값들은 블록(17)로부터 가산블록(18)로의 출력으로 제공된다.

만약 부호화 효율이 1보다 크다면, 오디오 신호는 피치 예측기 정보 예를 들 면 피치 예측기 순서 정보, 양자화된 피치 예측기 계수들, 양자화된 주파수 영역 값들 형태의 지연 값 및 예측 에러 정보로 표현된다. 위에서 기술된 바와 같이, 예측 에러 정보는 부호화된 오디오 신호의 주파수 스펙트럼과 선택된 피치 예측기 및 샘플들의 레퍼런스 시퀀스에 기초하여 재생될 수 있는 오디오 신호의 주파수 스펙트럼의 차이를 나타낸다. 그러므로, 이 경우에서, 예측 에러 정보를 포함하는 양자화된 주파수 영역 값들은 역 양자화 블록(17)로 전달되며, 역 양자화 블록(17)에서 상기 값들은 가능한 정확하게 예측 에러의 주파수 영역 값을 회복하는 방식으로 역 양자화된다. 따라서, 블록(17)의 출력은 역 양자화된 예측 에러 값들을 포함한다. 이러한 값들은 가산블록(18)으로의 입력으로서 더 제공되며, 상기 가산블록(18)에서 상기 역 양자화된 예측 에러 값들은 선택된 피치 예측기를 사용하여 예측된 신호의 주파수 영역 값들에 가산된다. 이러한 방식으로, 최초의 오디오 신호의 재생된 주파수 영역 표현(representation)이 형성된다. 예측된 신호의 주파수 영역 값들은 계산 블록(12)으로부터 이용가능하며, 상기 계산 블록(12)에서는 예측된 신호의 주파수 영역 값들은 예측에러의 결정과 관련하여 계산되고, 도 1의 라인 C1에서 나타난 바와 같이 가산 블록(18)로 전달된다.

가산 블록(18)의 동작은 계산 블록(12)에 의해 제공된 제어 정보에 따라서 게이트로 제어된다(스위치 온/오프). 이러한 게이트 동작을 가능하게 하는 제어 정보의 전달은 계산 블록(12)과 가산 블록(18)사이의 링크에 의해 나타난다(도 1에서 라인 D1 및 D2). 게이팅 동작은 역 양자화 블록(17)에 의해 제공된 역 양자화 주파수 영역 값들의 다른 타입들을 고려하기 위해 필요하다. 위에서 기술된 바와 같이, 만약 부호화 효율이 1보다 크지 않다면, 블록(17)의 출력은 최초 오디오 신호를 나타내는 역 양자화된 주파수 영역 값들을 포함한다. 이 경우에는 가산 동작이 필요하지 않으며, 계산 블록(12)에서 연구된 어떠한 예측 오디오 신호의 주파수 영역 값들에 대한 정보도 필요하지 않다. 이러한 경우에는, 가산 블록(18)의 동작은 계산 블록(12)으로부터 제공된 제어 정보에 의하여 금지되고 최초의 오디오 신호를 나타내는 역 양자화된 주파수 영역 값들은 가산 블록(18)을 통과한다. 반면에, 만약 부호화 효율이 1보다 크다면, 블록(17)의 출력은 역 양자화된 예측 에러 값들을 포함한다. 이러한 경우에, 최초의 오디오 신호의 재생된 주파수 영역 표현을 형성하기 위하여 역 양자화된 예측 에러 값들과 예측된 신호의 주파수 스펙트럼을 가산하는 것이 필요하다. 이제, 가산 블록(18)의 동작은 계산 블록(12)으로부터 전달된 제어 정보에 의해 가능하게 되며, 역 양자화된 예측 에러 값들이 예측된 신호의 주파수 스펙트럽에 의해 가산되도록 한다. 유리하게, 필요한 제어 정보는 오디오 신호에 적용되는 부호화 선택과 관련해서 블록(12)에서 만들어진 부호화 방법 정보에 의해 제공된다.

대안적인 실시예에서, 양자화는 예측 에러 및 부호화 효율 값들의 계산전에 수행될 수 있으며, 예측 에러 및 부호화 효율 계산들은 최초 신호 및 예측 신호들을 나타내는 양자화된 주파수 영역 값들을 사용하여 수행된다. 유리하게 상기 양자화는블록들(6 및 12) 그리고 블록들(11 및 12)사이에서 수행된다(미도시). 이러한 실시예에서 양자화 블록(14)은 필요하지 않으나, 부가적인 역 양자화 블록이 라인 C1에 의해 표현된 통로에서 필요하다.

가산 블록(18)의 출력은 샘플들(오디오 신호)의 부호화된 시퀀스에 대응하는 샘플된 주파수 영역 데이터이다. 이러한 샘플된 주파수 영역 데이터는 역 수정된 DCT 트랜스포머(19)내에서 시간 영역으로 더 변환되며, 연속하는 프레임들의 부호화와 관련하여 저장되고 사용되기 위하여 역 수정된 DCT 트랜스포머(19)로부터 샘플들의 복호화된 시퀀스가 레퍼런스 버퍼(8)로 전달된다. 레퍼런스 버퍼(8)의 저장 능력은 문제되는 애플리케이션의 부호화 효율 요구를 얻기 위해 필요한 샘플들의 수에 따라서 선택된다. 레퍼런스 버퍼(8)에서, 새로운 시퀀스의 샘플들은 바람직하게는 버퍼내의 가장 오래된 샘플들을 오버-라이트함에 의해 저장되며, 즉 버퍼는 이른바 순환버퍼이다.

인코더(1)에서 형성된 비트 스트링은 송수신기(16)로 전달되며, 상기 송수신기(16)에서 알려진 방식대로 변조가 행해진다. 상기 변조된 신호는 데이터 전송 채널(3)을 경유하여 수신기로 전달되며, 예를 들면 무선 주파수 신호들 같은 것이다. 유리하게는, 주어진 프레임의 부호화가 완료된 후에 실질적으로 즉시, 상기 부호화된 오디오 신호는 프레임별로 전송된다. 대안적으로, 상기 오디오 신호는 부호화되며, 전송 터미널의 메모리에 저장되고 추후에 전송될 수 있다.

수신장치(31)에 있어서 데이터 전송채널로부터 수신된 신호는 수신기 블록(20)에서 알려진 방법으로 복조된다. 복조된 데이터 프레임에 포함된 정보는 디코더(33)에서 결정된다. 디코더(33)의 디멀티플렉싱 블록(21)에서 수신된 정보가 원래의 오디오신호를 기초로 하여 구성되었는지를 비트스트링의 부호화 방법 정보(502)를 기본으로 하여 제일 먼저 조사한다. 디코더가 인코더(1)에서 형성된 비트 스트링(501)이 원신호의 주파수 도메인 변환값을 포함하지 않는다면, 복호화는 바람직하게는 다음 방법으로 수행된다. 피치 예측기블록(24)에서 사용되는 오더(M)는 오더필드(504)로부터 결정되며, 시간지연은 지연필드(505)에 의해 결정된다. 오더와 지연에 관한 정보뿐만 아니라 비트스트링(501)의 계수필드(506)에서 수신된 양자화된 피치 예측기 계수들은 디코더의 피치 예측기블록(24)으로 전송된다. 이것은 도 2의 라인(B2)에 의해 설명된다. 상기 비트스트링의 필드(507)에서 수신된 예측에러 신호의 양자화된 값들은 역양자화블록(22)에서 역양자화되어 디코더의 합계블록(23)으로 전송된다. 지연정보에 따라 디코더의 피치 예측기블록(24)은 샘플버퍼(28)로부터 참조시퀀스로 사용되어질 샘플을 검색하고 피치예측기블록(24)이 수신된 피치예측기 계수를 이용하는 선택된 오더(M)에 따라 예측을 수행한다. 그것에 의하여 제1의 재구성된 시간 도메인 신호가 생성되어 변환블록(25)에서 주파수 도메인으로 변환된다. 상기 주파수 도메인 신호는 합계블록(23)으로 전송되어 역양자화된 예측에러 신호와 가산된 주파수 도메인 신호가 된다. 그러므로 에러가 없는 데이터 전송 상태에서, 재구성된 주파수 도메인 신호는 실질적으로 주파수 도메인에서 원래 부호화된 신호에 대응한다. 이 주파수 도메인신호는 역변환블록(26)에서 역보정된 DCT변환의 수단에 의해 시간 도메인으로 변환된 디지털 오디오신호로서 출력된다. 이 신호는 디지털/아날로그 변환기(27)에서 아날로그신호로 변환되고 필요에 따라 증폭되고 알려진 방법으로 다른 추가 처리단계로 전송된다. 이것은 도 3에서 오디오 블록(32)에 의해 설명된다.

인코더(1)에서 형성된 비트스트링(501)이 주파수 도메인으로 변환된 원래 신 호의 값을 구성한다면 복호화는 바람직하게는 다음 방법으로 수행된다. 양자화된 주파수 도메인 변환값은 역양자화블록(22)에서 역양자화되고 합계블록(23)을 통하여 역변환블록(26)으로 전송된다. 역변환블록(26)에서 주파수영역 신호는 역보정된 DCT변환 수단에 의해 시간 도메인으로 변환된다. 필요하다면 이 신호는 디지털/아날로그 변환기(27)에서 아날로그신호로 변환된다.

도 2에서, 참조부호(A2)는 합계블록(23)으로의 제어정보의 전송을 설명한다. 이 제어정보는 상기 인코더의 로컬 디코더 기능과 관련하여 기술되는 것과 유사한 방법으로 사용되어 진다. 즉, 수신된 비트스트링(501)의 필드(502)내에서 제공된 부호화 방법정보가 비트스트링이 오디오신호 그 자체에서 유도된 양자화된 주파수 도메인값을 포함하는 것을 표시하면 합계블록(23)의 동작은 금지된다. 이것은 오디오신오의 양자화된 주파수 도메인값이 합계블록(23)을 통과하여 역변환블록(26)으로 가는 것을 허용한다. 반대로 수신된 비트스트링의 필드(502)로부터 검색된 부호화 방법정보가 오디오신호가 피치 예측기를 이용하여 부호화된 것을 표시하면, 합계블록(23)의 동작은 인에이블되어, 역양자환된 예측에러데이터가 변환블록(25)에 의해 생성된 예측된 주파수 도메인으로 표현된 신호가 합산되는 것을 허용한다.

도 3의 예에서, 전송장치는 무선통신장치(2)이고, 수신장치는 기지국(31)이며, 기지국(31)의 디코더(33)에서 무선통신장치(2)로부터 전송된 신호가 복호되며, 디코더(31)에서 아날로그신호는 공지된 방법으로 다음 처리단계로 전송된다.

현재의 실시예에서는 본 발명을 적용하는 가장 중요한 특징만이 존재하는 것은 명백하지만, 실제 응용예에서는 데이터전송 시스템은 또한 여기에 나타난 시스 템 이외의 기능을 포함한다. 단기간 예측과 같은 본 발명에 따른 부호화와 관련한 다른 부호화 방법을 이용하는 것 또한 가능하다. 더욱이, 본 발명에 따라 부호화된 신호를 전송할 때 다른 채널 부호화와 같은 다른 처리단계들이 수행될 수 있다.

시간 도메인에서 예측된 신호와 실제 신호 사이의 일치를 판단하는 것 또한 가능하다. 그러므로, 본 발명의 다른 실시예에서 상기 신호들을 변환블록들(6, 11)이 필수적으로 요구되지 않으며, 디코더의 변환블록(25)과 역변환블록(26) 뿐만 아니라 인코더의 역변환블록(19)도 요구되지 않는다. 그러므로 부호화 효율과 예측에러는 시간영역 신호에 따라 결정된다.

상술된 오디오신호 부호화/복호화 단계들은 이동통신 시스템, 위성 TV, 비디오 주문형 시스템 등과 같은 다른 종류의 데이터 전송 시스템에 적용될 수 있다. 예컨대, 오디오신호가 풀 듀플렉스로 전송되어지는 이동통신 시스템은 무선통신장치(2)와 기지국(31) 또는 그와 같은 것에서 인코더/디코더 한쌍을 요구한다. 도 3의 블록도에서 무선통신장치(2)와 기지국(31)의 대응하는 기능의 블록들은 주로 같은 참조번호로 표시된다. 인코더(1)와 디코더(33)가 도 3에서는 분리된 유닛으로 보이지만, 그것들은 실제 응용에서는 부호화와 복호화를 수행하는데 필요한 모든 기능들이 수행되는 소위 코덱이라는 하나의 유닛으로서 수행되어 진다. 오디오신호가 이동통신 시스템에서 디지털 포맷으로 전송되어지면, 각각의 아날로그/디지털 변환과 디지털/아날로그 변환은 기지국에서 필요로 하지 않는다. 그러므로, 이들 변환들은 공중전화망과 같은 다른 전화망에 이동통신망이 접속하기 위한 인터페이스와 무선통신 장치에서 수행된다. 그러나 이 전화망이 디지털 전화망이라면 상기 변환들이 상기와 같은 전화망에 접속된 예컨대 디지털전화(미도시)에서 이루어질 수도 있다.

상술되어진 부호화 단계들은 전송과 관련하여 필수적으로 수행되지는 않지만, 부호화된 정보가 차후의 전송을 위해 저장될 수 있다. 더욱이, 인코더에 인가되는 오디오신호는 반드시 실시간 오디오신호일 필요는 없으나 부호화된 오디오신호가 오디오신호보다 초기에 저장된 정보일 수 있다.

다음에서 본 발명의 바람직한 실시예에 따른 다른 부호화 단계들이 수학적으로 기술된다. 피치 예측기블록의 전달함수는 다음 형태를 갖는다.

여기서,

는 시간지연이며, b(k)는 피치 예측기의 계수이며, m1과 m2는 바람직하게는 다음 방법에서 오더(M)에 의존한다.

m1=(M-1)/2

m2 =M-m1-1

바람직하게는, 샘플들의 가장 좋은 대응되는 시퀀스(즉, 참조 시퀀스)는 최소제곱 방법을 사용하여 결정된다.

여기서, E는 에러이며, x()는 시간 도메인에서 입력신호이고,

()는 샘플들의 선행 시퀀스로부터 재구성된 신호이며, N은 검사된 프레임에서의 샘플수이다. 지연

는 변수를

과

으로 설정하고 수학식 2로부터 b를 산출함으로써 계산될 수 있다. 지연

를 산출하는 다른 방법은 공식을 이용함으로써 정규화된 상관방법을 사용하는 것이다.

샘플들의 가장 좋은 대응(참조)시퀀스가 발견되면, 지연블록(7)은 지연에 대한 즉, 오디오신호에서 샘플들의 대응 시퀀스가 얼마나 이르게 나타나는가에 대한 정보를 갖는다.

피치 예측기 계수 b(k)는 수학식 2로부터 각 오더(M)을 위해 계산될 수 있으며, 다음 수학식 4로 다시 나타낼 수 있다.

계수 b(k)에 대한 최적값은 b(k)에 대한 에러의 변화가 가능한 작은 계수가 되는 b(k)를 서치함으로써 결정될 수 있다. 이것은 b에 대한 에러관계의 부분 도함수를 0(∂E/∂b = 0)으로 설정함으로써 계산될 수 있다. 여기서, 다음 수학식 5가 유도된다.

즉,

상기 수학식은 매트릭스 포맷으로 쓰여질 수 있으며, 계수 b(k)는 매트릭스 수학식을 풀면 결정될 수 있다.

여기서,

본 발명에 따른 발명에 있어서, 종래의 기술에 따른 시스템보다 오디오신호의 주기성을 보다 효과적으로 이용하는 것이 목적이다. 상기 목적은 몇 개의 오더에 대한 피치 예측기 계수들을 계산함으로써 오디오신호 주파수에서의 변화에 대한 인코더의 적응성을 증가시켜 이루어 질 수 있다. 오디오신호를 부호화하는 데 이용되는 피치 예측기 순서는 예측에러를 최소화하고 부호화 효율을 최대로 하거나 예측에러와 부호화효율 간의 균형을 제공하기 위한 방법으로서 선택되어진다. 상기 선택은 어떠한 간격으로서 바람직하게는 각 프레임에 대하여 독립적으로 이루어진다. 그러므로 오더와 피치 예측기 계수는 프레임 대 프레임 기준으로 변할 수 있다. 이에 따라 본 발명에 의한 방법으로서, 고정된 오더를 이용하는 종래기술의 부호화 방법과 비교할 때 부호화의 유연성을 증가시키는 것이 가능하다. 더욱이, 본 발명에 따른 방법으로서, 주어진 프레임에 전송된 정보의 양(비트의 수)이 부호화의 수단에 의하여 감소될 수 없다면, 주파수 도메인으로 변환된 원래의 신호가 피치 예측기 계수와 에러 신호 대신에 전송될 수 있다.

본 발명은 전술한 실시예들에 한정되지 않고, 다른 측면에서도 한정되지 않지만, 첨부된 청구항들의 범위내에서 변형될 수 있다.

본 발명에 따른 방법에서 사용된 이전에 제공된 계산 절차는 디지털 신호 처리 유닛 또는 그와 유사한 것, 및/또는 하드웨어 도구 내에서 컨트롤러(34)의 프로그램 코드처럼 프로그램 형태로 편리하게 실행된다. 전술한 본 발명의 기반 위에서, 당업자는 본 발명에 따른 부호기(1)를 실행할 수 있기 때문에, 이와 관련하여 더 상세하게 부호기(1)의 다른 기능 블록들을 논할 필요가 없다.

상기 수신기에 상기 예측기 계수들을 전송하기 위해, 소위 룩업(look-up) 테이블들을 사용하는 것이 가능하다. 이와 같은 룩업 테이블에 있어서, 다른 계수 값들이 저장되는데, 여기서 상기 계수 대신에 룩업 테이블 내의 계수 인덱스가 전송된다. 룩업 테이블은 부호기(1)와 복호기(33) 모두에 공지이다. 수신 단계에서, 룩업 테이블을 사용함으로써 전송 인덱스의 기반에서 질문으로 피치 예측기 계수를 결정하는 것이 가능하다. 어떤 경우에 있어서, 룩업 테이블의 사용은, 피치 예측기 계수들의 전송에 비교될 때, 전송되는 비트의 수를 감소시킬 수 있다.

Claims

오디오 신호를 부호화하는 방법에 있어서,

- 부호화되는 오디오 신호의 일부분에 실질적으로 대응하는 상기 오디오 신호의 다른 부분을 발견하기 위해 상기 부호화되는 오디오 신호의 일부분을 검사하는 단계,

- 피치 예측기 오더들의 세트를 사용하는 상기 오디오 신호의 실질적인 대응 부분을 기반으로 하여 예측 신호들의 세트를 생성하는 단계를 구비하며,

상기 방법은,

- 상기 예측 신호들 각각에 대해 부호화 에러를 결정하고 최소의 상기 부호화 에러를 상기 예측 신호에 대해 부호화 효율을 결정하는 단계로서, 상기 결정된 부호화 효율 정보가 부호화 정보량이 상기 부호화가 상기 부호화되는 오디오 신호의 일부분을 기반으로 하여 수행되는 것보다 더 적은 것을 나타내면, 상기 부호화는 상기 최소 부호화 에러를 가지는 상기 예측 신호를 기반으로 하여 수행되는, 결정하는 단계;

상기 예측 신호들 각각에 대해 소정의 부호화 효율을 결정하고 상기 예측 신호들에 대해 부호화 에러를 결정하는 단계로서, 상기 결정된 부호화 효율 정보는 상기 부호화된 정보량이 상기 부호화되는 오디오 신호의 일부분을 기반으로 하여 부호화가 수행되는 것보다 작은 것을 나타내고, 상기 부호화는 상기 최소 부호화 에러를 제공하는 상기 예측 신호를 기반으로 하여 수행되는, 결정하는 단계;

상기 예측신호들 각각에 대해 부호화 효율을 결정하는 단계로서, 상기 결정된 부호화 효율 정보가 부호화 정보량이 상기 부호화되는 오디오 신호의 일부분을 기반으로 하여 상기 부호화가 수행되는 것보다 적은 것을 나타내면, 상기 부호화는 최고 부호화 효율을 제공하는 예측 신호를 기반으로 하여 수행되는, 결정하는 단계; 및

상기 예측 신호들 각각에 대해 부호화 효율을 결정하는 단계로서, 상기 부호화는 최고 부호화 효율을 제공하는 상기 예측 신호를 기반으로 하여 수행되는, 결정하는 단계 중 하나 이상을 더 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제1항에 있어서, 선택가능한 부호화 방법들은 상기 부호화되는 오디오 신호가 예측 신호를 기반으로 하여 부호화되는 방법을 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제2항에 있어서, 상기 선택가능한 부호화 방법들은 상기 부호화되는 오디오 신호가 상기 오디오 신호 자체를 기반으로 하여 부호화되는 방법을 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제3항에 있어서, 상기 부호화되는 오디오 신호의 일부분은 상기 오디오 신호의 주파수 스펙트럼을 결정하도록 주파수 도메인으로 변형되고,

각 예측 신호는 각 예측 신호의 주파수 스펙트럼을 결정하도록 주파수 도메인으로 변형되고,

상기 부호화 효율은 상기 오디오 신호의 주파수 스펙트럼 및 상기 예측 신호의 주파수 스펙트럼을 기반으로 하여 상기 최소 부호화 에러를 가지는 상기 예측 신호에 대해 결정되어지는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제4항에 있어서, 상기 부호화되는 오디오 신호의 일부분은 상기 오디오 신호의 주파수 스펙트럼을 결정하도록 주파수 도메인으로 변형되고,

각 예측 신호는 각 예측 신호의 주파수 스펙트럼을 결정하도록 주파수 도메인으로 변형되고,

상기 부호화 효율은 상기 오디오 신호의 주파수 스펙트럼 및 상기 예측 신호의 주파수 스펙트럼을 기반으로 하여 각 예측 신호에 대해 결정되는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제4항 또는 제5항에 있어서, 상기 예측 신호들은 상기 예측 신호들 각각에 대한 다른 예측 오더를 사용함으로써 형성되는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제4항 또는 제5항에 있어서, 상기 예측 신호들 각각에 대해 결정된 상기 예측 신호 에러 정보는 상기 오디오 신호의 주파수 스펙트럼과 상기 예측 신호의 주 파수 스펙트럼을 사용하는 것을 나타내는 차이 스펙트럼으로서 계산되는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제5항에 있어서, 상기 주파수 도메인으로의 변형은 수정된 DCT 변형을 사용하여 실시되는 것을 특징으로 하는 오디오 신호의 부호화 방법.
제1항, 제2항, 제3항, 제4항, 제5항, 또는 제8항 중 어느 한 항에 있어서, 상기 예측 신호의 부호화 정보(501)는 적어도 부호화 방법(502)과 관련한 데이터, 선택된 오더(504)와 관련한 데이터, 래그(lag)(505), 피치 예측기 계수들(506) 및 예측 에러와 관련한 데이터(507)를 포함하는 것을 특징으로 하는 오디오 신호의 부호화 방법.
오디오 신호를 부호화하기 위한 수단(16, 20)을 포함하는 인코더(1)에 있어서,

- 부호화되는 오디오 신호의 일부분에 실질적으로 대응하며 기준신호로서 선택되는 상기 오디오 신호의 다른 부분을 발견하기 위해 상기 부호화되는 오디오 신호의 일부분을 검사하기 위한 수단(7),

- 상기 기준신호를 기반으로 하여 예측 신호들의 세트를 생성하도록 피치 예측기 오더들의 세트를 사용하기 위한 수단(9, 10)을 구비하며,

상기 인코더는(1)는,

- 상기 예측 신호들 각각에 대해 부호화 에러를 결정하기 위한 수단 및 최소의 상기 부호화 에러를 상기 예측 신호에 대해 부호화 효율을 결정하기 위한 수단으로서, 상기 결정된 부호화 효율 정보가 부호화 정보량이 상기 부호화가 상기 부호화되는 오디오 신호의 일부분을 기반으로 하여 수행되는 것보다 더 적은 것을 나타내면, 상기 부호화하기 위한 수단은 상기 최소 부호화 에러를 가지는 상기 예측 신호를 기반으로 하여 수행되도록 적용되는, 결정하기 위한 수단;

- 상기 예측 신호들 각각에 대해 소정의 부호화 효율을 결정하기 위한 수단 및 상기 예측 신호들에 대해 부호화 에러를 결정하기 위한 수단으로서, 상기 결정된 부호화 효율 정보는 상기 부호화된 정보량이 상기 부호화되는 오디오 신호의 일부분을 기반으로 하여 부호화가 수행되는 것보다 작은 것을 나타내고, 상기 부호화하기 위한 수단은 상기 최소 부호화 에러를 제공하는 상기 예측 신호를 기반으로 하여 수행되도록 적용되는, 결정하기 위한 수단;

- 상기 예측신호들 각각에 대해 부호화 효율을 결정하기 위한 수단으로서, 상기 결정된 부호화 효율 정보가 부호화 정보량이 상기 부호화되는 오디오 신호의 일부분을 기반으로 하여 상기 부호화가 수행되는 것보다 적은 것을 나타내면, 상기 부호화하기 위한 수단은 최고 부호화 효율을 제공하는 예측 신호를 기반으로 하여 수행되도록 적용되는, 결정하기 위한 수단; 및

- 상기 예측 신호들 각각에 대해 부호화 효율을 결정하기 위한 수단으로서, 상기 부호화하기 위한 수단은 최고 부호화 효율을 제공하는 상기 예측 신호를 기반으로 하여 수행되도록 적용되는, 결정하기 위한 수단 중 하나 이상을 더 포함하는 것을 특징으로 하는 인코더.
제10항에 있어서, 상기 인코더(1)는 소정의 예측 신호를 기반으로 하여 상기 오디오 신호를 부호화하는 수단(4, 6-14)을 포함하는 것을 특징으로 하는 인코더.
제10항 또는 제11항에 있어서, 상기 인코더(1)는 상기 오디오 신호 자체를 부호화하는 수단(4, 6, 14)을 포함하는 것을 특징으로 하는 인코더.
제10항에 따른 인코더, 및

상기 부호화된 오디오 신호를 전송하기 위한 수단을 포함하는 것을 특징으로 하는 데이터 전송 시스템.
제13항에 있어서, 수신 디바이스에의 전송을 위해 비트 스트링(15)를 형성하기 위한 수단을 포함하며, 상기 비트 스트링은 적어도 상기 선택된 부호화 방법에 관한 정보를 포함하는 것을 특징으로 하는 데이터 전송 시스템.
제13항 또는 제14항에 있어서, 상기 오디오 신호를 프레임들로 분할하기 위한 수단을 포함하는 것을 특징으로 하는 데이터 전송 시스템.
제15항에 있어서, 이동 단말기를 포함하는 것을 특징으로 하는 데이터 전송 시스템.
제10항에 따른 인코더에서 부호화된 오디오 신호를 복호화하기 위한 디코더(33)에 있어서, 상기 디코더(33)는,

상기 부호화 방법 정보(502)의 기반에서 상기 수신된 정보가 상기 본래 오디오 신호를 기반으로 하여 형성된 것이었는지의 여부를 검사하기 위한 수단 및 부호화 페이즈(phase)에서 사용된 상기 피치 예측기 오더(M)를 검사하기 위한 수단을 포함하는 복호화되는 상기 오디오 신호의 부호화 방법을 결정하기 위한 수단과,

예측 오디오 신호와 관련한 정보를 수신하기 위한 수단(21)과, 상기 오디오 신호 자체를 기반으로 하여 형성된 상기 부호화된 정보를 사용하여 상기 오디오 신호를 복호화하기 위한 수단과, 상기 오디오 신호를 복호화하기 위한 상기 피치 예측기 오더를 선택하기 위한 수단, 및 상기 선택된 피치 예측기 오더(M)에 의한 예측을 수행함으로써 상기 오디오 신호를 복호화하기 위한 수단을 포함하는 상기 결정된 부호화 방법에 따라 상기 오디오 신호를 복호화하기 위한 수단을 포함하는 것을 특징으로 하는 디코더.
제17항에 있어서, 상기 디코더는 상기 수신된 정보로부터 적어도 선택된 오더(504)와 관련한 데이터, 래그(505), 적어도 한 피치 예측기 계수(506) 및 예측 에러 데이터(507)를 결정하기 위한 수단(21)을 포함하는 것을 특징으로 하는 디코더.
제18항에 있어서, 상기 디코더는 선택된 오더(504)와 관련한 상기 데이터와, 래그(505), 및 적어도 한 피치 예측기 계수(506)를 사용하여 소정의 예측 신호를 생성하는 수단(24, 28)을 포함하는 것을 특징으로 하는 디코더.
제18항 또는 제19항에 있어서, 상기 디코더는 상기 예측 신호와 예측 에러 데이터를 사용하여 소정의 재구성된 오디오 신호를 생성하기 위한 수단(23, 24, 28)을 포함하는 것을 특징으로 하는 디코더.
제17항에 있어서, 상기 오디오 신호 자체와 관련한 정보를 수신하기 위한 수단(21)을 포함하는 것을 특징으로 하는 디코더.
제21항에 있어서, 상기 디코더는 상기 오디오 신호 자체와 관련한 상기 수신된 정보를 사용하여 소정의 재구성된 오디오 신호를 생성하기 위한 수단(22, 23, 26)을 포함하는 것을 특징으로 하는 디코더.
제17항, 제18항, 제19항, 또는 제21항 중 어느 한 항에 있어서, 상기 부호화 페이즈에 사용되는 상기 피치 예측기 오더(M)의 데이터 표시(data indicative)는 상기 디코더에 저장되는 것을 특징으로 하는 디코더.
제10항에 따른 인코더에 의해 형성되는 정보를 전달하기 위한 데이터 구조(501)를 가진 데이터를 기록한 컴퓨터로 읽을 수 있는 기록매체 있어서,

상기 데이터 구조(501)는, 적어도

선택된 부호화 방법의 정보를 전달하기 위한 부호화 방법 필드(502);

선택된 오더의 정보를 전달하기 위한 오더 필드(504);

지연 정보를 전달하기 위한 지연 필드(505);

하나 이상의 피치 예측기 계수의 정보를 전달하기 위한 계수 필드(506); 및

예측 에러 정보를 전달하기 위한 에러 필드(507)를 포함하는 것을 특징으로 하는 컴퓨터로 읽을 수 있는 기록매체.
제7항에 있어서, 상기 주파수 도메인으로의 변형은 수정된 DCT 변형을 사용하여 실시되는 것을 특징으로 하는 오디오 신호의 부호화 방법.