KR20090086102A

KR20090086102A - 부호화 방법, 인코더, 및 컴퓨터로 판독 가능한 매체

Info

Publication number: KR20090086102A
Application number: KR1020097012209A
Authority: KR
Inventors: 데준 장; 량 장; 위에 랑; 팅홍 왕; 리숑 리; 웬하이 우; 웨이 샤오; 푸웨이 마; 제신 류
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2007-11-05
Filing date: 2008-09-16
Publication date: 2009-08-10
Also published as: JP5532304B2; ATE533147T1; US8600739B2; JP2013122612A; EP2110808B1; US20090248406A1; KR101211922B1; CN101303857A; EP2110808A1; CN100578619C; JP2010511901A; WO2009059513A1; EP2110808A4

Abstract

부호화 방법 및 인코더가 제공된다. 인코더는 입력 신호의 특성 파라미터를 취득하는데 사용되는 특성 파라미터 취득 유닛(101); 상기 특성 파라미터에 따라 상기 입력 신호의 유형을 결정하는데 사용되는 신호 유형 결정 유닛(102); 상기 특성 파라미터에 따라 양자화될 벡터를 생성하는데 사용되는 벡터 생성 유닛(103); 및 상기 신호 유형 결정 유닛(102)에 의해 결정된 상기 입력 신호의 유형에 따라, 상기 양자화될 벡터를 검색하기 위해 대응하는 코드북을 선택하는데 사용되는 판정 유닛(105)을 포함한다.

Description

부호화 방법, 인코더, 및 컴퓨터로 판독 가능한 매체 {A CODING METHOD, AN ENCODER AND A COMPUTER READABLE MEDIUM}

관련출원에 대한 상호참조

본 출원은, "CODING METHOD AND ENCODER"라는 명칭으로 2007년 11월 5일에 출원된 중국 특허출원 200710165784.3에 대해 우선권을 주장하며, 그 내용 전부는 인용에 의해 본 명세서에 포함된다.

본 발명은 벡터 부호화 기술에 관한 것으로, 더욱 구체적으로는 부호화 방법, 인코더, 및 컴퓨터로 판독 가능한 매체에 관한 것이다.

본 발명은 부호 여기 선형 예측(code exited linear prediction, CELP) 모델에 기초한 벡터 부호화 기술에서, 적응적 필터링(adaptive filtering) 후의 잔여 신호(residual signal)에 대해 양자화 부호화(quantization coding)를 수행하는 것은 매우 중요한 프로세스이다. 현재, 잔여 신호의 양자화 부호화는 흔히 고정 코드북 검색(fixed codebook search)에 의해 수행된다. 일반적으로 사용되는 고정 코드북은 대수 코드북(algebraic codebook)이다. 대수 코드북은 목표 신호(target signal)의 펄스 위치에 관심을 가지고, 펄스 진폭의 디폴트값을 1로 설정하여, 펄 스의 심볼 및 위치만 정량화되면 된다. 물론, 다수의 펄스가 동일 위치에 중첩되어 상이한 진폭을 나타낼 수 있다. 양자화 부호화에 대수 코드북을 채용하는 경우, 중요한 것은 목표 신호에 대응하는 최적 대수 코드북에서 펄스의 위치를 검색하는 것이다. 일반적으로, 펄스의 최적 위치(optimal position)를 검색할 때, 완전 검색(full search)(즉, 모든 가능한 위치 조합을 자세하게 검색)은 매우 복잡하므로, 차선 위치(sub-optimal position) 검색 알고리즘을 필요로 한다. 검색 결과의 품질 보증을 기초로, 검색 시간을 단축하고 계산 복잡도를 낮추는 방법이 부호화 기술에서 연구되고 해결되어야 할 주요 문제이다.

이하에, 대수 코드북에서 펄스 위치를 검색하는 2가지 기존의 차선 검색 방법에 대해 설명한다.

1. 심도 우선 트리 검색 절차(depth-first tree search procedure)

음성 서브프레임(speech sub-fraim)의 길이는 64이며, 검색될 펄스의 개수 N은 부호율(code rate)에 따라 변화한다. 다른 제한이 없다면, 64개의 위치에서 N개의 펄스를 검색하기 위한 계산은 매우 복잡하다. 그러므로, 대수 코드북에서의 펄스 위치는 제한되어 있고, 64개의 위치는 M개의 트랙으로 나뉘어져 있다. 표 1에 트랙을 나누는 전형적인 방법을 나타냈다.

[표 1]

표 1에서, "T0" 내지 "T3"은 4개의 트랙이고, "위치"는 각 트랙 상의 위치 번호이다. 표 1로부터 알 수 있듯이, 64개의 위치는 4개의 트랙으로 나뉘어져 있으며, 각 트랙은 16개의 위치를 가지고, 4개의 트랙 상의 펄스 위치는 서로 엇갈려 있어, 펄스 위치에 대한 각종 조합을 최대한 보증한다.

검색될 N개의 펄스는 일정한 수량 분포에 기초하여 M=4개 트랙 상에 제한되어 있다. 예를 들면, N=4이고 각 트랙 상에서 1개의 펄스가 검색된다. 다른 상황은 마찬가지로 추론할 수 있다.

T0 내지 T3에서 검색될 펄스가 각각 P0 내지 P3이라고 하자. 검색하는 동안, 예를 들면 T0-T1, T1-T2, T2-T3, 및 T3-T0와 같이, 2개의 인접한 트랙 상의 2개의 펄스는 동시에 검색되므로, 최종의 최적 코드북은 4 레벨 검색에 의해 취득된다. 자세한 프로세스는 도 1에 나타나 있으며, 다음과 같은 단계를 포함한다.

1) T0-T1 및 T2-T3 상에서 제1 레벨 검색을 수행한다. 먼저, P0 및 P1의 위치를 T0-T1 상에서 검색하는데, P0는 트랙 TO 상의 16개 위치 중 4개의 위치로부터 검색되고, 이 4개의 위치는 기지(旣知)의 기준 신호의 트랙 상의 극 값(extreme value)에 의해 결정되며, P1은 트랙 T1 상의 16개 위치로부터 검색된다. P0 및 P2의 최적 위치는 설정된 평가 표준(예를 들면, 비용 함수 Qk)에 따라 검색된 4×16개의 위치 조합으로부터 결정된다. 그 후, P2 및 P3의 위치를 T2-T3 상에서 검색하는데, P2는 트랙 T2 상의 16개 위치 중 8개의 위치로부터 검색되고, 이 8개의 위치는 기지의 기준 신호의 트랙 상의 극값에 의해 결정된다. 이로써, 이 레벨에 대한 검색 프로세스가 완료된다.

2) 제1 레벨 검색과 유사하게, T1-T2 및 T3-T0 상에서 제2 레벨 검색을 수행한다.

3) 마찬가지로, T2-T3 및 T0-T1 상에서 제3 레벨 검색을 수행하고, T3-T0 및 T1-T2 상에서 제4 레벨 검색을 수행한다.

4) 끝으로, 4 레벨 검색으로부터 최적의 결과를 최적 대수 코드북으로서 선택한다. 총 검색 횟수는 4×(4×16＋8×16)＝768회이다.

2. 전역 펄스 교체 절차(global pulse replacement procedure)

설명을 용이하게 하기 위하여, 전술한 알고리즘의 코드북 구조와 동일한 코드북 구조를 사용하고, 4개의 트랙 각각 상에서 1개의 펄스가 검색되며, T0 내지 T3 상에서 검색되는 펄스는 각각 P0 내지 P3이라고 가정한다. 상세한 프로세스는 다음의 단계들을 포함한다.

1) {P0, P1, P2, P3}={20, 33, 42, 7}로 가정되는, 초기 코드북을 결정한다. P1, P2, 및 P3은 변경 없이 그대로 유지하고, P0의 초기값 20을 트랙 T0 상의 다른 위치로 차례로 교체하여, 새로운 코드북 {0, 33, 42, 7}, {4, 33, 42, 7}, ... , {60, 33, 42, 7}을 취득한다. 설정된 평가 표준(evalution criterion)에 따라, 최적의 새로운 코드북을 선택한다. 예를 들면, 비용 함수의 최대 Qk 값을 가지는 새로운 코드북을 선택한다. 최대 Qk 값 및 대응하는 새로운 코드북, 예를 들면, {4, 33, 42, 7}을 기록한다.

2) 초기 코드북 내의 P0, P2, 및 P3은 변경 없이 그대로 유지하고(여기서, 초기 코드북은 여전히 원래의 초기 코드북, 즉 {20, 33, 42, 7}임에 유의하기 바람), 1)에서의 프로세스와 유사하게 P1의 초기값 33을 트랙 T1 상의 다른 위치로 차례로 교체하여, 최대 Qk 값 및 대응하는 새로운 코드북, 예를 들면 교체에 의해 {20, 21, 42, 7}을 취득한다.

3) P2 및 P3에 대하여 1) 및 2)와 유사한 프로세스를 수행하여, 최대의 Qk 값 및 대응하는 새로운 코드북을 취득한다.

4) 취득한 4개의 최대 Qk 값 중에서 최대값을 전역 최적값으로 선택하고, 대응하는 코드북, 예를 들면 {20, 21, 42, 7}을 이 라운드 검색의 최적 코드북으로서 제공한다.

5) 최적 코드북 {20, 21, 42, 7}을 새로운 라운드의 초기 코드북으로서 채택한 다음, 1) 내지 4) 프로세스를 반복하며, 이 사이클을 일반적으로 4회 수행하여 최종의 최적 코드북을 취득한다. 그러므로, 총 검색 횟수는 4×(4×16)＝256회이다.

기존의 각종 부호화 기술에 사용된 코드북 검색 알고리즘이 계산 복잡도 및 성능에 대한 요건을 충족시키는 것은 어렵다. 예를 들면, 심도 우선 트리 검색 알 고리즘은 각종 부호율 하의 원하는 음성 품질(speech quality)을 얻지만, 검색 횟수가 많으며, 계산 복잡도는 높다. 게다가, 전역 펄스 교체 알고리즘은 계산 복잡도는 낮지만, 국부 최대값이 생길 수 있어, 성능이 불안정하다, 즉 이 알고리즘은 어떤 신호 상태 하에서는 양호한 품질을 얻을 수 있지만, 다른 신호 상태 하에서는 원하는 품질을 얻을 수 없다.

따라서, 본 발명의 여러 실시예는 계산 복잡도를 낮추고 시스템 성능을 향상시킬 수 있는 부호화 방법, 인코더, 및 컴퓨터로 판독 가능한 매체를 제공한다.

부호화 방법은, 입력 신호의 특성 파라미터를 취득하는 단계; 상기 특성 파라미터에 따라 상기 입력 신호의 유형을 결정하는 단계; 상기 특성 파라미터에 따라 양자화될 벡터를 취득하는 단계; 및 상기 입력 신호의 유형에 대응하는 코드북 검색 알고리즘으로 양자화될 상기 벡터에 대해 코드북 검색을 수행하는 단계를 포함한다.

인코더는, 입력 신호의 특성 파라미터를 취득하도록 구성된 특성 파라미터 취득 유닛; 상기 특성 파라미터에 따라 상기 입력 신호의 유형을 결정하도록 구성된 신호 유형 결정 유닛(signal type determination unit); 상기 특성 파라미터에 따라 양자화될 벡터를 생성하도록 구성된 벡터 생성 유닛; 및 상기 신호 유형 결정 유닛에 의해 결정된 상기 입력 신호의 유형에 대응하는 코드북 검색 알고리즘으로, 상기 양자화될 벡터에 대해 코드북 검색을 수행하도록 구성된 판정 유닛(decision unit)을 포함한다.

컴퓨터로 판독 가능한 저장 매체는 컴퓨터 프로그램 코드를 포함한다. 상기 컴퓨터 프로그램 코드는 컴퓨터 유닛에 의해 실행되어, 컴퓨터 유닛은, 입력 신호의 특성 파라미터를 취득하고, 상기 특성 파라미터에 따라 상기 입력 신호의 유형을 결정하며, 상기 특성 파라미터에 따라 양자화될 벡터를 취득하고, 상기 입력 신호의 유형에 대응하는 코드북 검색 알고리즘으로, 상기 양자화될 벡터에 대해 코드북 검색을 수행할 수 있게 된다.

부호화 방법 또는 디바이스는 입력 신호의 다양한 유형에 따라 상이한 코드북 검색 알고리즘을 채택한다. 입력 신호의 특성에 따라 적절한 검색 알고리즘을 선택할 수 있기 때문에, 간단한 계산으로 만족스러운 결과를 얻을 수 있는 일정한 유형의 신호는 이들 신호 유형에 적합한 검색 알고리즘과 짝을 이룰 수 있고 계산 복잡도가 낮아, 보다 적은 시스템 자원으로 더욱 우수한 성능을 달성한다. 한편, 복잡한 계산을 필요로 하는 다른 유형의 신호는 더욱 정교한 검색 알고리즘으로 처리될 수 있으므로, 부호화 품질을 보증할 수 있다.

도 1은 종래기술의 심도 우선 트리 검색 절차의 개략도이다.

도 2는 본 발명의 실시예에 따른 부호화 방법의 흐름도이다.

도 3은 본 발명의 실시예에 따른 인코더의 논리 구조의 개략도이다.

도 4는 본 발명의 제1 실시예에 따른 코드북 검색 알고리즘의 흐름도이다.

도 5는 본 발명의 제2 실시예에 따른 코드북 검색 알고리즘의 흐름도이다.

도 6은 본 발명의 제3 실시예에 따른 코드북 검색 알고리즘의 흐름도이다.

도 7은 본 발명의 제4 실시예에 따른 코드북 검색 알고리즘의 흐름도이다.

도 8은 본 발명의 제5 실시예에 따른 코드북 검색 알고리즘의 흐름도이다.

본 발명의 실시예에서는, 입력 신호의 다양한 유형에 따라 상이한 코드북 검색 알고리즘을 선택할 수 있는 부호화 방법을 제공한다. 또한 본 발명의 실시예에서는 이 부호화 방법을 사용하는 인코더를 제공한다. 이하에, 본 발명의 실시예의 방법 및 디바이스에 대해 각각 설명한다.

도 2를 참조하면, 본 발명의 실시예의 부호화 방법은 다음의 단계를 포함한다.

단계 1에서, 입력 신호의 특성 파라미터를 취득한다.

본 실시예에서, 부호화를 위한 입력 신호는 CELP 모델에 기초한 적응적 필터링 후의 잔여 신호는 물론 벡터 양자화 부호화에 적용 가능한 다른 유사한 음성(speech) 신호 또는 음악 톤 신호일 수 있다. 여기서, 특성 파라미터는 일정한 면(aspect)에서 입력 신호의 특성을 기술하도록 된 데이터이다. 특성 파라미터는 프레임 내에서 분석 및 추출되고, 실제의 요건 및 신호 특성에 따라 프레임 사이즈가 선택된다.

특성 파라미터에는 선형 예측 계수(linear prediction coefficient, LPC), 선형 예측 셉스트럼 계수(linear prediction cepstrum coefficient, LPCC), 피치 주기 계수(pitch period coefficient), 프레임 에너지, 및 평균 영교차율(average zero-crossing rate)이 포함되지만, 이에 한정되지 않는다.

단계 2에서, 입력 신호의 특성 파라미터에 따라 입력 신호의 유형을 결정한다.

입력 신호의 유형이 결정할 때, 일정한 면에서 입력 신호의 특성을 각각 반영하는 특성 파라미터는 여러 유형이 있기 때문에, 입력 신호는 상이한 결정 방법에 기초하여 분류될 수 있는데, 예를 들면 상이한 특성 파라미터 또는 특성 파라미터의 조합에 기초하거나, 특성 파라미터에 대해 상이한 임계값을 설정함으로써 분류될 수 있으며, 본 실시예에서는 이에 한정되지 않고 실제 요건에 따라 설정될 수도 있다.

신호 유형의 분류는 후속하는 검색 알고리즘 선택에 밀접하게 관련되어 있기 때문에, 적용 가능한 분류 방식은 후보 검색 알고리즘의 특성에 따른 분류 및 분류 표준을 참조함으로써 구체적인 특성 파라미터를 결정하는 것이다.

예를 들면, 계산 복잡도가 낮은 알고리즘은 주기적인 특성(periodic characteristic)이 있는 입력 신호의 처리에 적합한데, 그 이유는 이 유형의 신호에 대해 최적 펄스의 위치를 결정하는 것이 상대적으로 용이하기 때문이다. 이로써 시스템 성능에 두드러지게 영향을 미치지 않으면서 복잡도를 효과적으로 낮출 수 있다. 계산 복잡도가 높은 알고리즘은 백색 잡음 특성(white noise characteristic)이 있는 입력 신호의 처리에 적합한데, 그 이유는 이 유형의 신호에 대해 최적 펄스의 위치를 결정하는 것이 어렵기 때문에, 고품질의 알고리즘을 사용하여 부호화 품질을 보증할 수 있기 때문이다.

그러므로, 입력 신호의 주기적인 특성을 반영하는 특성 파라미터는 분류를 위한 기준(reference)으로 채택될 수 있으며, 입력 신호의 유형은 주기적인 특성이 있는 유형과 백색 잡음 특성이 있는 유형으로 분류된다. 이와 같이, 주기적 특성이 있는 신호는 복잡도가 낮은 검색 알고리즘에 의해 처리되고, 백색 잡음 특성이 있는 신호는 복잡도가 높은 검색 알고리즘에 의해 처리된다.

물론, 입력 신호의 다른 특성을 반영하는 특성 파라미터도 분류를 위한 보조적인 기준으로서, 또는 분류를 더욱 세분하기 위해 채용될 수 있다. 이하에 설명을 위한 예로서 분류 및 결정 방법이 주어진다.

입력 신호는 4개의 상이한 프레임 유형, 즉 무성음 프레임(unvoiced frame), 유성음 프레임(voiced frame), 일반 프레임(general frame), 및 과도 프레임(transition fram)으로 분류될 수 있다. 유성음 프레임 및 과도 프레임은 하나의 유형으로 통합될 수 있다. 무성음 프레임과 일반 프레임은 백색 잡음 특성이 있는 유형에 속하고, 유성음 프레임과 과도 프레임은 주기적인 특성이 있는 유형에 속한다.

피치 주기 계수, 예를 들면, 평균 진폭 차함수(average magnitude difference function, AMDF)를 채용하여 입력 신호의 주기적인 특성을 평가하여, 주기적인 특성이 있는 유형과 백색 잡음 특성이 있는 유형을 예비적으로 구별할 수 있다. 물론, 결정을 위해 평균 영교차율을 단독으로 또는 보조로 사용할 수 있으며, 일반적으로 주기적인 신호의 평균 영교차율은 백색 잡음 신호의 평균 영교차율보다 작다.

백색 잡음 특성이 있는 유형에서는, 프레임 에너지를 사용하여 무성음 프레 임과 일반 프레임을 결정할 수 있다. 일반적으로, 무성음 프레임의 프레임 에너지는 일반 프레임의 프레임 에너지보다 낮으며, 결정을 위해 임계값을 설정할 수 있다.

주기적 특성이 있는 유형에서는, AMDF를 다시 분석하여 유성음 프레임과 과도 프레임을 구별할 수 있거나, 구별을 위해 평균 영교차율의 세분된 값 범위를 사용한다. 물론, 유성음 프레임과 과도 프레임이 하나의 유형으로 통합되면 세분은 불필요하다.

상기한 분류 및 결정 방법은 단지 예이며, 실제의 요건 및 신호 특성에 따라 적절한 특성 파라미터와 결정 시퀀스를 선택할 수 있다. 예를 들면, 분류는 먼저 프레임 에너지에 따라 이루어지고, 그 후 구조적인 특성 파라미터에 의해 세분된다.

단계 3에서, 입력 신호의 특성 파라미터에 따라 양자화될 벡터를 생성한다.

이 단계는 종래기술과 마찬가지 방식으로 실행될 수 있다. 또한, 단계 3은 시퀀스상 단계 2와 논리적으로 연관이 없어, 단계 2 전/후에 수행될 수 있거나 단계 2와 병렬로 수행될 수 있다.

단계 4에서, 입력 신호의 결정된 유형에 따라 대응하는 코드북 검색 알고리즘으로 양자화될 벡터에 대하여 코드북 검색을 수행한다.

코드북 검색 알고리즘은 신호의 특성을 충족하도록, 입력 신호의 유형의 분류에 따라 구성된다.

예를 들면, 단계 2에 기초한 신호 분류 방법은 다음의 기능을 가진다.

복잡도가 높고 성능이 우수한 코드북 검색 알고리즘, 예를 들면, 랜덤 코드북 검색 알고리즘 또는 본 발명의 배경기술에서 설명한 심도 우선 트리 검색 알고리즘이 무성음 프레임 신호를 처리하도록 구성된다.

복잡도가 낮은 코드북 검색 알고리즘은, 예를 들면, 펄스 위치 교체, 특히 본 발명의 배경기술에서 설명한 전역 펄스 교체 알고리즘에 기초하여, 유성음 프레임 및/또는 과도 프레임 신호를 처리하도록 구성된다. 물론, 유성음 프레임과 과도 프레임이 2개의 상이한 유형의 신호로 다시 분류되면, 이 2개의 프레임 또한 상이한 코드북 검색 알고리즘으로 처리될 수 있다.

코드북 검색 알고리즘을 선택한 후, 결정된 코드북 검색 알고리즘으로 양자화될 벡터에 대하여 코드북 검색을 수행한다.

본 발명의 실시예에서 전술한 부호화 방법을 구현하는 인코더에 대해 이하에 설명한다. 도 3을 참조하면, 인코더는 특성 파라미터 취득 유닛(101), 신호 유형 결정 유닛(102), 벡터 생성 유닛(103), 2개 이상의 코드북 검색 유닛(104), 및 판정 유닛(105)을 포함한다.

특성 파라미터 취득 유닛(101)은 입력 신호의 특성 파라미터를 취득하도록 구성되어 있다.

신호 유형 결정 유닛(102)은 입력 신호의 유형을 특성 파라미터 취득 유닛(101)에 의해 제공되는 특성 파라미터에 따라 결정하도록 구성되어 있다.

벡터 생성 유닛(103)은 특성 파라미터 취득 유닛(101)에 의해 제공되는 특성 파라미터에 따라 양자화될 벡터를 생성하도록 구성되어 있다.

2개 이상의 코드북 검색 유닛(예를 들면, 본 실시예에서는 코드북 검색 유닛 1 내지 n이 제공되며, 도 3에 동일하게 도면부호 104로 나타낸다)은 상이한 코드북 검색 알고리즘을 제공하도록 구성되어 있다(예를 들면 코드북 검색 유닛 1은 심도 우선 트리 검색 알고리즘을 제공하고, 코드북 검색 유닛 2는 펄스 위치 교체에 기초한 코드북 검색 알고리즘을 제공한다).

판정 유닛(105)은 대응하는 코드북 검색 알고리즘을 선택하도록 구성되고(예를 들면, 본 실시예에서는 코드북 검색 유닛(104)이 선택된다), 신호 유형 결정 유닛(102)에 의해 결정된 입력 신호의 유형에 따라 선택된 코드북 검색 알고리즘으로, 벡터 생성 유닛(103)에 의해 생성된 양자화될 벡터에 대해 코드북 검색을 수행한다. 예를 들면, 입력 신호의 유형이 주기적인 특성이 있는 유형으로 판정 유닛(105)이 판정하면, 코드북 검색 유닛 2가 코드북 검색을 수행하기 위해 선택되고, 입력 신호의 유형이 백색 잡음 특성이 있는 유형으로 판정 유닛(105)이 판정하면, 코드북 검색 유닛 1이 코드북 검색을 수행하기 위해 선택된다.

유의할 것은, 본 실시예에서 2개의 코드북 검색 유닛이 선택적이고, 그렇다면, 판정 유닛은 대응하는 코드북 검색 알고리즘을 선택하고 신호 유형 결정 유닛에 의해 결정된 입력 신호의 유형에 따라 선택된 알고리즘으로 양자화될 벡터에 대해 코드북 검색을 수행하도록 구성되어 있다는 것이다.

방법 실시예에서 설명한 상기 신호 분류의 예에 기초하면, 신호 유형 결정 유닛(102)에 의해 결정된 입력 신호의 유형에는 주기적인 특성이 있는 유형과 백색 잡음 특성이 있는 유형이 포함된다.

코드북 검색 유닛(104)은 제1 클래스 코드북 검색 유닛과 제2 클래스 코드북 검색 유닛을 포함하고, 제1 클래스 코드북 검색 유닛에 의해 제공되는 코드북 검색 알고리즘의 계산 복잡도는, 제2 클래스 코드북 검색 유닛에 의해 제공되는 코드북 검색 알고리즘의 계산 복잡도보다 낮다. 판정 유닛(105)은 주기적인 특성이 있는 유형에 따라 제1 클래스 코드북 검색 유닛을 선택하고, 백색 잡음 특성이 있는 유형에 따라 제2 클래스 코드북 검색 유닛을 선택하도록 구성된다.

또한, 본 방법 실시예에서 설명한 상기한 예의 신호 분류에 기초하여, 신호 유형 결정 유닛(102)에 의해 결정된 백색 잡음 특성이 있는 유형에는 무성음 프레임과 일반 프레임이 포함되고, 동일한 신호 유형 결정 유닛(102)에 의해 결정된 주기적인 특성이 있는 유형에는 유성음 프레임 및/또는 과도 프레임이 포함된다.

코드북 검색 유닛(104) 내의 제2 클래스 코드북 검색 유닛은 랜덤 코드북 검색 유닛과 심도 우선 검색 유닛을 포함한다. 랜덤 코드북 검색 유닛은 랜덤 코드북 검색 알고리즘을 제공하도록 구성되어 있고, 심도 우선 검색 유닛은 심도 우선 트리 검색 알고리즘을 제공하도록 구성되어 있다. 코드북 검색 유닛(104) 내의 제1 클래스 코드북 검색 유닛은 펄스 위치 교체에 기초하여 코드북 검색 알고리즘을 제공하도록 구성된 펄스 교체 검색 유닛을 포함한다.

판정 유닛(105)은 일반 프레임 및/또는 무성음 프레임에 따라 심도 우선 검색 유닛을 선택하고, 유성음 프레임 및/또는 과도 프레임에 따라 펄스 교체 검색 유닛을 선택하도록 구성되어 있다.

본 발명의 실시예에서 전술한 부호화 방법 또는 디바이스는 입력 신호의 여 러 유형에 따라 상이한 코드북 검색 알고리즘을 채용한다.

입력 신호의 모든 가능한 구조적 특성에 따라 적절한 검색 알고리즘을 선택할 수 있으므로, 간단한 계산에 의해 만족스러운 결과를 얻을 수 있는 일정한 유형의 신호는, 보다 적은 시스템 자원으로 보다 우수한 성능을 달성하도록, 이들 신호 유형에 적합하고 계산 복잡도가 낮은 검색 알고리즘과 짝을 이룰 수 있다. 한편, 복잡한 계산을 필요로 하는 다른 유형의 신호는 더욱 정교한 검색 알고리즘에 의해 처리될 수 있으며, 이로써 부호화 품질을 보증할 수 있다.

더욱 우수한 부호화 성능을 제공하기 위하여, 펄스 위치 교체에 기초한 코드북 검색 알고리즘에 대해 이하에 설명한다. 이 알고리즘은, 복잡도는 낮지만 성능은 우수하며, 본 발명의 부호화 기술에 적용 가능하다.

도 4는 본 발명의 제1 실시예에 따른 코드북 검색 알고리즘을 나타내며, 다음의 단계들을 포함한다.

단계 A1에서, 기본 코드북(basic codebook)을 취득한다. 이 기본 코드북은 M개 트랙 상의 N개 펄스에 관한 위치 정보를 포함하고, N, M은 양의 정수이다.

여기서, 기본 코드북은 1 라운드의 검색에서 베이스로 기능하는 초기 코드북(initial codebook)이다. 일반적으로 대수 코드북에서 펄스 위치를 검색하기 전에, 각 트랙 상에서 검색될 펄스의 수량 분포가 비트율과 같은 정보에 따라 결정되었다.

예를 들면 음성 양자화 부호화에 펄스 검색을 채택하면, 표 1에 나타낸 방법에 따라 64개의 위치가 M=4개 트랙, 즉 T0, T1, T2, 및 T4로 분할되고, 상이한 비 트율에 기초하여, 펄스의 수량 분포는 다음일 수 있다: N=4이고, 각 트랙에서 1개의 펄스가 검색되고; N=8이고, 각 트랙에서 2개의 펄스가 검색되고; 또는 N=5이고, TO, T1, 및 T2에서 각각 1개의 펄스가 검색되고, T3에서 2개의 검색될 수 있다.

M개 트랙 상의 N개 펄스의 수량 분포가 결정된 후, 기본 코드북이 취득된다, 즉 각 트랙 상의 각 펄스의 초기 위치가 취득된다. 각 펄스의 초기 위치는 여러 방법으로 결정될 수 있으며, 본 발명의 코드북 검색 알고리즘에 한정되지 않는다. 예를 들면, 몇 가지 방법을 이하에 설명한다.

1) 트랙 상의 펄스의 임의 위치를 펄스의 초기 위치로서 임의로 선택한다.

2) 각 트랙 상의 기지의 기준 신호의 수개의 극값에 따라, 대응하는 트랙 상의 각 펄스의 위치를 결정한다.

3) 일정한 계산 방식에 의해(즉, 기본 코드북을 사용하여) 각 펄스의 초기 위치를 취득한다.

또, 선택적인 기준 신호는 "펄스 위치 최대 우도 함수(pulse position maximum likelihood function)"(펄스 진폭 선택 신호라고도 함)이다. 이 함수는 아래와 같이 표현된다:

위 식에서, d(i)는 대량화될 목표 신호에 의해 결정된 각 차원에서의 벡터 신호 d의 성분이고, 전형적으로 목표 신호의 콘벌루션(convolution)과 사전 필터링 가중 합성 필터(pre-filtered weighted synthesis filter)의 펄스 응답이며; r_LTP(i)는 각 차원에서의 잔여 신호 r의 장기 예측 성분이고; a는 비례 계수이며, 기준 신호 d(i)의 의존도를 제어하고 상이한 비트율에 따라 값이 변화한다. 64개 위치 상의 상이한 b(i)의 값을 계산할 수 있으며, T0 내지 T3 상에서 b(i)의 값이 최대인 위치를 펄스의 초기 위치로서 선택한다.

단계 A2에서, n개의 펄스를 검색 펄스로서 선택한다. n개의 펄스는 N개의 펄스의 일부이며, n은 N보다 작은 양의 정수이다. 구체적으로 다음과 같이 구현된다: Ns개의 펄스로부터 n개의 펄스를 검색 펄스로서 선택하고(여기서 Ns개의 펄스는 N개의 펄스 전부 또는 일부이고 N 이하의 양의 정수이며, n은 Ns보다 작은 양의 정수이다); 기본 코드북에서 n개의 검색 펄스 이외의 펄스의 위치를 고정하고, n개의 검색 펄스의 위치를 트랙 상의 다른 위치로 각각 교체하여 검색 코드북을 취득한다.

검색 펄스로서 선택될 수 있는 펄스는 N개의 펄스 전부 또는 단지 그 일부일 수 있으며, "검색 펄스로서 선택될 수 있는 펄스"는 "Ns 집합"을 형성한다. 어떤 의미에서, N개의 펄스가 Ns 집합에 속하지 않는 펄스를 포함하면, 이들 펄스의 위치는 이미 최적이므로 더 이상 검색될 필요가 없다.

n개의 펄스는 Ns개의 펄스로부터 다양한 방법으로 선택될 수 있으며, 본 실시예의 코드북 검색 알고리즘에 한정되지 않는다. 예를 들어, 다음과 같은 몇 가지 방법을 설명한다:

1) n의 값 및 검색 펄스의 조합을 임의로 선택한다.

Ns 집합이 모두 3개의 펄스, 즉 P0, P1, 및 P2를 가진다고 가정하면, 가능한 조합은, n=1, P1을 검색 펄스로 취하는 것; n=2, P0 및 P1을 검색 펄스로 취하는 것; n=2, P1 및 P2를 검색 펄스로 취하는 것 등을 포함한다.

2) n의 값을 n≥2로 결정하고, 검색 펄스의 조합을 임의로 선택한다.

Ns 집합이 모두 4개의 펄스, 즉 P0, P1, P2, P3을 가지고, n=3이라고 가정하면, 가능한 조합은 P0, P1, P2; P0, P2, P3; P0, P1, P3; 및 P1, P2, P3을 포함하고, 이 각각은 검색 펄스로서 사용된다.

검색 펄스의 조합을 선택한 후, 기본 코드북 내의 n개 검색 펄스의 대응하는 위치를, 검색 펄스가 위치된 트랙 상의 다른 위치로 교체하여 검색 코드북을 취득한다.

기본 코드북이 모두 4개의 펄스, 즉 P0, P1, P2, P3을 가지고, 각각이 M=4개 트랙, 즉 T0, T1, T2, T3 상에 위치되어 있고, 1개의 펄스가 각 트랙 상에서 검색된다고 가정한다. 검색 프로세스에서 선택된 펄스가 P2, P3이면, 기본 코드북에서 P0, P1의 위치는 고정되어 있고, P2의 위치들은 T2 상의 다른 위치들(예를 들면, 총 t2개의 위치)로 각각 교체되며, P3의 위치들은 T3 상의 다른 위치들(예를 들면, 총 t3개의 위치)로 각각 교체되며, 모두 (t2＋1)×(t3＋1)－1=t2×t3＋t2＋t3개의 검색 코드북이 취득된다. 유의할 것은, 검색되는 트랙 상의 교체에 사용된 위치들은 트랙 상의 모든 위치, 또는 예를 들면, 기지의 기준 신호의 값에 따라 검색되는 트랙으로부터 교체를 위하여 선택되는 위치 중 일부일 수 있다.

단계 A3에서, 단계 A2의 검색 프로세스를 1 라운드에 K회 실행하고, K는 2이 상의 양의 정수이다. 2개 이상의 검색 펄스를 하나 이상의 검색 프로세스에서 선택하는데, 각각의 검색 프로세스에서 선택한 검색 펄스는 완전히 동일하지 않다.

단계 A2에서, 사이클링 횟수 K는 구체적으로 설정된 상한값일 수 있으며, 1라운드의 검색은 검색 프로세스가 K회 수행된 때에 완료된다.

또한, 본 발명의 실시예는 K 값을 반드시 한정할 필요는 없다. 즉, K 값은 결정되어 있지 않으며, 1 라운드의 검색이 완료되었는지는 일정한 검색 종료 조건에 따라 결정된다. 예를 들면, 선택된 검색 펄스들이 Ns 집합을 모두 편력(traverse)하였으면, 1 라운드의 검색이 완료된 것으로 결정된다. 물론, 위의 2가지 방법도 통합될 수 있다. 즉, 1 라운드의 검색이 종료되었는지는, 검색 종료 조건이 충족되었는지에 대한 사실에 의해 결정되며, 검색 횟수는 설정된 K의 상한값을 초과할 수 없다. K의 값이 상한값에 도달하면, 검색 종료 조건이 충족되지 않더라도 1 라운드의 검색이 완료된 것으로 간주한다. 구체적인 규칙은 실제 요건에 따라 설정될 수 있으며, 본 실시예의 코드북 검색 알고리즘으로 한정되지 않는다. 검색 결과 내의 펄스들 사이의 연관 관계를 나타내기 위하여, 본 실시예의 코드북 검색 알고리즘은 K회의 검색 프로세스 중 1회 이상이 2개 이상의 펄스에 대해 수행될 것을 요구하며, 선택된 검색펄스는 동일한 트랙 또는 상이한 트랙 상에 분포될 수 있다.

단계 A4에서, 설정된 평가 표준에 따라 기본 코드북 및 검색 코드북으로부터 이 라운드의 최적 코드북을 선택한다.

검색 코드북 및 기본 코드북의 비교 및 평가 프로세스는 단계 A2에서의 검색 프로세스와 동시에 실행될 수 있다. 예를 들면, "우선 코드북(preferred codebook)"을 설정한 후 기본 코드북으로 초기화한다. 그 후, 검색 코드북을 취득하고 평가를 위하여 현재의 우선 코드북과 비교한다. 검색 코드북이 우선 코드북보다 우수한 것으로 판정되면, 현재의 우선 코드북은 검색 코드북으로 교체된다. 위의 프로세스는 K회의 검색이 모두 완료될 때까지 반복되며, 최종적으로 취득된 우선 코드북은 이 라운드의 최적 코드북이다. 유의할 것은, 각 검색 프로세스는 기본 코드북에 기초하고, 우선 코드북만이 비교 평가된다는 것이다.

K회의 검색 프로세스의 결과는 또한 총괄하여 평가될 수도 있다. 예를 들면, 각각의 검색 프로세스 후에 취득된 우선 코드북을 저장하고, K개의 우선 코드북을 비교하여 이 라운드의 최적의 코드북을 선택한다.

검색 코드북과 기본 코드북의 비교 및 평가 표준은 실제 요건에 따라 결정되며, 본 실시예의 코드북 검색 알고리즘으로 한정되지 않는다. 예를 들면, 통상 대수 코드북의 품질을 측정하도록 구성된 비용 함수(Qk)를 비교를 위해 채용할 수 있다. 일반적으로 Qk 값일 클수록 코드북 품질이 더 우수할 것이므로, Qk 값이 더 큰 코드북이 우선 코드북으로 선택될 수 있다.

도 5는 제1 실시예 기초한, 본 발명의 제2 실시예에 따른 코드북 검색 알고리즘을 나타내며, 다음과 같은 단계를 포함한다.

단계 B1에서, 기본 코드북을 취득한다. 기본 코드북은 M개의 트랙 상의 N개의 펄스에 관한 위치 정보를 포함하며, N, M은 양의 정수이다.

이 단계는 코드북 검색 알고리즘의 제1 실시예의 단계 A1에 따라 수행될 수 있다.

단계 B2에서, n=n0개 검색 펄스를 Ns개의 펄스로부터 선택하는데, Ns의 정의는 코드북 검색 알고리즘의 제1 실시예에서와 동일하며; n0는 2 이상이고, 현재 라운드의 검색 중에 변화되지 않고 유지되고; n0개의 검색 펄스는, 중복되지 않게 총

개의 가능한 조합 중에서 선택된 오직 1개의 조합이다.

Ns 집합은 모두 4개의 펄스, 즉 P0, P1, P2, P3를 가지고, 각각은 M=4개 트랙 , 즉 T0, T1, T2, T3 상에 있으며, 1개의 펄스가 각 트랙 상에서 검색된다고 가정하자. n=n0=2로 결정되고, Ns 집합으로부터 2개의 검색 펄스가 선택되면, P0, P1; P0, P2; P0, P3; P1, P2; P1, P3; 및 P2, P3을 포함하는, 모두

개의 조합이 있다. 검색 펄스는 6개의 조합으로부터 임의로 또는 순차로 선택될 수 있다. 매번 중복되지 않게 선택하기 위하여, 검색 펄스는 조합의 변경 규칙에 따라 순차로 선택되거나; 또는 모든 조합이 차례로 저장되거나 번호가 부여될 수 있으며, 선택된 조합(또는 번호)은 그 후 삭제된다.

단계 B3에서, 1 라운드에 단계 B2의 검색 프로세스를 K회 수행하며,

이다. 하나 이상의 검색 프로세스에서 2개 이상의 검색 펄스를 선택하는데, 각각의 검색 프로세스에서 선택한 검색 펄스는 완전히 동일하지 않다.

n의 값이 고정되어 있기 때문에, 매번 선택되는 검색 펄스의 조합은 중복되지 않으며, 많아야

회의 검색이면 Ns 집합 내의 모든 가능한 조합을 편력할 수 있다. 물론, K의 상한값은

보다 낮게 제한되고, 이때는 모든 가능한 조합을 편력하는 것이 아니지만, 선택된 검색 펄스는 여전히 Ns 집합을 편력할 수 있다.

단계 B4에서, 이 라운드의 최적 코드북을 설정된 평가 표준에 따라 기본 코드북 및 검색 코드북으로부터 선택한다.

이 단계는 코드북 검색 알고리즘의 제1 실시예의 단계 A4에 따라 수행될 수 있다.

도 6은 본 발명의 제3 실시예에 따른 코드북 검색 알고리즘을 나타내며, 코드북 검색 알고리즘의 제1 실시예 및 제2 실시예에 기초하여 다수의 라운드를 반복하여 수행할 수 있는 방법을 제공한다. 이 방법은 다음의 단계들을 포함한다.

단계 C1에서, 기본 코드북을 취득한다. 기본 코드북은 M개 트랙 상의 N개 펄스에 관한 위치 정보를 포함하고, N, M은 양의 정수이다.

단계 C2에서, Ns=N이고, 1 라운드에 K회의 검색 프로세스를 수행하여 이 라운드의 최적 코드북을 취득한다.

이 단계는 코드북 검색 알고리즘의 제1 실시예의 단계 A2 내지 A4에 따라, 또는 코드북 검색 알고리즘의 제2 실시예의 단계 B2 내지 B4에 따라 수행될 수 있다. Ns=N이므로, 검색 펄스는 기본 코드북의 모든 펄스로부터 선택될 수 있다. 코드북 검색 알고리즘의 제2 실시예의 방법에 대하여 말하면, 상이한 라운드에서 결정된 N의 값은 동일 또는 상이할 수 있다.

단계 C3에서, 검색의 라운드 수 G가 설정된 G의 상한값에 도달하였는지를 결정하고, 도달하였으면 단계 C5를 수행하고; 도달하지 않았으면 단계 C4를 수행한다.

단계 C4에서, 최적의 코드북이 원래의 기본 코드북을 대체하여 새로운 기본 코드북으로 사용되고, 프로세스는 단계 C2로 돌아가 새로운 라운드의 최적 코드북에 대한 검색을 계속한다.

단계 C5에서, 이 라운드의 최적 코드북을 취득하여 최종의 최적 코드북으로 사용한다.

도 7은 본 발명의 제4 실시예에 따른 코드북 검색 알고리즘을 나타내며, 코드북 검색 알고리즘의 제1 실시예 및 제2 실시예에 기초하여 다수의 라운드를 반복하여 수행할 수 있는 다른 방법을 제공한다. 이 방법은 다음의 단계를 포함한다.

단계 D1에서, 기본 코드북을 취득한다. 기본 코드북은 M개 트랙 상의 N개 펄스에 관한 위치 정보를 포함하고, N, M은 양의 정수이다.

단계 D2에서, 1 라운드에 K회의 검색 프로세스를 수행하여 이 라운드의 최적의 코드북을 취득한다.

이 단계는 코드북 검색 알고리즘의 제1 실시예의 단계 A2 내지 A4에 따라, 또는 코드북 검색 알고리즘의 제2 실시예의 단계 B2 내지 B4에 따라 수행될 수 있다. 제1 라운드에서, Ns=N으로 설정된다.

단계 D3에서, 검색의 라운드 수 G가 설정된 G의 상한값에 도달하였는지 또는 다음 라운드의 Ns 집합이 비어(null) 있는지를 판정하고, 그렇다면 단계 D5를 수행하고; 그렇지 않으면 단계 D4를 수행한다.

본 실시예의 코드북 검색 알고리즘에서, 각 라운드의 Ns 집합은 이전 라운드의 검색 결과에 따라 결정되고, 구체적인 구현은 단계 D4에 나타나 있다. Ns 집합이 비어 있으면, 검색이 완료된 것으로 간주한다. 또한 Ns 집합이 비어 있지 않은 경우, 검색의 완료 여부는 설정된 G의 상한값에 따라 결정될 수도 있다.

단계 D4에서, 최적의 코드북 내에서 고정된 위치에 있고 원래의 Ns개 펄스 중에 속하는 펄스를 취득하여 새로운 Ns개의 펄스로 사용하기 위하여, 최적의 코드북이 원래의 기본 코드북을 대체하여 새로운 기본 코드북으로 사용된다. 그 후, 프로세스는 단계 D2로 돌아가 새로운 라운드의 최적 코드북 검색을 계속한다.,

제1 라운드의 검색에서 Ns=N=4이고, Ns 집합은 모두 4개의 펄스, 즉 P0, P1, P2, P3를 가지고, 이들 각각은 M=4개 트랙, 즉 T0, T1, T2, T3 상에 있으며, 각 트랙 상에서 1개의 펄스가 검색된다고 하자. 제1 라운드에서 n=n0=2로 결정되면, K=6회의 검색이 제2 실시예의 코드북 검색 알고리즘에서와 같이 모든 검색 펄스의 조합을 편력함으로써 수행된다. 그 조합은, P0, P1; P0, P2; P0, P3; P1, P2; P1, P3; P2, P3 이다. 제1 라운드의 최적 코드북이 P0, P3의 조합으로 검색하여 취득된다고 하면, 고정된 위치에 있고 제1 라운의 Ns 집합에 속하는 펄스는 P1, P2이므 로, 제2 라운드의 Ns 집합은 P1, P2이다. 제2 라운드에서 n=n0=2로 결정되면, K=1회의 검색이 수행된다. 명백히, P1, P2의 조합으로 검색하여 제2 라운드의 최적 코드북이 취득되면, 이 검색에서 고정된 펄스는 P0, P3이다. 그러나, 이 2개의 펄스는 제2 라운드의 Ns 집합에 속하지 않는 것이 분명하므로, 제3 라운드의 Ns 집합은 빈 것으로 판정되고, 검색이 완료된다.

단계 D5에서, 이 라운드의 최적 코드북을 취득하여 최종의 최적 코드북으로 사용한다.

도 8은 본 발명의 제5 실시예에 따른 코드북 검색 알고리즘을 나타내며, 코드북 검색 알고리즘의 상기한 실시예들에 기초하여 초기의 기본 코드북을 취득하는 구체적인 방법을 제공한다. 이 방법은 다음의 단계들을 포함한다.

단계 E1에서, M개 트랙 상의 N개 펄스에 대한 수량 분포를 취득한다.

즉, 검색될 펄스의 총수 N 및 각 트랙 상에 분포된 펄스의 수를 비트율과 같은 관련 정보에 따라 결정한다.

단계 E2에서, 트랙 상의 기지의 기준 신호에 대한 수 개의 극값에 따라 각 트랙의 집중 검색 범위를 결정하는데, 집중 검색 범위는 트랙 상의 1개의 위치를 적어도 포함한다.

기준 신호는 펄스 위치 최대 우도 함수 b(i)를 채택할 수 있으며, 모든 펄스 위치에 대해 상이한 값의 b(i)를 계산하고, 각 트랙 상의 b(i)의 최대값을 가지는 수 개의 위치를 각 트랙의 집중 검색 범위로서 각각 선택한다. 각 트랙의 집중 검색 범위에 포함되는 위치의 수는 동일 또는 상이할 수 있다.

예를 들면, 모두 M=4개의 트랙, 즉 T0, T1, T2, T3이 제공되고, 각 트랙 상의 위치는 표 1에 나타낸 바와 같이 분할되어 있으며, 각 트랙 상의 펄스 위치는 b(i)의 절대값에 따라 내림차순으로 재정렬된다. 재정렬된 트랙 위치는 다음과 같다고 가정한다:

{T0, T1, T2, T3}=

{

{0, 36, 32, 4, 40, 28, 16, 8, 20, 52, 44, 48, 12, 56, 24, 60},

{1, 33, 37, 5, 29, 41, 17, 9, 49, 21, 53, 25, 13, 45, 57, 61},

{34, 2, 38, 30, 6, 18, 42, 50, 26, 14, 10, 22, 54, 46, 58, 62},

{35, 3, 31, 39, 7, 19, 27, 51, 15, 43, 55, 47, 23, 11, 59, 63}

}

이로써, 각 트랙 상의 b(1)의 절대값이 최대인 4개의 위치가 트랙의 집중 검색 범위로 선택되면, 기본 코드북의 집중 검색 범위는 다음과 같다:

{

{0, 36, 32, 4},

{1, 33, 37, 5},

{34, 2, 38, 30},

{35, 3, 31, 39}

}

단계 E3에서, N개 펄스의 수량 분포에 따라 M개의 집중 검색 범위에서 완전 검색을 수행하고, 설정된 평가 표준에 따라 모든 가능한 위치 조합으로부터 기본 코드북을 선택한다.

집중 검색 범위는 일반적으로 매우 작기 때문에, 완전 검색을 수행하여 최적의 기본 코드북을 취득할 수 있다. 예를 들면, 기본 코드북은 모두 N=4개의 펄스, 즉, P0, P1, P2, P3를 가지고, 각각은 M=4개의 트랙, 즉, T0, T1, T2, T3 상에 위치하며, 각 트랙 상에서 1개의 펄스가 검색된다고 가정한다. 단계 E2에서 제공된 검색 범위에 관해서는, 모두 4×4×4×4=256회의 검색 후에 기본 코드북을 취득할 수 있다.

단계 E4에서, 기본 코드북에 기초하여 제1 라운드에서 K회의 검색 프로세스를 수행하여, 이 라운드의 최적 코드북을 취득한다.

이 단계는 코드북 검색 알고리즘의 제1 실시예의 단계 A2 내지 A4에 따라, 또는 코드북 검색 알고리즘의 제2 실시예의 단계 B2 내지 B4에 따라 수행될 수 있다.

코드북 검색 알고리즘의 상기한 실시예를 더욱 잘 이해하기 위하여, 아래에 계산 예를 든다:

예를 들면, M=4개 트랙, 즉, T0, T1, T2, T3 상에 각각 위치하는 모두 N=4개의 펄스, 즉, P0, P1, P2, P3가 제공되며, 각 트랙 상에서 1개의 펄스가 검색된다. 각 트랙 상의 위치는 표 1에 나타낸 바와 같이 분할되어 있으며, 검색 프로세스는 다음과 같은 단계를 포함한다.

1) 코드북 검색 알고리즘의 제5 실시예에 따라 초기의 기본 코드북을 계산하 는 방법에서, 완전 검색을 수행하여 각 트랙 상의 4개의 위치를 포함하는 집중 검색 범위, 예를 들면 {32, 33, 2, 35}로부터 초기의 기본 코드북을 취득하며, 필요한 검색 횟수는 4×4×4×4=256회 이다.

2) 제1 라운드 검색을 수행한다; n=n0=2로 결정하고, 코드북 검색 알고리즘의 제2 실시예에서처럼 검색 펄스의 모든 조합을 편력함으로써, K=6회의 검색을 수행한다. 각각의 검색은 1개 트랙 상의 4개 위치와 다른 트랙 상의 12개 위치 중에서 수행된다(카운트된 위치의 수는 이미 기본 코드북 내의 펄스 위치를 포함하고, 트랙 상의 검색될 위치는 기본 코드북의 집중 검색 범위를 결정하는 것과 유사하게 선택된다). 제1 라운드 검색에서 취득된 최적 코드북은 {32, 33, 6, 35}이고, 고정된 펄스가 P0, P1인 경우에 취득되는 것으로 가정한다. 필요한 검색 횟수는 6×(4×12)=288회이다.

3) 제2 라운드 검색을 수행한다; n=n0=2로 결정하고, P2, P3의 위치 {6, 35}는 고정되며, P0, P1의 조합에 대해 K=1회의 검색을 수행한다. 이 검색은 T0, T1 상의 4개 위치 중에서 각각 수행된다.

제2 라운드 검색에서 취득된 최적 코드북이 {32, 33, 6, 35}라고 가정하면, 필요한 검색 횟수는 4×4=16회이다.

4) 검색 펄스의 Ns 집합이 비어있다고, 즉 기본 코드북 내의 펄스의 모든 위치를 검색한다고 결정한다. 최종의 최적 코드북은 {32, 33, 6, 35}이다. 필요한 검색 횟수는 총 256＋288＋16=560회이다.

상기한 계산예에서 제공된 방법을 사용하여, 24명의 남성 시퀀스와 24명의 여성 시퀀스로 구성된 테스트 시퀀스에 대한 음성 부호화를 수행한다. 객관적인 음성 품질면에서 이 부호화 결과를 기존의 심도 우선 트리 검색 절차의 부호화 결과를 비교하여, 2가지 방법에 의해 취득된 음성 품질을 평가한다. 그러나, 상기한 방법에서 필요한 검색 횟수는 560회로, 심도 우선 트리 검색 절차에서 필요한 768회보다 훨씬 적다.

코드북 검색 알고리즘의 전술한 실시예로부터 알 수 있는 것은, 본 발명의 코드북 검색 알고리즘의 실시예에서는, 교체 및 검색 방법을 상이한 펄스 조합에 대하여 수행하여 최적의 코드북을 선택하고, 다수의 펄스에 대해 적어도 1회의 검색을 수행한다는 것이다. 최적의 코드북을 상이한 펄스 조합과 교체하여 선택하기 때문에, 검색의 전역성(global sense of search)을 최대로 보증하면서 검색 횟수를 감소시킨다. 또한, 다수의 펄스에 대하여 적어도 1회의 검색을 수행하기 때문에, 검색 결과에 대한 펄스들 사이의 연관 관계(association)의 영향이 고려되어, 검색 결과의 품질을 더욱 보증할 수 있다. 1 라운드의 검색에서, n 값이 고정되어 있고 상이한 검색 펄스의 조합이 순차로 선택되는 방법을 채택하면, 검색 펄스의 선택이 최적화되고, 검색 프로세스는 더욱 효과적이 된다. 또, 검색 펄스의 모든 가능한 조합을 편력하면, 검색 결과의 전역성이 강화되며, 검색 결과의 품질이 향상된다. 멀티 라운드 검색 방법을 채택하여 최종 최적 코드북을 취득하면, 검색 결과의 품질이 향상된다. 물론, 1 라운드의 검색에서, 코드북 검색 알고리즘의 제1 실시예 또는 제2 실시예에서 제공되는 검색 방법을 사용할 수 있을 뿐 아니라, 이전 또는 이후의 라운드들에서는 다른 방법을 채용할 수 있다. 멀티 라운드 검색 방법을 채 택하여 최종의 최적 코드북을 취득하는 경우, Ns 집합의 범위는 이전 라운드의 검색 결과에 따라 감소되어, 계산량이 효과적으로 감소된다. 집중 검색 방법을 채택하여 초기의 기본 코드북을 취득하는 경우, 고품질의 기본 코드가 취득되어, 검색 결과의 품질이 더욱 향상된다.

본 발명의 실시예에서 제공되는 부호화 방법 및 인코더의 응용 효과를 평가하기 위하여 분류 인코더(classified encoder)에 대하여 실험을 수행하였다. 이 인코더는 신호를 무성음, 일반, 유성음, 및 과도 유형으로 분류하지만, 모든 유형의 입력 신호는 검색에 단 하나의 고정된 코드북 검색 알고리즘을 채택한다. 이 실험에서, 본 발명의 방법은 임의의 코드북 검색 알고리즘을 채택하여 무성음 프레임을 처리하고, 심도 우선 검색 알리즘을 채택하여 일반 프레임을 처리하며, 본 발명의 코드북 검색 알고리즘의 계산 예에서 제공된 방법을 채택하여 유성음/과도 프레임을 처리한다. 이 실험에서는 상이한 샘플링 레이트 하의 상이한 음성 샘플의 처리 결과를 비교하여 다음의 결론을 얻었다:

1) 본 발명의 실시예의 부호화 방법에서의 가중 구분 신호대잡음비 파라미터(weighted segmental signal-to-noise ratio parameter)는 원래의 인코더 내의 방법에서의 그것보다 평균 약 0.0245 정도 높다.

2) 본 발명의 실시예의 부호화 방법의 알고리즘 복잡도는 초당 백만회 조작(million operations per second, MOPS)으로 측정되고, 원래의 인코더 내의 방법보다 평균 약 0.3185 MOPS 정도 낮다.

3) 본 발명의 실시예의 부호화 방법의 음성 품질 감지 평가(perceptual evaluation of speech quality, PESQ)는, 원래의 인코더 내의 방법보다 약 0.03%, 즉 0.00127 평균 의견 스코어(mean opinion score, MOS) 정도 낮은데, 이는 거의 무시될 수 있다.

이상에 비추어, 원래의 인코더 내의 방법과 비교하면, 본 발명의 실시예의 부호화 방법은 낮은 복잡도와 우수한 시스템 성능을 가지는 점에서 유리하다.

해당 기술분야의 당업자는, 본 발명의 실시예에 따른 방법의 단계 전부 또는 일부를 프로그램 명령어의 제어를 받는 하드웨어로 구현할 수 있음을 알 것이다. 이 프로그램은 다음의 단계, 즉 입력 신호의 특성 파라미터를 취득하는 단계; 특성 파라미터에 따라 입력 신호의 유형을 결정하는 단계; 특성 파라미터에 따라 양자화될 벡터를 취득하는 단계; 및 결정된 입력 신호의 유형에 대응하는 코드북 검색 알고리즘으로 양자화될 벡터에 대해 코드북 검색을 수행하는 단계에서 실행된다. 이 프로그램은 ROM, RAM, 자기 디스크 또는 광 디스크와 같은 컴퓨터로 판독 가능한 저장 매체에 저장될 수 있다.

이상, 본 발명의 부호화 방법 및 인코더에 대하여 상세하게 설명하였다. 본 발명의 원리 및 실시에 대하여 구체적인 실시예로 설명하였으나, 이들 실시예는 단지 본 발명의 방법 및 개념을 설명하기 위한 것이다. 해당 기술분야의 당업자는 본 발명의 범위를 벗어나지 않으면서 본 발명의 실시 및 응용 범위에 대해 변형 및 변경할 수 있다. 그러므로, 이상의 설명은 본 발명을 한정하려는 것이 아니다.

Claims

입력 신호의 특성 파라미터를 취득하는 단계;

상기 특성 파라미터에 따라 상기 입력 신호의 유형을 결정하는 단계;

상기 특성 파라미터에 따라 양자화될 벡터를 취득하는 단계; 및

상기 입력 신호의 유형에 대응하는 코드북 검색 알고리즘으로 양자화될 상기 벡터에 대해 코드북 검색을 수행하는 단계

를 포함하는 부호화 방법.
제1항에 있어서,

상기 입력 신호의 유형은 주기적인 특성과 백색 잡음 특성을 포함하고,

상기 입력 신호의 유형이 상기 주기적인 특성인 경우, 상기 코드북 검색 알고리즘은 제1 클래스 코드북 검색 알고리즘이고,

상기 입력 신호의 유형이 상기 백색 잡음 특성인 경우, 상기 코드북 검색 알고리즘은 제2 클래스 코드북 검색 알고리즘인, 부호화 방법.
제2항에 있어서,

상기 백색 잡음 특성이 있는 유형의 입력 신호는 일반 프레임과 무성음 프레임 중 적어도 하나를 포함하고,

상기 일반 프레임 또는 상기 무성음 프레임에 의해 사용되는 코드북 검색 알 고리즘은 심도 우선 트리 검색 알고리즘인, 부호화 방법.
제2항 또는 제3항에 있어서,

상기 주기적인 특성이 있는 유형의 입력 신호는 유성음 프레임과 과도 프레임 중 적어도 하나를 포함하고,

상기 유성음 프레임 또는 상기 과도 프레임에 의해 사용되는 코드북 검색 알고리즘은 펄스 위치 교체에 기초한 코드북 검색 알고리즘인, 부호화 방법.
제4항에 있어서,

펄스 위치 교체에 기초한 상기 코드북 검색 알고리즘은,

M개 트랙 상의 N개 펄스에 대한 위치 정보를 포함하는 기본 코드북을 취득하는 단계(N, M은 양의 정수임);

n개의 펄스를 검색 펄스로서 선택하는 단계(n개 펄스는 N개 펄스의 일부이고, n은 N보다 작은 양의 정수임); 및

n개 검색 펄스의 위치 정보를 각각 상기 트랙 상의 다른 위치 정보로 교체하여, 검색된 코드북을 취득하는 단계를 포함하는, 부호화 방법.
제5항에 있어서,

상기 n개의 펄스를 검색 펄스로서 선택하는 단계는,

Ns개의 펄스로부터 n개의 펄스를 검색 펄스로서 선택하는 단계(Ns개 펄스는 N개 펄스의 전부 또는 일부이고, Ns는 N 이하의 양의 정수이며, n은 Ns보다 작은 양의 정수임); 및

상기 기본 코드북 내의 상기 n개의 검색 펄스 이외의 펄스의 위치를 고정하는 단계를 포함하는, 부호화 방법.
제6항에 있어서,

상기 Ns개의 펄스로부터 n개의 펄스를 검색 펄스로서 선택하는 단계는,

2 이상인 n의 값을 결정하는 단계; 및

각 검색 프로세스에서 중복되지 않게 순차로 또는 임의로, 모두
개의 가능한 조합 중에서 하나를 선택하는 단계를 포함하고,

인 부호화 방법.
제6항에 있어서,

상기 원래의 기본 코드북을 상기 최적 코드북으로 교체하여 새로운 기본 코드북으로 하고, 상기 최적 코드북 내에 고정된 위치에 있고 원래의 Ns개 펄스에 속하는 펄스를 취득하여 새로운 Ns개 펄스로서 사용하여, 최적 코드북에 대한 다음 라운의 검색을 계속하는 단계; 및

상기 원래의 기본 코드북을 상기 최적 코드북으로 교체하는 프로세스를, 검색의 라운드 수 G가 상한값에 도달할 때까지 반복하는 단계

를 더 포함하는 부호화 방법.
제6항에 있어서,

상기 기본 코드북을 취득하는 단계는,

상기 M개 트랙 상의 상기 N개 펄스의 수량 분포를 취득하는 단계;

각각의 상기 트랙 상의 기지의 기준 신호의 수개의 극값에 따라 각각의 상기트랙의 집중 검색 범위를 결정하는 단계; 및

상기 N개 펄스의 수량 분포에 따라 상기 M개 집중 검색 범위 내에서 완전 검색을 수행하고, 설정된 평가 표준에 따라 모든 위치 조합으로부터 상기 기본 코드북을 선택하는 단계를 포함하고,

상기 집중 검색 범위는 상기 트랙 상의 1개 위치를 적어도 포함하는, 부호화 방법.
입력 신호의 특성 파라미터를 취득하도록 구성된 특성 파라미터 취득 유닛; 상기 특성 파라미터에 따라 상기 입력 신호의 유형을 결정하도록 구성된 신호 유형 결정 유닛; 상기 특성 파라미터에 따라 양자화될 벡터를 생성하도록 구성된 벡터 생성 유닛; 및

상기 신호 유형 결정 유닛에 의해 결정된 상기 입력 신호의 유형에 대응하는 코드북 검색 알고리즘으로, 상기 양자화될 벡터에 대해 코드북 검색을 수행하도록 구성된 판정 유닛

을 포함하는 인코더.
제10항에 있어서,

2 이상의 코드북 검색 유닛을 더 포함하고,

상기 코드북 검색 유닛 각각은 상이한 코드북 검색 알고리즘을 제공하도록 구성된, 인코더.
제11항에 있어서,

상기 신호 유형 결정 유닛에 의해 결정된 상기 입력 신호의 유형은, 주기적 특성과 백색 잡음 특성을 포함하고,

상기 코드북 검색 유닛은 제1 클래스 코드북 검색 유닛과 제2 클래스 코드북 검색 유닛을 포함하고, 상기 제1 클래스 코드북 검색 유닛에 의해 제공되는 코드북 검색 알고리즘의 계산 복잡도는, 상기 제2 클래스 코드북 검색 유닛에 의해 제공되는 코드북 검색 알고리즘의 계산 복잡도보다 낮으며,

상기 판정 유닛은 상기 입력 신호의 유형에 대응하는 코드북 검색 유닛을 선택하도록, 즉, 상기 주기적인 특성이 있는 유형에 따라 상기 제1 클래스 코드북 검색 유닛을 선택하고, 상기 백색 잡음 특성이 있는 유형에 따라 상기 제2 클래스 코드북 검색 유닛을 선택하도록 구성된, 인코더.
제12항에 있어서,

상기 신호 유형 결정 유닛에 의해 결정된, 백색 잡음 특성이 있는 유형의 입력 신호는 일반 프레임과 무성음 프레임 중 적어도 하나를 포함하고,

상기 제2 클래스 코드북 검색 유닛은 심도 우선 트리 검색 알고리즘을 제공하도록 구성된 심도 우선 검색 유닛을 포함하며,

상기 판정 유닛은, 백색 잡음 특성이 있는 유형에 따라 상기 제2 클래스 코드북 검색 유닛을 선택하고, 상기 일반 프레임 또는 상기 무성음 프레임에 따라 상기 심도 우선 검색 유닛을 선택하도록 구성된, 인코더.
제12항에 있어서,

상기 신호 유형 결정 유닛에 의해 결정된 주기적 특성이 있는 유형의 입력 신호는, 유성음 프레임과 과도 프레임 중 적어도 하나를 포함하는, 인코더
컴퓨터 프로그램 코드를 포함하는 컴퓨터로 판독한 저장 매체로서,

상기 컴퓨터 프로그램 코드는 컴퓨터 유닛에 의해 실행될 때, 상기 컴퓨터 유닛으로 하여금,

입력 신호의 특성 파라미터를 취득하도록 하고,

상기 특성 파라미터에 따라 상기 입력 신호의 유형을 결정하도록 하며,

상기 특성 파라미터에 따라 양자화될 벡터를 취득하도록 하고,

상기 입력 신호의 유형에 대응하는 코드북 검색 알고리즘으로, 양자화될 상기 벡터에 대해 코드북 검색을 수행하도록 하는,

컴퓨터로 판독 가능한 저장 매체.