KR100556278B1 - 벡터탐색방법 - Google Patents

벡터탐색방법 Download PDF

Info

Publication number
KR100556278B1
KR100556278B1 KR1019980010207A KR19980010207A KR100556278B1 KR 100556278 B1 KR100556278 B1 KR 100556278B1 KR 1019980010207 A KR1019980010207 A KR 1019980010207A KR 19980010207 A KR19980010207 A KR 19980010207A KR 100556278 B1 KR100556278 B1 KR 100556278B1
Authority
KR
South Korea
Prior art keywords
vector
codeword
gray code
code
equation
Prior art date
Application number
KR1019980010207A
Other languages
English (en)
Other versions
KR19980080612A (ko
Inventor
유지 마에다
슈이찌 마에다
Original Assignee
소니 가부시끼 가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 소니 가부시끼 가이샤 filed Critical 소니 가부시끼 가이샤
Publication of KR19980080612A publication Critical patent/KR19980080612A/ko
Application granted granted Critical
Publication of KR100556278B1 publication Critical patent/KR100556278B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/135Vector sum excited linear prediction [VSELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 음성신호 등을 부호화할 때 벡터 양자화에서 코드북 탐색을 간단하게 하여 벡터 탐색속도를 강화한다.
잡음 코드북(260)에서 M개의 기본 벡터 각각은 부호 가산기(270)에서 팩터 ±1과 곱해지고 가산기(280)에서 조합되어 2M개의 잡음부호 벡터를 생성한다. 여기에서, 2진 그레이 부호의 특성은 다음과 같이 이용된다. 2진 그레이 부호의 부호어(i)에 따른 잡음 부호 벡터와 부호어(i)와 인접하고 소정의 비트 위치 (v)에서만 부호어(i)와 다른 부호어(u)에 따른 잡음 부호벡터 사이에 구해진 변화분 ΔGu은 부호어(u')가 비트 위치 (V)를 제외한 하나의 비트 위치(w)에서만 부호어(u)와 다르다는 사실을 이용하므로써 그레이 부호계열에서 비트위치 (v)를 바꾼 다음의 부호어(u')가 잡음 부호 벡터로부터 변화분 ΔGu'을 표현할 수 있는 식으로 사용된다. 따라서, 연산이 간단하게 되어, 벡터 탐색 속도를 증가시킨다.

Description

벡터 탐색방법
본 발명은 음성신호와 음향 신호를 부호화하기 위한 압축에서 벡터 양자화시에 최적 음원 벡터를 얻기 위한 벡터 탐색 방법에 관한 것이다.
청감상 특성 뿐만아니라 시간영역 및 주파수 대역에서 통계적 특성을 사용하여 음성신호와 음향 신호를 압축화하기 위한 다양한 부호화 방법들이 알려져 있다. 이 부호화 방법들은 시간 영역 부호화, 주파수 영역 부호화, 분석-합성 부호화 등으로 분류할 수 있다.
음성신호 등을 부호화하기 위해 압축하는데 효과적인 부호화 방법으로서, SBC(Sub-Band Coding ; 대역분할 부호화), LPC(Linear Predictive Coding ; 선형예측 부호화), DCT(Discrete Cosine Transform ; 이산 코사인 변환), MDCT(Modified DCT ; 변경 DCT), FFT(Fast Fourier Transform ; 고속 푸리에 변환) 등 뿐만아니라 하모닉(Harmonic) 부호화, MBE(MultiBand Excitation ; 다중대역 여기) 부호화가 알려져 있다.
음성신호를 부호화 할 때, 인접 샘플값들 간에 상관관계가 있음을 이용하여 과거 샘플값들로부터 현재 샘플값을 예측할 수 있다. 적응 예측 부호화(APC)는 이 특성을 이용하여 예측값과 입력 신호사이의 차이, 즉 예측 잔차의 부호화를 행한다.
이 적응 예측 부호화에서, 입력신호는 음성신호가 거의 정상으로 간주될 수 있는 부호화 단위로, 즉 20ms의 프레임 단위로 꺼내지고 선형예측 부호화(LPC)에 의해 얻어진 예측계수에 따라 선형예측이 행해져서, 예측값과 입력신호 간의 차이를 구한다. 이 차이는 양자화되고 보조 정보로서 예측 계수와 양자화 단계폭으로 다중화되어, 프레임 단위로 전송된다.
다음으로, 대표적인 예측 부호화 방법으로서 부호 여기 선형 예측(CELP) 부호화에 대한 설명을 할 것이다.
CELP부호화는 코드북(Codebook)이라고 하는 잡음 사전을 사용하여 입력 음성신호를 표현하는 최적 잡음을 선택하여 그 번호(인덱스)를 전송한다. CELP 부호화에서, 합성에 의한 분석(AbS)을 사용하는 밀폐 루프가 시간축 파형의 벡터 양자화를 위해 사용되어, 음원 파라미터를 부호화한다.
도 1은 CELP를 사용하여 음성신호를 부호화 하기 위한 부호화장치의 필수 부분의 구성을 나타내는 블록도이다. 이후에, 이 부호화 장치의 구성을 참고로 CELP 부호화에 대한 설명을 할 것이다.
입력단자(10)로부터 공급된 음성신호는 먼저 LPC 분석기(20)에서 LPC(Linear Predictive Coding ; 선형예측 부호화)분석되어, 구해진 예측 계수가 합성 필터(30)로 전송된다. 또한, 예측 계수는 또한 다중화기(Multiplexer)(130)로 전송된다.
합성필터(30)에서, LPC분석기(20)로부터의 예측계수는 후술될 적응 코드북(40)과 잡음코드북(60)으로부터 증폭기(50 및 70)와 가산기(80)를 통해 공급된 부호 벡터와 합성된다.
가산기(90)는 입력단자(10)로부터 공급된 음성신호와 합성필터(30)로부터의 예측값 사이의 차이를 결정하고, 이는 청감가중 블록(100)으로 전송된다.
청감가중 블록(100)에서는, 사람의 청감의 특성을 고려하여 가산기(90)에서 구해진 차이가 가중된다. 오차 계산기(110)는 청감에 의해 가중된 차이, 즉 합성필터(30)로부터의 예측값과 입력 음성신호 사이의 차이의 왜곡을 최소화하는 부호 벡터와 증폭기(50, 70)의 이득을 탐색한다. 이 탐색의 결과는 다중화기(130) 뿐만아니라 적응 코드북(40), 잡음 코드북(60), 이득 코드북(120)에 인덱스로서 전송되어서 출력단자(140)에서 전송경로 부호로서 전송된다.
따라서, 입력 음성신호를 표현하는 최적 부호벡터가 적응 코드북(40)과 잡음 코드북(60)으로부터 선택되고, 이들을 합성하기 위한 최적 이득이 결정된다. 상기 처리는 입력단자(10)로부터 공급된 음성신호를 청감 가중한 후에 행해질 수 있고, 코드북에 저장된 부호 벡터는 청감 가중될 수 있음을 주의한다.
다음으로, 상기 적응 코드북(40), 잡음 코드북(60), 이득 코드북(120)에 대한 설명을 할 것이다.
CELP부호화에서, 입력 음성신호를 표현하는 음원 벡터는 적응 코드북(40)에 저장된 부호 벡터와 잡음 코드북(60)에 저장된 부호 벡터의 선형합으로 형성된다. 여기에서 입력 신호벡터로부터의 청감 가중 차이를 최소화하는 음원 벡터를 표현하는 각 코드북의 인덱스가 저장된 모든 부호 벡터에 대해 합성필터(30)의 출력벡터를 계산하고 오차 계산기(110)에서 오차를 계산하므로써 결정된다.
또한, 증폭기(50)에서 적응 코드북의 이득과 증폭기(70)에서 잡음 코드북의 이득은 또한 비슷한 탐색에 의해 부호화된다.
잡음 코드북(60)은 보통 코드북 벡터로서 2가 비트의 수로 거듭제곱된 개수만큼의 분산 1의 가우스 잡음의 계열 벡터를 포함한다.
그리고 보통, 코드북 벡터의 조합은 적정 이득을 이 코드북 벡터에 가산하므로써 구해진 음원 벡터의 왜곡을 최소화하도록 선택된다.
선택된 코드북 벡터를 양자화할 때 양자화 왜곡은 코드북의 차원의 수를 증가시키므로써 감소될 수 있다. 예를들어, 사용된 코드북은 40차원이고 2의 9(비트의 수)승개, 즉 512개이다.
이 CELP부호화를 사용하므로써, 비교적 높은 압축비와 바람직한 음질을 얻을 수 있다. 그런데, 큰 수의 차원의 코드북을 사용하는 것은 합성필터에서 많은 연산량과 코드북의 많은 메모리 양을 필요로 하고, 이것은 실시간 처리를 어렵게한다. 만약 고음질이 보장되면, 큰 지연이 발생된다. 또한, 부호에서 단지 1비트 오차가 완전히 다른 벡터를 재생시키는 또다른 문제 있다. 즉, 상기 부호화는 부호 오차에 대해서는 약하다.
CELP부호화의 상기 문제를 개선하기 위해, 벡터합 여기 선형 예측(VSELP)이 사용된다. 이하에, 이 VSELP 부호화가 도 2 및 도 3을 참고로 설명될 것이다.
도 2는 VSELP에 의해 음성신호를 부호화하기 위한 부호화 장치에서 사용된 잡음 코드북의 구성을 나타내는 블록도이다.
VSELP부호화는 복수의 소정의 기본 벡터로 구성된 잡음 코드북(260)을 사용한다. 잡음 코드북(260)에 저장된 개수(M)개의 각 기본 벡터는 팩터 (+1 또는 -1)로 곱해져서 복호기(210)에 의해 부호 부가부(270-1 내지 270-M)로 복호화된 인덱스에 따라 값을 바꾼다. 팩터 (+1 또는 -1)로 곱해진 M개의 기본 벡터는 가산기(280)에서 서로 조합되어 2M개의 잡음 부호 벡터를 만들어낸다.
이 결과, M개의 기본 벡터에 대해 콘벌루션 연산과 이의 가산 및 감산을 행하므로써, 모든 잡음 부호 벡터에 대한 콘벌루션 연산 결과를 얻을 수 있다. 또한, M개의 기본 벡터만이 잡음 코드북(260)에 저장되므로, 메모리 양을 감소시킬 수 있다.
또한, 생성된 2M개의 부호 벡터가 기본 벡터의 가산 및 감산에 의해 표현될 수 있는 용장 구성을 가지므로 부호 오차에 대한 내구성을 강화할 수 있다.
도 3은 상기한 잡음 코드북을 갖춘 VSELP 부호화 장치의 필수 부분의 구성을 나타내는 블록도이다. 이 VSELP부호화 장치에서, 일반 CELP부호화 장치에서 보통 512개인 잡음 코드북의 수는 9로 감소되고, 각 부호 벡터(기본 벡터)는 부호 가산기(365)에 의해 부호 +1 또는 -1에 의해 가산되어서, 이의 선형합이 가산기(370)에 의해 구해지고, 이에의해 29=512개의 잡음 부호 벡터가 만들어진다.
VSELP 부호화의 주요 특징은 상기한 바와같이 잡음 부호 벡터가 기본 벡터의 선형합으로 형성되고 적응 코드북의 이득과 잡음 코드북의 이득이 즉시 벡터 양자화된다.
상기 VSELP 부호화의 기본 구성은 합성에 의한 분석의 부호화 방법, 즉 여기원으로서 피치 주파수 요소와 잡음 요소의 선형 예측합성을 행하는 것이다. 즉, 파형은 선형 예측 합성을 행하기 위해 입력 음성신호의 피치 주파수에 의존하는 적응 코드북(340)과 잡음 코드북(360)으로부터 벡터부에서 선택되어서, 부호 벡터와 입력 음성신호의 파형으로부터의 차이를 최소화하는 이득을 선택한다.
VSELP부호화에서, 입력 음성신호의 피치 요소를 표현하는 적응 코드북으로부터의 부호 벡터와 입력 음성신호의 잡음 요소를 표현하는 잡음 코드북으로부터의 부호 벡터는 모두 벡터 양자화되어, 조합에서 동시에 두 개의 최적 파라미터를 얻는다.
이 과정에서, 기본 벡터는 +1 또는 -1에 의해 부가되는 자유도만을 가지고 적응 코드북의 벡터는 기본 벡터와 직교하지 않으므로, 만약 CELP처리가 적응 코드북의 벡터와 잡음 부호 벡터의 이득을 결정하는데 계속적으로 사용된다면 부호화 효율은 저하된다. 이에 대처하기 위해, VSELP에서, 기본 벡터부호는 다음과 같은 처리에 의해 결정된다.
먼저, 입력 음성신호의 피치 주파수가 탐색되어 적응 코드북의 부호 벡터를 결정한다. 다음으로, 잡음 기본 벡터가 적응 코드북의 부호 벡터에 직교하는 공간에 사영되고 입력벡터와의 내적이 연산되어서, 잡음 코드북의 부호 벡터를 결정한다.
다음으로, 결정된 두 개의 부호벡터에 따라, 합성된 벡터와 입력 음성신호 사이의 차이를 최소화하는 이득 β와 이득 γ의 조합을 결정하기 위해 코드북이 탐색된다. 두 이득의 양자화를 위해, 동일하게 변환된 한쌍의 두 파라미터가 사용된다. 여기에서, β는 장기 예측 이득계수에 해당하고 γ는 부호 벡터의 스칼라 이득에 해당한다.
VSELP부호화에서 코드북 탐색을 위한 연산양이 CELP부호화에서 연산양보다 감소되지만, 처리 속도를 더 개선하고 지연을 더 감소시키는 것이 바람직하다.
따라서, 본 발명의 목적은 음성 신호 등을 부호화할 때 벡터 양자화에서 코드북 탐색을 간단하게 하고 벡터 탐색 속도를 개선할 수 있게 하는 것이다.
상기 목적을 달성하기 위해, 본 발명에 의한 벡터 탐색방법에서는, 각각 팩터 +1 또는 -1로 곱해진 복수의 기본 벡터를 합성하므로써 구해진 합성 벡터에 따라 구해진 예측 벡터 중에서, 상기 예측 벡터가 주어진 입력벡터와의 차이가 최소화되도록 또는 주어진 입력 벡터와의 내적을 최대화 하도록 결정되고, 입력벡터와의 차 또는 입력 벡터와의 내적을 구하기 위한 연산은 복수의 기본 벡터 각각에 대해 곱해진 상기 팩터의 조합을 변화하므로써 행해져서, 그레이(Gray) 부호에 의하면, 그레이 코드 (u)에 따라 생성된 합성 벡터로부터 구해진 중간값(Gu)은 그레이 코드(u)에 인접한 (i)에 따른 중간값(Gi)과 이들 사이의 변화분(ΔGu)에 의해 표현된다.
또한, 입력 벡터와 예측 벡터 사이의 차를 최소화하거나 이들 사이의 내적을 최대화하는 기본 벡터의 조합은 그레이 코드의 소정의 비트 위치가 변화될 때의 합성 벡터의 변화분과 다른 비트 위치가 변화될 때의 합성 벡터의 변화분 사이의 차이를 사용하므로써 구해진다.
상기한 벡터 탐색 방법에 의하면, 그레이 코드의 특성을 사용하므로써, 다음 연산을 행하기 위해 구해진 연산결과를 사용하는 것이 가능하고, 따라서 벡터 탐색 속도를 증가시킬 수 있다.
이제 본 발명의 바람직한 실시예에 의한 벡터 탐색방법에 대해 설명할 것이다.
먼저, 상기 VSELP부호화 장치에서 행해진 벡터 양자화의 경우에 대한 설명을 할 것이다.
파형 부호화 및 분석-합성 방법에서, 파형의 표본값과 스펙트럼 엔벌로프 파라미터 각각을 양자화하는 대신에, 조합(벡터)에서 복수의 값들이 전체적으로 하나의 부호로 표현된다. 상기 양자화 방법을 벡터 양자화라 한다. 파형 벡터 양자화에 의한 부호화에서, 표본화 후의 파형은 부호화 유닛으로서 소정의 시간 간격동안 삭제되고 이 간격 동안의 파형 패턴은 하나의 부호에 의해 표현된다. 이에 대해 다양한 파형 패턴이 미리 메모리에 저장되고 부호가 이들에 부가된다. 부호와 패턴(부호 벡터) 사이의 대응은 코드북에 표시되어 있다.
음성신호 파형을 위해, 각 시간간격 동안 코드북에 저장된 파라미터 각각과의 비교를 행하고 가장 유사한 파형의 부호가 그 간격의 파형을 표현하는데 사용된다. 따라서, 다양한 입력음이 제한된 수의 패턴으로 표현된다. 결과적으로, 완전한 왜곡을 최소화하기 위한 적절한 패턴이 패턴 분포 등을 고려하여 코드북에 저장된다.
실현될 패턴이 다양한 특수성을 가져서 음성파형의 특정 간격에서 표본점들간에 상관관계를 볼 수 있고 표본점이 매끄럽게 연결된다.
다음으로, 입력 벡터와 코드북으로부터 선택된 복수의 벡터의 최적 조합으로부터 형성된 합성 벡터 사이의 차를 최소화하는 부호 벡터를 탐색하는 벡터 탐색에 대한 설명을 할 것이다.
먼저, p(n)이 청감가중된 입력 음성신호이고 q'm(n)(1≤m≤M)이 청감 가중된 장기 예측 벡터에 직교하는 기본 벡터라고 가정한다.
수학식 1은 입력벡터와 코드북으로부터 선택된 복수의 벡터의 조합에 의해 형성된 합성 벡터의 내적이다. 즉, 수학식 1을 최대화하는 θij를 구하므로써, 합성 벡터와 입력 벡터 사이의 내적이 최대화된다.
조합(θij)은 만약 부호어(i)의 비트(j)가 0이면 -1이고 부호어(i)의 비트(j)가 1이면 1임을 주의한다(0 ≤ i ≤2M - 1, 1 ≤ m ≤ M).
[수학식 1]
수학식 1의 분모를 전개하여 수학식 2를 구할 수 있다.
[수학식 2]
여기에서, 수학식 3에 주어진 변수 (Rm)과 수학식 4에 주어진 변수(Dmj)를 도입한다.
[수학식 3]
[수학식 4]
이 변수(Rm 과 Dmj)는 수학식 5를 얻기 위해 수학식 1에 도입된다.
[수학식 5]
여기에서, 수학식 6에 주어진 변수(Ci)와 수학식 7에 주어진 변수(Gi)가 더 도입된다.
[수학식 6]
[수학식 7]
이 변수(Ci 와 Gi)를 사용하므로써, 수학식 1은 수학식 8로 다시 쓰여질 수 있다.
즉, 수학식 8을 최소화하는 변수(Ci 와 Gi)를 구하므로써, 합성 벡터와 입력 벡터 사이의 상관관계를 최대화할 수 있다.
[수학식 8]
그런데, 만약 비트 위치 (v)에서만 표시단어 (i)와 다른 표시단어 (u)가 있고, Ci 와 Gi가 알려져 있으면, Cu와 Gu는 수학식 9와 수학식 10에 의해 표현될 수 있다.
[수학식 9]
[수학식 10]
이를 이용하므로써 또한 2진 그레이 코드를 사용하여 부호어(i)를 변환하므로써, 코드북으로부터 선택된 복수의 부호 벡터의 최적 조합을 고효율로 연산할 수 있다. 그레이 코드는 이후에 상세하게 설명될 것이다.
만약 ΔGu가 Gi 에서 Gu의 변화분이라고 가정하면, 수학식 10은 수학식 11로 다시 쓰여질 수 있다.
[수학식 11]
여기에서, 그레이 코드의 부호어(u')는 비트 위치 (V)에서만 부호어(i)와 다르다. 부호어(u')는 비트 위치 (v)이외에 하나의 비트만 선행 부호어(u)와 다르다.
이제, 만약 (w)가 상기 비트 위치인 것으로 가정하면, θuv의 부호는 바뀌고 수학식 12의 관계는 수학식 11로부터 구해질 수 있다.
[수학식 12]
이로부터, 비트위치 (V)가 처음 2진 그레이 코드에서 변화될 때 변화분(ΔGu)을 구하기 위해 수학식 11을 사용할 수 있고 그 후에 동일한 비트 위치(V)에서 변화분을 구하기 위해 수학식 12를 사용할 수 있어서, 벡터 탐색속도가 강화될 수 있다.
도 4는 M=4일 때, 2진 그레이 코드를 나타낸다. 여기에 도시된 바와같이, 그레이 코드는 인접한 두 개의 부호어가 1비트에서만 서로 다른 일종의 순환부호이다.
여기에서, 만약 비트 위치 V=3에 주목하면, 예를 들어, 도면부호 425로 지시된 바와같이 N이 3에서 4로 변화할 때와 도면 부호 426에 나타난 바와같이 N이 11에서 12로 변화할 때 값이 변화된다. 즉, 만약 N=4일 때의 그레이 코드가 N=12일 때의 그레이 코드와 비교되면, 비트 (v)(V=3)를 제외하면, 유일한 차이는 비트 (w)(W=4)에서이다.
여기에서, 만약 N=4일 때의 그레이 코드가 (u)라고 가정하고 N=12일때의 그레이 코드가 (u')라고 가정하면,
[수학식 13]
N = 4일 때 : θu1 = -1, θu2 = 1, θu3 = 1, θu4 = -1
N = 12일 때 : θu'1 = -1, θu'2 = 1, θu'3 = -1, θu'4 = 1
이와 수학식 11로부터,다음이 구해질 수 있다.
[수학식 14]
N = 4일 때 : ΔGu = θu3u1D13 + θu2D23 + θu4D43}
N = 12일 때 : ΔGu = θu'3u'1 D13 + θu'2D23 + θu'4D43}
상기한 바와같이, 비트 위치 V =1 과 2가 동일한 부호를 가지고 비트 위치 V = 3 과 4가 다른 부호를 가지므로, 다음이 만족된다.
[수학식 15a]
[수학식 15b]
즉, 수학식 15a가 수학식 15b로 간단하게 될 수 있다.
도 5는 본 발명에 의한 벡터 탐색방법의 상기 과정을 나타내는 순서도이다.
먼저, 스텝(ST1)에서, 변수(Rm)가 수학식 3으로부터 연산되고,변수 (Dmj)가 수학식 4로부터 연산된다.
스텝(ST2)에서,변수 (C0)는 수학식 6으로부터 연산되고, 변수(G0)는 수학식 7로부터 연산된다.
스텝(ST3)에서, Ci(1 ≤ i ≤ 2M-1)는 수학식 9로부터 연산된다.
스텝(ST4)에서, 비트 (V-1)가 연산된다.
스텝(ST5)에서, 특정 비트 V가 처음 변화할 때의 Gu의 변화분(ΔGu)가 수학식 11으로부터 연산된다.
스텝(ST6)에서, 나머지 비트 V가 변화할 때의 ΔGu는 수학식 12로부터 연산된다.
스텝(ST7)에서, 비트 V가 V + 1로 설정된다.
스텝(ST8)에서, V는 M과 동일한지 그 이하인지를 판정한다. 만약 V가 M과 같거나 그 이하이면, 제어는 스텝(ST5)으로 복귀되어 상기 처리가 반복된다. 한편, 만약 V가 M보다 크면, 제어는 스텝(ST6)을 통과한다.
스텝(ST9)에서, Gu = Gi + ΔGu (여기에서 1 ≤ u ≤ 2M-1)가 연산되고, 벡터 탐색이 완료된다.
도 6은 본 발명에 의한 벡터 탐색 방법에 의해 구해진 Gi연산 처리양을 종래의 벡터 탐색방법의 처리와 비교하여 나타낸다.
도 6a는 곱셈에 대한 연산회수에서의 비교 결과를 나타낸다. 또한, 도 6b는 가산 및 감산에 대한 연산회수의 비교 결과를 나타낸다. 이 결과로부터, M이 증가함에 따라, 연산회수가 감소되는 효과를 볼 수 있다.
또한, 도 6c는 메모리에 기입회수에서의 비교결과를 나타낸다. 이 결과는 M의 값에 상관없이, 메모리의 기입회수가 종래의 벡터 탐색방법과 비교하여 두 배 증가된 것을 나타낸다.
다음으로, PSI-CELP부호화에서 벡터 양자화에 사용된 본 발명의 실시에에 의한 벡터 탐색방법에 대한 설명을 할 것이다.
PSI-CELP(Pitch Synchronous Innovation CELP)부호화는 적응 코드북의 피치 주기(피치 래그)로 잡음 코드북으로부터의 부호 벡터의 주기 처리를 하므로써 유음부에 대해 개선된 음질을 얻기 위한 고효율 음성 부호화이다.
도 7은 잡음 코드북으로부터의 부호 벡터의 피치의 주기 처리를 나타낸다. 상기 CELP부호화에서, 적응 코드북은 주기적 피치 성분을 포함하는 음성신호를 효율적으로 표현하는데 사용된다. 그런데, 비트 속도가 4kbs로 저하될 때, 음원 부호화에 대해 할당된 비트의 수는 감소되고 적응 코드북만으로 주기적 피치 성분을 포함하는 음성신호를 효율적으로 표현할 수 없게된다.
이에 대처하기 위해, PSI-CELP 부호화 방식에서, 잡음 코드북으로부터의 부호 벡터의 피치는 주기 처리된다. 이는 적응 코드북만으로는 충분히 표현될 수 없는 주기적 피치 성분을 포함하는 음성신호를 정확하게 표현하는 것을 가능하게 한다. 래그(피치 래그)(L)는 표본수로 표현된 피치 사이클을 나타낸다.
도 8은 PSI-CELP부호화 장치의 필수부의 구성예를 나타내는 블록도이다. 이하에, 도 8을 참고로 PSI-CELP부호화에 대한 설명을 할 것이다.
PSI-CELP부호화는 잡음 코드북의 피치 주기 처리를 행하는데 특징이 있다. 이 주기 처리는 반복되도록 음성신호의 기본 사이클인 피치 주기 성분만을 취하므로써 음성신호를 변형하는 것이다.
입력 단자(710)로부터 공급된 음성신호는 먼저 선형 예측 분석기(720)에서 선형예측 분석되고 구해진 예측 계수는 선형 예측 합성 필터(730)로 공급된다. 합성 필터(730)에서 LPC분석기(720)로부터의 예측 계수는 증폭기(650, 770)와 가산기(780)를 거쳐 적응 코드북(640)과 잡음 코드북(680, 760, 761) 각각으로부터 공급된 부호 벡터와 합성된다.
잡음 코드북(660)으로부터의 잡음 부호 벡터는 선택기(655)에 의해 32개의 기본 벡터로부터 선택되고 부호 가산기(657)에 의해 팩터 +1 또는 -1로 곱해진 벡터이다. 팩터 +1 또는 -1로 곱해진 잡음 부호 벡터와 적응 코드북(640)으로부터의 부호 벡터는 선택기(652)에 의해 선택되고 증폭기(650)에 의해 소정의 이득(g0)으로 가산되어 가산기(780)에 공급된다.
한편, 잡음 코드북(760, 761)으로부터의 잡음 부호 벡터는 선택기(755, 756)에 의해 16개의 기본 벡터로부터 각각 선택되어 피치 사이클러(750, 751)에 의해 피치 주기 처리되고, 그 후에 이들은 부호 가산기(740, 741)에 의해 팩터 +1 또는 -1와 곱해져서 가산기(765)에 공급된다. 이후에, 이들은 증폭기(770)에서 소정의 이득(g1)이 주어지고 가산기(780)에 공급된다.
증폭기(650, 770)에 의해 각각 이득이 주어진 부호 벡터는 가산기(780)에서 가산되고 선형 예측 합성필터(730)에 공급된다.
가산기(790)에서는, 입력단자(710)로부터 공급된 음성신호와 선형 예측 합성 필터(730)로부터의 예측값 사이의 차이가 구해진다.
청감 가중 왜곡 최소화기(800)에서는, 사람의 청감 특성을 고려하여 가산기(790)에 의해 구해진 차가 청감가중된다. 청감가중된 차이, 즉 부호 벡터와 이득은 선형 예측 합성필터(730)로부터의 예측값과 입력 음성신호 사이의 차이 오차를 최소화하도록 결정된다. 이 결과는 적응 코드북(640), 잡음 코드북(660, 760, 761)에 인덱스로서 전송되고 송신경로 부호로서 출력된다.
그런데, LSP중간 대역 제 2단계 양자화에서, 수학식 16은 코드북으로부터 선택된 복수의 벡터의 조합으로부터 만들어진 합성 벡터와 입력 중간 대역 LSP오차 벡터 사이의 유클리드 거리를 구한다. 즉, 이 연산은 수학식 16에 의해 구해진 유클리드 거리 D(k)2를 최소화하는 쌍 θ(k, i)을 구하므로써 행해지는데, 여기에서 0 ≤ k ≤ MM - 1이고 0 ≤ i ≤ 7인 것으로 가정한다.
[수학식 16]
수학식 16은 다음과 같이 수학식 17로 전개된다.
[수학식 17]
여기에서, 수학식 18에 의해 주어진 변수 R(k, i)(o < k < MM - i, 0 < i < 7)와 수학식 19에 의해 주어진 변수 D(i, m)(0 <i, m< 7)가 도입된다.
[수학식 18]
[수학식 19]
수학식 17에서, 우측 제 1항은 항상 일정하고 따라서 무시될 수 있다. 상기 변수 R 및 D를 대입하므로써, 다음과 같이 수학식 20에 의해 정의된 관계를 만족시키는 θ(k, i)를 구할 필요가 있다.
[수학식 20]
여기에서, 수학식 21에 의해 주어진 변수(CI)와 수학식 22에 의해 주어진 변수(GI)가 더 도입된다(여기에서, 0 ≤ I ≤ 28 - 1).
[수학식 21]
[수학식 22]
상기 변수(CI와 GI)는 다음을 얻기 위해 수학식 20에 도입된다.
[수학식 23]
즉, 수학식 23을 최소화하는 변수(CI와 GI)를 구하므로써 오차를 최소화하는 것이 가능하다.
PSI-CELP부호화 방식의 상기 벡터 탐색에서, 수학식 21과 수학식 22는 VSELP부호화의 상기 벡터 탐색에서 수학식 9와 수학식 10과 동일한 형태를 갖는다. 결과적으로, 본 발명에 의한 상기 벡터 탐색방법은 또한 PSI-CELP에 적용될 수 있어서, 벡터 탐색 속도가 강화될 수 있다.
그레이 코드 특성을 이용하는, 본 발명에 의한 벡터 탐색 방법은, 다음 연산을 행하기 위해 완료된 연산의 결과를 사용하고, 따라서 합성 벡터의 연산을 간단하게 할 수 있고 벡터 탐색속도를 증가시킬 수 있다.
도 1은 CELP부호화의 설명을 위해 부호화 장치의 구성예를 나타내는 블록도이다.
도 2는 VSELP부호화에서 사용된 잡음 코드북의 구성을 나타내는 블록도이다.
도 3은 VSELP부호화의 설명을 위해 부호화 장치의 구성예를 나타내는 블록도이다.
도 4는 2진 그레이(Gray) 부호의 일예를 나타낸다.
도 5는 본 발명에 의한 벡터 탐색 방법의 과정을 나타내는 순서도이다.
도 6은 본 발명에 의한 벡터 탐색 방법에서의 연산양과 메모리 기입양을 종래의 벡터 탐색과 비교하여 나타낸다.
도 7은 PSI-CELP를 설명한다.
도 8은 PSI-CELP부호화의 설명을 위해 부호화 장치의 구성예를 나타내는 블록도이다.
* 도면의 주요부분에 대한 부호설명
210. 복호기 260. 잡음 코드북
270-1∼270-M. 부호부가부 280. 가산기

Claims (5)

  1. 입력 벡터와 +1 또는 -1의 각각의 팩터의 세트가 승산된 각각의 복수의 기본벡터의 합을 각각 포함하는 복수의 합성 벡터 사이의 차이 오차를 연산하여 오디오신호의 벡터 양자화에 대한 최적의 합성 벡터를 구하는 벡터 탐색 방법에 있어서,
    상기 팩터의 세트는 그레이 코드에 따라서 변화하고,
    그레이 코드의 부호어(u)에 따라서 생성된 합성 벡터의 연산에 의해 구해진 중간값(Gu)은 소정의 비트 위치(v)에서만 상기 부호어(u)와 다른 인접한 부호어(i)에 따라 생성된 합성 벡터의 연산에 의해 구해진 중간값(Gi)과 그레이 코드 특성을 사용하여 연산된 변화량(△Gu)으로 표현되고,
    상기 변화량(△Gu)은 상기 그레이 코드에서 또 다른 부호어(i')에 따른 중간 값(Gi')과 소정의 비트 위치(v)에서만 상기 부호어(i')와 다른 인접한 부호어(u')에 따른 중간값(Gu') 사이의 변화량(△Gu')을 표현하는데 사용되는 것을 특징으로 하는 벡터 탐색 방법.
  2. 제 1항에 있어서,
    상기 예측벡터는 상기 예측 벡터와 과거 음원신호에 따른 벡터를 합성하므로써 예측 합성 필터를 통해 만들어지는 것을 특징으로 하는 벡터 탐색방법.
  3. 제 1항에 있어서,
    상기 그레이 부호에서 상기 부호어(u')는 소정의 비트 위치(v)를 제외한 하나의 비트 위치(w)에서만 상기 부호어(u)와 다르고,
    상기 변화분 ΔGu'은 상기 그레이 부호의 상기 부호어(u)에 따라 미리 구해진 상기 변화분 ΔGu의 합과 상기 변화분 ΔGu와 상기 ΔGu' 사이의 차이로서 표현되는 것을 특징으로 하는 벡터 탐색방법.
  4. 제 1항에 있어서,
    상기 예측벡터와 상기 입력 벡터 사이의 차이를 최소화하기 위한 연산은 상기 입력 벡터와의 내적을 최대화하는 그레이 부호의 부호어(i)에 대해 기본 벡터를 합성하므로써 만들어진 합성 벡터로부터 상기 합성 벡터를 결정하고,
    상기 내적은 두 개의 변수 Ci와 Gi를 사용하여, Ci2/Gi로 표현되고, 그 값이 최대화되는 것을 특징으로 하는 벡터 탐색방법.
  5. 제 1항에 있어서,
    상기 예측 벡터와 상기 입력벡터 사이의 차를 최소화하는 연산은 상기 입력벡터로부터의 유클리드 거리를 최소화하는 그레이 부호의 부호어(i)에 대해 기본 벡터를 합성하므로써 만들어진 합성 벡터로부터 상기 합성 벡터를 결정하는 연산이고,
    상기 유클리드 거리는 두 개의 변수 Ci와 Gi의 합으로 표현되고, 상기 합은 최소화되는 것을 특징으로 하는 벡터 탐색방법.
KR1019980010207A 1997-03-28 1998-03-25 벡터탐색방법 KR100556278B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP97-078615 1997-03-28
JP07861597A JP3593839B2 (ja) 1997-03-28 1997-03-28 ベクトルサーチ方法

Publications (2)

Publication Number Publication Date
KR19980080612A KR19980080612A (ko) 1998-11-25
KR100556278B1 true KR100556278B1 (ko) 2006-06-29

Family

ID=13666802

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980010207A KR100556278B1 (ko) 1997-03-28 1998-03-25 벡터탐색방법

Country Status (9)

Country Link
US (1) US7464030B1 (ko)
EP (1) EP0867863B1 (ko)
JP (1) JP3593839B2 (ko)
KR (1) KR100556278B1 (ko)
CN (1) CN1120472C (ko)
AU (1) AU757927B2 (ko)
DE (1) DE69808687T2 (ko)
SG (1) SG71098A1 (ko)
TW (1) TW371342B (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100318336B1 (ko) * 2000-01-14 2001-12-22 대표이사 서승모 G.723.1 mp-mlq 코드북 검색 시간 단축 방법.
CN1898720B (zh) * 2004-07-09 2012-01-25 日本电信电话株式会社 音响信号检测系统、音响信号检测服务器、影像信号搜索装置、影像信号搜索方法、影像信号搜索程序与记录介质、信号搜索装置、信号搜索方法、及信号搜索程序与记录介质
CN101266795B (zh) * 2007-03-12 2011-08-10 华为技术有限公司 一种格矢量量化编解码的实现方法及装置
WO2011000567A1 (de) * 2009-07-02 2011-01-06 Siemens Enterprise Communications Gmbh & Co. Kg Verfahren zur vektor-quantisierung eines merkmalsvektors

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06132911A (ja) * 1992-10-16 1994-05-13 Oki Electric Ind Co Ltd ベクトル量子化テーブルのグレイコード化方法
JPH07170192A (ja) * 1993-12-16 1995-07-04 Toshiba Corp ベクトル量子化装置
JPH07199994A (ja) * 1993-12-28 1995-08-04 Nec Corp 音声符号化方式
JPH0863198A (ja) * 1994-08-22 1996-03-08 Nec Corp ベクトル量子化器
JPH08137495A (ja) * 1994-11-07 1996-05-31 Matsushita Electric Ind Co Ltd 音声符号化装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
JP2776050B2 (ja) 1991-02-26 1998-07-16 日本電気株式会社 音声符号化方式
JPH06138896A (ja) 1991-05-31 1994-05-20 Motorola Inc 音声フレームを符号化するための装置および方法
JPH06186998A (ja) 1992-12-15 1994-07-08 Nec Corp 音声符号化装置のコードブック探索方式
CA2136891A1 (en) * 1993-12-20 1995-06-21 Kalyan Ganesan Removal of swirl artifacts from celp based speech coders

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06132911A (ja) * 1992-10-16 1994-05-13 Oki Electric Ind Co Ltd ベクトル量子化テーブルのグレイコード化方法
JPH07170192A (ja) * 1993-12-16 1995-07-04 Toshiba Corp ベクトル量子化装置
JPH07199994A (ja) * 1993-12-28 1995-08-04 Nec Corp 音声符号化方式
JPH0863198A (ja) * 1994-08-22 1996-03-08 Nec Corp ベクトル量子化器
JPH08137495A (ja) * 1994-11-07 1996-05-31 Matsushita Electric Ind Co Ltd 音声符号化装置

Also Published As

Publication number Publication date
KR19980080612A (ko) 1998-11-25
SG71098A1 (en) 2000-03-21
DE69808687D1 (de) 2002-11-21
AU5970698A (en) 1998-10-01
DE69808687T2 (de) 2003-06-12
CN1203411A (zh) 1998-12-30
JP3593839B2 (ja) 2004-11-24
EP0867863B1 (en) 2002-10-16
US7464030B1 (en) 2008-12-09
JPH10276096A (ja) 1998-10-13
AU757927B2 (en) 2003-03-13
EP0867863A1 (en) 1998-09-30
CN1120472C (zh) 2003-09-03
TW371342B (en) 1999-10-01

Similar Documents

Publication Publication Date Title
US7149683B2 (en) Method and device for robust predictive vector quantization of linear prediction parameters in variable bit rate speech coding
US6427135B1 (en) Method for encoding speech wherein pitch periods are changed based upon input speech signal
EP0409239B1 (en) Speech coding/decoding method
EP1619664B1 (en) Speech coding apparatus, speech decoding apparatus and methods thereof
KR100304682B1 (ko) 음성 코더용 고속 여기 코딩
US7065338B2 (en) Method, device and program for coding and decoding acoustic parameter, and method, device and program for coding and decoding sound
JPH09127991A (ja) 音声符号化方法及び装置、音声復号化方法及び装置
JPH1091194A (ja) 音声復号化方法及び装置
JPH09127990A (ja) 音声符号化方法及び装置
JPH10124092A (ja) 音声符号化方法及び装置、並びに可聴信号符号化方法及び装置
JP3628268B2 (ja) 音響信号符号化方法、復号化方法及び装置並びにプログラム及び記録媒体
JPH07261800A (ja) 変換符号化方法、復号化方法
JP3275247B2 (ja) 音声符号化・復号化方法
KR100556278B1 (ko) 벡터탐색방법
JP3268750B2 (ja) 音声合成方法及びシステム
US7716045B2 (en) Method for quantifying an ultra low-rate speech coder
JP3916934B2 (ja) 音響パラメータ符号化、復号化方法、装置及びプログラム、音響信号符号化、復号化方法、装置及びプログラム、音響信号送信装置、音響信号受信装置
JP2613503B2 (ja) 音声の励振信号符号化・復号化方法
JP2968109B2 (ja) コード励振線形予測符号化器及び復号化器
JP3232701B2 (ja) 音声符号化方法
JP3252285B2 (ja) 音声帯域信号符号化方法
US20050096903A1 (en) Method and apparatus for performing harmonic noise weighting in digital speech coders
CA2137880A1 (en) Speech coding apparatus
JP3489748B2 (ja) 音声符号化装置及び音声復号化装置
JP3192051B2 (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120213

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee