KR100426514B1 - 복잡성이감소된신호전송시스템 - Google Patents
복잡성이감소된신호전송시스템 Download PDFInfo
- Publication number
- KR100426514B1 KR100426514B1 KR1019970707328A KR19970707328A KR100426514B1 KR 100426514 B1 KR100426514 B1 KR 100426514B1 KR 1019970707328 A KR1019970707328 A KR 1019970707328A KR 19970707328 A KR19970707328 A KR 19970707328A KR 100426514 B1 KR100426514 B1 KR 100426514B1
- Authority
- KR
- South Korea
- Prior art keywords
- excitation
- signal
- sequence
- sequences
- input
- Prior art date
Links
- 230000008054 signal transmission Effects 0.000 title claims description 4
- 230000005284 excitation Effects 0.000 claims abstract description 183
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 46
- 238000003786 synthesis reaction Methods 0.000 claims abstract description 46
- 239000002131 composite material Substances 0.000 claims abstract description 8
- 230000005540 biological transmission Effects 0.000 claims description 23
- 238000000034 method Methods 0.000 claims description 15
- 238000004458 analytical method Methods 0.000 claims description 9
- 230000001939 inductive effect Effects 0.000 claims 1
- 238000001914 filtration Methods 0.000 abstract description 8
- 230000003044 adaptive effect Effects 0.000 description 49
- 230000004044 response Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000012546 transfer Methods 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 6
- 230000009467 reduction Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000009432 framing Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000013139 quantization Methods 0.000 description 2
- 235000009027 Amelanchier alnifolia Nutrition 0.000 description 1
- 244000068687 Amelanchier alnifolia Species 0.000 description 1
- 241001237745 Salamis Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 235000015175 salami Nutrition 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/62—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for providing a predistortion of the signal in the transmitter and corresponding correction in the receiver, e.g. for improving the signal/noise ratio
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L2019/0001—Codebooks
- G10L2019/0013—Codebook search algorithms
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Radar Systems Or Details Thereof (AREA)
Abstract
CELP 코더에서, 타겟 신호 및 복수의 합성 신호들 사이의 비교가 이루어진다. 합성 신호는 타겟 신호로부터 유도된 파라미터들을 갖는 합성 필터에 의해 복수의 여기 순차들을 필터링함으로써 유도된다. 타겟 신호와 합성 신호 사이에 최소 오류를 발생시키는 여기 신호가 선택된다. 최상의 여기 신호의 탐색은 실질적인 계산상의 복잡성을 요구한다. 복잡성을 줄이기 위해 역방향 필터링된 타겟 신호를 가장 유사한 적은 수의 여기 순차들을 선택함으로써 적은 수의 여기 순차들의 사전선택이 이루어진다. 이러한 적은 수의 여기 순차들로써, 완전한 복잡성 탐색이 이루어진다. 최종 선택에 포함된 감소된 수의 여기 순차들로 인해, 요구되는 계산상의 복잡성이 감소된다.
Description
상기 전제부에 따른 송신 시스템은, "Communications, Computers and Power in Modern Environment Conference proceeding", Saskatoon, Canada, 17-18 May 1993, pp. 397-406, IEEE Wescanex 1993에 기재된 W.Grieder 등의 논문"Codebook searching for 4.8 kbps CELP speech coder"로부터 공지되어 있다.
그러한 송신 시스템들은 무선 채널, 동축 케이블 또는 광섬유와 같은 송신매체를 통한 음성 신호들의 송신을 위해 이용될 수 있다. 그러한 송신 시스템들은 또한 자기 테이프 또는 디스크와 같은 기록 매체상에 음성 신호들을 기록하는데 이용될 수 있다. 가능한 응용들은 자동 응답 기계들 또는 구술 녹음기들(dictating machines)이다.
현대의 음성 송신 시스템들에서, 송신될 음성 신호들은 합성 기술에 의한 분석을 이용하여 종종 코딩된다. 이러한 기술에서, 합성 신호는 복수의 여기 순차들에 의해 여기되는 합성 필터에 의해 발생된다. 합성 음성 신호는 복수의 여기 순차들에 대해 결정되고, 합성 신호와, 입력 신호로부터 유도된 타겟 신호 사이의 오류를 나타내는 오류 신호가 결정된다. 가장 작은 오류를 발생시키는 여기 순차가 선택되고, 코딩된 형태로 수신기에 송신된다.
수신기에서, 여기 순차는 복구되고, 합성 신호는 여기 순차를 합성 필터에 적용함으로써 발생된다. 이 합성 신호는 송신기의 입력 신호가 복제된 것이다.
양질의 신호 송신을 얻기 위해, 큰 수(예를들어, 1024)의 여기 순차들이 선택과 관련된다. 음성 코딩의 경우에, 여기 순차는 일반적으로 2 내지 5 ㎳의 지속 시간을 갖는 세그먼트이다. 16 ㎑의 샘플 주파수의 경우에, 이것은 32 내지 80개의 샘플들을 의미한다. 합성 필터의 파라미터들은 입력 신호의 특징적인 성질들을 나타내는 분석 파라미터들로부터 일반적으로 유도된다. 음성 코딩에서 대부분 이용되는 분석 파라미터들은 소위 예측 파라미터들이다. 예측 파라미터들의 수는 10에서 50까지 변할 수 있으며, 결과적으로 합성 필터의 차수(order)이다.
모든 여기 순차들에 대해 합성 음성 신호를 계산해야 하는 것은 실질적인 계산상의 부담을 발생시킨다.
본 발명은, 복수의 여기 순차(excitation sequence)들을 발생시키는 여기 순차 발생기를 지닌 인코더를 포함하고, 송신 채널을 거쳐 수신기에 입력 신호를 송신하는 송신기와, 여기 순차로부터 유도된 합성 신호와 입력 신호로부터 유도된 타겟 신호 사이에 최소 오류를 발생시키는 복수의 여기 신호들로부터 여기 순차를 선택하는 선택 수단과, 여기 순차로부터 합성 신호를 유도하는 합성 필터를 포함하며, 송신기는 수신기에 상기 선택된 여기 순차를 나타내는 신호를 송신하도록 배열되고, 수신기는 선택된 여기 순차를 나타내는 신호로부터 상기 선택된 여기 순차를 유도하는 여기 순차 발생기를 지닌 디코더를 포함하는, 송신 시스템에 관한 것이다.
본 발명은 또한 송신기, 인코더, 송신 방법 및, 인코딩 방법에 관한 것이다.
도 1은 본 발명이 적용될 수 있는 송신 시스템을 도시하는 도면.
도 2는 본 발명에 따른 인코더를 도시하는 도면.
도 3은 주 순차(main sequence)로부터 복수의 여기 순차들을 사전 선택하는 적응 코드북 선택 수단의 부분을 도시하는 도면.
도 4는 적어도 하나의 다른 여기 순차를 선택하는 선택 수단의 부분을 도시하는 도면.
도 5는 본 발명에 따른 여기 순차 선택 수단을 도시하는 도면.
도 6은 본 발명에 따른 고정 코드북 선택 수단을 도시하는 도면.
도 7은 도 1에 따른 송신 시스템에 사용될 디코더를 도시하는 도면.
본 발명의 목적은 계산상의 부담이 실질적으로 감소된 상기 전제부에 따른 송신 시스템을 제공하는 것이다.
그러므로 본 발명에 따른 송신 시스템은, 인코더가 입력 신호로부터 나머지 순차(residual sequence)를 유도하는 분석 필터를 포함하고, 인코더가 여기 순차들의 더 큰 세트로부터 나머지 순차와 가장 크게 유사한 복수의 여기 순차들을 선택하는 여기 순차 선택 수단을 포함하는 것을 특징으로 한다.
본 발명은, 송신 시스템의 복잡성이, 필터링된 타겟 신호 또는 나머지 신호를 이용하여 가능한 여기 순차들의 사전 선택을 실행함으로써, 실질적으로 감소될 수 있다는 인식에 기초한다. 선택된 여기 순차들은 필터링된 타겟 신호(또는 나머지 신호)와 가장 유사한 것들이다. 실험들은 선택 과정의 품질에 영향을 주지 않고 20에서 180 까지 변하는 인자로 코더의 복잡성을 감소시키는 것이 가능함을 보여주었다.
B. Atal, V. Cupermann 및, A. Gersho에 의해 편집된 책인 "Advances in Speech Coding", pp.145-156, Kluwer Academic Publishers, ISBN 0-7923-9091-1에서, R.A. Salami에 의한 "Binary pulse excitation: a novel approach to low complexity CELP coding"이라는 논문은 더 큰 코드북으로부터의 국부 코드북(local codebook)의 구성을 개시한다는 것이 관찰된다.
본 발명의 실시예는, 소정의 수의 0인 샘플값들에 의해 분리되는 0이 아닌 샘플값들을 여기 순차들이 포함하는 것을 특징으로 하며, 여기 순차 선택 수단이 복수의 여기 순차들에서 0이 아닌 샘플값들의 위치를 나머지 신호로부터 결정하도록 배열되는 것을 특징으로 한다.
소정의 수의 0인 값들로 분리된 등거리의 펄스를 이용하는 것은 여기 순차들을 필터링하기 위한 감소된 계산상의 복잡성을 발생시킨다. 다른 선택을 위해 고려될 여기 순차들에서 0이 아닌 샘플들의 위치를 우선 선택함으로써, 다른 선택에 포함된 여기 순차들의 수가 실질적으로 감소된다. 이것은 요구된 계산상의 복잡성의 실질적 감소를 일으킨다.
본 발명의 다른 실시예는 여기 순차들이 3중 여기 샘플(ternary excitation sample)들을 포함하고, 여기 순차 선택 수단들은 신호 샘플들의 부호가 나머지 순차에서 대응하는 샘플들의 부호와 다르지 않은 여기 순차들을 선택하도록 배열되는 것을 특징으로 한다.
3중 샘플값들을 이용하는 것은 낮은 계산상의 복잡성을 발생시키는데, 3중 신호의 필터링에 이용된 곱셈이 +1, 0 또는, -1로 곱셈하는 것만을 포함하기 때문이며, 이것은 용이하게 실행될 수 있다.
본 발명을 도면들을 참고하여 이제 설명될 것이다.
도 1에 따른 송신 시스템에서, 입력 신호는 송신기(2)에 인가된다. 송신기(2)에서, 입력 신호는 본 발명에 따른 인코더를 이용하여 인코딩된다. 인코더(4)의 출력 신호는, 송신 매체(8)를 거쳐 수신기(10)에 인코더(4)의 출력 신호를 송신하는, 송신 수단(6)의 입력에 인가된다. 송신 수단의 동작은, 가능하게는 송신 매체(8)에 적합한 캐리어 신호상의 2진 형태로, 인코더로부터의 (2진) 신호들을 변조하는 것을 포함할 수 있다. 수신기(10)에서, 수신된 신호는 프런트엔드(front end)(12)에 의해 디코더(14)에 적합한 신호로 변환된다. 프런트엔드(12)의 동작은 필터링, 복조 및, 2진 기호들의 검출을 포함할 수 있다. 디코더(14)는 프런트엔드(12)로부터의 출력 신호로부터 재구성된 입력 신호를 유도한다.
도 2에 따른 인코더에서, 디지털화된 입력 신호의 샘플들(i[n])을 전달하는 인코더(4)의 입력은 프레이밍 수단(framing means)(20)의 입력에 접속된다. 출력 신호(x[n])를 전달하는 프레이밍 수단의 출력은 고역 필터(22)에 접속된다. 출력신호(s[n])를 전달하는 고역 필터(22)의 출력은, 지각적 가중 필터(perceptual weighting filter)(32) 및, LPC 분석기(24)의 입력에 접속된다. 출력 신호(r[k]를 전달하는 LPC 분석기(24)의 제 1 출력은 양자화기(quantiser)(26)에 접속된다. LPC 분석기의 제 2 출력은 복잡성이 감소된 합성 필터에 대한 필터 계수(af)를 전달한다.
출력 신호(C[k])를 전달하는 양자화기(26)의 출력은, 보간기(interpolator)(28)의 입력 및 멀티플렉서(59)의 제 1 입력에 접속된다. 출력 신호(aq[k][s])를 전달하는 보간기(28)의 출력은, 지각적 가중 필터(32)의 제 2 입력, 0인 입력 응답 필터(34)의 입력 및, 임펄스 응답 계산기(36)의 입력에 접속된다. 신호(w[n])를 전달하는 지각적 가중 필터(32)의 출력은, 감산기(38)의 제 1 입력에 접속된다. 출력 신호(z[n])를 전달하는 0인 입력 응답 필터(34)의 출력은 감산기(38)의 제 2 입력에 접속된다.
타겟 신호(t[n])를 전달하는 감산기(38)의 출력은, 적응 코드북 선택 수단(40)의 입력, 적응 코드북 사전 선택 수단(adaptive codebook preselection means)(42)의 입력 및, 감산기의 입력에 접속된다. 출력 신호(h[n])를 전달하는 임펄스 응답 계산기(36)의 출력은 적응 코드북 선택 수단(40)의 입력, 적응 코드북 사전 선택 수단(42)의 입력, 고정 코드북 선택 수단(44)의 입력 및, 고정 코드북 사전 선택 수단(46)으로도 언급될 여기 신호 선택의 입력에 접속된다. 출력 신호(ia[k])를 전달하는 적응 코드북 사전 선택 수단(42)의 출력은 적응 코드북 선택 수단(40)의 입력에 접속된다. 적응 코드북 사전 선택 수단(42), 적응 코드북 선택 수단(40), 고정 코드북 사전 선택 수단(46) 및, 고정 코드북 선택 수단(44)의 결합은 선택 수단(45)을 형성한다.
출력 신호(Ga)를 전달하는 적응 코드북 선택 수단의 제 1 출력은, 멀티플렉서(59)의 제 2 입력과, 곱셈기(52)의 제 1 입력에 접속된다. 출력 신호(Ia)를 전달하는 적응 코드북 선택 수단의 제 2 출력은, 멀티플렉서(59)의 제 3 입력과, 적응 코드북(48)의 입력에 접속된다. 출력 신호(p[n])를 전달하는 적응 코드북 선택 수단(40)의 제 3 출력은 감산기(41)의 제 2 입력에 접속된다.
출력 신호(e[n])를 전달하는 감산기(41)의 출력은, 고정 코드북 선택 수단(44)의 제 2 입력과, 고정 코드북 사전 선택 수단(46)의 제 2 입력에 접속된다. 출력 신호(if[k])를 전달하는 고정 코드북 사전 선택 수단(46)의 출력은 고정 코드북 선택 수단(44)의 제 3 입력에 접속된다. 출력 신호(Gf)를 전달하는 고정 코드북 선택 수단의 제 1 출력은 곱셈기(54)의 제 1 입력과, 멀티플렉서(59)의 제 4 입력에 접속된다. 출력 신호(P)를 전달하는 고정 코드북 선택 수단(44)의 제 2 출력은, 여기 발생기(50)의 제 1 입력과, 멀티플렉서(59)의 제 5 입력에 접속된다. 출력 신호(L[k])를 전달하는 고정 코드북 선택 수단(44)의 제 3 출력은, 여기 발생기(50)의 제 2 입력과, 멀티플렉서(59)의 제 6 입력에 접속된다. 출력 신호(yf[n])를 전달하는 여기 발생기(50)의 출력은, 곱셈기(54)의 제 2 입력에 접속된다. 출력 신호(ya[n])을 전달하는 적응 코드북(48)의 출력은, 곱셈기(52)의 제 2 입력에 접속된다. 곱셈기(52)의 출력은 가산기(56)의 제 1 입력에 접속된다. 곱셈기(54)의 출력은 가산기(56)의 제 2 입력에 접속된다 출력 신호(yaf[n])를 전달하는가산기(56)의 출력은, 메모리 갱신 유닛(58)에 접속되며, 메모리 갱신 유닛은 적응 코드북(48)에 연결된다.
멀티플렉서(59)의 출력은 인코더(4)의 출력을 구성한다.
도 2에 따른 인코더의 실시예는 입력 신호가 0 내지 7 ㎑의 주파수 범위를 지닌 광대역 음성 신호라는 가정하에서 설명된다. 16 ㎑의 샘플링 속도를 가정한다. 그러나, 본 발명은 그러한 타입의 신호들에만 한정되지 않는다는 것이 관찰된다.
프레이밍 수단(20)에서 음성 신호(i[n])는, 또한 프레임들이라 불리는, N개의 신호 샘플들(x[n])의 순차들로 분할된다. 그러한 프레임의 지속 시간은 통상적으로 10 내지 30 mS이다. 고역 필터(22)에 의해, 프레이밍된 신호의 DC 내용(DC content of the framed signal)은, 고역 필터(22)의 출력에서 DC 프리 신호(DC free signal)가 이용가능하도록, 제거된다. 선형 예측 분석기(24)에 의해, K개의 선형 예측 계수들(a[k])이 결정된다. K는 통상적으로 협대역 음성에 대해서는 8 내지 12 사이에 있으며, 광대역 음성에 대해서는 16 내지 20 사이에 있으나, 이러한 통상적인 값에 대한 예외들이 가능하다. 선형 예측 계수들은 나중에 설명될 합성 필터에 이용된다.
예측 계수들(a[k])의 계산을 위해, 제 1 신호(s[n])는 가중된 신호(sw[n])를 얻도록 해밍 윈도우(Hamming window)로 가중된다. 예측 계수들(a[n])은 우선 자동상관 계수들(autocorrelation coefficients)을 계산하고 그후에 값들(a[k])을 재귀적으로 결정하기 위한 레빈슨-듀빈(Levinson-Durbin) 알고리즘을 실행하여신호(sw[n])로부터 유도된다. 제 1 재귀 단계의 결과는 복잡성이 감소된 합성 필터에서의 이용을 위해 (af)로서 저장된다. 대안으로, 복잡성이 감소된 합성 필터에 대한 파라미터들로서 제 2 재귀 단계의 결과들(af1 및 af2)을 저장하는 것이 가능하다. 제 2 차수의 복잡성이 감소된 합성 필터가 이용되면, 사전 선택만을 실행하는 것이 가능할 수 있다는 것이 관찰된다. 그다음에, 완전한 복잡성의 합성 필터를 이용하는 선택은 불필요할 수 있다. 예측 파라미터들(a[k])에 의해 나타낸 스펙트럼 포락선(spectral envelope)에서 매우 뾰족한 피크들을 제거하기 위해, 대역폭 확장 동작이 각각의 계수(a[k])를r k값과 곱함으로써 실행된다. 수정된 예측 계수들(ab[k])은 로그 영역 비율들(r[k])로 변형된다.
양자화기(26)는, 수신기에 로그 영역 비율들을 송신하기 위해 이용될, 비트들의 수를 줄이도록 불균일한 방식으로 로그 영역 비율들을 양자화한다. 양자화기(26)는 로그 영역 비율들의 양자화 레벨을 표시하는 신호(C[k])를 발생시킨다.
합성 필터에 대한 최적의 여기 순차의 선택을 위해 프레임들(s[n])은 S개의 서브프레임들로 세분된다. 부드러운 필터 전이들을 달성하기 위해, 보간기(28)는 각각의 서브 프레임에 대한 이전의 지수들(Cp[k])과 현재의 지수들(C[k]) 사이의 선형 보간을 실행하고, 대응하는 로그 영역 비율들을 예측 파라미터들(aq[k][s])로 변환시킨다. s는 현재의 서브 프레임의 지수와 동일하다.
합성 인코더에 의한 분석에서, 음성 신호의 프레임(또는 서브 프레임)은 합성 필터에 의해 필터링된 서로다른 여기 순차에 각각 대응하는 복수의 합성 음성 프레임들과 비교된다. 합성 필터의 전달 함수(transfer function of the synthesis filter)는 1/A(z)와 동일하며, A(z)는, 하기 식과 동일하다.
식 (1)에서 P는 예측 차수(prediction order)이고, k는 러닝 지수(running index)이며, z-1은 단일 지연 오퍼레이터(unity delay operator)이다.
인간의 청각 시스템의 지각적 성질들(perceptual properties)을 다루기 위해 음성 프레임과 합성 음성 프레임 사이의 차이가 전달 함수 A(z)/A(z/r)를 지닌 지각적 가중 필터(perceptual weighting filter)에 의해 필터링된다.r는 보통 약 0.8인 값을 갖는 상수이다. 선택된 최적의 여기 신호는 지각적 가중 필터의 출력 신호의 최소 전력을 발생시키는 여기 신호이다.
대부분의 음성 코더들에서 지각적 가중 필터링 동작은 비교 동작전에 실행된다. 이것은 음성 신호가 전달 함수 A(z)/A(z/r)를 지닌 필터에 의해 필터링되어야 하고, 합성 필터는 전달 함수 1/A(z/r)를 지닌 수정된 합성 필터에 의해 대체되어야함을 의미한다. 또한, 전달 함수 A(z/r 1)/A(z/r 2)를 지닌 필터와 같은, 다른 타입의 지각적으로 가중인 필터들이 이용되는 것이 관찰된다. 지각적 가중 필터(32)는 상기에 논의된 바와같이 전달 함수 A(z)/A(z/r)에 따라 음성 신호의 필터링을 실행한다. 지각적 가중 필터(32)의 파라미터들은 보간된 예측 파라미터들(aq[k][s])로 각각의 서브 프레임마다 갱신된다. 본 발명의 범위는 지각적 가중 필터의 전달 함수의 모든 변형들 및 지각적 가중 필터의 모든 위치들을 포함한다는 것이 관찰된다.
수정된 합성 필터의 출력 신호는 또한, 이전의 서브프레임들로부터 상기 선택된 여기 순차들에 의존한다. 현재의 여기 순차 및 이전의 여기 순차들에 의존하는 합성 음성 신호의 부분들을 분리될 수 있다. 0인 입력 필터의 출력 신호가 현재의 여기 순차와 독립하기 때문에, 도 2의 필터(34)로 행해진 바와같이 음성 신호 경로로 이동될 수 있다.
수정된 합성 필터의 출력 신호가 지각적으로 가중된 음성 신호로부터 감산되므로, 0인 입력 응답 필터(34)의 신호는 또한, 지각적으로 가중된 음성 신호로부터 감산되어야 한다. 이러한 감산은 감산기(38)에 의해 실행된다. 감산기(38)의 출력에서 타겟 신호(t[n])는 이용가능하다.
인코더(4)는 국부 디코더(30)를 포함한다. 국부 디코더(30)는 복수의 이전에 선택된 여기 순차들을 그후에 저장하는 적응 코드북(adaptive codebook)(48)을 포함한다. 적응 코드북(48)은 적응 코드북 지수(Ia)로 어드레싱된다. 적응 코드북(48)의 출력 신호(ya[n])는 곱셈기(52)에 의해 이득 인자(Ga)로 스케일링된다. 국부 디코더(30)는 복수의 소정의 여기 순차들을 발생시키도록 배열된 여기 발생기(50)를 또한 포함한다. 여기 순차(yf[n])는 소위 규칙적 펄스 여기 순차(regular pulse exciration sequence)이다. 그것은 0인 값을 지닌 복수의 샘플에 의해 분리된 복수의 여기 샘플들을 포함한다. 여기 샘플들의 위치는 파라미터(PH(위상))에 의해 표시된다. 여기 샘플들은 -1, 0 및, +1중 하나를 가질수 있다. 여기 샘플들의 값들은 변수(L[k])에 의해 주어진다. 여기 발생기(50)의 출력 신호(yf[n])는 곱셈기(54)에 의해 이득 인자(Gf)로써 스케일링된다. 곱셈기들(52 및, 54)의 출력 신호들은 여기 신호(yaf[n])로 가산기(56)에 의해 가산된다. 이러한 신호(yaf[n])는 다음 서브 프레임에서 이용하기 위해 적응 코드북(48)에 저장된다.
적응 코드북 사전 선택 수단(42)에서, 감소된 세트의 여기 순차들이 결정된다. 이들 순차들의 지수들(ia[k])은 적응 코드북 선택 수단(40)으로 넘겨진다. 적응 코드북 사전 선택 수단(42)에서 제 1 차수의 복잡성이 감소된 합성 필터가 본 발명에 따라 이용된다. 또한 모든 가능한 여기 순차들이 고려되지는 않으나, 감소된 수의 여기 순차들은 적어도 2개의 위치들의 상호 변위(mutual displacement)를 갖는다. 양호한 선택은 2에서 5까지의 범위에서의 변위이다. 이용된 합성 필터의 복잡성의 감소 및, 고려된 여기 순차들의 수의 감소는 인코더의 복잡성의 실질적인 감소를 준다.
적응 코드북 선택 수단(40)은 최상의 여기 순차를 사전 선택된 여기 순차들로부터 유도하도록 배열된다. 이러한 선택에서 완전한 복잡성의 합성 필터가 이용되며, 사전 선택된 여기 순차들 부근의 작은 수의 여기 순차들이 시도된다. 시도된 여기 순차들 사이의 변위는 사전 선택에 이용된 변위보다 더 작다. 1의 변위가 본 발명에 따른 인코더에서 이용된다. 포함된 작은 수의 여기 순차들로 인해, 최종 선택의 부가적인 복잡성은 낮다. 적응 코드북 선택 수단은 또한, 가중된 합성 필터에 의해 상기 저장된 여기 순차들을 필터링하고, Ga 값으로 합성 신호를 곱함으로써얻어진 합성 신호인, 신호(p[n])를 또한 발생시킨다.
감산기(41)는 차이 신호(difference signal)(e[n])를 유도하도록 타겟 신호(t[n])로부터 신호(p[n])를 감산한다. 고정 코드북 사전 선택 수단(46)에서, 역방향 필터링된 타겟 신호(tf[n])는 신호(e[n])로부터 유도된다. 가능한 여기 순차들로부터, 필터링된 타겟 신호와 가장 유사한 여기 순차들이 사전 선택되고, 그 지수들(if[k])이 고정 코드북 선택 수단(44)으로 넘겨진다. 고정 코드북 선택 수단(44)은 고정 코드북 사전 선택 수단(46)에 의해 사전 선택된 것들로부터 최적의 여기 신호의 탐색을 실행한다. 이러한 탐색에서 완전한 복잡성의 합성 필터가 이용된다. 신호들(C[k], Ga, Ia, Gf, PH 및, L[k])은 멀티플렉서(59)에 의해 단일 출력 스트림으로 멀티플렉싱된다.
임펄스 응답값들(h[n])은 재귀(recursion)에 따라 예측 파라미터들(aq[k][s])로부터 임펄스 응답 계산기(36)에 의해 계산된다.
식 (2)에서 Nm은 임펄스 응답의 요구되는 길이이다. 본 시스템에서 이러한 길이는 서브프레임에서의 샘플들의 수와 동일하다.
도 3에 따른 적응 코드북 사전 선택 수단(42)에서, 타겟 신호(t[n])는 시간 반전기(time reverser)(50)의 입력에 인가된다. 시간 반전기(50)의 출력은 0인 상태의 필터(52)의 입력에 접속된다. 0인 상태의 필터(52)의 출력은 시간 반전기(54)의 입력에 접속된다. 시간 반전기(54)의 출력은 교차 상관기(cross correlator)(56)의 제 1 입력에 접속된다. 교차 상관기(56)의 출력은 디바이더(divider)(64)의 제 1 입력에 접속된다.
적응 코드북(48)의 출력은 교차 상관기(56)의 제 2 입력에 접속되며, 선택 스위치(49)를 거쳐서, 복잡성이 감소된 0인 상태의 합성 필터(60)의 입력에 접속된다. 선택 스위치의 다른 단말기는 또한 메모리 갱신 유닛(58)의 출력에 접속된다. 복잡성이 감소된 합성 필터(60)의 출력은 에너지 추정기(energy estimator)(62)의 입력에 접속된다. 에너지 추정기(62)의 출력은 에너지 테이블(energy table)(63)의 입력에 접속된다. 에너지 테이블(63)의 출력은 디바이더(64)의 제 2 입력에 접속된다. 디바이더(64)의 출력은 피크 검출기(65)의 입력에 접속되고, 피크 검출기(65)의 출력은 실렉터(selector)(66)의 입력에 접속된다. 실렉터(66)의 제 1 출력은 서로다른 여기 순차들을 선택하기 위해 적응 코드북(48)의 입력에 접속된다. 적응 코드북으로부터 사전 선택된 여기 순차를 표시하는 신호를 전달하는 실렉터(66)의 제 2 출력은 적응 코드북(48)의 선택 입력에 접속되며, 에너지 테이블(63)의 선택 입력에 접속된다.
적응 코드북 사전 선택 수단(42)은 적응 코드북 및 대응하는 이득 인자(ga)로부터 여기 순차를 선택하도록 배열된다. 이러한 동작은 다음식과 동일한 오류 신호()를 최소화하는 것으로 기록될 수 있다.
식 (3)에서 Nm은 서브프레임에서의 샘플들의 수이고, y[l][n]은 여기 순차(ca[l][n])에 대한 0인 상태의 합성 필터의 응답이다. ga에 대해 식 (3)을 미분하고, 그 도함수를 ga의 최적값에 대해 0과 동일하게 나타냄으로써, 하기 식이 발견될 수 있다.
식 (6)에서 h[n]은 식 (2)에 따라 계산된 바와같이 도 3에서 필터(52)의 임펄스 응답이다. 식 (6)은 또한 하기 식과 같이 쓸 수 있다.
식 (7)은 적응 코드북의 사전 선택에서 이용된다. 식 (7)을 이용하는 이점은 식(7)의 분자를 결정하기 위해 단지 하나의 필터 동작이 모든 코드북 기재사항들(codebook entries)에 대해 요구된다는 것이다. 식 (6)을 이용하는 것은 사전 선택에 포함된 각각의 코드북 기재사항에 대해 하나의 필터의 동작을 요구할 것이다. 그 계산이 여전히 모든 코드북 기재사항들을 필터링하는 것을 필요로 하는, 식 (7)의 분모를 결정하기 위해서, 복잡성이 감소된 합성 필터가 이용된다.
f[l]의 분모 Ea는 복잡성이 감소된 합성 필터(60)로 필터링된 관련된 여기 순차의 에너지이다. 실험들은 단일 필터 계수는 다소 느리게 변한다는 것을 보여주었으며, 그래서 프레임당 한 번씩만 갱신되어야 한다. 프레임당 한 번만 여기 순차들의 에너지를 계산하는 것이 또한 가능하지만, 이것은 약간 수정된 선택 과정을 요구한다. 적응 코드북으로부터 여기 순차들을 사전 선택하기 위해, 식 (7)로부터 유도된 기준 rap[i · Lm+l]가 하기 식에 따라 계산된다.
식 (8)에서 i 및 l 은 러닝 과라미터들(running parameters)이며, Lmin은 고려되는 음성 신호의 최소의 가능한 피치 주기(pitch period)이고, Nm은 서브프레임당 샘플들의 수이고, Sa는 후속 여기 순차들 사이의 변위이고, Lm은 서브 프레임당저장된 에너지 값들의 수를 정의하는 상수이며, 그것은 1+(Nm-1)/Sa와 동일하다. 식 (8)에서 따른 탐색은 0≤l〈Lm 및 0≤i〈S에 대해서 실행된다. 탐색은 적응 코드북(48)에서 이전에 기록된 여기 순차의 시작에 대응하는 제 1 코드북 기재사항을 항상 포함하도록 배열된다. 이것은 에너지 테이블(63)에 저장된 이전에 계산된 에너지 값들 Ea의 재이용을 허용한다.
적응 코드북(48)을 갱신하는 순간에, 이전의 서브프레임의 선택된 여기 신호(yaf[n])는 메모리 갱신 유닛(58)에 존재한다. 선택 스위치(49)는 위치 0에 있으며, 새로이 이용가능한 여기 순차들은 복잡성이 감소된 합성 필터(60)에 의해 필터링된다. 새로운 필터링된 여기 순차들의 에너지 값들은 Lm개의 메모리 위치들에 저장된다. 메모리(63)에 이미 존재하는 에너지 값들은 아래쪽으로 이동된다. 가장 오래된 Lm개의 에너지 값들은 메모리(63)로부터 이동되는데, 대응하는 여기 순차들이 적응 코드북내에 더 이상 존재하지 않기 때문이다. 타겟 신호(ta[n])는 시간 반전기(50), 필터(52) 및, 시간 반전기(54)의 결합에 의해 계산된다. 상관기(56)는 식(8)의 분자를 계산하고, 디바이더(64)는 식 (8)의 분모에 의한 식 (8)의 분자로부터의 나눗셈을 실행한다. 피크 검출기(65)는 식 (8)의 Pa개의 가장 큰 값들을 주는 코드북 지수들의 지수들을 결정한다. 실렉터(66)는 피크 실렉터(56)에 의해 발견된 Pa개의 순차들의 이웃하는 여기 순차들의 지수들을 부가하고, 적응 코드북 실렉터(40)에 모든 이들 지수들을 넘긴다.
프레임의 중간에서(S/2 개의 서브프레임들이 통과된 후에), (af)의 값이 갱신된다. 그후에, 선택 스위치가 위치 1에 놓이며, 적응 코드북 사전 선택들과 관련된 여기 순차들에 대응하는 모든 에너지 값들이 재계산되고 메모리(63)에 저장된다.
도 4에 따른 적응 코드북 실렉터(40)에서 적응 코드북(48)의 출력은 (완전한 복잡성의) 0인 상태의 합성 필터(70)의 출력에 접속된다. 합성 필터(70)는 계산기(36)로부터 임펄스 응답 파라미터를 수신한다. 합성 필터(70)의 출력은 상관기(72)의 입력 및 에너지 추정기(74)의 입력에 접속된다. 타겟 신호(t[n])는 상관기(72)의 제 2 입력에 인가된다. 상관기(72)의 출력은 디바이더(76)의 제 1 입력에 접속된다. 에너지 추정기(74)의 출력은 디바이더(76)의 제 2 입력에 접속된다. 디바이더(76)의 출력은 실렉터(78)의 제 1 입력에 접속된다. 사전 선택된 여기 순차들의 지수들(ia[k])은 실렉터(78)의 제 2 입력에 인가된다. 실렉터의 제 1 출력은 적응 코드북(48)의 선택 입력에 접속된다. 실렉터(78)의 2개의 다른 출력들은 출력 신호들(Ga 및 Ia)을 제공한다.
최적의 여기 순차의 선택은 항(ra[r])를 최대화하는 것에 대응한다. 상기 항(ra[r])은 하기 식과 동일하다.
식 (9)는 식 (5)의 항 f[l]에 대응한다. 신호 y[r][n]는 필터(70)에 의해 여기 순차들로부터 유도된다. 필터(70)의 초기 상태들은, 여기 순차가 필터링되기 전에, 매번 0으로 설정된다. 변수 ia[r]는 사전 선택된 여기 순차들 및 그 이웃들의 지수들을 증가하는 지수 순서로 포함한다고 가정된다. 이것은 ia[r]이 지수들의 Pa개의 후속 그룹들을 포함한다는 것을 의미하며, 이들 그룹들 각각은 적응 코드북의 Sa개의 연속적인 지수들을 포함한다. 그룹중 제 1 지수를 지닌 코드북 기재사항에 대해서, y[r · Sa][n]은 하기 식에 따라 계산된다.
하나를 제외한 동일한 여기 샘플들이 y[r · Sa+l][n]의 계산과 관련되기 때문에, 값 y[r · Sa+l][n]은 y[r ·Sa][n]으로부터 재귀적으로 결정될 수 있다. 이러한 재귀는 한 그룹 내에서 지수를 갖는 모든 여기 순차들에 대해 적용될 수 있다. 일반적으로 재귀에 대해서 하기 식을 쓸 수 있다.
상관기(72)는 필터(70)의 출력 신호와 타겟 신호(t[n])로부터 식 (9)의 분자를 결정한다. 에너지 추정기(74)는 식 (9)의 분모를 결정한다. 디바이더의 출력에서 식(9)의 값이 이용가능하다. 실렉터(78)는 모든 사전 선택된 지수들에 대해 식 (9)가 계산되도록 하고 적응 코드북(48)의 최적의 지수(Ia)를 저장한다. 그후에, 실렉터는 하기 식에 따라 이득값 g를 계산한다.
식 (12)에서, y는 지수(Ia)를 지닌 선택된 여기 순차에의 필터(70)의 응답이다. 이득 인자 g는, 불균일한 양자화에 의해, 실렉터(78)의 출력에 제공된 양자화된 이득 인자(Ga)로 양자화된다. 실렉터(78)는 또한 하기 식에 따라 합성 신호에의적응 코드북의 기여(P[n])를 출력한다.
도 5에 따른 고정 코드북 사전 선택 수단에서, 신호(e[n])는 역방향 필터(80)의 입력에 인가된다. 역방향 필터(80)의 출력은 상관기(86)의 제 1 입력 및 위상 실렉터(82)의 입력에 접속된다. 위상 실렉터의 출력은 진폭 실렉터(84)의 입력에 접속된다. 진폭 실렉터(84)의 출력은 상관기(86)의 제 2 입력 및 복잡성이 감소된 합성 필터(88)의 입력에 접속된다. 복잡성이 감소된 합성 필터(88)의 출력은 에너지 추정기(90)의 입력에 접속된다.
상관기(86)의 출력은 디바이더(92)의 제 1 입력에 접속된다. 에너지 추정기(90)의 출력은 디바이더(92)의 제 2 입력에 접속된다. 디바이더(92)의 출력은 실렉터(94)의 입력에 접속된다. 실렉터의 출력에서 고정 코드북의 사전 선택된 여기 순차들의 지수들(if[k])은 이용가능하다.
역방향 필터(80)는 신호(e[n])로부터 역방향 필터링된 신호 tf[n]을 계산한다. 역방향 필터의 동작은 도 3에 따른 적응 코드북 사전 선택 수단(42)내의 역방향 필터링 동작과 관련하여 서술된 바와 동일하다. 고정 코드북은 소위 3중 RPE 코드북(ternary RPE codebook)(규칙적 펄스 여기), 즉 소정의 수의 0인 값들로 분리된 복수의 등거리 펄스들을 포함하는 코드북으로서 배열된다. 3중 RPE 코드북은, 그 Np개의 펄스들이 +1, 0 또는, -1의 진폭을 가질 수 있는, Nm개의 펄스들을 가진다. 이들 Np개의 펄스들은 0≤PH〈D인 위상(PH) 및 펄스 간격(D)에 의해 정의된 규직적 그리드(regular grid)상에 위치된다. 그리드 위치들 pos는 0≤l〈Np인 PH+D·l에 의해 주어진자. 나머지 Nm-Np개의 펄스들은 0이다. 상기에 정의한 바와 같은 3중 RPE 코드북은 D ·(3Np-1)개의 기재사항들은 갖는다. 복잡성을 줄이기 위해, Nf개의 기재사항들의 서브세트를 포함하는 국부 RPE 코드북이 각각의 서브 프레임에 대해 발생된다. 이러한 국부 RPE 코드북의 모든 여기 순차들은, 하기 식을 최대화하는 (PH)의 값을 간격 0≤PH〈D에 대해 탐색함으로써 위상 실렉터(82)에 의해 결정되는 동일한 위상(PH)을 가진다.
진폭 실렉터(84)에서 2개의 어레이들이 채워진다. 제 1 어레이인 amp는, sign이 시그넘 함수(signum function)인, sign(tf[PH+D ·l])과 동일한 변수들 amp[l]을 포함한다. 제 2 어레이인 pos[l]은, |tf[PH+D·l]|의 N2개의 가장 큰 값들을 표시하는 플래그(flag)를 포함한다. 이들 값들에 대해 여기 펄스들은 0인 값을 갖도록 허용되지 않는다. 그후에, 2차원 어레이 cf[k][n]은, 위상(PH)을 가지며, 어레이들 amp 및 pos의 내용에 의해 각각 부여되는 요구 조건들을 만족시키는 샘플값들을 갖는, Nf개의 여기 순차들로 채워진다. 이들 여기 순차들은 나머지 순차와 가장 크게 유사한 여기 순차들이며, 역방향 필터링된 신호 tf[n]에 의해 나타내진다.
후보 여기 순차(candidate excitation sequence)의 선택은 적응 코드북 사전 선택 수단(42)에 이용된 것과 동일한 원리에 기초한다. 상관기(86)는 역방향 필터 링된 신호 tf[n] 및 사전 선택된 여기 순차들 사이의 상관값을 계산하였다. (복잡성이 감소된) 합성 필터(88)는 여기 순차들을 필터링하도록 배열되며, 에너지 추정기(90)는 필터링된 여기 순차들의 에너지를 계산한다. 디바이더는 여기 순차에 대응하는 에너지로 상관값을 나눈다. 실렉터(94)는 디바이더(92)의 출력 신호의 Pf개의 가장 큰 값들에 대응하는 여기 순차들을 선택하고, 후보 여기 순차들의 대응하는 지수들을 어레이(if[k])에 저장한다.
도 6에 따른 고정 코드북 선택 수단(44)에서, 감소된 코드북(94)의 출력은 합성 필터(96)의 입력에 접속된다. 합성 필터(96)의 출력은 상관기(98)의 제 1 입력 및 에너지 추정기(100)의 입력에 접속된다. 신호(e[n])는 상관기(98)의 제 2 입력에 인가된다. 상관기(98)의 출력은 곱셈기(108)의 제 1 입력 및 디바이더(102)의 제 1 입력에 접속된다. 에너지 추정기(100)의 출력은 디바이더(102)의 제 2 입력 및 곱셈기(112)의 입력에 접속된다. 디바이더(102)의 출력은 양자화기(104)의 입력에 접속된다. 양자화기(104)의 출력은 곱셈기(105) 및 제곱기(squarer)(110)의 입력에 접속된다.
곱셈기(105)의 출력은 곱셈기(108)의 제 2 입력에 접속된다. 제곱기(110)의 출력은 곱셈기(112)의 제 2 입력에 접속된다. 곱셈기(108)의 출력은 감산기(114)의 제 1 입력에 접속되며, 곱셈기(112)의 출력은 감산기(114)의 제 2 입력에 접속된다. 감산기(114)의 출력은 실렉터(116)의 입력에 접속된다. 실렉터(116)의 제 1 출력은 감소된 코드북(94)의 선택 입력에 접속된다. 출력 신호들(P, L[k], Gf)을 지닌 실렉터(116)의 3개의 출력들은 고정 코드북 탐색의 최종 결과들을 제공한다.
고정 코드북 선택 수단(42)에서, 최적의 여기 순차를 위한 폐쇄 루프 탐색이실행된다. 탐색은, 표현 rf[r]이 최대인, 지수 r을 결정하는 것을 포함한다. rf[r]은 하기 식과 동일하다.
식 (15)에서 y[r][n]은 필터링된 여기 순차이며, Gf는 하기 식과 동일한 최적의 이득 인자 g의 양자화된 버전이다.
식 (15)는,에 대한 식을 전개하고, r에 의존하지 않는 항들을 삭제하고, 최적의 이득 g를 양자화된 이득 Gf로 대체함으로써 얻어진다. 신호 y[r][n]은 하기 식에 따라 계산될 수 있다.
cf[if[r]][j]는 j=P+D ·l(0≤1〈Np)에 대해 0이 아닌 값들만을 가질 수 있으므로, 식 (17)은 하기 식으로 간략화될 수 있다.
식 (18)의 결정은 필터(96)에 의해 실행된다. 식 (15)의 분자는 상관기(98)에 의해 결정되고 식 (15)의 분모는 에너지 추정기(100)에 의해 계산된다. g의 값은 디바이더(102)의 출력에서 이용가능하다. g의 값은 양자화기(104)에 의해 Gf로양자화된다. 곱셈기(108)의 출력에서, 식 (15)의 제 1 항이 이용가능하고, 곱셈기(112)의 출력에서 식 (15)의 제 2 항이 이용가능하다. 표현 rf[r]은 감산기(114)의 출력에서 이용가능하다. 실렉터(116)는 식 (15)를 최대화하는 r의 값을 선택하고, 그 출력들에서 이득(Gf), 0이 아닌 여기 펄스들의 진폭(L[k]) 및, 여기 순차의 최적의 위상(PH)을 제공한다.
도 7에 따른 디코더(14)의 입력 신호는, 디멀티플렉서(118)의 입력에 인가된다. 신호(C[k])를 전달하는 디멀티플렉서(118)의 제 1 출력은 보간기(130)의 입력에 접속된다. 신호(Ia)를 전달하는 디멀티플렉서(118)의 제 2 출력은 적응 코드북(120)의 입력에 접속된다. 적응 코드북(120)의 출력은 곱셈기(124)의 제 1 입력에 접속된다. 신호(Ga)를 전달하는 디멀티플렉서(118)의 제 3 출력은 곱셈기(124)의 제 2 입력에 접속된다. 신호(Gf)를 전달하는 디멀티플렉서(118)의 제 4 출력은 곱셈기(126)의 제 1 입력에 접속된다. 신호(PH)를 전달하는 디멀티플렉서(118)의 제 5 출력은 여기 발생기(122)의 제 1 입력에 접속된다. 신호(L[k])를 전달하는 디멀티플렉서(118)의 제 6 출력은 여기 발생기(122)의 제 2 입력에 접속된다. 여기 발생기의 출력은 곱셈기(126)의 제 2 입력에 접속된다. 곱셈기(124)의 출력은 가산기(128)의 제 1 입력에 접속되며, 곱셈기(126)의 출력은 가산기(128)의 제 2 입력에 접속된다.
가산기(128)의 출력은 합성 필터(132)의 제 1 입력에 접속된다. 합성 필터의 출력은 포스트 필터(post filter)(134)의 제 1 입력에 접속된다. 보간기(130)의 출력은 합성 필터(132)의 제 2 입력에 접속되고, 포스트 필터(134)의 제 2 입력에 접속된다. 디코딩된 출력 신호는 포스트 필터(134)의 출력에서 이용가능하다.
적응 코드북(120)은 각각의 서브프레임에 대해 지수(Ia)에 따라 여기 순차를 발생시킨다. 상기 여기 신호는 곱셈기(124)에 의해 이득 인자(Ga)로써 스케일링된다. 여기 발생기(122)는 각각의 서브프레임에 대한 위상(PH)과 진폭값들(L[k])에 따라 여기 순차를 발생시킨다. 여기 발생기(122)로부터의 여기 신호는 곱셈기(126)에 의해 이득 인자(Gf)로써 스케일링된다. 곱셈기들(124 및, 126)의 출력 신호들은 완전한 여기 신호를 얻도록 가산기(128)에 의해 가산된다. 이러한 여기 신호는 그 내용을 적응시키기 위해 적응 코드북(120)으로 피드백된다. 합성 필터(132)는, 각각의 서브프레임마다 갱신되는 보간된 예측 파라미터들 aq[k][s]의 제어하에 가산기(128)의 출력에서, 여기 신호로부터 합성 음성 신호를 유도한다. 보간된 예측 파라미터들 aq[k][s]는, 파라미터들(C[k])의 보간 및, 보간된 (C[k]) 파라미터들의 예측 파라미터들로의 변환에 의해 유도된다. 포스트 필터(134)는 음성 신호의 지각적 품질을 향상시키도록 이용된다. 그것은 하기 식과 동일한 전달 함수를 갖는다.
식 (19)에서, G[s]는 포스트 필터(134)의 필터 함수의 변하는 감쇠(the varing attenuation of the filter function of the post filter)를 보상하기 위한 이득 인자이다.
Claims (10)
- 송신 채널을 통해 수신기에 입력 신호를 송신하는 송신기를 포함하는 송신 시스템으로서, 상기 송신기는 복수의 여기 순차들(excitation sequences)을 발생시키는 여기 순차 발생기를 지닌 인코더와, 상기 여기 순차로부터 유도된 합성 신호와 상기 입력 신호로부터 유도된 타겟 신호 사이에 최소 오류를 발생시키는 복수의 여기 신호들로부터 여기 순차를 선택하는 선택 수단과, 상기 여기 순차로부터 합성 신호를 유도하는 합성 필터를 포함하며, 상기 송신기는 상기 선택된 여기 순차를 나타내는 신호를 상기 수신기에 송신하도록 배열되고, 상기 수신기는 상기 선택된 여기 순차를 나타내는 신호로부터 상기 선택된 여기 순차를 유도하는 여기 순차 발생기를 지닌 디코더를 포함하는, 상기 송신 시스템에 있어서,상기 인코더는 상기 입력 신호로부터 나머지 순차(residual sequence)를 유도하는 분석 필터를 포함하고, 상기 인코더는 상기 나머지 순차와 가장 크게 유사한 복수의 여기 순차들을 더 큰 세트의 여기 순차들로부터 선택하는 여기 순차 선택 수단을 포함하는 것을 특징으로 하는 송신 시스템.
- 제 1 항에 있어서,상기 여기 순차들은 소정의 수의 0인 샘플값들에 의해 분리되는 0이 아닌 샘플값들을 포함하고, 상기 여기 순차 선택 수단은 상기 복수의 여기 순차들에서 상기 0이 아닌 샘플값들의 위치를 나머지 신호로부터 결정하도록 배열되는 것을 특징으로 하는 송신 시스템.
- 제 1 항 또는 제 2 항에 있어서,상기 여기 순차들은 3중 여기 샘플들(ternary excitation samples)을 포함하며, 상기 여기 순차 선택 수단들은, 신호 샘플들의 부호가 상기 나머지 순차에서 대응하는 샘플들의 부호와 다르지 않은, 여기 순차들을 선택하도록 배열되는 것을 특징으로 하는 송신 시스템.
- 제 1 항 또는 제 2 항에 있어서,상기 여기 순차들은 3중 여기 샘플들을 포함하고, 상기 여기 순차 선택 수단들은, 신호 샘플들의 부호가 N개의(N은 양의 정수) 가장 큰 샘플들의 부호에 대응하는, 여기 순차들을 상기 나머지 순차로부터 선택하도록 배열되는 것을 특징으로 하는 송신 시스템.
- 입력 신호를 송신하는 송신기로서, 복수의 여기 순차들을 발생시키는 여기 순차 발생기를 지닌 인코더와, 상기 여기 순차로부터 유도된 합성 신호와 상기 입력 신호로부터 유도된 타켓 신호 사이에 최소 오류를 발생시키는 복수의 여기 신호들로부터 여기 순차를 선택하는 선택 수단을 포함하고, 상기 선택된 여기 순차를 나타내는 신호를 송신하도록 배열되는, 상기 송신기에 있어서,상기 인코더는 상기 입력 신호로부터 나머지 순차를 유도하는 분석 필터를포함하고, 상기 나머지 순차와 가장 크게 유사한 복수의 여기 순차들을 더 큰 세트의 여기 순차들로부터 선택하는 여기 순차 선택 수단을 포함하는 것을 특징으로 하는, 송신기.
- 제 5 항에 있어서,상기 여기 순차들은 소정의 수의 0인 샘플값들에 의해 분리되는 0이 아닌 샘플값들을 포함하고, 상기 여기 순차 선택 수단들은 상기 복수의 여기 순차들에서 상기 0이 아닌 샘플값들의 위치를 나머지 신호로부터 결정하도록 배열되는 것을 특징으로 하는, 송신기.
- 복수의 여기 순차들을 발생시키는 여기 순차 발생기와, 상기 여기 순차로부터 유도된 합성 신호와 입력 신호로부터 유도된 타겟 신호 사이에 최소 오류를 발생시키는 복수의 여기 신호들로부터 여기 순차를 선택하는 선택 수단을 포함하며, 상기 선택된 여기 순차를 나타내는 신호를 출력하도록 배열되는 인코더에 있어서,상기 입력 신호로부터 나머지 순차를 유도하는 분석 필터를 포함하며, 상기 나머지 순차와 가장 크게 유사한 복수의 여기 순차들을 더 큰 세트의 여기 순차들로부터 선택하는 여기 순차 선택 수단을 포함하는 것을 특징으로 하는 인코더.
- 제 7 항에 있어서,상기 여기 순차들은 소정의 수의 0인 샘플값들에 의해 분리되는 0이 아닌 샘플값들을 포함하고, 상기 여기 순차 선택 수단들은 상기 복수의 여기 순차들에서 0이 아닌 샘플값들의 위치를 나머지 신호로부터 결정하도록 배열되는 것을 특징으로 하는, 인코더.
- 입력 신호를 송신하는 방법으로서, 복수의 여기 순차들을 발생시키는 단계와, 상기 여기 순차로부터 유도된 합성 신호와 상기 입력 신호로부터 유도된 타겟 신호 사이에 최소 오류를 발생시키는 복수의 여기 신호들로부터 여기 순차를 선택하는 단계와, 상기 선택된 여기 순차를 나타내는 신호를 송신하는 단계를 포함하는, 상기 입력 신호 송신 방법에 있어서,분석 필터 동작에 따라 나머지 순차를 상기 입력 신호로부터 유도하는 단계를 포함하고, 상기 나머지 순차와 가장 크게 유사한 복수의 여기 순차들을 더 큰 세트의 여기 순차들로부터 선택하는 단계를 포함하는 것을 특징으로 하는 입력 신호 송신 방법.
- 제 9 항에 있어서,상기 여기 순차들은 소정의 수의 0인 샘플값들에 의해 분리되는 0이 아닌 샘플값들을 포함하고, 여기 순차 선택 수단들은 상기 복수의 여기 순차들에서 0이 아닌 샘플값들의 위치를 나머지 신호로부터 결정하도록 배열되는 것을 특징으로 하는, 입력 신호 송신 방법.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP96200371.1 | 1996-02-15 | ||
EP96200371 | 1996-02-15 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR19990007805A KR19990007805A (ko) | 1999-01-25 |
KR100426514B1 true KR100426514B1 (ko) | 2004-07-01 |
Family
ID=8223673
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019970707328A KR100426514B1 (ko) | 1996-02-15 | 1997-01-31 | 복잡성이감소된신호전송시스템 |
Country Status (9)
Country | Link |
---|---|
US (4) | US6272196B1 (ko) |
EP (1) | EP0821849B1 (ko) |
JP (1) | JP4097699B2 (ko) |
KR (1) | KR100426514B1 (ko) |
CN (1) | CN1114279C (ko) |
AR (1) | AR006972A1 (ko) |
DE (1) | DE69731588T2 (ko) |
TW (1) | TW317051B (ko) |
WO (1) | WO1997030525A1 (ko) |
Families Citing this family (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW439368B (en) * | 1998-05-14 | 2001-06-07 | Koninkl Philips Electronics Nv | Transmission system using an improved signal encoder and decoder |
US6581030B1 (en) * | 2000-04-13 | 2003-06-17 | Conexant Systems, Inc. | Target signal reference shifting employed in code-excited linear prediction speech coding |
JP3582589B2 (ja) * | 2001-03-07 | 2004-10-27 | 日本電気株式会社 | 音声符号化装置及び音声復号化装置 |
US6789059B2 (en) * | 2001-06-06 | 2004-09-07 | Qualcomm Incorporated | Reducing memory requirements of a codebook vector search |
US7110942B2 (en) * | 2001-08-14 | 2006-09-19 | Broadcom Corporation | Efficient excitation quantization in a noise feedback coding system using correlation techniques |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7194141B1 (en) * | 2002-03-20 | 2007-03-20 | Ess Technology, Inc. | Image resolution conversion using pixel dropping |
US7774221B2 (en) | 2002-09-04 | 2010-08-10 | Advanced Health Media, Llc | System and method for a planner |
US20040044673A1 (en) * | 2002-09-04 | 2004-03-04 | Jeffrey Brady | System and method for a planner and a deduplicating planner |
US7822628B2 (en) | 2002-09-04 | 2010-10-26 | Advanced Health Media, Llc | System and method for a planner |
US7698132B2 (en) * | 2002-12-17 | 2010-04-13 | Qualcomm Incorporated | Sub-sampled excitation waveform codebooks |
US20050091191A1 (en) * | 2003-09-24 | 2005-04-28 | Greg Miller | System and method for managing and utilizing information |
US7788486B2 (en) * | 2003-09-24 | 2010-08-31 | Advanced Health Media, Llc | System and method for distributing and creating presentations |
US8809705B2 (en) * | 2007-12-04 | 2014-08-19 | General Electric Company | Device and method for switching electrical energy |
US20050171830A1 (en) * | 2003-09-24 | 2005-08-04 | Greg Miller | System and method for managing and utilizing information |
ES2291939T3 (es) * | 2003-09-29 | 2008-03-01 | Koninklijke Philips Electronics N.V. | Codificacion de señales de audio. |
US7861246B2 (en) | 2004-06-17 | 2010-12-28 | Platform Computing Corporation | Job-centric scheduling in a grid environment |
US7403745B2 (en) * | 2005-08-02 | 2008-07-22 | Lucent Technologies Inc. | Channel quality predictor and method of estimating a channel condition in a wireless communications network |
US8417185B2 (en) | 2005-12-16 | 2013-04-09 | Vocollect, Inc. | Wireless headset and method for robust voice data communication |
US7885419B2 (en) | 2006-02-06 | 2011-02-08 | Vocollect, Inc. | Headset terminal with speech functionality |
US7773767B2 (en) | 2006-02-06 | 2010-08-10 | Vocollect, Inc. | Headset terminal with rear stability strap |
RU2459283C2 (ru) * | 2007-03-02 | 2012-08-20 | Панасоник Корпорэйшн | Кодирующее устройство, декодирующее устройство и способ |
USD605629S1 (en) | 2008-09-29 | 2009-12-08 | Vocollect, Inc. | Headset |
US8160287B2 (en) | 2009-05-22 | 2012-04-17 | Vocollect, Inc. | Headset with adjustable headband |
US8438659B2 (en) | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
US9070356B2 (en) * | 2012-04-04 | 2015-06-30 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
US9263053B2 (en) | 2012-04-04 | 2016-02-16 | Google Technology Holdings LLC | Method and apparatus for generating a candidate code-vector to code an informational signal |
Family Cites Families (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1223365A (en) * | 1984-02-02 | 1987-06-23 | Shigeru Ono | Method and apparatus for speech coding |
CA1229681A (en) * | 1984-03-06 | 1987-11-24 | Kazunori Ozawa | Method and apparatus for speech-band signal coding |
US4724535A (en) * | 1984-04-17 | 1988-02-09 | Nec Corporation | Low bit-rate pattern coding with recursive orthogonal decision of parameters |
NL8500843A (nl) * | 1985-03-22 | 1986-10-16 | Koninkl Philips Electronics Nv | Multipuls-excitatie lineair-predictieve spraakcoder. |
US4944013A (en) * | 1985-04-03 | 1990-07-24 | British Telecommunications Public Limited Company | Multi-pulse speech coder |
US4899385A (en) * | 1987-06-26 | 1990-02-06 | American Telephone And Telegraph Company | Code excited linear predictive vocoder |
JPH02500620A (ja) * | 1987-08-28 | 1990-03-01 | ブリテツシユ・テレコミユニケイシヨンズ・パブリツク・リミテツド・カンパニー | コード化通信システム |
US4907276A (en) * | 1988-04-05 | 1990-03-06 | The Dsp Group (Israel) Ltd. | Fast search method for vector quantizer communication and pattern recognition systems |
US5384891A (en) * | 1988-09-28 | 1995-01-24 | Hitachi, Ltd. | Vector quantizing apparatus and speech analysis-synthesis system using the apparatus |
US5293448A (en) * | 1989-10-02 | 1994-03-08 | Nippon Telegraph And Telephone Corporation | Speech analysis-synthesis method and apparatus therefor |
DE69029120T2 (de) * | 1989-04-25 | 1997-04-30 | Toshiba Kawasaki Kk | Stimmenkodierer |
JP2600373B2 (ja) | 1989-05-11 | 1997-04-16 | 松下電器産業株式会社 | 光ディスク記録再生装置 |
US5105464A (en) * | 1989-05-18 | 1992-04-14 | General Electric Company | Means for improving the speech quality in multi-pulse excited linear predictive coding |
GB2235354A (en) * | 1989-08-16 | 1991-02-27 | Philips Electronic Associated | Speech coding/encoding using celp |
CA2021514C (en) * | 1989-09-01 | 1998-12-15 | Yair Shoham | Constrained-stochastic-excitation coding |
NL8902347A (nl) * | 1989-09-20 | 1991-04-16 | Nederland Ptt | Werkwijze voor het coderen van een binnen een zeker tijdsinterval voorkomend analoog signaal, waarbij dat analoge signaal wordt geconverteerd in besturingscodes die bruikbaar zijn voor het samenstellen van een met dat analoge signaal overeenkomend synthetisch signaal. |
US5097507A (en) * | 1989-12-22 | 1992-03-17 | General Electric Company | Fading bit error protection for digital cellular multi-pulse speech coder |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
WO1992005541A1 (fr) * | 1990-09-14 | 1992-04-02 | Fujitsu Limited | Systeme de codage de la parole |
AU653969B2 (en) * | 1990-09-28 | 1994-10-20 | Philips Electronics N.V. | A method of, system for, coding analogue signals |
US5235670A (en) * | 1990-10-03 | 1993-08-10 | Interdigital Patents Corporation | Multiple impulse excitation speech encoder and decoder |
US5206884A (en) * | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
US5138661A (en) * | 1990-11-13 | 1992-08-11 | General Electric Company | Linear predictive codeword excited speech synthesizer |
US5127053A (en) * | 1990-12-24 | 1992-06-30 | General Electric Company | Low-complexity method for improving the performance of autocorrelation-based pitch detectors |
US5195137A (en) * | 1991-01-28 | 1993-03-16 | At&T Bell Laboratories | Method of and apparatus for generating auxiliary information for expediting sparse codebook search |
JP3254687B2 (ja) * | 1991-02-26 | 2002-02-12 | 日本電気株式会社 | 音声符号化方式 |
US5233660A (en) * | 1991-09-10 | 1993-08-03 | At&T Bell Laboratories | Method and apparatus for low-delay celp speech coding and decoding |
FI95085C (fi) * | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
US5327520A (en) * | 1992-06-04 | 1994-07-05 | At&T Bell Laboratories | Method of use of voice message coder/decoder |
DE69328450T2 (de) * | 1992-06-29 | 2001-01-18 | Nippon Telegraph And Telephone Corp., Tokio/Tokyo | Verfahren und Vorrichtung zur Sprachkodierung |
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JPH06224773A (ja) | 1993-01-26 | 1994-08-12 | Toshiba Corp | 高能率符号化回路 |
US5621852A (en) * | 1993-12-14 | 1997-04-15 | Interdigital Technology Corporation | Efficient codebook structure for code excited linear prediction coding |
US5651090A (en) * | 1994-05-06 | 1997-07-22 | Nippon Telegraph And Telephone Corporation | Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor |
JPH08123494A (ja) * | 1994-10-28 | 1996-05-17 | Mitsubishi Electric Corp | 音声符号化装置、音声復号化装置、音声符号化復号化方法およびこれらに使用可能な位相振幅特性導出装置 |
US5699485A (en) * | 1995-06-07 | 1997-12-16 | Lucent Technologies Inc. | Pitch delay modification during frame erasures |
ATE192259T1 (de) * | 1995-11-09 | 2000-05-15 | Nokia Mobile Phones Ltd | Verfahren zur synthetisierung eines sprachsignalblocks in einem celp-kodierer |
US5867814A (en) * | 1995-11-17 | 1999-02-02 | National Semiconductor Corporation | Speech coder that utilizes correlation maximization to achieve fast excitation coding, and associated coding method |
EP0788091A3 (en) * | 1996-01-31 | 1999-02-24 | Kabushiki Kaisha Toshiba | Speech encoding and decoding method and apparatus therefor |
-
1996
- 1996-02-23 TW TW085102124A patent/TW317051B/zh not_active IP Right Cessation
-
1997
- 1997-01-31 WO PCT/IB1997/000069 patent/WO1997030525A1/en active IP Right Grant
- 1997-01-31 DE DE69731588T patent/DE69731588T2/de not_active Expired - Lifetime
- 1997-01-31 JP JP52914197A patent/JP4097699B2/ja not_active Expired - Lifetime
- 1997-01-31 CN CN97190354A patent/CN1114279C/zh not_active Expired - Lifetime
- 1997-01-31 KR KR1019970707328A patent/KR100426514B1/ko active IP Right Grant
- 1997-01-31 EP EP97900710A patent/EP0821849B1/en not_active Expired - Lifetime
- 1997-02-12 US US08/798,686 patent/US6272196B1/en not_active Expired - Lifetime
- 1997-02-13 AR ARP970100567A patent/AR006972A1/es active IP Right Grant
-
2000
- 2000-11-13 US US09/710,820 patent/US6608877B1/en not_active Expired - Lifetime
-
2001
- 2001-01-16 US US09/761,196 patent/US6600798B2/en not_active Expired - Lifetime
- 2001-01-16 US US09/761,197 patent/US6603832B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
TW317051B (ko) | 1997-10-01 |
US6272196B1 (en) | 2001-08-07 |
US6608877B1 (en) | 2003-08-19 |
JPH11504492A (ja) | 1999-04-20 |
US20010014856A1 (en) | 2001-08-16 |
KR19990007805A (ko) | 1999-01-25 |
US6600798B2 (en) | 2003-07-29 |
EP0821849B1 (en) | 2004-11-17 |
CN1114279C (zh) | 2003-07-09 |
AR006972A1 (es) | 1999-10-13 |
EP0821849A1 (en) | 1998-02-04 |
DE69731588T2 (de) | 2005-12-01 |
DE69731588D1 (de) | 2004-12-23 |
JP4097699B2 (ja) | 2008-06-11 |
US6603832B2 (en) | 2003-08-05 |
WO1997030525A1 (en) | 1997-08-21 |
CN1189263A (zh) | 1998-07-29 |
US20010006537A1 (en) | 2001-07-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100426514B1 (ko) | 복잡성이감소된신호전송시스템 | |
US6594626B2 (en) | Voice encoding and voice decoding using an adaptive codebook and an algebraic codebook | |
US6014619A (en) | Reduced complexity signal transmission system | |
JPS5912186B2 (ja) | 雑音の影響を減少した予測音声信号符号化 | |
WO1992016930A1 (en) | Speech coder and method having spectral interpolation and fast codebook search | |
EP0501421B1 (en) | Speech coding system | |
KR100455970B1 (ko) | 복잡성이감소된신호전송시스템,전송기및전송방법,인코더및코딩방법 | |
EP0578436B1 (en) | Selective application of speech coding techniques | |
EP0602826B1 (en) | Time shifting for analysis-by-synthesis coding | |
US6535847B1 (en) | Audio signal processing | |
JP3168238B2 (ja) | 再構成音声信号の周期性を増大させる方法および装置 | |
US4908863A (en) | Multi-pulse coding system | |
CA2218244C (en) | Reduced complexity signal transmission system | |
CA2218223C (en) | Reduced complexity signal transmission system | |
JP3749838B2 (ja) | 音響信号符号化方法、音響信号復号方法、これらの装置、これらのプログラム及びその記録媒体 | |
EP0987680B1 (en) | Audio signal processing | |
KR20040004372A (ko) | 음성 전송 시스템 | |
KR960011132B1 (ko) | 씨이엘피(celp) 보코더에서의 피치검색방법 | |
JPH05224698A (ja) | ピッチサイクル波形を平滑化する方法及び装置 | |
KR100587721B1 (ko) | 음성전송시스템 | |
WO2001009880A1 (en) | Multimode vselp speech coder |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20130326 Year of fee payment: 10 |
|
FPAY | Annual fee payment |
Payment date: 20140320 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20160317 Year of fee payment: 13 |