KR0131011B1 - 표본화된 신호벡터를 부호화 하는 방법 - Google Patents

표본화된 신호벡터를 부호화 하는 방법

Info

Publication number
KR0131011B1
KR0131011B1 KR1019920700756A KR920700756A KR0131011B1 KR 0131011 B1 KR0131011 B1 KR 0131011B1 KR 1019920700756 A KR1019920700756 A KR 1019920700756A KR 920700756 A KR920700756 A KR 920700756A KR 0131011 B1 KR0131011 B1 KR 0131011B1
Authority
KR
South Korea
Prior art keywords
vector
measurement
excitation
sampled
language
Prior art date
Application number
KR1019920700756A
Other languages
English (en)
Other versions
KR920702526A (ko
Inventor
토르 브죄른 민데
Original Assignee
브릿트 레이고·타게 뢰브그렌
테레포오낙티이에보라켓 엘 엠 엘리크썬
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 브릿트 레이고·타게 뢰브그렌, 테레포오낙티이에보라켓 엘 엠 엘리크썬 filed Critical 브릿트 레이고·타게 뢰브그렌
Publication of KR920702526A publication Critical patent/KR920702526A/ko
Application granted granted Critical
Publication of KR0131011B1 publication Critical patent/KR0131011B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0002Codebook adaptations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms
    • G10L2019/0014Selection criteria for distances
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

본 발명은 적응코드북에서 최적 여기벡터를 선택하므로서 샘플된 언어신호벡터를 부호화 하는 방법에 관한 것이다. 최적 여기벡터는 선형필터의 임펄스응답(hw(n))을 가진 여기벡터의 콘벌루션(102)과 언어신호벡터 사이의 상관관계를 정규화 하여 제곱된 에너지를 최대로 하여 얻어진다.
콘벌루션하기전에 코드북(100)의 벡터는 최대 크기인 벡터성분에 대해 블록정규화(200)된다. 같은 방식으로, 언어신호벡터(s(n))는 최대 크기 성분에 대해 블록정규화(200)된다.
제곱된 상관관계(C1)과 에너지(E)의 계산된 값과 최적 여기벡터의 상응하는 값 CM, EM은 스케링 레벨의 제한된 수를 가진 가수와 스케링인자로 나누어진다. 레벨의 수는 상관관계 및 에너지에 따라 다르다. 최적 여기벡터를 결정하는데 이용되는 적 CI·EM및 EI·CM을 계산하는 동안 각각의 가수가 곱해지고 각각의 스케링인자 계산이 수행된다.

Description

[발명의 명칭]
표본화된 신호벡터를 부호화 하는 방법
[기술분야]
본 발명은 적응코드북(adaptive code book)에서 최적 여기 벡터(optimal exitation vector)를 선택하여 표본화된 언어신호벡터를 부호화 하는 방법에 관한 것이다.
[선행 기술]
디지털화된 언어를 무선전송할 때, 언어의 중요한 특성이 감소하지 않고 단위시간당 전송되는 정보량을 감소시키는 것이 바람직하다.
엠 슐러디 및 비 아탈씨의 논문 저 비트에서의 고특성 언어에 관한 부호여기선형예측(CELP) (IEEE ICASSP- 85, 1985) (the article code-excited linear prediction (CELP) : High-quality speech at very low bit rates, IEEE ICASSP-85, 1985 by Schroeder and B.)에 공지된 방법은 전송기에서 소위 CELP 형이라고 불리는 코더를 이용하여 정보를 감소시킨다.
이러한 코더는 합성부와 분석부를 포함한다. 코더는 합성부에 3개의 주요 부분을 갖는다. 즉, LPC-필터(선형예측 부호 필터)와 전송되는 프레임에 대해 표본화된 언어신호벡터를 가능한 근사하게 근접시키는 신호를 합성 생산하기 위해 필터를 여가시키는 여기벡터를 포함하는 고정된 코드와 적응코드를 갖는다.
언어신호벡터 그 자체를 전송하는 대신 코드북에서 여기벡터의 지표는 무선 접속시 전송되는 다른 파라미터중에 있다.
수신기는 전송기측에서와 같은 방식으로 언어신호벡터의 선택된 근사값을 재생산하는 상응하는 합성부를 포함한다.
코드북에서 최상의 가능한 여기벡터를 선택하기 위해 전송기측은 코드북을 분석하는 분석기측을 포함한다.
적응코드북의 최적지표에 대한 연구는 코드북에서 모든 지표를 철저히 조사하므로서 수행된다. 적응코드북에서 각각의 지표에 대해 상응하는 여기벡터가 LPC-필터를 통해 여과되고 이의 출력신호는 부호화된 표본화된 언어신호벡터와 비교된다.
에러벡터가 가중필터를 통해 계산되고 여과된다. 가중된 에러벡터의 성분이 이차 가중에러를 형성하기 위해 제곱되어 합해진다. 최소 이차 가중에러로 주어진 지표가 최적지표로 선택된다. 아이.엠.트랜코소 및 비이 에스 알타씨의 예측코더에서최적 기술혁신을 발전하는 효율적 절차로 알려진 동등 방법(artile Efficient procedures for finding the optimum innovation in stochastic coder, IEEE ISASSP-86, 1986, by I. M Trancoso and B.S.Atal)에서 최적지표는 항상 언어벡터와 표본화된 언어신호벡터 사이의 상관관계 정규화 하여 제곱한 에너지를 최대로 하여 얻는다.
이 두개의 완전 조사방법은 디지털 신호프로세서 필요한 표시사이클의 수에 대해선 비용이 많이 들지만 언어의 고특성을 유지한다는 면에서는 바람직하다. 적응코드북의 조사는 미합중국 특허 번호 3,899,385 및 케이 스위민너덴 및 알.브이 콕시의 1989년 9월 5 - 8일 벤구버에서 개최된 전기통신을 위한 언어부호화에 대한 IEEE 연수회에서의 단일 AT T DSP32C (디지털신호 프로세서 에 대한 8.0 kbps CELP코더의 고안이행 및 평가 (the article Design, implementation and evaluation of a 8.0 kbps CELP coder on a singl ATT DSP32C digital signal processor, IEEE Workshop on speech coding for telecommunications, Vancouver, Sept. 5 - 8, 1989, by k. Swaminathan and R.V.Cox.)의 논문에서 알 수 있다.
정수이행에 관한 문제점은 적응코드북이 피드백 (긴기간 메모리)을 갖는다는 것이다. 코드북은 선행프레임의 전체 여기벡터 (고정된 및 적응코드북으로부터 최적 여기벡터의 선형조합)로 갱신된다.
이러한 적응코드북을 적용하면, 언어 고특성을 얻는데 필요불가결한 언어신호의 동적변동을 가능케 한다.
그러나 언어신호가 넓은 동적영역으로 변화하는데 이는 이들 프로세서가 불충분한 16비트의 워드길이를 갖기 때문에 정수표시 작동하는 디지털 신호 프로세서의 신호정도의 유지특성을 가진 신호로 표현하기가 어렵다.
신호는 정수 디지털 신호 프로세서의 소프트웨어에서 성취되는 유통점이행이나 이중정도(두개워드)로 표현되어야 한다.
그러나 이 두방법은 복잡하기 때문에 비용이 많이든다.
[발명의 요약]
본 발명의 목적은 복잡성과 같은 전에 알려진 방법의 결점없이 정수 디지털 신호 프로세서에서 적응코드북과 분석관련하여 넓은 동적 언어신호범위를 얻는 방법을 제공하는 것이다.
적응코드북에서 최적 여기벡터를 선택하므로서 표본화된 언어신호벡터를 부호화 하는 방법에 있어서
(a) 소정의 여기벡터가 연속적으로 적응코드북에서 판독되고
(b) 각각 판독된 여기벡터가 선형필터의 임펄스 응답과 콘벌루(convolve)되고
(c) 각각의 필터 출력신호가
(C1) 한편으로 표본화된 언어신호벡터와 상관관계의 제곱의 측정(CI)과
(C2) 필터 출력신호의 에너지 측정(EI)을 형성하기 위해 이용되고
(d) 각각의 측정(CI)은 필터 출력신호와 표본화된 언어신호벡터간의 상관관계의 제곱의 측정간의 비율의 최대값인 여기벡터의 측정(EM)과 필터 출력신호 측정이 곱해지고
(e) 필터출력신호와 표본화된 언어신호벡터사이의 상관관계간의 제곱의 측정간의 비의 최대값인 여기벡터의 측정(CM)과 필터 출력신호의 에너지의 측정이 곱해지고
(f) 스탭 (d)와 (e)에서의 적(product)이 서로 비교되고 만일 스탭 (d)에서의 적이 스탭 (e)에서의 적보다 크면, 측정 CM, EM이 측정 CI, EI로 대치되고,
(g) 필터출력신호와 표본화된 언어신호 벡터간의 상호관계의 제곱의 값 사이의 비의 최대값에 상응하는 여기벡터와 필터출력신호의 에너지의 측정이 적응 코드북에서 최적 여기벡터로 선택된다.
상기 목적은
(A) 스탭 (b)에서 콘블루션 하기전에 적응코드북으로 부터의 한 세트의 여기벡터내의 최대 절대값을 가진 성분에 대해 적응코드북의 소정의 여기벡터를 블록정규화 하고
(B) 스탭 (CI)에서 측정 (CI)을 하기 전에 최대 절대값을 갖는 성분에 대해 표본화된 언어신호벡터를 블록정규화 하고
(C) 스탭 (CI)의 측정 (CI)과 측정 (CM)을 각각의 가수와 레벨의 소정의 제1최대수를 가진 각각의 제1스케링인자(scaling factor)로 나누고
(D) 스탭 (C2)의 측정 (EI)과 측정 (EM)을 레벨의 소정의 제2최대수를 가진 제2스캐링 인자와 가수로 나누고
(E) 각각의 가수를 곱하므로서 스탭(d)와 (e)에서 상기 적을 형성하고 각각의 스케링인자계산을 하므로서 얻어진다.
[도면의 간단한 설명]
본 발명의 목적 및 장점을 수반한 도면과 관련해서 설명하므로서 분명해질 것이다.
제1도는 적응코드북에서 최적 여기벡터를 선택하므로서 언어신호벡터를 부호화하는 선행기술의 장치의 블록도.
제2도는 본 발명을 따르는 방법을 수행하는 장치의 제1실시예의 블록도.
제3도는 본 발명을 따르는 방법을 수행하는 장치의 바람직한 제2실시예의 블록도.
제4도는 본 발명을 따르는 방법을 수행하는 장치의 제3실시예의 블록도.
[발명의 상세한 설명]
[바람직한 실시예]
여러 도면에서 같은 참조번호는 상응하는 요소에 사용했다.
제1도는 적응코드북에서 최적 여기벡터를 선택하므로서 언어신호벡터를 부호화하는 종래기술을 따르는 장치의 블록도이다.
예컨대 40개의 샘플을 포함하는 표본화된 언어신호벡터 (sw(n))와 콘벌루션 유닛 (102) 내의 선형필터의 임펄스 응답 (hw(n))을 가진 적응코드북 (100) 으로 부터의 여기벡터를 콘벌루션하여 얻은 합성신호 (sw(n))는 상관기 (104)에서 서로가 상관된다.
상관기 (104)의 출력신호는 신호 (sw(n))와 신호 (sw(n)) 사이의 상관의 제곱에 대해 측정(CI)을 한다.
상관의 측정은 예컨데 입력신호 (sw(n))와 (sw(n))에서의 상응하는 성분의 적을 합하므로서 계산된다.
더구나 에너지상관기 (106)에서 합성신호 (sw(n)의 에너지 (EI)는 신호의 제곱성분을 합하므로서 계산된다.
이들 계산은 적응코드북의 각각의 여기벡터에 대해 수행된다.
각각의 계산된 쌍 CI, EI에 대해 적 (CI·EM)과 (EI·CM)이 형성되고 여기서 CM과 EM은 최대비가 CI/EI인 여기벡터에 대해 제곱상관 및 에너지의 값이다.
값 CM와 EM은 메모리 (108), (110)에 각각 축적되고 적이 곱셈기 (112), (114)에서 형성된다.
다음 이 적은 비교기 (116)에서 비교된다. 만일 적 (CI·EM)이 적 (EI·CM) 보다 크면, CM, EM은 CI, EI로 갱생된다.
그렇지 않으면, CM및 EM의 후행값이 유지된다. CM및 EM의 갱생과 동시에 적응코드북에서의 상응하는 벡터의 지표를 축적하는 도시되지 않은 메모리가 또한 갱생된다.
적응코드북 (100) 내의 모든 여기벡터가 이러한 식으로 조사될 때, 최적 여기 벡터가 CM,EM에 상응하는 벡터 및 메모리 (108), (110) 에 축적된 벡터로서 얻어진다.
도면에 도시되지 않은 메모리에 지표가 축적된 코드북 (100) 에서의 이 벡터의 지표는 표본화된 언어신호벡터의 코드의 기본부분을 형성한다.
제2도는 본 발명을 따르는 방법을 수행하는 장치의 제1실시예의 블록도이다. 제1도의 전에 공지된 장치의 같은 파라미터 즉, 제곱상관 및 에너지는 또한 제2도의 장치에서 계산된다.
그러나, 콘벌류션 유닛 (102)에서 콘벌류션하기전에 적응 코드북 (100) 의 여기벡터는 최대 절대값을 가진 코드북에서의 모든 여기벡터의 성분에 대해 블록정규화 유닛 (200)에서 정규화된다.
이것은 최대 절대값을 가진 성분을 조사하기 위해 코드북의 모든 여기벡터를 조사하므로서 이루어진다. 다음 이 성분은 가능한 워드길이를 가지고 윗쪽으로 이동한다.
본 명세서에서는 16 비트의 워드 길이를 택했다.
그러나 본 발명은 이 워드길이로 제한한 것이 아니라 다른 워드길이도 가능하다.
상응하는 방식으로 언어신호벡터는 최대 절대값을 가진 성분에 대해 블록정규화 유닛 (202)에서 블록정규화 된다.
블록정규화후, 제곱상관 및 에너지의 계산은 상관기 (104) 및 에너지 계산기 (106) 각각에서 수행된다.
워드길이가 16 비트인 경우, 결과가 2 중정도, 즉 32 비트로 축적된다.
상관관계 및 에너지 계산 동안, 적의 합이 수행된다. 이 적의 합은 합이 보통 32 비트이상 필요하기 때문에 32 비트 이상의 길이를 가진 축적기가 합을 위해 사용된다. 그후 결과가 32 비트내로 축적된 오른쪽으로 이동(shift) 한다. 32비트 축적기와 관련해서 다른 방법이 합하기전에 각각의 적을 오른쪽 예컨대 6 비트에 이동시킨다.
이러한 이동은 실제표시가 아니므로 아래에서 설명하지 않았다. 얻어진 결과는 16 비트의 가수와 스케링인자로 나누어진다. 스케링인자는 스케링레벨의 제한된 수를 갖는 것이 바람직하다.
상호관계에 대한 스케링레벨의 안정한 최대수는 9 이고 에너지에 대한 스케링 레벨의 안정한 최대수는 7 이라는 것이 증명되었다. 그러나 이 값은 임계는 아니다. 8 에 가까운 값도 바람직하다고 증명되었다. 스케링인자는 지수로서 축적하는 것이 바람직하다. 스케링인자가 2E로서 형성된다는 것은 알 수 있고 여기서 E는 지수이다.
스케링레벨의 위에서 제한된 최대수에 있어서, 상관관계에 대한 스케링인자는 4 비트로 축적되는 반면, 에너지에 대한 스케링인자는 3 비트를 필요로 한다.
스케링인자가 2E로 표현되기 때문에 스케링은 가수를 간단히 이동하므로서 표현된다. 스케링인자를 가수로서의 분활을 설명하기 위해 벡터길이가 40 샘플로 워드길이가 16 비트로 가정했다.
이 경우에 최대값의 절대값이 216-1이다. 상관관계의 최대값은 다음과 같다.
최대경우의 스캐링인자 221은 1로, 즉 20로 가정하는 반면 가수는 5·212이다.
합성 출력신호벡터는 최대값 즉 216-2의 반과 같은 성분을 갖는 반면, 표본화된 신호벡터는 단지 최대성분을 갖는다.
이 경우에 상호관계는
이다.
이 경우에 스케링인자는 21즉 2로 생각되는 반면, 가수는 아직 5·212이다.
스케링인자는 결과가 CCmax보다 작게 되는데 얼마나 시간이 걸리나를 표시한다. 벡터성분에 대한 또 다른 값으로 상관관계가 계산되고 그 결과가 CCmax보다 작을때 왼쪽에 이동한다.
이 경우는 스케링인자의 지수로 주어지고 결과의 절대값에서 가장 중요한 15 비트는 가수의 절대값으로 주어진다.
스케링인자 레벨의 수가 제한되기 때문에 수행할 수 있는 이동의 수가 또한 제한된다. 따라서 상관관계가 적을때 이동의 최대수 후에도 가수의 가장 중요한 비트는 단지 제로 (zero) 만을 포함한다.
C1는 다음 상관관계의 가수를 제곱하므로 계산되고 결과 1 비트를 왼쪽으로 이동시키고 스케링인자의 지수를 2 배로 하고 1 까지의 결과지수를 증가시킨다.
EI은 같은 방식으로 나누어진다. 그러나 이 경우에 마지막 제곱이 필요하지 않다. CI및 EM에 대한 가수는 곱셈기 (112)에서 곱해지고 EI및 CM의 가수는 곱셈기 (114)에서 곱해진다. 이 파라미터에 대한 스케링인자는 CI, EM및 EI, CM에 대한 스케링인자의 지수를 더하므로서 스케링인자 S1 및 S2 를 각각 계산하는 스케링 계산유닛 (204)에 전달된다. 스케링유닛 (206), (208) 에서 스케링인자가 비교기 (116)에서 비교되는 스케링된 특성을 형성하기 위해 곱셈기 (112), (114) 로 부터의 적에 적용된다.
각각의 스케링인자는 스케링인자의 지수에 의해 표시되는 스탭수의 오른쪽에 상응하는 적을 이동시켜 인가된다.
스케링인자는 스케링레벨의 최대수까지 제한할 수 있기 때문에 이동수를 언어의 양호한 특성을 생산하는 최대까지 제한할 수 있다.
상관관계 및 에너지의 위에서 선택된 값 9 및 7 각각은 이동의 수를 최소로 하고 언어의 양호한 특성을 유지하는데 최적이라는게 증명되었다.
제2도의 수행의 결정은 양입력신호에 대해 이동이 필요하다는 것이다. 이것은 양 입력신호가 정확성이 상실되고 이에 따라 비교가 더 불확실해진다는 것이다. 또 다른 결점은 두 입력신호의 이동이 오랜시간이 걸린다는 것이다.
제3도는 본 발명을 따르는 방법을 수행하는 장치의 제2바람직한 실시예의 블록도를 예시한 것으로 상기의 결점이 제거된다.
두개의 스케링인자를 계산하는 대신 스케링인자 계산유닛 (304) 이 스케링인자를 효과적으로 계산한다.
이것은 한쌍의 EI, CM의 스케링인자의 지수를 한쌍의 CI, EM의 스케링 인자의 지수로부터 빼므로서 계산된다.
결과지수가 양이면, 곱셈기 (112) 의 적이 계산된 지수에 의해 표시된 스탭의 수의 오른쪽에 이동한다.
이러한 수행의 장점은 단지 하나의 효과적인 이동만이 필요하다는 것이다.
이것은 이동단계가 적을수록 속도가 증가한다는 것을 의미한다. 더구나 단지 하나만의 신호가 이동하기 때문에 비교의 정확도가 향상된다는 것이다.
제3도를 따르는 바람직한 실시예의 수행을 특허청구앞에 부착된 파스칼 프로그램에 의해 상세히 설명되었다.
제4도는 본 발명을 따르는 방법을 수행하는 장치의 제3실시예의 블록도이다.
제3도의 실시예에서 스케링인자 계산유닛 (404) 이 유효 스케링인자를 계산하기 때문에 본 실시예에서 유효 스케링인자가 곱셈기 (112) 로 부터 하나의 적에만 적용된다.
제4도에서 유효 스케링인자가 스케링유닛 (406) 위의 곱셈기 (112) 로 부터의 적에 적용된다.
이 실시예에서 유효 스케링인자의 지수가 음이냐 양이냐에 따라 이동이 왼쪽 및 오른쪽으로 이루어진다.
따라서 비교기 (116) 의 입력신호는 하나이상의 워드를 필요로 하게 된다.
제1도에 예시된 부호방법에 대한 MIPS (초당 백만명령) 으로 표현되는 복잡성의 비교는 다음과 같다.
복잡성의 주요부분이 이들 분야에서 일어나기 때문에 상관관계 에너지 및 비교의 계산의 복잡성을 추정할 수 있다.
다음 방법이 비교된다.
1. 하드웨어의 부동소숫점 수행 (floating point implementation)
2. 정수디지털 신호 프로세서의 소프트웨어에서의 소숫점 수행
3. 정수디지털 프로세서의 이중정밀도의 수행
4. 정수디지털 신호 프로세서 위에서 실행된 본 발명의 방법
각각의 표본화된 언어벡터는 40 개 샘플 (40 성분)을 포함하고 각각의 언어벡터는 시간 프레임 5 ms 이상으로 연장하고 적응 코드북은 128 여기벡터와 40 개 성분을 포함한다고 가정했다.
정수디지털 신호 프로세서 위에서 여러 다른 연산에 필요한 명령의 수의 추정은 택서스 인스투루먼트 (texas instruments) TMS320C25 USER'S GUIDE에서 볼 수 있다.
부동소숫점 연산 (FLOP) 은 복잡하지만 하드웨어에서 수행된다. 이러한 이유때문에 이들은 비교를 용이하게 하기 위해 하나의 명령으로 계산한다.
1. 하드웨어에서 부동소숫점 시행
부동소숫점 연산 (FLOP) 은 복잡하지만 하드웨어에서 수행된다.
이러한 이유때문에 비교를 실행하기 위해 하나의 명령으로 계산된다.
이것은 128·85/0.005 = 2.2 MIPS 가 된다.
2. 소프트웨어에서 부동소숫점 실행
이 연산은 더 간단하고 명령에 필요한 수가 근접한다.
부동소숫점 승법 10 명령
부동소숫점 가법 20 명령
이것은 128·2460/0.005 = 63 MIPS 가 된다.
3. 이중 정밀도 수행
연산은 더 간단한 명령에 의해 된다.
명령에 필요한 수는
이것은 다음과 같다.
이것은 128·350/0.005 = 9.0 MIPS 가 된다.
4. 본 발명의 방법
연산은 더 간단하게 된다. 명령에 필요한 수는 다음과 같다.
이것은 다음과 같다.
이것은 128·118/0.005 = 3.0 MIPS 이다.
위의 추정은 근사적이고 다른 방법에 대해 복잡성의 크기정도를 표시한다.
본 발명을 따르는 방법은 하드웨어에서의 부동소숫점 수행에 필요한 명령의 수에 대해 가장 효과적이라는 것은 추정할 수 있다.
그러나 방법이 정수디지털 신호 프로세서에서 저렴하게 수행되기 때문에 언어의 유지특성과 함께 비용감소를 얻을 수 있다.
정수디지털 신호 프로세서위의 소프트웨어에서의 부동소숫점 수행과 이중정밀도의 수행과의 비교하면, 본 발명의 방법이 언어의 유지특성과 더불어 복잡성 (MIPS 의 필요한 수) 이 감소했다는 것을 알 수 있다.
본 발명의 여러수정과 변경이 본 발명의 범위에서 벗어나지 않는다면 가능하다. 예컨대, 본 발명은 소위 수직벡터의 재귀에너지 계산 (recursive energy calulation)에 이용할 수도 있다.
본 발명은 또한 적응코드북의 여기벡터를 실험하는 선택적 조사 방법에도 이용할 수 있다.
이 경우, 블록정규화가 모든 적응코드북 또는 선택된 벡터에 대해서 이용할 수 있다.
프로그램 고정점
{
이 프로그램은 적응 코드북에 대해 최적피치예상 (optimal prediction)을 계산한다. 또한 최적피치예상은 가중합성 필터를 통해 여과된다.
메쓰리브 이용(USES MATHLIB)
메쓰리브는 택사스 인스투루먼트 디지털 프로세서 TMSc5x (Texas Instruments digital sighal processor Tlusc5x) 의 베이직 명령을 모방한 모듈러이고 이 베이직명령 점에서 연장된 명령 (macros)을 한정한다.
피치지연 = 40 에 대한 피치예상을 계산한다.
계산된 피치예상과 가중 섭브프레임 사이의 상호관계를 계산한다.
마지막으로 피치예상의 전력을 계산한다.
피치예상의 재귀갱생을 시작한다.
최대 상관관피치예상 전력을 갱신한다.
피치예상에 대해 섭브 프레임을 갱신한다.

Claims (13)

  1. (a) 소정의 여기 벡터가 적응코드북에서 연속적으로 판독되고 (b) 각각의 판독된 여기 벡터는 선형필터의 임펄스 응답과 콘벌루되고 (c) 각각의 필터 출력신호는 한편으로는 (C1) 표본화된 언어신호 벡터와 상관관계의 제곱의 측정 (CI)을 다른 한편으로는 (C2) 필터 출력신호의 에너지의 측정 (EI)을 형성하기 위해 사용되고 (d) 각각의 측정 (CI) 은 필터 출력신호와 표본화된 언어신호벡터 사이의 상관관계의 제곱의 측정간의 비율의 최대값으로 주어진 여기 벡터의 측정 (EM) 및 필터 출력신호의 에너지의 측정이 승합되고 (e) 측정 (EI) 는 필터출력신호와 제곱의 측정간의 비율의 최대값으로 주어진 여기 벡터의 측정 (CM) 와 필터 출력신호의 에너지가 승합되고 (f) 스탭 (d) 및 (e) 의 적이 서로 비교되고 스탭 (d) 에서의 적이 스탭 (e) 에서의 적보다 크면 측정 CM, EM가 측정 CI및 EI로 대체되고 (g) 필터출력신호와 표본화된 언어신호벡터 사이의 상관관계의 제곱의 측정간의 비율의 최대값 및 필터출력값의 에너지의 측정에 상응하는 여기벡터가 적응코드북에서 최적 여기벡터로 선택되는 적응 코드북에서 최적 여기벡터를 선택하므로서 표본화된 언어신호벡터를 부호화 하는 방법에 있어서, (A) 스탭 (b) 에서 콘벌루션 하기전에 적응코드북으로 부터의 한 세트의 여기벡터의 최대 절대값에 대해 적응코드북의 소정의 여기 벡터를 블록정규화 하고 (B) 스탭 (C1)에서 측정 (CI) 를 형성하기 전에 최대 절대값을 갖는 성분에 대해 표본화된 언어신호 벡터를 블록 정규화 하고 (C) 스탭 (C1) 으로 부터의 측정 (CI) 과 측정 (CM) 을 레벨의 소정의 제1최대수의 가수와 각각의 제1스케링인자로 나누고 (D) 스탭 (C2) 로부터의 측정 (EI) 과 측정 (EM)을 레벨의 소정의 제2최대수의 각각의 가수와 각각의 제2스케링인자로 나누고 (E) 각각의 가수를 곱하므로서 스탭 (d) 및 스탭 (e)에서 상기적을 형성하는 것을 특징으로 하는 표본화 언어신호벡터를 부호화 하는 방법.
  2. 제1항에 있어서, 스탭 (A)에서 한 세트의 여기벡터는 적응코드북에서 모든 여기벡터를 포함하는 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  3. 제1항에 있어서, 스탭 (A)에서 여기벡터의 세트는 적응코드북으로 부터의 상기 소정의 여기벡터만을 포함하는 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  4. 제2항에 있어서, 상기 소정의 여기벡터는 적응코드북에서의 모든 적응벡터를 포함하는 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  5. 제1항, 제2항, 제3항 또는 제4항에 있어서 스케링인자는 베이스 (2)에 지수로서 축적되는 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  6. 제1항, 제2항, 제3항 또는 제4항 또는 제5항에 있어서, 각각의 적에 대한 전체 스케링인자는 제1 및 제2스케링인자에 대해 상응하는 지수를 곱하므로서 형성되는 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  7. 제1항, 제2항, 제3항, 또는 제4항에 있어서, 유효 스케링인자는 적(CI, EM)의 전체 스케링인자에 대한 지수와 적 (EI, CM) 의 전체 스케링인자에 대한 지수의 차를 형성하여 계산되는 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  8. 제1항, 제2항, 제3항 또는 제4항에 있어서, 지수가 제로 (zero) 보다 크면, 측정 (CI) 및 (EM) 에 대한 가수의 적이 유효 스케링인자의 지수로 표시되는 스탭수의 오른쪽에 이동하고 지수가 제로보다 작거나 같으면, 측정 (EI) 및 (CM) 에 대한 가수의 적이 유효 스케링인자의 절대값으로 표시되는 스탭의 수의 오른쪽으로 각각 이동하는 것을 특징으로 하는 표본화된 언어신호 벡터를 부호화 하는 방법.
  9. 제1항, 제2항, 제3항 또는 제4항에 있어서, 가수는 분해능력이 16 비트인 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  10. 제1항, 제2항, 제3항 또는 제4항에 있어서, 레벨의 제1최대수는 레벨의 제2최대수와같은 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  11. 제1항, 제2항, 제3항 또는 제4항에 있어서 레벨의 제1최대수는 레벨의 제2최대수와 다른 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  12. 제11항에 있어서, 레벨의 제1최대수는 9인 것을 특징으로 하는 표본화된 언어신호벡터를 부호화 하는 방법.
  13. 제12항에 있어서, 레벨의 제2최대수는 7 인 것을 특징으로 하는 표본하된 언어신호벡터를 부호화 하는 방법.
KR1019920700756A 1990-08-10 1991-07-15 표본화된 신호벡터를 부호화 하는 방법 KR0131011B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
SE9002622A SE466824B (sv) 1990-08-10 1990-08-10 Foerfarande foer kodning av en samplad talsignalvektor
SE9002622-0 1990-08-10
PCT/SE1991/000495 WO1992002927A1 (en) 1990-08-10 1991-07-15 A method of coding a sampled speech signal vector

Publications (2)

Publication Number Publication Date
KR920702526A KR920702526A (ko) 1992-09-04
KR0131011B1 true KR0131011B1 (ko) 1998-10-01

Family

ID=20380132

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019920700756A KR0131011B1 (ko) 1990-08-10 1991-07-15 표본화된 신호벡터를 부호화 하는 방법

Country Status (13)

Country Link
US (1) US5214706A (ko)
EP (1) EP0470941B1 (ko)
JP (1) JP3073013B2 (ko)
KR (1) KR0131011B1 (ko)
AU (1) AU637927B2 (ko)
CA (1) CA2065451C (ko)
DE (1) DE69112540T2 (ko)
ES (1) ES2076510T3 (ko)
HK (1) HK1006602A1 (ko)
MX (1) MX9100552A (ko)
NZ (1) NZ239030A (ko)
SE (1) SE466824B (ko)
WO (1) WO1992002927A1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5307460A (en) * 1992-02-14 1994-04-26 Hughes Aircraft Company Method and apparatus for determining the excitation signal in VSELP coders
US5570454A (en) * 1994-06-09 1996-10-29 Hughes Electronics Method for processing speech signals as block floating point numbers in a CELP-based coder using a fixed point processor
US6009395A (en) * 1997-01-02 1999-12-28 Texas Instruments Incorporated Synthesizer and method using scaled excitation signal
WO2001033718A1 (en) * 1999-10-30 2001-05-10 Stmicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
JPWO2011048810A1 (ja) * 2009-10-20 2013-03-07 パナソニック株式会社 ベクトル量子化装置及びベクトル量子化方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1195350B (it) * 1986-10-21 1988-10-12 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per la codifica e decodifica del segnale vocale mediante estrazione di para metri e tecniche di quantizzazione vettoriale
US4727354A (en) * 1987-01-07 1988-02-23 Unisys Corporation System for selecting best fit vector code in vector quantization encoding
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US5077798A (en) * 1988-09-28 1991-12-31 Hitachi, Ltd. Method and system for voice coding based on vector quantization

Also Published As

Publication number Publication date
ES2076510T3 (es) 1995-11-01
JPH05502117A (ja) 1993-04-15
CA2065451A1 (en) 1992-02-11
WO1992002927A1 (en) 1992-02-20
MX9100552A (es) 1992-04-01
JP3073013B2 (ja) 2000-08-07
EP0470941A1 (en) 1992-02-12
SE466824B (sv) 1992-04-06
SE9002622D0 (sv) 1990-08-10
EP0470941B1 (en) 1995-08-30
CA2065451C (en) 2002-05-28
DE69112540D1 (de) 1995-10-05
AU637927B2 (en) 1993-06-10
SE9002622L (sv) 1992-02-11
KR920702526A (ko) 1992-09-04
DE69112540T2 (de) 1996-02-22
AU8336691A (en) 1992-03-02
NZ239030A (en) 1993-07-27
US5214706A (en) 1993-05-25
HK1006602A1 (en) 1999-03-05

Similar Documents

Publication Publication Date Title
EP0504627B1 (en) Speech parameter coding method and apparatus
KR100334202B1 (ko) 이동전화에서고속음성압축을수행하기위한에이식
CA2061803C (en) Speech coding method and system
KR0127901B1 (ko) 음성 인코딩 장치 및 그 방법
KR100190183B1 (ko) 벡터 양자화장치 및 벡터 양자화방법
Kleijn et al. A low-complexity waveform interpolation coder
EP0501421A2 (en) Speech coding system
KR100408911B1 (ko) 선스펙트럼제곱근을발생및인코딩하는방법및장치
EP0235180B1 (en) Voice synthesis utilizing multi-level filter excitation
EP0778561A2 (en) Speech coding device
KR0131011B1 (ko) 표본화된 신호벡터를 부호화 하는 방법
US7305337B2 (en) Method and apparatus for speech coding and decoding
US5233659A (en) Method of quantizing line spectral frequencies when calculating filter parameters in a speech coder
Nein et al. Incorporating error shaping technique into LSF vector quantization
EP0483882A2 (en) Speech parameter encoding method capable of transmitting a spectrum parameter with a reduced number of bits
JP3092344B2 (ja) 音声符号化装置
EP0910064B1 (en) Speech parameter coding apparatus
JP3112462B2 (ja) 音声符号化装置
JP3265645B2 (ja) 音声符号化装置
Chan Efficient interconversion algorithm for PARCOR and LSP parameters
Mikkonen et al. Soft-decision decoding of binary block codes in CELP speech coding
JPH0527800A (ja) ベクトル量子化方式
JPH08137496A (ja) 音声符号化装置

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20101111

Year of fee payment: 14

EXPY Expiration of term