KR100346732B1 - 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치 - Google Patents

잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치 Download PDF

Info

Publication number
KR100346732B1
KR100346732B1 KR1019950026591A KR19950026591A KR100346732B1 KR 100346732 B1 KR100346732 B1 KR 100346732B1 KR 1019950026591 A KR1019950026591 A KR 1019950026591A KR 19950026591 A KR19950026591 A KR 19950026591A KR 100346732 B1 KR100346732 B1 KR 100346732B1
Authority
KR
South Korea
Prior art keywords
formant
pulse
pitch
noise codebook
generating
Prior art date
Application number
KR1019950026591A
Other languages
English (en)
Other versions
KR970013777A (ko
Inventor
김홍국
하남규
Original Assignee
삼성전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자 주식회사 filed Critical 삼성전자 주식회사
Priority to KR1019950026591A priority Critical patent/KR100346732B1/ko
Publication of KR970013777A publication Critical patent/KR970013777A/ko
Application granted granted Critical
Publication of KR100346732B1 publication Critical patent/KR100346732B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0007Codebook element generation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

음성의 피치정보와 포만트정보를 이용하여 음성의 여기신호를 모델링하는 선형예측 부호화방법에 관한 것으로서 더욱 상세하게는 음성의 피치정보와 포만트정보를 이용하여 펄스열을 생성하고 이를 통하여 생성된 잡음코드북을 이용하여 선형예측 부호화하는 방법이 개시된다. 본 발명에 따른 잡음코드북을 생성방법은 (a) 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 단계, (b) 상기 음성 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 단계 및 (c) 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시켜 잡음코드북을 작성하는 단계를 포함하는 것을 특징으로 한다.
본 발명에 따른 잡음코드북 작성방법은 음성에서 피치와 포만트정보를 추출하여 펄스열을 만들고, 이로부터 잡음코드북을 작성하기 때문에 기존의 CELP에 비해 고품질의 음성을 합성할 수 있게 함과 동시에 코드북의 크기를 줄일수 있는 효과가 있다.

Description

잡음코드북 작성과 그를 이용한 선형예측 부호화/복호화 방법 및 그 장치
본 발명은 음성의 피치정보와 포만트정보를 이용하여 음성의 여기신호를 모델링하는 선형예측 부호화방법에 관한 것으로서 더욱 상세하게는 음성의 피치정보와 포만트정보를 이용하여 펄스열을 작성하고 이를 이용하여 작성된 잡음코드북을 이용하여 부호화하는 방법에 관한 것이다.
일반적으로 음성의 피치(pitch)정보와 포만트(formant)정보는 분석구간내에서 변화하는 값을 갖는다. 이 정보는 음성의 주기성 뿐만아니라 음질을 좌우하는 중요한 요소이다.
코드여기 선형예측 부호화기(Code Excited Linear Prediction: 이하 CELP부호화기라 함)의 피치필터(pitch filter)는 음성의 주기성을 제거하기 위해 사용되고 제거되지 않은 부분(잔차신호: residual)는 잡음코드북으로 모델링된다.
그러나, 주기성의 시변특성 때문에 실제의 잔차신호는 음성의 주기성분과 유사한 모양을 갖게된다. 따라서, 이를 잡음코드북으로 처리할 경우에는 고품질의 복호화된 합성음을 기대하기 어렵다.
따라서, 잡음코드북대신 음성의 잔차신호와 유사한 여기신호를 생성하고, 이를 코드북으로 사용하는 것이 바람직하다.
본 발명은 상기의 요구에 부응하기 위하여 창출된 것으로서 피치 및 포만트정보를 이용하여 펄스열을 생성하고, 생성된 펄스열을 이용하여 잔차신호를 부호화하는 데 사용되는 잡음코드북을 작성하는 방법과 위 잡음코드북을 이용한 선형예측 부호화방법 및 복호화 방법을 제공하고, 위 방법에 대응되는 장치를 제공하는 것을 그 목적으로 한다.
상기 목적을 달성하는 본 발명에 따른 음성신호의 잔차성분을 부호화하기 위한 잡음코드북을 생성방법방법은 (a) 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 단계, (b) 상기 음성 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 단계 및 (c) 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시켜 잡음코드북을 작성하는 단계를 포함하는 것을 특징으로 한다. 여기서 상기 (c) 단계는 (c1) 피치 주파수와 포만트 주파수의 배수관계에 근거하여 포만트 펄스의 크기를 구하는 단계, (c2) 상기 구해진 펄스크기를 이용하여 제1펄스열을 생성시키는 단계, (c3) 상기 제1펄스열을 푸리에 변환하여 얻은 스펙트럼에 잡음 성분을 혼합하여 제2펄스 스펙트럼을 생성시키는 단계 및 (c4) 상기 제2펄스 스펙트럼을 역 푸리에 변환시켜 펄스열을 만들고, 이를 통하여 잡음코드북을 작성하는 단계를 포함하는 것을 특징으로 할 수 있다. 또한 상기 펄스열은 프레임 주기로 작성되는 것이 바람직하다.
상기 목적을 달성하는 본 발명에 따른 잡음코드북을 이용하여 음성신호의 잔차성분의 부호화방법은 (a) 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 단계, (b) 상기 음성 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 단계, (c) 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시켜 잡음코드북을 작성하는 단계 및 (d) 상기 작성된 잡음코드북을 사용하여 상기 잔차신호를 부호화하는 단계를 포함하는 것을 특징으로 한다.
또한 상기 목적을 달성하는 본 발명에 따른 잡음코드북을 이용하여 음성신호의 잔차성분이 부호화된 잔차부호화신호를 복호화하는 방법은 (a) 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 단계, (b) 상기 음성 프레임을 대표하는 음성특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 단계, (c) 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시켜 잡음코드북을 작성하는 단계 및 (d) 상기 작성된 잡음코드북을 사용하여 상기 잔차부호화신호를 복호화하는 단계를 포함하는 것을 특징으로 한다.
또한 상기 목적을 달성하는 본 발명에 따른 음성신호의 잔차성분을 부호화하기 위한 잡음코드북을 생성하는 장치는 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 피치추출부, 상기 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 포만트추출부, 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시키는 펄스생성부 및 상기 펄스생성부에서 생성된 펄스열에 기초하여 잡음코드북을 생성시키는 잡음코드북 생성부를 포함하는 것을 특징으로 할 수 있다. 여기서 상기 펄스생성부는 피치 주파수와 포만트 주파수의 배수관계에 근거하여 포만트 펄스의 크기를 구하고, 상기 구해진 펄스크기를 이용하여 제1펄스열을 생성시켜, 상기 제1펄스열을 푸리에 변환하여 얻은 스텍트럼에 잡음 성분을 혼합하여 얻은 제2펄스 스텍트럼을 역 푸리에 변환시켜 펄스열을 생성시키는 것을 특징으로 할 수 있다.
또한 상기 목적을 달성하는 본 발명에 따른 잡음코드북을 이용하여 음성신호의 잔차성분을 부호화하는 장치는 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 피치추출부, 상기 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 포만트추출부, 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시키는 펄스생성부, 상기 펄스생성부에서 생성된 펄스열에 기초하여 잡음코드북을 생성시키는 잡음코드북 생성부 및 상기 잡음코드북을 이용하여 상기 잔차성분을 부호화시키는 잔차성분부호화부를 포함하는 것을 특징으로 할 수 있다.
또한 상기 목적을 달성하는 본 발명에 따른 잡음코드북을 이용하여 음성신호의 잔차성분이 부호화된 잔차부호화신호를 복호화하는 장치는 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 피치추출부, 상기 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 포만트추출부, 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시키는 펄스생성부, 상기 펄스생성부에서 생성된 펄스열에 기초하여 잡음코드북을 생성시키는 잡음코드북 생성부 및 상기 잡음코드북을 이용하여 상기 잔차부호화신호을 복호화시키는 잔차성분복호화부를 포함하는 것을 특징으로 할 수 있다.
이하 첨부된 도면을 참조하여 본 발명을 상세히 설명한다.
제1도는 종래의 코드여기 선형예측 부호화과정을 보이는 블록선도이다. 제1도에 있어서 참조번호 101에서는 분석하고자 하는 음성의 일정구간(프레임)을 샘플링한다. 일반적으로 1프레임은 20-30ms 즉, 8kHz 샘플링의 경우 160-240개의 샘플값에 해당한다.
참조번호 102에서는 샘플링된 1프레임의 음성데이터에 대해 직류성분을 제거하기 위한 고역여파처리(high pass filtering)를 행한다.
참조번호 103에서는 선형예측기법을 사용하여 음성의 특징파라메타αi를 구한다. 이 특징파라메타(이하 LPC계수라 함)는 식(1)과 같이 창함수(window function)로 가중된 음성신호에 대해 이를 p차의 선형다항식으로 근사화 시키는 경우에 있어서 구해지는 다항식의 계수에 해당한다.
여기서,이고, 식(2)의 값을 최소화하는 계수에 해당한다.
여기서,이다.
이렇게 얻어진 LPC계수는 양자화되어 전송되기에 앞서 참조번호 104에서 전송 시 효율을 좋게하고 부프레임 보간(subframe interpolation)특성이 좋은 선스펙트럼쌍(Line Spectrum Pairs: 이하 LSP)계수로 변환된다.
LSP계수는 참조번호 105에서 양자화된다.
참조번호 106에서는 부호화기와 복호화기의 동기를 맞추기위해 LSP계수를 역양자화시킨다.
이렇게 분석된 음성파라메타로부터 음성의 주기성을 제거하고, 잡음코드북으로 모델링하기 위해 음성구간을 4개의 부프레임으로 자세히 나눈다. 즉, 각 부프레임의 음성구간 길이는N/4=N s 가 된다.
S번째 부프레임에 대한 I번째 음성파라메타는 다음 식(3)과 같이 얻을 수 있다.
여기서, ωi(n-1)와 ωi(n)는 각각 바로 전프레임과 현재 프레임의 i번째 LSP계수를 나타낸다.
참조번호 108에서는 LSP계수를 LPC계수로 변환시킨다. 그리고 참조번호 109, 110, 111에서는 부프레임 LPC계수로부터 음성합성필터와 오차가중필터를 구성한다.
음성합성필터와 오차가중필터는 다음식으로 구해진다.
여기서,는 LSP계수로부터 변환된 LPC계수이다.
참조번호 109는 바로 전 부프레임의 합성필터의 영향을 제거해 준다. Zero-Input-Reponse(ZIR), Szir(n)는 다음의 식(6)과 같이 구할 수 있다.
여기서,(n)는 바로 전 프레임에서의 합성신호를 의미한다.
이 ZIR의 결과를 원 음성신호 S(n)에서 뺀다. 이를 Sd(n)라 한다.
참조번호 113과 참조번호 114는 각각 적응코드북과 잡음코드북 중에서 Sd(n)에 가장 근사한 코드북을 찾는 과정에 해당한다.
제2도는 적응코드북의 탐색과정을 보이는 블럭선도이다. 식 (5)에 해당하는오차가중필터는 신호 Sd(n)과 음성합성필터에 각각 적용된다. Sd(n)에 오차가중필터를 적용한 신호를 SdW(n)라 한다. 또한 적응코드북을 이용하여 L의 지연을 갖고 만들어지는 값을 PL(n)이라하면 제202단계에서 필터링된 신호는 ga·P'L(n)이고 두 신호의 차를 최소화하는 L*와 ga를 다음식 (7)-(9)와 같이 찾는다.
이렇게 구해진 L*와 ga로부터 구해진 오차신호를 SeW(n)이라 한다. 이 값은 식 (10)과 같다.
제3도는 잡음코드북의 탐색과정을 보이는 블럭선도이다. M개로 구성된 잡음코드북 중의 i번째 코드어를 Ci(n)라 하면 참조번호 301 에서 필터링된 신호는 gr· c'i(n)이 된다. 최적의 코드어와 코드북이득은 다음 식 (11)-(13)과 같다.
최종적으로 얻어지는 음성필터의 여기신호는 식(14)와 같이 나타내어 진다.
식(14)의 결과는 적응코드북을 갱신하는 데 이용된다.
부호화기에서는 pitch, LSP계수, 적응코드북 인덱스 L*, 이득 ga, 잡음코드북 인덱스 i*, 이득 gr을 복호화기로 전송한다.
제4도는 복호화기의 동작원리를 보이는 것이다.
상술한 CELP부호화기의 단점은 잡음코드북을 모든 음성데이타에 대해 동일한 값으로 사용하는 데 있다. 따라서, 잡음코드북의 성능이 CELP부호화기의 성능을 좌우하게 된다. 또한 코드어의 크기 M도 매우 커질 수 밖에 없게 된다.
제5도는 본 발명에 창출한 Pulse Train Code Excited Linear Prediction(PT-CELP) 부호화방법을 보이는 블록선도이다. 제5도에 도시된 흐름도는 참조번호 501 내지 504를 제외하고는 제1도에 도시된 바와 동일하다. 따라서, 설명을 간략하게 하기 위하여 중복되는 부분에 대한 설명을 생략한다.
참조번호 501에서는 음성으로부터 피치정보를 추출하고, 참조번호 502에서는 현재 프레임을 대표하는 LPC계수를 역양자화한다. 참조번호 503에서는 LPC스펙트럼으로부터 포만트정보를 추출한다. 추출된 피치와 포만트정보는 참조번호 504에서 잡음코드북으로 사용될 펄스열을 만드는데 사용된다.
펄스열의 생성은 각 프레임마다 행해지며 또한 피치정보를 복호화기로 전송하기 때문에 복호화기에서도 부호화기에서와 마찬가지로 펄스열을 만들고 이를 코드북으로 사용한다.
이렇게 구현된 코드북은 현재 분석하고자 하는 음성형태, 즉 피치와 포만트에 잘 맞는 파형으로 구성되게 된다. 이는 코드북의 크기 M을 줄일 수 있게 하며, 음성부호화기의 성능을 향상시키게 된다. 또한 적응코드북의 탐색 시 제1도에서와는 달리 탐색구간을 프레임 대표피치 P에 대해 (P-4)에서 (P+3)까지의 8가지 그리고 (2P-4)에서 (2P+4)의 8가지, 총 16가지로 한정하여 탐색시간의 감축효과를 갖는다.
참조번호 501에서는 음성의 1프레임 데이타에 대해 피치를 추출한다. 피치추출은 음성의 자기상관계수를 이용한다. 전처리과정(102단계)을 거친 음성신호를Sp(n)이라 하면 자기상관계수 rs(n)는
이 된다. 일반적으로 주기 P를 갖는 신호의 자기 상관 계수는 역시 주기 P를 갖는다. 즉,
이 된다. 또한 rs(0)는 모든 rs(n)보다 크다는 것이 알려져 있으므로 처음으로 최대가 되는 rs(n)을 찾으면 된다.
참조번호 503은 참조번호 502에서 얻어진 현재 프레임을 대표하는 LPC계수로부터 얻은 스펙트럼의 로컬 맥시마(Local Maxima)를 서치하여 얻을 수 있다. 예에서와 같이 로컬 멕시마(Local Maxima)가 3개 존재할 경우 이를 각각 F1, F2, F3라 한다. 본 발명에서는 우선 F1정보만을 이용하였다.
제8도는 제5도에 도시된 참조번호 504의 기능을 보다 구체적으로 보이는 흐름도이다. 제801단계에서는 F1주파수가 피치의 주파수의 몇배인가를 계산한다.
제802단계는 피치펄스와 피치펄스 사이에 M-1개의 포만트펄스를 만들기위한크기를 구한다.
제803단계는 제802단계에서 얻어진 크기정보를 이용하여 펄스열 p(n)을 만든다.
제9도는 M=3인 경우의 예를 보인다.
제804단계에서는 p(n)을 256 point Discrete Fourier Transform하여 스팩트럼을 구한다. 제805단계에서는 이 스펙트럼에 잡음성분을 혼합한다. 잡음이 혼합된 펄스 스펙트럼는 다음 식과 같이 구한다.
제806단계에서는 식(19)의를 256 point inverse DFT하여을 구한다.
이렇게 구한 펄스열로부터 제5도의 제505단계에서는 코드북을 생성한다.
제6도는 제5도에 도시된 부호화과정에 대응되는 복호화과정을 보이는 도면이다. 제6도에 도시된 복호화과정은 전송된 피치정보로부터 펄스열을 만든 다음 이 펄스열로 잡음코드북을 대체하여 제4도와 같이 합성음을 만든다.
상술한 바와 같이 본 발명에 따른 잡음코드북 작성방법은 음성에서 피치와 포만트정보를 추출하여 펄스열을 만들고, 이로부터 잡음코드북을 작성하기 때문에 기존의 CELP에 비해 고품질의 음성을 합성할 수 있게 함과 동시에 코드북의 크기를 줄일수 있는 효과가 있다.
또한, 피치를 추정하여 적응코드북 탐색과정에 이용함으로서 탐색시간을 줄일 수 있게 하는 효과도 있다.
제1도는 종래의 코드여기 선형예측 부호화 과정을 보이는 블럭선도이다.
제2도는 적응코드북의 탐색과정을 보이는 블럭선도이다.
제3도는 잡음코드북의 탐색과정을 보이는 블럭선도이다.
제4도는 종래의 코드여기 선형예측 복호화방법을 보이는 블럭선도이다.
제5도는 본 발명에 따른 잡음코드북 작성방법을 적용한 새로운 코드여기 선형예측 부호화방법을 보이는 블럭선도이다.
제6도는 제5도에 도시된 부호화과정에 대응되는 복호화과정을 보이는 블럭선도이다.
제7도는 추출된 포만트의 일예를 보이는 도면이다.
제8도는 제5도에 도시된 펄스열 발생과정을 보다 구체적으로 보이는 흐름도이다.
제9도는 발생된 펄스열의 일예를 보이는 도면이다.

Claims (9)

  1. 음성신호의 잔차성분을 부호화하기 위한 잡음코드북을 생성시키는 방법에 있어서,
    (a) 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 단계;
    (b) 상기 음성 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 단계; 및
    (c) 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시켜 잡음코드북을 작성하는 단계를 포함하는 것을 특징으로 하는 잡음코드북 생성방법.
  2. 제1항에 있어서, 상기 (c) 단계는
    (c1) 피치 주파수와 포만트 주파수의 배수관계에 근거하여 포만트 펄스의 크기를 구하는 단계;
    (c2) 상기 구해진 펄스크기를 이용하여 제1펄스열을 생성시키는 단계;
    (c3) 상기 제1펄스열을 푸리에 변환하여 얻은 스펙트럼에 잡음성분을 혼합하여 제2펄스 스펙트럼을 생성시키는 단계; 및
    (c4) 상기 제2펄스 스펙트럼을 역 푸리에 변환시켜 펄스열을 만들고, 이를 통하여 잡음코드북을 작성하는 단계를 포함하는 것을 특징으로 하는 잡음코드북 생성방법.
  3. 제1항 또는 제2항에 있어서, 상기 펄스열은
    프레임 주기로 작성되는 것을 특징으로 하는 잡음코드북 생성방법.
  4. 잡음코드북을 이용하여 음성신호의 잔차성분을 부호화하는 방법에 있어서,
    (a) 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기상관계수를 이용하여 피치를 추출하는 단계;
    (b) 상기 음성 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 단계;
    (c) 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시켜 잡음코드북을 작성하는 단계; 및
    (d) 상기 작성된 잡음코드북을 사용하여 상기 잔차신호를 부호화하는 단계를 포함하는 것을 특징으로 하는 선형예측 부호화방법.
  5. 잡음코드북을 이용하여 음성신호의 잔차성분이 부호화된 잔차부호화신호를 복호화하는 방법에 있어서,
    (a) 소정의 음성신호의 한 프레임에서 상기 음성신호의 자기상관계수를 이용하여 피치를 추출하는 단계;
    (b) 상기 음성 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 단계;
    (c) 상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시켜 잡음코드북을 작성하는 단계; 및
    (d) 상기 작성된 잡음코드을 사용하여 상기 잔차부호화신호를 복호화하는 단계를 포함하는 것을 특징으로 하는 선형예측 부호화방법.
  6. 음성신호의 잔차성분을 부호화하기 위한 잡음코드북을 생성장치에 있어서,
    소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 피치추출부;
    상기 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 포만트추출부;
    상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시키는 펄스생성부; 및
    상기 펄스생성부에서 생성된 펄스열에 기초하여 잡음코드북을 생성시키는 잡음코드북 생성부를 포함하는 것을 특징으로 하는 잡음코드북 생성장치.
  7. 제6항에 있어서, 상기 펄스생성부는
    피치 주파수와 포만트 주파수의 배수관계에 근거하여 포만트 펄스의 크기를 구하고, 상기 구해진 펄스크기를 이용하여 제1펄스열을 생성시켜, 상기 제1펄스열을 푸리에 변환하여 얻은 스펙트럼에 잡음 성분을 혼합하여 얻은 제2펄스 스펙트럼을 역 푸리에 변환시켜 펄스열을 생성시키는 것을 특징으로 하는 잡음코드북 생성장치.
  8. 잡음코드북을 이용하여 음성신호의 잔차성분을 부호화하는 장치에 있어서,
    소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 피치추출부;
    상기 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 포만트추출부;
    상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시키는 펄스생성부;
    상기 펄스생성부에서 생성된 펄스열에 기초하여 잡음코드북을 생성시키는 잡음코드북 생성부; 및
    상기 잡음코드북을 이용하여 상기 잔차성분을 부호화시키는 잔차성분부호화부를 포함하는 것을 특징으로 하는 선형예측 부호화장치.
  9. 잡음코드북을 이용하여 음성신호의 잔차성분이 부호화된 잔차부호화신호를 복호화하는 장치에 있어서,
    소정의 음성신호의 한 프레임에서 상기 음성신호의 자기 상관계수를 이용하여 피치를 추출하는 피치추출부;
    상기 프레임을 대표하는 음성 특징파라미터의 계수에 기초하여 얻은 스펙트럼으로부터 포만트를 구하는 포만트추출부;
    상기 추출된 피치 정보와 포만트 정보에 기초하여 펄스열을 생성시키는 펄스생성부;
    상기 펄스생성부에서 생성된 펄스열에 기초하여 잡음코드북을 생성시키는 잡음코드북 생성부; 및
    상기 잡음코드북을 이용하여 상기 잔차부호화신호을 복호화시키는 잔차성분복호화부를 포함하는 것을 특징으로 하는 선형예측 복호화장치.
KR1019950026591A 1995-08-25 1995-08-25 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치 KR100346732B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950026591A KR100346732B1 (ko) 1995-08-25 1995-08-25 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950026591A KR100346732B1 (ko) 1995-08-25 1995-08-25 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치

Publications (2)

Publication Number Publication Date
KR970013777A KR970013777A (ko) 1997-03-29
KR100346732B1 true KR100346732B1 (ko) 2002-11-30

Family

ID=37488718

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950026591A KR100346732B1 (ko) 1995-08-25 1995-08-25 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치

Country Status (1)

Country Link
KR (1) KR100346732B1 (ko)

Also Published As

Publication number Publication date
KR970013777A (ko) 1997-03-29

Similar Documents

Publication Publication Date Title
KR100348899B1 (ko) 캡스트럼 분석을 이용한 하모닉 노이즈 음성 부호화기 및부호화 방법
US4709390A (en) Speech message code modifying arrangement
US5018200A (en) Communication system capable of improving a speech quality by classifying speech signals
JP4912816B2 (ja) 音声コーダの方法とシステム
JPH08123495A (ja) 広帯域音声復元装置
JPH10187196A (ja) 低ビットレートピッチ遅れコーダ
JP4180677B2 (ja) 音声符号化並びに復号化方法及びその装置
US6826527B1 (en) Concealment of frame erasures and method
US6768978B2 (en) Speech coding/decoding method and apparatus
EP1057172A1 (en) Apparatus and method for hybrid excited linear prediction speech encoding
JPH086597A (ja) 音声の励振信号符号化装置および方法
KR100346732B1 (ko) 잡음코드북작성과그를이용한선형예측부호화/복호화방법및그장치
Burnett et al. A mixed prototype waveform/CELP coder for sub 3 kbit/s
KR100346729B1 (ko) 코드여기선형예측부호화의잡음코드북작성방법
JP2853170B2 (ja) 音声符号化復号化方式
Hernandez-Gomez et al. On the behaviour of reduced complexity code-excited linear prediction (CELP)
JPH08211895A (ja) ピッチラグを評価するためのシステムおよび方法、ならびに音声符号化装置および方法
KR100624545B1 (ko) 티티에스 시스템의 음성압축 및 합성방법
JP3676801B2 (ja) 広帯域音声復元方法及び広帯域音声復元装置
JPH02160300A (ja) 音声符号化方式
JPH10232697A (ja) 音声符号化方法および復号化方法
JPH0876793A (ja) 音声符号化装置及び音声符号化方法
JPS61259300A (ja) 音声合成方式
WO2001009880A1 (en) Multimode vselp speech coder
KR19980035867A (ko) 음성 데이터 부호화/복호화장치 및 그 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20080627

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee