KR100421226B1 - 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용 - Google Patents

음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용 Download PDF

Info

Publication number
KR100421226B1
KR100421226B1 KR1019960065696A KR19960065696A KR100421226B1 KR 100421226 B1 KR100421226 B1 KR 100421226B1 KR 1019960065696 A KR1019960065696 A KR 1019960065696A KR 19960065696 A KR19960065696 A KR 19960065696A KR 100421226 B1 KR100421226 B1 KR 100421226B1
Authority
KR
South Korea
Prior art keywords
signal
filter
transfer function
frequency signal
short
Prior art date
Application number
KR1019960065696A
Other languages
English (en)
Other versions
KR970050107A (ko
Inventor
까뜨린느 꽹뀌
귀아데 알렝 르
Original Assignee
프랑스 뗄레꽁(소시에떼 아노님)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프랑스 뗄레꽁(소시에떼 아노님) filed Critical 프랑스 뗄레꽁(소시에떼 아노님)
Publication of KR970050107A publication Critical patent/KR970050107A/ko
Application granted granted Critical
Publication of KR100421226B1 publication Critical patent/KR100421226B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients

Abstract

선형예측 분석방법은 음성주파수 신호의 스펙트럼 포락선을 나타내는 스펙트럼 파라미터를 결정하기 위하여 이용된다. 이 방법에는 q (1 보다 큰 정수)의 연속 예측단계(5p)가 포함되어 있다. 각 예측단계(p(1≤p≤q))에서는 해당단계의 입력신호의 선형예측 계수(a1 p,…aMp p)의 미리 확정된 수(Mp)를 나타내는 파라미터들이 결정된다. 분석될 음성 주파수 신호는 제 1 단계의 입력신호를 구성한다. 단계(p+1)의 입력신호(Sp(n))는 전달함수
를 가진 필터에 의하여 여과되는 단계(p)의 입력신호(Sp-1(n))로 구성되어 있다.
특히, 광대역 음성코더내에 사용한다.

Description

음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용{METHOD FOR LINEAR PREDICTIVE ANALYSIS OF AN AUDIO-FREQUENCY SIGNAL, METHODS FOR CODING AND DECODING AN AUDIOFREQUENCY SIGNAL INCLUDING APPLICATION THEREOF}
본 발명은 음성 주파수 신호의 선형예측 분석을 위한 방법에 관한 것이다. 이 방법은 예측 음성코더, 특히 합성에 의한 분석코더(그중 가장 널리 보급되어 있는 유형은 "코드 여기 선형예측"(code-excited linear prediction: CELP)코더이다)내에서, 특수하지만, 한정적이지 않은 응용을 발견한다.
합성에 의한 분석예측 코딩 기술들이 전화의 질을 보전하면서, 8 kbit/s 정도의 낮은 비율로, 전화대역(300 내지 3400 Hz)내의 음성을 코딩하기 위하여 현재 매우 널리 이용되고 있다. 음성대역(20 kHz 정도의)에 있어서는 변환코딩 기술이 방송을 수반하는 여러가지 응용과 음성 및 음악신호를 저장하기 위하여 이용된다. 그러나, 이러한 기술들은 비교적 긴 코딩지연(100 ms 이상)을 가지며, 이는 특히 대화가 매우 중요한 그룹통신에 참가할 때에 여러가지 곤란이 제기된다. 예측 기술들은 지연을 더 짧게 하지만, 이는 본질적으로 선형예측 분석프레임의 길이(전형적으로 10 내지 20 ms)에 따라 달라진다. 이러한 이유로, 전화대역보다 더 큰 대역폭을 가지는 음성/음악신호를 코딩하기 위한 응용들도 모색되고 있다.
비트율 압축용으로 이용되는 예측코더는 신호의 스펙트럼 포락선의 모델을 만든다. 이러한 모델형성은 입력신호의 M 선형예측 계수(ai)를 결정하는 것으로 이루어지는 M 차수(협대역에 있어서는 전형적으로)의 선형예측 분석에 의한다. 이러한 계수는 다음과 같은 형식 1/A(z)의 전달함수를 가진 디코더내에 사용되는 합성필터를 특징으로 한다.
선형예측 분석은 음성코딩보다 더 넓은 일반응용분야를 가진다. 일부 응용에 있어서는 예측순서(M)는 선형예측 분석이 얻고자하는 변수중 하나를 구성하며, 이러한 변수는 분석된 신호의 스펙트럼내에 존재하는 피크의 수에 의하여 영향을 받는다(US-A-5,142,581 참조).
선형예측 분석에 의하여 계산되는 필터는 여러가지 구조를 가질 수 있기 때문에, 계수(계수 ai자체, LAR, LSF, LSP 파라미터, 반사 또는 PARCOR 계수 등)를 나타내기 위한 파라미터의 선택이 달라진다. 디지탈신호 처리기(DSP)가 나오기전에는 순환구조, 예를 들면 1971 년에 부다페스트에서 개최된 제 7 차 국제음향학회의의 회보에 발표된 F, 이다쿠라 및 S. 사이또의 논문 "음성분석 및 합성을 위한 디지탈 여과법"(Digital Filtering Techniques for Speech Analysis and Acoustics)(pp. 261-264)에 기술된 유형의 PARCOR 계수를 채용하는 구조들이 통상적으로 이용되었다(FR-A-2,284,946 또는 US-1-3,975,587 참조).
합성에 의한 분석 코더내에서는, 계수(ai)가, 음성신호를 나타내는 합성신호를 얻기 위하여 단기 합성필터에 인가할 여기신호를 결정하는데 코더에 의하여 사용되는 지각가중 필터를 구성하는데도 이용된다. 이러한 지각가중은 스펙트럼중 코딩오류를 가장 많이 지각할 수 있는 부분, 즉 인터포먼트 영역(inferformant regions)에 역점을 둔다. 지각가중필터의 전달함수(W(z))는 통상적으로 다음의 형식으로 된다.
상기식에서,과 같은 2 개의 스펙트럼 확장계수이다. 잡음 마스킹내의 개선은 E. Ordentlich 및 Y. Shoham 이 발표한 논문 "32 kbps 에서의 광대역음성의 저지연코드-여기 선형예측 코딩"(Proc. ICASSP, Toronto, May 1991, pp. 9-12)에 의하여 제공되었다. 이러한 개선은 지각가중을 위하여 필터(W(z))를 스펙트럼의 틸트(tilt)를 모델화하는 또다른 필터와 결합시키는 것이다. 이 개선은 특히, 필자들이 재구성신호의 주관적 질에 괄목할만한 향상을 보여준 고도의 동적 스펙트럼범위(광대역 또는 음성대역)를 가진 코딩신호의 경우에는 상당히 평가할 만하다.
대부분의 현행 CELP 디코더에 있어서, 선형예측 계수(ai)는 신호의 스펙트럼의 틸트를 변경시킴이 없이, 음성신호의 포먼트와 고조파(harmonic)사이의 주파수영역을 감쇠시키는데 이용되는 포스트필터의 범위를 정하기 위하여 이용되기도 한다. 이러한 포스트 필터의 전달함수의 종래형식은 다음과 같다.
상기식에서, GP는 필터의 감쇠를 보상하는 이득인수이고, β1및 β2는 0 ≤ β1≤ β2≤ 1 과 같은 계수이고, μ는 양의 상수이고,는 계수(ai)에 따라달라지는 제 1 반사계수를 나타낸다.
그러므로, 신호의 스펙트럼 포락선을 계수(ai)에 의하여 모델화하는 것은 이것이 디코더내에서 재구성될 신호의 스펙트럼 내용을 나타내고, 디코더내의 양자화 잡음 마스킹과 포스트필터링을 제어하는 한, 코딩 및 디코딩과정에 있어서 하나의 주요요소를 구성한다.
고도의 동적 스펙트럼범위를 가진 신호에 있어서, 종래의 채용된 선형예측 분석은 스펙트럼의 포락선을 충실히 모델화하지 못한다. 음성신호는 실질적으로 고주파에서 보다 저주파에서 더 강력한 경우가 많기 때문에, 선형예측 분석이 저주파에서 정밀한 모델링을 행하더라도, 이는 고주파에서의 스펙트럼 모델화를 해치게 된다. 이러한 단점은 특히, 광대역코딩의 경우에 문제가 된다.
본 발명의 목적은 선형예측 분석방법을 채용하는 시스템내의 음성고주파신호의 스펙트럼의 모델화를 개선하는 것이다. 본 발명의 또다른 목적은 이러한 시스템의 성능을 서로 다른 입력신호(음성, 음악, 사인파, DTMF 신호등), 서로 다른 대역폭(전화대역, 광대역, 하이파이대역등), 서로 다른 녹음 기록(방향성 마이크로폰, 음향안테나등) 및 여과조건등에 대하여 더 균일하게 하는 것이다.
이에따라, 본 발명은 음성주파수 신호의 단기 스펙트럼에 종속하는 스펙트럼 파라미터를 결정하기 위하여, 음성주파수 신호의 선형예측 분석을 위한 방법으로서, q 연속 예측단계(여기에서 q 는 1 보다 큰 정수이다)가 포함되어 있는 방법을 제안한다. 각 예측단계(p (1 ≤ p ≤ q)에서는 이 단계(stage)의 입력신호의 미리정하여진 수(Mp)의 선형예측 계수(a1 p, … aMP P)를 나타내는 파라미터들이 정하여지고, 분석된 음성주파수 신호는 제 1 단계의 입력신호를 구성하고, 단계(p+1)의 입력신호는 다음의 전달함수를 가진 필터에 의하여 여과되는 단계(p)의 입력신호를 구성한다.
선형예측 계수의 수(Mp)는 특별히 일단계에서 다음단계로 증가될 수 있다. 따라서, 제 1 단계는 스펙트럼이나 신호의 일반 틸트를 공정하고 성실하게 설명할 수 있으나, 그 다음 단계들은 신호의 포먼트(formant)의 표현을 세분한다. 고도의 동적범위를 가진 신호의 경우에는, 이것은 중요하다고 지각될 수 있는 다른 주파수영역의 평범한 모델화를 해치면서, 가장 강력한 영역에 너무 많은 특권을 부여하는 것을 피하게 한다.
본 발명의 제 2 국면은 순방향 적응합성 분석 음성주파수 코더내에 이러한 선형예측 분석방법을 응용하는 것에 관한 것이다. 이에 따라, 본 발명은 다음의 스텝, 즉
- 단기 합성필터를 정의하는 파라미터들을 결정하기 위하여 연속 프레임내에 계수화된 음성주파수 신호의 선형예측 분석스텝,
- 음성주파수 신호를 나타내는 합성신호를 만들어내기 위하여 단기 합성필터에 인가할 여기신호를 정의하는 여기 파라미터의 결정스텝,
- 단기 합성필터를 정의하는 파라미터 및 여기 파라미터의 양자화값을 만들어내는 스텝 등이 포함되어 있는 음성주파수 신호를 코딩하기 위한 방법으로서, 선형예측 분석이 전술한 바와 같은 q 연속단계로 구성된 하나의 프로세스이고, 단기 예측필터가 다음의 형식 1/A(z)의 전달함수를 가진 방법을 제안한다.
이와 같이 얻은, 전달함수 A(z)는 수식(2)에 따라, 코더가 여기신호의 폐쇄루프 결정에 의한 합성분석코더인 때에, 지각평가 필터의 전달함수를 정의하기 위하여서도 사용된다. 또다른 유리한 가능성은 일단계에서 다른 단계로 변동될 수 있는, 즉 지각평가 필터에 다음 형식의 전달함수를 제공할 수 있는 스펙트럼 확장계수()를 채택할 수 있다는 것이다.
상기식에서,과 같은 스펙트럼 확장계수의 쌍을 나타낸다.
본 발명은 대응 디코더내에도 사용할 수 있다. 본 발명에 의하여 이와 같이 사용되는 디코딩방법에는 다음의 스텝, 즉
- 각 세트에 미리정한 수의 계수가 포함되어 있는 다수(q 〉1)세트의 선형예측 계수가 포함되어 있는 단기 합성필터를 정의하는 파라미터와 여기 파라미터의 양자화값을 수신하는 스텝,
- 여기 파라미터의 양자화값에 근거하여 하나의 여기신호를 만들어내는 스텝,
- 다음 형식 1/A(z)의 전달함수를 가진 합성필터에 의하여 여기신호를 여과함으로써 하나의 합성 음성주파수 신호를 만들어내는 스텝등이 포함되어 있다.
상기식에서, 계수일때, p번째 선형예측 계수 세트에 해당된다.
이러한 전달함수 A(z)는 그 전달함수에 전술한 수식(3)에서와 같이, 형식과 같은 계수를 나탄낸다)의 일항에 포함되어 있는 포스트필터를 정의하는데도 사용할 수 있다.
유리한 일변형은 포스트필터의 전달함수중 이 항을 다음의 항으로 대치하는 것이다.
상기식에서,과 같은 계수쌍들을 나타낸다.
본 발명은 또한 연속 프레임으로 계수화된 제 1 음성주파수 신호를 코딩하기 위한 방법으로서, 다음의 스텝, 즉
- 단기 합성필터를 정의하는 파라미터들을 결정하기 위하여 제 2 음성주파수 신호를 선형예측 분석하는 스텝,
- 제 1 음성주파수 신호를 나타내는 합성신호로서, 적어도 하나의 다음 프레임을 위한 제 2 음성주파수 신호를 구성하는 합성신호를 만들어내기 위하여, 단기 합성필터에 인가될 여기신호를 정의하는 여기 파라미터를 결정하는 스텝,
- 여기 파라미터의 양자화값을 만들어내는 스텝등이 포함되어 있고,
선형예측 분석이 위에서 정의한 바와 같은 q 의 연속단계로 구성된 하나의 프로세서이고, 단기 예측필터가 다음 형식 1/A(z)의 전달함수를 가진 방법을 제안한다.
본 발명은 대응 디코더내에서의 실행을 위하여, 비트 스트림(bit stream)에 의하여 부호화된 음성주파수신호를 연속프레임으로 구성하기 위하여, 비트 스트림을 디코딩하기 위한 방법으로서, 다음의 스텝, 즉
- 여기 파라미터의 양자화값을 수신하는 스텝,
- 여기 파라미터의 양자화값에 근거하여 여기신호를 만들어내는 스텝,
- 단기 합성필터에 의하여 여기신호를 여과함으로써 합성 음성주파수 신호를 만들어내는 스텝,
- 적어도 하나의 다음 프레임을 위한 단기 합성필터의 계수를 얻기 위하여, 합성신호의 선형예측분석을 실시하는 스텝 등이 포함되어 있고,
선형예측 분석이 위에서 정의한 바와 같은 q 연속단계로 구성된 하나의 프로세스이고, 단기 예측필터가 다음 형식 1/A(z)의 전달함수를 가지는 방법을 제안한다.
본 발명에 의하면, 그외에도 혼합 음성주파수코더/디코더, 즉 최초의 선형예측 단계 또는 순방향분석에 해당하는 단계들과 최종단계 또는 역방향분석에 해당하는 단계들을 모두 순방향 및 역방향 적응방식에 따르는 코더/디코더를 만들 수 있게 한다. 이에 따라, 본 발명은 연속프레임으로 계수화된 제 1 음성주파수 신호를 코딩하기 위한 방법으로서, 다음의 단계, 즉
- 단기 합성필터의 제 1 구성요소를 정의하는 파라미터를 결정하기 위하여, 제 1 음성주파수 신호의 선형예측 분석을 행하는 스텝,
- 제 1 음성주파수 신호를 나타내는 합성신호를 만들어내기 위하여, 단기 합성필터에 인가될 여기신호를 정의하는 여기 파라미터를 결정하는 스텝,
- 단기 합성필터의 제 1 구성요소를 정의하는 파라미터와 여기 파라미터의 양자화값을 만들어내는 스텝,
- 단기 합성필터의 제 1 구성요소의 전달함수의 역에 해당하는 전달함수를 가진 필터에 의하여 합성신호를 여과하는 스텝,
- 적어도 하나의 다음 프레임을 위한 단기 합성필터의 제 2 구성요소의 계수를 얻기 위하여, 여과된 합성신호의 선형예측 분석을 행하는 스텝 등이 포함되어 있고,
제 1 음성주파수 신호의 선형예측 분석이 적어도 1 과 동일한 정수(qF)의 연속단계들이 포함된 하나의 프로세스이고, qF단계로 구성된 상기 프로세스에, 각 예측단계 p (1≤p≤qF)에서, 이 단계의 입력신호의 선형예측 계수(a1 F,P, …, aMFp F,P)의 예정된 수(MFp)를 나타내는 파라미터의 결정과 제 1 단계의 입력신호를 구성하는 제 1 음성주파수 신호 및 다음의 전달함수를 가진 필터에 의하여 여과되는 단계(p)의 입력신호를 구성하는 단계(p+1)의 입력신호가 포함되어 있고,
단기 합성필터의 제 1 구성요소가 다음 형식 1/AF(z)의 전달함수를 가지며,
여과된 합성신호의 선형예측 분석이 적어도 1 과 동일한 정수(qB)의 연속단계들로 구성되는 하나의 프로세스이고, qB단계의 프로세스가 각 예측단계 p(1≤p≤qB)에, 이 단계의 입력신호의 선형예측 계수(a1 B,P, …, aMBp B,P)의 예정된 수(MBp)를 나타내는 파라미터들의 결정과 제 1 단계의 입력신호를 구성하는 여과된 합성신호 및 다음의 전달함수를 가진 필터에 의하여 여과되는 단계(p)의 입력신호를 구성하는 단계(p+1)의 입력신호 등이 포함되어 있고,
단기 합성필터의 제 2 구성요소가 다음 형식 1/AB(z)의 전달함수를 가지며,
단기 합성필터가 A(z) = AF(z)ㆍAB(z)에 의한 형식 1/A(z)의 전달함수를 가진 방법을 제안한다.
본 발명은 대응 혼합디코더내에 실행하기 위하여, 비트 스트림에 의하여 부호화된 음성주파수 신호를 연속프레임으로 구성할 수 있도록, 비트 스트림을 디코딩하기 위한 방법으로서, 다음의 스텝, 즉
- 단기 합성필터의 제 1 구성요소로서,
의 형식 1/AF(z)의 전달함수를 가진 제 1 구성요소를 정의하는 파라미터로서, 1 ≤ p ≤ qF일때, 적어도 1 과 동일한 수(qF)의 선형예측 계수(a1 F,P, …, aMFp F,p) 세트(각 세트(p)는 예정된 수(MFp)의 계수를 포함한다)를 나타내는 파라미터와 여기 파라미터의 양자화값을 수신하는 스텝,
- 여기 파라미터의 양자화값에 근거하여 여기신호를 만들어내는 스텝,
- A(z) = AF(z)ㆍAB(z)(여기에서, 1/AB(z)는 단기 합성필터의 제 2 구성요소의 전달함수를 나타낸다)의 전달함수 1/A(z)를 가진 단기 합성필터에 의하여 여기신호를 여과함으로써 합성 음성주파수 신호를 만들어내는 스텝 및,
- 전달함수 AF(z)를 가진 필터에 의하여 합성신호를 여과하는 스텝,
- 적어도 하나의 다음 프레임을 위한 단기 합성필터의 제 2 구성요소의 계수를 얻기 위하여, 여과된 합성신호의 선형예측 분석을 실시하는 스텝 등이 포함되어 있고,
여과된 합성신호의 선형예측 분석이 위에서 정의된 바와 같은 qB단계들로 구성되는 하나의 프로세스이고, 단기 합성필터가 다음과 같은 형식 1/A(z) = 1/[AF(z)ㆍAB(z)]의 전달함수를 가지는 방법을 제안한다.
합성 분석코딩/디코딩분야에 대한 본 발명의 응용에 특별한 중요성이 있지만, 본 발명에 의하여 제안된 다단계 선형예측 분석방법은 예를 들면, 변환 예측코더, 음성인식 시스템, 음성확장 시스템 등, 음성신호 처리에 있어서 다른 많은 응용을 가진다.
본 발명의 다른 특징 및 장점들을 첨부도면에 의하여 더 상세히 설명하면 다음과 같다.
도 1 에 도시된 방법으로 분석될 음성주파수 신호는 SO(n)으로 표시한다. 이 신호는 디지탈샘플의 형태로 이용할 수 있는 것으로 가정하고, 정수(n)는 연속샘플링시간을 나타낸다. 선형예측 분석방법에는 q 연속단계(51,...5p, ..., 5q)가 포함되어 있다. 각 예측단계(prediction stage)(15p (1≤p≤q))에서는 입력신호(sp-1(n))의 차수(Mp)의 선형예측이 행하여진다. 제 1 단계(51)의 입력신호는 분석될 음성주파수 신호(sO(n))로 구성되어 있고, 단계(5p+1(1≤p≤q))의 입력신호는 다음의 전달함수를 가진 필터를 이용하여, p번째 단계(5p)의 입력신호(sp-1(n))에 여과를 적용함으로써 단계(6p)에서 얻어지는 신호(sp(n))로 구성된다.
상기식에서, 계수 ai p(1≤i≤Mp)는 단계(5p)에서 얻은 선형예측 계수이다.
여러 단계(51,…, 5q)에서 사용할 수 있는 선형예측 분석방법은 이 기술분야에서는 널리 알려져 있다.
예를들면, L.R. Rabiner 및 R.W. Shafer 에 의한 "음성신호의 디지탈 처리"(Prentice-Hall Int. 1978)과 J.D. Markel 및 A.H. Gray 에 의한 "음성의 선형예측"(Springer Verlag Berlin Heidelberg, 1976)등을 참고로 할 수 있다. 특히, (각 단계(5p)별로) 다음의 스텝이 포함되어 있는 레빈슨-더빈 알고리즘(Levinson-Durbin algorithm)을 이용할 수 있다.
- Q 샘플의 분석윈도를 거쳐 단계의 입력신호(sp-1(n))의 Mp자기상관 Ri(0 ≤ i ≤ Mp)를 평가하는 스텝
상기식에서, s*(n)=ap-1(n)ㆍf(n), f(n)은 예를들면, 장방형파함수, 해밍함수(Hamming function)와 같은 길이(Q)의 윈도함수를 나타낸다.
- 계수(ai p)의 재귀적 평가스텝,
계수 ai p(i=1, …, Mp)는 최종반복에서 얻은 ai P, Mp와 동일한 것으로 본다. 양(E(Mp))은 단계(p)의 잔류예측 오류의 에너지이다. -1 과 1 사이에 놓여있는계수(ri p)는 반사계수라 한다. 이러한 반사계수는 로그영역비(LARip= LAR(ri P)로 나타낼 수 있고, 그 함수(LAR)는 LAR(r)= log10[(1-r)/(1+r)]에 의하여 정의된다.
많은 응용에 있어서, 얻어진 예측계수는 양자화할 필요가 있다. 이러한 양자화(quantizing)는 직접 계수(ai p)상에서, 또는 관련 반사계수(ri p) 또는 로그영역비(LARi P)상에서 행할 수 있다. 또다른 가능성은 스펙트럼 라인 파라미터(선 스펙트럼쌍 LSP 또는 선 스펙트럼 주파수 LSF)를 양자화하는 것이다. O 과 π사이에서 정규화되는 Mp스펙트럼 라인 주파수 ωi p(1≤i≤Mp)는 복소수 1, exp(jω2 p), exp(jω4 p), …, exp(jωMp p)가 다항식 Pp(z)=Ap(z)-z-(Mp+1)Ap((z-1)의 루트인 것과 같고, 복소수 exp(jω1 p), exp(jω3 p),…, exp(jωp Mp-1) 및 -1 이 다항식 Qp(z)=Ap(z)+z-(Mp+1)Ap(z-1)의 루트인 것과 같다. 양자화는 규격화된 주파수((ωi p) 또는 그 코사인에 관련될 수 있다.
분석은 전술한 종래의 레빈슨-더빈 알고리즘에 따라 각 예측단계(5p)에서 실시할 수 있다. 이와 동일한 결과를 제공하는 더 최근에 개발된 다른 알고리즘, 특히 분할 레빈슨 알고리즘(S. Saoudi, J.M. Boucher 및 A. Le Guyader 에 의한 "음성코딩용 LSP 파라미터를 계산하기 위한 새로운 유효 알고리즘", SignalProcessing, Vol. 28, 1992, pp201-212, 참조)을 채용하거나, 쳬비셰프 다항식(Chebyshev Polynomials"(P. Kabal 및 R.P. Ramachandran 에 의한 "쳬비셰프 다항식을 이용한 선 스펙트럼 주파수의 계산", IEEE Trans. on Acoustics, Speech, and Signal Processing, Vol. ASSP-34, No. 6, pp. 1419-1426, December 1986, 참조)을 이용하는 것이 유리하다.
도 1 에 도시된 다단계분석은 음성주파수 신호(SO(n))용 단기 예측필터를 정의하기 위하여 실시되며, 이러한 필터의 전달함수 A(z)는 다음의 형식으로 주어진다.
이러한 전단함수는 수식(1)(M = M1 + … Mq)에 의하여 주어지는 종래의 일반형식을 만족시킨다. 그러나, 이 함수 A(z)중 다단계 예측 프로세스에 의하여 얻는 계수(ai)는 일반적으로 종래의 1 단계 예측 프로세스에 의하여 제공되는 계수와 다르다.
다른 것보다 먼저 실시되는 선형예측의 차수(Mp)는 한단계에서 다음 단계로 M1<M2…<Mg 와 같이 증가한다. 이에 따라, 분석된 신호의 스펙트럼 포락선의 모양은 제 1 단계(51)에서는 비교적 조잡하게 모델화되고(예: M1=2), 이러한 모델링은 제 1 단계에 의하여 제공된 종합정보를 상실함이 없어, 단계별로 세분된다. 이것은 특히, 광대역신호 또는 고도의 동적 스펙트럼범위를 가지는 신호의 경우에, 지각적으로 중요한 스펙트럼의 일반 틸트와 같은 파라미터를 불충분하게 계산하는 것을 피하게 한다.
전형적인 일실시예에 있어서, 연속 예측단계의 수(q)는 2와 같다. 목적이 차수(M)의 합성필터인 경우에는 M1=2 및 M2=M-2 를 취할 수 있고, 이 필터의 계수(ai)(방정식(1))는 다음에 의하여 주어진다.
단기 스펙트럼을 나타내거나, 적당한 경우에는 단기 스펙트럼을 양자화하기 위하여, 각 단계(1≤p≤q)별로 전술한 스펙트럼 파라미터(1≤i≤Mp일때, ai p,LARi p, ωi p또는 cos ωi p)의 세트중 하나를 채택하거나, 그 대안으로, 방정식(9) 내지 (13)에 따라 산정된 복합필터에 있어서는 동일한 스펙트럼 파라미터(1≤i≤일때, ai, ri, LARi, ωi또는 cos ωi)를 채택할 수 있다. 이러한 파라미터와 다른 표현 파라미터사이의 선택은 각 응용의 제약(constraints)에 따라 달라진다.
도 2 의 그래프는 종래의 일단계(M=15) 선형예측 프로세스(곡선 Ⅱ)와 q=2단계(M1=2, M2=13)에서 본 발명에 의한 선형예측 프로세스(곡선 Ⅲ)에 의하여 모델화된 음성신호의 30ms 통화부분의 스펙트럼 포락선들의 비교를 도시한 것이다. 신호의 샘플링 주파수(Fe)는 16 kHz 이었다. 신호의 스펙트럼(그 푸리에 변환의 모듈러스)는 곡선(I)에 의하여 표시되어 있다. 이 스펙트럼은 평균적으로 고주파에서 보다 저주파에서 더 많은 에너지를 가지는 음성주파수 신호를 나타낸다. 동적 스펙트럼범위는 도 2 의 경우(60 dB) 보다 이따금 더 크다. 곡선(Ⅱ, Ⅲ)은 모델화된 스펙트럼 포락선에 해당한다. 이에 의하여, 본 발명에 의한 분석방법이 특히, 고주파(f > 4 kHz)에서 스펙트럼의 모델링을 실질적으로 개선한다는 것을 알 수 있다. 고주파에서의 스펙트럼의 일반 틸트와 그 포먼트는 다단계 분석 프로세스에 의하여 더 양호하게 보인다.
CELP형 음성코더에 대한 본 발명의 응용을 설명하면 다음과 같다.
도 3 은 CELP 코더 및 디코더에서 채용되는 음성합성 프로세스를 도시한 것이다. 여기발생기(10)가 색인(k)에 응답하여 예정된 코드북에 속하는 하나의 여기코드(Ck)를 인도한다. 증폭기(12)가 이 여기코드를 여기이득(β)으로 곱하고, 여기에서 얻은 신호는 장기 합성필터(14)에 따르게 된다. 필터(14)의 출력신호(u)는 단기 합성필터(16)에 따르게 되고, 단기 합성필터의 출력은 여기에서 합성 음성신호로 보는 신호를 구성한다. 이러한 합성신호는 재구성된 음성의 주관적 질을 향상시키기 위한 포스트필터(17)에 인가된다. 포스트 필터링기술은 음성코딩분야에서는 잘 알려져 있다(J.H. Chen 및 A. Gersho 의 "코드화음성의 품질강화를 위한 적응필터링", IEEE Trans. on Speech and Audio Processing, Vol. 3-1, pp. 59-71, January 1995, 참조). 도시된 실시예에 있어서, 포스트 필터(17)의 계수들은 단기 합성필터(16)의 특징을 이루는 LPC 파라미터로 부터 얻는다. 포스트 필터(17)는 일부현행 CELP 디코더에서와 같이, 장기 포스트 필터링 구성요소도 포함할 수 있다고 이해된다.
전술한 신호들은 예를 들면, 광대역코더(50 내지 7000 Hz)에 있어서, 16 kHz와 동등한 샘플링비율로 16 비트워드에 의하여 표현되는 디지탈 신호들이다. 합성필터(14, 16)는 일반적으로 순수한 순환필터이다. 장기 합성필터(14)는 전형적으로 B(z) = 1-Gz-T인 형식 1/B(z)의 전달함수를 가진다. 지연(T)과 이득(G)은 코더에 의하여 적응될 수 있게 결정되는 장기예측(LTP) 파라미터를 구성한다. 단기 합성필터(16)를 정의하는 LPC 파라미터는 음성신호의 선형예측 분석방법에 의하여 코더에서 결정된다. 통상적인 CELP 코더 및 디코더에 있어서는 필터(16)의 전달함수는 일반적으로 A(z)가 형식(1)으로 되어있는 형식 1/A(z)으로 되어있다. 본 발명은 A(z)가 전술한 바와 같이, (7)에 의하여 분해되는 전달함수와 유사한 형식을 채택하는 것을 제안한다. 예를 들면, 서로 다른 단계의 파라미터 q=2, M1=2, M2=13(M=M1+M2=15)일 수 있다.
여기에서는 단기 합성필터(14)에 인가되는 신호(u(n))를 나타내기 위하여 "여기신호"(excitation signal)라는 용어를 사용한다. 이러한 여기신호는 LTP 구성요소(G. u(n-T))와 잔류 구성요소 또는 혁신 시퀀스(Bck(n))가 포함되어 있다. 합성에 의한 분석코더, 잔류 구성요소의 특징을 나타내는 파라미터 및 선택적으로는 LPT 구성요소 등은 지각평가필터를 이용하여 폐쇄루프내에서 평가된다.
도 4 는 CELP 코더의 다이어그램을 도시한 것이다. 음성신호 s(n)는 예를 들면, 마이크로폰(22)의 증폭 및 여과된 출력신호를 처리하는 아날로그/디지탈변환기(20)에 의하여 제공되는 디지탈신호이다. 이 신호 s(n)는 ∧ 샘플의 연속 프레임들로 디지탈화되고, 이 프레임 자체는 L 샘플의 서브 프레임 또는 여기 프레임으로 나누어진다(예: ∧ = 160, L = 32).
LPC, LTP 및 EXC (인덱스 K 및 여기이득 β) 파라미터들은 3 개의 분석모듈(24, 26, 28)에 의하여 코더 레벨에서 얻는다. 그 다음에, 이러한 파라미터들은 유효 디지탈전송을 위하여 공지된 방식으로 양자화된 다음에, 코더의 출력신호를 형성하는 멀티플렉서(30)의 지배를 받게된다. 이러한 파라미터들은 코더의 일부 필터의 초기상태를 계산하기 위하여 모듈(32)에도 인도된다. 이 모듈(32)에는 본질적으로 도 3 에 도시된 것과 같은 디코딩체인이 포함되어 있다. 모듈(32)은 디코더와 같이, 양자화된 LPC, LTP 및 EXC 파라미터에 근거하여 작동한다. LPC 파라미터가 디코더에서 보간되면, 동일한 보간이 모듈(32)에 의하여서 행하여진다. 이 모듈(32)은 코더 레벨에서, 문제가 되는 서브 프레임 전의 합성 및 여기 파라미터의 함수로서 정하여지는 디코더의 합성필터(14,16)의 전위상태를 알 수 있게 한다.
코딩 프로세스의 제 1 스텝에서는 단기 분석모듈(24)이 음성신호s(n) 의 단기 상관관계를 분석함으로써, 단기 합성필터를 정의하는 LPC 파라미터를 결정한다. 이러한 결정은 음성신호의 스펙트럼 내용의 개발에 적응할 수 있도록 ∧ 샘플의 프레임당 1 회 실시된다. 이는 본 발명에 의하면, 도 1 에 도시된 sO(n)=s(n) 이라는 분석방법을 채용하는 것이다.
코딩의 그 다음 단계는 장기예측(long-term prediction) LTP 파라미터를 결정하는 것이다. 이러한 파라미터들은 예를 들면, L 샘플의 서브 프레임당 1회 결정된다. 감산기(34)는 음성신호s(n)로부터 0 입력신호에 대한 단기 합성필터(16)의 응답을 뺀다. 이 응답은 전달함수 1/A(z)를 가진 필터(36)에 의하여 결정되고, 이 함수의 계수들은 모듈(24)에 정하여지는 LPC 파라미터에 의하여 주어지고, 그 초기상태는 합성신호의 M=M1=+…+Mq 최종샘플에 일치하도록 모듈(32)에 의하여 제공된다. 감산기(34)의 출력신호는 지각가중 필터(38)에 따르게 되고, 이 필터의 역할은 스펙트럼중 오류가 가장 많이 지각될 수 있는 부분, 즉 인터포먼트 영역을 강조하는 것이다.
지각가중 필터(38)의 전달함수 W(z)는 W(z)=AN(z)/AP(z)의 형식으로 되어있고, 여기에서 AN(z) 및 AP(z)는 차수(M)의 FIR(유한 임펄스 응답)형 전달함수이다. 함수 AN(z) 및 AP(z)의 계수 bi 및 ci(1≤i≤M)는 지각가중 평가모듈(39)에 의하여 각 프레임별로 계산되고, 모듈은 이를 필터(38)에 인도한다. 제 1 가능성은 0≤≤1 을 가진 AN(z)=A(Z/) 및 AP(z)=A(z/)를 취하는 것이고, 이것은 형식(7)의 A(z)를 가진 종래의 형식(2)으로 축소된다. q=2, M1=2 및 M2=13 을 가진 광대역신호의 경우에는,=0.92 및=0.6 의 선택이 양호한 결과를 얻는다는 것을 알게 되었다.
그러나, 매우 적은 여분의 계산을 위하여, 본 발명은 W(z)를 가진 형식(6)을 채택함으로써 양자화잡음의 정형을 위한 큰 유연성을 가질 수 있게 한다. 즉,
q=2, M1=2, M2=13 을 가진 광대역신호의 경우에는 선택(=0.9,=0.65,=0.95,=0.75)가 양호한 결과를 얻는다는 것을 알게 되었다. 항 A1(z/)/A1(z/)은 필터(38)의 일반적인 틸트를 조정할 수 있게 하는 한편, 항 A2(z/)/A2(z/)은 마스킹을 포먼트 레벨로 조정할 수 있게 한다.
종래 방식에서는 모듈(26)에 의하여 수행되는 폐쇄루프 LTP 분석이 각 서브프레임별로 정규화된 상관관계를 최대화시키는 지연(T)을 선택하는 것이다.
상기식에서, x'(n)는 문제가 되는 서브 프레임 시간중 필터(38)의 출력신호를 나타내고, yT(n)는 누적곱 u(n-T)*h'(n)을 나타낸다. 상기식에서 h'(0), h'(1), …, h'(L-1)은 전달함수 W(z)/A(z)를 가진 가중 합성필터의 임펄스 응답을 나타낸다. 이러한 임펄스 응답(h')은 임펄스 응답 계산모듈(40)에 의하여, 모듈(39)과 적당한 경우에는 양자화 및 보간 후, 서브 프레임별로 정하여지는 LPC 파라미터에 의하여 인도되는 계수(bi, ci)의 함수로서 얻어진다. 샘플 u(n-T)은 모듈(32)에 의하여 인도되는 장기 합성필터(14)의 전위상태이다. 서브 프레임의 길이보다 더 짧은 미싱샘플(missing sample) u(n-T)은 전위샘플에 근거하여 또는 음성신호로부터 보간에 의하여 얻는다. 전체적 또는 부분적 지연(T)은 한정된 윈도내에서 선택된다. 폐쇄루프 검색범위를 감소시킴으로써 계산될 누적(convolution) yT(n)의 수를 줄이기 위하여, 예를 들면, 먼저 프레임당 1 회 개방루프 지연(T')을 결정한 다음에, 감소된 구간 어라운드(interval around)(T')내에서 각 서브 프레임별로 폐쇄루프 지연을 선택할 수 있다. 가장 간단한 개방루프 검색 방식은 적당한 경우에는 전달함수 A(z)의 역필터에 의하여 여과되는 음성신호의 자기상관을 최대화시키는 지연(T')을 결정하는 것이다. 일단 지연(T)이 결정되면, 장기예측 이득(G)은 다음 식에 의하여 얻어진다.
서브 프레임에 관한 CELP 여기를 검색하기 위하여, 최적지연(T)을 위하여 모듈(26)에 의하여 계산된 신호 GyT(n)가 먼저 감산기(42)에 의하여 신호 x'(n)로부터 감산된다. 이에 의하여 얻어지는 신호 x(n)는 역방향 필터(44)에 종속되고, 이 필터는 다음 식에 의하여 주어지는 신호 D(n)를 인도한다.
상기식에서, h(0), h(1),…h(L-1)은 합성필터와 지각가중 필터로 구성되는필터의 임펄스 응답을 나타내며, 이러한 응답은 모듈(40)을 경유하여 계산된다. 다시 말하면, 이와 같은 복합필터는 전달함수로서 W(z)/[A(z)ㆍB(z)]을 가진다. 이것을 행렬표현으로 하면 다음과 같다.
벡터(D)는 여기 검색모듈(28)용 목표벡터를 구성한다. 이 모듈(28)은 정규 상관관계를 최대화하는 코드북내의 코드워드를 결정한다. 상기 식에서,
일단 최적 색인(k)이 결정되면, 여기이득(β)은와 동일한 것으로 본다.
도 3 에 의하면, CELP 디코더에는 코더에 의한 비트 스트림 출력을 수신하는 디멀티플렉서(8)가 포함되어 있다. EXC 여기 파라미터와 LTP 및 LPC 합성 파라미터의 양자화값은 합성신호를 재생시키기 위하여 발생기(10), 증폭기(12) 및 필터(14, 16)에 인도되고, 이러한 합성신호는 포스트필터에 종속되고, 그 다음에는 원음성을 재생시키기 위하여 증폭된 다음에 확성기(19)에 인가되기 전에, 변환기(18)에 의하여 아날로그로 변환된다.
도 3 에 도시된 디코더의 경우에는 LPC 파라미터가 예를 들면, 여러가지 선형예측 단계에 관한 반사계수(부분 상관관계 또는 PARCOR 계수라고도 한다)의 양자화 색인으로 구성된다. 모듈(15)은 이러한 양자화 색인으로부터 ri p의 양자화값을 회복하고, 이 값을 변환하여 q 세트의 선형예측 계수를 제공한다. 이러한 변환은 예를들면, 레빈슨-더빈 알고리즘에서와 같은 재귀적 방법(recursive method)을 이용하여 행한다.
여러 세트의 계수(aip)는 방정식(4)에 의하여 주어지는 전달함수 1/A1(z)…1/Aq(z)를 가진 연속하는 q 필터/단계로 구성되는 단기 합성필터(16)에 인도된다. 필터(16)는 방정식(1)에 의하여 주어지는 전달함수 1/A(z)를 가진 단일단계내에도 있을 수 있고, 이러한 방정식에서 계수(ai)는 방정식(9) 내지 (13)에 의하여 계산한다.
여러 세트의 계수(ai p)는 전술한 실시예에서, 다음 형식의 전달함수를 가지는 포스트필터(17)에도 전달된다.
상기식에서, APN(z) 및 APP(z)는 차수(M)의 FIR형 전달함수이고, GP는 일정한 이득인수이고, μ는 양의 상수이고, r1는 제 1 반사계수를 나타낸다.반사계수(r1)는 다음에 계산할 필요가 없는 복합 합성필터의 계수(ai)와 연관된 계수일 수 있다. 제 1 예측단계의 제 1 반사계수(r1=r1 1)는 적당한 경우에는 상수(μ)를 조정하여 r1으로 볼 수도 있다. APN(z)/APP(z) 항에 있어서, 제 1 가능성은 0≤β1≤β2≤1 일때, APN(z)=A(z/β1) 및 APP(z)=A(z/β2)로 하는 것이며, 이는 형식(7)의 A(z)를 가진 종래의 형식(3)으로 축소된다.
본 발명은 코더의 지각가중 필터의 경우에서와 같이, 일단계에서 다음단계(방정식(8))로 서로 다른 계수(β1, β2)를 채택할 수 있게 한다. 즉,
q=2, M1=2, M2=13 을 가진 광대역신호의 경우에는,선택(β1 1=0.7, β2 1=0.9, β1 2=0.95, β2 2=0.97)이 양호한 결과를 제공하는 것을 알게 되었다.
이상에서는 본 발명을 순방향 적응 예측코더에 대한 그 응용, 즉 선형예측 분석을 거치는 음성 주파수 신호가 코더의 입력신호인 응용으로 설명하였다. 본 발명은 역방향 적응 예측코더/디코더에 대하여도 응용되며, 여기에서는 합성신호가 코더와 디코더에서 선형예측 분석의 대상이 된다(J.H. Chen 외의 "CCITT 16 kbit/s 음성코딩 표준을 위한 저지연 CELP 코더", IEEE J. SAC, Vol. 10, No. 5, pp. 830-848, June 1992, 참조). 도 5 및 도 6 은 각각 본 발명을 실시하는 역방향 적응 CELP 디코더 및 CELP 코더를 도시한 것이다. 도 3 및 도 4 에서와 동일한 참조부호들은 유사한 소자들을 표시하는데 사용하였다.
역방향 적응 디코더는 단기 합성필터(16)에 인가될 여기신호 u(n)를 정의하는 파라미터들의 양자화값만을 수신한다. 당해 실시예에서는 이러한 파라미터들은 색인(k)과 대응이득(β) 및 LTP 파라미터이다. 합성신호는 도 3 의 모듈(24)과 동일한 다단 선형예측 분석모듈(124)에 의하여 처리된다. 이 모듈(124)은 LPC 파라미터를 여기신호의 하나 이상의 다음 프레임을 위하여 필터(16)와 전술한 바와 같이 계수를 얻는 포스트필터(17)에 각각 인도한다.
도 6 에 도시된 대응코더는 음성신호 s(n)가 아니라, 국부적으로 발생되는 합성신호에 관한 다단 선형예측 분석을 수행한다. 따라서, 이 코더에는 도 5 에 도시된 디코더의 소자(10, 12, 14, 16, 124)로 구성되어 있는 로컬디코더(local decoder)(132)가 포함되어 있다. 로컬디코더(132)는 합성신호의 분석에 의하여 얻은 LPC 파라미터로서, 지각가중 평가모듈(39)과 임펄스 응답(h, h')을 계산하기 위한 모듈(40)에 의하여 이용되는 파라미터를, 적응사전과 필터(36)의 초기상태(s)의 샘플(u)에 추가하여 인도한다. 이러한 코더의 기타작동은 도 4 에 의하여 설명한 코더의 작동과 같고, 다만, 여기에서는 LPC 분석모듈(24)이 더 이상 필요없다는 것이 다르다. EXC 및 LTP 파라미터만이 디코더에 보내진다.
도 7 및 도 8은 혼합 적응되는 CELP 디코더와 CELP 코더의 블록선도이다. 제 1 단계의 선형예측 계수는 코더에 수행되는 음성 주파수 신호의 순방향분석에서 생기고, 최종단계의 선형예측 계수는 디코더(및 코더내에 제공된 로컬디코더)에 의하여 수행되는 합성신호의 역방향분석에서 생긴다. 도 3 내지 도 6 의 소자와 유사한 소자들에는 동일한 참조부호를 붙였다.
도 7 에 도시된 혼합디코더는 단기 합성필터(16)에 인가될 여기신호 u(n)를 정의하는 EXC, LTP 파라미터의 양자화값과 코더에 의하여 수행되는 순방향분석에 의하여 결정되는 LPC/F 파라미터의 양자화값을 수신한다. 이러한 LPC/F 파라미터들은 1≤P≤qF 일때, qF 세트의 선형예측 계수(a1 F,p,…,aMFp F,p)를 나타내고, 필터(16)의 절단함수 1/A(z)의 제 1 구성요소 1/AF(z)를 다음과 같이 정의한다.
도 8 에 도시된 혼합코더에는 전술한 LPC/F 파라미터를 얻기 위하여, qF>1인 경우에는 도 1 에 의하여 설명한 방식으로, qF=1 인 경우에는 단일단계에서, 코드화될 음성 주파수 신호 s(n)를 분석하는 모듈(224/F)이 포함되어 있다.
전달함수 1/A(z)=1/[AF(z)ㆍAB(z)]를 가진 단기 합성필터(16)의 다른 구성요소 1/AB(z)는 다음식에 의하여 주어진다.
혼합디코더에는 계수(ai B,p)를 결정하기 위하여, 전달함수 AF(z)를 가진 역필터(200)로서, 여과된 합성신호를 만들어내기 위하여 단기 합성필터(16)에 의하여 생성되는 합성신호를 여과하는 역필터가 포함되어 있다. 모듈(224/B)은 qB>1 인 경우에는 도 1 를 참조하여 설명한 방식으로, qB=1 인 경우에는 단일단계에서, 이러한 신호의 선형예측 분석을 수행한다. 이와 같이 얻은 LPC/B 계수는 그 다음 프레임을 위하여 그 제 2 구성요소를 정의할 수 있도록 합성필터(16)에 인도된다. 이러한 계수들은 LPC/F 계수와 마찬가지로, 그 구성요소 APN(z) 및 APP(z)가 APN(z)=A(z/β1), APP(z)=A(z/β2)의 형식으로 되어있거나, 다음의 형식으로 되어있는 포스트필터(17)에도 인도된다.
계수쌍에 의하여 따로 따로 최적화될 수 있다.
혼합디코더내에 제공된 로컬디코더(232)는 본질적으로 도 7 에 도시된 디코더의 소자(10, 12, 14, 16, 200, 224/B)로 구성되어 있다. 로컬디코더는 적응사전과 필터(36)의 초기상태(s)의 샘플(u)에 추가하여, 지각가중 평가모듈(39)과 임펄스 응답(h, h')을 계산하기 위한 모듈(40)에 의하여, 분석모듈(224/F)에 의하여 인도되는 LPC/F 파라미터들과 함께 이용되는 LPC/B 파라미터들을 인도한다.
모듈(39)에 의하여 평가되는 지각가중 필터(38)의 전달함수는W(z)=A(z/)/A(z/)의 형식이거나, 다음의 형식으로 되어있다.
계수쌍에 의하여 따로 최적화될 수 있다.
혼합코더의 기타작동은 도 4 에 의하여 설명한 코더의 작동과 같다. EXC, LTP 및 LPC/F 파라미터만이 디코더에 보내진다.
도 1 은 본 발명에 의한 선형예측 분석방법의 흐름도.
도 2 는 본 발명에 의한 방법의 결과를 종래의 선형예측 분석방법과 비교하는 스펙트럼 도표.
도 3 및 도 4 는 본 발명을 실시할 수 있는 CELP 디코더 및 코더의 블록선도.
도 5 및 도 6 은 본 발명을 실시할 수 있는 CELP 디코더 및 코더변형의 블록선도.
도 7 및 도 8 은 본 발명을 실시할 수 있는 다른 CELP 디코더 및 코더변형의 블록선도.
** 도면의 주요부분에 대한 부호의 설명 **
10. 여기발생기 12. 증폭기
14. 장기 합성필터 16. 단기 합성필터
20. 변환기 24,26,28. 분석모듈
30. 멀티플렉서 34. 감산기

Claims (22)

  1. 음성 주파수 신호의 단기 스펙트럼에 종속되는 스펙트럼 파라미터를 결정하기 위하여, 음성 주파수 신호(sO(n))를 선형예측 분석하기 위한 방법으로서, q(1 보다 큰 정수)의 연속 예측단계(5p)가 포함되어 있는 방법에 있어서, 각 예측단계 p(1≤p≤q)에서, 해당단계의 입력신호의 선형예측 계수(ai p, …,aMp p)의 각 단계(p)별로 미리 정의된 수(Mp)를 나타내는 파라미터들이 결정되고, 분석될 음성 주파수 신호가 제 1 단계의 입력신호(sO(n))를 구성하고, 단계(p+1)의 입력신호(sp(n))가 전달함수
    를 가진 필터에 의하여 여과되는 단계(p)의 입력신호(sp-1(n))를 구성하는 것을 특징으로 하는 방법.
  2. 제 1 항에 있어서, 선형예측 계수들의 수(Mp)가 일단계에서 다음 단계로 증가하는 것을 특징으로 하는 분석방법.
  3. 음성 주파수 신호를 부호화하기 위한 방법으로서, 다음의 스텝들, 즉
    - 단기 합성필터(16)를 정의하는 파라미터(LPC)를 결정하기 위하여, 연속 프레임으로 계수화된 음성 주파수 신호(s(n))의 선형예측 분석 스텝,
    - 음성 주파수 신호를 나타내는 합성신호를 만들어내기 위하여, 단기 합성필터(16)에 인가될 여기신호(u(n))를 정의하는 여기 파라미터(k, β, LTP)의 결정스텝 및,
    - 단기 합성필터를 정의하는 파라미터와 여기 파라미터의 양자화값의 생성스텝등이 포함되어 있는 방법으로서,
    선형예측 분석이 q(1 보다 큰 정수)의 연속단계(5p)를 가진 하나의 프로세스로 되어 있고, 이러한 프로세스에, 각 예측단계(p(1≤p≤q)에서, 이 단계의 입력신호의 선형예측 계수(ai p, …,aMp p)의 각 단계(p)별로 미리 정의된 수(Mp)를 나타내는 파라미터의 결정이 포함되어 있고, 부호화될 음성 주파수 신호(s(n))가 제 1 단계의 입력신호(sO(n))를 구성하고, 단계(p+1)의 입력신호(sp(n))가 전달함수
    를 가진 필터에 의하여 여과되는 단계(p)의 입력신호(sp-1(n))로 구성되며, 단기 합성필터(16)가
    를 가진 형식 1/A(z)의 전달함수를 가지는 것을 특징으로 하는 코딩방법.
  4. 제 3 항에 있어서, 선형예측 계수들의 수(Mp)가 일단계에서 다음단계로 증가하는 것을 특징으로 하는 코딩방법.
  5. 제 3 항 또는 제 4 항에 있어서, 여기 파라미터의 적어도 일부가 형식(여기에서,과 같은 스펙트럼 확장계수를 나타낸다)을 가진 적어도 하나의 지각가중 필터(38)에 의하여, 음성 주파수 신호(s(n))와 합성신호사이의 차를 여과함으로써 생기는 오류신호의 에너지를 최소화하는 것에 의하여 결정되는 것을 특징으로 하는 코딩방법.
  6. 제 3 항 또는 제 4 항에 있어서, 여기 파라미터의 적어도 일부가, 형식
    (여기에서,과 같은 스펙트럼 확장계수의 쌍을 나타낸다)의 전달함수를 가진 적어도 하나의 지각가중 필터(38)에 의하여, 음성주파수 신호(s(n))와 합성신호사이의 차를 여과함으로써 생기는 오류신호의 에너지를 최소화하는 것에 의하여 결정되는 것을 특징으로 하는 코딩방법.
  7. 비트 스트림에 의하여 부호화되는 음성 주파수 신호를 구성하기 위하여, 비트 스트링을 디코딩하기 위한 방법으로서,
    - 단기 합성필터(16)를 정의하는 파라미터(LPC)와 여기 파라미터(k, β,LTP)의 양자화값이 수신되고, 합성필터를 정의하는 파라미터가 1 보다 큰 수(q)의 선형예측 계수(ai p) 세트들을 정의하고, 각 세트(p)에 미리 확정된 수(Mp)의 계수들이 포함되어 있고,
    - 여기신호(u(n))가 여기 파라미터의 양자화값에 근거하여 만들어지며,
    - 합성 음성 주파수 신호(s(n))가
    의 형식 1/A(z)의 전달함수(상기식에서, 계수 a1 p,…,aMp p는 1≤p≤q 에 있어서, p 번째 세트의 선형예측 계수에 해당한다)를 가지는 합성필터에 의하여, 여기필터를 여과시킴으로써 생성되는 것을 특징으로 하는 디코딩방법.
  8. 제 7 항에 있어서, 상기 합성 음성주파수 신호가 형식 A(z/β1)/A(z/β2)(여기에서, β1및 β2는 0≤β1≤β2≤1 과 같은 계수를 나타낸다)의 항이 포함되어 있는 전달함수(HPF(z))를 가진 포스트 필터(17)에 인가되는 것을 특징으로 하는 디코딩방법.
  9. 제 7 항에 있어서, 상기 합성 음성주파수 신호가 형식
    (여기에서, β1 p및 β2 p는 1≤p≤q 에 있어서, 0≤β1 p≤β2 p≤1 과 같은 계수쌍을 나타내고, Ap(z)는 p 번째 선형예측 계수세트에 있어서, 함수
    를 나타낸다)의 항이 포함되어 있는 전달함수(HPF(z))를 가진 포스트 필터(17)에 인가되는 것을 특징으로 하는 디코딩방법.
  10. 연속 프레임들로 계수화되는 제 1 음성 주파수 신호를 부호화하기 위한 방법으로서, 다음과 같은 스텝, 즉
    - 단기 합성필터(16)를 정의하는 파라미터(LPC)를 결정하기 위하여, 제 2 음성 주파수신호(s(n))를 선형예측 분석하는 스텝,
    - 제 1 음성 주파수 신호를 나타내고, 적어도 하나의 다음 프레임을 위한 제 2 음성 주파수 신호를 구성하는 합성신호(s(n))를 만들어내기 위하여, 단기 합성 필터(16)에 인가될 여기신호(u(n))를 정의하는 여기 파라미터(k, β, LTP)를 결정하는 스템 및,
    - 여기 파라미터의 양자화값을 만들어내는 스텝 등이 포함되어 있는 방법에 있어서,
    선형예측 분석이 q(1 보다 큰 정수) 연속단계(5p)를 가진 하나의 프로세스이고, 이 프로세스에 각 예측단계(p(1≤p≤q))에서, 해당 단계의 입력신호의 선형예측계수(ai p,…,aMp p)의 각 단계(p)별로 미리 정의된 수(Mp)를 나타내는 파라미터들의 결정이 포함되어 있고, 제 2 음성 주파수 신호가 제 1 단계의 입력신호(sO(n))를 구성하고, 단계(p+1)의 입력신호(sp(n))가 전달함수
    를 가진 필터에 의하여 여과되는 단계(p)의 입력신호(sp-1(n))로 구성되어 있고, 단기 합성필터(16)가 형식 1/A(z)의 전달함수
    를 가지는 것을 특징으로 하는 디코방법.
  11. 제 10 항에 있어서, 선형예측 계수들의 수(Mp)가 일단계에서 다음 단계로 증가하는 것을 특징으로 하는 코딩방법.
  12. 제 10 항 또는 제 11 항에 있어서, 여기 파라미터의 적어도 일부가 형식과 같은 스펙트럼 확장계수를 나타낸다)의 전달함수를 가진 적어도 하나의 지각가중 필터(38)에 의하여, 제 1 음성주파수 신호(s(n))와 합성신호사이의 차를 여과함으로써 생기는 오류신호의 에너지를 최소화하는 것에 의하여 결정되는 것을 특징으로 하는 코딩방법.
  13. 제 10 항 또는 제 11 항에 있어서, 여기 파라미터들의 적어도 일부가 형식
    (여기에서,과 같은 스펙트럼 확장계수쌍을 나타낸다)의 전달함수를 가진 적어도 하나의 지각가중 필터(38)에 의하여, 제 1 음성 주파수 신호(s(n))와 합성신호사이의 차를 여과함으로써 생기는 오류신호의 에너지를 최소화하는 것에 ·의하여 결정되는 것을 특징으로 하는 코딩방법.
  14. 비트스트림에 의하여 부호화되는 음성 주파수 신호를 연속 프레임으로 구성하기 위하여, 비트스트림을 디코딩하기 위한 방법으로서,
    - 여기 파라미터(k, β, LTP)의 양자화값이 수신되고,
    - 여기신호(u(n))가 여기 파라미터의 양자화값에 근거하여 만들어지고,
    - 합성 음성 주파수 신호가 단기 합성 필터(16)에 의하여 여기 신호를 여과함으로써 만들어지고,
    - 합성 신호의 선형예측 분석이 적어도 하나의 다음 프레임을 위한 단기 합성필터(16)의 계수들을 얻기 위하여 실시되고,
    선형예측 분석이 q(1 보다 큰 정수) 연속단계(5p)를 가진 하나의 프로세스이고, 이 프로세스에 각 예측단계(p(1≤p≤q))에서, 해당단계의 입력신호의 선형예측계수(a1 p,…,aMp p)의 각 단계(p)별로 미리 정의된 수(Mp)를 나타내는 파라미터들의 결정이 포함되어 있고, 합성신호가 제 1 단계의 입력신호(sO(n))를 구성하며, 단계(p+1)의 입력신호(sp(n))가 전달함수
    를 가진 필터에 의하여 여과되는 단계(p)의 입력신호(sp-1(n))로 구성되어 있고, 단기 합성필터(16)가 형식 1/A(z)의 전달함수
    를 가지는 것을 특징으로 하는 디코딩방법.
  15. 제 14 항에 있어서, 상기 합성 음성 주파수 신호가 형식 A(z/β1)/A(z/β2)(여기에서, β1및 β2는 0≤β1≤β2≤1 과 같은 계수를 나타낸다)의 항이 포함되어 있는 전달함수(HPF(z))를 가진 포스트 필터(17)에 인가되는 것을 특징으로 하는 디코딩방법.
  16. 제 14 항에 있어서, 상기 음성주파수 신호(s(n))가 형식
    (여기에서, β1 p및 β2 p는 1≤p≤q 에 있어서, 0≤β1 p≤β2 p≤1 과 같은 계수쌍을 나타낸다)의 항이 포함되어 있는 전달함수(HPF(z))를 가진 포스트 필터(17)에 인가되는 것을 특징으로 하는 디코딩방법.
  17. 연속 프레임으로 계수화되는 제 1 음성 주파수 신호를 부호화하기 위한 방법으로서, 다음의 스텝, 즉
    - 단기 합성필터(16)의 제 1 구성요소를 정의하는 파라미터(LPC/F)를 결정하기 위하여, 제 1 음성 주파수 신호(s(n))를 선형예측 분석하는 스텝,
    - 제 1 음성주파수 신호를 나타내는 합성신호(s(n))를 만들어내기 위하여, 단기 합성필터(16)에 인가될 여기신호(u(n))를 정의하는 여기 파라미터(k, β, LTP)를 결정하는 스텝,
    - 단기 합성필터의 제 1 구성요소를 정의하는 파라미터와 여기 파라미터의 양자화값을 만들어내는 스텝,
    - 단기 합성필터의 제 1 구성요소의 전달함수의 역에 대응하는 전달함수를 가진 필터에 의하여 합성신호를 여과하는 스텝 및,
    - 적어도 하나의 다음 프레임을 위한 단기 합성필터의 제 2 구성요소의 계수들을 얻기 위하여, 여과된 합성신호를 선형예측 분석하는 스텝이 포함되어 있고,
    제 1 음성 주파수 신호(s(n))의 선형예측 분석이 qF(적어도 1 과 동일한 정수)연속단계(5p)를 가진 하나의 프로세스이고, qF 단계를 가진 프로세스에 각 예측단계(p(1≤p≤q)에서, 해당단계의 입력신호의 선형예측 계수(ai F,p,…aMFp F,p)의 각 단계(p)별로 미리 정의된 수(MFp)를 나타내는 파라미터의 결정이 포함되어 있고, 제 1 음성 주파수 신호(s(n))가 qF 단계를 가진 프로세스의 제 1 단계의 입력신호(sO(n))를 구성하고, qF 단계를 가진 프로세스의 단계(p+1)의 입력신호(sp(n))가 전달함수
    를 가진 필터에 의하여 여과되는 qF 단계를 가진 프로세스의 단계(p)의 입력신호(sp-1(n))로 구성되어 있고, 단기 합성필터(16)의 제 1 구성요소가 형식 1/AF(z)의 전달함수
    를 가지며,
    여과된 합성신호의 선형예측 분석이 qB(적어도 1 과 동일한 정수)연속단계(5p)를 가진 하나의 프로세스이고, qB단계를 가진 이러한 프로세스에각 예측단계(p(1≤p≤qB)에서, 해당단계의 입력신호의 선형예측 계수(a1 B,p,…,aMBp B,p)의 각 단계(p)별로 미리 정의된 수(MBp)를 나타내는 파라미터들의 결정이 포함되어 있고, 여과된 합성신호가 qB단계를 가진 프로세스의 제 1 단계의 입력신호를 구성하고, qB단계를 가진 프로세스의 단계(p+1)의 입력신호(sp(n))가 전달함수
    를 가진 필터에 의하여 여과되는 qB단계를 가진 프로세스의 단계(p)의 입력신호(sp-1(n))로 구성되어 있고, 단기 합성필터의 제 2구성요소가 형식 1/AB(z)의 전달함수
    를 가지며, 단기 합성필터(16)가 형식 1/A(z)의 전달함수 A(z)=AF(z)ㆍAB(z)를 가지는 것을 특징으로 하는 코딩방법.
  18. 제 17 항에 있어서, 여기 파라미터의 적어도 일부가 형식과 같은 스펙트럼 확장계수를 나타낸다)의 전달함수를 가진 적어도 하나의 지각가중 필터(38)에 의하여, 제 1 음성 주파수 신호와 합성신호(s(n))사이의 차를 여과함으로써 생기는 오류신호의 에너지를 최소화하는 것에 의하여 결정되는 것을 특징으로 하는 코딩방법.
  19. 제 17 항에 있어서, 여기 파라미터의 적어도 일부가 형식
    (여기에서,과 같은 스펙트럼 확장계수쌍을 나타내고,과 같은 스펙트럼 확장계수쌍을 나타낸다)의 전달함수를 가진 적어도 하나의 지각가중 필터(38)에 의하여, 제 1 음성 주파수 신호(s(n))와 합성신호사이의 차를 여과함으로써 생기는 오류신호의 에너지를 최소화하는 것에 의하여 결정되는 것을 특징으로 하는 코딩방법.
  20. 비트 스트림에 의하여 부호화되는 음성 주파수 신호를 연속 프레임으로 구성하기 위하여 비트 스트림을 디코딩하기 위한 방법으로서, 단기 합성필터(16)의 제 1 구성요소를 정의하는 파라미터(LPC/F)와 여기 파라미터(k, β, LTP)의 양자화값을 수신하고, 단기 합성필터의 제 1 구성요소를 정의하는 파라미터들이 1≤p≤qF 일때, 적어도 1 과 동일한 수(qF)의 선형예측 계수(ai F,P,…aMFp F,P)세트를 나타내고,각 세트(p)에 계수들이 미리 확정된 수(MFp)가 포함되어 있고, 단기 합성필터(16)의 제 1 구성요소가 형식 1/AF(z)의 전달함수
    를 가지며,
    - 여기신호(u(n))가 여기 파라미터의 양자화값에 근거하여 만들어지고,
    - 합성 음성 주파수 신호(s(n))가 형식 1/A(z)의 전달함수 A(z)=AF(z)ㆍAB(z)를 가진 단기 합성필터(16)에 의하여 여기신호를 여과함으로써 만들어지고, 1/AB(z)는 단기 합성필터(16)의 제 2 구성요소의 전달함수를 나타내며,
    - 합성신호가 전달함수 AF(z)를 가진 필터에 의하여 여과되고,
    - 여과된 합성신호의 선형예측 분석이 적어도 하나의 다음 프레임을 위한 단기 합성필터(16)의 제 2 구성요소의 계수를 얻기 위하여 실시되며,
    - 여과된 합성신호의 선형예측 분석이 qB(적어도 1 과 동일한 정수)연속단계(5p)를 가진 하나의 프로세스이고, 이러한 프로세스에, 각 예측단계(p(1≤p≤qB)에서, 해당단계의 입력신호의 선형예측 계수(ai B,P,…aMPp B,F)의 각 단계(p)별로 미리 정의된 수(MBp)를 나타내는 파라미터의 결정이 포함되어 있고, 여과된 합성신호제 1 단계의 입력신호를 구성하며, 전달함수
    를 가진 필터에 의하여 여과되는 단계(p)의 입력신호(sp-1(n))로 구성되어 있고, 단기 합성필터(16)의 제 2 구성요소가 형식 1/AB(z)의 전달함수
    를 가지는 것을 특징으로 하는 디코딩방법.
  21. 제 20 항에 있어서, 상기 합성 음성 주파수 신호(s(n))가 형식 A(z/β1)/A(z/β2)(여기에서, β1및 β2는 0≤β1≤β2≤1 과 같은 계수를 나타낸다)의 항이 포함되어 있는 전달함수(HPF(z))를 가진 포스트필터(17)에 인가되는 것을 특징으로 하는 디코딩방법.
  22. 제 20 항에 있어서, 상기 합성 음성 주파수 신호가 형식
    (여기에서, β1 F,P및 β2 F,P는 1≤p≤qF일때, 0≤β1 F,P≤β2 F,P≤1 과 같은 계수쌍을나타내고, β1 B,P및 β2 B,P는 1≤p≤qB일때, 0≤β1 B,P≤β2 B,P≤1 과 같은 계수쌍을 나타낸다)의 항이 포함되어 있는 전달함수(HPF(z))를 가진 포스트필터(17)에 인가되는 것을 특징으로 하는 디코딩방법.
KR1019960065696A 1995-12-15 1996-12-14 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용 KR100421226B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR9514925 1995-12-15
FR9514925A FR2742568B1 (fr) 1995-12-15 1995-12-15 Procede d'analyse par prediction lineaire d'un signal audiofrequence, et procedes de codage et de decodage d'un signal audiofrequence en comportant application

Publications (2)

Publication Number Publication Date
KR970050107A KR970050107A (ko) 1997-07-29
KR100421226B1 true KR100421226B1 (ko) 2004-07-19

Family

ID=9485565

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960065696A KR100421226B1 (ko) 1995-12-15 1996-12-14 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용

Country Status (7)

Country Link
US (1) US5787390A (ko)
EP (1) EP0782128B1 (ko)
JP (1) JP3678519B2 (ko)
KR (1) KR100421226B1 (ko)
CN (1) CN1159691A (ko)
DE (1) DE69608947T2 (ko)
FR (1) FR2742568B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101257776B1 (ko) * 2011-10-06 2013-04-24 단국대학교 산학협력단 상태-체크 코드를 이용한 부호화 방법 및 부호화 장치
KR101397512B1 (ko) * 2009-03-11 2014-05-22 후아웨이 테크놀러지 컴퍼니 리미티드 선형 예측 코딩 분석을 위한 방법, 장치 및 시스템

Families Citing this family (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5621852A (en) * 1993-12-14 1997-04-15 Interdigital Technology Corporation Efficient codebook structure for code excited linear prediction coding
FR2729246A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
FR2729247A1 (fr) * 1995-01-06 1996-07-12 Matra Communication Procede de codage de parole a analyse par synthese
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
JP3064947B2 (ja) * 1997-03-26 2000-07-12 日本電気株式会社 音声・楽音符号化及び復号化装置
FI973873A (fi) * 1997-10-02 1999-04-03 Nokia Mobile Phones Ltd Puhekoodaus
FR2774827B1 (fr) 1998-02-06 2000-04-14 France Telecom Procede de decodage d'un flux binaire representatif d'un signal audio
US6223157B1 (en) * 1998-05-07 2001-04-24 Dsc Telecom, L.P. Method for direct recognition of encoded speech data
US6148283A (en) * 1998-09-23 2000-11-14 Qualcomm Inc. Method and apparatus using multi-path multi-stage vector quantizer
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
EP1336175A1 (en) * 2000-11-09 2003-08-20 Koninklijke Philips Electronics N.V. Wideband extension of telephone speech for higher perceptual quality
JP4343529B2 (ja) 2000-12-06 2009-10-14 アイピージー エレクトロニクス 503 リミテッド フィルタ装置及び方法
WO2002067246A1 (en) * 2001-02-16 2002-08-29 Centre For Signal Processing, Nanyang Technological University Method for determining optimum linear prediction coefficients
US6590972B1 (en) * 2001-03-15 2003-07-08 3Com Corporation DTMF detection based on LPC coefficients
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US20030216921A1 (en) * 2002-05-16 2003-11-20 Jianghua Bao Method and system for limited domain text to speech (TTS) processing
EP1383109A1 (fr) * 2002-07-17 2004-01-21 STMicroelectronics N.V. Procédé et dispositif d'encodage de la parole à bande élargie
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7254533B1 (en) * 2002-10-17 2007-08-07 Dilithium Networks Pty Ltd. Method and apparatus for a thin CELP voice codec
US20040260540A1 (en) * 2003-06-20 2004-12-23 Tong Zhang System and method for spectrogram analysis of an audio signal
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US8027242B2 (en) 2005-10-21 2011-09-27 Qualcomm Incorporated Signal coding and decoding based on spectral dynamics
US8417185B2 (en) * 2005-12-16 2013-04-09 Vocollect, Inc. Wireless headset and method for robust voice data communication
US7773767B2 (en) 2006-02-06 2010-08-10 Vocollect, Inc. Headset terminal with rear stability strap
US7885419B2 (en) * 2006-02-06 2011-02-08 Vocollect, Inc. Headset terminal with speech functionality
US8392176B2 (en) 2006-04-10 2013-03-05 Qualcomm Incorporated Processing of excitation in audio coding and decoding
CN101114415B (zh) * 2006-07-25 2011-01-12 元太科技工业股份有限公司 双稳态显示器的驱动装置及其方法
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
US8330745B2 (en) 2007-01-25 2012-12-11 Sharp Kabushiki Kaisha Pulse output circuit, and display device, drive circuit, display device, and pulse output method using same circuit
US8428957B2 (en) 2007-08-24 2013-04-23 Qualcomm Incorporated Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
TWI346465B (en) * 2007-09-04 2011-08-01 Univ Nat Central Configurable common filterbank processor applicable for various audio video standards and processing method thereof
USD605629S1 (en) 2008-09-29 2009-12-08 Vocollect, Inc. Headset
FR2938688A1 (fr) 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
US8160287B2 (en) 2009-05-22 2012-04-17 Vocollect, Inc. Headset with adjustable headband
US8438659B2 (en) 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface
EP2551848A4 (en) * 2010-03-23 2016-07-27 Lg Electronics Inc METHOD AND APPARATUS FOR PROCESSING AUDIO SIGNAL
CN102638846B (zh) * 2012-03-28 2015-08-19 浙江大学 一种基于最优量化策略的wsn通信负载降低方法
US9928850B2 (en) * 2014-01-24 2018-03-27 Nippon Telegraph And Telephone Corporation Linear predictive analysis apparatus, method, program and recording medium
WO2015111568A1 (ja) * 2014-01-24 2015-07-30 日本電信電話株式会社 線形予測分析装置、方法、プログラム及び記録媒体
US9626983B2 (en) * 2014-06-26 2017-04-18 Qualcomm Incorporated Temporal gain adjustment based on high-band signal characteristic
EP3323243B1 (en) * 2015-07-16 2022-01-19 Dolby Laboratories Licensing Corporation Signal reshaping and decoding for hdr signals

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3975587A (en) * 1974-09-13 1976-08-17 International Telephone And Telegraph Corporation Digital vocoder
US4398262A (en) * 1981-12-22 1983-08-09 Motorola, Inc. Time multiplexed n-ordered digital filter
CA1245363A (en) * 1985-03-20 1988-11-22 Tetsu Taguchi Pattern matching vocoder
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
JP2625998B2 (ja) * 1988-12-09 1997-07-02 沖電気工業株式会社 特徴抽出方式
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5307441A (en) * 1989-11-29 1994-04-26 Comsat Corporation Wear-toll quality 4.8 kbps speech codec
FI98104C (fi) * 1991-05-20 1997-04-10 Nokia Mobile Phones Ltd Menetelmä herätevektorin generoimiseksi ja digitaalinen puhekooderi
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US5692101A (en) * 1995-11-20 1997-11-25 Motorola, Inc. Speech coding method and apparatus using mean squared error modifier for selected speech coder parameters using VSELP techniques

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101397512B1 (ko) * 2009-03-11 2014-05-22 후아웨이 테크놀러지 컴퍼니 리미티드 선형 예측 코딩 분석을 위한 방법, 장치 및 시스템
KR101257776B1 (ko) * 2011-10-06 2013-04-24 단국대학교 산학협력단 상태-체크 코드를 이용한 부호화 방법 및 부호화 장치

Also Published As

Publication number Publication date
FR2742568B1 (fr) 1998-02-13
DE69608947T2 (de) 2001-02-01
EP0782128B1 (fr) 2000-06-21
CN1159691A (zh) 1997-09-17
US5787390A (en) 1998-07-28
KR970050107A (ko) 1997-07-29
FR2742568A1 (fr) 1997-06-20
JPH09212199A (ja) 1997-08-15
JP3678519B2 (ja) 2005-08-03
DE69608947D1 (de) 2000-07-27
EP0782128A1 (fr) 1997-07-02

Similar Documents

Publication Publication Date Title
KR100421226B1 (ko) 음성 주파수 신호의 선형예측 분석 코딩 및 디코딩방법과 그 응용
US5845244A (en) Adapting noise masking level in analysis-by-synthesis employing perceptual weighting
JP3566652B2 (ja) 広帯域信号の効率的な符号化のための聴覚重み付け装置および方法
JP3653826B2 (ja) 音声復号化方法及び装置
JP4662673B2 (ja) 広帯域音声及びオーディオ信号復号器における利得平滑化
US7529660B2 (en) Method and device for frequency-selective pitch enhancement of synthesized speech
EP1141946B1 (en) Coded enhancement feature for improved performance in coding communication signals
US5732188A (en) Method for the modification of LPC coefficients of acoustic signals
US6098036A (en) Speech coding system and method including spectral formant enhancer
EP0878790A1 (en) Voice coding system and method
US6138092A (en) CELP speech synthesizer with epoch-adaptive harmonic generator for pitch harmonics below voicing cutoff frequency
EP1006510A2 (en) Signal encoding and decoding system
US5884251A (en) Voice coding and decoding method and device therefor
Koishida et al. A wideband CELP speech coder at 16 kbit/s based on mel-generalized cepstral analysis
JP3163206B2 (ja) 音響信号符号化装置
KR100421816B1 (ko) 음성복호화방법 및 휴대용 단말장치
JPH08160996A (ja) 音声符号化装置
JPH11184499A (ja) 音声符号化方法および音声符号化方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130201

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140203

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20150213

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20160128

Year of fee payment: 13