KR19980703868A - 음성프레임내의 여기펄스위치를 결정하는 방법 - Google Patents

음성프레임내의 여기펄스위치를 결정하는 방법 Download PDF

Info

Publication number
KR19980703868A
KR19980703868A KR1019970707268A KR19970707268A KR19980703868A KR 19980703868 A KR19980703868 A KR 19980703868A KR 1019970707268 A KR1019970707268 A KR 1019970707268A KR 19970707268 A KR19970707268 A KR 19970707268A KR 19980703868 A KR19980703868 A KR 19980703868A
Authority
KR
South Korea
Prior art keywords
pulse
phase
excitation
speech
positions
Prior art date
Application number
KR1019970707268A
Other languages
English (en)
Inventor
퍼 헨리크 스베드버그 조나스
Original Assignee
에르링 블롬메, 한스 홀므그렌
텔레폰악티에볼라겟 엘엠 에릭슨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에르링 블롬메, 한스 홀므그렌, 텔레폰악티에볼라겟 엘엠 에릭슨 filed Critical 에르링 블롬메, 한스 홀므그렌
Publication of KR19980703868A publication Critical patent/KR19980703868A/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Time-Division Multiplex Systems (AREA)
  • Control Of Stepping Motors (AREA)

Abstract

본 발명은 선형예측 음성코드의 여기펄스의 소정의 수(N=j+N1, N2)에 대한 음성프레임내의 위치를 결정하는 방법에 관한 것이다. 이 방법은 두 개의 공지된 방법의 결합이다. 본 발명에 따라, 여기펄스의 위치는 제 1 방법에 따라 다수의 산출 단계(j)에서 산출되고 여기펄스의 위치는 제 2 방법에 따라 다수의 산출단계(N1, N2,..., NL)에서 산출되고 제 1 방법에 따라 산출된 다수의 위치(mi, mk, mr)중 하나로부터의 개시점을 지니어서 다수의 펄스배치(L)중 하나를 얻고 제 1 및 제 2 방법을 따른 단계의 수(j 및 max [N1, N2])사이의 비가 소정의 음성품질에 대한 산출특성을 얻도록 선택된다. 제 1 및 제 2 방법의 두 개의 상이한 실시예가 설명되어 있다.

Description

음성프레임내의 여기펄스위치를 결정하는 방법
위에서 언급한 다중펄스 원리에 따라 작동하는 선형예측 음성 엔코더는 미합중국 특허 명세서 3,624,303에 개시되어 있고, 이는 음성신호의 선형예측 엔코더를 설명하고 미합중국 3,740,476은 예측 파라미터와 예측 잔류신호가 음성 엔코더에 형성될 수 있는 방법을 설명한다.
선형코딩에 의해 인공음성신호를 형성할 때, 원신호로부터 인공음성신호를 특징으로 하는 다수의 예측 파라미터(ak)가 발생한다. 따라서, 이들 파라미터로부터 용장성을 포함하지 않고 이동무선 시스템에서의 이동국과 기지국 사이의 음성전송을 변환하지 않는 음성신호가 형성될 수 있다. 대역폭이라는 면으로부터, 매우 높은 대역폭을 필요로 하는 원음성신호 대신 예측 파라미터만을 전송하는데 매우 적합하다.
그러나, 수신기에 재발생되고 합성음성신호를 구성하는 음성신호는 예측 파라미터에 의해 나타나는 합성신호와 원신호의 음성 패턴사이의 일치의 결여로 이해하기가 어려울 수 있다. 미합중국 특허 명세서 4,472,832(SE-B-456618)에는 이러한 결점이 상세히 설명되어 있으며 또한, 이러한 결점은 합성신호복재를 구성할 때 어느 정도 감소될 수 있다. 이는 원신호 입력패턴을 프레임간격으로 분할함으로써 수행된다. 각각의 간격내에는 음성입력패턴과 음성 복제사이에 예측 파라미터 ak와 예측잔류 dk에 따라 변하는 진폭과 위상위치(시간위치)가 있다. 각각의 펄스는 가장 작은 예측 잔여를 얻기 위해 음성패턴 복재에 영향줄 수 있다. 발생한 여기펄스는 매우 낮은 비트비를 가지므로 엔코드될 수 있고, 예측 파라미터와 유사한 협대역에 전송된다. 이는 재발생된 음성신호의 품질을 향상시킨다.
위에서 설명한 공지된 방법에서, 잔여신호 dk를 가중하고 예측필터의 여기펄스에 대해 발생한 값을 피드백하여 가중시킴으로써 음성입력패턴의 각각의 입력신호패턴내에서 발생된다. 다음, 두 개의 필터상의 출력신호사이에서 상관이 수행되고 여기펄스의 파라미터(진폭 및 위상위치)를 형성하도록 상관된 신호로부터의 다수의 신호성분에 대해 상관이 최대가 된다. 여기펄스를 발생하기 위해 다중펄스 알고리즘에 의해 제공된 장점은 상이한 형태의 음이 적은수의 펄스(8펄스/프레임 간격)에서 발생될 수 있다. 펄스 검색 알고리즘은 펄스를 필요로 하는 프레임내의 펄스위치에 관한 것이다. 무램덤하게 위치한 펄스를 필요로 하는 무성음(자음)과 더 모아질 펄스의 위치를 필요로 하는 유성음(모음)을 재발생할 수 있다.
공지된 방법은 음성신호의 프레임 및 다음 프레임내의 여기펄스의 정확한 위상위치를 산출하고 펄스의 위치조절 소위, 펄스배치가 음성신호 파라미터(예측잔여, 잔여신호 및 선행 프레임의 여기펄스 파라미터)의 복잡한 처리에 따라서만 수행된다.
위에서 언급한 미합중국 특허에 따른 원펄스배치 방법의 하나의 결점은 펄스위치를 산출하기 위해 수행되는 엔코딩이 산출 및 기억에 대해 복잡하다는 것이다. 또한 엔코딩은 프레임 간격내의 펄스위치를 지닌 다수의 비트를 필요로 한다. 또한, 최적 결합펄스 엔코딩 알고리즘으로부터 얻어진 코드워드의 비트가 비트에러에 민감하다. 송신기로부터 수신기로의 전송중 코드워드의 비트에러가 수신기에서 디코딩할 때 펄스위치조절이 어렵게 된다.
이것은 각각의 음성프레임에 설정되어야 하는 여기펄스의 수를 제한함으로써 감소될 수 있다. 이것은 프레임내의 하나 이상의 여기펄스의 정확한 위치조정이 무시되도록 크게함으로써 성취되는 반면, 엔코딩 및 전송후 허용가능한 품질의 재생된 음성신호를 얻는다.
따라서, 이미 산출된 여기펄스의 위상위치를 추종하는 이들 펄스에 이미 결정된 위상위치의 수를 금지하므로 설정할 때 어느 위상위치 제한이 도입되는 방법(미합중국 특허 명세서 5,193,140)이 제안되었다. 프레임의 제1펄스의 위치가 산출되고 이 산출된 위상위치에 배치될 때, 위상위치가 프레임의 이의 펄스에 한정된다. 이 법칙은 프레임의 모든 위치에 적용되는 것이 바람직하다. 새로운 다음 프레임에서 펄스의 국부화를 실행할 때, 프레임의 모든 위치가 자유이다.
합성음성신호를 발생할 때 음성 엔코더에서의 소위 코드북의 이용은 최근에 미합중국 특허 명세서 4,701,954에 개시되어 있다. 이 코드북은 합성신호 복재를 발생할 때 이용되는 다수의 음성신호를 기억한다. 코드북은 고정될 수 있다. 즉, 영구 코드워드가 적응될 수 있다. 즉, 음성신호가 형성됨에 따라 갱신될 수 있다. 고정 및 적응된 코드북의 결합이 이용될 수 있다.
본 발명은 다중펄스원리에 따라 작동하는 선형예측 음성 엔코더의 음성 프레임의 여기펄스의 위치를 결정하는 방법에 관한 것이다. 이러한 엔코더는 이동국으로부터의 전송전 음성신호를 압축하기 위해 이동전화 시스템에 이용될 수 있다.
제안된 방법을 수반한 도면을 참고로 하면서 설명할 것이다.
도 1은 공지된 LPC음성 엔코더를 도시한 블록도.
도 2는 도 1의 음성 엔코더에 나타난 신호를 도시한 도면.
도 3은 여기펄스를 결정할 때 제한과 관련된 공지된 방법의 원리를 설명하기 위한 음성프레임의 타이밍도.
도 4는 본 발명의 원리에 따라 작동하는 음성 엔코더의 부분을 도시한 블록도.
도 5는 본 발명의 방법이 적용될 수 있는 적응코드북을 지닌 공지된 음성엔코더의 부분을 도시한 블록도.
도 6은 본 발명의 방법을 설명하는 흐름도.
도 7은 본 발명에 따라 펄스의 배치 또는 설정을 도시한 도면.
도 8은 본 발명에 따라 위상위치조절에 의해 위상의 배치를 설명한 도면.
도 9는 본 방법에 따라 작동하는 음성엔코더의 부분을 도시한 블록도.
도 10은 또다른 방법에 따라 작동하는 음성엔코더의 부분을 도시한 도면.
하나의 위치가 이미 할당된 음성 프레임내에 모든 위상위치를 금지하는 위에서 설명한 방법은 하나의 제한이 이용되는 것보다 전송된 여기펄스의 수가 크게 제한된다. 또한, 송신기의 여기펄스의 위상위치를 엔코드하기 용이함과 동시에 수신기측에서 디코딩할 때 위상위치의 분리를 향상시킨다.
그러나, 이의 방법의 문제의 하나는 제한으로 인해 톤피치 및 천이와 같은 중요한 특성이 저하된다는 것이다. 다음, 이로인해 수신된 파형이 왜곡된다. 또한, 위에서 언급한 공지된 방법에 따른 모든 가능한 위치에 대한 검색이 매우 복잡하게 되어 매우 복잡한 하드웨어를 이용해야 하고 유효 위상위치의 수가 초기에 낮을 때만 이용될 수 있다. 다수의 위상위치의 경우에, 상기 위치를 결정할 때 복잡하지 않도록 해야 한다.
본 발명에 따라서, 제한이 결여된 위에서 언급한 제 1 공지된 방법은 어느 제한의 도입을 요하는 최종 언급한 공지된 방법과 결합된다. 이들 두 개의 공지된 방법은 제한없이 어느 다수의 단계가 수행된 후 각각의 위상에서, 제한없이 제 1 검색에서 제한없이 제 1 검색에서 결정된 위치가 개시점으로 택해질 때 다수의 순차검색이 제한 더불어 수행된다. 이로인해 제한없이 산술단계의 수가 자유롭게 선택되고 이들 단계는 제한을 지닌 산술단계의 수에 대해 정확한 위치를 제공하지만 산술이 복잡해져 대략적인 위치를 제공하지만 산출이 덜 복잡하게 되어 음성 프레임내의 여기펄스의 위치(위상위치)를 산출할 때 전체 복잡성이 최적화 된다.
본 발명의 방법은 청구항 1의 특징부에 개시되어 있다.
청구항 2 내지 5는 청구항 1의 독립항이고 청구항 6은 또다른 실시예를 한정한다.
제한된 방법은 코드북이 이용이 있거나 없이 원음성신호의 상관과 LPC합성신호의 임펄스 응답의 다중펄스 원리에 따라 작동하는 음성 엔코더에 적용될 수 있다. 그러나, 이 방법은 여러 여기펄스가 프레임간격에 동시에 설정된 소위 RPE음성 엔코더에 적용될 수 있다.
도 1은 상관과 관련된 다중펄스원리에 따라 공지된 LPC음성엔코더를 도시한 도면이다. 이러한 엔코더는 미합중국 명세서 4,472,832(SE-B-456618)에 상세히 설명되어 있다. 마이크로폰으로부터의 아날로그 음성신호는 예측 분석기(110)의 입력에 나타난다. 아날로그-디지탈 변환기외에, 또한 예측분석기(110)는 LPC컴퓨터 및 잔여신호 발생기를 포함하여 예측 파라미터 ak및 잔여신호 dk를 형성한다. 예측 파라미터는 분석기 유닛을 통해 합성신호 및 원음성신호를 특징으로 한다.
여기 프로세서(120)는 두 개의 신호 ak및 dk를 수신하고 프레임신호 FC에 의해 결정된 다수의 상호 순차적 프레임간격중 하나동안 작동함으로써 각각의 기간동안 어느 다수의 여기펄스를 발생한다. 여기펄스 파라미터 Amp, mp는 엔코더(131)에 전달되고 무선 송신기로부터의 전송전 예측 파라미터 ak와 멀티플렉스된다.
여기 프로세서(120)는 소정의 산출 또는 산술 단계동안 예측 파라미터 ak에 따라 신호 dk및 (Ai, mi)을 가중하기 위해 동일한 임펄스응답을 갖는 두 개의 예측필터를 포함한다. 여기펄스가 발생할 때마다 가중된 원신호(y)와 가중된 인공신호(y) 사이를 상관하는 상관신호 발생기가 포함되어 있다. 다수의 펄스성분 좌표 Ai, mi(0≤iI)는 각각의 상관에 대해 얻어지고 이들 좌표중(1)은 최소 제곱에러 또는 최소 절대값을 제공한다. 선택된 좌표에 대한 진폭 Amp및 시간위치 mp는 여기신호 발생기에서 산출된다. 선택된 펄스 Amp, mp로부터의 가산이 상관신호 발생기의 바람직한 신호로부터 감산되어 좌표의 새로운 순차를 얻는다. 이러한 절차는 프레임내의 여기펄스의 바람직한 수와 동일한 여러번 되풀이된다. 이것이 위에서 언급한 미합중국 특허 명세서에 설명되어 있다.
도 2는 음성입력신호, 예측잔여신호 dk및 여기펄스의 타이밍도를 도시한다. 예시된 경우에, 여기펄스는 수가 8이고 이중 Am1, m1이(가장 작은 에러)로 주어지고 이후 프레임에 걸쳐 Am2, m2가 주어진다.
다수의 좌표 Am2, mi, m=m1으로부터의 각각이 여기펄스에 대한 진폭 Amp및 위상위치 mp는 αiij의 최대값이 주어지고 관련된 진폭 Amp가 산출되는 좌표 I에 대해 산출되고, 여기서 αi는 신호 y와사이의 교차상관 벡터이고 Φij(이하, Cij, i=j=m)는 예측필터의 임펄스응답에 대한 자동상관 매트릭스이다. 위에서 언급한 조건이 만족될 때 위치 mp가 허용된다. 첨자 p는 여기펄스가 상기에 따라 산출되는 단계를 나타낸다.
여기펄스의 위치의 결정이 제한되는 공지된 방법에 따라, 도 2의 프레임은 도 2에 도시되어 있듯이 분할된다. 예로서, 프레임은 N=12를 포함한다고 했다. N은 검색벡터(n)를 형성한다. 전체의 프레임은 소위 서브블록으로 도 3에 도시되어 있듯이 분할된다. 다음 각각의 서브블록은 위상의 어느 번호에 포함되어 있다. 예를 들면, 프레임이 대체적으로 도 3에 도시되어 있듯이, N=12위치를 포함하면, 4개의 서브블록이 각각의 서브블록내에 3개의 상이한 위상이 포함되어 있다. 각각의 위치 n(0≤nN)는 다음 서브블록 nf(0≤nfNf) 및 상기 서브블록의 위치 f(0≤fF)에 포함되어 있다.
다음 관계는 N위치를 포함하는 전체 검색벡터의 위치 n(0≤n≤N)에 적용된다.
n=nf+f ……… (1) 여기서
f는 서브블록 nf내의 펄스위상이고 F=블록내의 위상의 수이다.
nf=0,...,(Nf-1), f=0,...(F-1) 및
n=0,...,(N-1).
다음 관계가 적용된다.
fp=n MOD F 및 nfp=n DIV F...(1)
도 3은 N위치를 포함하는 검색벡터에 대한 위상 fp및 서브블록 nfp의 분배를 도시한다. 이 경우에, N=12, F=2 및 NF=4이다.
제한을 이용하는 공지된 방법에서, 펄스검색이 위치 n이 선행단계에서 산출된 여기펄스에 대해 이미 축적된 위상 fp에 포함되지 않은 위치에 제한된다.
소정의 펄스산출 사이클의 순차수는 다음에서 p로 표시했다. 제한을 포함하는 공지된 방법은 프레임 간격에 대해 다음 산출결과를 제공한다.
1. 바람직한 신호 yn을 산출한다.
2. 교차상관 벡터 αi을 산출한다.
3. 자동상관 매트릭스 Cij(=Φiji=j=m)을 산출한다.
4. p=1에 대하여, 점유되지 않은 위상 f의 최대 α1/Cij을 제공하는 펄스위치에 대한 검색을 한다.
5. 발견되지 않은 펄스위치 mp에 대한 진폭 Amp을 산출한다.
6. 교차상관 벡터 αi을 갱신한다.
7. 상기 식에 따라 fp와 nfp을 산출한다.
8. p=p+1에 대해, 동일단계 4 내지 7을 실행한다.
공지된 방법을 예시하는 흐름도는 미합중국 특허 명세서 5,193,140의 도 4a 및 4b에 도시되어 있다.
얻어진 위상 f1,...fp는 코드되고 위상위치(서브블록) nf1,...,nfp는 전송전에 엔코드된다. 결합은 전송전에 각각 엔코드된다. 결합코딩은 위상을 엔코딩하기 위해 이용된다. 각각의 위상위치는 각각 코드워드로 엔코드된다.
일실시예에서, 펄스의 배치에 대한 제한을 갖지 않는 공지된 음성처리회로는 도 4에 도시된 방식으로 수정되고 이는 여기신호 발생회로(120)를 포함하는 음성프로세서의 부분을 도시한다.
예측잔여신호 dk및 여기발생기(127)는 게이트(122, 124)의 매체를 통하여 프레임신호 FC와 함께 적시에 각각의 필터(121 및 123)에 적용된다. 각각의 필터(121, 123)로부터 얻어진 신호 yn및 yn이 상관발생기(125)에서 상관된다. 신호 yn은 참음성신호를 나타내는 반면 yn은 인공음성신호를 나타낸다. 상관발생기(125)로부터 위에 따라 성분 αi및 Φij을 포함하는 신호 Ciq가 있다. 최대 α1/Cij를 제공하는 펄스위치 mp는 여기발생기(127)에서 산출되고 진폭 Amp는 상기위치 mp외에 얻어질 수 있다.
여기펄스 파라미터 mp, Amp는 여기발생기(127)로부터 위상발생기(129)로 전달된다. 이 발생기는 관련된 위상 fp및 여기발생기(127)로부터 들어오는 값 mp, Amp으로부터 위상위치(서브블록) nfp을 산출한다.
f=(m-1) MOD F
nf=(m- ) DIV F
여기서 F=가능한 위상의 수이다.
위상발생기(129)는 위의 식에 따라 위상 및 위상위치를 산출하기 위해 지시를 기록하는 판독메모리를 포함하는 프로세서를 포함할 수 있다.
위상 fp및 위상위치 nfp는 도 1에서 엔코더(131)에 전달된다. 이 엔코더는 공지된 엔코더와 동일한 원리이지만 펄스위상 mp대신 코드위상과 위상위치가 다르다. 이 위상과 위상위치는 다음 식에 따라 펄스위치 mp을 산출한다.
mp=(nfp-1)F+fp
그리고 여기위상위치를 분명히 결정한다.
위상 fp는 상관발생기(125)와 여기발생기(127)에 전달된다. 상관발생기는 이 위상 fp가 점유하는 동안 이 위상을 기억한다. 신호 Ciq의 값은 분석된 순차에 대하여 산출된 모든 선행 fp에 속한 이들의 위치에 포함된다.
q=nF+fp
여기서 n=0,...,(Nf-1)은 점유된 프레임내의 모든 선행위상을 나타낸다. 이와 유사하게, 여기발생기(127)는 신호 Ciq와 신호 Ciq*사이를 비교할 때 점유된 위상을 관찰한다.
프레임에 대한 모든 펄스 배치가 수행될 때, 모든 위상은 새로운 프레임의 제 1 펄스에 대하여 자유로워진다.
도 5는 소위 적응 코드북의 도움으로 수행되는 음성 엔코딩 루우틴의 또다른 형태를 도시한다. 예측분석기(110)는 두 개의 파라미터 ak및 dk을 포함하고 이들 파라미터는 도 4의 여기프로세서(120)앞에 도입된 블록(111)에 대한 입력크기로 이용된다.
블록(111)은 다수의 코드워드 C1,...,Cn을 기억하고 제어신호에 의해 갱신된 적응 코드블록(112)을 포함한다. 이것은 제어신호의 값에 따라 소정의 코드워드 ci에 대해 포인트된 선택기(113)에 의해 도 5에서 문자로 된다. 코드워드는 적절한 방식으로 스케일 유닛(114)에 의해 코드북(112)으로부터 스케일되고 스케일된 코드워드가 분석기(110)로부터 예측잔여 dk를 플러스입력이 받아들여지는 합산기(115)의 마이너스 입력에 전달된다. 예시된 경우에, 합산기(115)에 전달된 예측잔여는 dk1을 표시되어 있고 합산기(115)의 하류에서 얻어진 잔여는 dk2로 표시되어 있다.(분석기 (110)로부터 변하지 않은) 예측 파라미터 ak는 도 4에 따라 여기프로세서(120)에 적용된다.
선택기(113)에 대한 제어신호(113)는 필터파라미터 ak를 지닌 적응필터(117), 가중필터(117) 및 최대값 형성기를 포함하는 루우프로부터 전달된다. 잔여신호 dk2는 필터(116)에 전달되고 필터된 신호가 필터(117)에서 가중된다.
제 1 선택된 코드워드는 필터(116, 117)에서 여과되어 가중된 예측잔여 dk2을 제공하고 최소 평균 에러 E가 최대값 형성기(118)에 형성된다. 위의 절차는 모든 선택된 코드워드에 대해 수행되고 스캘러(114)에 스케일된 후, 최소에러를 제공하는 코드워드가 잔여신호 dk1에서 dk2로 감산된다. 이것이 적응 코드워드를 이용할 때 최상 코드워드를 조사하는 소위 폐쇄루우프이다. 도 5에 도시된 회로는 본 발명의 방법을 수행할 때 이용될 수 있거나 이용될 수 있거나 이용되지 않을 수 있다. 따라서, 도 4에서 적응 코드북이 이용되지 않을 때
dk=dk1이고 적응 코드북이 이용될 때
dk=dk2이다.
도 9와 관련하여 설명했듯이, 이 경우에 코드북이 제한으로 산출된 펄스배치만을 기억하기 위해 메모리 공간과 대체될지라도 도 5에 도시된 회로는 에러의 폐쇄루우프를 검색하기 위해 블록(132a~d)에서 이용된다.
선택된 코드워드 ci(최소 에러)에 대한 예측 파라미터 ak및 첨자 I는 멀티플렉서(135)에 공급되고 공지된 방식으로 전송된다.
본 발명의 방법은 도 6을 참조로 하여 설명할 것이다.
펄스배치 루우틴의 개시에, 제한없이 공지의 방법으로 블록 1에서 여기펄스의 번호 j가 결정된다. 이들은 위에서 설명했듯이, 공지된 방식으로 산출된다. 프레임내의 펄스위치와 mp(1≤p≤j)와 진폭 Amp가 이 방법으로 결정된다. 위에 따라 산출된 각각의 펄스위치가 이용되기 때문에 제한으로 결정될 때 이들 펄스의 진폭 Amp를 이용할 필요가 없고 진폭은 흥미의 대상이 아니다. 그러나, 진폭이 재순환되지 않으면 또다른 방법에서는 진폭을 이용해야 한다.
펄스위치 mp(p=1,...,j)의 번호가 이 방법으로 결정될 때, 여기펄스의 산출이 제한의 공지된 방식으로 블록 2에서 수행된다. 각각의 여기펄스의 펄스위치 mp와 진폭 Amp는 위에서 설명한 공지된 방법으로 결정된다. 따라서 이 절차는 동일 프레임내의(제한이 없는) 블록 1에 따라 결정된 선택된 여기펄스의 위치 mi(1≤i≤j)로부터 개시점에서 시작한다. (공지된 방법에 따른 제한이 있는) 새로운 여기펄스의 산출은 소정의 수 N1에 대해 수행된다.
제한을 지닌 제 1 산출단계(블록 2)에 있어서, 새로운 여기펄스에 대한 위치 mk(k=i)는 제한(블록 1) 없는 공지된 방법으로 산출된 후 제 1 산출단계에 대한 위에서 언급한 제한을 지닌 동일한 산출 루우틴이 도 6의 블록 3에서 또다른 위치 mk(1≤k≤j: k=1)로부터 시작될지라도 제 2 산출단계로부터 시작된다. 산출은 N2가 N1과 같은 여기펄스의 소정의 수 N2에 대해 수행된다. 제한이 있는 공지된 방법에 의해 수행된 산출단계는 도 6의 블록 4에서 최종단계까지 다수번으로 지속된다.
이러한 단계의 수 L은 제한(블록 1)이 없는 방법에 따라 얻어진 여기펄스에 대한 j=p의 위치의 수와 동일할 필요가 없다. 음성품질이 허용될 수 있다고 하면 절차를 인터럽트한 후 작은 수의 단계를 수행하는 것이 적절하고 산출수가 적어진다. 또한, 제한없이 산출된 여기펄스에 대한 위치 P의 원래의 수보다 개시위치를 제공함으로써 정확도를 향상시킬 수 있다. 이로인한 위치의 수는 L=P+Pextra이 된다. 여기서 Pextra는 부가적인 위치를 나타낸다. 이것이 도 7을 참조로 하여 설명되어 있다.
위에서 언급한 펄스위치 L=P+Pextra는 또다른 제한을 허여될 수 있는 펄스에 위치시키는데 이용된다. 따라서 가장 멀리 위치한 이들의 위상 fp(p=1,...,j)가 제한없이 산출된 펄스위치를 택하지 못하도록 한다.
도 6에 따라서 제한이 있는 펄스 배치 루우틴이 소정의 단계(펄스 p2로부터의 개시와 함께 펄스 p1, N2를 지닌 N1단계)후 인터럽트된다. 이로인해 어느 부가적인 위치 pextra를 포함하는(제한이 없는) 각각의 원래 산출된 위치로부터의 펄스의 수 N이 된다. 블록 5에서, 어느 L펄스 배치가 소정의 규정에 따라 이용되는 지를 결정한다. 그 규정을 만족하는 펄스배치는 유지된다. 이 규정, 소위 폐쇄루우프가 L=4를 나타내는 도 9의 블록도를 참조하여 상세히 설명할 것이다.
제한이 있는 위에 따라 선택된 배치(Amp, mp, p=1, 2..., i, k)는 프레임에 최종 여기펄스를 위치시키고 위상위치와 수신기에 전달된 위상위치의 값에 해당한다. 제한없이 초기에 산출된 이들이 위치(mp, p=1,...,j)가 전달되지 않는다.
위에 따른 산출단계의 알고리즘은 부록 1에 도시되어 있다.
도 7은 여기펄스와 제한없이 산출된 부가펄스와 제한으로 산출된 펄스배치를 개략적으로 도시한다. 펄스 P1, P2, P3 및 P4는 공지된 방법(블록 1 및 블록 2)에 따라 산출된 여기펄스이다. 이들 펄스는 위상위치 n1, n2, n3 및 n4를 지닌다. 이들 펄스외에, 위상위치 n5 및 n6을 지닌 펄스위치를 지닌 두 개의 펄스위치 Pe1 및 Pe2에 예시된 경우의 동일한 공지된 방법으로 산출된다. 따라서, 위상위치 n1~n6은 제한(블록 2 내지 4, 도 6)이 있는 공지된 방법에 따라 산출된 L=6펄스배치를 산출하기 위해 개시점을 제공한다. 따라서 두 개의 부가적인 펄스배치가 얻어지는데 이는 위에서 언급한 규정에 따라 최상의 펄스배치를 시험할 때 포함될 수 있다. 도 7에서 각각의 펄스배치의 개시펄스는 실선 및 직각으로 표시되어 있는 반면, 각각의 펄스배치에서 산출된 펄스는 점선과 링으로 표시되어 있다.
제한이 있는 것으로 산출되고 모든 개시펄스 P1 내지 P4 및 부가적인 펄스 Pe1 및 Pe2는 폐쇄루우프 규정에 따라 시험된다. 최상이라고 발견된 펄스배치, 즉 최소에러를 지닌 배치가 선택되어 전달된다. 나머지 펄스배치는 특정 프레임에 이용되지 않는다.
여기펄스의 위치의 위에서 언급한 산출의 대안으로, 제한을 고려하지 않음과 동시에 제한없이 산출된 여기펄스의 위상을 조절하도록 할 수 있다. 이 경우에, 위상 fp는 상기 규정에 따라 최상으로 선택된 펄스배치에 대해 선택된다.
프레임에서의 제한이 없는 산출된 개시펄스의 전체수의 각각의 위상에 대해 프레임의 개시펄스의 위치주위에 특정크기의 시간간격의 포함된 검색영역이 규정되어 있다. 각각의 개시펄스를 토대로 산출된 펄스의 위치가 검색영역 외부에 위치한 제한이 있는 펄스배치가 산출된다. 이 방법에서, 관련된 개시펄스의 위치외에 나머지 개시펄스의 검색영역에 위치한 이들 펄스의 적은 수의 위치가 얻어진다. 이러한 위치는 각각의 나머지 개시펄스에 대해 되풀이되고 다수의 펄스배치가 되는데 이러한 배치에는 각각의 배치가 개시펄스의 정확한 위치에 해당하고 나머지 펄스의 위치는 나머지 개시펄스의 검색영역내에 위치된다.
위에서 언급한 펄스배치 제한외에 또다른 제한이 얻어진 상이한 펄스위치 mp의 코디에 위치한다. 이러한 상태는 폐쇄루우프 시험을 하기전에 위의 방식에 따라 시험된 상이한 위치에 적용된다. 코드제한은 소위 엔코드 가능한 벡터가 선택되는데 이 벡터는 위의 방법에 따라 제한을 진것으로 산출된 펄스배치에 해당한다는 것을 의미한다.
N을 포함하는 전체검색 벡터의 위치 n(0≤n≤N_이 다음과 같은 식으로 된다.
n=nfF+F 여기서,
f=서브블록(위상위치) nf내의 위상이고 F=블록 nf내 이 위상수이다.
소정의 펄스배치(벡터)의 모든 위상의 펄스위상이 선택된 이들 펄스에 대해 다르다. 나머지는 버려진다.
이에 따라 얻어진 모든 벡터는 엔코딩기능한다고 간주되고 폐쇄루우프가 시험되고 개시펄스의 위치에 대한 최상의 펄스배치의 위치의 값이 수신기에 전달된다.
산출 및 시험의 복잡성은 전체위상 조절에 대해 내림차 순서로 여러 좌표의 리스트를 컴화일하고 사용함으로써 변경되지 않게 유지된다.
위에서 언급한 위상위치조절의 알고리즘이 수반한 부록 2에 나타난다.
도 8은 위의 방식대로 제한이 없이 얻어진 여기펄스의 위에서 언급한 위상조절을 도시한 도면이다. 도 8a는 도 7의 최상부에 도시된 펄스 P1 내지 P4에 해당하고 제한이 없이 얻어진 여기펄스 P1, P2, P3 및 P4를 도시한다.
프레임의 개시펄스 주위에 시간간격이 포함된 검색영역 S1, S2, S3, S4가 프레임의 제한이 없는 전체수의 산출된 개시펄스의 각각의 개시펄스 P1 내지 P4에 대해 형성된다. 각각의 이들 검색영역 외측의 펄스위치는 허락되지 않은 펄스위치이고 제한을 구성한다. 예를 들어, 각각의 검색영역은 제한없이 산출된 펄스위치 mi에 가장 인접한 위치에 의해 형성된 두 개의 펄스위치를 포함한다. 따라서, 각각의 개시펄스위치 주위에 허여된 상기 위치로부터 형성될 수 있는 다수의 펄스배치가 산출된다.
도 8c는 개시펄스로 펄스 P1으로 산출된 펄스배치를 도시하고 3개의 펄스가 후의 개시펄스 원위치로부터 산출된 위상편이 증분을 지닌 두 개의 펄스 P2 및 P4에 의해 형성되는 반면, 제 3 개시펄스 P3는 예의 관련된 개시펄스위치로부터의 위상편차가 주어진다. 이는 전체위상 시프트가 2가 된다.
개시펄스 P2로부터의 개시전과 함께 도 8d는 두 개의 펄스 P0 및 P4가 관련된 개시펄스 위치로부터 왼쪽으로 한 단계 변위되고, 제 4 펄스 P1가 오른쪽으로 한단계 변위하는 방법을 도시한다. 이것은 전체위상 시프트가 3이 된다.
개시펄스 P4로부터의 개시점의 경우에, 도 8e는 두 개의 펄스가 두 개의 펄스 P2 및 P4 관련된 개시펄스 위치로부터 오른쪽으로 한단계 변위되고 제 1 펄스가 관련된 개시펄스위치로부터 오른쪽으로 한 단계 변위되는 방법을 도시한다. 이것은 또한 전체위상 시프트가 3이 된다.
다음표가 컴화일될 수 있다.
두 개의 갯펄스 위치만이 예로 택해지고 이들 개시펄스위치는 순차번호 2 및 5을 지닌다. 여기서 fp1, fp2은 F=3으로 위의 식에 따라 산출된다.
[표 ]
일반적으로 위상 fp는 엔코딩 가능성 fp1≠fp2과 같을 수 있다. 다음은 여러 개시펄스위치 mp가 이용될 수 있다. p≥3.
fp1≠fp2≠fp3≠fp4이는 하나 및 동일한 펄스배치에 대한 것이다.
얻어진 엔코드 가능한 펄스배치는 위의 방법의 폐쇄루우프에 따라 서로 비교되고 최상의 코드가능한 배치의 위상값이 각각 배치에서의 바이어스로 이용되는 개시펄스의 진폭값으로부터 택해지거나 진폭이 각각의 산출된 위상의 위상변화를 고려하도록 재순환될 수 있다.
최상의 엔코더 가능한 배치의 위상 fp및 위상위치 nfp가 전달된다.
도 9는 본 발명의 방법을 이용하는 음성엔코더의 부분을 도시한 블록도이다.
도 4에 도시되어 있듯이, 블록(125)은 신호 y와 y사이의 상관을 나타내는 직폭 Ciq=(Cij, αi)을 형성하는 상관을 나타낸다. 다음 I좌표의 최상상관(최소 제곱평균 에러)의 진폭 Amp와 위상위치 mp를 선택하는 여기발생기(127)를 추종한다. 전체의 I상관은 소정의 여기펄스의 위치와 진폭을 결정하기전에 수행된다. 공지된 실시예에서, 여기발생기(127)는 위상발생기(129, 도 4)에 의해 추종된다. 도 9의 실시예에서, 메모리유닛(126)이 대신에 접속되어 있다. 이 메모리유닛은 제한이 없는 방법에 따라 얻어진 선택된 여기펄스의 진폭 Amp 및 위상위치 mp(p=1,...,j)를 기억한다.
메모리 유닛(126)은 도 9의 블록(128a) 및 제어스위치(128b)에 의해 문자화되는 선택유닛에 의해 추종된다. 선택유닛(128a)은 스위치(128b)로 하여금 메모리 유닛(126)에 대한 소정의 분지의 접속용 다수의 분지를 구하게 하여 메모리유닛(126)에 기억된 소정의 위치 mp(p=1,...,j)가 도 6의 블록에 따라 개시값을 형성할 수 있다.
도면에 도시된 최상의 분지 (a)는 여기발생기(127)와 같은 설계의 여기발생기(127a);
도 4에서 위상발생기(129)와 같고 도 4에서 갱신을 위해 여기발생기(127a)에 대한 피드백을 지닌 위상발생기(129a);
기억장치(130a);
폐쇄루우프 에러 E1을 산출하는 산출유닛(132a)을 구비하여 코드북이 없지만 도 5에 따른 회로와 동일한 기능을 갖는다. 코드북대신, 유닛(127a, 129a, 130a)에서의 제한으로 산출된 관련된 펄스배치의 값이 기억되는 위치를 기억하는 메모리를 제공한다. 적응 코드북이 이용될 때, 예측잔여 dk2가 유닛(132a)에 전달되거나 예측잔여 dk1에 적용된다. 예측 파라미터 ak가 또한 공급된다.
나머지 분지(b, c, d)는 분지(a)의 유닛에 해당하는 유닛을 포함한다. 따라서, 각각의 분지는 제한이 있는 방법에 따라 펄스위치를 결정할 수 있는 유닛을 포함한다. 각각의 분지는 제한이 있는 것으로 산출된 펄스배치를 제공한다. 즉, 메모리(126)로부터 택해진 4개의 개시값 mp를 토대로 제한이 있는(도 7의) 전체의 4개의 펄스 파라미터 수행된다. 분지수는 4개이상의 값이 이용될 때 연장될 수 있다. 이와 유사하게 유닛(132b, 132c, 132d)이 분지(b, c, d)로부터 관련된 펄스배치를 기억하고 에러 폐쇄루우프(E2, E3, E4)를 산출하기 위해 제공되어 있다.
선택유닛(128a)은 초상위분지(a)에 대한 스위치 접점(128b)을 제어하고 여기 발생기(127a)에 제한(블록 1, 도 6)이 없는 펄스검색으로부터 이미 점유된 위치 mp(p=1,..., j)을 제공한다. 또한 여기발생기(127a)는 제한없이 상기 펄스검색후 상관발생기로부터 갱신된 값(Cij, αi)을 수신한다. 여기발생기(127a) 및 위상발생기(129a)는 이들 유닛이 이미 점유되어 있기 때문에 소정의 위치 i로 부터 시작하는 제한이 있는 펄스검색을 수행할 수 있다. 소정의 수의 검색이 있은 후, 얻어진 결과는 다수의 여기펄스를 제공하는데 이 여기펄스의 진폭 Amp와 펄스위치 mp는 유닛(130a)에 기억된다. 이 경우에, 위상 fp와 위상위치 nfp는 펄스위치 mp대신에 기억된다.
다음, 선택유닛(128a)은 분지(b)에서 여기발생기(127b)에 대한 스위치(128b)쪽으로 스탭되고 위치 m2을 지닌 제 2 개시값으로부터 시작하는 펄스검색이 다음 분지(b)에 의해 실행된다. 이 검색은 분지(a)에 의해 수행되는 검색과 같은 방식으로 수행되고 펄스검색이 유사한 방법으로 분지(c, d)에 연장된다. Cij의 동일한 값이 펄스검색의 개시에 모든 분지에 적용되는데 이는(제한이 있는) 최상의 여기펄스를 검색할 때 좌표를 시험할 때 이용된다.
소정의 수의 병렬 단계 M을 완료할 때, 모든 분지(a)~(d)는 여기펄스를 진폭 및 위상위치를 산출하고 기억유닛(134)에 이들 값이 기억된다. 산출유닛(132a~132d)이용된 코드워드 및 각각의 분지로부터 택해진 여기펄스에 따라 인입음성 프레임과 합성음성 프레임사이의 에러의 각각의 산출을 수행하고 여기펄스가 각각의 분지로부터 택해진다. 따라서 인입음성신호는 각각의 유닛(132a~132d)에 적용된다. 각각의 이들 유닛은 폐쇄루우프 에러를 산출하고 출력신호로 각각의 에러값 E1, E2, E3, E4를 전달한다. 제곱가장 오차를 선택할 수 있다.
여기서 ew(n)은 음성프레임내의 값 y(n)와의 인입(참 음성신호와 합성음성신호사이의 차이이다.
산출유닛(132a~132d)의 기능은 적응 코드북이 이용되지 않으면 동일하고 에러 E1~E4는 동일한 방식으로 산출된다.
관련된 스위치 접점(133b)을 지닌 선택유닛(133a)은 상이한 위상배치의 산출된 에러값 E1, E2, E3, E4를 감지하고 이들 값을 기억유닛(134)에 한 번에 하나를 전달한다. 기억유닛은 차례로 값을 수신하고 이 값이 양호한 값일 때, 즉 바로 선행하는 값보다 에러 E가 작을 때 인입값을 기억한다. 유닛(134)이 값 E1~E4를 수신함과 동시에, 유닛은 가장 작은 값을 한다. 즉 최상의 펄스배치를 등록한다. 최상의 펄스배치를 등록한 후, 기억유닛(134)은 최상 펄스배치에 대한 진폭 Am, 위상 fp 및 위상위치 nfp를 수집한다. 이 값은 기억유닛(130a~130d)에 대한 접속중 하나를 경유해 얻어지고 엔코더(131)에 전달된다. 엔코더(131)는 도 1에 도시되어 있듯이 멀티플렉서(135)에 접속되어 있다.
엔코더(131)는 진폭, 즉 제한으로 컴화일된 최상 여기펄스에 대한 진폭 Amp 및 위상위치 fp, nfp을 수신한다. 전에 언급했듯이, 얻어진 위상 f1,...fp는 공통으로 코드되고 얻어진 위상위치 nf1,...,nfp는 각각 전송전에 코드된다. 주지해야할 것은 위상위치와 위상위치 로케이션이 각각의 메시지 워드에서 코드된다는 것이다. 이것은 구별력을 향상시키고 에러확율을 감소시킨다.
도 10은 도 9와 유사하지만 도 8에서 언급했듯이 개시펄스에 대한 위상조절을 하도록 개량된 블록도이다. 제한이 있는 펄스위치를 산출하는 선택기(128b) 및 블록(127a~d, 129a~130a~d)이 제거되어 있고 개시펄스 P1~P4(도 8)에 대한 위에서 언급한 검색영역을 한정하는 유닛(100)과 대체된다. 여기펄스가 이 검색영역 외부에 위치되지 못하게 하고 각각의 개시펄스 주위로의 검색영역의 도입과 관련된 산출이 도 9에 따른 상기 산출과 대체될 수 있다. 또한, 유닛(100)은 표에 따라 펄스배치의 가능한 수에 대한 펄스위치를 산출하고 코드제한을 고려함과 동시에 가능한 펄스배치를 컴화일한다. 이들 코드제한은 출력 a, b, c, d에 대하여 얻어지고 얻어진 펄스배치가 위에서 설명한 방식으로 폐쇄루우프 에러 E1, E2, E3, E4을 산출하는 유닛(132a~132d)에 전달된다.
엔코더(131)에서 코딩하기 위해 선택된 펄스배치의 진폭의 값은 유닛(100)에 전달되지 않기 때문에, 각각의 펄스배치의 진폭값 Amp가 메모리유닛(126)으로부터 산출유닛(132a-132d) 및 기억유닛(134)에 전달된다.
위상위치와 위상위치 로케이션을 코딩할 때, 위상위치와 위상위치 로케이션이 공지된 방식으로 관련된 패리티를 포함하는 메시지 블록이 두 개이상의 곱으로 결합된다. 관련된 패리티워드를 지닌 위상위치와 위상위치 로케이션이 수행될 수 있다. 메시지워드에서 여러 값을 갖는 코딩은 보호를 잘하기 위해 하쉬어 코딩을 이용할 수 있을 지라도 저장이 대역폭에서 이루어진다는 것이다. 덜 보호된 단순한 코딩이 하나의 위상값 및 위치값에 적용될지라도 대역폭이 손실된다. 위상의 코딩은 결합코딩으로 수행된다.
주지해야할 것은 도 9 및 도 10은 음성엔코더의 관련된 회로가 구성될 수 있는 방법을 도시한다. 실질적으로 모든 유닛은 도 6의 흐름도 및 수반한 부록 1, 2에 따라 기능을 수행하도록 프로그램된 마이크로 프레세서에서 집적될 수 있다.
음성품질은 제한이 있는 공지된 방법과 비교해 제안된 방법에 의해 향상되고 복잡함이 감소하게 된다. 제한이 있고 없는 모두의 공지된 방법이 이용되기 때문에 제한이 있고 없는 방법에 따라 산출된 여기펄스의 수사이의 비를 선택할 수 있고 이 방식으로 소정의 바람직한 음성품질을 위해 최저의 산출 복잡성을 제공하는 최적 분배를 얻는다.
본 발명의 방법은 프레임간격이 채워질 때까지 여기펄스가 한 번에 하나의 펄스를 적소에 위치한 음성엔코더와 관련하여 설명되었다. EP-A 195,487는 또다른 형태의 음성엔코더를 설명하는데 이는 펄스사이의 거리 ta가 일정한 펄스형태 배치절차로 단일 펄스대신 작동한다. 또한 본 발명의 방법은 이러한 음성엔코더에 적용된다. 이 경우에 (도 4a, 4b)프레임의 숨은 위치는 펄스패턴의 펄스의 위치와 일치한다.
[부록 1]
도 6의 흐름도에 따른 산출단계용 알고리즘
수정된 산출단계 1~8은 미합중국 5,193,140에 설명되어 있다.
미합중국 5,193,140은 [2]로 표시했다.
[2]의 자동상관 매트릭스 Φij는 응용의 설명부에서 C(i, j)=Cij로 표기되어 있다.
[2]의 펄스위치 mp와 mq는 이 경우에 msp와 msq로 표시되어 있다.
[2] 및 명세서의 설명부분에서의 크기 αi는 여기서 a(i)로 표시되어 있다.
[2]의 αm의 아날로그는 a(m)에 대하여
1. 바람직한 신호 y(n)를 산출한다.
2. 교차상관 벡터 a(i) 및 저장카피를 산출한다.
3. 공분산(또는 자동상관) 매트릭스 C(ij)를 산출한다.
4. p=1에 대해 P+extra
4.1. msp즉 최대 a(i)*a(i)/C(ij)=a(ms)*a(ms)/C(ms, ms)을 점유되지 않은 위치에 제공한다.
4.2. 발견되지 않은 위상위치msp에 대해 진폭 A(msp)을 산출한다.
4.3. 교차상관 벡터 a(i)을 갱신한다.
4.4. 가능한 위치로부터 발견된 위치 msp를 버린다.
5. q=1에 대해 P+extra
5.1. assav-a(i)을 카피한다.
5.2. msq의 값을 m1에 활당한다.
5.3. 개시펄스위치 m1의 진폭 A(m1)을 산출한다.
5.4. 교차상관 벡터 a(i)를 갱신한다.
5.5. p=2에 대해 p
5.5.1. 점유된 위상에 최대 a(i)*a(i)/C(ij)=a(m)*a(m)/C(m, m)을 제공하는 위상위치, 즉 mp을 검색한다.
5.5.2. 발견된 펄스위치 mp의 진폭 A(mp)을 산출한다.
5.5.3. 교차상관 벡터 a(i)을 갱신한다.
5.5.4. mp와 같은 위상이 이 위치에서 배제된다.
5.5.5. 폐쇄루우프 에러 E을 산출한다.
5.7. 에러 E가 전에 저장된 한 세트의 위치와 위상보다 낮으면 위치 mp를 mWp로 그리고 진폭 A(mp)로 저장한다.
6. 저장된 세트의 위치 mWp에 대한 [2]의 식(1)에 따라 fp및 nfp을 산출한다.
[부록 2]
위상위치 조절용 알고리즘
부록 1에 따른 표시
1. 부록 1의 단계 1~4를 통한 것처럼 최적위치 msp와 진폭 A(msp)을 산출한다.
2. msp로부터의 P위치의 n=(P+extra, P에 대하여)
3.0. combinationi=combination1to combinationn
3.1. 각각의 방향으로 한 단계씩 각각의 위치를 시프팅함으로써 combinationi로 모든 위치를 새이크한다. 이로 인한 새트치가 제한된 위치코드를 사용함으로써 엔코드 가능하면, 이들을 시프트하지 않은 combinationi로부터 전체위상 시프트에 대한 순서로 리스트 min_shift_list에 이들을 저장한다.
4.0. j=1에 대해 nb_to_test.
4.1. mvp에 대한 min_shift_list의 상부의 위치를 카피한다.
4.2. 리스트 min_shift_list에서 모든위치를 제거한다.
4.3. A(mvp)에 대한 시프트되지 않은 combinationi의 A(msp)로부터의 진폭을 카피한다.
4.4. mvp및 A(mvp)을 사용하여 폐루우프 에러 Ej산출한다.
4.5. 에러 Ej가 전에 저장된 세트의 위치와 진폭에 대한 에러보다 적을 경우, 위치 mvp를 mwp로 그리고 진폭 A(mvp)을 A(mwp)로 저장한다.
5. 저장된 세트의 위치 mwp에 대해 [2]의 식(1)에 따라 fp및 nfp을 산출한다.

Claims (6)

  1. 음성프레임에서 분할된 음성신호가 분석되고 분석된 음성신호가 예측잔여(dk)와 다수의 예측 파라미터(ak)를 형성하기 위해 합성(110)된 선형예측 음성디코더에서의 여기펄스의 소정의 수(N=j+N1, N2)의 음성프레임내의 위치를 결정하는 방법으로 제 1 방법에 따라, 상기 예측 파리미터(ak)에 따라 바람직한 여기펄스에 대한 여기프로세서로부터 얻어진 예측잔여(dk)와 파라미터(Ai, mi)를 여과시키는 여기 프로세서(120)에 적용되고, 제 2 방법에 따라, 음성프레임이 다수의 위상위치(nf)로 분할되고 각각의 위상위치는 다수의 위상(n)으로 분할되고 제한은 여기펄스를 배치할 때 점유된 위상이 각각의 다음의 여기펄스에 그리고 음성프레임내의 각각의 위상위치(nf)에 금지되는 효과에 끼워지는 음성프레임내의 위치를 결정하는 방법에 있어서,
    a) 제 1 방법에 따라 다수의 산출단계(j)에서 여기펄스의 위치를 산출하는 단계;
    b) 제 2 방법에 따라 다수의 산출단계(N1, N2,...,NL)에서 여기펄스의 위치를 산출하되 각각의 단계는 제 1 단계에 따라 산출된 다수의 위치(mi, mk, mr)중 하나로 부터의 개시점을 지니어 다수의 펄스배치(L)중 하나를 얻는 단계;
    c) 소정의 음성품질에 대한 산출의 복잡성을 얻기위해 제 1 및 제 2 방법에 따라 산출단계(j 및 max[N1, N2])수 사이의 비를 선택하는 단계를 구비한 것을 특징으로 하는 음성프레임내의 위치를 결정하는 방법.
  2. 음성프레임으로 분할된 음성신호가 분석되고 상기 예측 파라미터(ak)에 따라 바람직한 여기펄스중 하나에 대해 여기프로세서로부터 얻어진 예측잔여(dk)와 파라미터(Ai, mi)를 여과하는 예측잔여(dk) 및 다수의 예측 파라미터(ak)를 형성하기 위해 합성(110)되고 음성프레임은 다수의 위상위치(nf)로 분할되고 각각의 위상위치는 다수의 위상(n)으로 분할되고 제한은 음성프레임내의 다음 여기펄스와 각각의 위상위치 로케이션(nf)에 대한 위상펄스를 위치할 때 점유된 위상을 금지하게 끼워지는 선형예측 음성엔코더에서의 여기펄스의 소정의 수(N=j+N1, N2)의 음성프레임내의 위치를 결정하는 방법에 있어서,
    a) 소정의 음성프레임에 대해 여기펄스의 배치를 실행할 때 이미 점유된 위상위치가 다음 여기펄스에 금지되는 제한을 적용하지 않고 소정의 규정(max, [a(i)*a(i)/C(i, j)])을 만족하는 다수의 펄스위치(mp, p=1,...,j)를 결정하는 단계;
    b) a)에 따라 상기 다수의 펄스위치를 산출한 후, a)에 따라 산출된 제 1 펄스위치(m1)에 대한 개시위치에 의해 제 1의 또 다른 펄스위치(mp, p=1,..., i)를 결정하는 단계;
    c) b)에 따른 단계를 되풀이하지만 a)에서 산출된 제 2 펄스위치(m2)로부터의 개시위치와 제 2의 다수의 펄스위치(mp, p=1,..., k)을 지닌 단계;
    d) 단계 b) 및 c)에 따라 얻어진 펄스위치 배치중 어느 것이 상기 규정을 최상으로 만족하는지를 산출하고 여기펄스의 최상의 배치에 대한 위치를 선택하는 단계를 구비한 것을 특징으로 하는 음성프레임내의 위치를 결정하는 방법.
  3. 청구항 2에 있어서, 제 1 펄스위치(m1)는 제 1의 산출된 펄스이고 제 2 펄스위치는 제한없이 산출된 다음 산출된 펄스위치인 것을 특징으로 하는 음성프레임내의 위치를 결정하는 방법.
  4. 청구항 2에 있어서, 단계 c)후 하나 이상의 또다른 단계 c1), c2),..를 더 수행하고 각각의 다음 단계는 제 2 및 제 4 펄스위치(mr)로부터 개시되는 것을 특징으로 하는 음성프레임내의 위치를 결정하는 방법.
  5. 청구항 2 내지 4항중 어느 한 항에 있어서, 제 1 방법에 따라 산출된 펄스위치의 수는 상기 제 2 방법에 따라 산출된 펄스위치의 최종수보다 작은 것을 특징으로 하는 음성프레임내의 위치를 결정하는 방법.
  6. 음성프레임으로 분할된 음성신호가 분석되고 분석된 음성신호가 예측 파라미터(ak)에 따라 각각의 바람직한 여기펄스에 대해 여기 프로세서로부터 얻어진 예측잔여(dk)와 파라미터(Ai, mi)를 여과하는 여기프로세서(120)에 적용된 예측잔여(dk)와 다수의 예측 파라미터(ak)를 형성하기 위해 합성(110)되고 음성프레임이 다수의 서브블록(nf)으로 분할되고 각각의 위상위치는 다수의 위상(n)으로 분할되고 여기펄스를 배치할 때 점유된 위상을 음성 프레임내의 각각의 다음의 여기펄스 및 각각의 위상위치(nf)에 대한 여기펄스를 금지하게 제한이 끼워질 수 있는 선형예측 음성 디코더에서의 여기펄스의 소정의 수(N=j+N1, N2)에 대한 음성프레임내의 위치를 결정하는 방법에 있어서,
    a) 이미 점유된 사이 다음 여기펄스에 금지된 제한을 적용하지 않고 규정(max. [a(i)*a(i)/C(i, j)을 만족하는 소정의 음성프레임에 대한 다수의 펄스위치(m1, m2,...mj)중 어느 하나를 결정하는 단계;
    b) 제한없이 산출된 소정의 수의 상기 펄스위치(m1, m2,...,mj) 주위에 시간간격(S1, S2,...)의 형태의 검색영역을 형성하고 각각의 검색간격은 연속된 검색을 위해 허여되는 단계;
    c) 제한없이 a)에 따라 산출된 관련된 개시펄스(mi)로부터의 개시점을 지닌 b)단계에 따른 제한이 있는 다수의 펄스배치를 형성화되, 상기 검색영역내의 개시펄스의 위치로부터 편이된 위치와의 펄스배치의 결합을 얻기 위해 하나 이상의 펄스가 개시펄스의 위치로부터 하나 이상의 위치에 시프트되는 단계;
    d) n=nf, F+f의 식을 토대로 c)에 따라 산출된 펄스배치를 선택하되, n은 프레임내의 소정의 펄스위치이고 nf는 음성프레임의 소정의 서브블록에 대한 서수이고 f는 서브블록내의 전체의 F위상중 하나의 위상이고 f는 펄스배치의 상기 결합의 위치와 같은 값을 취하지 않는 단계;
    e) 상기 규정을 최상으로 만족하는 단계 c) 및 d)에 따라 얻어진 펄스위치의 배치를 선택하는 단계를 구성하는 것을 특징으로 하는 음성프레임내의 위치를 결정하는 방법.
KR1019970707268A 1995-04-12 1996-04-10 음성프레임내의 여기펄스위치를 결정하는 방법 KR19980703868A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
SE9501368-6 1995-04-12
SE9501368A SE508788C2 (sv) 1995-04-12 1995-04-12 Förfarande att bestämma positionerna inom en talram för excitationspulser

Publications (1)

Publication Number Publication Date
KR19980703868A true KR19980703868A (ko) 1998-12-05

Family

ID=20397946

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019970707268A KR19980703868A (ko) 1995-04-12 1996-04-10 음성프레임내의 여기펄스위치를 결정하는 방법

Country Status (8)

Country Link
US (2) US6064956A (ko)
EP (2) EP0821824B1 (ko)
KR (1) KR19980703868A (ko)
CN (2) CN1199152C (ko)
AU (2) AU703575B2 (ko)
DE (2) DE69614101T2 (ko)
SE (1) SE508788C2 (ko)
WO (2) WO1996032713A1 (ko)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser
JP3166697B2 (ja) * 1998-01-14 2001-05-14 日本電気株式会社 音声符号化・復号装置及びシステム
JP3199020B2 (ja) * 1998-02-27 2001-08-13 日本電気株式会社 音声音楽信号の符号化装置および復号装置
US7206739B2 (en) * 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
US7167476B1 (en) * 2002-04-12 2007-01-23 Juniper Networks, Inc. Systems and methods for routing data in a network device
US8036886B2 (en) * 2006-12-22 2011-10-11 Digital Voice Systems, Inc. Estimation of pulsed speech model parameters
US8688437B2 (en) 2006-12-26 2014-04-01 Huawei Technologies Co., Ltd. Packet loss concealment for speech coding
CN101286321B (zh) * 2006-12-26 2013-01-09 华为技术有限公司 双脉冲激励的线性测编码
US11270714B2 (en) 2020-01-08 2022-03-08 Digital Voice Systems, Inc. Speech coding using time-varying interpolation
US11990144B2 (en) 2021-07-28 2024-05-21 Digital Voice Systems, Inc. Reducing perceived effects of non-voice data in digital speech

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3624302A (en) * 1969-10-29 1971-11-30 Bell Telephone Labor Inc Speech analysis and synthesis by the use of the linear prediction of a speech wave
US3740476A (en) * 1971-07-09 1973-06-19 Bell Telephone Labor Inc Speech signal pitch detector using prediction error data
US4472832A (en) * 1981-12-01 1984-09-18 At&T Bell Laboratories Digital speech coder
NL8302985A (nl) * 1983-08-26 1985-03-18 Philips Nv Multipulse excitatie lineair predictieve spraakcodeerder.
US4701954A (en) * 1984-03-16 1987-10-20 American Telephone And Telegraph Company, At&T Bell Laboratories Multipulse LPC speech processing arrangement
NL8500843A (nl) * 1985-03-22 1986-10-16 Koninkl Philips Electronics Nv Multipuls-excitatie lineair-predictieve spraakcoder.
US4944013A (en) * 1985-04-03 1990-07-24 British Telecommunications Public Limited Company Multi-pulse speech coder
JPH0782359B2 (ja) * 1989-04-21 1995-09-06 三菱電機株式会社 音声符号化装置、音声復号化装置及び音声符号化・復号化装置
SE463691B (sv) * 1989-05-11 1991-01-07 Ericsson Telefon Ab L M Foerfarande att utplacera excitationspulser foer en lineaerprediktiv kodare (lpc) som arbetar enligt multipulsprincipen
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
JP2746039B2 (ja) * 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JP2970407B2 (ja) * 1994-06-21 1999-11-02 日本電気株式会社 音声の励振信号符号化装置
SE508788C2 (sv) * 1995-04-12 1998-11-02 Ericsson Telefon Ab L M Förfarande att bestämma positionerna inom en talram för excitationspulser

Also Published As

Publication number Publication date
US5937376A (en) 1999-08-10
AU5352096A (en) 1996-10-30
EP0820627A1 (en) 1998-01-28
EP0820627B1 (en) 2001-07-25
US6064956A (en) 2000-05-16
CN1186561A (zh) 1998-07-01
DE69614101T2 (de) 2002-03-14
DE69614101D1 (de) 2001-08-30
WO1996032712A1 (en) 1996-10-17
AU703575B2 (en) 1999-03-25
DE69617414T2 (de) 2002-08-01
EP0821824A1 (en) 1998-02-04
SE508788C2 (sv) 1998-11-02
CN1186560A (zh) 1998-07-01
WO1996032713A1 (en) 1996-10-17
EP0821824B1 (en) 2001-11-28
DE69617414D1 (de) 2002-01-10
AU5352196A (en) 1996-10-30
SE9501368D0 (sv) 1995-04-12
AU706038B2 (en) 1999-06-10
CN1199152C (zh) 2005-04-27
SE9501368L (sv) 1996-11-29

Similar Documents

Publication Publication Date Title
KR0127901B1 (ko) 음성 인코딩 장치 및 그 방법
US5193140A (en) Excitation pulse positioning method in a linear predictive speech coder
KR100368897B1 (ko) 분석합성선형예측음성부호기
US5073940A (en) Method for protecting multi-pulse coders from fading and random pattern bit errors
US7146311B1 (en) CELP encoding/decoding method and apparatus
KR950013372B1 (ko) 음성 부호화 장치와 그 방법
KR19980703868A (ko) 음성프레임내의 여기펄스위치를 결정하는 방법
EP0488803B1 (en) Signal encoding device
US7302387B2 (en) Modification of fixed codebook search in G.729 Annex E audio coding
Ostrowski et al. Genetic annealing search for index assignment in vector quantization
SA90110060B1 (ar) طريقة تنظيم نبضات الاستثارة excitation pulses في جهاز ترميز(كود)كلام تنبؤي خطي linear predictive (LPC) coder

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
NORF Unpaid initial registration fee