KR100323487B1 - 버스트여기선형예측 - Google Patents

버스트여기선형예측 Download PDF

Info

Publication number
KR100323487B1
KR100323487B1 KR1019960704137A KR19960704137A KR100323487B1 KR 100323487 B1 KR100323487 B1 KR 100323487B1 KR 1019960704137 A KR1019960704137 A KR 1019960704137A KR 19960704137 A KR19960704137 A KR 19960704137A KR 100323487 B1 KR100323487 B1 KR 100323487B1
Authority
KR
South Korea
Prior art keywords
burst
waveform
candidate
gain
residual
Prior art date
Application number
KR1019960704137A
Other languages
English (en)
Other versions
KR970700902A (ko
Inventor
윌리엄 알. 가드너
Original Assignee
러셀 비. 밀러
콸콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 러셀 비. 밀러, 콸콤 인코포레이티드 filed Critical 러셀 비. 밀러
Publication of KR970700902A publication Critical patent/KR970700902A/ko
Application granted granted Critical
Publication of KR100323487B1 publication Critical patent/KR100323487B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Luminescent Compositions (AREA)
  • Valve-Gear Or Valve Arrangements (AREA)
  • Valve Device For Special Equipments (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Control Of Eletrric Generators (AREA)
  • Stabilization Of Oscillater, Synchronisation, Frequency Synthesizers (AREA)
  • Control Of Motors That Do Not Use Commutators (AREA)
  • Semiconductor Lasers (AREA)
  • Amplifiers (AREA)
  • Pyrane Compounds (AREA)
  • Investigation Of Foundation Soil And Reinforcement Of Foundation Soil By Compacting Or Drainage (AREA)
  • Steroid Compounds (AREA)
  • Devices Affording Protection Of Roads Or Walls For Sound Insulation (AREA)
  • Transmission And Conversion Of Sensor Element Output (AREA)
  • Character Spaces And Line Spaces In Printers (AREA)

Abstract

본 발명은 버스트 특성인 신호를 엔코딩하기 위한 새롭고 개선된 장치에 관한 것이다. 코드 여기 선형 예측 알고리즘에서, 짧은 기간 여분 및 긴 기간 여분은 디지탈 샘플 스피치로부터 제거되고, 버스트 특성인 잔여 신호는 인코딩되어야 한다. 잔여 신호는 버스트 형태 코드북의 버스트 형태에 상응하는 버스트 형태 인덱스, 버스트 이득, 버스트 위치의 3가지 파라미터를 사용하여 인코딩된다. 또한 상기 3가지 파라미터는 잔여 신호를 매칭하기 위한 파형을 나타낸다. 추가로 기술된 것은 잔여 파형에 최고의 매칭을 찾는 폐 루프 철저한 검색 방법 및 상기 버스트 위치가 잔여 파형의 개방 루프 분석에 의해 결정되고, 버스트 형태 및 이득 파라미터는 폐 루프 형태로 결정되는 부분 개방 루프 방법이다. 또한 코드북 수가 상기 코드 북의 다른 수의 선형 결합이 되도록 만들어진 반복 버스트 코드북 및 코드북을 포함하며 검색 알고리즘의 계산 복잡성을 줄일 수 있는 버스트 벡터 코드북을 제공하는 방법이 기술된다.

Description

버스트 여기 선형 예측
본 발명은 음성 처리에 관한 것이다, 특히 본 발명은 버스트 여기 벡터를 사용하여 선형 예측 스피치 코딩을 수행하는 새롭고 개선된 방법 및 장치에 관한 것이다.
디지탈 기술에 의한 음성 전송은 특히 먼 거리 및 디지탈 무선 전화 응용에서 널리 이용되었다. 이것은 차례로 재구성된 음성의 높은 품질을 유지하면서 전송 채널을 통하여 전송되는 정보량을 최소화하는 결정 방법에서 이익이 생겼다. 만약 음성이 단순히 샘플링 또는 디지탈화에 의해서만 전송된다면, 통상적인 아날로그 전화 음성 품질을 유지하는데는 단위 초당 64 킬로바이트의 근처의 데이터 레이트가 요구된다. 그러나 적절한 코딩, 전송, 수신기에서 재 합성 등의 음성 분석을 이용하여, 데이터 레이트의 상당한 감소가 이루어질 수 있다.
사람 음성 발생 모델과 관련된 파라미터를 추출함으로서 음성을 압축하는 기술을 사용하는 장치를 보코드라 한다. 그러한 장치는 엔코드 및 디코드로 구성되는데, 상기 엔코드는 관련된 파라미터를 추출하기 위하여 들어오는 음성을 분석하고, 상기 디코드는 전송 채널을 통하여 수신되는 파라미터를 사용하여 음성을 재 합성한다. 모델은 시간에 따라 변하는 음성 신호를 정확하게 모델링 하기 위하여 일정하게 변한다. 그래서 음성은 파라미터가 계산되는 동안에 시간 블록 또는 분석 프레임으로 나눠진다. 그러면 파라미터는 각 새로운 프레임으로 갱신된다.
음성 코더의 다양한 분류중에서, 코드 여기 신형 예측 코딩(CELP), 확률적 코딩, 또는 벡터 여기 음성 코팅 코드는 동일 종류이다. 이러한 특정 분류의 코딩 알고리즘의 예는 토마스 E. 트리메인 등의 이동 위성 회의처리에서 논문 명칭 "4.8kbps 코드 여기 선형 예측 코드"에 기술되어 있다. 유사하게, 이런 형태의 다른 보코드의 예는 본 발명의 양수인에게 양도된 "가변 레이트 보코드"의 명칭으로 1993, 1, 14에 제출된 공동 계류 중인 특허 출원 제 08/004, 484호 및 "낮은 비트 레이트에서 음성을 코딩하기 위한 방법"의 명칭으로 미국 특허 제 4, 797, 925호에 상세히 기술되어 있다. 상기 전술한 특허 출원 및 상기 전술한 미국 특허의 내용은 본 명세서에 참조로 삽입된다.
상기 보코드의 기능은 음성의 고유 특성 여분 모두를 제거함으로서 디지탈화된 음성 신호를 낮은 비트 신호로 압축하는 것이다. 음성은 전형적으로 음성 트랙의 필터링 작용으로 짧은 기간 여분을 갖고, 음성 코드에 의해 음성 트랙의 여기로 인하여 긴 기간 여분을 갖는다. CELP 코드에서, 이러한 작동은 2개의 필터 즉, 짧은 기간 포르만트(formant)(LPC) 필터 및 긴기간 피치 필터에 의해 모델 된다. 이러한 여분이 제거되면, 그 결과 잔여 신호는 화이트(white) 가우시안 노이즈로 모델될 수 있고, 또한 엔코드되어야 한다.
주어진 음성 프레임에 대한 코딩 파라미터를 결정하는 과정은 아래와 같다. 첫째, LPC 필터의 파라미터는 스피치(speech)의 음성 트랙 필터링에 의하여 짧은 기간 여분을 제거하는 필터 계수를 찾음으로서 결정된다. 둘째로, 피치 필터의 파라미터는 스피치의 음성 코드로 인하여 긴 기간 여분을 제거하는 필터 계수를 찾음으로서 결정된다. 마지막으로, 코드북의 다수의 임의 여기 파형을 갖는 피치 및 LPC 필터를 구동하고, 상기 2개 필터의 출력이 원래 음성에 가장 근접하도록 하는 특정 여기 파형을 선택함으로서 디코트에서 피치 및 LPC 필터로 입력되는 여기 신호가 선택된다. 그래서 이러한 전송된 파라미터는 (1) LPC 필터, (2) 피치 필터, 및 (3) 코드북 여기의 3가지 항목과 관련되어 있다.
CELP 코드의 쇼트 컴잉(shortcomming)의 하나는 임의 여기 벡터의 사용이다. 임의 여기 벡터의 사용은 짧은 기간 및 긴 기간 여분이 스피치 신호로부터 제거된 후에 남아 있는 이상적인 여기 파형의 성질과 같은 버스트를 고려하지 않게 된다. 구성되지 않는 임의 벡터는 잔여 여기 신호와 유사한 버스트를 에코딩 하도록 특별히 적절하지 않고, 잔여 여기 신호를 코딩하는 비효율적인 방법이 야기된다. 그래서, 보다 낮은 에코드된 데이터 레이트에서 보다 높은 품질의 스피치가 발생하는 잔여 여기 신호의 성질과 유사한 버스트와 협동하는 타겟 신호를 코딩하는 개선된 방법에 대한 필요성이 있다.
본 발명은 그러한 신호의 성질과 유사한 버스트를 고려한 잔여 여기 신호를 엔코딩하는 새롭고 개선된 방법 및 장치이다. 본 발명은 임의의 여기 벡터로 전체 여기 신호를 엔코딩하기 하기보다는 버스트 여기 벡터로 여기 신호의 큰 에너지의 버스트를 엔코딩하는 것이다. 지원자(candidate) 버스트 파형은 버스트 형태, 버스트 이득, 버스트 위치를 특징으로 한다. 이러한 세트의 3가지 버스트 파라미터는 여기 파형을 결정하고, 그것은 필터 쌍의 출력이 타겟 스피치 신호에 거의 근접하도록 LPC 및 피치 필터를 구동하는데 사용된다.
본 명세서에 추가로 기술된 것은 타겟 스피치 신호에 개선된 근접을 만들어 내는 한 세트 이상의 버스트 파라미터를 제공하는 방법 및 장치이다. 바람직한 기술에서, 하나의 버스트에 상응하는 한 세트의 버스트 파라미터가 발견되고, 상기 파라미터는 필터된 버스트 파형과 타겟 스피치 파형 사이의 최소 차이를 야기한다. LPC 및 피치 필터 쌍에 의해 이러한 버스트를 필터함으로서 제조된 파형은 타겟 신호로부터 감산되고, 제 2세트의 버스트 파라미터에 대하여 연속적인 검색은 새롭고, 갱신된 타겟 신호를 사용하여 유도된다. 최초 공정은 타겟 파형과 매칭하기 위하여 반복되고 요구된다.
폐 루즈 형태의 버스트 여기 검색을 수행하는 제 1방법 및 장치가 제공된다. 즉 타겟 신호가 공지되었을 때, 필터된 버스트 여기와 타겟 신호 사이에서 최고의 매칭이 야기되는 형태, 이득 및 위치를 선택함으로서 결정된 최적의 결합으로서 모든 버스 형태, 버스트 이득 및 버스트 위치의 철저한 검색이 유도된다. 선택적으로, 계산 수는 단지 어떤 3가지 파라미터의 부 세트를 통하여 부분 최적 검색을 유도함으로서 줄일 수 있다.
또한 부분적인 개방 루프 방법은 검색되는 파라미터 수가 잔여 여기 신호를 분석하고, 최대 에너지 위치를 확인하고, 여기 버스트 위치로서 이런 위치들을 이용함으로서 크게 줄일 수 있다. 하나의 멀티플 버스트 부분 개방 루프 수행에서, 단일 위치는 상기 언급된 바로서 확인되고, 버스트 이득 및 형태가 주어진 버스트 위치로 확인되고, 필터된 버스트 신호는 타겟 신호로부터 감산되고, 남아 있는 타겟 신호와 상응하는 잔여 여기 신호는 연속적인 버스트 위치를 찾기 위해 다시 분석된다. 다른 멀티플 버스트 부분 개방 루프 수행에서, 다수의 버스트 위치는 잔여 여기 파형을 분석함으로서 확인되고, 그러면 버스트 이득 및 형태는 상기 언급한 제 1방법의 버스트 위치로 결정된다.
마지막으로, 검색 알고리즘의 계산 복잡성 및 저장 요구를 줄이는 일련의 방법이 기술된다. 제 1방법은 각 연속하는 버스트 형태가 이전 형태 시퀀스의 초기로부터 하나 이상 엘리먼트를 제거하고 그리고 이전 형태 시퀀스의 단부에 하나 이상 엘리먼트를 부가함으로서 전임자(predecessor)로 유도될 수 있는 반복적인 버스트 세트를 제공하는 것이다. 다른 방법은 각 연속하는 버스트 형태가 이전의 버스트의 선형 결합을 사용함으로서 형성되는 버스트 세트를 제공하는 것이다.
본 발명의 특징, 목적, 장점은 참조 문자가 전체 도면에서 동일한 도면을 참조로 아래의 상세한 기술로부터 명백해질 것이다.
제 1a 내지 c도는 한 세트의 3가지 파형을 나타내고, 제 1a도는 코드되지 않은 스피치이고, 제 1b도는 제거된 짧은 기간 여분을 갖는 스피치이고, 제 1c도는 이상적인 잔여 여기 파형으로 알려진 제거된 짧은 기간 및 긴 기간 스피치 여분을 나타내는 도면;
제 2도는 폐 루프 검색 메카니즘을 나타내는 블랙도;
제 3도는 부분 개방 루프 검색 메카니즘을 나타내는 블랙도.
제 1a 내지 c도는 3가지 파형을 나타내는데 수평 축 상에 시간 및 수직축 상에 진폭을 표시한다. 제 1a도는 코드되지 않는 스피치 신호 파형의 전형적인 예를 나타낸다. 제 1b도는 제 1a도와 동일한 스피치 신호로서 포르만트(formant)(LPC)예측 필터에 의하여 제거된 짧은 기간 여분을 나타낸다. 스피치의 짧은 기간 여분은 전형적으로 음성 프레임에 대하여 한 세트의 자기 상관관계 계수를 계산함으로서 그리고 상기 자기 상관 관계 계수로부터 선형 기술에서 공지된 기술에 의해 한 세트의 선형 예측 코딩(LPC) 계수를 결정한다. LPC 계수는 Rabiner & Schafer, Prentice-Hall, Inc, 1978의 스피치 신호의 디지탈 처리에서 기술된 듀빈(Durbin)의 반복을 사용하는 자기 상관 관계 방법에 의해 얻을 수 있다. LPC 필터의 탭 (Tap) 값을 결정하는 방법은 전술한 특허 출원 및 특허에서 기술된다. 이 LPC 계수는 포르만트(LPC) 필터에 대한 한 세트의 탭 값을 결정한다.
제 1c도는 제 1a도와 동일한 스피치 샘플을 나타내나, 짧은 기간 및 긴 기간 일시 여분이 제거될 것이다. 상기 언급한 대로 짧은 기간 여분이 제거되고, 그러면 잔여 스피치가 스피치의 긴 기간 일시 여분을 제거하기 위하여 피치 예측 필터에 의해 필터 되고, 상기 수행은 선행 기술에 잘 공지되어 있다. 긴 기간 여분은 현재 스피치 프레임을 이전의 코드된 스피치 내력(history)과 비교함으로서 제거된다. 코드는 이전의 코드된 여기 신호로부터 한 세트의 샘플을 확인하고, 상기 여기 신호는 LPC 필터에 의해 필터될 때 현재 스피치 신호와 최고로 매치된다. 이러한 샘플 세트는 피치 래그에 의해 나타나고, 최고 매치와 피치 이득을 만드는 여기 신호를 찾기 위하여 시간을 고려하여 샘플의 수를 나타내고, 그것은 샘플의 세트에 인가하기 위한 곱셈 요소이다. 피치 필터의 수행은 전술한 특허 출원 및 특허에 기술된다.
잔여 여기 파형으로 언급되는 결과 파형의 전형적인 예는 제 1c도에 기술되어 있다. 잔여 여기 파형의 큰 에너지 성분은 제 1c도에 기술된 화살표(1, 2, 3)에 의해 표시된 버스트에서 발생된다. 타겟 파형의 모델링은 벡터 코드 북의 임의 벡터에 전체 잔여 여기 파형을 매칭함으로서 이전의 작업에서 수행될 수 있다. 본 발명에서, 상기 코드는 다수의 버스트 벡터로 잔여 여기 파형을 매치하고, 그래서 잔여 여기 파형의 큰 에너지 세그먼트에 더 가까이 근접한다.
제 2도는 본 발명의 바람직한 수행을 나타낸다. 제 2도에 도시된 바람직한 수행에서, 최적의 버스트 형태(B), 버스트 이득(G), 버스트 위치(I)의 검색은 폐 루프 형태로 결정된다.
입력 스피치 프레임 s(n)는 합산 엘리먼트(2)의 합산 입력에 제공된다. 바람직한 수행에서 각 스피치 프레임은 40 스피치 샘플로 구성된다. 이전의 피치 검색 작동에서 결정된 최적 피리 래그(L*) 및 피치 이득(b*)은 피치 합성 필터(4)에 제공된다. 최적 피치 래그(L*) 및 피치 이득(b*)에 따라서 제공된 피치 합성 필터(4)의 출력은 LPC 필터(6)에 제공된다.
이전에 계산된 LPC 계수는 포르만트(LPC) 합성 필터(6), 감지 가중 필터(8), 메모리가 없는 포르만트 (LPC) 합성 필터(12)에 제공된다. 필터(6, 8, 12)의 탭 값은 LPC 계수에 따라서 결정된다. 포르만트(LPC) 합성 필터(6)의 출력은 합산 엘리먼트(2)의 감산 입력에 제공된다. 합산 엘리먼트에서 계산된 에러 신호는 감지 가중 필터(8)에 제공된다. 감지 가중 필터(8)는 필터는 신호를 필터하고, 출력, 타겟 신호, x(n)를 합산 엘리먼트(18)의 합산 입력에 제공한다.
엘리먼트(9)는 후보 파형을 합산 엘리먼트(18)의 감산 입력에 제공한다. 각 후보 파형은 버스트 형태 인덱스 값(i), 버스트 이득(G), 버스트 위치(I)에 의해 확인된다. 바람직한 수행에서, 각 후보 파형은 40 샘플로 구성된다. 버스트 엘리먼트(10)는 버스트 형태 인덱스 값(i)을 구비하고, 인덱스 값에 응답하여 버스트 엘리먼트(10)는 소정된 샘플 수의 버스트 벡터(Bi)에 제공한다. 바람직한 실행에서 각 버스트 벡터는 9개의 샘플이다. 각 버스트 벡터는 LPC 계수에 따라서 입력 버스트 벡터를 필터하는 메모리 없는 포르만트(LPC) 합성 필터(12)에 제공된다. 메모리 없는 포르만트 합성 필터(12)의 출력은 멀티플라이어(14)의 하나의 입력에 제공된다.
멀티플라이어(14)의 제 2입력은 버스트 이득 값(G)이다. 바람직한 실행에서, 16개의 다른 이득 값이 있다. 이득 값은 소정된 세트의 값 또는 과거 및 현재 입력 스피치 프레임의 특징으로부터 적절히 결정될 수 있다. 각 버스트 벡터에 대해, 모든 이득 값(G)은 최적 이득 값, 또는 (I, I)의 특정 값에 대하여 적절히 수량화되지 않는 이득 값은 선행 기술에 공지된 방법 즉 검색후 16개의 다른 이득 값에 수량화된 G의 선택된 값을 사용하여 결정될 수 있다. 멀티플라이어(14)로부터 산출 값은 가변 딜레이 엘리먼트(16)에 제공된다.
가변 딜레이 엘리먼트(16)는 버스트 위치 값(I)을 수신하고 및 (I)의 값에 따라서 후보 파형 형태 내에 버스트 벡터를 배치한다. 만약 후보 파형 프레임이 L 샘플로 구성되어 있다면, 그러면 테스트되는 최대 배치 수는 다음과 같다.
가능한 배치 수 = L-버스트 _길이 + 1 (1)
버스트_길이는 샘플의 버스트 기간이다(바람직한 실시예에서 버스트_길이 = 9). 다른 실시예에서, 가능한 버스트 위치의 부세트 수는 결과 데이터 레이트를 줄일 수 있게 선택될 수 있다. 예를들면 버스트가 모든 다른 샘플 위치에서 시작할 수 있게 한다. 버스트 위치의 부세트 테스팅은 복잡성을 줄일 것이고, 어떤 경우에서 스피치 품질을 줄일 수 있는 부분 최적 코딩을 야기할 것이다.
후보 파형 Wi, G, I(n)은 합산 엘리먼트(18)의 감산 입력에 제공된다. 타겟 파형과 후보 파형 사이의 차이는 에너지 계산 엘리먼트(20)에 제공된다. 에너지 계산 엘리먼트(20)는 아래의 공식(2)에 따라서 가중 에러 벡터의 수의 자승을 합산한다.
모든 후보 파형에 대하여 계산된 에너지 값은 최소 엘리먼트(22)에 제공된다. 최소 엘리먼트(22)는 멀리서 발견되는 최소 에너지 값을 현재 에너지 값과 비교한다. 만약 최소 엘리먼트(22)에 제공된 에너지 값은 현재 최소 값보다 적다면, 현재 에너지 값은 최소 엘리먼트(22)에 저장되고 현재 버스트 형태, 버스트 이득, 버스트 위치 값이 또한 저장된다. 모든 허락 가능한 버스트 형태, 버스트 위치, 버스트 배치가 검색된 후에, 최고 매치 후보 B*, G*및 I*는 최소 엘리먼트(22)에 의해 제공된다.
타겟 벡터의 보다 나은 매칭을 위해, 후보 파형은 하나 이상의 버스트로 구성될 수 있다. 멀티플 버스트 후보 파형의 경우에서, 제 1검색은 유도되고 최고 매칭 파형이 확인된다. 최고 매칭 파형은 타겟 신호로부터 감산되고 부가적인 검색이 유도된다. 이러한 처리는 요구된 많은 버스트 만큼 반복될 수 있다. 어떤 경우에 이전에 선택된 버스트 위치가 한번 이상 선택되지 않도록 버스트 위치 검색을 제한하는 것이 바람직하다. 노이즈와 유사한 버스트는 임의의 노이즈보다 여러 가지 가청 특성을 갖는 것을 주목해야 한다. 서로로부터 분리되게 버스트를 제한함으로서, 결과 여기 신호는 임의의 노이즈에 보다 가깝고, 어떤 환경에서 더 자연스럽게 받아들일 수 있다.
검색 작동의 계산 복잡성을 줄이기 위하여, 제 2 부분 개방 루프 검색이 유도될 수 있다. 부분적으로 개방 검색이 유도되는 장치가 제 3도에 도시되어 있다. 이런 방법으로, 버스트의 위치는 개방 루프 기술을 사용하여 결정되고, 연속적으로 버스트 형태 및 이득이 이전에 언급된 폐 루프 형태에서 결정된다.
제 2도에서 기술된 폐 루프 검색의 작동에서와 같이, 입력 스피치 프레임 s(n)는 합산 엘리먼트(30)의 합산 입력에 제공된다. 피치 검색 작동에서 결정된 최적 피치 레그(L*) 및 피치 이득(b*)은 피치 합성 필터(32)에 제공된다. 최적 피치 레그(L*) 및 피치 이득(b*)에 따라서 제공된 피치 합성 필터(32)의 출력은 포맷 (LPC) 합성 필터(34)에 제공된다.
이전에 계산된 LPC 계수(ai)는 포르만트(LPC) 합성 필터(34), 모든 제로 감지 가중 필터(36), 모든 극성 감지 가중 필터(37) 및 메모리 없는 가중 LPC 필터(42)에 제공된다. 바람직한 실시예에서, 제 2도에 기술된 감지 가중 필터는 2개의 분리 필터; 모든 제로 필터(36) 및 모든 극성 필터(37)로 분해될 수 있다. 필터(32, 36, 37, 42)의 탭 값은 LPC 계수에 따라서 결정된다.
포르만트(LPC) 합성 필터(34)의 출력은 합산 엘리먼트(30)의 감산 입력에 제공된다. 합산 엘리먼트(30)에서 계산된 에러 신호는 모든 제로 감지 가중 필터(36)에 제공된다. 모든-제로 감지 가중 필터(36)는 신호를 필터하고, 출력 r(n)를 모든 극성 감지 가중 필터(37)의 입력에 제공한다. 모든 극성 감지 가중 필터(37)는 타겟 신호 x(n)를 합산 엘리먼트(46)의 합산 입력에 출력한다.
모든 제로 감지 가중 필터(36) r(n)의 출력은 또한 피크 검출기(54)에 제공되고, 그것은 신호를 분석하고 신호의 가장 큰 에너지 버스트의 위치를 확인한다. 버스트 위치(I)를 찾는 공식은 아래와 같다.
이런 방법으로 검색의 부분을 수행함으로서, 페 루프에서 검색되어야하는 파라미터의 전체 수는 1/I에 의해 감소된다.
버스트 형태(i), 버스트 이득(G)에 대한 검색은 앞서 언급한 폐 형태로 유도된다. 버스트 엘리먼트(38)는 버스트 인덱스 값(i)을 구비하고, 인덱스 값에 응답하여 버스트 엘리먼트(38)는 버스트 벡터(Bi)를 제공된다. Bi는 LPC 계수에 따라서 입력 버스트 벡터를 필터 하는 메모리 없는 가중 LPC 필터(42)에 제공된다. 메모리 없는 가중된 LPC 필터(42)의 출력은 멀티플라이어(44)의 한 입력에 제공된다.
멀티플(44)의 제 2입력은 버스트 이득 값(G)이다. 멀티플라이어(44)의 출력은 버스트 위치 엘리먼트(46)에 제공되고, 버스트 위치 값(I)에 따라서, 후보 프레임 내에 버스트를 위치시킨다. 후보 파형은 합산 엘리먼트(48)의 타겟 신호로부터 감산된다. 상기 차이는 앞서 언급한 대로 에러 신호의 에너지를 계산하는 에너지 계산 엘리먼트(50)에 제공된다. 계산된 에너지 값은 최소 엘리먼트(52)에 제공되고, 상기 언급한 대로 최소 에러 에너지를 검출하고 확인 파라미터B*, G*및 I을 제공한다.
멀티플 버스트 부분 개방 루프 검색은 제 1최고 매치 파형을 확인함으로서 이루어질 수 있고, 모든 제로 감지 가중 필터(36)의 출력으로부터 필터되지 않는 최고 매치 파형을 감산하고, 앞서 언급한 대로 최대 에너지를 가진 새롭고 갱신된 r(n)의 위치를 찾음으로서 다음 버스트의 위치를 결정한다. 연속적인 버스트의 위치를 결정한 후에, 필터된 제 1 최고 매칭 파형이 타겟 벡터 x(n)으로부터 감산되고, 최소화 검색은 결과 파형으로 유도된다. 이러한 처리는 요구된 것만큼 반복될 수 있다. 앞서 계산된 이유로 서로 다르게 버스트 위치를 제한하는 것이 바람직하다. 버스트 위치가 다르다는 것을 보장하는 유일한 수단은 r(n)을 연속적인 버스트 검색이 유도되기 전에 버스트가 감산되는 영역에서 제로로 대치하는 것이다.
버스트 엘리먼트(10, 38)를 필터(12, 42)에 응답하여 필터의 계산에 필요한 반복 계산의 복잡성을 줄일 수 있다. 예를들면 버스트 값은 각 연속하는 버스트 형태는 이전의 시퀀스의 초기로부터 하나 이상 엘리먼트를 제거하고 이전의 엘리먼트 단부에서 하나 이상의 엘리먼트를 부가함으로서 선임자로부터 유도되는 반복적인버스트 세트로서 저장될 수 있다. 다른 전략에서, 버스트는 다른 방법으로 상호 관련이 있다. 예를들면 버스트의 1/2는 다른 버스트의 샘플 전환일 수 있고, 또는 버스트는 이전 버스트의 선형 결합을 사용하여 만들어질 수 있다. 이러한 기술들은 후보 버스트 형태의 모두를 저장하기 위하여 버스트 엘리먼트(10, 38)에 의해 요구되는 메모리를 줄인다.
바람직한 실시예의 이전의 언급은 당업자에게 본 발명을 사용하거나 만들 수 있게 제공된다. 이런 실시예의 다양한 변형은 당업자에게 명백하고, 여기에 한정된 일반적인 원리는 발명적 사상의 사용없이 다른 실시예에 제한되지 않고 여기에 기술된 원리와 새로운 특징으로 일관되는 가장 넓은 범위에 따른다.

Claims (12)

  1. 디지탈 음성 샘플의 프레임들로부터 짧은 기간 여분들과 긴 기간 여분들이 제거되어 잔여 파형이 발생되는 선형 예측 코더 내에서, 상기 잔여 파형보다 작은 크기의 버스트 형태를 이용하여 상기 잔여 파형을 엔코딩하는 장치에 있어서,
    상기 버스트 형태, 버스트 이득 및 버스트 위치를 선택하고, 상기 버스트 형태가 제 1 개 샘플들보다 적은 제 2 개 샘플들을 가질 때 상기 버스트 이득, 버스트 위치 및 버스트 형태에 따라서 제 1 개 샘플들의 후보 파형을 발생시키고, 상기 후보 파형을 출력하는 후보 파형 발생기 수단; 및
    상기 잔여 파형 및 상기 후보 파형을 수신하고, 상기 후보 파형을 상기 잔여 파형과 비교하고, 상기 비교에 따라서 비교 신호를 출력하는 비교수단을 포함하는 것을 특징으로 하는 장치.
  2. 제 1항에 있어서,
    각 후보 파형에 대해 상기 비교 신호를 수신하고, 상기 비교 신호를 현재 최소 값과 비교하고, 상기 비교 신호가 상기 현재 최소 값보다 적을 때 후보 파형 식별 값을 저장하고, 상기 파형 식별 값에 따라 최적 후보 파형을 선택하는 후보 파형 선택 수단을 더 포함하는 것을 특징으로 하는 장치.
  3. 제 1항에 있어서,
    상기 후보 파형 발생기 수단은,
    상기 버스트 형태를 출력하기 위한 버스트 코드북 수단;
    상기 버스트 형태를 수신하고 소정의 필터링 포맷에 따라서 상기 버스트 형태를 필터링하기 위한 포르만트 합성 필터 수단;
    상기 필터된 버스트 형태 및 버스트 이득 값을 수신하고, 상기 버스트 이득과 상기 필터된 버스트 형태를 곱하여 버스트 이득 곱을 구하고 상기 버스트 이득 곱을 출력하는 버스트 이득 곱셈 수단; 및
    상기 버스트 이득 곱 및 버스트 위치를 수신하고, 상기 버스트 위치값에 따라서 상기 버스트 이득 곱을 음성 잔여 프레임에 시간적으로 배치시켜 상기 후보 파형을 발생시키고, 상기 후보 파형을 출력하기 위한 버스트 위치 수단을 포함하는 것을 특징으로 하는 장치.
  4. 제 1항에 있어서,
    상기 잔여 파형을 수신하고 소정의 버스트 위치 포맷에 따라서 상기 잔여 파형에서 상기 버스트 위치를 검출하기 위한 피크 검출 수단을 더 포함하는 것을 특징으로 하는 장치.
  5. 디지탈 음성 샘플의 프레임들로부터 짧은 기간 여분들과 긴 기간 여분들이 제거되어 잔여 파형이 발생되는 선형 예측 코더 내에서, 상기 잔여 파형보다 작은 크기의 버스트 형태를 이용하여 상기 잔여 파형을 엔코딩하는 방법에 있어서,
    제 1 개 샘플들보다 제 2 개 샘플들이 적을 때 제 2 개 샘플들의 상기 버스트 형태, 버스트 이득 및 버스트 위치에 따라서 후보 파형을 발생시키는 단계로서, 상기 버스트 형태들은 순환적 버스트 형태 포맷에 따라 발생되며, 다음 버스트 형태는 상기 버스트 형태의 끝에서 적어도 한 비트를 제거하고 상기 버스트 형태의 앞에 적어도 하나의 새로운 비트를 첨가함에 의해 이전의 버스트 형태로부터 유도되는 단계;
    상기 후보 파형을 상기 잔여 파형과 비교하는 단계; 및
    상기 비교에 따라서 비교 신호를 발생시키는 단계를 포함하는 것을 특징으로 하는 방법.
  6. 제 1 항에 있어서,
    상기 버스트 형태들은 순환적 버스트 형태 포맷에 따라 발생되며, 다음 버스트 형태는 상기 버스트 형태의 끝에서 적어도 한 비트를 제거하고 상기 버스트 형태의 앞에 적어도 하나의 새로운 비트를 첨가함에 의해 이전의 버스트 형태로부터 유도되는 것을 특징으로 하는 장치.
  7. 디지탈 음성 샘플의 프레임들로부터 짧은 기간 여분들과 긴 기간 여분들이 제거되어 잔여 파형이 발생되는 선형 예측 코더 내에서, 상기 잔여 파형보다 작은 크기의 버스트 형태를 이용하여 제 1 개 샘플들의 상기 잔여 파형을 엔코딩하는 방법에 있어서,
    제 1 개 샘플들보다 제 2 개 샘플들이 적을 때 제 2 개 샘플들의 상기 버스트 형태, 버스트 이득 및 버스트 위치에 따라서 후보 파형을 발생시키는 단계;
    상기 후보 파형을 상기 잔여 파형과 비교하는 단계; 및
    상기 비교에 따라서 비교 신호를 발생시키는 단계를 포함하는 것을 특징으로 하는 방법.
  8. 제 7 항에 있어서,
    소정의 버스트 형태들, 버스트 이득들, 버스트 위치들의 세트에 대하여 제 6 항의 단계들이 반복되며, 각 후보 파형에 대해 상기 비교 신호에 따라 최적 파형을 선택하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  9. 제 7 항에 있어서,
    상기 후보 파형 발생 단계는,
    소정의 포르만트 필터링 포맷에 따라서 상기 버스트 형태를 필터링하는 단계;
    상기 버스트 이득과 상기 필터된 버스트 형태를 곱하여 버스트 이득 곱을 발생시키는 단계; 및
    상기 버스트 위치 값에 따라서 상기 버스트 이득 곱을 시간적으로 배치하여 상기 후보 파형을 발생시키는 단계를 포함하는 것을 특징으로 하는 방법.
  10. 제 7 항에 있어서,
    상기 후보 파형 발생 단계는,
    상기 잔여 파형으로부터 상기 버스트 위치 값을 검출하는 단계;
    소정의 포르만트 필터링 포맷에 따라서 상기 버스트 형태를 필터링하는 단계;
    상기 버스트 이득과 상기 필터된 버스트 형태를 곱하여 버스트 이득곱을 발생시키는 단계; 및
    상기 버스트 위치 값에 따라서 상기 버스트 이득 곱을 시간적으로 배치하여 상기 후보 파형을 발생시키는 단계를 포함하는 것을 특징으로 하는 방법.
  11. 제 7 항에 있어서,
    상기 버스트 형태들은 순환적 버스트 형태 포맷에 따라 발생되며, 다음 버스트 형태는 상기 버스트 형태의 끝에서 적어도 한 비트를 제거하고 상기 버스트 형태의 앞에 적어도 하나의 새로운 비트를 첨가함에 의해 이전의 버스트 형태로부터 유도되는 것을 특징으로 하는 방법.
  12. 디지탈 음성 샘플의 프레임들로부터 짧은 기간 여분들과 긴 기간 여분들이 제거되어 잔여 파형이 발생되는 선형 예측 코더 내에서, 상기 잔여 파형보다 작은 크기의 버스트 형태를 이용하여 상기 잔여 파형을 엔코딩하는 장치에 있어서,
    상기 버스트 형태, 버스트 이득 및 버스트 위치를 선택하고, 상기 버스트 형태, 버스트 이득 및 버스트 위치에 따라서 후보 파형을 발생시키고, 상기 후보 파형을 출력하는 후보 파형 발생 수단으로서, 상기 버스트 형태들은 순환적 버스트 형태 포맷에 따라 발생되며, 다음 버스트 형태는 상기 버스트 형태의 끝에서 적어도 한 비트를 제거하고 상기 버스트 형태의 앞에 적어도 하나의 새로운 비트를 첨가함에 의해 이전의 버스트 형태로부터 유도하는 수단; 및
    상기 잔여 파형 및 상기 후보 파형을 수신하고, 상기 후보 파형을 상기 잔여 파형과 비교하고, 상기 비교에 따라서 비교 신호를 출력하는 비교수단을 포함하는 것을 특징으로 하는 장치.
KR1019960704137A 1994-02-01 1995-02-01 버스트여기선형예측 KR100323487B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US18981494A 1994-02-01 1994-02-01
US189,814 1994-02-01
US189814 1994-02-01
PCT/US1995/001341 WO1995021443A1 (en) 1994-02-01 1995-02-01 Burst excited linear prediction

Publications (2)

Publication Number Publication Date
KR970700902A KR970700902A (ko) 1997-02-12
KR100323487B1 true KR100323487B1 (ko) 2002-07-08

Family

ID=22698876

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019960704137A KR100323487B1 (ko) 1994-02-01 1995-02-01 버스트여기선형예측

Country Status (17)

Country Link
US (1) US5621853A (ko)
EP (1) EP0744069B1 (ko)
JP (1) JPH09508479A (ko)
KR (1) KR100323487B1 (ko)
CN (1) CN1139988A (ko)
AT (1) ATE218741T1 (ko)
AU (1) AU693519B2 (ko)
BR (1) BR9506574A (ko)
CA (1) CA2181456A1 (ko)
DE (1) DE69526926T2 (ko)
DK (1) DK0744069T3 (ko)
ES (1) ES2177631T3 (ko)
FI (1) FI962968A (ko)
HK (1) HK1011108A1 (ko)
MX (1) MX9603122A (ko)
PT (1) PT744069E (ko)
WO (1) WO1995021443A1 (ko)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5963897A (en) * 1998-02-27 1999-10-05 Lernout & Hauspie Speech Products N.V. Apparatus and method for hybrid excited linear prediction speech encoding
US6182030B1 (en) 1998-12-18 2001-01-30 Telefonaktiebolaget Lm Ericsson (Publ) Enhanced coding to improve coded communication signals
EP1690251B1 (en) * 2003-12-02 2015-08-26 Thomson Licensing Method for coding and decoding impulse responses of audio signals
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
US20100324913A1 (en) * 2009-06-18 2010-12-23 Jacek Piotr Stachurski Method and System for Block Adaptive Fractional-Bit Per Sample Encoding
CN105225669B (zh) * 2011-03-04 2018-12-21 瑞典爱立信有限公司 音频编码中的后量化增益校正
MX371425B (es) 2013-06-21 2020-01-29 Fraunhofer Ges Forschung Aparato y metodo para la ocultacion mejorada del libro de codigo adaptativo en la ocultacion similar a acelp mediante la utilizacion de una estimacion mejorada del retardo de tono.
TR201808890T4 (tr) * 2013-06-21 2018-07-23 Fraunhofer Ges Forschung Bir konuşma çerçevesinin yeniden yapılandırılması.
EP3079151A1 (en) * 2015-04-09 2016-10-12 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and method for encoding an audio signal

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4191853A (en) * 1978-10-10 1980-03-04 Motorola Inc. Sampled data filter with time shared weighters for use as an LPC and synthesizer
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
JP3102015B2 (ja) * 1990-05-28 2000-10-23 日本電気株式会社 音声復号化方法
US5138661A (en) * 1990-11-13 1992-08-11 General Electric Company Linear predictive codeword excited speech synthesizer
US5233660A (en) * 1991-09-10 1993-08-03 At&T Bell Laboratories Method and apparatus for low-delay celp speech coding and decoding
SE469764B (sv) * 1992-01-27 1993-09-06 Ericsson Telefon Ab L M Saett att koda en samplad talsignalvektor
US5495555A (en) * 1992-06-01 1996-02-27 Hughes Aircraft Company High quality low bit rate celp-based speech codec
US5353374A (en) * 1992-10-19 1994-10-04 Loral Aerospace Corporation Low bit rate voice transmission for use in a noisy environment
US5341456A (en) * 1992-12-02 1994-08-23 Qualcomm Incorporated Method for determining speech encoding rate in a variable rate vocoder

Also Published As

Publication number Publication date
DE69526926T2 (de) 2003-01-02
AU1739895A (en) 1995-08-21
JPH09508479A (ja) 1997-08-26
CN1139988A (zh) 1997-01-08
EP0744069B1 (en) 2002-06-05
DE69526926D1 (de) 2002-07-11
AU693519B2 (en) 1998-07-02
EP0744069A1 (en) 1996-11-27
KR970700902A (ko) 1997-02-12
FI962968A0 (fi) 1996-07-25
BR9506574A (pt) 1997-09-23
CA2181456A1 (en) 1995-08-10
ATE218741T1 (de) 2002-06-15
HK1011108A1 (en) 1999-07-02
FI962968A (fi) 1996-09-24
WO1995021443A1 (en) 1995-08-10
US5621853A (en) 1997-04-15
MX9603122A (es) 1997-03-29
ES2177631T3 (es) 2002-12-16
PT744069E (pt) 2002-10-31
DK0744069T3 (da) 2002-10-07

Similar Documents

Publication Publication Date Title
KR100938017B1 (ko) 벡터 양자화 장치 및 방법
EP0266620B1 (en) Method of and device for speech signal coding and decoding by parameter extraction and vector quantization techniques
US5012518A (en) Low-bit-rate speech coder using LPC data reduction processing
EP0372008A1 (en) DIGITAL VOICE ENCODER WITH IMPROVED VERTOR EXCITATION SOURCE.
JP2003512654A (ja) 音声の可変レートコーディングのための方法およびその装置
EP0550657A1 (en) METHOD AND DEVICE FOR CODING ANALOG SIGNALS.
KR100323487B1 (ko) 버스트여기선형예측
WO1994019790A1 (en) Method for generating a spectral noise weighting filter for use in a speech coder
US5797119A (en) Comb filter speech coding with preselected excitation code vectors
KR100463559B1 (ko) 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법
JP3531780B2 (ja) 音声符号化方法および復号化方法
US6535847B1 (en) Audio signal processing
WO1997023866A1 (en) Method and apparatus for processing digital data using fractal-excited linear predictive coding
Gersho et al. Vector quantization techniques in speech coding
EP0138954B1 (en) Speech pattern processing utilizing speech pattern compression
Oh et al. Recursive Randomized Tree Coding of Speech
EP0987680A1 (en) Audio signal processing
JP3305338B2 (ja) ピッチ周波数符号化復号化器
KR100955126B1 (ko) 벡터 양자화 장치
Erzin et al. Natural quality variable-rate spectral speech coding below 3.0 kbps
Erzin et al. On the Use of Interframe Information of Line Spectral Frequencies in Speech Coding
JPH11500837A (ja) スピーチコーダ用信号予測方法及び装置
JPH05197799A (ja) 符号化装置
JPH09269800A (ja) 音声符号化装置
JPH03189699A (ja) パラメータ量子化方式

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131227

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20141230

Year of fee payment: 14

EXPY Expiration of term