KR20000029745A - Celp코더내의여기코드북을검색하기위한방법및장치 - Google Patents

Celp코더내의여기코드북을검색하기위한방법및장치 Download PDF

Info

Publication number
KR20000029745A
KR20000029745A KR1019997000852A KR19997000852A KR20000029745A KR 20000029745 A KR20000029745 A KR 20000029745A KR 1019997000852 A KR1019997000852 A KR 1019997000852A KR 19997000852 A KR19997000852 A KR 19997000852A KR 20000029745 A KR20000029745 A KR 20000029745A
Authority
KR
South Korea
Prior art keywords
impulse response
vector
codebook
speech
value
Prior art date
Application number
KR1019997000852A
Other languages
English (en)
Other versions
KR100497788B1 (ko
Inventor
앤드류 피. 데자코
닝 비
Original Assignee
러셀 비. 밀러
콸콤 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 러셀 비. 밀러, 콸콤 인코포레이티드 filed Critical 러셀 비. 밀러
Publication of KR20000029745A publication Critical patent/KR20000029745A/ko
Application granted granted Critical
Publication of KR100497788B1 publication Critical patent/KR100497788B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/06Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

코드에 대한 분석 윈도우가 목표 음성 프레임의 길이를 넘어 연장된 경우의 대수 코드북에서 코드 벡터를 선택하기 위한 방법 및 장치가 개시된다. 입력 신호는 지각 가중 필터(76))에 의해 필터링된다. 상기 필터는 상기 지각 가중 필터(76)의 길이와 동일한 다수의 샘플을 연속 출력하도록 설정되는 반면에, 제로 입력 벡터가 입력으로 인가된다. 분석 윈도우를 확장하므로써, 2차원 임펄스 행렬은 1차원의 오토코릴레이션 행렬로 메모리(60,80)에 저장되어, 검색을 위하여 요구된 계산의 복잡성 및 메모리를 상당히 절약한다.

Description

CELP 코더내의 여기 코드북을 검색하기 위한 방법 및 장치 {METHOD AND APPARATUS FOR SEARCHING AN EXCITATION CODEBOOK IN A CODE EXCITED LINEAR PREDICTION CODER}
디지털 기술의 음성 전송은, 특히 장거리 및 디지털 무선 전화에 보급되고 있다. 이것은 전송 채널을 통해 전송되는 정보의 양을 최소로하는 반면에, 재현된 음성의 높은 음질을 유지하는 방법을 결정하는 데에서 형성되었다. 음성이 간단하게 샘플링 및 디지털화되어 전송된다면, 초당 64킬로비트(64kbps) 정도의 데이터 비율이 일반적인 아날로그 전화의 음질을 달성하기 위하여 요구된다. 그러나, 수신측에서 음성 분석에 이어 적절한 코딩, 전송 및 재합성을 이용함에도 불구하고, 데이터 비율에 있어서 상당한 감소가 달성될 수 있다.
인간의 음성 발생의 모델과 관련된 파라미터를 추출하므로써 발성된 음성을 압축하기 위한 방법을 사용하는 장치는 일반적으로 보코더라고 불린다. 이같은 장치는 입력되는 음성을 분석하여 관련 파라미터를 추출하는 엔코더 및 전송 채널을 통해 수신한 파라미터를 사용하여 음성을 재합성하는 디코더로 구성된다. 모델은 시변 음성 신호를 정확하게 모델링하기 위하여, 연속하여 변화한다. 따라서 파라미터가 계산되는 동안에 음성은 시간 블록 또는 분석 프레임으로 분할된다. 상기 파라미터는 각각의 새로운 프레임에 대하여 업데이트된다.
다양한 음성 코더 종류중, CELP 코더, 확률적 코딩(Stochastic Coding), 또는 벡터 여기 음성 코딩 코더(Vector Excited Speech Coding Coder)는 같은 종류이다. 이러한 특정 종류의 코딩 알고리즘의 예는 Proceedings of the Mobile Satellite Conference(1998년)에서 토마스 이. 트레메인 등에 의한 "4.8kbps 코드 여기 선형 예측 코더(A 4.8 kbps Code Excited Linear Predictive Coder)" 에 개시되었다. 유사하게 이러한 타입의 다른 보코더의 예는, 본 발명의 양수인에게 양도되고 본 명세서에서 참조문으로 인용한 "다양한 비율의 보코더(Variable Rate Vocoder)"미국 특허 제 5,414,796호에 상세히 개시되었다.
보코더의 작용은 음성 내의 자연적인 리던던시 특성을 제거하므로써, 디지털화된 음성 신호를 낮은 비트율의 신호로 압축하는 것이다. CELP 코더에 있어서, 리던던시는 단기 포맷(short term format) 또는 LPC 필터에 의해 제거된다. 이러한 리던던시가 제거되면, 결과적인 잔여 신호는 화이트 가우시안 잡음으로 모델링되고 또한 디코딩되어야 한다.
음성의 소정 프레임에 대하여 코딩 파라미터를 결정하기 위한 처리는 다음과 같다. 우선, LPC 필터의 파라미터는 음성 트랙 필터링에 기인하여 짧은 기간(short term) 리던던시를 제거하는 필터 계수를 찾으므로써 결정된다. 이어, 디코더에서 LPC로 입력되는 여기 신호는, 코드북내의 임의 여기 파형(random excitation waveform)을 사용하여 LPC 필터를 구동하고 LPC 필터의 출력이 원래 음성에 가장 근접한 음성을 발생시키는 특정 여기 파형을 선택하므로써, 선택된다. 따라서, 전송된 파라미터는 (1) LPC 필터 및 (2) 코드북 여기 벡터의 식별과 관련된다.
약속 여기 코드북 구조는 대수 코드북(algebraic codebok)으로서 언급된다. 대수 코드북의 실제 구조는 Proceeding of ICASSP, 1987년 4월 6-9일에 제이. 피. 아도울의 논문 "대수 코드에 기초한 빠른 CELP 코딩"에 개시되었다. 대수 코드의 사용은 본 명세서에서 참조문으로 인용한 "Dynamic Codebook for Efficient Speech Coding Based on Algebraic Codes"로 등록된 미국 특허 제 5,444,816호에 상세히 개시되어개시되었다코더에 기초한 합성에 의한 분석은 합성된 최상의 음성 벡터를 목표 음성 벡터에 매칭시키기 위하여, 최소 평균 자승 에러 측정법(minimum mean square error measure)을 사용한다. 이러한 측정법은 현재 서브프레임에 대한 최적의 벡터를 선택하기 위하여 코드벡터 코드북을 검색하는 데에 사용된다. 이러한 평균 자승 에러 측정법은 일반적으로, 윈도우에 한정되며, 상기 윈도우를 넘어서 여기 코드벡터가 선택되어 기여도를 처리하는 데에 실패하며, 이러한 코드벡터는 다음 서브 프레임에 계속된다.
본 발명에 있어서, 이를 넘어서면 평균 자승 에러 측정법이 최소가 되는 윈도우 크기는 현재 서브 프레임내의 코드벡터를 다음의 서브 프레임으로 연결하도록 확장된다. 윈도우의 확장은 지각 가중 필터(perceptual weighting filter)의 임펄스 응답(h(n)의 길이와 동일하다. 본 발명의 평균 자승 에러 방법은 Proceeding of the Mobile Satellite Conference(1988년)에서 토마스 이. 트레메인 등에 의한 "4.8kbps 코드 여기 선형 예측 코더(A 4.8 kbps Code Excited Linear Predictive Coder)" 에 개시되어진 LPC분석에서 사용된 최소 평균 자승 에러에 대한 오토코릴레이션 방법과 유사하다.
이러한 전망으로부터의 평균 자승 에러 문제를 공식화하여, 본 발명은 현재의 방법을 능가하는 다음과 같은 이점을 가진다.
1) 현재 서브 프레임으로부터의 코드 벡터를 다음 서브 프레임에 연결하는 것은 상기 측정법에서 고려되며, 이에 따라 벡터의 끝에 위치된 펄스는 벡터의 초기에 위치된 펄스와 동일하게 가중 처리된다.
2) 지각 가중 필터의 임펄스 응답은 전체 서브 프레임에 대해 변화가 없으며, h(n),, 퇴플리츠(Toeplitz) 또는 상술한 다른 방법,의 오토코릴레이션 행렬을 형성한다. 따라서, 본 발명은 2-D 행렬을 1-D 벡터로 변환하므로, 코드북 탐색뿐만 아니라 계산 동작을 위한 RAM 요구를 감소시킨다.
볼 발명의 특징, 목적 및 장점은 도면과 함께 아래에서 전개된 상세한 설명으로부터 명확해질 것이며, 도면에서 동일한 문자는 동일한 것을 나타낸다.
본 발명은 음성 처리에 관한 것이다. 보다 구체적으로, 본 발명은 코드 여기 선형 예측(CELP : Code Excited Linear Prediction) 코더내에 최적의 여기 벡터를 위치시키기 위한 새롭고 개선된 방법 및 장치에 관한 것이다.
도 1은 ACELP 코더에서의 코드 벡터를 선택하기 위한 일반적인 장치를 도시한다.
도 2는 본 발명에 따른, ACELP 코드 벡터를 선택하기 위한 장치의 블록도를 도시한다.
도 3은 본 발명에 따른, 코드 벡터를 선택하기 위한 방법에 대한 흐름도를 도시한다.
도 1은 대수 코드북 탐색을 수행하기 위해 사용된 일반적인 방법 및 장치를 도시한다. 코드북 발생기(6)는 펄스 위치 신호(Pi)에 응답하여 i번째 위치에서의 유니트 펄스를 가지는 신호를 발생하는 펄스 발생기(2)를 포함한다. 실시예에 있어서, 코드북 여기 벡터는 40개의 샘플을 포함하며 유니트 임펄스에 대한 가능한 위치는 표 1에 도시된 바와 같이 트랙(T0 내지 T4)으로 분할된다.
표 1
바람직한 실시예에 있어서, 펄스 발생기(2)에 의해 하나의 펄스가 각각의 트랙에 제공된다. Np는 여기 벡터내의 펄스의 개수이다, 바람직한 실시예에 있어서, Np는 5가 된다. 각각의 펄스(pi)에 대하여, 대응 신호(si)가 상기 펄스에 할당된다. 도시된 승산기(4)는 위치(Pi)에서의 유니트 임펄스와 부호 값(si)을 곱한다. 결과적인 코드 벡터(ck)는 다음과 같이 식(1)으로 주어진다.
(1)
필터 발생기(12)는 기술 분양에 잘 공지되어 있고 상술한 미국 특허 제 5,414,796호에서 상세하게 개시된 포르만트 필터(h(n))에 대한 탭 값을 생성한다. 일반적으로 임펄스 함수(h(n))는 M개의 샘플에 대하여 계산되며, 여기에서 M은 검색되는 서브 프레임의 길이이며, 예를 들어 40이 된다.
합성 필터 계수(h(n))가 메모리 엘리먼트(13)에 제공되어 2차원 삼각 퇴플리츠 행렬(Toeplitz matrix)(H)로서 저장되며, 여기에서 아래에 도시된 바와 같이 대각 성분은 h(0)이고 대각 아래의 성분은 h(1)...,h(M-1)이다.
(2)
메모리(13)에 의해 값이 행렬 승산 엘리먼트(14)로 제공된다. 아래의 식 (3)에 따라, H는 임펄스 응답 행렬Φ의 코릴레이션을 제공하기 위하여 자신의 전치 행렬과 곱하여진다.
(3)
코릴레이션 동작의 결과는 메모리 엘리먼트(18)에 제공되어 이러한 실시예에 대해 402또는 1600개의 메모리 위치를 요구하는 2차원 행렬로서 저장된다.
입력 음성 프레임(s(n))은 지각 가중 필터(32)에 인가되어 목표 신호(x(n))를 제공하기 위해 필터링된다. 지각 가중 필터(32)의 설계 및 구현은 기술 분야에 공지되어 있으며, 미국 특허 제 5,414,796호에서 상세하게 개시되었다.
목표 신호(x(n))의 샘플 값 및 임펄스 행렬(H(n))의 값들은, 아래의 식(4)에 따라 목표 신호(x(n))와 임펄스 응답 사이에서의 크로스 코릴레이션을 계산하는 행렬 승산 엘리먼트(16)에 제공된다.
(4)
메모리 엘리먼트(20)로부터의 값(d(i)) 및 코드북 벡터 진폭 엘리먼트(ck)는 코드북 벡터 진폭 엘리먼트를 벡터(d(n))와 승산하는 행렬 승산 엘리먼트(22)로 인가되어, 아래의 식(5)에 따라 결과 값을 제곱한다.
(5)
코드북 벡터 진폭 엘리먼트(c(k)) 및 코드북 펄스 위치 벡터(P)는 행렬 승산 엘리먼트(26)에 제공된다. 행렬 승산 엘리먼트(26)는 아래의 식(6)에 따라 값(Eyy)을 계산한다.
(6)
Eyy의 값 및의 값은 아래의 식(7)에 따라 값(Tk)을 계산하는 제산기(28)에 제공된다.
(7)
각각의 코드 벡터 진폭 엘리먼트(c(k)) 및 코드북 펄스 위치 벡터(P)에 대한 값(Tk)은 최소화 엘리먼트(30)에 인가되고, 값(Tk)을 최대화시키는 코드벡터가 선택된다.
도 2를 참조하여, 본 발명에 따른 코드 벡터를 선택하기 위한 장치가 도시된다. 도 3에 있어서, 본 발명에 따른 동작을 설명하기 위한 흐름도가 도시된다. 우선 블록(100)에 있어서, 본 발명은 d(k)의 값을 미리 계산하며, 이것은 그것의 값이 검색되는 코드 벡터에 따라 변화하지 않기 때문에 앞서서 계산 및 저장될 수 있다.
음성 프레임(s(n))은 목표 신호(x(n))를 발생시키는 지각 가중 필터(76)에 제공된다. 결과적인 목표 음성 세그먼트(x(n))는 승산 및 누선 엘리먼트(78)에 인가되는 M+L-1개의 지각적으로 가중 처리된 샘플로 이루어진다. L은 지각 가중 필터(76)의 임펄스 응답의 길이이다. 이렇게 연장된 길이의 목표 음성 벡터(x(n))는 지각 가중 필터(76)를 통해 음성 신호중 M개의 샘플을 필터링하고 제로 입력 벡터가 상기 지각 가중 필터(76)의 입력으로 인가되는 동안에 L-1개의 추가 샘플에 대하여 이러한 필터링이 계속하여 수행되게 하므로써, 생성된다.
필터 발생기(12)에 대해 앞서 언급한 바와 같이, 필터 발생기(56)는 포르만트 필터에 대한 필터 탭 계수를 계산하고 이러한 계수들로부터 임펄스 응답(h(n))을 결정한다. 그러나, 필터 발생기(56)는 0 에서 L-1까지의 지연에 대한 필터 응답을 생성하며, 여기에서 L은 임펄스 응답(h(n))의 길이이다. 실시예에서 개시된 바와 같이, 피치 필터(pitch filter)를 사용하지 않고 본 발명은 기술 분야에 공지된 것과 같은 임펄스 응답의 간단한 수정에 의해 피치 필터가 존재하는 경우에 동일하게 적용될 수 있다는 것이 주지되어야 한다.
필터 발생기(56)로부터의 h(n) 값은 승산 및 누산 엘리먼트(78)에 인가된다. 승산 및 누산 엘리먼트(78)는 아래의 식(8)에 따라 필터 임펄스 응답(h(n))과 목표 시퀀스(x(n))의 크로스 코릴레이션을 계산한다.
(8)
계산된 값(d(n))은 메모리 엘리먼트(80)에 저장된다.
블록(102)에서, 본 발명은 Eyy의 계산을 위해 요구된 Φ의 값을 미리 계산한다. 이것은 본 발명의 메모리 절약에 있어서 가장 큰 이득이 실현되는 지점이다. 평균 제곱 에러 측정법은 증가된 윈도우를 넘어 확장되기 때문에, h(n)은 전체 서브 프레임에 대해 변화하지 않으며, 결과적으로 Φ(i,j)=가 되기 때문에 2-D의 Φ(i,j) 행렬은 1-D의 벡터가 된다. 표 1에 설명된 실시예에 있어서, 이것은 일반적인 방법이 1600개의 RAM 위치를 요구하는 반면에 본 발명은 단지 40개 만을 요구한다. 동작 수의 절감은 또한 2-D 행렬에 대한 1-D 벡터의 계산 및 저장에서 얻어진다. 본 발명에 있어서, Φ의 값은 아래의 식(9)에 따라 계산된다.
(9)
Φ(i)의 값은 메모리 엘리먼트(80)에 저장되며, 상기 엘리먼트는 M2개의 엘리먼트의 저장을 요구하는 종래의 방법과는 대조적으로 단지 L개의 메모리 위치를 요구한다. 이러한 실시예에서 L = M이 된다.
블록(104)에 있어서, 본 발명은 크로스 코릴레이션 값(Exy)을 계산한다. 메모리 엘리먼트(80)에 저장된 d(k)의 값과 현재의 코드북 발생기(50)로부터 코드북 벡터(ci(k))는 승산 및 누산 엘리먼트(62)에 인가된다. 승산 및 누산 엘리먼트(62)는 식(10)에 따라 목표 벡터(x(k))와 코드북 벡터 진폭 엘리먼트(cj(k))의 크로스 코릴레이션을 계산한다.
(10)
Exy의 값은 Exy의 자승 값을 계산하는 자승 수단(64)에 인가된다.
블록(106)에서, 본 발명은 합성된 음성의 오토코릴레이션의 값(Eyy)을 계산한다. 코드북 벡터 진폭 엘리먼트(ci(k) 및 cj(k))는 코드북 발생기(50)로부터 승산 및 누산 엘리먼트(70)로 인가된다. 게다가,의 값이 메모리 엘리먼트(60)로부터 승산 및 누산 엘리먼트(70)로 인가된다. 승산 및 누산 엘리먼트(70)는 아래의 식(11)에 따라 다음의 값을 계산한다.
(11)
승산 및 누산 엘리먼트(70)에 의해 계산된 값은 그것의 값에 2가 곱하여지는 승산기(72)에 인가된다. 승산기(72)로부터의 출력 값은 가산기(74)의 제 1 입력에 인가된다.
메모리 엘리먼트(60)는 Φ(0)값을, 값(Np)이 곱하여지는 승산기(75)에 인가한다. 승산기(75)의 출력 값은 가산기(74)의 제 2 입력에 인가된다. 가산기(74)로부터의 합은 아래의 식(12)에 의해 주어진 값(Eyy)이 된다.
(12)
계산 리소오스의 절약에 대한 평가는 본 발명의 식(12)과 종래 검색 방법의 식(6)을 비교하므로써 달성될 수 있다. 이러한 절약은의 2-D 액세스에 대한 1-D 행렬()의 빠른 어드레싱, Eyy 계산을 위해 요구된 감소된 가산(실시예에 대해 식(6)은 15개의 가산을 수행하는 반면에, ck(pi)가 단지 1 또는 -1의 부호 항이라는 가정하에 식(12)은 11개를 수행한다.) 및 Φ(i,j)가 반드시 저장될 필요가 없기 때문에 1360개의 RAM 위치 절약에서 유래한다.
블록(108)에서, 본 발명은의 값을 계산한다. 가산 엘리먼트(74)로부터의 Eyy의 값은 제산기(66)의 제 1 입력에 인가된다. 자승 수단(64)로부터의 (Exy)2의 값은 제산기(66)의 제 2 입력에 인가된다. 제산기(66)는 아래의 식(13)에서 주어진 몫을 계산한다.
(13)
제산기(66)로부터의 몫은 최소화 엘리먼트(66)에 인가된다. 블록(110)에서, 모든 벡터(ck)가 테스트되지 않았다면, 흐름도는 다시 블록(104)으로 궤환하고, 다음 코드 벡터가 상술한 바와 같이 테스트된다. 모든 벡터가 테스트되었다면, 블록(112)에서 최소화 엘리먼트(68)는의 최대 값을 발생시키는 코드 벡터를 선택한다.
바람직한 실시예에 대한 상술한 설명은 기술 분야의 당업자가 본 발명을 이용 또는 이해하기 위한 것이다. 상기 실시예의 다양한 수정이 당업자에게는 용이하게 인지될 것이며, 명세서에서 한정된 일반적인 원칙은 기술상 진보적 사항을 사용하지 않고도 다른 실시예에 적용될 수 있다. 따라서 본 발명은 제시된 실시예에 한정되는 것이 아니라, 원칙 및 새로운 특성과 일관된 넓은 범위에 적용된다.

Claims (9)

  1. 임펄스 응답(h(n))을 가지는 L개의 탭을 구비한 필터 수단에 의해 짧은 기간 및 긴 기간의 리던던시가 N개의 디지털화된 음성 샘플의 프레임으로부터 제거되어 N 샘플중 잔여 파형을 형성하는 합성 음성을 제공하기 위한 선형 예측 코더에서, k개의 코드북 벡터를 사용하여 상기 잔여 파형을 인코딩하기 위한 방법에 있어서,
    제 1 컨볼루션을 제공하기 위하여 목표 신호(x(n))와 상기 임펄스 응답(h(n))을 컨볼루션하는 단계;
    임펄스 응답 행렬을 오토코릴레이션하는 단계를 포함하는데, 상기 임펄스 응답 행렬은 대각 성분(h(0))을 가지는 하삼각 퇴플리츠 행렬이며 여기에서 h(0)은 제로차의 임펄스 응답 값이고 대각 하단 성분(h(1),...h(L-1))이 존재하고, 상기 임펄스 응답 오토코릴레이션은에 따라 이 계산되며,
    합성 음성의 오토코릴레이션(Eyy)을 제공하기 위하여 상기 임펄스 응답 행렬 및 상기 코드북 벡터(ck)의 오토코릴레이션에 따라 상기 합성 음성을 오토코릴레이션하는 단계;
    크로스 코릴레이션(Exy)을 제공하기 위하여, 상기 제 1 컨볼류선 및 상기 코드북 벡터에 따라 상기 합성 음성 및 상기 목표 음성을 크로스 코릴레이션하는 단계; 및
    상기 크로스 코릴레이션(Exy) 및 상기 합성 음성 오토코릴레이션(Eyy)에 따라 코드북 벡터를 선택하는 단계를 포함하는 것을 특징으로 하는 방법.
  2. 제 1 항에 있어서, 제 1 세트의 필터 계수를 생성하는 단계;
    제 2 세트의 필터 계수를 생성하는 단계; 및
    상기 임펄스 응답(h(n))을 제공하기 위하여 상기 제 1 세트의 필터 계수 및 상기 제 2 세트의 필터 계수를 조합하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  3. 제 1 항에 있어서, N개의 디지털화된 샘플의 입력 프레임을 수신하는 단계; 및
    상기 목표 신호를 제공하기 위하여 상기 입력 프레임을 지각 가중 처리하는 단계를 더 포함하는 것을 특징으로 하는 방법.
  4. 제 1 항에 있어서, 상기 목표 신호 및 상기 임펄스 응답을 컨볼루션하는 단계는에 따라 수행되는 것을 특징으로 하는 방법.
  5. 제 1 항에 있어서, L개의 메모리 위치로 이루어진 메모리 내에 상기 임펄스 응답 오토코릴레이션을 저장하기 위한 단계를 더 포함하는 것을 특징으로 하는 방법.
  6. 제 1 항에 있어서, 상기 합성 음성 및 상기 목표 음성을 크로스 코릴레이션하는 단계는에 따라 수행되며, 여기에서 d(k)는 상기 목표 신호 및 상기 임펄스 응답의 크로스 코릴레이션인 것을 특징으로 하는 방법.
  7. 제 1 항에 있어서, 상기 합성 음성을 오토코릴레이션하는 단계는에 따라 수행되는 것을 특징으로 하는 방법.
  8. 제 1 항에 있어서, 상기 코드북 벡터를 선택하기 위한 단계는,
    각각의 코드 벡터(ck)에 대하여 상기 값(Exy)을 자승하는 단계;
    각각의 코드 벡터(ck)에 대하여 Eyy의 계산된 값을 상기 Exy의 자승으로 나누는 단계; 및
    Eyy 및 Exy의 자승에 대한 몫을 최대화시키는 코드 벡터를 선택하는 단계를 포함하는 것을 특징으로 하는 방법.
  9. 제 1 항에 있어서, 상기 코드북 벡터(ck)는 대수 코드북 포맷에 따라 선택되는 것을 특징으로 하는 방법.
KR10-1999-7000852A 1996-07-31 1997-07-31 Celp 코더내의 여기 코드북을 검색하기 위한 방법 및 장치 KR100497788B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US690,709 1996-07-31
US08/690,709 US5751901A (en) 1996-07-31 1996-07-31 Method for searching an excitation codebook in a code excited linear prediction (CELP) coder

Publications (2)

Publication Number Publication Date
KR20000029745A true KR20000029745A (ko) 2000-05-25
KR100497788B1 KR100497788B1 (ko) 2005-06-29

Family

ID=24773618

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-1999-7000852A KR100497788B1 (ko) 1996-07-31 1997-07-31 Celp 코더내의 여기 코드북을 검색하기 위한 방법 및 장치

Country Status (13)

Country Link
US (1) US5751901A (ko)
EP (1) EP0917710B1 (ko)
JP (1) JP2000515998A (ko)
KR (1) KR100497788B1 (ko)
CN (1) CN1124589C (ko)
AT (1) ATE259532T1 (ko)
AU (1) AU719568B2 (ko)
BR (1) BR9710640A (ko)
CA (1) CA2261956A1 (ko)
DE (1) DE69727578D1 (ko)
FI (1) FI990181A (ko)
IL (1) IL128285A0 (ko)
WO (1) WO1998005030A1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
KR100668300B1 (ko) * 2003-07-09 2007-01-12 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법
KR100806470B1 (ko) * 2006-03-10 2008-02-21 마츠시타 덴끼 산교 가부시키가이샤 고정 코드북 탐색 장치 및 고정 코드북 탐색 방법
KR100926599B1 (ko) * 2001-06-06 2009-11-11 콸콤 인코포레이티드 코드북 벡터 검색의 메모리 요구들을 감소시키는 방법 및 장치
KR100935174B1 (ko) * 2001-06-04 2010-01-06 콸콤 인코포레이티드 고속 코드-벡터 탐색 장치 및 방법

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU727706B2 (en) * 1995-10-20 2000-12-21 Facebook, Inc. Repetitive sound compression system
US6714907B2 (en) * 1998-08-24 2004-03-30 Mindspeed Technologies, Inc. Codebook structure and search for speech coding
US7363219B2 (en) * 2000-09-22 2008-04-22 Texas Instruments Incorporated Hybrid speech coding and system
US7606703B2 (en) * 2000-11-15 2009-10-20 Texas Instruments Incorporated Layered celp system and method with varying perceptual filter or short-term postfilter strengths
DE10140507A1 (de) * 2001-08-17 2003-02-27 Philips Corp Intellectual Pty Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers
US7047188B2 (en) * 2002-11-08 2006-05-16 Motorola, Inc. Method and apparatus for improvement coding of the subframe gain in a speech coding system
US7054807B2 (en) * 2002-11-08 2006-05-30 Motorola, Inc. Optimizing encoder for efficiently determining analysis-by-synthesis codebook-related parameters
JP3887598B2 (ja) * 2002-11-14 2007-02-28 松下電器産業株式会社 確率的符号帳の音源の符号化方法及び復号化方法
US7249014B2 (en) * 2003-03-13 2007-07-24 Intel Corporation Apparatus, methods and articles incorporating a fast algebraic codebook search technique
GB0307752D0 (en) * 2003-04-03 2003-05-07 Seiko Epson Corp Apparatus for algebraic codebook search
EP1619664B1 (en) * 2003-04-30 2012-01-25 Panasonic Corporation Speech coding apparatus, speech decoding apparatus and methods thereof
KR101132485B1 (ko) * 2003-12-02 2012-03-30 톰슨 라이센싱 오디오 신호의 임펄스 응답의 코딩 및 디코딩 방법
US8920343B2 (en) 2006-03-23 2014-12-30 Michael Edward Sabatino Apparatus for acquiring and processing of physiological auditory signals
CN101842833B (zh) * 2007-09-11 2012-07-18 沃伊斯亚吉公司 语音和音频编码中快速代数码本搜索的方法和设备
WO2014053261A1 (en) * 2012-10-05 2014-04-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for encoding a speech signal employing acelp in the autocorrelation domain

Family Cites Families (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3633107A (en) * 1970-06-04 1972-01-04 Bell Telephone Labor Inc Adaptive signal processor for diversity radio receivers
JPS5017711A (ko) * 1973-06-15 1975-02-25
US4076958A (en) * 1976-09-13 1978-02-28 E-Systems, Inc. Signal synthesizer spectrum contour scaler
US4214125A (en) * 1977-01-21 1980-07-22 Forrest S. Mozer Method and apparatus for speech synthesizing
CA1123955A (en) * 1978-03-30 1982-05-18 Tetsu Taguchi Speech analysis and synthesis apparatus
DE3023375C1 (ko) * 1980-06-23 1987-12-03 Siemens Ag, 1000 Berlin Und 8000 Muenchen, De
US4379949A (en) * 1981-08-10 1983-04-12 Motorola, Inc. Method of and means for variable-rate coding of LPC parameters
USRE32580E (en) * 1981-12-01 1988-01-19 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech coder
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
EP0111612B1 (fr) * 1982-11-26 1987-06-24 International Business Machines Corporation Procédé et dispositif de codage d'un signal vocal
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4787925A (en) * 1983-04-15 1988-11-29 Figgie International Inc. Gas filter canister housing assembly
DE3370423D1 (en) * 1983-06-07 1987-04-23 Ibm Process for activity detection in a voice transmission system
US4672670A (en) * 1983-07-26 1987-06-09 Advanced Micro Devices, Inc. Apparatus and methods for coding, decoding, analyzing and synthesizing a signal
EP0163829B1 (en) * 1984-03-21 1989-08-23 Nippon Telegraph And Telephone Corporation Speech signal processing system
DE3411844A1 (de) * 1984-03-30 1985-10-10 Robert Bosch Gmbh, 7000 Stuttgart Zuendspule fuer die mehrkerzige und verteilerlose zuendanlage einer brennkraftmaschine
US4617676A (en) * 1984-09-04 1986-10-14 At&T Bell Laboratories Predictive communication system filtering arrangement
US4856068A (en) * 1985-03-18 1989-08-08 Massachusetts Institute Of Technology Audio pre-processing methods and apparatus
US4937873A (en) * 1985-03-18 1990-06-26 Massachusetts Institute Of Technology Computationally efficient sine wave synthesis for acoustic waveform processing
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4831636A (en) * 1985-06-28 1989-05-16 Fujitsu Limited Coding transmission equipment for carrying out coding with adaptive quantization
JPS628031A (ja) * 1985-07-04 1987-01-16 Matsushita Electric Ind Co Ltd 油圧センサ
US4827517A (en) * 1985-12-26 1989-05-02 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech processor using arbitrary excitation coding
US4797929A (en) * 1986-01-03 1989-01-10 Motorola, Inc. Word recognition in a speech recognition system using data reduced word templates
CA1299750C (en) * 1986-01-03 1992-04-28 Ira Alan Gerson Optimal method of data reduction in a speech recognition system
US4726037A (en) * 1986-03-26 1988-02-16 American Telephone And Telegraph Company, At&T Bell Laboratories Predictive communication system filtering arrangement
JPH0748695B2 (ja) * 1986-05-23 1995-05-24 株式会社日立製作所 音声符号化方式
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
US4697261A (en) * 1986-09-05 1987-09-29 M/A-Com Government Systems, Inc. Linear predictive echo canceller integrated with RELP vocoder
US4771465A (en) * 1986-09-11 1988-09-13 American Telephone And Telegraph Company, At&T Bell Laboratories Digital speech sinusoidal vocoder with transmission of only subset of harmonics
US4903301A (en) * 1987-02-27 1990-02-20 Hitachi, Ltd. Method and system for transmitting variable rate speech signal
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
US4868867A (en) * 1987-04-06 1989-09-19 Voicecraft Inc. Vector excitation speech or audio coder for transmission or storage
US5202953A (en) * 1987-04-08 1993-04-13 Nec Corporation Multi-pulse type coding system with correlation calculation by backward-filtering operation for multi-pulse searching
US4890327A (en) * 1987-06-03 1989-12-26 Itt Corporation Multi-rate digital voice coder apparatus
US4899385A (en) * 1987-06-26 1990-02-06 American Telephone And Telegraph Company Code excited linear predictive vocoder
CA1337217C (en) * 1987-08-28 1995-10-03 Daniel Kenneth Freeman Speech coding
US4852179A (en) * 1987-10-05 1989-07-25 Motorola, Inc. Variable frame rate, fixed bit rate vocoding method
IL84902A (en) * 1987-12-21 1991-12-15 D S P Group Israel Ltd Digital autocorrelation system for detecting speech in noisy audio signal
US4817157A (en) * 1988-01-07 1989-03-28 Motorola, Inc. Digital speech coder having improved vector excitation source
US4896361A (en) * 1988-01-07 1990-01-23 Motorola, Inc. Digital speech coder having improved vector excitation source
DE3871369D1 (de) * 1988-03-08 1992-06-25 Ibm Verfahren und einrichtung zur sprachkodierung mit niedriger datenrate.
EP0331858B1 (en) * 1988-03-08 1993-08-25 International Business Machines Corporation Multi-rate voice encoding method and device
US5023910A (en) * 1988-04-08 1991-06-11 At&T Bell Laboratories Vector quantization in a harmonic speech coding arrangement
US4864561A (en) * 1988-06-20 1989-09-05 American Telephone And Telegraph Company Technique for improved subjective performance in a communication system using attenuated noise-fill
FR2636163B1 (fr) * 1988-09-02 1991-07-05 Hamon Christian Procede et dispositif de synthese de la parole par addition-recouvrement de formes d'onde
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
US5077798A (en) * 1988-09-28 1991-12-31 Hitachi, Ltd. Method and system for voice coding based on vector quantization
EP0364647B1 (en) * 1988-10-19 1995-02-22 International Business Machines Corporation Improvement to vector quantizing coder
NL8901032A (nl) * 1988-11-10 1990-06-01 Philips Nv Coder om extra informatie op te nemen in een digitaal audiosignaal met een tevoren bepaald formaat, een decoder om deze extra informatie uit dit digitale signaal af te leiden, een inrichting voor het opnemen van een digitaal signaal op een registratiedrager, voorzien van de coder, en een registratiedrager verkregen met deze inrichting.
JP3033060B2 (ja) * 1988-12-22 2000-04-17 国際電信電話株式会社 音声予測符号化・復号化方式
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
DE68916944T2 (de) * 1989-04-11 1995-03-16 Ibm Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion.
US5060269A (en) * 1989-05-18 1991-10-22 General Electric Company Hybrid switched multi-pulse/stochastic speech coding technique
GB2235354A (en) * 1989-08-16 1991-02-27 Philips Electronic Associated Speech coding/encoding using celp
US5091945A (en) * 1989-09-28 1992-02-25 At&T Bell Laboratories Source dependent channel coding with error protection
DE59002222D1 (de) * 1989-10-06 1993-09-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals.
CA2067379C (en) * 1989-10-06 1998-05-26 Thomas Vaupel Process for transmitting a signal
JPH03181232A (ja) * 1989-12-11 1991-08-07 Toshiba Corp 可変レート符号化方式
CA2010830C (en) * 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5103459B1 (en) * 1990-06-25 1999-07-06 Qualcomm Inc System and method for generating signal waveforms in a cdma cellular telephone system
US5235671A (en) * 1990-10-15 1993-08-10 Gte Laboratories Incorporated Dynamic bit allocation subband excited transform coding method and apparatus
US5187745A (en) * 1991-06-27 1993-02-16 Motorola, Inc. Efficient codebook search for CELP vocoders
US5175769A (en) * 1991-07-23 1992-12-29 Rolm Systems Method for time-scale modification of signals
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
IT1257065B (it) * 1992-07-31 1996-01-05 Sip Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi.
US5630013A (en) * 1993-01-25 1997-05-13 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for performing time-scale modification of speech signals
US5526464A (en) * 1993-04-29 1996-06-11 Northern Telecom Limited Reducing search complexity for code-excited linear prediction (CELP) coding
JP3137805B2 (ja) * 1993-05-21 2001-02-26 三菱電機株式会社 音声符号化装置、音声復号化装置、音声後処理装置及びこれらの方法
JP3182032B2 (ja) * 1993-12-10 2001-07-03 株式会社日立国際電気 音声符号化通信方式及びその装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100576024B1 (ko) * 2000-04-12 2006-05-02 삼성전자주식회사 에이켈프 음성 압축기의 코드북 검색 장치 및 방법
KR100935174B1 (ko) * 2001-06-04 2010-01-06 콸콤 인코포레이티드 고속 코드-벡터 탐색 장치 및 방법
KR100926599B1 (ko) * 2001-06-06 2009-11-11 콸콤 인코포레이티드 코드북 벡터 검색의 메모리 요구들을 감소시키는 방법 및 장치
KR100668300B1 (ko) * 2003-07-09 2007-01-12 삼성전자주식회사 비트율 확장 음성 부호화 및 복호화 장치와 그 방법
KR100806470B1 (ko) * 2006-03-10 2008-02-21 마츠시타 덴끼 산교 가부시키가이샤 고정 코드북 탐색 장치 및 고정 코드북 탐색 방법

Also Published As

Publication number Publication date
US5751901A (en) 1998-05-12
IL128285A0 (en) 2000-02-17
DE69727578D1 (de) 2004-03-18
FI990181A (fi) 1999-03-31
CA2261956A1 (en) 1998-02-05
ATE259532T1 (de) 2004-02-15
KR100497788B1 (ko) 2005-06-29
EP0917710B1 (en) 2004-02-11
CN1229502A (zh) 1999-09-22
AU3969497A (en) 1998-02-20
WO1998005030A1 (en) 1998-02-05
EP0917710A1 (en) 1999-05-26
AU719568B2 (en) 2000-05-11
JP2000515998A (ja) 2000-11-28
FI990181A0 (fi) 1999-02-01
BR9710640A (pt) 2002-08-06
CN1124589C (zh) 2003-10-15

Similar Documents

Publication Publication Date Title
KR100497788B1 (ko) Celp 코더내의 여기 코드북을 검색하기 위한 방법 및 장치
EP1145228B1 (en) Periodic speech coding
KR100264863B1 (ko) 디지털 음성 압축 알고리즘에 입각한 음성 부호화 방법
US6691084B2 (en) Multiple mode variable rate speech coding
US6345248B1 (en) Low bit-rate speech coder using adaptive open-loop subframe pitch lag estimation and vector quantization
EP0898267B1 (en) Speech coding system
EP0745971A2 (en) Pitch lag estimation system using linear predictive coding residual
EP0360265A2 (en) Communication system capable of improving a speech quality by classifying speech signals
KR20020052191A (ko) 음성 분류를 이용한 음성의 가변 비트 속도 켈프 코딩 방법
WO1998005030A9 (en) Method and apparatus for searching an excitation codebook in a code excited linear prediction (clep) coder
US6678651B2 (en) Short-term enhancement in CELP speech coding
JP2002268686A (ja) 音声符号化装置及び音声復号化装置
KR100465316B1 (ko) 음성 부호화기 및 이를 이용한 음성 부호화 방법
WO2002023536A2 (en) Formant emphasis in celp speech coding
EP0713208A2 (en) Pitch lag estimation system
JPH09179593A (ja) 音声符号化装置
JPH08320700A (ja) 音声符号化装置
Tammi et al. A preprocessing method for perfect reconstruction WI coding
MXPA99001099A (en) Method and apparatus for searching an excitation codebook in a code excited linear prediction (clep) coder
KR970009747B1 (ko) Qcelp 음성부호화기의 복잡도 감소 알고리즘
EP1212750A1 (en) Multimode vselp speech coder
JP2001100799A (ja) 音声符号化装置、音声符号化方法および音声符号化アルゴリズムを記録したコンピュータ読み取り可能な記録媒体

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130531

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140529

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160330

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20170330

Year of fee payment: 13