KR100911426B1 - 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및이를 이용한 음성 부호화기 - Google Patents

무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및이를 이용한 음성 부호화기 Download PDF

Info

Publication number
KR100911426B1
KR100911426B1 KR1020060099769A KR20060099769A KR100911426B1 KR 100911426 B1 KR100911426 B1 KR 100911426B1 KR 1020060099769 A KR1020060099769 A KR 1020060099769A KR 20060099769 A KR20060099769 A KR 20060099769A KR 100911426 B1 KR100911426 B1 KR 100911426B1
Authority
KR
South Korea
Prior art keywords
vector
codebook
fixed codebook
pulse
initial
Prior art date
Application number
KR1020060099769A
Other languages
English (en)
Other versions
KR20070061330A (ko
Inventor
이응돈
성종모
송윤정
이수인
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to PCT/KR2007/001749 priority Critical patent/WO2008044817A1/en
Priority to US12/442,554 priority patent/US8249864B2/en
Publication of KR20070061330A publication Critical patent/KR20070061330A/ko
Application granted granted Critical
Publication of KR100911426B1 publication Critical patent/KR100911426B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0013Codebook search algorithms

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

본 발명은 무반복 전역 펄스 교체(iteration-free global pulse replacement)를 통한 음성 부호화기(speech codec)의 고정 코드북 검색(fixed codebook search) 방법 및 이를 이용한 음성 부호화기에 관한 것이다. 본 발명에 따른 음성 부호화기에서 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법은, (a) 펄스 위치 가능성 벡터 또는 상관도 벡터를 이용하여 초기 코드북 벡터를 결정하는 단계; (b) 상기 초기 코드북 벡터에 대한 고정코드북 검색 판별값을 계산하는 단계; (c) 상기 초기 코드북 벡터를 각 트랙별로 한 펄스씩 교체하여 얻어진 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 생성하는 펄스 위치를 각 트랙의 후보 펄스 위치로 결정하는 단계; (d) 상기 초기 코드북 벡터의 하나 이상의 펄스 위치를 상기 각 트랙의 후보 펄스 위치로 교체함으로써 얻어진 모든 조합의 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 판단하는 단계; (e) 상기 (b) 단계에서 구해진 상기 초기 코드북 벡터에 대한 고정코드북 판별값과 상기(d) 단계에서 판단된 최대값을 비교함으로써 최적의 고정코드북 벡터를 결정하는 단계를 포함한다.
음성 부호화기, 고정 코드북 검색, 무반복 전역 펄스 교체

Description

무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및 이를 이용한 음성 부호화기{Fixed codebook search method through iteration-free global pulse replacement and speech coder using the same method}
도 1은 기존의 전역 펄스 교체를 통한 고정 코드북 검색 방법에 대한 일실시예 흐름도.
도 2a 및 2b는 본 발명이 적용되는 G.729EV 부호화기(codec)의 인코더 및 디코더 기능도를 나타낸다.
도 3은 본 발명의 일실시예에 따른 무반복 전역 펄스 교체를 이용한 고정 코드북 검색 방법의 절차를 도시한 흐름도이다.
본 발명은 무반복 전역 펄스 교체(iteration-free global pulse replacement)를 통한 음성 부호화기(speech codec)의 고정 코드북 검색(fixed codebook search) 방법 및 이를 이용한 음성 부호화기에 관한 것으로서, 더욱 상세하게는 에이켈프(ACELP : algebraic code excited linear prediction) 방식등의 음성 부호화기에서 무반복 전역 펄스 교체를 통해 고정 코드북의 고속 검색을 수행하 는 방법 및 이를 이용한 음성 부호화기에 관한 것이다.
종래의 고정 코드북 검색 방식에는 G.723.1 6.3kbps 음성 부호화기에서 사용하는 전수 검색(full search) 방식, G.729, G.723.1 5.3kbps 음성 부호화기에서 사용하는 집중 검색(focused search) 방식, G.729A, AMR-NB, AMR-WB 음성 부호화기에서 사용하는 깊이 우선 트리 검색(depth first tree search) 방식 등이 있다.
위와 같은 검색 방식들은 음질에 비해 계산량이 다소 많다는 문제점이 있었다. 이러한 문제점을 해결하기 위하여, 본 출원과 동일한 출원인에 의해 출원되어 등록된 한국 특허 제10-0556831호(대응 미국 특허출원 공개번호: US20040193410)는 전역 펄스 교체를 통한 고정 코드북 검색 방식에 대하여 개시하고 있으며, 이러한 방식은 2006년 4월에 ITU-T 표준으로 채택된 G.729.1 음성 부호화기의 8kbps 모드의 고정 코드북 검색 방식으로 사용되고 있다. 이하 도 1을 참조하여 상기 특허에 개시된 전역 펄스 교체를 통한 고정 코드북 검색 방법을 살펴본다.
도 1에 도시된 바와 같이, 기존의 전역 펄스 교체 방법은, 펄스 위치 가능성 추정 벡터(pulse position likelihood estimate vector)로부터 초기 코드북 벡터를 결정하는 단계(110), 초기 코드북 벡터로부터 에이켈프(ACELP) 음성 코딩 방식에서 고정 코드북을 검색하기 위해 사용되는 판별값(Q pre )을 계산하는 단계(120), 상기 잠정 결정된 코드북 벡터에 대하여 각 트랙 별로 한 펄스씩 펄스를 교체하여 얻어진 코드북 벡터 각각에 대하여 고정 코드북 검색 판별값을 계산하는 단계(130), 모든 트랙에 대해 펄스 교체에 의해 얻어지는 상기 판별값 중 최대값(Q max )을 찾는 단 계(140), 상기 최대값(Q max )과 펄스를 교체하기 전의 코드북 벡터에 의한 판별값(Q pre )을 비교하는 단계(150), 상기 최대값(Q max )이 펄스 교체전의 전의 판별값(Q pre ) 보다 큰 경우, 상기 최대값(Q max )을 생성하는 펄스 위치로 펄스를 교체하여 새로운 코드북 벡터를 결정하는 단계(160), 미리 설정된 일정 반복 회수가 되면 펄스 교체를 종료하는 단계(170, 180)로 이루어진다.
즉, 기존의 전역 펄스 교체 방식에서는 각 펄스 교체 과정에서 판별값이 계속 증가하도록 펄스 교체가 반복적으로 이루어지므로 펄스 교체 과정이 반복될수록 최적의 코드북 벡터를 신속하게 검색할 수 있지만 펄스 교체 과정이 반복될수록 연산량이 증가하는 문제점이 있다.
따라서, 본 발명의 목적은 기존의 전역 펄스 교체 방식에서 반복 과정을 제거함으로써 연산량(computational load)을 획기적으로 감소시킬 수 있는 고정 코드북 검색 방식을 제공하는 것이다.
본 발명의 다른 목적은 펄스 위치 가능성 추정 벡터(pulse-position likelihood-estimator vector)와 상관도 벡터(correlation vector or backward filtered target vector)를 언어적 특성에 따라 적절히 이용함으로써 기존의 전역 펄스 교체 방식의 음질을 향상시킬 수 있는 고정 코드북 검색 방법을 제공하는 것이다.
전술한 목적 달성을 위해, 본 발명의 일특징에 따라 음성 부호화기에서 무반복 전역 펄스 교체를 통한 고정코드북 검색 방법은, (a) 펄스 위치 가능성 벡터 또는 상관도 벡터를 이용하여 초기 코드북 벡터를 결정하는 단계; (b) 상기 초기 코드북 벡터에 대한 고정코드북 검색 판별값을 계산하는 단계; (c) 상기 초기 코드북 벡터를 각 트랙별로 한 펄스씩 교체하여 얻어진 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 생성하는 펄스 위치를 각 트랙의 후보 펄스 위치로 결정하는 단계;(d) 상기 초기 코드북 벡터의 하나 이상의 펄스 위치를 상기 각 트랙의 후보 펄스 위치로 교체함으로써 얻어진 모든 조합의 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 판단하는 단계; (e) 상기 (b) 단계에서 구해진 상기 초기 코드북 벡터에 대한 고정코드북 판별값과 상기(d) 단계에서 판단된 최대값을 비교함으로써 최적의 고정코드북 벡터를 결정하는 단계를 포함한다.
바람직하게, 상기 (a) 단계는 상기 음성 부호화기에서 처리될 언어적 특성에 따라 펄스 위치 가능성 추정 벡터를 이용하거나 상관도 벡터를 이용한다.
바람직하게, 상기 (b) 단계 내지 (d) 단계에서의 고정코드북 검색 판별값 계산은 상기 음성 부호화기에서 처리될 언어적 특성에 따라 상관도 벡터를 이용하거나 펄스 위치 가능성 추정 벡터를 이용한다.
또한, 상기 (e) 단계는, (e1) 상기 초기 코드북 벡터에 대한 고정코드북 판별값이 큰 것으로 판단되면 상기 초기 코드북 벡터를 최적 코드북 벡터로 결정하는 단계; 및 (e2) 상기(d) 단계에서 판단된 최대값이 큰 것으로 판단되면 상기 최대값 을 생성한 코드북 벡터를 최적 코드북 벡터로 결정하는 단계를 포함한다.
본 발명의 다른 특징에 따른 CELP 인코더는, 선형예측 분석부, 적응형 코드북 검색부 및 고정 코드북 검색부를 구비하고, 상기 고정 코드북 검색부는, 무반복 전역 펄스 교체를 통한 고정 코드북 검색을 수행하기 위해, (a) 펄스 위치 가능성 벡터 또는 상관도 벡터를 이용하여 초기 코드북 벡터를 결정하기 위한 수단; (b) 상기 초기 코드북 벡터에 대한 고정코드북 검색 판별값을 계산하기 위한 수단; (c) 상기 초기 코드북 벡터를 각 트랙별로 한 펄스씩 교체하여 얻어진 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 생성하는 펄스 위치를 각 트랙의 후보 펄스 위치로 결정하기 위한 수단; (d) 상기 초기 코드북 벡터의 펄스 위치를 상기 각 트랙의 후보 펄스 위치로 1개 이상 교체함으로써 얻어지는 모든 조합의 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 판단하기 위한 수단; (e) 상기 (b) 수단에 의해 구해진 상기 초기 코드북 벡터에 대한 고정코드북 판별값과 상기(d) 수단에 의해 판단된 최대값을 비교함으로써 최적의 고정코드북 벡터를 결정하기 위한 수단을 포함한다.
본 발명의 또다른 특징에 따른 CELP 인코더는, 선형 예측을 통해 음성 샘플간의 여분을 제거하는 선형예측 분석부와, 적응형 코드북 검색을 통해 상기 샘플간의 여분이 제거된 음성 샘플로부터 피치(pitch)를 구하는 적응형 코드북 검색부와, 상기 샘플간의 여분과 상기 피치가 제거된 음성 샘플과 가장 가까운 코드워드를 고정코드북으로부터 검색하는 고정 코드북 검색부를 포함하고, 상기 고정 코드북 검색부는 무반복 전역 펄스 교체를 통한 고정 코드북 검색을 수행하는 것을 특징으로 한다.
본 발명의 또다른 특징에 따른 CELP-기반 음성 부호화기는 인코더 및 디코더를 구비하고, 인코더는, 입력 신호를 로우밴드 및 하이밴드 입력신호로 분리하기 위한 QMF 필터 뱅크와, 상기 로우밴드 입력 신호로부터 선정된 주파수 이하의 주파수 성분을 제거하는 전처리를 수행하는 하이패스 필터와, 상기 하이패스 필터로부터 출력된 신호를 부호화하여 협대역 합성 신호를 생성하기 위한 CELP 인코더와, 상기 하이패스 필터에 의해 전처리된 신호와 상기 CELP 인코더에 의해 생성된 상기 합성 신호간의 차이 신호를 가중화하기 위한 인지가중필터와, 상기 인지가중필터에 의해 생성된 가중화된 차이 신호를 주파수 도메인 신호로 변환하기 위한 MDCT와, 상기 하이밴드 입력 신호로부터 소정 주파수 이상의 주파수 성분을 제거하기 위해 전처리를 수행하는 로우패스 필터와, 상기 로우패스 필터에 의해 전처리된 신호를 부호화하기 위한 TDBWE 인코더와, 상기 인지가중필터에 의해 생성된 상기 가중화된 차이 신호 및 상기 로우패스 필터에 의해 전처리된 신호를 주파수 도메인 신호로 변환하기 위한 MDCT와, 상기 MDCT에 의해 변환된 주파수 도메인 신호들을 부호화하기 위한 TDAC 인코더를 포함하고, 상기 CELP 인코더는 전술한 무반복 전역 펄스 교체를 통한 고정코드북 검색을 수행하는 것을 특징으로 한다.
본 발명의 또다른 특징에 따르면, 전술한 CELP-기반 음성 부호화기를 구비한 음성 단말 장치가 제공된다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 실시예를 상세히 설명한다.
본 발명은 ITU-T 표준 규격의 G.729 기반 임베디드 가변 비트율(Embeded Variable bit-rate: EV) 부호화기에 적용가능하다. G729EV 부호화기의 인코더 입력과 디코더 출력은 16000 Hz로 샘플링된다. 인코더에 의해 산출된 비트스트림은 12개의 임베디드층으로 구성되는데, 이들은 레이어(Layer) 1 내지 12로 지칭된다. 레이어 1은 8 kbit/s의 비트율에 대응하는 코어 레이어(core layer)이고, 레이어 2는 4 kbit/s가 추가된 협대역 증진(enhancement) 레이어이고, 레이어 3 내지 12는 2 kbit/s의 스텝으로 20 kbit/s가 추가된 광대역 증진 레이어이다.
G.729EV 부호화기는, 임베디드 CELP(Code-Excited Linear-Prediction) 코딩, TDBWE(Time-Domain Bandwidth Extension) 코딩 및 TDAC(Time-domain Aliasing Cancellation) 코딩의 3-스테이지 구조를 갖는다. 임베디드 CELP 코딩 스테이지는 8 및 12 kbit/s의 협대역 합성음(50-4000 Hz)을 산출하는 레이어 1 및 2를 생성하고, TDBWE 코딩 스테이지는 14 kbit/s의 광대역 출력(50-7000 Hz)를 산출하는 레이어 3을 생성하고, TDAC 코딩 스테이지는 MDCT(Modified Discrete Cosine Transform) 도메인에서 작동되며 음질을 향상시기키 위해 14-32 kbit/s의 레이어 4-12를 생성한다.
도 2a 및 2b는 G.729EV 부호화기(codec)의 인코더 및 디코더 기능도를 나타낸다. 도 2a에 도시된 바와 같이, 인코더측에서, H1(z) 및 H2(z)로 도시된 QMF 필터 뱅크를 이용하여 입력 신호 SWB(n)를 2개의 서브밴드로 분리한다. 다음, 데시메 이션(decimation, ↓2)을 통해 얻어진 로우-밴드 입력 신호는 소정 주파수(예,50 Hz) 미만의 주파수 성분을 제거하기 위해 하이패스 필터 Hh1(z)에 의해 전처리되고, 그 결과에 따른 신호 SLB(n)는 협대역 CELP 인코더에 의해 처리된다. CELP 인코더는 선형 예측(Linear Prediction: LP) 분석, 적응형 코드북(Adaptive codebook) 검색 및 고정코드북(Fixed codebook) 검색 과정을 통해 합성 신호
Figure 112006074037753-pat00001
enh(n)을 산출한다. LP 분석은 음성 샘플간의 여분을 제거하는 과정이고, 적응형 코드북 검색은 적응형 코드북 검색을 통해 상기 샘플간의 여분이 제거된 음성 샘플로부터 피치(pitch)를 구하는 과정이며, 고정 코드북 검색은 샘플간의 여분과 피치 성분을 제거한 음성 샘플과 가장 가까운 코드워드를 고정 코드북으로부터 검색하는 과정이다.
다음, 하이패스 필터 Hh1(z)에 의해 전처리된 신호 S(n)와 CELP 인코더에 의해 산출된 합성 신호
Figure 112006074037753-pat00002
enh(n)간의 차이를 나타내는 신호 dLB(n)가 인지가중필터(perceptual weighting filter, WLB(z))에 의해 가중화된다. WLB(z) 필터의 파라미터들은 CELP 인코더에 의해 양자화된 선형 예측(LP) 계수들로부터 도출된다. 또한, WLB(z) 필터는 자신의 출력과 하이밴드 입력 신호 SHB(n)간의 스펙스럼 연속성을 보장하기 위한 이득 보상(gain compensation)을 수행한다. WLB(z) 필터의 출력은 MDCT에 의해 주파수 도메인 신호로 변환된다.
한편, 데시메이션(↓2) 및 스펙트럼 폴딩(spectral folding, (-1)n)에 의해 얻어진 하이밴드 입력 신호는 소정 주파수 이상(예, 3000 Hz 이상)의 주파수 성분을 제거하기 위해 로우패스 필터 Hh2(z)에 의해 전처리되고, 그 결과 신호는 TDBWE 인코더에 의해 부호화된다. 또한, MDCT는 Hh2(z)에 의해 전처리된 신호를 주파수 도메인 신호로 변환한다. MDCT에 의해 주파수 도메인으로 변환된 신호들(i.e., MDCT 계수들)은 최종적으로 TDAC 인코더에 의해 부호화된다. 또한, 음질 향상을 위해 비트스트림내에 파라미터-레벨 리던던시를 삽입하기 위해 FEC 인코더에 의해 일부 파라미터들이 전송된다.
도 2b는 G.729EV 기반 디코더의 기능을 도시한다. 디코더는 전술한 인코더의 역과정을 수행함으로써 복호화를 수행하는 것으로서, 복호화 과정은 실제로 디코더에 수신된 레이어 개수 또는 수신된 비트율에 따라 달라진다. 수신된 비트율이 8 bit/s(레이어 1 포함) 또는 12 kbit/s(레이어 1 및 2)인 경우에는 CELP 디코딩이 수행되며, 14 kbit/s(레이어 1-3 포함)인 경우에는 CELP 디코딩 및 TDBWE 디코딩이 수행되고, 14 kbit/s를 초과하는 경우, 즉, 레이어 4개 이상 포함하는 경우에는 CELP 디코딩 및 TDBWE 디코딩이외에 TDAC 디코딩이 수행될 것이다. G.729EV 인코더 및 디코더의 구체적인 구조 및 기능은 ITU-T G.729.1 ("G.729 based Embedded Variable bit-rate coder: An 8-32 kbit/s scalable wideband coder bitstream interoperable with G.729", 2006.5 공개됨)에 상세히 기재되어 있으므로, 이를 참조하기 바란다.
본 발명은 이와 같이 도 2a 및 2b에 도시된 음성 부호화기(codec)에 적용되 며, 후술하는 본 발명의 일실시예는 G.729.1 8 kbps 모드에 기반하여 설명된다. G.729.1 8 kbps 모드에서 부프레임(subframe)의 전체 펄스 위치 개수인 M은 40이고, 부프레임내의 펄스 개수인 N p 는 4이다.
CELP 인코더에서 수행되는 고정 코드북 검색은 다음의 수학식 1을 최대화하는 코드북 벡터를 선택하는 것이다.
Figure 112006074037753-pat00003
여기서 c k k번째 고정 코드북 벡터(fixed codevector)이고 t는 전치 행렬(transpose matrix)을 나타낸다. 또한, 상관도 벡터(correlation vector or backward filtered target vector)인 d와 자기상관행렬(autocorrelation matrix) Φ 는 각각 다음의 수학식으로 표현된다.
Figure 112006074037753-pat00004
Figure 112006074037753-pat00005
상기에서 M은 부프레임(subframe)의 전체 펄스 위치 수이고, x 2(n)은 고정 코드북 검색을 위한 대상 신호(target signal)이며 h(n)은 선형예측 합성필터의 임펄스 응답(impulse response)을 나타낸다.
이하의 표 1은 G.729.1 8kbps 모드에 대한 고정 코드북 구조를 나타낸 도표이다. 표 1에 나타난 바와 같이 G.729.1 8kbps 모드에서 M은 40이다.
트랙 펄스 펄스 위치
0
Figure 112006074037753-pat00006
Figure 112006074037753-pat00007
0, 5, 10, 15, 20, 25, 30, 35
1
Figure 112006074037753-pat00008
Figure 112006074037753-pat00009
1, 6, 11, 16, 21, 26, 31, 36
2
Figure 112006074037753-pat00010
Figure 112006074037753-pat00011
2, 7, 12, 17, 22, 27, 32, 37
3
Figure 112006074037753-pat00012
Figure 112006074037753-pat00013
3, 8, 13, 18, 23, 28, 33, 38, 4, 9, 14, 19, 24, 29, 34, 39
또한, 상기한 수학식 1에서의 분자와 분모는 각각 다음의 수학식 4와 수학식 5로 나타낼 수 있다.
Figure 112006074037753-pat00014
Figure 112006074037753-pat00015
여기서 N p 는 부프레임 내의 펄스 수(G.729.1 8kbps 모드에서 N p = 4)를 나타내고 m i i번째 펄스 위치를 나타내며 s i , s j 는 각각 i, j번째 펄스 부호를 나타낸다. 본 발명에서, 펄스 부호는 음성부호화기에서 부호화될 언어적 특성에 따라 상관도 벡터(d) 또는 펄스 위치 가능성 추정 벡터(b)를 이용하여 결정될 수 있다. 즉, s i = sign{d(i)} 또는 s i = sign{b(i)} 로 나타낼 수 있다.
b(n)은 펄스 위치 가능성 추정 벡터의 n번째 인자로서 다음의 수학식 6과 같이 표현된다.
Figure 112006074037753-pat00016
여기서, r LTP (n)은 피치 잔여 신호(long-term prediction signal)를 의미한다. 따라서, b(n)은 피치 잔여 신호와 상관도(correlation)의 함수라 할 수 있다.
도 3은 본 발명의 일실시예에 따른 무반복 전역 펄스 교체를 이용한 고정 코드북 검색 방법의 절차를 도시한 흐름도이다.
우선, 단계(310)에서, 펄스 위치 가능성 벡터 또는 상관도 벡터를 이용하여 초기 코드북 벡터를 결정한다. 초기 코드북 벡터의 결정은 트랙별 각 펄스 위치에 대한 펄스 위치 가능성 추정 벡터 또는 상관도 벡터 내 인자의 절대값이 큰 위치부 터 트랙당 N p 개, 총 트랙수 N p 개의 펄스 위치를 선택하여 초기 코드북 벡터(initial codevector)를 결정한다.
이하의 표 2는 G.729.1 8kbps 모드의 특정 부프레임에서 트랙 0, 1, 2, 3의 각 펄스 위치에 대한 펄스 위치 가능성 추정 벡터 내 인자의 크기를 보여주고 있다. 표 2로부터 초기 코드북 벡터 (i 0, i 1, i 2, i 3)의 펄스 위치는 (30, 31, 32, 28)이 된다.
트랙 펄스 위치 가능성 추정 벡터 내 인자의 절대값
0 0.10, 0.31, 0.15, 0.02, 0.10, 0.17, 0.67, 0.35
1 0.29, 0.07, 0.06, 0.21, 0.00, 0.04, 0.32, 0.00
2 0.36, 0.17, 0.06, 0.04, 0.34, 0.29, 0.66, 0.05
3 0.18, 0.08, 0.43, 0.06, 0.10, 0.48, 0.16, 0.12, 0.33, 0.05, 0.13, 0.26, 0.11, 0.11, 0.11, 0.05
단계(320)에서 상기 초기 코드북 벡터로부터 고정 코드북을 검색하기 위해 사용되는 고정코드북 검색 판별값(Q init )을 구한다. 고정 코드북 검색 판별값은 초기 코드북 벡터로부터 전술한 수학식 1을 이용하여 계산된다.
단계(330)에서, 상기 초기 코드북 벡터를 각 트랙 별로 한 펄스씩 펄스를 교체하여 얻어진 코드북 벡터 각각에 대하여 고정 코드북 검색 판별값(Q k )을 계산한다. 예를 들어, 표 2의 초기 코드북 벡터의 펄스 위치 (30, 31, 32, 28)로부터 트랙 0에서는 펄스 위치 '30'을 다른 펄스 위치로 교체한 (0, 31, 32, 28), (5, 31, 32, 28), (10, 31, 32, 28), (15, 31, 32, 28), (20, 31, 32, 28), (25, 31, 32, 28), (35, 31, 32, 28)에 대해 각각 Q k 값을 구한다. 트랙 1에서는 펄스 위치 '31'을 다른 펄스 위치로 교체한 (30, 1, 32, 28), (30, 6, 32, 28), (30, 11, 32, 28), (30, 16, 32, 28), (30, 21, 32, 28), (30, 26, 32, 28), (30, 36, 32, 28), 에 대해 각각 Q k 값을 구한다.트랙 2에서는 펄스 위치 '32'를 다른 펄스 위치로 교체한 (30, 31, 2, 28), (30, 31, 7, 28), (30, 31, 12, 28), (30, 31, 17, 28), (30, 31, 22, 28), (30, 31, 27, 28), (30, 31, 37, 28)에 대해 각각 Q k 값을 구한다. 트랙 3에서는 펄스 위치 '28'을 다른 펄스 위치로 교체한 (30, 31, 32, 3), (30, 31, 32, 8), (30, 31, 32, 13), (30, 31, 32, 18), (30, 31, 32, 23), (30, 31, 32, 28), (30, 31, 32, 33), (30, 31, 32, 38), (30, 31, 32, 9), (30, 31, 32, 14), (30, 31, 32, 19), (30, 31, 32, 24), (30, 31, 32, 29), (30, 31, 32, 34), (30, 31, 32, 39)에 대해 각각 Q k 값을 구한다.
단계(340)에서, 상기 각 트랙 별로 한 펄스식의 펄스 교체에 의해 얻어진 코드북벡터들에 대한 고정 코드북 검색 판별값들 중에서 각 트랙별로 최대값을 찾는다. 예를 들어, 표 2의 초기 코드북 벡터의 펄스 위치로부터 트랙 0에서 한 펄스씩 교체하여 구해진 7개의 Q k 값, 트랙 1에서 한 펄스씩 교체하여 구해진 7개의 Q k 값, 트랙 2에서 한 펄스씩 교체하여 구해진 7개의 Q k 값, 트랙 3에서 한 펄스씩 교체하여 구해진 15개의 Q k 값으로부터 트랙 별로 각각 한 개씩, 총 4개의 최대 Q k 값을 찾는다.
단계(140)에서는 각 트랙 별로 상기 최대값을 생성하는 펄스 위치를 각 트랙의 후보 펄스 위치(candidate pulse position)로 결정한다. 예를 들어, 트랙 0에서 (5, 31, 32, 28)이 최대 Q k 값을 생성하면 트랙 0의 후보 펄스 위치는 '5'가 되고, 트랙 1에서 (30, 21, 32, 28)이 최대 Q k 값을 생성하면 트랙 1의 후보 펄스 위치는 '21'이 되고, 트랙 2에서 (30, 31, 17, 28)이 최대 Q k 값을 생성하면 트랙 2의 후보 펄스 위치는 '17'이 되고, 트랙 3에서 (30, 31, 32, 19)이 최대 Q k 값을 생성하면 트랙 3의 후보 펄스 위치는 '19'가 된다.
단계(360)에서, 초기 코드북 벡터의 하나 이상의 펄스 위치를 각 트랙의 후보 펄스 위치로 교체함으로써 얻을 수 있는 모든 조합의 코드북 벡터 각각에 대해 판별값(Q cmb_k )을 계산한다. 즉, 초기 코드북 벡터로부터 한 트랙의 펄스가 교체되는 경우, 두 트랙의 펄스가 교체되는 경우, 세 트랙의 펄스가 교체되는 경우, 네 트랙의 펄스가 교체되는 경우의 모든 조합에 대해 판별값(Q cmb_k )을 계산한다.
일례로서 초기 코드북 벡터의 펄스 위치 (30, 31, 32, 28)로부터 각 트랙 별 후보 펄스 위치 (5, 21, 17, 19)로 교체 가능한 조합을 모두 고려하면, 초기 코드북 벡터로부터 한 트랙의 펄스가 교체되는 경우는 (5, 31, 32, 28), (30, 21, 32, 28), (30, 31, 17, 28), (30, 31, 32, 19)로서 4 가지(4C1)이고, 초기 코드북 벡터로부터 두 트랙의 펄스가 교체되는 경우는 (5, 21, 32, 28), (5, 31, 17, 28), (5, 31, 32, 19), (30, 21, 17, 28), (30, 21, 32, 19), (30, 31, 17, 19)로서 6 가지(4C2)이고, 초기 코드북 벡터로부터 세 트랙의 펄스가 교체되는 경우는 (5, 21, 17, 28), (5, 21, 32, 19), (5, 31, 17, 19), (30, 21, 17, 19)로서 4 가지(4C3)이고, 초기 코드북 벡터로부터 네 트랙의 펄스가 교체되는 경우는 (5, 21, 17, 19)로서 1 가지(4C4)이다.
단계(370)에서, 상기 교체 가능한 모든 조합의 코드북 벡터에 대해 구해진 판별값들 중에서 최대 판별값(Q max )을 찾는다. 일례로서, 전술한 15 가지 조합의 펄스 위치에 대해서 최대 판별값을 구한다.
단계(380)에서, 단계(320)에서 계산된 초기 코드북 벡터의 판별값(Q init )과 단계(370)에서 구해진 교체 가능한 모든 조합에 대한 최대 판별값(Q max )을 비교한다.
상기 교체 가능한 모든 조합에 대한 최대 판별값(Q max )이 초기 코드북 벡터의 판별값(Q init )보다 크면 상기 최대 판별값을 생성한 펄스 위치들로 펄스들을 교체하여 최적 코드북 벡터를 결정하고(400), 그렇지 않으면 초기 코드북 벡터를 최적 코드북 벡터로 결정한다(390). 예를 들어, 전술한 15 가지 조합의 펄스 위치 중에서 초기 코드북 벡터로부터 두 트랙의 펄스가 교체된 (5, 31, 17, 28)의 펄스 위치가 최대 판별값을 생성하고 이러한 최대 판별값이 초기 코드북 벡터의 판별값보다 크다면 (5, 31, 17, 28)이 최적 코드북 벡터의 펄스 위치로 결정된다.
또한, 표 3에 나타난 바와 같이 본 발명에 따른 무반복 전역 펄스 교체 방식과 기존의 전역 펄스 교체 방식에서 초기 코드북 벡터를 결정하는 방법과 판별값 계산 과정에서 수학식 4와 수학식 5의 부호를 결정하는 방법에 따라 음질이 달라질 수 있다.
고정코드북 검색 방법 M1 M2 M3 M4
기존의 전역 펄스 교체 방식 3.758 3.759 3.763 3.756
무반복 전역 펄스 교체 방식 3.730 3.737 3.747 3.745
M1: 상관도 벡터( d )에 의해 초기 코드북 벡터 결정 & s i = sign{d(i)}
M2: 상관도 벡터( d )에 의해 초기 코드북 벡터 결정 & s i = sign{b(i)}
M3: 펄스 위치 가능성 추정 벡터( b )에 의해 초기 코드북 벡터 결정 & s i = sign{d(i)}
M4: 펄스 위치 가능성 추정 벡터( b )에 의해 초기 코드북 벡터 결정 & s i = sign{b(i)}
표 4는 G.729.1 8kbps 모드에 적용된 깊이 우선 트리 검색 방식, 기존의 전역 펄스 교체 방식 및 본 발명에 따른 무반복 전역 펄스 교체 방식의 연산량 비교 결과를 보여준다.
고정코드북 검색 방법 연산량 PESQ
깊이 우선 트리 검색 320 3.76
기존의 전역 펄스 교체 118 3.76
무반복 전역 펄스 교체 48 3.75
상기 예에서 기존의 전역 펄스 교체 방식은 펄스 교체 과정을 4회 반복하였고 실험 음성 샘플은 표 5에 기재되어 있다. 상기 표에서 PESQ(Perceptual Evaluation of Speech Quality)는 원신호와 이 신호가 통신 시스템을 통과한 결과인 감쇄된 신호를 비교하는 평가 기준이다.
음성 샘플 유형 잡음레벨 비고
Korean - 3 males & 3 females with each 5 samples
Korean + Music Noise 25 dB SNR 3 males & 3 females with each 5 samples
Korean + Office Noise 20 dB SNR 3 males & 3 females with each 5 samples
Korean + Babble Noise 30 dB SNR 3 males & 3 females with each 5 samples
Korean + Interfering Talker 15 dB SNR 3 males & 3 females with each 5 samples
이와 같은 실험 결과에 의하면, 다국적 언어에 따라 초기 코드북 벡터를 결정하는 방법과 판별값 계산 과정에서 수학식 4와 수학식 5의 부호를 결정하는 방법이 서로 달라질 수 있으므로 언어의 특성에 맞게 최적의 방법을 사용하는 것이 바람직하다.
무반복 전역 펄스 교체 방식은 깊이 우선 트리 검색 방식과 기존의 전역 펄스 교체 방식에 비해 음질을 거의 동일하면서 연산량은 획기적으로 감소하게 된다. 따라서, 무반복 전역 펄스 교체 방식을 이용하여 고정 코드북을 검색하면 연산량을 대폭 감소시키면서도 음질은 그대로 유지할 수 있다.
이와 같이 무반복 전역 펄스 교체 방식이 기존의 전역 펄스 교체 방식에 비해 연산량을 대폭 감소시키면서 음질을 그대로 유지할 수 있는 요인은 첫째, 최적 코드북 벡터는 초기 코드북 벡터의 펄스 위치로부터 각 트랙 별 후보 펄스 위치로 교체되어 결정될 확률이 높기 때문이고 둘째, 기존의 전역 펄스 교체 방식에서는 한 펄스씩 교체하여 총 4 번의 반복 과정에 의해 초기 코드북 벡터의 펄스 위치로부터 각 트랙 별 후보 펄스 위치로 교체가 되지만 무반복 전역 펄스 교체 방식에서는 초기 코드북 벡터의 펄스 위치로부터 각 트랙 별 후보 펄스 위치로 교체 가능한 모든 조합에 대해서 한 번에 모두 비교함으로써 불필요한 반복 과정이 제거되기 때문이다.
본 발명에 의한 음성 부호화기의 고정 코드북 검색 방식은 대수 코드북 구조를 갖는 여러 가지 형태의 고정 코드북 검색에 동일하게 적용될 수 있다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록 매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장되거나 휴대폰이나 VoIP 전화기와 같은 음성 단말 장치에 사용될 수 있다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
전술한 바와 같이, 본 발명에 따르면, 기존의 전역 펄스 교체 방식에 비해 음질을 그대로 유지하면서 연산량을 대폭 감소시킬 수 있는 효과가 있다.

Claims (9)

  1. 음성 부호화기의 고정 코드북 검색 방법에 있어서,
    (a) 펄스 위치 가능성 벡터 또는 상관도 벡터를 이용하여 초기 코드북 벡터를 결정하는 단계;
    (b) 상기 초기 코드북 벡터에 대한 고정코드북 검색 판별값을 계산하는 단계;
    (c) 상기 초기 코드북 벡터를 각 트랙별로 한 펄스씩 교체하여 얻어진 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 생성하는 펄스 위치를 각 트랙의 후보 펄스 위치로 결정하는 단계;
    (d) 상기 초기 코드북 벡터의 하나 이상의 펄스 위치를 상기 각 트랙의 후보 펄스 위치로 교체함으로써 얻어진 모든 조합의 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 판단하는 단계;
    (e) 상기 (b) 단계에서 구해진 상기 초기 코드북 벡터에 대한 고정코드북 판별값과 상기(d) 단계에서 판단된 최대값을 비교함으로써 최적의 고정코드북 벡터를 결정하는 단계
    를 포함하는 고정코드북 검색 방법.
  2. 제 1 항에 있어서,
    상기 (a) 단계는 상기 음성 부호화기에서 처리될 언어적 특성에 따라 펄스 위치 가능성 추정 벡터를 이용하거나 상관도 벡터를 이용하는 고정코드북 검색 방법.
  3. 제 1 항에 있어서,
    상기 (b) 단계 내지 (d) 단계에서의 고정코드북 검색 판별값 계산은 상기 음성 부호화기에서 처리될 언어적 특성에 따라 상관도 벡터를 이용하거나 펄스 위치 가능성 추정 벡터를 이용하는 고정 코드북 검색 방법.
  4. 제1항에 있어서, 상기 (e) 단계는,
    (e1) 상기 초기 코드북 벡터에 대한 고정코드북 판별값이 큰 것으로 판단되면 상기 초기 코드북 벡터를 최적 코드북 벡터로 결정하는 단계; 및
    (e2) 상기(d) 단계에서 판단된 최대값이 큰 것으로 판단되면 상기 최대값을 생성한 코드북 벡터를 최적 코드북 벡터로 결정하는 단계
    를 포함하는 고정 코드북 검색 방법.
  5. 음성 부호화기에서 제1항 내지 제4항중 어느 하나의 항에 따른 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법을 수행하기 위한 프로그램을 기록한 컴퓨터 판독가능 기록매체.
  6. 선형예측 분석부, 적응형 코드북 검색부 및 고정 코드북 검색부를 구비한 CELP 인코더에서, 상기 고정 코드북 검색부는, 고정 코드북 검색을 수행하기 위해,
    (a) 펄스 위치 가능성 벡터 또는 상관도 벡터를 이용하여 초기 코드북 벡터를 결정하기 위한 수단;
    (b) 상기 초기 코드북 벡터에 대한 고정코드북 검색 판별값을 계산하기 위한 수단;
    (c) 상기 초기 코드북 벡터를 각 트랙별로 한 펄스씩 교체하여 얻어진 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 생성하는 펄스 위치를 각 트랙의 후보 펄스 위치로 결정하기 위한 수단;
    (d) 상기 초기 코드북 벡터의 펄스 위치를 상기 각 트랙의 후보 펄스 위치로 1개 이상 교체함으로써 얻어지는 모든 조합의 코드북 벡터 각각에 대한 고정코드북 검색 판별값을 계산하고 이들중 최대값을 판단하기 위한 수단;
    (e) 상기 (b) 수단에 의해 구해진 상기 초기 코드북 벡터에 대한 고정코드북 판별값과 상기(d) 수단에 의해 판단된 최대값을 비교함으로써 최적의 고정코드북 벡터를 결정하기 위한 수단
    을 포함하는 CELP 인코더.
  7. 삭제
  8. 인코더 및 디코더를 구비하는 CELP-기반 음성 부호화기에 있어서, 상기 인코더는,
    입력 신호를 로우밴드 및 하이밴드 입력신호로 분리하기 위한 QMF 필터 뱅크와,
    상기 로우밴드 입력 신호로부터 선정된 주파수 이하의 주파수 성분을 제거하는 전처리를 수행하는 하이패스 필터와,
    상기 하이패스 필터로부터 출력된 신호를 부호화하여 협대역 합성 신호를 생성하기 위한 CELP 인코더와,
    상기 하이패스 필터에 의해 전처리된 신호와 상기 CELP 인코더에 의해 생성된 상기 합성 신호간의 차이 신호를 가중화하기 위한 인지가중필터와,
    상기 인지가중필터에 의해 생성된 가중화된 차이 신호를 주파수 도메인 신호로 변환하기 위한 MDCT와,
    상기 하이밴드 입력 신호로부터 소정 주파수 이상의 주파수 성분을 제거하기 위해 전처리를 수행하는 로우패스 필터와,
    상기 로우패스 필터에 의해 전처리된 신호를 부호화하기 위한 TDBWE 인코더와,
    상기 인지가중필터에 의해 생성된 상기 가중화된 차이 신호 및 상기 로우패스 필터에 의해 전처리된 신호를 주파수 도메인 신호로 변환하기 위한 MDCT와,
    상기 MDCT에 의해 변환된 주파수 도메인 신호들을 부호화하기 위한 TDAC 인코더를 포함하고,
    상기 CELP 인코더는 제1항에 따른 고정 코드북 검색을 수행하는 것을 특징으로 하는 CELP-기반 음성 부호화기.
  9. 제8항에 따른 CELP-기반 음성 부호화기를 구비한 음성 단말 장치.
KR1020060099769A 2005-12-08 2006-10-13 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및이를 이용한 음성 부호화기 KR100911426B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
PCT/KR2007/001749 WO2008044817A1 (en) 2006-10-13 2007-04-11 Fixed codebook search method through iteration-free global pulse replacement and speech coder using the same method
US12/442,554 US8249864B2 (en) 2005-12-08 2007-04-11 Fixed codebook search method through iteration-free global pulse replacement and speech coder using the same method

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20050119938 2005-12-08
KR1020050119938 2005-12-08

Publications (2)

Publication Number Publication Date
KR20070061330A KR20070061330A (ko) 2007-06-13
KR100911426B1 true KR100911426B1 (ko) 2009-08-11

Family

ID=38357130

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020060061746A KR100795727B1 (ko) 2005-12-08 2006-07-03 Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법
KR1020060099769A KR100911426B1 (ko) 2005-12-08 2006-10-13 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및이를 이용한 음성 부호화기

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020060061746A KR100795727B1 (ko) 2005-12-08 2006-07-03 Celp기반의 음성 코더에서 고정 코드북 검색 장치 및방법

Country Status (2)

Country Link
US (1) US8249864B2 (ko)
KR (2) KR100795727B1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2458413C2 (ru) * 2007-07-27 2012-08-10 Панасоник Корпорэйшн Устройство кодирования аудио и способ кодирования аудио
CN100578619C (zh) 2007-11-05 2010-01-06 华为技术有限公司 编码方法和编码器
CN100578620C (zh) * 2007-11-12 2010-01-06 华为技术有限公司 固定码书搜索方法及搜索器
CN101931414B (zh) * 2009-06-19 2013-04-24 华为技术有限公司 脉冲编码方法及装置、脉冲解码方法及装置
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
KR20120032444A (ko) 2010-09-28 2012-04-05 한국전자통신연구원 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치
WO2012044067A1 (ko) * 2010-09-28 2012-04-05 한국전자통신연구원 적응 코드북 업데이트를 이용한 오디오 신호 디코딩 방법 및 장치
CA2929800C (en) * 2010-12-29 2017-12-19 Samsung Electronics Co., Ltd. Apparatus and method for encoding/decoding for high-frequency bandwidth extension
US20130211846A1 (en) * 2012-02-14 2013-08-15 Motorola Mobility, Inc. All-pass filter phase linearization of elliptic filters in signal decimation and interpolation for an audio codec
CN105551497B (zh) 2013-01-15 2019-03-19 华为技术有限公司 编码方法、解码方法、编码装置和解码装置
US9418671B2 (en) * 2013-08-15 2016-08-16 Huawei Technologies Co., Ltd. Adaptive high-pass post-filter

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010095585A (ko) * 2000-04-11 2001-11-07 대표이사 서승모 음성 부호화기의 고정코드북 고속탐색 방법
KR20040041716A (ko) * 2002-11-11 2004-05-20 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2108623A1 (en) * 1992-11-02 1994-05-03 Yi-Sheng Wang Adaptive pitch pulse enhancer and method for use in a codebook excited linear prediction (celp) search loop
JPH06186998A (ja) 1992-12-15 1994-07-08 Nec Corp 音声符号化装置のコードブック探索方式
KR19990055847A (ko) * 1997-12-29 1999-07-15 윤종용 가변율 음성부호화기를 위한 코드북 설계 방법
SE521225C2 (sv) * 1998-09-16 2003-10-14 Ericsson Telefon Ab L M Förfarande och anordning för CELP-kodning/avkodning
KR100341398B1 (ko) * 2000-01-27 2002-06-22 오길록 씨이엘피형 보코더의 코드북 검색 방법
US6980948B2 (en) 2000-09-15 2005-12-27 Mindspeed Technologies, Inc. System of dynamic pulse position tracks for pulse-like excitation in speech coding
US7206739B2 (en) * 2001-05-23 2007-04-17 Samsung Electronics Co., Ltd. Excitation codebook search method in a speech coding system
KR100438175B1 (ko) * 2001-10-23 2004-07-01 엘지전자 주식회사 코드북 검색방법
KR20030092921A (ko) * 2002-05-31 2003-12-06 주식회사 현대시스콤 음성 시스템에서 코드북 인덱스 탐색 방법
US7003461B2 (en) * 2002-07-09 2006-02-21 Renesas Technology Corporation Method and apparatus for an adaptive codebook search in a speech processing system
KR100463418B1 (ko) * 2002-11-11 2004-12-23 한국전자통신연구원 Celp 음성 부호화기에서 사용되는 가변적인 고정코드북 검색방법 및 장치
KR100503414B1 (ko) 2002-11-14 2005-07-22 한국전자통신연구원 고정 코드북의 집중 검색 방법 및 장치
KR100556831B1 (ko) * 2003-03-25 2006-03-10 한국전자통신연구원 전역 펄스 교체를 통한 고정 코드북 검색 방법
US20050256702A1 (en) * 2004-05-13 2005-11-17 Ittiam Systems (P) Ltd. Algebraic codebook search implementation on processors with multiple data paths
CN100498934C (zh) 2005-10-31 2009-06-10 连展科技(天津)有限公司 一种新型的快速固定码本搜索方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010095585A (ko) * 2000-04-11 2001-11-07 대표이사 서승모 음성 부호화기의 고정코드북 고속탐색 방법
KR20040041716A (ko) * 2002-11-11 2004-05-20 한국전자통신연구원 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법

Also Published As

Publication number Publication date
KR20070061330A (ko) 2007-06-13
US20100088091A1 (en) 2010-04-08
KR20070061193A (ko) 2007-06-13
KR100795727B1 (ko) 2008-01-21
US8249864B2 (en) 2012-08-21

Similar Documents

Publication Publication Date Title
KR100911426B1 (ko) 무반복 전역 펄스 교체를 통한 고정 코드북 검색 방법 및이를 이용한 음성 부호화기
KR101406113B1 (ko) 스피치 신호에서 천이 프레임을 코딩하기 위한 방법 및 장치
JP5325292B2 (ja) 信号の異なるセグメントを分類するための方法および識別器
US8566106B2 (en) Method and device for fast algebraic codebook search in speech and audio coding
JP5357055B2 (ja) 改良形デジタルオーディオ信号符号化/復号化方法
KR101224559B1 (ko) 캐스케이드 된 스위치를 구비하는 저 비트레이트 오디오 인코딩/디코딩 기법
CN109545236B (zh) 改进时域编码与频域编码之间的分类
JP3481390B2 (ja) 短期知覚重み付けフィルタを使用する合成分析音声コーダに雑音マスキングレベルを適応する方法
KR101441474B1 (ko) 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
CA2815249C (en) Coding generic audio signals at low bitrates and low delay
JP2011518345A (ja) スピーチライク信号及びノンスピーチライク信号のマルチモードコーディング
US6678651B2 (en) Short-term enhancement in CELP speech coding
CN111105807B (zh) 对线性预测编码系数进行量化的加权函数确定装置和方法
KR101924192B1 (ko) 계층형 정현파 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치
EP2763137A2 (en) Voice signal encoding method, voice signal decoding method, and apparatus using same
Geiser et al. Candidate proposal for ITU-T super-wideband speech and audio coding
Kuo et al. Speech classification embedded in adaptive codebook search for low bit-rate CELP coding
Moriya et al. Progress in LPC-based frequency-domain audio coding
WO2008044817A1 (en) Fixed codebook search method through iteration-free global pulse replacement and speech coder using the same method
Lee et al. Efficient fixed codebook search method for ACELP speech codecs
Ragot et al. A 8-32 kbit/s scalable wideband speech and audio coding candidate for ITU-T G729EV standardization
Jung et al. A bit-rate/bandwidth scalable speech coder based on ITU-T G. 723.1 standard
Heute Speech and audio coding—aiming at high quality and low data rates
KR20100006491A (ko) 무성음 부호화 및 복호화 방법 및 장치
Jeong et al. Embedded bandwidth scalable wideband codec using hybrid matching pursuit harmonic/CELP scheme

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee