KR101771065B1 - 씨이엘피 부호기 및 복호기에 사용하기 위한 가요성 및 스케일러블 조합형 이노베이션 코드북 - Google Patents

씨이엘피 부호기 및 복호기에 사용하기 위한 가요성 및 스케일러블 조합형 이노베이션 코드북 Download PDF

Info

Publication number
KR101771065B1
KR101771065B1 KR1020127023628A KR20127023628A KR101771065B1 KR 101771065 B1 KR101771065 B1 KR 101771065B1 KR 1020127023628 A KR1020127023628 A KR 1020127023628A KR 20127023628 A KR20127023628 A KR 20127023628A KR 101771065 B1 KR101771065 B1 KR 101771065B1
Authority
KR
South Korea
Prior art keywords
codebook
celp
innovation
contribution
excitation
Prior art date
Application number
KR1020127023628A
Other languages
English (en)
Other versions
KR20130069546A (ko
Inventor
브뤼노 브세뜨
Original Assignee
보이세지 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=44798205&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=KR101771065(B1) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by 보이세지 코포레이션 filed Critical 보이세지 코포레이션
Publication of KR20130069546A publication Critical patent/KR20130069546A/ko
Application granted granted Critical
Publication of KR101771065B1 publication Critical patent/KR101771065B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • G10L19/107Sparse pulse excitation, e.g. by using algebraic codebook
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • G10L19/125Pitch excitation, e.g. pitch synchronous innovation CELP [PSI-CELP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Abstract

CELP 부호기에 있어서, 조합형 이노베이션 코드북 부호화 장치는 제 1 적응적 코드북 여기 잔차(first, adaptive-codebook excitation residual)의 전치 양자화기(pre-quantizer)와, 상기 제 1 적응적 코드북 여기 잔차로부터 생성된 제 2 여기 잔차(second excitation residual)에 응답하는 CELP 이노베이션 코드북 모듈(innovation-codebook module)을 포함한다. CELP 복호기에 있어서, 조합형 이노베이션 코드북은 제 1 여기 기여(a first excitation contribution)로의 전치 양자화된 부호화 파라메타(coding parameters)의 역 양자화기와, 제 2 여기 기여(a second excitation contribution)를 생성하기 위해 CELP 이노베이션 코드북 파라메타(innovation-codebook parameters)에 응답하는 CELP 이노베이션 코드북 구조를 포함한다.

Description

씨이엘피 부호기 및 복호기에 사용하기 위한 가요성 및 스케일러블 조합형 이노베이션 코드북{FLEXIBLE AND SCALABLE COMBINED INNOVATION CODEBOOK FOR USE IN CELP CODER AND DECODER}
본 발명은 CELP(Code-Exited Linear Prediction) 부호기 및 복호기에 사용하기 위한 조합형 이노베이션 코드북(combined innovation codebook) 장치에 관한 것이다.
CELP 모델은 소리 신호(sound signal), 예를 들어, 음성(speech)을 낮은 비트 속도(low bit rate)로 부호화하는데 널리 이용된다. CELP에 있어서, 소리 신호는 시 가변 합성 필터(time-varying synthesis filter)를 통해 처리되는 여기(excitation)로서 모델링된다. 시 가변 합성 필터가 많은 형태를 취하지만, 선형 회귀 올-폴 필터(linear recursive all-pole filter)가 이용되곤 한다. 이러한 시 가변 합성 필터의 역(inverse), 즉 선형 올-제로 비회귀 필터(linear all-zero non-recursive filter)를 STP(Short-Term Prediction) 필터라고 하는데, 이는 그 필터가 소리 신호의 샘플 s[i]와 소리 신호의 이전 샘플 s[i-1], s[i-2], .., s[i-m]의 가중합(weighted sum)간의 예측 에러(prediction error)를 최소화하는 방식으로 계산된 계수를 포함하기 때문이며, 이때, m은 필터의 차수이다. STP 필터용으로 자주 이용되는 다른 디노미네이션(denomination)으로는 LP(Linear Prediction) 필터가 있다.
LP 필터로부터의 예측 에러의 잔차(residual)가 적절한 초기 상태를 가진 시 가변 합성 필터의 입력으로서 인가되면, 합성 필터의 출력은 음성과 같은 원음 신호(original sound signal)가 된다. 낮은 비트 속도에서는 정확한 예측 에러 잔차를 전송할 수 없다. 따라서, 예측 에러 잔차는 부호화되어, 여기(excitation)라고 하는 근사치를 형성한다. 종래의 CELP 부호기에 있어서, 여기는 2개의 기여(contribution)의 합으로서 부호화되는데, 첫번 째 기여는 소위 적응적 코드북(adaptive codebook)으로부터 생성되고, 두번째 기여는 소위 이노베이션(innovation) 또는 고정 코드북(fixed codebook)으로부터 생성된다. 적응적 코드북은 필연적으로 적절한 이득을 가진 과거 여기로부터의 샘플들의 블럭이다. 이노베이션 또는 고정 코드북에는 LP 필터 및 적응적 코드북으로부터의 예측 에러 잔차를 부호화하는 작업을 하는 코드벡터들로 채워져 있다.
이노베이션 또는 고정 코드북은 많은 구조 및 제약을 이용하여 고안될 수 있다. 그러나, 현재의 음성 부호화 시스템에서는, ACELP(Algebra Code-Excited Linear Prediction) 모델이 이용되곤 한다. ACELP는 음성 부호화 분야의 당업자에게 잘 알려져 있으며, 따라서, 본 명세서에서는 상세하게 설명하지 않을 것이다. 요약하면, ACELP 이노베이션 코드북내의 코드 벡터들의 각각은 펄스 위치의 서로 다른 간삽 트랙(interleaved track)에 속하는 것으로 볼 수 있는 극소수의 비-제로 펄스(non-zero pulse)를 포함한다. 트랙의 수 및 트랙당 비-제로 펄스의 수는 통상 ACELP 이노베이션 코드북의 비트 속도에 의존한다. ACELP 부호기의 작업은 펄스 위치 및 부호(sign)를 탐색하여 에러 기준(error criterion)을 최소화하는 것이다. ACELP에 있어서, 이러한 탐색은 주어진 ACELP 코드 벡터가 시 가변 합성 필터를 통해 필터링된 이후 에러 기준이 여기 도메인(excitation domain)이 아니라 합성 도메인(synthesis domain)에서 계산되는 합성에 의한 분석(analysis-by-synthesis)을 이용하여 실행된다. 초대형 ACELP 이노베이션 코드북으로 고속 탐색을 할 수 잇는 효과적인 ACELP 탐색 알고리즘이 제안되었다.
도 1에는, ACELP 복호기(100)의 주요 부품 및 동작 원리를 나타내는 블럭도가 도시된다. 도 1을 참조하면, ACELP 복호기(100)는 복호화된 피치 파라메타(pitch parameter)(101)와 복호화된 ACELP 파라메타(102)를 수신한다. 복호화된 피치 파라메타(101)는 적응적 코드벡터를 생성하기 위해 적응적 코드북(103)에 적용되는 피치 지연(pitch delay)을 포함한다. 상술한 바와 같이, 적응적 코드북(103)은 필연적으로 과거 여기(past excitation)로 부터의 샘플들의 블럭이며, 적응적 코드북은 과거 여기를 포함하는 수학식을 사용하여 피치 지연에서 과거 여기를 보간(interpolating)함에 의해 발견된다. 또한, 복호화된 피치 파라메타는 제 1 적응적 코드북 기여(113)를 형성하기 위해 증폭기(112)를 이용하여 적응적 코드북(103)으로부터의 적응적 코드 벡터에 적용되는 피치 이득을 포함한다. 적응적 코드북(103) 및 증폭기(112)는 적응적 코드북 구조를 형성한다. 복호화된 ACELP 파라메타는 대응하는 이노베이션 코드벡터를 출력하기 위해 이노베이션 코드북(104)에 적용되는 코드북 인덱스(codebook index)를 포함하는 ACELP 이노베이션 코드북 파라메타를 포함한다. 또한, 복호화된 ACELP 파라메타는 제 2 이노베이션 코드북 기여(114)를 형성하기 위해 증폭기(105)에 의해 코드북(104)으로부터의 이노베이션 코드 벡터에 적용되는 이노베이션 코드북 이득을 포함한다. 이노베이션 코드북(104)과 증폭기(105)는 이노베이션 코드북 구조(110)를 형성한다. 그 다음, 제 1 적응적 코드북 기여(113)와 제 2 이노베이션 코드북 기여(114)의 가산기(106)에서의 합산을 통해 전체 여기(total excitation)(115)가 형성된다. 그 다음, 전체 여기(115)는 LP 합성 필터(107)를 통해 처리되어, 예를 들어, 음성과 같은 원음 신호의 합성(111)을 생성한다. 적응적 코드북(103)의 메모리는 현재 프레임(frame)(화살표 108)의 여기를 이용하여 다음 프레임을 위해 갱신되며, 그 다음, 적응적 코드북(103)은 다음 서브프레임(subframe)(화살표 109)의 복호화된 피치 파라메타의 처리를 위해 시프트(shift)된다. 상술한 기초적인 CELP 모델에 대해 여러 수정이 이루어질 수 있다. 예를 들어, 합성 필터의 입력에서의 여기 신호가 신호 개선을 위해 처리될 수 있다. 또한, 합성 필터의 출력에 후처리가 적용될 수 있다. 또한, 적응적 및 대수 코드북(adaptive and algebraic codebook)이 공동으로 양자화될 수 있다.
ACELP 코드북은, 낮은 비트 속도에서 음성을 부호화하는데 있어서 매우 효과적이지만, ACELP 코드북 크기가 증가할 경우, 변환 부호화 및 벡터 양자화와 같은 다른 방식처럼 빠르게 품질이 좋아지는 것은 아니다. dB/비트/샘플 단위로 측정될 때, ACELP 이노베이션 코드북에서 트랙당 보다 많은 비-제로 펄스(more non-zero pulses per track)를 이용하여 획득한 보다 높은 비트 속도(예를 들어, 16kbit/s 보다 높은 비트 속도)에서의 이득은 변환 부호화 및 벡터 양자화의 이득(dB/비트/샘플 단위)만큼 크지 않다. 이것은, ACELP가 소리 신호를 합성 필터의 지연되고 스케일링된 임펄스 응답들의 합으로 부호화된다는 것을 고려해 보면, 알 수 있을 것이다. 낮은 비트 속도(예를 들어, 12kbit/s 미만의 비트 속도)에서, ACELP 기술은 여기의 필수 성분을 재빠르게 포획한다. 그러나, 높은 비트 속도에서는, 신호의 서로 다른 주파수 성분에 걸쳐 추가적인 비트가 소비되는 방식에 대하여 보다 높은 입도(granularity), 특히 보다 양호한 제어가 유용하다.
그러므로, 보다 높은 비트 속도에서 이용하는데 적용될 보다 양호한 이노베이션 코드북 구조가 필요하다.
보다 구체적으로, 본 발명은 제 1 적응적 코드북 여기 잔차를 전치 양자화(pre-quantizing)하고 - 전치 양자화는 변환 도메인에서 실행됨 -, 제 1 적응적 코드북 여기 잔차로부터 생성된 제 2 여기 잔차에 응답하여 CELP 이노베이션 코드북을 탐색하는 것을 포함하는, 조합형 이노베이션 코드북 부호화 방법에 관한 것이다.
본 발명은 전치 양자화된 부호화 파라메타를 제 1 이노베이션 여기 기여로 역 양자화하고 - 전치 양자화된 부호화 파라메타를 역 양자화하는 것은 부호화 파라메타의 역변환을 계산하는 것을 포함함 -, CELP 이노베이션 코드북 파라메타를 CELP 이노베이션 코드북 구조에 적용하여 제 2 이노베이션 여기 기여를 생성하는 것을 포함하는 조합형 이노베이션 코드북 복호화 방법에 관한 것이다.
본 발명은 제 1 적응적 코드북 여기 잔차의 전치 양자화기(pre-quantizer) - 전치 양자화는 변환 도메인에서 동작함 -와, 제 1 적응적 코드북 여기 잔차로부터 생성된 제 2 여기 잔차에 응답하는 CELP 이노베이션 코드북 모듈을 포함하는, 조합형 이노베이션 코드북 부호화 장치에 관한 것이다.
본 발명은 상술한 조합형 이노베이션 코드북 부호화 장치를 포함하는 CELP 부호기에 관한 것이다.
본 발명은 전치 양자화된 부호화 파라메타의 제 1 이노베이션 여기 기여로의 역 양자화기 - 역 양자화기는 부호화 파라메타에 응답하는 역 변환 계산기를 포함함 -와, 제 2 이노베이션 여기 기여를 생성하기 위해 CELP 이노베이션 코드북 파라메타에 응답하는 CELP 이노베이션 코드북 구조를 포함하는 조합형 이노베이션 코드북에 관한 것이다.
본 발명은 상술한 조합형 이노베이션 코드북을 포함하는 CELP 복호기에 관한 것이다.
조합형 이노베이션 코드북 장치 및 대응하는 방법의 상술한 특징 및 다른 특징은, 첨부된 도면을 참조하여 예시적으로 제공된 실시 예에 대한 이하의 제한 없는 설명으로부터 더욱 명확해질 것이다.
본 발명은 보다 높은 비트 속도에서 이용하는데 적용될 보다 양호한 이노베이션 코드북 구조를 제공한다.
도면에 있어서,
도 1은 비 제한적 예시로서 ACELP를 이용하고 적응적 이노베이션 코드북 구조를 포함하는 CELP 복호기의 블럭도,
도 2는, 예를 들어, ACELP 이노베이션 코드북을 이용하여, 주파수 도메인에서 동작하는 제 1 복호화 단계와 시간 도메인에서 동작하는 제 2 복호화 단계에 의해 형성된 조합형 이노베이션 코드북을 포함하는 CELP 복호기의 블럭도,
도 3은 조합형 이노베이션 코드북 부호화 장치를 이용하는 CELP 부호기의 일부를 나타낸 블럭도,
도 4는 프리엠퍼시스 필터(pre-emphasis filter)의 역학(dynamics)을 주파수 응답의 가장 작은 크기 및 가장 큰 크기간의 차이(dB 단위)로 나타낸 프리엠퍼시스 필터 F(z)에 대한 주파수 응답을 예시적으로 나타낸 그래프이다.
도 2의 복호기(200)를 참조하면, 예를 들어, 도 1의 ACELP 이노베이션 코드북 구조(110)와 같은 CELP 이노베이션 코드북 구조는 ACELP의 장점 및 부호화 효율이 낮은 비트 속도에서 유지되고, 높은 비트 속도에서 보다 양호한 성능 및 확장성(scalability)을 제공하도록 수정된다. 물론, ACELP와는 다른 CELP 모델이 이용될 수 있다.
보다 구체적으로, 도 2에는 도 1의 ACELP 이노베이션 코드북 구조(110)의 수정으로부터 결과하는 가요성 및 스케일러블 "조합형 이노베이션 코드북"(201)이 도시된다. 도시된 바와 같이, 조합형 이노베이션 코드북(201)은 두 단계, 즉, 변환 도메인에서 동작하는 제 1 복호화 단계(202) 및 시간 도메인 ACELP 코드북을 이용하는 제 2 복호화 단계(203)의 조합을 포함한다.
도 2의 복호기(200)를 설명하기에 앞서, 도 3을 참조하여 ACELP 부호기(300)를 부분적으로 설명하겠다.
선형 예측 필터링( Linear Prediction Filtering )
도 3을 참조하면, ACELP 부호기(300)는 부호화될 입력 소리 신호(302)를 처리하는 LP 필터(301)를 포함한다. LP 필터(301)는, 예를 들어, z-변환(z-transform)에 있어서 아래의 전달 함수를 나타낸다.
Figure 112012072843719-pct00001
상기 함수에서, ai는 선형 예측 계수(LP 계수)를 나타내며, a0 =1이고, M은 선형 예측 계수의 수(LP 분석의 차수)를 나타낸다. LP 계수 ai는 ACELP 부호기(300)의 LP 분석기(도시되지 않음)에서 결정된다.
LP 필터(301)는 그의 출력에 LP 잔차(303)를 생성한다.
적응적 -코드북 탐색( Adaptive - Codebook Search )
LP 필터(301)로부터의 LP 잔차 신호(303)는 적응적 코드북 기여(305)를 발견하기 위해 ACELP 부호기(300)의 적응적 코드북 탐색 모듈(304)에서 이용된다. 적응적 코드북 탐색 모듈(304)은 복호기(200)(도2)로부터 전송된 피치 파라메타(320)를 생성하는데, 그 피치 파라메타는 피치 지연 및 피치 이득을 포함한다. 또한, 적응적 코드북 탐색은 폐루프 피치 탐색(closedloop pitch search)이라고 알려져 있으며, 소위 타겟 신호(target signal)를 계산하고, 지각 가중 도메인(perceptually weighted domain)에서의 원본 신호와 합성 신호간의 에러를 최소화함에 의해 그 파라메타들을 발견하는 것을 포함한다. ACELP 부호기의 적응적 코드북 탐색의 다른 점은 당업자에게 잘 알려져 있으며, 따라서, 본 명세서에서는 추가적인 설명을 하지 않겠다.
ACELP 부호기(300)는 변환-도메인에서 동작하고 전치 양자화기라고도 지칭되는 제 1 부호화 단계(306)와, 시간 도메인에서 동작하고, 예를 들어, ACELP를 이용하는 제 2 부호화 단계(307)를 포함하는 조합형 이노베이션 코드북 부호화 장치를 포함한다. 도 3에 도시된 바와 같이, 예시적인 실시 예에 있어서, 제 1 단계 또는 전치 양자화기(306)는 저주파수를 엠퍼사이징(emphasizing)하는 프리엠퍼시스 필터 F(z)와, DCT(Discrete Cosine Transform) 계산기(309) 및 (AVQ(Algebraic Vector Quantizer) 글로벌 이득을 포함하는) AVQ(310)를 포함한다. 제 2 단계(307)는 ACELP 이노베이션 코드북 탐색 모듈(311)을 포함한다. DCT와 AVQ의 이용은 단지 예시적인 것임을 알아야 하며, 다른 변환이 이용될 수 있고 변환 계수를 양자화하기 위한 다른 방법이 또한 이용될 수 있다.
상술한 바와 같이, 전치 양자화기(306)는, 예를 들어, 소리 신호의 주파수 표시로서 DCT를 이용하고, DCT의 주파수 도메인 계수를 양자화하고 부호화하기 위해 AVQ를 이용한다. 전치 양자화기(306)는 특히 낮은 비트 속도에서 제 1 단계 양자화기라기 보다는 예비 조건 부여 단계(pre-conditioning stage)로서 이용된다. 보다 구체적으로, 전치 양자화기(306)를 이용하여, ACELP 이노베이션 코드북 탐색 모듈(311)(제 2 부호화 단계(307))은 제 1 적응적 코드북 여기 잔차(313)보다 큰 정규 스펙트럼 역학(regular spectral dynamics)을 가진 제 2 여기 잔차(312)(도 3)에 적용된다. 그런 의미에서, 전치 양자화기(306)는, 부분적으로 적응적 코드북 탐색의 불완전한 작업에 기인한 시간 및 주파수에 있어서의 큰 신호 역학을 흡수하며, (음성 부호화의 당업자에게 잘 알려져 있으며 ACELP 부호기(300)에서 실행되는 전형적인 합성에 의한 분석 루프에서) LP 가중 도메인에서의 부호화 에러를 최소화하기 위한 작업을 ACELP 이노베이션 코드북 탐색이 할 수 있게 한다.
피치 잔차 신호(313)의 생성
ACELP 부호기(300)는 LP 잔차 신호(303)로부터 적응적 코드북 기여(305)를 공제하여 상술한 제 1 적응적 코드북 여기 잔차(313)를 생성하여 전치 양자화기(306)에 인가하는 감산기(314)를 포함한다. 적응적 코드북 여기 잔차
Figure 112012072843719-pct00002
는 아래와 같이 주어진다.
Figure 112012072843719-pct00003
여기에서, r[n]은 LP 잔차이고, gp 는 적응적 코드북 이득이고, v[n]은 적응적 코드북 여기(통상 간삽된 과거 여기)이다.
전치 양자화
도 3을 참조하여 전치 양자화기(306)의 동작을 설명하겠다.
프리엠퍼시스 필터링
제 2 부호화 단계(307)에서 ACELP 이노베이션 코드북 탐색의 서브프레임과 정렬되는 주어진 서브프레임에 있어서, 제 1 적응적 코드북 여기 잔차(313)(도 3)는 프리엠퍼시스 필터 F(z)(308)에 의해 프리-엠퍼사이징(pre-emphasizing)된다. 도 4에는 프리엠퍼시스 필터 F(z)(308)의 주파수 응답이 예시적으로 도시되며, 거기에서는 프리엠퍼시스 필터의 역학이 주파수 응답의 가장 작은 크기와 가장 큰 크기간의 차이(dB 단위)로서 표시된다. 예시적인 프리엠퍼시스 필터 F(z)는 아래와 같이 주어진다.
Figure 112012072843719-pct00004
이 수학식은 아래와 같은 계차 방정식(difference equation)에 대응한다.
Figure 112012072843719-pct00005
수학식에서, x[n]은 프리엠퍼시스 필터 F(z)(308)에 입력되는 제 1 적응적 코드북 여기 잔차(313)이고, y[n]은 프리-엠퍼사이징된(pre-emphasized) 제 1 적응적 코드북 여기 잔차를 나타내며, 계수 α는 프리엠퍼시스 레벨(a level of pre-emphasis)을 제어한다. 이러한 비 제한적 예시에 있어서, α의 값이 0과 1 사이에서 설정되면, 프리엠퍼시스 필터 F(z)(308)는 저주파수에서 보다 큰 이득을 갖고, 고주파수에서 보다 낮은 이득을 가질 것이며, 증폭된 저주파수를 가진 프리-엠퍼사이징된 제 1 적응적 코드북 여기 잔차 y[n]를 생성할 것이다. 이러한 프리엠퍼시스 필터 F(z)(308)는 스펙트럼 틸트(spectral tilt)를 제 1 적응적 코드북 여기 잔차(313)에 적용하여 이 잔차의 저주파수를 향상시킨다.
DCT 계산
계산기(309)는, 예를 들어, 직사각형 무중첩 윈도우(rectangular non-overlapping window)를 이용하여 프리엠퍼시스 필터 F(z)(308)로부터의 프리-엠퍼사이징된 적응적 코드북 여기 잔차 y[n]에 DCT를 적용한다. 이러한 비 제한적 예시에 있어서, 아래와 같이 정의되는 DCT-Ⅱ가 이용된다.
Figure 112012072843719-pct00006
AVQ
예를 들어, AVQ(310)와 같은 양자화기는 계산기(309)로부터의 DCT의 주파수 도메인 계수 Y[k](DCT변환되고, 디-엠퍼사이징된(de-emphasised) 제 1 적응적 코드북 여기 잔차)를 양자화하고 부호화한다. 예시적인 AVQ 구현은 미국특허번호 7,106,228호에 개시되어 있다. AVQ(310)로부터의 양자화되고 부호화된 주파수 영역 DCT 계수(315)는 전치 양자화된 파라메타로서 복호기(도 2)에 전송된다. 예를 들어, AVQ(310)는 전치 양자화된 파라메타로서 스케일링되고 양자화된 DCT 계수와 글로벌 이득을 생성할 수 있다.
비트 속도에 의거하여, AVQ(310)의 타겟 SNR(Signal-to-Noise Ratio)(AVQ_SNR(도 4))이 설정된다. 비트 속도가 높을 수록 SNR이 높게 설정된다. 그 다음, spectral_max - AVQ_SNR보다 높은 평균 이득을 가진 DCT 계수의 블럭만이 양자화되도록 AVQ(310)의 글로벌 이득이 설정되는데, spectral_max는 프리엠퍼시스 필터 F(z)(308)의 주파수 응답의 최대 크기이다. 다른 비-양자화 DCT 계수는 0으로 설정된다. 다른 방식에 있어서, DCT 계수의 양자화 블럭의 개수는 비트 속도 예산(bit rate budget)에 좌우되며, 예를 들어, AVQ는 이용 가능한 비트-예산에 의거하여 저주파수에만 관련된 변환 계수를 부호화할 수 있다.
여기 잔차 신호(312)의 생성
DCT 계산
제 2 부호화 단계(307)(본 예시에서는 ACELP 이노베이션 코드북 탐색; 다른 CELP 구조가 이용될 수도 있음)동안에 여기 잔차 신호(312)를 획득하기 위해, AVQ(310)로부터의 AVQ 양자화된 DCT 계수(315)가 계산기(316)에서 역 DCT 변환된다.
디- 엠퍼시스 필터링( De - emphasis filtering )
그 다음, 디-엠퍼시스 필터 1/F(z)(317)를 통해 역 DCT 변환 계수(315)가 처리되어, 전치 양자화기(306)로부터 시간 도메인 기여(318)가 획득된다. 디-엠퍼시스 필터 1/F(z)(317)는 프리엠퍼시스 필터 F(z)(308)의 역 전달 함수를 가진다. 상술한 프리엠퍼시스 필터 F(z)(308)에 대한 비 제한적 예시에 있어서, 디-엠퍼시스 필터
Figure 112012072843719-pct00007
의 계차 방정식은 아래와 같다
Figure 112012072843719-pct00008
디-엠퍼시스 필터의 경우에 있어서, x[n]은 프리엠퍼사이징되고 양자화된 여기 잔차(계산기(316)로부터)이고, y[n]은 디-엠퍼사이징되고 양자화된 여기 잔차(시간 도메인 기여(318))이며, 계수 α는 상기에서 정의되었다.
제 2 여기 잔차를 생성하기 위한 감산
마지막으로, 감산기(319)는 현재 서브프레임에서의 적응적 코드북 탐색에 의해 발견된 적응적 코드북 기여(305)로부터 디-엠퍼사이징된 여기 잔차 y[n]를 공제하여, 제 2 여기 잔차(312)를 산출한다.
ACELP 이노베이션 코드북 탐색
제 2 여기 잔차(312)는 제 2 부호화 단계(307)에서 ACELP 이노베이션 코드북 탐색 모듈(311)에 의해 부호화된다. ACELP 부호기의 이노베이션 코드북 탐색의 다른 점에 대해서는 당업자에게 잘 알려져 있으며, 따라서, 본 명세서에서는 추가적인 설명을 하지 않겠다. ACELP 이노베이션 코드북 탐색 계산기(311)의 출력에 있는 ACELP 이노베이션 코드북 파라메타(333)는 ACELP 파라메타로서 복호기에 전송된다(도 2). 부호화 파라메타(333)는 이노베이션 코드북 인덱스 및 이노베이션 코드북 이득을 포함한다.
조합형 이노베이션 코드북(201)의 동작
도 2의 복호기(200)를 참조하면, 역 양자화기(202)라고도 하는 조합형 이노베이션 코드북(201)의 제 1 복호화 단계는 AVQ 복호기 및 역 DCT 계산기(204)와, 도 3의 부호기(300)의 필터(317)에 대응하는 역 필터(inverse filter) 1/F(z)(205)를 포함한다. 역 양자화기(202)로부터의 기여는 아래와 같이 획득된다.
AVQ 복호화
먼저, 본 예시에 있어서 변환 도메인 복호기(204)(AVQ)는, 예를 들어 도 3의 AVQ(310)로부터의 AVQ-양자화 DCT 계수(315)(AVQ 글로벌 이득을 포함할 수 있음)에 의해 형성된 복호화되고 전치 양자화된 부호화 파라메타를 수신한다. 보다, 구체적으로, AVQ 복호기는 복호기(200)에 의해 수신된 복호화되고 전치 양자화된 부호화 파라메타를 역 양자화한다.
DCT 계산
역 DCT 계산기(204)는 AVQ 복호기로부터의 역 양자화되고 스케일링된 파라메타
Figure 112012072843719-pct00009
에, 예를 들어, 역 DCT와 같은 역 변환을 적용한다. 역 DCT-Ⅱ는 본 비 제한적 예시에서, 아래와 같이 정의된다.
Figure 112012072843719-pct00010
디- 엠퍼시스 필터링 (1/F(z))
복호기/계산기(204)로부터의 AVQ-복호화되고 역 DCT 변환된 파라메타
Figure 112012072843719-pct00011
는 디-엠퍼시스 필터 1/F(z)(205)에 의해 처리됨으로써, 역 양자화기(202)로부터의 제 1 단계 이노베이션 여기 기여(208)가 생성된다.
ACELP 파라메타 복호화
도 3의 ACELP 이노베이션 코드북 탐색 계산기(311)에서의 부호화(제 2 부호화 단계(307))는 제 1 부호화 단계(306)로부터의 AVQ(310)와 DCT 계산기(309)로부터의 정보에 의해 제어될 수 있지만 필수적인 것은 아닌 틸트 필터(tilt filter)(도시되지 않음)를 합체할 수 있다. 도 2의 복호기(200)에 있어서, 복호화된 ACELP 파라메타는 제 2 복호화 단계(203)에 의해 수신된다. 복호화된 ACELP 파라메타는 ACELP 이노베이션 코드북 탐색 계산기(311)의 출력에 있는 ACELP 이노베이션 코드북 파라메타들(333)을 포함하는데, 그 파라메타들은 복호기(도 2)에 전송되고, 이노베이션 코드북 인덱스 및 이노베이션 코드북 이득을 포함한다. 도 2의 조합형 이노베이션 코드북(201)의 제 2 복호화 단계는 증폭기(207)를 이용하여 이노베이션 코드북 이득만큼 증폭된 코드벡터를 생성하기 위해 이노베이션 코드북 인덱스에 응답하는 ACELP 코드북(206)을 포함한다. 제 2 ACELP 이노베이션 코드북 여기 기여(209)는 증폭기(207)의 출력에서 생성된다. 이러한 ACELP 이노베이션 코드북 여기 기여(209)는, 역 필터 1/F(z)(205)와 관련된 역 양자화기(202)에서와 동일한 방식으로, 상술한 틸트 필터(그 부호기(도시되지 않음)에 합체된 경우)의 역(inverse)을 통해 처리된다. 사용되는 틸트 필터는 필터 F(z)와 동일할 수 있지만 일반적으로는 F(z)와 다르다.
여기 기여의 가산( Addition of excitation contributions )
마지막으로, 복호기(200)는 적응적 코드북 기여(113)와, 역 양자화기(202)로부터의 여기 기여(208) 및 ACELP 이노베이션 코드북 여기 기여(209)를 합산하여 총 여기 신호(total excitation signal)(211)를 형성하는 가산기(210)를 포함한다.
합성 필터링
여기 신호(211)는 소리 신호(213)를 복구하기 위해 LP 합성 필터(212)를 통해 처리된다.
도 3을 참조하면, 전치 양자화기(306)의 DCT 계산기(309)와 AVQ(310)는 역학에 있어서의 주어진 임계치를 초과하는 여기 잔차 스펙트럼의 부호화 부분들에 집중한다. 전형적인 2 단계 양자화의 경우에서 처럼, 그것은 제 2 부호화 단계(307)를 위해 제 2 여기 잔차(312)를 균일화(whitening)하기에는 적절하지 않다. 그러므로, 부호기(300)에서, 제 2 단계(307)(ACELP 이노베이션 코드북 탐색 모듈(311))에 의해 부호화되는 제 2 여기 잔차(312)는 제어된 스펙트럼 역학을 가진 여기 잔차이며, "초과" 스펙트럼 역학은 제 1 부호화 단계에서의 전치 양자화기(306)에 의해 어느 정도 흡수된다. 비트 속도가 증가하면, 제 1 단계에서 AVQ_SNR(도 4) 및 DC 성분부터 시작하는 양자화된 DCT 블럭들의 수가 증가한다. 다른 예시로서, 양자화된 DCT 블럭들의 수는 이용 가능한 비트 속도 예산에 좌우된다.
그러나, 비트 속도가 높아지면, 그에 비례하여 제 1 부호화 단계에서 전치 양자화기(306)에 의해 이용되는 비트가 더 많아지게 되며, 그에 따라 총 부호화 잡음은 점점더 가중된 LP 필터의 스펨트럼 엔벨로프를 따르도록 성형(shape)된다.
상술한 설명에서 비록 본 발명을 예시적인 실시 예와 관련하여 설명하였지만, 이러한 실시 예는 본 발명의 범주 및 본질을 벗어나지 않고서 특허청구범위내에서 수정될 수 있다.
103: 적응적 코드북
113: 제 1 적응적 코드북 기여
200: 복호기
201: 조합형 이노베이션 코드북
202: 역 양자화기
203: 제 2 복호화 단계
204: AVQ 복호기 및 역 DCT 계산기
205: 역 필터
206: ACELP 코드북
207: 증폭기
208: 제 1 단계 이노베이션 여기 기여
209: 제 2 ACELP 이노베이션 코드북 여기 기여
210: 가산기
211: 여기 신호
212: LP 합성 필터
213: 소리 신호

Claims (38)

  1. 소리(sound)를 제 1 부호화 파라메타 세트, 제 2 부호화 파라메타 세트 및 제 3 부호화 파라메타 세트로 부호화하기 위한 CELP(Code-Exited Linear Prediction) 코드북 부호화 장치로서,
    입력 소리 신호를 처리하여 제 1 LP 잔차(Linear Prediction residual)를 생성하는 LP 필터와;
    제 1 LP 잔차를 이용하여 적응적 코드북 기여(adaptive-codebook contribution)를 발견하고 제 1 부호화 파라메타 세트를 형성하는 피치 파라메타들(pitch paramaters)을 생성하는 적응적 코드북 탐색 모듈과;
    적응적 코드북 기여와 제 1 LP 잔차간의 차이로서 제 2 적응적 코드북 여기 잔차를 생성하는 제 1 감산기와;
    제 2 부호화 파라메타 세트를 형성하는 양자화된 변환 계수들(quantized transform coefficients)을 생성하기 위해 제 2 적응적 코드북 여기 잔차의 변환 계산기를 포함하는 전치 양자화기와;
    양자화된 변환 계수들의 역 변환된 버전(inverse-transformed version)과 적응적 코드북 기여간의 차이로서 제 3 여기 잔차를 생성하는 제 2 감산기와;
    제 3 여기 잔차를 이용하여 이노베이션 코드북 기여를 발견하고 제 3 부호화 파라메타 세트를 형성하는 이노베이션 코드북 파라메타들을 생성하는 CELP 이노베이션 코드북 탐색 모듈을 구비하는
    CELP 코드북 부호화 장치.
  2. 제 1 항에 있어서,
    상기 전치 양자화기의 변환 계산기는 제 2 적응적 코드북 여기 잔차를 DCT(Discrete Cosine Transform) 변환하여 DCT 계수들을 생성하는 계산기인
    CELP 코드북 부호화 장치.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 변환 계산기는 변환 계수들을 생성하고, 상기 전치 양자화기는 변환 계수들을 양자화하여 양자된 변환 계수들을 생성하는 양자화기를 구비하는
    CELP 코드북 부호화 장치.
  4. 제 3 항에 있어서,
    상기 전치 양자화기의 양자화기는 상기 변환 계산기로부터의 변환 계수들로부터 대수 벡터 양자화된 변환 계수들(algebraic-vector-quantized transform coefficients)을 생성하기 위한 대수 벡터 양자화기인
    CELP 코드북 부호화 장치.
  5. 제 1 항 또는 제 2 항에 있어서,
    상기 전치 양자화기는, 상기 제 2 적응적 코드북 여기 잔차를 프리엠퍼사이징(pre-emphasizing)하여, 상기 변환을 계산하기 전에, 프리엠퍼사이징된 제 2 잔차(pre-emphasized second residual)를 생성하기 위한 프리엠퍼시스 필터를 구비하는
    CELP 코드북 부호화 장치.
  6. 제 5 항에 있어서,
    상기 프리엠퍼시스 필터는 상기 제 2 적응적 코드북 여기 잔차의 저주파수를 엠퍼사이징(emphasizing)하는
    CELP 코드북 부호화 장치.
  7. 제 5 항에 있어서,
    양자화된 변환 계수들의 역 변환을 계산하는 계산기와, 양자화된 변환 계수들의 역 변환된 버전을 형성하는 시간 도메인 기여를 생성하기 위한 역 변환된 계수들의 디-엠퍼시스 필터를 구비하고,
    제 2 감산기는 적응적 코드북 기여로부터 시간 도메인 기여를 감산하여 제 3 여기 잔차를 생성하는
    CELP 코드북 부호화 장치.
  8. 제 1 항 또는 제 2 항에 있어서,
    상기 CELP 이노베이션 코드북 탐색 모듈은 ACELP(Algebraic CELP) 탐색 모듈인
    CELP 코드북 부호화 장치.
  9. 제 1 항 또는 제 2 항에 있어서,
    상기 전치 양자화기는 특정 임계값을 초과하는 에너지를 가진 변환 계수들만을 양자화하는
    CELP 코드북 부호화 장치.
  10. 제 3 항에 있어서,
    상기 전치 양자화기는 단지 이용 가능한 비트 예산(bit-budget)에만 의거하여 저주파수에 관련된 변환 계수를 부호화하는
    CELP 코드북 부호화 장치.
  11. 피치 파라메타들(pitch parameters), 양자화된 부호화 파라메타들(quantized coding parameters) 및 이노베이션 코드북 파라메타들(innovation-codebook parameters)을 이용하여, 소리를 복호화하는 CELP(Code-Exicted Linear Prediction) 코드북 복호화 장치로서,
    피치 파라메타들을 이용하여 적응적 코드북 기여를 생성하는 적응적 코드북 구조체와;
    제 1 이노베이션 여기 기여를 생성하기 위해 양자화된 부호화 파라메타들의 역 변환을 계산하는 계산기를 구비하는 역 양자화기와;
    제 2 이노베이션 여기 기여를 생성하기 위해 이노베이션 코드북 파라메타들을 이용하는 CELP 이노베이션 코드북 구조체와;
    적응적 코드북 기여와, 제 1 이노베이션 여기 기여 및 제 2 이노베이션 여기 기여를 합산하여 총 여기 신호(total excitation signal)를 형성하는 가산기와;
    총 여기 신호를 처리하여 상기 소리의 합성을 나타내는 합성 신호를 생성하기 위한 LP(Linear Prediction) 합성 필터를 구비한
    CELP 코드북 복호화 장치.
  12. 제 11 항에 있어서,
    상기 역 양자화기는 양자화된 부호화 파라메타들을 역 양자화하는 복호화기를 구비하는
    CELP 코드북 복호화 장치.
  13. 제 12 항에 있어서,
    상기 복호화기는 AVQ(Algebraic Vector Quantizer) 복호화기를 구비하는
    CELP 코드북 복호화 장치.
  14. 제 12 항 또는 제 13 항에 있어서,
    상기 역 변환의 계산기는 역 양자화된 부호화 파라메타들의 역 변환을 계산하는
    CELP 코드북 복호화 장치.
  15. 제 14 항에 있어서,
    상기 역 변환은 IDCT(Inverse Discrete Cosine Transform)인
    CELP 코드북 복호화 장치.
  16. 제 14 항에 있어서,
    상기 역 양자화기는 역 변환되고 역 양자화된 부호화 파라메타를 공급받아 제 1 이노베이션 여기 기여를 생성하는 디-엠퍼시스 필터(de-emphasis filter)를 구비하는
    CELP 코드북 복호화 장치.
  17. 소리(sound)를 제 1 부호화 파라메타 세트, 제 2 부호화 파라메타 세트 및 제 3 부호화 파라메타 세트로 부호화하기 위한 CELP(Code-Exited Linear Prediction) 코드북 부호화 방법으로서,
    LP 필터(Linear Prediction filter)를 통해 소리 신호를 처리하여 제 1 LP 잔차(Linear Prediction residual)를 생성하고;
    적응적 코드북 기여(adaptive-codebook contribution)를 발견하고 제 1 부호화 파라메타 세트를 형성하는 피치 파라메타들(pitch paramaters)을 생성하기 위해 제 1 LP 잔차를 이용하여 적응적 코드북을 탐색하고;
    적응적 코드북 기여와 제 1 LP 잔차간의 차이로서 제 2 적응적 코드북 여기 잔차를 생성하고;
    제 2 적응적 코드북 여기 잔차를 전치 양자화하되, 상기 전치 양자화는 제 2 부호화 파라메타 세트를 형성하는 양자화된 변환 계수들(quantized transform coefficients)을 생성하기 위해 제 2 적응적 코드북 여기 잔차의 변환을 계산하는 것을 포함하고;
    양자화된 변환 계수들의 역 변환된 버전(inverse-transformed version)과 적응적 코드북 기여간의 차이로서 제 3 여기 잔차를 생성하고;
    이노베이션 코드북 기여를 발견하고 제 3 부호화 파라메타 세트를 형성하는 이노베이션 코드북 파라메타들을 생성하기 위해 제 3 여기 잔차를 이용하여 CELP 이노베이션 코드북을 탐색하는 것을 구비하는
    CELP 코드북 부호화 방법.
  18. 제 17 항에 있어서,
    상기 변환은 DCT(Discrete Cosine Transform) 변환인
    CELP 코드북 부호화 방법.
  19. 제 17 항 또는 제 18 항에 있어서,
    상기 전치 양자화는 변환 계수들을 생성하기 위해 제 2 적응적 코드북 여기 잔차를 계산하고, 양자화된 변환 계수들을 생성하기 위해 변환 계수들을 양자화하는 것을 구비하는
    CELP 코드북 부호화 방법.
  20. 제 19 항에 있어서,
    변환 계수들을 양자화하는 것은, 상기 변환 계수들을 양자화하는 대수 벡터(algebraic vector)를 구비하는
    CELP 코드북 부호화 방법.
  21. 제 17 항 또는 제 18 항에 있어서,
    상기 제 2 적응적 코드북 여기 잔차를 전치 양자화하는 것은, 제 2 적응적 코드북 여기 잔차의 변환을 계산하기 전에 제 2 적응적 코드북 여기 잔차를 프리엠퍼시스 필터링(pre-emphasis filtering)하는 것을 구비하는
    CELP 코드북 부호화 방법.
  22. 제 21 항에 있어서,
    상기 프리엠퍼시스 필터링은 제 2 적응적 코드북 여기 잔차의 저주파수를 엠퍼사이징(emphasizing)하는 것을 구비하는
    CELP 코드북 부호화 방법.
  23. 제 17 항 또는 제 18 항에 있어서,
    양자화된 변환 계수들의 역 변환을 계산하고, 역 변환된 계수들을 디-엠퍼시스 필터링하여, 양자화된 변환 계수들의 역 변환된 버전을 형성하는 시간 도메인 기여를 생성하는 것을 구비하고,
    제 3 여기 잔차를 생성하는 것은 적응적 코드북 기여로부터 시간 도메인 기여를 감산하는 것을 구비하는
    CELP 코드북 부호화 방법.
  24. 제 17 항 또는 제 18 항에 있어서,
    상기 CELP 이노베이션 코드북 탐색은 ACELP(Algebraic CELP) 이노베이션 코드북 탐색인
    CELP 코드북 부호화 방법.
  25. 제 17 항 또는 제 18 항에 있어서,
    상기 제 2 적응적 코드북 여기 잔차를 전치 양자화하는 것은, 특정 임계값을 초과하는 에너지를 가진 변환 계수들만을 전치 양자화하는 것을 구비하는
    CELP 코드북 부호화 방법.
  26. 제 19 항에 있어서,
    변환 계수를 전치 양자화하는 것은, 단지 이용 가능한 비트-예산(bit-budget)에만 의거하여 저주파수에 관련된 변환 계수들을 부호화하는 것을 구비하는
    CELP 코드북 부호화 방법.
  27. 피치 파라메타들(pitch parameters), 양자화된 부호화 파라메타들(quantized coding parameters) 및 이노베이션 코드북 파라메타들(innovation-codebook parameters)을 이용하여, 소리를 복호화하는 CELP(Code-Exicted Linear Prediction) 코드북 복호화 방법으로서,
    적응적 코드북 기여를 생성하기 위해 적응적 코드북 구조체에 피치 파라메타들을 적용하고;
    양자화된 부호화 파라메타들을 역 양자화하되, 상기 역 양자화는 제 1 이노베이션 여기 기여를 생성하기 위해 양자화된 부호화 파라메타들의 역 변환을 계산하는 것을 구비하고;
    제 2 이노베이션 여기 기여를 생성하기 위해 CELP 이노베이션 코드북 구조체에 이노베이션 코드북 파라메타들을 적용하고;
    적응적 코드북 기여와, 제 1 이노베이션 여기 기여 및 제 2 이노베이션 여기 기여를 합산하여 총 여기 신호(total excitation signal)를 형성하고;
    LP(Linear Prediction) 합성 필터를 통해 총 여기 신호를 처리하여 상기 소리의 합성을 나타내는 합성 신호를 생성하는 것을 구비하는
    CELP 코드북 복호화 방법.
  28. 제 27 항에 있어서,
    양자화된 부호화 파라메타들을 역 양자화하는 것은,
    양자화된 부호화 파라메타들을 복호화하여 역 양자화된 부호화 파라메타들을 생성하는 것을 구비하는
    CELP 코드북 복호화 방법.
  29. 제 28 항에 있어서,
    양자화된 부호화 파라메타들을 복호화하는 것은,
    상기 양자화된 부호화 파라메타들을 복호화하는 AVQ(Algebraic Vector Quantizer)를 구비하는
    CELP 코드북 복호화 방법.
  30. 제 28 항 또는 제 29 항에 있어서,
    부호화 파라메타들의 역 변환을 계산하는 것은 역 양자화된 부호화 파라메타들의 역 변환을 계산하는 것을 구비하는
    CELP 코드북 복호화 방법.
  31. 제 30 항에 있어서,
    역 변환은 역 DCT(Inverse Discrete Cosine Transform)인
    CELP 코드북 복호화 방법.
  32. 제 30 항에 있어서,
    제 1 이노베이션 여기 기여를 생성하기 위해 역 변환되고 역 양자화된 부호화 파라메타들을 디-엠퍼시스 필터링(de-emphasis filtering)하는 것을 구비하는
    CELP 코드북 복호화 방법.
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
KR1020127023628A 2010-04-14 2011-04-08 씨이엘피 부호기 및 복호기에 사용하기 위한 가요성 및 스케일러블 조합형 이노베이션 코드북 KR101771065B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US32419110P 2010-04-14 2010-04-14
US61/324,191 2010-04-14
PCT/CA2011/000398 WO2011127569A1 (en) 2010-04-14 2011-04-08 Flexible and scalable combined innovation codebook for use in celp coder and decoder

Publications (2)

Publication Number Publication Date
KR20130069546A KR20130069546A (ko) 2013-06-26
KR101771065B1 true KR101771065B1 (ko) 2017-08-24

Family

ID=44798205

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020127023628A KR101771065B1 (ko) 2010-04-14 2011-04-08 씨이엘피 부호기 및 복호기에 사용하기 위한 가요성 및 스케일러블 조합형 이노베이션 코드북

Country Status (16)

Country Link
US (1) US9053705B2 (ko)
EP (1) EP2559028B1 (ko)
JP (2) JP6073215B2 (ko)
KR (1) KR101771065B1 (ko)
CN (1) CN102844810B (ko)
AU (1) AU2011241424B2 (ko)
BR (1) BR112012025347B1 (ko)
CA (1) CA2789107C (ko)
DK (1) DK2559028T3 (ko)
ES (1) ES2552179T3 (ko)
MX (1) MX2012011943A (ko)
MY (1) MY162594A (ko)
PT (1) PT2559028E (ko)
RU (1) RU2547238C2 (ko)
WO (1) WO2011127569A1 (ko)
ZA (1) ZA201206333B (ko)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
NO2669468T3 (ko) 2011-05-11 2018-06-02
MY183444A (en) 2013-01-29 2021-02-18 Fraunhofer Ges Forschung Apparatus and method for synthesizing an audio signal, decoder, encoder, system and computer program
KR102222838B1 (ko) 2014-04-17 2021-03-04 보이세지 코포레이션 다른 샘플링 레이트들을 가진 프레임들간의 전환시 사운드 신호의 선형 예측 인코딩 및 디코딩을 위한 방법, 인코더 및 디코더
CN106228991B (zh) 2014-06-26 2019-08-20 华为技术有限公司 编解码方法、装置及系统
EP3583217A4 (en) 2017-02-17 2021-04-07 Hyasynth Biologicals Inc. PROCESS AND CELL LINE FOR THE PRODUCTION OF POLYKETIDES IN YEAST
JP7285830B2 (ja) 2017-09-20 2023-06-02 ヴォイスエイジ・コーポレーション Celpコーデックにおいてサブフレーム間にビット配分を割り振るための方法およびデバイス

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103638A1 (en) 1998-08-24 2002-08-01 Conexant System, Inc System for improved use of pitch enhancement with subcodebooks
US20080249783A1 (en) 2007-04-05 2008-10-09 Texas Instruments Incorporated Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding
US20090240491A1 (en) 2007-11-04 2009-09-24 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2292466A1 (fr) 1974-11-29 1976-06-25 Creat Lab Nouveaux medicaments anti-inflammatoires et analgesiques et leur procede de preparation
JP3193515B2 (ja) * 1993-03-11 2001-07-30 株式会社日立国際電気 音声符号化通信方式及びその装置
US5657422A (en) * 1994-01-28 1997-08-12 Lucent Technologies Inc. Voice activity detection driven noise remediator
JPH09127998A (ja) * 1995-10-26 1997-05-16 Sony Corp 信号量子化方法及び信号符号化装置
JP3849210B2 (ja) * 1996-09-24 2006-11-22 ヤマハ株式会社 音声符号化復号方式
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6480822B2 (en) * 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US7072832B1 (en) * 1998-08-24 2006-07-04 Mindspeed Technologies, Inc. System for speech encoding having an adaptive encoding arrangement
US6192335B1 (en) * 1998-09-01 2001-02-20 Telefonaktieboiaget Lm Ericsson (Publ) Adaptive combining of multi-mode coding for voiced speech and noise-like signals
CA2252170A1 (en) * 1998-10-27 2000-04-27 Bruno Bessette A method and device for high quality coding of wideband speech and audio signals
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6757648B2 (en) * 2001-06-28 2004-06-29 Microsoft Corporation Techniques for quantization of spectral data in transcoding
US6662154B2 (en) * 2001-12-12 2003-12-09 Motorola, Inc. Method and system for information signal coding using combinatorial and huffman codes
CA2388358A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for multi-rate lattice vector quantization
JP3881943B2 (ja) * 2002-09-06 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
KR100651712B1 (ko) * 2003-07-10 2006-11-30 학교법인연세대학교 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
FR2859566B1 (fr) * 2003-09-05 2010-11-05 Eads Telecom Procede de transmission d'un flux d'information par insertion a l'interieur d'un flux de donnees de parole, et codec parametrique pour sa mise en oeuvre
US6983241B2 (en) * 2003-10-30 2006-01-03 Motorola, Inc. Method and apparatus for performing harmonic noise weighting in digital speech coders
US7430329B1 (en) * 2003-11-26 2008-09-30 Vidiator Enterprises, Inc. Human visual system (HVS)-based pre-filtering of video data
JP4871501B2 (ja) * 2004-11-04 2012-02-08 パナソニック株式会社 ベクトル変換装置及びベクトル変換方法
WO2006107837A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Methods and apparatus for encoding and decoding an highband portion of a speech signal
WO2006116024A2 (en) * 2005-04-22 2006-11-02 Qualcomm Incorporated Systems, methods, and apparatus for gain factor attenuation
US7177804B2 (en) * 2005-05-31 2007-02-13 Microsoft Corporation Sub-band voice codec with multi-stage codebooks and redundant coding
US8306827B2 (en) * 2006-03-10 2012-11-06 Panasonic Corporation Coding device and coding method with high layer coding based on lower layer coding results
KR101565919B1 (ko) * 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
WO2008072737A1 (ja) * 2006-12-15 2008-06-19 Panasonic Corporation 符号化装置、復号装置およびこれらの方法
ES2821432T3 (es) * 2008-02-15 2021-04-26 Nokia Technologies Oy Cuantificación de audio mediante indexación de vectores de complejidad reducida
JP5449133B2 (ja) * 2008-03-14 2014-03-19 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
CN101971251B (zh) * 2008-03-14 2012-08-08 杜比实验室特许公司 像言语的信号和不像言语的信号的多模式编解码方法及装置
CN101335000B (zh) * 2008-03-26 2010-04-21 华为技术有限公司 编码的方法及装置
FR2929466A1 (fr) * 2008-03-28 2009-10-02 France Telecom Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique
MY159110A (en) * 2008-07-11 2016-12-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Audio encoder and decoder for encoding and decoding audio samples

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020103638A1 (en) 1998-08-24 2002-08-01 Conexant System, Inc System for improved use of pitch enhancement with subcodebooks
US20080249783A1 (en) 2007-04-05 2008-10-09 Texas Instruments Incorporated Layered Code-Excited Linear Prediction Speech Encoder and Decoder Having Plural Codebook Contributions in Enhancement Layers Thereof and Methods of Layered CELP Encoding and Decoding
US20090240491A1 (en) 2007-11-04 2009-09-24 Qualcomm Incorporated Technique for encoding/decoding of codebook indices for quantized mdct spectrum in scalable speech and audio codecs

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Max Neuendorf(editor). WD6 of USAC. ISO/IEC JTC1/SC29/WG11 N11213. 2010.01.*

Also Published As

Publication number Publication date
EP2559028A1 (en) 2013-02-20
AU2011241424A1 (en) 2012-08-30
MY162594A (en) 2017-06-30
KR20130069546A (ko) 2013-06-26
EP2559028A4 (en) 2014-07-02
US9053705B2 (en) 2015-06-09
JP2013527492A (ja) 2013-06-27
WO2011127569A1 (en) 2011-10-20
CN102844810A (zh) 2012-12-26
BR112012025347B1 (pt) 2020-06-09
JP6073215B2 (ja) 2017-02-01
CN102844810B (zh) 2017-05-03
ZA201206333B (en) 2013-04-24
CA2789107A1 (en) 2011-10-20
AU2011241424B2 (en) 2016-05-05
RU2012148280A (ru) 2014-05-20
BR112012025347A2 (pt) 2016-06-28
MX2012011943A (es) 2013-01-24
US20120089389A1 (en) 2012-04-12
ES2552179T3 (es) 2015-11-26
RU2547238C2 (ru) 2015-04-10
PT2559028E (pt) 2015-11-18
JP6456412B2 (ja) 2019-01-23
EP2559028B1 (en) 2015-09-16
DK2559028T3 (en) 2015-11-09
CA2789107C (en) 2017-08-15
JP2017083876A (ja) 2017-05-18

Similar Documents

Publication Publication Date Title
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
JP6456412B2 (ja) Celp符号器および復号器で使用するための柔軟で拡張性のある複合革新コードブック
KR20100113065A (ko) 정수 변환에 기초한 부호화 및 복호화에 대한 반올림 노이즈 셰이핑
JP6173304B2 (ja) Celpコーダにおける変換領域コードブック装置
KR100718487B1 (ko) 디지털 음성 코더들에서의 고조파 잡음 가중
EP1564723A1 (en) Transcoder and coder conversion method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant