KR20110113123A - 오디오 신호 처리 방법 및 장치 - Google Patents

오디오 신호 처리 방법 및 장치 Download PDF

Info

Publication number
KR20110113123A
KR20110113123A KR1020100086488A KR20100086488A KR20110113123A KR 20110113123 A KR20110113123 A KR 20110113123A KR 1020100086488 A KR1020100086488 A KR 1020100086488A KR 20100086488 A KR20100086488 A KR 20100086488A KR 20110113123 A KR20110113123 A KR 20110113123A
Authority
KR
South Korea
Prior art keywords
stage
current
codebook index
current stage
codebook
Prior art date
Application number
KR1020100086488A
Other languages
English (en)
Inventor
정규혁
이창헌
전혜정
이병석
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Priority to US13/640,042 priority Critical patent/US9153238B2/en
Priority to PCT/KR2011/002487 priority patent/WO2011126340A2/ko
Priority to EP11766191.8A priority patent/EP2557566B8/en
Priority to CN201180026076.6A priority patent/CN102906812B/zh
Publication of KR20110113123A publication Critical patent/KR20110113123A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks

Abstract

현재 프레임에 대한 이전 스테이지의 코드북 인덱스 후보자로부터 현재 스테이지의 타겟 신호를 생성하고, 상기 현재 스테이지의 타겟 신호에 대한 현재 스테이지의 코드북 인덱스를 획득하며, 제 2 베스트값에 기초하여 상기 현재 스테이지의 코드북 인덱스로부터 현재 스테이지의 코드북 인덱스 후보자를 선택함으로써, 코드북 검색의 복잡도를 줄일 수 있다.

Description

오디오 신호 처리 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}
본 발명은 오디오 신호 처리 방법 및 장치에 관한 것이다.
오디오 신호를 코딩함에 있어서, 오디오 신호의 압축률을 높이기 위해서 벡터 양자화 기법 등이 이용된다.
본 발명의 목적은 오디오 신호를 코딩함에 있어서, 벡터 양자화 기법을 이용하여 압축률을 향상시킴과 동시에 복잡도를 줄이고자 함에 있다.
상기 목적을 달성하기 위하여 본 발명은 복수개의 스테이지를 가지는 벡터 양자화 기법을 이용하는 것을 특징으로 하는 오디오 신호 처리 방법을 제시한다.
본 발명은 각 스테이지의 코드 벡터의 개수를 가변적으로 적용하는 것을 특징으로 하는 오디오 신호 처리 방법을 제시한다.
본 발명은 이전 스테이지의 에러값에 기초하여 현재 스테이지의 코드 벡터의 개수를 가변적으로 적용하는 것을 특징으로 하는 오디오 신호 처리 방법을 제시한다.
본 발명은 이전 프레임의 스테이지의 에러값에 기초하여 현재 스테이지의 코드 벡터의 개수를 가변적으로 적용하는 것을 특징으로 하는 오디오 신호 처리 방법을 제시한다.
본 발명에 따르면, 이전 스테이지 또는 이전 프레임의 스테이지의 에러값에 따라 코드 벡터의 개수를 가변적으로 적용함으로써, 코드북 검색의 복잡도를 줄일 수 있다.
도 1은 본 발명이 적용되는 일실시예로서, 선형 예측 분석기(100)를 개괄적으로 도시한 블록도이다.
도 2는 현재 프레임에 이용되는 윈도우 함수를 개괄적으로 도시한 것이다.
도 3은 선형 예측 필터 계수 양자화부(130)에서 선형 예측 필터의 계수를 양자화하는 과정을 개괄적으로 도시한 블록도이다.
도 4는 본 발명이 적용되는 일실시예로서, 코딩 모드에 따른 중간 벡터를 도시한 테이블이다.
도 5는 본 발명이 적용되는 일실시예로서, 코딩 모드와 예측 타입에 따른 예측 벡터를 도시한 테이블이다.
도 6은 본 발명이 적용되는 일실시예로서, 제 1 베스트값이 감소되는 스테이지를 도시한 테이블이다.
도 7은 본 발명이 적용되는 일실시예로서, 이전 스테이지의 에러값에 기초하여 제 2 베스트값을 결정하는 방법을 도시한 순서도이다.
도 8은 본 발명이 적용되는 일실시예로서, 현재 스테이지의 에러값에 기초하여 제 2 베스트값을 결정하는 방법을 도시한 순서도이다.
인코더에서 선형 예측 분석은 다음과 같은 과정으로 수행될 수 있다.
단기 예측(short-term prediction) 또는 선형 예측 분석은 시계열적 데이터에서 현재 상태가 과거 또는 미래 상태와 밀접한 연관성을 가지고 있음을 이용한 접근방법(autocorrelation approach)을 사용하여, CELP(Code-Excited Linear Prediction Coding) 모델의 합성 필터의 계수를 결정한다. 상기 합성 필터의 계수 즉, 선형 예측 필터의 계수는 ISP(Immitance Spectral Pair)로 변형된 후, 양자화 및 인터폴레이션을 위해 ISF(Immitance Spectral Frequencies)로 변형된다. 상기 인터폴레이션된, 그리고 양자화된 선형 예측 필터의 계수는 선형 예측 도메인(LP domain)상으로 변형되고, 각각의 서브 프레임에 대해서 합성 및 가중 필터링(weighting filtering)이 적용된다.
도 1은 본 발명이 적용되는 일실시예로서, 선형 예측 분석기(100)를 개괄적으로 도시한 블록도이다.
도 1을 참조하면, 상기 선형 예측 분석기(100)는 선형 예측 필터 계수 획득부(110), 선형 예측 필터 계수 변환부(120), 및 선형 예측 필터 계수 양자화부(130)를 포함할 수 있다.
상기 선형 예측 필터 계수 획득부(110)는 선형 예측 필터의 계수를 획득하며, 구체적인 방법은 도 2를 참조하여 살펴보기로 한다.
도 2는 현재 프레임에 이용되는 윈도우 함수를 개괄적으로 도시한 것이다.
프레임은 복수개의 서브 프레임으로 구성될 수 있다. 상기 프레임을 인코딩하는 경우, 프레임내의 샘플들은 윈도우 함수를 이용하여 스케일링될 수 있다. 상기 윈도우 함수는 입력 신호의 특성에 따라 프레임별로 이용되는 윈도우 함수의 개수, 윈도우 함수가 적용되는 프레임 또는 서브 프레임 단위 등이 결정될 수 있다. 예를 들어, 상기 윈도우 함수는 입력 신호가 음성 신호인지, 음악 신호인지, 또는 음성 신호와 음악 신호가 혼합된 신호인지를 고려하여 결정될 수 있다.
도 2를 참조하면, 프레임은 4개의 서브 프레임으로 구성되며, 상기 프레임을 인코딩하는 경우, 5개 서브 프레임의 단위로 윈도우 함수가 이용된다. 또한, 프레임별로 2개의 윈도우 함수를 이용하여 선형 예측 필터의 계수가 획득될 수 있다. 예를 들어, 제 1 윈도우 함수는 4번째 서브 프레임을 중심으로 위치하며, 제 2 윈도우 함수는 2번째 서브 프레임을 중심으로 위치한다. 이 경우, 상기 제 1 윈도우 함수 또는 상기 제 2 윈도우 함수는 다음 수학식 1에 따라 획득될 수 있다.
Figure pat00001
상기 수학식 1에서 n은 프레임내의 샘플 인덱스를 나타내며, L은 5*서브 프레임내의 샘플 수/2를 나타낸다.
상기 제 1 윈도우 함수에 대응하는 프레임내의 샘플들은 상기 제 1 윈도우 함수에 의해서 스케일링 될 수 있고, 상기 제 2 윈도우 함수에 대응하는 프레임내의 샘플들은 상기 제 2 윈도우 함수에 의해서 스케일링 될 수 있다. 스케일링된 신호는 다음 수학식 2 및 수학식 3과 같이 표현될 수 있다.
Figure pat00002
Figure pat00003
상기 수학식 2는 제 2 윈도우 함수에 의해 스케일링된 신호를 나타내며, 상기 수학식 3은 제 1 윈도우 함수에 의해 스케일링된 신호를 나타낸다. 상기 n은 프레임내의 샘플 인덱스를 나타내며, L1은 서브 프레임내의 샘플 수를 나타낸다.
상기 스케일링된 신호를 이용하여 자기 상관 함수(autocorrelation function)가 결정되고, 상기 자기 상관 함수(autocorrelation function)를 이용하여 선형 예측 필터의 계수가 획득될 수 있다.
상기 선형 예측 필터 계수 변환부(120)에서는 상기 선형 예측 필터의 계수가 ISP(Immitance Spectral Pair)로 변환된 후, 양자화 및 인터폴레이션을 위해 ISF(Immitance Spectral Frequencies)로 변환된다. 상기 선형 예측 필터 계수 양자화부(130)에서는 선형 예측 필터의 계수를 ISF(Immitance Spectral Frequencies) 도메인상에서 양자화한다. 이 경우, 수개의 스테이지를 가지는 멀티 스테이지 벡터 양자화기(Multi-Stage Vector Quantizer)가 이용될 수 있다.
도 3은 선형 예측 필터 계수 양자화부(130)에서 선형 예측 필터의 계수를 양자화하는 과정을 개괄적으로 도시한 블록도이다.
도 3을 참조하면, 상기 선형 예측 필터 계수 양자화부(130)는 타겟 신호 생성부(310), 가중 에러 측정부(320), 코드북 인덱스 저장부(330), 및 코드북 인덱스 후보자 선택부(340)를 포함할 수 있다.
상기 타겟 신호 생성부(310)는 현재 스테이지에서 양자화되는 신호 즉, 타겟 신호를 생성할 수 있다. 상기 현재 스테이지의 타겟 신호라 함은 이전 스테이지의 코드북 인덱스 후보자와 이전 스테이지의 타겟 신호간의 차분 신호를 의미할 수 있다. 상기 이전 스테이지의 코드북 인덱스 후보자는 이전 스테이지에서 코드북 탐색을 통해서 획득된 코드북 인덱스 중에서 현재 스테이지의 타겟 신호를 생성하기 위해서 선택된 코드북 인덱스을 나타내며, 코드북 인덱스 후보자를 선택하는 방법에 대해서는 이하 해당 부분에서 구체적으로 살펴보기로 한다.
다만, 상기 현재 스테이지가 첫번째 스테이지인 경우, 상기 타겟 신호는 스펙트럴 신호와 예측된 스펙트럴 신호간의 차분 신호를 의미할 수 있다. 상기 스펙트럴 신호는 ISF(Immitance Spectral Frequencies) 도메인상에서 변환된 선형 예측 필터의 계수를 의미할 수 있다. 또는, ISF(Immitance Spectral Frequencies) 계수로 표현될 수도 있다. 현재 프레임에 대해 복수개의 윈도우 함수가 이용되는 경우, 복수개의 선형 예측 필터의 계수를 획득할 수 있음은 앞서 본 바와 같다. 따라서, 상기 스펙트럴 신호는 복수개의 윈도우 함수에 대응하는 복수개의 스펙트럴 신호를 포함할 수 있다. 상기 타겟 신호는 예측 타입(strongly/weakly 내용 추가)을 고려하여 양자화될 수 있다. 이하, 상기 예측된 스펙트럴 신호를 획득하는 방법에 대해서 도 4 및 도 5를 참조하여 살펴보기로 한다.
도 4는 본 발명이 적용되는 일실시예로서, 코딩 모드에 따른 중간 벡터를 도시한 테이블이고, 도 5는 본 발명이 적용되는 일실시예로서, 코딩 모드와 예측 타입에 따른 예측 벡터를 도시한 테이블이다.
현재 프레임의 예측된 스펙트럴 신호는 이전 프레임의 스펙트럴 신호와 중간 벡터(mean vector)를 이용하여 획득될 수 있다. 상기 이전 프레임의 스펙트럴 신호는 양자화된 신호일 수 있다. 예를 들어, 상기 현재 프레임의 예측된 스펙트럴 신호는 중간 벡터와 제 1 예측 차분 신호의 합으로 획득될 수 있다. 상기 제 1 예측 차분 신호는 이전 프레임의 스펙트럴 신호와 중간 벡터간의 차분 신호를 의미할 수 있다. 또는, 상기 제 1 예측 차분 신호는 상기 이전 프레임의 스펙트럴 신호와 중간 벡터간의 차분 신호를 예측 벡터로 스케일링한 신호일 수 있다. 상기 예측 벡터는 상기 현재 프레임의 코딩 모드 및 예측 타입을 고려하여 결정될 수 있다. 상기 현재 프레임의 예측된 스펙트럴 신호는 다음 수학식 4 및 수학식 5와 같이 표현될 수 있다.
Figure pat00004
Figure pat00005
상기 수학식 4는 예측 타입(strongly)에 대한 예측된 스펙트럴 신호를 나타내며, 상기 수학식 5는 예측 타입(weakly)에 대한 예측된 스펙트럴 신호를 나타낸다. f[0]는 현재 프레임의 예측된 스펙트럴 신호를, f[-1]는 이전 프레임의 양자화된 스펙트럴 신호를 각각 나타내며, m(i)은 도 4의 테이블로부터 획득되는 중간 벡터를 나타낸다. p(i)는 도 5의 테이블로부터 획득되는 예측 벡터를 나타내며, i는 스펙트럴 신호내의 계수 인덱스를 나타낸다.
상기 가중 에러 측정부(320)는 상기 타겟 신호와 각 스테이지의 코드북간의 에러값(이하, 에러값이라 함.)을 측정하고, 상기 에러값이 증가하는 순서로 정렬할 수 있다. 이는 상기 에러값을 최소로 하는 코드북 인덱스를 추출하기 위한 것이다.
상기 코드북 인덱스 저장부(330)는 상기 정렬된 코드북으로부터 최상위에 위치한 코드북 인덱스 즉, 상기 에러값을 최소로 하는 코드북 인덱스를 선택하고, 이를 저장할 수 있다. 최상위에 위치한 복수개의 코드북 인덱스가 저정될 수도 있다. 또한, 상기 코드북 인덱스 저장부(330)는 상기 저장된 코드북 인덱스에 대응하는 에러값을 저장할 수 있다. 상기 코드북 인덱스 및 상기 에러값은 현재 스테이지의 타겟 신호별로 저장될 수 있다.
상기 저장되는 코드북 인덱스의 개수는 제 1 베스트값(M)에 기초하여 결정될 수 있다. 예를 들어, 상기 제 1 베스트값은 현재 스테이지의 타겟 신호별로 선택되는 코드북 인덱스의 개수를 의미할 수 있다. 선택되는 코드북 인덱스의 개수가 많을수록 복원된 신호의 퀄러티가 향상될 수 있으나, 코드북 탐색의 복잡도가 증가될 수 있다. 따라서, 상기 제 1 베스트값은 퀄러티와 복잡도를 상호 고려하여 결정될 수 있다.
일실시예로서, 최적화된 제 1 베스트값은 코딩 모드에 기초하여 결정될 수 있다. 예를 들어, 현재 프레임의 코딩 모드가 트랜지션 코딩 모드(Transition Coding mode)인 경우, 상기 제 1 베스트값은 7로 설정할 수 있고, 보이스드 코딩 모드(Voiced Coding mode), 언보이스드 코딩 모드(Unvoiced Coding mode), 또는 제너릭 코딩 모드(Generic Coding mode)인 경우, 상기 제 1 베스트값은 4로 설정될 수 있다.
한편, 코드북 탐색의 복잡도를 감소시키기 위해서 상기 설정된 제 1 베스트값을 스테이지별로 줄일 수 있다. 다만, 마지막 스테이지에서는 초기에 설정된 제 1 베스트값으로 설정될 수 있다. 이하, 도 6을 참조하여 구체적으로 살펴보기로 한다.
도 6은 본 발명이 적용되는 일실시예로서, 제 1 베스트값이 감소되는 스테이지를 도시한 테이블이다.
도 6을 참조하면, 현재 프레임이 협대역 신호(narrow-band signal)이고, 상기 현재 프레임의 코딩 모드가 보이스드 코딩 모드이며, 예측 타입(strongly)으로 양자화되는 경우를 살펴보기로 한다. 현재 프레임의 코딩 모드가 보이스드 코딩 모드이므로, 초기에 제 1 베스트값은 4로 설정될 수 있다. 제 1 베스트값이 감소되는 스테이지가 스테이지 3과 스테이지 5인 경우이므로, 스테이지 3 및 스테이지 4에서는 제 1 베스트값이 3으로 설정될 수 있고, 나아가 스테이지 5부터는 제 1 베스트값이 2로 설정될 수 있다. 다만, 마지막 스테이지에서는 초기에 설정된 제 1 베스트값으로 증가될 수 있다.
상기 살펴본 바와 같이 베스트값은 고정된 값으로 설정될 수 있으며, 또한 각 스테이지별로 가변적인 값으로 설정될 수 있다.
일실시예로서, 최적화된 제 1 베스트값은 이전 스테이지의 코드북 인덱스 저장부(330)에 저장된 에러값(이하, 이전 스테이지의 에러값이라 함.)에 기초하여 결정될 수 있다. 이전 스테이지의 코드북 인덱스 저장부(330)는 에러 분석부(미도시)를 더 포함할 수 있다. 상기 문턱값과 상기 이전 스테이지의 에러값간의 비교를 통하여 제 1 베트스값이 결정될 수 있다. 예를 들어, 상기 제 1 베스트값은 상기 문턱값보다 작은 이전 스테이지의 에러값을 가지는 코드북 인덱스의 개수로 결정될 수 있다.
일실시예로서, 최적화된 제 1 베스트값은 이전 프레임의 스테이지에서의 코드북 인덱스 저장부(330)에 저장된 에러값(이하, 이전 프레임의 에러값이라 함.)에 기초하여 결정될 수 있다. 상기 이전 프레임의 스테이지는 현재 프레임의 현재 스테이지와 동일한 스테이지를 의미할 수 있다. 이전 프레임의 스테이지에서의 코드북 인덱스 저장부(330)는 에러 분석부(미도시)를 더 포함할 수 있다. 상기 문턱값과 상기 이전 프레임의 에러값간의 비교를 통하여 제 1 베트스값이 결정될 수 있다. 예를 들어, 상기 제 1 베스트값은 상기 문턱값보다 작은 이전 프레임의 에러값을 가지는 코드북 인덱스의 개수로 결정될 수 있다.
또한, 상기 이전 스테이지로부터 결정된 제 1 베스트값과 이전 프레임의 스테이지로부터 결정된 제 1 베스트값을 상호 비교 분석하여 최적화된 제 1 베스트값을 결정할 수도 있다.
코드북 인덱스 후보자 선택부(340)는 상기 코드북 인덱스 저장부(330)에 저장된 복수개의 코드북 인덱스 중에서 다음 스테이지의 타겟 신호를 생성하기 위해 이용되는 코드북 인덱스를 선택할 수 있다. 상기 다음 스테이지의 타겟 신호를 생성하기 위해서 복수개의 코드북 인덱스가 선택될 수 있다.
상기 선택되는 코드북 인덱스의 개수는 제 2 베스트값에 기초하여 결정될 수 있다. 상기 제 2 베스트값은 현재 스테이지의 타겟 신호별로 선택된 코드북 인덱스 중에서 다음 스테이지의 타겟 신호를 생성하기 위해 선택되는 코드북 인덱스의 개수를 의미할 수 있다. 마찬가지로, 상기 선택되는 코드북 인덱스의 개수가 많을수록 복원된 신호의 퀄러티가 향상될 수 있으나, 코드북 탐색의 복잡도가 증가될 수 있는바, 상기 제 2 베스트값은 퀄러티와 복잡도를 상호 고려하여 결정될 수 있다.
상기 제 2 베스트값을 결정하는 방법은 앞서 설명한 제 1 베스트값을 결정하는 방법이 동일하게 적용될 수 있다.
도 7은 본 발명이 적용되는 일실시예로서, 이전 스테이지의 에러값에 기초하여 제 2 베스트값을 결정하는 방법을 도시한 순서도이다.
도 7을 참조하면, 이전 스테이지의 타겟 신호 생성할 수 있다(S700). 상기 이전 스테이지의 타겟 신호와 이전 스테이지의 코드북간의 에러값을 측정하고(S710), 상기 이전 스테이지의 에러값들로부터 이전 스테이지의 문턱값을 결정할 수 있다(S720). 상기 이전 스테이지의 문턱값과 상기 이전 스테이지의 에러값간의 비교 분석을 수행하고(S730), 그 결과에 기초하여 현재 스테이지의 제 2 베스트값을 결정할 수 있다(S740).
도 8은 본 발명이 적용되는 일실시예로서, 현재 스테이지의 에러값에 기초하여 제 2 베스트값을 결정하는 방법을 도시한 순서도이다.
최적화된 제 2 베스트값은 현재 스테이지의 코드북 인덱스 저장부(330)에 저장된 에러값(이하, 현재 스테이지의 에러값)에 기초하여 결정될 수 있다. 상기 현재 스테이지의 코드북 인덱스 저장부(330)는 에러 분석부(미도시)를 더 포함할 수 있다. 상기 문턱값과 상기 현재 스테이지의 에러값간의 비교를 통하여 제 2 베트스값이 결정될 수 있다. 예를 들어, 상기 제 2 베스트값은 상기 문턱값보다 작은 현재 스테이지의 에러값을 가지는 코드북 인덱스의 개수로 결정될 수 있다.
도 8을 참조하면, 이전 스테이지의 코드북 인덱스 후보자 및 상기 이전 스테이지의 코드북 인덱스 후보자에 대응하는 이전 스테이지의 타겟 신호를 획득할 수 있다(S800). 상기 이전 스테이지의 코드북 인덱스 후보자와 상기 이전 스테이지의 타겟 신호를 이용하여 현재 스테이지의 타겟 신호를 생성할 수 있다(S810). 상기 현재 스테이지의 타겟 신호는 상기 이전 스테이지의 코드북 인덱스 후보자와 상기 이전 스테이지의 타겟 신호간의 차분 신호를 의미할 수 있다. 또한, 상기 현재 스테이지의 타겟 신호는 앞서 설명한 제 1 베스트값에 따라 생성될 수도 있다. 예를 들어, 상기 제 1 베스트값과 동일한 개수로 획득될 수 있다.
상기 현재 스테이지의 타겟 신호와 현재 스테이지의 코드북간의 에러값을 측정할 수 있다(S820). 마찬가지로, 상기 현재 스테이지의 에러값들로부터 현재 스테이지의 문턱값을 결정하고(S830), 상기 현재 스테이지의 문턱값과 상기 현재 스테이지의 에러값간의 비교 분석을 수행할 수 있다(S840). 상기 비교 결과에 기초하여 현재 스테이지의 제 2 베스트값을 결정할 수 있다(S850).
디코더는 중간 벡터, 예측 벡터, 및 이전 프레임의 양자화된 스펙트럴 신호를 이용하여 현재 프레임의 예측된 스펙트럴 신호가 생성될 수 있다. 한편, 인코더의 코드북 인덱스 후보자 선택부(340)에 의해 선택된 코드북 인덱스 후보자 정보는 비트스트림으로부터 획득될 수 있다. 상기 선택된 코드북 인덱스 후보자 정보 및 상기 현재 프레임의 예측된 스펙트럴 신호를 이용하여 현재 프레임의 양자화된 스펙트럴 신호가 생성될 수 있다. 최종적으로, 상기 현재 프레임의 양자화된 스펙트럴 신호는 ISP 도메인으로 변환된 후, 다시 선형 예측 도메인으로 변환됨으로써, 양자화된 선형 예측 필터의 계수가 획득될 수 있다.
본 발명은 벡터 양자화 기법을 이용하여 오디오 신호를 코딩하는데 이용될 수 있다.

Claims (10)

  1. 현재 프레임에 대한 이전 스테이지의 코드북 인덱스 후보자를 획득하는 단계;
    상기 이전 스테이지의 코드북 인덱스 후보자에 대응하는 현재 프레임에 대한 현재 스테이지의 타겟 신호를 생성하는 단계;
    상기 현재 스테이지의 타겟 신호에 대한 현재 스테이지의 코드북 인덱스를 획득하는 단계;
    상기 현재 스테이지의 코드북 인덱스 중에서 현재 스테이지의 코드북 인덱스 후보자를 선택하는 단계를 포함하되,
    상기 현재 스테이지의 코드북 인덱스 후보자는 제 2 베스트값에 기초하여 선택되며, 상기 제 2 베스트값은 상기 현재 스테이지의 타겟 신호별로 획득된 코드북 인덱스 중에서 다음 스테이지의 타겟 신호를 생성하기 위해 선택되는 코드북 인덱스의 개수인 것을 특징으로 하는 오디오 신호 인코딩 방법.
  2. 제 1항에 있어서, 상기 현재 스테이지의 타겟 신호는 상기 이전 스테이지의 코드북 인덱스 후보자와 이전 스테이지의 타겟 신호간의 차분 신호인 것을 특징으로 하는 오디오 신호 인코딩 방법.
  3. 제 2항에 있어서, 상기 이전 스테이지의 타겟 신호는 상기 이전 스테이지의 코드북 인덱스 후보자에 대응하는 타겟 신호인 것을 특징으로 하는 오디오 신호 인코딩 방법.
  4. 제 2항에 있어서, 상기 이전 스테이지가 첫번째 스테이지인 경우, 상기 이전 스테이지의 타겟 신호는 상기 현재 프레임의 스펙트럴 신호와 상기 현재 프레임의 예측된 스펙트럴 신호간의 차분 신호인 것을 특징으로 하되,
    상기 현재 프레임의 예측된 스펙트럴 신호는 이전 프레임의 양자화된 스펙트럴 신호를 이용하여 예측되는 것을 특징으로 하는 오디오 신호 인코딩 방법.
  5. 제 1항에 있어서, 상기 현재 스테이지의 코드북 인덱스를 획득하는 단계는,
    상기 현재 스테이지의 타겟 신호와 현재 스테이지의 코드북간의 에러값을 획득하는 단계; 및
    상기 에러값이 증가하는 순서로 상기 현재 스테이지의 코드북을 정렬하는 단계를 더 포함하되,
    상기 현재 스테이지의 코드북 인덱스는 제 1 베스트값에 기초하여 획득되며, 상기 제 1 베스트값은 상기 현재 스테이지의 타겟 신호별로 선택되는 코드북 인덱스의 개수인 것을 특징으로 하는 오디오 신호 인코딩 방법.
  6. 제 5항에 있어서, 상기 현재 스테이지의 코드북 인덱스는 상기 정렬된 현재 스테이지의 코드북에서 최상위에 위치한 코드북 인덱스인 것을 특징으로 하는 오디오 신호 인코딩 방법.
  7. 제 5항에 있어서, 상기 제 1 베스트값은 코딩 모드에 기초하여 결정되되,
    상기 코딩 모드는 트랜지션 코딩 모드, 보이스드 코딩 모드, 언보이스드 코딩 모드 및 제너릭 코딩 모드를 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법.
  8. 제 1항에 있어서, 상기 현재 스테이지의 코드북 인덱스 후보자를 선택하는 단계는,
    상기 현재 스테이지의 에러값과 현재 스테이지의 문턱값을 비교하되, 상기 현재 스테이지의 문턱값은 상기 현재 스테이지의 코드북 인덱스들에 대응하는 에러값들에 기초하여 결정되는 것인 단계;
    상기 비교 결과에 기초하여 상기 제 2 베스트값을 결정하는 단계; 및
    상기 제 2 베스트값에 따라 상기 현재 스테이지의 코드북 인덱스 후보자를 선택하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 인코딩 방법.
  9. 제 8항에 있어서, 상기 선택된 현재 스테이지의 코드북 인덱스 후보자에 대응하는 에러값은 상기 문턱값과 동일하거나, 작은 것을 특징으로 하는 오디오 신호 인코딩 방법.
  10. 제 1항에 있어서, 제 2 베스트값은 이전 스테이지의 에러값과 이전 스테이지의 문턱값을 비교한 결과에 기초하여 결정되되,
    상기 이전 스테이지의 에러값은 이전 스테이지의 타겟 신호와 이전 스테이지의 코드북간의 에러값을 의미하며, 상기 이전 스테이지의 문턱값은 이전 스테이지의 코드북 인덱스들에 대응하는 에러값들에 기초하여 결정되는 것을 특징으로 하는 오디오 신호 인코딩 방법.
KR1020100086488A 2010-04-08 2010-09-03 오디오 신호 처리 방법 및 장치 KR20110113123A (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US13/640,042 US9153238B2 (en) 2010-04-08 2011-04-08 Method and apparatus for processing an audio signal
PCT/KR2011/002487 WO2011126340A2 (ko) 2010-04-08 2011-04-08 오디오 신호 처리 방법 및 장치
EP11766191.8A EP2557566B8 (en) 2010-04-08 2011-04-08 Method and apparatus for processing an audio signal
CN201180026076.6A CN102906812B (zh) 2010-04-08 2011-04-08 处理音频信号的方法和装置

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US32188110P 2010-04-08 2010-04-08
US61/321,881 2010-04-08

Publications (1)

Publication Number Publication Date
KR20110113123A true KR20110113123A (ko) 2011-10-14

Family

ID=45028583

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100086488A KR20110113123A (ko) 2010-04-08 2010-09-03 오디오 신호 처리 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20110113123A (ko)

Similar Documents

Publication Publication Date Title
US5751903A (en) Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
CA2833868C (en) Apparatus for quantizing linear predictive coding coefficients, sound encoding apparatus, apparatus for de-quantizing linear predictive coding coefficients, sound decoding apparatus, and electronic device therefor
CN105825861B (zh) 确定加权函数的设备和方法以及量化设备和方法
CN106463134B (zh) 用于对线性预测系数进行量化的方法和装置及用于反量化的方法和装置
KR101562281B1 (ko) 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
JPH08328588A (ja) ピッチラグを評価するためのシステム、音声符号化装置、ピッチラグを評価する方法、および音声符号化方法
EP2080193A2 (en) Pitch lag estimation
CN107077857B (zh) 对线性预测系数量化的方法和装置及解量化的方法和装置
JPH04270398A (ja) 音声符号化方式
KR101705276B1 (ko) 낮은 또는 중간 비트 레이트에 대한 인지 품질에 기반한 오디오 분류
KR101350285B1 (ko) 신호를 부호화 및 복호화하는 방법, 장치 및 시스템
KR20090117877A (ko) 부호화 장치 및 부호화 방법
KR100647290B1 (ko) 합성된 음성의 특성을 이용하여 양자화/역양자화를선택하는 음성 부호화/복호화 장치 및 그 방법
KR20050006883A (ko) 광대역 음성 부호화기 및 그 방법과 광대역 음성 복호화기및 그 방법
RU2622860C2 (ru) Устройство и способ для обработки кодированного сигнала и кодер и способ для генерирования кодированного сигнала
KR20110113123A (ko) 오디오 신호 처리 방법 및 장치
KR101789632B1 (ko) 음성 신호 부호화 방법 및 장치
Sooraj et al. Performance analysis of CELP codec for Gaussian and fixed codebooks
Kassim et al. Compressive sensing based low bit rate speech encoder
JP2892462B2 (ja) コード励振線形予測符号化器
KR20100006491A (ko) 무성음 부호화 및 복호화 방법 및 장치
KR20110113124A (ko) 오디오 신호 처리 방법 및 장치
Chomphan Thai Speech Coding Based On Conjugate-Structure Algebraic Code Excited Linear Prediction Algorithm
JPH04270397A (ja) 音声符号化方式
KR20110106779A (ko) 오디오 신호 처리 방법 및 장치

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination