KR20130108281A - 부호화 장치 및 부호화 방법 - Google Patents

부호화 장치 및 부호화 방법 Download PDF

Info

Publication number
KR20130108281A
KR20130108281A KR1020137005813A KR20137005813A KR20130108281A KR 20130108281 A KR20130108281 A KR 20130108281A KR 1020137005813 A KR1020137005813 A KR 1020137005813A KR 20137005813 A KR20137005813 A KR 20137005813A KR 20130108281 A KR20130108281 A KR 20130108281A
Authority
KR
South Korea
Prior art keywords
suppression
spectrum
celp
encoding
unit
Prior art date
Application number
KR1020137005813A
Other languages
English (en)
Inventor
다쿠야 가와시마
마사히로 오시키리
Original Assignee
파나소닉 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 파나소닉 주식회사 filed Critical 파나소닉 주식회사
Publication of KR20130108281A publication Critical patent/KR20130108281A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Abstract

음성 신호에 적합한 부호화와 음악 신호에 적합한 부호화를 계층 구조로 해서 조합시킨 부호화 방식에 있어서, 부호화의 품질 열화를 억제하면서, 부호화 장치에 있어서의 처리량을 삭감할 수 있는 부호화 장치. 이 장치에 있어서, 본선택 후보 한정부(109)는, 입력 신호의 스펙트럼과 잔차 스펙트럼을 이용해 예비 선택된 소정 수의 억압 계수를 CELP 성분 억압부(104)에 대해서 지시하고, 변환 부호화부(110)는 지시된 억압 계수를 CELP 성분 억압부(104)에서 이용해 생성된 억압 스펙트럼을 CELP잔차신호 스펙트럼 산출부(105)에 입력해서 산출된 잔차 스펙트럼을 이용해 제2부호화를 행하고, 왜곡 평가부(112)는 제2부호화에 의해 얻어진 제2 부호를 복호해서 생성된 제2 복호 신호의 스펙트럼과 억압 스펙트럼과 입력 신호의 스펙트럼을 이용해, 지시된 억압 계수 중에서 1개의 억압 계수를 결정한다.

Description

부호화 장치 및 부호화 방법{ENCODER APPARATUS AND ENCODING METHOD}
본 발명은, 부호화 장치 및 부호화 방법에 관한 것이다.
음성 및 음악등을, 저비트레이트(低bit rate)이면서도 고음질로 압축할 수 있는 부호화 방식으로서 음성 신호에 적합한 CELP(Code Excited Linear Prediction) 부호화 방식과, 음악 신호에 적합한 변환 부호화 방식을 계층 구조로 하여 조합시킨 부호화 방식이 제안되어 있다(예를 들면, 비특허 문헌1 참조). 또한, 이하(以下)에 있어서는, 음성 신호와 음악 신호를 총칭해서 음향 신호라고 부르는 일도 있다.
이 부호화 방식에서는, 부호화 장치는, 우선, CELP 부호화 방식으로 입력 신호를 부호화하여 CELP 부호화 데이터를 생성한다. 그 다음에, 부호화 장치는, 입력 신호와 CELP 복호 신호(CELP 부호화 데이터의 복호 결과)의 잔차(殘差)신호(이하, CELP잔차신호라고 부름)를 주파수 영역으로 변환해서 얻어지는 잔차 스펙트럼을 변환 부호화함으로써, 고음질화를 꾀하고 있다. 변환 부호화 방식으로서는, 잔차 스펙트럼의 에너지가 큰 주파수에 펄스를 생성하여, 그 펄스의 정보를 부호화하는 방식이 제안되어 있다(비특허 문헌 1 참조).
그렇지만, CELP 부호화 방식은, 음성 신호의 부호화에는 적합하지만, 음악 신호에 대해서는 부호화 모델이 다르므로 음질이 나빠진다. 그 때문에, 상기 부호화 방식으로 음악 신호를 부호화했을 경우, CELP잔차신호의 성분이 커지기 때문에, 변환 부호화에 의해 CELP잔차신호(잔차 스펙트럼)를 부호화해도 음질이 향상하기 어렵다는 과제가 있다.
이 과제를 해결하기 위하여, CELP 복호 신호의 주파수 성분(이하, CELP 성분이라고 부름)의 진폭을 억압한 결과를 이용해 산출되는 잔차 스펙트럼을 변환 부호화함으로써 고음질화를 꾀하는 부호화 방식(CELP 성분 억압 방법)이 제안되어 있다(예를 들면, 특허 문헌 1 및 비특허 문헌 1 (section 6.11.6.2) 참조).
비특허 문헌 1에 개시된 CELP 성분 억압 방법에서는, 입력 신호의 샘플링 주파수가 16kHz인 경우, 0.8kHz~5.5kHz의 중대역에서만 CELP 성분의 진폭의 억압(이하, CELP 억압이라고 부름)이 행해진다. 단, 비특허 문헌 1에서는, 부호화 장치는, CELP잔차신호에 대해서 변환 부호화를 직접 행하는 것은 아니고, 그 전에 다른 변환 부호화 방식(예를 들면, 비특허 문헌 1(Section 6.11.6.1) 참조)에 의해 CELP 성분의 잔차신호를 작게 하고 있다. 이 때문에, 부호화 장치는, 중대역이라 하더라도 상기 다른 변환 부호화 방식에 의해 부호화된 주파수 성분에 대해서는 CELP 억압을 행하지 않는다. 또, 중대역내의 CELP 억압을 행하지않는 주파수 이외의 기타 주파수에서는, CELP 억압의 정도(강도)를 나타내는 CELP 억압 계수는 한가지이다. CELP 억압 계수는, CELP 억압의 강도별로 코드북(이하, CELP 억압 계수 코드북 이라고 부름) 에 저장되어 있다. CELP 억압 계수 코드북에는, CELP 성분을 전혀 억압하지 않는 것을 의미하는 계수(=1.0)도 저장되어 있다.
부호화 장치는, 변환 부호화를 행하기 전에, CELP 성분(CELP 복호 신호)과, CELP 억압 계수 코드북에 저장되어 있는 CELP 억압 계수를 곱함으로써 CELP 억압을 행한 뒤, 입력 신호와 CELP 복호 신호(CELP 억압 후의 CELP 복호 신호) 의 잔차 스펙트럼을 구해, 잔차 스펙트럼을 변환 부호화 한다. 이 변환 부호화는, 모든 CELP 억압 계수에 대해서 행해진다. 그리고, 부호화 장치는, 변환 부호화 데이터의 복호 신호와 CELP 성분이 억압된 CELP 복호 신호를 가산한 신호와, 입력 신호의 잔차신호를 산출하고, 잔차신호의 에너지(이하, 부호화 왜곡이라고 부름)가 최소가 되는 CELP 억압 계수를 결정하고, 탐색한 CELP 억압 계수(부호화 왜곡이 최소가 되는 CELP 억압 계수)를 부호화한다. 이것에 의해, 부호화 장치에서는, 대역 전체로서 부호화 왜곡을 최소로 한 변환 부호화를 행할 수 있다. 이하에서는, CELP 억압 계수별로 변환 부호화를 행하여, 부호화 왜곡(잔차신호의 에너지)이 최소가 되는 CELP 억압 계수를 결정하는 일련의 처리를 「본선택(本選擇)」이라고 부르기로 한다.
한편, 복호 장치는, 부호화 장치로부터 송신되는 CELP 억압 계수를 이용하여, CELP 복호 신호의 CELP 성분을 억압하고, CELP 성분이 억압된 CELP 복호 신호에 변환 부호화의 복호 신호를 가산한다. 이렇게 함으로써, 복호 장치에서는, CELP 부호화와 변환 부호화를 계층 구조로 해서 조합시킨 부호화를 행할 때의 CELP 부호화에 의한 음질의 열화를 억제한 복호 신호를 얻을 수 있다.
미국 특허 출원 공개 제 2009/0112607호 명세서
Recommendation ITU-T G.718,2008년6월
그렇지만, 상술한 CELP 성분 억압 방법을 이용하여, CELP 억압 계수 코드북에 저장되어 있는 CELP 억압 계수별로 변환 부호화를 행함으로써, 부호화 왜곡의 평가(이하, 왜곡 평가라고 부르는 일이 있음)를 행하는 경우에는, CELP 억압 계수 전부의 후보, 즉, CELP 억압 계수 코드북에 저장되어 있는 모든 CELP 억압 계수에 대해서 변환 부호화를 행할 필요가 있기때문에, 부호화 장치에 있어서의 처리량이 대단히 커져 버린다고 하는 과제가 있다.
본 발명의 목적은, CELP 억압 계수별로 생성되는, 변환 부호화 처리에 대한 입력 신호(이하, 타깃 신호라고 부름) 중에서 일부를 선택(이하, 「예비 선택」이라고 부름) 하여, 본선택에 있어서 변환 부호화를 행하는 대상을 한정함으로써, 부호화의 품질 열화를 억제하면서, 부호화 장치에 있어서의 처리량을 삭감할 수 있는 부호화 장치 및 부호화 방법을 제공하는 것이다.
본 발명의 한 형태에 따른 부호화 장치는, 입력 신호에 대한 제1의 부호화에 의해 얻어진 제1 부호를 복호해서 생성된 제1 복호 신호의 스펙트럼을 출력하는 제1부호화부와, 상기 제1 복호 신호의 스펙트럼의 진폭을, 복수의 억압 계수중에서 지시된 억압 계수를 이용해 억압하여 억압 스펙트럼을 생성하는 억압부와, 상기 입력 신호의 스펙트럼과 상기 억압 스펙트럼을 이용해서 잔차 스펙트럼을 산출하는 잔차 스펙트럼 산출부와, 상기 입력 신호의 스펙트럼과 상기 잔차 스펙트럼을 이용해, 소정 수의 억압 계수를 예비 선택하고, 상기 예비 선택된 억압 계수를 상기 억압부에 대해서 지시하는 예비 선택부와, 상기 지시된 억압 계수를 상기 억압부에서 이용해 생성된 억압 스펙트럼을 상기 잔차 스펙트럼 산출부에 입력해서 산출된 잔차 스펙트럼을 이용해 제2의 부호화를 행하고, 상기 제2 부호화에 의해 얻어진 제2 부호를 복호해서 생성된 제2 복호 신호의 스펙트럼과, 상기 억압 스펙트럼과, 상기 입력 신호의 스펙트럼을 이용하여, 상기 지시된 억압 계수중에서 1개의 억압 계수를 결정하는 제2부호화부를 구비한다.
본 발명의 한 형태에 따른 부호화 방법은, 입력 신호에 대한 제1의 부호화에 의해 얻어진 제1 부호를 복호해서 생성된 제1 복호 신호의 스펙트럼을 출력하는 제1부호화 단계와, 상기 제1 복호 신호의 스펙트럼 진폭을, 복수의 억압 계수중에서 지시된 억압 계수를 이용해 억압하여 억압 스펙트럼을 생성하는 억압 단계와, 상기 입력 신호의 스펙트럼과 상기 억압 스펙트럼을 이용해서 잔차 스펙트럼을 산출하는 잔차 스펙트럼 산출 단계와, 상기 입력 신호의 스펙트럼과 상기 잔차 스펙트럼을 이용해서, 상기 억압 단계에서 이용할 소정 수의 억압 계수를 예비 선택하고, 상기 예비선택된 억압 계수를 상기 지시된 억압 계수로 설정하는 예비선택 단계와, 상기 지시된 억압 계수를 상기 억압 단계에서 이용하여 생성된 억압 스펙트럼을 이용해 상기 잔차 스펙트럼 산출 단계에서 산출된 잔차 스펙트럼을 이용해서 제2의 부호화를 행하고, 상기 제2 부호화에 의해 얻어진 제2 부호를 복호해서 생성된 제2 복호 신호의 스펙트럼과, 상기 억압 스펙트럼과, 상기 입력 신호의 스펙트럼을 이용하여, 상기 지시된 억압 계수중에서 1개의 억압 계수를 결정하는 제2부호화 단계를 가진다.
본 발명에 의하면, 음성 신호에 적합한 부호화와 음악 신호에 적합한 부호화를 계층 구조로 해서 조합시킨 부호화 방식에 있어서, 모든 CELP 억압 계수 후보에 대해서 변환 부호화를 순차적으로 행하는 방법과 비교해서, 부호화의 품질 열화를 억제하면서, 부호화 장치에 있어서의 처리량을 삭감할 수 있다.
도 1은, 본 발명의 실시형태 1에 따른 부호화 장치의 구성을 나타내는 블록도이다.
도 2는, 본 발명의 실시형태 1에 따른 복호 장치의 구성을 나타내는 블록도이다.
도 3은, 본 발명의 실시형태 2에 따른 부호화 장치의 구성을 나타내는 블록도이다.
이하, 본 발명의 각 실시형태에 대해서, 도면을 참조하여 상세히 설명한다. 또한, 본 발명에 따른 부호화 장치 및 복호 장치로서, 음향 부호화 장치 및 음향 복호 장치를 예로 들어 설명한다. 또한, 상술한 바와 같이, 음성 신호와 음악 신호를 총칭해서 음향 신호라고 칭하는 것으로 한다. 즉, 음향 신호는, 실질적으로 음성 신호만, 실질적으로 음악 신호만, 음성 신호 및 음악 신호가 혼재한 신호의 어느 신호도 다 나타내는 것으로 한다.
또, 본 발명에 따른 부호화 장치 및 복호 장치는, 적어도 2개의 부호화를 행하는 계층을 가진다. 이하의 설명에 있어서는, 음성 신호에 적합한 부호화로서 CELP 부호화를, 음악 신호에 적합한 부호화로서 변환 부호화를, 각각 대표로 이용하는 것으로 하고, 부호화 장치 및 복호 장치는, CELP 부호화와 변환 부호화를 계층 구조로 해서 조합시킨 부호화 방식을 이용한다.
(실시형태 1)
도 1은, 본 발명의 실시형태 1에 따른 부호화 장치(100)의 주요한 구성을 나타내는 블록도이다. 부호화 장치(100)는, 음성 및 음악 등의 입력 신호를, CELP 부호화와 변환 부호화를 계층 구조로 해서 조합시킨 부호화 방식을 이용해 부호화하여, 부호화 데이터를 출력한다. 도 1에 나타내는 것처럼, 부호화 장치(100)는, MDCT(Modified Discrete Cosine Transform:수정 이산 코사인 변환) 부(101), CELP 부호화부(102), MDCT부(103), CELP 성분 억압부(104), CELP잔차신호 스펙트럼 산출부(105), 펄스 위치 추정부(106), 추정 펄스 감쇠부(107), 추정 왜곡 평가부(108), 본선택 후보 한정부(109), 변환 부호화부(110), 가산부(111), 왜곡 평가부(112) 및 다중화부(113)를 구비한다. 각 부는 이하의 동작을 행한다.
도 1에 나타내는 부호화 장치(100)에 있어서, MDCT부(101)는, 입력 신호에 대해서 MDCT 처리를 행하여 입력 신호 스펙트럼을 생성한다. 그리고, MDCT부(101)는, 생성한 입력 신호 스펙트럼을 CELP잔차신호 스펙트럼 산출부(105), 왜곡 평가부(112) 및 추정 왜곡 평가부(108)에 출력한다.
CELP 부호화부(102)는, 입력 신호를 CELP 부호화 방식에 의해 부호화하여 CELP 부호화 데이터를 생성한다. 또, CELP 부호화부(102)는, 생성한 CELP 부호화 데이터를 복호(로컬 디코드)하여 CELP 복호 신호를 생성한다. 그리고, CELP 부호화부(102)는, CELP 부호화 데이터를 다중화부(113)에 출력하고, CELP 복호 신호를 MDCT부(103)에 출력한다.
MDCT부(103)는, CELP 부호화부(102)로부터 입력되는 CELP 복호 신호에 대해서 MDCT 처리를 행하여 CELP 복호 신호 스펙트럼을 생성한다. 그리고, MDCT부(103)는, 생성한 CELP 복호 신호 스펙트럼을 CELP 성분 억압부(104)에 출력한다.
이와 같이, 예를 들면, CELP 부호화부(102) 및 MDCT부(103)는, 입력 신호에 대한 제1의 부호화에 의해 얻어진 제1 부호를 복호해서 생성된 제1 복호 신호의 스펙트럼을 출력하는 제1부호화부로서 동작한다.
CELP 성분 억압부(104)는, CELP 억압의 정도(강도)를 나타내는 CELP 억압 계수가 저장된 CELP 억압 계수 코드북을 구비한다. 예를 들면, CELP 억압 계수 코드북에는, 억압하지 않음을 의미하는 1.0부터, CELP 성분의 진폭을 절반으로 하는 0.5까지의 4 종류의 CELP 억압 계수가 저장되어 있다. 즉, CELP 억압 계수는, CELP 억압의 정도(강도)가 클수록 값이 보다 작아진다. 또, 여기에서의 CELP 억압 계수 코드북에서는, CELP 억압 계수가 CELP 억압의 정도(강도)의 오름차순(昇順) 또는 내림차순(降順)으로 저장되어 있는 것으로 한다. 또, 각 CELP 억압 계수에는, CELP 억압의 정도(강도)에 관해서 오름차순 또는 내림차순으로 인덱스(CELP 억압 계수 인덱스)가 부여되어 있는 것으로 한다.
우선, CELP 성분 억압부(104)는, 추정 왜곡 평가부(108), 본선택 후보 한정부(109) 또는 왜곡 평가부(112)로부터 입력되는 CELP 억압 계수 인덱스에 따라, CELP 억압 계수 코드북 중에서 CELP 억압 계수를 선택한다. 그리고, CELP 성분 억압부(104)는, 선택한 CELP 억압 계수를, MDCT부(103)로부터 입력되는 CELP 복호 신호 스펙트럼의 주파수 성분마다 곱하여, CELP 성분 억압 스펙트럼을 산출한다. 그리고, CELP 성분 억압부(104)는, CELP 성분 억압 스펙트럼을 CELP잔차신호 스펙트럼 산출부(105) 및 가산부(111)에 출력한다.
CELP잔차신호 스펙트럼 산출부(105)는, MDCT부(101)로부터 입력되는 입력 신호 스펙트럼과, CELP 성분 억압부(104)로부터 입력되는 CELP 성분 억압 스펙트럼의 차분(差分)인 CELP잔차신호 스펙트럼을 산출한다. 구체적으로는, CELP잔차신호 스펙트럼 산출부(105)는, 입력 신호 스펙트럼으로부터 CELP 성분 억압 스펙트럼을 감소시킴으로써, CELP잔차신호 스펙트럼을 얻는다. 그리고, CELP잔차신호 스펙트럼 산출부(105)는, CELP잔차신호 스펙트럼을 변환 부호화부(110), 펄스 위치 추정부(106) 및 추정 펄스 감쇠부(107)에 출력한다.
펄스 위치 추정부(106)는, CELP잔차신호 스펙트럼 산출부(105) 로부터 입력되는 CELP잔차신호 스펙트럼(변환 부호화 대상 신호. 이하, 타깃(target)신호라고 부르는 일이 있음.) 을 이용해서, 변환 부호화부(110)에서 부호화되는 펄스 위치(예를 들면, CELP잔차신호 스펙트럼의 진폭이 큰 주파수)를 추정한다. 그리고, 펄스 위치 추정부(106)는, 추정한 펄스 위치(추정 펄스 위치)를 추정 펄스 감쇠부(107)에 출력한다.
추정 펄스 감쇠부(107)는, CELP잔차신호 스펙트럼 산출부(105) 로부터 입력되는 CELP잔차신호 스펙트럼 중, 펄스 위치 추정부(106) 로부터 입력되는 추정 펄스 위치에 있어서의 진폭을 감쇠시킨다. 그리고, 추정 펄스 감쇠부(107)는, 감쇠 후의 스펙트럼을 변환 부호화 추정 잔차 스펙트럼으로서 추정 왜곡 평가부(108)에 출력한다.
추정 왜곡 평가부(108)는, MDCT부(101)로부터 입력되는 입력 신호 스펙트럼, 및, 추정 펄스 감쇠부(107)로부터 입력되는 변환 부호화 추정 잔차 스펙트럼을 이용하여, 변환 부호화에 의한 부호화 왜곡(왜곡 에너지)의 추정값인 추정 왜곡 에너지를 산출한다. 그리고, 추정 왜곡 평가부(108)는, 추정 왜곡 에너지를 본선택 후보 한정부(109)에 출력한다.
또, 추정 왜곡 평가부(108)는, 후술하는 예비 선택 탐색에 있어서 평가 대상의 CELP 억압 계수에 대응하는 변환 부호화 추정 잔차 스펙트럼을 얻기 위해서, 평가 대상의 CELP 억압 계수 인덱스를 CELP 성분 억압부(104)에 출력한다. 예를 들면, 추정 왜곡 평가부(108)는, CELP 억압 계수 인덱스 j=1에 대한 추정 왜곡 에너지를 산출할 때에는, CELP 억압 계수 인덱스 j=1을 CELP 성분 억압부(104)에 출력한다. 그리고, 추정 왜곡 평가부(108)는, CELP 성분 억압부(104), CELP잔차신호 스펙트럼 산출부(105), 펄스 위치 추정부(106), 추정 펄스 감쇠부(107)에서 순차적으로 처리된 결과인 변환 부호화 추정 잔차 스펙트럼(CELP 억압 계수 인덱스 j=1에 대응)에 대한 추정 왜곡 에너지를 산출한다.
본선택 후보 한정부(109)는, 추정 왜곡 평가부(108)로부터 입력되는 추정 왜곡 에너지의 분포에 기초하여, CELP 억압 코드북에 저장되어 있는 CELP 억압 계수 중, 후술하는 본선택 탐색에서 탐색하는 CELP 억압 계수(변환 부호화에 이용하는 CELP 억압 계수)의 후보를 한정한다. 그리고, 본선택 후보 한정부(109)는, 한정된 CELP 억압 계수의 후보를 나타내는 CELP 억압 계수 인덱스를 CELP 성분 억압부(104)에 출력한다. 또한, 이하에 있어서, 여기서 한정된 CELP 억압 계수의 후보를 합쳐서 CELP 억압 계수군(抑壓係數群), 또, 한정된 CELP 억압 계수의 후보에 대응하는 CELP 억압 계수 인덱스를 합쳐서 CELP 억압 계수 인덱스군(群), 이라고 부르는 일이 있다.
이와 같이, 예를 들면, 펄스 위치 추정부(106), 추정 펄스 감쇠부(107), 추정 왜곡 평가부(108) 및 본선택 후보 한정부(109)는, 입력 신호 스펙트럼과 CELP잔차신호 스펙트럼을 이용하여, 소정 수의 CELP 억압 계수를 예비 선택하고, 예비 선택된 CELP 억압 계수를 CELP 성분 억압부(104)에 대해서 지시하는 예비 선택부로서 동작한다.
또한, 도 1에 나타내는 부호화 장치(100)에 있어서, CELP 성분 억압부(104), CELP잔차신호 스펙트럼 산출부(105), 펄스 위치 추정부(106), 추정 펄스 감쇠부(107), 추정 왜곡 평가부(108) 및 본선택 후보 한정부(109)는, 폐루프(closed loop)를 구성한다. 이 폐루프를 구성하는 각 구성부는, CELP 성분 억압부(104)가 구비하는 CELP 억압 코드북에 저장되어 있는 CELP 억압 계수 중, 추정 왜곡 평가부(108)로부터 지시되는 CELP 억압 계수 인덱스에 대응하는 CELP 억압 계수를 이용하여, 후술하는 본선택 탐색에 있어서 탐색 대상이 되는 후보(CELP 억압 계수 인덱스)를 탐색한다. 이하, 이 탐색 처리를, 「예비 선택 탐색」이라고 부른다.
변환 부호화부(110)는, CELP잔차신호 스펙트럼 산출부(105)로부터 입력되는 CELP잔차신호 스펙트럼(타깃 신호)을 변환 부호화에 의해 부호화하여, 변환 부호화 데이터를 생성한다. 또, 변환 부호화부(110)는, 생성한 변환 부호화 데이터를 복호(로컬 디코드)하고, 변환 부호화 복호 신호 스펙트럼을 생성한다. 이 때, 변환 부호화부(110)는, CELP잔차신호 스펙트럼과 변환 부호화 복호 신호 스펙트럼의 왜곡이 작아지도록 부호화를 행한다. 예를 들면, 변환 부호화부(110)는, CELP잔차신호 스펙트럼의 진폭(에너지)이 큰 주파수에, 펄스를 생성함으로써 상기 왜곡을 작게하도록 부호화를 행한다. 그리고, 변환 부호화부(110)는, 부호화에 의해 얻어진 변환 부호화 데이터를 왜곡 평가부(112)에 출력하고, 변환 부호화 복호 신호 스펙트럼을 가산부(111)에 출력한다.
가산부(111)는, CELP 성분 억압부(104)로부터 입력되는 CELP 성분 억압 스펙트럼과, 변환 부호화부(110)로부터 입력되는 변환 부호화 복호 신호 스펙트럼을 가산해서 복호 신호 스펙트럼을 산출하고, 복호 신호 스펙트럼을 왜곡 평가부(112)에 출력한다.
왜곡 평가부(112)는, CELP 성분 억압부(104)가 구비하는 CELP 억압 계수 코드북에 저장된 CLEP 억압 계수 중, 일부 인덱스(본선택 후보 한정부(109)에서 한정된 CELP 억압 계수 인덱스)를 주사(走査)해서, MDCT부(101)로부터 입력되는 입력 신호 스펙트럼과 가산부(111)로부터 입력되는 복호 신호 스펙트럼의 왜곡(즉, 변환 부호화에 의한 부호화 왜곡) 이 최소가 되는 CELP 억압 계수 인덱스를 탐색한다. 즉, 왜곡 평가부(112)는, 상기 일부의 인덱스에 대응하는 CELP 억압 계수를 이용해 CELP 억압을 행하도록 CELP 성분 억압부(104)를 제어한다(CELP 억압 계수 인덱스를 출력한다). 그리고, 왜곡 평가부(112)는, 산출한 왜곡이 최소가 되는 CELP 억압 계수 인덱스를, CELP 억압 계수 최적 인덱스 로서 다중화부(113)에 출력하고, 변환 부호화부(110)로부터 입력되는 변환 부호화 데이터 중 CELP 억압 계수 최적 인덱스에 대응하는 변환 부호화 데이터(왜곡 최소시의 변환 부호화 데이터)를 다중화부(113)에 출력한다.
이와 같이, 예를 들면, 변환 부호화부(110), 가산부(111) 및 왜곡 평가부(112)는, 상술한 예비 선택부로부터 지시된 CELP 억압 계수를 CELP 성분 억압부(104)에서 이용하여 생성된 CELP 억압 스펙트럼을 CELP잔차신호 스펙트럼 산출부(105)에 입력하여 산출된 CELP잔차신호 스펙트럼을 이용해 변환 부호화(제2 부호화)를 행하고, 변환 부호화에 의해 얻어진 변환 부호화 데이터(제2 부호)를 복호하여 생성된 변환 부호화 복호 신호 스펙트럼(제2 복호 신호 스펙트럼)과, CELP 억압 스펙트럼과, 입력 신호 스펙트럼을 이용하여, 지시된 CELP 억압 계수중에서 1개의 CELP 억압 계수를 결정하는 제2부호화부로서 동작한다.
또한, 도 1에 나타내는 부호화 장치(100)에 있어서, CELP 성분 억압부(104), CELP잔차신호 스펙트럼 산출부(105), 변환 부호화부(110), 가산부(111) 및 왜곡 평가부(112)는, 폐루프를 구성한다. 이 폐루프를 구성하는 각 구성부는, CELP 성분 억압부(104)가 구비하는 CELP 억압 코드북에 저장되어 있는 복수의 CELP 억압 계수 중, 본선택 후보 한정부(109)로부터 지시되는 CELP 억압 계수 인덱스에 대응하는 CELP 억압 계수를 이용해 복호 신호 스펙트럼을 생성하여, 입력 신호 스펙트럼과 복호 신호 스펙트럼의 왜곡(변환 부호화에 의한 부호화 왜곡)이 최소가 되는 후보(CELP 억압 계수 인덱스)를 탐색한다. 이하, 이 탐색 처리를, 「본선택 탐색」이라고 부른다.
다중화부(113)는, CELP 부호화부(102)로부터 입력되는 CELP 부호화 데이터, 왜곡 평가부(112)로부터 입력되는 변환 부호화 데이터(왜곡 최소시의 변환 부호화 데이터) 및 CELP 억압 계수 최적 인덱스를 다중화하고, 다중화 결과를 부호화 데이터로서 복호 장치에 송신한다.
다음에, 복호 장치(200)에 대해서 설명한다. 복호 장치(200)는, 부호화 장치(100)로부터 송신되는 부호화 데이터를 복호하여, 복호 신호를 출력한다.
도 2는, 복호 장치(200)의 주요한 구성을 나타내는 블록도이다. 복호 장치(200)는, 분리부(201), 변환 부호화 복호부(202), CELP 복호부(203), MDCT부(204), CELP 성분 억압부(205), 가산부(206), IMDCT(Inverse Modified Discrete Cosine Transform:역수정 이산 코사인 변환) 부(207)를 구비한다. 각부는 이하의 동작을 행한다.
도 2에 나타내는 복호 장치(200)에 있어서, 분리부(201)는, CELP 부호화 데이터와, 변환 부호화 데이터와, CELP 억압 계수 최적 인덱스를 포함한 부호화 데이터를, 부호화 장치(100)(도 1)로부터 전송로(도면표시 없음)를 경유하여 수신한다. 분리부(201)는, 부호화 데이터를, CELP 부호화 데이터와, 변환 부호화 데이터와, CELP 억압 계수 최적 인덱스로 분리한다. 그리고, 분리부(201)는, CELP 부호화 데이터를 CELP 복호부(203)에 출력하고, 변환 부호화 데이터를 변환 부호화 복호부(202)에 출력하고, CELP 억압 계수 최적 인덱스를 CELP 성분 억압부(205)에 출력한다.
변환 부호화 복호부(202)는, 분리부(201)로부터 입력되는 변환 부호화 데이터를 복호하여, 변환 부호화 복호 신호 스펙트럼을 생성하고, 변환 부호화 복호 신호 스펙트럼을 가산부(206)에 출력한다.
CELP 복호부(203)는, 분리부(201)로부터 입력되는 CELP 부호화 데이터를 복호하고, CELP 복호 신호를 MDCT부(204)에 출력한다.
MDCT부(204)는, CELP 복호부(203)로부터 입력되는 CELP 복호 신호에 대해서, MDCT 처리를 행하여 CELP 복호 신호 스펙트럼을 생성한다. 그리고, MDCT부(204)는, 생성한 CELP 복호 신호 스펙트럼을 CELP 성분 억압부(205)에 출력한다.
CELP 성분 억압부(205)는, CELP 성분 억압부(104)가 구비하는 CELP 억압 계수 코드북과 동일한 CELP 억압 계수 코드북를 구비한다. CELP 성분 억압부(205)가 구비하는 CELP 억압 계수 코드북은, 기본적으로는 CELP 성분 억압부(104)가 구비하는 CELP 억압 계수 코드북과 완전히 동일한 CELP 억압 계수 코드북이면 좋지만, 다른 무엇인가의 조정 등도 포함시켜 억압할 경우에는, 반드시 동일하지 않아도 좋다. CELP 성분 억압부(205)는, 분리부(201)로부터 입력되는 CELP 억압 계수 최적 인덱스에 대응하는 CELP 억압 계수를, MDCT부(204)로부터 입력되는 CELP 복호 신호 스펙트럼의 주파수 성분별로 곱함으로서, CELP 복호 신호 스펙트럼(CELP 성분)이 억압된 CELP 성분 억압 스펙트럼을 산출한다. 그리고, CELP 성분 억압부(205)는, 산출한 CELP 성분 억압 스펙트럼을 가산부(206)에 출력한다.
가산부(206)는, 부호화 장치(100)의 가산부(111)와 동일하게 하여, CELP 성분 억압부(205)로부터 입력되는 CELP 성분 억압 스펙트럼과, 변환 부호화 복호부(202)로부터 입력되는 변환 부호화 복호 신호 스펙트럼을 가산하여, 복호 신호 스펙트럼을 산출한다. 그리고, 가산부(206)는, 산출한 복호 신호 스펙트럼을 IMDCT부(207)에 출력한다.
IMDCT부(207)는, 가산부(206)로부터 입력되는 복호 신호 스펙트럼에 대해서, IMDCT 처리를 행하여 복호 신호를 출력한다.
다음에, 부호화 장치(100)(도 1)에 있어서의 예비 선택 탐색 처리의 상세한 것에 대해서 설명한다.
우선, 펄스 위치 추정부(106)에 있어서의, 추정 펄스 위치의 추정 방법의 일례에 대해서 설명한다.
일반적으로, 변환 부호화에서는, 입력신호(여기에서는, CELP잔차신호 스펙트럼)의 진폭이 큰 주파수에 펄스를 생성하도록 부호화가 행해진다. 이 때, 생성되는 펄스의 갯수, 및, 펄스의 진폭과 입력 신호의 오차는, 설정된 비트레이트(bit rate) 또는 신호의 주파수 특성에 따라 다르다. 그 때문에, 변환 부호화에 있어서의 부호화 왜곡은 실제로 부호화를 행하지 않으면 정확하게 구할 수 없다. 단, 변환 부호화에 있어서 부호화되는 펄스 위치는, 통계적 수법을 이용함으로써 추정이 가능하다.
여기서, CELP잔차신호 스펙트럼이 정규 분포라고 가정한다. 또, 변환 부호화에서는 진폭이 보다 큰 주파수에서 펄스가 생성되어, 펄스의 정보가 부호화되는 것으로 한다. 예를 들면, 부호화 장치(100)는, CELP잔차신호 스펙트럼 중, 진폭이 큰 상위 10%의 주파수에서 펄스가 부호화된다고 가정하여, 변환 부호화부(110)에서 부호화되는 펄스 위치를 판정하기 위한 임계값(진폭의 임계값)을 산출한다.
구체적으로는, 우선, CELP잔차신호 스펙트럼의 절대값 평균 Iavg[j] 가, 다음식(1)에 따라 산출된다.
Figure pct00001
여기서, Iavg[j]는 CELP 억압 계수 인덱스 j에 있어서의 CELP잔차신호 스펙트럼의 절대값 평균을 나타내고, i는 주파수 샘플의 번호를 나타내고, Cr은 CELP잔차신호 스펙트럼의 진폭을 나타낸다. 또, CELP 억압 계수 인덱스의 총수를 M개로 하고, 주파수 샘플의 총수를 N개로 한다.
그 다음에, CELP 억압 계수 인덱스 j에 있어서의 CELP잔차신호 스펙트럼의 표준 편차 σ[j]가, 다음식(2)에 따라 산출된다.
Figure pct00002
그리고, 수학식(1)에 의해 산출된 절대값 평균 Iavg[j] 및 수학식(2)에 의해 산출된 표준 편차 σ[j]를 이용해 임계값 Ithr은, 예를 들면, 다음식(3)에 따라 산출된다.
Figure pct00003
여기서, β는 임계값 Ithr의 값을 제어하는 정수이다. 예를 들면, CELP잔차신호 스펙트럼 중, 진폭이 큰 상위 10%의 주파수가 선택되게 되도록 임계값을 설정할 때에는, β의 값을 약 1.6으로 설정한다. 또, 예를 들면, CELP잔차신호 스펙트럼 중, 진폭이 큰 상위 5%의 주파수가 선택되게 되도록 임계값을 설정할 때에는, β의 값을 약 2.0으로 설정한다. 또한, β의 설정값은 정규 분포표에 따라 구할 수 있다.
펄스 위치 추정부(106)는, 수학식(3)에 나타내는 임계값 Ithr을 이용함으로써, 변환 부호화부(110)에서 부호화되는 펄스 위치(추정 펄스 위치)를 추정한다. 구체적으로는, 펄스 위치 추정부(106)는, 다음식(4)에 따라, CELP 억압 계수 인덱스 j에 있어서, 변환 부호화부(110)에서 부호화되는 펄스 위치를 추정한다.
Figure pct00004
여기서, Iep[j][i]는, CELP 억압 계수 인덱스 j의 각 주파수 샘플 i(1≤i≤N)에 있어서 펄스가 생성되는지 아닌지의 추정 결과를 나타낸다. 즉, 수학식(4)에 나타내는 것처럼, CELP 억압 계수 인덱스 j에 있어서, 펄스가 생성된다고 추정된 주파수 샘플 i에서는 Iep[j][i]=1.0이 되고, 그 이외의 주파수 샘플에서는 Iep[j][i]=0.0이 된다. 즉, 펄스 위치 추정부(106)는, Iep[j][i]=1.0이 되는 주파수 샘플을, 추정 펄스 위치로 한다.
이와 같이, 펄스 위치 추정부(106)는, CELP잔차신호 스펙트럼(타깃 신호)의 분포 특성에 기초하여, 변환 부호화부(110)에서의 부호화의 결과로서 구해지는 펄스의 위치를 낮은 연산량으로 효율적으로 추정하고 있다. 구체적으로는, 펄스 위치 추정부(106)는, CELP잔차신호 스펙트럼(타깃 신호)의 진폭 또는 절대값의 통계량을 기초로 산출되는 임계값(Ithr)과, CELP잔차신호 스펙트럼의 진폭을 비교하여, 변환 부호화부(110)에서 부호화되는 펄스(추정 펄스 위치)를 추정한다. 이것에 의해, 펄스 위치 추정부(106)에서는, 진폭의 임계값 판정을 행하는 것만으로 좋으며, 변환 부호화부(110)에서 부호화된다고 추정되는 펄스 위치를, 변환 부호화부(110)에서의 처리량보다 적은 처리량으로 특정하는 것이 가능하게 된다. 또, 펄스 위치 추정부(106)에서 이용되는 상기 통계량으로서, 표준 편차σ를 적어도 포함하도록 하면 좋다. 이와 같이 타깃 신호의 진폭 또는 절대값의 격차 정도를 정량적으로 나타내는 표준 편차를 이용해 임계값을 산출함으로써, 적은 연산량으로 펄스 위치의 추정 정밀도 높은 임계값을 산출하는 것이 가능하게 된다.
그 다음에, 추정 펄스 감쇠부(107)는, 펄스 위치 추정부(106)에서 추정된 추정 펄스 위치(Iep[j][i]=1.0에 대응하는 대역)의 진폭을 감쇠시켜, 변환 부호화 추정 잔차 스펙트럼을 생성한다.
예를 들면, 여기에서는, 간단하게 하기 위해, 추정 펄스 감쇠부(107) 에서의 스펙트럼 감쇠의 결과, 추정 펄스 위치(Iep[j][i]=1.0에 대응하는 대역) 에서는, CELP잔차신호 스펙트럼의 진폭에 대해서 어느 일정한 비율의 오차가 남고, 기타 펄스 위치(Iep[j][i]=0.0에 대응하는 대역) 에서는, CELP잔차신호 스펙트럼이 오차로서 그대로 남는 것으로 한다. 구체적으로는, 추정 펄스 감쇠부(107)는, 다음식(5)에 따라, 변환 부호화 추정잔차 스펙트럼 Cra를 산출한다.
Figure pct00005
여기서, α는 추정 펄스 위치에 있어서 CELP잔차신호 스펙트럼의 진폭을 어느 정도 오차로서 남기는지를 나타내는(즉, 감쇠 정도를 나타냄), 0이상 1 미만의 정수(이후, 추정 잔차 계수라고 부름)를 나타낸다. 예를 들면, 추정 펄스 위치에 있어서의 오차를 영(0)으로 간주할 경우에는, α=0.0으로 설정되고, 추정 펄스 위치에 있어서 10%의 오차를 전망할 경우에는, α=0.1로 설정된다. 즉, 추정 펄스 감쇠부(107)는, CELP잔차신호 스펙트럼의 진폭에, 추정 잔차 계수(0이상 1 미만의 값)를 곱셈함으로써, 변환 부호화 추정 잔차 스펙트럼(즉, 복호 신호 스펙트럼의 추정값)을 산출한다. 이와 같이, 0이상 1 미만의 정수를 CELP잔차신호 스펙트럼에 곱해서 변환 부호화에 의한 오차를 추정하는 것은, 변환 부호화에 의해 소정의 SNR(Signal Noise Ratio)이 얻어지도록 오차를 산출하고 있는 것이 된다. 이 때의 SNR은 다음식(6)에서 표시된다.
Figure pct00006
그 다음에, 추정 왜곡 평가부(108)는, 다음식(7)에 따라, 입력 신호 스펙트럼 및 변환 부호화 추정잔차 스펙트럼을 이용하여, 변환 부호화에 의한 부호화 왜곡(왜곡 에너지)의 추정값인 추정 왜곡 에너지 Ee를 산출한다(이하, 추정 왜곡 평가라고 부르는 일이 있다).
Figure pct00007
여기서, S는 입력 신호 스펙트럼을 나타낸다. 또, θ는 CELP 억압 계수별로 설정되는 일정값을 나타내고, CELP 억압 계수 사이의 추정 왜곡 에너지의 조정 기능을 가진다. 예를 들면, CELP 억압 계수(인덱스 j)가 영(0)일 때는 θ[j]=1.0으로 설정되고, CELP 억압 계수(인덱스 j)가 클수록, θ[j]=0.0에 가까워지도록 조정된다.
이와 같이, 추정 왜곡 평가부(108)는, 추정 펄스 위치에 있어서의 스펙트럼의 진폭을 0이상 1 미만의 비율로 감쇠시킨 변환 부호화 추정 잔차 스펙트럼에 대한 추정 왜곡 에너지를 산출한다. 이것에 의해, 추정 왜곡 평가부(108)에서는, 변환 부호화부(110)에서 부호화된다고 추정된 펄스 위치에서의 추정 왜곡 에너지를, 변환 부호화부(110)에서의 처리량보다 적은 처리량으로 추정하는 것이 가능하게 된다.
또한, 예비 선택 탐색에 있어서, 모든 CELP 억압 계수로 추정 왜곡 평가를 행할 경우에는, 추정 왜곡 평가부(108)는, CELP 억압 계수 인덱스를 전부 주사하도록 동작한다. 즉, 추정 왜곡 평가부(108)는, CELP 억압 계수 인덱스를 모두 CELP 성분 억압부(104)에 출력한다. 한편, 예비 선택 탐색에 있어서, 추정 왜곡 평가를 행하는 CELP 억압 계수의 후보를 한정하는 것도 가능하다.
예를 들면, CELP 억압 계수 인덱스의 총수가 M=4일 경우에 3 후보만을 예비 선택 탐색하는 경우를 설명한다. 이 때, 가장 강하게 억압하는 계수와 가장 약하게 억압하는 계수 중 어느것인가를 본선택 탐색으로부터 제외함으로써 후보를 좁힌다. 우선, CELP 억압 계수 인덱스 j=1 및 j=4에 대한 추정 왜곡 에너지(즉, Ee[1] 및 Ee[4])를 산출한다. 그 다음에, 추정 왜곡 평가부(108)는, Ee[1]이 Ee[4]보다 작은 경우에는, CELP 억압 계수 인덱스 j=2에 대한 추정 왜곡 에너지(즉, Ee[2])를 산출하고, Ee[4]가 Ee[1]보다 작은 경우에는, CELP 억압 계수 인덱스 j=3에 대한 추정 왜곡 에너지(즉, Ee[3])를 산출한다. 즉, j=1, 4 및 (2 또는 3의 어느것인가 한 쪽)의 3 종류의 CELP 억압 계수로 한정해서 추정 왜곡 평가가 행해지고, 예비 선택 탐색이 완료한다. 따라서, 추정 왜곡 평가부(108)는, 3개의 CELP 억압 계수에 대해서만 추정 왜곡 평가를 행하면 좋으며, j=1~4의 4개의 CELP 억압 계수를 전부 평가하는 경우와 비교해서, 예비 선택 탐색에 필요로 하는 처리량을 약 3/4으로 억제할 수 있다.
그 다음에, 본선택 후보 한정부(109)는, 추정 왜곡 에너지의 분포에 기초하여, 본선택 탐색의 탐색 대상인 CELP 억압 계수(변환 부호화에 이용하는 CELP 억압 계수)의 후보를 한정한다. 즉, 본선택 후보 한정부(109)는, 추정 왜곡 에너지를 기초로, CELP 억압 계수 코드북에 저장되어 있는 복수의 CELP 억압 계수 중, 소정 수의 CELP 억압 계수를 예비 선택한다. 이하, 본선택 후보 한정부(109)에서의 본선택 탐색의 한정 방법 1 및 2에 대해서 설명한다. 또한, 이하에서는, 일례로서 M=4 (j=1~4)인 경우에 대해서 설명한다.
<방법 1>
방법 1에서는, CELP 억압 계수의 가장 큰 계수와 가장 작은 계수에 대해서 예비 선택 탐색을 행하고, 추정 왜곡 에너지가 큰 쪽은 본선택 탐색에서 선택될 가능성이 작다고 판단하고, 그 CELP 억압 계수를 본선택 탐색으로부터 제외하는 것으로, 본선택 탐색의 처리량을 줄인다.
상기를 실현하는 방법을 이하에 설명한다. 우선, 본선택 후보 한정부(109)에는, CELP 억압 계수 인덱스 j=1 및 j=4에 대한 추정 왜곡 에너지(즉, Ee[1] 및 Ee[4]) 가 입력된다.
(1)본선택 후보 한정부(109)는, Ee[1]과 Ee[4]를 비교한다.
(2)Ee[1]이 Ee[4]보다 작은 경우, 본선택 후보 한정부(109)는, 본선택 탐색을 j=1, 2, 3의 3 종류의 CELP 억압 계수로 한정한다. 한편, Ee[4]가 Ee[1]보다 작은 경우, 본선택 후보 한정부(109)는, 본선택 탐색을 j=2, 3, 4의 3 종류의 CELP 억압 계수로 한정한다.
본선택 탐색에서는, 이와 같이 하여 한정된 3개의 CELP 억압 계수(CELP 억압 계수 인덱스)를 이용한다.
즉, 본선택 후보 한정부(109)는, CELP 성분 억압부(104)에 저장되어 있는 복수의 CELP 억압 계수 중, 최대값을 이용했을 경우의 추정 왜곡 에너지와, 최소값을 이용했을 경우의 추정 왜곡 에너지를 비교 (상기예에서는, 최소의 인덱스 j=1 및 최대의 인덱스 j=4를 비교)하고, 추정 왜곡 에너지가 큰 쪽의 CELP 억압 계수를 본선택 탐색의 대상(본선택 탐색의 CELP 억압 계수군)으로부터 제외한다. 즉, 예비 선택 탐색을 행함으로써, 본선택 탐색에 있어서의 탐색 대상 후보가 1개 삭감된다.
이때, 부호화 장치(100)에 있어서, 예비 선택 탐색에서의 연산 회수(추정 왜곡 평가의 회수)는 2회(상기예에서는 j=1, 4의 2회)가 되고, 본선택 탐색에서의 연산 회수가 3회(j=1, 2, 3 또는 j=2, 3, 4)가 된다. 이 때, 본선택 탐색에서의 변환 부호화의 1회의 처리량(삭감분)쪽이, 예비 선택 탐색에서의 2회 연산에 있어서의 처리량보다 큰 경우에는, 부호화 장치(100) 전체에서의 처리량은 삭감된다.
이와 같이 하여, 방법 1에서는, 필요 최소한의 CELP 억압 계수(여기에서는, 최대값과 최소값의 2개의 CELP 억압 계수)에 대해서만 예비 선택 탐색이 행해진다. 또, 방법 1에서는, 추정 왜곡 에너지가 큰 CELP 억압 계수가 본선택 탐색의 대상으로부터 제외된다. 이것에 의해, 본선택 탐색에 있어서 모든 CELP 억압 계수를 탐색하는 경우와 비교해서, 부호화의 품질 열화를 억제하면서, 부호화 장치(100)에 있어서의 처리량을 삭감할 수 있다.
<방법 2>
방법 2에서는, 전부의 CELP 억압 계수에서 예비 선택 탐색을 행하고, 추정 왜곡 에너지로부터 본선택 탐색에서도 선택될 가능성이 높은 CELP 억압 계수를 한정함으로써, 본선택 탐색의 처리량을 줄인다. 이 때 가장 추정 왜곡 에너지가 작은 후보는 반드시 본선택 탐색의 후보로서 남기도록 한다. 그리고, 남겨진 후보에 부여된 CELP 억압 계수 인덱스에 인접하는 인덱스(한쪽 또는 양쪽)의 CELP 억압 계수도 본선택 탐색의 후보로서 남기도록 한다. 이것은, CELP 억압 계수 인덱스가 억압의 정도에 관해서 오름차순 또는 내림차순으로 배치되어 있는 경우에, 이들 CELP 억압 계수 후보가 본선택 탐색시에 왜곡 에너지가 가장 작은 후보로서 선택될 가능성이, 추정 왜곡 에너지가 최소인 후보 및 그것에 인접하는 후보 이외의 CELP 억압 계수 후보보다 높기 때문이다.
상기를 실현하는 방법으로서 본선택 탐색에서 2 종류의 CELP 억압 계수를 탐색 대상으로 하는 경우에 대해서 설명한다.
본선택 후보 한정부(109)에는, 전부의 CELP 억압 계수(j=1~4)에 대한 추정 왜곡 에너지(즉, Ee[1]~Ee[4])가 입력된다.
(1)본선택 후보 한정부(109)는, 추정 왜곡 에너지 Ee[1]~Ee[4] 중, 최소의 추정 왜곡 에너지를 탐색하고, 최소 추정 왜곡 에너지에 대응하는 CELP 억압 계수 인덱스를 보존한다.
(2)본선택 후보 한정부(109)는, 보존한 CELP 억압 계수 인덱스(즉, 최소 추정 왜곡 에너지에 대응하는 CELP 억압 계수 인덱스)의 전후(양단(兩端))의 CELP 억압 계수 인덱스에 대응하는 추정 왜곡 에너지를 비교하고, 추정 왜곡 에너지가 작은 쪽 CELP 억압 계수 인덱스를 보존한다.
(3)본선택 후보 한정부(109)는, (1)의 처리에서 보존한 CELP 억압 계수 인덱스(즉, 최소 추정 왜곡 에너지에 대응하는 CELP 억압 계수 인덱스), 및, (2)의 처리에서 보존한 CELP 억압 계수 인덱스의 2 종류의 CELP 억압 계수를, 본선택 탐색의 CELP 억압 계수군으로서 한정한다.
본선택 탐색에서는, 이와 같이 해서 한정된 2개의 CELP 억압 계수 (CELP 억압 계수 인덱스)를 이용한다.
즉, 본선택 후보 한정부(109)는, CELP 성분 억압부(104)에 저장되어 있는 복수의 CELP 억압 계수 중, 추정 왜곡 에너지가 최소인 CELP 억압 계수(제1 CELP 억압 계수), 및, 추정 왜곡 에너지가 최소인 CELP 억압 계수의 전후의 CELP 억압 계수 인덱스에 대응하는 CELP 억압 계수 중 추정 왜곡 에너지가 작은 CELP 억압 계수(제2 CELP 억압 계수)를, 본선택 탐색의 대상으로서 특정한다. 즉, 본선택 후보 한정부(109)는, 복수의 CELP 억압 계수 중의 추정 왜곡 에너지가 가장 작은 CELP 억압 계수(제1 CELP 억압 계수)와, 추정 왜곡 에너지가 가장 작은 CELP 억압 계수에 부여된 CELP 억압 계수 인덱스의 전후의 CELP 억압 계수 인덱스에 대응하는 2개의 CELP 억압 계수 중 추정 왜곡 에너지가 작은 쪽의 CELP 억압 계수(제2 CELP 억압 계수)를 소정 수의 CELP 억압 계수로서 예비 선택한다.
이때, 부호화 장치(100)에 있어서, 예비 선택 탐색에서의 연산 회수(추정 왜곡 평가의 회수)는 4회(j=1~4)가 되고, 본선택 탐색에서의 연산 회수가 2회가 된다. 이 때, 본선택 탐색에서의 변환 부호화의 2회 처리량(삭감분)쪽이, 예비 선택 탐색에서의 4회 연산에 있어서의 처리량보다 큰 경우에는, 부호화 장치(100) 전체에서의 처리량은 삭감된다. 즉, 방법 1과 마찬가지로, 본선택 탐색에서의 변환 부호화의 1회의 처리량이, 예비 선택 탐색에서의 2회의 연산에 있어서의 처리량보다 큰 경우에는, 부호화 장치(100) 전체에서의 처리량은 삭감된다.
이와 같이 하여, 방법 2에서는, 전부의 CELP 억압 계수를 대상으로 하여 예비 선택 탐색이 행해지지만, 방법 1과 비교해서, 본선택 탐색 대상인 CELP 억압 계수군을 보다 좁게 한정한다. 이것에 의해, 본선택 탐색에 있어서의 처리량을 방법 1보다 삭감할 수 있다.
또, 방법 2에서는, 추정 왜곡 에너지가 최소인 CELP 억압 계수, 및, 해당 CELP 억압 계수의 양단의 CELP 억압 계수 인덱스에 대응하는 CELP 억압 계수 중 추정 왜곡 에너지가 보다 작은 CELP 억압 계수가, 본선택 탐색의 대상이 된다. 즉, 예비 선택 탐색에서는, 본선택 탐색에 있어서 최적의 CELP 억압 계수(왜곡 에너지가 최소인 CELP 억압 계수)로서 결정될 가능성이 높은 CELP 억압 계수가 탐색된다. 따라서, 방법 2에서는, 본선택 탐색에 있어서 전부의 CELP 억압 계수를 탐색하는 경우와 비교해서, 부호화의 품질 열화를 억제하면서, 부호화 장치(100)에 있어서의 처리량을 삭감할 수 있다.
또한, 방법 2에 있어서, 본선택 후보 한정부(109)는, CELP 성분 억압부(104)에 저장되어 있는 복수의 CELP 억압 계수 중, 추정 왜곡 에너지가 최소인 CELP 억압 계수(예를 들면, CELP 억압 계수 인덱스 j), 및, 추정 왜곡 에너지가 최소인 CELP 억압 계수의 전후의 CELP 억압 계수 인덱스에 대응하는 CELP 억압 계수군(예를 들면, CELP 억압 계수 인덱스[j-1] 및 [j+1]) 을, 본선택 탐색의 대상으로서 특정해도 좋다. 즉, 본선택 후보 한정부(109)는, 복수의 CELP 억압 계수 중의 추정 왜곡 에너지가 가장 작은 CELP 억압 계수와, 추정 왜곡 에너지가 가장 작은 CELP 억압 계수에 부여된 인덱스의 전후 인덱스에 대응하는 2개의 CELP 억압 계수를 소정 수의 CELP 억압 계수로서 예비 선택해도 좋다.
이상, 본선택 후보 한정부(109)에서의 본선택 탐색의 대상이 되는 CELP 억압 계수군의 한정 방법 1 및 2에 대해서 설명했다. 이와 같이, 방법 1에서는, 방법 2와 비교해서, 본선택 탐색의 대상을 넓게 함으로써, 본선택 탐색의 대상을 한정함으로 인한 본선택 탐색의 성능 열화를 보다 작게 할 수 있다. 한편, 방법 2에서는, 방법 1과 비교해서 본선택 탐색에서의 처리량을 보다 삭감할 수 있다.
이와 같이, 부호화 장치(100)에서는, 예비 선택 탐색에 있어서, 추정 왜곡 평가부(108)가, 예비 선택 탐색에서 탐색 대상으로 하는 CELP 억압 계수 인덱스를 CELP 성분 억압부(104)에 출력한다. 이것에 의해, 추정 왜곡 평가부(108)에는, CELP 억압 계수 인덱스별로 변환 부호화 추정 잔차 스펙트럼이 입력되고, 추정 왜곡 평가부(108)는, CELP 억압 계수 인덱스에 각각 대응하는 추정 왜곡 에너지를 산출한다. 그리고, 본선택 후보 한정부(109)는, 추정 왜곡 에너지를 기초로, 실제로 변환 부호화를 이용해서 왜곡 평가를 행하는 본선택 탐색에서 탐색 대상으로 하는 CELP 억압 계수 인덱스를 한정한다. 즉, 부호화 장치(100)에서는, 예비 선택 탐색에 있어서, 본선택 탐색에서의 변환 부호화의 왜곡 에너지가 보다 작아진다고 전망되는(추정되는) CELP 억압 계수를 특정한다.
그 다음에, 부호화 장치(100)에서는, 본선택 탐색에 있어서, 본선택 후보 한정부(109)로부터 지시되는 CELP 억압 계수 인덱스군만을 이용해서, 변환 부호화부(110)에서 변환 부호화가 행해지고, 왜곡 평가부(112)에서 왜곡 에너지가 최소가 되는 CELP 억압 계수의 탐색이 행해진다. 그리고, 왜곡 에너지가 최소가 되는 CELP 억압 계수에 대응하는 CELP 억압 계수 인덱스가 다중화부(113)에 출력되고, 해당 CELP 억압 계수 인덱스는, 부호화 장치(100)의 부호화 데이터의 일부로서 복호 장치(200)에 송신된다.
즉, 본 실시형태에서는, 부호화 장치(100)는, 변환 부호화로 부호화되는 펄스 위치를 통계적으로 추정하고, 추정한 펄스 위치에서 추정되는 추정 왜곡 에너지를 산출하고, 추정 왜곡 에너지가 보다 작은 CELP 억압 계수를, 본선택 탐색의 대상이 되는 CELP 억압 계수군으로서 한정한다(예비 선택 탐색). 그리고, 부호화 장치(100)는, 예비 선택 탐색에서 후보가 한정된 CELP 억압 계수별로 변환 부호화를 행하여, 잔차신호의 에너지(왜곡 에너지)가 최소가 되는 CELP 억압 계수를 결정한다(본선택 탐색).
이렇게 함으로써, 부호화 장치(100)는, 예비 선택 탐색에 있어서, 왜곡 에너지가 작다고 전망되는 CELP 억압 계수만을 본선택 탐색의 대상으로 함으로써, 변환 부호화를 행하는 회수를 삭감한다. 여기서, 예비 선택 탐색에서는, 전술한 것처럼, 펄스 위치 추정부(106)에서의 펄스 위치의 추정, 추정 펄스 감쇠부(107)에서의 변환 부호화 추정 잔차 스펙트럼의 산출, 및, 추정 왜곡 평가부(108)에서의 왜곡 에너지의 산출을, 각각 변환 부호화부(110)에서의 처리보다 적은 처리량으로 행하는 것이 가능하게 된다. 따라서, 예비 선택탐색에 있어서 본선택 탐색의 대상이 되는 CELP 억압 계수군을 미리 한정함으로써, 전부의 CELP 억압 계수에 대해서 변환 부호화를 순차적으로 행하는 경우와 비교해서, 부호화 장치(100)에서의 처리량을 삭감할 수 있다.
또, 예비 선택 탐색에서는, 본선택 탐색의 대상으로서, 추정 왜곡 에너지가 작다고 전망되는 CELP 억압 계수, 즉, 본선택 탐색에 있어서 왜곡 에너지가 최소로서 평가될 가능성이 높은 CELP 억압 계수만으로 후보를 한정한다. 이것에 의해, 본선택 탐색의 대상이 되는 CELP 억압 계수군을 한정하는 것으로 인한, 부호화의 품질 열화를 억제할 수 있다.
따라서, 본 실시형태에 의하면, 음성 신호에 적합한 부호화와 음악 신호에 적합한 부호화를 계층 구조로 해서 조합시킨 부호화 방식에 있어서, 전부의 CELP 억압 계수 후보에 대해서 변환 부호화를 순차적으로 행하는 방법과 비교해서, 부호화의 품질 열화를 억제하면서, 부호화 장치에 있어서의 처리량을 삭감할 수 있다.
또한, 본 실시형태에 있어서, 예비 선택 탐색시에 산출된 값 중, 본선택 탐색시에도 사용되는 값(예를 들면, CELP잔차신호 스펙트럼 등)에 대해서는, 본선택 탐색시에 재차 산출하지 않고, 예비 선택 탐색시에 산출된 값을 이용해도 좋다. 이것에 의해, 부호화 장치에서는, 본선택 탐색시의 처리량을 더욱 삭감할 수 있다.
(실시형태 2)
도 3은, 본 발명의 실시형태 2에 따른 부호화 장치(300)의 주요한 구성을 나타내는 블록도이다. 또한, 도 3에 있어서, 실시형태 1(도 1)과 동일한 구성요소에는 동일한 부호를 붙이고 그 설명을 생략한다. 도 3에 나타내는 부호화 장치(300)에서는, 도 1에 나타내는 부호화 장치(100)에 대해서 타깃 신호 특징 추출부(301)가 추가되는 점이 다르다. 또, 펄스 위치 추정부(302) 및 추정 펄스 감쇠부(303)에는, 타깃 신호 특징 추출부(301)로부터 출력되는 특징 정보가 입력 신호로서 추가되는 점이 실시형태 1과 다르다.
도 3에 나타내는 부호화 장치(300)에 있어서, 타깃 신호 특징 추출부(301)는, CELP잔차신호 스펙트럼 산출부(105)로부터 입력되는 CELP잔차신호 스펙트럼(타깃 신호)을 이용해서, 해당 타깃 신호의 특징을 추출한다.
여기서, 일례로서 변환 부호화로서 FPC(Factorial Pulse Coding)를 이용하는 경우에 대해서 설명한다. FPC에서는, 부호화 대상(여기에서는 CELP잔차신호 스펙트럼)의 스펙트럼의 진폭의 격차가 작을 때에는 부호화할 수 있는 펄스 갯수가 보다 많아 지고, 부호화 대상의 스펙트럼의 진폭의 격차가 클 때에는 부호화할 수 있는 펄스 갯수가 보다 적어진다, 라는 특징이 있다. 예를 들면, 어느 대역에 에너지가 집중하는 타깃 신호에서는, FPC으로 부호화되는 펄스 갯수는 적어지고, 전대역에 에너지가 분산해 있는 타깃 신호에서는, FPC으로 부호화되는 펄스 갯수는 많아진다.
즉, 부호화 장치(300)에서는, 타깃 신호(CELP잔차신호 스펙트럼)의 상기 특징을 추출하고, 추출한 특징에 기초해서 FPC으로 부호화되는 펄스 갯수를 예측할 수 있다. 즉, 예비 선택 탐색에 있어서, 타깃 신호의 펄스 위치를 정확하게 추정하는 것이 가능해 진다.
본 실시형태에서는, 타깃 신호 특징 추출부(301)는, 타깃 신호의 진폭의 평균값과, 진폭의 최대값과의 비(比)를, 타깃 신호의 특징으로서 추출한다. 구체적으로는, 타깃 신호 특징 추출부(301)는, 수학식(1)에 따라, 타깃 신호의 진폭의 평균값 Iavg를 산출한다. 또, 타깃 신호 특징 추출부(301)는, 타깃 신호의 절대값 진폭의 최대값을 tmax로 한다. 여기서, tmax/Iavg의 값이 클수록, 어느 특정 대역에 에너지가 집중하고 있을 가능성이 높다. 즉, tmax/Iavg의 값이 클수록, 스펙트럼의 격차가 클 가능성이 높다.
따라서, 타깃 신호 특징 추출부(301)는, tmax/Iavg의 값이 클수록, 예비 선택 탐색에 있어서 추정하는 타깃 신호의 펄스 갯수를 적게 해야 한다고 판정한다. 한편, 타깃 신호 특징 추출부(301)는, tmax/Iavg의 값이 작을수록, 대역 전체에 에너지가 분산하고 있을 가능성이 높기 때문에, 예비 선택 탐색에 있어서 추정하는 타깃 신호의 펄스 갯수를 많게 해야 한다고 판정한다. 그래서, 타깃 신호 특징 추출부(301)는, tmax/Iavg의 값에 따라, 다음식(8)에 따라, 타깃 신호의 특징에 기초하여 예측되는 타깃 신호의 펄스 갯수에 관한 정보를 특징 정보 K로서 생성한다.
Figure pct00008
여기서, κh는 예비 선택 탐색(펄스 위치 추정부(302))에 있어서 추정되는 펄스의 갯수를 감소시키는지 아닌지를 판정하기 위해 미리 설정된 임계값이고, κl는 예비 선택 탐색에 있어서 추정되는 펄스의 갯수를 증가시키는지 아닌지를 판정하기 위해 미리 설정된 임계값이다.
펄스 위치 추정부(302)는, CELP잔차신호 스펙트럼 산출부(105) 로부터 입력되는 CELP잔차신호 스펙트럼(타깃 신호), 및, 타깃 신호 특징 추출부(301)로부터 입력되는 특징 정보 K를 이용하여, 변환 부호화부(110)에서 부호화되는 펄스 위치(추정 펄스 위치)를 추정한다. 구체적으로는, 펄스 위치 추정부(302)는, 실시형태 1(펄스 위치 추정부(106)) 에서 이용한 수학식(3) 대신에, 다음식(9)에 나타내는 임계값 Ithr[j]를 이용한다.
Figure pct00009
즉, 수학식(9)에서는, 특징 정보 K(0.9, 1.0, 1.1)의 값에 따라 β의 값이 프레임별로 적응적으로 보정되어, 펄스 위치 추정부(302)에서 선택되는 펄스 갯수가 적응적으로 제어된다. 환언하면, 펄스 위치 추정부(302)는, 수학식(9)에 나타내는 것처럼, 실시형태 1(식(3))을, 타깃 신호 특징 추출부(301)로부터 입력되는 특징 정보 K를 이용하여 보정한다.
이것에 의해, 펄스 위치 추정부(302)에서는, 타깃 신호에 있어서 어느 특정 대역에 에너지가 집중하고 있을 가능성이 높은 경우(식(8)에 있어서 tmax/Iavg>κh의 경우), 특징 정보 K=1.1이므로, 「β」가 「β*1.1」이 되어 임계값 Ithr[j]는 보다 커지도록 제어된다. 따라서, 펄스 위치 추정부(302)에서는, 임계값 Ithr[j]를 초과하는 펄스 갯수가 보다 적어진다.
한편, 펄스 위치 추정부(302)에서는, 타깃 신호의 전대역에 에너지가 분산해 있을 가능성이 높을 경우(식(8)에 있어서 tmax/Iavg<κl의 경우), 특징 정보 K=0.9이므로, 「β」가 「β*0.9」가 되어 임계값 Ithr[j]는 보다 작아지도록 제어된다. 따라서, 펄스 위치 추정부(302)에서는, 임계값 Ithr[j]를 초과하는 펄스 갯수가 보다 많아진다.
즉, 펄스 위치 추정부(302)는, 수학식(8)에 있어서 tmax/Iavg>κh의 경우(스펙트럼의 격차가 큰 경우)에는, 추정하는 펄스 갯수를 적게 설정하고, 수학식(8)에 있어서 tmax/Iavg<κl의 경우(스펙트럼의 격차가 작은 경우)에는, 추정하는 펄스 갯수를 많게 설정한다. 즉, 펄스 위치 추정부(302)는, CELP잔차신호 스펙트럼의 특징에 따라, 추정하는 펄스의 갯수를 설정하고, 설정된 갯수의 펄스의 위치를 추정한다. 예를 들면, 펄스 위치 추정부(302)는, 펄스의 갯수를, CELP잔차신호 스펙트럼의 각 대역에 있어서의 진폭의 격차가 커질수록 적어지도록 설정한다.
추정 펄스 감쇠부(303)는, 타깃 신호 특징 추출부(301)로부터 입력되는 특징 정보를 이용해서, CELP잔차신호 스펙트럼 산출부(105) 로부터 입력되는 CELP잔차신호 스펙트럼 중, 펄스 위치 추정부(302) 로부터 입력되는 추정 펄스 위치의 스펙트럼을 감쇠시킨다.
구체적으로는, 추정 펄스 감쇠부(303)는, 실시형태 1(추정 펄스 감쇠부(107))에서 이용한 수학식(5) 대신에, 다음식(10)에 따라, 변환 부호화 추정 잔차 스펙트럼 Cra를 산출한다.
Figure pct00010
즉, 수학식(10)에서는, 특징 정보 K(0.9, 1.0, 1.1)의 값에 따라 추정 잔차 계수 α의 값이 프레임마다 적응적으로 보정되어, 추정 펄스 감쇠부(303)에서의 감쇠 정도(추정 오차량)가 적응적으로 제어된다. 환언하면, 추정 펄스 감쇠부(303)는, 수학식(10)에 나타내는 것처럼, 실시형태 1(수학식(5))을, 타깃 신호 특징 추출부(301)로부터 입력되는 특징 정보 K를 이용하여 보정한다.
이것에 의해, 추정 펄스 감쇠부(303)에서는, 타깃 신호에 있어서 어느 특정 대역에 에너지가 집중하고 있을 가능성이 높은 경우(식(8)에 있어서 tmax/Iavg>κh의 경우), 특징 정보 K=1.1이므로, 「α」가 「α/1.1」이 되어, 추정 펄스 위치에 있어서의 오차가 보다 작아지도록 제어된다. 한편, 추정 펄스 감쇠부(303)에서는, 타깃 신호에 있어서 전대역에 에너지가 분산해 있을 가능성이 높은 경우(식(8)에 있어서 tmax/Iavg>κh의 경우), 특징 정보 K=0.9이므로, 「α」가 「α/0.9」가 되어, 추정 펄스 위치에 있어서의 오차가 보다 커지도록 제어된다.
즉, 추정 펄스 감쇠부(303)는, 수학식(8)에 있어서 tmax/Iavg>κh의 경우(스펙트럼의 진폭 격차가 큰 경우)에는, 스펙트럼의 감쇠 정도를 크게 하고, 수학식(8)에 있어서 tmax/Iavg<κl의 경우(스펙트럼의 진폭 격차가 작은 경우)에는, 스펙트럼의 감쇠 정도를 작게 한다. 즉, 추정 펄스 감쇠부(303)는, CELP잔차신호 스펙트럼의 감쇠 정도를, CELP잔차신호 스펙트럼의 각 대역에 있어서의 진폭의 격차가 커질수록 크게하도록 설정한다.
환언하면, 스펙트럼의 진폭의 격차에 따라, 변환 부호화의 오차 추정값에 의해 산출되는 SNR이 적응적으로 변화하게 된다. 그 때의 SNR는 다음식(11)에서 표시된다.
Figure pct00011
이와 같이, 부호화 장치(300)는, 타깃 신호(CELP잔차신호 스펙트럼)의 특징(여기에서는, 스펙트럼의 진폭의 격차(tmax/Iavg))에 따라, 변환 부호화부(110)에서 부호화되는 펄스 갯수 및 펄스의 오차(추정 펄스 감쇠부(303)에서의 감쇠 정도)를 적응적으로 제어한다. 이것에 의해, 부호화 장치(300)에서는, 변환 부호화부(110)에서 부호화된다고 추정되는 펄스 위치에서의 왜곡 에너지를, 실시형태 1보다 정밀도 좋게 추정할 수 있다. 또, 실시형태 1과 마찬가지로, 부호화 장치(300)에서는, 추정 펄스 위치의 추정, 추정 펄스 감쇠부(107)에서의 변환 부호화 추정 잔차 스펙트럼의 산출, 및, 추정 왜곡 평가부(108)에서의 왜곡 에너지의 산출을, 각각 변환 부호화부(110)에서의 처리보다 적은 처리량으로 행할 수 있다.
따라서, 본 실시형태에 의하면, 음성 신호에 적합한 부호화와 음악 신호에 적합한 부호화를 계층 구조로 해서 조합시킨 부호화 방식에 있어서, 실시형태 1과 비교해서, 부호화의 품질 열화를 더욱 억제하면서, 전부의 CELP 억압 계수 후보에 대해서 변환 부호화를 순차적으로 행하는 방법과 비교해, 부호화 장치에 있어서의 처리량을 삭감할 수 있다.
또한, 본 실시형태에서는, 타깃 신호의 특징으로서 스펙트럼의 진폭의 격차를 이용하는 경우에 대해서 설명했지만, 본 발명은, 타깃 신호의 특징으로서 스펙트럼의 진폭의 격차를 이용하는 경우에 한정되지 않는다. 예를 들면, 타깃 신호의 특징으로서, 타깃 신호의 톤 성(tone性)을 이용해도 좋다. 여기서 말하는 톤 성이란, 스펙트럼의 피크의 크기, 혹은 다이내믹 레인지(Dynamic Range)의 크기를 나타내는 지표이다. 예를 들면, 타깃 신호 또는 그 절대값의 산술 평균에 대한 기하 평균의 비(比)를 측정하고, 이 비가 0에 가까울 때는 톤성이 높다고 판정할 수 있다. 구체적으로는, 도 3에 나타내는 부호화 장치(300)에 있어서, 타깃 신호 특징 추출부(301)는, 타깃 신호의 톤성을 측정한다. 그리고, 펄스 위치 추정부(302)는, 펄스의 갯수를, 톤성이 높아질수록 적게 하도록 설정한다. 예를 들면, 펄스 위치 추정부(302)는, 타깃 신호의 톤성이 높은 경우에는 임계값을 크게 설정하여, 추정 펄스 갯수가 적어지도록 제어하고, 타깃 신호의 톤성이 낮은 경우에는 임계값을 작게 하여, 추정 펄스 갯수가 많아지도록 제어하면 좋다. 또, 추정 펄스 감쇠부(303)는, CELP잔차신호 스펙트럼의 감쇠 정도를, 톤성이 높아질수록 크게 하도록 설정한다. 즉, 추정 펄스 감쇠부(303)는, 타깃 신호의 톤성이 높은 경우에는 추정 잔차 계수를 작게 하여(감쇠 정도를 크게 하여), 잔차신호(오차)가 작아지도록 제어하고, 타깃 신호의 톤성이 낮은 경우에는 추정 잔차 계수를 크게 하여(감쇠 정도를 작게 하여), 잔차신호(오차)가 커지도록 제어하면 좋다. 이와 같이, 타깃 신호의 특징으로서 톤성을 이용할 경우에도, 본 실시형태와 동일한 효과를 얻을 수 있다.
또, 예를 들면, 타깃 신호의 특징으로서, 타깃 신호의 잡음성을 이용해도 좋다. 여기서 말하는 잡음성이란 타깃 신호의 에너지의 편향의 적음을 나타내는 지표이다. 예를 들면, 타깃 신호를 몇개인가의 대역으로 구분하여 대역별로 에너지를 측정하고, 대역별 에너지 분산이 작을 때는 잡음성이 높다고 판정할 수 있다. 구체적으로는, 도 3에 나타내는 부호화 장치(300)에 있어서, 타깃 신호 특징 추출부(301)는, 타깃 신호의 잡음성을 측정한다. 그리고, 펄스 위치 추정부(302)는, 펄스의 갯수를, 잡음성이 높아질수록 많게 하도록 설정한다. 예를 들면, 펄스 위치 추정부(302)는, 타깃 신호의 잡음성이 높은 경우에는 임계값을 작게 설정하여, 추정 펄스 갯수가 많아지도록 제어하고, 타깃 신호의 잡음성이 낮은 경우에는 임계값을 크게 하여, 추정 펄스 갯수가 적어지도록 제어하면 된다. 또, 추정 펄스 감쇠부(303)는, CELP잔차신호 스펙트럼의 감쇠 정도를, 잡음성이 높아질수록 작게 하도록 설정한다. 즉, 추정 펄스 감쇠부(303)는, 타깃 신호의 잡음성이 높은 경우에는 추정 잔차 계수를 크게 해서(감쇠 정도를 작게 하여), 잔차신호(오차)가 커지도록 제어하고, 타깃 신호의 잡음성이 낮은 경우에는 추정 잔차 계수를 작게 하여(감쇠 정도를 크게 하여), 잔차신호(오차)가 작아지도록 제어하면 된다. 이와 같이, 타깃 신호의 특징으로서 잡음성을 이용하는 경우에서도, 본 실시형태와 동일한 효과를 얻을 수 있다.
이상, 본 발명의 각 실시형태에 대해서 설명했다.
또한, 상기 각 실시형태에서는, 펄스 위치 추정부에 있어서, 변환 부호화부로의 입력 신호(CELP잔차신호 스펙트럼)가 정규 분포 라고 가정하고, 진폭이 큰 상위 주파수를 선택하기 위한 임계값(Ithr)을 설정하는 경우에 대해서 설명했다. 그러나, 펄스 위치 추정부는, 변환 부호화부로의 입력 신호(CELP잔차신호 스펙트럼)가 정규 분포 이외의 기타 분포를 가정할 수 있는 경우에는, 해당 분포 모델에 따라 임계값(Ithr)을 설정해도 좋다.
또, 상기 각 실시형태에서는, 펄스 위치 추정부에 있어서, 변환 부호화부에서 부호화되는 펄스수의 상한치를 웃도는 펄스 갯수를 추정할 경우가 있을 수 있다. 이것에 대해서, 펄스 위치 추정부는, 해당 상한치를 이용하여, 추정되는 펄스수를 제어해도 좋다. 이 때, 펄스 위치 추정부는, 진폭이 보다 작은 펄스를 제외하거나, 보다 고역측의 펄스를 제외하거나 해도 좋다. 또는, 펄스 위치 추정부는, 상술한 진폭 및 주파수 대역의 조건에 더해, 신호의 특징으로부터 산출할 수 있는 다른 조건을 조합시켜, 제외할 펄스를 결정해도 좋다.
또, 상기 각 실시형태에서는, CELP 억압 계수 코드북에 저장되는 CELP 억압 계수가, CELP 억압 정도의 오름차순 또는 내림차순으로 저장되어 있는 경우에 대해 설명했다. 그러나, 억압 계수의 후보를 한정하는 방법으로서, 저장되는 순서에 의하지 않는 방법을 이용할 경우에는, 반드시 오름차순 또는 내림차순으로 하지 않아도 좋다.
또, 상기 각 실시형태에서는, 음성 신호에 적합한 부호화의 일례로서 CELP 부호화를 이용해서 설명했지만, 본 발명은 ADPCM(Adaptive Differential Pulse Code Modulation), APC(Adaptive Prediction Coding), ATC(Adaptive Transform Coding), TCX(Transform Coded Excitation) 등을 이용해도 실현 가능하며, 동일한 효과가 얻어진다.
또, 상기 각 실시형태에서는, 음악 신호에 적합한 부호화의 일례로서 변환 부호화를 이용해서 설명했지만, 음성 신호에 적합한 부호화 방식의 복호 신호와 입력 신호의 잔차신호를 주파수 영역에서 효율 좋게 부호화 할 수 있는 방식이면 좋다. 이러한 방식으로서 FPC(Factorial Pulse Coding) 및 AVQ(Algebraic Vector Quantization) 등이 있으며, 동일한 효과를 얻을 수 있다.
또, 이상의 설명에서는, 부호화 장치(100),(300)로부터 출력된 부호화 데이터를 복호 장치(200)에서 수신한다고 했지만, 이것에 한하는 것은 아니다. 즉, 복호 장치(200)는, 부호화 장치(100),(300)의 구성에 있어서 생성된 부호화 데이터가 아니라도, 복호에 필요한 부호화 데이터를 가지는 부호화 데이터를 생성할 수 있는 부호화 장치에 의해 출력된 부호화 데이터이면, 복호할 수 있다.
또, 상기 각 실시형태에서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명은 하드웨어와의 연계에 있어서 소프트웨어에서도 실현되는 일도 가능하다.
또, 상기 각 실시형태의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로인 LSI로서 실현된다. 이들은 개별적으로 1 칩화되어도 좋고, 일부 또는 전부를 포함하도록 1칩화되어도 좋다. 여기에서는, LSI라고 했지만, 집적도의 차이에 의해, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한하는 것은 아니고, 전용 회로 또는 범용 프로세서로 실현해도 좋다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블/프로세서를 이용해도 좋다.
나아가서는, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해 LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히, 그 기술을 이용하여 기능 블록의 집적화를 행해도 좋다. 바이오 기술의 적용 등이 가능성으로서 있을 수 있다.
2010년 9월 10일에 출원한 특허출원 2010-203657의 일본 출원에 포함되는 명세서, 도면 및 요약서의 개시 내용은, 모두 본원에 원용된다.
본 발명은, 부호화의 품질 열화를 억제하면서 장치 전체로서의 연산량을 삭감할 수 있으며, 예를 들면, 패킷 통신 시스템, 이동 통신 시스템 등에 적용할 수 있다.
100, 300: 부호화 장치 200: 복호 장치
101, 103, 204: MDCT부 102: CELP 부호화부
104, 205: CELP 성분 억압부 105: CELP잔차신호 스펙트럼 산출부
106, 302: 펄스 위치 추정부 107, 303: 추정 펄스 감쇠부
108: 추정 왜곡 평가부 109: 본선택 후보 한정부
110: 변환 부호화부 111, 206: 가산부
112: 왜곡 평가부 113: 다중화부
201: 분리부 202: 변환 부호화 복호부
203: CELP 복호부 207: IMDCT부
301: 타깃 신호 특징 추출부

Claims (17)

  1. 입력 신호에 대한 제1의 부호화에 의해 얻어진 제1 부호를 복호해서 생성된 제1 복호 신호의 스펙트럼을 출력하는 제1부호화부와,
    상기 제1 복호 신호의 스펙트럼의 진폭을, 복수의 억압 계수중에서 지시된 억압 계수를 이용해 억압하여 억압 스펙트럼을 생성하는 억압부와,
    상기 입력 신호의 스펙트럼과 상기 억압 스펙트럼을 이용해 잔차 스펙트럼을 산출하는 잔차 스펙트럼 산출부와,
    상기 입력 신호의 스펙트럼과 상기 잔차 스펙트럼을 이용해, 소정 수의 억압 계수를 예비 선택하고, 상기 예비 선택된 억압 계수를 상기 억압부에 대해서 지시하는 예비 선택부와,
    상기 지시된 억압 계수를 상기 억압부에서 이용하여 생성된 억압 스펙트럼을 상기 잔차 스펙트럼 산출부에 입력하여 산출된 잔차 스펙트럼을 이용해 제2의 부호화를 행하고, 상기 제2 부호화에 의해 얻어진 제2 부호를 복호하여 생성된 제2 복호 신호의 스펙트럼과, 상기 억압 스펙트럼과, 상기 입력 신호의 스펙트럼을 이용하여, 상기 지시된 억압 계수중에서 1개의 억압 계수를 결정하는 제2부호화부를 구비하는 부호화 장치.
  2. 청구항 1에 있어서,
    상기 제2부호화부는,
    상기 잔차 스펙트럼에 대해서 생성된 펄스를 상기 제2의 부호화로 부호화하고, 상기 제2 부호화에 의한 부호화 왜곡이 최소가 되는 상기 억압 계수를 탐색하고,
    상기 예비 선택부는,
    상기 잔차 스펙트럼을 이용해 상기 펄스의 위치를 추정하는 추정 수단과,
    상기 잔차 스펙트럼 중, 추정된 상기 펄스의 위치에 있어서의 진폭을 감쇠시켜 추정잔차 스펙트럼을 생성하는 감쇠 수단과,
    상기 추정 잔차 스펙트럼과 상기 입력 신호의 스펙트럼을 이용해서, 상기 부호화 왜곡의 추정 에너지인 추정 왜곡 에너지를 산출하는 산출 수단과,
    상기 추정 왜곡 에너지에 기초하여, 상기 복수의 억압 계수 중, 상기 소정 수의 억압 계수를 예비 선택하는 후보 한정 수단을
    구비하는 부호화 장치.
  3. 청구항 2에 있어서,
    상기 복수의 억압 계수는, 억압의 정도에 관해서 오름차순 또는 내림차순으로 인덱스가 부여되고,
    상기 후보 한정 수단은,
    최대 인덱스 및 최소 인덱스에 대응하는 상기 억압 계수 중, 상기 추정 왜곡 에너지가 큰 쪽의 억압 계수를, 상기 소정 수의 억압 계수로부터 제외하는, 부호화 장치.
  4. 청구항 2에 있어서,
    상기 복수의 억압 계수는, 억압의 정도에 관해서 오름차순 또는 내림차순으로 인덱스가 부여되고,
    상기 후보 한정 수단은,
    상기 복수의 억압 계수 중 상기 추정 왜곡 에너지가 가장 작은 억압 계수와, 상기 추정 왜곡 에너지가 가장 작은 억압 계수에 부여된 인덱스의 전후(前後)의 인덱스에 대응하는 2개의 억압 계수를, 상기 소정 수의 억압 계수로서 예비 선택하는, 부호화 장치.
  5. 청구항 2에 있어서,
    상기 복수의 억압 계수는, 억압의 정도에 관해서 오름차순 또는 내림차순으로 인덱스가 부여되고,
    상기 후보 한정 수단은,
    상기 복수의 억압 계수 중의 상기 추정 왜곡 에너지가 가장 작은 제1 억압 계수와, 상기 제1 억압 계수에 부여된 인덱스의 전후의 인덱스에 대응하는 2개의 억압 계수 중 상기 추정 왜곡 에너지가 작은 편인 제2 억압 계수를 상기 소정 수의 억압 계수로서 예비 선택하는 부호화 장치.
  6. 청구항 2에 있어서,
    상기 추정 수단은,
    상기 잔차 스펙트럼의 진폭의 통계량에 기초해서 산출되는 임계값과, 상기 잔차 스펙트럼의 진폭을 비교해서, 상기 펄스의 위치를 추정하는, 부호화 장치.
  7. 청구항 6에 있어서,
    상기 통계량은, 적어도 상기 진폭의 표준 편차를 포함하는, 부호화 장치.
  8. 청구항 2에 있어서,
    상기 감쇠 수단은,
    추정된 상기 펄스의 위치에 있어서의 스펙트럼의 진폭에, 0이상 1 미만의 값을 가지는 계수를 곱셈해서 상기 진폭을 감쇠시키는, 부호화 장치.
  9. 청구항 2에 있어서,
    상기 추정 수단은,
    상기 잔차 스펙트럼의 특징에 따라, 추정하는 상기 펄스의 갯수를 설정하고, 설정된 갯수의 상기 펄스의 위치를 추정하는, 부호화 장치.
  10. 청구항 9에 있어서,
    상기 특징은, 상기 잔차 스펙트럼의 각 대역에 있어서의 진폭의 격차이며,
    상기 추정 수단은,
    상기 펄스의 갯수를, 상기 격차가 클수록 적게 하도록 설정하는, 부호화 장치.
  11. 청구항 9에 있어서,
    상기 특징은, 상기 잔차 스펙트럼의 톤성이며,
    상기 추정 수단은,
    상기 펄스의 갯수를, 상기 톤성이 높아질수록 적게 하도록 설정하는,
    부호화 장치.
  12. 청구항 9에 있어서,
    상기 특징은, 상기 잔차 스펙트럼의 잡음성이며,
    상기 추정 수단은,
    상기 펄스의 갯수를, 상기 잡음성이 높아질수록 많게 하도록 설정하는, 부호화 장치.
  13. 청구항 2에 있어서,
    상기 감쇠 수단은,
    상기 잔차 스펙트럼의 특징에 따라, 추정된 상기 펄스의 위치에 있어서의 스펙트럼의 진폭을 감쇠시키는, 부호화 장치.
  14. 청구항 13에 있어서,
    상기 특징은, 상기 잔차 스펙트럼의 각 대역에 있어서의 진폭의 격차이며,
    상기 감쇠 수단은,
    상기 스펙트럼의 감쇠 정도를, 상기 격차가 커질수록 크게 하도록 설정하는, 부호화 장치.
  15. 청구항 13에 있어서,
    상기 특징은, 상기 잔차 스펙트럼의 톤성이며,
    상기 감쇠 수단은,
    상기 스펙트럼의 감쇠 정도를, 상기 톤성이 높아질수록 크게 하도록 설정하는, 부호화 장치.
  16. 청구항 13에 있어서,
    상기 특징은, 상기 잔차 스펙트럼의 잡음성이며,
    상기 감쇠 수단은,
    상기 스펙트럼의 감쇠 정도를, 상기 잡음성이 높아질수록 작게 하도록 설정하는, 부호화 장치.
  17. 입력 신호에 대한 제1의 부호화에 의해 얻어진 제1 부호를 복호해서 생성된 제1 복호 신호의 스펙트럼을 출력하는 제1부호화 단계와,
    상기 제1 복호 신호의 스펙트럼의 진폭을, 복수의 억압 계수중에서 지시된 억압 계수를 이용해 억압해서 억압 스펙트럼을 생성하는 억압 단계와,
    상기 입력 신호의 스펙트럼과 상기 억압 스펙트럼을 이용해서 잔차 스펙트럼을 산출하는 잔차 스펙트럼 산출 단계와,
    상기 입력 신호의 스펙트럼과 상기 잔차 스펙트럼을 이용해서, 상기 억압 단계에서 이용하는 소정 수의 억압 계수를 예비 선택하고, 상기 예비 선택된 억압 계수를 상기 지시된 억압 계수로 설정하는 예비 선택단계와,
    상기 지시된 억압 계수를 상기 억압 단계에서 이용하여 생성된 억압 스펙트럼을 이용해서 상기 잔차 스펙트럼 산출 단계에서 산출된 잔차 스펙트럼을 이용해서 제2의 부호화를 행하고, 상기 제2 부호화에 의해 얻어진 제2 부호를 복호해서 생성된 제2 복호 신호의 스펙트럼과, 상기 억압 스펙트럼과, 상기 입력 신호의 스펙트럼을 이용해서, 상기 지시된 억압 계수중에서 1개의 억압 계수를 결정하는 제2부호화 단계를 가지는 부호화 방법.
KR1020137005813A 2010-09-10 2011-09-05 부호화 장치 및 부호화 방법 KR20130108281A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JPJP-P-2010-203657 2010-09-10
JP2010203657 2010-09-10
PCT/JP2011/004960 WO2012032759A1 (ja) 2010-09-10 2011-09-05 符号化装置及び符号化方法

Publications (1)

Publication Number Publication Date
KR20130108281A true KR20130108281A (ko) 2013-10-02

Family

ID=45810369

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020137005813A KR20130108281A (ko) 2010-09-10 2011-09-05 부호화 장치 및 부호화 방법

Country Status (10)

Country Link
US (1) US9361892B2 (ko)
JP (1) JP5679470B2 (ko)
KR (1) KR20130108281A (ko)
CN (1) CN103069483B (ko)
AU (1) AU2011300248B2 (ko)
BR (1) BR112013005683A2 (ko)
RU (1) RU2013110317A (ko)
SG (1) SG188413A1 (ko)
TW (1) TW201218188A (ko)
WO (1) WO2012032759A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2581904B1 (en) * 2010-06-11 2015-10-07 Panasonic Intellectual Property Corporation of America Audio (de)coding apparatus and method
EP2733699B1 (en) 2011-10-07 2017-09-06 Panasonic Intellectual Property Corporation of America Scalable audio encoding device and scalable audio encoding method
US8914515B2 (en) * 2011-10-28 2014-12-16 International Business Machines Corporation Cloud optimization using workload analysis
KR101701081B1 (ko) 2013-01-29 2017-01-31 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법
CN105493182B (zh) * 2013-08-28 2020-01-21 杜比实验室特许公司 混合波形编码和参数编码语音增强
PL3385948T3 (pl) * 2014-03-24 2020-01-31 Nippon Telegraph And Telephone Corporation Sposób kodowania, koder, program i nośnik zapisu
CN107851442B (zh) * 2015-04-13 2021-07-20 日本电信电话株式会社 匹配装置、判定装置、它们的方法、程序及记录介质
US10325588B2 (en) * 2017-09-28 2019-06-18 International Business Machines Corporation Acoustic feature extractor selected according to status flag of frame of acoustic signal

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6263312B1 (en) * 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
WO2006134992A1 (ja) * 2005-06-17 2006-12-21 Matsushita Electric Industrial Co., Ltd. ポストフィルタ、復号化装置及びポストフィルタ処理方法
CN101273404B (zh) 2005-09-30 2012-07-04 松下电器产业株式会社 语音编码装置以及语音编码方法
KR20080047443A (ko) 2005-10-14 2008-05-28 마츠시타 덴끼 산교 가부시키가이샤 변환 부호화 장치 및 변환 부호화 방법
JPWO2008072733A1 (ja) 2006-12-15 2010-04-02 パナソニック株式会社 符号化装置および符号化方法
JP4708446B2 (ja) * 2007-03-02 2011-06-22 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP5294713B2 (ja) * 2007-03-02 2013-09-18 パナソニック株式会社 符号化装置、復号装置およびそれらの方法
JP4633774B2 (ja) * 2007-10-05 2011-02-16 日本電信電話株式会社 多重ベクトル量子化方法、装置、プログラム及びその記録媒体
US8209190B2 (en) 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
JP5483051B2 (ja) 2009-03-03 2014-05-07 学校法人金沢工業大学 住宅換気システム

Also Published As

Publication number Publication date
SG188413A1 (en) 2013-04-30
AU2011300248B2 (en) 2014-05-15
CN103069483B (zh) 2014-10-22
WO2012032759A1 (ja) 2012-03-15
BR112013005683A2 (pt) 2018-01-23
US9361892B2 (en) 2016-06-07
CN103069483A (zh) 2013-04-24
JPWO2012032759A1 (ja) 2014-01-20
RU2013110317A (ru) 2014-10-20
AU2011300248A1 (en) 2013-03-28
US20130166308A1 (en) 2013-06-27
JP5679470B2 (ja) 2015-03-04
TW201218188A (en) 2012-05-01

Similar Documents

Publication Publication Date Title
JP5679470B2 (ja) 符号化装置及び符号化方法
USRE49363E1 (en) Variable bit rate LPC filter quantizing and inverse quantizing device and method
US8099275B2 (en) Sound encoder and sound encoding method for generating a second layer decoded signal based on a degree of variation in a first layer decoded signal
US8019597B2 (en) Scalable encoding apparatus, scalable decoding apparatus, and methods thereof
US10311884B2 (en) Advanced quantizer
KR20080047443A (ko) 변환 부호화 장치 및 변환 부호화 방법
KR20080049085A (ko) 음성 부호화 장치 및 음성 부호화 방법
US8892428B2 (en) Encoding apparatus, decoding apparatus, encoding method, and decoding method for adjusting a spectrum amplitude
KR20160120713A (ko) 복호 장치, 부호화 장치, 복호 방법, 부호화 방법, 단말 장치, 및 기지국 장치
JP5711733B2 (ja) 復号装置、符号化装置及びこれらの方法
US20130176150A1 (en) Encoding device and encoding method
KR102148407B1 (ko) 소스 필터를 이용한 주파수 스펙트럼 처리 장치 및 방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid