KR20080049085A - 음성 부호화 장치 및 음성 부호화 방법 - Google Patents

음성 부호화 장치 및 음성 부호화 방법 Download PDF

Info

Publication number
KR20080049085A
KR20080049085A KR1020087007649A KR20087007649A KR20080049085A KR 20080049085 A KR20080049085 A KR 20080049085A KR 1020087007649 A KR1020087007649 A KR 1020087007649A KR 20087007649 A KR20087007649 A KR 20087007649A KR 20080049085 A KR20080049085 A KR 20080049085A
Authority
KR
South Korea
Prior art keywords
spectrum
unit
layer
encoding
speech
Prior art date
Application number
KR1020087007649A
Other languages
English (en)
Inventor
마사히로 오시키리
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20080049085A publication Critical patent/KR20080049085A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Abstract

음성 신호의 저역부의 스펙트럼을 고역부에 여러 차례 복제할 경우에 있어서도, 스펙트럼 에너지의 연속성을 유지하여, 음성 품질의 열화를 방지하는 음성 부호화 장치. 이 음성 부호화 장치(100)에서는, LPC 양자화부(102)는, LPC 계수의 양자화를 행하고, LPC 복호화부(103)는, 양자화 후의 LPC 계수를 복호하고, 역필터부(104)는, 복호 LPC 계수를 이용해 구성한 역필터에 의해 입력 음성 신호의 스펙트럼을 평탄화하고, 주파수 영역 변환부(105)는, 평탄화된 스펙트럼의 주파수 분석을 행하고, 제 1 레이어 부호화부(106)는, 평탄화된 스펙트럼의 저역부를 부호화하여 제 1 레이어 부호화 데이터를 생성하고, 제 1 레이어 복호화부(107)는, 제 1 레이어 부호화 데이터의 복호를 행하여 제 1 레이어 복호 스펙트럼을 생성하고, 제 2 레이어 부호화부(108)는, 제 1 레이어 복호 스펙트럼을 이용하여 평탄화된 스펙트럼의 고역부의 부호화를 행한다.

Description

음성 부호화 장치 및 음성 부호화 방법{AUDIO ENCODING DEVICE AND AUDIO ENCODING METHOD}
본 발명은, 음성 부호화 장치 및 음성 부호화 방법에 관한 것이다.
이동체 통신 시스템에 있어서의 전파 자원 등을 유효하게 이용하기 위해, 음성 신호를 저비트레이트(低bit rate)로 압축하는 것이 요구되고 있다.
한편으로, 통화 음성의 품질 향상이나 현장감 높은 통화 서비스의 실현이 요망되고 있다. 이를 실현하기 위해서는, 음성 신호의 고품질화뿐만 아니라, 보다 대역이 넓은 오디오 신호 등의 음성 신호 이외의 신호도 고품질로 부호화할 수 있는 것이 바람직하다.
이와 같이 상반된 요구에 대해서, 복수의 부호화 기술을 계층적으로 통합하는 어프로치가 유망시되고 있다. 구체적으로는, 음성 신호에 적합한 모델로 입력 신호를 저비트레이트로 부호화하는 제 1 레이어와, 입력 신호와 제 1 레이어 복호 신호의 차분 신호를 음성 이외의 신호에도 적합한 모델로 부호화하는 제 2 레이어를 계층적으로 조합시키는 어프로치이다. 이러한 계층 구조를 가지는 부호화 방식 은, 부호화된 비트 스트림의 일부를 폐기해도 나머지 정보로부터 복호 신호가 얻어지는 특징(스케일러빌리티 성)을 가지기 때문에, 스케일러블 부호화라고 불린다. 스케일러블 부호화는, 이러한 특징 때문에, 비트레이트가 서로 다른 네트워크간의 통신에도 유연하게 대응할 수 있다. 또, 이 특징은, IP 프로토콜로 다양한 네트워크가 통합되어 가는 향후의 네트워크 환경에 적합한 것이라고 할 수 있다.
종래의 스케일러블 부호화로서는, MPEG-4(Moving Picture Experts Group phase-4)에서 규격화된 기술을 이용하는 것이 있다(예를 들면 비특허 문헌 1 참조). 비특허 문헌 1에 기재된 스케일러블 부호화에서는, 음성 신호에 적합한 CELP(Code Excited Linear Prediction;부호 여기 선형 예측)를 제 1 레이어에 이용하고, 원신호로부터 제 1 레이어 복호 신호를 빼고 얻어지는 잔차신호에 대한 부호화로서 AAC(Advanced Audio Coder)나 TwinVQ(Transform Domain Weighted Interleave Vector Quantization)와 같은 변환 부호화를 제 2 레이어에 이용한다.
한편, 변환 부호화에 있어서, 효율 좋게 스펙트럼을 부호화하는 기술이 있다(예를 들면 특허 문헌 1 참조). 특허 문헌 1에 기재한 기술에서는, 음성 신호의 주파수 대역을 저역부와 고역부의 2개의 서브밴드로 분할하고, 저역부의 스펙트럼을 고역부에 복제하고, 복제 후의 스펙트럼에 변형을 가해 고역부의 스펙트럼으로 한다. 이 때, 변형 정보를 적은 비트수로 부호화함으로써, 저비트레이트화를 꾀할 수 있다.
(비특허 문헌 1) 미키 스케이치(三木弼一) 편저, MPEG-4의 모든 것, 초판, (주)공업 조사회, 1998년 9월 30일, pp.126-127
(특허 문헌 1) 일본 특허 공표 제 2001-521648 호 공보
(발명이 해결하려고 하는 과제)
일반적으로, 음성 신호나 오디오 신호의 스펙트럼은, 주파수와 함께 완만하게 변화하는 성분(스펙트럼 포락)과 세세하게 변화하는 성분(스펙트럼 미세 구조)의 곱(積)으로 표시된다. 일례로서 도 1에 음성 신호의 스펙트럼, 도 2에 스펙트럼 포락, 도 3에 스펙트럼 미세 구조를 나타낸다. 이 스펙트럼 포락(도 2)은, 10차의 LPC(Linear Prediction Coding)계수를 이용하여 산출한 것이다. 이러한 도면으로부터, 스펙트럼 포락(도 2)과 스펙트럼 미세 구조(도 3)의 곱이, 음성 신호의 스펙트럼(도 1)이 되어 있는 것을 알 수 있다.
그런데, 저역부의 스펙트럼을 복제하여 고역부의 스펙트럼으로 할 때, 복제원(複製元)인 저역부의 대역폭보다 복제처(複製處)인 고역부의 대역폭이 넓을 경우는, 저역부의 스펙트럼을 2회 이상 고역부에 복제하게 된다. 예를 들면, 도 1의 저역부(0-FL)로부터 고역부(FL-FH)에 스펙트럼을 복제할 경우, 이 예에서는 FH=2*FL의 관계가 있기 때문에, 저역부의 스펙트럼을 고역부에 2회 복제할 필요가 있다. 이와 같이 저역부의 스펙트럼을 고역부에 여러 차례 복제하면, 도 4에 나타내는 것처럼, 복제처 스펙트럼의 접속부에 있어서 스펙트럼 에너지의 불연속이 발생하게 된다. 이러한 불연속이 발생하는 원인은, 스펙트럼 포락에 있다. 도 2에 나타내는 바와 같이, 스펙트럼 포락에서는 주파수가 올라감에 따라 에너지가 감쇠하기 때문에, 스펙트럼에 기울기가 생긴다. 이러한 스펙트럼의 기울기의 존재로 인해, 저역부의 스펙트럼을 고역부에 여러 차례 복제하면, 스펙트럼 에너지의 불연속이 발생하여, 음성 품질이 열화되어 버린다. 이 불연속을 게인 조정에 의해 보정하는 것은 가능하지만, 게인 조정으로 충분한 효과를 얻기 위해서는 많은 비트수를 필요로 하게 된다.
본 발명의 목적은, 저역부의 스펙트럼을 고역부에 여러 차례 복제할 경우에 있어서도, 스펙트럼 에너지의 연속성을 유지하여, 음성 품질의 열화를 방지할 수 있는 음성 부호화 장치 및 음성 부호화 방법을 제공하는 것이다.
(과제를 해결하기 위한 수단)
본 발명의 음성 부호화 장치는, 음성 신호의 저역부의 스펙트럼을 부호화하는 제 1 부호화 수단과, 상기 음성 신호의 LPC 계수를 이용해 상기 저역부 스펙트럼을 평탄화하는 평탄화 수단과, 평탄화된 저역부의 스펙트럼을 이용해 상기 음성 신호의 고역부 스펙트럼을 부호화하는 제 2 부호화 수단을 구비하는 구성을 취한다.
(발명의 효과)
본 발명에 의하면, 스펙트럼의 에너지의 연속성을 유지하여, 음성 품질의 열화를 방지할 수 있다.
도 1은 음성 신호의 스펙트럼(종래)을 나타내는 도면,
도 2는 스펙트럼 포락(종래)을 나타내는 도면,
도 3은 스펙트럼 미세 구조(종래)를 나타내는 도면,
도 4는 저역부의 스펙트럼을 고역부에 여러 차례 복제했을 때의 스펙트럼(종래)을 나타내는 도면,
도 5(a)는 본 발명의 동작 원리 설명도(저역부의 복호 스펙트럼),
도 5(b)는 본 발명의 동작 원리 설명도(역필터 통과 후의 스펙트럼),
도 5(c)는 본 발명의 동작 원리 설명도(고역부의 부호화),
도 5(d)는 본 발명의 동작 원리 설명도(복호 신호의 스펙트럼),
도 6은 본 발명의 실시예 1에 따른 음성 부호화 장치의 블록 구성도,
도 7은 상기 음성 부호화 장치의 제 2 레이어 부호화부의 블록 구성도,
도 8은 본 발명의 실시예 1에 따른 필터링부의 동작 설명도,
도 9는 본 발명의 실시예 1에 따른 음성 복호화 장치의 블록 구성도,
도 10은 상기 음성 복호화 장치의 제 2 레이어 복호화부의 블록 구성도,
도 11은 본 발명의 실시예 2에 따른 음성 부호화 장치의 블록 구성도,
도 12는 본 발명의 실시예 2에 따른 음성 복호화 장치의 블록 구성도,
도 13은 본 발명의 실시예 3에 따른 음성 부호화 장치의 블록 구성도,
도 14는 본 발명의 실시예 3에 따른 음성 복호화 장치의 블록 구성도,
도 15는 본 발명의 실시예 4에 따른 음성 부호화 장치의 블록 구성도,
도 16은 본 발명의 실시예 4에 따른 음성 복호화 장치의 블록 구성도,
도 17은 본 발명의 실시예 5에 따른 음성 부호화 장치의 블록 구성도,
도 18은 본 발명의 실시예 5에 따른 음성 복호화 장치의 블록 구성도,
도 19는 본 발명의 실시예 5에 따른 음성 부호화 장치의 블록 구성도(변형예 1),
도 20은 본 발명의 실시예 5에 따른 음성 부호화 장치의 블록 구성도(변형예 2),
도 21은 본 발명의 실시예 5에 따른 음성 복호화 장치의 블록 구성도(변형예 1),
도 22는 본 발명의 실시예 6에 따른 제 2 레이어 부호화부의 블록 구성도,
도 23은 본 발명의 실시예 6에 따른 스펙트럼 변형부의 블록 구성도,
도 24는 본 발명의 실시예 6에 따른 제 2 레이어 복호화부의 블록 구성도,
도 25는 본 발명의 실시예 7에 따른 스펙트럼 변형부의 블록 구성도,
도 26은 본 발명의 실시예 8에 따른 스펙트럼 변형부의 블록 구성도,
도 27은 본 발명의 실시예 9에 따른 스펙트럼 변형부의 블록 구성도,
도 28은 본 발명의 실시예 10에 따른 제 2 레이어 부호화부의 블록 구성도,
도 29는 본 발명의 실시예 10에 따른 제 2 레이어 복호화부의 블록 구성도,
도 30은 본 발명의 실시예 11에 따른 제 2 레이어 부호화부의 블록 구성도,
도 31은 본 발명의 실시예 11에 따른 제 2 레이어 복호화부의 블록 구성도,
도 32는 본 발명의 실시예 12에 따른 제 2 레이어 부호화부의 블록 구성도,
도 33은 본 발명의 실시예 12에 따른 제 2 레이어 복호화부의 블록 구성도이다.
본 발명에서는, 저역부의 스펙트럼을 이용하여 고역부를 부호화함에 있어서, 저역부의 스펙트럼으로부터 스펙트럼 포락의 영향을 제거하여 스펙트럼을 평탄화하고, 평탄화한 스펙트럼을 이용하여 고역부의 스펙트럼을 부호화한다.
우선, 본 발명의 동작 원리에 대해 도 5(a)~(d)를 이용하여 설명한다.
도 5(a)~(d)에 있어서, FL을 임계값 주파수라 하고, 0-FL을 저역부, FL-FH를 고역부라 한다.
도 5(a)는, 종래의 부호화/복호화 처리에 의해 얻어지는 저역부의 복호 스펙트럼을 나타내며, 도 5(b)는, 도 5(a)에 나타낸 복호 스펙트럼을 스펙트럼 포락과 역(逆)특성을 가지는 역필터를 통과시킴으로써 얻어지는 스펙트럼을 나타낸다. 이와 같이, 저역부의 복호 스펙트럼을 스펙트럼 포락과 역 특성을 가지는 역필터를 통과시킴으로써, 저역부 스펙트럼의 평탄화가 이루어진다. 그리고, 도 5(c)에 나타내는 바와 같이, 평탄화된 저역부의 스펙트럼을 고역부에 여러 차례(여기서는 2회) 복제하여, 고역부를 부호화한다. 이미 도 5(b)에 나타낸 바와 같이 저역부의 스펙트럼이 평탄화되어 있기 때문에, 고역부의 부호화에서는, 상기와 같은 스펙트 럼 포락에 기인하는 스펙트럼의 에너지 불연속은 발생하지 않는다. 그리고, 신호 대역이 0-FH로 확장된 스펙트럼에 대해 스펙트럼 포락을 부여함으로써, 도 5(d)에 나타내는 바와 같은 복호 신호의 스펙트럼이 얻어진다.
또한, 고역부의 부호화 방법으로서는, 저역부의 스펙트럼을 피치 필터의 내부 상태로 이용하여, 주파수축상에서 낮은 주파수로부터 높은 주파수를 향해 피치 필터 처리를 행하여 스펙트럼의 고역부를 추정하는 방법을 이용할 수 있다. 이 부호화 방법에 의하면, 고역부의 부호화에서는, 피치 필터의 필터 정보를 부호화 하면 되기 때문에, 저비트레이트화를 꾀할 수 있다.
이하, 본 발명의 실시예에 대해서, 첨부 도면을 참조하여 상세히 설명한다.
(실시예 1)
본 실시예에서는, 제 1 레이어 및 제 2 레이어의 양쪽에 있어서 주파수 영역에서의 부호화를 행하는 경우에 대해 설명한다. 또, 본 실시예에서는, 저역부 스펙트럼의 평탄화를 행한 후에, 평탄화 후의 스펙트럼을 반복 이용하여 고역부의 스펙트럼을 부호화한다.
도 6에, 본 발명의 실시예 1에 따른 음성 부호화 장치의 구성을 나타낸다.
도 6에 나타내는 음성 부호화 장치(100)에 있어서, LPC 분석부(101)는, 입력 음성 신호의 LPC 분석을 실시하여, LPC 계수 α(i)(1≤i≤NP)를 산출한다. 여기서, NP는 LPC 계수의 차수를 나타내며, 예를 들면 10~18이 선택된다. 산출된 LPC 계수는, LPC 양자화부(102)에 입력된다.
LPC 양자화부(102)는, LPC 계수의 양자화를 행한다. LPC 양자화부(102)는, 양자화 효율이나 안정성 판정의 관점에서, LPC 계수를 LSP(Line Spectral Pair) 파라미터로 변환한 후에 양자화한다. 양자화 후의 LPC 계수는 부호화 데이터로서 LPC 복호화부(103) 및 다중화부(109)에 입력된다.
LPC 복호화부(103)는, 양자화 후의 LPC 계수를 복호하여 복호 LPC 계수 αq(i)(1≤i≤NP)를 생성하여, 역필터부(104)에 출력한다.
역필터부(104)는, 복호 LPC 계수를 이용하여 역필터를 구성하고, 이 역필터에 입력 음성 신호를 통과시킴으로써, 입력 음성 신호의 스펙트럼을 평탄화한다.
역필터는 수학식 1 또는 수학식 2와 같이 표시된다. 수학식 2는, 평탄화의 정도를 제어하는 공진 억압 계수(共振抑壓係數) γ(0〈γ〈1)를 이용했을 때의 역필터이다.
Figure 112008022732660-PCT00001
Figure 112008022732660-PCT00002
그리고, 수학식 1에 표시되는 역필터에 음성 신호 s(n)을 입력시켰을 때 얻어지는 출력 신호 e(n)은, 수학식 3과 같이 표시된다.
Figure 112008022732660-PCT00003
마찬가지로, 수학식 2에 표시되는 역필터에 음성 신호 s(n)을 입력시켰을 때 얻어지는 출력 신호 e(n)은, 수학식 4와 같이 표시된다.
Figure 112008022732660-PCT00004
따라서, 이 역필터 처리에 의해 입력 음성 신호의 스펙트럼이 평탄화된다. 또한, 이하의 설명에서는, 역필터부(104)의 출력 신호(스펙트럼이 평탄화된 음성 신호)를 예측잔차신호라고 부른다.
주파수 영역 변환부(105)는, 역필터부(104)로부터 출력되는 예측잔차신호의 주파수 분석을 행하여, 변환계수로서 잔차스펙트럼을 구한다. 주파수 영역 변환부(105)는, 예를 들면, MDCT(Modified Discrete Cosine Transform;변형 이산 코사인 변환)를 이용하여 시간 영역 신호를 주파수 영역 신호로 변환한다. 잔차스펙트럼은 제 1 레이어 부호화부(106) 및 제 2 레이어 부호화부(108)에 입력된다.
제 1 레이어 부호화부(106)는, TwinVQ 등을 이용하여 잔차스펙트럼의 저역부의 부호화를 행하고, 이 부호화로 얻어지는 제 1 레이어 부호화 데이터를 제 1 레이어 복호화부(107) 및 다중화부(109)에 출력한다.
제 1 레이어 복호화부(107)는, 제 1 레이어 부호화 데이터의 복호를 행하여 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 부호화부(108)에 출력한다. 또한, 제 1 레이어 복호화부(107)는, 시간 영역으로 변환되기 전의 제 1 레이어 복호 스펙트럼을 출력한다.
제 2 레이어 부호화부(108)는, 제 1 레이어 복호화부(107)에서 얻어진 제 1 레이어 복호 스펙트럼을 이용하여, 잔차 스펙트럼의 고역부의 부호화를 행하고, 이 부호화로 얻어지는 제 2 레이어 부호화 데이터를 다중화부(109)에 출력한다. 제 2 레이어 부호화부(108)는, 제 1 레이어 복호 스펙트럼을 피치 필터의 내부 상태로 이용하여, 피치 필터링 처리에 의해 잔차스펙트럼의 고역부를 추정한다. 이 때, 제 2 레이어 부호화부(108)는, 스펙트럼의 하모닉스(harmonics) 구조를 붕괴시키지 않도록 잔차스펙트럼의 고역부를 추정한다. 또, 제 2 레이어 부호화부(108)는, 피치 필터의 필터 정보를 부호화한다. 그리고, 제 2 레이어 부호화부(108)에서는, 스펙트럼이 평탄화된 잔차스펙트럼을 이용해 잔차 스펙트럼의 고역부를 추정한다. 이 때문에, 필터링 처리에 의해 재귀적으로 스펙트럼이 반복 사용되어 고역부가 추정되더라도, 스펙트럼의 에너지의 불연속 발생을 방지할 수 있다. 따라서, 본 실시예에 의하면, 저비트레이트로 고음질을 얻을 수 있다. 또한, 제 2 레이어 부호화부(108)의 상세한 것에 대해서는 후술한다.
다중화부(109)는, 제 1 레이어 부호화 데이터, 제 2 레이어 부호화 데이터 및 LPC 계수 부호화 데이터를 다중화해 비트 스트림을 생성하여, 출력한다.
그 다음에, 제 2 레이어 부호화부(108)의 상세한 것에 대하여 설명한다. 도 7에, 제 2 레이어 부호화부(108)의 구성을 나타낸다.
내부 상태 설정부(1081)에는, 제 1 레이어 복호화부(107)로부터 제 1 레이어 복호 스펙트럼 S1(k)(0≤k〈FL)가 입력된다. 내부 상태 설정부(1081)는, 이 제 1 레이어 복호 스펙트럼을 이용하여, 필터링부(1082)에서 이용되는 필터의 내부 상태를 설정한다.
피치 계수 설정부(1084)는, 탐색부(1083)로부터의 제어에 따라 피치 계수(T)를 미리 정해진 탐색 범위 Tmin∼Tmax 안에서 조금씩 변화시키면서, 필터링부(1082)에 순차적으로 출력한다.
필터링부(1082)는, 내부 상태 설정부(1081)에서 설정된 필터의 내부 상태와, 피치 계수 설정부(1084)로부터 출력되는 피치 계수(T)에 기초하여 제 1 레이어 복호 스펙트럼의 필터링을 행하여, 잔차스펙트럼의 추정값 S2'(k)를 산출한다. 이 필터링 처리의 상세한 것에 대해서는 후술한다.
탐색부(1083)는, 주파수 영역 변환부(105)로부터 입력되는 잔차스펙트럼 S2(k)(0≤k〈FH)와 필터링부(1082)로부터 입력되는 잔차스펙트럼의 추정값 S2'(k)의 유사성을 나타내는 파라미터인 유사도를 산출한다. 이 유사도의 산출 처리는, 피치 계수 설정부(1084)로부터 피치 계수 T가 주어질 때마다 행해지며, 산출되는 유사도가 최대가 되는 피치 계수(최적 피치 계수) T'(Tmin∼Tmax의 범위)가 다중화부(1086)에 출력된다. 또, 탐색부(1083)는, 이 피치 계수 T'를 이용하여 생성되는 잔차스펙트럼의 추정값 S2'(k)를 게인 부호화부(1085)에 출력한다.
게인 부호화부(1085)는, 주파수 영역 변환부(105)로부터 입력되는 잔차스펙트럼 S2(k)(0≤k〈FH)를 기초로 잔차스펙트럼 S2(k)의 게인 정보를 산출한다. 또 한, 여기서는, 이 게인 정보를 서브밴드마다의 스펙트럼 파워로 표시하고, 주파수대역 FL≤k〈FH를 J개의 서브밴드로 분할하는 경우를 예로 들어 설명한다. 이 때, 제 j 서브밴드의 스펙트럼 파워 B(j)는 수학식 5로 표시된다. 수학식 5에 있어서, BL(j)는 제 j 서브밴드의 최소 주파수, BH(j)는 제 j 서브밴드의 최대 주파수를 나타낸다. 이와 같이 하여 구한 잔차스펙트럼의 서브밴드 정보를 잔차스펙트럼의 게인 정보로 간주한다.
Figure 112008022732660-PCT00005
또, 게인 부호화부(1085)는, 마찬가지로, 잔차스펙트럼의 추정값 S2'(k)의 서브밴드 정보 B'(j)를 수학식 6에 따라 산출하고, 서브밴드마다의 변동량 V(j)를 수학식 7에 따라 산출한다.
Figure 112008022732660-PCT00006
Figure 112008022732660-PCT00007
다음에, 게인 부호화부(1085)는, 변동량 V(j)를 부호화하여 부호화 후의 변동량 Vq(j)를 구하고, 그 인덱스를 다중화부(1086)에 출력한다.
다중화부(1086)는, 탐색부(1083)로부터 입력되는 최적한 피치 계수 T'와 게 인 부호화부(1085)로부터 입력되는 변동량 V(j)의 인덱스를 다중화하여, 제 2 레이어 부호화 데이터로서 다중화부(109)에 출력한다.
그 다음에, 필터링부(1082)에서의 필터링 처리의 상세한 것에 대해 설명한다. 도 8에, 필터링부(1082)가, 피치 계수 설정부(1084)로부터 입력되는 피치 계수(T)를 이용하여, 대역 FL≤k〈FH의 스펙트럼을 생성하는 양상을 나타낸다. 여기서는, 전 주파수 대역(0≤k〈FH)의 스펙트럼을 편의적으로 S(k)라고 부르며, 필터 함수는 수학식 8에서 표시되는 것을 사용한다. 이 수학식에 있어서, T는 피치 계수 설정부(1084)로부터 주어진 피치 계수를 나타내며, 또 M=1이라고 한다.
Figure 112008022732660-PCT00008
S(k)의 0≤k〈FL 대역에는, 제 1 레이어 복호 스펙트럼 S1(k)가 필터의 내부 상태로서 저장된다. 한편, S(k)의 FL≤k〈FH 대역에는, 이하의 절차에 의해 구해진 잔차스펙트럼의 추정값 S2'(k)가 저장된다.
S2'(k)에는, 필터링 처리에 의해, k로부터 T만큼 낮은 주파수의 스펙트럼 S(k-T)에, 이 스펙트럼을 중심으로 i만큼 떨어진 근방의 스펙트럼 S(k-T-i)에 소정의 가중 계수 βi 를 곱한 스펙트럼 βiㆍS(k-T-i)를 전부 가산한 스펙트럼, 즉, 수학식 9에 의해 표시되는 스펙트럼이 대입된다. 그리고 이 연산을, 주파수가 낮은 쪽(k=FL)에서부터 순차적으로 k를 FL≤k〈FH의 범위에서 변화시켜 행함으로써, FL≤k〈FH에 있어서의 잔차스펙트럼의 추정값 S2'(k)가 산출된다.
Figure 112008022732660-PCT00009
이상의 필터링 처리는, 피치 계수 설정부(1084)로부터 피치 계수 T가 부여될 때마다, FL≤k〈FH의 범위에 있어서, 그때마다 S(k)를 제로 클리어하여 행해진다. 즉, 피치 계수 T가 변화할 때마다 S(k)가 산출되어, 탐색부(1083)에 출력된다.
여기서, 도 8에 나타내는 예에서는, 피치 계수 T의 크기가 대역 FL-FH보다 작기 때문에, 고역부(FL≤k〈FH)의 스펙트럼은 저역부(0≤k〈FL)의 스펙트럼을 재귀적으로 이용해서 생성된다. 저역부의 스펙트럼은 상기와 같이 평탄화되고 있기 때문에, 필터링 처리에 의해 저역부의 스펙트럼을 재귀적으로 이용해 고역부의 스펙트럼이 생성되는 경우에 있어서도, 고역부의 스펙트럼에는 에너지의 불연속이 발생하는 일이 없다.
이와 같이, 본 실시예에 의하면, 스펙트럼 포락의 영향에 의해 고역부에서 발생하던 스펙트럼의 에너지의 불연속을 방지할 수 있어, 음성 품질을 개선할 수 있다.
이어서, 본 실시예에 따른 음성 복호화 장치에 대해 설명한다. 도 9에, 본 발명의 실시예 1에 따른 음성 복호화 장치의 구성을 나타낸다. 이 음성 복호화 장치(200)는, 도 6에 나타낸 음성 부호화 장치(100)로부터 송신되는 비트 스트림을 수신하는 것이다.
도 9에 나타내는 음성 복호화 장치(200)에 있어서, 분리부(201)는, 도 6에 나타낸 음성 부호화 장치(100)로부터 수신된 비트 스트림을, 제 1 레이어 부호화 데이터, 제 2 레이어 부호화 데이터 및 LPC 계수로 분리하고, 제 1 레이어 부호화 데이터를 제 1 레이어 복호화부(202)에, 제 2 레이어 부호화 데이터를 제 2 레이어 복호화부(203)에, LPC 계수를 LPC 복호화부(204)에 출력한다. 또, 분리부(201)는, 레이어 정보(비트 스트림에 어느 레이어의 부호화 데이터가 포함되는지를 나타내는 정보)를 판정부(205)에 출력한다.
제 1 레이어 복호화부(202)는, 제 1 레이어 부호화 데이터를 이용해 복호 처리를 행하여 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 복호화부(203) 및 판정부(205)에 출력한다.
제 2 레이어 복호화부(203)는, 제 2 레이어 부호화 데이터와 제 1 레이어 복호 스펙트럼을 이용해, 제 2 레이어 복호 스펙트럼을 생성하여 판정부(205)에 출력한다. 또한, 제 2 레이어 복호화부(203)의 상세한 것에 대하여는 후술한다.
LPC 복호화부(204)는, LPC 계수 부호화 데이터를 복호하여 얻은 복호 LPC 계수를 합성 필터부(207)에 출력한다.
여기서, 음성 부호화 장치(100)는, 비트 스트림에 제 1 레이어 부호화 데이터와 제 2 레이어 부호화 데이터의 양쪽을 포함시켜 송신하지만, 통신 경로의 도중에서 제 2 레이어 부호화 데이터가 폐기되는 경우가 있다. 그래서, 판정부(205)는, 레이어 정보를 기초로, 비트 스트림에 제 2 레이어 부호화 데이터가 포함되어 있는지 없는지를 판정한다. 그리고, 판정부(205)는, 비트 스트림에 제 2 레이어 부호화 데이터가 포함되어 있지 않을 경우는, 제 2 레이어 복호화부(203)에 의해 제 2 레이어 복호 스펙트럼이 생성되지 않기 때문에, 제 1 레이어 복호 스펙트럼을 시간 영역 변환부(206)에 출력한다. 단, 이 경우, 제 2 레이어 부호화 데이터가 포함되어 있을 경우의 복호 스펙트럼과 차수를 일치시키기 위해, 판정부(205)는, 제 1 레이어 복호 스펙트럼의 차수를 FH까지 확장하고, FL-FH의 스펙트럼을 0으로서 출력한다. 한편, 비트 스트림에 제 1 레이어 부호화 데이터 및 제 2 레이어 부호화 데이터의 양쪽이 포함되어 있을 경우는, 판정부(205)는, 제 2 레이어 복호 스펙트럼을 시간 영역 변환부(206)에 출력한다.
시간 영역 변환부(206)는, 판정부(205)로부터 입력되는 복호 스펙트럼을 시간 영역의 신호로 변환해 복호잔차신호를 생성하여, 합성 필터부(207)에 출력한다.
합성 필터부(207)는, LPC 복호화부(204)로부터 입력되는 복호 LPC 계수 αq(i)(1≤i〈NP)를 이용해 합성 필터를 구성한다.
합성 필터 H(z)는 수학식 10 또는 수학식 11과 같이 표시된다. 또한, 수학식 11에 있어서 γ(0〈γ〈1)는 공진 억압 계수를 나타낸다.
Figure 112008022732660-PCT00010
Figure 112008022732660-PCT00011
그리고, 시간 영역 변환부(206)에서 주어지는 복호잔차신호를 eq(n)으로서 합성 필터부(207)에 입력하면, 수학식 10으로 표시되는 합성 필터를 이용했을 때, 출력되는 복호 신호 sq(n)은 수학식 12와 같이 표시된다.
Figure 112008022732660-PCT00012
마찬가지로, 수학식 11로 표시되는 합성 필터를 이용했을 때, 복호 신호 sq(n)은 수학식 13과 같이 표시된다.
Figure 112008022732660-PCT00013
그 다음에, 제 2 레이어 복호화부(203)의 상세한 것에 대하여 설명한다. 도 10에, 제 2 레이어 복호화부(203)의 구성을 나타낸다.
내부상태 설정부(2031)에는, 제 1 레이어 복호화부(202)로부터 제 1 레이어 복호 스펙트럼이 입력된다. 내부상태 설정부(2031)는, 제 1 레이어 복호 스펙트럼 S1(k)를 이용해, 필터링부(2033)에서 이용되는 필터의 내부 상태를 설정한다.
한편, 분리부(2032)에는, 분리부(201)로부터 제 2 레이어 부호화 데이터가 입력된다. 분리부(2032)는, 제 2 레이어 부호화 데이터를 필터링 계수에 관한 정보(최적 피치 계수 T')와 게인에 관한 정보(변동량 V(j)의 인덱스)로 분리하고, 필터링 계수에 관한 정보를 필터링부(2033)에 출력함과 동시에, 게인에 관한 정보를 게인 복호화부(2034)에 출력한다.
필터링부(2033)는, 내부 상태 설정부(2031)에서 설정된 필터의 내부 상태와 분리부(2032)로부터 입력되는 피치 계수 T'를 기초로 제 1 레이어 복호 스펙트럼 S1(k)의 필터링을 행하여, 잔차스펙트럼의 추정값 S2'(k)를 산출한다. 필터링부(2033)에서는, 수학식 8로 나타내는 필터 함수가 이용된다.
게인 복호화부(2034)는, 분리부(2032)로부터 입력되는 게인 정보를 복호하고, 변동량 V(j)를 부호화하여 얻어지는 변동량 Vq(j)를 구한다.
스펙트럼 조정부(2035)는, 필터링부(2033)로부터 입력되는 복호 스펙트럼 S'(k)에, 게인 복호화부(2034)로부터 입력되는 복호된 서브밴드마다의 변동량 Vq(j)를 수학식 14에 따라 곱함으로써, 복호 스펙트럼 S'(k)의 주파수대역 FL≤k〈FH에 있어서의 스펙트럼 형상을 조정하고, 조정 후의 복호 스펙트럼 S3(k)를 생성한다. 이 조정 후의 복호 스펙트럼 S3(k)는, 제 2 레이어 복호 스펙트럼으로서 판정부(205)에 출력된다.
Figure 112008022732660-PCT00014
이와 같이 하여, 음성 복호화 장치(200)는, 도 6에 나타내는 음성 부호화 장치(100)로부터 송신된 비트 스트림을 복호할 수 있다.
(실시예 2)
본 실시예에서는, 제 1 레이어에 있어서 시간 영역에서의 부호화(예를 들면 CELP 부호화)를 행하는 경우에 대해 설명한다. 또, 본 실시예에서는, 제 1 레이어 에서의 부호화 처리중에 구해지는 복호 LPC 계수를 이용해 제 1 레이어 복호 신호의 스펙트럼 평탄화를 행한다.
도 11에, 본 발명의 실시예 2에 따른 음성 부호화 장치의 구성을 나타낸다. 도 11에 있어서, 실시예 1(도 6)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
도 11에 나타내는 음성 부호화 장치(300)에 있어서, 다운 샘플링부(301)는, 입력 음성 신호의 샘플링 레이트를 다운 샘플링하여, 소망하는 샘플링 레이트의 음성 신호를 제 1 레이어 부호화부(302)에 출력한다.
제 1 레이어 부호화부(302)는, 소망하는 샘플링 레이트로 다운 샘플링된 음성 신호에 대해 부호화 처리를 행해 제 1 레이어 부호화 데이터를 생성하여, 제 1 레이어 복호화부(303) 및 다중화부(109)에 출력한다. 제 1 레이어 부호화부(302)는, 예를 들면, CELP 부호화를 이용한다. 제 1 레이어 부호화부(302)가, CELP 부호화처럼 LPC 계수 부호화 처리를 행할 때는, 그 부호화 처리중에 복호 LPC 계수를 생성할 수 있다. 그리고, 제 1 레이어 부호화부(302)는, 부호화 처리중에 생성되는 제 1 레이어 복호 LPC 계수를 역필터부(304)에 출력한다.
제 1 레이어 복호화부(303)는, 제 1 레이어 부호화 데이터를 이용해 복호 처리를 행하여 제 1 레이어 복호 신호를 생성하여, 역필터부(304)에 출력한다.
역필터부(304)는, 제 1 레이어 부호화부(302)로부터 입력되는 제 1 레이어 복호 LPC 계수를 이용해 역필터를 구성하고, 이 역필터에 제 1 레이어 복호 신호를 통과시킴으로써, 제 1 레이어 복호 신호의 스펙트럼을 평탄화한다. 또한, 역필터 의 상세한 것에 대하여는 실시예 1과 동일하기 때문에 설명을 생략한다. 또, 이하의 설명에서는, 역필터부(304)의 출력 신호(스펙트럼이 평탄화된 제 1 레이어 복호 신호)를 제 1 레이어 복호잔차신호라고 부른다.
주파수 영역 변환부(305)는, 역필터부(304)로부터 출력되는 제 1 레이어 복호잔차신호의 주파수 분석을 행해 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 부호화부(108)에 출력한다.
또한, 지연부(306)는, 입력 음성 신호에 대해 소정 길이의 지연을 부여하기 위한 것이다. 이 지연의 크기는, 입력 음성 신호가 다운 샘플링부(301), 제 1 레이어 부호화부(302), 제 1 레이어 복호화부(303), 역필터부(304) 및 주파수 영역 변환부(305)를 경유했을 때에 발생하는 시간 지연과 동일한 값으로 한다.
이와 같이, 본 실시예에 의하면, 제 1 레이어에서의 부호화 처리중에 구해지는 복호 LPC 계수(제 1 레이어 복호 LPC 계수)를 이용해 제 1 레이어 복호 신호의 스펙트럼의 평탄화를 행하기 때문에, 제 1 레이어 부호화 데이터의 정보를 이용해 제 1 레이어 복호 신호의 스펙트럼을 평탄화할 수 있다. 따라서, 본 실시예에 의하면, 제 1 레이어 복호 신호의 스펙트럼을 평탄화하기 위한 LPC 계수에 요하는 부호화 비트가 불필요해지기 때문에, 정보량의 증가를 수반하는 일 없이, 스펙트럼의 평탄화를 행할 수 있다.
그 다음에, 본 실시예에 따른 음성 복호화 장치에 대해 설명한다. 도 12에, 본 발명의 실시예 2에 따른 음성 복호화 장치의 구성을 나타낸다. 이 음성 복호화 장치(400)는, 도 11에 나타내는 음성 부호화 장치(300)로부터 송신되는 비트 스트 림을 수신하는 것이다.
도 12에 나타내는 음성 복호화 장치(400)에 있어서, 분리부(401)는, 도 11에 나타내는 음성 부호화 장치(300)로부터 수신된 비트 스트림을, 제 1 레이어 부호화 데이터, 제 2 레이어 부호화 데이터 및 LPC 계수 부호화 데이터로 분리하고, 제 1 레이어 부호화 데이터를 제 1 레이어 복호화부(402)에, 제 2 레이어 부호화 데이터를 제 2 레이어 복호화부(405)에, LPC 계수 부호화 데이터를 LPC 복호화부(407)에 출력한다. 또, 분리부(401)는, 레이어 정보(비트 스트림에 어느 레이어의 부호화 데이터가 포함되는지를 나타내는 정보)를 판정부(413)에 출력한다.
제 1 레이어 복호화부(402)는, 제 1 레이어 부호화 데이터를 이용해 복호 처리를 행하여 제 1 레이어 복호 신호를 생성하여, 역필터부(403) 및 업 샘플링부(410)에 출력한다. 또, 제 1 레이어 복호화부(402)는, 복호 처리중에 생성되는 제 1 레이어 복호 LPC 계수를 역필터부(403)에 출력한다.
업 샘플링부(410)는, 제 1 레이어 복호 신호의 샘플링 레이트를 업 샘플링하여, 도 11의 입력 음성 신호의 샘플링 레이트와 동일하게 하여 로패스 필터부(411) 및 판정부(413)에 출력한다.
로패스 필터부(411)는, 통과 대역이 0-FL로 설정되어 있어, 업 샘플링 후의 제 1 레이어 복호 신호의 주파수 대역 0-FL만을 통과시켜 저역 신호를 생성해, 가산부(412)에 출력한다.
역필터부(403)는, 제 1 레이어 복호화부(402)로부터 입력되는 제 1 레이어 복호 LPC 계수를 이용해 역필터를 구성하고, 이 역필터에 제 1 레이어 복호 신호를 통과시킴으로써 제 1 레이어 복호잔차신호를 생성하여, 주파수 영역 변환부(404)에 출력한다.
주파수 영역 변환부(404)는, 역필터부(403)로부터 출력되는 제 1 레이어 복호잔차신호의 주파수 분석을 행해 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 복호화부(405)에 출력한다.
제 2 레이어 복호화부(405)는, 제 2 레이어 부호화 데이터와 제 1 레이어 복호 스펙트럼을 이용해 제 2 레이어 복호 스펙트럼을 생성하여 시간 영역 변환부(406)에 출력한다. 또한, 제 2 레이어 복호화부(405)의 상세한 것에 대해서는, 실시예 1의 제 2 레이어 복호화부(203)(도 9)와 동일하기 때문에 설명을 생략한다.
시간 영역 변환부(406)는, 제 2 레이어 복호 스펙트럼을 시간 영역의 신호로 변환해 제 2 레이어 복호잔차신호를 생성하여, 합성 필터부(408)에 출력한다.
LPC 복호화부(407)는, LPC 계수를 복호하고 얻은 복호 LPC 계수를 합성 필터부(408)에 출력한다.
합성 필터부(408)는, LPC 복호화부(407)로부터 입력되는 복호 LPC 계수를 이용해 합성 필터를 구성한다. 또한, 합성 필터부(408)의 상세한 것에 대해서는, 실시예 1의 합성 필터부(207)(도 9)와 동일하기 때문에 설명을 생략한다. 합성 필터부(408)는, 실시예 1과 마찬가지로 하여 제 2 레이어 합성 신호 sq(n)을 생성하여, 하이 패스 필터부(409)에 출력한다.
하이 패스 필터부(409)는, 통과 대역이 FL-FH로 설정되어 있어, 제 2 레이어 합성 신호의 주파수대역 FL-FH만을 통과시켜 고역 신호를 생성하여, 가산부(412)에 출력한다.
가산부(412)는, 저역 신호와 고역신호를 가산해 제 2 레이어 복호 신호를 생성하여, 판정부(413)에 출력한다.
판정부(413)는, 분리부(401)로부터 입력되는 레이어 정보에 기초하여, 비트 스트림에 제 2 레이어 부호화 데이터가 포함되어 있는지 없는지를 판정하고, 제 1 레이어 복호 신호 또는 제 2 레이어 복호 신호의 어느 것인가를 선택하여 복호 신호로서 출력한다. 판정부(413)는, 비트 스트림에 제 2 레이어 부호화 데이터가 포함되지 않은 경우는 제 1 레이어 복호 신호를 출력하고, 비트 스트림에 제 1 레이어 부호화 데이터 및 제 2 레이어 부호화 데이터의 양쪽이 포함되어 있을 경우는 제 2 레이어 복호 신호를 출력한다.
또한, 로패스 필터부(411) 및 하이 패스 필터부(409)는, 저역 신호와 고역신호 간에서 서로 주는 영향을 완화하기 위해서 이용된다. 따라서, 저역 신호와 고역 신호 간에서 서로 주는 영향이 작을 경우는, 음성 복호화 장치(400)를, 이러한 필터를 이용하지 않는 구성으로 해도 좋다. 이러한 필터를 이용하지 않을 경우, 필터링에 관련된 연산이 불필요하게 되기 때문에, 연산량을 삭감할 수 있다.
이와 같이 하여, 음성 복호화 장치(400)는, 도 11에 나타내는 음성 부호화 장치(300)로부터 송신된 비트 스트림을 복호할 수 있다.
(실시예 3)
제 1 레이어 음원 신호의 스펙트럼은, 입력 음성 신호로부터 스펙트럼 포락의 영향을 제거한 예측잔차신호의 스펙트럼과 동일하게 평탄화되고 있다. 그래서, 본 실시예에서는, 제 1 레이어에서의 부호화 처리중에 구해지는 제 1 레이어 음원 신호를, 스펙트럼이 평탄화된 신호(즉, 실시예 2에 있어서의 제 1 레이어 복호잔차신호)로 간주하여 처리를 행한다.
도 13에, 본 발명의 실시예 3에 따른 음성 부호화 장치의 구성을 나타낸다. 도 13에 있어서, 실시예 2(도 11)와 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
제 1 레이어 부호화부(501)는, 소망하는 샘플링 레이트로 다운 샘플링된 음성 신호에 대해 부호화 처리를 행하여 제 1 레이어 부호화 데이터를 생성하여, 다중화부(109)에 출력한다. 제 1 레이어 부호화부(501)는, 예를 들면, CELP 부호화를 이용한다. 또, 제 1 레이어 부호화부(501)는, 부호화 처리중에 생성되는 제 1 레이어 음원 신호를 주파수 영역 변환부(502)에 출력한다. 또한, 여기서 말하는 음원 신호란, CELP 부호화를 행하는 제 1 레이어 부호화부(501)의 내부에 있는 합성 필터(또는 청각 가중 합성 필터)에 입력되는 신호를 가리키며, 구동 신호라고도 불린다.
주파수 영역 변환부(502)는, 제 1 레이어 음원 신호의 주파수 분석을 행하여 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 부호화부(108)에 출력한다.
또한, 지연부(503)의 지연 크기는, 입력 음성 신호가 다운 샘플링부(301), 제 1 레이어 부호화부(501) 및 주파수 영역 변환부(502)를 경유했을 때 발생하는 시간 지연과 동일한 값으로 한다.
이와 같이, 본 실시예에 의하면, 실시예 2(도 11)에 비해, 제 1 레이어 복호화부(303) 및 역필터부(304)가 불필요해지기 때문에, 연산량을 삭감할 수 있다.
그 다음에, 본 실시예에 따른 음성 복호화 장치에 대해 설명한다. 도 14에, 본 발명의 실시예 3에 따른 음성 복호화 장치의 구성을 나타낸다. 이 음성 복호화 장치(600)는, 도 13에 나타내는 음성 부호화 장치(500)로부터 송신되는 비트 스트림을 수신하는 것이다. 도 14에 있어서, 실시예 2(도 12)와 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
제 1 레이어 복호화부(601)는, 제 1 레이어 부호화 데이터를 이용해 복호 처리를 행하여 제 1 레이어 복호 신호를 생성하여, 업 샘플링부(410)에 출력한다. 또, 제 1 레이어 복호화부(601)는, 복호 처리중에 생성되는 제 1 레이어 음원 신호를 주파수 영역 변환부(602)에 출력한다.
주파수 영역 변환부(602)는, 제 1 레이어 음원 신호의 주파수 분석을 행하여 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 복호화부(405)에 출력한다.
이와 같이 하여, 음성 복호화 장치(600)는, 도 13에 나타내는 음성 부호화 장치(500)로부터 송신된 비트 스트림을 복호할 수 있다.
(실시예 4)
본 실시예에서는, 제 2 레이어에서 구한 제 2 레이어 복호 LPC 계수를 이용 해, 제 1 레이어 복호 신호 및 입력 음성 신호 각각의 스펙트럼을 평탄화한다.
도 15에, 본 발명의 실시예 4에 따른 음성 부호화 장치(700)의 구성을 나타낸다. 도 15에 있어서, 실시예 2(도 11)와 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
제 1 레이어 부호화부(701)는, 소망한 샘플링 레이트에 다운 샘플링된 음성 신호에 대해서 부호화 처리를 행하여 제 1 레이어 부호화 데이터를 생성하여, 제 1 레이어 복호화부(702) 및 다중화부(109)에 출력한다. 제 1 레이어 부호화부(701)는, 예를 들면, CELP 부호화를 이용한다.
제 1 레이어 복호화부(702)는, 제 1 레이어 부호화 데이터를 이용해 복호 처리를 행하여 제 1 레이어 복호 신호를 생성하여, 업 샘플링부(703)에 출력한다.
업 샘플링부(703)는, 제 1 레이어 복호 신호의 샘플링 레이트를 업 샘플링해 입력 음성 신호의 샘플링 레이트와 동일하게 하여, 역필터부(704)에 출력한다.
역필터부(704)에는, 역필터부(104)와 마찬가지로, LPC 복호화부(103)로부터 복호 LPC 계수가 입력된다. 역필터부(704)는, 복호 LPC 계수를 이용해 역필터를 구성하고, 이 역필터에 업 샘플링 후의 제 1 레이어 복호 신호를 통과시킴으로써, 제 1 레이어 복호 신호의 스펙트럼을 평탄화한다. 또한, 이하의 설명에서는, 역필터부(704)의 출력 신호(스펙트럼이 평탄화된 제 1 레이어 복호 신호)를 제 1 레이어 복호잔차신호라고 부른다.
주파수 영역 변환부(705)는, 역필터부(704)로부터 출력되는 제 1 레이어 복호잔차신호의 주파수 분석을 행하여 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 부호화부(108)에 출력한다.
또한, 지연부(706)의 지연의 크기는, 입력 음성 신호가 다운 샘플링부(301), 제 1 레이어 부호화부(701), 제 1 레이어 복호화부(702), 업 샘플링부(703), 역필터부(704) 및 주파수 영역 변환부(705)를 경유했을 때에 생기는 시간 지연과 동일한 값으로 한다.
그 다음에, 본 실시예에 따른 음성 복호화 장치에 대해 설명한다. 도 16에, 본 발명의 실시예 4에 따른 음성 복호화 장치의 구성을 나타낸다. 이 음성 복호화 장치(800)는, 도 15에 나타내는 음성 부호화 장치(700)로부터 송신되는 비트 스트림을 수신하는 것이다. 도 16에 있어서, 실시예 2(도 12)와 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
제 1 레이어 복호화부(801)는, 제 1 레이어 부호화 데이터를 이용해 복호 처리를 행하여 제 1 레이어 복호 신호를 생성하여, 업 샘플링부(802)에 출력한다.
업 샘플링부(802)는, 제 1 레이어 복호 신호의 샘플링 레이트를 업 샘플링하여 도 15의 입력 음성 신호의 샘플링 레이트와 동일하게 하여, 역필터부(803) 및 판정부(413)에 출력한다.
역필터부(803)에는, 합성 필터부(408)와 마찬가지로, LPC 복호화부(407)로부터 복호 LPC 계수가 입력된다. 역필터부(803)는, 복호 LPC 계수를 이용해 역필터를 구성하고, 이 역필터에 업 샘플링 후의 제 1 레이어 복호 신호를 통과시킴으로써 제 1 레이어 복호 신호의 스펙트럼을 평탄화하고, 제 1 레이어 복호잔차신호를 주파수 영역 변환부(804)에 출력한다.
주파수 영역 변환부(804)는, 역필터부(803)로부터 출력되는 제 1 레이어 복호잔차신호의 주파수 분석을 행해 제 1 레이어 복호 스펙트럼을 생성하여, 제 2 레이어 복호화부(405)에 출력한다.
이와 같이 하여, 음성 복호화 장치(800)는, 도 15에 나타내는 음성 부호화 장치(700)로부터 송신된 비트 스트림을 복호할 수 있다.
이와 같이, 본 실시예에 의하면, 음성 부호화 장치에 있어서, 제 2 레이어에서 구한 제 2 레이어 복호 LPC 계수를 이용하여, 제 1 레이어 복호 신호 및 입력 음성 신호 각각의 스펙트럼을 평탄화하기 때문에, 음성 복호화 장치에서는, 음성 부호화 장치와 공통된 LPC 계수를 이용해 제 1 레이어 복호 스펙트럼을 구할 수 있다. 따라서, 본 실시예에 의하면, 음성 복호화 장치에서는, 복호 신호를 생성함에 있어서, 실시예 2, 3과 같은 저역부와 고역부로 분리한 처리를 행할 필요가 없어지기 때문에 로패스 필터 및 하이 패스 필터가 불필요하게 되어 장치 구성이 간단해짐과 동시에, 필터링 처리에 관련된 연산량을 삭감할 수 있다.
(실시예 5)
본 실시예는, 스펙트럼의 평탄화를 행하는 역필터의 공진 억압 계수를 입력 음성 신호의 특성에 따라 적응적으로 변화시켜 평탄화의 정도를 제어하는 것이다.
도 17에, 본 발명의 실시예 5에 따른 음성 부호화 장치(900)의 구성을 나타낸다. 도 17에 있어서, 실시예 4(도 15)와 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
음성 부호화 장치(900)에 있어서, 역필터부(904, 905)는, 수학식 2에 의해 표시된다.
특징량(特徵量) 분석부(901)는, 입력 음성 신호를 분석해 특징량을 산출하여, 특징량 부호화부(902)에 출력한다. 특징량으로서는, 공진에 의한 음성 스펙트럼의 강도를 나타내는 파라미터를 이용한다. 구체적으로는, 예를 들면, 서로 이웃해 있는 LSP 파라미터간 거리를 이용한다. 일반적으로, 이 거리가 작을수록 공진의 정도가 강해, 공진 주파수에 대응하는 스펙트럼의 에너지가 크게 나타난다. 공진이 강하게 나타나는 음성 구간에서는, 평탄화 처리에 의해, 공진 주파수 근방에서의 스펙트럼이 과도하게 감쇠되어 음질 열화의 원인이 된다. 이것을 막기 위해, 공진이 강하게 나타나는 음성 구간에서는 상기의 공진 억압 계수 γ(0〈γ〈1)를 작게 설정하여 평탄화의 정도를 약하게 한다. 이에 의해, 평탄화 처리에 의한 공진 주파수 근방에서의 스펙트럼의 과도한 감쇠를 방지할 수 있어, 음성 품질의 열화를 억제할 수 있다.
특징량 부호화부(902)는, 특징량 분석부(901)로부터 입력되는 특징량을 부호화해 특징량 부호화 데이터를 생성하여, 특징량 복호화부(903) 및 다중화부(906)에 출력한다.
특징량 복호화부(903)는, 특징량 부호화 데이터를 이용해 특징량을 복호하여, 복호 특징량에 따라 역필터부(904, 905)에서 이용하는 공진 억압 계수 γ를 결정하여 역필터부(904, 905)에 출력한다. 특징량으로서 주기성의 세기를 나타내는 파라미터가 이용될 경우, 입력 음성 신호의 주기성이 강할수록 공진 억압 계수 γ 를 크게 하고, 입력 음성 신호의 주기성이 약할수록 공진 억압 계수 γ를 작게 한다. 이와 같이 공진 억압 계수 γ를 제어함으로써, 유성부에서는 보다 강하게 스펙트럼의 평탄화가 행해지고, 무성부에서는 스펙트럼의 평탄화의 정도가 약해진다. 따라서, 무성부에서의 과도한 스펙트럼의 평탄화를 막을 수 있어, 음성 품질의 열화를 억제할 수 있다.
역필터부(904, 905)는, 특징량 복호화부(903)에 의해 제어되는 공진 억압 계수 γ에 따라, 수학식 2에 따라 역필터 처리를 행한다.
다중화부(906)는, 제 1 레이어 부호화 데이터, 제 2 레이어 부호화 데이터, LPC 계수 및 특징량 부호화 데이터를 다중화해 비트 스트림을 생성하여, 출력한다.
또한, 지연부(907)의 지연의 크기는, 입력 음성 신호가 다운 샘플링부(301), 제 1 레이어 부호화부(701), 제 1 레이어 복호화부(702), 업 샘플링부(703), 역필터부(905) 및 주파수 영역 변환부(705)를 경유했을 때에 발생하는 시간 지연과 동일한 값으로 한다.
그 다음에, 본 실시예에 따른 음성 복호화 장치에 대해 설명한다. 도 18에, 본 발명의 실시예 5에 따른 음성 복호화 장치의 구성을 나타낸다. 이 음성 복호화 장치(1000)는, 도 17에 나타내는 음성 부호화 장치(900)로부터 송신되는 비트 스트림을 수신하는 것이다. 도 18에 있어서, 실시예 4(도 16)와 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
음성 부호화 장치(1000)에 있어서, 역필터부(1003)는, 수학식 2에 의해 표시된다.
분리부(1001)는, 도 17에 나타내는 음성 부호화 장치(900)로부터 수신된 비트 스트림을, 제 1 레이어 부호화 데이터, 제 2 레이어 부호화 데이터, LPC 계수 부호화 데이터 및 특징량 부호화 데이터로 분리하고, 제 1 레이어 부호화 데이터를 제 1 레이어 복호화부(801)에, 제 2 레이어 부호화 데이터를 제 2 레이어 복호화부(405)에, LPC 계수를 LPC 복호화부(407)에, 특징량 부호화 데이터를 특징량 복호화부(1002)에 출력한다. 또, 분리부(1001)는, 레이어 정보(비트 스트림에 어느 레이어의 부호화 데이터가 포함되는지를 나타내는 정보)를 판정부(413)에 출력한다.
특징량 복호화부(1002)는, 특징량 복호화부(903)(도 17)와 마찬가지로, 특징량 부호화 데이터를 이용하여 특징량을 복호하고, 복호 특징량에 따라 역필터부(1003)에서 이용하는 공진 억압 계수 γ를 결정하여 역필터부(1003)에 출력한다.
역필터부(1003)는, 특징량 복호화부(1002)에 의해 제어되는 공진 억압 계수 γ에 따라, 수학식 2에 따라 역필터 처리를 행한다.
이와 같이 하여, 음성 복호화 장치(1000)는, 도 17에 나타내는 음성 부호화 장치(900)로부터 송신된 비트 스트림을 복호할 수 있다.
또한, LPC 양자화부(102)(도 17)는, 상기와 같이, LPC 계수를 일단 LSP 파라미터로 변환한 후에 양자화한다. 그래서, 본 실시예에 있어서는, 음성 부호화 장치의 구성을 도 19에 나타내는 것처럼 해도 좋다. 즉, 도 19에 나타내는 음성 부호화 장치(1100)에서는, 특징량 분석부(901)를 구비하지 않고, LPC 양자화부(102)가 LSP 파라미터 간의 거리를 산출하여 특징량 부호화부(902)에 출력한다.
또, LPC 양자화부(102)가 복호 LSP 파라미터를 생성할 경우에는, 음성 부호 화 장치의 구성을 도 20에 나타내는 것처럼 해도 좋다. 즉, 도 20에 나타내는 음성 부호화 장치(1300)에서는, 특징량 분석부(901), 특징량 부호화부(902) 및 특징량 복호화부(903)를 구비하지 않고, LPC 양자화부(102)가 복호 LSP 파라미터를 생성해 복호 LSP 파라미터 간의 거리를 산출하여 역필터부(904, 905)에 출력한다.
또, 도 20에 나타내는 음성 부호화 장치(1300)로부터 송신된 비트 스트림을 복호하는 음성 복호화 장치(1400)의 구성을 도 21에 나타낸다. 도 21에 있어서, LPC 복호화부(407)는, 다시, 복호 LPC 계수로부터 복호 LSP 파라미터를 생성하여, 복호 LSP 파라미터 간의 거리를 산출하여 역필터부(1003)에 출력한다.
(실시예 6)
음성 신호나 오디오 신호에서는, 복제원인 저역부의 스펙트럼의 다이내믹 레인지(Dynamic Range)(스펙트럼의 진폭의 최대값과 최소값과의 비)가 복제처인 고역부의 스펙트럼의 다이내믹 레인지보다 커지는 상황이 자주 발생한다. 이러한 상황에 있어서 저역부의 스펙트럼을 복제하여 고역부의 스펙트럼으로 할 경우, 고역부에 스펙트럼의 과대한 피크가 발생한다. 그리고, 이와 같이 과대한 피크를 가지는 스펙트럼을 시간 영역으로 변환하여 얻어지는 복호 신호에는, 방울이 울리는 듯하게 들리는 노이즈가 발생하여, 그 결과, 주관 품질이 저하해 버린다.
이에 대해, 주관 품질의 개선을 꾀하기 위해, 저역부의 스펙트럼을 변형하여 저역부의 스펙트럼 다이내믹 레인지를 고역부의 스펙트럼 다이내믹 레인지에 접근시키는 기술이 제안되어 있다(예를 들면, 오시키리(押切), 에바라(江原), 요시다 (吉田), "피치 필터링에 기초한 스펙트럼 부호화를 이용한 초광대역 스케일러블 음성 부호화의 개선", 2004년 추계 음(音) 강론집 2-4-13, pp.297-298, 2004년 9월, 참조). 이 기술에서는, 저역부의 스펙트럼을 어떻게 변형했는지를 나타내는 변형 정보를 음성 부호화 장치로부터 음성 복호화 장치에 송신할 필요가 있다.
여기서, 음성 부호화 장치에 있어서 이 변형 정보를 부호화할 때에, 부호화 후보의 수(數)가 충분하지 않을 경우, 즉, 저비트레이트일 경우에는 커다란 양자화 오차가 발생한다. 그리고, 이러한 커다란 양자화 오차가 발생하면, 그 양자화 오차에 기인하여 저역부 스펙트럼의 다이내믹 레인지의 조정이 충분히 행해지지 않아, 그 결과 품질 열화를 초래하는 일이 있다. 특히, 고역부 스펙트럼의 다이내믹 레인지보다 큰 다이내믹 레인지를 나타내는 부호화 후보가 선택되었을 경우, 고역부의 스펙트럼에 과대한 피크가 발생하기 쉬워져, 품질 열화가 현저하게 발생하는 일이 있다.
그래서, 본 실시예에서는, 저역부 스펙트럼의 다이내믹 레인지를 고역부 스펙트럼의 다이내믹 레인지에 접근시키는 기술을 상기 각 실시예에 적용할 경우에 있어서, 제 2 레이어 부호화부(108)가 변형 정보를 부호화할 때에, 다이내믹 레인지가 작아지는 부호화 후보를 다이내믹 레인지가 커지는 부호화 후보보다 선택되기 쉽도록 한다.
도 22에, 본 발명의 실시예 6에 따른 제 2 레이어 부호화부(108)의 구성을 나타낸다. 도 22에 있어서, 실시예 1(도 7)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
도 22에 나타내는 제 2 레이어 부호화부(108)에 있어서, 스펙트럼 변형부(1087)에는, 제 1 레이어 복호화부(107)로부터 제 1 레이어 복호 스펙트럼 S1(k)(0≤k〈FL)가 입력되고, 주파수 영역 변환부(105)로부터 잔차스펙트럼 S2(k)(0≤k〈FH)가 입력된다. 스펙트럼 변형부(1087)는, 복호 스펙트럼 S1(k)의 다이내믹 레인지를 적절한 다이내믹 레인지로 하기 위해, 복호 스펙트럼 S1(k)를 변형시켜 복호 스펙트럼 S1(k)의 다이내믹 레인지를 변화시킨다. 그리고, 스펙트럼 변형부(1087)는, 복호 스펙트럼 S1(k)를 어떻게 변형했는지를 나타내는 변형 정보를 부호화하여 다중화부(1086)에 출력한다. 또, 스펙트럼 변형부(1087)는, 변형 후의 복호 스펙트럼(변형 복호 스펙트럼) S1'(j, k)를 내부 상태 설정부(1081)에 출력한다.
스펙트럼 변형부(1087)의 구성을 도 23에 나타낸다. 스펙트럼 변형부(1087)는, 복호 스펙트럼 S1(k)를 변형하여 복호 스펙트럼 S1(k)의 다이내믹 레인지를 잔차스펙트럼 S2(k)의 고역부(FL≤k〈FH)의 다이내믹 레인지에 접근시킨다. 또, 스펙트럼 변형부(1087)는, 변형 정보를 부호화하여 출력한다.
도 23에 나타내는 스펙트럼 변형부(1087)에 있어서, 변형 스펙트럼 생성부(1101)는, 복호 스펙트럼 S1(k)를 변형해 변형 복호 스펙트럼 S1'(j, k)를 생성하여, 서브밴드 에너지 산출부(1102)에 출력한다. 여기서, j는 코드북(1111)의 각 부호화 후보(각 변형 정보)를 식별하기 위한 인덱스이며, 변형 스펙트럼 생성부(1101)에서는, 코드북(1111)에 포함되는 각 부호화 후보(각 변형 정보)를 이용하여 복호 스펙트럼 S1(k)의 변형이 행해진다. 여기에서는, 지수함수를 이용해 스펙 트럼 변형을 행하는 경우를 일례로 든다. 예를 들면, 코드북(1111)에 포함되는 부호화 후보를 α(j)라고 나타냈을 때, 각 부호화 후보 α(j)는 0≤α(j)≤1의 범위에 있는 것으로 한다. 따라서, 변형 복호 스펙트럼 S1'(j, k)는, 수학식 15와 같이 표시된다.
Figure 112008022732660-PCT00015
여기서, sign()은 양(+) 또는 음(-)의 부호를 돌려주는 함수를 나타낸다. 따라서, 부호화 후보 α(j)가 0에 가까운 값을 취할수록 변형 복호 스펙트럼 S1'(j, k)의 다이내믹 레인지는 작아진다.
서브밴드 에너지 산출부(1102)는, 변형 복호 스펙트럼 S1'(j, k)의 주파수대역을 복수의 서브밴드로 분할하고, 각 서브밴드의 평균 에너지(서브밴드 에너지) P1(j, n)을 구하여 분산 산출부(1103)에 출력한다. 여기서 n은 서브밴드 번호를 나타낸다.
분산 산출부(1103)는, 서브밴드 에너지 P1(j, n)의 격차 정도를 나타내기 위해, 서브밴드 에너지 P1(j, n)의 분산 σ1(j)2을 구한다. 그리고, 분산 산출부(1103)는, 부호화 후보(변형 정보) j에 있어서의 분산 σ1(j)2을 감산부(1106)에 출력한다.
한편, 서브밴드 에너지 산출부(1104)는, 잔차스펙트럼 S2(k)의 고역부를 복수의 서브밴드로 분할하고, 각 서브밴드의 평균 에너지(서브밴드 에너지) P2(n)을 구해 분산 산출부(1105)에 출력한다.
분산 산출부(1105)는, 서브밴드 에너지 P2(n)의 격차 정도를 나타내기 위해, 서브밴드 에너지 P2(n)의 분산 σ22을 구하여 감산부(1106)에 출력한다.
감산부(1106)는, 분산 σ22으로부터 분산 σ1(j)2을 빼고, 이 감산에 의해 얻어지는 오차 신호를 판정부(1107) 및 가중오차 산출부(1108)에 출력한다.
판정부(1107)는, 오차 신호의 부호(양 또는 음)를 판정하고, 판정 결과에 기초하여, 가중오차 산출부(1108)에 줄 가중치(웨이트)를 결정한다. 판정부(1107)는, 오차 신호의 부호가 양(+)일 경우에는 wpos를, 음(-)일 경우에는 wneg를 가중치로서 선택하여, 가중오차 산출부(1108)에 출력한다. wpos와 wneg의 사이에는 수학식 16에 나타내는 대소(大小) 관계가 있다.
Figure 112008022732660-PCT00016
가중오차 산출부(1108)는, 우선, 감산부(1106)로부터 입력되는 오차 신호의 제곱값을 산출하고, 다음에, 판정부(1107)로부터 입력되는 가중치 w(wpos 또는 wneg)를 오차 신호의 제곱값을 곱하여 가중제곱오차 E를 산출하여, 탐색부(1109)에 출력한다. 가중제곱오차 E는 수학식 17과 같이 표시된다.
Figure 112008022732660-PCT00017
탐색부(1109)는, 코드북(1111)을 제어하여 코드북(1111)에 저장되어 있는 부호화 후보(변형 정보)를 순차적으로 변형 스펙트럼 생성부(1101)에 출력시켜, 가중제곱오차 E가 최소가 되는 부호화 후보(변형 정보)를 탐색한다. 그리고, 탐색부(1109)는, 가중치 제곱오차 E가 최소가 되는 부호화 후보의 인덱스 jopt를 최적 변형 정보로서 변형 스펙트럼 생성부(1110) 및 다중화부(1086)에 출력한다.
변형 스펙트럼 생성부(1110)는, 복호 스펙트럼 S1(k)를 변형하여 최적 변형 정보 jopt에 대응하는 변형 복호 스펙트럼 S1'(jopt, k)를 생성하여, 내부 상태 설정부(1081)에 출력한다.
그 다음에, 본 실시예에 따른 음성 복호화 장치의 제 2 레이어 복호화부(203)에 대해 설명한다. 도 24에, 본 발명의 실시예 6에 따른 제 2 레이어 복호화부(203)의 구성을 나타낸다. 도 24에 있어서, 실시예 1(도 10)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
제 2 레이어 복호화부(203)에 있어서, 변형 스펙트럼 생성부(2036)는, 분리부(2032)로부터 입력되는 최적 변형 정보 jopt를 기초로, 제 1 레이어 복호화부(202)로부터 입력되는 제 1 레이어 복호 스펙트럼 S1(k)를 변형해 변형 복호 스펙트럼 S1'(jopt, k)를 생성하여, 내부 상태 설정부(2031)에 출력한다. 즉, 변형 스펙트럼 생성부(2036)는, 음성 부호화 장치측의 변형 스펙트럼 생성부(1110)에 대응하여 구비되며, 변형 스펙트럼 생성부(1110)와 동일한 처리를 행한다.
상기와 같이, 가중제곱오차를 산출할 때의 가중치를 오차 신호의 부호에 따라 결정하고, 또, 그 가중치가 수학식 16에 나타내는 관계가 있을 때, 다음과 같이 말할 수 있다.
즉, 오차 신호가 양(+)인 경우란, 변형 복호 스펙트럼 S1'의 격차 정도가 목표값인 잔차스펙트럼 S2의 격차 정도보다 작아지는 경우이다. 즉 이것은, 음성 복호화 장치측에서 생성되는 변형 복호 스펙트럼 S1'의 다이내믹 레인지가 잔차스펙트럼 S2의 다이내믹 레인지보다 작아지는 것에 상당한다.
한편, 오차 신호가 음(-)인 경우란, 변형 복호 스펙트럼 S1'의 격차 정도가 목표값인 잔차스펙트럼 S2의 격차 정도보다 커지는 경우이다. 즉 이것은, 음성 복호화 장치측에서 생성되는 변형 복호 스펙트럼 S1'의 다이내믹 레인지가 잔차스펙트럼 S2의 다이내믹 레인지보다 커지는 것에 상당한다.
따라서, 수학식 16에 나타내는 바와 같이 오차 신호가 양일 경우의 가중치 wpos를 오차 신호가 음일 경우의 가중치 wneg보다 작게 설정함으로써, 제곱오차가 동일한 정도의 값일 때, 잔차스펙트럼 S2의 다이내믹 레인지보다 작은 다이내믹 레인지가 되는 변형 복호 스펙트럼 S1'를 생성하는 부호화 후보가 선택되기 쉬워진다. 즉, 다이내믹 레인지를 억제하는 부호화 후보가 우선적으로 선택되게 된다. 따라서, 음성 복호화 장치에서 생성되는 추정 스펙트럼의 다이내믹 레인지가 잔차스펙 트럼의 고역부의 다이내믹 레인지보다 커지는 빈도가 감소한다.
여기서, 변형 복호 스펙트럼 S1'의 다이내믹 레인지가, 목표가 되는 스펙트럼의 다이내믹 레인지보다 커지면, 음성 복호화 장치에서는 추정 스펙트럼에 과대한 피크가 출현하여 인간의 귀에 품질 열화로서 지각되기 쉬워지는데 비해, 변형 복호 스펙트럼 S1'의 다이내믹 레인지가 목표가 되는 스펙트럼의 다이내믹 레인지보다 작아지면, 음성 복호화 장치에서는 추정 스펙트럼에 상기와 같이 과대한 피크가 발생하기 어려워진다. 따라서, 본 실시예에 의하면, 저역부의 스펙트럼의 다이내믹 레인지를 고역부 스펙트럼의 다이내믹 레인지에 맞추는 기술을 실시예 1에 적용할 경우에 있어서, 청감적인 음질의 열화를 방지할 수 있다.
또한, 상기 설명에서는, 스펙트럼 변형 방법으로서 지수함수를 이용한 것을 일례로 들었지만, 이것으로 한정되지 않으며, 예를 들면 대수관계를 이용한 스펙트럼 변형 등, 다른 스펙트럼 변형 방법을 이용해도 좋다.
또, 상기 설명에서는 서브밴드의 평균 에너지의 분산을 이용하는 경우에 대해 설명했지만, 스펙트럼의 다이내믹 레인지의 크기를 나타내는 지표이기만 하다면, 서브밴드의 평균 에너지 분산에 한정되는 것은 아니다.
(실시예 7)
도 25에, 본 발명의 실시예 7에 따른 스펙트럼 변형부(1087)의 구성을 나타낸다. 도 25에 있어서, 실시예 6(도 23)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
도 25에 나타내는 스펙트럼 변형부(1087)에 있어서, 격차도(隔差度) 산출부(1112-1)는, 복호 스펙트럼 S1(k)의 저역부의 값의 분포로부터 복호 스펙트럼 S1(k)의 격차도를 산출하여, 임계값 설정부(1113-1, 1113-2)에 출력한다. 격차도란, 구체적으로는 복호 스펙트럼 S1(k)의 표준 편차 σ1이다.
임계값 설정부(1113-1)는, 표준 편차 σ1을 이용해 제 1 임계값 TH1을 구하여 평균 스펙트럼 산출부(1114-1) 및 변형 스펙트럼 생성부(1110)에 출력한다. 여기서, 제 1 임계값 TH1이란, 복호 스펙트럼 S1(k) 중 비교적 진폭이 큰 스펙트럼을 특정하기 위한 임계값으로서, 표준 편차 σ1에 소정의 정수 a를 곱한 값이 사용된다.
임계값 설정부(1113-2)는, 표준 편차 σ1을 이용해 제 2 임계값 TH2를 구하여 평균 스펙트럼 산출부(1114-2) 및 변형 스펙트럼 생성부(1110)에 출력한다. 여기서, 제 2 임계값 TH2란, 복호 스펙트럼 S1(k)의 저역부 중 비교적 진폭이 작은 스펙트럼을 특정하기 위한 임계값으로서, 표준 편차 σ1에 소정의 정수 b(〈a)를 곱한 값이 사용된다.
평균 스펙트럼 산출부(1114-1)는, 제 1 임계값 TH1보다 진폭이 큰 스펙트럼의 평균 진폭값(이하, 제 1 평균값이라고 함)을 구하여, 변형 벡터 산출부(1115)에 출력한다. 구체적으로는, 평균 스펙트럼 산출부(1114-1)는, 복호 스펙트럼 S1(k)의 저역부 스펙트럼의 값을, 복호 스펙트럼 S1(k)의 평균값 m1에 제 1 임계값 TH1을 더한 값 (m1+TH1)과 비교하고, 이 값보다 큰 값을 가지는 스펙트럼을 특정한다(스텝 1). 다음에, 평균 스펙트럼 산출부(1114-1)는, 복호 스펙트럼 S1(k)의 저역 부 스펙트럼의 값을, 복호 스펙트럼 S1(k)의 평균값 m1로부터 제 1 임계값 TH1을 뺀 값 (m1-TH1)과 비교하고, 이 값보다 작은 값을 가지는 스펙트럼을 특정한다(스텝 2). 그리고, 평균 스펙트럼 산출부(1114-1)는, 스텝 1 및 스텝 2의 양쪽에서 구해진 스펙트럼의 진폭의 평균값을 구해, 변형 벡터 산출부(1115)에 출력한다.
평균 스펙트럼 산출부(1114-2)는, 제 2 임계값 TH2보다 진폭이 작은 스펙트럼의 평균 진폭값(이하, 제 2 평균값이라고 함)을 구하여, 변형 벡터 산출부(1115)에 출력한다. 구체적으로는, 평균 스펙트럼 산출부(1114-2)는, 복호 스펙트럼 S1(k)의 저역부의 스펙트럼의 값을, 복호 스펙트럼 S1(k)의 평균값 m1에 제 2 임계값 TH2를 더한 값 (m1+TH2)과 비교하고, 이 값보다 작은 값을 가지는 스펙트럼을 특정한다(스텝 1). 다음에, 평균 스펙트럼 산출부(1114-2)는, 복호 스펙트럼 S1(k)의 저역부의 스펙트럼의 값을, 복호 스펙트럼 S1(k)의 평균값 m1로부터 제 2 임계값 TH2를 뺀 값 (m1-TH2)와 비교하고, 이 값보다 큰 값을 가지는 스펙트럼을 특정한다(스텝 2). 그리고, 평균 스펙트럼 산출부(1114-2)는, 스텝 1 및 스텝 2의 양쪽에서 구해진 스펙트럼의 진폭의 평균값을 구해 변형 벡터 산출부(1115)에 출력한다.
한편, 격차도 산출부(1112-2)는, 잔차스펙트럼 S2(k)의 고역부 값의 분포로부터 잔차스펙트럼 S2(k)의 격차도를 산출하여, 임계값 설정부(1113-3, 1113-4)에 출력한다. 격차도란, 구체적으로는 잔차스펙트럼 S2(k)의 표준 편차 σ2이다.
임계값 설정부(1113-3)는, 표준 편차 σ2를 이용해 제 3 임계값 TH3을 구하여 평균 스펙트럼 산출부(1114-3)에 출력한다. 여기서, 제 3 임계값 TH3이란, 잔 차스펙트럼 S2(k)의 고역부 중 비교적 진폭이 큰 스펙트럼을 특정하기 위한 임계값으로서, 표준 편차 σ2에 소정의 정수 c를 곱한 값이 사용된다.
임계값 설정부(1113-4)는, 표준 편차 σ2를 이용하여 제 4 임계값 TH4를 구하여 평균 스펙트럼 산출부(1114-4)에 출력한다. 여기서, 제 4 임계값 TH4란, 잔차스펙트럼 S2(k)의 고역부 중 비교적 진폭이 작은 스펙트럼을 특정하기 위한 임계값으로서, 표준 편차 σ2에 소정의 정수 d(〈c)를 곱한 값이 사용된다.
평균 스펙트럼 산출부(1114-3)는, 제 3 임계값 TH3보다 진폭이 큰 스펙트럼의 평균 진폭값(이하, 제 3 평균값이라고 함)을 구해 변형 벡터 산출부(1115)에 출력한다. 구체적으로는, 평균 스펙트럼 산출부(1114-3)는, 잔차스펙트럼 S2(k)의 고역부의 스펙트럼의 값을, 잔차스펙트럼 S2(k)의 평균값 m3에 제 3 임계값 TH3을 더한 값 (m3+TH3)과 비교하고, 이 값보다 큰 값을 가지는 스펙트럼을 특정한다(스텝 1). 다음에, 평균 스펙트럼 산출부(1114-3)는, 잔차스펙트럼 S2(k)의 고역부의 스펙트럼의 값을, 잔차스펙트럼 S2(k)의 평균값 m3으로부터 제 3 임계값 TH3을 뺀 값 (m3-TH3)과 비교하고, 이 값보다 작은 값을 가지는 스펙트럼을 특정한다(스텝 2). 그리고, 평균 스펙트럼 산출부(1114-3)는, 스텝 1 및 스텝 2의 양쪽에서 구해진 스펙트럼의 진폭의 평균값을 구해, 변형 벡터 산출부(1115)에 출력한다.
평균 스펙트럼 산출부(1114-4)는, 제 4 임계값 TH4보다 진폭이 작은 스펙트럼의 평균 진폭값(이하, 제 4 평균값이라고 함)을 구해, 변형 벡터 산출부(1115)에 출력한다. 구체적으로는, 평균 스펙트럼 산출부(1114-4)는, 잔차스펙트럼 S2(k)의 고역부의 스펙트럼의 값을, 잔차스펙트럼 S2(k)의 평균값 m3에 제 4 임계값 TH4를 더한 값 (m3+TH4)와 비교하고, 이 값보다 작은 값을 가지는 스펙트럼을 특정한다(스텝 1). 다음에, 평균 스펙트럼 산출부(1114-4)는, 잔차스펙트럼 S2(k)의 고역부의 스펙트럼의 값을, 잔차스펙트럼 S2(k)의 평균값 m3으로부터 제 4 임계값 TH4를 뺀 값 (m3-TH4)와 비교하고, 이 값보다 큰 값을 가지는 스펙트럼을 특정한다(스텝 2). 그리고, 평균 스펙트럼 산출부(1114-4)는, 스텝 1 및 스텝 2의 양쪽에서 구해진 스펙트럼의 진폭의 평균값을 구하여, 변형 벡터 산출부(1115)에 출력한다.
변형 벡터 산출부(1115)는, 제 1 평균값, 제 2 평균값, 제 3 평균값 및 제 4 평균값을 이용하여, 이하와 같이 하여 변형 벡터를 산출한다.
즉, 변형 벡터 산출부(1115)는, 제 3 평균값과 제 1 평균값의 비(이하, 제 1 게인이라고 함), 및 제 4 평균값과 제 2 평균값의 비(이하, 제 2 게인이라고 함)를 산출하여, 제 1 게인 및 제 2 게인을 변형 벡터로서 감산부(1106)에 출력한다. 이하, 변형 벡터를 g(i)(i=1, 2)라고 표기한다. 즉, g(1)은 제 1 게인을 나타내고, g(2)는 제 2 게인을 나타낸다.
감산부(1106)는, 변형 벡터 g(i)로부터, 변형 벡터 코드북(1116)에 속하는 부호화 후보를 빼고, 이 감산에 의해 얻어지는 오차 신호를 판정부(1107) 및 가중오차 산출부(1108)에 출력한다. 이하, 부호화 후보를 v(j, i)라고 표시한다. 여기서, j는 변형 벡터 코드북(1116)의 각 부호화 후보(각 변형 정보)를 식별하기 위한 인덱스이다.
판정부(1107)는, 오차 신호의 부호(양 또는 음)를 판정하고, 판정 결과를 기초로, 가중오차 산출부(1108)에 줄 가중치(웨이트)를 제 1 게인 g(1), 제 2 게인 g(2)마다 결정한다. 판정부(1107)는, 제 1 게인 g(1)에 대해서는, 오차 신호의 부호가 양일 경우에는 wlight를, 음일 경우에는 wheavy를 가중치로서 선택하여, 가중오차 산출부(1108)에 출력한다. 한편, 제 2 게인 g(2)에 대해서는, 판정부(1107)는, 오차 신호의 부호가 양일 경우에는 wheavy를, 음일 경우에는 wlight를 가중치로서 선택하여, 가중오차 산출부(1108)에 출력한다. wlight와 wheavy의 사이에는 수학식 18에 나타내는 대소 관계가 있다.
Figure 112008022732660-PCT00018
가중오차 산출부(1108)는, 우선, 감산부(1106)로부터 입력되는 오차 신호의 제곱값을 산출하고, 다음에, 오차 신호의 제곱값과, 제 1 게인 g(1), 제 2 게인 g(2)마다 판정부(1107)로부터 입력되는 가중치 w(wlight 또는 wheavy)를 곱하여 합해 가중제곱오차 E를 산출하여, 탐색부(1109)에 출력한다. 가중제곱오차 E는 수학식 19와 같이 표시된다.
Figure 112008022732660-PCT00019
탐색부(1109)는, 변형 벡터 코드북(1116)을 제어하여 변형 벡터 코드북(1116)에 저장되어 있는 부호화 후보(변형 정보)를 순차적으로 감산부(1106)에 출력시켜, 가중제곱오차 E가 최소가 되는 부호화 후보(변형 정보)를 탐색한다. 그 리고, 탐색부(1109)는, 가중제곱오차 E가 최소가 되는 부호화 후보의 인덱스 jopt를 최적 변형 정보로서 변형 스펙트럼 생성부(1110) 및 다중화부(1086)에 출력한다.
변형 스펙트럼 생성부(1110)는, 제 1 임계값 TH1, 제 2 임계값 TH2 및 최적 변형 정보 jopt를 이용해 복호 스펙트럼 S1(k)를 변형하여 최적 변형 정보 jopt에 대응하는 변형 복호 스펙트럼 S1'(jopt, k)를 생성하여, 내부 상태 설정부(1081)에 출력한다.
변형 스펙트럼 생성부(1110)는, 우선, 최적 변형 정보 jopt를 이용하여 제 3 평균값과 제 1 평균값의 비(比)의 복호값(이하, 복호 제 1 게인이라고 함), 및 제 4 평균값과 제 2 평균값의 비의 복호값(이하, 복호 제 2 게인이라고 함)을 생성한다.
다음에, 변형 스펙트럼 생성부(1110)는, 복호 스펙트럼 S1(k)의 진폭값과 제 1 임계값 TH1을 비교하고, 제 1 임계값 TH1보다 진폭이 큰 스펙트럼을 특정하고, 이러한 스펙트럼에 복호 제 1 게인을 곱해 변형 복호 스펙트럼 S1'(jopt, k)를 생성한다. 마찬가지로, 변형 스펙트럼 생성부(1110)는, 복호 스펙트럼 S1(k)의 진폭값과 제 2 임계값 TH2를 비교하여, 제 2 임계값 TH2보다 진폭이 작은 스펙트럼을 특정하고, 이러한 스펙트럼에 복호 제 2 게인을 곱해 변형 복호 스펙트럼 S1'(jopt, k)를 생성한다.
또한, 복호 스펙트럼 S1(k) 중, 제 1 임계값 TH1과 제 2 임계값 TH2에 끼인 영역에 속하는 스펙트럼에 대해서는, 부호화 정보가 존재하지 않는다. 그래서, 변형 스펙트럼 생성부(1110)는, 복호 제 1 게인과 복호 제 2 게인의 중간적인 값을 가지는 게인을 사용한다. 예를 들면, 변형 스펙트럼 생성부(1110)는, 복호 제 1 게인과, 복호 제 2 게인과, 제 1 임계값 TH1과, 제 2 임계값 TH2에 기초하는 특성 곡선으로부터, 어떤 진폭 x에 대응하는 복호 게인 y를 구하고, 이 게인을 복호 스펙트럼 S1(k)의 진폭에 곱한다. 즉, 복호 게인 y는, 복호 제 1 게인 및 복호 제 2 게인의 선형 보간값으로 되어 있다.
이와 같이 하여 본 실시예에 의하면, 실시예 6과 동일한 작용ㆍ효과를 얻을 수 있다.
(실시예 8)
도 26에, 본 발명의 실시예 8에 따른 스펙트럼 변형부(1087)의 구성을 나타낸다. 도 26에 있어서, 실시예 6(도 23)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
도 26에 나타내는 스펙트럼 변형부(1087)에 있어서, 수정부(1117)에는, 분산 산출부(1105)로부터 분산 σ22이 입력된다.
수정부(1117)는, 분산 σ22의 값을 작게 하는 수정 처리를 실시하여 감산부(1106)에 출력한다. 구체적으로는, 수정부(1117)는, 0 이상 1 미만의 값을 분산 σ22에 곱한다.
감산부(1106)는, 수정 처리 후의 분산으로부터 분산 σ1(j)2을 빼고, 이 감산에 의해 얻어지는 오차 신호를 오차 산출부(1118)에 출력한다.
오차 산출부(1118)는, 감산부(1106)로부터 입력되는 오차 신호의 제곱값(제곱오차)을 산출하여, 탐색부(1109)에 출력한다.
탐색부(1109)는, 코드북(1111)을 제어하여 코드북(1111)에 저장되어 있는 부호화 후보(변형 정보)를 순차적으로 변형 스펙트럼 생성부(1101)에 출력시켜, 제곱오차가 최소가 되는 부호화 후보(변형 정보)를 탐색한다. 그리고, 탐색부(1109)는, 제곱오차가 최소가 되는 부호화 후보의 인덱스 jopt를 최적 변형 정보로서 변형 스펙트럼 생성부(1110) 및 다중화부(108)6에 출력한다.
이와 같이, 본 실시예에 의하면, 수정부(1117)에서의 수정 처리에 의해, 탐색부(1109)에서는, 수정 처리 후의 분산, 즉 값이 작아진 분산을 목표값으로 한 부호화 후보의 탐색이 행해지게 된다. 따라서, 음성 복호화 장치에서는, 추정 스펙트럼의 다이내믹 레인지가 억제 당하게 되기 때문에, 상기와 같은 과대한 피크의 발생 빈도를 한층 더 감소할 수 있다.
또한, 수정부(1117)에서는, 입력 음성 신호의 특성에 따라 분산 σ22에 곱하는 값을 변화시켜도 괜찮다. 그 특성으로서는, 입력 음성 신호의 피치 주기성의 세기를 이용하는 것이 적당하다. 즉, 수정부(1117)는, 입력 음성 신호의 피치 주기성이 약할 때(예를 들면, 피치 게인이 작을 때)에는 분산 σ22에 곱하는 값을 큰 값으로 하고, 입력 음성 신호의 피치 주기성이 강한 경우(예를 들면, 피치 게인이 클 경우)에는 분산 σ22 에 곱하는 값을 작은 값으로 해도 좋다. 이러한 적응화에 의해, 피치 주기성이 강한 신호(예를 들면 모음부)에 대해서만 과대한 스펙트럼 피크가 생기기 어려워져, 그 결과, 청감적인 음질을 개선할 수 있다.
(실시예 9)
도 27에, 본 발명의 실시예 9에 따른 스펙트럼 변형부(1087)의 구성을 나타낸다. 도 27에 있어서, 실시예 7(도 25)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
도 27에 나타내는 스펙트럼 변형부(1087)에 있어서, 수정부(1117)에는, 변형 벡터 산출부(1115)로부터 변형 벡터 g(i)가 입력된다.
수정부(1117)는, 제 1 게인 g(1)의 값을 작게 하는 수정 처리 및 제 2 게인 g(2)의 값을 크게 하는 수정 처리의 적어도 한쪽을 실시하여 감산부(1106)에 출력한다. 구체적으로는, 수정부(1117)는, 0 이상 1 미만의 값을 제 1 게인 g(1)에 곱하고, 1보다 큰 값을 제 2 게인 g(2)에 곱한다.
감산부(1106)는, 수정 처리 후의 변형 벡터로부터, 변형 벡터 코드북(1116)에 속하는 부호화 후보를 빼고, 이 감산에 의해 얻어지는 오차 신호를 오차 산출부(1118)에 출력한다.
오차 산출부(1118)는, 감산부(1106)로부터 입력되는 오차 신호의 제곱값(제 곱오차)을 산출하여, 탐색부(1109)에 출력한다.
탐색부(1109)는, 변형 벡터 코드북(1116)을 제어하여 변형 벡터 코드북(1116)에 저장되어 있는 부호화 후보(변형 정보)를 순차적으로 감산부(1106)에 출력시켜, 제곱오차가 최소가 되는 부호화 후보(변형 정보)를 탐색한다. 그리고, 탐색부(1109)는, 제곱오차가 최소가 되는 부호화 후보의 인덱스 jopt를 최적 변형 정보로서 변형 스펙트럼 생성부(1110) 및 다중화부(1086)에 출력한다.
이와 같이, 본 실시예에 의하면, 수정부(1117)에서의 수정 처리에 의해, 탐색부(1109)에서는, 수정 처리 후의 변형 벡터, 즉 다이내믹 레인지를 작게 하는 변형 벡터를 목표값으로 한 부호화 후보의 탐색이 행해지게 된다. 따라서, 음성 복호화 장치에서는, 추정 스펙트럼의 다이내믹 레인지가 억제 당하게 되기 때문에, 상기와 같은 과대한 피크의 발생 빈도를 한층 더 감소할 수 있다.
또한, 본 실시예에 있어서도 실시예 8과 마찬가지로, 수정부(1117)에서는, 입력 음성 신호의 특성에 따라 변형 벡터 g(i)에 곱하는 값을 변화시켜도 좋다. 이러한 적응화에 의해, 실시예 8과 마찬가지로, 피치 주기성이 강한 신호(예를 들면 모음부)에 대해서만 과대한 스펙트럼 피크가 생기기 어려워져서, 그 결과, 청감적인 음질을 개선할 수 있다.
(실시예 10)
도 28에, 본 발명의 실시예 10에 따른 제 2 레이어 부호화부(108)의 구성을 나타낸다. 도 28에 있어서, 실시예 6(도 22)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
도 28에 나타내는 제 2 레이어 부호화부(108)에 있어서, 스펙트럼 변형부(1088)에는, 주파수 영역 변환부(105)로부터 잔차스펙트럼 S2(k)가 입력되고, 탐색부(1083)로부터 잔차스펙트럼의 추정값(추정 잔차스펙트럼) S2'(k)가 입력된다.
스펙트럼 변형부(1088)는, 잔차스펙트럼 S2(k)의 고역부의 다이내믹 레인지를 참조하여 추정잔차스펙트럼 S2'(k)를 변형시켜 추정 잔차스펙트럼 S2'(k)의 다이내믹 레인지를 변화시킨다. 그리고, 스펙트럼 변형부(1088)는, 추정 잔차스펙트럼 S2'(k)를 어떻게 변형했는지를 나타내는 변형 정보를 부호화하여 다중화부(1086)에 출력한다. 또, 스펙트럼 변형부(1088)는, 변형 후의 추정잔차스펙트럼(변형잔차스펙트럼)을 게인 부호화부(1085)에 출력한다. 또한, 스펙트럼 변형부(1088)의 내부 구성은, 스펙트럼 변형부(1087)와 동일하기 때문에, 자세한 설명은 생략한다.
게인 부호화부(1085)에서의 처리는, 실시예 1에 있어서의 「잔차 스펙트럼의 추정값 S2'(k)」를 「변형잔차스펙트럼」이라고 바꾸어 읽었을 뿐이기 때문에, 자세한 설명은 생략한다.
그 다음에, 본 실시예에 따른 음성 복호화 장치의 제 2 레이어 복호화부(203)에 대해 설명한다. 도 29에, 본 발명의 실시예 10에 따른 제 2 레이어 복호화부(203)의 구성을 나타낸다. 도 29에 있어서, 실시예 6(도 24)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
제 2 레이어 복호화부(203)에 있어서, 변형 스펙트럼 생성부(2037)는, 분리부(2032)로부터 입력되는 최적 변형 정보 jopt, 즉, 변형 잔차스펙트럼에 관한 최적 변형 정보 jopt에 기초하여, 필터링부(2033)로부터 입력되는 복호 스펙트럼 S'(k)를 변형하여 스펙트럼 조정부(2035)에 출력한다. 즉, 변형 스펙트럼 생성부(2037)는, 음성 부호화 장치측의 스펙트럼 변형부(1088)에 대응하여 구비되어, 스펙트럼 변형부(1088)와 동일한 처리를 행한다.
이와 같이, 본 실시예에 의하면, 복호 스펙트럼 S1(k)뿐만 아니라 추정 잔차스펙트럼 S2'(k)도 변형시키기 때문에, 보다 적절한 다이내믹 레인지를 가지는 추정 잔차스펙트럼을 생성할 수 있다.
(실시예 11)
도 30에, 본 발명의 실시예 11에 따른 제 2 레이어 부호화부(108)의 구성을 나타낸다. 도 30에 있어서, 실시예 6(도 22)와 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
도 30에 나타내는 제 2 레이어 부호화부(108)에 있어서, 스펙트럼 변형부(1087)는, 음성 복호화 장치와 공유하는 소정의 변형 정보에 따라 복호 스펙트럼 S1(k)를 변형시켜 복호 스펙트럼 S1(k)의 다이내믹 레인지를 변화시킨다. 그리고, 스펙트럼 변형부(1087)는, 변형 복호 스펙트럼 S1'(j, k)를 내부 상태 설정부(1081)에 출력한다.
그 다음에, 본 실시예에 따른 음성 복호화 장치의 제 2 레이어 복호화부(203)에 대해 설명한다. 도 31에, 본 발명의 실시예 11에 따른 제 2 레이어 복호화부(203)의 구성을 나타낸다. 도 31에 있어서, 실시예 6(도 24)과 동일한 구성 부분에는 동일 부호를 붙이며, 설명을 생략한다.
제 2 레이어 복호화부(203)에 있어서, 변형 스펙트럼 생성부(2036)는, 음성 부호화 장치와 공유하는 소정의 변형 정보, 즉, 도 30의 스펙트럼 변형부(1087)가 사용한 소정의 변형 정보와 동일한 변형 정보에 따라, 제 1 레이어 복호화부(202)로부터 입력되는 제 1 레이어 복호 스펙트럼 S1(k)를 변형하여 내부 상태 설정부(2031)에 출력한다.
이와 같이, 본 실시예에 의하면, 음성 부호화 장치의 스펙트럼 변형부(1087)와 음성 복호화 장치의 변형 스펙트럼 생성부(2036)가 미리 정해진 동일한 변형 정보에 따라 변형 처리를 행하기 때문에, 음성 부호화 장치로부터 음성 복호화 장치에의 변형 정보의 송신이 불필요하게 된다. 따라서, 본 실시예에 의하면, 실시예 6에 비해, 비트레이트를 저감시킬 수 있다.
또한, 도 28에 나타내는 스펙트럼 변형부(1088)와 도 29에 나타내는 변형 스펙트럼 생성부(2037)가 미리 정해진 동일한 변형 정보에 따라 변형 처리를 행하여도 좋다. 이에 의해, 비트레이트를 한층 더 저감시킬 수 있다.
(실시예 12)
실시예 10에 있어서의 제 2 레이어 부호화부(108)가, 스펙트럼 변형부(1087) 를 가지지 않는 구성을 취하는 것도 가능하다. 그래서, 실시예 12로서 이 경우의 제 2 레이어 부호화부(108)의 구성을 도 32에 나타낸다.
또, 제 2 레이어 부호화부(108)가 스펙트럼 변형부(1087)를 가지지 않을 경우, 음성 복호화 장치에 있어서도, 스펙트럼 변형부(1087)에 대응하는 변형 스펙트럼 생성부(2036)가 필요 없게 된다. 그래서, 실시예 12로서 이 경우의 제 2 레이어 복호화부(203)의 구성을 도 33에 나타낸다.
이상, 본 발명의 실시예에 대해서 설명했다.
또한, 실시예 6~12에 따른 제 2 레이어 부호화부(108)는, 실시예 2(도 11), 실시예 3(도 13), 실시예 4(도 15), 실시예 5(도 17, 15, 16) 에 있어서도 이용할 수 있다. 다만, 실시예 4, 5(도 15, 13, 15, 16)에서는, 제 1 레이어 복호 신호를 업 샘플링한 후에 주파수 영역 변환을 실시하고 있기 때문에, 제 1 레이어 복호 스펙트럼 S1(k)의 주파수 대역은 0≤k〈FH가 된다. 그러나, 단순하게 업 샘플링한 후에 주파수 영역으로의 변환을 행하고 있기 때문에, 대역 FL≤k〈FH에는 유효한 신호 성분이 포함되지 않는다. 따라서, 이러한 실시예에 있어서도, 제 1 레이어 복호 스펙트럼 S1(k)의 대역을 0≤k〈FL로 취급할 수 있다.
또, 실시예 6~12에 따른 제 2 레이어 부호화부(108)는, 실시예 2~5에 기재한 음성 부호화 장치 이외의 음성 부호화 장치의 제 2 레이어에 있어서의 부호화에도 이용할 수 있다.
또, 상기 실시예에 있어서는, 제 2 레이어 부호화부(108) 내에 있어서 다중화부(1086)에서 피치 계수나 인덱스 등을 다중화하여 제 2 레이어 부호화 데이터로 서 출력한 후, 다중화부(109)에서 제 1 레이어 부호화 데이터, 제 2 레이어 부호화 데이터 및 LPC 계수 부호화 데이터를 다중화해 비트 스트림을 생성하고 있지만, 이것으로 한정되지 않으며, 제 2 레이어 부호화부(108) 내에 다중화부(1086)를 설치하지 않고, 피치 계수나 인덱스 등을 다중화부(109)에 직접 입력하여 제 1 레이어 부호화 데이터 등과의 다중화를 행하여도 좋다. 또, 제 2 레이어 복호화부(203)에 관해서도, 분리부(201)에서 비트 스트림으로부터 일단 분리되어 생성된 제 2 레이어 부호화 데이터를 제 2 레이어 복호화부(203) 내의 분리부(2032)에 입력하고, 분리부(2032)에서 다시 피치 계수나 인덱스 등으로 분리하고 있지만, 이것으로 한정되지 않으며, 제 2 레이어 복호화부(203) 내에 분리부(2032)를 설치하지 않고, 분리부(201)에서 직접 비트 스트림을 피치 계수나 인덱스 등으로 분리하여 제 2 레이어 복호화부(203)에 입력해도 괜찮다.
또, 상기 실시예에 있어서는 스케일러블 부호화의 계층수가 2인 경우를 예로 들어 설명했지만, 이것으로 한정되지 않으며, 본 발명은 3 이상의 계층을 가지는 스케일러블 부호화에도 적용할 수 있다.
또, 상기 실시예에 있어서는 제 2 레이어에 있어서의 변환 부호화의 방식으로서 MDCT를 이용하는 경우를 예로 들어 설명했지만, 이것으로 한정되지 않으며, 본 발명에서는, FFT, DFT, DCT, 필터 뱅크, Wavelet 변환 등, 다른 변환 부호화 방식을 이용할 수도 있다.
또, 상기 실시예에 있어서는 입력 신호가 음성 신호인 경우를 예로 들어 설명했지만, 이것으로 한정되지 않으며, 본 발명은 오디오 신호에도 적용할 수 있다.
또, 상기 실시예에 따른 음성 부호화 장치나 음성 복호화 장치를 이동체 통신 시스템에 있어서 사용되는 무선 통신 이동국 장치나 무선 통신 기지국 장치에 구비하여, 이동체 통신에 있어서의 음성 품질의 열화를 방지할 수 있다. 또, 무선 통신 이동국 장치는 UE, 무선 통신 기지국 장치는 Node B라고 표시되는 일이 있다.
또, 상기 실시예에서는, 본 발명을 하드웨어로 구성하는 경우를 예를 들어 설명했지만, 본 발명은 소프트웨어로 실현하는 것도 가능하다.
또, 상기 실시예의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화 되어도 괜찮고, 일부 또는 모두를 포함하도록 1칩화 되어도 괜찮다. 여기에서는, LSI라고 했지만, 집적도의 차이에 의해, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현해도 괜찮다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 괜찮다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해 LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히 그 기술을 이용해 기능 블록의 집적화를 행하여도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는, 2005년 9월 30일에 출원한 일본특허출원 제 2005-286533 호 및 2006년 7월 21 일에 출원한 일본특허출원 제 2006-199616 호에 기초하고 있는 것이다.
이 내용은 모두 여기에 포함시켜 놓는다.
본 발명은, 이동체 통신 시스템에 있어서 사용되는 무선 통신 이동국 장치나 무선 통신 기지국 장치 등의 용도에 적용할 수 있다.

Claims (13)

  1. 음성 신호의 임계값 주파수보다 낮은 대역인 저역부의 스펙트럼을 부호화 하는 제 1 부호화 수단과,
    상기 음성 신호의 스펙트럼 포락과 역(逆) 특성을 가지는 역필터를 이용해 상기 저역부의 스펙트럼을 평탄화하는 평탄화 수단과,
    평탄화된 저역부의 스펙트럼을 이용하여 상기 음성 신호의 상기 임계값 주파수보다 높은 대역인 고역부의 스펙트럼을 부호화하는 제 2 부호화 수단
    을 구비하는 음성 부호화 장치.
  2. 제 1 항에 있어서,
    상기 평탄화 수단은 상기 음성 신호의 LPC 계수를 이용하여 상기 역필터를 구성하는 음성 부호화 장치.
  3. 제 1 항에 있어서,
    상기 평탄화 수단은 상기 음성 신호의 공진(共振)의 정도에 따라 평탄화의 정도를 변화시키는 음성 부호화 장치.
  4. 제 3 항에 있어서,
    상기 평탄화 수단은 상기 공진이 강할수록 상기 평탄화의 정도를 약하게 하는 음성 부호화 장치.
  5. 제 1 항에 있어서,
    상기 제 2 부호화 수단은 상기 평탄화된 저역부의 스펙트럼을 변형시키고, 변형 후의 저역부의 스펙트럼을 이용해 상기 고역부의 스펙트럼을 부호화하는 음성 부호화 장치.
  6. 제 5 항에 있어서,
    상기 제 2 부호화 수단은 상기 평탄화된 저역부 스펙트럼의 다이내믹 레인지를 상기 고역부의 스펙트럼의 다이내믹 레인지에 접근시키는 변형을 상기 평탄화된 저역부의 스펙트럼에 실시하는 음성 부호화 장치.
  7. 제 6 항에 있어서,
    상기 제 2 부호화 수단은 복수의 부호화 후보에 있어서 다이내믹 레인지를 크게 하는 부호화 후보보다 다이내믹 레인지를 작게 하는 부호화 후보를 우선적으로 이용하여, 상기 평탄화된 저역부의 스펙트럼을 변형시키는 음성 부호화 장치.
  8. 제 7 항에 있어서,
    상기 제 2 부호화 수단은 부호화 후보 탐색용의 목표값을 작게 하는 수정을 행하고, 그 수정 후의 목표값에 기초하여, 상기 평탄화된 저역부의 스펙트럼의 변형에 이용할 부호화 후보를 상기 복수의 부호화 후보에 대해서 탐색하는 음성 부호화 장치.
  9. 제 5 항에 있어서,
    상기 제 2 부호화 수단은 상기 변형 후의 저역부의 스펙트럼으로부터 상기 고역부의 스펙트럼을 추정하고, 추정한 고역부의 스펙트럼을 변형시키고, 변형 후의 고역부의 스펙트럼을 이용해 상기 음성 신호의 고역부의 스펙트럼을 부호화하는 음성 부호화 장치.
  10. 제 1 항에 있어서,
    상기 제 2 부호화 수단은 상기 평탄화된 저역부의 스펙트럼으로부터 상기 고 역부의 스펙트럼을 추정하고, 추정한 고역부의 스펙트럼을 변형시키고, 변형 후의 고역부의 스펙트럼을 이용하여 상기 음성 신호의 고역부의 스펙트럼을 부호화하는 음성 부호화 장치.
  11. 청구항 1에 기재한 음성 부호화 장치를 구비하는 무선 통신 이동국 장치.
  12. 청구항 1에 기재한 음성 부호화 장치를 구비하는 무선 통신 기지국 장치.
  13. 음성 신호의 임계값 주파수보다 낮은 대역인 저역부의 스펙트럼을 부호화하는 제 1 부호화 공정과,
    상기 음성 신호의 스펙트럼 포락과 역 특성을 가지는 역필터를 이용해 상기 저역부의 스펙트럼을 평탄화하는 평탄화 공정과,
    평탄화된 저역부의 스펙트럼을 이용하여 상기 음성 신호의 상기 임계값 주파수보다 높은 대역인 고역부의 스펙트럼을 부호화하는 제 2 부호화 공정
    을 구비하는 음성 부호화 방법.
KR1020087007649A 2005-09-30 2006-09-29 음성 부호화 장치 및 음성 부호화 방법 KR20080049085A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2005286533 2005-09-30
JPJP-P-2005-00286533 2005-09-30
JP2006199616 2006-07-21
JPJP-P-2006-00199616 2006-07-21

Publications (1)

Publication Number Publication Date
KR20080049085A true KR20080049085A (ko) 2008-06-03

Family

ID=37899782

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087007649A KR20080049085A (ko) 2005-09-30 2006-09-29 음성 부호화 장치 및 음성 부호화 방법

Country Status (8)

Country Link
US (1) US8396717B2 (ko)
EP (1) EP1926083A4 (ko)
JP (1) JP5089394B2 (ko)
KR (1) KR20080049085A (ko)
CN (1) CN101273404B (ko)
BR (1) BRPI0616624A2 (ko)
RU (1) RU2008112137A (ko)
WO (1) WO2007037361A1 (ko)

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3336843B1 (en) * 2004-05-14 2021-06-23 Panasonic Intellectual Property Corporation of America Speech coding method and speech coding apparatus
US20070299658A1 (en) * 2004-07-13 2007-12-27 Matsushita Electric Industrial Co., Ltd. Pitch Frequency Estimation Device, and Pich Frequency Estimation Method
EP2096632A4 (en) * 2006-11-29 2012-06-27 Panasonic Corp DECODING DEVICE AND AUDIO DECODING METHOD
US20100017199A1 (en) * 2006-12-27 2010-01-21 Panasonic Corporation Encoding device, decoding device, and method thereof
US20100280833A1 (en) * 2007-12-27 2010-11-04 Panasonic Corporation Encoding device, decoding device, and method thereof
CN102089817B (zh) * 2008-07-11 2013-01-09 弗劳恩霍夫应用研究促进协会 用于计算频谱包络数目的装置与方法
JP5325293B2 (ja) * 2008-07-11 2013-10-23 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ 符号化されたオーディオ信号を復号化するための装置および方法
BRPI0917953B1 (pt) 2008-08-08 2020-03-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparelho de atenuação de espectro, aparelho de codificação, aparelho terminal de comunicação, aparelho de estação base e método de atenuação de espectro.
CN101741504B (zh) * 2008-11-24 2013-06-12 华为技术有限公司 一种确定信号线性预测编码阶数的方法和装置
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
CN102334159B (zh) 2009-02-26 2014-05-14 松下电器产业株式会社 编码装置、解码装置及其方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JPWO2011048741A1 (ja) * 2009-10-20 2013-03-07 日本電気株式会社 マルチバンドコンプレッサ
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
KR102632248B1 (ko) 2010-07-19 2024-02-02 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱
US9047875B2 (en) 2010-07-19 2015-06-02 Futurewei Technologies, Inc. Spectrum flatness control for bandwidth extension
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
AU2011300248B2 (en) * 2010-09-10 2014-05-15 Panasonic Corporation Encoder apparatus and encoding method
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
WO2012053150A1 (ja) * 2010-10-18 2012-04-26 パナソニック株式会社 音声符号化装置および音声復号化装置
JP5664291B2 (ja) * 2011-02-01 2015-02-04 沖電気工業株式会社 音声品質観測装置、方法及びプログラム
JP5817499B2 (ja) * 2011-12-15 2015-11-18 富士通株式会社 復号装置、符号化装置、符号化復号システム、復号方法、符号化方法、復号プログラム、及び符号化プログラム
WO2013108343A1 (ja) * 2012-01-20 2013-07-25 パナソニック株式会社 音声復号装置及び音声復号方法
EP2757558A1 (en) * 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
US9711156B2 (en) * 2013-02-08 2017-07-18 Qualcomm Incorporated Systems and methods of performing filtering for gain determination
CA3029033C (en) * 2013-04-05 2021-03-30 Dolby International Ab Audio encoder and decoder
JP6305694B2 (ja) 2013-05-31 2018-04-04 クラリオン株式会社 信号処理装置及び信号処理方法
CN104282312B (zh) * 2013-07-01 2018-02-23 华为技术有限公司 信号编码和解码方法以及设备
US9666202B2 (en) 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
DK3058567T3 (en) * 2013-10-18 2017-08-21 ERICSSON TELEFON AB L M (publ) CODING POSITIONS OF SPECTRAL PEAKS
WO2015098564A1 (ja) 2013-12-27 2015-07-02 ソニー株式会社 復号化装置および方法、並びにプログラム
US10410645B2 (en) * 2014-03-03 2019-09-10 Samsung Electronics Co., Ltd. Method and apparatus for high frequency decoding for bandwidth extension
CN110444216B (zh) * 2014-05-01 2022-10-21 日本电信电话株式会社 解码装置、解码方法、记录介质
ES2883848T3 (es) * 2014-05-01 2021-12-09 Nippon Telegraph & Telephone Codificador, descodificador, método de codificación, método de descodificación, programa de codificación, programa de descodificación y soporte de registro
PL3594945T3 (pl) * 2014-05-01 2021-05-04 Nippon Telegraph And Telephone Corporation Kodowanie sygnału dźwiękowego
US9838700B2 (en) * 2014-11-27 2017-12-05 Nippon Telegraph And Telephone Corporation Encoding apparatus, decoding apparatus, and method and program for the same
EP3182411A1 (en) 2015-12-14 2017-06-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an encoded audio signal
EP3382702A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for determining a predetermined characteristic related to an artificial bandwidth limitation processing of an audio signal
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004163D0 (sv) 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
DE60202881T2 (de) 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US7599835B2 (en) * 2002-03-08 2009-10-06 Nippon Telegraph And Telephone Corporation Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program
JP2004062410A (ja) 2002-07-26 2004-02-26 Nippon Seiki Co Ltd 表示装置の表示方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2005062410A (ja) 2003-08-11 2005-03-10 Nippon Telegr & Teleph Corp <Ntt> 音声信号の符号化方法
JP2005286533A (ja) 2004-03-29 2005-10-13 Nippon Hoso Kyokai <Nhk> データ伝送システム、データ送信装置、データ受信装置
JPWO2006025313A1 (ja) 2004-08-31 2008-05-08 松下電器産業株式会社 音声符号化装置、音声復号化装置、通信装置及び音声符号化方法
JP5100124B2 (ja) 2004-10-26 2012-12-19 パナソニック株式会社 音声符号化装置および音声符号化方法
EP1806737A4 (en) 2004-10-27 2010-08-04 Panasonic Corp TONE CODIER AND TONE CODING METHOD
EP2752849B1 (en) 2004-11-05 2020-06-03 Panasonic Intellectual Property Management Co., Ltd. Encoder and encoding method
JP5046653B2 (ja) 2004-12-28 2012-10-10 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4397826B2 (ja) 2005-01-20 2010-01-13 株式会社資生堂 粉末化粧料の成型方法
WO2006107833A1 (en) * 2005-04-01 2006-10-12 Qualcomm Incorporated Method and apparatus for vector quantizing of a spectral envelope representation
CN101138274B (zh) * 2005-04-15 2011-07-06 杜比国际公司 用于处理去相干信号或组合信号的设备和方法

Also Published As

Publication number Publication date
EP1926083A4 (en) 2011-01-26
BRPI0616624A2 (pt) 2011-06-28
EP1926083A1 (en) 2008-05-28
CN101273404A (zh) 2008-09-24
JP5089394B2 (ja) 2012-12-05
US8396717B2 (en) 2013-03-12
RU2008112137A (ru) 2009-11-10
WO2007037361A1 (ja) 2007-04-05
US20090157413A1 (en) 2009-06-18
JPWO2007037361A1 (ja) 2009-04-16
CN101273404B (zh) 2012-07-04

Similar Documents

Publication Publication Date Title
KR20080049085A (ko) 음성 부호화 장치 및 음성 부호화 방법
US8315863B2 (en) Post filter, decoder, and post filtering method
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
US7983904B2 (en) Scalable decoding apparatus and scalable encoding apparatus
EP2012305B1 (en) Audio encoding device, audio decoding device, and their method
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
EP1806736B1 (en) Scalable encoding apparatus, scalable decoding apparatus, and methods thereof
US8099275B2 (en) Sound encoder and sound encoding method for generating a second layer decoded signal based on a degree of variation in a first layer decoded signal
MX2014000161A (es) Aparato y metodo para generar señal extendida de ancho de banda.
JP4976381B2 (ja) 音声符号化装置、音声復号化装置、およびこれらの方法
JP2020204784A (ja) 信号符号化方法及びその装置、並びに信号復号方法及びその装置
RU2809981C1 (ru) Аудиодекодер, аудиокодер и связанные способы с использованием объединенного кодирования параметров масштабирования для каналов многоканального аудиосигнала

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application