KR20070070174A - 스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법 - Google Patents

스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법 Download PDF

Info

Publication number
KR20070070174A
KR20070070174A KR1020077008457A KR20077008457A KR20070070174A KR 20070070174 A KR20070070174 A KR 20070070174A KR 1020077008457 A KR1020077008457 A KR 1020077008457A KR 20077008457 A KR20077008457 A KR 20077008457A KR 20070070174 A KR20070070174 A KR 20070070174A
Authority
KR
South Korea
Prior art keywords
spectral
lower layer
encoding
reforming
layer
Prior art date
Application number
KR1020077008457A
Other languages
English (en)
Inventor
마사히로 오시키리
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070070174A publication Critical patent/KR20070070174A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

제 2 레이어에서의 부호화 효율을 개선함과 동시에, 제 2 레이어에서의 부호화 신호를 이용해 복호한 원신호의 품질을 향상시킬 수 있는 스케일러블 부호화 장치 등을 제공한다. 이 장치에 있어서, 예측 계수 부호화부(205)는, 예측 계수의 후보가 기록된 예측 계수 코드북을 구비하고, 이 예측 계수 코드북을 탐색하여, 스케일 팩터 산출부(202)로부터 입력되어 오는 제 1 레이어 복호 신호의 스케일 팩터에 곱함으로써, 그 곱셈 결과를 스케일 팩터 산출부(204)로부터 입력되어 오는 원(原)신호의 스케일 팩터에 가장 근사(近似)시키는 예측 계수를 결정하고, 결정한 예측 계수를 부호화하여, 그 부호화 코드를 다중화부와 예측 계수 복호화부(206)에 각각 입력시킨다.

Description

스케일러블 부호화 장치, 스케일러블 복호 장치 및 스케일러블 부호화 방법{SCALABLE ENCODER, SCALABLE DECODER, AND SCALABLE ENCODING METHOD}
본 발명은 음성 신호 등을 계층화하여 부호화하는 스케일러블 부호화 장치 등에 관한 것이다.
종래, 이동 통신 시스템에서는, 전파 자원 등의 유효 이용을 위해, 음성 신호를 낮은 비트 레이트(bit rate)로 압축하는 것이 요구되고 있다. 그 한편으로, 통화 음성의 품질 향상이나 현장감 높은 통화 서비스의 실현도 희망하고 있어, 그 실현에는, 음성 신호의 고품질화뿐만 아니라, 보다 대역이 넓은 오디오 신호 등의 음성 성분 이외의 신호 성분도 고품질로 부호화할 필요가 있다.
이러한 상반되는 요구를 동시에 만족시키는 수단으로서, 복수의 부호화 기술을 계층적으로 통합하는 어프로치가 유망시되고 있다. 구체적으로는, 음성 신호에 특화된 모델로 음성 성분을 낮은 비트 레이트로 부호화하는 제 1 레이어 부호화부와, 음성 성분 이외의 신호 성분을 보다 범용적인 모델로 부호화하는 제 2 레이어 부호화부를 조합시키는 어프로치가 검토되고 있다. 이러한 계층적 부호화 방식은, 부호화된 비트 스트림(bit stream)이 스케일러빌리티성(scalability性)(비트 스트림의 일부의 정보로부터도 복호 신호를 얻을 수 있는 특성)을 가지기 때문에, 스케일러블 부호화 방식으로 불린다.
스케일러블 부호화 방식은, 그 성질로 인해, 비트 레이트가 다른 네트워크 간의 통신에 유연하게 대응할 수 있다. 이 특징은, IP 프로토콜(protocol)로 다양한 네트워크가 통합되어 가는 향후의 네트워크 환경에 적합한 것이라고 말할 수 있다.
스케일러블 부호화의 실현 수단으로서, MPEG-4(Moving Picture Experts Group phase-4)로 규격화된 기술을 이용하는 수단이 알려져 있다(예를 들면 비특허 문헌 1 참조). 비특허 문헌 1에 기재된 기술에서는, 음성 신호에 특화된 대표적인 부호화 방식인 CELP(Code Excited Linear Prediction : 부호 여기 선형 예측) 방식을 제 1 레이어에 적용하여, 원(原)신호로부터 제 1 레이어 복호 신호를 뺀 잔차 신호에 대해서 보다 범용적인 부호화 모델인 AAC(Advanced Audio Coder) 방식 또는 TwinVQ(Transform Domain Weighted Interleave Vector Quantization: 주파수 영역 가중 인터리브 벡터 양자화) 방식을 제 2 레이어에 적용한다. 이 제 2 레이어에 적용되는 2개의 방식은 다른 방식이지만, 기본적으로는 MDCT(Modified Discrete Cosine Transform : 변형 이산 코사인 변환) 계수의 양자화를 행할 때에 스펙트럼의 대략적인 형상을 나타내는 스펙트럼 개형(槪形) 정보와 나머지의 상세한 스펙트럼 형상을 나타내는 스펙트럼 미세 정보로 분리하여, 각각 부호화하는 점에서 공통된다.
비특허 문헌 1 : 미키 스께이치(三木弼一) 편저, 「MPEG-4의 모든 것」, 초판, (주) 공업 조사회, 1998년 9월 30일, p.126-127
발명의 개시
발명이 해결하려고 하는 과제
그렇지만, 비특허 문헌 1에 기재된 기술에서는, 제 2 레이어에 있어서, 입력 신호인 원(原)신호로부터 그 제 1 레이어 복호 신호를 빼고 얻어지는 잔차 신호에 대해서 부호화가 행해지게 된다. 이러한 잔차 신호의 특성은, 제 1 레이어부를 경유함으로써 원신호에 포함되는 주요한 정보가 제거되기 때문에, 잡음 계열에 가까운 특성이 된다. 이 때문에, 비특허 문헌 1에 기재된 기술로서는, 제 2 레이어에서의 부호화 효율이 저하함과 동시에, 제 2 레이어에서의 부호화 신호를 이용해 원신호를 복호하더라도, 그 원신호의 품질이 향상되기 어렵다고 하는 문제가 있다.
따라서, 본 발명의 목적은, 제 2 레이어에서의 부호화 효율을 개선함과 동시에, 제 2 레이어에서의 부호화 신호를 이용해서 복호한 원신호의 품질을 향상시키는 스케일러블 부호화 장치 등을 제공하는 것이다.
과제를 해결하기 위한 수단
본 발명에 따른 스케일러블 부호화 장치는, 입력 신호를 부호화하여 하위 레이어 부호화 파라미터를 생성하는 하위 레이어 부호화 수단과, 상기 하위 레이어 부호화 파라미터를 복호하여 하위 레이어 복호 신호를 생성하는 하위 레이어 복호화 수단과, 상기 입력 신호에 기초하여 상기 입력 신호의 스펙트럼 개형을 산출하는 제 1 스펙트럼 개형 산출 수단과, 상기 하위 레이어 복호 신호에 기초하여 상기 하위 레이어 복호 신호의 스펙트럼 개형을 산출하는 제 2 스펙트럼 개형 산출 수단과, 상기 하위 레이어 복호 신호의 스펙트럼 개형으로부터 상기 입력 신호의 스펙트럼 개형을 예측함으로써 예측 정보를 얻어, 이 예측 정보를 부호화하여 상위 레이어 부호화 파라미터를 생성하는 예측 정보 부호화 수단과, 상기 하위 레이어 부호화 파라미터와 상기 상위 레이어 부호화 파라미터를 출력하는 출력 수단을 구비하는 구성을 취한다.
본 발명에 따른 스케일러블 복호 장치는, 입력 신호를 스케일러블 부호화하는 스케일러블 부호화 장치에 의해 생성된 부호화 파라미터를 복호하는 스케일러블 복호 장치로서, 상기 부호화 파라미터를 복호하여 하위 레이어 복호 신호를 생성하는 하위 레이어 복호화 수단과, 상기 부호화 파라미터를 복호함으로써, 상기 입력 신호의 스펙트럼 개형을 예측시키는 예측 정보를 생성하는 예측 정보 복호화 수단과, 상기 하위 레이어 복호 신호와 상기 예측 정보에 기초하여 상기 입력 신호의 스펙트럼 개형을 생성하는 스펙트럼 생성 수단을 구비하는 구성을 취한다.
[발명의 효과]
본 발명에 의하면, 예측 정보 부호화 수단이, 하위 레이어 복호 신호의 스펙트럼 개형으로부터 입력 신호의 스펙트럼 개형을 예측시키는 예측 정보를 생성해서 부호화하고, 부호화된 예측 정보를 상위 레이어 부호화 파라미터로서 출력하기 때문에, 이 상위 레이어 부호화 파라미터의 부호화 효율을 개선할 수 있음과 동시에, 이 상위 레이어 부호화 파라미터를 이용하여 복호한 입력 신호의 품질을 높일 수 있다.
도 1은 실시예 1에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도,
도 2는 실시예 1에 있어서의 제 2 레이어 부호화부의 주요한 구성을 나타내는 블록도,
도 3은 실시예 1에 있어서의 예측 계수 부호화부의 주요한 구성을 나타내는 블록도,
도 4는 실시예 1에 있어서 스펙트럼과 스펙트럼 개형의 관계를 설명하는 도면,
도 5는 실시예 1에 따른 스케일러블 복호 장치의 주요한 구성을 나타내는 블록도,
도 6은 실시예 1에 있어서의 제 2 레이어 복호화부의 주요한 구성을 나타내는 블록도,
도 7은 실시예 1에 있어서의 예측 계수 부호화부의 응용예를 나타내는 블록도,
도 8은 실시예 1에 있어서의 예측 계수 부호화부의 응용예를 나타내는 블록도,
도 9a는 실시예 2에 있어서 정현파의 부호화 방식과 생성된 스펙트럼과의 관계를 설명하는 도면,
도 9b는 실시예 2에 있어서 정현파의 부호화 방식과 생성된 스펙트럼과의 관계를 설명하는 도면,
도 9c는 실시예 2에 있어서 정현파의 부호화 방식과 생성된 스펙트럼과의 관계를 설명하는 도면,
도 10은 실시예 2에 있어서의 제 2 레이어 부호화부의 주요한 구성을 나타내는 블록도,
도 11은 실시예 2에 있어서의 스펙트럼 평활부의 주요한 구성을 나타내는 블록도,
도 12는 실시예 2에 따른 스케일러블 복호 장치의 주요한 구성을 나타내는 블록도,
도 13은 실시예 2에 있어서 MDCT에 의한 스펙트럼을 평활화하기 전후의 양상을 나타내는 도면,
도 14는 실시예 3에 있어서의 제 2 레이어 부호화부의 주요한 구성을 나타내는 블록도,
도 15는 참고예에 따른 음성 부호화 장치에 있어서의 주요한 구성요소의 구성을 나타내는 블록도,
도 16은 참고예에 따른 음성 복호 장치에 있어서의 주요한 구성요소의 구성을 나타내는 블록도,
도 17은 실시예 2에 있어서의 스케일 팩터의 양자화 성능을 계산기 시뮬레이션에 의해 산출한 결과의 일례를 나타내는 도면이다.
발명을 실시하기 위한 최선의 형태
본 발명은, 스케일러블 부호화의 제 2 레이어 부호화부에 있어서, 입력 신호인 원(原)신호의 스펙트럼 형상을 소정의 주파수 대역마다 대략적으로 파악한 스펙트럼 개형과, 제 1 레이어 복호 신호의 스펙트럼 개형의 사이에 강한 상관(相關)이 있는 것을 이용하여, 제 1 레이어 복호 신호의 스펙트럼 개형을 이용하여 원신호의 스펙트럼 개형을 예측하고, 그 예측 정보를 부호화함으로써, 입력 신호의 제 2 레이어 부호화 파라미터를 저비트 레이트(低bit rate)화하는 것이다.
이하, 본 발명의 실시예에 대해서, 도면을 참조하면서 상세히 설명한다. 또한, 각 실시예에서는, 이하의 전제 조건하에서, 입력 신호가 스케일러블 부호화되는 것으로 한다.
(1) 제 1 레이어(하위 레이어)와 제 2 레이어(상위 레이어)의 2 계층.
(2) 제 2 레이어의 부호화에서는, 주파수 영역에서 부호화를 행한다(변환 부호화).
(3) 제 2 레이어의 부호화에 있어서의 변환 방식으로는 MDCT를 사용한다.
(4) 제 2 레이어의 부호화에서는, 입력 신호 대역을 복수의 서브밴드(주파수 대역)로 분할하고, 각각의 서브밴드 단위로 부호화한다.
(5) 제 2 레이어의 부호화에서는, 각 서브밴드에 포함되는 MDCT 계수는, 스펙트럼 개형을 나타내는 정보와, 스펙트럼 개형으로 미처 나타내지 못하는 서브밴드 내의 미세한 MDCT 계수의 형상을 나타내는 스펙트럼 미세 정보로 분리하여 부호화된다.
(6) 제 2 레이어의 부호화에서는, 스펙트럼 개형을 나타내는 정보로서 서브밴드마다의 평균 진폭을 이용한다. 또한, 이 서브밴드 평균 진폭을 스케일 팩터(scale factor)라고 부른다.
(7) 제 2 레이어의 부호화에서는, 서브밴드 분할은 임계 대역에 대응화시켜 행해지며 바크 스케일(Bark scale)로 등간격으로 분할된다.
(실시예 1)
도 1은 본 발명의 실시예 1에 따른 스케일러블 부호화 장치(100)의 주요한 구성을 나타내는 블록도이다. 스케일러블 부호화 장치(100)는 제 1 레이어 부호화부(101), 지연부(102), 제 1 레이어 복호화부(103), 제 2 레이어 부호화부(104) 및 다중화부(105)를 구비한다.
제 1 레이어 부호화부(101)는, 도시하지 않은 마이크로폰 등으로부터 입력되어 오는 음성 신호의 원신호를 부호화하여 제 1 레이어 부호화 파라미터를 생성하고, 생성한 제 1 레이어 부호화 파라미터를 제 1 레이어 복호화부(103) 및 다중화부(105)에 각각 입력시킨다.
지연부(102)는, 제 1 레이어 부호화부(101)와 제 1 레이어 복호화부(103)의 사이에서 발생하는 시간 지연을 보정하기 위해, 입력된 원신호에 소정 길이의 지연을 부여하고, 지연시킨 원신호를 제 2 레이어 부호화부(104)에 입력시킨다.
제 1 레이어 복호화부(103)는, 제 1 레이어 부호화부(101)로부터 입력되어 오는 제 1 레이어 부호화 파라미터를 복호하여 제 1 레이어 복호 신호를 생성하고, 생성한 제 1 레이어 복호 신호를 제 2 레이어 부호화부(104)에 입력시킨다.
제 2 레이어 부호화부(104)는, 제 1 레이어 복호화부(103)로부터 입력되어 오는 제 1 레이어 복호 신호와, 지연부(102)로부터 입력되어 오는 소정 시간 지연시킨 원신호에 기초하여, 제 1 레이어 복호 신호의 스펙트럼 개형으로부터 원신호의 스펙트럼 개형을 예측하기 위해 필요한 예측 계수를 결정해서 부호화하고, 또 이러한 스펙트럼 개형으로는 나타낼 수 없는 스펙트럼 형상을 나타내기 위해서 필요한 스펙트럼 미세 정보를 생성해서 부호화하고, 이들 부호화 파라미터를 다중화부(105)에 입력시킨다. 또한, 제 2 레이어 부호화부(104)에 있어서의 이들 부호화 파라미터의 구체적인 생성 양상에 대해서는 후술한다.
다중화부(105)는, 제 1 레이어 부호화부(101)로부터 입력되어 오는 제 1 레이어 부호화 파라미터와, 제 2 레이어 부호화부(104)로부터 입력되어 오는 부호화 파라미터를 다중하여 비트 스트림으로서 스케일러블 부호화 장치(100)의 외부로 출력한다. 따라서, 다중화부(105)는 본 발명에 있어서의 출력 수단으로서 기능한다.
도 2는 스케일러블 부호화 장치(100)에 있어서의 제 2 레이어 부호화부(104)의 주요한 구성을 나타내는 블록도이다. 제 2 레이어 부호화부(104)는 MDCT 분석 부(201),(203), 스케일 팩터 산출부(202),(204), 예측 계수 부호화부(205), 예측 계수 복호화부(206) 및 스펙트럼 미세 정보 부호화부(208)를 구비한다.
MDCT 분석부(201)는, 제 1 레이어 복호화부(103)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수를 산출하고, 산출한 제 1 레이어 복호 신호의 MDCT 계수를 스케일 팩터 산출부(202)와 스펙트럼 미세 정보 부호화부(208)에 각각 입력시킨다.
스케일 팩터 산출부(202)는, MDCT 분석부(201)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수에 기초하여 제 1 레이어 복호 신호에 있어서의 각 서브밴드의 스케일 팩터를 산출한다. 그리고, 스케일 팩터 산출부(202)는 산출한 제 1 레이어 복호 신호의 스케일 팩터를 예측 계수 부호화부(205)에 입력시킨다. 또한, 이 스케일 팩터는, 각 서브밴드에 포함되는 MDCT 계수의 평균 진폭을 나타내며, 복호 신호의 음질을 좌우하는 중요한 파라미터이다. 또, 본 실시예에 있어서, 스펙트럼 개형이란, 각 서브밴드의 스케일 팩터를 주파수 방향으로 연결했을 때의 형상이다.
MDCT 분석부(203)는, 지연부(102)로부터 입력되어 오는 원신호의 MDCT 계수를 산출하고, 산출한 원신호의 MDCT 계수를 스케일 팩터 산출부(204)와 스펙트럼 미세 정보 부호화부(208)에 각각 입력시킨다.
스케일 팩터 산출부(204)는, MDCT 분석부(203)로부터 입력되어 오는 원신호의 MDCT 계수에 기초하여 원신호의 각 서브밴드의 스케일 팩터를 산출하고, 산출한 원신호의 스케일 팩터를 예측 계수 부호화부(205)에 입력시킨다.
예측 계수 부호화부(205)는, 예측 계수의 후보가 기록된 예측 계수 코드북을 구비하고, 이 예측 계수 코드북을 탐색하여, 스케일 팩터 산출부(202)로부터 입력되어 오는 제 1 레이어 복호 신호의 스케일 팩터에 곱함으로써, 그 곱셈 결과를 스케일 팩터 산출부(204)로부터 입력되어 오는 원신호의 스케일 팩터에 가장 근사(近似)시키는 예측 계수를 결정하고, 결정한 예측 계수를 부호화하여, 그 부호화 파라미터를 다중화부(105)와 예측 계수 복호화부(206)에 각각 입력시킨다. 또한, 예측 계수 부호화부(205)에 있어서의 예측 계수의 구체적인 결정 양상에 대해서는 후술한다.
예측 계수 복호화부(206)는, 예측 계수 부호화부(205)로부터 입력되어 오는 부호화 파라미터를 이용하여 예측 계수를 복호하고, 복호한 예측 계수를 스펙트럼 미세 정보 부호화부(208)에 입력시킨다.
스펙트럼 미세 정보 부호화부(208)는, MDCT 분석부(201)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수와, MDCT 분석부(203)로부터 입력되어 오는 원신호의 MDCT 계수와, 예측 계수 복호화부(206)로부터 입력되어 오는 복호 예측 계수를 이용하여, 서브밴드내의 미세한 MDCT 계수의 형상을 나타내는 스펙트럼 미세 정보를 생성해서 부호화하고, 그 부호화 파라미터를 다중화부(105)에 입력시킨다. 또한, MDCT 분석부(201)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수에, 예측 계수 복호화부(206)로부터 입력되어 오는 복호 예측 계수를 곱함으로써, 원신호의 스펙트럼 개형과 거의 동일한 스펙트럼 형상이 생성되기 때문에, 스펙트럼 미세 정보 부호화부(208)는, 이 생성한 스펙트럼 형상과 MDCT 분석부(203) 로부터 입력되어 오는 원신호의 MDCT 계수를 비교함으로써, 스펙트럼 미세 정보를 생성할 수 있다.
도 3은 본 실시예에 따른 스케일러블 부호화 장치(100)에 있어서의 예측 계수 부호화부(205)의 주요한 구성을 나타내는 블록도이다. 예측 계수 부호화부(205)는 곱셈기(301), 가산기(302), 탐색부(303) 및 예측 계수 코드북(304)을 구비한다.
곱셈기(301)는, 스케일 팩터 산출부(202)로부터 입력되어 오는 제 1 레이어 복호 신호의 스케일 팩터에 예측 계수 코드북(304)으로부터 입력되어 오는 예측 계수를 곱한 후에, 그 곱셈 결과를 가산기(302)에 입력시킨다.
가산기(302)는, 스케일 팩터 산출부(204)로부터 입력되어 오는 원신호의 스케일 팩터로부터, 곱셈기(301)로부터 입력되어 오는 예측 계수가 곱해진 제 1 레이어 복호 신호의 스케일 팩터를 뺌으로써, 오차 신호를 생성하고, 생성한 오차 신호를 탐색부(303)에 입력시킨다.
탐색부(303)는, 예측 계수 코드북(304)에 대해서, 그 보유하는 모든 예측 계수의 후보를 순서대로 곱셈기(301)에 입력시키도록 지시한다. 그리고, 탐색부(303)는, 곱셈기(301)로부터 입력되어 오는 오차 신호를 관찰하여, 그 오차가 최소가 되는 예측 계수를 결정하고, 결정한 예측 계수를 부호화하여, 그 부호화 파라미터를 다중화부(105)에 입력시킨다.
예측 계수 코드북(304)은, 예측 계수의 후보를 보유하고 있으며, 탐색부(303)로부터의 지시에 따라 예측 계수를 순서대로 곱셈기(301)에 입력시킨다.
여기서, 원신호의 스케일 팩터의 추정값, 즉 제 1 레이어 복호 신호의 스케일 팩터에 예측 계수를 곱한 값을 「X'(m)」, 제 1 레이어 복호 신호의 스케일 팩터를「Y(m)」, 예측 계수를「α(m)」, 서브밴드 번호를 「m」이라고 표기하면, 원신호의 스케일 팩터의 추정값 X'(m)는 다음의 「식 1」로 산출된다.
Figure 112007028378560-PCT00001
그리고, 식 1로 산출된 원신호의 스케일 팩터의 추정값 X'(m)를 이용하여, 탐색부(303)는 다음의 「식 2」에 표시되는 오차 E가 최소로 되는 예측 계수 α(m)를 결정하고, 결정한 예측 계수를 부호화하여, 그 부호화 파라미터를 다중화부(105)에 출력한다. 또한, 식 2에서는, 원신호의 스케일 팩터를 「X(m)」라고 표기한다.
Figure 112007028378560-PCT00002
도 4에, 원신호의 스펙트럼 및 원신호의 스케일 팩터(a)와, 제 1 레이어 복호 신호의 스펙트럼 및 제 1 레이어 복호 신호의 스케일 팩터(b)의 관계의 일례를 나타낸다. 도 4로부터 분명해진 바와 같이, 원신호의 스펙트럼과 제 1 레이어 복호 신호의 스펙트럼은 미세한 부분에서 상위(相違)하긴 하지만, 이들을 스케일 팩터로 비교하면, 거의 동일한 형상을 가지는 점에서, 이러한 스케일 팩터끼리는 상관이 강하다고 말할 수 있다. 즉, 스케일 팩터로 대표되는 스펙트럼 개형 정보에 착안하여 예측을 행하면, 스펙트럼 미세 정보에 착안하여 예측을 행하는 것보다, 부호화 효율의 개선 효과가 높다. 따라서, 제 1 레이어 복호 신호의 스케일 팩터와 예측 계수를 이용하면, 원신호의 스케일 팩터를 고정밀도로 생성할 수 있음을 알 수 있다. 또한, 도 4에 기재한 원신호의 스펙트럼과 제 1 레이어 복호 신호의 스펙트럼은 MDCT 계수의 스펙트럼 진폭을 산출하여 플롯한 것이다.
도 5는 본 실시예에 따른 스케일러블 복호 장치(500)의 주요한 구성을 나타내는 블록도이다. 스케일러블 복호 장치(500)는 분리부(501), 제 1 레이어 복호화부(502) 및 제 2 레이어 복호화부(503)를 구비한다.
분리부(501)는, 스케일러블 부호화 장치(100)로부터 송신되어 오는 비트 스트림을 분리하여, 제 1 레이어 부호화 파라미터를 제 1 레이어 복호화부(502)에 입력시키고, 한편으로 예측 계수의 부호화 파라미터와 스펙트럼 미세 정보의 부호화 파라미터를 제 2 레이어 복호화부(503)에 입력시킨다.
제 1 레이어 복호화부(502)는, 분리부(501)로부터 입력되어 오는 제 1 레이어 부호화 파라미터로부터 제 1 레이어 복호 신호를 생성하고, 이 제 1 레이어 복호 신호를 제 2 레이어 복호화부(503)에 입력시킨다. 또, 이 제 1 레이어 복호 신호는 직접 스케일러블 복호 장치(500)의 외부로도 출력된다. 이에 의해, 제 1 레이어 복호화부(502)에서 생성되는 제 1 레이어 복호 신호를 출력할 필요가 생긴 경우에는, 이 출력을 이용할 수 있다.
제 2 레이어 복호화부(503)는, 분리부(501)로부터 입력되어 오는 부호화 파라미터와 제 1 레이어 복호화부(502)로부터 입력되어 오는 제 1 레이어 복호 신호에 대해서, 후술하는 복호화 처리를 실시하여, 제 2 레이어 복호 신호를 생성해서 출력한다. 그리고, 제 1 레이어 복호 신호에 의해 재생 음성의 최소한의 품질이 담보되며, 제 2 레이어 복호 신호에 의해 재생 음성의 품질을 높일 수 있다. 또, 제 2 레이어 복호 신호가 이용되는지 여부는 애플리케이션의 설정 등에 의존한다.
도 6은 본 실시예에 따른 스케일러블 복호 장치(500)에 있어서의 제 2 레이어 복호화부(503)의 주요한 구성을 나타내는 블록도이다. 제 2 레이어 복호화부(503)는 예측 계수 복호화부(601), MDCT 분석부(602), 스펙트럼 미세 정보 복호화부(605), 복호 스펙트럼 생성부(606) 및 시간 영역 변환부(607)를 구비한다.
예측 계수 복호화부(601)는, 분리부(501)로부터 입력되어 오는 부호화 파라미터를 예측 계수로 복호하고, 복호한 예측 계수를 복호 스펙트럼 생성부(606)에 입력시킨다.
MDCT 분석부(602)는, 제 1 레이어 복호화부(502)로부터 입력되어 오는 시간 영역 신호인 제 1 레이어 복호 신호에 대해서 변형 이산 코사인 변환(MDCT)에 의한 주파수 변환을 가하여 MDCT 계수를 산출하고, 산출한 제 1 레이어 복호 신호의 MDCT 계수를 복호 스펙트럼 생성부(606)에 입력시킨다.
스펙트럼 미세 정보 복호화부(605)는, 분리부(501)로부터 입력되어 오는 부호화 파라미터를 복호하여 스펙트럼 미세 정보를 생성하고, 생성한 스펙트럼 미세 정보를 복호 스펙트럼 생성부(606)에 입력시킨다.
복호 스펙트럼 생성부(606)는, 예측 계수 복호화부(601)로부터 입력되어 오는 복호한 예측 계수와, 스펙트럼 미세 정보 복호화부(605)로부터 입력되어 오는 스펙트럼 미세 정보와, MDCT 분석부(602)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수로부터 원신호의 복호 스펙트럼을 생성하고, 생성한 원신호의 복호 스펙트럼을 시간 영역 변환부(607)에 입력시킨다. 예를 들면, 복호 스펙트럼 생성부(606)는 원신호의 복호 스펙트럼 U(k)를 다음의 「식 3」을 이용하여 산출한다.
Figure 112007028378560-PCT00003
여기서, 식 3에 있어서,「C(k)」는 스펙트럼 미세 정보, 「α'(m)」는 제 m 서브밴드의 복호한 예측 계수, 「B(k)」는 제 1 레이어 복호 신호의 MDCT 계수를 나타내며, 「k」는 제 m 서브밴드에 포함되는 주파수를 나타낸다.
시간 영역 변환부(607)는, 복호 스펙트럼 생성부(606)로부터 입력되어 오는 복호 스펙트럼을 시간 영역의 신호로 변환한 후, 변환 후의 신호에 대해서 필요에 따라서 적절한 윈도잉(windowing)이나 중첩 가산 등의 처리를 실시하여 프레임 간에 발생하는 불연속을 해소함으로써, 최종적으로 제 2 레이어 복호 신호를 생성하여 출력한다.
이와 같이, 원신호의 스케일 팩터와 제 1 레이어 복호 신호의 스케일 팩터의 사이에는 강한 상관이 있으며, 또 제 1 레이어 복호 신호의 스케일 팩터에 예측 계수를 곱하면, 원신호의 스케일 팩터를 높은 정밀도로 생성할 수 있다. 또, 이 예측 계수의 부호화 파라미터의 데이터량은, 종래 기술에 있어서의 원신호로부터 제 1 레이어 복호 신호를 뺌으로써 생성한 오차 신호의 부호화 파라미터의 데이터량에 비해 현저하게 적다.
그래서, 본 실시예에서는, 스케일러블 부호화 장치(100)가, 제 1 레이어 부호화 파라미터와 함께, 이 제 1 레이어 부호화 파라미터에 유래하는 예측 계수의 부호화 파라미터를 스케일러블 복호 장치(500)에 송신하도록 했다.
따라서, 본 실시예에 의하면, 스케일러블 부호화 장치(100)가 음성 신호를 스케일러블 부호화하여 스케일러블 복호 장치(500)에 송신하는 경우에, 이 음성 신호의 송신에 필요한 비트 레이트를 삭감할 수 있다. 환언하면, 본 실시예에 의하면, 음성 신호의 스케일러블 부호화에 있어서, 제 2 레이어의 부호화 효율을 높일 수 있다. 또, 본 실시예에 의하면, 스케일러블 복호 장치(500)에 의해 재생되는 음성의 품질을 높일 수 있다.
또한, 본 실시예에 따른 스케일러블 부호화 장치(100) 또는 스케일러블 복호 장치(500)에 대해, 이하와 같이 변형하거나 응용하거나 해도 좋다.
본 실시예에서는, 예측 계수 부호화부(205)가, 식 2에 표시되는 오차 E가 최소로 되는 예측 계수 α(m)의 부호화 파라미터를 다중화부(105)에 출력하는 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 예측 계수 부호화부(205)가, 원신호의 스케일 팩터 X(m)와 제 1 레이어 복호 신호의 스케일 팩터 Y(m)를 이용하여 이상(理想) 계수 αopt(m)를 산출하고, 이 이상 계수 αopt(m)를 양자화하도록 해도 좋다. 여기서, 이상 계수 αopt(m)는 다음의 「식 4」에 표시된다.
Figure 112007028378560-PCT00004
도 7은 이 응용예에 있어서, 예측 계수 부호화부(205) 대신에 이용되는 예측 계수 부호화부(705)의 주요한 구성을 나타내는 블록도이다. 예측 계수 부호화부(705)는 탐색부(303), 예측 계수 코드북(304), 이상(理想) 계수 산출부(711) 및 가산기(712)를 구비한다. 이상 계수 산출부(711)는, 스케일 팩터 산출부(202)로부터 입력되어 오는 제 1 레이어 복호 신호의 스케일 팩터 Y(m)와, MDCT 분석부(203)로부터 입력되어 오는 원신호의 스케일 팩터 X(m)로부터 식 4를 이용하여 이상 계수 αopt(m)를 산출하고, 산출한 이상 계수 αopt(m)를 가산기(712)에 입력시킨다. 가산기(712)는, 이상 계수 산출부(711)로부터 입력되어 오는 이상 계수 αopt(m)와, 예측 계수 코드북(304)으로부터 입력되어 오는 예측 계수와의 차분을 나타내는 오차 신호를 생성하고, 이 오차 신호를 탐색부(303)에 입력시킨다. 그리고, 예측 계수 부호화부(705)는, 가산기(712)에 의해 생성되는 오차 신호가 가리키는 차분이 최소로 되는 예측 계수의 부호화 파라미터를 다중화부(105)에 입력시킨다. 또한, 탐색부(303) 및 예측 계수 코드북(304)은, 예측 계수 부호화부(205)에 있어서의 대응 구성요소와 동일한 동작을 행하는 구성요소이기 때문에, 그 설명을 생략한다.
또, 도 8에, 본 실시예에 있어서의 도 7에 나타낸 응용예와는 다른 응용예를 나타낸다. 도 8은 예측 계수 부호화부(205) 대신에 이용되는 예측 계수 부호화부(805)의 주요한 구성을 나타내는 블록도이다. 예측 계수 부호화부(805)는 곱셈기(301), 가산기(302),(815), 탐색부(303), 예측 계수 코드북(304) 및 잔차 성분 코드북(814)을 구비한다. 잔차 성분 코드북(814)은, 잔차 성분을 나타내는 코드북을 보유하고 있으며, 탐색부(303)로부터의 지시에 따라, 보유하는 잔차 성분을 순서대로 가산기(815)에 입력시킨다. 가산기(815)는, 곱셈기(301)로부터 입력되어 오는, 예측 계수가 곱해진 제 1 레이어 복호 신호의 스케일 팩터에, 잔차 성분 코드북(814)으로부터 입력되어 오는 잔차 성분을 가산하고, 그 가산 결과를 가산 기(302)에 입력시킨다. 그리고, 예측 계수 부호화부(805)는, 가산기(302)에서 생성되는 오차 신호가 가리키는 차분이 최소로 되는 예측 계수와 잔차 성분의 조합을 결정하고, 그 부호화 파라미터를 다중화부(105)에 입력시킨다. 그리고, 이 응용예에 대해서, 원신호의 스케일 팩터의 추정값 X'(m)은, 제 1 레이어 복호 신호의 스케일 팩터 Y(m), 예측 계수 α(m)및 잔차 성분 e(m)을 이용하여, 다음의 「식 5」로 산출된다.
Figure 112007028378560-PCT00005
이와 같이, 도 8에 나타내는 응용예라면, 오차 신호용 부호가 별도로 필요하게 되어 비트 레이트는 증가하지만, 그 한편으로 원신호의 스케일 팩터의 추정 정밀도가 개선된다.
또, 또 다른 응용예로서 복수의 서브밴드의 예측 계수 α(m)를 하나의 벡터로 간주하고, 이 벡터에 대해서, 예측 계수 벡터 코드북에 포함되는 후보 중에서 가장 적당한 후보를 탐색에 의해 결정하도록 해도 좋다. 이와 같이 하면, 복수의 서브밴드의 예측 계수 α(m)가 하나의 부호화 파라미터로 표시되게 되어, 예측 계수 α(m)의 부호화 파라미터의 데이터량이 삭감되어, 비트 레이트를 저하시킬 수 있다.
또, 본 실시예에서는, 스케일러블 부호화 장치(100)가, 음성 신호의 제 1 레이어 부호화 파라미터와 제 2 레이어 부호화 파라미터를 비트 스트림으로서 출력하는 경우에 대해 설명했지만, 본 발명은 이 경우에 한정되는 것은 아니며, 예를 들면 스케일러블 부호화 장치(100)가, 음성 신호의 제 1 레이어 부호화 파라미터와 제 2 레이어 부호화 파라미터를 도시하지 않은 데이터 보존부 등에 축적하여 보존하도록 해도 좋다.
또, 본 실시예에서는, 탐색부(303)가, 식 2에 표시되는 오차 E가 최소로 되는 예측 계수 α(m)을 결정하는 경우에 대해 설명했지만, 본 발명은 이 경우로 한정되는 것은 아니며, 예를 들면 탐색부(303)가 다음의 「식 6」에 표시되는 바와 같이 대수 영역에서 예측 계수 α(m)를 탐색하도록 해도 좋다.
Figure 112007028378560-PCT00006
또, 본 실시예에서는, 탐색부(303)가, 예측 계수 코드북(304)이 보유하는 예측 계수 α(m)의 전(全) 후보를 탐색하는 경우에 대해 설명했지만, 본 발명은 이 경우에 한정되는 것은 아니며, 예를 들면 탐색부(303)가 예측 계수 코드북(304)이 보유하는 일부의 후보로 한정하여 탐색하도록 해도 좋다.
(실시예 2)
도 9a~도 9c에, 정현파 신호를 고속 푸리에 변환(Fast Fourier Transform : FFT) 처리 또는 MDCT 처리를 이용하여 스펙트럼 분석을 행할 때에, 그 분석 위치를 변경했을 때 각 처리에 의해 얻어지는 스펙트럼 진폭의 차이를 나타낸다.
여기서, 음성 신호는, 도 9a에 나타내는 바와 같이 정현파이므로, 그 스펙트럼은 당연히 1개의 선(線)스펙트럼으로서 표시될 것이다. 실제로, 음성 신호를 FFT 변환하여 스펙트럼 분석했을 경우에는, 도 9b에 나타내는 바와 같이, 그 분석 위치에 상관없이, 1개의 선 스펙트럼으로서 표시되게 된다. 그런데 , MDCT를 이용한 스펙트럼 분석에서는, 도 9c에 나타내는 바와 같이, 산출되는 스펙트럼이 분석 위치에 의존하여 변화한다. 즉, MDCT를 이용한 스펙트럼 분석으로 산출되는 스펙트럼은 그 파형의 위상에 영향을 받게 된다. 그 때문에, 실시예 1에 나타낸 바와 같이, 스케일 팩터 산출부(202),(204)가 MDCT 분석부(201),(203)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수에 기초하여 스케일 팩터(스펙트럼 개형)를 생성하는 경우에는, 생성된 스케일 팩터가, 그 기초로 된 스펙트럼을 충실히 반영하고 있지 않을 우려가 있다.
또, 실시예 1에 나타내는 스케일러블 부호화에서는, 제 1 레이어 부호화 파라미터 및 제 1 레이어 복호 신호의 생성에 있어 양자화가 행해지기 때문에, 이 제 1 레이어 부호화 파라미터 또는 신호에는 양자화 왜곡이 잠재하게 된다. 따라서, 실시예 1에 나타내는 스케일러블 부호화에서는, 제 2 레이어 부호화부(104)에 입력되는 원신호와 제 1 레이어 복호 신호의 위상이 동기(同期)하고 있지 않을 우려가 있으며, 이것은 바꾸어 말하면, 원신호의 스펙트럼 개형과 제 1 레이어 복호 신호의 스펙트럼 개형의 상관을 높일 여지가 남아 있다고 하는 것이다. 특히, 제 1 레이어에 CELP 방식과 같은 고능률 부호화법이 적용되었을 경우에는, 이러한 경향이 강해진다.
그래서, 본 발명에 따른 실시예 2에서는, 제 1 레이어에 CELP 방식과 같은 고능률 부호화법이 적용되었을 경우에도, 원신호의 스펙트럼 개형과 제 1 레이어 복호 신호의 스펙트럼 개형의 상관을 보다 높일 수 있는 수단을 강구한다.
도 10은 본 실시예에 따른 스케일러블 부호화 장치에 있어서의 제 2 레이어 부호화부(1004)의 주요한 구성을 나타내는 블록도이다. 제 2 레이어 부호화부(1004)는, 스케일러블 부호화 장치(100)에 있어서, 제 2 레이어 부호화부(104) 대신에 사용되는 것으로서, 제 2 레이어 부호화부(104)에 있어서의 MDCT 분석부(201)와 스케일 팩터 산출부(202)의 사이에 스펙트럼 평활부(1011)를 더 구비하는 것이다. 따라서, 제 2 레이어 부호화부(1004)는 제 2 레이어 부호화부(104)의 구성요소와 동일한 기능을 가지는 구성요소를 많이 구비하기 때문에, 이러한 동일한 기능을 가지는 구성요소에 대해서는, 중복을 피하기 위해, 그 설명을 생략한다.
스펙트럼 평활부(1011)는, MDCT 분석부(201)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수 즉 스펙트럼을, 분석 위치 근방의 스펙트럼을 이용해서 평활화하고, 평활화한 스펙트럼을 스케일 팩터 산출부(202)에 입력시킨다. 또한, 본 실시예에서는, 스케일 팩터 산출부(202)로부터 스펙트럼 미세 정보 부호화부(208)에 평활화된 제 1 레이어 복호 신호의 스케일 팩터가 입력되지만, 이 평활화된 제 1 레이어 복호 신호의 스케일 팩터는 참조용으로 입력되는 것으로서, 스펙트럼 미세 정보 부호화부(208)의 기능은 실시예 1에 있어서의 그것과 거의 동일하다.
도 11은 스펙트럼 평활부(1011)의 주요한 구성을 나타내는 블록도이다. 스펙트럼 평활부(1011)는 평활 처리부(1121) 및 에너지 조정부(1122)를 구비한다. 또한, 스펙트럼 평활부(1011)의 동작에 대해서는 후술한다.
도 12는 본 실시예에 따른 스케일러블 복호 장치에 있어서의 제 2 레이어 복 호화부(1203)의 주요한 구성을 나타내는 블록도이다. 제 2 레이어 복호화부(1203)는, 스케일러블 복호 장치(500)에 있어서, 제 2 레이어 복호화부(503) 대신에 사용되는 것으로서, 제 2 레이어 복호화부(503)에 있어서, 복호 스펙트럼 생성부(606) 대신에 복호 스펙트럼 생성부(1216)를 구비하고, 또 MDCT 분석부(602)와 복호 스펙트럼 생성부(606)의 사이에 스펙트럼 평활부(1212) 및 스케일 팩터 산출부(1213)를 새롭게 더 구비하는 것이다. 또, 스펙트럼 평활부(1212)는, 스펙트럼 평활부(1011)와 마찬가지로, 도 11에 나타내는 평활 처리부(1121)와 에너지 조정부(1122)를 구비한다. 따라서, 제 2 레이어 복호화부(1203)는 제 2 레이어 복호화부(503)나 스펙트럼 평활부(1011)의 구성요소와 동일한 기능을 가지는 구성요소를 많이 구비하기 때문에, 이러한 동일한 기능을 가지는 구성요소에 대해서는, 중복을 피하기 위해, 그 설명을 생략한다.
스펙트럼 평활부(1011),(1212)는, MDCT 분석부(201) 또는 MDCT 분석부(602)로부터 입력되어 오는 제 1 레이어 복호 신호의 스펙트럼을 평활화할 때에, 착안한 스펙트럼과 그 근방의 스펙트럼의 가중 평균값을 산출한다. 예를 들면, 스펙트럼 평활부(1011),(1212)에 있어서의 평활 처리부(1121)는 다음의 「식 7」에 따라 스펙트럼의 평활화를 행한다.
Figure 112007028378560-PCT00007
여기서, S(k)는 평활화 전(前)의 MDCT 스펙트럼, S'(k)는 평활화 후(後)의 MDCT 스펙트럼, β(i)은 가중 계수, L은 평균을 구하는 범위를 나타낸다.
또는, 스펙트럼 평활부(1011),(1212)는, MDCT 분석부(201) 또는 MDCT 분석부(602)로부터 입력되어 오는 제 1 레이어 복호 신호의 스펙트럼을 평활화할 때에, 착안한 스펙트럼과 그 근방의 스펙트럼의 차(差)의 평균을 산출한다. 예를 들면, 스펙트럼 평활부(1011),(1212)에 있어서의 평활 처리부(1121)는 다음의 「식 8」에 따라 스펙트럼의 평활화를 행한다.
Figure 112007028378560-PCT00008
여기서, γ1、γ2는, 가중 계수를 나타낸다.
그리고, 스펙트럼 평활부(1011),(1212)에 있어서의 에너지 조정부(1122)는, 평활 처리부(1121)에 의해 평활화된 제 1 레이어 복호 신호의 스펙트럼을, 그 평활화의 전후에서 스펙트럼 에너지가 일치하도록 조정한다.
스케일 팩터 산출부(1213)는, 스케일 팩터 산출부(202)와 동일하게 기능하여, 스펙트럼 평활부(1212)로부터 입력되어 오는 평활화된 제 1 레이어 복호 신호의 MDCT 계수에 기초하여 제 1 레이어 복호 신호에 있어서의 각 서브밴드의 스케일 팩터를 산출한다. 그리고, 스케일 팩터 산출부(1213)는 산출한 제 1 레이어 복호 신호의 스케일 팩터를 복호 스펙트럼 생성부(1216)에 입력시킨다.
복호 스펙트럼 생성부(1216)는, 예측 계수 복호화부(601)로부터 입력되어 오는 복호된 예측 계수와, MDCT 분석부(602)로부터 입력되어 오는 제 1 레이어 복호 신호의 MDCT 계수와, 스케일 팩터 산출부(1213)로부터 입력되어 오는 제 1 레이어 복호 신호의 스케일 팩터와, 스펙트럼 미세 정보 복호화부(605)로부터 입력되어 오 는 스펙트럼 미세 정보로부터 원신호의 복호 스펙트럼을 생성하고, 생성한 원신호의 복호 스펙트럼을 시간 영역 변환부(607)에 입력시킨다. 예를 들면, 복호 스펙트럼 생성부(1216)는 원신호의 복호 스펙트럼 U(k)을 다음의 「식 9」를 이용하여 산출한다.
Figure 112007028378560-PCT00009
여기서, 식 9에 있어서, 「C(k)」는 스펙트럼 미세 정보, 「α'(m)」은 제 m 서브밴드의 복호한 예측 계수, 「B(k)」는 제 1 레이어 복호 신호의 MDCT 계수를 나타내며, 「k」는 제 m 서브밴드에 포함되는 주파수를 나타낸다. 또, 「Y(m)」은 제 m 서브밴드에 있어서의 제 1 레이어 복호 신호의 스케일 팩터, 「Z(m)」은 제 m 서브밴드에 있어서의 평활화 후의 제 1 레이어 복호 신호의 스케일 팩터를 나타낸다.
도 13의 왼쪽 박스(a)에, 도 9에 나타낸 정현파를 4개의 분석 위치 ph0, ph1, ph2, ph3에서 MDCT를 이용한 스펙트럼 분석을 행했을 때의 스펙트럼을 개념적으로 표시한다. 도 13의 왼쪽 박스(a)에 나타내는 스펙트럼에 대해서, 스펙트럼 평활부(1011) 또는 스펙트럼 평활부(1212)가 식 7 또는 식 8에 따른 평활화 처리를 행함으로써, 도 13의 오른쪽 박스(B)에 나타내는 스펙트럼이 산출된다. 원래, MDCT를 이용한 스펙트럼 분석에 의해 산출되는 스펙트럼에는, 도 13의 왼쪽 박스(a)에 나타내는 바와 같이 편차가 발생한다. 이에 대해, 스펙트럼 평활부(1011) 또는 스펙트럼 평활부(1212)에 의해 평활화된 후의 스펙트럼에서는, 도 13의 오른 쪽 박스(b)에 나타내는 바와 같이, 이 편차가 적어진다. MDCT를 이용한 스펙트럼 분석에 의해 산출되는 스펙트럼의 편차가 적어지면, 그 평활화된 스펙트럼에 대해서는, 원신호의 스펙트럼으로부터 크게 괴리(乖離)되어 버리는 경우가 줄어들어, 대국적으로 보면 원신호의 스펙트럼이 보다 정확하게 반영되게 된다.
이와 같이, 본 실시예에 의하면, 스펙트럼 평활부(1011) 또는 스펙트럼 평활부(1212)가, 제 1 레이어 복호 신호의 스펙트럼에 대해서 스펙트럼 평활화 처리를 실시하기 때문에, 평활화 후의 스펙트럼으로부터 산출되는 스펙트럼 개형과, 스케일 팩터 산출부(204)에 의해 산출되는 원신호의 스펙트럼 개형의 상관이 한층 더 강해진다. 그 결과, 본 실시예에 의하면, 예측 계수 부호화부(205)에서의 부호화 효율이 한층 더 향상된다.
참고로서, 도 17에, 스케일 팩터의 양자화 성능을 계산기 시뮬레이션에 의해 산출한 결과의 일례를 나타낸다. 도 17에 나타내는 예에서는, 각 서브밴드의 스케일 팩터의 예측 계수 α(m)는 4 bit의 스칼라 양자화기를 이용하여 양자화된다. 또, 도 17에 나타내는 예에서는, 양자화 전의 원신호의 스케일 팩터 X(m)에 대한 양자화 후의 스케일 팩터 Xq(m)를 이용하여 다음의 「식 10」에 따라 SNR(Signal-to-Noise Ratio)를 산출한다.
Figure 112007028378560-PCT00010
도 17에 나타내는 바와 같이, 평활화 처리가 있는 경우와 없는 경우를 비교 하면, 평활화 처리가 있는 경우에서는 클린(clean) 음성에서 근소하게 SNR이 저하하긴 하지만, 오디오나 차내 잡음 음성에서는 SNR이 크게 개선되어 있다. 따라서 전체적으로 보면, 스펙트럼 평활화에 의한 효과는 크다고 말할 수 있다.
(실시예 3)
인간의 청각 특성에는, 어떤 신호가 들리고 있을 때, 그 신호와 주파수가 가까운 음(音)이 귀에 들어와도 들리기 어렵다고 하는 청각 마스킹 특성이 있다. 그래서, 본 실시예에서는, 이 청각 마스킹 특성을 이용하여, 제 2 레이어 부호화 파라미터의 구성요소인 예측 계수와 스펙트럼 미세 정보의 부호화 효율의 향상을 도모한다.
도 14는 본 발명의 실시예 3에 따른 스케일러블 부호화 장치에 있어서의 제 2 레이어 부호화부(1404)의 주요한 구성을 나타내는 블록도이다. 제 2 레이어 부호화부(1404)는, 실시예 2에 있어서의 제 2 레이어 부호화부(1004)에 있어서, 예측 계수 부호화부(205) 대신에 예측 계수 부호화부(1405)를, 또 스펙트럼 미세 정보 부호화부(208) 대신에 스펙트럼 미세 정보 부호화부(1408)를, 그리고 새롭게 청각 마스킹 산출부(1411)를 구비하는 것이다. 따라서, 제 2 레이어 부호화부(1404)는 제 2 레이어 부호화부(104),(1004)의 구성요소와 동일한 기능을 가지는 구성요소를 많이 구비하기 때문에, 이러한 동일 기능을 가지는 구성요소에 대해서는, 중복을 피하기 위해, 그 설명을 생략한다.
청각 마스킹 산출부(1411)는, 지연부(102)로부터 입력되어 오는 원신호에 대 해, 그 서브밴드마다 미리 규정되어 있는 청각 마스킹 T(m)을 예측 계수 부호화부(1405)와 스펙트럼 미세 정보 부호화부(1408)에 각각 통지한다.
예측 계수 부호화부(1405)는, 청각 마스킹 산출부(1411)로부터 통지되는 청각 마스킹 T(m)과 오차 스케일 팩터 E(m)의 크기를 서브밴드마다 비교하여, 오차 스케일 팩터 E(m)가 청각 마스킹 T(m)을 초과할 경우에는, 그 서브밴드에 발생해 있는 양자화 왜곡이 인간의 청각으로 지각될 수 있다고 판정하고, 그 서브밴드에 대해 예측 계수를 결정하여 부호화하고, 그 부호화 파라미터를 다중화부(105)에 입력시킨다. 또한, 오차 스케일 팩터 E(m)는 원신호의 스케일 팩터와 제 1 레이어 복호 신호의 스케일 팩터의 차(差)로서 산출된다. 또, 예측 계수 부호화부(1405)는, 서브밴드마다 예측 계수를 부호화했는지 여부를 나타내는 정보를 부호화하고, 그 부호화한 정보를 다중화부(105)에 입력시켜, 스케일러블 복호 장치(500)에 송신하는 것이 바람직하다.
스펙트럼 미세 정보 부호화부(1408)도, 예측 계수 부호화부(1405)와 동일하게 하여, 오차 스케일 팩터 E(m)가 청각 마스킹 T(m)을 초과할 경우에 한해, 그 서브밴드에 발생해 있는 양자화 왜곡이 인간의 청각으로 지각될 수 있다고 판정하고, 그 서브밴드에 대해 스펙트럼 미세 정보를 부호화하여 다중화부(105)에 입력시킨다. 또, 스펙트럼 미세 정보 부호화부(1408)는, 서브밴드마다 스펙트럼 미세 정보를 부호화했는지 여부를 나타내는 정보를 부호화하고, 그 부호화한 정보를 다중화부(105)에 입력시켜, 스케일러블 복호 장치(500)에 송신하는 것이 바람직하다.
이와 같이, 본 실시예에 의하면, 제 2 레이어 부호화부(1404)가, 원신호의 서브밴드마다 청각 마스킹 효과가 유효하게 이루어지는 상태인지를 판정하여, 청각 마스킹 효과가 유효하게 이루어지는 상태의 서브밴드에 대해서는, 예측 계수와 스펙트럼 미세 정보의 부호화를 행하지 않기 때문에, 음성 신호의 제 2 레이어 부호화 파라미터의 부호화 효율을 개선할 수 있다. 그 결과, 본 실시예에 의하면, 음성 신호의 보다 더 낮은 비트 레이트화와 고음질화를 양립시킬 수 있다.
그리고, 본 실시예에 있어서, 예측 계수 부호화부(1405) 또는 스펙트럼 미세 정보 부호화부(1408)가, 청각 마스킹 T(m)과 오차 스케일 팩터 E(m)를 서브밴드마다 비교하여, 오차 스케일 팩터 E(m)가 청각 마스킹 T(m)을 초과하는 정도에 따라, 예측 계수 또는 스펙트럼 미세 정보를 부호화할 때의 비트수를 늘려, 그 서브밴드의 오차 스케일 팩터 E(m)를 작게 하도록 해도 좋다. 또, 이와 같이 할 경우도, 예측 계수 부호화부(1405) 또는 스펙트럼 미세 정보 부호화부(1408)는 서브밴드마다 예측 계수 또는 스펙트럼 미세 정보에 배분한 비트수를 나타내는 정보를 스케일러블 복호 장치(500)에 송신하는 것이 바람직하다.
그리고, 본 발명에 따른 스케일러블 부호화 장치에 대해, 이하와 같이 변형하거나 응용하거나 해도 좋다.
본 발명에 따른 각 실시예에서는, 음성 신호를 제 1 레이어(하위 레이어)와 제 2 레이어(상위 레이어)의 2 계층으로 스케일러블 부호화를 행하는 경우에 대해 설명했지만, 본 발명은 이 경우에 한정되는 것은 아니며, 예를 들면 3 계층 이상으로 스케일러블 부호화를 행하도록 해도 좋다.
또, 본 발명에 있어서, 제 n 레이어에 있어서의 신호의 샘플링 레이트를 Fs(n)로 표시하여, Fs(n)≤Fs(n+1)의 관계가 성립되도록, 각 레이어의 샘플링 레이트를 조절해도 좋다. 즉, 제 1 레이어 부호화부(101) 또는 제 1 레이어 복호화부(502)에 있어서의 샘플링 레이트를 제 2 레이어 부호화부(104) 또는 제 2 레이어 복호화부(503)에 있어서의 샘플링 레이트보다 낮게 설정해도 좋다. 이와 같이 하면, 대역 스케일러블을 실현할 수 있기 때문에, 네트워크의 상황이 좋을 때나 사용자가 사용하고 있는 기기의 능력이 높을 때는 복호 신호에 의해 형성되는 현장감을 한층 더 높일 수 있다.
또, 본 발명의 각 실시예에서는, MDCT를 이용하여 스펙트럼 분석을 행하는 경우에 대해 설명했지만, 본 발명은 이 경우에 한정되는 것은 아니며, 다른 방식, 예를 들면 DFT, 코사인 변환 또는 Wavelet 변환 등을 이용하여 스펙트럼 분석을 행하도록 해도 좋다.
(참고예)
이 참고예에서는, 음성 신호의 스케일러블 부호화는 행하지 않지만, 과거 프레임의 스케일 팩터를 사용하여 현 프레임의 스케일 팩터를 예측할 때에, 본 발명의 실시예 2에서 이용한 것처럼, 스펙트럼 평활화 처리를 이용하여 스케일 팩터의 예측을 행한다.
도 15는 이 참고예에 따른 음성 부호화 장치(1504)의 주요한 구성을 나타내는 블록도이다. 음성 부호화 장치(1504)는 제 2 레이어 부호화부(1004)에 있어서의 MDCT 분석부(203), 스케일 팩터 산출부(204), 예측 계수 부호화부(205), 예측 계수 복호화부(206) 및 스펙트럼 미세 정보 부호화부(208)와 동일한 기능을 가지는 구성요소를 구비하고, 또 스펙트럼 미세 정보 복호화부(1511), 복호 스펙트럼 생성부(1512), 버퍼(1513), 스펙트럼 평활부(1514) 및 스케일 팩터 산출부(1515)를 새롭게 더 구비한다. 또, 스펙트럼 미세 정보 복호화부(1511)는, 제 2 레이어 복호화부(1203)에 있어서의 스펙트럼 미세 정보 복호화부(605)와 동일하게 기능하고, 복호 스펙트럼 생성부(1512)는 복호 스펙트럼 생성부(1216)와, 스펙트럼 평활부(1514)는 제 2 레이어 부호화부(1004)에 있어서의 스펙트럼 평활부(1011)와, 스케일 팩터 산출부(1515)는 스케일 팩터 산출부(202)와 동일하게 기능한다. 이하, 음성 부호화 장치(1504)에 대해 설명하지만, 제 2 레이어 부호화부(1004) 및 제 2 레이어 복호화부(1203)의 구성요소와 동일한 기능을 가지는 구성요소에 대해서는, 중복을 피하기 위해, 그 설명을 생략한다.
버퍼(1513)는, 복호 스펙트럼 생성부(1512)로부터 입력되어 오는 복호 스펙트럼을 1 프레임분 저장하고, 새로운 복호 스펙트럼이 입력되어 오면, 저장하고 있는 전(前)프레임의 복호 스펙트럼을 스펙트럼 평활부(1514), 스펙트럼 미세 정보 부호화부(208) 및 복호 스펙트럼 생성부(1512)에 입력시킨다.
따라서, 음성 부호화 장치(1504)에서는, 버퍼(1513)에 저장되어 있는 전(前) 프레임의 복호 스펙트럼에 대해서 스펙트럼 평활화가 실시되어 스케일 팩터가 산출되게 되며, 그 결과, 예측 계수 부호화부(205)에서는, 그 전(前) 프레임에 따른 스케일 팩터에 기초하여 현 프레임의 예측 계수가 산출되게 된다. 또, 스펙트럼 미세 정보 부호화부(208)와 복호 스펙트럼 생성부(1512)에서는, 전(前) 프레임의 복 호 스펙트럼을 이용하여, 스펙트럼 미세 정보의 부호화와 복호 스펙트럼의 생성이 각각 행해진다.
도 16은 이 참고예에 따른 음성 복호 장치(1603)의 주요한 구성을 나타내는 블록도이다. 음성 복호 장치(1603)는, 제 2 레이어 복호화부(1203)에 있어서의 예측 계수 복호화부(601), 스펙트럼 미세 정보 복호화부(605), 복호 스펙트럼 생성부(1216) 및 시간 영역 변환부(607)와 동일한 기능을 가지는 구성요소를 구비하며, 또 버퍼(1611), 스펙트럼 평활부(1612) 및 스케일 팩터 산출부(1613)를 새롭게 더 구비한다. 또, 스펙트럼 평활부(1612)는 제 2 레이어 복호화부(1203)에 있어서의 스펙트럼 평활부(1212)와, 스케일 팩터 산출부(1613)는 스케일 팩터 산출부(1213)와 동일하게 기능한다. 이하, 음성 복호 장치(1603)에 대해 설명하지만, 제 2 레이어 복호화부(1203)의 구성요소와 동일한 기능을 가지는 구성요소에 대해서는, 중복을 피하기 위해, 그 설명을 생략한다.
버퍼(1611)는, 복호 스펙트럼 생성부(1216)로부터 입력되어 오는 복호 스펙트럼을 1 프레임분 저장하고, 새로운 복호 스펙트럼이 입력되어 오면, 저장하고 있는 전(前)프레임의 복호 스펙트럼을 스펙트럼 평활부(1612) 및 복호 스펙트럼 생성부(1216)에 입력시킨다.
따라서, 음성 복호 장치(1603)에서는, 버퍼(1611)에 저장되어 있는 전(前) 프레임의 복호 스펙트럼에 대해서 스펙트럼 평활화가 실시되어 스케일 팩터가 산출되게 되며, 그 결과, 복호 스펙트럼 생성부(1216)에서는, 그 전(前) 프레임에 따른 스케일 팩터에 기초하여 현 프레임의 스케일 팩터가 예측되며, 이 스케일 팩터를 사용하여 복호하게 된다.
또한, 복호 스펙트럼 생성부(1216)는 원신호의 복호 스펙트럼 U(k)을 다음의 「식 11」을 이용하여 산출한다.
Figure 112007028378560-PCT00011
여기서, 식 11에 있어서, 「C(k)」는 스펙트럼 미세 정보, 「α'(m)」은 제 m 서브밴드의 복호한 예측 계수, 「Bprv(k)」는 전(前) 프레임의 MDCT 계수를 나타내며, 「k」는 제 m 서브밴드에 포함되는 주파수를 나타낸다. 또, 「Yprv(m)」은 제 m 서브밴드에 있어서의 전(前)프레임의 스케일 팩터, 「Zprv(m)」은 제 m 서브밴드에 있어서의 평활화 후의 전(前) 프레임의 스케일 팩터를 나타낸다.
이와 같이, 이 참고예의 구성에 의하면, 스펙트럼 개형의 시간적인 상관을 이용하여, 스펙트럼 개형의 예측을 행하기 때문에, 스케일 팩터의 부호화를 효율적으로 행할 수 있음과 동시에, 그 저(低)비트 레이트화를 도모할 수가 있다.
이상, 본 발명의 각 실시예에 대해서 설명했다.
본 발명에 따른 스케일러블 부호화 장치 등은, 상기의 각 실시예에 한정되지 않으며, 여러 가지 변경하여 실시하는 것이 가능하다. 예를 들면, 각 실시예는 적절히 조합하여 실시할 수 있다.
본 발명에 따른 스케일러블 부호화 장치 및 스케일러블 복호 장치는, 이동체 통신 시스템에 있어서의 통신 단말 장치 및 기지국 장치에 탑재하는 것이 가능하며, 이에 의해 상기와 동일한 작용 효과를 가지는 통신 단말 장치, 기지국 장치, 및 이동 통신 시스템을 제공할 수 있다.
또한, 여기서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명을 소프트웨어로 실현하는 것도 가능하다. 예를 들면, 본 발명에 따른 스케일러블 부호화 방법의 알고리즘을 프로그램 언어를 이용해 기술(記述)하여, 이 프로그램을 메모리에 기억해 두고 정보 처리 수단에 의해 실행시킴으로써, 본 발명에 따른 스케일러블 부호화 장치와 동일한 기능을 실현할 수 있다.
또, 상기 각 실시예의 설명에 이용한 각 기능 블록은, 전형적으로는 집적 회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화되어도 좋고, 일부 또는 모두를 포함하도록 1칩화되어도 좋다.
여기에서는, LSI라고 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI라고 호칭되는 일도 있다.
또, 집적 회로화의 수법은 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 좋다. LSI 제조 후에, 프로그램하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속이나 설정을 재구성 가능한 리컨피규러블 프로세서(configurable processor)를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 다른 기술에 의해 LSI에 대체되는 집적 회로화의 기술이 등장하면, 당연히 그 기술을 이용하여 기능 블록의 집적화를 행하여도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는 2004년 10월 13일에 출원한 일본 특허 출원 제 2004-298942 호에 기초하고 있는 것이다. 이 내용은 모두 여기에 포함시켜 놓는다.
본 발명에 따른 스케일러블 부호화 장치는, 제 2 레이어에서의 부호화 효율을 개선함과 동시에, 제 2 레이어에서의 부호화 파라미터를 이용하여 복호한 원신호의 품질을 향상시킨다고 하는 효과를 가지며, 낮은 비트 레이트이며 또한 높은 재생 음질이 요구되는 이동체 통신 시스템 등에 유용하다.

Claims (10)

  1. 입력 신호를 부호화하여 하위 레이어 부호화 파라미터를 생성하는 하위 레이어 부호화 수단과,
    상기 하위 레이어 부호화 파라미터를 복호하여 하위 레이어 복호 신호를 생성하는 하위 레이어 복호화 수단과,
    상기 입력 신호에 기초하여 상기 입력 신호의 스펙트럼 개형(槪形)을 산출하는 제 1 스펙트럼 개형 산출 수단과,
    상기 하위 레이어 복호 신호에 기초하여 상기 하위 레이어 복호 신호의 스펙트럼 개형을 산출하는 제 2 스펙트럼 개형 산출 수단과,
    상기 하위 레이어 복호 신호의 스펙트럼 개형으로부터 상기 입력 신호의 스펙트럼 개형을 예측하여 예측 정보를 얻고, 이 예측 정보를 부호화하여 상위 레이어 부호화 파라미터를 생성하는 예측 정보 부호화 수단과,
    상기 하위 레이어 부호화 파라미터와 상기 상위 레이어 부호화 파라미터를 출력하는 출력 수단
    을 구비하는 스케일러블 부호화 장치.
  2. 제 1 항에 있어서,
    부호화된 상기 예측 정보를 복호하는 예측 정보 복호화 수단과,
    상기 하위 레이어 복호 신호의 스펙트럼 개형과 복호된 상기 예측 정보에 기초하여 상기 입력 신호의 스펙트럼 개형을 추정해서, 상기 입력 신호의 스펙트럼과 상기 하위 레이어 복호 신호의 스펙트럼과 추정된 상기 입력 신호의 스펙트럼 개형에 기초하여 상기 입력 신호의 스펙트럼 개형에 나타나지 않는 상기 입력 신호의 스펙트럼의 특징을 나타내는 스펙트럼 미세 정보를 생성하여 부호화하는 스펙트럼 미세 정보 부호화 수단을 더 구비하며,
    상기 출력 수단은,
    부호화된 상기 예측 정보 및 상기 스펙트럼 미세 정보를 상위 레이어 부호화 파라미터로서 출력하는 것
    을 특징으로 하는 스케일러블 부호화 장치.
  3. 제 1 항에 있어서,
    상기 제 2 스펙트럼 개형 산출 수단은,
    상기 하위 레이어 복호 신호에 기초하여 생성된 하위 레이어 복호 신호의 스펙트럼을 평활화한 후에, 상기 하위 레이어 복호 신호의 스펙트럼 개형을 산출하는 스케일러블 부호화 장치.
  4. 제 1 항에 있어서,
    상기 예측 정보 부호화 수단은,
    상기 하위 레이어 복호 신호의 스펙트럼 개형에 곱해졌을 때에, 그 곱셈 결과를 상기 입력 신호의 스펙트럼 개형에 가장 근사시키는 예측 계수를 부호화하는 스케일러블 부호화 장치.
  5. 제 4 항에 있어서,
    상기 예측 정보 부호화 수단은,
    상기 하위 레이어 복호 신호의 스펙트럼 개형에 곱해졌을 때에, 그 곱셈 결과를 상기 입력 신호의 스펙트럼 개형에 가장 근사시키는 예측 계수가 상기 입력 신호의 소정의 주파수 대역마다 복수 존재할 경우에, 상기 복수의 예측 계수를 통합하여 벡터 양자화하는 스케일러블 부호화 장치.
  6. 제 1 항에 있어서,
    상기 예측 정보 부호화 수단은,
    상기 입력 신호의 소정의 주파수 대역마다 청각 마스킹 효과가 유효하게 이루어지는지를 판정하고, 청각 마스킹 효과가 유효하게 이루어졌다고 판정했을 때에 한하여, 상기 하위 레이어 복호 신호의 스펙트럼 개형으로부터 상기 입력 신호의 스펙트럼 개형을 예측하여 예측 정보를 얻고, 이 예측 정보를 부호화하여 상위 레 이어 부호화 파라미터를 생성하는 스케일러블 부호화 장치.
  7. 제 1 항에 있어서,
    상기 예측 정보 부호화 수단은,
    상기 입력 신호의 소정의 주파수 대역마다 청각 마스킹 효과의 유효성을 판정하고, 판정된 유효성의 정도에 따라 부호화 비트수를 조절함으로써, 상기 하위 레이어 복호 신호의 스펙트럼 개형으로부터 상기 입력 신호의 스펙트럼 개형을 예측하여 예측 정보를 얻고, 이 예측 정보를 부호화하여 상위 레이어 부호화 파라미터를 생성하는 스케일러블 부호화 장치.
  8. 제 1 항에 있어서,
    상기 하위 레이어 부호화 수단에 있어서의 샘플링 레이트는 상기 제 1 스펙트럼 개형 산출 수단에 있어서의 샘플링 레이트보다도 낮은 스케일러블 부호화 장치.
  9. 입력 신호를 스케일러블 부호화하는 스케일러블 부호화 장치에 의해 생성된 부호화 파라미터를 복호하는 스케일러블 복호 장치로서,
    상기 부호화 파라미터를 복호하여 하위 레이어 복호 신호를 생성하는 하위 레이어 복호화 수단과,
    상기 부호화 파라미터를 복호함으로써, 상기 입력 신호의 스펙트럼 개형을 예측시키는 예측 정보를 생성하는 예측 정보 복호화 수단과,
    상기 하위 레이어 복호 신호와 상기 예측 정보에 기초하여 상기 입력 신호의 스펙트럼 개형을 생성하는 스펙트럼 생성 수단
    을 구비하는 스케일러블 복호 장치.
  10. 입력 신호를 부호화하여 하위 레이어 부호화 파라미터를 생성하는 스텝과,
    상기 하위 레이어 부호화 파라미터를 복호하여 하위 레이어 복호 신호를 생성하는 스텝과,
    상기 입력 신호에 기초하여 상기 입력 신호의 스펙트럼 개형을 산출하는 스텝과,
    상기 하위 레이어 복호 신호에 기초하여 상기 하위 레이어 복호 신호의 스펙트럼 개형을 산출하는 스텝과,
    상기 하위 레이어 복호 신호의 스펙트럼 개형으로부터 상기 입력 신호의 스펙트럼 개형을 예측함으로써 예측 정보를 얻고, 이 예측 정보를 부호화하여 상위 레이어 부호화 파라미터를 생성하는 스텝
    을 구비하는 스케일러블 부호화 방법.
KR1020077008457A 2004-10-13 2005-10-11 스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법 KR20070070174A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JPJP-P-2004-00298942 2004-10-13
JP2004298942 2004-10-13

Publications (1)

Publication Number Publication Date
KR20070070174A true KR20070070174A (ko) 2007-07-03

Family

ID=36148347

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077008457A KR20070070174A (ko) 2004-10-13 2005-10-11 스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법

Country Status (7)

Country Link
US (1) US8010349B2 (ko)
EP (1) EP1801785A4 (ko)
JP (1) JP4606418B2 (ko)
KR (1) KR20070070174A (ko)
CN (1) CN101044554A (ko)
BR (1) BRPI0518133A (ko)
WO (1) WO2006041055A1 (ko)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8271275B2 (en) * 2005-05-31 2012-09-18 Panasonic Corporation Scalable encoding device, and scalable encoding method
CN101199005B (zh) * 2005-06-17 2011-11-09 松下电器产业株式会社 后置滤波器、解码装置以及后置滤波处理方法
JP5142723B2 (ja) * 2005-10-14 2013-02-13 パナソニック株式会社 スケーラブル符号化装置、スケーラブル復号装置、およびこれらの方法
RU2008121724A (ru) * 2005-11-30 2009-12-10 Панасоник Корпорэйшн (Jp) Устройство субполосного кодирования и способ субполосного кодирования
JP4969454B2 (ja) * 2005-11-30 2012-07-04 パナソニック株式会社 スケーラブル符号化装置およびスケーラブル符号化方法
WO2007119368A1 (ja) * 2006-03-17 2007-10-25 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
EP1841072B1 (de) * 2006-03-30 2016-06-01 Unify GmbH & Co. KG Verfahren und Einrichtung zum Dekodieren von schichtkodierten Daten
US20090248407A1 (en) * 2006-03-31 2009-10-01 Panasonic Corporation Sound encoder, sound decoder, and their methods
US20100161323A1 (en) * 2006-04-27 2010-06-24 Panasonic Corporation Audio encoding device, audio decoding device, and their method
CN101548318B (zh) * 2006-12-15 2012-07-18 松下电器产业株式会社 编码装置、解码装置以及其方法
JPWO2009038158A1 (ja) * 2007-09-21 2011-01-06 日本電気株式会社 音声復号装置、音声復号方法、プログラム及び携帯端末
CN101771417B (zh) * 2008-12-30 2012-04-18 华为技术有限公司 信号编码、解码方法及装置、系统
CA2759914A1 (en) * 2009-05-29 2010-12-02 Nippon Telegraph And Telephone Corporation Encoding device, decoding device, encoding method, decoding method and program therefor
JP5295380B2 (ja) 2009-10-20 2013-09-18 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
US8711012B2 (en) 2010-07-05 2014-04-29 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, encoding device, decoding device, program, and recording medium
US9135929B2 (en) * 2011-04-28 2015-09-15 Dolby International Ab Efficient content classification and loudness estimation

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1197619A (en) * 1982-12-24 1985-12-03 Kazunori Ozawa Voice encoding systems
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
US5317672A (en) * 1991-03-05 1994-05-31 Picturetel Corporation Variable bit rate speech encoder
JP3395311B2 (ja) * 1993-02-03 2003-04-14 ソニー株式会社 双方向レートコンバータ及び撮像装置
US5764698A (en) * 1993-12-30 1998-06-09 International Business Machines Corporation Method and apparatus for efficient compression of high quality digital audio
US5684920A (en) * 1994-03-17 1997-11-04 Nippon Telegraph And Telephone Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein
TW271524B (ko) * 1994-08-05 1996-03-01 Qualcomm Inc
EP0732687B2 (en) * 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP3481027B2 (ja) * 1995-12-18 2003-12-22 沖電気工業株式会社 音声符号化装置
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
KR100198476B1 (ko) * 1997-04-23 1999-06-15 윤종용 노이즈에 견고한 스펙트럼 포락선 양자화기 및 양자화 방법
JP3134817B2 (ja) 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
US6792542B1 (en) * 1998-05-12 2004-09-14 Verance Corporation Digital system for embedding a pseudo-randomly modulated auxiliary data sequence in digital samples
EP1024435A1 (en) * 1999-01-28 2000-08-02 Atr Human Information Processing Research Laboratories A mellin-transform information extractor for vibration sources
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US6446037B1 (en) 1999-08-09 2002-09-03 Dolby Laboratories Licensing Corporation Scalable coding method for high quality audio
JP2002042416A (ja) * 2000-07-28 2002-02-08 Victor Co Of Japan Ltd 音声信号の記録方法、伝送方法、記録装置、伝送装置、記録媒体及び伝送媒体
DE10102159C2 (de) 2001-01-18 2002-12-12 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer
DE60212696T2 (de) 2001-11-23 2007-02-22 Koninklijke Philips Electronics N.V. Bandbreitenvergrösserung für audiosignale
KR100908114B1 (ko) * 2002-03-09 2009-07-16 삼성전자주식회사 스케일러블 무손실 오디오 부호화/복호화 장치 및 그 방법
EP1489599B1 (en) 2002-04-26 2016-05-11 Panasonic Intellectual Property Corporation of America Coding device and decoding device
JP3881946B2 (ja) * 2002-09-12 2007-02-14 松下電器産業株式会社 音響符号化装置及び音響符号化方法
JP4239060B2 (ja) * 2002-08-30 2009-03-18 ソニー株式会社 符号化装置および方法、データ処理装置および方法、並びにプログラム
FR2852172A1 (fr) 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio

Also Published As

Publication number Publication date
CN101044554A (zh) 2007-09-26
EP1801785A1 (en) 2007-06-27
US8010349B2 (en) 2011-08-30
WO2006041055A1 (ja) 2006-04-20
BRPI0518133A (pt) 2008-10-28
JPWO2006041055A1 (ja) 2008-05-15
JP4606418B2 (ja) 2011-01-05
US20070253481A1 (en) 2007-11-01
EP1801785A4 (en) 2010-01-20

Similar Documents

Publication Publication Date Title
KR20070070174A (ko) 스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법
KR101220621B1 (ko) 부호화 장치 및 부호화 방법
RU2765565C2 (ru) Способ и система для кодирования стереофонического звукового сигнала с использованием параметров кодирования первичного канала для кодирования вторичного канала
JP5036317B2 (ja) スケーラブル符号化装置、スケーラブル復号化装置、およびこれらの方法
US8099275B2 (en) Sound encoder and sound encoding method for generating a second layer decoded signal based on a degree of variation in a first layer decoded signal
KR101340233B1 (ko) 스테레오 부호화 장치, 스테레오 복호 장치 및 스테레오부호화 방법
KR101414354B1 (ko) 부호화 장치 및 부호화 방법
JP5539203B2 (ja) 改良された音声及びオーディオ信号の変換符号化
KR100788706B1 (ko) 광대역 음성 신호의 부호화/복호화 방법
GB2323759A (en) Audio coding and decoding with compression
KR20070017524A (ko) 부호화 장치, 복호화 장치, 및 이들의 방법
US10762912B2 (en) Estimating noise in an audio signal in the LOG2-domain
KR101804922B1 (ko) 오디오 신호 처리 방법 및 장치
JPH08137494A (ja) 音響信号符号化装置、音響信号復号装置および音響信号処理装置

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid