KR20070061847A - 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이들의방법 - Google Patents

스케일러블 부호화 장치, 스케일러블 복호 장치 및 이들의방법 Download PDF

Info

Publication number
KR20070061847A
KR20070061847A KR1020077007252A KR20077007252A KR20070061847A KR 20070061847 A KR20070061847 A KR 20070061847A KR 1020077007252 A KR1020077007252 A KR 1020077007252A KR 20077007252 A KR20077007252 A KR 20077007252A KR 20070061847 A KR20070061847 A KR 20070061847A
Authority
KR
South Korea
Prior art keywords
encoding
signal
channel
monaural
decoding
Prior art date
Application number
KR1020077007252A
Other languages
English (en)
Inventor
미치요 고토
고지 요시다
히로유키 에하라
마사히로 오시키리
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070061847A publication Critical patent/KR20070061847A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
  • Stereo-Broadcasting Methods (AREA)

Abstract

스테레오 음성 신호에 대해, CELP 부호화에 의한 스케일러블 부호화를 실현하여, 부호화 효율을 향상시킬 수 있는 스케일러블 부호화 장치를 개시한다. 이 장치에 있어서, 가산기(101) 및 곱셈기(102)는, 제 1 채널 신호(CH1) 및 제 2 채널 신호(CH2)의 평균을 구하여 모노럴 신호(M)로 한다. 모노럴 신호용 CELP 부호기(103)는, 모노럴 신호(M)에 대해 CELP 부호화를 행하고, 얻어지는 부호화 파라미터를 외부로 출력함과 동시에, 이 부호화 파라미터를 이용해 합성되는 합성 모노럴 신호(M')를 제 1 채널 신호용 부호기(104)에 출력한다. 제 1 채널 신호용 부호기(104)는, 합성 모노럴 신호(M')와 제 2 채널 신호(CH2)를 이용하여, 제 1 채널 신호(CH1)에 대해서, 제 1 채널 신호(CH1)의 부호화 왜곡과 제 2 채널 신호(CH2)의 부호화 왜곡의 합을 최소로 하는 CELP 부호화를 행한다.

Description

스케일러블 부호화 장치, 스케일러블 복호 장치 및 이들의 방법{SCALABLE ENCODING DEVICE, SCALABLE DECODING DEVICE, AND METHOD THEREOF}
본 발명은, 스테레오 음성 신호에 대해, CELP 방식에 의한 부호화(이하, 단지 CELP 부호화라고 생략하는 일이 있음)에 의해 스케일러블(scalable) 부호화를 실현하는 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이러한 방법에 관한 것이다.
휴대전화기에 의한 통화와 같이, 이동 통신 시스템에 있어서의 음성 통신에서는, 현재, 모노럴(monaural) 방식에 의한 통신(모노럴 통신)이 주류이다. 그러나, 향후, 제 4 세대의 이동 통신 시스템과 같이, 전송 레이트의 새로운 고 비트레이트(高bit rate)화가 진행되면, 복수 채널을 전송만 하는 대역을 확보할 수 있게 되기 때문에, 음성 통신에 있어서도 스테레오 방식에 의한 통신(스테레오 통신)이 보급하게 될 것으로 기대된다.
예를 들면, 음악을 HDD(하드 디스크) 탑재의 휴대용 오디오 플레이어에 기록하고, 이 플레이어에 스테레오용의 이어폰이나 헤드폰 등을 장착하여 스테레오 음 악을 즐기는 사용자가 증가하고 있는 현상을 생각하면, 장래, 휴대전화기와 음악 플레이어가 결합하여, 스테레오용 이어폰이나 헤드폰 등의 장비를 이용하면서, 스테레오 방식에 의한 음성 통신을 행하는 라이프스타일이 일반적이 될 것으로 예상된다. 또, 최근 보급하고 있는 TV 회의 등의 환경에 있어서, 현장감 있는 회화를 가능하게 하기 위해, 역시 스테레오 통신이 행해지게 될 것으로 예상된다.
그런데, 스테레오 통신이 보급하더라도, 여전히 모노럴 통신도 행해질 것으로 예상된다. 왜냐하면, 모노럴 통신은 낮은 비트레이트이기 때문에 통신 코스트가 값싸지는 것이 기대되고, 또, 모노럴 통신에만 대응한 휴대전화기는 회로 규모가 작아지기 때문에 가격이 저렴해져, 고품질의 음성 통신을 원하지 않는 사용자는, 모노럴 통신에만 대응한 휴대전화기를 구입할 것이기 때문이다. 따라서, 한 개의 통신 시스템내에 있어서, 스테레오 통신에 대응한 휴대전화기와 모노럴 통신에 대응한 휴대전화기가 혼재하게 되어, 통신 시스템은, 이러한 스테레오 통신 및 모노럴 통신의 양쪽으로 대응할 필요성이 생긴다.
또, 이동 통신 시스템은 무선 신호에 의해 통신 데이터를 주고받기 때문에, 전파로(傳播路) 환경에 따라서는 통신 데이터의 일부를 상실하는 경우가 있다. 그래서, 그러한 경우에도 남은 수신 데이터로부터 원래의 통신 데이터를 복원할 수 있는 기능을 휴대전화기가 가지고 있으면 매우 유용하다.
스테레오 통신 및 모노럴 통신의 양쪽으로 대응할 수 있는 한편, 통신 데이터의 일부를 상실하더라도 남은 수신 데이터로부터 원래의 통신 데이터를 복원할 수 있는 기능으로서, 스테레오 신호와 모노럴 신호로 되어 있는 스케일러블 부호화 가 있다. 이 기능을 가진 스케일러블 부호화 장치의 예로서 예를 들면, 비특허 문헌 1에 개시된 것이 있다.
[비특허 문헌 1] ISO/IEC 14496-3: 1999 (B.14 Scalable AAC with core coder)
그렇지만, 비특허 문헌 1에 개시된 스케일러블 부호화 장치는, 오디오 신호를 대상으로 한 것으로서 음성 신호는 상정(想定)하고 있지 않기 때문에, 음성 신호에 대해서 그대로 적용하면, 부호화 효율이 저하한다고 하는 문제가 있다. 즉, 음성 신호에 대해서는, 효율적인 부호화가 가능한 CELP 부호화를 적용하는 것이 바람직하지만, 비특허 문헌 1에는, CELP 방식을 적용했을 경우의, 특히 확장 레이어(Layer)에 있어서 CELP 부호화를 적용하는 경우의 구체적인 구성은 표시되지 않으며, 상정 외인 음성 신호에 대해서 최적화되어 있는 CELP 부호화를 그대로 적용하더라도, 바람직한 부호화 효율을 얻는 것은 곤란하다.
따라서, 본 발명의 목적은, 스테레오 음성 신호에 대해, CELP 부호화에 의한 스케일러블 부호화를 실현하여, 부호화 효율을 향상시킬 수 있는 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이러한 방법을 제공하는 것이다.
본 발명의 스케일러블 부호화 장치는, 제 1 채널 신호와 제 2 채널 신호를 포함한 스테레오 음성 신호로부터 모노럴 음성 신호를 생성하는 생성 수단과, 상기 모노럴 음성 신호에 대해 CELP 방식의 부호화를 가하는 모노럴 부호화 수단과, 상기 제 2 채널 신호에 대한 CELP 방식의 부호화로 발생하는 부호화 왜곡을 산출하는 산출 수단과, 상기 제 1 채널 신호에 대해 CELP 방식의 부호화를 가하고, 해당 부호화로 발생하는 상기 제 1 채널 신호의 부호화 왜곡 및 상기 산출 수단으로 산출되는 상기 제 2 채널 신호의 부호화 왜곡의 합(合)이 최소가 되는 상기 제 1 채널 신호의 부호화 파라미터를 구하는 제 1 채널 부호화 수단을 구비하는 구성을 취한다.
도 1은 실시형태 1에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도
도 2는 모노럴 신호와 제 1 채널 신호 및 제 2 채널 신호의 관계를 나타내는 도면
도 3은 실시형태 1에 따른 모노럴 신호용 CELP 엔코더(encoder) 내부의 주요한 구성을 나타내는 블록도
도 4는 실시형태 1에 따른 제 1 채널 신호용 엔코더 내부의 주요한 구성을 나타내는 블록도
도 5는 실시형태 1에 따른 스케일러블 복호 장치의 주요한 구성을 나타내는 블록도
도 6은 실시형태 2에 따른 스케일러블 부호화 장치의 주요한 구성을 나타내는 블록도
도 7은 실시형태 2에 따른 제 1 채널 신호용 엔코더 내부의 주요한 구성을 나타내는 블록도
도 8은 실시형태 2에 따른 스케일러블 복호 장치의 주요한 구성을 나타내는 블록도
이하, 본 발명의 실시형태에 대해서, 첨부 도면을 참조하여 상세히 설명한다. 또한, 여기에서는, 2 채널로 되어 있는 스테레오 음성 신호를 부호화하는 경우를 예로 들어 설명하며, 또, 이하에 나타내는 제 1 채널 및 제 2 채널이란, 각각 L채널 및 R채널, 또는 그 반대의 채널을 가리키고 있다.
(실시형태 1)
도 1은, 본 발명의 실시형태 1에 따른 스케일러블 부호화 장치(100)의 주요한 구성을 나타내는 블록도이다. 이 스케일러블 부호화 장치(100)는, 가산기(101), 곱셈기(102), 모노럴 신호용 CELP 엔코더(103) 및 제 1 채널 신호용 엔코더(104)를 구비한다.
스케일러블 부호화 장치(100)의 각 부는 이하의 동작을 행한다.
가산기(101)는, 스케일러블 부호화 장치(100)에 입력된 제 1 채널 신호(CH1) 및 제 2 채널 신호(CH2)를 가산하여, 합 신호를 생성한다. 곱셈기(102)는, 이 합 신호에 1/2를 곱해 스케일(scale)을 반으로 하여, 모노럴 신호(M)를 생성한다. 즉, 가산기(101) 및 곱셈기(102)는, 제 1 채널 신호(CH1) 및 제 2 채널 신호(CH2) 의 평균 신호를 구하여, 이것을 모노럴 신호(M)로 한다.
모노럴 신호용 CELP 엔코더(103)는, 이 모노럴 신호(M)에 대해 CELP 부호화를 행하고, 서브 프레임 마다 얻어지는 CELP 부호화 파라미터를 스케일러블 부호화 장치(100)의 외부로 출력한다. 또, 모노럴 신호용 CELP 엔코더(103)는, 이 서브 프레임 마다의 CELP 부호화 파라미터를 이용해 (서브 프레임 마다) 합성되는 합성 모노럴 신호(M')를 제 1 채널 신호용 엔코더(104)에 출력한다. 여기서, CELP 부호화 파라미터란, LPC(LSP) 파라미터, 적응 음원 코드북 인덱스, 적응 음원 게인, 고정 음원 코드북 인덱스 및 고정 음원 게인을 말한다.
제 1 채널 신호용 엔코더(104)는, 스케일러블 부호화 장치(100)에 입력된 제 1 채널 신호(CH1)에 대해, 마찬가지로 스케일러블 부호화 장치(100)에 입력된 제 2 채널 신호(CH2)와, 모노럴 신호용 CELP 엔코더(103)로부터 출력된 합성 모노럴 신호(M')를 이용하여 후술하는 부호화를 행하고, 얻어지는 제 1 채널 신호의 CELP 부호화 파라미터를 스케일러블 부호화 장치(100)의 외부로 출력한다.
이 스케일러블 부호화 장치(100)의 특징의 하나는, 가산기(101), 곱셈기(102), 및 모노럴 신호용 CELP 엔코더(103)에 의해 제 1 레이어를, 제 1 채널 신호용 엔코더(104)에 의해 제 2 레이어를 구성하고, 제 1 레이어로부터는, 모노럴 신호의 부호화 파라미터가 출력되고, 제 2 레이어로부터는, 복호측에 있어서 제 1 레이어의 복호 신호(모노럴 신호)와 합쳐서 복호함으로써 스테레오 신호를 얻을 수 있는 부호화 파라미터가 출력되는 것이다. 즉, 본 실시형태에 따른 스케일러블 부호화 장치는, 모노럴 신호와 스테레오 신호로 되어 있는 스케일러블 부호화를 실현 한다.
이 구성에 의해, 상기의 제 1 레이어 및 제 2 레이어로부터 되는 부호화 파라미터를 취득한 복호 장치는, 전송로 환경의 악화로 인해, 제 2 레이어의 부호화 파라미터를 취득하지 못하고, 제 1 레이어의 부호화 파라미터 밖에 취득할 수 없었다 하더라도, 낮은 품질이긴 하지만 모노럴 신호를 복호할 수 있다. 또, 복호 장치가 제 1 레이어 및 제 2 레이어 양쪽의 부호화 파라미터를 취득할 수 있었을 경우, 이들을 이용하여 고품질의 스테레오 신호를 복호할 수 있다.
이하에, 스케일러블 부호화 장치(100)로부터 출력되는 제 1 레이어 및 제 2 레이어의 부호화 파라미터에 의해, 복호 장치가 스테레오 신호를 복호할 수 있는 원리에 대해 설명한다. 도 2는, 모노럴 신호와 제 1 채널 신호 및 제 2 채널 신호의 관계를 나타내는 도면이다.
부호화 전(前)의 모노럴 신호(M)는, 도 2 A에 나타내는 바와 같이, 제 1 채널 신호(CH1) 및 제 2 채널 신호(CH2)의 합에 1/2를 곱하여, 즉, 다음의 (식1)에 의해 구할 수 있다.
Figure 112007024763069-PCT00001
… (식 1)
따라서, 모노럴 신호(M)와 제 1 채널 신호(CH1)를 알면, 이상적으로는 제 2 채널 신호(CH2)도 구해진다.
그러나, 실제로는, 모노럴 신호(M)와 제 1 채널 신호(CH1)에 대해 부호화를 행하면, 부호화에 의한 부호화 왜곡이 발생하기 때문에, 상기의 (식 1)이 성립되지 않게 된다. 보다 상세하게는, 제 1 채널 신호(CH1)와 모노럴 신호(M)의 차분(差 分)을 제 1 채널 신호 차분(ΔCH1)이라 부르고, 제 2 채널 신호(CH2)와 모노럴 신호(M)의 차분을 제 2 채널 신호 차분(ΔCH2)이라 부르기로 한다면, 부호화를 행함으로써, 도 2 B에 나타내는 바와 같이 ΔCH1과 ΔCH2의 사이에 차(差)가 발생하여 (식1)의 관계를 만족시키지 못하게 되기 때문에, 복호에 의해, 모노럴 신호(M)와 제 1 채널 신호(CH1)를 얻을 수 있어도, 이들로부터는 제 2 채널 신호(CH2)를 정확하게 구할 수가 없어진다. 따라서, 복호 신호의 음질 열화를 방지하기 위해서는, 이러한 2개의 부호화 왜곡의 차를 고려한 부호화 방법을 생각할 필요가 있다.
그래서, 본 실시형태에 따른 스케일러블 부호화 장치(100)는, CH1 및 CH2의 복호 정밀도를 보다 향상시키기 위해서, CH1을 부호화 할 때에, CH2의 부호화 왜곡도 최소(最小)가 되도록 CH1의 부호화 왜곡을 최소화하여, CH1의 부호화 파라미터를 결정한다. 이에 의해, 복호 신호의 음질 열화를 방지할 수 있다.
한편, CH2의 복호는, 복호 장치에 있어서, 모노럴 신호의 복호 신호 및 CH1의 복호 신호로부터 생성한다. 상기의 (식1)로부터 이하의 (식 2)가 유도되므로, 이 (식 2)에 따라 CH2를 생성할 수 있다.
Figure 112007024763069-PCT00002
… (식 2)
도 3은, 모노럴 신호용 CELP 엔코더(103) 내부의 주요한 구성을 나타내는 블록도이다.
이 모노럴 신호용 CELP 엔코더(103)는, LPC 분석부(111), LPC 양자화부(112), LPC 합성 필터(113), 가산기(114), 청감 보정부(115), 왜곡 최소화부(116), 적응 음원 코드북(117), 곱셈기(118), 고정 음원 코드북(119), 곱셈 기(120), 게인 코드북(121) 및 가산기(122)를 구비한다.
LPC 분석부(111)는, 곱셈기(102)로부터 출력된 모노럴 신호(M)에 대해서 선형 예측 분석을 가하고, 분석 결과인 LPC 파라미터를 LPC 양자화부(112) 및 청감 보정부(115)에 출력한다.
LPC 양자화부(112)는, LPC 분석부(111)로부터 출력된 LPC 파라미터를 양자화에 적절한 LSP 파라미터로 변환한 후에 양자화하고, 얻어지는 양자화 LSP 파라미터(CL)를 모노럴 신호용 CELP 엔코더(103)의 외부로 출력한다. 이 양자화 LSP 파라미터는, 모노럴 신호용 CELP 엔코더(103)에 의해 얻어지는 CELP 부호화 파라미터의 하나이다. 또, LPC 양자화부(112)는, 이 양자화 LSP 파라미터를 양자화 LPC 파라미터로 재변환한 후, 이것을 LPC 합성 필터(113)에 출력한다.
LPC 합성 필터(113)는, LPC 양자화부(112)로부터 출력되는 양자화 LPC 파라미터를 이용하여, 후술하는 적응 음원 코드북(117) 및 고정 음원 코드북(119)에서 생성된 음원 벡터를 구동 음원으로 하여 LPC 합성 필터에 의한 합성을 행한다. 얻어진 합성 신호(M')는, 가산기(114) 및 제 1 채널 신호용 엔코더(104)에 출력된다.
가산기(114)는, LPC 합성 필터(113)로부터 출력된 합성 신호의 극성을 반전시켜, 모노럴 신호(M)에 가산함으로써 오차 신호를 산출하고, 이 오차 신호를 청감 보정부(115)에 출력한다. 이 오차 신호가 부호화 왜곡에 상당한다.
청감 보정부(115)는, LPC 분석부(111)로부터 출력된 LPC 파라미터에 기초하 여 구성되는 청감 보정 필터를 이용하여, 가산기(114)로부터 출력된 부호화 왜곡에 대해서 청감적인 보정를 행하고, 이 신호를 왜곡 최소화부(116)에 출력한다.
왜곡 최소화부(116)는, 청감 보정부(115)로부터 출력되는 부호화 왜곡이 최소가 되도록, 적응 음원 코드북(117), 고정 음원 코드북(119) 및 게인 코드북(121)에 대해 각종 파라미터를 지시한다. 구체적으로는, 왜곡 최소화부(116)는, 적응 음원 코드북(117), 고정 음원 코드북(119) 및 게인 코드북(121)에 대해서, 사용할 인덱스(CA, CD, CG)를 지시한다.
적응 음원 코드북(117)은, 과거에 생성된 LPC 합성 필터(113)에 대한 구동 음원의 음원 벡터를 내부 버퍼에 기억하고 있으며, 왜곡 최소화부(116)로부터 지시된 인덱스에 대응하는 적응 코드북 래그에 기초하여, 이 기억되어 있는 음원 벡터로부터 1 서브 프레임분을 생성하여, 적응 음원 벡터로서 곱셈기(118)에 출력한다.
고정 음원 코드북(119)은, 왜곡 최소화부(116)로부터 지시된 인덱스에 대응하는 음원 벡터를, 고정 음원 벡터로서 곱셈기(120)에 출력한다.
게인 코드북(121)은, 왜곡 최소화부(116)로부터 지시된 인덱스에 대응하는 게인, 구체적으로는, 적응 음원 코드북(117)으로부터의 적응 음원 벡터, 및 고정 음원 코드북(119)로부터의 고정 음원 벡터에 대한 각 게인을 생성하여, 곱셈기(118), (120)에 각각 출력한다.
곱셈기(118)는, 게인 코드북(121)으로부터 출력된 적응 음원 게인을, 적응 음원 코드북(117)으로부터 출력된 적응 음원 벡터에 곱하여, 가산기(122)에 출력한 다.
곱셈기(120)는, 게인 코드북(121)으로부터 출력된 고정 음원 게인을, 고정 음원 코드북(119)로부터 출력된 고정 음원 벡터에 곱하여, 가산기(122)에 출력한다.
가산기(122)는, 곱셈기(118)로부터 출력된 적응 음원 벡터와, 곱셈기(120) 로부터 출력된 고정 음원 벡터를 가산하고, 가산 후의 음원 벡터를 구동 음원으로서 LPC 합성 필터(113)에 출력한다. 또, 가산기(122)는, 얻어진 구동 음원의 음원 벡터를 적응 음원 코드북(117)에 피드백한다.
LPC 합성 필터(113)는, 상술한 바와 같이, 가산기(122)로부터 출력되는 음원 벡터, 즉, 적응 음원 코드북(117) 및 고정 음원 코드북(119)에서 생성된 음원 벡터를 구동 음원으로 하여 LPC 합성 필터에 의한 합성을 행한다.
이와 같이, 적응 음원 코드북(117) 및 고정 음원 코드북(119)에서 생성된 음원 벡터를 이용하여 부호화 왜곡이 구해지는 일련의 처리는, 폐루프(귀환 루프)로 되어 있으며, 왜곡 최소화부(116)는, 이 부호화 왜곡이 최소가 되도록, 적응 음원 코드북(117), 고정 음원 코드북(119) 및 게인 코드북(121)에 대해서 지시를 행한다. 그리고, 왜곡 최소화부(116)는, 부호화 왜곡이 최소가 되는 각종 CELP 부호화 파라미터(CA, CD, CG)를 스케일러블 부호화 장치(100)의 외부로 출력한다.
도 4는, 제 1 채널 신호용 엔코더(104) 내부의 주요한 구성을 나타내는 블록도이다.
또한, 이 제 1 채널 신호용 엔코더(104)에 있어서, LPC 분석부(131), LPC 양자화부(132), LPC 합성 필터(133), 가산기(134), 왜곡 최소화부(136), 적응 음원 코드북(137), 곱셈기(138), 고정 음원 코드북(139), 곱셈기(140), 게인 코드북(141), 및 가산기(142)는, 상기의 모노럴 신호용 CELP 엔코더(103)에 있어서의, LPC 분석부(111), LPC 양자화부(112), LPC 합성 필터(113), 가산기(114), 왜곡 최소화부(116), 적응 음원 코드북(117), 곱셈기(118), 고정 음원 코드북(119), 곱셈기(120), 게인 코드북(121) 및 가산기(122)와 각각 동일한 구성이기 때문에 설명을 생략한다.
완전히 신규 구성은, 제 2 채널 신호 오차 성분 산출부(143)이다. 또, 청감 보정부(135) 및 왜곡 최소화부(136)의 기본적 동작은, 모노럴 신호용 CELP 엔코더(103)에 있어서의 청감 보정부(115) 및 왜곡 최소화부(116)와 동일하지만, 이들은 제 2 채널 신호 오차 성분 산출부(143)의 출력을 받아, 이하와 같이 모노럴 신호용 CELP 엔코더(103)와 다른 동작도 행한다.
본 실시형태에 따른 스케일러블 부호화 장치(100)는, 제 2 레이어, 즉, 제 1 채널 신호용 엔코더(104)에 있어서 CH1을 부호화할 때에, CH1의 부호화 왜곡 및 CH2의 부호화 왜곡의 합을 최소화하도록, CH1의 부호화 파라미터를 결정한다. 이에 의해, CH1 및 CH2의 부호화 왜곡이 동시에 최적화됨으로써, 고품질의 음성을 달성할 수 있다.
제 2 채널 신호 오차 성분 산출부(143)는, 제 2 채널 신호에 임시로 CELP 부호화를 가했을 경우의 오차 성분, 즉, 상기 CH2의 부호화 왜곡을 산출한다. 구체 적으로는, 제 2 채널 신호 오차 성분 산출부(143)내의 제 2 채널 합성 신호 생성부(144)는, 합성 모노럴 신호(M')를 2배 하고, 이 값으로부터 합성 제 1 채널 신호(CH1')를 뺌으로써, 합성 제 2 채널 신호(CH2')를 산출한다. 제 2 채널 신호의 CELP 부호화는 행하지 않는다. 그리고, 가산기(145)가, 제 2 채널 신호(CH2)와 합성 제 2 채널 신호(CH2')의 차분을 구한다.
청감 보정부(135)는, 모노럴 신호용 CELP 엔코더(103)내의 청감 보정부(115)와 마찬가지로, 제 1 채널 신호(CH1)와 합성 제 1 채널 신호(CH1')의 차분, 즉 제 1 채널의 부호화 왜곡에 청감 보정을 가한다. 또, 청감 보정부(135)는, 제 2 채널 신호(CH2)와 합성 제 2 채널 신호(CH2')의 차분, 즉 제 2 채널의 부호화 왜곡에도 청감 보정을 가한다.
왜곡 최소화부(136)는, 이들 청감 보정된 부호화 왜곡, 즉, 제 1 채널 신호에 대한 부호화 왜곡 및 제 2 채널 신호에 대한 부호화 왜곡의 합을 최소화하도록, 이하에 나타내는 알고리즘에 의해 최적의 적응 음원 벡터, 고정 음원 벡터 및 이들의 게인이 결정된다.
이하는, 왜곡 최소화부(136)에 있어서 사용되는 부호화 왜곡 최소화의 알고리즘을 설명한 것이다. 또한, CH1, CH2는 입력 신호, CH1'는 CH1의 합성 신호, CH2'는 CH2의 합성 신호, M'는 합성 모노럴 신호로 한다.
제 1 채널 신호 및 제 2 채널 신호에 대한 부호화 왜곡의 합(d)은, 이하의 (식 3)으로 표시된다.
Figure 112007024763069-PCT00003
… (식 3)
그런데, 모노럴 신호와 제 1 채널 신호 및 제 2 채널 신호의 관계에 의해, CH2'는, 이하의 (식 4)에 나타내는 바와 같이, 이미 부호화된 모노럴 합성 신호(M')와 제 1 채널의 합성 신호(CH1')를 이용하여 나타낼 수 있다.
Figure 112007024763069-PCT00004
… (식 4)
따라서, (식 3)은, 이하의 (식 5)로 고쳐 쓸 수 있다.
Figure 112007024763069-PCT00005
… (식 5)
즉, 본 실시형태에 따른 스케일러블 부호화 장치는, (식 5)에 표시되는 부호화 왜곡(d)을 최소로 하는 등의 CH1'를 얻을만한 제 1 채널 신호의 CELP 부호화 파라미터를 탐색에 의해 구한다.
구체적으로는, 우선 제 1 채널에 대한 LPC 파라미터의 분석·양자화를 행한다. 다음에, 상기 (식 5)에 표시되는 부호화 왜곡을 최소로 하는 등의 적응 음원 코드북 탐색, 고정 음원 코드북 탐색, 및 음원 게인 탐색을 행하여, 적응 음원 코드북 인덱스, 고정 음원 코드북 인덱스, 및 음원 게인 인덱스를 결정한다.
즉, CH1의 부호화 왜곡 및 CH2의 부호화 왜곡의 합을 최소로 함에도 불구하고, 부호화의 과정에서는, CH1의 부호화 왜곡만을 고려하면 좋다. 이에 의해, CH2에 대한 부호화 왜곡도 동시에 고려된다.
이와 같이, 제 1 채널의 파라미터의 부호화(적응 음원 코드북 인덱스 및 고정 음원 코드북 인덱스)를 최적(最適)으로 함으로써, 제 1 채널의 신호뿐 아니라, 제 2 채널의 신호에 대해서도 부호화 왜곡을 최소화하도록 부호화를 행할 수 있다.
다음에, 왜곡 최소화부(136)에 있어서 사용되는 부호화 왜곡을 최소화하는 알고리즘의 또 한가지 바리에이션에 대해 설명한다. 여기서는, α제 1 채널 신호의 부호화 왜곡 및 제 2 채널 신호의 부호화 왜곡에 대해, 청감 보정부(135)에서의 청감적인 보정에 추가하여, 어느것인가의 채널 신호를 고(高)정밀도로 부호화하고 싶을 때, 그 정도(程度)에 맞는 보정을 하는 경우에 대해 설명한다. 또한, α, β는 청감 보정 후의 CH1 및 CH2의 각각의 부호화 왜곡에 대한 보정 계수라고 한다.
제 1 채널 신호 및 제 2 채널 신호에 대한 부호화 왜곡의 합(d')은, 이하의 (식 6)으로 표시된다.
Figure 112007024763069-PCT00006
… (식 6)
그런데, 모노럴 신호와 제 1 채널 신호 및 제 2 채널 신호의 관계에 의해, CH2'는, 다음의 (식 7)에 나타내는 바와 같이, 이미 부호화된 모노럴 합성 신호(M')와 제 1 채널의 합성 신호(CH1')로 나타낼 수 있다.
Figure 112007024763069-PCT00007
… (식 7)
따라서, (식 6)은, 이하의 (식 8)이 된다.
Figure 112007024763069-PCT00008
… (식 8)
본 실시형태에 따른 스케일러블 부호화 장치는, 이 (식 8)에 표시되는 부호화 왜곡 d'을 최소로 할만한 CH1'을 얻도록 제 1 채널 CELP 부호화 파라미터를 탐색에 의해 구한다.
구체적으로는, 우선 제 1 채널에 대한 LPC 파라미터의 분석 및 양자화를 행한다. 다음에, (식 8)에 표시되는 부호화 왜곡을 최소로 하는 등의 적응 음원 코드북 탐색, 고정 음원 코드북 탐색, 및 음원 게인 탐색을 행하여, 적응 음원 코드 북 인덱스, 고정 음원 코드북 인덱스, 및 음원 게인 인덱스를 결정한다.
즉, CH1의 부호화 왜곡 및 CH2의 부호화 왜곡의 합을 최소로 함에도 불구하고, 부호화의 과정에서는, CH1의 부호화 왜곡만을 고려하면 좋다. 이에 의해, CH2에 대한 부호화 왜곡도 동시에 고려된 것이 된다.
여기서, 동시에 고려한다고 하는 것은, 반드시 같은 비율로 부호화 왜곡을 고려한다는 것을 의미하는 것은 아니며, 예를 들면 제 1 채널 신호와 제 2 채널 신호가 완전히 독립된 신호(예를 들면, 음성 신호와 다른 음악 신호이기도 하고, 또는 화자(話者) A의 음성과 화자 B의 음성인 경우 등)로서, 제 1 채널 신호를 보다 고정밀도로 부호화하고 싶은 경우는, 제 1 채널 신호의 왜곡 신호에 대한 보정 계수 α를 β보다 큰 값으로 함으로써, 제 1 채널 신호의 왜곡을 제 2 채널 신호에 비해 작게 할 수 있다.
이와 같이, 제 1 채널의 파라미터의 부호화(적응 음원 코드북 인덱스 및 고정 음원 코드북 인덱스)를 최적으로 함으로써, 제 1 채널의 신호뿐만 아니라, 제 2 채널의 신호에 대해서도 부호화 왜곡을 최소화하도록 부호화를 행할 수 있다.
또한, α 및 β 값의 결정 방법으로서는, 입력 신호의 종별(음성 신호 혹은 음악 신호 등)에 따라 미리, 테이블로서 준비해 둘 수도 있고, 또는, 일정 구간(프레임, 서브 프레임 등)의 신호의 에너지의 비(比)를 산출하여, 결정하는 것도 가능하다.
도 5는, 상기의 스케일러블 부호화 장치(100)에 의해 생성된 부호화 파라미터를 복호하는, 즉, 스케일러블 부호화 장치(100)에 대응하는 스케일러블 복호 장 치(150)의 주요한 구성을 나타내는 블록도이다.
모노럴 신호용 CELP 디코더(decoder)(151)는, 모노럴 신호의 CELP 부호화 파라미터로부터 모노럴 신호(M')를 합성한다. 제 1 채널 신호용 디코더(152)는, 제 1 채널 신호의 CELP 부호화 파라미터로부터 제 1 채널 신호(CH1')를 합성한다.
한편, 제 2 채널 신호용 디코더(153)는, 모노럴 신호(M')와 제 1 채널 신호(CH1')로부터, 이하의 (식 9)에 따라 제 2 채널 신호(CH2')를 구한다.
Figure 112007024763069-PCT00009
…(식 9)
이와 같이, 본 실시형태에 의하면, CH1를 부호화 할 때에, CH1의 부호화 왜곡 및 CH2의 부호화 왜곡의 합을 최소화하도록, CH1의 부호화 파라미터를 결정하기때문에, CH1 및 CH2의 복호 정밀도를 향상시킬 수 있어, 복호 신호의 음질 열화를 방지할 수 있다.
또한, 본 실시형태에서는, CH1의 부호화 왜곡 및 CH2의 부호화 왜곡의 합을 최소화하도록 CH1의 부호화 파라미터를 결정했지만, CH1의 부호화 왜곡 및 CH2의 부호화 왜곡의 양쪽이 모두 최소화하도록 CH1의 부호화 파라미터를 결정해도 좋다.
(실시형태 2)
도 6은, 본 발명의 실시형태 2에 따른 스케일러블 부호화 장치(200)의 주요한 구성을 나타내는 블록도이다. 또한, 이 스케일러블 부호화 장치(200)는, 실시형태 1에 나타낸 스케일러블 부호화 장치(100)와 동일한 기본적 구성을 가지고 있어, 동일한 구성요소에는 동일한 부호를 붙이며, 그 설명을 생략한다.
본 실시형태에서는, 제 2 레이어에 있어서 CH1를 부호화 할 때에, CH1의 모노럴 신호로부터의 차분 파라미터를 부호화한다. 보다 상세하게는, 제 1 채널 신호용 엔코더(104a)는, 스케일러블 부호화 장치(200)에 입력된 제 1 채널 신호(CH1)에 대해, CELP 부호화에 준한 부호화, 즉, 선형 예측 분석 및 적응 음원 코드북 탐색에 의한 부호화를 행하고, 이 과정에서 얻어지는 부호화 파라미터와, 모노럴 신호용 CELP 엔코더(103)로부터 출력되는 모노럴 신호의 CELP 부호화 파라미터의 차분 파라미터를 구한다. 또한, 이 부호화에 대해서도 단지 CELP 부호화라고 부르기로 한다면, 상기의 처리는, 모노럴 신호(M)와 제 1 채널 신호(CH1)에 대해서, CELP 부호화 파라미터의 레벨(단계)에서 차분을 취하는 것에 상당한다. 그리고, 제 1 채널 신호용 엔코더(104a)는, 상기의 차분 파라미터에 대해서 부호화를 행한다. 이에 의해, 차분 파라미터를 양자화하게 되므로, 보다 효율적인 부호화를 행할 수 있다.
모노럴 신호용 CELP 엔코더(103)는, 실시형태 1과 마찬가지로, 제 1 채널 신호 및 제 2 채널 신호로부터 생성된 모노럴 신호에 대해서 CELP 부호화를 행하고, 모노럴 신호의 CELP 부호화 파라미터를 추출하여, 출력한다. 이 모노럴 신호의 CELP 부호화 파라미터는, 제 1 채널 신호용 엔코더(104a)에도 입력된다. 또, 모노럴 신호용 CELP 엔코더(103)는, 합성된 모노럴 신호(M')도 제 1 채널 신호용 엔코더(104a)에 출력한다.
제 1 채널 신호용 엔코더(104a)의 입력은, 제 1 채널 신호(CH1), 제 2 채널 신호(CH2), 합성된 모노럴 신호(M') 및 모노럴 신호의 CELP 부호화 파라미터이다. 제 1 채널 신호용 엔코더(104a)는, 모노럴 신호에 대한 제 1 채널 신호의 차분을 부호화하고, 제 1 채널 신호의 CELP 부호화 파라미터를 출력한다. 여기서, 모노럴 신호는 이미 CELP 부호화되어 있으며, 부호화 파라미터가 추출되어 있으므로, 제 1 채널 신호의 CELP 부호화 파라미터는, 모노럴 신호의 CELP 부호화 파라미터에 대한 차분 파라미터로 되어 있다.
도 7은, 제 1 채널 신호용 엔코더(104a) 내부의 주요한 구성을 나타내는 블록도이다.
LPC 양자화부(132)는, LPC 분석부(131)에서 얻어지는 제 1 채널 신호(CH1)의 LPC 파라미터와, 모노럴 신호용 CELP 엔코더(103)에서 이미 구해져 있는 모노럴 신호(M)의 LPC 파라미터와의 차분 LPC 파라미터를 구하고, 이 차분을 양자화하여 최종적인 제 1 채널의 LPC 파라미터로 한다.
음원 탐색은 다음과 같이 행해진다. 적응 음원 코드북(137a)은, 제 1 채널(CH1)의 적응 코드북 래그를 모노럴 신호의 적응 코드북 래그와 이에 대한 차분 래그 파라미터로서 나타낸다. 고정 음원 코드북(139a)은, CH1의 고정 음원 코드북 인덱스로서, 모노럴 신호용 CELP 엔코더(103)의 고정 음원 코드북(119)에서 사용된 모노럴 신호(M)용 고정 음원 코드북 인덱스를 이용한다. 즉, 고정 음원 코드북(139a)은, 고정 음원 벡터로서, 모노럴 신호의 부호화로 얻어진 것과 동일한 것을 이용한다.
음원 게인은, 모노럴 신호(M)의 부호화로 얻어진 적응 음원 게인과 이것에 곱하는 게인 승수값의 적(積), 또는, 모노럴 신호(M)의 부호화로 얻어진 고정 음원 게인과 이것에 곱하는 게인 승수값(적응 음원 게인에 곱하는 것과 동일)의 적(積)으로 나타내며, 이 게인 승수값을 부호화한다.
도 8은, 상기의 스케일러블 부호화 장치(200)에 대응하는 스케일러블 복호 장치(250)의 주요한 구성을 나타내는 블록도이다.
제 1 채널 신호용 디코더(152a)는, 모노럴 신호의 CELP 부호화 파라미터 및 제 1 채널 신호의 CELP 부호화 파라미터의 양쪽으로부터, 제 1 채널 신호(CH1')를 합성한다.
이와 같이, 본 실시형태에 의하면, 제 2 레이어에 있어서 CH1을 부호화할 때에, 모노럴 신호로부터의 차분 파라미터를 부호화하기 때문에, 보다 효율적인 부호화를 행할 수 있다.
이상, 본 발명에 따른 실시형태 1, 2에 대해 설명했다.
본 발명에 따른 스케일러블 부호화 장치 및 스케일러블 복호 장치는, 상기 각 실시형태에 한정되지 않으며, 여러 가지 변경하여 실시할 수 있다.
본 발명에 따른 스케일러블 부호화 장치 및 스케일러블 복호 장치는, 이동체 통신 시스템에 있어서의 통신 단말장치 및 기지국 장치에 탑재하는 것도 가능하며, 이에 의해 상기와 동일한 작용 효과를 가지는 통신 단말장치 및 기지국 장치를 제공할 수 있다.
또한, 상기 각 실시형태에 있어서, 모노럴 신호(M)를 CH1와 CH2의 평균 신호로 했지만, 반드시 이것에 한하는 것은 아니다.
또, 적응 음원 코드북은, 적응 코드북으로 불리는 일이 있다. 또, 고정 음 원 코드북은, 고정 코드북, 잡음 코드북, 확률 코드북(stochastic codebook), 또는 난수 코드북(random codebook)으로 불리는 일이 있다.
또, 여기서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어 설명했지만, 본 발명은 소프트웨어로 실현하는 것도 가능하다.
또, 상기 각 실시형태의 설명에 이용한 각 기능 블록은, 전형적으로는 집적회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화되어 있어도 좋고, 일부 또는 모두를 포함하도록 1칩화되어 있어도 좋다.
또, 여기에서는 LSI라고 했지만, 집적도의 차이에 따라, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI 등으로 호칭되는 일도 있다.
또, 집적회로화의 수법은 LSI에 한하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현되어도 좋다. LSI 제조 후에, 프로그램화하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속 혹은 설정을 재구성 가능한 리컨피규러블 프로세서를 이용해도 좋다.
또, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해, LSI에 대체되는 집적회로화의 기술이 등장하면, 당연히 그 기술을 이용하여 기능 블록의 집적화를 행하여도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는, 2004년 9월 30일에 출원한 특허출원 2004-288327에 기초하고 있는 것이다. 이 내용은 모두 여기에 포함시켜 놓는다.
본 발명에 의하면, 스테레오 음성 신호에 대해, CELP 부호화에 의한 스케일러블 부호화를 실현할 수 있어, 부호화 효율을 향상시킬 수 있다.
본 발명에 따른 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이러한 방법은, 이동체 통신 시스템에 있어서, 스테레오 음성 신호에 대해, CELP 부호화에 의한 스케일러블 부호화를 행하는 통신 단말장치, 기지국 장치 등의 용도에 적용할 수 있다.

Claims (18)

  1. 제 1 채널 신호와 제 2 채널 신호를 포함한 스테레오 음성 신호로부터 모노럴 음성 신호를 생성하는 생성 수단과,
    상기 모노럴 음성 신호에 대해 CELP 방식의 부호화를 가하는 모노럴 부호화 수단과,
    상기 제 2 채널 신호에 대한 CELP 방식의 부호화로 발생하는 부호화 왜곡을 산출하는 산출 수단과,
    상기 제 1 채널 신호에 대해 CELP 방식의 부호화를 가하고, 해당 부호화로 발생하는 상기 제 1 채널 신호의 부호화 왜곡 및 상기 산출 수단으로 산출되는 상기 제 2 채널 신호의 부호화 왜곡의 합이 최소가 되는 상기 제 1 채널 신호의 부호화 파라미터를 구하는 제 1 채널 부호화 수단
    을 구비하는 스케일러블 부호화 장치.
  2. 제 1 항에 있어서,
    상기 모노럴 부호화 수단은,
    상기 모노럴 음성 신호에 대한 CELP 방식의 부호화로 얻어지는 부호화 파라미터를 이용하여 합성 모노럴 신호를 생성하고,
    상기 제 1 채널 부호화 수단은,
    상기 제 1 채널 신호에 대한 CELP 방식의 부호화로 얻어지는 부호화 파라미터를 이용하여 합성 제 1 채널 신호를 생성하고,
    상기 산출 수단은,
    상기 합성 모노럴 신호와 상기 합성 제 1 채널 신호를 이용하여 합성 제 2 채널 신호를 생성하고, 상기 제 2 채널 신호와 상기 합성 제 2 채널 신호의 차분을 구함으로써, 상기 제 2 채널 신호에 대한 CELP 방식의 부호화로 발생하는 부호화 왜곡을 산출하는
    스케일러블 부호화 장치.
  3. 제 1 항에 있어서,
    상기 제 2 채널 신호에 대한 부호화를 행하지 않는 스케일러블 부호화 장치.
  4. 제 1 항에 있어서,
    상기 합은, 상기 제 1 채널 신호의 부호화 왜곡 및 상기 제 2 채널 신호의 부호화 왜곡에 각각 보정을 가한 왜곡의 합인 스케일러블 부호화 장치.
  5. 제 1 항에 있어서,
    상기 모노럴 부호화 수단은,
    상기 모노럴 음성 신호에 대한 선형 예측 분석으로 얻어지는 부호화 파라미터를 상기 제 1 채널 부호화 수단에 출력하고,
    상기 제 1 채널 부호화 수단은,
    상기 제 1 채널 신호에 대한 선형 예측 분석으로 얻어지는 부호화 파라미터와 상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터와의 차분을 부호화하는
    스케일러블 부호화 장치.
  6. 제 1 항에 있어서,
    상기 모노럴 부호화 수단은,
    상기 모노럴 음성 신호에 대한 적응 음원 코드북 탐색으로 얻어지는 부호화 파라미터를 상기 제 1 채널 부호화 수단에 출력하고,
    상기 제 1 채널 부호화 수단은,
    상기 제 1 채널 신호에 대한 적응 음원 코드북 탐색으로 얻어지는 파라미터와 상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터와의 차분을 부호화 하는
    스케일러블 부호화 장치.
  7. 제 1 항에 있어서,
    상기 모노럴 부호화 수단은,
    상기 모노럴 음성 신호에 대한 고정 음원 코드북 탐색으로 얻어지는 고정 음원 코드북 인덱스를 상기 제 1 채널 부호화 수단에 출력하고,
    상기 제 1 채널 부호화 수단은,
    상기 제 1 채널 신호의 고정 음원 코드북 인덱스로서, 상기 제 1 채널 부호화 수단으로부터 출력되는 고정 음원 코드북 인덱스를 이용하는
    스케일러블 부호화 장치.
  8. 제 1 항에 있어서,
    상기 생성 수단은,
    상기 제 1 채널 신호 및 상기 제 2 채널 신호의 평균을 구해 상기 모노럴 음성 신호로 하는 스케일러블 부호화 장치.
  9. 청구항 1에 기재한 스케일러블 부호화 장치에 대응하는 스케일러블 복호 장치로서,
    상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 모노 럴 음성 신호를 복호하는 모노럴 복호 수단과,
    상기 제 1 채널 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 스테레오 음성 신호의 제 1 채널 신호를 복호하는 제 1 채널 복호 수단과,
    상기 모노럴 음성 신호와 상기 스테레오 음성 신호의 제 1 채널 신호를 이용하여 상기 스테레오 음성 신호의 제 2 채널 신호를 복호하는 제 2 채널 복호 수단
    을 구비하는 스케일러블 복호 장치.
  10. 청구항 5에 기재한 스케일러블 부호화 장치에 대응하는 스케일러블 복호 장치로서,
    상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 모노럴 음성 신호를 복호하는 모노럴 복호 수단과,
    상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터와 상기 제 1 채널 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 스테레오 음성 신호의 제 1 채널 신호를 복호하는 제 1 채널 복호 수단과,
    상기 모노럴 음성 신호와 상기 스테레오 음성 신호의 제 1 채널 신호를 이용해 상기 스테레오 음성 신호의 제 2 채널 신호를 복호하는 제 2 채널 복호 수단
    을 구비하는 스케일러블 복호 장치.
  11. 청구항 6에 기재한 스케일러블 부호화 장치에 대응하는 스케일러블 복호 장치로서,
    상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 모노럴 음성 신호를 복호하는 모노럴 복호 수단과,
    상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터와 상기 제 1 채널 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 스테레오 음성 신호의 제 1 채널 신호를 복호하는 제 1 채널 복호 수단과,
    상기 모노럴 음성 신호와 상기 스테레오 음성 신호의 제 1 채널 신호를 이용해 상기 스테레오 음성 신호의 제 2 채널 신호를 복호하는 제 2 채널 복호 수단
    을 구비하는 스케일러블 복호 장치.
  12. 청구항 7에 기재한 스케일러블 부호화 장치에 대응하는 스케일러블 복호 장치로서,
    상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 모노럴 음성 신호를 복호하는 모노럴 복호 수단과,
    상기 모노럴 부호화 수단으로부터 출력되는 부호화 파라미터와 상기 제 1 채널 부호화 수단으로부터 출력되는 부호화 파라미터를 이용해 스테레오 음성 신호의 제 1 채널 신호를 복호하는 제 1 채널 복호 수단과,
    상기 모노럴 음성 신호와 상기 스테레오 음성 신호의 제 1 채널 신호를 이용해 상기 스테레오 음성 신호의 제 2 채널 신호를 복호하는 제 2 채널 복호 수단
    을 구비하는 스케일러블 복호 장치.
  13. 청구항 1에 기재한 스케일러블 부호화 장치를 구비하는 통신 단말장치.
  14. 청구항 9에 기재한 스케일러블 복호 장치를 구비하는 통신 단말장치.
  15. 청구항 1에 기재한 스케일러블 부호화 장치를 구비하는 기지국 장치.
  16. 청구항 9에 기재한 스케일러블 복호 장치를 구비하는 기지국 장치.
  17. 제 1 채널 신호와 제 2 채널 신호를 포함한 스테레오 음성 신호로부터 모노럴 음성 신호를 생성하는 생성 스텝과,
    상기 모노럴 음성 신호에 대해 CELP 방식의 부호화를 가하는 모노럴 부호화 스텝과,
    상기 제 2 채널 신호에 대한 CELP 방식의 부호화로 발생하는 부호화 왜곡을 산출하는 산출 스텝과,
    상기 제 1 채널 신호에 대해 CELP 방식의 부호화를 가하고, 해당 부호화로 발생하는 상기 제 1 채널 신호의 부호화 왜곡 및 상기 산출 스텝에 있어서 산출되는 상기 제 2 채널 신호의 부호화 왜곡의 합이 최소가 되는 상기 제 1 채널 신호의 부호화 파라미터를 구하는 제 1 채널 부호화 스텝
    을 구비하는 스케일러블 부호화 방법.
  18. 청구항 17에 기재한 스케일러블 부호화 방법에 대응하는 스케일러블 복호 방법으로서,
    상기 모노럴 부호화 스텝에서 생성되는 부호화 파라미터를 이용해 모노럴 음성 신호를 복호하는 모노럴 복호 스텝과,
    상기 제 1 채널 부호화 스텝에서 생성되는 부호화 파라미터를 이용해 스테레오 음성 신호의 제 1 채널 신호를 복호하는 제 1 채널 복호 스텝과,
    상기 모노럴 음성 신호와 상기 스테레오 음성 신호의 제 1 채널 신호를 이용해 상기 스테레오 음성 신호의 제 2 채널 신호를 복호하는 제 2 채널 복호 스텝
    을 구비하는 스케일러블 복호 방법.
KR1020077007252A 2004-09-30 2005-09-28 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이들의방법 KR20070061847A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2004288327 2004-09-30
JPJP-P-2004-00288327 2004-09-30

Publications (1)

Publication Number Publication Date
KR20070061847A true KR20070061847A (ko) 2007-06-14

Family

ID=36118956

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077007252A KR20070061847A (ko) 2004-09-30 2005-09-28 스케일러블 부호화 장치, 스케일러블 복호 장치 및 이들의방법

Country Status (10)

Country Link
US (1) US7904292B2 (ko)
EP (1) EP1801783B1 (ko)
JP (1) JP4963965B2 (ko)
KR (1) KR20070061847A (ko)
CN (1) CN101031960A (ko)
AT (1) ATE440361T1 (ko)
BR (1) BRPI0516739A (ko)
DE (1) DE602005016130D1 (ko)
RU (1) RU2007111717A (ko)
WO (1) WO2006035810A1 (ko)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2273494A3 (en) * 2004-09-17 2012-11-14 Panasonic Corporation Scalable encoding apparatus, scalable decoding apparatus
BRPI0516201A (pt) * 2004-09-28 2008-08-26 Matsushita Electric Ind Co Ltd aparelho de codificação escalonável e método de codificação escalonável
ATE545131T1 (de) * 2004-12-27 2012-02-15 Panasonic Corp Tonkodierungsvorrichtung und tonkodierungsmethode
EP1818910A4 (en) * 2004-12-28 2009-11-25 Panasonic Corp SCALABLE CODING DEVICE AND SCALABLE CODING METHOD
JP4907522B2 (ja) * 2005-04-28 2012-03-28 パナソニック株式会社 音声符号化装置および音声符号化方法
JP4850827B2 (ja) * 2005-04-28 2012-01-11 パナソニック株式会社 音声符号化装置および音声符号化方法
WO2008084688A1 (ja) * 2006-12-27 2008-07-17 Panasonic Corporation 符号化装置、復号装置及びこれらの方法
EP2128855A1 (en) * 2007-03-02 2009-12-02 Panasonic Corporation Voice encoding device and voice encoding method
JP5377287B2 (ja) * 2007-03-02 2013-12-25 パナソニック株式会社 ポストフィルタ、復号装置およびポストフィルタ処理方法
JP5295380B2 (ja) 2009-10-20 2013-09-18 パナソニック株式会社 符号化装置、復号化装置およびこれらの方法
US9779739B2 (en) * 2014-03-20 2017-10-03 Dts, Inc. Residual encoding in an object-based audio system
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA1268546C (en) * 1985-08-30 1990-05-01 STEREO VOICE SIGNAL TRANSMISSION SYSTEM
JP2746039B2 (ja) 1993-01-22 1998-04-28 日本電気株式会社 音声符号化方式
JPH06259097A (ja) * 1993-03-09 1994-09-16 Olympus Optical Co Ltd コード駆動音源音声符号化装置
JPH09261065A (ja) * 1996-03-25 1997-10-03 Mitsubishi Electric Corp 量子化装置及び逆量子化装置及び量子化逆量子化システム
JP3622365B2 (ja) 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JP3531780B2 (ja) * 1996-11-15 2004-05-31 日本電信電話株式会社 音声符号化方法および復号化方法
US6345246B1 (en) * 1997-02-05 2002-02-05 Nippon Telegraph And Telephone Corporation Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates
JP3134817B2 (ja) * 1997-07-11 2001-02-13 日本電気株式会社 音声符号化復号装置
DE19742655C2 (de) * 1997-09-26 1999-08-05 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Codieren eines zeitdiskreten Stereosignals
SE519552C2 (sv) * 1998-09-30 2003-03-11 Ericsson Telefon Ab L M Flerkanalig signalkodning och -avkodning
US6973184B1 (en) * 2000-07-11 2005-12-06 Cisco Technology, Inc. System and method for stereo conferencing over low-bandwidth links
SE519985C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP2003099095A (ja) * 2001-09-20 2003-04-04 Canon Inc オーディオ符号化装置、方法、記録媒体及びプログラム
JP2003323199A (ja) 2002-04-26 2003-11-14 Matsushita Electric Ind Co Ltd 符号化装置、復号化装置及び符号化方法、復号化方法
AU2003234763A1 (en) 2002-04-26 2003-11-10 Matsushita Electric Industrial Co., Ltd. Coding device, decoding device, coding method, and decoding method
KR100528325B1 (ko) * 2002-12-18 2005-11-15 삼성전자주식회사 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding

Also Published As

Publication number Publication date
DE602005016130D1 (de) 2009-10-01
WO2006035810A1 (ja) 2006-04-06
RU2007111717A (ru) 2008-10-10
EP1801783A1 (en) 2007-06-27
US7904292B2 (en) 2011-03-08
EP1801783B1 (en) 2009-08-19
US20080255833A1 (en) 2008-10-16
ATE440361T1 (de) 2009-09-15
CN101031960A (zh) 2007-09-05
JP4963965B2 (ja) 2012-06-27
BRPI0516739A (pt) 2008-09-23
EP1801783A4 (en) 2007-12-05
JPWO2006035810A1 (ja) 2008-05-15

Similar Documents

Publication Publication Date Title
JP4963965B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
US7945447B2 (en) Sound coding device and sound coding method
US7848932B2 (en) Stereo encoding apparatus, stereo decoding apparatus, and their methods
JP5413839B2 (ja) 符号化装置および復号装置
JP4887279B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP4887288B2 (ja) 音声符号化装置および音声符号化方法
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP2013050540A (ja) オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
JPWO2006080358A1 (ja) 音声符号化装置および音声符号化方法
JP4948401B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2008132850A1 (ja) ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法
WO2010016270A1 (ja) 量子化装置、符号化装置、量子化方法及び符号化方法
US20100121633A1 (en) Stereo audio encoding device and stereo audio encoding method
JPWO2008090970A1 (ja) ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
EP3252763A1 (en) Low-delay audio coding
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid