KR20070085532A - 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 - Google Patents

스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 Download PDF

Info

Publication number
KR20070085532A
KR20070085532A KR1020077012113A KR20077012113A KR20070085532A KR 20070085532 A KR20070085532 A KR 20070085532A KR 1020077012113 A KR1020077012113 A KR 1020077012113A KR 20077012113 A KR20077012113 A KR 20077012113A KR 20070085532 A KR20070085532 A KR 20070085532A
Authority
KR
South Korea
Prior art keywords
channel signal
encoding
signal
spatial information
information
Prior art date
Application number
KR1020077012113A
Other languages
English (en)
Inventor
미치요 고토
고지 요시다
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20070085532A publication Critical patent/KR20070085532A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

복호 신호의 음질의 열화를 방지하면서, 부호화 비트 레이트를 저감시킬 수 있는 스테레오 음성 부호화 장치를 개시한다. 이 장치에 있어서, 공간 정보 분석부(101)는 L채널 신호 및 R채널 신호의 각 공간 정보를 분석한다. 유사도 향상부(102)는 공간 정보 분석부(101)의 분석 결과에 따라, L채널 신호 및 R채널 신호의 각 공간 정보의 차이를 보정하여, L채널 신호 및 R채널 신호의 유사도를 향상시킨다. 채널 신호 부호화부(103)는 양쪽 채널 공통의 음원을 이용하여, 유사도를 향상시킨 후의 L채널 신호 및 R채널 신호를 각각 부호화하여, 얻어지는 단일 부호화 정보를 출력한다. 공간 정보 부호화부(104)는 공간 정보 분석부(101)의 분석 결과를 부호화하여, 얻어진 부호화 정보를 출력한다.

Description

스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법{STEREO ENCODING APPARATUS, STEREO DECODING APPARATUS, AND THEIR METHODS}
본 발명은 스테레오 신호에 대해서 부호화를 실시하는 스테레오 부호화 장치, 이에 대응하는 스테레오 복호 장치, 및 그 방법에 관한 것이다.
휴대 전화기에 의한 통화와 같이, 이동체 통신 시스템에 있어서의 음성 통신에서는, 현재, 모노럴(monaural) 방식에 의한 통신(모노럴 통신)이 주류이다. 그러나, 향후, 제 4 세대 이동체 통신 시스템과 같이, 전송 레이트가 더 좋아진 고비트 레이트화가 진행되면, 복수 채널을 전송할 정도의 대역을 확보할 수 있게 되기 때문에, 음성 통신에 있어서도 스테레오 방식에 의한 통신(스테레오 통신)의 보급이 기대된다.
예를 들면, 음악을 HDD(하드 디스크)를 탑재한 휴대 오디오 플레이어에 기록하여, 이 플레이어에 스테레오용 이어폰이나 헤드폰 등을 장착해 스테레오 음악을 즐기는 사용자가 증가하고 있는 현상을 생각하면, 장래, 휴대 전화기와 음악 플레이어가 결합하여, 스테레오용 이어폰이나 헤드폰 등의 장비를 이용하면서, 스테레 오 방식에 의한 음성 통신을 행하는 라이프 스타일이 일반적으로 될 것이 예상된다. 또한, 최근 보급되고 있는 TV 회의 등의 환경에 있어서, 현장감 있는 회화를 가능하게 하기 위해, 역시 스테레오 통신이 행해지게 될 것이 예상된다.
한편, 이동체 통신 시스템, 유선 방식의 통신 시스템 등에 있어서는, 시스템의 부하를 경감시키기 위해, 전송될 음성 신호를 미리 부호화함으로써 전송 정보의 저비트 레이트화를 도모하는 것이 일반적으로 행해지고 있다.
그 때문에, 최근, 스테레오 음성 신호를 부호화하는 기술이 주목을 받고 있다. 예를 들면, 크로스 채널 예측(cross-channel prediction)을 사용하여, 스테레오 음성 신호의 CELP 부호화의 가중된 예측 잔차 신호의 부호화 효율을 높이는 부호화 기술이 있다(비특허 문헌 1 참조).
비특허 문헌 1: S. A. Ramprashad, "Stereophonic CELP coding using cross channel prediction,", In Proc. of the 2000 IEEE Workshop, pp.136-138, 2000
발명의 개시
발명이 해결하려고 하는 과제
그러나, 비특허 문헌 1에 개시된 기술은, 2개 채널의 음성 신호에 대해, 각각 별도로 적응 코드북, 고정 코드북 등을 가지고 있으며, 각 채널마다 따로따로 구동 음원 신호를 발생시켜, 합성 신호를 생성하고 있다. 즉, 각 채널마다 음성 신호의 CELP 부호화를 행하여, 얻어진 각 채널의 부호화 정보를 복호측에 출력하고 있다. 그 때문에, 부호화 정보가 채널수만큼 생성되게 되어, 부호화 정보량(부호 화 비트 레이트)이 증대한다고 하는 문제가 있다.
따라서, 본 발명의 목적은, 복호 신호의 음질의 열화를 방지하면서, 부호화 정보량(부호화 비트 레이트)을 삭감할 수 있는 스테레오 부호화 장치, 스테레오 복호 장치, 및 그 방법을 제공하는 것이다.
과제를 해결하기 위한 수단
본 발명의 스테레오 부호화 장치는, 제 1 채널 신호 및 제 2 채널 신호의 양쪽 또는 한쪽을 보정함으로써 상기 제 1 채널 신호 및 상기 제 2 채널 신호간의 유사도를 높이는 보정 수단과, 유사도가 높아진 상기 제 1 채널 신호 및 제 2 채널 신호를 단일 음원으로 부호화하는 제 1 부호화 수단과, 상기 보정 수단에 있어서의 보정에 관한 정보를 부호화하는 제 2 부호화 수단을 구비하는 구성을 채택한다.
발명의 효과
본 발명에 의하면, 복호 신호의 음질의 열화를 방지하면서, 부호화 정보량(부호화 비트 레이트)을 삭감할 수 있다.
도 1은 실시예 1에 따른 스테레오 부호화 장치의 기능 블록도,
도 2는 동일 발생원으로부터의 음을 상이한 위치에서 수음(收音)한 신호의 파형 스펙트럼의 일례를 나타낸 도면,
도 3은 실시예 1에 따른 스테레오 복호 장치의 기능 블록도,
도 4는 실시예 1에 따른 스테레오 음성 부호화 장치의 주요한 구성을 나타내는 블록도
도 5는 실시예 1에 따른 음성 부호화부 내부의 주요한 구성을 나타내는 블록도,
도 6은 실시예 1에 따른 공간 정보 처리부 내부의 주요한 구성을 나타내는 블록도,
도 7은 실시예 2에 따른 스테레오 음성 부호화 장치의 주요한 구성을 나타내는 블록도,
도 8은 실시예 3에 따른 음성 부호화부의 주요한 구성을 나타내는 블록도,
도 9는 실시예 3에 따른 공간 정보 부여부 내부의 주요한 구성을 나타내는 블록도.
발명을 실시하기 위한 최선의 형태
이하, 본 발명의 실시예에 대해서 첨부 도면을 참조하여 상세하게 설명한다. 또한, 여기서는 2채널로 되어 있는 스테레오 신호를 부호화하는 경우를 예로 들어서 설명한다.
(실시예 1)
도 1은 본 발명의 실시예 1에 따른 스테레오 부호화 방법의 개념을 설명하기 위한 도면, 즉 본 실시예에 따른 스테레오 부호화 장치의 기능 블록도이다.
본 실시예에 따른 스테레오 부호화 장치에 있어서, 우선, 부호화 대상인 스테레오 신호의 L채널 신호 및 R채널 신호의 상호간의 특성 차이가 보정된다. 이 보정 처리에 의해, 양쪽 채널 신호간의 유사도는 향상된다. 그리고, 후속하는 부호화 처리에 있어서, 양쪽 채널에 공통된 단일 음원을 이용해 보정 후의 양쪽 채널 신호의 부호화를 행하여, 단일 부호화 파라미터(단일 음원이 복수의 부호화 파라미터로 표현될 경우에는, 1세트의 부호화 파라미터)를 얻는다. 양쪽 채널 신호가 서로 잘 유사한 상태로 되어 있기 때문에, 양쪽 채널 공통의 음원을 이용하여 부호화를 행할 수 있게 된다.
일반적으로, 동일 발생원으로부터의 음이라 하더라도, 마이크로폰이 놓여져 있는 위치, 즉, 수음 위치에 따라, 신호 파형이 상이한 특성을 나타내게 된다. 간단한 예로서는, 발생원으로부터의 거리에 따라, 스테레오 신호의 에너지는 감쇠함과 동시에, 도달 시간에 지연도 발생하여, 수음 위치에 따라 상이한 파형 스펙트럼을 나타내게 된다. 이와 같이, 스테레오 신호는 수음 환경이라고 하는 공간적인 인자에 의해 큰 영향을 받는다.
이 수음 환경의 차이에 의한 스테레오 신호의 특성을 보다 상세하게 설명하기 위해, 도 2에, 동일 발생원으로부터의 음을 상이한 2개의 위치에서 수음한 신호(L채널 신호 SL, R채널 신호 SR)의 파형 스펙트럼의 일례를 나타낸다.
이 도면에서, L채널 신호 및 R채널 신호가 각각 상이한 특성을 나타내고 있 음을 알 수 있다. 이 상이한 특성을 나타내는 현상은, 원래 신호의 파형에, 수음 위치에 따라 상이한 새로운 공간적인 특성이 부가된 후에, 마이크로폰 등의 수음 기기에 의해 음이 수음된 결과라고 볼 수 있다. 이 특성을 본 명세서에서는 공간 정보(Spatial Information)라고 부르기로 한다. 예를 들면, 도 2의 예에서는, L채널 신호 SL을 시간 Δt만큼 지연시키면 L채널 신호 SL'로 된다. 다음에, L채널 신호 SL'의 진폭을 일정한 비율로 감소시켜 진폭차 ΔA를 소멸시키면, L채널 신호 SL'는 동일 발생원으로부터의 신호이기 때문에, 이상적으로는 R채널 신호 SR과 일치하는 것을 기대할 수 있다. 즉, L채널 신호 및 R채널 신호의 특성의 차이는, 양쪽 채널의 공간 정보의 차를 없앰으로써, 보정할 수 있다고 생각된다.
그래서, 본 실시예에서는, 상기의 L채널 신호 및 R채널 신호의 각 공간 정보의 양쪽 또는 한쪽에 적당한 보정을 가함으로써, 2개 채널 신호의 파형을 접근시켜, 이들 신호의 유사도를 향상시킨다. 이에 따라, 부호화 처리에서 사용되는 음원을 공유할 수 있으며, 또한, 부호화 파라미터로서도 양쪽 채널 신호에 대해서 각각의 부호화 파라미터를 생성하지 않더라도, 단일(또는, 1세트의) 부호화 파라미터를 생성함으로써 양호한 정밀도의 부호화 정보를 얻을 수 있다.
공간 정보에 대해서 보다 상세하게 설명하면, 공간 정보는 음의 발생원과 각 집음 기기 사이의 공간에 관한 정보이다. 예를 들면, 집음 기기의 위치에 따라 각 채널 신호의 진폭이 변화하거나 위상이 변화하기 때문에, 각 채널 신호는 음원으로부터 각 집음 기기에 이를 때까지의 공간에 관한 정보를 포함하고 있다고 생각할 수 있다. 그리고, 이 공간 정보에 의해, 스테레오 신호는 인간의 청감에 확장감을 주게 된다. 또한, 각 채널간에 대해서도 마찬가지로 생각할 수 있어, 예를 들면, L채널 신호에는, L채널과 R채널의 각 집음 기기간의 공간에 관한 정보가 포함되어 있다고 생각할 수도 있다. 따라서, 각 채널 신호에 포함되는 공간 정보를 조작함으로써, 각 채널 신호를 서로 유사하게 하거나, 각 채널 신호를 음원 신호와 유사하게 하거나, 또는 각 채널 신호를 어떤 가상 채널의 신호와 유사하게 할 수도 있다. 이 점에 본 발명자는 주목하여, 본 발명을 하기에 이르렀다.
또한, 양쪽 채널의 유사도가 향상해 있으면, L채널 신호와 R채널 신호에서 음원을 공유할 수 있다. 따라서, L채널 신호 및 R채널 신호에 대한 보정으로서는, 공간 정보를 보정할 뿐만 아니라, 공간 정보 이외의 다른 특성을 보정함으로써 양쪽 채널의 유사도를 향상시킬 수도 있다.
도 1에 나타낸 공간 정보 분석부(101), 유사도 향상부(102), 및 채널 신호 부호화부(103)는 이하의 동작을 행함으로써, 상기 처리를 실현한다.
공간 정보 분석부(101)는 L채널 신호 SL 및 R채널 신호 SR의 각 공간 정보를 분석하고, 분석 결과를 유사도 향상부(102) 및 공간 정보 부호화부(104)에 출력한다. 유사도 향상부(102)는 공간 정보 분석부(101)로부터 출력된 분석 결과에 따라, L채널 신호 및 R채널 신호의 각 공간 정보의 차이를 보정함으로써, L채널 신호 및 R채널 신호의 유사도를 향상시킨다. 유사도 향상부(102)는 유사도를 향상시킨 후의 L채널 신호 SL"및 R채널 신호 SR"를 채널 신호 부호화부(103)에 출력한다. 채 널 신호 부호화부(103)는 양쪽 채널 공통의 음원을 이용하여, 상기 SL" 및 SR"를 각각 부호화하여, 얻어지는 1세트의 부호화 정보(채널 신호 부호화 파라미터)를 출력한다. 공간 정보 부호화부(104)는 공간 정보 분석부(101)로부터 출력된 공간 정보의 분석 결과를 부호화하여, 얻어진 부호화 정보(공간 정보 부호화 파라미터)를 출력한다.
또한, 상기의 설명에서는, SL 및 SR의 양쪽 파형을 보정하고, 이에 따라 유사도가 향상된 2개의 신호 SL", SR"를 유사도 향상부(102)로부터 출력하는 경우를 예로 들어서 설명했지만, SL 및 SR 중 어느 한쪽의 파형을 다른쪽 파형에 접근시키도록 보정해도 좋다. 그러한 경우, 예를 들면 S에 보정을 가했다고 한다면, 유사도 향상부(102)의 출력은 SL", SR로 된다. 즉, SR이 유사도 향상부(102)를 경유하지 않고 채널 신호 부호화부(103)에 직접 입력되는 구성과 실질적으로 동일하게 된다.
또한, 상기 공간 정보의 구체적인 예로서는, 이하의 것이 있다.
예를 들면, 2채널 간의 에너지비 및 지연 시간차라고 하는 2개의 파라미터를 공간 정보로서 사용할 수 있다. 이들은 정량화하기 쉬운 파라미터이다. 또한, 베리에이션(variation)으로서 주파수 대역 마다의 전파(傳播) 특성, 예를 들면, 위상차, 진폭비 등을 사용할 수도 있다.
도 3은 상기 스테레오 부호화 장치에 대응하는 본 실시예에 따른 스테레오 복호 장치의 기능 블록도이다.
공간 정보 복호부(151)는 공간 정보 부호화 파라미터를 복호하여, 얻어진 공간 정보를 채널 신호 복원부(153)에 출력한다. 채널 신호 복호부(152)는 채널 신호 부호화 파라미터를 복호하여, 특정한 채널 신호를 얻는다. 이 채널 신호는 L채널 신호 및 R채널 신호의 양쪽 채널의 공간 정보를 보정하여, L채널 및 R채널에 공통된 양쪽 채널간의 유사도를 높인 채널 신호로 된다. 이 L채널 및 R채널 공통의 채널 신호는 채널 신호 복원부(153)에 출력된다. 채널 신호 복원부(153)는, 채널 신호 복호부(152)로부터 출력된 채널 신호를, 공간 정보 복호부(151)로부터 출력되는 공간 정보를 이용해서 L채널 신호 및 R채널 신호로 각각 복원하여 출력한다.
이와 같이, 본 실시예에 따른 스테레오 부호화 방법 및 스테레오 복호 방법에 의하면, 스테레오 신호의 각 채널 신호를 보정함으로써 각 채널 신호의 유사도를 높인 뒤, 각 채널 신호를 각 채널 공통의 음원을 이용해서 부호화하므로, 부호화 정보량(부호화 비트 레이트)을 삭감할 수 있다. 또한, 부호화측, 각 채널의 공간 정보의 차도 부호화해서 출력하기 때문에, 복호측에서는 이것을 이용하여 각 채널 신호를 양호한 정밀도로 재생할 수 있다.
또한, 상기의 설명에 있어서는, 각 채널 신호의 유사도를 높인 뒤, 각 채널 공통의 음원을 이용하여 각 채널에 대해 부호화를 실시하는 경우를 예로 들어서 설명했지만, 양쪽 채널의 유사도는 높아져 있으므로, 한쪽 채널만을 선택해서 부호화 대상으로 하고, 이 선택 채널만의 부호화 정보를 출력해도 좋다. 이러한 경우에도, 복호측에서는 선택 채널의 부호화 정보를 복호하여, 이 선택 채널 신호를 재생할 수 있음과 동시에, 부호화측에서 선택되지 않은 비선택 채널에 대해서도, 부호 화측으로부터 출력된 공간 정보를 이용하여 선택 채널 내지 상기 비선택 채널의 품질을 크게 저하시키지 않고 재생할 수 있다.
또한, 유사도 향상부(102)에 있어서의 양쪽 채널 신호의 공간 정보의 보정 방법에는 여러 가지 방법이 있다. 예를 들면, 양쪽 채널 신호로부터 완전히 공간 정보를 제거하여, L채널 신호 및 R채널 신호를 음원 신호(음원으로 생성된 음성 신호)로 되돌리거나, L채널 신호 및 R채널 신호의 산술 평균 [(L+R)/2]을 모노럴 신호로 의제(擬制)하고, 양쪽 채널 신호로부터 각각 소정의 공간 정보를 제거하여, 의제 모노럴 신호로 변환하는 방법이 있다. 그러나, 이론적으로는, L채널 신호 및 R채널 신호를 상기의 음원 신호나 의제 모노럴 신호로 변환하는 것은 가능은 하지만, 실제로 음이 취득되는 것은 실제로 2개의 마이크로폰 (L채널 및 R채널)이 설치되어 있는 장소뿐이며, 부호화 장치가 취득할 수 있는 것은 L채널 신호 및 R채널 신호뿐이다.
그래서, 본 실시예의 보다 상세한 실시예에 있어서는, L채널 신호 또는 R채널 신호의 한쪽을 메인 채널 신호로 하고, 다른쪽을 서브 채널 신호로 하여, 서브 채널 신호로부터 소정의 공간 정보를 제거함으로써, 이 신호를 메인 채널 신호와 유사하게 만든다. 부호화 장치는 L채널 신호 및 R채널 신호의 양쪽을 취득하고 있으므로, 양쪽 채널 신호를 비교 분석함으로써, 상기 소정의 공간 정보, 즉, L채널 신호 및 R채널 신호의 공간 정보의 차를 구할 수 있다.
이어서, 도 4 및 도 5를 이용하여, 본 실시예에 따른 스테레오 부호화 방법에 대해서 더욱 상세하게 설명한다.
도 4는 본 실시예에 따른 스테레오 음성 부호화 장치, 즉, 도 1에 나타낸 스테레오 부호화 방법의 개념을 구현화한 스테레오 음성 부호화 장치의 주요한 구성을 나타내는 블록도이다. 여기서, 이하에 나타내는 제 1 채널 음성 신호 및 제 2 채널 음성 신호란, 각각 L채널 음성 신호 및 R채널 음성 신호, 또는 그 반대 채널의 음성 신호를 말한다.
본 실시예에 따른 스테레오 음성 부호화 장치는 음성 부호화부(100), MC 선택부(105), 및 MC 선택 정보 부호화부(106)를 구비한다. 음성 부호화부(100)는 도 1에 나타낸 기능 블록 전체에 대응한 구성이다.
MC 선택부(105)는, 입력되는 제 1 채널 음성 신호 및 제 2 채널 음성 신호의 한쪽을 메인 채널, 다른쪽을 서브 채널로 하여, 메인 채널 신호(MC) 및 서브 채널 신호(SC)를 음성 부호화부(100)에 출력한다.
음성 부호화부(100)는, 우선, 메인 채널 신호와 서브 채널 신호를 비교 분석하여, 양쪽 채널의 공간 정보의 차를 구한다. 다음에, 음성 부호화부(100)는 서브 채널 신호로부터, 상기 구해진 공간 정보의 차를 제거하여 메인 채널 신호와 유사하게 한 뒤, 양쪽 채널에 공통된 음원을 이용하여, 메인 채널 신호 및 메인 채널 신호와 유사하게 한 서브 채널 신호의 부호화를 행하여, 얻어지는 부호화 정보(채널 신호 부호화 파라미터)를 출력한다. 또한, 음성 부호화부(100)는, 구해진 공간 정보의 차에 대해서도 부호화를 행하고, 이 부호화 정보(공간 정보 부호화 파라미터)도 출력한다.
MC 선택 정보 부호화부(106)는 MC 선택부(105)에서 어느 채널을 메인 채널로 했는지를 나타내는 MC 선택 정보를 부호화하고, 이 부호화 정보(MC 선택 정보 부호화 파라미터)를 출력한다. 이 MC 선택 정보 부호화 파라미터는 음성 부호화부(100)에서 생성된 채널 신호 부호화 파라미터 및 공간 정보 부호화 파라미터와 함께, 부호화 정보로서 복호 장치에 전송된다.
도 5는 상기의 음성 부호화부(100) 내부의 주요한 구성을 나타내는 블록도이다. 여기서는, 음성 신호의 부호화 방법으로서 CELP 부호화를 이용하는 경우를 예로 들어서 설명한다.
이 음성 부호화부(100)는 크게 나누어서, 메인 채널 신호(MC)를 부호화하는 MC 부호화부(110-1), 서브 채널 신호(SC)를 부호화하는 SC 부호화부(110-2), 공간 정보 처리부(123), 및 양쪽 채널에 공통된 적응 코드북, 고정 코드북 등을 구비하고 있다. 또한, 공간 정보 처리부(123)는, 도 1에 나타낸 기능 블록 중 공간 정보 분석부(101), 유사도 향상부(102), 및 공간 정보 부호화부(104)에 대응하고 있다.
또한, MC 부호화부(110-1)와 SC 부호화부(110-2)는, 부호화 대상의 신호는 다르지만 내부의 기본적 구성은 마찬가지이다. 따라서, 동일한 구성요소에 대해서는, 동일한 부호에 MC부호화부(110-1), SC 부호화부(110-2)의 다름을 표시하는 번호 1, 2를 하이픈 뒤에 붙여서 나타낸다. 그리고, MC 부호화부(110-1)측의 구성에 대한 설명만을 하고, SC 부호화부(110-2) 측에 대해서는 기본적으로 그 설명을 생략한다.
음원 부호화부(100)는 성도(聲道) 정보와 음원 정보로 이루어져 있는 메인 채널 신호, 서브 채널 신호를, 성도 정보에 대해서는, LPC 파라미터(선형 예측 계 수)를 구함으로써 부호화하고, 음원 정보에 대해서는, 미리 기억되어 있는 음성 모델 중 어느 것을 이용할지를 특정하는 인덱스, 즉, 적응 코드북(117) 및 고정 코드북(118)에서 어떠한 음원 벡터를 생성할지를 특정하는 인덱스를 구함으로써, 음원 정보를 부호화한다.
구체적으로는, 음성 부호화부(100)의 각 부는 이하의 동작을 한다.
LPC 분석부(111-1)는 메인 채널 신호에 대해서 선형 예측 분석을 실시하여, 스펙트럼 포락(包絡) 정보인 LPC 파라미터를 구하여, LPC 양자화부(112-1) 및 청각 가중부(115-1)에 출력한다. 또한, SC 부호화부(110-2)의 LPC 분석부(111-2)는 공간 정보 처리부(123)에 의해 소정의 처리가 실시된 서브 채널 신호에 대해 상기 처리를 행한다. 공간 정보 처리부(123)의 처리에 대해서는 후술한다.
LPC 양자화부(112-1)는 LPC 분석부(111-1)에서 얻어지는 LPC 파라미터를 양자화하여, 얻어지는 양자화 LPC 파라미터를 LPC 합성 필터(113-1)에 출력하고, 양자화 LPC 파라미터의 인덱스(LPC 양자화 인덱스)를 부호화 파라미터로서 출력한다.
한편, 적응 코드북(117)은 LPC 합성 필터(113-1) 및 LPC 합성 필터(113-2)의 양쪽에서 공통으로 사용된 과거의 구동 음원을 기억하고 있어, 왜곡 최소화부(116)로부터 지시된 인덱스에 대응하는 적응 코드북 래그에 따라, 기억하고 있는 구동 음원으로부터 1서브 프레임분의 음원 벡터를 생성한다. 이 음원 벡터는 적응 코드북 벡터로서 승산기(120)에 출력된다.
고정 코드북(118)은 소정 형상의 음원 벡터를 복수개 미리 기억하고 있어, 왜곡 최소화부(116)로부터 지시된 인덱스에 대응하는 음원 벡터를 고정 코드북 벡 터로서 승산기(121)에 출력한다.
또한, 상기의 적응 코드북(117)은 유성음과 같이 주기성이 강한 성분을 표현하기 위해 사용되고, 한편, 고정 코드북(118)은 백색 잡음과 같이 주기성이 약한 성분을 표현하기 위해서 사용된다.
게인 코드북(119)은 왜곡 최소화부(116)로부터의 지시에 따라, 적응 코드북(117)으로부터 출력되는 적응 코드북 벡터용 게인(적응 코드북 게인), 및 고정 코드북(118)으로부터 출력되는 고정 코드북 벡터용 게인(고정 코드북 게인)을 생성하여, 각각 승산기(120, 121)에 출력한다.
승산기(120)는 게인 코드북(119)으로부터 출력되는 적응 코드북 게인을, 적응 코드북(117)으로부터 출력되는 적응 코드북 벡터에 곱하여 가산기(122)에 출력한다.
승산기(121)는 게인 코드북(119)으로부터 출력되는 고정 코드북 게인을, 고정 코드북(118)으로부터 출력되는 고정 코드북 벡터에 곱하여 가산기(122)에 출력한다.
가산기(122)는 승산기(120)로부터 출력되는 적응 코드북 벡터와, 승산기(121)로부터 출력되는 고정 코드북 벡터를 가산하고, 가산 후의 음원 벡터를 구동 음원으로서 LPC 합성 필터(113-1) 및 LPC 합성 필터(113-2)에 출력한다.
LPC 합성 필터(113-1)는 LPC 양자화부(112-1)로부터 출력되는 양자화 LPC 파라미터를 필터 계수로 하여, 적응 코드북(117) 및 고정 코드북(118)에서 생성되는 음원 벡터를 구동 음원으로 한 필터 함수, 즉, LPC 합성 필터를 이용하여 합성 신 호를 생성한다. 이 합성 신호는 가산기(114-1)에 출력된다.
가산기(114-1)는 LPC 합성 필터(113-1)에서 생성되는 합성 신호를 메인 채널 신호(가산기(114-2)에서는, 공간 정보 제거 후의 서브 채널 신호)로부터 감소시킴으로써 오차 신호를 산출하고, 이 오차 신호를 청각 가중부(115-1)에 출력한다. 또한, 이 오차 신호가 부호화 왜곡에 상당한다.
청각 가중부(115-1)는 LPC 분석부(111-1)로부터 출력되는 LPC 파라미터를 필터 계수로 하는 청각 가중 필터를 이용하여, 가산기(114-1) 로부터 출력되는 부호화 왜곡에 대해 청각적인 가중을 실시하여, 왜곡 최소화부(116)에 출력한다.
왜곡 최소화부(116)는 청각 가중부(115-1) 및 청각 가중부(115-2)로부터 출력되는 부호화 왜곡의 양쪽을 고려하여, 양쪽 부호화 왜곡의 합이 최소로 되는 적응 코드북(117), 고정 코드북(118), 및 게인 코드북(119)의 각 인덱스(코드북 인덱스)를 서브 프레임마다 구하고, 이들 인덱스를 부호화 정보로서 출력한다.
구체적으로는, 부호화 왜곡은 부호화 대상으로 되는 원래 신호와 합성 신호와의 차의 제곱에 의해 표시된다. 그 때문에, 청각 가중부(115-1) 로부터 출력되는 부호화 왜곡을 a2로 하고, 청각 가중부(115-2)로부터 출력되는 부호화 왜곡을 b2로 하면, 왜곡 최소화부(116)는 상기 부호화 왜곡의 합 a2+b2을 최소로 하는 적응 코드북(117), 고정 코드북(118), 및 게인 코드북(119)의 각 인덱스(코드북 인덱스)를 구한다.
또한, 상기의 적응 코드북(117) 및 고정 코드북(118)을 기초로 합성 신호를 생성하여, 이 신호의 부호화 왜곡을 구하는 일련의 처리는 폐루프(귀환 루프)로 되어 있으며, 왜곡 최소화부(116)는 각 코드북에 지시하는 인덱스를 1서브 프레임 내에 있어서 여러 가지로 변화시킴으로써 각 코드북을 탐색하여, 최종적으로 얻어지는 양쪽 채널의 부호화 왜곡을 최소로 하는 각 코드북의 인덱스를 출력한다.
또한, 부호화 왜곡이 최소로 될 때의 구동 음원은 서브 프레임마다 적응 코드북(117)으로 피드백된다. 적응 코드북(117)은 이러한 피드백에 의해, 기억되어 있는 구동 음원을 갱신한다.
도 6은 공간 정보 처리부(123) 내부의 주요한 구성을 나타내는 블록도이다. 이 공간 정보 처리부(123)에는 메인 채널 신호 및 서브 채널 신호의 양쪽이 입력된다.
공간 정보 분석부(131)는 메인 채널 신호와 서브 채널 신호를 비교 분석함으로써, 양쪽 채널 신호의 공간 정보의 차를 구하여, 얻어진 분석 결과를 공간 정보 양자화부(132)에 출력한다.
공간 정보 양자화부(132)는 공간 정보 분석부(131)에서 얻어진 양쪽 채널의 공간 정보의 차에 대해 양자화를 행하고, 얻어지는 공간 정보의 부호화 파라미터(공간 정보 양자화 인덱스)를 출력한다. 또한, 공간 정보 양자화부(132)는 공간 정보 분석부(131)에서 얻어진 양쪽 채널의 공간 정보의 차를 양자화한 공간 정보 양자화 인덱스에 대해 역양자화를 실시하여 공간 정보 제거부(133)에 출력한다.
공간 정보 제거부(133)는 공간 정보 양자화부(132)로부터 출력된 역양자화된 공간 정보 양자화 인덱스, 즉, 공간 정보 분석부(131)에서 얻어진 양쪽 채널의 공 간 정보의 차를 양자화하여 역양자화한 신호를, 입력된 서브 채널 신호로부터 감소시킴으로써, 서브 채널 신호를 메인 채널 신호와 유사한 신호로 변환시킨다. 이 공간 정보가 제거된 서브 채널 신호는 LPC 분석부(111-2)에 출력된다.
다음에, 공간 정보 처리부(123)의 각 부의 처리를, 수식을 이용하여 상세하게 설명한다. 우선, 공간 정보로서 2채널 사이의 에너지비 및 지연 시간차를 사용하는 경우를 예로 들어서 설명한다.
공간 정보 분석부(131)는 2채널간의 프레임 단위의 에너지비를 산출한다. 우선, 메인 채널 신호 및 서브 채널 신호의 1프레임 내의 에너지 EMC 및 ESC가, 다음의 수학식(1) 및 수학식(2)에 따라 구해진다.
Figure 112007039341258-PCT00001
Figure 112007039341258-PCT00002
여기서, n은 샘플 번호, FL은 1프레임의 샘플수(프레임 길이)이다. 또한, xMC(n) 및 xSC(n)은 각각 메인 채널 신호 및 서브 채널 신호의 제 n 샘플의 진폭을 나타낸다.
그리고, 공간 정보 분석부(131)는 메인 채널 신호 및 서브 채널 신호의 에너지비의 제곱근 C를 다음의 수학식(3)에 따라 구한다.
Figure 112007039341258-PCT00003
또한, 공간 정보 분석부(131)는 서브 채널 신호의 메인 채널 신호에 대한 2채널간의 신호의 시간적 편차의 양인 지연 시간차를, 이하와 같이, 2채널의 신호간에서 상호 상관이 가장 높아지는 값으로서 구한다. 구체적으로는, 메인 채널 신호 및 서브 채널 신호의 상호 상관 함수 Φ가 다음의 수학식(4)에 따라 구해진다.
Figure 112007039341258-PCT00004
여기서, m은 미리 정한 min_m부터 max_m까지의 범위의 값을 취하는 것으로 하고, Φ(m)이 최대로 될 때의 m=M을 서브 채널 신호의 메인 채널 신호에 대한 지연 시간차로 한다.
또한, 상기의 에너지비 및 지연 시간차를 이하의 수학식(5)에 의해서 구해도 좋다. 수학식(5)에서는, 메인 채널 신호와 메인 채널 신호에 대한 공간 정보를 제거한 서브 채널 신호와의 오차 D를 최소로 하는 에너지비의 제곱근 C 및 지연 시간차 m을 구한다.
Figure 112007039341258-PCT00005
공간 정보 양자화부(132)는 상기 C 및 m을 미리 정한 비트수로 양자화하여, 양자화값을 각각, CQ 및 MQ로 한다.
공간 정보 제거부(133)는 서브 채널 신호로부터 이하의 수학식(6)의 변환식에 따라 공간 정보를 제거한다.
Figure 112007039341258-PCT00006
이상 설명한 바와 같이, 본 실시예에 의하면, 스테레오 신호의 각 채널 신호를 보정함으로써 각 채널 신호의 유사도를 높인 뒤, 각 채널 신호를 각 채널 공통의 음원을 이용하여 부호화하므로, 부호화 정보량 (부호화 비트 레이트)을 삭감할 수 있다.
또한, 각 채널 신호를 공통된 음원을 이용하여 부호화하므로, 각 채널용으로 적응 코드북, 고정 코드북, 및 게인 코드북의 세트를 2세트 설치할 필요가 없어, 1세트의 각 코드북으로 음원을 생성할 수 있다. 즉, 회로 규모를 삭감할 수 있다.
또한, 이상의 구성에 있어서, 왜곡 최소화부(116)는 메인 채널 신호뿐만 아니라 서브 채널 신호도 고려하여, 양쪽 채널의 부호화 왜곡이 최소로 되는 제어를 행한다. 따라서, 부호화 성능이 높아져, 복호 신호의 음질을 향상시킬 수 있다.
또한, 본 실시예의 도 5에서는, 스테레오 음성 신호의 부호화에 CELP 부호화가 이용되는 경우를 예로 들어서 설명했지만, L채널 신호 및 R채널 신호의 유사도를 높이는 보정을 행하여, 사실상, 단일 채널 신호로 의제되는 상태로 할 수 있으면, 부호화 정보량을 삭감할 수 있으므로, 반드시 CELP 부호화와 같이 미리 정해진 음원 정보를 코드북으로서 갖는 부호화 방법이 아니더라도 무방하다.
또한, 본 실시예에 있어서는, 2채널간의 에너지비 및 지연 시간차라고 하는 2개의 파라미터의 양쪽을 공간 정보로 하는 경우를 예로 들어서 설명했지만, 공간 정보로서 어느 한쪽의 파라미터만을 사용하도록 해도 좋다. 1개의 파라미터만을 사용할 경우에는, 2개 파라미터를 이용하는 경우와 비교하여 2개 채널의 유사성을 향상시키는 효과는 감소하지만, 반대로 부호화 비트수를 더욱 삭감할 수 있다고 하는 효과가 있다.
예를 들면, 공간 정보로서 2채널간의 에너지비만을 이용할 경우, 서브 채널 신호의 변환은 상기 수학식(3)으로 구해지는 에너지비의 제곱근 C를 양자화한 값 CQ를 이용하여, 이하의 수학식(7)에 따라 행한다.
Figure 112007039341258-PCT00007
예를 들면, 공간 정보로서 2채널간의 지연 시간차만을 이용할 경우, 서브 채널 신호의 변환은 상기 수학식(4)로 구해지는 Φ(m)을 최대로 하는 m=M을 양자화한 값 MQ를 이용하여, 이하의 수학식(8)에 따라 행한다.
Figure 112007039341258-PCT00008
(실시예 2)
도 7은 본 발명의 실시예 2에 따른 스테레오 음성 부호화 장치의 주요한 구성을 나타내는 블록도이다. 이 스테레오 음성 부호화 장치는 실시예 1에 나타낸 스테레오 음성 부호화 장치(도 4 참조)와 마찬가지의 기본적 구성을 갖고 있어, 동일한 구성요소에는 동일한 부호를 부여하고, 그 설명을 생략한다.
본 실시예에 따른 스테레오 음성 부호화 장치는, 제 1 채널 및 제 2 채널 양쪽의 음성 신호의 에너지를 산출하여, 에너지가 큰 쪽의 채널을 메인 채널로서 선택한다. 여기서, 에너지는 각 프레임마다 산출되고, 메인 채널의 선택도 각 프레임마다 행해진다. 이하, 상세하게 설명한다.
에너지 산출부(201)는 제 1 채널 음성 신호 및 제 2 채널 음성 신호의 프레임마다의 에너지 E1 및 E2를 이하의 수학식(9) 및 (10)에 따라 구하여, MC 선택부(105a)에 출력한다.
Figure 112007039341258-PCT00009
Figure 112007039341258-PCT00010
MC 선택부(105a)는 제 1 채널 음성 신호 및 제 2 채널 음성 신호 중, 어느 신호를 메인 채널 신호로 할 것인지를 결정한다. 구체적으로는, 2채널의 프레임 단위의 에너지 E과 E를 비교하여, 에너지가 큰 쪽의 채널을 메인 채널로 하 고, 작은 쪽의 채널을 서브 채널로 한다. 즉, 이하의 수학식(11)이 나타내는 조건일 경우에는, 제 1 채널을 메인 채널, 제 2 채널을 서브 채널로 한다.
Figure 112007039341258-PCT00011
또한, 이하의 수학식(12)가 나타내는 조건일 경우에는, 제 2 채널을 메인 채널, 제 1 채널을 서브 채널로 한다.
Figure 112007039341258-PCT00012
MC 선택 정보 부호화부(106)는 프레임마다 메인 채널 및 서브 채널의 선택이 행해지고 있기 때문에, 어느 채널이 메인 채널로 선택되었는지의 정보(MC 선택 정보)를 부호화한다.
이와 같이, 본 실시예에 의하면, 양쪽 채널의 프레임마다 에너지를 산출하여, 에너지가 큰 쪽 채널을 메인 채널로 선택한다. 여기서, 일반적으로, 에너지가 큰 신호 쪽이, 보다 많은 정보량을 포함하고 있다고 추측된다. 따라서, 본 실시예에서는, 보다 정보량이 많은 쪽의 채널을 메인 채널로 함으로써, 부호화 오차를 작게 할 수 있다.
또한, 본 실시예에서는, 각 채널의 에너지를 산출하고, 이것을 기준으로 하여 메인 채널을 선택하는 경우를 예로 들어서 설명했지만, 직접적으로 각 채널의 정보량을 인식하여, 정보량이 많은 쪽의 채널을 메인 채널로 선택하도록 해도 좋다.
또한, 본 실시예에서는, 단순히 프레임 단위의 에너지를 메인 채널 선택 기준으로 하는 경우를 예로 들어서 설명했지만, 이에 한정되지 않고, 예를 들면, 에너지를 평활화한 값을 사용하도록 해도 좋다. 이에 따라, 에너지 변동에 따라 메인 채널 및 서브 채널이 과도하게 전환되는 것을 억제할 수 있다. 여기서, 에너지를 평활화하기 위해서는, 예를 들면, 다음의 수학식(13) 및 (14)를 이용하여, 평활화된 에너지 E1S 및 E2S를 구한다.
Figure 112007039341258-PCT00013
Figure 112007039341258-PCT00014
여기서, α1S 및 α2S는 다음의 수학식(15)를 만족하는 정수이다.
Figure 112007039341258-PCT00015
(실시예 3)
본 발명의 실시예 1, 2에서는, SC 부호화부(110-2)의 실제 부호화 대상은, 공간 정보 처리부(123)에 의해 공간 정보가 제거된 후의 서브 채널 신호이다. 구체적으로는, SC 부호화부(110-2)는 공간 정보 제거 후의 서브 채널 신호로부터 합성 신호를 생성하고, 이 합성 신호와 원래의 공간 정보 제거 후의 서브 채널 신호 사이의 부호화 왜곡이 최소로 되도록 부호화 파라미터의 최적화 루프를 돌려서 부호화를 행하고 있다. 환언하면, 실시예 1, 2는, 서브 채널의 부호화에 있어서, 공간 정보 제거 후의 서브 채널 신호를 부호화 대상으로 하여, 이 공간 정보 제거 후의 서브 채널 신호를 부호화 처리의 타겟 신호로서 부호화를 행하고 있다.
본 발명의 실시예 3에서는, 서브 채널의 부호화에 있어서, 공간 정보가 제거되기 전의 서브 채널 신호, 즉, 공간 정보를 그대로 포함하고 있는 서브 채널 신호를 부호화 처리의 타겟 신호로 하여 부호화를 행한다.
또한, 본 실시예에 따른 스테레오 음성 부호화 장치의 기본적 구성은, 실시예 1에 나타낸 스테레오 음성 부호화 장치(도 4 참조)와 마찬가지이므로, 그 설명은 생략하고, 실시예 1에 나타낸 음성 부호화부(100)(도 5 참조)와 상이한 구성인 음성 부호화부(300)에 대해서 이하에서 설명한다.
도 8은 상기의 음성 부호화부(300)의 주요한 구성을 나타내는 블록도이다. 실시예 1에 나타낸 음성 부호화부(100)와 동일한 구성요소에는 동일한 부호를 부여하고, 그 설명을 생략한다.
SC 부호화부(310)는 공간 정보 처리부(123)에 의해 공간 정보가 제거된 서브 채널 신호에 대해, 공간 정보 부여부(301)에 의해 재차 공간 정보를 부가한다. 즉, 공간 정보 부여부(301)는 공간 정보 처리부(123)로부터 서브 채널 신호에 대한 공간 정보가 주어져, 이것을 LPC 합성 필터(113-2)로부터 출력되는 합성 신호에 부가하여, 가산기(114-2)에 출력한다.
가산기(114-2)는 공간 정보 부여부(301)로부터 출력되는 공간 정보 부여 후 의 합성 신호를 서브 채널 신호로부터 감소시킴으로써 부호화 왜곡을 산출하고, 이 부호화 왜곡을 청각 가중부(115-2)를 경유하여 왜곡 최소화부(116)에 출력한다.
왜곡 최소화부(116)는 MC 부호화부(110-1) 및 SC 부호화부(310) 로부터 출력되는 부호화 왜곡에 대해, 상술한 바와 같이, 양쪽의 부호화 왜곡의 합이 최소로 되는 각 코드북의 인덱스를 서브 프레임마다 구하여, 이 인덱스를 부호화 정보로서 출력한다.
또한, SC 부호화부(310)는 서브 채널 신호에 대한 청각 가중을, 서브 채널 신호를 기초로 생성되는 LPC 계수에 의해 행하기 위해서, LPC 분석부(111-2)와는 별도로 LPC 분석부(302)를 구비한다.
LPC 분석부(302)는 서브 채널 신호를 입력으로 하여 LPC 분석을 행하여, 얻어지는 LPC 계수를 청각 가중부(115-2)에 출력한다.
청각 가중부(115-2)는 LPC 분석부(302)로부터 출력되는 LPC 계수를 이용하여, 가산기(114-2)로부터 출력되는 부호화 왜곡에 대해 청각 가중을 행한다.
도 9는 상기 공간 정보 부여부(301) 내부의 주요한 구성을 나타내는 블록도이다.
공간 정보 역양자화부(321)는 공간 정보 처리부(123)로부터 출력된 공간 정보 양자화 인덱스를 역양자화하여, 서브 채널 신호의 메인 채널 신호에 대한 공간 정보의 차를 공간 정보 복호부(322)에 출력한다.
공간 정보 복호부(322)는 LPC 합성 필터(113-2)로부터 출력되는 합성 신호에 대해, 공간 정보 역양자화부(321)로부터 출력되는 공간 정보의 차를 적용하여, 공 간 정보 부여 후의 합성 신호를 생성하여, 가산기(114-2)에 출력한다.
다음에, 공간 정보 부여부(301)에 있어서의 공간 정보를 부여한 서브 채널 신호를 생성하기 위한 처리를, 수식을 이용하여 설명한다.
우선, 공간 정보로서 메인 채널 신호와 서브 채널 신호 사이의 에너지비 및 지연 시간차를 사용하는 경우에 대해서 설명한다. 실시예 1과 마찬가지로, 공간 정보 양자화 인덱스인 에너지비와 지연 시간차의 양자화값을 각각 CQ, MQ로 하면, 공간 정보 역양자화부(321)는 서브 채널 신호의 메인 채널 신호에 대한 공간 정보의 차, 즉 에너지비 C' 및 지연 시간차 M'를 구한다. 그리고, 공간 정보 복호부(322)는 이하의 수학식(16)을 이용하여 공간 정보 부여 후의 서브 채널 신호를 구한다.
Figure 112007039341258-PCT00016
또한, 공간 정보로서 2채널간의 에너지비만을 이용할 경우에는, 공간 정보 부여 후의 서브 채널 신호는 이하의 수학식(17)에 의해 구해진다.
Figure 112007039341258-PCT00017
또한, 공간 정보로서 2채널간의 지연 시간차만을 이용할 경우, 공간 정보 부 여 후의 서브 채널 신호는 이하의 수학식(18)에 의해 구해진다.
Figure 112007039341258-PCT00018
이와 같이, 본 실시예에 의하면, 서브 채널의 부호화에 있어서, 공간 정보가 제거되기 전의 서브 채널 신호를 부호화 처리의 타겟 신호로서 부호화를 행하기 때문에, 이하의 이유에 의해 실시예 1, 2보다도 부호화 성능을 더욱 향상시킬 수 있다.
즉, 실시예 1, 2에서는, 공간 정보 제거 후의 서브 채널 신호를 실제의 부호화 대상으로 하여, 이 부호화 왜곡을 최소화하고 있다. 그러나, 복호 신호로서 최종적으로 출력되어야 할 신호는 서브 채널 신호이며, 공간 정보 제거 후의 서브 채널 신호는 아니다. 그러면, 공간 정보 제거 후의 서브 채널 신호를 부호화 처리의 타겟 신호로 하면, 최종적인 복호 신호인 서브 채널 신호에 포함되는 부호화 왜곡은 충분히 최소화되지 않을 가능성이 있다. 예를 들면, 서브 채널 신호의 진폭이 메인 채널 신호의 진폭보다 큰 경우라 하더라도, 왜곡 최소화부(116)에 입력되는 서브 채널 신호의 부호화 왜곡은, 메인 채널 신호와의 에너지차를 제거한 후의 신호를 기초로 산출되는 것이다. 그런데, 복호 장치에 있어서는, 복호 후의 서브 채널 신호에 별도 복호된 공간 정보를 부여하여 합성 신호를 생성하게 된다. 그러면, 공간 정보 부여에 의해, 서브 채널 신호의 진폭이 증폭되게 되므로, 이것에 원래 포함되는 부호화 왜곡도 증폭되어 버리게 된다.
한편, 본 실시예에서는, 공간 정보가 제거되어 있지 않은 서브 채널 신호 그 자체를 부호화 대상으로 하고, 최종적인 복호 신호를 얻을 때에 포함될 수 있는 부호화 왜곡을 대상으로 왜곡 최소화 처리를 행한다. 따라서, 부호화 성능을 더욱 향상시킬 수 있다.
또한, 이상의 구성에 있어서, 청각 가중 처리에 이용하는 LPC 계수는 SC 부호화부(310)의 입력 신호인 서브 채널 신호를 별도 LPC 분석하여 구한다. 즉, 최종적인 복호 신호이어야 할 서브 채널 신호 그 자체를 반영한 청각 가중치에 따라 청각 가중을 행한다. 따라서, 보다 청각적으로 왜곡이 작은 부호화 파라미터를 얻을 수 있다.
이상, 본 발명의 각 실시예에 대해서 설명하였다.
본 발명에 따른 스테레오 부호화 장치 및 스테레오 부호화 방법은 상기 각 실시예에 한정되지 않고, 여러 가지로 변경해서 행하는 것이 가능하다.
본 발명에 따른 스테레오 부호화 장치는 이동체 통신 시스템에 있어서의 통신 단말 장치 및 기지국 장치에 탑재하는 것이 가능하며, 이에 따라 상기와 마찬가지의 작용 효과를 갖는 통신 단말장치 및 기지국 장치 제공할 수 있다. 또한, 본 발명에 따른 스테레오 부호화 장치 및 스테레오 부호화 방법은 유선 방식의 통신 시스템에 있어서도 이용 가능하다.
또한, 여기서는, 본 발명을 하드웨어로 구성하는 경우를 예로 들어서 설명했지만, 본 발명을 소프트웨어로 실현하는 것도 가능하다. 예를 들면, 본 발명에 따른 스테레오 부호화 방법의 처리 알고리즘을 프로그램 언어에 의해서 기재하고, 이 프로그램을 메모리에 기억시켜 두고서 정보 처리 수단에 의해서 실행시킴으로써, 본 발명의 스테레오 부호화 장치와 마찬가지의 기능을 실현할 수 있다.
또한, 적응 코드북(adaptive codebook)은 적응 음원 코드북이라고 불리는 경우가 있으며, 고정 코드북(fixed codebook)은 고정 음원 코드북으로 불리는 경우가 있다. 또한, 고정 코드북은 확률 코드북(stochastic codebook) 또는 난수 코드북(random codebook)이라고 불리는 경우가 있다.
또한, 상기 각 실시예의 설명에 이용한 각 기능 블록은 전형적으로는 집적회로인 LSI로서 실현된다. 이들은 개별적으로 1칩화 되어 있어도 좋고, 일부 또는 모두를 포함하도록 1칩화 되어 있어도 좋다.
또한, 여기서는 LSI라고 했지만, 집적도의 차이에 따라서, IC, 시스템 LSI, 슈퍼 LSI, 울트라 LSI 등으로 호칭되는 경우도 있다.
또한, 집적 회로화의 수법은 LSI에 한정하는 것은 아니며, 전용 회로 또는 범용 프로세서로 실현해도 좋다. LSI 제조 후에, 프로그램화하는 것이 가능한 FPGA(Field Programmable Gate Array)나, LSI 내부의 회로 셀의 접속 또는 설정을 재구성 가능한 리컨피규러블 프로세서(reconfigurable processor)를 이용해도 좋다.
또한, 반도체 기술의 진보 또는 파생하는 별개의 기술에 의해, LSI에 대체되는 집적 회로화의 기술이 등장하면, 당연히 그 기술을 이용하여 기능 블록의 집적화를 행해도 좋다. 바이오 기술의 적응 등이 가능성으로서 있을 수 있다.
본 명세서는 2004년 11월 30일에 출원한 일본 특허 출원 제2004-347273호 및 2005년 3월 31일에 출원한 일본 특허 출원 제2005-100850호에 기초하고 있다. 이들 내용은 모두 여기에 포함시켜 놓는다.
본 발명에 따른 스테레오 부호화 장치, 스테레오 복호 장치, 및 그 방법은, 이동체 통신 시스템에 있어서의 통신 단말 장치, 기지국 장치 등의 용도에 적용할 수 있다.

Claims (17)

  1. 제 1 채널 신호 및 제 2 채널 신호의 양쪽 또는 한쪽을 보정함으로써 상기 제 1 채널 신호 및 상기 제 2 채널 신호간의 유사도를 높이는 보정 수단과,
    유사도가 높아진 상기 제 1 채널 신호 및 제 2 채널 신호를 단일 음원으로 부호화하는 제 1 부호화 수단과,
    상기 보정 수단에 있어서의 보정에 관한 정보를 부호화하는 제 2 부호화 수단
    을 구비하는 스테레오 부호화 장치.
  2. 제 1 항에 있어서,
    상기 보정 수단은, 상기 제 1 채널 신호 및 상기 제 2 채널 신호에 포함되는 공간 정보의 양쪽 또는 한쪽을 보정하고,
    상기 제 2 부호화 수단은, 상기 공간 정보의 보정에 관한 정보를 부호화하는
    스테레오 부호화 장치.
  3. 제 2 항에 있어서,
    상기 공간 정보는, 상기 제 1 채널 신호 및 상기 제 2 채널 신호의 에너지 및 지연 시간의 양쪽 또는 한쪽을 포함하는 스테레오 부호화 장치.
  4. 제 1 항에 있어서,
    상기 제 1 부호화 수단은, 1조의 적응 코드북 및 고정 코드북을 구비하는 스테레오 부호화 장치.
  5. 제 1 항에 있어서,
    상기 제 1 부호화 수단은, 상기 제 1 채널 신호 및 상기 제 2 채널 신호의 양쪽의 부호화 왜곡의 합을 최소로 하는 상기 음원을 구하는 스테레오 부호화 장치.
  6. 제 1 항에 있어서,
    상기 보정 수단은, 상기 제 1 채널 신호의 공간 정보와 상기 제 2 채널 신호의 공간 정보와의 차를 구하여, 당해 차를 상기 제 1 채널 신호 또는 상기 제 2 채널 신호 중 어느 한쪽으로부터 제거하는 스테레오 부호화 장치.
  7. 제 1 항에 있어서,
    상기 보정 수단은, 상기 제 1 채널 신호 및 상기 제 2 채널 신호 중, 정보량이 많은 채널 신호를 메인 채널 신호로 하고, 다른쪽을 서브 채널 신호로 하여, 당해 서브 채널 신호의 파형을 상기 메인 채널 신호의 파형에 접근시키는 보정을 행하는 스테레오 부호화 장치.
  8. 제 7 항에 있어서,
    상기 정보량이 많은 채널 신호는, 에너지가 보다 큰 쪽의 채널 신호인 스테레오 부호화 장치.
  9. 제 1 항에 있어서,
    상기 보정 수단은, 상기 제 1 채널 신호 및 상기 제 2 채널 신호 중, 한쪽을 메인 채널 신호로 하고, 다른쪽을 서브 채널 신호로 하여, 메인 채널 신호의 공간 정보와 서브 채널 신호의 공간 정보와의 차를 구하여, 당해 차를 서브 채널 신호로부터 제거하고,
    상기 제 1 부호화 수단은, 당해 차가 제거된 서브 채널 신호를 부호화 처리의 타겟 신호로 하는
    스테레오 부호화 장치.
  10. 제 1 항에 있어서,
    상기 보정 수단은, 상기 제 1 채널 신호 및 상기 제 2 채널 신호 중, 한쪽을 메인 채널 신호로 하고, 다른쪽을 서브 채널 신호로 하여, 메인 채널 신호의 공간 정보와 서브 채널 신호의 공간 정보와의 차를 구하여, 당해 차를 서브 채널 신호로부터 제거하고,
    상기 제 1 부호화 수단은, 당해 차가 제거되기 전의 서브 채널 신호를 부호화 처리의 타겟 신호로 하고, 당해 차가 제거된 서브 채널 신호로부터 생성되는 합성 신호를 이용하여 부호화를 행하는
    스테레오 부호화 장치.
  11. 제 1 채널 신호 및 제 2 채널 신호의 양쪽 또는 한쪽에 대해서 실시된 보정에 관한 정보를 복호하는 제 1 복호 수단과,
    상기 보정이 실시되어, 유사도가 높아진 제 1 채널 신호 및 제 2 채널 신호에 관한 정보를 복호하는 제 2 복호 수단과,
    상기 보정에 관한 정보와, 상기 제 1 채널 신호 및 제 2 채널 신호에 관한 정보를 이용하여, 상기 제 1 채널 신호 및 상기 제 2 채널 신호를 복원하는 복원 수단
    을 구비하는 스테레오 복호 장치.
  12. 청구항 1에 기재된 스테레오 부호화 장치를 구비하는 통신 단말 장치.
  13. 청구항 11에 기재된 스테레오 복호 장치를 구비하는 통신 단말 장치.
  14. 청구항 1에 기재된 스테레오 부호화 장치를 구비하는 기지국 장치.
  15. 청구항 11에 기재된 스테레오 복호 장치를 구비하는 기지국 장치.
  16. 제 1 채널 신호 및 제 2 채널 신호의 양쪽 또는 한쪽을 보정함으로써 상기 제 1 채널 신호 및 상기 제 2 채널 신호간의 유사도를 높이는 보정 단계와,
    유사도가 높아진 상기 제 1 채널 신호 및 제 2 채널 신호를 단일 음원으로 부호화하는 제 1 부호화 단계와,
    상기 보정 단계에서의 보정에 관한 정보를 부호화하는 제 2 부호화 단계
    를 구비하는 스테레오 부호화 방법.
  17. 제 1 채널 신호 및 제 2 채널 신호의 양쪽 또는 한쪽에 대해 실시된 보정에 관한 정보를 복호하는 제 1 복호 단계와,
    상기 보정이 실시되어, 유사도가 높아진 제 1 채널 신호 및 제 2 채널 신호에 관한 정보를 복호하는 제 2 복호 단계와,
    상기 보정에 관한 정보와, 상기 제 1 채널 신호 및 제 2 채널 신호에 관한 정보를 이용하여, 상기 제 1 채널 신호 및 상기 제 2 채널 신호를 복원하는 복원 단계
    를 구비하는 스테레오 복호 방법.
KR1020077012113A 2004-11-30 2005-11-28 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법 KR20070085532A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2004347273 2004-11-30
JPJP-P-2004-00347273 2004-11-30
JPJP-P-2005-00100850 2005-03-31
JP2005100850 2005-03-31

Publications (1)

Publication Number Publication Date
KR20070085532A true KR20070085532A (ko) 2007-08-27

Family

ID=36565000

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077012113A KR20070085532A (ko) 2004-11-30 2005-11-28 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법

Country Status (7)

Country Link
US (1) US7848932B2 (ko)
EP (1) EP1814104A4 (ko)
JP (1) JPWO2006059567A1 (ko)
KR (1) KR20070085532A (ko)
BR (1) BRPI0516658A (ko)
RU (1) RU2007120056A (ko)
WO (1) WO2006059567A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101035070B1 (ko) * 2009-06-09 2011-05-19 주식회사 라스텔 고음질 가상 공간 음향 생성 장치 및 방법

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4887288B2 (ja) * 2005-03-25 2012-02-29 パナソニック株式会社 音声符号化装置および音声符号化方法
JPWO2008090970A1 (ja) * 2007-01-26 2010-05-20 パナソニック株式会社 ステレオ符号化装置、ステレオ復号装置、およびこれらの方法
WO2009084226A1 (ja) * 2007-12-28 2009-07-09 Panasonic Corporation ステレオ音声復号装置、ステレオ音声符号化装置、および消失フレーム補償方法
US8386267B2 (en) * 2008-03-19 2013-02-26 Panasonic Corporation Stereo signal encoding device, stereo signal decoding device and methods for them
WO2009146734A1 (en) * 2008-06-03 2009-12-10 Nokia Corporation Multi-channel audio coding
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
CN101521013B (zh) * 2009-04-08 2011-08-17 武汉大学 空间音频参数双向帧间预测编解码装置
CN102280107B (zh) * 2010-06-10 2013-01-23 华为技术有限公司 边带残差信号生成方法及装置
JP6061121B2 (ja) * 2011-07-01 2017-01-18 ソニー株式会社 オーディオ符号化装置、オーディオ符号化方法、およびプログラム
JP6267860B2 (ja) * 2011-11-28 2018-01-24 三星電子株式会社Samsung Electronics Co.,Ltd. 音声信号送信装置、音声信号受信装置及びその方法
KR20140017338A (ko) * 2012-07-31 2014-02-11 인텔렉추얼디스커버리 주식회사 오디오 신호 처리 장치 및 방법
DK3353779T3 (da) * 2015-09-25 2020-08-10 Voiceage Corp Fremgangsmåde og system til kodning af et stereolydssignal ved at anvende kodningsparametre for en primær kanal til at kode en sekundær kanal
KR102291792B1 (ko) 2016-11-08 2021-08-20 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 적어도 2개의 채널들을 다운믹싱하기 위한 다운믹서 및 방법 및 멀티채널 인코더 및 멀티채널 디코더

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19959156C2 (de) 1999-12-08 2002-01-31 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals
SE519985C2 (sv) 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
JP3951690B2 (ja) * 2000-12-14 2007-08-01 ソニー株式会社 符号化装置および方法、並びに記録媒体
US6614365B2 (en) * 2000-12-14 2003-09-02 Sony Corporation Coding device and method, decoding device and method, and recording medium
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP4347698B2 (ja) * 2002-02-18 2009-10-21 アイピージー エレクトロニクス 503 リミテッド パラメトリックオーディオ符号化
DE60311794C5 (de) * 2002-04-22 2022-11-10 Koninklijke Philips N.V. Signalsynthese
KR101016982B1 (ko) * 2002-04-22 2011-02-28 코닌클리케 필립스 일렉트로닉스 엔.브이. 디코딩 장치
EP1683133B1 (en) * 2003-10-30 2007-02-14 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101035070B1 (ko) * 2009-06-09 2011-05-19 주식회사 라스텔 고음질 가상 공간 음향 생성 장치 및 방법

Also Published As

Publication number Publication date
RU2007120056A (ru) 2008-12-10
BRPI0516658A (pt) 2008-09-16
US20090150162A1 (en) 2009-06-11
US7848932B2 (en) 2010-12-07
WO2006059567A1 (ja) 2006-06-08
EP1814104A1 (en) 2007-08-01
JPWO2006059567A1 (ja) 2008-06-05
EP1814104A4 (en) 2008-12-31

Similar Documents

Publication Publication Date Title
KR20070085532A (ko) 스테레오 부호화 장치, 스테레오 복호 장치 및 그 방법
KR102427245B1 (ko) 고차 앰비소닉스 신호 표현의 압축 및 압축 해제 방법 및 장치
JP4963965B2 (ja) スケーラブル符号化装置、スケーラブル復号装置、及びこれらの方法
JP3881943B2 (ja) 音響符号化装置及び音響符号化方法
JP5413839B2 (ja) 符号化装置および復号装置
US8036390B2 (en) Scalable encoding device and scalable encoding method
JP4555299B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JPWO2007088853A1 (ja) 音声符号化装置、音声復号装置、音声符号化システム、音声符号化方法及び音声復号方法
US20110112843A1 (en) Signal analyzing device, signal control device, and method and program therefor
KR20070029754A (ko) 음성 부호화 장치 및 그 방법과, 음성 복호화 장치 및 그방법
JP4842147B2 (ja) スケーラブル符号化装置およびスケーラブル符号化方法
JP2007187749A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための新装置
JP4574320B2 (ja) 音声符号化方法、広帯域音声符号化方法、音声符号化装置、広帯域音声符号化装置、音声符号化プログラム、広帯域音声符号化プログラム及びこれらのプログラムを記録した記録媒体
JPWO2010098120A1 (ja) チャネル信号生成装置、音響信号符号化装置、音響信号復号装置、音響信号符号化方法及び音響信号復号方法
JP2006072269A (ja) 音声符号化装置、通信端末装置、基地局装置および音声符号化方法
KR20140037118A (ko) 오디오 신호 처리방법, 오디오 부호화장치, 오디오 복호화장치, 및 이를 채용하는 단말기
EP3252763A1 (en) Low-delay audio coding

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid