KR20050042075A - 오디오 디코딩 장치 및 오디오 디코딩 방법 - Google Patents

오디오 디코딩 장치 및 오디오 디코딩 방법 Download PDF

Info

Publication number
KR20050042075A
KR20050042075A KR1020047009424A KR20047009424A KR20050042075A KR 20050042075 A KR20050042075 A KR 20050042075A KR 1020047009424 A KR1020047009424 A KR 1020047009424A KR 20047009424 A KR20047009424 A KR 20047009424A KR 20050042075 A KR20050042075 A KR 20050042075A
Authority
KR
South Korea
Prior art keywords
signal
subband
gain
aliasing
subband signal
Prior art date
Application number
KR1020047009424A
Other languages
English (en)
Other versions
KR100728428B1 (ko
Inventor
나오야 다나카
오사무 시마다
미네오 츠시마
다케시 노리마츠
곡 셍 총
킴 한 쿠아
수아 홍 네오
도시유키 노무라
유이치로 다카미자와
마사히로 세리자와
Original Assignee
마츠시타 덴끼 산교 가부시키가이샤
닛폰 덴키 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마츠시타 덴끼 산교 가부시키가이샤, 닛폰 덴키 가부시키가이샤 filed Critical 마츠시타 덴끼 산교 가부시키가이샤
Publication of KR20050042075A publication Critical patent/KR20050042075A/ko
Application granted granted Critical
Publication of KR100728428B1 publication Critical patent/KR100728428B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereo-Broadcasting Methods (AREA)
  • Reduction Or Emphasis Of Bandwidth Of Signals (AREA)

Abstract

오디오 디코딩 장치는, 복수의 서브밴드로 분할된 저역 주파수 서브밴드 신호, 및 전송된 고역 주파수 인코딩 정보로부터, 복수의 고역 주파수 서브밴드 신호를 생성하는 대역 확장기를 이용하여 고역 주파수 성분 정보를 디코딩한다. 상기 장치는 에일리어싱 검출기와 에일리어싱 제거기를 구비하고 있다. 에일리어싱 검출기는 대역 확장기에 의해서 생성된 복수의 고역 주파수 서브밴드 신호에서의 에일리어싱 성분의 발생 정도를 검출한다. 에일리어싱 제거기는 고역 주파수 서브밴드 신호를 생성하는 데에 이용한 게인을 조정함으로써, 고역 주파수 서브밴드 신호의 에일리어싱 성분을 억제한다. 따라서, 연산 횟수를 감소시키기 위하여 실수의 서브밴드를 이용하는 경우에도, 에일리어싱의 발생을 억제할 수 있고, 그로 인한 음질의 열화를 감소시킬 수 있다.

Description

오디오 디코딩 장치 및 오디오 디코딩 방법{AUDIO DECODING APPARATUS AND METHOD}
본 발명은, 소량의 부가 정보를 이용하여 협대역 오디오 신호로부터 광대역 오디오 신호를 생성하는 오디오 대역폭 확장 시스템의 디코딩 장치 및 디코딩 방법에 관한 것이고, 또한 적은 연산량으로써 고음질 신호의 디코딩을 가능하게 하는 기술에 관한 것이다.
대역폭 분할 인코딩(bandwidth division encoding)은, 오디오 신호를 낮은 비트 전송속도로 인코딩하면서도 고품질 재생 신호를 실현하는 일반적인 방법이다. 이것은, 대역 분할 필터를 사용하여 입력 오디오 신호를 복수의 주파수 대역(서브밴드)으로 분할하거나, 또는 푸리에 변환이나 기타의 시간-주파수 변환 알고리즘을 이용하여 입력 신호를 주파수 영역 신호로 변환한 후, 그 신호를 그 주파수 영역내의 다수의 서브밴드로 분할하여, 각각의 대역폭 부분에 적절한 코딩 비트를 할당함으로써 실현된다. 대역폭 분할 인코딩을 이용하여 낮은 비트 전송속도의 데이터로부터 고품질 재생 신호를 취득할 수 있는 이유는, 인코딩 처리시에 신호를 인간의 청각 특성에 따라서 처리하기 때문이다.
일반적으로, 약 10 kHz 이상의 주파수에서의 인간의 청각 감도는 저하하여, 낮은 레벨의 음은 청취하기 어렵게 된다. 또한, "주파수 마스킹(masking)"이라고 하는 현상이 잘 알려져 있다. 특정 주파수 대역에 높은 레벨의 음이 존재하는 경우, 주파수 마스킹으로 인하여, 인접 주파수 대역의 낮은 레벨의 음은 청취하기 어렵게 된다. 이러한 청각적인 특성으로 인하여 감지되기 어려운 신호를 비트 할당하여 인코딩하는 것은, 재생 신호의 품질에 대체로 아무런 영향을 주지 않으므로, 이러한 신호의 인코딩은 의미가 없다. 역으로, 이러한 청각적으로 의미가 없는 대역에 할당된 코드 비트를 취하여 청각적으로 민감한 서브밴드에 재할당함으로써, 청각적으로 민감한 신호를 매우 상세하게 인코딩할 수 있고, 이에 따라서 재생 신호의 품질을 효과적으로 향상시킬 수 있다.
이러한 대역 분할을 이용하는 코딩의 예는, 국제 규격인 MPEG-4 AAC(ISO/IEC 14496-3)가 있고, 약 96 Kbps의 비트 전송속도에서 16 kHz 이상의 광대역 스테레오 신호를 고품질로 코딩하는 것이 가능하다.
비트 전송속도를, 예로서, 약 48 kbps로 저하시킨 경우, 10 kHz 이하의 대역폭만을 고품질로 인코딩할 수 있어서, 음이 분명하지 않게 된다. 이러한 대역폭 제한에 의한 음질 열화(劣化)를 보상하는 하나의 방법으로서는, 소위 SBR(spectral band replication)이 있고, 유럽 전기통신 표준 협회(ETSI; European Telecommunication Standards Institute)에서 발표한 Digital Radio Mondiale(DRM) System Specification(ETSI TS 101 980)에 기재되어 있다. 또한, 유사한 기술이, 예로서, 음향 기술 협회(AES; Audio Engineering Society) convention paper 5553, 5559, 5560(112th Convention, 2002 May 10-13, Munich, Germany)에 개시되어 있다.
SBR은, AAC 등의 오디오 인코딩 처리 또는 그것에 상당하는 대역 제한 처리에 의해서 상실되는 고역(高域) 주파수 대역 신호(고역 주파수 성분이라고 한다)를 보상하는 것을 목적으로 한다. SBR-보상 대역보다 낮은 주파수 대역의 신호(저역(低域) 주파수 성분이라고도 한다)는 기타 수단으로써 전송해야 한다. 기타 수단에 의해서 전송된 저역 주파수 성분에 따라서 의사(擬似)-고역 주파수 성분을 생성하기 위한 정보가 SBR-부호화 데이터에 포함되어 있고, 이 의사-고역 주파수 성분을 저역 주파수 성분에 가산함으로써 대역 제한에 의한 오디오 품질 열화를 보상할 수 있다.
도 7은 종래 기술에 의한 SBR 대역 확장을 위한 디코더의 개략도이다. 입력 비트스트림(106)은, 저역 주파수 성분 정보(107), 고역 주파수 성분 정보(108), 및 부가 정보(109)로 분리된다. 저역 주파수 성분 정보(107)는, 예로서, MPEG-4 AAC 또는 기타 코딩 방법을 사용하여 인코딩된 정보이고, 디코딩되어서 저역 주파수 성분을 나타내는 시간 신호를 생성한다. 저역 주파수 성분을 나타내는 이 시간 신호는 분석 필터 뱅크(analysis filter bank)(103)에 의해서 복수의 서브밴드로 분할된다.
일반적으로, 분석 필터 뱅크(103)는 복소수(複素數)의 계수를 이용하는 필터 뱅크이고, 분할된 서브밴드 신호는 복소수의 신호로 표시된다. 대역 확장기(band expander)(104)는, 저역 주파수 성분을 나타내는 저역 주파수 서브밴드 신호를 고역 주파수 서브밴드에 복사함으로써, 대역 제한에 의해서 상실된 고역 주파수 성분을 보상한다. 대역 확장기(104)에 입력되는 고역 주파수 성분 정보(108)는 보상된 고역 주파수 서브밴드에 대한 게인(gain) 정보를 포함하고 있고, 각각의 생성된 고역 주파수 서브밴드에 대하여 게인이 조정된다.
이어서, 대역 확장기(104)에 의해서 생성된 고역 주파수 서브밴드 신호는 저역 주파수 서브밴드 신호와 함께, 밴드 합성용 합성 필터 뱅크(105)에 입력되어서, 출력 신호(110)가 생성된다. 합성 필터 뱅크(105)에 입력되는 서브밴드 신호는, 일반적으로 복소수 신호이므로, 합성 필터 뱅크(105)로서 복소수 계수의 필터 뱅크가 사용된다.
도 1은 본 발명에 의한 오디오 디코딩 장치의 일례를 나타내는 개략 블록도(제1실시형태).
도 2는 본 발명에 의한 오디오 디코딩 장치의 일례를 나타내는 개략 블록도(제2실시형태).
도 3은 본 발명에 의한 오디오 디코딩 장치에 있어서의 에일리어싱을 검출하는 방법의 일례를 설명하는 도면.
도 4A 및 도 4B는 본 발명에 의한 오디오 디코딩 장치에 있어서의 에일리어싱을 검출하는 방법을 설명하는 도면.
도 5는 본 발명에 의한 오디오 디코딩 장치의 일례를 나타내는 개략 블록도(제4실시형태).
도 6은 본 발명에 의한 오디오 디코딩 장치의 일례를 나타내는 개략 블록도(제5실시형태).
도 7은 종래 기술에 의한 오디오 디코딩 장치의 개략 블록도.
도 8은 에일리어싱 성분이 어떻게 생성되는 가를 설명하는 도면.
상기와 같이 구성된 대역 확장용 디코더는, 분석 필터 뱅크와 합성 필터 뱅크를 포함하는 2개의 필터 뱅크가 복소수 연산을 실행하므로, 디코딩 처리에 있어서 많은 연산을 필요로 한다. 따라서, 적분회로를 사용하여 디코더를 구성하는 경우, 전력 소비가 증가하고 또한 소정의 전원 용량으로써 가능한 재생 시간이 감소하는 문제가 있다.
합성 필터 뱅크로부터 실제로 출력되는 디코딩된 신호는 실수 신호이므로, 디코딩을 위하여 실행하는 연산 횟수를 감소시키기 위해서는, 합성 필터 뱅크를 실수 필터 뱅크로써 구성할 수도 있다. 그러나, 실수 연산만을 실행하는 합성 필터 뱅크(실수 계수의 합성 필터 뱅크)의 특성은, 종래 기술에서와 같이 복소수 연산을 실행하는 합성 필터 뱅크(복소수 계수의 합성 필터 뱅크)의 특성과 상이하므로, 복소수 합성 필터 뱅크를 단순히 실수 합성 필터 뱅크로서 대체할 수는 없다.
도 8A 내지 도 8E는 복소수 계수 필터 뱅크 및 실수 계수 필터 뱅크의 특성을 나타낸다. 어느 소정의 주파수에 대한 톤(tone) 신호는 도 8A에 나타내는 바와 같이 단선(單線)의 스펙트럼으로 도시되어 있다. 이 톤 신호(201)를 포함하는 입력 신호를 분석 필터 뱅크로써 복수의 서브밴드로 분할하면, 톤 신호(201)를 나타내는 선(線) 스펙트럼은, 단일의 특정 서브밴드 신호에 포함된다. 이상적으로는, 예로서, m 서브밴드에 포함되는 신호는 mπ/M로부터 (m+1)π/M까지의 주파수 대역내의 신호만을 나타낸다.
그러나, 실제의 분석 필터 뱅크에서는, 대역 분할 필터의 주파수 특성에 따라서 인접 서브밴드로부터 소정의 서브밴드까지의 신호가 소정의 서브밴드에 포함된다. 도 8B는 분석 필터 뱅크로서 사용되는 복소수 계수 필터 뱅크의 예를 나타낸다. 이 경우에, 톤 신호(201)는 복소수 신호로 나타나고, 도면에서 실선으로 나타내는 바와 같이 m 서브밴드 신호(203)에, 및 점선으로 나타내는 바와 같이 m-1 서브밴드 신호(204)에 포함되어 있다. 양 서브밴드에 포함되는 톤 신호는 주파수축상에서의 동일한 위치를 차지한다. 고역 주파수 서브밴드 신호 생성 처리에서는, 양 서브밴드 신호를 고역 주파수 서브밴드에 복사하여, 각각의 서브밴드의 게인을 조정하지만, 각각의 서브밴드에 대하여 게인이 상이하면, 각각의 서브밴드의 톤 신호(201)는, 또한 진폭이 상이하게 된다.
이러한 톤 신호 진폭의 변화는 합성 필터링 후에 신호 오차로서 남지만, 양 서브밴드 신호에 있어서의 톤 신호는 주파수축상에서의 동일한 위치를 차지하므로, 이 신호 오차의 영향은, 합성 필터로서 복소수 계수 필터 뱅크를 사용하는 종래의 방법에 있어서 톤 신호(201)의 진폭 변화로서만 나타난다. 따라서, 이러한 오차는 출력 신호 품질에 주는 영향이 매우 적다.
그러나, 합성 필터로서 실수(實數) 계수의 필터 뱅크를 사용하는 경우에는, 우선, 복소수 계수의 분석 필터 뱅크에 의해서 출력되는 복소수 계수 서브밴드 신호를 실수 서브밴드 신호로 변환해야 한다. 이것은, 예로서, 복소수 서브밴드 신호의 실수축과 허수축을 (π/4) 만큼 회전시켜서 처리할 수 있고, DFT로부터 DCT를 도출하는 것과 동일한 처리이다. 서브밴드에 포함되는 신호의 형상은, 이러한 실수 서브밴드 신호로의 변환 처리에 따라서 변화한다.
도 8C는 점선으로서 표시된 m-1 서브밴드 신호의 변화를 나타낸다. m-1 서브밴드에 포함되는 신호의 스펙트럼은, 실수 서브밴드 신호로의 변환의 결과로서, 서브밴드 경계(202)의 축선에 대하여 대칭이다. 따라서, 원래의 복소수 서브밴드 신호에 포함된 톤 신호(201)의 "이미지 성분"으로 알려진 신호가 서브밴드 경계(202)에 대하여 대칭인 위치에 나타난다. 또한, m 서브밴드의 신호에 대하여 유사한 이미지 성분(205)이 나타나고, m-1 서브밴드 및 m 서브밴드의 게인에 아무런 변화가 없는 한, 이들 이미지 성분은 합성 필터링 처리에서 서로 상쇄되어서 출력 신호에 출현하지 않는다.
그러나, 고역 주파수 서브밴드 신호 생성 처리에 있어서, 도 8D에 나타내는 바와 같이, 각각의 서브밴드에 게인 차(206)가 있으면, 이미지 성분(205)이 완전히 상쇄되지 않고, 에일리어싱(aliasing)이라고 하는 오차 신호로서, 출력 신호에 출현한다. 도 8E에 나타내는 바와 같이, 이 에일리어싱 성분(207)은 신호가 통상적으로 존재하지 않는 위치(즉, 서브밴드 경계(202)에 대하여 원래의 톤 신호와 대칭인 위치)에 발생하므로, 출력 신호의 음질에 큰 영향을 준다. 특히, 대역 분할 필터에 의한 감쇠가 불충분한 서브밴드 근방에 톤 신호가 존재하는 경우, 생성된 에일리어싱 성분의 진폭이 증가하여, 출력 신호의 음질에 있어서 상당한 열화(劣化)의 요인이 된다.
(과제를 해결하기 위한 수단)
따라서, 본 발명은, 이러한 종래 기술의 문제점을 해결하는 것을 목적으로 하며, 실수 계수 합성 필터 뱅크를 사용함으로써 디코딩 처리에서 실행되는 연산 횟수를 감소시키고, 에일리어싱을 억제하며, 또한 출력 신호의 음질을 향상시키는 기술을 제공한다.
본 발명에 의한 오디오 디코딩 장치는, 협대역 오디오 신호에 대한 인코딩 정보를 포함하는 비트스트림으로부터 광대역 오디오 신호를 디코딩하는 장치이다.
본 발명의 제1특징에 있어서, 상기 장치는, 상기 비트스트림으로부터 인코딩된 정보를 디멀티플렉싱하는 비트스트림 디멀티플렉서와, 상기 디멀티플렉싱된 인코딩 정보로부터 협대역 오디오 신호를 디코딩하는 디코더와, 상기 디코딩된 협대역 오디오 신호를 복수의 제1서브밴드 신호로 분할하는 분석 필터 뱅크와, 최소한 하나의 제1서브밴드 신호로부터, 각각의 제2서브밴드 신호가 상기 제1서브밴드 신호의 주파수 대역 보다 높은 주파수 대역을 갖는 복수의 제2서브밴드 신호를 생성하는 대역 확장기와, 제2서브밴드 신호의 게인을 조정하여 제2서브밴드 신호에 발생하는 에일리어싱 성분을 억제하는 에일리어싱 제거기와, 제1서브밴드 신호와 제2서브밴드 신호를 합성하여 광대역 오디오 신호를 생성하는 실수 연산 합성 필터 뱅크를 포함하고 있다.
본 발명의 제2특징에 있어서, 상기 장치는, 상기 비트스트림으로부터 인코딩된 정보를 디멀티플렉싱하는 비트스트림 디멀티플렉서와, 상기 디멀티플렉싱된 인코딩 정보로부터 협대역 오디오 신호를 디코딩하는 디코더와, 상기 디코딩된 협대역 오디오 신호를 복수의 제1서브밴드 신호로 분할하는 분석 필터 뱅크와, 최소한 하나의 제1서브밴드 신호로부터, 각각의 제2서브밴드 신호가 상기 제1서브밴드 신호의 주파수 대역 보다 높은 주파수 대역을 갖는 복수의 제2서브밴드 신호를 생성하는 대역 확장기와, 대역 확장기에 의해서 생성된 복수의 제2서브밴드 신호에서의 에일리어싱 성분의 발생 정도를 검출하는 에일리어싱 검출기와, 검출된 에일리어싱 성분의 레벨에 따라서 제2서브밴드 신호의 게인을 조정하여 에일리어싱 성분을 억제하는 에일리어싱 제거기와, 제1서브밴드 신호와 제2서브밴드 신호를 합성하여 광대역 오디오 신호를 생성하는 실수 연산 합성 필터 뱅크를 포함하고 있다.
(종래 기술에 대한 본 발명의 이점)
이상과 같이 구성하여, 본 발명은, 저역 주파수 서브밴드 신호로부터 고역 주파수 서브밴드 신호를 생성하는 처리에 있어서, 각각의 고역 주파수 서브밴드에 인가되는 상이한 게인으로 인한, 실수 서브밴드 신호의 에일리어싱을 억제함으로써, 에일리어싱에 의한 음질 열화를 억제한다.
이하, 본 발명에 의한 오디오 디코딩 장치 및 오디오 디코딩 방법의 바람직한 실시형태에 대하여 첨부 도면을 참조하여 설명한다.
(실시형태 1)
도 1은 본 발명의 제1실시형태에 의한 디코딩 장치를 나타내는 개략도이다.
이 디코딩 장치는, 비트스트림 디멀티플렉서(101), 분석 필터 뱅크(103), 대역 확장기(대역 확장 수단)(104), 합성 필터 뱅크(105), 에일리어싱 제거기(113) 및 부가 신호 발생기(111)를 구비하고 있다.
비트스트림 디멀티플렉서(101)는 입력 비트스트림(106)을 수신하여, 상기 비트스트림(106)을 저역 주파수 성분 정보(107), 고역 주파수 성분 정보(108), 및 부가 신호 정보(109)로 디멀티플렉싱한다. 저역 주파수 성분 정보(107)는, 예로서, MPEG-4 AAC 코딩 방법을 사용하여 인코딩된다. 저역 주파수 디코더(102)는 저역 주파수 성분 정보(107)를 디코딩하여 저역 주파수 성분을 나타내는 시간 신호를 생성한다.
이어서, 저역 주파수 성분을 나타내는 이 생성된 시간 신호는 분석 필터 뱅크(103)에 의해서 복수(M개)의 서브밴드로 분할되어서 대역폭 확장기(104)에 입력된다. 분석 필터 뱅크(103)는 복소수 계수의 필터 뱅크이고, 상기 분석 필터 뱅크(103)에 의해서 생성되는 서브밴드 신호는 복소수의 신호로써 표시된다.
대역 확장기(104)는, 저역 주파수 성분을 나타내는 저역 주파수 서브밴드 신호를 고역 주파수 서브밴드에 복사하여 대역 제한에 의해서 상실된 고역 주파수 성분을 보상한다. 대역 확장기(104)에 입력되는 고역 주파수 성분 정보(108)는 보상되는 고역 주파수 서브밴드에 대한 게인 정보를 포함하고 있고, 각각의 생성된 고역 주파수 서브밴드에 대하여 게인이 조정된다.
부가 신호 발생기(111)는 부가 정보(109)에 따라서 게인이 제어된 부가 신호(112)를 생성하여 그 정보를 각각의 고역 주파수 서브밴드에 부가한다. 부가 신호 발생기(111)에 의해서 생성되는 부가 신호로서 정현파 톤(tone) 신호 또는 노이즈 신호를 사용한다.
대역 확장기(104)에 의해서 생성된 고역 주파수 서브밴드 신호는 저역 주파수 서브밴드 신호와 함께 합성 필터 뱅크(105)에 입력되어서 대역 합성되고, 출력 신호(110)가 생성된다. 이 합성 필터 뱅크(105)는 실수 계수의 필터 뱅크이다. 합성 필터 뱅크(105)에 이용되는 서브밴드의 수는 분석 필터 뱅크(103)의 서브밴드의 수와 일치할 필요는 없다. 예로서, 도 1에서, N=2M이면, 출력 신호의 샘플링 주파수는, 분석 필터 뱅크에 입력되는 시간 신호의 샘플링 주파수의 2배로 된다.
상기 고역 주파수 성분 정보(108) 또는 부가 신호 정보(109)에는 게인 제어에 관한 정보만이 포함되므로, 스펙트럼 정보를 포함하는 저역 주파수 성분 정보(107)에 비하여 극히 낮은 전송속도를 이용할 수 있다. 따라서, 이 구성은 낮은 비트 전송속도에서의 광대역 신호의 코딩에 적합하다.
또한, 도 1에 나타낸 디코딩 장치는 에일리어싱 제거기(113)를 구비하고 있다. 상기 에일리어싱 제거기(113)에는 고역 주파수 성분 정보(108)를 입력하고, 고역 주파수 성분 데이터의 게인 정보를 조정하여 실수 계수 합성 필터 뱅크(105)로써 에일리어싱을 억제한다. 대역 확장기(104)는 상기 조정된 게인을 이용하여 고역 주파수 서브밴드 신호를 생성한다.
본 실시형태의 합성 필터 뱅크(105)에 입력되는 서브밴드 신호는 실수 신호이어야 하지만, 복소수 신호로부터 실수 신호로의 변환은 기술적으로 공지된 방법을 사용하는 위상 회전 연산에 의해서 용이하게 실현될 수 있다.
이하, 에일리어싱 제거기(113)의 동작을 상세하게 설명한다.
상기한 바와 같이, 합성 필터 뱅크로서 실수 계수 필터 뱅크를 사용하는 경우에, 에일리어싱의 하나의 원인은, 고역 주파수 신호 생성 과정에 있어서 인접 서브밴드 신호가 상이한 게인 레벨로 조정되는 것이다. 모든 인접 서브밴드 신호에 대하여 게인이 동일하면, 에일리어싱 성분을 완전히 제거할 수 있다. 그러나, 이 경우에, 고역 주파수 성분으로서 전송된 게인 정보가 반영되지 않고, 고역 주파수 성분 게인이 일치하지 않으며, 또한 출력 신호 품질이 열화한다. 따라서, 에일리어싱 제거기(113)는 고역 주파수 성분 정보로서 전송된 게인 정보를 참조하여, 에일리어싱 성분이 청취 불가능한 레벨로 감소되도록, 게인을 조정함으로써, 에일리어싱 성분에 의하여 발생하는 오디오 음질 열화 및 고역 주파수 성분의 게인 불일치에 의해서 발생하는 오디오 품질 열화를 방지해야 한다.
인접 서브밴드간의 게인 차가 증가함에 따라서 에일리어싱 성분이 증가하는 사실에 근거하여, 발명의 본 실시형태의 에일리어싱 제거기(113)는 인접 서브밴드간의 게인 차에 제한을 설정하여, 발생하는 에일리어싱 성분의 영향을 감소시킨다.
예로서, 에일리어싱 제거기(113)는 모든 m에 대하여 이하의 관계식을 만족시키도록 g[m]을 조정한다.
g[m]a* g[m-1]
g[m]a* g[m+1]
여기서, g[m-1], g[m], g[m+1]은 3개의 연속적인 m-1, m, m+1 서브밴드에 대한 게인이고, "a"는 인접 서브밴드간의 게인 비에 대한 상한치를 결정하며 대략 2.0이다. 계수 "a"의 값은 모든 m 서브밴드에 대하여 동일할 수도 있고, 또는 상이한 m 서브밴드에 대하여 상이한 "a"를 적용할 수도 있다. 예로서, 에일리어싱의 청각적인 영향이 큰 저역 주파수 서브밴드에 대하여 비교적 작은 "a"를 적용할 수 있고, 에일리어싱의 영향이 비교적 작은 고역 주파수 서브밴드에 대하여 비교적 큰 "a"를 적용할 수 있다.
이러한 게인 조정에 의해서, 인접 서브밴드간의 게인 차가 제한되므로, 에일리어싱 성분의 영향이 억제되어서 가청(可聽) 음질이 향상된다. 또한, 고역 주파수 성분 서브밴드 신호의 게인 분포는, 전송된 게인 정보에 의한 게인 분포와 상이하게 되지만, 영향을 받는 서브밴드는 인접 서브밴드에 대한 게인 비가 매우 큰 서브밴드뿐이다. 또한, 조정된 게인 레벨에 있어서 동일한 서브밴드 게인 관계가 유지되므로, 고역 주파수 서브밴드 신호의 게인 불일치로 인한 음질 열화가 억제될 수 있다.
게인 조정으로서는, 인접 서브밴드간의 게인 비의 제한 이외에, 복수의 서브밴드의 평균 게인을 이용하여 게인을 조정할 수도 있다. 이어서, 3개의 서브밴드의 평균 게인을 이용하는 것을 예로서 설명한다. 이 경우에, 게인 조정후의 m 서브밴드에 대한 게인 g'[m]이 이하의 관계식을 만족시키도록 한다.
g'[m]=(g[m-1]+g[m]+g[m+1])/3
여기서, g[m-1], g[m], g[m+1]은 고역 주파수 성분으로서 수신된 3개의 연속적인 m-1, m, m+1 서브밴드에 대한 게인이다.
또한, 낮은 주파수의 서브밴드로부터 순차적으로 게인 레벨을 조정하기 위해서 m-1 서브밴드에 대한 조정후의 게인 g'[m-1]을 이용할 수 있으므로, 이하의 식으로부터 게인 g'[m]을 구할 수 있다.
g'[m]=(g'[m-1]+g[m]+g[m+1])/3
상기와 같이 게인을 조정함으로써, 서브밴드간의 게인 변동을 평활화하고, 또한 인접 서브밴드간의 게인 차를 감소시킬 수 있으므로, 에일리어싱 성분을 억제할 수 있고 가청 음질을 개선할 수 있다. 또한, 이러한 평활화 처리에 의해서, 고역 주파수 서브밴드 신호의 게인 분포를 전송된 게인 정보에 의한 게인 분포와 상이하게 되지만, 평활화 이전의 게인 분포의 형상은 평활화 이후에도 유지되고, 또한 고역 주파수 서브밴드 신호의 게인 불일치로 인한 음질 열화도 억제될 수 있다.
상기의 게인 평활화 처리에 있어서 복수의 서브밴드의 게인의 단순 평균을 이용했지만, 계산전에 각각의 게인에 소정의 가중 계수를 우선 곱하는 가중 평균을 이용할 수도 있는 것을 유념해야 한다.
원래의 게인 레벨이 매우 작은데도 불구하고, 평활화 처리 결과, 게인 레벨이 커지는 것을 방지하기 위하여, 원래의 게인 레벨이 소정의 임계치 이하인 경우 평활화 처리를 실행하지 않고, 원래의 조정되지 않은 게인을 이용할 수도 있다.
(실시형태 2)
도 2는 본 발명의 제2실시형태에 의한 디코딩 장치의 개략도이다. 본 실시형태는, 에일리어싱 성분이 도입될 가능성이 큰 서브밴드를 검출하는 에일리어싱 검출 수단(에일리어싱 검출기)(315)이 추가된 것이, 도 1에 나타낸 구성과 상이하다. 에일리어싱 검출기(315)로부터 출력되는 검출 데이터(316)는 에일리어싱 제거기(313)에 입력되고, 이어서, 에일리어싱 검출기는 검출 데이터(316)에 따라서 고역 주파수 성분의 게인을 조정한다.
본 제2실시형태에 의한 디코딩 장치의 동작은 에일리어싱 검출기(315)와 에일리어싱 제거기(313)에 관한 것을 제외하고는 제1실시형태의 동작과 동일하다. 따라서, 에일리어싱 검출기(315)와 에일리어싱 제거기(313)의 동작만을 이하에 설명한다.
우선, 에일리어싱 검출기(315)의 동작 원리를 설명한다.
에일리어싱은, 실수 서브밴드 신호를 이용하는 한, 이론적으로 피할 수 없지만, 에일리어싱에 의한 음질 열화의 정도는 서브밴드 신호에 포함된 신호의 성질에 따라서 매우 상이하다. 도 8을 참조로 하여 설명한 바와 같이, 에일리어싱 성분은 원래의 신호에 비하여 상이한 위치에 발생하지만, 그 위치의 원래의 신호가 강하면, 에일리어싱 성분의 영향이 마스킹되어서 음질에 대한 에일리어싱 성분의 영향은 작아진다. 역으로, 신호가 원래 존재하지 않는 위치에 에일리어싱 성분이 발생하면, 에일리어싱 성분만을 들을 수 있게 되고 음질에 대한 그 영향은 크다. 따라서, 에일리어싱 성분이 발생하는 부근에서의 신호 강도를 검출함으로써 에일리어싱 성분의 영향이 어느 정도 큰 가를 알 수 있다.
그러나, 에일리어싱 성분이 발생하는 위치 및 그 주변의 신호의 강도를 검출하기 위해서는, 예로서, 푸리에 변환 또는 기타의 주파수 변환 처리를 이용하여 서브밴드 신호의 주파수 분포를 조사해야 한다. 문제는 이러한 과정이 필요로 하는 연산량 때문에 비실용적이라는 것이다. 따라서, 본 발명에서는, 서브밴드 신호의 주파수 분포의 기울기를 나타내는 파라미터를 이용함으로써 적은 연산량으로써 에일리어싱의 영향을 검출하는 방법을 사용한다. 이 방법의 전제는, 소정의 서브밴드내에서 주파수 분포가 넓은 신호(노이즈 신호)의 영향은, 에일리어싱이 발생해도 상기의 마스킹 현상으로 인하여 그 영향이 적으므로, 무시하는 것이다.
주파수 분포가 한정된 신호(톤 신호)에 대해서는, 톤 신호의 위치와 그 발생하는 에일리어싱 성분과의 관계는 도 8을 참조로 하여 상기에서 설명한 바와 같고, 톤 신호가 서브밴드 경계 부근에 존재하는 경우에 에일리어싱의 영향이 크다.
도 3은 톤 신호 위치와, 톤 신호를 포함하는 서브밴드의 주파수 분포의 기울기와의 관계를 나타낸다. 도 3에서, m-1 서브밴드 신호(403) 및 m 서브밴드 신호(404)에는 톤 신호(401) 및 그 이미지(402)가 포함되어 있고, 톤 신호(401)와 이미지(402)는 서브밴드 경계(405)에 대하여 대칭으로 위치되어 있다.
톤 신호(401)가 서브밴드 경계(405) 부근에 존재하는 경우, 톤 신호(401) 및 그 이미지(402)는 모두 m-1 서브밴드의 높은 주파수측에 존재한다. 따라서, m-1 서브밴드의 주파수 분포의 기울기(406)는 정(正)이다. 톤 신호(401)가 서브밴드 경계(405)로부터 높은 주파수측으로 편이되는 경우, 그 이미지(402)는 반대 방향으로(즉, 낮은 구파수 방향으로) 이동하여, m-1 서브밴드의 주파수 분포의 기울기는 더욱 완만하게 되고 점차로 부(負)로 된다. m 서브밴드의 주파수 분포의 기울기 (407)는 마찬가지로 부로부터 정으로 변화한다. 이것은, m-1 서브밴드의 주파수 분포의 기울기가 정이고 또한 m 서브밴드의 주파수 분포의 기울기가 부인 경우, 톤 신호 및 그 이미지는 모두 서브밴드 경계(405) 부근에 존재할 가능성이 있다.
용이하게 연산할 수 있고 또한 서브밴드 신호 주파수 분포의 기울기를 나타내는 파라미터로서, 선형 예측 계수(LPC; linear prediction coefficient) 및 반사 계수를 이용할 수 있다. 예로서, 이러한 파라미터로서 이하의 식으로써 구하여지는 1차 반사 계수를 이용한다.
여기서, x(m,i)는 m 서브밴드의 신호를 나타내고, i는 시간 샘플을 나타내고, x*(m,i)는 x(m,i)의 공액 복소수를 나타내며, k1[m]은 m 서브밴드의 1차 반사 계수를 나타낸다.
1차 반사 계수는, 주파수 분포의 기울기가 정인 경우 정이고, 기울기가 부인 경우 부이므로, k1[m-1]이 정이고 k[m]이 부이면, m-1 서브밴드와 m 서브밴드의 사이의 경계에 에일리어싱이 발생할 가능성이 높은 것으로 판단할 수 있다.
그러나, 서브밴드 분할 필터로서, 일반적인 QMF(quadrature mirror filter)를 사용하는 경우에는, 필터 특성으로 인하여 우수(偶數) 서브밴드와 기수(奇數) 서브밴드간에 주파수 분포가 반전된다. 이것을 고려하면, 에일리어싱을 검출하기 위한 조건을 이하와 같이 설정할 수 있다.
m이 우수인 경우: k1[m-1]<0, 및 k1[m]<0
m이 기수인 경우: k1[m-1]>0, 및 k1[m]>0
이하, 이 조건을 "검출 조건 1"이라고 한다. 검출 조건 1은 2개의 인접하는 서브밴드간에 에일리어싱이 존재하는 가를 검출하는 데에 이용되는 조건을 정의한다. 검출 조건 1을 적용하는 경우, 우수의 m 및 기수의 m에 대하여 상기 조건이 동시에 만족될 수 없으므로, 2개의 연속하는 m 및 m-1 서브밴드에 대하여 에일리어싱이 두번 검출되지는 않는다.
QMF의 통과 대역은 일반적으로 3개의 서브밴드, 즉, 해당 서브밴드와 그 양측의 서브밴드에 분산되어 있다. 이 경우에, 해당 서브밴드의 중심 부근에 톤 신호가 존재하거나, 또는 해당 서브밴드의 높은 주파수 영역과 낮은 주파수 영역 모두에 톤 신호가 존재하면, 해당 서브밴드의 양측의 서브밴드에 이미지 성분이 나타난다.
도 4A 및 도4B는 소정의 서브밴드의 낮은 주파수 영역과 높은 주파수 영역에 톤 신호가 존재하는 경우의 주파수 분포를 나타낸다. 도 4A에 있어서는, m-1 서브밴드의 낮은 주파수 영역과 높은 주파수 영역 모두에 톤 신호(501 및 502)가 존재하고, 도 4B에 있어서는 톤 신호(511 및 512)가 존재한다. m-1 서브밴드의 낮은 주파수 영역의 톤 신호(501 및 511)의 이미지 성분은, 각각, m-2 서브밴드에 신호(503 및 513)로서 나타난다. m-1 서브밴드의 높은 주파수 영역의 톤 신호(502 및 512)의 이미지 성분은, 각각, m 서브밴드에 신호(504 및 514)로서 나타난다.
도 4A의 주파수 분포(506) 및 도 4B의 주파수 분포(516)에 나타내는 바와 같이, m-1 서브밴드의 주파수 분포의 기울기는 낮은 주파수의 톤 신호와 높은 주파수의 톤 신호의 에너지 비(比)에 의해서 결정된다. 따라서, m-1 서브밴드의 반사 계수의 부호를 이용하여 2개의 서브밴드간의 에일리어싱을 검출하는 데에 적용하는 검출 조건 1로써는, 3개의 서브밴드간의 에일리어싱을 검출할 수 없다. 한편, m-2 서브밴드 및 m 서브밴드에서는, 그 이미지 성분에 의해서, 주파수 분포의 기울기의 부호는, m-1 서브밴드의 낮은 주파수의 톤 신호와 높은 주파수의 톤 신호의 에너지 비에 관계없이, 도 4A의 주파수 분포(505 및 507)와 도 4B의 주파수 분포(515 및 517)에 나타내는 바와 같이, 안정하게 유지된다.
이것을 이용함으로써, m-2 서브밴드 및 m 서브밴드의 반사 계수를 이용하여 3개의 서브밴드간의 에일리어싱을 검출하는 조건을 설정할 수 있다.
m이 우수인 경우: k1[m-2]>0, 및 k1[m]<0
m이 기수인 경우: k1[m-2]<0, 및 k1[m]>0
이하, 이 조건을 "검출 조건 2"라고 한다.
그러나, m-2 서브밴드 및 m 서브밴드의 주파수 분포의 기울기가 큰 경우에는 3개의 서브밴드간에 에일리어싱이 문제가 되고, 검출 조건 2만을 적용하는 경우 검출 오차가 증가한다. m-2 서브밴드 및 m 서브밴드의 주파수 분포의 기울기는, m-1 서브밴드의 낮은 주파수 영역의 톤 신호와 높은 주파수 영역의 톤 신호의 에너지 비에 따라서 변화한다.
즉, m-1 서브밴드의 낮은 주파수 영역의 톤 신호의 에너지가 높은 주파수 영역의 톤 신호의 에너지에 비하여 작은 경우(도 4A에 나타낸 경우), m-2 서브밴드의 반사 계수 k1[m-2]의 절대치는 m 서브밴드의 반사 계수 k1[m]의 절대치 보다 작아진다. 역으로, m-1 서브밴드의 낮은 주파수의 톤 신호의 에너지가 높은 주파수의 톤 신호의 에너지에 비하여 큰 경우(도 4B에 나타낸 경우), m-2 서브밴드의 반사 계수 k1[m-2]의 절대치는 m 서브밴드의 반사 계수 k1[m]의 절대치 보다 커진다. 이하, 이 특성을 "특성 1"이라고 한다.
따라서, m-2 서브밴드와 m 서브밴드 모두의 주파수 분포의 기울기를 동시에 고려하는 것이 바람직하다. 또한, 반사 계수의 절대치가 0 내지 1인 것을 이용하면, 3개의 서브밴드간에 에일리어싱을 검출하는 조건은 바람직하게는 우선 상기의 검출 조건 2를 만족시키고, 또한 이하의 조건도 만족시킨다.
m이 우수인 경우: k1[m-2]-k1[m]>T
m이 기수인 경우: k1[m]-k1[m-2]>T
여기서, T는 소정의 임계치이고, 예로서 T=1.0 정도의 값이다. 이하, 이 조건을 "검출 조건 3"이라고 한다. 검출 조건 3의 검출 범위는 검출 조건 2의 검출 범위보다 좁다. 반사 계수의 범위에 관한 조건,
-1<k1[m]<1
때문에, 검출 조건 2 또는 검출 조건 3을 이용한 경우, 3개의 연속하는 m, m+1 및 m+2 서브밴드에 있어서 조건이 겹치지 않으므로, 3개의 연속하는 서브밴드에서 에일리어싱이 검출되지 않는다. 또한, 검출 조건 1을 검출 조건 2 또는 검출 조건 3과 함께 이용한 경우에도 3개의 연속하는 서브밴드에서 에일리어싱이 검출되지 않는다. 또한, m-2, m-1 및 m 서브밴드의 반사 계수를 이용하여 3개의 연속하는 서브밴드에 대한 에일리어싱을 설정할 수 있는 것은 명백하다.
상기 검출 조건을 만족시키는 서브밴드 번호는 에일리어싱 검출기(315)로부터 에일리어싱 검출 데이터(316)로서 출력된다. 이어서, 에일리어싱 제거기(313)는 검출 데이터(316)에 의해서 표시된 서브밴드만에 대한 게인을 조정하여 에일리어싱을 억제한다. 예로서, 검출 데이터(316)가, 검출 조건 1에 의한 2개의 서브밴드간의 에일리어싱 발생을 나타내면, m-1 및 m 서브밴드의 게인을 일치시킴으로써, 또는 2개의 서브밴드간의 게인 차 혹은 게인 비를 소정의 임계치 이하로 제한함으로써, 게인을 조정할 수 있다. 양 서브밴드에 대하여 동일한 게인 레벨을 설정하는 경우에는, 2개의 서브밴드 중 낮은 측의 게인 레벨로 설정하거나, 높은 측의 게인 레벨로 설정하거나, 또는 높은 측 게인 레벨과 낮은 측 게인 레벨의 중간 레벨(평균치 등)로 게인을 설정할 수 있다.
에일리어싱 검출기(315)에 의한 검출 오차를 방지하기 위해서, 에일리어싱 제거기(313)는 상기 방법의 조합을 이용할 수 있다. 예로서, 에일리어싱 제거기(313)는 에일리어싱이 검출된 서브밴드에 대하여 게인을 일치시키는 방법을 이용하고, 기타 서브밴드에 대해서는 게인 차 또는 게인 비를 소정의 임계치 이하로 제한하는 게인 제한 방법을 이용할 수 있다.
또한, 검출 데이터(316)가 검출 조건 2 또는 검출 조건 3에 따라서 3개의 서브밴드간의 에일리어싱의 발생을 나타내는 경우에는, 에일리어싱 제거기(313)는 3개의 서브밴드 모두의 게인을 일치시킴으로써 게인을 조정할 수 있다. 다른 방법으로는, 상기의 2개의 서브밴드간의 게인 일치 방법을 m-2 서브밴드로부터 오름차순으로 적용할 수 있고, 즉, m-2 및 m-1 서브밴드의 게인을 조정한 후에, 그 게인 레벨과 m 서브밴드의 게인을 일치시킬 수도 있다. 이것은 또한 m 서브밴드로부터 내림차순으로 적용하여 2개의 서브밴드간의 게인을 일치시킬 수도 있다. 또 다른 방법으로는, 상기한 바와 같이 오름차순 및 내림차순으로 2개의 서브밴드간의 게인 일치 방법을 적용한 후, 양 게인 레벨의 중간치를 산출하여 적용할 수도 있다. 2개의 서브밴드에 대하여 동일한 게인 레벨을 설정하는 경우에는, 낮은 측의 게인 레벨로 설정하거나, 높은 측의 게인 레벨로 설정하거나, 또는 높은 측 게인 레벨과 낮은 측 게인 레벨의 중간 레벨(평균치 등)로 게인을 설정할 수 있다.
또 다른 방법으로는, 양 서브밴드에 대하여 동일한 게인 레벨을 설정하는 대신에, 2개의 서브밴드간의 게인 차 또는 게인 비를 소정의 임계치 이하로 설정할 수도 있다.
추가적인 또 다른 방법으로는, 에일리어싱 검출기(315)에 의한 검출 오차를 방지하기 위해서, 에일리어싱 제거기(313)는 상기 방법의 조합을 이용할 수 있다. 예로서, 에일리어싱 제거기(313)는 에일리어싱이 검출된 서브밴드에 대하여 게인을 일치시키는 방법을 이용하고, 기타 서브밴드에 대해서는 게인 차 또는 게인 비를 소정의 임계치 이하로 제한하는 게인 제한 방법을 이용할 수 있다.
상기 구성으로써, 에일리어싱이 음질에 영향을 주는 서브밴드의 게인만을 조정하고, 기타 서브밴드에 대해서는 수신한 비트스트림의 게인 레벨을 사용할 수 있다. 따라서, 에일리어싱에 의한 음질 열화를 방지할 수 있고, 또한 게인 불일치에 의한 음질 열화도 방지할 수 있다. 예로서, 에일리어싱 제거기(313)에 있어서 게인 일치 방법으로서 상기의 방법을 사용하는 경우, 에일리어싱 검출기(315)에서 검출 조건 1을 적용하면 최소한 2개의 서브밴드의 단위로 전송된 게인 레벨로 게인을 조정할 수 있고, 또한 에일리어싱 검출기(315)가 검출 조건 2 또는 검출 조건 3을 적용하면 최소한 4개의 서브밴드의 단위로 수신된 게인 레벨로 게인을 조정할 수 있다.
그리고, 서브밴드 신호의 주파수 분포의 기울기를 나타내는 파라미터는, 시간축에 대한 복수의 파라미터를 연산하여 이 파라미터를 평활화함으로써 산출할 수 있는 것을 유념해야 한다.
도 1에 나타낸 디코딩 장치의 합성 필터 뱅크(105)는 실수 연산 필터로 구성되어 있다. 이것은 또한 실수 연산을 실행할 수 있는 복소 연산 필터를 사용할 수도 있는 것은 명백하다.
또한, 서브밴드 신호의 주파수 분포의 기울기를 나타내는 파라미터로서 사용되는 선형 예측 계수 또는 반사 계수를 종래의 대역 확장 수단에서의 중간 파라미터로서 사용하는 경우, 이 파라미터의 전부 또는 일부를 함께 사용할 수 있으므로, 처리에 필요한 연산 횟수를 감소시킬 수 있다.
(실시형태 3)
상기 제2실시형태에서의 에일리어싱 검출기(305)는 소정의 임계치와, 각각의 서브밴드의 반사 계수를 비교하여, 이 값들간의 관계에 따라서 에일리어싱의 발생 여부를 검출하여 2치(値) 값으로서 출력한다. 2치 검출 방법을 이용함으로써 판정치가 임계치 부근에서 변화하는 경우에는, 발생/비발생에 대한 에일리어싱 검출치가 빈번하게 변화한다. 이로 인하여 게인의 조정 여부에 대한 추적이 복잡하게 되어서 음질에 악영향을 끼칠 수도 있다.
그러므로, 본 실시형태의 에일리어싱 검출기(315)는 에일리어싱의 발생 정도를 검출한다. 즉, 2치 값을 이용하여 단순히 에일리어싱의 검출 여부를 표시하는 것 보다는, 에일리어싱의 발생을, 에일리어싱의 발생 정도를 나타내는 연속치로써 표시한다. 이어서, 이 연속치에 따라서 게인을 점차적으로 변화되도록 조정한다. 게인의 조정 및 비조정의 절환에 의한 급격한 게인 변화가 억제되므로, 그로 인한 음질의 열화를 감소시킬 수 있다. 본 제3실시형태에 의한 오디오 디코딩 장치의 구성은 도 2에 나타낸 제2실시형태의 장치의 구성과 동일한 것을 염두에 두어야 한다.
이어서, 에일리어싱의 발생 정도를 나타내는 값을 설명한다.
2개의 서브밴드간의 에일리어싱을 검출하는 경우, m 서브밴드의 에일리어싱의 정도 d[m]을 이하의 관계식으로부터 산출할 수 있다.
i) m이 우수이고, 또한 k1[m]<q, k1[m-1]<q인 경우:
k1[m]>k1[m-1]이면, d[m]=(-k1[m]+q)/p
k1[m]k1[m-1]이면, d[m]=(-k1[m-1]+q)/p
ii) m이 기수이고, 또한 k1[m]>-q, k1[m-1]>-q인 경우:
k1[m]>k1[m-1]이면, d[m]=(k1[m-1]+q)/p
k1[m]k1[m-1]이면, d[m]=(k1[m]+q)/p
iii) 기타의 경우:
d[m]=0
여기서, p 및 q는 소정의 임계치이고, p=q=약 0.25인 것이 바람직하다. 또한, d[m]의 상한치는 1.0으로 제한하는 것이 바람직하다.
m 서브밴드와 m-1 서브밴드의 게인 g[m], g[m-1]은, 에일리어싱의 정도 d[m]을 이용하여 이하와 같이 조정한다.
g[m]>g[m-1]인 경우,
g[m]=(1.0-d[m])ㆍg[m] + d[m]ㆍg[m-1]
g[m]<g[m-1]인 경우,
g[m-1]=(1.0-d[m])ㆍg[m-1] + d[m]ㆍg[m]
검출 조건 2 또는 검출 조건 3을 이용하는, 3개의 서브밴드간의 에일리어싱 검출과, 검출 조건 1을 이용하는 2개의 서브밴드간의 에일리어싱 검출을 병용하는 경우, 이하의 방법을 이용하여 에일리어싱 발생 정도 d[m]을 산출할 수 있다.
우선, 모든 m에 대하여 d[m]을 0.0에 설정한다. 그리고, m에 대하여 오름차순으로 이하의 방법을 적용하여 d[m] 및 d[m-1]을 산출한다.
첫째, 검출 조건 1을 만족시키면, d[m]=1.0이다. 두째, 검출 조건 2 또는 검출 조건 3을 만족시키는 경우에만 에일리어싱의 발생 정도 d[m]을 이하와 같이 설정한다.
i) m이 우수인 경우:
d[m]=0.0이면, d[m]=(k1[m-2]-k1[m]-T)/s
d[m-1]=0.0이면, d[m-1]=(k1[m-2]-k1[m]-T)/s
ii) m이 기수인 경우:
d[m]=0.0이면, d[m]=(k1[m]-k1[m-2]-T)/s
d[m-1]=0.0이면, d[m-1]=(k1[m]-k1[m-2]-T)/s
여기서, T 및 s는 소정의 임계치이고, 대략 T=0.8이고 s=0.4인 것이 바람직하다. 또한, d[m]의 상한치는 1.0으로 제한하는 것이 바람직하다.
에일리어싱의 발생 정도 d[m]은, 또한 이하의 방법을 이용하여 산출할 수 있다.
우선, 모든 m에 대하여 d[m]을 0.0에 설정한다. 그리고, m에 대하여 오름차순으로 이하의 방법을 적용하여 d[m] 및 d[m-1]을 산출한다.
첫째, 검출 조건 1을 만족시키면, d[m]=1.0이다. 두째, 검출 조건 2 또는 검출 조건 3을 만족시키는 경우에만 에일리어싱의 발생 정도 d[m] 및 d[m-1]을 이하와 같이 설정한다.
i) m이 우수인 경우:
d[m]=0.0이면, d[m]=(k1[m-2]-k1[m]-abs(k1[m-1]))
d[m-1]=0.0이면, d[m-1]=(k1[m-2]-k1[m]-abs(k1[m-1]))
ii) m이 기수인 경우:
d[m]=0.0이면, d[m]=(k1[m]-k1[m-2]-abs(k1[m-1]))
d[m-1]=0.0이면, d[m-1]=(k1[m]-k1[m-2]-abs(k1[m-1]))
여기서, abs( )는 절대치를 나타내는 함수이다.
에일리어싱의 발생 정도 d[m]에 따라서 3개의 서브밴드간의 게인을 조정하기 위하여, 예로서, 상기와 같이 오름차순으로 2개의 서브밴드간의 게인 일치 방법을 이용하는 경우, m 서브밴드와 m-1 서브밴드의 게인 g[m], g[m-1]을, 이하와 같이 조정할 수 있다.
g[m]>g[m-1]인 경우,
g[m]=(1.0-d[m])ㆍg[m] + d[m]ㆍg[m-1]
g[m]<g[m-1]인 경우,
g[m-1]=(1.0-d[m])ㆍg[m-1] + d[m]ㆍg[m]
상기와 같이 산출된 에일리어싱의 발생 정도 d[m]을 이용하여 게인을 조정함으로써, 단순히 에일리어싱의 발생 여부를 나타내는 2치 값에 따라서 게인을 조정하는 게인 조정 단계의 절환에 의한 음질의 열화를 억제할 수 있다
또한, 도 4A 및 도 4B를 참조로 하여 설명한 특성 1을 고려하면, 연속하는 서브밴드의 에일리어싱 찌그러짐을 감소시키기 위하여, 특성 1을 이용해서 에일리어싱의 발생 정도 d[m]을 산출하여 게인을 조정할 수 있다.
더욱 상세하게는, 도 4A에 나타낸 경우에 있어서, m 서브밴드의 이미지 성분의 진폭이 m-2 서브밴드의 이미지 성분의 진폭보다 크므로, m 서브밴드의 에일리어싱 발생 정도는 m-2 서브밴드의 에일리어싱 발생 정도보다 크다. 역으로, 도 4B에 나타낸 경우에 있어서, m-2 서브밴드의 에일리어싱 발생 정도는 m 서브밴드의 에일리어싱 발생 정도보다 크다. 따라서, 특성 1을 고려하여 에일리어싱의 발생 정도 d[m]을 설정함으로써 찌그러짐의 정도에 의한 에일리어싱 찌그러짐을 감소시킬 수 있다. 이러한 특성에 의한 에일리어싱의 발생 정도 d[m]은 이하의 식으로부터 산출할 수 있다.
d[m]=1-k1[m-1]ㆍk1[m-1], 또는
d[m]=1-abs(k1[m-1])
이 방법은, k1[m-1]=0인 경우, 에일리어싱의 발생 정도 d[m]이 1(최대)로 되므로 바람직하다. 이것은, 도 4A 및 도 4B에서의 m-1 서브밴드의 낮은 주파수의 톤 및 높은 주파수의 톤의 진폭이 동일한 경우, m-1 서브밴드의 주파수 분포의 기울기가 0으로 되는, 즉, m-2 서브밴드 및 m 서브밴드의 이미지 성분이 동일한 경우, 반사 계수 k1[m-1]이 0으로 되기 때문이고, 이에 따라서 양자에 대하여 에일리어싱 발생 정도가 동일해야 한다.
이어서, 특성 1에 의해서 결정된 우선 순위에 따라서 에일리어싱 발생 정도 d[m]을 산출하는 방법의 예를 설명한다. 이하에 기재한 방법은 검출 조건 2 또는 검출 조건 3에 의한 3개의 서브밴드에 대한 에일리어싱 검출과, 검출 조건 1에 의한 2개의 서브밴드간의 에일리어싱 검출 모두를 이용하는 것을 유념해야 한다.
우선, 이하의 식으로부터 에일리어싱 발생 정도 d[m]을 산출한다.
i) m이 우수인 경우:
k1[m]<0, 또한 k1[m-1]<0이면,
d[m]=S,
k1[m]<0, k1[m-1]<0, 또한 k1[m-2]>0이면,
d[m-1]=1-k1[m-1]ㆍk1[m-1],
k1[m]<0, k1[m-1]0, 또한 k1[m-2]>0이면,
d[m]=1-k1[m-1]ㆍk1[m-1]
ii) m이 기수인 경우:
k1[m]>0, 또한 k1[m-1]>0이면,
d[m]=S,
k1[m]>0, k1[m-1]>0, 또한 k1[m-2]<0이면,
d[m-1]=1-k1[m-1]ㆍk1[m-1],
k1[m]>0, k1[m-1]0, 또한 k1[m-2]<0이면,
d[m]=1-k1[m-1]ㆍk1[m-1]
iii) 기타의 경우:
d[m]=0
여기서, S는 소정의 값이고, S= 약 1.0인 것이 바람직하다. S 값은 해당 서브밴드의 반사 계수를 이용하여 적절하게 설정할 수 있는 것을 유념해야 한다.
에일리어싱의 발생 정도 d[m]에 따라서 3개의 서브밴드간의 게인을 조정하기 위하여 상기 방법과 똑 같이, 예로서, 상기와 같이 오름차순으로 2개의 서브밴드간의 게인 일치 방법을 이용하는 경우, m 서브밴드와 m-1 서브밴드의 게인 g[m], g[m-1]을, 이하와 같이 조정할 수 있다.
g[m]>g[m-1]인 경우,
g[m]=(1.0-d[m])ㆍg[m] + d[m]ㆍg[m-1]
g[m]<g[m-1]인 경우,
g[m-1]=(1.0-d[m])ㆍg[m-1] + d[m]ㆍg[m]
에일리어싱이 발생하는 경우 최대 게인 조정량, 및 에일리어싱이 발생하지 않는 경우 최소 게인 조정량을 에일리어싱 발생 정도에 따라서 평활하게 변화시키는 한, 에일리어싱 발생 정도를 나타내는 값 d[m]으로서 어떠한 특성도 이용할 수 있는 것을 염두에 두어야 한다.
또한, 시간축을 기준으로 하는 에일리어싱 발생 정도를 나타내는 복수의 값을 산출해서 평활화하여, 에일리어싱 발생 정도 d[m]으로서 이용할 수 있다.
(실시형태 4)
도 5는 본 발명의 제4실시형태에 의한 디코딩 장치를 나타내는 개략 블록도이다. 이 디코딩 장치가, 상기의 제2 및 제3실시형태의 디코딩 장치와 상이한 점은, 비트스트림 디멀티플렉서(101)로부터의 고역 주파수 성분 정보(108)가 분석 필터 뱅크(103)로부터의 저역 주파수 서브밴드 신호(617)와 함께 에일리어싱 검출기에 입력되는 것이다.
이러한 구성으로써, 에일리어싱 검출기(615)는, 저역 주파수 서브밴드 신호 (617)와, 고역 주파수 성분 정보(108)에 포함된 게인 정보 모두를 이용하여 에일리어싱을 검출할 수 있다.
상기한 바와 같이, 에일리어싱은, 인접 서브밴드간의 게인 차가 큰 경우 문제가 된다. 또한, 에일리어싱이 발생하는 위치 부근의 원래의 신호 레벨이 낮은 경우, 에일리어싱 성분만을 들을 수 있으므로, 음질이 매우 열화된다.
따라서, 이러한 사실을 고려하여, 본 실시형태의 에일리어싱 검출기(615)는, 우선, 고역 주파수 성분 정보(108)에 포함된 게인 정보를 참조하여 인접 서브밴드간의 게인 차가 소정 레벨보다 큰 서브밴드를 검출하고, 이어서, 상기 검출한 서브밴드에 복사해야 하는 저역 주파수 서브밴드 신호를 참조하여, 각각의 저역 주파수 서브밴드의 레벨을 판단한다. 이 판단 결과, 소정의 서브밴드와 인접 서브밴드간의 레벨 차가 소정의 임계치 이상이면, 그 서브밴드를 에일리어싱이 발생할 가능성이 있는 서브밴드인 것으로 판단한다. 각각의 서브밴드의 레벨을 나타내는 데에는 서브밴드 신호 에너지, 최대 진폭, 총 진폭, 평균 진폭, 또는 기타의 값을 이용할 수 있다.
에일리어싱 검출기(615)는 상기 조건을 만족시키는 서브밴드의 수를 에일리어싱 검출 데이터(616)로서 출력한다. 이어서, 에일리어싱 제거기(613)는, 에일리어싱 검출 데이터(616)에 의해서 표시된 서브밴드의 게인만을 조정한다.
게인은, 인접 서브밴드에 대하여 동일한 레벨을 설정함으로써, 또는 서브밴드간의 게인 차 혹은 게인 비를 소정의 임계치 이하로 제한함으로써, 조정할 수 있다. 양 서브밴드에 대하여 동일한 게인 레벨을 설정하는 경우에는, 2개의 서브밴드 중 낮은 측의 게인 레벨로 설정하거나, 높은 측의 게인 레벨로 설정하거나, 또는 높은 측 게인 레벨과 낮은 측 게인 레벨의 중간 레벨(평균치 등)로 게인을 설정할 수 있다.
또한, 에일리어싱 검출기(615)에 의한 검출 오차를 방지하기 위해서, 상기 방법의 조합을 이용할 수 있다. 예로서, 에일리어싱이 검출된 서브밴드에 대하여 게인을 일치시키는 방법을 이용하고, 기타 서브밴드에 대해서는 게인 차 또는 게인 비를 소정의 임계치 이하로 제한하는 게인 제한 방법을 이용할 수 있다.
따라서, 이러한 구성은, 음질에 영향을 주는 에일리어싱이 예상되는 서브밴드의 게인만을 조정하고, 기타 서브밴드에 대해서는 수신한 비트스트림의 게인 레벨을 사용한다. 그러므로, 에일리어싱에 의한 음질 열화를 방지할 수 있고, 또한 게인 불일치에 의한 음질 열화도 방지할 수 있다.
(실시형태 5)
상기의 제1 내지 제4실시형태의 오디오 디코딩 장치는, 고역 주파수 성분 데이터에 고역 주파수 서브밴드의 게인 정보가 포함되어 있고, 그 정보만을 직접 조정하는 것을 전제로 하고 있다. 그러나, 게인 정보는, 실제의 게인 정보를 송출함으로써, 또는 디코딩된 고역 주파수 서브밴드 신호의 에너지를 송출함으로써 전송될 수 있다. 이 경우의 디코딩 방법은, 디코딩후의 신호 에너지와, 고역 주파수 서브밴드에 복사해야 하는 저역 주파수 서브밴드의 신호 에너지와의 비를 산출함으로써 게인 정보를 취득한다. 그러나, 이 방법은 에일리어싱의 제거 처리전에 고역 주파수 서브밴드 신호의 게인을 산출하는 것을 필요로 한다. 따라서, 본 발명의 본 실시형태에서는, 고역 주파수 서브밴드 디코딩후에 에너지 레벨을 전송하는 게인 정보 전송 방법으로써 실행 가능하게 한 오디오 디코딩 장치를 설명한다.
도 6은 본 실시형태에 의한 오디오 디코딩 장치의 개략 블록도이다. 도면에 나타내는 바와 같이, 이 오디오 디코딩 장치는, 제1실시형태에 나타낸 디코딩 장치의 구성에, 에일리어싱 제거 처리전에 고역 주파수 서브밴드 신호의 게인을 산출하는 게인 산출기(718)가 추가되어 있다.
고역 주파수 서브밴드의 게인 레벨을 디코딩하기 위하여 전송되는 정보(108)는, 디코딩후의 고역 주파수 서브밴드의 에너지 R, 및 이 에너지 R과 부가 신호에 의해서 가산된 에너지와의 비 Q의 2 종류의 값을 포함하고 있다. 게인 산출기(718)는 대역 확장기(104)의 게인 산출부와 동일하다. 이 게인 산출기(718)는, 이 2개의 값, 즉, 에너지 R과 비 Q, 및 저역 주파수 서브밴드 신호(617)의 에너지 E로부터 고역 주파수 서브밴드의 게인 g를 산출한다.
g=sqrt(R/E/(1+Q))
여기서, sqrt는 제곱근 연산자(square root operator)를 나타낸다.
이어서, 이와 같이 산출된 각각의 서브밴드의 게인 정보(719)는, 기타의 고역 주파수 정보와 함께 에일리어싱 제거기(713)에 보내어져서, 제1실시형태에서 설명한 동일한 방법으로 에일리어싱이 제거된다. 이 게인 정보(720)는 부가 신호 정보와 함께 부가 신호 발생기(711)에 보내어지는 것을 유념해야 한다. 이러한 구성으로써, 고역 주파수 서브밴드의 게인 정보 대신에 고역 주파수 서브밴드의 에너지 값이 전송되는 경우에도, 본 발명의 에일리어싱 제거기(제거 수단)를 적용할 수 있다.
또한, 제2 내지 제4실시형태에 대해서도, 에일리어싱 제거전에 고역 주파수 서브밴드 신호의 게인을 산출하고, 그 산출된 고역 주파수 서브밴드 신호의 게인을 에일리어싱 제거기(113)에 입력함으로써, 고역 주파수 서브밴드의 에너지 값이 전송되는 경우에도, 본 실시형태의 에일리어싱 제거기를 적용할 수 있다.
본 발명의 본 실시형태에서는 저역 주파수 서브밴드 신호 에너지를 이용할 수 있으므로, 2개의 인접하는 서브밴드간의 게인 g를 이하와 같이 조정할 수 있는 것을 유념해야 한다.
우선, 이하의 식을 이용하여 게인 조정전 m-1 및 m의 서브밴드의 총 에너지 Et[m]을 산출한다.
Et[m]=g[m]2ㆍE[m] + g[m-1]2ㆍE[m-1]
여기서, g[m-1] 및 g[m]은 게인 조정전의 m-1 및 m 서브밴드의 게인이고, E[m-1] 및 E[m]은, 각각, 대응하는 저역 주파수 서브밴드 신호의 에너지이다.
이어서, 총 에너지 Et[m]을 해당 에너지로서 산출하고, 해당 에너지를 취득하는 데에 필요한, 기준 에너지(즉, 저역 주파수 서브밴드 신호 에너지)에 대한 게인을 산출한다. 이 게인은 해당 에너지와 기준 에너지의 비의 제곱근으로서 표시되므로, 이하의 식을 이용하여 m-1 서브밴드 및 m 서브밴드의 평균 게인 Gt[m]을 산출한다.
Gt[m]=sqrt(Et[m]/(E[m]+E[m-1]))
이어서, 이 평균 게인 Gt[m]과, m 서브밴드에서의 에일리어싱 발생 정도 d[m]을 이용하여, 게인 조정후의 m 서브밴드의 게인 g'[m]을 산출한다.
g'[m]=d[m]ㆍGt[m] + (1.0-d[m])ㆍg[m]
이 게인 조정 결과, m 서브밴드의 에너지가 변화한다. m-1 서브밴드의 에너지가, Et[m]에서 m 서브밴드의 에너지를 감산한 값과 동일하므로 m-1 서브밴드 및 m 서브밴드의 총 에너지 Et[m]이 변화하는 것을 방지하기 위하여, 조정후의 m-1 서브밴드의 게인 g'[m-1]을 이하의 식으로부터 연산할 수 있다.
g'[m-1]=sqrt((Et[m]-g'[m]2ㆍE[m])/E[m-1])
m-1 서브밴드 및 m 서브밴드의 게인을 상기와 같이 조정하는 경우, 게인 조정전의 m-1 서브밴드 및 m 서브밴드의 총 에너지와, 게인 조정후의 m-1 서브밴드 및 m 서브밴드의 총 에너지는 동일하게 된다. 환언하면, 2개의 서브밴드의 총 에너지를 변화시키지 않고 각각의 서브밴드의 게인을 조정할 수 있으므로, 게인 조정에 따르는 신호 에너지의 변화에 의한 음질 열화를 방지할 수 있다.
또한, m-1 서브밴드 및 m 서브밴드의 총 에너지 Et[m]은 대응하는 저역 주파수 서브밴드로부터 복사된 신호로부터만 산출되고, 또한 에너지 비 Q로서 표시되고 부가 신호에 의해서 가산된 에너지 성분을 포함하지 않는다. 따라서, 저역 주파수 서브밴드로부터 복사된 서브밴드 신호의 에너지 분포가 부가 신호에 의해서 영향을 받지 않고 유지될 수 있으므로, 음질의 열화를 방지할 수 있다.
이 게인 조정 방법을 3개의 서브밴드에 대하여 적용하는 경우, 동일한 게인 레벨로 설정해야 하는 각각의 서브밴드 I(I=m-2, m-1, m)에 대하여 g[I]2ㆍE[I]의 값을 산출한 후, 이 3개의 값의 합을 Et[m]으로서 이용한다.
2개의 서브밴드간의 게인의 조정으로써와 같이, 평균 게인 Gt[m]을 이하의 식으로부터 산출하고, 게인 조정으로써 해당 서브밴드의 게인을 설정하여 Gt[m]을 일치시킨다.
Gt[m]=sqrt(Et[m]/(E[m-2]+E[m-1]+E[m]))
이 방법은 또한 게인을 조정하는 서브밴드의 수가 4개 이상인 경우에 이용된다.
또한, 이 2개의 서브밴드의 게인 조정 방법을 에일리어싱 제거기(113)를 참조로 하여 이전에 설명한 바와 같이 오름차순 또는 내림차순으로 적용할 수 있는 것을 염두에 두어야 한다.
이하와 같이 2개 이상의 서브밴드의 에일리어싱 발생 정도 d[m]을 이용하여 게인을 또 다른 방법으로 조정할 수 있다. 예로서, 3개의 서브밴드에 대하여 게인을 조정하는 것으로 하면, 게인을 조정해야 하는 m-2, m-1, m 서브밴드의 각각에 대하여 에너지가 산출되고, 또한 총 에너지 Et[m]이 이하와 같이 산출된다.
Et[m]=g[m-2]2ㆍE[m-2] + g[m-1]2ㆍE[m-1] + g[m]2ㆍE[m]
이어서, 이 총 에너지 Et[m]을 이용하여 이하의 식으로부터 평균 게인의 제곱 G2t[m]을 산출한다.
G2t[m]=Et[m]/(E[m-2]+E[m-1]+E[m])
이어서, G2t[m]을 이용하여 해당 서브밴드(I=m-2, m-1, m)의 게인을 이하와 같이 잠정적으로 산출한다. 본 실시형태에서는 제곱을 이용하여 게인을 보간(補間)하는 것을 유념해야 한다.
g2[I]=f[I]ㆍG2t[m]+(1.0-f[I])ㆍg[I]2
여기서, f[I]는 큰 의미의 d[I] 및 d[I+1]이다. 이 잠정적인 게인 g2[I]를 이용하여 총 에너지 E't[m]을 이하와 같이 산출할 수 있다.
E't[m]=g2[m-2]ㆍE[m-2] + g2[m-1]ㆍE[m-1] + g2[m]ㆍE[m]
총 에너지 E't[m]은 상기의 총 에너지 Et[m]과 반드시 동일하지는 않은 것을 유념해야 한다. 다라서, 게인 조정으로 인하여 총 에너지가 변화는 것을 방지하기 위하여, 해당 서브밴드 I(I=m-2, m-1, m)의 조정후 게인 g'[I]를,
g'[I]=sqrt(bㆍg2[I])에 설정할 수 있다. 여기서, b=Et[m]/E't[m].
이 방법을 게인 조정된 서브밴드의 수가 2 또는 4 이상인 경우에 또한 이용할 수 있다.
2개의 서브밴드간에 게인을 조정하는 경우, 이 게인 조정 방법을 이용하면, 2개 이상의 서브밴드에 대하여 에일리어싱 발생 정도 d[m]을 이용하여 게인을 조정하는 경우에도 게인 조정전의 총 에너지와 게인 조정후의 총 에너지가 동일하게 된다. 이것은, 총 신호 에너지를 변화시키지 않고 각각의 서브밴드의 게인을 조정할 수 있으므로, 게인 조정에 따르는 신호 에너지의 변화로 인한 음질 열화를 방지할 수 있는 것을 의미한다. 상기와 같이 2개의 서브밴드에 대하여 게인을 조정하는 경우에, 음질은 또한 부가 신호에 의해서도 영향을 받지 않는다.
상기 실시형태의 오디오 디코딩 장치의 구성은, 분석 필터 뱅크(103)로부터 출력되는 복소수의 저역 주파수 서브밴드 신호를 대역 확장기(104)에서 실수의 저역 주파수 서브밴드 신호로 변환하여, 실수 연산으로서 고역 주파수 서브밴드 신호를 생성하는 경우에도 적용할 수 있다. 또한, 에일리어싱 검출 처리는 대역 확장기(104)에서의 변환된 실수의 저역 주파수 서브밴드 신호에 대해서도 적용할 수 있다. 2 가지 경우 모두, 본 발명에 의한 오디오 디코딩 장치의 구성 또는 처리 방법을 변경하지 않고, 처리된 신호를 복소수 신호로부터 실수 신호, 즉, 복소수 신호의 허수부가 0인 신호로 변환함으로써 실현할 수 있다. 이러한 구성으로 인하여, 실수 연산을 이용함으로써 대역 확장기의 연산 횟수가 감소되는 동시에, 생성된 고역 주파수 서브밴드 신호에 대하여 에일리어싱 제거 처리가 적용된다. 따라서, 에일리어싱에 의한 음질 열화를 방지할 수 있다.
또한, 상기 오디오 디코딩 장치의 구성은, 분석 필터 뱅크(103)가 실수 계수의 필터 뱅크인 경우에도 적용할 수 있다. 실수 계수의 분석 필터 뱅크(103)에 의한 대역 분할로 인하여 발생된 서브밴드 신호는 실수 신호이므로, 복소수 신호를 실수 신호로 변환하는 경우와 동일하게 고역 주파수 서브밴드 생성시에 에일리어싱이 문제가 된다. 상기 실시형태의 어느 하나에 기재된 오디오 디코딩 장치의 구성을 이용함으로써, 에일리어싱이 발생하는 것을 방지할 수 있고, 이에 따라서, 에일리어싱에 의한 음질 열화를 방지할 수 있다. 또한, 모든 디코딩 연산이 실수 연산으로써 실행되므로 이러한 구성으로써 연산 횟수를 크게 감소시킬 수 있다.
또한, 본 발명의 상기 실시형태에서 설명한 오디오 디코딩 장치의 프로세스를, 소정의 프로그래밍 언어로 코딩된 소프트웨어로써 실현할 수도 있다. 또한 이러한 소프트웨어 애플리케이션을 컴퓨터 판독 가능한 데이터 기록매체에 기록하여 배포할 수도 있다.
본 발명을 특정 실시예와 함게 설명하였지만, 당업자에게는 많은 기타의 변형, 정정 및 응용이 있을 수 있는 것은 명백하다. 따라서, 본 발명은 여기에 제시된 개시에 한정되지 않으며 첨부된 청구범위에 의해서만 한정된다.
또한, 본 발명은 2002년 10월 15일에 출원한 일본국 특허 출원 제2002-300490호에 관련된 것이며, 그 내용이 여기에 참조로서 포함되는 것을 염두에 두어야 한다.

Claims (30)

  1. 협대역 오디오 신호에 대한 인코딩된 정보를 포함하는 비트스트림으로부터 광대역 오디오 신호를 디코딩하는 오디오 디코딩 장치로서,
    상기 비트스트림으로부터 인코딩된 정보를 디멀티플렉싱하는 비트스트림 디멀티플렉서와,
    상기 디멀티플렉싱된 인코딩 정보로부터 협대역 오디오 신호를 디코딩하는 디코더와,
    상기 디코딩된 협대역 오디오 신호를 복수의 제1서브밴드 신호로 분할하는 분석 필터 뱅크와,
    최소한 하나의 제1서브밴드 신호로부터, 각각의 제2서브밴드 신호가 상기 제1서브밴드 신호의 주파수 대역 보다 높은 주파수 대역을 갖는 복수의 제2서브밴드 신호를 생성하는 대역 확장기와,
    제2서브밴드 신호의 게인을 조정하여 제2서브밴드 신호에 발생하는 에일리어싱 성분을 억제하는 에일리어싱 제거기와,
    제1서브밴드 신호와 제2서브밴드 신호를 합성하여 광대역 오디오 신호를 생성하는 실수 연산 합성 필터 뱅크를 포함하는 오디오 디코딩 장치.
  2. 협대역 오디오 신호에 대한 인코딩된 정보를 포함하는 비트스트림으로부터 광대역 오디오 신호를 디코딩하는 오디오 디코딩 장치로서,
    상기 비트스트림으로부터 인코딩된 정보를 디멀티플렉싱하는 비트스트림 디멀티플렉서와,
    상기 디멀티플렉싱된 인코딩 정보로부터 협대역 오디오 신호를 디코딩하는 디코더와,
    상기 디코딩된 협대역 오디오 신호를 복수의 제1서브밴드 신호로 분할하는 분석 필터 뱅크와,
    최소한 하나의 제1서브밴드 신호로부터, 각각의 제2서브밴드 신호가 상기 제1서브밴드 신호의 주파수 대역 보다 높은 주파수 대역을 갖는 복수의 제2서브밴드 신호를 생성하는 대역 확장기와,
    대역 확장기에 의해서 생성된 복수의 제2서브밴드 신호에서의 에일리어싱 성분의 발생 정도를 검출하는 에일리어싱 검출기와,
    검출된 에일리어싱 성분의 발생 정도에 따라서 제2서브밴드 신호의 게인을 조정하여 에일리어싱 성분을 억제하는 에일리어싱 제거기와,
    제1서브밴드 신호와 제2서브밴드 신호를 합성하여 광대역 오디오 신호를 생성하는 실수 연산 합성 필터 뱅크를 포함하는 오디오 디코딩 장치.
  3. 제2항에 있어서, 에일리어싱 성분은, 최소한, 복소수 연산을 실행하는 합성 필터 뱅크에 의한 합성후의 억제된 성분을 포함하는 것을 특징으로 하는 오디오 디코딩 장치.
  4. 제2항에 있어서, 상기 제1서브밴드 신호는 저역 주파수 서브밴드 신호이고, 상기 제2서브밴드 신호는 고역 주파수 서브밴드 신호인 것을 특징으로 하는 오디오 디코딩 장치.
  5. 제4항에 있어서, 상기 에일리어싱 검출기는 제1서브밴드 신호의 주파수 분포의 기울기를 나타내는 파라미터를 사용하여 에일리어싱 성분의 발생 정도를 검출하는 것을 특징으로 하는 오디오 디코딩 장치.
  6. 제5항에 있어서, 상기 에일리어싱 검출기는 인접하는 2개의 서브밴드의 주파수 분포의 기울기를 나타내는 파라미터를 산출하여, 2개의 서브밴드의 에일리어싱 성분의 발생 정도를 검출하는 것을 특징으로 하는 오디오 디코딩 장치.
  7. 제5항에 있어서, 상기 에일리어싱 검출기는 인접하는 3개의 서브밴드의 주파수 분포의 기울기를 나타내는 파라미터를 산출하여, 상기 3개의 서브밴드의 에일리어싱 성분의 발생 정도를 검출하는 것을 특징으로 하는 오디오 디코딩 장치.
  8. 제5항에 있어서, 상기 주파수 분포의 기울기를 나타내는 파라미터는 반사 계수인 것을 특징으로 하는 오디오 디코딩 장치.
  9. 제2항에 있어서,
    상기 비트스트림은, 협대역을 광대역으로 확장하기 위한, 협대역 오디오 신호와 부가 정보에 관한 인코딩된 정보를 포함하고,
    상기 부가 정보는, 상기 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 신호의 특징을 나타내는 고역 주파수 성분 정보를 포함하며,
    상기 비트스트림 디멀티플렉서는, 또한 상기 비트스트림으로부터 상기 부가 정보를 디멀티플렉싱하고,
    상기 대역 확장기는, 최소한 하나의 제1서브밴드 신호와, 부가 정보의 고역 주파수 성분 정보로부터, 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 복수의 제2서브밴드 신호를 생성하는 것을 특징으로 하는 오디오 디코딩 장치.
  10. 제9항에 있어서, 상기 고역 주파수 성분 정보는 상기 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 게인 정보를 포함하고,
    상기 대역 확장기는 상기 게인 정보에 따라서 제1서브밴드 신호로부터 제2서브밴드 신호를 생성하며, 그리고
    상기 에일리어싱 제거기는 검출된 에일리어싱 성분의 발생 정도와 게인 정보에 따라서 상기 제2서브밴드 신호의 게인을 조정하여 에일리어싱 성분을 억제하는 것을 특징으로 하는 오디오 디코딩 장치.
  11. 제9항에 있어서, 상기 고역 주파수 성분 정보는 상기 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 신호의 에너지 정보를 포함하고,
    상기 대역 확장기는 상기 에너지 정보로부터 산출된 게인 정보에 따라서 제1서브밴드 신호로부터 제2서브밴드 신호를 생성하며, 그리고
    상기 에일리어싱 제거기는 검출된 에일리어싱 성분의 발생 정도와 게인 정보에 따라서 상기 제2서브밴드 신호의 게인을 조정하여 에일리어싱 성분을 억제하는 것을 특징으로 하는 오디오 디코딩 장치.
  12. 제11항에 있어서, 상기 에일리어싱 제거기는, 게인이 조정된 복수의 제2서브밴드 신호의 총 에너지가, 대응하는 제2서브밴드 신호의 에너지 정보에 의해서 제공된 총 에너지와 동일하도록, 제2서브밴드 신호의 게인을 조정하는 것을 특징으로 하는 오디오 디코딩 장치.
  13. 제11항에 있어서, 상기 대역 확장기는 생성된 제2서브밴드 신호에 부가 신호를 가산하고,
    상기 에너지 정보는, 제2서브밴드 신호의 에너지 R, 및 상기 에너지 R과 부가 신호의 에너지와의 비 Q를 포함하며, 그리고
    상기 대역 확장기는 상기 제1서브밴드 신호의 에너지 E를 산출하여, 에너지 R, 에너지 E, 및 에너지 비 Q로 표시된 부가 신호의 에너지에 따라서 대응하는 제2서브밴드 신호의 게인 g를 산출하는 것을 특징으로 하는 오디오 디코딩 장치.
  14. 제13항에 있어서, 제곱근 연산자를 sqrt로 표시할 경우, 상기 제2서브밴드 신호의 게인 g는,
    g=sqrt{R/E(1+Q)}인 것을 특징으로 하는 오디오 디코딩 장치.
  15. 협대역 오디오 신호에 대한 인코딩된 정보를 포함하는 비트스트림으로부터 광대역 오디오 신호를 디코딩하는 오디오 디코딩 방법으로서,
    상기 비트스트림으로부터 인코딩된 정보를 디멀티플렉싱하는 단계와,
    상기 디멀티플렉싱된 인코딩 정보로부터 협대역 오디오 신호를 디코딩하는 단계와,
    상기 디코딩된 협대역 오디오 신호를 복수의 제1서브밴드 신호로 분할하는 단계와,
    최소한 하나의 제1서브밴드 신호로부터, 각각의 제2서브밴드 신호가 상기 제1서브밴드 신호의 주파수 대역 보다 높은 주파수 대역을 갖는 복수의 제2서브밴드 신호를 생성하는 단계와,
    제2서브밴드 신호의 게인을 조정하여 제2서브밴드 신호에 발생하는 에일리어싱 성분을 억제하는 단계와,
    실수 필터링 연산으로써 제1서브밴드 신호와 제2서브밴드 신호를 합성하여 광대역 오디오 신호를 생성하는 단계를 포함하는 오디오 디코딩 방법.
  16. 협대역 오디오 신호에 대한 인코딩된 정보를 포함하는 비트스트림으로부터 광대역 오디오 신호를 디코딩하는 오디오 디코딩 방법으로서,
    상기 비트스트림으로부터 인코딩된 정보를 디멀티플렉싱하는 단계와,
    상기 디멀티플렉싱된 인코딩 정보로부터 협대역 오디오 신호를 디코딩하는 단계와,
    상기 디코딩된 협대역 오디오 신호를 복수의 제1서브밴드 신호로 분할하는 단계와,
    최소한 하나의 제1서브밴드 신호로부터, 각각의 제2서브밴드 신호가 상기 제1서브밴드 신호의 주파수 대역 보다 높은 주파수 대역을 갖는 복수의 제2서브밴드 신호를 생성하는 단계와,
    제2서브밴드 신호를 생성하기 전에, 생성되는 복수의 제2서브밴드 신호의 각각에서의 에일리어싱 성분의 발생 정도를 검출하는 단계와,
    검출된 에일리어싱 성분의 발생 정도에 따라서 제2서브밴드 신호의 게인을 조정하여 에일리어싱 성분을 억제하는 단계와,
    실수 필터링 연산으로써 제1서브밴드 신호와 제2서브밴드 신호를 합성하여 광대역 오디오 신호를 생성하는 단계를 포함하는 오디오 디코딩 방법.
  17. 제16항에 있어서, 에일리어싱 성분은, 최소한, 복소수 필터링 연산에 의한 합성후의 억제된 성분을 포함하는 것을 특징으로 하는 오디오 디코딩 방법.
  18. 제16항에 있어서, 상기 제1서브밴드 신호는 저역 주파수 서브밴드 신호이고, 상기 제2서브밴드 신호는 고역 주파수 서브밴드 신호인 것을 특징으로 하는 오디오 디코딩 방법.
  19. 제18항에 있어서, 에일리어싱 성분의 발생 정도의 검출 단계에서, 제1서브밴드 신호의 주파수 분포의 기울기를 나타내는 파라미터를 사용하여 에일리어싱 성분의 발생 정도를 검출하는 것을 특징으로 하는 오디오 디코딩 방법.
  20. 제19항에 있어서, 에일리어싱 성분의 발생 정도의 검출 단계에서, 인접하는 2개의 서브밴드의 주파수 분포의 기울기를 나타내는 파라미터를 산출하여, 2개의 서브밴드의 에일리어싱 성분의 발생 정도를 검출하는 것을 특징으로 하는 오디오 디코딩 방법.
  21. 제19항에 있어서, 에일리어싱 성분의 발생 정도의 검출 단계에서, 인접하는 3개의 서브밴드의 주파수 분포의 기울기를 나타내는 파라미터를 산출하여, 3개의 서브밴드의 에일리어싱 성분의 발생 정도를 검출하는 것을 특징으로 하는 오디오 디코딩 방법.
  22. 제19항에 있어서, 상기 주파수 분포의 기울기를 나타내는 파라미터는 반사 계수인 것을 특징으로 하는 오디오 디코딩 방법.
  23. 제16항에 있어서,
    상기 비트스트림은, 협대역을 광대역으로 확장하기 위한, 협대역 오디오 신호와 부가 정보에 관한 인코딩된 정보를 포함하고,
    상기 부가 정보는, 상기 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 신호의 특징을 나타내는 고역 주파수 성분 정보를 포함하며,
    인코딩된 정보의 디멀티플렉싱 단계에서, 상기 비트스트림으로부터 상기 부가 정보를 디멀티플렉싱하고,
    복수의 제2서브밴드 신호의 생성 단계에서, 최소한 하나의 제1서브밴드 신호와, 부가 정보의 고역 주파수 성분 정보로부터, 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 복수의 제2서브밴드 신호를 생성하는 것을 특징으로 하는 오디오 디코딩 방법.
  24. 제23항에 있어서, 상기 고역 주파수 성분 정보는 상기 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 게인 정보를 포함하고,
    복수의 제2서브밴드 신호의 생성 단계에서, 상기 게인 정보에 따라서 제1서브밴드 신호로부터 제2서브밴드 신호를 생성하며, 그리고
    게인 조정 단계에서, 검출된 에일리어싱 성분의 발생 정도와 게인 정보에 따라서 상기 제2서브밴드 신호의 게인을 조정하여 에일리어싱 성분을 억제하는 것을 특징으로 하는 오디오 디코딩 방법.
  25. 제23항에 있어서, 상기 고역 주파수 성분 정보는 상기 제1서브밴드 신호의 주파수 대역보다 높은 주파수 대역의 신호의 에너지 정보를 포함하고,
    복수의 제2서브밴드 신호의 생성 단계에서, 상기 에너지 정보로부터 산출된 게인 정보에 따라서 제1서브밴드 신호로부터 제2서브밴드 신호를 생성하며, 그리고
    게인 조정 단계에서, 검출된 에일리어싱 성분의 발생 정도와 게인 정보에 따라서 상기 제2서브밴드 신호의 게인을 조정하여 에일리어싱 성분을 억제하는 것을 특징으로 하는 오디오 디코딩 방법.
  26. 제25항에 있어서, 게인 조정 단계에서, 게인이 조정된 복수의 제2서브밴드 신호의 총 에너지가, 대응하는 제2서브밴드 신호의 에너지 정보에 의해서 제공된 총 에너지와 동일하도록, 제2서브밴드 신호의 게인을 조정하는 것을 특징으로 하는 오디오 디코딩 방법.
  27. 제25항에 있어서, 복수의 제2서브밴드 신호의 생성 단계는, 생성된 제2서브밴드 신호에 부가 신호를 가산하는 단계를 포함하고,
    상기 에너지 정보는, 제2서브밴드 신호의 에너지 R, 및 상기 에너지 R과 부가 신호의 에너지와의 비 Q를 포함하며, 그리고
    상기 복수의 제2서브밴드 신호의 생성 단계는, 또한 상기 제1서브밴드 신호의 에너지 E를 산출하는 단계와, 에너지 R, 에너지 E, 및 에너지 비 Q로 표시된 부가 신호의 에너지에 따라서 대응하는 제2서브밴드 신호의 게인 g를 산출하는 단계를 포함하는 것을 특징으로 하는 오디오 디코딩 방법.
  28. 제27항에 있어서, 제곱근 연산자를 sqrt로 표시할 경우, 상기 제2서브밴드 신호의 게인 g는,
    g=sqrt{R/E(1+Q)}인 것을 특징으로 하는 오디오 디코딩 방법.
  29. 제15항 내지 제28항 중 어느 한 항에 의한 오디오 디코딩 방법에 의해서 실현되는 기능을 제공하는 프로그래밍 언어로 코딩된 소프트웨어.
  30. 제29항에 의한 소프트웨어를 기록한 데이터 기록매체.
KR1020047009424A 2002-09-19 2003-09-11 오디오 디코딩 장치 및 오디오 디코딩 방법 KR100728428B1 (ko)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JPJP-P-2002-00273557 2002-09-19
JP2002273557 2002-09-19
JP2002283722 2002-09-27
JPJP-P-2002-00283722 2002-09-27
JPJP-P-2002-00300490 2002-10-15
JP2002300490 2002-10-15

Publications (2)

Publication Number Publication Date
KR20050042075A true KR20050042075A (ko) 2005-05-04
KR100728428B1 KR100728428B1 (ko) 2007-06-13

Family

ID=32034073

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020047009424A KR100728428B1 (ko) 2002-09-19 2003-09-11 오디오 디코딩 장치 및 오디오 디코딩 방법

Country Status (14)

Country Link
US (1) US7069212B2 (ko)
EP (1) EP1543307B1 (ko)
JP (1) JP3646939B1 (ko)
KR (1) KR100728428B1 (ko)
CN (1) CN100492492C (ko)
AT (1) ATE318405T1 (ko)
AU (1) AU2003260958A1 (ko)
BR (1) BRPI0306434B1 (ko)
CA (1) CA2469674C (ko)
DE (1) DE60303689T2 (ko)
ES (1) ES2259158T3 (ko)
HK (1) HK1074877A1 (ko)
TW (1) TWI313856B (ko)
WO (1) WO2004027368A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180108871A (ko) * 2010-07-19 2018-10-04 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
DE10121532A1 (de) * 2001-05-03 2002-11-07 Siemens Ag Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
DE60202881T2 (de) 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7668711B2 (en) 2004-04-23 2010-02-23 Panasonic Corporation Coding equipment
KR101143724B1 (ko) * 2004-05-14 2012-05-11 파나소닉 주식회사 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치
CN101656073B (zh) * 2004-05-14 2012-05-23 松下电器产业株式会社 解码装置、解码方法以及通信终端和基站装置
EP1742202B1 (en) * 2004-05-19 2008-05-07 Matsushita Electric Industrial Co., Ltd. Encoding device, decoding device, and method thereof
EP1810281B1 (en) * 2004-11-02 2020-02-26 Koninklijke Philips N.V. Encoding and decoding of audio signals using complex-valued filter banks
KR20070085982A (ko) * 2004-12-10 2007-08-27 마츠시타 덴끼 산교 가부시키가이샤 광대역 부호화 장치, 광대역 lsp 예측 장치, 대역스케일러블 부호화 장치 및 광대역 부호화 방법
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
WO2006075663A1 (ja) * 2005-01-14 2006-07-20 Matsushita Electric Industrial Co., Ltd. 音声切替装置および音声切替方法
NZ562182A (en) * 2005-04-01 2010-03-26 Qualcomm Inc Method and apparatus for anti-sparseness filtering of a bandwidth extended speech prediction excitation signal
US8086451B2 (en) 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
TWI324336B (en) * 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
JP4899359B2 (ja) * 2005-07-11 2012-03-21 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
FR2888699A1 (fr) * 2005-07-13 2007-01-19 France Telecom Dispositif de codage/decodage hierachique
EP1906706B1 (en) * 2005-07-15 2009-11-25 Panasonic Corporation Audio decoder
US7917561B2 (en) * 2005-09-16 2011-03-29 Coding Technologies Ab Partially complex modulated filter bank
US8443026B2 (en) * 2005-09-16 2013-05-14 Dolby International Ab Partially complex modulated filter bank
JP4876574B2 (ja) * 2005-12-26 2012-02-15 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
TWI311856B (en) * 2006-01-04 2009-07-01 Quanta Comp Inc Synthesis subband filtering method and apparatus
WO2007080211A1 (en) * 2006-01-09 2007-07-19 Nokia Corporation Decoding of binaural audio signals
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
JP5185254B2 (ja) * 2006-04-04 2013-04-17 ドルビー ラボラトリーズ ライセンシング コーポレイション Mdct領域におけるオーディオ信号音量測定と改良
US8000825B2 (en) * 2006-04-13 2011-08-16 Immersion Corporation System and method for automatically producing haptic events from a digital audio file
US7979146B2 (en) * 2006-04-13 2011-07-12 Immersion Corporation System and method for automatically producing haptic events from a digital audio signal
US8378964B2 (en) 2006-04-13 2013-02-19 Immersion Corporation System and method for automatically producing haptic events from a digital audio signal
DE102006047197B3 (de) 2006-07-31 2008-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten
KR101056253B1 (ko) * 2006-10-25 2011-08-11 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 오디오 서브밴드 값을 생성하는 장치 및 방법과 시간 영역 오디오 샘플을 생성하는 장치 및 방법
US8285555B2 (en) 2006-11-21 2012-10-09 Samsung Electronics Co., Ltd. Method, medium, and system scalably encoding/decoding audio/speech
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
AU2008215232B2 (en) 2007-02-14 2010-02-25 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US20080208575A1 (en) * 2007-02-27 2008-08-28 Nokia Corporation Split-band encoding and decoding of an audio signal
JP4984983B2 (ja) * 2007-03-09 2012-07-25 富士通株式会社 符号化装置および符号化方法
KR101355376B1 (ko) * 2007-04-30 2014-01-23 삼성전자주식회사 고주파수 영역 부호화 및 복호화 방법 및 장치
KR101411900B1 (ko) * 2007-05-08 2014-06-26 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 장치
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
CN101458930B (zh) * 2007-12-12 2011-09-14 华为技术有限公司 带宽扩展中激励信号的生成及信号重建方法和装置
CN101329870B (zh) * 2008-08-01 2012-12-12 威盛电子股份有限公司 音频解码器以及相关的电子装置以及抑制高频调制噪声的方法
US8352279B2 (en) * 2008-09-06 2013-01-08 Huawei Technologies Co., Ltd. Efficient temporal envelope coding approach by prediction between low band signal and high band signal
WO2010070770A1 (ja) * 2008-12-19 2010-06-24 富士通株式会社 音声帯域拡張装置及び音声帯域拡張方法
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US11657788B2 (en) * 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI556227B (zh) * 2009-05-27 2016-11-01 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
AU2013263712B2 (en) * 2009-05-27 2015-11-12 Dolby International Ab Efficient Combined Harmonic Transposition
AU2015264887B2 (en) * 2009-05-27 2017-12-07 Dolby International Ab Efficient Combined Harmonic Transposition
JP5754899B2 (ja) * 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
JPWO2011048741A1 (ja) * 2009-10-20 2013-03-07 日本電気株式会社 マルチバンドコンプレッサ
EP4276823B1 (en) 2009-10-21 2024-07-17 Dolby International AB Oversampling in a combined transposer filter bank
CA3225485A1 (en) 2010-01-19 2011-07-28 Dolby International Ab Improved subband block based harmonic transposition
KR101423737B1 (ko) * 2010-01-21 2014-07-24 한국전자통신연구원 오디오 신호의 디코딩 방법 및 장치
WO2011114192A1 (en) * 2010-03-19 2011-09-22 Nokia Corporation Method and apparatus for audio coding
JP5651980B2 (ja) 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
CN103069484B (zh) * 2010-04-14 2014-10-08 华为技术有限公司 时/频二维后处理
US12002476B2 (en) 2010-07-19 2024-06-04 Dolby International Ab Processing of audio signals during high frequency reconstruction
US9236063B2 (en) * 2010-07-30 2016-01-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dynamic bit allocation
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5665987B2 (ja) * 2010-08-12 2015-02-04 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ Qmfベースのオーディオコーデックの出力信号のリサンプリング
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
MY176574A (en) * 2010-09-16 2020-08-17 Dolby Int Ab Cross product enhanced subband block based harmonic transposition
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
FR2969804A1 (fr) * 2010-12-23 2012-06-29 France Telecom Filtrage perfectionne dans le domaine transforme.
JP5743137B2 (ja) * 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
MX2013009346A (es) * 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral.
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
CA2827266C (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
MY159444A (en) 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
JP5712288B2 (ja) 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
PL2661745T3 (pl) 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
GB2491173A (en) * 2011-05-26 2012-11-28 Skype Setting gain applied to an audio signal based on direction of arrival (DOA) information
GB2493327B (en) 2011-07-05 2018-06-06 Skype Processing audio signals
US9210506B1 (en) * 2011-09-12 2015-12-08 Audyssey Laboratories, Inc. FFT bin based signal limiting
GB2495129B (en) 2011-09-30 2017-07-19 Skype Processing signals
GB2495278A (en) 2011-09-30 2013-04-10 Skype Processing received signals from a range of receiving angles to reduce interference
GB2495128B (en) 2011-09-30 2018-04-04 Skype Processing signals
GB2495472B (en) 2011-09-30 2019-07-03 Skype Processing audio signals
GB2495131A (en) 2011-09-30 2013-04-03 Skype A mobile device includes a received-signal beamformer that adapts to motion of the mobile device
GB2495130B (en) 2011-09-30 2018-10-24 Skype Processing audio signals
GB2496660B (en) 2011-11-18 2014-06-04 Skype Processing audio signals
GB201120392D0 (en) 2011-11-25 2012-01-11 Skype Ltd Processing signals
GB2497343B (en) 2011-12-08 2014-11-26 Skype Processing audio signals
CN106847303B (zh) * 2012-03-29 2020-10-13 瑞典爱立信有限公司 支持谐波音频信号的带宽扩展的方法、设备和记录介质
JP5997592B2 (ja) 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
KR101920029B1 (ko) * 2012-08-03 2018-11-19 삼성전자주식회사 모바일 장치 및 제어방법
JP2014074782A (ja) * 2012-10-03 2014-04-24 Sony Corp 音声送信装置、音声送信方法、音声受信装置および音声受信方法
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置
FR3007563A1 (fr) * 2013-06-25 2014-12-26 France Telecom Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
JP6531649B2 (ja) 2013-09-19 2019-06-19 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
CN104517610B (zh) * 2013-09-26 2018-03-06 华为技术有限公司 频带扩展的方法及装置
BR112016014476B1 (pt) 2013-12-27 2021-11-23 Sony Corporation Aparelho e método de decodificação, e, meio de armazenamento legível por computador
EP4002359A1 (en) * 2014-06-10 2022-05-25 MQA Limited Digital encapsulation of audio signals
CN105225666B (zh) 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
KR101641418B1 (ko) * 2014-07-25 2016-07-20 포항공과대학교 산학협력단 청각 주목도에 기반한 햅틱 신호 생성 방법 및 이를 위한 장치
CN104269173B (zh) * 2014-09-30 2018-03-13 武汉大学深圳研究院 切换模式的音频带宽扩展装置与方法
EP3067889A1 (en) 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and apparatus for signal-adaptive transform kernel switching in audio coding
US10049684B2 (en) * 2015-04-05 2018-08-14 Qualcomm Incorporated Audio bandwidth selection
EP3353785B2 (en) * 2015-09-22 2021-09-22 Koninklijke Philips N.V. Audio signal processing
JP6210338B2 (ja) * 2015-12-28 2017-10-11 ソニー株式会社 信号処理装置および方法、並びにプログラム
CN116343804A (zh) 2016-12-16 2023-06-27 瑞典爱立信有限公司 用于处理包络表示系数的方法、编码器和解码器
JP6769299B2 (ja) * 2016-12-27 2020-10-14 富士通株式会社 オーディオ符号化装置およびオーディオ符号化方法
US11540279B2 (en) * 2019-07-12 2022-12-27 Meteorcomm, Llc Wide band sensing of transmissions in FDM signals containing multi-width channels
US11916668B2 (en) 2020-12-08 2024-02-27 Meteorcomm, Llc Soft decision differential demodulator for radios in wireless networks supporting train control
US12022375B2 (en) 2020-12-19 2024-06-25 Meteorcomm, Llc End of train to head of train communication over a train control network
CN113299313B (zh) * 2021-01-28 2024-03-26 维沃移动通信有限公司 音频处理方法、装置及电子设备
CN113539277B (zh) * 2021-09-17 2022-01-18 北京百瑞互联技术有限公司 一种保护听力的蓝牙音频解码方法、装置、介质及设备
CN114189410B (zh) * 2021-12-13 2024-05-17 深圳市日声数码科技有限公司 一种车载数码广播音频接收系统

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4691292A (en) * 1983-04-13 1987-09-01 Rca Corporation System for digital multiband filtering
DE3510573A1 (de) * 1985-03-23 1986-09-25 Philips Patentverwaltung Digitale analyse-synthese-filterbank mit maximaler taktreduktion
JP2906646B2 (ja) * 1990-11-09 1999-06-21 松下電器産業株式会社 音声帯域分割符号化装置
JPH04206035A (ja) * 1990-11-30 1992-07-28 Kogaku Denshi Kk Cd―romおよびcd―romの再生システム
FR2680924B1 (fr) * 1991-09-03 1997-06-06 France Telecom Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant.
US5508949A (en) 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US5654952A (en) * 1994-10-28 1997-08-05 Sony Corporation Digital signal encoding method and apparatus and recording medium
JPH08162964A (ja) 1994-12-08 1996-06-21 Sony Corp 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体
EP0732687B2 (en) 1995-03-13 2005-10-12 Matsushita Electric Industrial Co., Ltd. Apparatus for expanding speech bandwidth
JP2956548B2 (ja) * 1995-10-05 1999-10-04 松下電器産業株式会社 音声帯域拡大装置
SE512719C2 (sv) 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3437421B2 (ja) 1997-09-30 2003-08-18 シャープ株式会社 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体
EP0957580B1 (en) 1998-05-15 2008-04-02 Thomson Method and apparatus for sampling-rate conversion of audio signals
EP0957579A1 (en) 1998-05-15 1999-11-17 Deutsche Thomson-Brandt Gmbh Method and apparatus for sampling-rate conversion of audio signals
US6539355B1 (en) * 1998-10-15 2003-03-25 Sony Corporation Signal band expanding method and apparatus and signal synthesis method and apparatus
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6718300B1 (en) 2000-06-02 2004-04-06 Agere Systems Inc. Method and apparatus for reducing aliasing in cascaded filter banks
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US6895375B2 (en) * 2001-10-04 2005-05-17 At&T Corp. System for bandwidth extension of Narrow-band speech

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180108871A (ko) * 2010-07-19 2018-10-04 돌비 인터네셔널 에이비 고주파 복원 동안 오디오 신호들의 프로세싱

Also Published As

Publication number Publication date
BRPI0306434B1 (pt) 2018-06-12
EP1543307B1 (en) 2006-02-22
ATE318405T1 (de) 2006-03-15
TW200407846A (en) 2004-05-16
BRPI0306434A8 (pt) 2017-10-10
WO2004027368A1 (en) 2004-04-01
US7069212B2 (en) 2006-06-27
DE60303689T2 (de) 2006-10-19
US20050149339A1 (en) 2005-07-07
CA2469674A1 (en) 2004-04-01
KR100728428B1 (ko) 2007-06-13
HK1074877A1 (en) 2005-11-25
EP1543307A1 (en) 2005-06-22
CN100492492C (zh) 2009-05-27
CA2469674C (en) 2012-04-24
AU2003260958A1 (en) 2004-04-08
BR0306434A (pt) 2004-10-26
TWI313856B (en) 2009-08-21
JP3646939B1 (ja) 2005-05-11
DE60303689D1 (de) 2006-04-27
JP2005520219A (ja) 2005-07-07
AU2003260958A8 (en) 2004-04-08
ES2259158T3 (es) 2006-09-16
CN1606687A (zh) 2005-04-13

Similar Documents

Publication Publication Date Title
KR100728428B1 (ko) 오디오 디코딩 장치 및 오디오 디코딩 방법
JP5224017B2 (ja) オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム
US8321229B2 (en) Apparatus, medium and method to encode and decode high frequency signal
JP3579047B2 (ja) オーディオ復号装置と復号方法およびプログラム
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
US10255928B2 (en) Apparatus, medium and method to encode and decode high frequency signal
JP4296752B2 (ja) 符号化方法及び装置、復号方法及び装置、並びにプログラム
KR20120008537A (ko) 복호화 장치 및 복호화 방법, 및 복호화 장치를 구비하는 통신 단말 장치 및 기지국 장치
KR20050107812A (ko) 다중-채널 신호들의 처리
JP4313993B2 (ja) オーディオ復号化装置およびオーディオ復号化方法
KR20160138373A (ko) 부호화 장치, 복호 장치, 부호화 방법, 복호 방법, 및 프로그램
US6995699B2 (en) Encoding method, and encoding apparatus, and decoding method and decoding apparatus
JP2005284301A (ja) 復号方法及び装置、並びにプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130524

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20140530

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20150515

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160517

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170522

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20180516

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20190515

Year of fee payment: 13