KR101427863B1

KR101427863B1 - 오디오 신호 코딩 방법 및 장치

Info

Publication number: KR101427863B1
Application number: KR1020137023033A
Authority: KR
Inventors: 레이 미아오; 제신 리우
Original assignee: 후아웨이 테크놀러지 컴퍼니 리미티드
Priority date: 2011-10-08
Filing date: 2012-03-22
Publication date: 2014-08-07
Also published as: JP2015172778A; JP2014508327A; KR20130126695A; US20170053661A1; US20140114670A1; WO2012163144A1; JP2017187790A; CN103035248B; US9779749B2; US20160148622A1; EP3239980A1; EP2680260A1; US9514762B2; EP2680260A4; CN103035248A; US9251798B2

Abstract

본 발명은 오디오 신호 방법 및 장치에 관한 것이다. 방법, 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계; 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하는 단계; 및 주파수 코딩 방식 또는 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 단계를 포함한다.

Description

오디오 신호 코딩 방법 및 장치{AUDIO SIGNAL CODING METHOD AND APPARATUS}

삭제

본 발명은 통신 분야에 관한 것이며, 특히 오디오 신호 코딩 방법 및 장치에 관한 것이다.

오디오 코딩 동안, 사람의 귀의 비트 레이트 한계 및 청력 특성을 고려하여, 저주파 오디오 신호의 정보를 양호하게 코딩하고 고주파 오디오 신호의 정보를 폐기한다. 그렇지만, 네트워크 기술의 급속한 발전으로, 네트워크 대역폭 한계가 낮아지고 있다. 사람들의 음색(timbre)에 대한 조건은 더 높아지고 있는 반면, 신호에 대한 대역폭을 부가함으로써 고주파 오디오 신호의 정보를 저장하고 싶어한다. 이 방법에서, 오디오 신호의 음색이 개선된다. 구체적으로, 이것은 대역폭 확장(BandWidth Extension: BWE) 기술을 사용함으로써 실현될 수 있다.

대역폭 확장에 의해 오디오 신호의 주파수 범위를 확장시키고 신호 품질을 향상시킬 수 있다. 현재, 흔히 사용되고 있는 BWT 기술로서는, 예를 들어, G.729.1의 시간 도메인(Time Domain: TD) 대역폭 확장 알고리즘, 동영상 전문가 그룹(Moving Picture Experts Group: MPEG)에서의 스펙트럼 대역 복제(Spectral Band Replication: SBR) 기술, 및 국제 통신 연합(International Telecommucation Union: ITU-I) G.722B/G.722.1D에서의 주파수 도메인(Frequency Domain: FD) 대역폭 확장 알고리즘을 들 수 있다.

도 1 및 도 2는 종래기술에서의 대역폭 확장에 대한 개략도이다. 즉, 저주파(예를 들어, 6.4 kHz보다 작은 주파수) 오디오 신호가 시간 도메인 코딩(TD coding) 또는 주파수 도메인 코딩(FD coding)을 사용하든 안 하든 간에, 고주파(예를 들어, 6.4-16/14 kHz) 오디오 신호는 대역폭 확장을 위해 시간 도메인 대역폭 확장(TD-BWE) 또는 주파수 도메인 대역폭 확장(FD-BWE)을 사용한다.

종래기술에서는, 저주파 오디오 신호의 코딩 방식 및 오디오 신호의 특성을 고려하지 않고, 시간 도메인 대역폭 확장의 시간 도메인 코딩 또는 주파수 도메인 대역폭 확장의 주파수 도메인 코딩만을 사용하여 고주파 오디오 신호를 코딩한다.

본 발명의 실시예는 오디오 신호 코딩 방법 및 장치를 제공하며, 이에 따라 고정 코딩 대신 적응 코딩을 실현할 수 있다.

본 발명의 실시예는 오디오 신호 코딩 방법을 제공하며, 상기 방법은,

오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계;

상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하는 단계; 및

주파수 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계

를 포함한다.

본 발명의 실시예는 오디오 신호 코딩 장치를 제공하며, 상기 장치는,

오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있는 분류 유닛;

상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하도록 구성되어 있는 저주파 신호 코딩 유닛; 및

주파수 코딩 방식 및/또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하도록 구성되어 있는 고주파 신호 코딩 유닛

을 포함한다.

본 발명의 실시예의 오디오 코딩 방법 및 장치에 따르면, 고주파 오디오 신호로의 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및/또는 오디오 신호의 특성에 따라 확정될 수 있다. 이 방법에서, 저주파 오디오 신호의 코딩 방식 및/또는 오디오 신호의 특성이 대역폭 확장 동안 고려되지 않는 경우를 회피할 수 있고, 대역폭 확장은 단일 코딩 방식에 제한되지 않으며, 적응 코딩이 실현되고, 오디오 코딩 품질이 향상된다.

도 1은 종래기술에서의 대역폭 확장에 대한 제1 개략도이다.
도 2는 종래기술에서의 대역폭 확장에 대한 제2 개략도이다.
도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다.
도 4는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제1 개략도이다.
도 5는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제2 개략도이다.
도 6은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제3 개략도이다.
도 7은 ITU-T G.718에서의 분석 윈도에 대한 개략도이다.
도 8은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 상이한 고주파 오디오 신호의 윈도윙에 대한 개략도이다.
도 9는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 높은 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 10은 본 발명에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 제로 지연 윈도윙에 기초한 BWE에 대한 개략도이다.
도 11은 본 발명의 실시예에 따른 오디오 신호 처리 장치에 대한 개략도이다.
도 12는 본 발명의 실시예에 따른 다른 오디오 신호 처리 장치에 대한 개략도이다.

첨부된 도면 및 실시예를 참조하여 본 발명의 기술적 솔루션에 대해 이하에 설명한다.

본 발명의 실시예에 따르면, 주파수 대역 확장에 시간 도메인 대역폭 확장이 사용되는지 또는 주파수 도메인 대역폭 확장이 사용되는지는 주파수 오디오 신호의 코딩 방식 또는 오디오 신호의 특성에 따라 확정될 수 있다.

이 방법에서, 저주파 코딩이 시간 도메인 코딩이면, 시간 도메인 대역폭 확장 또는 주파수 도메인 대역폭 확장이 고주파 코딩에 사용될 수 있고; 저주파 코딩이 주파수 도메인 코딩이면, 시간 도메인 대역폭 확장 또는 주파수 도메인 대역폭 확장이 고주파 코딩에 사용될 수 있다.

도 3은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 대한 흐름도이다. 도 3에 도시된 바와 같이, 본 발명의 본 실시예에 따른 오디오 신호 코딩 방법은 구체적으로 이하의 단계를 포함한다:

단계 101: 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류한다.

저주파 오디오 신호는 직접 코딩되는 반면, 고주파 오디오 신호는 대역폭 확장을 통해 코딩되어야 한다.

단계 102: 저주파 오디오 신호의 특성에 따라 대응하는 저주파 코딩 방식을 사용하여 저주파 오디오 신호를 코딩한다.

저주파 오디오 신호는 2가지 방식, 즉 시간 도메인 코딩 또는 주파수 도메인 코딩으로 코딩될 수 있다. 예를 들어, 음성 오디오 신호와 관련해서, 저주파 음성 신호는 시간 도메인 코딩을 사용하여 코딩되고; 음악 오디오 신호와 관련해서, 저주파 음성 신호는 주파수 도메인 코딩을 사용하여 코딩된다. 일반적으로, 시간 도메인 코딩, 예를 들어, 코드 여기 선형 예측(Code Excited Linear Predition: CELP)을 사용하여 음성 신호를 코딩하면 더 나은 효과를 거둘 수 있으며, 주파수 도메인 코딩, 예를 들어, 변형 이산 코사인 변환(Modified Discrete Cosine Transform: MDCT) 또는 고속 푸리에 변환(Fast fourier Transform: FFT)을 사용하여 음악 신호를 코딩하면 더 나은 효과를 거둘 수 있다.

단계 103: 저주파 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다.

이 단계는 고주파 오디오 신호를 코딩하는 경우에 몇 가지 가능성에 대해 설명한다: 첫째, 저주파 오디오 신호의 코딩 방식에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계; 둘째, 오디오 신호들의 특성에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계; 셋째, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 따라 고주파 오디오 신호의 코딩 방식을 확정하는 단계.

저주파 오디오 신호의 코딩 방식은 시간 도메인 코딩 또는 주파수 도메인 코딩이 될 수 있다. 그렇지만, 오디오 신호들의 특성은 음성 오디오 신호 또는 음악 오디오 신호가 될 수 있다. 고주파 오디오 신호의 코딩 방식은 시간 도메인 대역폭 확장 모드 또는 주파수 도메인 대역폭 확장 모드가 될 수 있다. 고주파 오디오 신호의 대역폭 확장과 관련해서, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 따라 코딩이 수행되어야 한다.

저주파 코딩 방식 및 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다. 선택된 대역폭 확장 모드는 저주파 코딩 방식 및 오디오 신호들의 특성에 대응하고, 동일한 도메인 코딩 방식에 속한다.

일실시예에서, 선택된 대역폭 확장 모드는 저주파 코딩 방식에 대응한다: 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다. 즉, 고주파 오디오 신호 및 저주파 오디오 신호의 코딩 방식은 동일한 도메인 코딩 방식(시간 도메인 코딩 또는 주파수 도메인 코딩)에 속한다.

다른 실시예에서, 선택된 대역폭 확장 모드는 오디오 신호들의 특성에 적절한 저주파 코딩 방식에 대응한다: 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 오디오 신호들이 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다. 즉, 고주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성에 적절한 저주파 코딩 방식은 동일한 도메인 코딩 방식(시간 도메인 코딩 또는 주파수 도메인 코딩)에 속한다.

또 다른 실시예에서, 저주파 코딩 방식 및 오디오 신호들의 특성을 종합적으로 고려함으로써, 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩한다: 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하고 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.

도 4를 참조하면, 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제1 개략도가 도시되어 있다. 시간 도메인(TD) 코딩 또는 주파수 도메인(FD) 코딩을 사용하여 저주파 오디오 신호, 예를 들어, 0-6.4kHz에서의 오디오 신호를 코딩할 수 있다. 고대역 오디오 신호, 예를 들어, 6.4-16/14 kHz의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE) 또는 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있다.

요컨대, 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서는, 저주파 오디오 신호의 코딩 방식 및 고주파 신호의 대역폭 확장이 일대일 대응이 되지 않는다. 예를 들어, 시간 도메인(TD) 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 고대역 오디오 신호의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE)이 될 수 있거나, 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있으며; 주파수 도메인(FD) 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 고대역 오디오 신호의 대역폭 확장은 시간 도메인 대역폭 확장(TD-BWE)이 될 수 있거나, 주파수 도메인 대역폭 확장(FD-BWE)이 될 수 있다.

구체적으로, 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 방식은 저주파 오디오 신호의 저주파 코딩 방식에 따라 처리를 수행하는 것이다. 상세하게 사항에 대해서는, 도 5에 도시된 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제2 개략도를 참조하면 된다. 시간 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 시간 도메인 대역폭 확장(TD-BWE)의 시간 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩하며; 주파수 도메인(FD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩한다.

그러므로 고주파 오디오 신호의 코딩 방식 및 저주파 오디오 신호의 코딩 방식이 동일한 도메인에 속하면, 오디오 신호들의 특성/저주파 오디오 신호를 참조하지 않아도 된다. 즉, 오디오 신호들의 특성/저주파 오디오 신호를 참조하는 대신, 저주파 오디오 신호의 코딩 방식을 참조하여 고주파 오디오 신호의 코딩을 처리한다.

고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식에 따라 확정되며, 이에 따라 대역폭 확장 동안 저주파 오디오 신호의 코딩 방식이 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.

대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 다른 방식은 오디오 신호들의 특성 또는 저주파 오디오 신호에 따라 처리를 수행하는 것이다. 예를 들어, 오디오 신호들/저주파 오디오 신호가 음성 오디오 신호이면, 시간 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩하고; 오디오 신호들/저주파 오디오 신호가 음악 오디오 신호이면, 주파수 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩한다.

도 4를 계속 참조하면, 저주파 오디오 신호의 코딩 방식에 관계없이, 오디오 신호의 특성/저주파 오디오 신호만을 참조하여 고주파 오디오 신호의 대역폭 확장을 위한 코딩이 수행된다. 그러므로 시간 도메인 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 시간 도메인 코딩 또는 주파수 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩할 수 있고; 주파수 도메인 코딩을 사용하여 저주파 오디오 신호를 코딩하면, 주파수 도메인 코딩 또는 시간 도메인 코딩을 사용하여 고주파 오디오 신호를 코딩할 수 있다.

고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정되며, 이에 따라 대역폭 확장 동안 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.

대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하는 또 다른 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 처리를 수행하는 것이다. 예를 들어, 시간 도메인 코딩 방식 및 오디오 신호들/저주파 오디오 신호를 사용하여 저주파 오디오 신호 코딩해야 하는 하면, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩해야 하거나 또는 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호 코딩해야 하는 하면, 그리고 오디오 신호/저주파 오디오 신호가 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.

도 6은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 대역폭 확장에 대한 제3 개략도이다. 도 6에 도시된 바와 같이, 시간 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩, 또는 시간 도메인 대역폭 확장(TD-BWE)의 시간 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호를 코딩할 수 있고; 주파수 도메인(TD) 코딩을 사용하여 저주파(0-6.4 kHz) 오디오 신호를 코딩하면, 주파수 도메인 대역폭 확장(FD-BWE)의 주파수 도메인 코딩을 사용하여 고주파(6.4-16/14 kHz) 오디오 신호 역시 코딩할 수 있다.

고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정되며, 이에 따라 대역폭 확장 동안, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.

본 발명의 실시예에 따른 오디오 신호 코딩 방법에서, 저주파 오디오 신호의 코딩 방식은 시간 도메인 코딩 또는 주파수 도메인 코딩이 될 수 있다. 또한, 대역폭 확장, 즉 시간 도메인 대역폭 확장 및 주파수 도메인 대역폭 확장에 대해 2 방식을 사용할 수 있고, 이것은 상이한 저주파 코딩 방식에 대응할 수 있다.

시간 도메인 대역폭 확장에서의 지연 및 주파수 도메인 대역폭 확장에서의 지연이 다를 수 있으며, 이에 따라 통일된 지연을 도달하기 위한 얼라인먼트가 필요하다.

모든 저주파 오디오 신호의 코딩 지연이 동일하다고 가정하면, 시간 도메인 대역폭 확장에서의 지연 및 주파수 도메인 대역폭 확장에서의 지연이 동일하다. 일반적으로, 시간 도메인 대역폭 확장에서의 지연은 고정되어 있는 반면, 주파수 도메인 대역폭 확장에서의 지연은 조정 가능하다. 그러므로 주파수 도메인 대역폭 확장에서의 지연을 조정하여 통일된 지연을 실현할 수 있다.

본 발명의 본 실시예에 따르면, 제로 지연이 저주파 오디오 신호의 디코딩과 관련되어 있는 대역폭 확장을 실현할 수 있다. 여기서, 비대칭 윈도(asymmetric window)는 고유하게 지연을 가지고 있으므로 제로 지연은 저주파 대역에 관련된다. 또한, 본 발명의 본 실시예에 따르면, 고주파 신호에 대해 상이한 윈도윙이 수행될 수 있다. 여기서는, 비대칭 윈도를 사용하는데, 예를 들어, 도 7에 도시되어 있는 ITU-T G.718에서의 분석 윈도(analyzing window)를 사용한다. 또한, 저주파 오디오 신호의 디코딩에 관련된 제로 지연과 저주파 오디오 신호의 디코딩에 관련된 고주파 윈도의 지연 간의 어떠한 차이도 도 8에 도시된 바와 같이 실현될 수 있다.

도 8은 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 상이한 고주파 오디오 신호의 윈도윙에 대한 개략도이다. 도 8에 도시된 바와 같이, 상이한 프레임들(frames), 예를 들어, (m-1) 프레임, (m) 프레임, 및 (m + 1) 프레임과 관련해서, 고주파 신호의 높은 지연 윈도윙(High delay windowing), 고주파 신호의 낮은 지연 윈도윙(Low delay windowing), 및 고주파 신호의 제로 지연 윈도윙(Zero delay windowing)이 실현될 수 있다. 고주파 신호의 각각의 지연 윈도윙은 윈도윙의 지연을 고려하지 않되, 고주파 신호의 상이한 윈도윙 방식만을 고려한다.

도 9는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 높은 지연 윈도윙에 기초한 BWE에 대한 개략도이다. 도 9에 도시된 바와 같이, 입력 프레임의 저주파 오디오 신호가 완전하게 디코딩되지 않으면, 디코딩된 저주파 오디오 신호를 고주파 여기 신호로서 사용한다. 입력 프레임의 고주파 오디오 신호에 대한 윈도윙은 입력 프레임의 저주파 오디오 신호의 디코딩 지연에 따라 확정된다.

예를 들어, 코딩되고 디코딩된 저주파 오디오 신호는 D1 ms의 지연을 가진다. 코딩 단의 인코더가 고주파 오디오 신호에 대해 시간-주파수 변환을 수행하면, D1 ms의 지연을 가지는 고주파 오디오 신호에 대해 시간-주파수 변환이 수행되고, 고주파 오디오 신호의 윈도윙 변환은 D2 ms의 지연을 생성할 수 있다. 그러므로 디코딩 단의 디코더에 의해 디코딩된 고주파 신호의 전체 지연은 D1 + D2 ms이다. 이 방법에서, 디코딩된 저주파 오디오 신호와 비교해 보면, 고주파 오디오 신호는 D2 ms의 추가 지연을 가진다. 즉, 디코딩된 저주파 오디오 신호는 그 디코딩된 고주파 오디오 신호의 지연과 정렬하기 위해서는 D2 ms의 추가 지연을 필요로 하고, 이에 따라 출력 신호의 전체 지연은 D1 + D2 ms이다. 그렇지만, 디코딩 단에서, 고주파 여기 신호는 저주파 오디오 신호의 예측으로부터 획득되어야 하므로, 디코딩 단에서의 저주파 오디오 신호 및 코딩 단에서의 고주파 오디오 신호 모두에 대해 시간-주파수 변환이 수행된다. D1 ms의 지연 후, 코딩 단에서의 고주파 오디오 신호 및 디코딩 단에서의 저주파 오디오 신호 모두에 대해 시간-주파수 변환이 수행되므로, 여기 신호가 정렬된다.

도 10은 본 발명에 따른 오디오 신호 코딩 방법에서의 고주파 신호의 제로 지연 윈도윙에 기초한 BWE에 대한 개략도이다. 도 10에 도시된 바와 같이, 디코딩 단은 현재 수신된 프레임의 고주파 오디오 신호에 대해 윈도윙을 직접 수행하고, 시간-주파수 변환 처리 동안, 디코딩 단은 현재 프레임의 디코딩된 저주파 오디오 신호를 여기 신호로서 사용한다. 여기 신호들이 시차가 있더라도, 여기 신호가 측정된 후에는 그 시차의 영향을 무시할 수 있다.

예를 들어, 디코딩된 저주파 신호가 D1 ms의 지연을 가지고 있는 한편, 코딩 단이 고주파 신호에 대해 시간-주파수 변환을 수행하면, 지연 처리가 수행되지 않으며, 고주파 신호에 대한 윈도윙은 D2 ms의 지연을 생성할 수 있고, 이에 따라 디코딩 단에서 디코딩된 고주파 신호의 전체 지연은 D2 ms이다.

D1이 D2와 동등하면, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬되기 위한 추가의 지연을 필요로 하지 않는다. 그렇지만, 디코딩 단은, D1 ms만큼 지연되는 저주파 오디오 신호에 대해 시간-주파수 변환이 수행된 후에 획득되는 주파수 신호로부터 고주파 여기 신호가 획득된다는 것을 예측하며, 이에 따라 고주파 여기 신호는 저주파 여기 신호와 정렬하지 않으며, D1의 시차가 존재한다. 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 또는 D2의 전체 지연을 가진다.

D1이 D2와 동등하지 않으면, 예를 들어, D1이 D2보다 작으면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D2 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D1 ms이고, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D2 - D1) ms의 추가의 지연이 필요하다. 예를 들어, D1이 D2보다 크면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D1 ms이고, 디코딩된 고주파 오디오 신호는 디코딩된 저주파 오디오 신호와 정렬하기 위한 (D1 - D2) ms의 추가의 지연이 필요하다.

고주파 신호의 제로-지연 윈도윙과 높은 지연 윈도윙 간의 BWE란, 코딩 단이 D3 ms 후에 현재 수신된 프레임의 고주파 오디오 신호에 대해 윈도윙을 수행한다는 것을 의미한다. 지연의 범위는 0 내지 D1 ms이다. 시간-주파수 변환 처리 동안, 디코딩 단은 현재 프레임의 디코딩된 저주파 오디오 신호를 여기 신호로서 사용한다. 여기 신호들이 시차가 있더라도, 여기 신호가 측정된 후에는 그 시차의 영향을 무시할 수 있다.

D1이 D2와 동등하면, 디코딩된 저주파 오디오 신호는 고주파 오디오 신호와 정렬되기 위한 D3 ms의 추가의 지연을 필요로 한다. 그렇지만, 디코딩 단은, D1 ms만큼 지연된 저주파 오디오 신호에 대해 시간-주파수 변환이 수행된 후에 획득되는 주파수 신호로부터 고주파 여기 신호가 획득된다는 것을 예측하며, 이에 따라 고주파 여기 신호는 저주파 여기 신호와 정렬하지 않으며, D1 - D3의 시차가 존재한다. 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D2 + D3 또는 D1 + D3의 전체 지연을 가진다.

D1이 D2와 동등하지 않으면, 예를 들어, D1이 D2보다 작으면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, (D2 + D3) ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 (D1 - D3) ms이고, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D3 - D1) ms의 추가의 지연이 필요하다.

예를 들어, D1이 D2보다 크면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, max(D1, D2 + D3) ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 (D1 - D3) ms이고, 여기서 max(a, b)는 a와 b 간의 더 큰 값을 취해진다는 것을 나타낸다. max(D1, D2 + D3) = D2 + D3이면, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 (D2 + D3 - D1) ms의 추가의 지연이 필요하고; max(D1, D2 + D3) = D1이면, 디코딩된 고주파 오디오 신호는 디코딩된 저주파 오디오 신호와 정렬하기 위한 (D1 - D2 - D3) ms의 추가의 지연이 필요하다. 예를 들어, D3 = (D1 - D2)이면, 디코딩된 신호는, 코딩 단에서의 신호와 비교해서, D1 ms의 전체 지연을 가지며, 고주파 여기 신호와 저주파 여기 신호 간의 시차는 D2 ms이다. 이 경우, 디코딩된 저주파 오디오 신호는 디코딩된 고주파 오디오 신호와 정렬하기 위한 추가의 지연이 필요하지 않다.

그러므로 본 발명의 실시예에서, 시간 도메인 대역폭 확장 동안, 주파수 도메인 대역폭 확장의 상태는 다음 프레임이 주파수 도메인 대역폭 확장을 사용할 수도 있기 때문에 갱신되어야 한다. 마찬가지로, 주파수 도메인 대역폭 확장 동안, 시간 도메인 대역폭 확장의 상태는 다음 프레임이 시간 도메인 대역폭 확장을 사용할 수도 있기 때문에 갱신되어야 한다. 이 방법에서, 대역폭 전환의 연속성이 실현된다.

전술한 실시예는 본 발명의 실시예에 따른 오디오 신호 코딩 방법에 관한 것이며, 오디오 신호 처리 장치를 사용하여 실현될 수 있다. 도 11은 본 발명의 실시예에 따른 오디오 신호 처리 장치에 대한 개략도이다. 도 11에 도시된 바와 같이, 본 발명의 실시예에서 제공하는 신호 처리 장치는 구체적으로 분류 유닛(11), 저주파 신호 코딩 유닛(12), 및 고주파 신호 코딩 유닛(13)을 포함한다.

분류 유닛(11)은 오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있다. 저주파 신호 코딩 유닛(12)은 저주파 오디오 신호의 특성에 따라 대응하는 저주파 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하도록 구성되어 있고, 여기서 코딩 방식은 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식이 될 수 있다. 예를 들어, 음성 오디오 신호와 관련해서는, 시간 도메인 코딩을 사용하여 저주파 음성 신호를 코딩하고, 음악 오디오 신호와 관련해서는, 주파수 도메인 코딩을 사용하여 저주파 음성 신호를 코딩한다. 일반적으로, 시간 도메인 코딩을 사용하여 음성 신호를 코딩하면 더 나은 효과를 거둘 수 있고, 주파수 도메인 코딩을 사용하여 음악 신호를 코딩하면 더 나은 효과를 거둘 수 있다.

고주파 신호 코딩 유닛(13)은 주파수 코딩 방식 및/또는 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 고주파 오디오 신호를 코딩하도록 구성되어 있다.

구체적으로, 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩을 사용하면, 고주파 신호 코딩 유닛(13)은 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩 또는 주파수 도메인 코딩을 수행하며; 저주파 신호 코딩 유닛(12)이 주파수 도메인 코딩을 사용하면, 고주파 신호 코딩 유닛(13)은 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩 또는 주파수 도메인 코딩을 수행한다.

또한, 오디오 신호들/저주파 오디오 신호가 음성 오디오 신호이면, 고주파 신호 코딩 유닛(13)은, 시간 도메인 코딩을 사용하여 고주파 음성 신호를 코딩하고; 오디오 신호들/저주파 오디오 신호가 음악 오디오 신호이면, 고주파 신호 코딩 유닛(13)은, 주파수 도메인 코딩을 사용하여 고주파 음악 신호를 코딩한다. 이 경우, 저주파 오디오 신호의 코딩 방식은 고려되지 않는다.

또한, 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하고, 오디오 신호들/저주파 오디오 신호가 음성 신호이면, 고주파 신호 코딩 유닛(13)은, 시간 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 저주파 신호 코딩 유닛(12)이 주파수 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하거나 또는 저주파 신호 코딩 유닛(12)이 시간 도메인 코딩 방식을 사용하여 저주파 오디오 신호를 코딩하며, 오디오 신호들/저주파 오디오 신호가 음악 신호이면, 고주파 신호 코딩 유닛(13)은, 주파수 도메인 대역폭 확장 모드를 선택하여 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행한다.

도 12는 본 발명의 실시예에 따른 다른 오디오 신호 처리 장치에 대한 개략도이다. 도 12에 도시된 바와 같이, 본 발명의 실시예에 따른 신호 처리 장치는 구체적으로 저주파 신호 디코딩 유닛(14)을 더 포함한다.

저주파 신호 디코딩 유닛(14)은 저주파 오디오 신호를 디코딩하도록 구성되어 있으며, 저주파 오디오 신호의 코딩 및 디코딩 동안 제1 지연 D1이 생성된다.

구체적으로, 고주파 오디오 신호가 지연 윈도를 가지면, 고주파 신호 코딩 유닛(13)은, 고주파 오디오 신호가 제1 지연 D1만큼 지연된 후, 고주파 오디오 신호를 코딩하도록 구성되어 있으며, 여기서 고주파 오디오 신호의 코딩 동안 제2 지연 D2가 생성되며, 이에 따라, 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 D1과 제2 지연 D2의 합, 즉 (D1 + D2)이다.

고주파 오디오 신호가 지연 윈도를 가지지 않으면, 고주파 신호 코딩 유닛(13)은 고주파 오디오 신호를 코딩하도록 구성되어 있으며, 여기서 고주파 오디오 신호의 코딩 동안 제2 지연 D2가 생성된다. 제1 지연 D1이 제2 지연 D2보다 작거나 같으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은 제2 지연 D2와 제1 지연 D1 간의 차(D2 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제2 지연 D2이며; 제1 지연 D1이 제2 지연 D2보다 크면, 저주파 신호 코딩 유닛(12)은, 고주파 오디오 신호를 코딩한 후, 제1 지연 D1와 제2 지연 D2 간의 차(D1 - D2)만큼 그 코딩된 고주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제1 지연 D1이다.

고주파 오디오 신호가 지연 윈도를 가지고 있고 이 지연 윈도의 지연이 제로 지연과 높은 지연 사이이면, 고주파 신호 코딩 유닛(13)은, 고주파 오디오 신호가 제3 지연 D3만큼 지연된 후, 그 지연된 고주파 오디오 신호를 코딩하도록 구성되어 있고, 여기서 고주파 신호의 코딩 동안 제2 지연 D2이 생성된다. 제1 지연이 제2 지연보다 작거나 같으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은, 제2 지연 D2와 제3 지연 D3의 합과, 제1 지연 D1 간의 차(D2 + D3 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키고, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제2 지연 D2와 제3 지연 D3의 합, 즉 (D2 + D3)이다. 제1 지연이 제2 지연보다 크면, 2가지 가능성이 존재한다: 제1 지연 D1이 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)보다 크거나 같으면, 고주파 오디오 신호를 코딩한 후, 고주파 신호 코딩 유닛(13)은, 제1 지연 D1과, 제2 지연 D2와 제3 지연 D3의 합 간의 차(D1 - D2 - D3)만큼 그 코딩된 고주파 오디오 신호를 지연시키고; 제1 지연 D1이 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)보다 작으면, 저주파 오디오 신호를 코딩한 후, 저주파 신호 코딩 유닛(12)은, 제2 지연 D2와 제3 지연 D3의 합과, 제1 지연 D1 간의 차(D2 + D3 - D1)만큼 그 코딩된 저주파 오디오 신호를 지연시키며, 이에 따라 오디오 신호들의 코딩 지연 및 디코딩 지연은 제1 지연 D1 또는 제2 지연 D2와 제3 지연 D3의 합(D2 + D3)이다.

본 발명의 실시예에서 제공하는 오디오 신호 코딩 장치에 따르면, 고주파 오디오 신호에 대한 대역폭 확장을 위한 코딩 방식은 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호에 따라 확정될 수 있으며, 이에 따라 대역폭 확장 동안, 저주파 오디오 신호의 코딩 방식 및 오디오 신호들의 특성/저주파 오디오 신호가 고려되지 않는 경우가 회피될 수 있으며, 상이한 오디오 신호들의 코딩 품질에 대한 대역폭 확장에 의해 야기되는 한계가 낮아지며, 적응 코딩이 실현되고, 오디오 코딩 품질이 최적으로 된다.

당업자라면 본 발명의 실시예에서 설명된 예시적 유닛 및 알고리즘 단계는 전자기기 하드웨어, 컴퓨터 소프트웨어, 또는 하드웨어와 소프트웨어의 조합의 형태로 실현될 수 있다. 하드웨어와 소프트웨어의 상호호환성을 명확하게 설명하기 위해, 각각의 실시예의 구성 및 단계가 일반적으로 기능에 의해 설명된다. 하드웨어 또는 소프트웨어로 기능이 실현되는지는 기술적 솔루션의 특정한 어플리케이션 및 설계상의 제한 조건에 따라 좌우된다. 당업자라면 특정한 어플리케이션에 대한 설명된 기능을 실현할 다른 방법을 사용할 수 있다. 그렇지만, 본 발명의 범위를 넘어서는 실현에 대해서는 고려하지 않는다.

본 발명의 실시예에 따른 방법 또는 알고리즘의 단계는 프로세서에 의해 동작할 수 있는 하드웨어 또는 소프트웨어 모듈에 의해 실행될 수 있거나 이것들의 조합에 의해 실행될 수 있다. 소프트웨어 모듈은 랜덤 액세스 메모리(RAM), 메모리, 리드-온리 메모리(ROM), 전기적 프로그래머블 ROM, 전기적 삭제 가능형 프로그래머블 ROM, 레지스터, 하드디스크, 휴대형 하드디스크, 콤팩트 디스크-리드 온리 메모리(CD-ROM), 또는 종래기술에 잘 알려진 임의의 다른 저장 매체에 저장될 수 있다.

본 발명의 목적, 기술적 솔루션, 및 이로운 효과에 대해 전술한 실시예에서 상세히 설명하였다. 전술한 설명은 단지 본 발명의 예시적 실시예에 지나지 않으며, 본 발명의 보호 범위를 제한하려는 것이 아님은 당연하다. 본 발명의 개념 및 원리를 벗어남이 벗이 이루어지는 모든 변형, 등가의 대체, 및 개선은 본 발명의 보호 범위에 해당된다.

Claims

오디오 신호 코딩 방법에 있어서,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하는 단계;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하는 단계; 및
주파수 코딩 방식 또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계
를 포함하는 오디오 신호 코딩 방법.
제1항에 있어서,
상기 주파수 코딩 방식에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법.
제1항에 있어서,
상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 오디오 신호들이 음악 신호이면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법.
제1항에 있어서,
상기 주파수 코딩 방식 및 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하고 상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는 단계인, 오디오 신호 코딩 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 고주파 오디오 신호 또는 상기 저주파 오디오 신호에 대한 지연 처리를 수행하는 단계
를 더 포함하며,
이에 따라, 상기 고주파 오디오 신호의 지연 및 상기 저주파 오디오 신호의 지연은 디코딩 단(decoding end)에서 동일하게 되는, 오디오 신호 코딩 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로,
상기 고주파 오디오 신호에 대한 제1 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하는 단계이며,
이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연과 제2 지연의 합이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이고, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 오디오 신호는 코딩된 후 상기 제2 지연과 상기 제1 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연이며,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 오디오 신호는 코딩된 후 상기 제1 지연과 상기 제2 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 방법.
제1항 내지 제4항 중 어느 한 항에 있어서,
상기 고주파 오디오 신호를 코딩하는 단계는 구체적으로, 상기 고주파 오디오 신호에 대한 제3 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하는 단계이며,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 오디오 신호는 코딩된 후 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연되고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연과 상기 제3 지연의 합이며,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 오디오 신호는 코딩된 후 상기 제1 지연과, 상기 제2 지연과 상기 제3 지연의 합 간의 차이만큼 지연되거나, 또는 상기 저주파 오디오 신호는 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연되며, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 또는 상기 제2 지연과 상기 제3 지연의 합인, 오디오 신호 코딩 방법.
오디오 신호 코딩 장치에 있어서,
오디오 신호들을 고주파 오디오 신호 및 저주파 오디오 신호로 분류하도록 구성되어 있는 분류 유닛;
상기 저주파 오디오 신호의 특성에 따라 시간 도메인 코딩 방식 또는 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩하도록 구성되어 있는 저주파 신호 코딩 유닛; 및
주파수 코딩 방식 및/또는 상기 오디오 신호들의 특성에 따라 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호를 코딩하도록 구성되어 있는 고주파 신호 코딩 유닛
을 포함하는 오디오 신호 코딩 장치.
제9항에 있어서,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 상기 주파수 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하도록 구성되어 있는, 오디오 신호 코딩 장치.
제9항에 있어서,
상기 오디오 신호들이 음성 신호이면, 상기 고주파 신호 코딩 유닛은 구체적으로, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하도록 구성되어 있으며,
상기 오디오 신호들이 음악 신호이면, 상기 고주파 신호 코딩 유닛은 구체적으로, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하는, 오디오 신호 코딩 장치.
제9항에 있어서,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 시간 도메인 코딩 방식을 사용하여 상기 저주파 오디오 신호를 코딩해야 하고 상기 오디오 신호들이 음성 신호이면, 시간 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 시간 도메인 코딩을 수행하며; 그렇지 않으면, 주파수 도메인 대역폭 확장 모드를 선택하여 상기 고주파 오디오 신호에 대한 주파수 도메인 코딩을 수행하도록 구성되어 있는, 오디오 신호 코딩 장치.
제9항 내지 제12항 중 어느 한 항에 있어서,
상기 저주파 오디오 신호를 디코딩하도록 구성되어 있는 저주파 신호 디코딩 유닛
을 더 포함하며,
상기 저주파 오디오 신호의 코딩 및 디코딩 동안 제1 지연이 생성되며,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 고주파 오디오 신호가 상기 제1 지연만큼 지연된 후, 상기 지연된 고주파 오디오 신호를 코딩하도록 구성되어 있으며,
이에 따라, 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연과 제2 지연의 합이며,
상기 제2 지연은 상기 고주파 오디오 신호의 코딩 동안 생성되는, 오디오 신호 코딩 장치.
제9항 내지 제12항 중 어느 한 항에 있어서,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연이고,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 신호 코딩 유닛은, 상기 고주파 오디오 신호가 코딩된 후, 상기 코딩된 고주파 오디오 신호를 상기 제1 지연과 상기 제2 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 동안 생성되는 지연인, 오디오 신호 코딩 장치.
제9항 내지 제12항 중 어느 한 항에 있어서,
상기 고주파 신호 코딩 유닛은 구체적으로, 상기 고주파 오디오 신호에 대한 제3 지연을 수행한 후 상기 고주파 오디오 신호를 코딩하도록 구성되어 있으며,
제1 지연이 제2 지연보다 작거나 같으면, 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있고, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제2 지연과 상기 제3 지연의 합이며,
상기 제1 지연이 상기 제2 지연보다 크면, 상기 고주파 신호 코딩 유닛은, 상기 고주파 오디오 신호가 코딩된 후, 상기 코딩된 고주파 오디오 신호를 상기 제1 지연과, 상기 제2 지연과 상기 제3 지연의 합 간의 차이만큼 지연시키도록 구성되어 있거나, 또는 상기 저주파 신호 코딩 유닛은, 상기 저주파 오디오 신호가 코딩된 후, 상기 코딩된 저주파 오디오 신호를 상기 제2 지연과 상기 제3 지연의 합과, 상기 제1 지연 간의 차이만큼 지연시키도록 구성되어 있으며, 이에 따라 상기 오디오 신호들의 코딩 지연 및 디코딩 지연은 상기 제1 지연 또는 상기 제2 지연과 상기 제3 지연의 합이며,
상기 제1 지연은 상기 저주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연이며, 상기 제2 지연은 상기 고주파 오디오 신호의 코딩 및 디코딩 동안 생성되는 지연인, 오디오 신호 코딩 장치.