KR20100086000A - 오디오 신호 처리 방법 및 장치 - Google Patents

오디오 신호 처리 방법 및 장치 Download PDF

Info

Publication number
KR20100086000A
KR20100086000A KR1020107011463A KR20107011463A KR20100086000A KR 20100086000 A KR20100086000 A KR 20100086000A KR 1020107011463 A KR1020107011463 A KR 1020107011463A KR 20107011463 A KR20107011463 A KR 20107011463A KR 20100086000 A KR20100086000 A KR 20100086000A
Authority
KR
South Korea
Prior art keywords
band
spectral data
copy
information
target
Prior art date
Application number
KR1020107011463A
Other languages
English (en)
Inventor
이현국
김동수
윤성용
방희석
임재현
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20100086000A publication Critical patent/KR20100086000A/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

제 1 대역 및 제 2 대역으로 이루어진 주파수 대역에서 상기 제 1 대역에 대응하는 스펙트럴 데이터를 수신하는 단계; 상기 제 1 대역의 부분 대역에 대응하는 카피 밴드의 주파수 정보에 근거하여, 상기 카피 밴드를 결정하는 단계; 및, 상기 카피 밴드의 스펙트럴 데이터를 이용하여, 상기 제 2 영역에 대응하는 타깃 밴드의 스펙트럴 데이터를 생성하는 단계를 포함하고, 상기 카피 밴드는 상기 제 1 대역의 상부에 존재하는 오디오 신호 처리 방법이 개시된다.

Description

오디오 신호 처리 방법 및 장치{A METHOD AND AN APPARATUS FOR PROCESSING AN AUDIO SIGNAL}
본 발명은 신호의 스펙트럴 데이터를 이용하여 오디오 신호를 코딩 및 디코딩할 수 있는 신호 처리 방법 및 장치에 관한 것이다.
신호의 특성을 이용하여 오디오 신호를 처리함에 있어서, 서로 다른 대역의 신호들간의 특성을 기반으로 오디오 신호를 처리하는 것이다.
Technical Problem
종래에는 서로 다른 대역의 신호들간의 특성을 기반으로 오디오 신호를 효과적으로 처리하기에는 부족한 문제점이 있다.
Technical Solution
본 발명은 상기와 같은 문제점을 해결하기 위해 창안된 것으로서, 서로 다른 대역의 신호들간의 특성을 기반으로 오디오 신호를 처리할 수 있는 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은, 특정 대역의 스펙트럴 데이터 중에서 적절한 스펙트럴 데이터를 선택함으로써, 다른 대역의 스펙트럴 데이터를 획득할 수 있는 신호 처리 방법 및 장치를 제공하는 데 있다.
본 발명의 또 다른 목적은, 음성 신호, 오디오 신호 등과 같이 서로 다른 특성을 가지는 신호들을 그 특성에 따라 적절한 방식으로 처리하면서도 비트율을 최소화시킬 수 있는 신호 처리 방법 및 장치를 제공하는 데 그 목적이 있다.
Advantageous Effects
본 발명은 다음과 같은 효과와 이점을 제공한다.
첫째, 음성 신호의 특성을 갖는 신호는 음성 신호로 디코딩하고, 오디오 신호의 특성을 갖는 신호는 오디오 신호로 디코딩하기 때문에, 각 신호 특성에 부합하는 디코딩 방식이 적응적으로 선택되는 효과가 있다.
둘째, 전송된 스펙트럴 데이터 중 가장 적절한 스펙트럴 데이터를 선택함으로써, 다른 대역의 스펙트럴 데이터를 획득하기 때문에, 오디오 신호의 복원율를 높일 수 있다.
셋째, 전송된 인코더에서 전송된 시작 밴드 정보를 이용하여 스펙트럴 데이터를 선택하기 때문에, 스펙트럴 데이터의 선택하는 데 있어서 정확도를 높일 수 있고, 연산에 필요한 복잡도를 줄일 수 있다.
넷째, 일부 대역에 해당하는 스펙트럴 데이터의 전송을 생략할 수 있기 때문에, 스펙트럴 데이터의 전송에 소요되는 비트를 현저히 절감할 수 있다.
도 1 은 본 발명의 실시 예에 따른 오디오 신호 인코딩 장치의 구성도.
도 2 는 도 1 의 부분 대역 인코딩부의 세부 구성도.
도 3 은 본 발명에 따른 카피 밴드, 타깃 밴드, 및 시작 밴드의 관계를 나타낸 도면.
도 4 는 본 발명의 부분 대역 확장의 다양한 실시예를 나타낸 도면.
도 5 은 본 발명의 실시 예에 따른 오디오 신호 디코딩 장치의 구성도.
도 6 는 도 5 에서 부분 대역 디코딩부의 세부 구성도.
도 7 는 타깃 밴드의 스펙트럴 데이터의 개수가 카피 밴드의 스펙트럴 데이터의 개수보다 큰 경우를 설명하기 위한 도면.
도 8 은 타깃 밴드의 스펙트럴 데이터의 개수가 카피 밴드의 스펙트럴 데이터의 개수보다 작은 경우를 설명하기 위한 도면.
본 발명에서 다음 용어는 다음과 같은 기준으로 해석될 수 있고, 기재되지 않은 용어라도 하기 취지에 따라 해석될 수 있다. 코딩은 경우에 따라 인코딩 또는 디코딩으로 해석될 수 있고, 정보(information)는 값(values), 파라미터(parameter), 계수(coefficients), 성분(elements) 등을 모두 아우르는 용어로서, 경우에 따라 의미는 달리 해석될 수 있는 바, 그러나 본 발명은 이에 한정되지 아니한다.
본 발명에 따른 신호 처리 장치는 카피밴드 결정부, 대역확장정보 수신부, 타깃밴드 생성부로 구성되며, 상기 타깃밴드 생성부는 타임신축부 및 데시메시션부를 포함하고, 필터링부를 더 포함할수 있다.
상기 카피밴드 결정부는 저주파 대역 및 고주파 대역으로 이루어진 주파수 대역에서 상기 저주파 대역에 대응하는 스펙트럴 데이터를 수신하고, 상기 저주파 대역의 부분 대역에 대응하는 카피 밴드의 주파수 정보에 근거하여, 상기 카피밴드를 결정한다.
대역확장 정보 획득보는 상기 카피밴드로 타깃밴드를 생성하기 위한 부가 정보를 획득하며, 상기 부가 정보는 비트스트링에서 획득할 수 있다. 상기 부가정보는 게인 정보, 하모닉 정보 등을 포함할 수 있다.
상기 타깃정보 생성부는 상기 카피 밴드의 스펙트럴 데이터를 이용하여, 상기 고주파 영역에 대응하는 타깃 밴드의 스펙트럴 데이터를 생성한다. 여기서, 상기 카피 밴드는 상기 저주파 대역의 상부에 존재할 수 있다. 저주파 대역에 존재하는 카피 밴드를 이용하여 고주파 대역을 생성할 수도 있고, 반대로 고주파 대역에 존재하는 카피 밴드를 이용하여 저주파 대역을 생성할 수도 있다.
상기 타깃밴드 생성부는 타임신축부 및 데시메시션부를 포함하고, 필터링부를 더 포함할수 있다. 즉, 상기 카피밴드는 비트스트립에서 획득할 수도 있고, 수신된 스펙트럴 데이터를 필터링하여 획득할 수도 있다.
여기서, 상기 카피 밴드의 주파수 정보는 시작 주파수, 시작 밴드 및 이를 나타내는 인덱스 정보 중 하나이고, 상기 타깃 밴드의 스펙트럴 데이터는 상기 카피 밴드의 스펙트럴 데이터, 및 상기 타깃 밴드의 스펙트럴 데이터간의 게인에 해당하는 게인 정보, 및 상기 카피 밴드의 하모닉 정보 중 하나 이상을 이용하여 생성될 수 있다. 상기 저주파 대역의 스펙트럴 데이터는, 오디오 신호 및 음성 신호 중 하나에 의해 디코딩될 수 있다.
본 발명은 기존의 AAC, AC3, AMR 등코어 코딩 또는 향후 코어 코딩에 적용될 수 있다. 이하, 다운믹스 신호에 적용되는 경우를 기준으로 설명하나, 이에 한정되지 아니한다.
도 1 은 본 발명의 실시예에 따른 오디오 신호 인코딩 장치의 구성을 보여주는 도면이고, 도 2 는 도 1 의 부분 대역 인코딩부의 세부 구성을 보여주는 도면이다. 도 1 을 참조하면, 멀티채널 인코딩부(110), 부분 대역 인코딩부(120), 오디오 신호 인코딩부(130), 음성 신호 인코딩부(140), 및 멀티플렉서(150)를 포함한다.
멀티채널 인코딩부(110)는, 복수의 채널 신호(이하, 멀티채널 신호)를 입력받아서, 다운믹스를 수행하여 다운믹스 신호을 생성하고, 다운믹스 신호를 멀티채널 신호로 업믹스하기 위해 필요한 공간 정보를 생성한다. 여기서 공간 정보는, 채널 레벨 차이 정보, 채널간 상관정보, 채널 예측 계수 및 다운믹스 게인 정보 등을 포함할 수 있다.
한편 여기서의 다운믹스 신호는 시간 도메인(예를 들면, 레지듀얼 데이터)의 신호일 수도 있고, 주파수 변환이 수행된 주파수 도메인(예를 들면, 스케일 팩터 계수, 스펙트럴 데이터)의 정보일 수 있다.
부분대역 인코딩부(120)는 광대역 신호에서 협대역 신호 및 대역 확장정보를 생성한다. 복수개의 대역으로 이루어진 원래 신호를 광대역 신호라 하고, 복수개의 대역 중 적어도 하나의 대역을 협대역 신호라 한다. 예를 들면, 2 개의 대역인 저주파 대역 및 고주파 대역으로 이루어진 광대역 신호에 있어서, 상기 저주파 대역 또는 고주파 대역을 협대역 신호라 한다. 부분 대역이란 상기 협대역 신호 전체가 아닌 일부 대역을 지칭하며, 이하 카피밴드라 칭한다.
대역 확장 정보란 상기 카피 밴드를 이용하여 타깃 밴드를 생성하기 위한 정보로서, 주파수 정보, 게인 정보, 하모닉 성분 정보 등을 포함할 수 있다. 디코더에서 상기 광대역 신호는 협대역 신호에 상기 타깃밴드를 결합함으로서 생성된다.
오디오 신호 인코딩부(130)는 다운믹스 신호(협대역 다운믹스 신호(DMXn))의 특정 프레임 또는 특정 세그먼트가 큰 오디오 특성을 갖는 경우, 오디오 코딩 스킴에 따라 다운믹스 신호를 인코딩한다. 여기서 오디오 신호는 AAC (Advanced Audio Coding) 표준 또는 HE-AAC (High Efficiency Advanced Audio Coding) 표준에 따른 것일 수 있으나, 본 발명은 이에 한정되지 아니한다. 한편, 오디오 신호 인코딩부는, MDCT(Modified Discrete Transform) 인코더에 해당할 수 있다.
음성 신호 인코딩부(140)는 다운믹스 신호(협대역 다운믹스 신호(DMXn))의 특정 프레임 또는 특정 세그먼트가 큰 음성 특성을 갖는 경우, 음성 코딩 스킴에 따라서 다운믹스 신호를 인코딩한다. 여기서 음성 신호는 G. 7XX 계열 또는 AMR-계열을 포함할수 있으며, 이에 한정되지 아니한다. 한편, 음성 신호 인코딩부(140)는 선형 예측 부호화(LPC: Linear Predicfion Coding) 방식을 더 이용할 수 있다. 하모닉 신호가 시간축 상에서 높은 중복성을 가지는 경우, 과거 신호로부터 현재 신호를 예측하는 선형 예측에 의해 모델링될 수 있는데, 이 경우 선형 예측 부호화 방식을 채택하면 부호화 효율을 높을 수 있다. 한편, 음성 신호 인코딩부(140)는 타임 도메인 인코더에 해당할 수 있다.
이와 같이 부분 대역 인코딩부(120)를 통한 협대역 다운믹스는 프레임별 또는 세그먼트별로 오디오 신호 인코딩부(130) 또는 음성 신호 인코딩부(140) 중 하나에 의해 인코딩된다.
멀티플렉서(150)는 멀티채널 인코딩부(110)에 의해 생성된 공간정보, 부분 대역 인코딩부(120)에 의해 생성된 대역 확장 정보, 인코딩된 협대역 다운믹스 신호를 멀티플렉싱하여 비트스트림을 생성한다.
이하, 도 2 와 함께 부분 대역 인코딩부(120)의 세부 구성에 대해서 설명하고자 한다.
도 2 를 참조하면, 부분 대역 인코딩부(120)는 스펙트럴 데이터 획득부(122), 카피 밴드 결정부(124), 게인 정보 획득부(126), 하모닉 성분 정보 획득부(128), 대역확장정보 전송부(129)를 포함한다.
스펙트럴 데이터 획득부(122)는 수신된 광대역 신호가 스펙트럴 데이터가 아닌 경우, 다운믹스를 스펙트럴 계수로 변환하고, 스펙트럴 계수를 스케일팩터로 스케일링한 후, 양자화를 수행함으로써 스펙트럴 데이터를 생성한다. 여기서의 스펙트럴 데이터는, 광대역 다운믹스에 대응하는 광대역의 스펙트럴 데이터이다.
카피 밴드 결정부(124)는 광대역의 스펙트럴 데이터를 근거로 하여 카피 밴드(copy band) 및 타깃 밴드(target band)를 결정하고, 대역 확장을 위한 주파수 정보를 생성하고, 상기 주파수 정보는 시작 주파수 또는 시작 밴드 정보(start band information) 등을 포함할 수 있다. 이하, 도 3 및 도 4 를 참조하면서 카피 밴드 등에 대해서 설명하고자 한다.
도 3 은 본 발명의 제 1 실시예에 따른 카피 밴드, 타깃 밴드, 및 시작 밴드의 관계를 나타낸 도면이고, 도 4 는 본 발명의 제 2 실시예 내지 제 4 실시예에 따른 카피 밴드, 타깃 밴드, 및 시작 밴드의 관계를 나타낸 도면이다.
우선, 도 3 을 참조하면, 0 부터 n-1 까지 총 n 개의 스케일 팩터 밴드(sfb)가 존재하고, 각 스케일 팩터 밴드(sfb0, ..., sfbn-1)에 대응하는 스펙트럴 데이터가 존재한다. 특정 밴드에 속하는 스펙트럴 데이터(sdi)는 다수의 스펙트럴 데이터의 집합(sdi_0부터 sdi_m-1)을 의미할 수 있는데, 스펙트럴 데이터의 개수(mi)는 스펙트럴 데이터 단위, 밴드 단위 또는 그 이상의 단위에 대응하여 생성할 수 있다. 한편, 0 번째 스케일팩터 밴드(sfb0)가 저주파 대역이고, n-1 번째 스케일팩터 밴드(sfbn-1)가 상부 즉, 고주파 대역에 해당하는 것을 예로 들고 있지만, 그 반대도 가능하다.
광대역 신호에 해당하는 스펙트럴 데이터는, 제 1 대역 및 제 2 대역을 포함하는 전체 대역(sfb0, ..., sfbn-1)에 해당하는 스펙트럴 데이터이고, 협대역 다운믹스(DMXn)에 해당하는 스펙트럴 데이터는, 제 1 대역에 해당하는 스펙트럴 데이터로서, 0 번째 밴드(sfb0)의 스펙트럴 데이터부터 i-1 번째 밴드(sfbi-1)의 스펙트럴 데이터까지이다. 즉, 협대역 스펙트럴 데이터만이 디코더로 전송되고, 나머지 밴드(sfbi부터 sfbn-1)의 스펙트럴 데이터를 전송되지 않는다.
이와 같이 스펙트럴 데이터가 전송되지 않는 밴드를 디코더에서 생성하게 되며, 이를 타깃 밴드(target band)(tb)라 한다. 한편, 카피 밴드(copy band)(cb)는 디코더에서 타깃 밴드(tb)의 스펙트럴 데이터를 생성하는 데 이용되는 스펙트럴 데이터의 스케일 팩터 밴드이다. 카피 밴드(copy band)는 협대역 다운믹스에 대응하는 밴드(sfb0 부터 sfbi-1) 중 일부 (sfbs 부터 sfbi-1)이다. 카피 밴드(cb)가 시작되는 밴드가 시작 밴드(start band)(sb)이고, 시작 밴드의 주파수가 시작 주파수(start frequency)이다. 다시 말해서, 카피 밴드(cb)는 시작 밴드(sb) 그 자체이거나, 시작 밴드 및 그 보다 높은 주파수 밴드를 포함하거나, 시작 밴드 및 그보다 낮은 주파수 밴드를 포함할 수 있다.
본 발명에 따르면, 인코더에서 광대역 스펙트럴 데이터를 이용하여 협대역 스펙트럴 데이터 및 대역 확장 정보를 생성하고, 디코더에서는 협대역 스펙트럴 데이터 중 카피 밴드의 스펙트럴 데이터를 이용하여 타깃 밴드의 스펙트럴 데이터를 생성한다.
도 4 는 부분대역 확장의 3 가지 실시예가 도시되어 있다. 카피 밴드는 협대역 전체가 아닌 부분 대역으로서 타깃 밴드를 생성할 수 있고, 여기서 상기 카피 밴드의 위치는 협대역의 상부 주파수 대역에 위치할 수 있다. 그리고 상기 카피 밴드의 개수는 적어도 하나이며, 복수개인 경우 등간격 또는 가변 간격으로 위치할 수 있다.
도 4 의 (A)를 참조하면, 카피밴드의 대역폭 및 타깃 밴드의 대역폭이 동일한 경우 부분 밴드 확장 방식을 도시한 것이다. 즉 카피 밴드(cb)가 시작 밴드(sb) 에 해당하는 s 번째 밴드(sfbs) n-4 번째 밴드(sfbn-4), n-2 번째 밴드(sfbn-2)이다. 인코더에서는 카피 밴드의 스펙트럴 데이터를 이용하여 카피 밴드의 오른쪽에 있는 타깃 밴드의 스펙트럴 데이터의 전송을 생략할 수 있다. 한편, 카피 밴드의 스펙트럴 데이터와 타깃 밴드의 스펙트럴 데이터간의 차이인 게인 정보(g)가 생성될 수 있는데 이에 대해서는 추후 설명하고자 한다.
도 4 의 (B)를 참조하면, 카피밴드 및 타깃 밴드의 대역폭이 상이한 경우로서, 타깃 밴드의 대역폭은 카피 밴드의 대역폭의 두 개 이상 (tb, tb')이며, 여기서, 상기 카피밴드의 대역폭에 해당하는 타깃 밴드의 대역폭의 스펙트럴 데이터에 서로 다른 게인(gs, gs+1)을 적용하여 생성할 수 있다.
도 4 의 (C)를 참조하면,, 카피 밴드의 스펙트럴 데이터를 이용하여 타깃 밴드의 스펙트럴 데이터를 생성한 이후, 제 2 차 시작 밴드(sfbk) 이전의 밴드(sfbk0∼sfbk-1)에 해당하는 스펙트럴 데이터를 이용하여, 제 2 타깃 밴드(sfbk, ..., sfbn-1)의 스펙트럴 데이터를 생성할 수 있다. 이때, 시작 밴드의 주파수는 샘플링 주파수(fs)의 1/8 에 해당하고, 제 2 차 시작 밴드는 샘플링 주파수(fs)의 1/8 에 해당할 수 있지만, 본 발명은 이에 한정되지 아니한다.
이상, 본 발명의 다양한 실시예에 따른 타깃 밴드, 카피 밴드, 및 시작 밴드의 관계를 살펴본 바, 다시 도 2 를 참조하면서, 나머지 구성요소에 대해서 이어서 설명하고자 한다.
카피 밴드 결정부(124)는 앞서 설명한 바와 같이, 카피 밴드, 타깃 밴드, 및 카피 밴드의 시작 밴드(sb)를 결정한다. 시작 밴드는 프레임별로 가변적으로 결정할 수 있다. 이 시작 밴드는 프레임별 신호의 특성에 따라 결정될 수 있는데, 신호가 트랜지언트(transient)한지 아니면 스테이셔너리(stationary)한지에 따라 결정될 수 있다. 예를 들어, 신호가 트랜지언트한 경우는 스테이셔너리한 경우보다 하모닉 성분이 더 적기 때문에, 시작 밴드가 낮은 주파수로 결정될 수 있다. 한편, 시작 밴드는, 스펙트럴 센트로이드(spectral centroid)를 이용한 소리의 밝기(brightness)의 수치로 결정될 수도 있다. 예를 들어, 소리가 비교적 밝은 경우(고음이 많은 경우) 시작 밴드를 고주파 대역으로 결정하고, 소리가 비교적 어두운 경우(저음이 많은 경우) 시작 밴드를 저주파 대역에서 결정할 수 있다. 프레임별로 가변적으로 시작 밴드를 결정하되, 음질과 비트레이트는 트레이드 오프(trade-off) 관계이므로 적절한 비트의 음질과 비트레이트를 설정하여 시작밴드를 결정하는 것이 바람직하다.
카피 밴드 결정부(124)는 타깃 밴드의 스펙트럴 데이터가 제외된 협대역의 스펙트럴 데이터 또는 협대역 다운믹스(DMXn)를 출력한다. 이 협대역 다운믹스는 도 1 과 함께 설명된 오디오 신호 인코딩부 또는 음성 신호 인코딩부로 입력된다.
또한 카피 밴드 결정부(124)는 시작 밴드 정보를 생성한다. 시작 밴드 정보는 카피 밴드(cb)가 시작하는 시작 주파수 정보, 카피 밴드(cb)의 시작밴드 정보를 지칭하며, 실제 값이 아니라 인덱스 정보로 표시될 수 있다. 상기 시작밴드 정보가 인덱스 정보로 표시된 경우는, 상기 인덱스에 해당하는 시작 밴드 정보는 테이블로 저장되어 디코더에서 이용할 수 있는 경우이다. 시작 밴드 정보는 대역확장정보 전송부(129)로 전달되어 대역 확장 정보로 포함된다.
게인 정보 획득부(126)는 타깃 밴드의 스펙트럴 데이터 및 카피 밴드의 스펙트럴 데이터를 이용하여 게인 정보를 생성한다. 여기서 게인 정보는, 다음 수학식과 같이 카피 밴드의 에너지 및 타깃 밴드의 에너지의 비로 정의될 수 있다.
[수학식 1]
Figure 112010033586370-PCT00001
여기서 gi는 게인, i 는 현재 타깃 밴드.
이 게인 정보는 위와 같이 타깃 밴드별로 결정될 수 있다. 게인 정보는, 대역확장정보 전송부(129)를 전달되어 역시 대역 확장 정보에 포함된다.
하모닉 성분 정보 획득부(128)는 카피 밴드의 하모닉 성분을 분석하여 하모닉 성분 정보를 생성한다. 이 하모닉 성분 정보는 역시 대역확장정보 전송부(129)로 전달되어 대역 확장 정보로 포함된다.
대역확장정보 전송부(129)는 시작 밴드 정보, 게인 정보, 하모닉 성분 정보를 포함시켜서 대역 확장 정보를 출력하고, 이 대역 확장 정보는, 도 1 과 함께 설명된 멀티플렉서로 입력된다.
위와 같은 방법으로 협대역 다운믹스 및 대역 확장 정보가 생성되었는 바, 이하에서는, 디코더에서 대역 확장 정보 및 협대역 다운믹스를 이용하여 광대역 다운믹스를 생성하는 과정에 대해 설명하고자 한다.
도 5 은 본 발명의 실시 예에 따른 오디오 신호 디코딩 장치의 구성을 보여주는 도면이고, 도 6 는 도 5 에서 대역확장 디코딩부의 세부 구성을 보여주는 도면이다. 우선 도 5 를 참조하면, 본 발명의 실시예에 따른 오디오 신호 디코딩 장치(200)는 디멀티플렉서(210), 오디오 신호 디코딩부(220), 음성 신호 디코딩부(230), 부분 대역 디코딩부(240), 및 멀티채널 디코딩부(250)를 포함한다.
디멀티플렉서(210)는 비트스트림으로부터 협대역 다운믹스(DMXn), 대역 확장 정보, 및 공간 정보를 추출한다. 오디오 신호 디코딩부(220)는 협대역 다운믹스 신호가 오디오 특성이 큰 경우, 오디오 코딩 방식으로 협대역 다운믹스 신호를 디코딩한다. 여기서 오디오 신호는 앞서 설명한 바와 같이, AAC 표준, HE-AAC 표준에 따를 수 있다. 음성 신호 디코딩부(230)는 협대역 다운믹스 신호가 음성 특성이 큰 경우, 음성 코딩 방식으로 협대역 다운믹스 신호를 디코딩한다.
부분 대역 디코딩부(240)는 협대역 다운믹스에 대역 확장 정보를 적용하여 광대역 신호를 생성한다. 이에 대한 구체적인 설명은 도 6 과 함께 후술하고자 한다.
멀티채널 디코딩부(250)는 광대역 다운믹스 및 공간정보를 이용하여 출력신호를 생성한다.
도 6 을 참조하면, 부분 대역 디코딩부(240)는 대역확장정보 수신부(242), 카피밴드 결정부(244) 및 타깃밴드정보 생성부(246)을 포함하며, 신호복원부(248)를 더 포함할 수 있다.
대역확장정보 수신부(242)는 대역확장정보로부터 시작밴드 정보, 게인 정보, 하모닉 성분 정보를 추출하여 카피 밴드 결정부(224) 및 타깃밴드정보 생성부(246)로 전달한다.
카피 밴드 결정부(244)는 협대역 다운믹스(DMXn) 및 시작 밴드 정보를 이용하여 카피 밴드를 결정한다. 여기서, 협대역 다운믹스(DMXn)가 협대역의 스펙트럴 데이터가 아닌 경우, 스펙트럴 데이터로 변형한다. 여기서, 상기 카피밴드는 시작 밴드와 동일할 수 도 있고, 상이할 수도 있다. 상기 카피밴드가 시작밴드와 상인한 경우, 시작 밴드 정보에 해당하는 밴드로부터 스펙트럴 데이터가 존재하는 밴드까지를 카피 밴드로 결정하는 것이다. 결정된 카피 밴드에 해당하는 스펙트럴 데이터를 타깃밴드정보 생성부(246)로 전달한다.
타깃밴드정보 생성부(246)는, 카피 밴드의 스펙트럴 데이터, 및 게인 정보 등을 이용하여 타깃 밴드의 스펙트럴 데이터를 생성한다. 다음 수학식과 같이 타깃 밴드의 데이터를 생성할 수 있다.
[수학식 2]
Figure 112010033586370-PCT00002
여기서, gi는 현재 밴드의 게인, sd(taget_band)는 타깃 밴드의 스펙트럴 데이터, sd(copy_band)는 카피 밴드의 스펙트럴 데이터.
앞서 설명한 도 4 의 (A)에 표시된 실시예의 경우, 타깃 밴드의 왼쪽 카피 밴드의 스펙트럴 데이터에 게인(gs, gn-4, gn-2 등)을 적용할 수 있다. 도 4 의 (B)의 경우, 첫번째 타깃 밴드(tb)에 대해서는, 카피 밴드의 스펙트럴 데이터에 게인(gs, gn-3)을 적용하고, 두번째 타깃 밴드(tb')에 대해서는, 카피 밴드의 스팩트럴 데이터에 다른 게인(gs*gs+1, gn-3*gn-2)을 적용할 수 있다. 도 4 의 (C)의 경우도, 협대역 중 일부 영역인 카피 밴드의 스펙트럴 데이터(sds)에 게인(gs)을 적용한 후, 협대역 전체에 대해 다른 게인(g2nd)을 적용하여 2 차 타깃밴드(tb)의 스펙트럴 데이터를 생성한다.
한편, 타깃 밴드의 스펙트럴 데이터의 개수(Nt), 및 카피 밴드의 스펙트럴 데이터의 개수(Nc)가 다를 수 있는데 이 경우에 대해서 설명하고자 한다. 도 7 는 타깃 밴드의 스펙트럴 데이터의 개수(Nt)가 카피 밴드의 스펙트럴 데이터의 개수(Nc)가 보다 큰 경우, 도 8 은 작은 경우를 설명하기 위한 도면이다.
우선 도 7 의 (A)를 살펴보면, 타깃 밴드(sfbi)의 스펙트럴 데이터의 개수(Nt)가 36 개이고, 카피 밴드(sfbs)의 스펙트럴 데이터의 개수(Nc)가 24 임을 알 수 있다. 데이터의 개수가 클수록 밴드의 수평 길이가 길게 표시되어 있다. 타깃 밴드의 데이터 개수가 더 크기 때문에 카피 밴드의 데이터를 두번 이상 이용할 수 있다. 예를 들어, 도 7 의 (B1)에 도시된 바와 같이, 우선 카피 밴드의 24 개의 데이터를 타깃 밴드의 저주파부터 채워 넣고, 도 7 의 (B2)에 도시된 바와같이, 카피 밴드의 앞부분 12 개 또는 뒷 부분 12 개를 타깃 밴드의 나머지 부분에 채워넣을 수 있다. 물론 여기서도 전송된 게인 정보를 적용할 수 있다.
한편 도 8 의 (A)를 참조하면, 타깃 밴드(sfbi)의 스펙트럴 데이터의 개수(Nt)가 24 개이고, 카피 밴드(sfbs)의 스펙트럴 데이터의 개수(Nc)가 36 임을 알 수 있다. 타깃 밴드의 데이터 수가 더 작기 때문에, 카피 밴드의 데이터 중 일부만을 이용할 수 있다. 예를 들어 도 8 의 (B)에 표시된 바와 같이 카피 밴드(sfbs)의 앞 부분의 스펙트럴 데이터 24 개만을 이용하거나, 도 8 의 (C)에 표시된 바와 같이 카피 밴드(sfbs)의 뒷 영역의 스펙트럴 데이터 24 개만 이용하여, 타깃 밴드(sfbi)의 스펙트럴 데이터를 생성할 수 있다.
다시 도 6 를 참조하면, 타깃밴드정보 생성부(246)는 앞서 설명한 다양한 방식으로 게인을 적용하여 타깃 밴드의 스펙트럴 데이터를 생성한다. 한편, 타깃밴드정보 생성부(246)는, 타깃 밴드의 스펙트럴 데이터를 생성하는 데 있어서, 하모닉 성분 정보를 더 이용할 수 있다. 구체적으로, 인코더에 의해 전송된 하모닉 성분 정보를 이용하여, 타깃 밴드의 개수 또는 넓이에 대응하는 서브 하모닉 신호를 페이즈 합성 등의 방법으로 만들어 줄 수 있다.
타깃밴드정보 생성부(246)는 타임 신축 단계 및 데시메이션 단계의 조합으로 생성할 수 있다. 여기서 타임 신축 단계는 시간 도메인의 신호를 시간 방향으로 확장시키는 단계일 수 있다. 상기 확장 단계는 페이즈 보코더 방식을 이용할 수 있다. 한편, 데시메이션 단계는 타임 신축된 신호를 다시 원래 시간으로 압축시키는 단계일 수 있다. 타깃 밴드 스펙트럴 데이터에 타임 신축 단계 및 데시메이션 단계를 적용할 수 있다.
신호 복원부(248)는 타깃 밴드 스펙트럴 데이터 및 협대역 신호를 이용하여 광대역 신호를 생성한다. 광대역 신호는 광대역의 스펙트럴 데이터일 수도 있고, 시간 도메인의 신호에 해당할수도 있다.
본 발명에 따른 오디오 신호 처리 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 읽을 수 있는 기록 매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한. 상기 인코딩 방법에 의해 생성된 비트스트림은 컴퓨터가 읽을 수 있는 기록 매체에 저장되거나, 유/무선 통신망을 이용해 전송될 수 있다.
이상과 같이, 본 발명은 비록 한정된 실시 예와 도면에 의해 설명되었으나, 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허청구범위의 균등범위 내에서 다양한 수정 및 변형이 가능함은 물론이다.
본 발명은 오디오 신호 또는 비디오 신호를 인코딩하고 디코딩하는 데 적용될 수 있다.

Claims (15)

  1. 제 1 대역 및 제 2 대역으로 이루어진 주파수 대역에서 상기 제 1 대역에 대응하는 스펙트럴 데이터를 수신하는 단계;
    상기 제 1 대역의 부분 대역에 대응하는 카피 밴드의 주파수 정보에 근거하여, 상기 카피 밴드를 결정하는 단계; 및,
    상기 카피 밴드의 스펙트럴 데이터를 이용하여, 상기 제 2 영역에 대응하는 타깃 밴드의 스펙트럴 데이터를 생성하는 단계를 포함하고,
    상기 카피 밴드는 상기 제 1 대역의 상부에 존재하는 것을 특징으로 하는 오디오 신호 처리 방법.
  2. 제 1 항에 있어서,
    상기 타깃 밴드의 스펙트럴 데이터는 타임 신축 단계 및 데시메이션 단계의 조합으로 생성되는 것을 특징으로 하는 오디오 신호 처리 방법.
  3. 제 1 항에 있어서,
    상기 카피 밴드의 주파수 정보는 시작 주파수, 시작 밴드 및 이를 나타내는 인덱스 정보 중 하나인 것을 특징으로 하는 오디오 신호 처리 방법.
  4. 제 1 항에 있어서,
    상기 타깃 밴드의 스펙트럴 데이터는 상기 카피 밴드의 스펙트럴 데이터, 및 상기 타깃 밴드의 스펙트럴 데이터간의 게인에 해당하는 게인 정보, 및 상기 카피 밴드의 하모닉 정보중 하나 이상을 이용하여 생성되는 것을 특징으로 하는 오디오 신호 처리 방법.
  5. 제 1 항에 있어서,
    상기 제 1 대역의 스펙트럴 데이터는, 오디오 코딩 방식 및 음성 코딩 방식 중 하나에 의해 디코딩된 신호를 근거로 생성된 것을 특징으로 하는 오디오 신호 처리 방법.
  6. 제 1 대역 및 제 2 대역으로 이루어진 주파수 대역에서 상기 제 1 대역에 대응하는 스펙트럴 데이터를 수신하고, 상기 제 1 대역의 부분 대역에 대응하는 카피 밴드의 주파수 정보에 근거하여, 상기 카피 밴드를 결정하는 카피밴드 결정부; 및,
    상기 카피 밴드의 스펙트럴 데이터를 이용하여, 상기 제 2 영역에 대응하는 타깃 밴드의 스펙트럴 데이터를 생성하는 타깃밴드정보 생성부를 포함하고,
    상기 카피 밴드는 상기 제 1 대역의 상부에 존재하는 것을 특징으로 하는 오디오 신호 처리 장치.
  7. 제 6 항에 있어서,
    상기 타깃 밴드의 스펙트럴 데이터는 필터링 단계, 타임 신축 단계 및 데시 메이션 단계의 조합으로 생성되는 것을 특징으로 하는 오디오 신호 처리 장치.
  8. 제 6 항에 있어서,
    상기 카피 밴드의 주파수 정보는 시작 주파수, 시작 밴드 및 이를 나타내는 인덱스 정보 중 하나인 것을 특징으로 하는 오디오 신호 처리 장치.
  9. 제 6 항에 있어서,
    상기 타깃 밴드의 스펙트럴 데이터는 상기 카피 밴드의 스펙트럴 데이터, 및 상기 타깃 밴드의 스펙트럴 데이터간의 게인에 해당하는 게인 정보, 및 상기 카피 밴드의 하모닉 정보 중 하나 이상을 이용하여 생성되는 것을 특징으로 하는 오디오 신호 처리 장치.
  10. 제 6 항에 있어서,
    상기 제 1 대역의 스펙트럴 데이터는, 오디오 코딩 방식 및 음성 코딩 방식 중 하나에 의해 디코딩된 신호를 근거로 생성된 것을 특징으로 하는 오디오 신호 처리 장치.
  11. 제 1 대역 및 제 2 대역으로 이루어진 주파수 대역의 스펙트럴 데이터를 획득하는 단계;
    상기 주파수 대역의 스펙트럴 데이터를 이용하여 카피 밴드 및 타깃 밴드를 결정하는 단계;
    상기 카피 밴드의 주파수를 나타내는 카피 밴드의 주파수 정보를 생성하는 단계; 및,
    상기 주파수 대역스펙트럴 데이터 중에서 상기 타깃 밴드의 스펙트럴 데이터가 제외된 제 1 대역 스펙트럴 데이터를 생성하는 단계를 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  12. 제 11 항에 있어서,
    상기 카피 밴드의 스펙트럴 데이터, 및 상기 타깃 밴드의 스펙트럴 데이터간의 게인에 해당하는 게인 정보를 생성하는 단계를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 방법.
  13. 광대역의 스펙트럴 데이터를 획득하는 스펙트럴 데이터 획득부; 및,
    상기 광대역의 스펙트럴 데이터를 이용하여 카피 밴드 및 타깃 밴드를 결정하고, 상기 카피 밴드의 시작주파수 정보, 또는 상기 카피 밴드의 시작 밴드 인덱스 정보에 대응하는 시작 밴드 정보를 출력하고, 상기 광대역의 스펙트럴 데이터 중에서 상기 타깃 밴드의 스펙트럴 데이터가 제외된 협대역의 스펙트럴 데이터를 출력하는 카피 밴드 결정부를 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
  14. 제 13 항에 있어서,
    상기 카피 밴드의 스펙트럴 데이터, 및 상기 타깃 밴드의 스펙트럴 데이터간의 게인에 해당하는 게인 정보를 생성하는 게인 정보 획득부를 더 포함하는 것을 특징으로 하는 오디오 신호 처리 장치.
  15. 디지털 오디오 데이터를 저장하며, 컴퓨터로 읽을 수 있는 저장매체에 있어서,
    상기 디지털 오디오 데이터는 제 1 대역 및 제 2 대역으로 이루어진 주파수 대역에서 상기 제 1 대역에 대응하는 스펙트럴 데이터 및 대역 확장정보를 포함하며,
    상기 제 1 대역은 상기 제 2 대역의 타깃 밴드를 생성하기 위한 카피 밴드를 그 상부에 포함하며,
    상기 대역 확장정보는 상기 카피 밴드의 주파수 정보, 게인 정보 및 상기 카피 밴드의 하모닉 정보 중 하나 이상을 포함하는 것을 특징으로 하는 저장 매체.
KR1020107011463A 2007-12-18 2008-12-18 오디오 신호 처리 방법 및 장치 KR20100086000A (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US1444107P 2007-12-18 2007-12-18
US61/014,441 2007-12-18
US11864708P 2008-11-30 2008-11-30
US61/118,647 2008-11-30

Publications (1)

Publication Number Publication Date
KR20100086000A true KR20100086000A (ko) 2010-07-29

Family

ID=40795707

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020107011463A KR20100086000A (ko) 2007-12-18 2008-12-18 오디오 신호 처리 방법 및 장치

Country Status (9)

Country Link
US (1) US9275648B2 (ko)
EP (1) EP2229677B1 (ko)
JP (1) JP5400059B2 (ko)
KR (1) KR20100086000A (ko)
CN (1) CN101903944B (ko)
AU (1) AU2008339211B2 (ko)
CA (1) CA2708861C (ko)
RU (1) RU2439720C1 (ko)
WO (1) WO2009078681A1 (ko)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2212884B1 (en) * 2007-11-06 2013-01-02 Nokia Corporation An encoder
KR101161866B1 (ko) * 2007-11-06 2012-07-04 노키아 코포레이션 오디오 코딩 장치 및 그 방법
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
WO2011083981A2 (en) * 2010-01-06 2011-07-14 Lg Electronics Inc. An apparatus for processing an audio signal and method thereof
WO2011110494A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improved magnitude response and temporal alignment in phase vocoder based bandwidth extension for audio signals
MY154204A (en) 2010-03-09 2015-05-15 Fraunhofer Ges Forschung Apparatus and method for processing an imput audio signal using cascaded filterbanks
PL2532002T3 (pl) 2010-03-09 2014-06-30 Fraunhofer Ges Forschung Urządzenie, sposób i program komputerowy do przetwarzania sygnału audio
SG10201505469SA (en) * 2010-07-19 2015-08-28 Dolby Int Ab Processing of audio signals during high frequency reconstruction
US9489962B2 (en) * 2012-05-11 2016-11-08 Panasonic Corporation Sound signal hybrid encoder, sound signal hybrid decoder, sound signal encoding method, and sound signal decoding method
US9674052B2 (en) 2012-09-20 2017-06-06 Hewlett Packard Enterprise Development Lp Data packet stream fingerprint
CN106847297B (zh) 2013-01-29 2020-07-07 华为技术有限公司 高频带信号的预测方法、编/解码设备
CN108269584B (zh) 2013-04-05 2022-03-25 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
TWI546799B (zh) 2013-04-05 2016-08-21 杜比國際公司 音頻編碼器及解碼器
EP2830051A3 (en) * 2013-07-22 2015-03-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals
CN110648677B (zh) 2013-09-12 2024-03-08 杜比实验室特许公司 用于下混合音频内容的响度调整
EP3226242B1 (en) * 2013-10-18 2018-12-19 Telefonaktiebolaget LM Ericsson (publ) Coding of spectral peak positions
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
EP3067887A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
MY196436A (en) 2016-01-22 2023-04-11 Fraunhofer Ges Forschung Apparatus and Method for Encoding or Decoding a Multi-Channel Signal Using Frame Control Synchronization
EP3288031A1 (en) * 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
KR20180056032A (ko) 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
CN111383646B (zh) * 2018-12-28 2020-12-08 广州市百果园信息技术有限公司 一种语音信号变换方法、装置、设备和存储介质
CN113593586A (zh) * 2020-04-15 2021-11-02 华为技术有限公司 音频信号编码方法、解码方法、编码设备以及解码设备

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3721582B2 (ja) 1993-06-30 2005-11-30 ソニー株式会社 信号符号化装置及び方法並びに信号復号化装置及び方法
JP3317470B2 (ja) * 1995-03-28 2002-08-26 日本電信電話株式会社 音響信号符号化方法、音響信号復号化方法
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JPH09281995A (ja) * 1996-04-12 1997-10-31 Nec Corp 信号符号化装置及び方法
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
JP3211762B2 (ja) * 1997-12-12 2001-09-25 日本電気株式会社 音声及び音楽符号化方式
JP4170459B2 (ja) 1998-08-28 2008-10-22 ローランド株式会社 波形信号の時間軸圧縮伸長装置
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
JP3576936B2 (ja) * 2000-07-21 2004-10-13 株式会社ケンウッド 周波数補間装置、周波数補間方法及び記録媒体
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
SE522553C2 (sv) * 2001-04-23 2004-02-17 Ericsson Telefon Ab L M Bandbreddsutsträckning av akustiska signaler
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
KR100935961B1 (ko) * 2001-11-14 2010-01-08 파나소닉 주식회사 부호화 장치 및 복호화 장치
JP3926726B2 (ja) 2001-11-14 2007-06-06 松下電器産業株式会社 符号化装置および復号化装置
JP4313993B2 (ja) 2002-07-19 2009-08-12 パナソニック株式会社 オーディオ復号化装置およびオーディオ復号化方法
JP3861770B2 (ja) * 2002-08-21 2006-12-20 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
JP2004198485A (ja) 2002-12-16 2004-07-15 Victor Co Of Japan Ltd 音響符号化信号復号化装置及び音響符号化信号復号化プログラム
CN1748247B (zh) * 2003-02-11 2011-06-15 皇家飞利浦电子股份有限公司 音频编码
RU2005135648A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Генерация аудиосигналов
US8311809B2 (en) 2003-04-17 2012-11-13 Koninklijke Philips Electronics N.V. Converting decoded sub-band signal into a stereo signal
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
WO2005043511A1 (en) 2003-10-30 2005-05-12 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
JP2005352396A (ja) 2004-06-14 2005-12-22 Matsushita Electric Ind Co Ltd 音響信号符号化装置および音響信号復号装置
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
CN101044553B (zh) * 2004-10-28 2011-06-01 松下电器产业株式会社 可扩展编码装置、可扩展解码装置及其方法
DE102005032724B4 (de) * 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7953605B2 (en) * 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
JP2007110565A (ja) 2005-10-14 2007-04-26 Matsushita Electric Ind Co Ltd マルチチャンネル音響復号化装置及び方法
WO2007052088A1 (en) * 2005-11-04 2007-05-10 Nokia Corporation Audio compression
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US20080300866A1 (en) * 2006-05-31 2008-12-04 Motorola, Inc. Method and system for creation and use of a wideband vocoder database for bandwidth extension of voice
KR20070115637A (ko) * 2006-06-03 2007-12-06 삼성전자주식회사 대역폭 확장 부호화 및 복호화 방법 및 장치
US20080109215A1 (en) * 2006-06-26 2008-05-08 Chi-Min Liu High frequency reconstruction by linear extrapolation
WO2008035949A1 (en) * 2006-09-22 2008-03-27 Samsung Electronics Co., Ltd. Method, medium, and system encoding and/or decoding audio signals by using bandwidth extension and stereo coding
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
US7885819B2 (en) * 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding

Also Published As

Publication number Publication date
EP2229677A4 (en) 2010-12-08
AU2008339211A1 (en) 2009-06-25
EP2229677A1 (en) 2010-09-22
CA2708861A1 (en) 2009-06-25
JP2011507050A (ja) 2011-03-03
JP5400059B2 (ja) 2014-01-29
EP2229677B1 (en) 2015-09-16
CN101903944A (zh) 2010-12-01
US20100292994A1 (en) 2010-11-18
RU2439720C1 (ru) 2012-01-10
WO2009078681A1 (en) 2009-06-25
AU2008339211B2 (en) 2011-06-23
US9275648B2 (en) 2016-03-01
CN101903944B (zh) 2013-04-03
CA2708861C (en) 2016-06-21

Similar Documents

Publication Publication Date Title
JP5400059B2 (ja) オーディオ信号処理方法及び装置
JP4934427B2 (ja) 音声信号復号化装置及び音声信号符号化装置
JP5485909B2 (ja) オーディオ信号処理方法及び装置
JP6704037B2 (ja) 音声符号化装置および方法
KR101455915B1 (ko) 일반 오디오 및 음성 프레임을 포함하는 오디오 신호용 디코더
KR101435893B1 (ko) 대역폭 확장 기법 및 스테레오 부호화 기법을 이용한오디오 신호의 부호화/복호화 방법 및 장치
JP5942358B2 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP5283046B2 (ja) ピーク検出に基づく選択的スケーリングマスク計算
KR101397058B1 (ko) 신호 처리 방법 및 이의 장치
JP5285162B2 (ja) ピーク検出に基づいた選択型スケーリングマスク演算
JP5752134B2 (ja) 最適化された低スループットパラメトリック符号化/復号化
JP2013044923A (ja) 符号化装置および方法、並びにプログラム
KR20090083070A (ko) 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
KR20090083068A (ko) 오디오 신호의 부호화, 복호화 방법 및 장치
US20100250260A1 (en) Encoder
JP4578145B2 (ja) 音声符号化装置、音声復号化装置及びこれらの方法
KR20080095491A (ko) 오디오/스피치 신호 부호화 및 복호화 방법 및 장치
KR20080092823A (ko) 부호화/복호화 장치 및 방법
KR20080034817A (ko) 부호화/복호화 장치 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
J201 Request for trial against refusal decision
AMND Amendment
B601 Maintenance of original decision after re-examination before a trial
J301 Trial decision

Free format text: TRIAL DECISION FOR APPEAL AGAINST DECISION TO DECLINE REFUSAL REQUESTED 20120406

Effective date: 20130412