KR20080033909A - 오디오 디코더 - Google Patents

오디오 디코더 Download PDF

Info

Publication number
KR20080033909A
KR20080033909A KR1020077030265A KR20077030265A KR20080033909A KR 20080033909 A KR20080033909 A KR 20080033909A KR 1020077030265 A KR1020077030265 A KR 1020077030265A KR 20077030265 A KR20077030265 A KR 20077030265A KR 20080033909 A KR20080033909 A KR 20080033909A
Authority
KR
South Korea
Prior art keywords
frequency band
signal
channel
aliasing noise
unit
Prior art date
Application number
KR1020077030265A
Other languages
English (en)
Other versions
KR101212900B1 (ko
Inventor
요시아키 다카기
콕 셍 총
다케시 노리마츠
슈지 미야사카
아키히사 가와무라
고지로 오노
Original Assignee
마쯔시다덴기산교 가부시키가이샤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마쯔시다덴기산교 가부시키가이샤 filed Critical 마쯔시다덴기산교 가부시키가이샤
Publication of KR20080033909A publication Critical patent/KR20080033909A/ko
Application granted granted Critical
Publication of KR101212900B1 publication Critical patent/KR101212900B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition

Abstract

에일리어싱 노이즈의 발생을 억제하면서 연산량을 경감한 오디오 디코더를 제공한다. 오디오 디코더는, 상기 부호화 다운믹스 신호로부터, 다운믹스 신호(M)에 대한 제1 주파수 대역 신호(x)를 생성하는 디코더(102) 및 분석 필터 뱅크(110)와, BC정보를 사용해, 분석 필터 뱅크(110)에서 생성된 제1 주파수 대역 신호(x)를, N채널의 오디오 신호에 대한 출력 신호(y)로 변환하는 채널 확대부(130)와, 채널 확대부(130)에서 생성된 N채널의 출력 신호(y)를 대역 합성함으로써, 시간축 상의 N채널의 오디오 신호로 변환하는 합성 필터 뱅크(140)와, 제1 주파수 대역 신호(x)에 있어서의 에일리어싱 노이즈의 발생을 검출하는 에일리어싱 노이즈 검출부(120)를 구비하고, 채널 확대부(130)는 또한, 에일리어싱 노이즈 검출부(120)에서 검출된 정보에 의거해, 출력 신호(y)에 에일리어싱 노이즈가 포함되는 것을 방지한다.

Description

오디오 디코더{AUDIO DECODER}
본 발명은, 복수 채널의 신호를 다운믹스한 신호를 부호화한 부호화 데이터와, 그것을 원래의 채널 수의 신호로 분리하기 위한 정보가 부호화된 부호화 데이터를 사용해, 원래의 채널수의 신호로 복호화하는 오디오 디코더에 관한 것이며, 특히 MPEG(Moving Picture Expert Group) 오디오에 있어서의 스페이셜 코덱(Spatial Audio Codec)의 복호화 처리에 관한 것이다.
최근, MPEG 오디오 규격에 있어서 Spatial Audio Codec(공간적 부호화)이라고 하는 기술이 규격화되어 가고 있다. 이것은, 매우 적은 정보량으로 현장감을 나타내는 멀티 채널 신호를 압축·부호화하는 것을 목적으로 하고 있다. 예를 들면, 이미 디지털 TV의 음성 방식으로서 널리 사용되고 있는 멀티 채널 코덱인 AAC(Advanced Audio Coding) 방식이 5.1ch당 512kbps나 384kbps라는 비트 레이트를 필요로 하는데 비해, Spatial Audio Codec에서는 128kbps나 64kbps, 또한 48kbps라는 매우 적은 비트 레이트로 멀티 채널 신호를 압축 및 부호화하는 것을 목표로 하고 있다(예를 들면, 비특허 문헌 1 참조).
도 1은, 종래의 오디오 장치의 구성을 도시한 블록도이다.
오디오 장치(1000)는, 오디오 신호의 쌍에 대한 공간 음향 부호화를 행해 부 호화 신호를 출력하는 오디오 엔코더(1100)와, 그 부호화 신호를 복호화하는 오디오 디코더(1200)를 구비하고 있다.
오디오 엔코더(1100)는, 1024샘플이나 2048샘플 등에 의해 나타내어지는 프레임 단위로 오디오 신호(예를 들면, 2채널의 오디오 신호 L, R)를 처리하는 것으로서, 다운믹스부(1110)와, 바이노럴 큐 검출부(1120)와, 엔코더(1150)와, 다중화부(1190)를 구비하고 있다.
다운믹스부(1110)는, 2채널의 스펙트럼 표현된 오디오 신호 L, R의 평균을 취함으로써, 즉 M=(L+R)/2에 의해 오디오 신호 L, R이 다운믹스된 다운믹스 신호 M을 생성한다.
바이노럴 큐 검출부(1120)는, 스펙트럼 밴드마다 오디오 신호 L, R 및 다운믹스 신호 M을 비교함으로써, 다운믹스 신호 M을 오디오 신호 L, R로 되돌리기 위한 BC 정보(바이노럴 큐)를 생성한다.
BC정보는, 채널간 레벨/강도차(inter-channel level/intensity diffrence)를 나타내는 레벨 정보 IID와, 및 채널간 코히어런스/상관(inter-channel coherence/correlation)을 나타내는 상관 정보 ICC와, 채널간 위상 지연차(inter-channel phase/delay diffrence)를 나타내는 위상 정보 IPD를 포함한다.
여기서, 상관 정보 ICC가 2개의 오디오 신호 L, R의 유사성을 나타내는데 비해, 레벨 정보 IID는 상대적인 오디오 신호 L, R의 강도를 나타낸다. 일반적으로, 레벨 정보 IID는 소리의 밸런스나 정위를 제어하기 위한 정보이고, 상관 정보 ICC는 음상의 폭이나 확산성을 제어하기 위한 정보이다. 이들은 모두 듣는 사람이 청 각적 정경을 머릿속에서 구성하는 것을 돕는 공간 파라미터이다.
스펙트럼 표현된 오디오 신호 L, R 및 다운믹스 신호 M은「파라미터 밴드」로 이루어지는 통상 복수의 그룹으로 구분되어 있다. 따라서, BC 정보는 각각의 파라미터 밴드마다 산출된다. 또한, 「BC정보」와「공간 파라미터」라고 하는 용어는 자주 동의적으로 사용된다.
엔코더(1150)는, 예를 들면 MP3(MPEG Audio Layer-3)나, AAC(Advanced Audio Coding) 등에 의해 다운믹스 신호 M을 압축 부호화한다.
다중화부(1190)는, 다운 믹스 신호 M과, 양자화된 BC 정보를 다중화함으로써 비트 스트림을 생성해, 그 비트 스트림을 상술한 부호화 신호로서 출력한다.
오디오 디코더(1200)는, 역다중화부(1210)와, 디코더(1220)와, 멀티 채널 합성부(1240)를 구비하고 있다.
역다중화부(1210)는 상술한 비트 스트림을 취득해, 그 비트 스트림으로부터 양자화된 BC정보와, 부호화된 다운 믹스 신호 M을 분리해 출력한다. 또한, 역다중화부(1210)는 양자화된 BC정보를 역양자화하여 출력한다.
디코더(1220)는, 부호화된 다운믹스 신호 M을 복호화해 멀티 채널 합성부(1240)에 출력한다.
멀티 채널 합성부(1240)는, 디코더(1220)로부터 출력된 다운믹스 신호 M과, 역다중화부(1210)로부터 출력된 BC 정보를 취득한다. 그리고, 멀티 채널 합성부(1240)는 그 BC 정보를 사용해, 다운 믹스 신호 M으로부터 2개의 오디오 신호 L, R을 복원한다.
또한, 위에서는, 2채널의 오디오 신호를 부호화하여 복호화하는 예를 들어 오디오 장치(1000)를 설명했으나, 오디오 장치(1000)는 2채널보다도 많은 채널의 오디오 신호(예를 들면, 5.1채널 음원을 구성하는 6개 채널의 오디오 신호)를 부호화 및 복호화할 수도 있다.
도 2는, 멀티 채널 합성부(1240)의 기능 구성을 도시한 기능 블록도이다.
멀티 채널 합성부(1240)는, 예를 들면 다운믹스 신호 M을 6개 채널의 오디오 신호로 분리하는 경우, 제1 분리부(1241)와, 제2 분리부(1242)와, 제3 분리부(1243)와, 제4 분리부(1244)와, 제5 분리부(1245)를 구비한다. 또한, 다운믹스 신호 M은, 청취자의 정면에 배치되는 스피커에 대한 정면 오디오 신호 C와, 시청자의 좌측 전방에 배치되는 스피커에 대한 좌측 전방 오디오 신호 Lf와, 시청자의 우측 전방에 배치되는 스피커에 대한 우측 전방 오디오 신호 Rf와, 시청자의 좌측 횡방에 배치되는 스피커에 대한 좌측 횡방 오디오 신호 Ls와, 시청자의 우측 횡방에 배치되는 스피커에 대한 우측 횡방 오디오 신호 Rs와, 저음 출력용 서브우퍼 스피커에 대한 저역 오디오 신호 LFE가 다운믹스되어 구성되어 있다.
제1 분리부(1241)는, 다운믹스 신호 M으로부터 제1 다운 믹스 신호 M1과 제4 다운믹스 신호 M4를 분리해 출력한다. 제1 다운믹스 신호 M1은, 정면 오디오 신호 C와 좌측 전방 오디오 신호 Lf와 우측 전방 오디오 신호 Rf와 저역 오디오 신호 LFE가 다운믹스되어 구성되어 있다. 제4 다운믹스 신호 M4는, 좌측 횡방 오디오 신호 Ls와 우측 횡방 오디오 신호 Rs가 다운믹스되어 구성되어 있다.
제2 분리부(1242)는, 제1 다운믹스 신호 M1으로부터 제2 다운믹스 신호 M2와 제3 다운믹스 신호 M3를 분리해 출력한다. 제2 다운 믹스 신호 M2는, 좌측 전방 오디오 신호 Lf와 우측 전방 오디오 신호 Rf가 다운믹스되어 구성되어 있다. 제3 다운믹스 신호 M3는, 정면 오디오 신호 C와 저역 오디오 신호 LFE가 다운믹스되어 구성되어 있다.
제3 분리부(1243)는, 제2 다운믹스 신호 M2로부터 좌측 전방 오디오 신호 Lf와 우측 전방 오디오 신호 Rf를 분리해 출력한다.
제4 분리부(1244)는, 제3 다운믹스 신호 M3로부터 정면 오디오 신호 C와 저역 오디오 신호 LFE를 분리해 출력한다.
제5 분리부(1245)는, 제4 다운믹스 신호 M4로부터 좌측 횡방 오디오 신호 Ls와 우측 횡방 오디오 신호 Rs를 분리해 출력한다.
이렇게 멀티 채널 합성부(1240)는, 멀티 스테이지의 방법에 의해 각 분리부에서 1개의 신호를 2개의 신호로 분리하고, 단일의 오디오 신호가 분리될 때까지 재귀적으로 신호의 분리를 반복한다.
도 3은, 멀티 채널 합성부(1240)의 기능 구성을 도시한 다른 기능 블록도이다.
멀티 채널 합성부(1240)는 올 패스 필터(1261)와, 연산부(1262)와, BCC 처리부(1263)를 구비하고 있다.
올 패스 필터(1261)는, 다운믹스 신호 M을 취득해, 그 다운믹스 신호 M에 대해 상관성이 없는 무상관 신호 Mrev를 생성해 출력한다. 다운믹스 신호 M과 무상관 신호 Mrev는 각각을 청각적으로 비교하면, 「상호 인코히어런트」라고 간주된다. 또, 무상관 신호 Mrev는 믹스 신호 M과 같은 에너지를 가져, 마치 소리가 퍼지고 있는 것 같은 환각을 만들어 내는 유한 시간의 잔향 성분을 포함한다.
BCC 처리부(1263)는 BC 정보를 취득하여, 그 BC정보에 포함되는 레벨 정보 IID나 상관 정보 ICC 등에 의거해 믹싱 계수 Hij를 생성해 출력한다.
연산부(1262)는, 다운믹스 신호 M, 무상관 신호 Mrev, 및 믹싱 계수 Hij를 취득하고, 이들을 사용해 (수학식 1)에 나타낸 바와 같이 연산을 행하여 오디오 신호 L, R을 출력한다. 이렇게 믹싱 계수 Hij를 사용함으로써, 오디오 신호 L, R간의 상관의 정도나 그들 신호의 지향성을 의도한 상태로 할 수 있다.
Figure 112007093098820-PCT00001
도 4는, 멀티 채널 합성부(1240)의 상세한 구성을 도시한 블록도이다.
멀티 채널 합성부(1240)는, 프리 매트릭스 처리부(1251)와, 포스트 매트릭스 처리부(1252)와, 제1 연산부(1253) 및 제2 연산부(1255)와, 무상관 처리부(1254)와, 분석 필터 뱅크(1256)와, 합성 필터 뱅크(1257)를 구비하고 있다. 또한, 프리 매트릭스 처리부(1251), 포스트 매트릭스 처리부(1252), 제1 연산부(1253), 제2 연산부(1255), 및 무상관 처리부(1254)에 의해 채널 확대부(1270)가 구성되어 있다.
분석 필터 뱅크(1256)는, 디코더(1220)로부터 출력된 다운믹스 신호 M을 취득해, 그 다운믹스 신호 M의 표현 형식을 시간/주파수 하이브리드 표현으로 변환하여 제1 주파수 대역 신호 x로서 출력한다. 또한, 이 분석 필터 뱅크(1256)는 제1 스테이지 및 제2 스테이지를 구비한다. 예를 들면, 제1 스테이지 및 제2 스테이지는 QMF 필터 뱅크 및 나이키스트 필터 뱅크이다. 이들 스테이지에서는, 우선 QMF 필터(제1 스테이지)에서 복수의 주파수 대역으로 분할하고, 또한 나이키스트 필터(제2 스테이지)에서 저주파수측의 서브 밴드를 더욱 미세한 서브 밴드로 나눔으로써, 저주파수 서브 밴드의 스펙트럼의 분해능을 높이고 있다.
프리 매트릭스 처리부(1251)는, 신호 강도 레벨의 각 채널로의 배분(스케일링)을 나타내는 스케일링 팩터인 행렬 R1을 BC 정보를 사용해 생성한다.
예를 들면, 프리 매트릭스 처리부(1251)는, 다운믹스 신호 M의 신호 강도 레벨과, 제1 다운믹스 신호 M1, 제2 다운믹스 신호 M2, 제3 다운믹스 신호 M3 및 제4 다운믹스 신호 M4의 신호 강도 레벨의 비율을 나타내는 레벨 정보 IID를 사용해 행렬 R1을 생성한다.
제1 연산부(1253)는, 분석 필터 뱅크(1256)로부터 출력된 시간/주파수 하이 브리드 표현의 제1 주파수 대역 신호 x를 취득해, 예를 들면 (수학식 2) 및 (수학식 3)에 나타낸 바와 같이, 그 제1 주파수 대역 신호 x와 행렬 R1의 적(積)을 산출한다. 그리고, 제1 연산부(1253)는 그 행렬 연산 결과를 나타내는 중간 신호 v를 출력한다. 즉, 제1 연산부(1253)는, 분석 필터 뱅크(1256)로부터 출력된 시간/주파수 하이브리드 표현의 제1 주파수 대역 신호 x로부터 4개의 다운믹스 신호 M1~M4를 분리한다.
Figure 112007093098820-PCT00002
Figure 112007093098820-PCT00003
무상관 처리부(1254)는, 도 3에 도시한 올 패스 필터(1261)로서의 기능을 갖고, 중간 신호 v에 대해 올 패스 필터 처리를 실시함으로써, (수학식 4)에 나타낸 바와 같이 무상관 신호 w를 생성해 출력한다. 또한, 무상관 신호 w의 구성 요소 Mrev 및 Mi , rev는 다운 믹스 신호 M, M1에 대해 무상관 처리가 실시된 신호이다.
Figure 112007093098820-PCT00004
포스트 매트릭스 처리부(1252)는, 잔향의 각 채널로의 배분을 나타내는 행렬 R2를 BC 정보를 사용해 생성한다. 예를 들면, 포스트 매트릭스 처리부(1252)는, 음 상의 폭이나 확산성을 나타내는 상관 정보 ICC로부터 믹싱 계수 Hij를 도출해, 그 믹싱 계수 Hij로 구성되는 행렬 R2를 생성한다.
제2 연산부(1255)는, 무상관 신호 w와 행렬 R2의 적을 산출해, 그 행렬 연산 결과를 나타내는 출력 신호 y를 출력한다. 즉, 제2 연산부(1255)는, 무상관 신호 w로부터 6개의 오디오 신호 Lf, Rf, Ls, Rs, C, LFE를 분리한다.
예를 들면, 도 2에 도시한 바와 같이, 좌측 전방 오디오 신호 Lf는 제2 다운 믹스 신호 M2로부터 분리되므로, 그 좌측 전방 오디오 신호 Lf의 분리에는, 제2 다운믹스 신호 M2와, 그것에 대응하는 무상관 신호 w의 구성 요소 M2 , rev가 사용된다. 마찬가지로, 제2 다운믹스 신호 M2는, 제1 다운 믹스 신호 M1으로부터 분리되므로, 그 제2 다운믹스 신호 M2의 산출에는, 제1 다운믹스 신호 M1과, 그것에 대응하는 무 상관 신호 w의 구성 요소 M1 , rev가 사용된다.
따라서, 좌측 전방 오디오 신호 Lf는 하기의 (수학식 5)에 의해 나타내어진다.
Figure 112007093098820-PCT00005
여기서, (수학식 5) 중의 Hij ,A는 제3 분리부(1243)에 있어서의 믹싱 계수이며, Hij ,D는 제2 분리부(1242)에 있어서의 믹싱 계수이며, Hij ,E는 제1 분리부(1241)에 있어서의 믹싱 계수이다. (수학식 5)에 나타낸 3개의 수학식은, 이하의 (수학식 6)에 나타낸 1개의 벡터 곱셈식으로 정리할 수 있다.
Figure 112007093098820-PCT00006
좌측 전방 오디오 신호 Lf 이외의 다른 오디오 신호 Rf, C, LFE, Ls, Rs도 상술한 바와 같은 행렬과 무상관 신호 w의 행렬의 연산에 의해 산출된다. 즉, 출력 신호 y는 하기의 (수학식 7)에 의해 나타내어진다.
Figure 112007093098820-PCT00007
합성 필터 뱅크(1257)는, 복원된 각 오디오 신호의 표현 형식을 시간/주파수 하이브리드 표현에서 시간 표현으로 변환해, 그 시간 표현의 복수의 오디오 신호를 멀티 채널 신호로서 출력한다. 또한, 합성 필터 뱅크(1257)는, 분석 필터 뱅크(1256)와 정합하도록, 예를 들면 2개의 스테이지로 구성된다. 또, 행렬 R1, R2는 상술한 파라미터 밴드 b마다 행렬 R1(b), R2(b)로서 생성된다.
도 5는, 오디오 디코더(1200)의 구성을 도시한 다른 블록도이다.
또한, 도 5에 있어서의 이중선의 화살표는 복수의 주파수 대역으로 분할된 주파수 대역 신호(상술한 제1 주파수 대역 신호 x 및 출력 신호 y)의 흐름을 나타내고 있다.
역다중화부(1210)에 의해 취득되는 부호화 신호는, 6채널의 오디오 신호가 2채널의 다운믹스 신호 M에 다운믹스되어 부호화된 부호화 다운믹스 신호와, 양자화된 BC 정보가 다중화되어 구성되어 있다.
역다중화부(1210)는, 그 부호화 신호를 부호화 다운믹스 신호와 BC 정보로 분리한다. 부호화 다운믹스 신호는, 예를 들면 MPEG 규격 AAC 방식으로 부호화된 2채널의 부호화 데이터이다.
디코더(1220)는 AAC 디코더를 사용하여, 그 부호화 다운믹스 신호를 복호화 한다. 그 결과, 디코더(1220)는, 2채널의 PCM 신호(시간축 신호)인 다운믹스 신호 M을 출력한다.
분석 필터 뱅크(1256)는 2개의 분석 필터(1256a)를 구비하고, 각 분석 필터(1256a)는, 디코더(1220)로부터 출력된 다운믹스 신호 M을 제1 주파수 대역 신호 x로 변환한다.
채널 확대부(1270)는, BC정보를 사용함으로써 2채널의 제1 주파수 대역 신호 x를 6채널의 출력 신호 y로 확대한다(예를 들면, 특허 문헌 1 참조).
합성 필터 뱅크(1257)는 6개의 합성 필터(1257a)를 구비하고, 각 합성 필터(1257a)는, 채널 확대부(1270)로부터 출력된 출력 신호 y를 PCM 신호인 오디오 신호로 변환한다.
도 6은, 오디오 디코더(1200)의 구성을 도시한 다른 블록도이다.
역다중화부(1210)에 의해 취득되는 부호화 신호는, 6채널의 오디오 신호가 1채널의 다운믹스 신호 M에 다운믹스되어 부호화된 부호화 다운믹스 신호와, 양자화된 BC 정보가 다중화되어 구성되어 있다.
이러한 경우, 디코더(1220)는 예를 들면 AAC 디코더를 사용하여 그 부호화 다운믹스 신호를 복호화한다. 그 결과, 디코더(1220)는, 1채널의 PCM 신호(시간축 신호)인 다운믹스 신호 M을 출력한다.
분석 필터 뱅크(1256)는 1개의 분석 필터(1256a)를 구비하고, 그 분석 필 터(1256a)는, 디코더(1220)로부터 출력된 다운믹스 신호 M을 제1 주파수 대역 신호 x로 변환한다.
채널 확대부(1270)는 BC 정보를 사용함으로써, 1채널의 제1 주파수 대역 신호 x를 6채널의 출력 신호 y로 확대한다.
비특허 문헌 1:118th AES convention, Barcelona, Spain, 2005, Convention Paper 6447.
특허 문헌 1:일본 특원 2004-248989호 공보
그러나, 상기 종래의 오디오 디코더에서는 연산량이 많기 때문에 회로 규모가 커져 버린다고 하는 문제가 있다.
즉, 도 5 및 도 6의 이중선의 화살표에 의해 나타내어지는 주파수 대역 신호(제1 주파수 대역 신호 x 및 출력 신호 y)는 복소수로 표현되고 있으므로, 분석 필터 뱅크(1256), 채널 확대부(1270) 및 합성 필터 뱅크(1257)에 있어서의 처리에는 막대한 연산량과 메모리 사이즈가 필요하다.
그래서, 복소수로 표현되는 주파수 대역 신호를 실수로서 처리하는 것을 생각할 수 있다. 그러나, 복소수의 처리를 단순히 실수의 처리로 치환하면 에일리어싱(aliasing) 노이즈가 발생하는 경우가 있다. 즉, 특정 주파수 대역에 톤(tone)성이 강한 신호가 존재하는 경우에는, 실수 처리에 의한 합성 필터(1257a)의 처리에 의해 인접하는 주파수 대역에 에일리어싱 노이즈가 발생한다. 따라서, 각 주파수 대역에 톤성이 강한 신호가 존재하는지 여부를 검출하여, 그 신호가 존재하는 경우에는 합성 필터(1257a)의 처리 전에 에일리어싱 노이즈 제거 처리를 행하는 것을 생각할 수 있다.
도 7은, 실수 처리 및 에일리어싱 노이즈 제거를 행하는 오디오 디코더의 구성을 도시한 블록도이다.
이 오디오 디코더(1200')의 분석 필터 뱅크(1256), 채널 확대부(1270) 및 합성 필터 뱅크(1257)는, 각각 주파수 대역 신호(제1 주파수 대역 신호 x 및 출력 신호 y)를 실수로 취급한다. 그리고, 이 오디오 디코더(1200')는 에일리어싱 노이즈 검출부(1281)와 6개의 노이즈 제거부(1282)를 구비한다.
에일리어싱 노이즈 검출부(1281)는 제1 주파수 대역 신호 x에 의거해, 그 신호의 각 주파수 대역에 톤성이 강한 신호가 존재하는지 아닌지, 즉 에일리어싱 노이즈가 발생할 가능성이 있는지 여부를 검출한다.
6개의 노이즈 제거부(1282)는 각각, 에일리어싱 노이즈 검출부(1281)의 검출 결과에 의거해, 채널 확대부(1270)로부터 출력되는 출력 신호 y로부터 에일리어싱 노이즈를 제거한다.
그러나, 이러한 오디오 디코더에서는, 출력 신호 y의 채널 수만큼 노이즈 제거부(1282)가 필요하게 되므로, 복소수의 처리를 실수의 처리로 치환하는 메리트가 없고, 연산량이 방대해져 회로 규모가 커져 버린다.
그래서 본 발명은, 이러한 문제를 감안하여 이루어진 것으로서, 에일리어싱 노이즈의 발생을 억제하면서 연산량을 경감한 오디오 디코더를 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위해서, 본 발명에 따른 오디오 디코더는, N(N≥2)채널의 오디오 신호를 다운믹스해 얻어지는 다운믹스 신호를 부호화한 제1 부호화 데이터와, 상기 다운믹스 신호를 원래의 N채널의 오디오 신호로 복원하기 위한 파라미터를 부호화한 제2 부호화 데이터로 이루어지는 비트 스트림을 디코드하여, N채널의 오디오 신호를 생성하는 오디오 디코더로서, 상기 제1 부호화 데이터로부터, 상기 다운믹스 신호에 대한 제1 주파수 대역 신호를 생성하는 주파수 대역 신호 생성 수단과, 상기 제2 부호화 데이터를 사용해, 상기 주파수 대역 신호 생성 수단에서 생성된 제1 주파수 대역 신호를, N채널의 오디오 신호에 대한 제2 주파수 대역 신호로 변환하는 채널 확대 수단과, 상기 채널 확대 수단에서 생성된 N채널의 제2 주파수 대역 신호를 대역 합성함으로써, 시간축 상의 N채널의 오디오 신호로 변환하는 대역 합성 수단과, 상기 제1 주파수 대역 신호에 있어서의 에일리어싱 노이즈의 발생을 검출하는 에일리어싱 노이즈 검출 수단을 구비하고, 상기 채널 확대 수단은 또한, 상기 에일리어싱 노이즈 검출 수단에서 검출된 정보에 의거해, 상기 제2 주파수 대역 신호에 에일리어싱 노이즈가 포함되는 것을 방지하는 것을 특징으로 한다.
이에 의해, 제1 주파수 대역 신호에 있어서 에일리어싱 노이즈가 발생할 것이 예견된 경우에는, 채널 확대 수단에서 노이즈의 발생이 억제되므로, 채널 확대 수단의 후단에서 채널의 수만큼 노이즈 제거부를 설치하는 것에 비해, 대단히 적은 처리량으로 에일리어싱 노이즈가 억제되어, 작은 회로 규모 또는 프로그램 사이즈의 오디오 디코더가 실현된다.
또, 상기 주파수 대역 신호 생성 수단은, 상기 제1 주파수 대역 신호 중 적어도 일부의 주파수 대역에 대해서는, 실수로 표현되는 상기 제1 주파수 대역 신호를 생성하고, 상기 에일리어싱 노이즈 검출 수단은, 상기 제1 주파수 대역 신호가 실수로 표현되는 것에 기인해 발생하는 에일리어싱 노이즈의 발생을 검출하는 것을 특징으로 해도 된다.
이에 의해, 제1 주파수 대역 신호는 복소수가 아니라 실수로 표현되므로, 연산량이 삭감되고, 또한 실수로의 표현을 사용하는 것에 의한 에일리어싱 노이즈의 발생이라는 문제도 회피된다.
또, 상기 주파수 대역 신호 생성 수단은, 소정의 주파수 대역의 대역 분해능을 높이기 위한 나이키스트 필터 뱅크를 갖고, 당해 나이키스트 필터 뱅크가 처리하는 주파수 대역에 대해서는 복소수로 표현되는 주파수 대역 신호를 생성하고, 당해 나이키스트 필터 뱅크가 처리하지 않는 주파수 대역에 대해서는 실수로 표현되는 주파수 대역 신호를 생성하는 것을 특징으로 해도 된다.
이에 의해, 제1 주파수 대역 신호는, 대역 분해능을 높이기 위한 필터 뱅크에 대해서는 복소수인 채로 처리되게 되므로, 높은 대역 분해능을 유지하면서 연산량이 억제되어, 음질 향상과 회로 규모 삭감의 양쪽을 균형있게 달성할 수 있다.
또, 상기 에일리어싱 노이즈 검출 수단은, 상기 제1 주파수 대역 신호에 있어서, 강한 주파수 성분이 지속되는 상태인 톤성이 강한 신호가 존재하는 주파수 대역을 검출하고, 상기 채널 확대 수단은, 상기 에일리어싱 노이즈 검출 수단에서 검출된 주파수 대역에 인접하는 주파수 대역의 신호 레벨을 조정한 상기 제2 주파수 대역 신호를 출력하는 것을 특징으로 해도 된다.
이에 의해, 에일리어싱 노이즈가 눈에 띄는 톤성이 높은 주파수 대역에 있어서 신호 레벨이 조정되므로, 효율적인 노이즈 제거가 실현된다.
또, 상기 제2 부호화 데이터는, 원래의 N채널의 오디오 신호간의 레벨비와 위상차를 포함하는 공간 파라미터를 부호화한 데이터이며, 상기 채널 확대 수단은, 상기 제1 주파수 대역 신호와, 당해 제1 주파수 대역 신호로부터 생성된 무상관 신호를, 상기 공간 파라미터로부터 생성된 연산 계수에 따른 비율로 혼합함으로써 상기 제2 주파수 대역 신호를 생성하는 연산 수단과, 상기 에일리어싱 노이즈 검출 수단에 의해 검출된 주파수 대역에 인접하는 주파수 대역에 대해 상기 연산 계수를 조정함으로써 상기 신호 레벨을 조정하는 조정 모듈을 구비하는 것을 특징으로 해도 된다.
이에 의해, 공간적인 소리의 확산을 연출하는 잔향 처리를 실시하면서 에일리어싱 노이즈가 억제되므로, 회로 규모가 작고, 또한 공간적 음향 효과가 손상되지 않는 공간 음향 복호화가 실현된다.
또, 상기 연산 수단은, 상기 공간 파라미터에 포함되는 레벨비로부터 도출되는 스케일링 계수를 상기 연산 계수의 일부로서 사용해 상기 제1 주파수 대역 신호를 스케일링함으로써 중간 신호를 생성하는 프리 매트릭스 모듈과, 상기 프리 매트릭스 모듈에서 생성된 중간 신호에 대해 올 패스 필터의 처리를 실시함으로써 무상관 신호를 생성하는 무상관 모듈과, 상기 공간 파라미터에 포함되는 위상차로부터 도출되는 믹싱 계수를 상기 연산 계수의 일부로서 사용해, 상기 제1 주파수 대역 신호와 상기 무상관 신호를 혼합하는 포스트 매트릭스 모듈을 구비하고, 상기 조정 모듈은, 상기 공간 파라미터를 조정함으로써 상기 연산 계수를 조정하는 것을 특징으로 해도 된다. 예를 들면, 상기 조정 모듈은, 상기 에일리어싱 노이즈 검출 수단이 검출한 주파수 대역과 당해 주파수 대역에 인접하는 주파수 대역에 대한 상기 공간 파라미터를 이퀄라이즈하는 이퀄라이저를 갖는다.
이에 의해, 프리 매트릭스 모듈, 무상관 모듈 및 포스트 매트릭스 모듈을 구비하는 종래의 공간 음향 디코더에도 적용할 수 있고, 컴팩트화와 고속 처리화가 가능해진다.
또한, 본 발명은, 이러한 오디오 디코더로서 실현할 수 있을 뿐만 아니라, 집적 회로나, 방법, 프로그램, 그 프로그램을 격납하는 기억 매체로서도 실현할 수 있다.
(발명의 효과)
본 발명의 오디오 디코더는, 에일리어싱 노이즈의 발생을 억제하면서 연산량을 경감할 수 있다고 하는 작용 효과를 발휘한다.
도 1은, 종래의 오디오 장치의 구성을 도시한 블록도이다.
도 2는, 종래의 채널 확대부의 기능 구성을 도시한 기능 블록도이다.
도 3은, 종래의 채널 확대부의 기능 구성을 도시한 다른 기능 블록도이다.
도 4는, 종래의 채널 확대부의 상세한 구성을 도시한 블록도이다.
도 5는, 종래의 오디오 디코더의 구성을 도시한 다른 블록도이다.
도 6은, 종래의 오디오 디코더의 구성을 도시한 다른 블록도이다.
도 7은, 실수 처리 및 에일리어싱 노이즈 제거를 행하는 오디오 디코더의 구성을 도시한 블록도이다.
도 8은, 본 발명의 실시형태에 있어서의 오디오 디코더의 구성을 도시한 블록도이다.
도 9는, 본 발명의 실시형태에 있어서의 멀티 채널 합성부의 상세한 구성을 도시한 블록도이다.
도 10은, 본 발명의 실시형태에 있어서의 TD부 및 EQ부의 동작을 도시한 흐름도이다.
도 11은, 본 발명의 실시형태에 있어서의 변형예 1에 따른 멀티 채널 합성부의 상세한 구성을 도시한 블록도이다.
도 12는, 본 발명의 실시형태에 있어서의 변형예 2에 따른 멀티 채널 합성부의 상세한 구성을 도시한 블록도이다.
도 13은, 본 발명의 실시형태에 있어서의 변형예 3에 따른 멀티 채널 합성부의 상세한 구성을 도시한 블록도이다.
도 14는, 본 발명의 실시형태에 있어서의 변형예 4에 따른 TD부 및 EQ부의 동작을 도시한 흐름도이다.
(부호의 설명)
100 오디오 디코더
101 역다중화부
102 디코더
103 멀티 채널 합성부
110 분석 필터 뱅크
120 에일리어싱 노이즈 검출부(TD부)
130 채널 확대부
131 프리 매트릭스 처리부
132 포스트 매트릭스 처리부
133 제1 연산부
134 제2 연산부
135 실수 무상관 처리부
136 EQ부
140 합성 필터 뱅크
이하, 본 발명의 실시형태에 있어서의 오디오 디코더에 대해 도면을 참조하면서 설명한다.
도 8은, 본 발명의 실시형태에 있어서의 오디오 디코더의 구성을 도시한 블록도이다.
본 실시형태에 있어서의 오디오 디코더(100)는, 에일리어싱 노이즈의 발생을 억제하면서 연산량을 경감한 것으로서, 역다중화부(101)와, 디코더(102)와, 멀티 채널 합성부(103)를 구비하고 있다.
역다중화부(101)는, 상기 종래의 역다중화부(1210)와 같은 기능을 가지며, 오디오 엔코더로부터 출력된 부호화 신호를 취득하여, 그 부호화 신호로부터 양자화된 BC정보와, 부호화 다운믹스 신호를 분리해 출력한다. 또한, 역다중화부(101)는 양자화된 BC 정보를 역양자화해 출력한다.
부호화 다운믹스 신호는 제1 부호화 데이터로서 구성되며, 예를 들면 6채널의 오디오 신호가 다운믹스되어 AAC 방식으로 부호화되어 있다. 또한, 부호화 다운믹스 신호는 AAC 방식과 SBR(Spectral Band Replication) 방식으로 부호화되어 있어도 된다. BC정보는 미리 정해진 형식으로 부호화되어 있으며 제2 부호화 데이터로서 구성되어 있다.
디코더(102)는 상기 종래의 디코더(1220)와 같은 기능을 갖고, 부호화 다운믹스 신호를 복호화함으로써 PCM 신호(시간축 신호)인 다운믹스 신호 M을 생성해 멀티 채널 합성부(103)에 출력한다. 또한, 디코더(102)는, AAC 방식의 복호화 과정에서 생성되는 MDCT(Modified Discrete Cosine Transform) 계수를 분석 필터 뱅크(110)의 출력 형식에 따라 변환함으로써 주파수 대역 신호를 생성해도 된다.
멀티 채널 합성부(103)는, 디코더(102)로부터 다운믹스 신호 M을 취득함과 더불어, 역다중화부(101)로부터 BC 정보를 취득한다. 그리고, 멀티 채널 합성부(103)는 그 BC정보를 사용해, 다운믹스 신호 M으로부터 상술한 6개의 오디오 신호를 복원한다.
멀티 채널 합성부(103)는, 분석 필터 뱅크(110)와, 에일리어싱 노이즈 검출부(120)와, 채널 확대부(130)와, 합성 필터 뱅크(140)를 구비하고 있다.
분석 필터 뱅크(110)는, 디코더(102)로부터 출력된 다운믹스 신호 M을 취득해, 그 다운믹스 신호 M의 표현 형식을 시간/주파수 하이브리드 표현으로 변환하여 제1 주파수 대역 신호 x로서 출력한다. 이 제1 주파수 대역 신호 x는, 모든 주파수 대역이 실수로 표현된 주파수 대역 신호이다. 또한, 본 실시형태에서는, 디코더(102)와 분석 필터 뱅크(110)에 의해 주파수 대역 신호 생성 수단이 구성되어 있다.
에일리어싱 노이즈 검출부(120)는, 분석 필터 뱅크(110)로부터 출력된 제1 주파수 대역 신호 x를 분석함으로써, 멀티 채널 합성부(103)로부터 출력되는 6채널의 오디오 신호에 에일리어싱 노이즈가 발생할 가능성이 높은지 아닌지를 검출한다. 즉, 에일리어싱 노이즈 검출부(120)는, 제1 주파수 대역 신호 x의 각 주파수 대역에 톤성이 강한 신호가 존재하는지 아닌지를 판별한다. 바꿔 말하면, 에일리어싱 노이즈 검출부(120)는, 강한 주파수 성분이 지속되는 상태인 톤성이 강한 신호가 존재하는 주파수 대역을 검출한다. 그리고, 에일리어싱 노이즈 검출부(120)는, 강한 신호가 존재한다고 판별한 경우에는, 인접하는 주파수 대역에 에일리어싱 노이즈가 발생할 가능성이 높다는 것을 검출한다. 또, 분석 필터 뱅크(110)에서는, 실수로 표현된 제1 주파수 대역 신호 x가 생성되므로, 그 에일리어싱 노이즈가 발생할 가능성은 높다.
채널 확대부(130)는 BC 정보를 취득하여, 그 BC 정보에 의거해 제1 주파수 대역 신호 x로부터 6채널의 출력 신호 y를 생성하기 위한 행렬을 생성한다. 이 때, 채널 확대부(130)는, 에일리어싱 노이즈 검출부(120)에 의해 에일리어싱 노이 즈의 발생 가능성이 높다고 검출되면, 합성 필터 뱅크(140)로부터 출력되는 출력 신호 y에 있어서 에일리어싱 노이즈가 억제되는 행렬(연산 계수)을 생성한다. 그리고, 채널 확대부(130)는, 제1 주파수 대역 신호 x에 대해 그 행렬을 사용한 행렬 연산을 행함으로써, 주파수 대역 신호(제2 주파수 대역 신호)인 6채널의 출력 신호 y를 출력한다.
즉, 채널 확대부(130)는, 에일리어싱 노이즈의 발생 가능성이 높다고 검출되면, 그 가능성이 높은 주파수 대역의 신호의 진폭을 조정함으로써 에일리어싱 노이즈를 경감한다. 즉, BC 정보에는 레벨 정보 IID가 포함되어 있으므로, 채널 확대부(130)는, 그 레벨 정보 IID로부터 얻어지는 각 주파수 대역마다의 진폭 증폭률을 행렬 내에서 조정함으로써, 에일리어싱 노이즈의 발생 가능성이 높은 주파수 대역의 신호의 크기를 제어한다.
합성 필터 뱅크(140)는, 6개의 합성 필터(140a)를 구비하고 있다. 각 합성 필터(140a)는 각각, 채널 확대부(130)로부터 출력된 출력 신호 y의 표현 형식을 시간/주파수 하이브리드 표현에서 시간 표현으로 변환한다. 즉, 합성 필터(140a)는, 출력 신호 y를 대역 합성하는 대역 합성 수단으로서 구성되어 있으며, 주파수 대역 신호인 출력 신호 y를 PCM 신호(시간축 신호)로 변환해 출력한다. 이에 의해, 6채널의 오디오 신호로 이루어지는 스테레오 신호가 출력된다.
도 9는, 멀티 채널 합성부(103)의 상세한 구성을 도시한 블록도이다.
분석 필터 뱅크(110)는, 실수 QMF부(111)와, 실수 Nyq부(112)를 구비하고 있다.
실수 QMF부(111)는, 필터 뱅크로서 실수 계수의 QMF(Quadrature Mirror Filter)로 구성되어 있으며, PCM 신호인 다운믹스 신호 M을 소정의 주파수 대역마다 분석하여, 시간/주파수 하이브리드 표현인 실수의 제1 주파수 대역 신호 x를 생성한다.
이러한 실수 QMF부(111)는, (수학식 8)에 나타낸 복소수(복소 변조 계수) Mr(k, n)이 아니라, (수학식 9)에 나타낸 실수(실수 변조 계수) Mr(k, n)을 사용한다.
Figure 112007093098820-PCT00008
Figure 112007093098820-PCT00009
실수 Nyq부(112)는, 실수 계수의 나이키스트 필터 뱅크로 구성되어 있으며, 상기 실수 QMF부(111)에서 생성된 제1 주파수 대역 신호 x의 저주파수 대역에 있어서, 더욱 미세한 주파수 대역마다 실수의 제1 주파수 대역 신호 x를 수정한다.
이러한 실수 Nyq부(112)의 필터는, 예를 들면 (수학식 10)에 나타낸 복소수(복소 변조 계수)
Figure 112007093098820-PCT00010
가 아니라, (수학식 11)에 나타낸 실수(실수 변조 계수)
Figure 112007093098820-PCT00011
를 사용한다.
Figure 112007093098820-PCT00012
Figure 112007093098820-PCT00013
TD부(120)는, 상술한 에일리어싱 노이즈 검출부(120)로서, 파라미터 밴드 m 및 처리 프레임 g에 있어서의 톤성(토낼리티) Tg(m)을, (수학식 12)와 같이 도출한다.
Figure 112007093098820-PCT00014
여기서,
Figure 112007093098820-PCT00015
(f)는, 2개의 처리 프레임 g 및(g-1)에 있어서의 신호 소비 전력의 합계를 나타내고,
Figure 112007093098820-PCT00016
(f)는, 상술한 처리 프레임의 코히어런스값을 나타낸다. Tg(m)의 값은 0에서 1이며, Tg(m)=0은 토낼리티가 없는 것을 나타내고, Tg(m)=1은 토낼리티가 높은 것을 나타낸다.
전체의 토낼리티는, 2개의 처리 프레임에 있어서의 상기 토낼리티의 최소값 에 의해 (수학식 13)처럼 나타내어지고, 파라미터 밴드 m에 있어서의 토낼리티의 최대값 GT(m)은 (수학식 14)처럼 나타내어진다.
Figure 112007093098820-PCT00017
Figure 112007093098820-PCT00018
채널 확대부(130)는, 조정 모듈인 EQ부(이퀄라이저)(136)와, 프리 매트릭스 처리부(131)와, 포스트 매트릭스 처리부(132)와, 제1 연산부(133)와, 제2 연산부(134)와, 실수 무상관 처리부(135)를 구비하고 있다.
EQ부(136)는, TD부(120)에 있어서 에일리어싱 노이즈의 발생 가능성이 높다고 파라미터 밴드 b에서 검출되면, BC 정보에 포함되는 레벨 정보 IID나 상관 정보 ICC 등인, 파라미터 밴드 b에서의 공간 파라미터 p(b)를 에일리어싱 노이즈의 발생이 억제되도록 수정한다.
프리 매트릭스 처리부(131)는, 종래의 프리 매트릭스 처리부(1251)와 같은 기능을 갖고, EQ부(136)를 통해 BC 정보를 취득해, 그 BC 정보에 의거해 행렬 R1을 생성한다. 즉, 프리 매트릭스 처리부(131)는, BC 정보의 공간 파라미터에 포함되는 레벨 정보 IID로부터, 스케일링 계수를 상술한 연산 계수의 일부로서 도출한다.
제1 연산부(133)는, 실수로 표현된 제1 주파수 대역 신호 x와 행렬 R1의 적 을 산출해, 그 행렬 연산 결과를 나타내는 중간 신호 v를 출력한다. 즉, 본 실시형태에서는, 프리 매트릭스 처리부(131) 및 제1 연산부(133)에 의해 프리 매트릭스 모듈이 구성되고, 그 프리 매트릭스 모듈이 제1 주파수 대역 신호 x를 스케일링하고 있다.
실수 무상관 처리부(135)는, 실수로 표현된 중간 신호 v에 대해 올 패스 필터 처리를 실시함으로써 무상관 신호 w를 생성해 출력한다.
이러한 실수 무상관 처리부(135)는, (수학식 15)에 나타낸 복소수(복소 격자 계수)
Figure 112007093098820-PCT00019
이 아니라, (수학식 16)에 나타낸 실수(실수 격자계수)
Figure 112007093098820-PCT00020
을 사용한다. 이에 의해, 비정수 지연 계수가 제거된다.
Figure 112007093098820-PCT00021
Figure 112007093098820-PCT00022
포스트 매트릭스 처리부(132)는, 종래의 포스트 매트릭스 처리부(1252)와 동일한 기능을 갖고, EQ부(136)를 통해 BC 정보를 취득해, 그 BC 정보에 의거해 행렬 R2를 생성한다. 즉, 포스트 매트릭스 처리부(132)는, BC 정보의 공간 파라미터에 포함되는 상관 정보 ICC나 위상 정보 IPD로부터, 믹싱 계수를 상술한 연산 계수의 일부로서 도출한다.
제2 연산부(134)는, 실수로 표현된 무상관 신호 w와 행렬 R2의 적을 산출해, 그 행렬 연산 결과를 나타내는 주파수 대역 신호인 출력 신호 y를 출력한다. 즉, 본 실시형태에서는, 포스트 매트릭스 처리부(132) 및 제2 연산부(134)에 의해 포스트 매트릭스 모듈이 구성되고, 그 포스트 매트릭스 모듈이, 믹싱 계수를 사용해 제1 주파수 대역 신호 x와 무상관 신호 w를 혼합하고 있다.
합성 필터 뱅크(140)는, 실수 INyq부(141)와, 실수 IQMF부(142)를 구비하고 있다.
실수 INyq부(141)는 실수 계수의 역 나이키스트 필터로, 실수 IQMF부(142)는 실수 계수의 역 QMF 필터로 구성되어 있다. 이에 의해, 합성 필터 뱅크(140)는 실수로 표현된 출력 신호 y를, 예를 들면 6채널의 오디오 신호로 이루어지는 시간 신호로 변환해 출력한다.
또, 이러한 실수 IQMF부(142)는, 예를 들면 (수학식 17)에 나타낸 복소수(복소 변조 계수) Nr(k, n)이 아니라, (수학식 18)에 나타낸 실수(실수 변조 계수) Nr(k, n)을 사용한다.
Figure 112007093098820-PCT00023
Figure 112007093098820-PCT00024
도 10은, TD부(120) 및 EQ부(136)의 동작을 도시한 흐름도이다.
우선, TD부(120)는, 분석 필터 뱅크(110)로부터 출력된 제1 주파수 대역 신호 x를 분석함으로써, 파라미터 밴드 b가 0부터 PramBand까지의 범위에서, 파라미터 밴드 b의 토낼리티 GT(b)와, 그 파라미터 밴드 b에 인접하는 파라미터 밴드 (b+1)의 토낼리티 GT(b+1)의 평균치인 평균 토낼리티 GT'(b)를 산출한다(단계 S700).
다음에, TD부(120)는, 파라미터 밴드 b를 0으로 초기 설정하고(단계 S701), 파라미터 밴드 b가 (ParamBand-1)에 도달했는지 아닌지, 즉 파라미터 밴드 b가 나타내는 밴드가 마지막에서 두번째의 밴드인지 아닌지를 판별한다(단계 S702).
여기서 TD부(120)는, (ParamBand-1)에 도달했다고 판별했을 때는(단계 S702의 yes), 에일리어싱 노이즈 검출의 처리를 종료한다. 한편, (ParamBand-1)에 도달하지 않았다고 판별했을 때는(단계 S702의 no), TD부(120)는 또한, 그 평균 토낼리티 GT'(b)가 미리 정해진 임계치 TH2보다도 큰지 아닌지를 판별한다(단계 S703).
TD부(120)는, 임계치 TH2보다도 크다고 판별했을 때는(단계 S703의 yes), 에일리어싱 노이즈의 발생 가능성이 있다는 것을 검출해, 그 검출 결과를 EQ부(136)에 통지한다. EQ부(136)는 그 검출 결과의 통지를 받으면, 파라미터 밴드 b의 공간 파라미터 p(b)와 파라미터 밴드(b+1)의 공간 파라미터 p(b+1)을, 그들 의 평균치로 치환하여 공간 파라미터 p(b)와 공간 파라미터 p(b+1)를 같게 한다. 그리고 TD부(120)는, 파라미터 밴드 b의 값을 1만큼 증가시키고(단계 S707), 단계 S702부터의 동작을 반복 실행한다.
한편, TD부(120)는, 평균 토낼리티 GT'(b)가 임계치 TH2 이하라고 판별했을 때는(단계 S703의 no), 또한 그 평균 토낼리티 GT'(b)가 임계치 TH1보다도 작은지 아닌지를 판별한다(단계 S705). 또한, 임계치 TH1는 임계치 TH2보다도 작은 값이다.
여기서 TD부(120)는, 임계치 TH1보다도 작다고 판별하면(단계 S705의 yes), 단계 S707부터의 처리를 반복 실행하고, 임계치 TH1 이상이라고 판별하면(단계 S705의 no), 그 판별 결과, 평균 토낼리티 GT'(b) 및 임계치 TH1, TH2를 EQ부(136)에 통지한다.
EQ부(136)는 상술한 통지를 받으면, 파라미터 밴드 b의 공간 파라미터 p(b)=ave×(1-a)+p(b)×a와, 파라미터 밴드 (b+1)의 공간 파라미터 p(b+1)=ave×(1-a)+p(b+1)×a를 산출한다(단계 S706). 여기서 ave=0.5×(p(b)+p(b+1))이며, a=(TH2-GT'(b))/(TH2-TH1)이다.
즉, EQ부(136)는, 임계치 TH1과 임계치 TH2 사이의 모든 평균 토낼리티 GT'(b)에 대해 공간 파라미터 p(b), p(b+1)를 선형 보간하고 있다. 즉, 평균 토낼리티 GT'(b)가 임계치 TH1에 가까운, 즉 토낼리티가 작을 때는, 공간 파라미터 p(b), p(b+1)은 각각 원래의 값에 가까워지고, 평균 토낼리티 GT'(b)가 임계치 TH2에 가까운, 즉 토낼리티가 클 때는, 공간 파라미터 p(b), p(b+1)은 각각의 평균치 에 가까워진다.
이렇게 본 실시형태에서는, 에일리어싱 노이즈가 발생하지 않도록 채널 확대부(130)에서 공간 파라미터가 조정되므로, 채널 확대부(130)의 후단에서 채널의 수만큼 노이즈 제거부를 설치하는 것에 비해, 대단히 적은 처리량으로 에일리어싱 노이즈가 억제되어, 작은 회로 규모 또는 프로그램 사이즈의 오디오 디코더가 실현된다. 그 결과, 저소비 전력화, 메모리 용량의 삭감, 및 칩 사이즈의 소형화를 도모할 수 있다.
(변형예 1)
여기서 본 실시형태에 있어서의 제1 변형예에 대해 설명한다.
상기 실시형태에서는, EQ부(136)는 TD부(120)의 검출 결과에 의거해 공간 파라미터 p를 이퀄라이즈했는데, 본 변형예에 따른 EQ부는, 프리 매트릭스 처리부 (131)에서 생성된 행렬 R1을 이퀄라이즈함과 더불어, 포스트 매트릭스 처리부(132)에서 생성된 행렬 R2를 이퀄라이즈한다.
도 11은, 본 변형예에 따른 멀티 채널 합성부의 상세한 구성을 도시한 블록도이다.
본 변형예에 따른 멀티 채널 합성부(103a)는, 상기 실시형태에 있어서의 채널 확대부(130) 대신에 채널 확대부(130a)를 구비한다.
채널 확대부(130a)는, 상기 실시형태의 EQ부(136)와 동일한 기능을 갖는 EQ부(136a) 및 EQ부(136b)를 구비하고 있다.
즉, EQ부(136a)는, TD부(120)에 의한 검출 결과에 의거해 프리 매트릭스 처리부(131)로부터 출력된 행렬 R1(스케일링 계수)을 이퀄라이즈하고, EQ부(136b)는, TD부(120)에 의한 검출 결과에 의거해 포스트 매트릭스 처리부(132)로부터 출력된 행렬 R2(믹싱 계수)를 이퀄라이즈한다.
EQ부(136a)는, (수학식 19)에 나타낸 바와 같이, EQ부(136)의 처리 대상인 공간 파라미터 p(b) 대신에 행렬 R1(b)를 처리 대상으로서 취급한다.
Figure 112007093098820-PCT00025
EQ부(136b)는, (수학식 20)에 나타낸 바와 같이, EQ부(136)의 처리 대상인 공간 파라미터 p(b) 대신에 행렬 R2(b)를 처리 대상으로서 취급한다.
Figure 112007093098820-PCT00026
이렇게 본 변형예에서는, 에일리어싱 노이즈가 발생하지 않도록 채널 확대부(130)에서 연산 계수인 행렬 R1, R2가 직접적으로 조정되므로, 채널 확대부(130)의 후단에서 채널의 수만큼 노이즈 제거부를 설치하는 것에 비해, 대단히 적은 처리량으로 에일리어싱 노이즈가 억제되어, 작은 회로 규모 또는 프로그램 사이즈의 오디오 디코더가 실현된다.
(변형예 2)
여기서 본 실시형태에 있어서의 제2 변형예에 대해 설명한다.
상기 실시형태에서는 주파수 대역 신호의 모든 주파수 대역에서 실수를 사용했으나, 본 변형예에서는 주파수 대역 신호 중 저주파수 대역에서는 복소수를 사용한다. 즉, 본 변형예에서는 주파수 대역 신호 중 일부에 대해서만 실수를 사용한다.
도 12는, 본 변형예에 따른 멀티 채널 합성부의 상세한 구성을 도시한 블록도이다.
본 변형예에 따른 멀티 채널 합성부(103b)는, 분석 필터 뱅크(110a)와, 채널 확대부(130b)와, 합성 필터 뱅크(140a)를 구비하고 있다.
분석 필터 뱅크(110a)는, 다운 믹스 신호를 시간/주파수 하이브리드 표현으로 변환하여 제1 주파수 대역 신호 x로서 출력하는 것이며, 상술한 실수 QMF부(111)와, 복소 Nyq부(112a)를 구비하고 있다.
복소 Nyq부(112a)는 복소 계수의 나이키스트 필터 뱅크로서 구성되어 있으며, 실수 QMF부(111)에서 생성된 제1 주파수 대역 신호 x의 저주파수 대역에 있어서, 복소계수의 나이키스트 필터에 의해 그 제1 주파수 대역 신호 x를 수정한다.
이렇게 분석 필터 뱅크(110a)는, 저역 주파수 대역이 부분적으로 실수로 표현되는 제1 주파수 대역 신호 x를 생성해 출력한다.
채널 확대부(130b)는, 상술한 프리 매트릭스 처리부(131), 포스트 매트릭스 처리부(132), 제1 연산부(133), 및 제2 연산부(134)와, 부분적 실수 무상관 처리 부(135a)를 구비하고 있다.
부분적 실수 무상관 처리부(135a)는, 부분적으로 실수로 표현되는 제1 주파수 대역 신호 x에 의거해 제1 연산부(133)로부터 출력된 중간 신호 v에 대해, 올 패스 필터 처리를 실시함으로써 무상관 신호 w를 생성해 출력한다.
합성 필터 뱅크(140a)는, 채널 확대부(130b)로부터 출력된 출력 신호 y의 표현 형식을 시간/주파수 하이브리드 표현에서 시간 표현으로 변환하는 것으로서, 상술한 실수 IQMF부(142)와, 복소INyq부(141a)를 구비하고 있다. 복소 INyq부(141a)는 복소 계수의 역 나이키스트 필터이며, 저역 주파수 대역에서 복소수의 제1 주파수 대역 신호 x를 생성한다. 그리고, 실수 IQMF부(142)는, 복소 INyq부(141a)에 의한 처리 결과에 대해, 실수 계수의 역 QMF에 의한 합성 필터 처리에 의해 멀티 채널의 시간 신호를 출력한다.
이렇게 본 변형예에서는, 저주파수 대역에서는 복소수인 채로 처리되게 되므로, 높은 대역 분해능을 유지하면서 연산량이 억제되어, 음질 향상과 회로 규모의 삭감 양쪽을 균형있게 달성할 수 있다.
(변형예 3)
여기서 본 실시형태에 있어서의 제3 변형예에 대해 설명한다.
본 변형예에 따른 멀티 채널 합성부는, 상기 변형예 1 및 변형예 2의 특징을 겸비하고 있다.
도 13은, 본 변형예에 따른 멀티 채널 합성부의 상세한 구성을 도시한 블록도이다.
본 변형예에 따른 멀티 채널 합성부(103c)는, 변형예 2의 분석 필터 뱅크(110a)와, 채널 확대부(130c)와, 변형예 2의 합성 필터 뱅크(140a)를 구비하고 있다.
채널 확대부(130c)는, 변형예 1의 EQ부(136a, 136b)와, 변형예 2의 부분적 실수 무상관 처리부(135a)를 구비하고 있다.
즉, 본 변형예에 따른 멀티 채널 합성부(103c)는, 프리 매트릭스 처리부(131)에서 생성된 행렬 R1을 이퀄라이즈함과 더불어, 포스트 매트릭스 처리부(132)에서 생성된 행렬 R2를 이퀄라이즈한다. 또한, 본 변형예에 따른 멀티 채널 합성부(103c)는 주파수 대역 신호 중 일부에 대해서만 실수를 사용한다.
(변형예 4)
여기서 본 실시형태에 있어서의 제4 변형예에 대해 설명한다.
상기 실시형태에 있어서의 TD부(120) 및 EQ부(136)는 서로 인접하는 파라미터 밴드로 공간 파라미터 p(b)를 평균화하고, 본 변형예에 따른 TD부(120) 및 EQ부(136)는 복수의 연속하는 파라미터 밴드로 이루어지는 그룹으로 공간 파라미터 p(b)를 평균화한다.
도 14는, 본 변형예에 따른 TD부(120) 및 EQ부(136)의 동작을 도시한 흐름도이다.
우선 TD부(120)는, 파라미터 밴드 b=0, 카운트치 cnt=0 및 평균치 ave=0을 초기 설정한다(단계 S1100). 그리고 TD부(120)는, 파라미터 밴드 b가 (ParamBand- 1)에 도달했는지 아닌지, 즉 파라미터 밴드 b가 나타내는 밴드가 마지막에서 두번째의 밴드인지 아닌지를 판별한다(단계 S1101).
여기서 TD부(120)는 (ParamBand-1)에 도달했다고 판별했을 때는(단계 S1101의 yes), 에일리어싱 노이즈 검출의 처리를 종료한다. 한편, (ParamBand-1)에 도달하지 않았다고 판별했을 때는(단계 S1101의 no), TD부(120)는, 또한 그 평균 토낼리티 GT'(b)가 미리 정해진 임계치 TH3보다도 큰지 아닌지를 판별한다(단계 S1102).
TD부(120)는, 임계치 TH3보다도 크다고 판별했을 때는(단계 S1102의 yes), 에일리어싱 노이즈의 발생 가능성이 있다는 것을 검출해, 그 검출 결과를 EQ부(136)에 통지한다.
EQ부(136)는 그 검출 결과의 통지를 받으면, 파라미터 밴드 b의 공간 파라미터 p(b)를 평균치 ave에 가산해 그 평균치 ave를 갱신하고, 카운트치 cnt를 1만큼 증가시킨다(단계 S1103). 그리고, TD부(120)는 파라미터 밴드 b의 값을 1만큼 증가시키고(단계 S1108), 단계 S1101부터의 동작을 반복 실행한다.
이렇게 연속하는 각 파라미터 밴드 b에 있어서의 평균 토낼리티 GT'(b)가 임계치 TH3보다도 큰 경우에는, 그 각 파라미터 밴드 b의 공간 파라미터 p(b)가 적산된다.
한편, TD부(120)는 평균 토낼리티 GT'(b)가 임계치 TH3 이하라고 판별했을 때는(단계 S1102의 no), 또한 현재의 카운트치 cnt가 1보다 큰지 아닌지를 판별한다(단계 S1104). TD부(120)는, 카운트치 cnt가 1보다도 크다고 판별하면(단계 S1104의 yes), 평균치 ave를 그 카운트치 cnt로 제산하여 그 평균치 ave를 갱신한다(단계 S1106). 그리고, TD부(120)는 그 갱신된 평균치 ave를 EQ부(136)에 통지한다.
EQ부(136)는, (b-cnt)부터 (b-1)의 범위의 파라미터 밴드 i의 공간 파라미터 p(i)가 TD부(120)로부터 통지된 평균치 ave가 되도록, 그들의 공간 파라미터 p(i)를 갱신한다(단계 S1107).
TD부(120)는, 카운트치 cnt가 1 이하라고 판별하면(단계 S1104의 no), 또는 EQ부(136)가 상술한 바와 같이 단계 S1107에서 공간 파라미터 p(i)를 갱신하면, 카운트치 cnt 및 평균치 ave를 0으로 설정한다(단계 S1105). 그리고, TD부(120)는 단계 S1108부터의 동작을 반복 실행한다.
이렇게 본 변형예에서는, 임계치 TH3보다도 큰 평균 토낼리티 GT'(b)를 갖는 연속한 파라미터 밴드로 이루어지는 그룹에서, 공간 파라미터 p(b)가 평균화된다.
또한, 상기 실시형태 및 그 변형예에 있어서의 오디오 디코더의 전체 또는 일부의 구성요소는, LSI(Large Scale Integration) 등의 집적회로로서 실현할 수 있음과 더불어, 그 처리 동작을 컴퓨터에 실행시키는 프로그램으로서도 실현할 수 있다.
본 발명의 오디오 디코더는, 에일리어싱 노이즈의 발생을 억제하면서 연산량을 경감할 수 있다는 효과를 발휘하고, 특히, 방송 등의 저 비트 레이트의 응용에 있어서 유용하여, 예를 들면 홈시어터 시스템, 차재(車載) 음향 시스템 및 전자 게 임 시스템 등에 적용 가능하다.

Claims (11)

  1. N(N≥2)채널의 오디오 신호를 다운믹스해 얻어지는 다운믹스 신호를 부호화한 제1 부호화 데이터와, 상기 다운믹스 신호를 원래의 N채널의 오디오 신호로 복원하기 위한 파라미터를 부호화한 제2 부호화 데이터로 이루어지는 비트 스트림을 디코드하여, N채널의 오디오 신호를 생성하는 오디오 디코더로서,
    상기 제1 부호화 데이터로부터, 상기 다운믹스 신호에 대한 제1 주파수 대역 신호를 생성하는 주파수 대역 신호 생성 수단과,
    상기 제2 부호화 데이터를 사용해, 상기 주파수 대역 신호 생성 수단에서 생성된 제1 주파수 대역 신호를, N채널의 오디오 신호에 대한 제2 주파수 대역 신호로 변환하는 채널 확대 수단과,
    상기 채널 확대 수단에서 생성된 N채널의 제2 주파수 대역 신호를 대역 합성함으로써, 시간축 상의 N채널의 오디오 신호로 변환하는 대역 합성 수단과,
    상기 제1 주파수 대역 신호에 있어서의 에일리어싱(aliasing) 노이즈의 발생을 검출하는 에일리어싱 노이즈 검출 수단을 구비하고,
    상기 채널 확대 수단은 또한, 상기 에일리어싱 노이즈 검출 수단에서 검출된 정보에 의거해, 상기 제2 주파수 대역 신호에 에일리어싱 노이즈가 포함되는 것을 방지하는 것을 특징으로 하는 오디오 디코더.
  2. 청구항 1에 있어서,
    상기 주파수 대역 신호 생성 수단은, 상기 제1 주파수 대역 신호 중 적어도 일부의 주파수 대역에 대해서는, 실수로 표현되는 상기 제1 주파수 대역 신호를 생성하고,
    상기 에일리어싱 노이즈 검출 수단은, 상기 제1 주파수 대역 신호가 실수로 표현되는 것에 기인하여 발생하는 에일리어싱 노이즈의 발생을 검출하는 것을 특징으로 하는 오디오 디코더.
  3. 청구항 2에 있어서,
    상기 주파수 대역 신호 생성 수단은, 소정의 주파수 대역의 대역 분해능을 높이기 위한 나이키스트 필터 뱅크를 갖고, 상기 나이키스트 필터 뱅크가 처리하는 주파수 대역에 대해서는 복소수로 표현되는 주파수 대역 신호를 생성하고, 상기 나이키스트 필터 뱅크가 처리하지 않는 주파수 대역에 대해서는 실수로 표현되는 주파수 대역 신호를 생성하는 것을 특징으로 하는 오디오 디코더.
  4. 청구항 2에 있어서,
    상기 에일리어싱 노이즈 검출 수단은, 상기 제1 주파수 대역 신호에 있어서, 강한 주파수 성분이 지속되는 상태인 톤(tone)성이 강한 신호가 존재하는 주파수 대역을 검출하고,
    상기 채널 확대 수단은, 상기 에일리어싱 노이즈 검출 수단에서 검출된 주파수 대역에 인접하는 주파수 대역의 신호 레벨을 조정한 상기 제2 주파수 대역 신호 를 출력하는 것을 특징으로 하는 오디오 디코더.
  5. 청구항 4에 있어서,
    상기 제2 부호화 데이터는, 원래의 N채널의 오디오 신호간의 레벨비와 위상차를 포함하는 공간 파라미터를 부호화한 데이터이며,
    상기 채널 확대 수단은,
    상기 제1 주파수 대역 신호와, 상기 제1 주파수 대역 신호로부터 생성된 무상관 신호를, 상기 공간 파라미터로부터 생성된 연산 계수에 따른 비율로 혼합함으로써 상기 제2 주파수 대역 신호를 생성하는 연산 수단과,
    상기 에일리어싱 노이즈 검출 수단에 의해 검출된 주파수 대역에 인접하는 주파수 대역에 대해, 상기 연산 계수를 조정함으로써 상기 신호 레벨을 조정하는 조정 모듈을 구비하는 것을 특징으로 하는 오디오 디코더.
  6. 청구항 5에 있어서,
    상기 연산 수단은,
    상기 공간 파라미터에 포함되는 레벨비로부터 도출되는 스케일링 계수를 상기 연산 계수의 일부로서 사용해, 상기 제1 주파수 대역 신호를 스케일링함으로써 중간 신호를 생성하는 프리 매트릭스 모듈과,
    상기 프리 매트릭스 모듈에서 생성된 중간 신호에 대해 올 패스 필터의 처리를 실시함으로써 무상관 신호를 생성하는 무상관 모듈과,
    상기 공간 파라미터에 포함되는 위상차로부터 도출되는 믹싱 계수를 상기 연산 계수의 일부로서 사용해, 상기 제1 주파수 대역 신호와 상기 무상관 신호를 혼합하는 포스트 매트릭스 모듈을 구비하고,
    상기 조정 모듈은, 상기 공간 파라미터를 조정함으로써 상기 연산 계수를 조정하는 것을 특징으로 하는 오디오 디코더.
  7. 청구항 5에 있어서,
    상기 조정 모듈은, 상기 에일리어싱 노이즈 검출 수단이 검출한 주파수 대역과 상기 주파수 대역에 인접하는 주파수 대역에 대한 상기 스케일링 계수를 이퀄라이즈함으로써 상기 연산 계수를 조정하는 이퀄라이저를 갖는 것을 특징으로 하는 오디오 디코더.
  8. 청구항 5에 있어서,
    상기 조정 모듈은, 상기 에일리어싱 노이즈 검출 수단이 검출한 주파수 대역과 상기 주파수 대역에 인접하는 주파수 대역에 대한 상기 믹싱 계수를 이퀄라이즈함으로써 상기 연산 계수를 조정하는 이퀄라이저를 갖는 것을 특징으로 하는 오디오 디코더.
  9. 청구항 6에 있어서,
    상기 조정 모듈은, 상기 에일리어싱 노이즈 검출 수단이 검출한 주파수 대역 과 상기 주파수 대역에 인접하는 주파수 대역에 대한 상기 공간 파라미터를 이퀄라이즈하는 이퀄라이저를 갖는 것을 특징으로 하는 오디오 디코더.
  10. 청구항 7 내지 9 중 어느 한 항에 있어서,
    상기 이퀄라이저는, 이퀄라이즈의 대상이 되는 각 요소를 상기 각 요소의 평균치로 치환함으로써 상기 이퀄라이즈를 행하는 것을 특징으로 하는 오디오 디코더.
  11. N(N≥2)채널의 오디오 신호를 다운믹스해 얻어지는 다운믹스 신호를 부호화한 제1 부호화 데이터와, 상기 다운믹스 신호를 원래의 N채널의 오디오 신호로 복원하기 위한 파라미터를 부호화한 제2 부호화 데이터로 이루어지는 비트 스트림을 디코드하여, N채널의 오디오 신호를 생성하는 오디오 신호의 복호 방법으로서,
    상기 제1 부호화 데이터로부터, 상기 다운믹스 신호에 대한 제1 주파수 대역 신호를 생성하는 주파수 대역 신호 생성 단계와,
    상기 제2 부호화 데이터를 사용해, 상기 주파수 대역 신호 생성 단계에서 생성된 제1 주파수 대역 신호를, N채널의 오디오 신호에 대한 제2 주파수 대역 신호로 변환하는 채널 확대 단계와,
    상기 채널 확대 단계에서 생성된, N채널의 제2 주파수 대역 신호를 대역 합성함으로써 시간축 상의 N채널의 오디오 신호로 변환하는 대역 합성 단계와,
    상기 제1 주파수 대역 신호에 있어서의 에일리어싱 노이즈의 발생을 검출하 는 에일리어싱 노이즈 검출 단계를 포함하고,
    상기 채널 확대 단계에서는 또한, 상기 에일리어싱 노이즈 검출 단계에서 검출된 정보에 의거해, 상기 제2 주파수 대역 신호에 에일리어싱 노이즈가 포함되는 것을 방지하는 것을 특징으로 하는 오디오 신호의 복호 방법.
KR1020077030265A 2005-07-15 2006-07-11 오디오 디코더 KR101212900B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JPJP-P-2005-00207754 2005-07-15
JPJP-P-2005-00207693 2005-07-15
JP2005207754 2005-07-15
JP2005207693 2005-07-15

Publications (2)

Publication Number Publication Date
KR20080033909A true KR20080033909A (ko) 2008-04-17
KR101212900B1 KR101212900B1 (ko) 2012-12-14

Family

ID=37668667

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020077030265A KR101212900B1 (ko) 2005-07-15 2006-07-11 오디오 디코더

Country Status (7)

Country Link
US (1) US8081764B2 (ko)
EP (1) EP1906706B1 (ko)
JP (1) JP4944029B2 (ko)
KR (1) KR101212900B1 (ko)
CN (1) CN101223821B (ko)
DE (1) DE602006010712D1 (ko)
WO (1) WO2007010785A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2625939C2 (ru) * 2012-10-05 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8208641B2 (en) 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US8285556B2 (en) * 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
JP2010518460A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
WO2008102527A1 (ja) * 2007-02-20 2008-08-28 Panasonic Corporation マルチチャンネル復号装置、マルチチャンネル復号方法、プログラム及び半導体集積回路
WO2008114984A1 (en) 2007-03-16 2008-09-25 Lg Electronics Inc. A method and an apparatus for processing an audio signal
ES2593822T3 (es) 2007-06-08 2016-12-13 Lg Electronics Inc. Método y aparato para procesar una señal de audio
US8200959B2 (en) 2007-06-28 2012-06-12 Cisco Technology, Inc. Verifying cryptographic identity during media session initialization
US8417942B2 (en) 2007-08-31 2013-04-09 Cisco Technology, Inc. System and method for identifying encrypted conference media traffic
US20090169001A1 (en) * 2007-12-28 2009-07-02 Cisco Technology, Inc. System and Method for Encryption and Secure Transmission of Compressed Media
US8837598B2 (en) * 2007-12-28 2014-09-16 Cisco Technology, Inc. System and method for securely transmitting video over a network
US8374854B2 (en) * 2008-03-28 2013-02-12 Southern Methodist University Spatio-temporal speech enhancement technique based on generalized eigenvalue decomposition
JP5383676B2 (ja) * 2008-05-30 2014-01-08 パナソニック株式会社 符号化装置、復号装置およびこれらの方法
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
RU2011130551A (ru) * 2008-12-22 2013-01-27 Конинклейке Филипс Электроникс Н.В. Формирование выходного сигнала посредством обработки сенд-эффектов
JP5299327B2 (ja) * 2010-03-17 2013-09-25 ソニー株式会社 音声処理装置、音声処理方法、およびプログラム
JP2013007944A (ja) * 2011-06-27 2013-01-10 Sony Corp 信号処理装置、信号処理方法、及び、プログラム
WO2013120531A1 (en) * 2012-02-17 2013-08-22 Huawei Technologies Co., Ltd. Parametric encoder for encoding a multi-channel audio signal
US9258645B2 (en) * 2012-12-20 2016-02-09 2236008 Ontario Inc. Adaptive phase discovery
TWI618051B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置
JP6046274B2 (ja) 2013-02-14 2016-12-14 ドルビー ラボラトリーズ ライセンシング コーポレイション 上方混合されたオーディオ信号のチャネル間コヒーレンスの制御方法
WO2014126688A1 (en) 2013-02-14 2014-08-21 Dolby Laboratories Licensing Corporation Methods for audio signal transient detection and decorrelation control
TWI618050B (zh) 2013-02-14 2018-03-11 杜比實驗室特許公司 用於音訊處理系統中之訊號去相關的方法及設備
EP2830060A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Noise filling in multichannel audio coding
MY179448A (en) * 2014-10-02 2020-11-06 Dolby Int Ab Decoding method and decoder for dialog enhancement
US9413388B1 (en) * 2015-01-30 2016-08-09 Dell Products L.P. Modified huffman decoding
CN108786118B (zh) * 2017-05-03 2021-08-31 宏碁股份有限公司 音频集线器
JP6693551B1 (ja) * 2018-11-30 2020-05-13 株式会社ソシオネクスト 信号処理装置および信号処理方法
CN116806000B (zh) * 2023-08-18 2024-01-30 广东保伦电子股份有限公司 一种多通道任意扩展的分布式音频矩阵

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0810926B2 (ja) * 1988-04-15 1996-01-31 三洋電機株式会社 Museデコーダ及びサブサンプル映像信号復調装置
EP0883107B9 (en) * 1996-11-07 2005-01-26 Matsushita Electric Industrial Co., Ltd Sound source vector generator, voice encoder, and voice decoder
US5890125A (en) 1997-07-16 1999-03-30 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US7289626B2 (en) * 2001-05-07 2007-10-30 Siemens Communications, Inc. Enhancement of sound quality for computer telephony systems
US7069212B2 (en) * 2002-09-19 2006-06-27 Matsushita Elecric Industrial Co., Ltd. Audio decoding apparatus and method for band expansion with aliasing adjustment
JP3762375B2 (ja) 2003-02-21 2006-04-05 ヤマト科学株式会社 プラズマ滅菌装置
JP4936894B2 (ja) 2004-08-27 2012-05-23 パナソニック株式会社 オーディオデコーダ、方法及びプログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2625939C2 (ru) * 2012-10-05 2017-07-19 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Кодер, декодер и способы для зависимого от сигнала преобразования масштаба при пространственном кодировании аудиообъектов
US9734833B2 (en) 2012-10-05 2017-08-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder and methods for backward compatible dynamic adaption of time/frequency resolution spatial-audio-object-coding
US10152978B2 (en) 2012-10-05 2018-12-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoder, decoder and methods for signal-dependent zoom-transform in spatial audio object coding

Also Published As

Publication number Publication date
JP4944029B2 (ja) 2012-05-30
EP1906706A1 (en) 2008-04-02
EP1906706A4 (en) 2008-11-12
WO2007010785A1 (ja) 2007-01-25
US20100235171A1 (en) 2010-09-16
CN101223821A (zh) 2008-07-16
EP1906706B1 (en) 2009-11-25
KR101212900B1 (ko) 2012-12-14
JPWO2007010785A1 (ja) 2009-01-29
DE602006010712D1 (de) 2010-01-07
CN101223821B (zh) 2011-12-07
US8081764B2 (en) 2011-12-20

Similar Documents

Publication Publication Date Title
KR101212900B1 (ko) 오디오 디코더
JP4918490B2 (ja) エネルギー整形装置及びエネルギー整形方法
KR101277041B1 (ko) 멀티 채널 음향 신호 처리 장치 및 방법
JP4603037B2 (ja) マルチチャネルオーディオ信号を表示するための装置と方法
KR101629862B1 (ko) 파라메트릭 스테레오 업믹스 장치, 파라메트릭 스테레오 디코더, 파라메트릭 스테레오 다운믹스 장치, 파라메트릭 스테레오 인코더
CN105518775B (zh) 使用自适应相位校准的多声道降混的梳型滤波器的伪迹消除
WO2011013381A1 (ja) 符号化装置および復号装置
JP2012177939A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP7201721B2 (ja) 相関分離フィルタの適応制御のための方法および装置
TWI566237B (zh) 使用物件特定之時間/頻率解析度以自混合信號分離音訊物件之技術
WO2009131066A1 (ja) 信号分析制御及び信号制御のシステム、装置、方法及びプログラム
JP2007178684A (ja) マルチチャンネルオーディオ復号装置
JP2006337767A (ja) 低演算量パラメトリックマルチチャンネル復号装置および方法
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
JP2007187749A (ja) マルチチャンネル符号化における頭部伝達関数をサポートするための新装置
JP2007025290A (ja) マルチチャンネル音響コーデックにおける残響を制御する装置
JPWO2009087923A1 (ja) 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム
CN116406471A (zh) 包括主要输入声道和两个或更多个经缩放的非主要输入声道的下混合的多声道音频信号的编码

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151118

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20161123

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20171114

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20181121

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20191119

Year of fee payment: 8