KR20020027364A - 디코더 상용성의 손실이 없는 설정된 비트수 저감 오디오코딩 시스템의 음질 개선 - Google Patents

디코더 상용성의 손실이 없는 설정된 비트수 저감 오디오코딩 시스템의 음질 개선 Download PDF

Info

Publication number
KR20020027364A
KR20020027364A KR1020017016475A KR20017016475A KR20020027364A KR 20020027364 A KR20020027364 A KR 20020027364A KR 1020017016475 A KR1020017016475 A KR 1020017016475A KR 20017016475 A KR20017016475 A KR 20017016475A KR 20020027364 A KR20020027364 A KR 20020027364A
Authority
KR
South Korea
Prior art keywords
core
signal
audio
extension
encoder
Prior art date
Application number
KR1020017016475A
Other languages
English (en)
Other versions
KR100606992B1 (ko
Inventor
유유리
스미스윌리암폴
페조조란
스미스스테판
Original Assignee
윌리암 네이버즈
디지탈 씨어터 시스템즈, 인코포레이티드
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윌리암 네이버즈, 디지탈 씨어터 시스템즈, 인코포레이티드 filed Critical 윌리암 네이버즈
Publication of KR20020027364A publication Critical patent/KR20020027364A/ko
Application granted granted Critical
Publication of KR100606992B1 publication Critical patent/KR100606992B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B14/00Transmission systems not characterised by the medium used for transmission
    • H04B14/02Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
    • H04B14/04Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
    • H04B14/046Systems or methods for reducing noise or bandwidth
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/12Formatting, e.g. arrangement of data block or words on the record carriers
    • G11B20/1217Formatting, e.g. arrangement of data block or words on the record carriers on discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/30Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording
    • G11B27/3027Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on the same track as the main recording used signal is digitally coded

Abstract

본 발명에 따르면 이전에 개발된 기술과 상용성을 유지하는 동시에 기존의 기술과 비교하여 샘플링 주파수의 범위가 확장되고 및/또는 노이즈 플로어를 낮춘 다중 채널 오디오 압축 기술이 제공된다. 높은 샘플링 주파수의 다중 채널 오디오(12)는 기존의 샘플링 주파수에 이르기까지 코어 오디오에 분해되고, 차세대 기술의 샘플링 주파수에 이르기까지 차동 신호에 분해된다. 상기 코어 오디오는 DTS, 돌비 AC-3 또는 MPEG I 또는 II와 같은 제1 세대 기술을 사용하여 엔코드(18)되어 엔코드된 코어 비트 스트림(20)은 시장의 유사한 디코더와 완벽하게 상용된다. 상기 차동 신호(34)는 샘플링 주파수를 확장하고 및/또는 코어 오디오의 질을 개선한 기술을 사용하여 엔코드(36)된다. 압축된 차동 신호(38)는 확장부분으로서 상기 코어 비트 스트림(20)에 첨부된다. 상기 확장 데이터는 제1 세대 디코더에 의해서는 무시될 수 있지만 제2 세대 디코더에 의해서는 디코드될 수 있다. 디코드된 코어 오디오 신호 및 확장 오디오 신호를 서로 가산함으로써(28), 제2 세대 디코더는 오디오 신호 대역폭을 효율적으로 확장할 수 있고 및/또는 코어 디코더만을 사용해 개선할 수 있는 것 이상으로 신호 대 잡음비를 개선할 수 있다.

Description

디코더 상용성의 손실이 없는 설정된 비트수 저감 오디오 코딩 시스템의 음질 개선{IMPROVING SOUND QUALITY OF ESTABLISHED LOW BIT-RATE AUDIO CODING SYSTEMS WITHOUT LOSS OF DECODER COMPATIBILITY}
다수의 비트수 저감 오디오 코딩 시스템이 현재 소비자 및 전문가용 오디오 재생 제품 및 서비스의 넓은 범위에 사용되고 있다. 예컨대, 돌비 AC3(돌비 디지털) 오디오 코딩 시스템은 640 kbit/s 에 이르는 비트 레이트를 사용하는 레이저 디스크, NTSC 코딩 DVD 영상, ATV 를 위한 스테레오 및 5.1 채널 오디오 사운드 트랙의 세계 표준이다. MPEG I 및 MPEG II 오디오 코딩 표준은 PAL 엔코드 DVD 영상, 유럽의 지상 디지털 무선 방송 및 미국의 위성 방송을 위한 스테레오 및 다중 채널 사운드 트랙 엔코딩을 768kbit/s 에 이르는 비트 레이트에서 실행하는데 폭넓게 사용된다. DTS(Digital theater systems) 응집성 음향 오디오 코딩 시스템(Coherent Acoustics audio coding system)은 컴팩트 디스크, DVD 영상 및 레이저 디스크, 1,536kbit/s에 이르는 비트 레이트를 위한 스튜디오 품질 5.1 채널 오디오 사운드트랙에 빈번하게 사용된다.
이들 시스템의 주된 문제점은 이들이 높은 PCM 샘플링 주파수, PCM 워드 길이 또는 높은 시스템 비트 레이트에 적응하도록 쉽게 개량될 수 없는 그들 설계의 비융통성이다. 음악 및 영화 산업이 44.1 kHz 샘플링 주파수 및 16 비트 워드 길이의 구식 컴팩트 디스크 디지털 오디오 포맷을 버리고, 96 kHz 샘플링 및 24비트 워드 길이의 새로운 DVD 오디오 PCM 지배 포맷을 채택함에 따라, 이것은 앞으로 중요한 논점이 될 것이다.
결과적으로, AC-3, MPEG, DTS와 같은 기존의 오디오 엔코딩 시스템을 사용하는 오디오 배달은 이러한 증가된 신호 충실도의 이익을 소비자에게 전달하도록 채택되어야한다. 불행하게도, 이들 디코더 기능을 실행하는 오디오 디코더 처리칩(DSPs)의 대규모로 설치된 베이스가 기존의 소비자 베이스에 이미 존재한다. 이들 디코더는 샘플링 속도, 워드 크기, 또는 비트 레이트 증가에 적응하도록 쉽게 개량될 수 없다. 따라서, 이러한 매체들을 통해 제품을 판매하는 음악 및 영화 콘텐츠 공급자들은 구식 표준을 따르는 코딩된 오디오 스트림을 계속 공급하려할 것이다. 이것은 미래에는 DVD 오디오, ATV, 위성 라디오 등과 같은 배달 매체가 각기 다른 표준을 따르는 다수의 비트 스트림을 배달하게될 수 있다는 것을 암시한다. 예컨대, 기존의 재생 시스템의 소유자가 표준 오디오 트랙을 수신 또는 실행하도록 하기 위해 하나의 스트림이 포함될 수 있는 한편, 새로운 장비의 소유자가 96kHz/24 비트 PCM 포맷을 사용하여 엔코드된 오디오 트랙을 실행하고 고유의 높은 충실도의 이점을 취할 수 있도록 제2 스트림이 또한 존재할 수 있다.
이 배달 방법의 문제점은 다수의 재생 매체들이 부가적인 오디오 스트림을 보내는데 필요한 여분의 대역폭 또는 채널 용량을 제공할 수 없다는 것이다. 부가적인 비트 스트림의 비트 레이트(예컨대, 96kHz/24 비트를 지원하는 비트 레이트)는 구식 포맷이 지원하는 비트 레이트와 적어도 같거나 더 클 것이다. 그러므로, 비트 레이트는 둘 이상의 오디오 표준을 지원하기 위해, 아마 두 배 또는 그 이상이 될 것이다.
본 발명은 비트수 저감 오디오 코딩 시스템(low bit-rate audio coding system)에 관한 것으로 더 상세하게는 디코더 상용성의 손실이 없이 설정된 비트수 저감 오디오 코딩 시스템의 음질을 개선하는 방법에 관한 것이다.
도 1은 예전 방법으로 코딩하기 위해 베이스 및 고주파 대역을 분리하는데 사용된 2-대역 데시메이션 필터 뱅크(filterbank)의 주파수 응답 그래프.
도 2는 본 발명의 일반화된 코어 더하기 확장 구조를 채용한 엔코더의 블록도.
도 3a 및 도 3b는 각각, 입력 오디오 및 코딩된 코어 및 차동 신호의 주파수스펙트럼 그래프.
도 4는 코어 더하기 확장 오디오 데이터의 단일 프레임에 대한 비트 스트림 포맷을 예시하는 도면.
도 5a 및 도 5b는 각각, 디코더에 단일 비트 스트림을 배달하기 위한 물리적인 매체 및 방송 시스템을 예시하는 도면.
도 6은 도 2에 도시한 코어 더하기 확장 코더에 순응하는 디코더의 블록도.
도 7은 다중 톤 시험 신호를 위한 재구성된 오디오 신호의 주파수 스펙트럼 그래프.
도 8a 및 도 8b는 각각, 고분해능 확장 구조를 구현한 엔코더 및 디코더의 블록도.
도 9는 고분해능 확장 구조에 대한 차동 신호의 주파수 스펙트럼 그래프.
도 10은 고분해능 확장 구조에 대한 다중 톤 시험 신호를 위한 재구성된 오디오 신호의 주파수 스펙트럼 그래프.
도 11a 및 도 11b는 각각, 고주파 확장 구조를 구현한 엔코더 및 디코더의 블록도.
도 12는 고정된 비트 레이트에 대한 다중 톤 시험 신호를 위한 재구성된 오디오 신호의 주파수 스펙트럼 그래프.
도 13은 교류 고주파 확장 구조를 구현한 엔코더의 블록도.
도 14a 및 도 14b는 각각, 확장 엔코더 및 디코더의 블록도.
도 15a 및 도 15b는 각각, 서브 밴드(subband) 엔코더 및 디코더의 블록도.
도 16은 블랙 박스(black-box) 하드웨어 아키텍춰의 블록도.
도 17은 직렬 입력으로부터 제1 프로세서의 온칩 메모리로의 데이터 흐름을 예시한 도면.
도 18은 제1 프로세서의 온칩 메모리로부터 직렬 포트로의 데이터 흐름을 예시한 도면.
도 19는 제1 프로세서의 온칩 메모리로부터 제2 프로세서의 온칩 메모리로의 데이터 흐름을 예시한 도면.
도 20은 제2 프로세서의 온칩 메모리로부터 제1 프로세서의 온칩 메모리로의 데이터 흐름을 예시한 도면.
도 21a 및 도 21b는 각각, 오픈 박스(open-box) 엔코더 및 디코더의 블록도.
도 22a 및 도 22b는 각각, 다른 오픈 박스(open-box) 엔코더 및 디코더의 블록도.
상기 문제점을 고려하여, 본 발명은 복제 오디오 데이터를 배달을 회피하는 한편, 주파수 영역을 확장하고 노이즈 플로어(Noise Floor)를 낮추는 코딩 방법론을 제공하고, 그럼으로 해서 PCM 샘플링 주파수, 워드 길이, 코딩 비트 레이트의 변화에 적응하는데 더욱 효과가 있다.
이것은 전통적인 오디오 코딩 알고리즘이 "코어" 오디오 코더를 구성하고, 나머지는 변경되지 않는 "코어" 더하기 "확장" 코딩 방법론으로 성취될 수 있다. 오디오 데이터는 (높은 샘플링 속도의 경우) 높은 오디오 주파수 또는 (긴 워드 길이의 경우) 높은 샘플링 분해능, 또는 모두를 나타낼 필요가 있고, "확장" 스트림으로서 전송된다. 이것은 오디오 콘텐츠 공급자가 소비자 장비 베이스에 내재하는 다른 형태의 디코더와 상용되는 단일 오디오 비트 스트림을 포함하도록 할 수 있다. 코어 스트림은 확장 데이터를 무시하는 구식 디코더에 의해 디코드될 것이고, 한편 높은 품질의 음(音) 재생을 제공하는 새로운 디코더는 코어 및 확장 데이터 스트림 모두에 사용될 수 있다.
시스템의 주요 특징은 확장 데이터가 원래의 "고 충실도" 입력 신호로부터 (엔코드/디코드되거나 및/또는 다운샘플링/업샘플링된)재구성된 코어 신호를 차감함으로써 발생된다는 것이다. 결과적인 차동 신호는 엔코드되어 확장 스트림을 생성한다. 이러한 기법으로, 코어 또는 확장 신호 안으로의 에일리어싱 폴드 백(aliasing fold-back)을 회피한다. 그러므로, 코어 오디오의 질은 확장 스트림을 포함해도 영향을 받지 않는다. 이 시스템의 가장 기본적인 모드에서 작동하는 시스템에 대하여, 코어 디코더의 대기 또는 지연만이 알려질 필요가 있다. 그러므로, 이 방법은 코더의 내부 알고리즘 또는 실행 상세의 지식 없이도 임의의 오디오 코딩 시스템에 성공적으로 공급될 수 있다. 그러나, 상기 시스템은 확장 코더가 코어 신호의 주파수 범위에 걸쳐 코어 코더에 매칭되도록 설계된다면, 더 효율적으로 동작하도록 만들어질 수 있다.
본 발명의 이러한 특징 및 다른 특징 그리고 이점은 본 기술분야의 당업자들에게는 첨부된 도면과 함께 이어지는 상세한 설명의 바람직한 실시예로부터 명백하게 될 것이다.
본 발명은 오디오 콘텐츠 공급자가 소비자 베이스에 존재하는 다른 형태의 디코더와 상용되는 단일 오디오 비트 스트림을 포함할 수 있도록 하는 고충실도 신호 코딩을 위한 "코어" 더하기 "확장" 코딩 방법론을 규정한다. 코어 비트 스트림은 확장 데이터를 무시하는 구식 디코더에 의해 디코드될 수 있고, 한편, 새로운 디코더는 고품질 재생을 제공하는 코어 및 확장 데이터 모두를 사용할 수 있다. 이러한 방법은 그들의 기존의 디코더를 고수하려는 기존의 소비자 베이스 및 고충실도 신호를 재생하기에 적합한 새로운 디코더를 구매하려는 소비자 베이스 모두를충족할 것이다.
차세대 엔코더와 기존의 디코더의 상용성을 유지하려는 방식으로 고충실도 오디오를 엔코딩하려는 원래 개념은 발명자가 스미스(Smyth)등이고 발명의 명칭이 "A MULTI-CHANNEL PREDICTIVE SUBBAND AUDIO CODER USING PSYCHOACOUSTIC ADAPTIVE BIT ALLOCATION IN FREQUENCY, TIME AND OVER THE MULTIPLE CHANNELS" 이며, 1996년 5월 2일 출원되고 양수인이 DTS Inc인 출원번호 제08/642,254호에 의해 개시되었다. 도 4a 및 도 4b에 도시된 바와 같이, 스미스 등의 오디오 스펙트럼은 대역당 24kHz의 오디오 대역폭을 제공하는 256 탭 2 대역 데시메이션(decimation) 프리필터 뱅크(pre-filiter bank)를 사용하여 최초 분할된다. 바닥 대역(0 - 24 kHz)은 분할되어 32개의 균일한 대역으로 엔코드된다, 상부 대역(24 - 48 kHz)은 분할되어 8개의 균일한 대역으로 엔코드된다.
엔코더의 동작을 반영하도록 설계된 새로운 디코더는 상부 및 바닥 대역 양자를 디코드하고 256 탭 2 대역 보간 필터 뱅크를 사용하여 고충실도 오디오 신호를 재구성한다. 상기 시스템은 바라는 전체 48 kHz 대역폭에 걸쳐 단일 이득 주파수 응답을 나타낸다.
전술한 고충실도 엔코딩 기술 이전에 존재한 구식 디코더들은 기저 대역 오디오 신호를 생성하기 위해 바닥 대역만을 디코드한다. 이런 점에서 상기 시스템은 기존의 디코더와 상용성을 유지한다. 그러나, 도 1에 도시한 바와 같이, 2 밴드 데시메이션 프리필터 뱅크의 주파수 응답(6)은 코어만 디코드된 때, 24kHz 주변에 에일리어싱 문제를 일으킨다. 바닥 및 상부 대역의 주파수 응답(8, 10)은 각각, 코어더하기 확장 코더에 단일 이득 응답을 제공하기 위해 그들의 개별적인 변화 영역의 24 kHz 에서 교차한다. 그러나, 코어만의 디코더에서 24 kHz 이상의 바닥 대역 주파수 응답(8) 부분은 아래로 에일리어싱된다. 결과적으로, 재구성된 기저 대역 오디오 신호는 구식의 기저 대역만의 코덱 시스템 내에서 발견하지 못한 타락도를 가질 것이다. 그러므로, 코딩 시스템은 기존의 디코더와 "진정한" 상용성을 유지할 수 없다. 더욱이, 이러한 방법은 많은 경우에 있어서 부최적화되는 상부 대역에 배치될 임의의 부가적인 비트를 강요한다.
일반화된 코어 더하기 확장 구조
엔코딩 및 디코딩을 위한 일반적인 과정이 도 2-7에 묘사되었다. 확장 비트 스트림(도 2 참조)을 생성하기 위해 아날로그 오디오(12)가 그 대역폭이 신호를 제한하는 아날로그 앤티 에일리어싱 LPF(14)에 공급된다. 대역이 제한된 신호는 분리된/디지털 오디오 신호(16)로 샘플링된다. LPF(14)의 차단 주파수는 나이키스트 판별 기준(Nyquist criteria)을 충족하기 위해 샘플링 속도의 반보다 느려야한다. 예컨대, 확장된 96 kHz 샘플링 속도에 대해 48 kHz의 차단 주파수가 적합하다.
디지털 오디오 신호(16)가 코어 디코더(18; AC3, MPEG, DTS 등)에 공급되고 각각의 비트 레이트에서 엔코드된다. 샘플링 속도 및 오디오 신호의 대역폭은 일부 경우에 있어서, 저역 통과 필터링 및 다운샘플링을 통해 코어 엔코더에 매칭되도록 조정될 필요가 있다. 간결하게 하기 위해 도면에 도시한 오디오 입력은 단일 채널 또는 다중 채널로 가정되었다. 다중 채널 입력의 경우, 감산 및 가산 과정은 각각의 채널에 대해 실행된다. 이 코어 비트 스트림(20)은 확장 데이터 생성 전에팩커(22; packer) 내에 유지된다. 상기 코어 비트 스트림은 또한 기존의 소비자 재생 장비 내에 존재하는 것들과 순응하는 코어 디코더(24)에도 공급된다.
결과적인 재구성된 코어 오디오 신호(26)는 다음으로 원래 입력 신호(16)의 지연된 변형(30)으로부터 차감(28)된다. 상기 지연(32)은 코어 엔코더/디코더 대기와 매칭되도록 만들어져서 디코드된 코어 오디오 및 입력 오디오 신호들의 정확한 시간 배열이 달성된다. 이 차동 신호(34)는 이제 코어 비트 스트림(20) 내에 코딩된 고분해능 또는 고주파수인 신호가 없는 원래 입력 신호(16)내의 구성요소를 나타낸다. 차동 신호는 그 다음 확장 코더(36)에 의해 확장 비트 스트림(38)을 생성하는 서브 밴드 코딩 또는 변환 코딩과 같은 표준 코딩 기술을 사용하여 적절하게 엔코드된다. 확장 비트 스트림 및 코어 비트 스트림은 합성 스트림(40)을 형성하기 위해 시간적으로 정렬되고 멀티플랙싱되거나 또는 응용에 따라 분리된 스트림으로서 유지 또는 전송될 수 있다.
주파수 스펙트럼을 확장하고 노이즈 플로어를 낮추는 과정의 숨은 개념이 도 3a 및 3b에 더 예시되었다. 도 3a는 96 kHz로 샘플링된 오디오 입력 신호의 주파수 스펙트럼의 스냅사진을 도시한다. 상기 오디오는 끝에서 48 kHz 까지의 주파수 성분을 명백하게 포함한다. 도 3b의 자취(44)는 데시메이션 및 코어 엔코딩 후의 신호의 스펙트럼을 도시한다. 오디오 주파수는 24 KHz 이상이 필터링되어 출력되고 샘플링 속도는 코어 코더를 매칭시키기 위해 데시메이터(decimator)에 의해 48 kHz로 떨어지게 된다. 자취(46)는 확장 엔코더에 입력되기 전의 차동 신호의 스펙트럼을 도시한다. 명백하게 상기 확장 코더는 데이터 자원을 코어 디코더에 의해 표현되지 않는 스펙트럼의 이러한 부분 상에 즉, 24 kHz 주변의 전이 대역(48; transition band) 및 24 kHz 내지 48 kHz의 고주파 확장 대역(50)에 집중시킬 수 있다. 부가적으로 비트들은 나머지 코어 신호(52)에 배치되어 코어 대역폭의 노이즈 플로어를 감소시킬 수 있다. 이어지는 특수한 경우는 (1)코어 신호의 분해능을 확장하기 위해, (2)코어 분해능 및 신호의 고주파 내용 모두를 확장하기 위해, (3)고주파 내용만을 확장하기 위해 확장 비트가 배치된 이들 응용을 조사한다. 이들 각각의 앞부분에 있어서, 코팅 시스템은 코어 코딩 시스템과 관련된 지연만이 알려질 필요가 있는 "블랙 박스" 방법으로 구성될 수 있거나 개별적인 코어 코딩 아키텍춰의 이점을 얻기 위해 "오픈 박스" 방법으로 구성될 수 있다.
코어만의 디코더와의 역 상용성을 유지하기 위해, 코어 및 확장 오디오 데이터(20, 38)를 각각 운반하는 단일 합성 비트 스트림(40)이 코어 펄스 확장 방법으로 또한 포맷된다. 이러한 비트 스트림은 각각이 두 개의 필드[코어 필드(56) 및 확장 필드(58); 도 4 참조]로 구성된 동기된 프레임(54)의 시퀀스이다. 코어만의 디코더는 동기 워드(CORE_SYNC; 61)를 검출하고 코어 필드(56) 내의 코어 비트(20)를 디코드하여 코어 오디오를 생성하고 다음 프레임을 디코드하기 위해 다음 프레임의 개시점으로 점프함으로써 확장 필드(58)를 무시한다. 그러나 확장 디코더는 코어 비트를 디코드할 수 있고, 확장 비트를 위한 동기 워드(EXT_SYNC; 60)가 존재하는지를 점검한다. 존재하지 않는다면, 상기 디코더는 코어 오디오를 출력하고 다음 프레임을 디코드하기 위해 다음 프레임의 개시점으로 점프한다. 그 밖의 경우, 디코더는 확장 필드(58) 내의 확장 비트(38)를 디코드하도록 진행되어 확장 오디오를 생성하고 그 다음 이것을 코어 오디오와 결합하여 고품질 오디오를 생성한다. 상기 코어 비트는 대역폭에 걸쳐 재구성된 코어 오디오 신호에 대한 노이즈 플로어를 규정한다. 확장 비트는 코어 대역폭에 걸쳐 노이즈 플로어를 (더 낮게)개량하고 오디오 대역폭의 나머지에 대해 노이즈 플로어를 규정한다.
도 5a 및 도 5b에 도시한 바와 같이, 합성 비트 스트림(40)은 CD, 디지털 다기능 디스크(DVD)등과 같은 전송 매체에 엔코드되거나, 직접 방송 시스템과 같은 전송 매체를 거쳐 방송된다. 도 5a에 도시한 바와 같이, 단일 합성 비트 스크림(40)은 CD, DVD, 또는 잘 알려진 기술을 사용하는 다른 디지털 저장 장치 등과 같은 휴대 장치 기록가능 저장 매체(62)에 기록된다. 도 5b에 도시한 바와 같이, 합성 비트 스트림(40)은 반송파(64)에 포함되고 위성, 케이블 또는 다른 전기통신 시스템을 통해 방송된다.
코어 및 확장 비트 스트림을 디코드하기 위해(도 6참조), 언팩커(unpacker; 66)는 합성 비트 스트림(40)을 언팩하고 코어 및 확장 비트 스트림(20, 38)을 각각의 그들의 디코더(68, 70)로 보낸다. 디코더(72)는 그 후 출력을 합해(74) 고충실 오디오 신호(76)를 재구성한다. (구식 장비의 경우와 같이) 재생 장치가 내장 확장 디코더를 갖지 않는 경우에 있어서, 확장 비트 스트림은 단순히 무시되고 코어 비트 스트림은 디코드되어 코어 품질 오디오 신호를 생성한다. 디코딩 예에 있어서, 코어 디코더 및 확장 디코더의 지연이 동일하다고 가정된다. 나중에 다루어지는 바와 같이, 지연의 차는 디코더 또는 엔코더 내에 부가적인 지연 단계를 부가함으로써 조정될 수 있다.
코어 더하기 확장 코딩 토폴로지의 이점이 다중 톤 시험 신호에 응답하여 코어만의 주파수 스펙트럼(78)과 코어 더하기 확장 주파수 스펙트럼(80)을 각각 표현한 도 7에 명확히 도시되었다. 이 각각의 응용에 있어서, 상기 오디오 시스템은 DC로부터 24 kHz 까지 대략 -100 dB의 노이즈 플로어를 갖는 코어만으로 재구성된 오디오 신호를 생성한다. 후에 더 상세하게 논의되는 바와 같이, 이 코어만의 응답은 구식 시스템에 사용되는 아날로그 앤티 에일리어싱 필터와 새로운 코더에 사용되는 디지털 데시메이션 필터의 차이에 기인하여 구식 시스템에 의해 생성된 코어만의 신호보다 약간 좋을 수 있다. 비교해 보면, [전술한 특별한 경우(2)의] 오디오 시스템은 코어 신호의 노이즈 플로어를 대략 -160 dB로 감소하고 대략 -60 dB의 노이즈 플로어에서 신호 대역폭을 48 kHz로 확장하는 코어 더하기 확장 오디오 신호를 생성한다. 높은 노이즈 플로어는 귀가 민감하지 않은 고주파에서 더 허용될 수 있음을 주목해야한다.
고분해능 확장 구조
도 8a 및 8b는 코어 과정의 코딩 분해능만을 개선하기 위한, 즉, 출력 오디오 신호의 대역폭 확장 없이 디코드된 오디오 출력 신호 내의 코딩 오류를 줄이기 위한 엔코딩 및 디코딩 과정을 도시한다. 기존의 코딩 방법(AC3, MPEG, DTS)의 비트 레이트는 고정되어 있으므로, 높은 코딩 분해능이 요구된다면, 오디오 신호를 엔코딩하기 위해 일반적으로 완전히 다른 상용되지 않는 코더의 사용을 요구할 것이다.
현행 방식에 있어서, 기존의 코어 엔코더(84)는 기존의 디코더의 비트 레이트 속박(AC3에 대해서는 640 kbit/s, MPEG에 대해서는 768 kbit/s, DTS에 대해서는 1,536 kbit/s) 내에서 최상의 코딩 분해능 가능 동작을 제공하는데 사용된다. 코딩 분해능을 더 개선하기 위해, 즉, 코팅 오류를 줄이기 위해, 엔코드된 코어 신호가 디코드되어 입력 신호로부터 차감(88)되고 이들 신호 사이의 정확한 시간 배열을 달성하기 위해 지연(90)된 재구성된 코어 신호를 형성한다. 확장 엔코더(82)는 일부 독단적인 코딩 과정을 사용하여 차 신호를 엔코드한다. 팩커(92)는 코어 및 확장 비트를 전술한 바와 같은 합성 비트 스트림으로 팩킹한다. 이 경우, 샘플링 주파수 및 오디오 대역폭은 확장 및 코어 엔코더(82, 84) 양쪽 내에서 각각 같다. 고충실도 96 kHz 입력 오디오가 제공된다면, 이 입력은 양쪽 코더에 매칭되도록 저역 필터로 필터링되고 다운샘플링 되어야함을 주목해야한다.
도 8b에 도시한 바와 같이, 언팩커(94)는 신호를 디코드하기 위해 합성 비트 스트림을 언팩하고 코어 및 확장 비트 스트림을 개별적인 디코더 프로세서(96, 98)에 각각 전달하며, 각각의 출력과 함께 합해진다(100). 만일 확장 디코더가 존재하지 않으면, 코어 디코더 출력이 직접 사용된다. 이 실시예에 있어서, 확장 비트 스트림은 출력 오디오 신호의 신호 대 잡음비를 개선하는 메카니즘으로서 고려될 수 있다. 즉, 확장 엔코더의 출력을 부가함으로써 코딩 노이즈 플로어는 감소된다. 감소 레벨은 확장 비트 스트림에 할당된 비트 레이트에 의존할 것이다.
도 9는 확장 코더에 입력되기 전의 차동 신호 주파수 스펙트럼(102)의 스냅 사진을 도시한다. 코어 엔코딩 과정은 코딩 오류를 갖으며 이것은 0 에서 24 kHz의 대역폭에 걸친 노이즈 플로어를 생성한다. 바로 24 kHz 에서의 큰 진폭 오류는 앤티 에일리어싱 필터의 전이 대역폭에 기인한다. 확장 코더는 이용 가능한 비트를 할당하여 코딩 오류 및 전이 대역폭 오류 모두를 감소시킨다. 대부분의 할당 방식들은 종합적인 성능을 최적화하기 위해 전이 대역과 같은 큰 오류에는 더 많은 비트를 할당하고, 작은 오류에는 적은 비트를 할당한다.
도 10에 도시한 바와 같이, 노이즈 플로어는 코어 더하기 확장 응답(104)이 -160 dB 로 하향 이동되었는데 비교하여 코어만의 주파수 응답(78)은 실질적으로 -100 dB 로 하향 이동되었고, 1,536 bit/sec에서 2,048 bit/sec로 코어 비트 레이트를 증가시키고 확장 코더에 부가적인 비트를 할당함으로써 전이 대역을 통해 확장되었다. 이러한 비트 레이트는 기존의 DTS 엔코더 시스템과 사용될 수 있는 예일뿐이라는 것을 주목해야한다. -160 dB의 노이즈 플로어는 다른 사용 가능한 코더로써 달성할 수 없으며, 오디오 충실도의 현저한 개선을 나타낸다.
고주파 확장 구조
도 11a 및 11b는 확장 비트 스트림이 코어 코딩 시스템에 의해 표현될 수 없는 고주파 오디오 정보를 운반할 수 있도록 하는 코딩 구조를 도시한다. 이 실시예에서 디지털 오디오는 96 kHz 주기를 갖으며 24-비트 PCM 샘플링에 의해 표현된다. 디지털 오디오는 24 kHz 이상의 신호 성분을 제거하기 위해 정수 지연을 갖는 선형 위상 FIR 필터(106)를 사용하여 먼저 저역 통과 필터링된다. 이 디지털 필터의 차단 주파수는 기존의 코어만의 오디오 코더의 아날로그 앤티 에일리어싱 필터와 같다. 디지털 필터는 그들의 아날로그 대응부분 보다 더 좁은 전이 대역을 나타내는 경향이 있으므로 코어만의 신호는 기존의 시스템의 코어만의 신호보다 실제적으로약간 좋을 수 있다.
필터링된 신호는 그 후 인수 2(108)에 의해 데시메이트되어 유효한 48 kHz 샘플링 신호를 발생시킨다. 다운샘플링된 신호는 정상 형태로 코어 엔코더(110)에 공급되고, 결과적인 비트 스트림은 비트 스트림을 적어도 일 프레임 정도 지연하는 프레임 버퍼(111)에 배치된다. 지연된 비트 스트림은 그 후 팩커(112)에 배치된다. 다운샘플링된 신호는 또한 코어 디코더(114)에 공급되어 코딩 오류를 갖고 있는 48 kHz 샘플링 디지털 오디오 스트림을 재구성한다. 원래의 96 kHz 입력 오디오 신호로부터 차감되기 전에, 인수 2로 먼저 업 샘플링(116)되어야하고, 보간 에일리어싱을 제거하기 위해 저역 필터로 필터링된다. 게다가 이 필터링은 정수 샘플 지연과 함께 선형 위상 FIR(118)을 사용하여 적절하게 달성될 수 있다. 그러므로, 이 신호는 코어 비트 스트림 내에 유지된 오디오 정보만을 여전히 운반할 수 있다. 즉, 이 신호는 약 24 kHz의 임의의 오디오 주파수 성분을 포함할 수 없다. 상기 재구성된 코어 신호는 그 다음, 입력 신호(122)의 지연된(119) 변형으로부터 차감(120)되어 차동 신호를 생성하며, 이 차동 신호는 지연(121)을 통과하고 96 kHz의 샘플링 엔코더(123)로 엔코드되어 확장 비트 스트림을 생성한다.
디코딩 과정은 이미 기술된 바와 유사하다. 도 11b에 도시된 바와 같이, 언팩커(124)는 합성 비트 스트림을 언팩하고 코어 및 확장 비트 스트림을 그들 각각의 디코더(126, 128)에 공급한다. 확장 디코더가 존재하지 않는 경우, 재구성된 오디오는 직접 출력된다(예시된 24 비트 48 kHz PCM). 확장 디코더가 플레이어 내에 존재하는 경우, 디코드된 코어 오디오는 96 kHz로 업 샘플링(130)되며, 저역 필터로 필터링(132)되고 확장 디코더의 출력과 합해진다(134).
이 과정에 숨은 개념이 일반적인 코어 더하기 확장 구조를 참조하여 도 3a 및 도 3b에 먼저 도시되었다. 도 3a는 96 kHz 샘플링 오디오 입력 신호의 주파수 스펙트럼의 스냅 사진을 도시한다. 상기 오디오는 끝에서 48 kHz 까지의 주파수 성분을 명백하게 포함한다. 도 3b의 자취(44)는 데시메이션 및 코어 엔코딩 후의 신호의 스펙트럼을 도시한다. 오디오 주파수는 24 KHz 이상이 필터링되어 출력되고 샘플링 속도는 데시메이터(decimator)에 의해 48 kHz로 떨어지게 되는데 그 이유는 코어 코드는 높은 샘플링 속도에서 동작할 수 없기 때문이다. 자취(46)는 확장 엔코더에 입력되기 전의 차동 신호의 스펙트럼을 도시한다. 명백하게 상기 확장 코더는 데이터 자원을 코어 디코더에 의해 표현되지 않는 스펙트럼의 이러한 부분 상에 즉, 24 kHz 와 48 kHz 사이에 집중시킬 수 있다.
일부 확장 비트를 코어 영역에 할당하고 일부를 고주파 스펙트럼에 할당하는 비트 할당 방식이 먼저 도 7에 도시되었다. 도시한 바와 같이, 이 양자는 출력 오디오 신호의 대역폭을 확장시키고 0 내지 24 kHz 영역의 노이즈 플로어를 감소시킨다. 이 실시예는 확장 코더에 할당할 부가적인 비트가 있다고 가정한다. 도 12에 도시한 바와 같은 대안의 응용은 기존의 레벨에 고정된 총비트 수를 유지하고 코어 및 확장 영역 사이에 이들을 할당한다. 명백하게 고주파 실행(136)의 개선은 24 kHz 까지 변경되지 않은 코어 노이즈 플로어(78)보다 높은 노이즈 플로어(138)에 대하여 상충관계(trade off)가 된다. 다른 방법에 있어서, 노이즈 플로어가 코어 영역에 혼자 놓여있는 동안 임의의 부가적인 비트들이 단독으로 고주파 스펙트럼에할당될 수 있다. 24 kHz 주변의 전이 대역 내의 오류는 꽤 크기 때문에, 고주파 스펙트럼은 전이 대역을 포함하도록 바람직하게 규정될 수 있다.
마지막 경우에 있어서, 코어 엔코더에 의해 제공된 노이즈 플로어는 충분히 양호하거나 또는 고주파 스펙트럼의 개선이 노이즈 플로어를 낮추는 것보다 더 중요하다고 가정되었다. 어느 한쪽의 경우 비확장 비트들은 재구성된 코어 신호와 관련된 코딩 오류를 줄이기 위해 할당된다. 이러한 엔코딩 과정은 요구되는 계산량 및 지연을 줄이기 위해 간결하게 될 수 있는 바와 같이, 디코더에 영향을 미치지 않고, 오디오 장비의 복잡성 및 단가를 줄일 수 있다.
도 13에 도시한 바와 같이, 이것은 24 kHz 이상의 신호 성분을 제거하기 위해 정수 지연이 있는 선형 위상 FIR 필터(140)를 사용하여 디지털 오디오를 첫 번째로 저역 통과 필터링함으로써 달성될 수 있다. 필터링된 신호는 그 후, 인수 2(142)에 의해 데시메이트되어 효과적인 48 kHz 샘플링 신호를 생성한다. 그 다음, 다운샘플링된 신호는 통상의 형태로 코어 엔코더(144)에 공급되어 결과적인 비트 스트림은 팩커(146)에 배치된다. 다운샘플링된 신호는 그 다음, 인수 2에 의해 업샘플링(148)되고 재구성된 신호 상의 보간 에일리어싱을 제거하기 위해 저역 통과 필터링(150)된다. 한편, 이 필터링은 정수 샘플 지연을 갖는 선형 위상 FIR을 사용하여 달성된다. 그러므로 재구성된 신호는 코딩 오류 없이 여전히 코어 비트 스트림 내에 유지된 오디오 정보만을 운반한다. 즉, 재구성된 신호는 24 kHz 이상의 임의의 오디오 주파수 성분을 포함하지 않는다. 그 후, 재구성된 신호는 차동 신호를 생성하기 위해 입력 신호의 지연된(154) 변형으로부터 차감되며, 이것은 지연(157)되고 96 kHz 샘플링 엔코더(158)로 엔코드되어 확장 비트 스트림을 생성한다.
이 방식과 도 11a의 방식과의 차이는 코어 엔코더 및 디코더의 체인이 차동 신호를 생성하기 위해 처리과정 내에서 우회(by-pass)된다는 것이다. 트레이트 오프(Trade-off)라는 것은 코어 엔코더의 코딩 오류는 차동 신호에 반영되지 않기 때문에 코어 엔코더에 의해 커버되는 주파수 대역의 노이즈 플로어는 개선될 수 없다는 것이다. 따라서, 확장 엔코더는 데시메이션 필터 및 보간 필터의 전이 대역으로부터 떨어진 낮은 서브 밴드에 비트를 할당할 수 없다.
필터 특성 문제점
코어 엔코더에 앞서 신호를 필터링하는 데시메이션 앤티 에일리어싱 저역 필터(LPF)의 목적은 코어 알고리즘에 의해 일반적으로 표현될 수 없는 신호를 제거하는 것이다. 다시 말해서, 소비자 장비 내에 존재하는 디코더는 이러한 주파수를 사용하도록 프로그램되지 않았다. 에일리어싱 효과 및 음질이 떨어지는 것을 피하기 위해 이 필터는 전이 포인트 전에 일반적으로 양호하게 롤오프(roll-off)할 것이다. 그러나, 이 필터의 특성, 즉 립플, 전이 대역폭 및 정지 대역 감쇠는 필요한 품질 표준을 얻기 위해 사용자에 의해 조정될 수 있다.
보간 앤티 에일리어싱 필터의 목적은 단순히 보간 에일리어싱이 효과적으로 감쇠되어 에일리어싱의 레벨이 전체적인 품질을 방해하지 않도록 보장하는 것이다. 상기 필터는 단순히 데시메이션 앤티 에일리어싱 필터의 모사(模寫)일 수 있다. 그러나, 데시메이션 필터의 복잡성은 코어 신호의 질을 보장하기 위해 증가하게 될 것이다. 결과적으로, 엔코더 및/또는 디코더에서 계산 부하를 단순화하기 위해 보간 필터의 크기를 줄이는 것이 바람직하다.
통상적으로 엔코더 및 디코더 모두에서 보간 필터의 같은 필터 특성을 유지하는 것이 바람직하다. 이것은 지연 및 응답이 정확히 매칭되는 것을 보장하여 디코더에서의 합계는 엔코더에서의 처리 차이와 정확히 반대가 될 것이다. 때때로, 디코더 보간 필터의 계산적인 복잡성을 줄이는 것이 바람직할 것이다. 한편 이것은 엔코더 및 디코더 사이의 보간 과정의 약간의 부조화를 일으킬 수 있지만 상기 차이는 적절한 필터 설계로 줄일 수 있다. 중요한 다른 문제점은 이들 필터의 지연이다. 만일 지연이 다르다면, 확장 체인 또는 코어 체인 내의 어느 한쪽의 부가적인 지연으로 보상되어야만 한다. 게다가, 여기에서의 목적은 확장 및 코어 신호가 합계 이전에 정확히 시간 정열되도록 보장하는 것이다.
코덱 실행
전술한 코딩 방식에 있어서, 코어 및 확장 비트 스트림 양자를 위한 엔코더/디코더는 임의이다. 즉, 엔코더/디코더는 서브 밴드 코딩, 변환 코딩, 등의 임의의 조합일 수 있다. 일반적인 코어 더하기 확장 방법은 두 개의 뚜렷한 실행으로 나누어질 수 있다. 그 첫 번째는 블랙 박스 방식이고 이것은 코어 디코더의 알고리즘 및 내부 구조에 대한 지식을 요구하지 않으며, 단지 코딩 지연의 지식만을 요구한다. 그러나, 확장 코딩은 코어 엔코딩의 특성이 알려지고 확장 코더가 이것에 매칭되도록 설계된다면 어떤 경우에는 더 효율적으로 될 수 있다.
블랙 박스 코덱
블랙 박스 방식 코어 엔코더 및 디코더의 지연을 제외하고, 코어 코더/디코더(코덱)의 내부 구조의 지식이 없다고 가정한다. 일반적인 코어 더하기 확장 방법을 설명하기 위해 위에서 사용된 블록도는 또한 블랙 박스 방법을 나타낸다. 도시한 바와 같이, 코어 및 확장 코딩 및 디코딩 과정은 완벽하게 분리되었다. 차동 신호를 형성하거나 시간 영역 내에서 완벽하게 발생하는 출력신호를 합하는 때에만 상호 작용이 발생한다. 그러므로, 코어 코덱의 내부 구조의 지식을 요구하지 않거나 확장 코덱의 선택은 코어 코덱에 의존하거나 코어 코덱에 의해 엑제될 필요가 없다. 그러나, (a)재구성된 코어 신호 및 입력 신호는 차동 신호가 형성되기 전에 정확히 시간 정렬되고, (b)코어 및 차동 신호는 이들이 디코더에서 합해지기 전에 정확히 시간 정렬되어야 하므로 지연은 선택되어야만 한다. 도 11a 및 11b에 도시한 바와 같이, 현재 바람직한 방법은 디코더에 요구되는 메모리를 최소화하기 위해 모든 지연을 엔코더 내에 놓는다.
입력 신호 및 재구성된 코어 신호를 시간 정렬하기 위하여, 입력 신호는 다음과 같은 양으로 지연된다.
Delayinput=DelayDecimation LPF+DelayCore Encoder+DelayCore Decoder+DelayInterpolation LPF.
디코더에서 코어 및 차동 신호를 시간 정렬하기 위해, 프레임 버퍼 지연은 다음과 같이 설정된다.
DelayFrame Buffer=DelayDifference Signal+DelayExtension Encoder+DelayExtension Decoder.
도 11a에 도시한 엔코더의 문제점은 아래와 같은 과도한 코딩 지연이다.
Coding Delay=DelayDecimation LPF+DelayCore Encoder
+DelayDifference Signal+DelayExtension Encoder+DelayExtension Decoder
+DelayCore Decoder+DelayInterpolation LPF.
도 13에 주어진 방식이 사용되고 보간 LPF(interpolation LPF)가 적절히 설계된다면, 이 지연은 다음과 같이 줄일 수 있다.
Coding Delay=DelayDecimation LPF+DelayCore Encoder
+DelayCore Decoder+DelayInterpolation LPF.
블랙 박스 확장 코더
블랙 박스 확장 코더(160)에 적합한 코덱의 한 예가 도 14 및 l5에 도시되었다. 이 코덱은 시장에서 현재 모든 일류 오디오 코딩 시스템에 기본적으로 사용되는 필터 뱅크 형태의 코딩 기술 - DTS 응집성 음향(DTS Coherent Acoustics), MPEG I 및 MPEG II는 서브 밴드 코딩을 사용하는 한편, AC-3 및 MPEG II AAC는 변환 코딩을 전개한다 - 을 토대로 한다. 그러므로, 여기에 제시된 코덱의 상세한 내용은 후술된 오픈 박스 실행에 사용되는 확장 코덱의 실행에 쉽게 적응시킬 수 있다.
상기 확장 엔코더(160)를 도 14a에 도시한다. 차동 신호는 필터 뱅크(162)에 의해 N 개의 서브 밴드로 분리되고 데시메이트된다. 각 서브 밴드 신호는 도 15a에 도시된 서브 밴드 코더(164)를 사용하여 엔코드될 수 있다. 그 후 각 서브 밴드 엔코더로부터의 서브 밴드 비트는 확장 비트로서 팩킹(166)된다.
디코더(168)가 도 14b에 도시되었다. 확장 비트는 우선 각 개별적인 서브 밴드 비트로 언팩(170)된다. 그 후, 언팩된 서브 밴드 비트는 도 15b에 도시된 서브밴드 디코더(172)에 의해 디코드되어 재구성된 서브 밴드 신호를 생성한다. 최종적으로, 차동 신호는 재구성된 서브 밴드 신호들에 걸쳐 합성 필터 뱅크(synthesis filter bank; 174)를 실행시킴으로써 재구성된다.
각 서브 밴드 엔코더(도 14a 참조) 내에서는 서브 밴드 샘플들이 서브 밴드 분석창으로 그룹을 이루게 된다. 각각의 이러한 창 내의 서브 밴드 샘플은 4 개의 예측 필터 계수의 셋트를 최적화 하는데 사용되고, 이 4개의 예측 필터 계수의 셋트는 그 후, 트리 탐색 VQ 방법(tree search VQ strategy)을 사용하여 양자화된다. 이 벡터 양자화된 예측 계수는 각 분석창 내의 서브 밴드 신호를 예측하는데 사용된다. 예측 이득은 서브 밴드 샘플의 변화 및 예측 나머지의 변화의 비율로서 얻어진다. 상기 예측 이득이 예측 계수의 VQ 어드레스 및 예측 나머지의 나중 양자화에 기인한 가능한 예측 이득의 손실 전달의 오버헤드를 커버하기에 충분한 양의 값이면, 상기 예측 나머지는 양자화되고 이동될 것이다. 그렇지 않은 경우, 예측 나머지는 포기될 것이고 서브 밴드 샘플은 양자화되고 이동될 것이다. 서브 밴드 분석창을 위한 적용 예측(adaptive prediction)의 사용은 압축된 비트 스트림 내의 "예측 모드" 플래그로 표시된다. 이러한 방법으로, 양자화 오류를 줄이는 것이 가능한 때에는 언제나 적용 예측이 동적으로 활성화된다.
예측 모드가 서브 밴드 분석창에 대해 온인 경우, 배율이 계산되며 이 배율은 예측 나머지의 RMS(실효값; 제곱 평균 평방근) 이거나 피크 진폭이다. 예측 나머지는 이 배율로 표준화된다. 예측 모드가 서브 밴드 분석창에 대해 온이 아니면, 과도 현상의 가능한 존재에 대해 서브 밴드 샘플이 분석된다. 과도 현상은 낮은 진폭 위상과 하나의 높은 진폭 위상 사이의 가파른 즉, 빠른 변화로서 규정된다. 이러한 창에 단일 배율이 사용되면 저레벨 샘플에 대해 과도하게 될 것이며, 이 저레벨 샘플은 낮은 비트 레이트 모드에서 어쩌면 프리 에코(pre-echo)에 이르게되는 과도 현상이 진행된다. 이러한 문제를 완화하기 위해, 각 분석창은 부속창의 수에 이르기까지 분할된다. 전이 위치는 분석 부속창에 의하여 분석창 내에 배치되고 2개의 배율이 계산되며, 하나는 전-과도 현상 부속창 내의 샘플을 위한 것이며, 다른 하나는 후-과도 현상 부속창을 위한 것이다 과도 현상이 발생되는 부속창의 식별 번호는 그 후 엔코드된 비트 스트림에 팩킹된다. 그 후에, 각 부속창 내의 상기 서브 밴드 샘플들은 그들 각각의 배율로 표준화된다.
배율은 비트 레이트에 의존한 64 레벨(2.2dB 스텝) 또는 128 레벨(1.1dB 스텝) 루트 스퀘어 표를 사용하여 대수적으로 양자화된다. 그들은 140 dB의 범위에 걸쳐 오디오의 동적 추적을 참작한다. 양자화표의 선택은 각 분석창에 대해 비트 스트림 내에 간직된다.
모든 채널의 모든 서브 밴드를 가로지르는 비트 할당은 서브 밴드 분석창의 시간 기간 동안 물 채움 알고리즘을 사용하여 달성될 수 있다. 높은 비트 레이트 응용에 대하여, 물 채움 알고리즘은 서브 밴드 전력 상에서 동작한다. 낮은 비트 레이트 응용에 대하여, 주관적인 투명한 코딩은 서브 밴드에 대한 신호 대 마스크 비(SMR)를 얻기 위해 모든 채널 상에 정신음향 분석을 실행하고, 상기 SMR을 물 채움 알고리즘에 공급함으로써 달성될 수 있다. 감소가 없거나 또는 가변의 비트 레이트 코딩 모드에서, 비트 할당은 양자화 단계 크기에 의해 결정되며, 이 양자화단계 크기는 양자화 노이즈가 소스 PCM 샘플의 LSB의 반(半)과 같은 일부 미리 결정된 임계값 이하로 되는 것을 보증한다. 이렇게 얻어진 비트 할당은 비트 스트림 내에 삽입된다.
비트 할당 후, 서브 밴드 샘플 또는 예측 나머지는 양자화되고 양자화 색인은 비트 스트림 내에 팩킹된다.
정신 음향 연구는, 약 5 kHz 이상에서, 인간 청각 시스템이 일시적인 미세 구조 상에서 보다 오디오 신호의 일시적인 포장 상에서 생생하게 그려지는 인간 청각 시스템의 공간 지각 능력을 기초로 하는 것을 보여주었다. 그러므로, 매우 낮은 비트 레이트 모드에서, 오디오 채널의 선택된 수의 고주파 서브 밴드의 합계만으로 엔코딩함으로써 전체적인 재구성 충실도를 개선하는 것이 가능하다. 디코딩에 의해, 개별적인 채널들의 이러한 고주파 서브 밴드는 이 합계 신호를 복제함으로써 재구성될 수 있다. 접합 강도 코딩(joint intensity coding)이 전개된다면, 합계 서브 밴드 샘플은 접합 채널(소스 채널)중의 하나 내에 전해지며 모든 다른 채널들은 색인만을 소스 채널 및 그들의 개별적인 배율에 전한다.
낮은 비트 레이트 응용에 있어서, 배율, 전위 위치, 비트 할당 또는 양자화 색인은 허프만 코드(Huffman code)와 같은 엔트로피 코딩을 사용하여 더 엔코드될 수 있다. 이 경우, 엔트로피 코딩 후에 실제적으로 사용되는 총비트는 고정된 비트 레이트 응용에 참조되는 최대 비트보다 현저하게 적을 것이다. 참조된 최대 비트를 완전히 활용하기 위해 반복 방법이 전개되고 그것에 의해 사용되지 않은 비트는 모든 사용되지 않은 비트가 고갈될 때까지 가장 낮은 것으로부터 시작하여 가장 높은것에서 종료될 때까지 증가적으로 서브 밴드에 배치된다.
블랙 박스 디코더 하드웨어 실행
듀얼 HSARC 21065L 부동 소숫점 프로세서 상에서 동작하는 5.1 채널, 96kHz, 24 비트 DTS 디코더의 하나의 실행을 도 16 내지 20에 도시한다. "코어" 블록의 처리 및 직렬 입/출력 데이터 스트림의 취급 모두가 프로세서 #1(P#1; 180) 내에서 실행된다. 확장 코딩에 요구되는 단일 처리 동작의 대부분은 프로세서 #2(P#2; 182)에 국한된다. 이러한 구성은 96/24 "고명료도" 오디오 포맷에 참조될 간단한 하드웨어 개량 경로를 허용한다. 특히, 외부 포트(186)를 통해 외부 메모리에 인터페이스하고, 출력 직렬 포트(192)를 통해 SPDIF 수신기 및 3개의 SPDIF 송신기(190a, 190b, 190c)에 접속되는 프로세서 #1는 코어 디코딩만을 위해서는 충분히 사용할 수 있다. 96kHz, 24 비트 DTS 디코더로의 갱신은 클러스터 다중처리 구성 내에서 프로세서 #2를 외부 메모리 버스(194)에 접속함으로써 행해진다. 샤크(SHARC)의 원칩 버스 조정 로직은 양 프로세서가 공통 버스를 공유하는 것을 허용한다.
디지털 스트림은 DVD 플레이어로부터 또는 DVD 플레이어 내부의 DVD 수송 메카니즘으로부터 이용할 수 있다. SPDIF 수신기는 디지털 스트림을 수신할 필요가 있고 이 디지털 스트림을 샤크 P#1의 Rx 직렬 포트(195)에 공급하기 적합한 포맷으로 변환한다. 입력되고 있는 디지털 스트림은 DMA를 사용하여 RX 직렬 포트로부터 샤크 P#1의 내부 메모리 내의 데이터 버퍼로 옮겨진다.
도 17의 블록도(196)는 입력되고 있는 데이터 스트림 흐름을 나타낸다. 좌,우(L, R) 채널, 서라운드 좌, 우 채널(SL, SR) 및 중앙 및 저주파 효과 채널(C, LFE)용의 6개의 디코드된 PCM 스트림은 3개의 출력 스트림으로 멀티플랙싱된다. 3 개의 Tx 직렬 포트 DMA 채널은 샤크 P#1의 내부 메모리 내의 데이터 버퍼로부터 적절한 전달 직렬 포트로 출력 스트림을 전송하는데 사용된다. 직렬 포트는 임의의 상업적으로 이용 가능한 SPDIF 송신기 또는 DAC를 만족하도록 구성될 수 있다.
도 18의 블록도(198)는 출력되고 있는 데이터 스트림 흐름을 나타낸다. 클러스터 다중처리 구성은 각 프로세서가 공유된 외부 메모리 및 양 프로세서의 I/O 레지스터에 엑세스하는 것을 가능하게 한다. 두 개의 프로세서 사이의 데이터 교환은 공유된 외부 메모리 내의 2중 버퍼를 통해 실행된다. 특히, 현 DTS 프레임으로부터의 "코어" 오디오 데이터의 6 개의 채널은 P#1의 외부 포트 DMA 채널을 사용하여 P#1의 내부 메모리로부터 공유된 외부 메모리의 블록(블록 A로 칭함) 내의 버퍼로 옮겨진다. 부가적으로 현 DTS 프레임으로부터의 확장 서브 밴드 샘플의 5 개의 채널 또한 P#1의 내부 메모리로부터 공유된 외부 메모리의 동일한 블록 내의 그들의 대응하는 버퍼로 옮겨진다. 게다가, P#1의 외부 포트 DMA 채널은 이 이동에 사용된다.
도 19의 블록도에 도시한 바와 같이, 현 DTS 프레임 동안 이전 DTS 프레임으로부터의 "코어" 및 확장 데이터는 공유된 외부 메모리의 블록 B 내의 그들의 대응하는 버퍼로부터 P#2의 내부 메모리로 옮겨진다. 이들 이동의 스캐쥴 및 메모리 블록(A/B)의 토글은 양 프로세서의 I/O 레지스터의 제어를 통해 P#1에 의해 행해진다. 이와 유사하게, 이전 DTS 프레임으로부터의 96kHz PCM 오디오의 6개 채널은 공유된 외부 메모리의 블록 D 내의 버퍼로부터 P#1의 내부 메모리로 P#1의 외부 포트 DMA 채널을 사용하여 옮겨진다. 도 20의 블록도(201)는 이 데이터 스트림 흐름을 도시한다. 이들 이동의 스캐쥴 및 메모리 블록(C/D)의 토글은 양 프로세서의 I/O 레지스터의 제어를 통해 P#1에 의해 다시 행해진다.
오픈 박스 코덱 I
오픈 박스 실행은 코어 코덱의 내부 구조의 지식을 요구한다. 도 21 및 22에 도시한 엔코더 예는 필터 뱅크 방법을 사용하는 코딩 기술을 채용한 코어 엔코더에 대한 것이다. 이들은 서브 밴드 코딩(DTS 응집성 음향, MPEG I 및 MPEG II) 및 변환 코딩(돌비 AC-3 및 MPEG II AAC)을 포함하지만 이에 국한되지는 않는다. 코어 코드의 내부 구조를 인식함으로써, 확장 코덱이 선택되고 설계되어, 확장 코덱은 예컨대, 0 내지 24 kHz의 코어 대역폭을 넘어 응답하고, 코어 코더의 응답과 매칭된다. 결과적으로, 차동 신호는 시간 영역 대신 변환 또는 서브 밴드 영역 내에 형성될 수 있다. 이것은 지연의 크기 및 계산횟수를 줄인다.
제1 실시예에 있어서, 디지털 오디오는 96 kHz 주기를 갖는 24 비트 PCM 샘플로 표현된다. 상기 디지털 오디오는 최초로 저역 통과 필터링(202)되어 대역폭이 24 kHz 이하로 줄어들고, 그 다음, 인수 2에 의해 데시메이트(204)되어 효율적인 48 kHz 샘플링 신호를 생성한다. 다운 샘플링된 신호는 그 후, 코어 엔코더(206)에 공급된다. 코어 엔코더 내의 N 대역 필터 뱅크(208)는 다운 샘플링된 신호를 N 개의 서브 밴드로 분해한다. 각 서브 밴드는 다수의 적용 예측, 스칼라 및/또는 벡터 양자화 및 엔트로피 코딩 기술(210)을 사용하여 엔코드될 수 있다. 최적의 구성에있어서, 서브 밴드 코딩 기술은 코어 엔코더에 사용된 서브 밴드 코딩 기술과 매칭될 것이다. 결과적인 비트 스트림은 그 후 팩커에 배치된다. 이 비트 스트림은 서브 밴드 차동 신호를 생성하기 위해 확장 엔코더에 의해 나중에 사용되도록 서브 밴드 샘플로 재구성하기 위해 또한 코어 서브 밴드 디코더(212)에 공급된다.
96 kHz로 샘플링된 입력 PCM 신호는 지연(214)된 후 2-대역 필터 뱅크(216)에 공급되어 2개의 48 kHz 샘플링된 서브 밴드 신호를 생성한다. 하부 대역 신호는 코어 엔코더에 사용되는 신호 중의 하나로서 동일한 N-대역 필터 뱅크(218)에 의해 N 개의 서브 밴드 신호로 분해된다. 이들 각각은 서브 밴드 차동 신호를 생성하기 위해 코어 엔코더로부터 재구성된 개별적인 서브 밴드 신호가 차감(220)된다. 상기 차 서브 밴드 신호는 서브 밴드 코더(222)에 의해 엔코드되고 그 후, 팩커(224)에 배치된다. 2-대역 필터 뱅크로부터의 상부 대역 신호는 M-대역 필터 뱅크(226)에 공급되어 M 개의 서브 밴드 신호를 생성한다. 그 후, 이들은 서브 밴드 코더(228)에 의해 엔코드되고 팩커 내에 배치된다. 이 서브 밴드 코더는 다수의 적용 예측, 스칼라 및 벡터 양자화 및/또는 엔트로피 코딩을 포함할 수 있다. 확장 엔코더 전의 지연은 다음 식에 의해 주어지므로,
Delay+Delay2-band filter=DelayDecimation LPF
재구성된 코어 서브 밴드 신호 및 오디오 서브 밴드 신호는 가산점(220)에 정확히 시간 정렬된다(도 21a 참조). 디코더(도 21b)에 있어서, 신호는 가산점에 자동으로 정렬된다. M-대역 필터 뱅크는 이 필터 뱅크의 지연이 N-대역 필터 뱅크의 지연과 매칭되도록 설계되어야한다. 그 밖에, 상부 대역 내의 서브 밴드 신호가하부 대역에서의 서브 밴드 신호와 마찬가지로 지연되도록 임의의 지연이 도입되어야 한다.
디코딩 과정이 도 21b에 도시되었다. 코어 비트 스트림은 언팩킹(230)되고 디코드(232)되어 N 개의 코어 서브 밴드 신호를 생성한다. 플레이어에 확장 디코더가 없다면 이들 코어 서브 밴드 신호는 N-대역 합성 필터 뱅크(234)에 공급되어 코어 오디오를 생성한다. 그렇지 않으면, 이 단계는 스킵되고 코어 서브 밴드 신호는 확장 디코더(236)에 공급되고, 확장 비트 스트림으로부터 디코드(240)된 차 서브 밴드 신호와 가산(238)된다. 이들 가산된 서브 밴드 신호는 그 후, N-대역 합성 필터 뱅크에 보내져 하부 대역 신호를 생성한다. 상부 대역 신호는 확장 비트 스트림을 디코드(244)하고 디코드된 M 개의 서브 밴드 신호를 M-대역 합성 필터 뱅크(246)에 공급함으로써 형성된다. 마지막으로, 상부 및 하부 대역 신호는 2-대역 합성 필터 뱅크(248)에 보내져 96 kHz 샘플링된 오디오 출력을 생성한다.
이 오픈 박스 방법의 이점은 코딩 지연
Encoding Delay = DelayDecimation LPF+ DelayCore Encoder
Encoding Delay = DelayCore DecoderDelay2-band filter
및 디코딩 복잡성
Decoding MIPS = MIPSCore Decoder+ MIPSM-band filter+ MIPS2-band filter
의 감소를 포함한다.
M-대역 및 2-대역 필터 뱅크에 대한 FIR 필터 탭의 수가 충분히 작게 선택되었다면, M-대역 및 2-대역 합성 필터 뱅크에 필요한 MIPS는 48 kHz에서 동작하는 N-대역 합성 필터 뱅크에 필요한 MIPS 보다 작게 만들어질 수 있다. 결과적으로, 96 kHz 오디오를 디코드하는 총 MIPS는 48 kHz 샘플링된 오디오를 취급하는 코어 디코더에 의해 요구되는 MIPS의 2배보다 작을 것이다.
오픈 박스 코덱 II
M-대역 필터 뱅크가 바람직한 실행 II 중의 하나의 N-대역으로 대치된다면, 확장 코덱 내의 3개의 필터 뱅크는 L-대역 필터 뱅크를 형성하도록 결합될 수 있으며, 여기서 L=M+N(도 22a 및 22b)이다. 결합된 L-대역 필터 뱅크는 빠른 알고리즘을 사용하여 코사인(cosin)변조가 실행된다면 낮은 계산 부하를 나타낼 수 있다.
도 22a는 확장 엔코더 내의 3 개의 분석 필터 뱅크가 단일 L-대역 분석 필터 뱅크(250)로 대치되고, 코어 엔코더로부터 재구성된 서브 밴드 신호가 차 서브 밴드 신호를 생성하기 위해 L-대역 필터 뱅크의 하부 N 개의 서브 밴드 신호로부터 차감된 것을 제외하면 오픈 박스 실행 II에서의 것과 기본적으로 같다. 이것은 96 kHz 샘플링 레이트에서 동작하는 확장 엔코더의 L-대역 필터 뱅크의 하부 N 개의 서브 밴드 각각이 48 kHz 샘플링 레이트에서 동작하는 코어 엔코더의 N-대역 필터 뱅크의 것과 동일한 오디오 스펙트럼을 커버할 수 있기 때문에 가능하다. 이러한 방식이 계속되기 위해서는 L- 및 N-대역 필터 뱅크의 필터 특성이 비록 이들이 다른 샘플링 주파수에서 동작할지라도 서로 매칭되는 것이 물론 필수적이다.
도 22b에 도시한 디코딩 과정은 3 개의 분석 필터 뱅크가 하나의 L-대역 분석 필터 뱅크(252)로 대치되고, 코어 디코더의 재구성된 서브 밴드가 L-대역 필터뱅크의 밖으로 나오는 대응하는 하부 N 개의 서브 밴드에 부가된 것을 제외하면 도 21b의 것과 거의 같다.
본 발명의 여러 예시적인 실시예가 도시되고 기술되었지만, 다수의 변화 및 대안의 실시예가 본 기술분야의 당업자에 의해 제시될 수 있다. 예컨대, 여기서 설명한 샘플링 레이트는 현 표준에 대응한다. 이들 샘플링 레이트는 세월이 흐름에 따라 변경될 것이다. 이러한 변화 및 대안의 실시예는 첨부된 청구 범위에서 규정된 바와 같이 본 발명의 정신 및 영역을 벗어나지 않는 범위에서 예상되고, 실현될 수 있다.

Claims (45)

  1. 오디오 대역폭을 구비하고, 알려진 샘플링 레이트에서 샘플링된 디지털 오디오 신호를 코딩하기 위한 다중 채널 오디오 엔코더에 있어서,
    코어 신호를 디지털 오디오 신호로부터 추출하고 코어 비트로 코딩하는 코어 엔코더(18)와,
    재구성된 코어 신호와 상기 디지털 오디오 신호로부터 차동 신호를 형성하는 가산(28) 노드와,
    상기 차동 신호를 확장 비트 안으로 엔코드하는 확장 엔코더(36)
    를 포함하는 다중 채널 오디오 엔코더.
  2. 제1항에 있어서, 코어 엔코더 및 확장 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭과 동일한 샘플링 레이트 및 오디오 대역폭을 갖고, 코딩 오류와 함께 재구성된 코어 신호를 형성하기 위해 상기 코어 비트를 디코드하는 코어 디코더(24)를 더 포함하고, 상기 재구성된 코어 신호는 상기 차동 신호를 생성하기 위해 상기 가산 노드에서 상기 디지털 오시오 신호로부터 차감된 것인 다중 채널 오디오 엔코더.
  3. 제1항에 있어서, 상기 확장 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭과 동일한 샘플링 레이트 및 오디오 대역폭을 갖고, 상기 코어 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭보다 낮은 샘플링 레이트 및 오디오 대역폭을 갖고,
    상기 코어 엔코더의 오디오 대역폭 이상의 신호 성분을 제거하기 위해 상기 디지털 오디오 신호를 필터링하는 데시메이션 저역 통과 필터(LPF; 140, 202)와,
    샘플링 레이트가 상기 코어 엔코더와 매치되고, 상기 코어 신호를 추출하기 위해 필터링된 신호를 다운 샘플링하는 데시메이터(142, 204)와,
    상기 재구성된 코어 신호를 생성하기 위해 상기 코어 비트를 디코드하는 코어 디코더(24)와,
    상기 재구성된 코어 신호를 확장 엔코더 샘플링 레이트까지 업샘플링하는 보간기(116)와,
    보간 에일리어싱을 제거하기 위해 상기 업샘플링된 재구성된 코어 신호를 필터링하는 보간 LPF(118)를 더 포함하고,
    상기 필터링된 신호는 상기 차동 신호를 형성하기 위해 상기 가산 노드에서 상기 디지털 오디오 신호로부터 차감되는 것인 다중 채널 오디오 엔코더.
  4. 제3항에 있어서, 상기 코어 비트는 오디오 대역폭에 있어서 상기 재구성된 코어 신호에 대한 노이즈 플로어를 규정하고, 상기 확장 비트는 상기 코어 엔코더의 오디오 대역폭에 있어서의 노이즈 플로어를 더욱 개량하고, 상기 확장 엔코더의 나머지 오디오 대역폭에 대한 노이즈 플로어를 규정하는 것인 다중 채널 오디오 엔코더.
  5. 제3항에 있어서, 상기 코어 비트는 오디오 대역폭에 있어서 상기 재구성된 코어 신호에 대한 노이즈 플로어를 규정하고, 상기 데시메이션 LPF의 전이 대역폭에 근접한 주파수 및 그 이상의 주파수에 상기 확장 비트가 할당되어 상기 확장 엔코더의 나머지 오디오 대역폭에 대한 노이즈 플로어를 규정하는 것인 다중 채널 오디오 엔코더.
  6. 제1항에 있어서, 상기 확장 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭과 동일한 샘플링 레이트 및 오디오 대역폭을 갖고, 상기 코어 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭보다 낮은 샘플링 레이트 및 오디오 대역폭을 갖고,
    상기 코어 엔코더의 오디오 대역폭 주변에 전이 대역폭을 갖고, 상기 코어 엔코더의 오디오 대역폭 이상의 신호 성분을 제거하기 위해 상기 디지털 오디오 신호를 필터링하는 데시메이션 저역 통과 필터(LPF; 140, 202)와,
    샘플링 레이트가 상기 코어 엔코더와 매치되고, 상기 코어 신호를 추출하기 위해 필터링된 신호를 다운 샘플링하는 데시메이터(142, 204)와,
    상기 재구성된 코어 신호를 형성하기 위해 상기 코어 신호를 상기 확장 엔코더 샘플링 레이트까지 업샘플링하는 보간기(116)와,
    보간 에일리어싱을 제거하기 위해 상기 업샘플링된 재구성된 코어 신호를 필터링하는 보간 LPF(118)를 더 포함하고,
    상기 필터링된 신호는 상기 차동 신호를 형성하기 위해 상기 가산 노드에서 상기 디지털 오디오 신호로부터 차감되고,
    상기 확장 코더는 상기 엔코드된 신호의 주파수 범위를 확장하기 위해 상기 전이 대역폭 및 그 이상에 비트들을 배치하는 것인 다중 채널 오디오 엔코더.
  7. 제1항에 있어서, 상기 코어 엔코더는 알려진 지연을 갖고,
    상기 디지털 오디오 신호 및 상기 재구성된 코어 신호를 시간 정렬하는 제1 지연(112)을 포함하고, 상기 가산 노드는 시간 영역 내에 차동 신호를 형성하는 것인 다중 채널 오디오 엔코더.
  8. 제7항에 있어서, 상용 가능한 디코더에서 시간 정렬을 유지하기 위해 상기 코어 비트 및 확장 비트를 시간 이동하는 제2 지연(121)을 더 포함하는 것인 다중 채널 오디오 엔코더.
  9. 제1항에 있어서, 상기 확장 엔코더는 상기 코어 엔코더의 오디오 대역폭에 걸쳐 상기 코어 엔코더를 매치하고, 상기 가산 노드는 상기 확장 코더 내부에 존재하고, 변환 또는 서브 밴드 영역 내에 상기 차동 신호를 형성하는 것인 다중 채널 오디오 엔코더.
  10. 제9항에 있어서, 상기 코어 엔코더는 상기 코어 신호를 N 개의 서브 밴드로분할하는 N 대역 필터 뱅크(208)와, 상기 코어 비트를 생성하는 N 서브 밴드 코더(206, 210)와, N 개의 서브 밴드 샘플을 재구성하는 N 서브 밴드 디코더(212)를 구비하고,
    상기 확장 엔코더는
    상기 디지털 오디오 신호를 하부 및 상부 대역으로 분리하는 2 대역 필터 뱅크(216)와,
    상기 하부 대역 내의 상기 디지털 오디오 신호를 N 개의 서브 밴드로 분할하는 상기 코어 엔코더의 것과 동등한 N 대역 필터 뱅크(218)와,
    상기 하부 대역 확장 비트를 형성하기 위해 N 개의 차 서브 밴드를 코딩하는 N 서브 밴드 코더(222)와,
    상기 상부 대역 내의 상기 디지털 오디오 신호를 M 개의 서브 밴드로 분할하는 M 대역 필터 뱅크(226)와,
    상기 상부 대역 확장 비트를 형성하기 위해 상기 M 개의 서브 밴드를 코딩하는 M 서브 밴드 코더(228)를 포함하고,
    상기 가산 노드는 상기 N 개의 차 서브 밴드를 형성하기 위해 상기 디지털 오디오 신호의 N 개의 서브 밴드로부터 상기 재구성된 N 개의 서브 밴드 샘플을 각각 차감하는 N 서브 밴드 노드를 포함하는 것인 다중 채널 오디오 엔코더.
  11. 제9항에 있어서, 상기 코어 엔코더는 상기 코어 신호를 N 개의 서브 밴드로 분할하는 N 대역 필터 뱅크(208)와, 상기 코어 비트를 생성하는 N 대역 코더(206,210)와, N 개의 서브 밴드 샘플을 재구성하는 N 서브 밴드 디코더(212)를 구비하고,
    상기 확장 엔코더는
    상기 디지털 오디오 신호를 N 개의 하부 서브 밴드 및 M 개의 상부 서브 밴드로 분할하는 L 대역 필터 뱅크(250)와,
    상기 하부 대역 확장 비트를 형성하기 위해 N 개의 차 서브 밴드를 코딩하는 N 서브 밴드 코더(222)와,
    상기 상부 대역 확장 비트를 형성하기 위해 M 개의 서브 밴드를 코딩하는 M 서브 밴드 코더를 포함하고,
    N 대역 필터 뱅크의 N 개의 하부 서브 밴드에 걸쳐 상기 L 대역 필터 뱅크의 필터 특성은 상기 N 대역 필터 뱅크의 필터 특성과 매칭되고, 상기 합계 노드는 N 개의 차 서브 밴드를 형성하기 위해 상기 디지털 오디오 신호의 N 개의 서브 밴드로부터 상기 재구성된 N 개의 서브 밴드 샘플을 각각 차감하는 N 개의 서브 밴드 노드를 포함하는 것인 다중 채널 오디오 엔코더.
  12. 제1항에 있어서, 코어 더하기 확장 포맷 내의 비트 스트림(40) 안으로 코어 비트 및 확장 비트를 팩킹하는 팩커를 더 포함하고, 상기 코어 더하기 확장 포맷 내의 상기 비트 스트림은 동기된 프레임(54)의 시퀀스를 포함하며, 각 프레임은 상기 코어 비트(61)를 구비하는 코어 필드(56)와 동기 워드(60) 및 상기 확장 비트(38)를 구비하는 확장 필드(58)를 구비하는 것인 다중 채널 오디오 엔코더.
  13. 제12항에 있어서, 상기 코어 필드는 동기 워드(61)를 또한 포함하는 것인 다중 채널 오디오 엔코더.
  14. 제2 세대 오디오 디코더로 더 높은 음질 재생을 제공하는 한편 제1 세대 오디오 디코더의 기존의 배이스와 상용성을 유지하기 위해 오디오 대역폭을 갖고, 알려진 샘플링 레이트에서 샘플링된 디지털 오디오 신호를 코딩하는 다중 채널 오디오 엔코더에 있어서,
    폴드 백(fold-back)의 에일리어싱 없이 코어 신호를 디지털 오디오 신호로부터 추출하고 코어 비트로 코딩하는 상기 제1 세대 오디오 디코더와 상용되는 코어 엔코더(18)와,
    재구성된 코어 신호(26)와 상기 디지털 오디오 신호로부터 차동 신호를 형성하는 가산(28) 노드와,
    상기 차동 신호를 확장 비트 안으로 엔코드하는 확장 엔코더(36)와,
    코어 더하기 확장 포맷 내의 비트 스트림(40) 안으로 코어 비트 및 확장 비트를 팩킹하는 팩커를 포함하고,
    상기 코어 더하기 확장 포맷 내의 상기 제1 세대 오디오 디코더는 오디오 신호를 생성하기 위해 코어 비트를 추출하고 디코드할 수 있으며, 상기 제2 세대 오디오 디코더는 더 높은 품질의 오디오 신호를 생성하기 위해 상기 코어 비트 더하기 확장 비트를 추출할 수 있는 것인 다중 채널 오디오 엔코더.
  15. 제14항에 있어서, 코어 엔코더 및 확장 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭과 동일한 샘플링 레이트 및 오디오 대역폭을 갖고, 재구성된 코어 신호를 형성하기 위해 상기 코어 비트를 디코드하는 제1 세대 오디오 디코더를 더 포함하고, 상기 재구성된 코어 신호는 상기 차동 신호를 생성하기 위해 상기 가산 노드에서 상기 디지털 오시오 신호로부터 차감된 것인 다중 채널 오디오 엔코더.
  16. 제14항에 있어서, 상기 확장 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭과 동일한 샘플링 레이트 및 오디오 대역폭을 갖고, 상기 코어 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭보다 낮은 샘플링 레이트 및 오디오 대역폭을 갖고,
    상기 코어 엔코더의 오디오 대역폭 이상의 신호 성분을 제거하기 위해 상기 디지털 오디오 신호를 필터링하는 데시메이션 저역 통과 필터(LPF; 140, 202)와,
    샘플링 레이트가 상기 코어 엔코더와 매치되고, 상기 코어 신호를 추출하기 위해 필터링된 신호를 다운 샘플링하는 데시메이터(142, 204)와,
    상기 재구성된 코어 신호를 생성하기 위해 상기 코어 비트를 디코드하는 제1 세대 오디오 디코더(206)와,
    상기 재구성된 코어 신호를 확장 엔코더 샘플링 레이트까지 업샘플링하는 보간기(116)와,
    보간 에일리어싱을 제거하기 위해 상기 업샘플링된 재구성된 코어 신호를 필터링하는 보간 LPF(118)를 더 포함하고,
    상기 필터링된 신호는 상기 차동 신호를 형성하기 위해 상기 가산 노드에서 상기 디지털 오디오 신호로부터 차감되는 것인 다중 채널 오디오 엔코더.
  17. 제14항에 있어서, 상기 확장 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭과 동일한 샘플링 레이트 및 오디오 대역폭을 갖고, 상기 코어 엔코더는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭보다 낮은 샘플링 레이트 및 오디오 대역폭을 갖고,
    상기 코어 엔코더의 오디오 대역폭 주변에 전이 대역폭을 갖고, 상기 코어 엔코더의 오디오 대역폭 이상의 신호 성분을 제거하기 위해 상기 디지털 오디오 신호를 필터링하는 데시메이션 저역 통과 필터(LPF; 140, 202)와,
    샘플링 레이트가 상기 코어 엔코더와 매치되고, 상기 코어 신호를 추출하기 위해 필터링된 신호를 다운 샘플링하는 데시메이터(142, 204)와,
    상기 재구성된 코어 신호를 형성하기 위해 상기 코어 신호를 상기 확장 엔코더 샘플링 레이트까지 업샘플링하는 보간기(116)와,
    보간 에일리어싱을 제거하기 위해 상기 업샘플링된 재구성된 코어 신호를 필터링하는 보간 LPF(118)를 더 포함하고,
    상기 필터링된 신호는 상기 차동 신호를 형성하기 위해 상기 가산 노드에서 상기 디지털 오디오 신호로부터 차감되고,
    상기 확장 코더는 상기 엔코드된 신호의 주파수 범위를 확장하기 위해 상기 전이 대역폭 및 그 이상에 비트들을 배치하는 것인 다중 채널 오디오 엔코더.
  18. 제14항에 있어서, 상기 코어 엔코더는 알려진 지연을 갖고,
    상기 디지털 오디오 신호 및 상기 재구성된 코어 신호를 시간 정렬하는 제1 지연(112)과,
    상용 가능한 제2 세대 디코더에서 시간 정렬을 유지하기 위해 상기 코어 비트 및 확장 비트를 시간 이동하는 제2 지연(121)을 더 포함하고,
    상기 가산 노드는 시간 영역 내에 차동 신호를 형성하는 것인 다중 채널 오디오 엔코더.
  19. 제14항에 있어서, 상기 확장 엔코더는 상기 코어 엔코더의 오디오 대역폭에 걸쳐 상기 코어 엔코더를 매치하고, 상기 가산 노드는 상기 확장 코더 내부에 존재하고, 변환 또는 서브 밴드 영역 내에 상기 차동 신호를 형성하는 것인 다중 채널 오디오 엔코더.
  20. 각 오디오 채널이 알려진 샘플링 레이트에서 샘플링되고 오디오 대역폭을 갖는, 비트 스트림(40)으로부터의 다중 오디오 채널을 재구성하는 다중 채널 블랙 박스 오디오 디코더에 있어서,
    상기 비트 스트림을 동시에 프레임(54)에 저장 및 판독하는 언팩커(66)와,
    재구성된 코어 신호를 형성하기 위해 상기 코어 비트를 디코드하는 코어 디코더(68)와,
    재구성된 차동 신호를 형성하기 위해 상기 확장 비트를 디코드하는 확장 디코더(70)와,
    상기 재구성된 코어 신호의 충실도를 개선하기 위해 상기 재구성된 코어 오디오 신호에 상기 차오디오 신호를 더하는 가산 노드(74)를 포함하고,
    각각의 상기 프레임은 코어 비트(20)를 갖는 코어 필드(56) 및 동기 워드(60) 및 확장 비트(38)를 갖는 확장 필드(58)를 구비하고, 상기 언팩커는 상기 확장 비트를 추출하고 분할하기 위해 상기 코어 비트를 추출하고 상기 동기 워드를 검출하는 것인 다중 채널 블랙 박스 오디오 디코더.
  21. 제20항에 있어서, 상기 코어 디코더 및 상기 확장 디코더는 동일한 샘플링 레이트 및 오디오 대역폭을 가지므로 재구성된 코어 신호에의 차동 신호 부가는 노이즈 플로어를 낮추는 것인 다중 채널 블랙 박스 오디오 디코더.
  22. 제20항에 있어서, 상기 확장 엔코더는 상기 코어 엔코더보다 더 빠른 샘플링 레트 및 더 넓은 오디오 대역폭을 갖고,
    상기 재구성된 코어 신호를 상기 확장 엔코더의 샘플링 레이트까지 업샘플링하는 보간기(130)와,
    보간 에일리어싱을 감쇠하기 위해 업샘플링된 재구성된 코어 신호를 필터링하는 저역 필터(132)를 포함하고,
    재구성된 코어 신호에의 재구성된 차오디오 신호의 부가로 오디오 대역폭을 확장하는 것인 다중 채널 블랙 박스 오디오 디코더.
  23. 각 오디오 채널이 알려진 샘플링 레이트에서 샘플링되고 오디오 대역폭을 갖는, 비트 스트림(40)으로부터의 다중 오디오 채널을 재구성하는 다중 채널 오픈 박스 오디오 디코더에 있어서,
    언팩커(230)와,
    N 개의 코어 서브 밴드 디코더(232)와,
    N 개의 확장 서브 밴드 디코더(240)와,
    M 개의 확장 서브 밴드 디코더(244)와,
    N 개의 가산 노드와,
    필터(242, 246, 248)를 포함하고,
    상기 언팩커(230)는 상기 비트 스트림을 동시에 프레임(54)에 저장 및 판독하고, 각각의 상기 프레임은 코어 비트(61)를 갖는 코어 필드(56) 및 동기 워드 및 확장 비트를 갖는 확장 필드(58)를 구비하고, 상기 언팩커는 상기 확장 비트를 추출하고 분할하기 위해 상기 코어 비트를 추출하고 상기 동기 워드(60)를 검출하고,
    상기 개의 N 코어 서브 밴드 디코더(232)는 상기 코어 비트를 N 개의 코어 서브 밴드 신호로 디코드하고,
    상기 N 개의 확장 서브 밴드 디코더(240)는 상기 확장 비트를 하부 N 개의확장 서브 밴드 신호로 디코드하고,
    상기 M 개의 확장 서브 밴드 디코더(244)는 상기 확장 비트를 상부 M 개의 확장 서브 밴드 신호로 디코드하고,
    상기 N 개의 가산 노드는 N 개의 합성 서브 밴드 신호를 형성하기 위해 상기 N 개의 코어 서브 밴드 신호를 상기 N 개의 확장 서브 밴드 신호에 각각 더하고,
    상기 필터(242, 246, 248)는 다중 채널 오디오 신호를 생성하기 위해 상기 N 개의 합성 서브 밴드 신호 및 상기 M 개의 확장 서브 밴드 신호를 합성하는 것인 다중 채널 오픈 박스 오디오 디코더.
  24. 제23항에 있어서, 상기 필터는 단일의 M+N 대역 필터 뱅크(242)이고, 이 필터 내에서 상기 하부의 N 개의 대역은 상기 N 개의 코어 서브 밴드 디코더와 상용되는 것인 다중 채널 오픈 박스 오디오 디코더.
  25. 제23항에 있어서, 상기 필터는
    상기 N 개의 합성 서브 밴드 신호를 합성하고, 상기 N 개의 코어 서브 밴드 디코더와 상용되는 N 대역 필터 뱅크와,
    상기 M 개의 확장 서브 밴드 신호를 합성하는 M 대역 필터 뱅크(246)와,
    상기 다중 채널 오디오 신호를 재구성하기 위해 상기 N 및 M 대역 필터 뱅크의 출력을 결합하는 2 대역 필터 뱅크(248)
    를 포함하는 것인 다중 채널 오픈 박스 오디오 디코더.
  26. 휴대 장치로 판독 가능한 저장 매체와,
    상기 저장 매체에 기록된 다중 채널 오디오 신호를 나타내는 디지털 비트 스트림(40)을 포함하고,
    상기 비트 스트림은 동기된 프레임(54)의 시퀀스를 포함하고, 각각의 상기 프레임은 코어 비트(20)를 갖는 코어 필드(56)와, 동기 워드(60) 및 확장 비트(38)를 갖는 확장 필드(58)를 포함하는 것인 제조품.
  27. 제26항에 있어서, 상기 다중 채널 오디오 신호는 상기 저장 매체에 기록된 단하나 밖에 없는 상기 디지털 비트 스트림에 의해 표현되는 것인 제조품.
  28. 제26항에 있어서, 상기 다중 채널 오디오 신호는 알려진 샘플링 레이트 및 오디오 대역폭을 갖고, 상기 코어 비트는 상기 오디오 신호의 대역폭에 걸쳐 상기 오디오 신호를 재구성하기 위한 노이즈 플로어를 규정하고, 상기 확장 비트는 상기 노이즈 플로어를 낮추는 것인 제조품.
  29. 제26항에 있어서, 상기 다중 채널 오디오 신호는 알려진 샘플링 레이트 및 오디오 대역폭을 갖고, 상기 코어 비트는 상기 재구성된 코어 신호의 대역폭에 걸쳐 상기 재구성된 코어 신호에 대한 노이즈 플로어를 규정하고, 상기 확장 비트는상기 확장 엔코더의 오디오 대역폭의 나머지에 대한 노이즈 플로어를 규정하는 것인 제조품.
  30. 제29항에 있어서, 상기 확장 비트는 상기 코어 엔코더의 오디오 대역폭에 걸쳐 상기 노이즈 플로어를 더욱 개량하는 것인 제조품.
  31. 오디오 대역폭과 샘플링 분해능에 이르기까지 코어 신호를 재구성할 수 있는 제1 세대 오디오 디코더의 기존 베이스 및 대역폭이 보다 넓은 제2 세대 오디오 디코더의 개발 베이스와 함께 사용하기 위한 제조품에 있어서,
    상기 제1 및 제2 세대 오디오 디코더와 함께 사용하기 위한 것으로서, 휴대 장치에 의해 판독 가능한 저장 매체와,
    코어 더하기 확장 포맷으로 상기 저장 매체에 기록된 다중 채널 오디오 신호를 나타내는 단일 디지털 비트 스트림(40)을 포함하고,
    상기 비트 스트림은 동기된 프레임(54)의 시퀀스를 구비하고, 각각의 상기 프레임은 코어 비트(20) 직전에 오는 코어 동기 워드(61)를 구비한 코어 필드(56)와, 확장 비트(38) 직전에 오는 확장 동기 워드(60)를 구비한 확장 필드(58)를 포함하고,
    상기 코어 비트의 시퀀스는 상기 제1 세대 오디오 디코더의 오디오 대역폭에 걸쳐 상기 재구성된 코어 신호에 대한 노이즈 플로어를 규정하고,
    상기 확장 비트의 시퀀스는 상기 코어 엔코더의 오디오 대역폭에 걸쳐 상기노이즈 플로어를 더욱 개량하고, 상기 제2 세대 오디오 디코더의 나머지 오디오 대역폭에 대한 노이즈 플로어를 규정하는 것인 제조품.
  32. 동기된 프레임의 시퀀스를 구비하는 반송파에 포함된 디지털 오디오 신호에 있어서, 각각의 상기 프레임은 오디오 대역폭 및 샘플 분해능에 이르기까지의 코어 신호를 나타내는 코어 비트를 구비한 코어 필드와, 오디오 대역폭의 확장 및/또는 코어 신호의 샘플 분해능 증대를 행하는 확장 오디오 신호를 나타낸 확장 비트 및확장 동기 워드를 구비하는 확장 필드를 포함하는 것인 디지털 오디오 신호.
  33. 제32항에 있어서, 상기 디지털 오디오 신호는 단일의 상기 동기된 프레임의 시퀀스를 포함하는 것인 디지털 오디오 신호.
  34. 제32항에 있어서, 각각의 상기 코어 필드는 코어 동기 워드를 포함하는 것인 디지털 오디오 신호.
  35. 입력 직렬 포트 및 출력 직렬 포트를 구비한 프로세서(180, 182)와,
    순차적으로 비트 스트림 데이터를 수신하는 수신기(188)와,
    제1 프로세서의 상기 출력 직렬 포트로부터의 오디오 신호 수신 및 상기 오디오 신호를 다중 오디오 채널로 향하게 하는 것과 양립하는 복수의 송신기(190a,b,c)를 포함하고,
    각각의 상기 프레임은 코어 비트를 구비하는 코어 필드와, 동기 워드 및 확장 비트를 구비하는 확장 필드를 포함하고, 상기 비트 스트림 데이터를 상기 제1 프로세서의 입력 직렬 포트에 공급하기 적절한 직렬 데이터 포맷으로 변환하고,
    상기 프로세서는 코어 오디오 신호를 재구성하기 위해 상기 코어 비트(20)를 디코딩하고, 차오디오 신호를 재구성하기 위해 상기 확장 비트(38)를 디코딩하며, 충실도를 증대시키기 위해 상기 코어 오디오 신호에 상기 차오디오 신호를 부가하여 이를 상기 다중 오디오 신호에 분할하기 위해 상기 출력 직렬 포트(192)로 전달하는 것인 다중 채널 블랙 박스 오디오 디코더.
  36. 제35항에 있어서, 상기 프로세서는 제1 및 제2 프로세서(180, 182) 및 상기 프로세서 사이의 오디오 데이터를 교환하는 공유 버스(194)를 포함하고,
    상기 제1 프로세서는 상기 코어 오디오 신호를 재구성하기 위하여 상기 코어 비트를 디코딩하고, 상기 제2 프로세서는 상기 차오디오 신호를 재구성하기 위해 상기 확장 비트를 디코딩하며, 이를 상기 코어 오디오 신호에 부가하여 상기 가산된 오디오 신호를 상기 프로세서의 출력 직렬 포트로 되돌려 전달하는 것인 다중 채널 블랙 박스 오디오 디코더.
  37. 제2 세대 오디오 디코더로 고음질 재생을 제공하는 한편, 제1 세대 오디오 디코더의 기존의 베이스와 상용성을 유지하는 오디오 대역폭을 갖고, 알려진 샘플링 레이트에서 샘플링된 다중 채널 디지털 오디오 신호를 엔코딩하는 방법에 있어서,
    상기 디지털 오디오 신호로부터 코어 신호를 추출하는 단계와,
    상기 제1 세대 오디오 디코더와 상용되는 방법으로, 에일리어싱 폴드백 없이 상기 코어 신호를 코어 비트로 엔코딩하는 단계와,
    재구성된 코어 신호 및 상기 디지털 오디오 신호로부터 차동 신호를 형성하는 단계와,
    상기 차동 신호를 확장 비트로 엔코딩하는 단계와,
    상기 코어 비트 및 상기 확장 비트를 코어 더하기 확장 포맷의 비트 스트림 내에 팩킹하는 단계를 포함하고,
    상기 제1 세대 오디오 디코더는 오디오 신호를 생성하기 위해 상기 코어 비트를 추출 및 디코드할 수 있고, 상기 제2 세대 오디오 디코더는 고품질 오디오 신호를 재생하기 위해 상기 코어 비트 더하기 확장 비트를 추출할 수 있는 것인 다중 채널 디지털 오디오 신호 엔코딩 방법.
  38. 제37항에 있어서, 상기 코어 및 차동 신호는 상기 디지털 오디오 신호의 샘플링 레이트 및 오디오 대역폭과 동일한 샘플링 레이트 및 오디오 대역폭에서 엔코드되고, 코딩 오류와 함께 재구성된 코어 신호를 형성하기 위해 상기 코어 비트를 디코드하는 제1 세대 오디오 디코더를 사용하는 단계를 더 포함하며, 상기 재구성된 코어 신호는 상기 차동 신호를 생성하기 위해 상기 디지털 오디오 신호로부터 차감되는 것인 다중 채널 디지털 오디오 신호 엔코딩 방법.
  39. 제37항에 있어서, 상기 차동 신호는 상기 디지털 오디오 신호의 확장 샘플링 데이터 및 확장 오디오 대역폭과 동등한 확장 샘플링 레이트 및 확장 오디오 대역폭에서 엔코드되고, 상기 코어 신호는 상기 디지털 오디오 신호의 코어 샘플링 레이트 및 코어 오디오 대역폭보다 작은 샘플링 레이트 및 코어 오디오 대역폭에서 엔코드 되며,
    상기 코어 오디오 대역폭 이상의 신호 성분을 제거하기 위해 상기 디지털 오디오 신호를 저역 통과 필터링하는 단계와,
    상기 코어 샘플링 레이트와 매칭되는 샘플링 레이트를 갖는 상기 코어 신호를 추출하기 위해 상기 필터링된 신호를 다운 샘플링하는 단계와,
    상기 재구성된 코어 신호를 형성하기 위해 상기 코어 비트를 디코드하는 제1 세대 오디오 디코더를 사용하는 단계와,
    상기 재구성된 코어 신호를 상기 확장 샘플링 레이트까지 업샘플링하는 단계와,
    보간 에일리어싱을 제거하기 위해 상기 업샘플링된 재구성된 코어 신호를 저역 통과 필터링하는 단계를 더 포함하고, 상기 필터링된 신호는 상기 차동 신호를 형성하기 위해 상기 디지털 오디오 신호로부터 차감되는 것인 다중 채널 디지털 오디오 신호 엔코딩 방법.
  40. 제37항에 있어서, 상기 차동 신호는 상기 디지털 오디오 신호의 확장 샘플링레이트 및 확장 오디오 대역폭과 동등한 확장 샘플링 레이트 및 확장 오디오 대역폭에서 엔코드되고, 상기 코어 신호는 상기 디지털 오디오 신호의 코어 샘플링 레이트 및 코어 오디오 대역폭보다 작은 샘플링 레이트 및 코어 오디오 대역폭에서 엔코드 되며,
    상기 코어 오디오 대역폭 이상의 신호 성분을 제거하기 위해 상기 디지털 오디오 신호를 저역 통과 필터링하는 단계와,
    상기 코어 샘플링 레이트와 매칭되는 샘플링 레이트를 갖는 상기 코어 신호를 추출하기 위해 상기 필터링된 신호를 다운 샘플링하는 단계와,
    재구성된 코어 신호를 형성하기 위해 상기 코어 신호를 상기 확장 샘플링 레이트까지 업샘플링하는 단계와,
    보간 에일리어싱을 제거하기 위해 상기 업샘플링된 재구성된 코어 신호를 필터링하는 단계와,
    상기 차동 신호를 엔코드하고, 상기 엔코드된 신호의 주파수 영역을 확장하기 위해 확장 비트를 상기 전이 대역폭 및 그 이상에 할당하는 단계를 더 포함하고,
    상기 필터링 단계는 상기 코어 오디오 대역폭 주변의 전이 대역폭을 나타내고, 상기 필터링된 신호는 상기 차동 신호를 형성하기 위해 상기 디지털 오디오 신호로부터 차감되는 것인 다중 채널 디지털 오디오 신호 엔코딩 방법.
  41. 제37항에 있어서, 알려진 지연을 갖는 상기 코어 신호 엔코딩 단계는
    상기 디지털 오디오 신호를 상기 코어 신호와 함께 시간 정렬하기 위해 지연하는 단계와,
    상기 시간 영역 내에서 상기 차동 신호를 형성하는 단계와,
    상용성 제2 세대 디코더에서 시간 정렬을 유지하기 위해 상기 코어 비트 및 확장 비트를 지연하는 단계
    를 더 포함하는 다중 채널 디지털 오디오 신호 엔코딩 방법.
  42. 제37항에 있어서, 상기 코어 및 차동 신호는 변환 또는 서브 밴드 코딩 기술을 사용하여 엔코딩되고, 상기 코딩 기술에서는 상기 코어 오디오 대역폭에 걸쳐 상기 차동 신호의 코딩이 상기 코어 신호의 코딩과 매칭되고, 상기 차동 신호는 변환 또는 서브 밴드 영역 내에서 형성되는 것인 다중 채널 디지털 오디오 신호 엔코딩 방법.
  43. 다중 채널 오디오 신호를 재구성하는 방법에 있어서,
    엔코드된 프레임(54)의 시퀀스를 수신하는 단계를 포함하고,
    각각의 상기 프레임은 코어 비트(20) 직전에 오는 코어 동기 워드(61)를 구비하는 코어 필드(56)와, 확장 비트(38) 직전에 오는 확장 동기 워드(60)를 구비하는 확장 필드(58)를 구비하고,
    상기 코어 비트를 코어 신호로 추출하여 디코드하기 위해 상기 코어 동기 워드를 검출하는 단계와,
    상기 확장 동기 워드를 무시하여 상기 확장 비트를 무시하는 단계와,
    상기 재구성된 다중 채널 오디오 신호로서 상기 재구성된 코어 신호를 출력하는 단계를 포함하는 것인 다중 채널 오디오 신호 재구성 방법.
  44. 다중 채널 오디오 신호를 재구성하는 방법에 있어서,
    엔코드된 프레임(54)의 시퀀스를 수신하는 단계를 포함하고,
    각각의 상기 프레임은 코어 비트(20) 직전에 오는 코어 동기 워드(61)를 구비하는 코어 필드(56)와, 확장 비트(38) 직전에 오는 확장 동기 워드(60)를 구비하는 확장 필드(58)를 구비하고,
    상기 코어 비트를 상기 재구성된 코어 신호로 추출하여 디코드하기 위해 상기 코어 동기 워드를 검출하는 단계와,
    상기 확장 비트를 재구성된 차동 신호로 추출하여 디코드하기 위해 상기 확장 동기 워드를 검출하는 단계와,
    상기 다중 채널 오디도 신호를 재구성하기 위해 상기 재구성된 코어 및 차동 신호를 가산하는 단계를 포함하는 것인 다중 채널 오디오 신호 재구성 방법.
  45. 제44항에 있어서, 상기 확장 비트는 상기 코어 비트보다 넓은 오디오 대역폭 및 높은 샘플링 레이트에서 디코드되고,
    상기 재구성된 코어 신호를 상기 재구성된 차동 신호의 샘플링 레이트까지 업샘플링하는 단계와,
    보간 에일리어싱을 감쇠하기 위해 상기 업샘플링된 재구성된 코어 신호를 저역 통과 필터링하는 단계를 더 포함하고,
    상기 코어 및 차동 신호의 가산은 상기 코어 신호의 오디오 대역폭을 확장하는 것인 다중 채널 오디오 신호 재구성 방법.
KR1020017016475A 1999-06-21 2000-06-19 디코더 호환성의 손실 없이 달성되는 낮은 비트 레이트 오디오 코딩 시스템의 음질 개선을 위한 다중 채널 오디오 엔코더, 다중 채널 블랙 박스 오디오 디코더, 다중 채널 오픈 박스 오디오 디코더, 다중 채널 디지털 오디오 신호 엔코딩 방법 및 재구성 방법 KR100606992B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/337,405 1999-06-21
US09/337,405 US6226616B1 (en) 1999-06-21 1999-06-21 Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility

Publications (2)

Publication Number Publication Date
KR20020027364A true KR20020027364A (ko) 2002-04-13
KR100606992B1 KR100606992B1 (ko) 2006-07-31

Family

ID=23320428

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017016475A KR100606992B1 (ko) 1999-06-21 2000-06-19 디코더 호환성의 손실 없이 달성되는 낮은 비트 레이트 오디오 코딩 시스템의 음질 개선을 위한 다중 채널 오디오 엔코더, 다중 채널 블랙 박스 오디오 디코더, 다중 채널 오픈 박스 오디오 디코더, 다중 채널 디지털 오디오 신호 엔코딩 방법 및 재구성 방법

Country Status (9)

Country Link
US (1) US6226616B1 (ko)
EP (2) EP1204970B1 (ko)
JP (2) JP4204227B2 (ko)
KR (1) KR100606992B1 (ko)
CN (1) CN1154087C (ko)
AU (1) AU5745200A (ko)
HK (1) HK1043422A1 (ko)
TW (1) TW565826B (ko)
WO (1) WO2000079520A1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100825548B1 (ko) * 2004-08-17 2008-04-28 마쯔시다덴기산교 가부시키가이샤 정보 기록 매체, 데이터 분별 장치, 및 데이터 재생 장치
KR100865826B1 (ko) * 2004-08-17 2008-10-28 파나소닉 주식회사 정보 기록 매체 및 데이터 재생 장치
KR101386270B1 (ko) * 2006-07-18 2014-04-17 톰슨 라이센싱 손실 인코딩된 신호와 함께 상기 신호에 대한 무손실 인코딩된 확장 데이터의 오디오 비트스트림 데이터 구조 배열
KR101424809B1 (ko) * 2006-10-02 2014-08-01 소니 주식회사 신호 처리 장치, 신호 처리 방법 및 프로그램이 기록된 기록매체

Families Citing this family (162)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030195974A1 (en) * 1998-12-04 2003-10-16 Ronning Joel A. Apparatus and method for scheduling of search for updates or downloads of a file
SE9903553D0 (sv) 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
EP1228506B1 (en) * 1999-10-30 2006-08-16 STMicroelectronics Asia Pacific Pte Ltd. Method of encoding an audio signal using a quality value for bit allocation
US7584291B2 (en) * 2000-05-12 2009-09-01 Mosi Media, Llc System and method for limiting dead air time in internet streaming media delivery
JP2003535425A (ja) * 2000-05-30 2003-11-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ Cdオーディオ上のコード化された情報
US7076053B1 (en) * 2001-01-12 2006-07-11 3Com Corporation System for the processing of audio data used for music on hold and paging in a private branch exchange
US7631088B2 (en) * 2001-02-27 2009-12-08 Jonathan Logan System and method for minimizing perceived dead air time in internet streaming media delivery
JP4008244B2 (ja) * 2001-03-02 2007-11-14 松下電器産業株式会社 符号化装置および復号化装置
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
US8605911B2 (en) 2001-07-10 2013-12-10 Dolby International Ab Efficient and scalable parametric stereo coding for low bitrate audio coding applications
GB0119569D0 (en) * 2001-08-13 2001-10-03 Radioscape Ltd Data hiding in digital audio broadcasting (DAB)
JP4245288B2 (ja) 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
CN100395817C (zh) * 2001-11-14 2008-06-18 松下电器产业株式会社 编码设备、解码设备和解码方法
WO2003042981A1 (en) * 2001-11-14 2003-05-22 Matsushita Electric Industrial Co., Ltd. Audio coding and decoding
JP4308229B2 (ja) * 2001-11-14 2009-08-05 パナソニック株式会社 符号化装置および復号化装置
DE60202881T2 (de) 2001-11-29 2006-01-19 Coding Technologies Ab Wiederherstellung von hochfrequenzkomponenten
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
WO2003077425A1 (fr) * 2002-03-08 2003-09-18 Nippon Telegraph And Telephone Corporation Procedes de codage et de decodage signaux numeriques, dispositifs de codage et de decodage, programme de codage et de decodage de signaux numeriques
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US20040125707A1 (en) * 2002-04-05 2004-07-01 Rodolfo Vargas Retrieving content of various types with a conversion device attachable to audio outputs of an audio CD player
US7299190B2 (en) 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
TW573293B (en) * 2002-09-13 2004-01-21 Univ Nat Central Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof
SE0202770D0 (sv) 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
US7606330B2 (en) * 2002-09-27 2009-10-20 Broadcom Corporation Dual-rate single band communication system
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
FR2852172A1 (fr) * 2003-03-04 2004-09-10 France Telecom Procede et dispositif de reconstruction spectrale d'un signal audio
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
DE602004004950T2 (de) * 2003-07-09 2007-10-31 Samsung Electronics Co., Ltd., Suwon Vorrichtung und Verfahren zum bitraten-skalierbaren Sprachkodieren und -dekodieren
JP4471931B2 (ja) * 2003-07-29 2010-06-02 パナソニック株式会社 オーディオ信号帯域拡張装置及び方法
JP2005086486A (ja) * 2003-09-09 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ処理方法
JP4679049B2 (ja) 2003-09-30 2011-04-27 パナソニック株式会社 スケーラブル復号化装置
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
PL2228791T3 (pl) 2004-03-25 2015-10-30 Dts Inc Skalowalny bezstratny kodek audio i narzędzie do authoringu
US8626494B2 (en) * 2004-04-30 2014-01-07 Auro Technologies Nv Data compression format
KR100636145B1 (ko) * 2004-06-04 2006-10-18 삼성전자주식회사 확장된 고해상도 오디오 신호 부호화 및 복호화 장치
NL1029156C2 (nl) * 2004-06-04 2006-07-25 Samsung Electronics Co Ltd Apparaat en werkwijze.
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US8284955B2 (en) 2006-02-07 2012-10-09 Bongiovi Acoustics Llc System and method for digital signal processing
EP1797563B1 (en) * 2004-10-07 2013-03-13 Panasonic Corporation Information storage medium, ts packet judgment apparatus, and data reproduction apparatus
KR20070070174A (ko) * 2004-10-13 2007-07-03 마츠시타 덴끼 산교 가부시키가이샤 스케일러블 부호화 장치, 스케일러블 복호 장치 및스케일러블 부호화 방법
SE0402650D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Improved parametric stereo compatible coding of spatial audio
SE0402651D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
KR100617165B1 (ko) * 2004-11-19 2006-08-31 엘지전자 주식회사 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법
DE102004056447A1 (de) * 2004-11-23 2006-05-24 Siemens Ag Codierverfahren und Decodierverfahren, sowie Codiervorrichtung und Decodiervorrichtung
WO2006075269A1 (en) 2005-01-11 2006-07-20 Koninklijke Philips Electronics N.V. Scalable encoding/decoding of audio signals
JP2006243041A (ja) * 2005-02-28 2006-09-14 Yutaka Yamamoto 高域補間装置及び再生装置
JP2006243043A (ja) * 2005-02-28 2006-09-14 Sanyo Electric Co Ltd 高域補間装置及び再生装置
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US8249861B2 (en) * 2005-04-20 2012-08-21 Qnx Software Systems Limited High frequency compression integration
US7813931B2 (en) * 2005-04-20 2010-10-12 QNX Software Systems, Co. System for improving speech quality and intelligibility with bandwidth compression/expansion
WO2006126844A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
JP4391450B2 (ja) * 2005-07-28 2009-12-24 シャープ株式会社 再生装置、コンテンツ記録媒体、再生装置の制御方法、制御プログラムおよび記録媒体
US7742913B2 (en) 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8521313B2 (en) * 2006-01-19 2013-08-27 Lg Electronics Inc. Method and apparatus for processing a media signal
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
JP2009526263A (ja) 2006-02-07 2009-07-16 エルジー エレクトロニクス インコーポレイティド 符号化/復号化装置及び方法
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US7835904B2 (en) * 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
EP1852849A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US8190441B2 (en) * 2006-09-11 2012-05-29 Apple Inc. Playback of compressed media files without quantization gaps
CN1920947B (zh) * 2006-09-15 2011-05-11 清华大学 用于低比特率音频编码的语音/音乐检测器
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
US7912729B2 (en) 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8046214B2 (en) * 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
WO2009029037A1 (en) * 2007-08-27 2009-03-05 Telefonaktiebolaget Lm Ericsson (Publ) Adaptive transition frequency between noise fill and bandwidth extension
CN101388212B (zh) * 2007-09-15 2011-05-11 华为技术有限公司 基于噪声整形的语音编解码方法、编解码装置
US8249883B2 (en) * 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
EP2232488B1 (en) * 2008-01-14 2011-07-13 Telefonaktiebolaget LM Ericsson (publ) Objective measurement of audio quality
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
CN101685637B (zh) * 2008-09-27 2012-07-25 华为技术有限公司 音频编码方法及装置和音频解码方法及装置
JP5031006B2 (ja) * 2009-09-04 2012-09-19 パナソニック株式会社 スケーラブル復号化装置及びスケーラブル復号化方法
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
CN101964188B (zh) 2010-04-09 2012-09-05 华为技术有限公司 语音信号编码、解码方法、装置及编解码系统
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
WO2011156905A2 (en) * 2010-06-17 2011-12-22 Voiceage Corporation Multi-rate algebraic vector quantization with supplemental coding of missing spectrum sub-bands
CN102610231B (zh) * 2011-01-24 2013-10-09 华为技术有限公司 一种带宽扩展方法及装置
CN106409299B (zh) 2012-03-29 2019-11-05 华为技术有限公司 信号编码和解码的方法和设备
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
CA2985121C (en) 2013-01-29 2019-03-12 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
RU2676870C1 (ru) * 2013-01-29 2019-01-11 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора
BR112015025080B1 (pt) 2013-04-05 2021-12-21 Dolby International Ab Método de decodificação e decodificador para decodificar dois sinais de áudio, método de codificação e codificador para codificar dois sinais de áudio, e meio legível não transitório
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
EP3291233B1 (en) * 2013-09-12 2019-10-16 Dolby International AB Time-alignment of qmf based processing data
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
US9397629B2 (en) * 2013-10-22 2016-07-19 Bongiovi Acoustics Llc System and method for digital signal processing
ES2657337T3 (es) * 2013-10-31 2018-03-02 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Extensión de ancho de banda de audio mediante inserción de ruido pre-formado temporal en el dominio de frecuencia
US9524720B2 (en) * 2013-12-15 2016-12-20 Qualcomm Incorporated Systems and methods of blind bandwidth extension
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
CN104934034B (zh) * 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
GB2524333A (en) * 2014-03-21 2015-09-23 Nokia Technologies Oy Audio signal payload
US10639000B2 (en) 2014-04-16 2020-05-05 Bongiovi Acoustics Llc Device for wide-band auscultation
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
US9609451B2 (en) * 2015-02-12 2017-03-28 Dts, Inc. Multi-rate system for audio processing
CN107258059B (zh) * 2015-02-24 2020-12-18 瑞典爱立信有限公司 无线电网络节点以及在其中执行的方法
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
WO2017053447A1 (en) 2015-09-25 2017-03-30 Dolby Laboratories Licensing Corporation Processing high-definition audio data
US10762911B2 (en) * 2015-12-01 2020-09-01 Ati Technologies Ulc Audio encoding using video information
CN107925388B (zh) * 2016-02-17 2021-11-30 弗劳恩霍夫应用研究促进协会 后置处理器、预处理器、音频编解码器及相关方法
WO2017164156A1 (ja) 2016-03-22 2017-09-28 ヤマハ株式会社 信号処理装置、音響信号の転送方法、及び、信号処理システム
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
DE102016220886B3 (de) * 2016-10-24 2018-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Interleaving für die Übertragung von Telegrammen mit variabler Subpaketanzahl und sukzessiver Decodierung
EP3539126B1 (en) * 2016-11-08 2020-09-30 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation
CN109801639B (zh) * 2017-11-16 2020-12-18 全景声科技南京有限公司 一种符合ac-3格式的全景声信号的编解码方法
JP2021521700A (ja) 2018-04-11 2021-08-26 ボンジョビ アコースティックス リミテッド ライアビリティー カンパニー オーディオ強化聴力保護システム
US11081116B2 (en) 2018-07-03 2021-08-03 Qualcomm Incorporated Embedding enhanced audio transports in backward compatible audio bitstreams
US20200013426A1 (en) * 2018-07-03 2020-01-09 Qualcomm Incorporated Synchronizing enhanced audio transports with backward compatible audio transports
US10911013B2 (en) 2018-07-05 2021-02-02 Comcast Cable Communications, Llc Dynamic audio normalization process
US10959035B2 (en) 2018-08-02 2021-03-23 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
CN113302688A (zh) * 2019-01-13 2021-08-24 华为技术有限公司 高分辨率音频编解码
CN110085267B (zh) * 2019-04-23 2022-02-08 晶晨半导体(上海)股份有限公司 一种弥补器件差异的调节电路
CN113747304B (zh) * 2021-08-25 2024-04-26 深圳市爱特康科技有限公司 一种新型的低音回放方法和装置

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4354057A (en) * 1980-04-08 1982-10-12 Bell Telephone Laboratories, Incorporated Predictive signal coding with partitioned quantization
USRE32124E (en) * 1980-04-08 1986-04-22 At&T Bell Laboratories Predictive signal coding with partitioned quantization
US4554670A (en) * 1982-04-14 1985-11-19 Nec Corporation System and method for ADPCM transmission of speech or like signals
US4860312A (en) * 1988-04-12 1989-08-22 Motorola, Inc. Quality improvement for a digitally transmitted information signal
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
WO1999012317A1 (en) * 1997-08-29 1999-03-11 Bell Canada Digital transmission using subband coding
US5859641A (en) * 1997-10-10 1999-01-12 Intervoice Limited Partnership Automatic bandwidth allocation in multimedia scripting tools
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100825548B1 (ko) * 2004-08-17 2008-04-28 마쯔시다덴기산교 가부시키가이샤 정보 기록 매체, 데이터 분별 장치, 및 데이터 재생 장치
KR100865826B1 (ko) * 2004-08-17 2008-10-28 파나소닉 주식회사 정보 기록 매체 및 데이터 재생 장치
KR100869605B1 (ko) * 2004-08-17 2008-11-21 파나소닉 주식회사 정보 기록 매체 및 데이터 재생 장치
KR100890095B1 (ko) * 2004-08-17 2009-03-24 파나소닉 주식회사 정보 기록 매체 및 데이터 재생 장치
KR100890096B1 (ko) * 2004-08-17 2009-03-24 파나소닉 주식회사 정보 기록 매체 및 데이터 재생 장치
KR100890097B1 (ko) * 2004-08-17 2009-03-24 파나소닉 주식회사 정보 기록 매체, 데이터 분별 장치, 및 데이터 재생 장치
KR100978723B1 (ko) * 2004-08-17 2010-08-30 파나소닉 주식회사 정보 기록 매체, 데이터 분별 장치, 및 데이터 재생 장치
US7949930B2 (en) 2004-08-17 2011-05-24 Panasonic Corporation Information recording medium, data sorting device and data reproduction device
US8170400B2 (en) 2004-08-17 2012-05-01 Panasonic Corporation Information recording medium, and multiplexing device
US8249415B2 (en) 2004-08-17 2012-08-21 Panasonic Corporation Information recording medium, data discrimination device, and data reproduction device
US8306384B2 (en) 2004-08-17 2012-11-06 Panasonic Corporation Information recording medium, data sorting device, and data reproduction device
KR101386270B1 (ko) * 2006-07-18 2014-04-17 톰슨 라이센싱 손실 인코딩된 신호와 함께 상기 신호에 대한 무손실 인코딩된 확장 데이터의 오디오 비트스트림 데이터 구조 배열
KR101424809B1 (ko) * 2006-10-02 2014-08-01 소니 주식회사 신호 처리 장치, 신호 처리 방법 및 프로그램이 기록된 기록매체

Also Published As

Publication number Publication date
KR100606992B1 (ko) 2006-07-31
JP2003502704A (ja) 2003-01-21
HK1043422A1 (zh) 2002-09-13
EP2228790A3 (en) 2010-12-01
EP2228790B1 (en) 2013-03-06
WO2000079520A1 (en) 2000-12-28
AU5745200A (en) 2001-01-09
EP1204970B1 (en) 2017-02-15
CN1154087C (zh) 2004-06-16
EP1204970A1 (en) 2002-05-15
JP4204227B2 (ja) 2009-01-07
CN1357136A (zh) 2002-07-03
TW565826B (en) 2003-12-11
US6226616B1 (en) 2001-05-01
EP2228790A2 (en) 2010-09-15
EP1204970A4 (en) 2009-07-29
JP2008020931A (ja) 2008-01-31

Similar Documents

Publication Publication Date Title
KR100606992B1 (ko) 디코더 호환성의 손실 없이 달성되는 낮은 비트 레이트 오디오 코딩 시스템의 음질 개선을 위한 다중 채널 오디오 엔코더, 다중 채널 블랙 박스 오디오 디코더, 다중 채널 오픈 박스 오디오 디코더, 다중 채널 디지털 오디오 신호 엔코딩 방법 및 재구성 방법
WO2000079520A9 (en) Improving sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
JP4174072B2 (ja) 心理音響学的アダプティブ・ビット割り当てを用いたマルチ・チャネル予測サブバンド・コーダ
JP2923406B2 (ja) オーディオ信号処理方法
TW384434B (en) Encoding method, device therefor, decoding method, device therefor and recording medium
KR100737302B1 (ko) 호환성 다중-채널 코딩/디코딩
Noll MPEG digital audio coding
JP3258424B2 (ja) 知覚モデルに基づく音声信号符号化方法とその装置
KR101612969B1 (ko) 임의 접근 위치(rap) 및 다중 예측 파라미터 세트(mpps) 능력을 구비한 적응형 세그먼트화를 이용하는 무손실 다채널 오디오 코덱
RU2407069C2 (ru) Кодирование и декодирование аудиосигналов с использованием гребенок фильтров с комплексным значением
US6823310B2 (en) Audio signal processing device and audio signal high-rate reproduction method used for audio visual equipment
CN101385075B (zh) 用于编码/解码信号的装置和方法
US20060004566A1 (en) Low-bitrate encoding/decoding method and system
JP3428024B2 (ja) 信号符号化方法及び装置,信号復号化方法及び装置,記録媒体,並びに信号伝送装置
EP1536410A1 (en) Method and apparatus for encoding/decoding MPEG-4 BSAC audio bitstream having ancillary information
CN104681030A (zh) 用于编码/解码信号的装置和方法
JPH05506345A (ja) 高品質オーディオ用符号器・復号器
KR20070037945A (ko) 오디오 신호의 부호화/복호화 방법 및 장치
JP2006201785A (ja) デジタル信号の符号化/復号化方法及びその装置並びに記録媒体
Sinha et al. The perceptual audio coder (PAC)
Britanak et al. Cosine-/Sine-Modulated Filter Banks
Johnston et al. AT&T perceptual audio coding (PAC)
JP4470304B2 (ja) 圧縮データ記録装置、記録方法、圧縮データ記録再生装置、記録再生方法および記録媒体
US6463405B1 (en) Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband
US5914752A (en) Band-division signal processing system

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130708

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140709

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20150707

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20160712

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170712

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20180712

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20190716

Year of fee payment: 14