KR20050097989A - 연속 백업 오디오 - Google Patents

연속 백업 오디오 Download PDF

Info

Publication number
KR20050097989A
KR20050097989A KR1020057014503A KR20057014503A KR20050097989A KR 20050097989 A KR20050097989 A KR 20050097989A KR 1020057014503 A KR1020057014503 A KR 1020057014503A KR 20057014503 A KR20057014503 A KR 20057014503A KR 20050097989 A KR20050097989 A KR 20050097989A
Authority
KR
South Korea
Prior art keywords
audio
audio information
information
encoded
coding
Prior art date
Application number
KR1020057014503A
Other languages
English (en)
Inventor
그레이그 캠벨 토드
마이클 미드 트루만
쥬리아 루스 커틀러
Original Assignee
돌비 레버러토리즈 라이쎈싱 코오포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 돌비 레버러토리즈 라이쎈싱 코오포레이션 filed Critical 돌비 레버러토리즈 라이쎈싱 코오포레이션
Publication of KR20050097989A publication Critical patent/KR20050097989A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0045Arrangements at the receiver end
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams

Abstract

디지털 오디오 인코더는 PCM 인코드 오디오 정보를 수신하고 상기 정보를 제 1 및 제 2 타입의 디지털 오디오 코딩으로 인코드하고, 상기 인코드된 오디오 정보는 자기 함유 데이터 유니트들을 가지며, 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유 데이터 유니트들의 대응하는 쌍들은 동일한 기초 오디오 정보를 나타낸다. 디코더는 제 1 및 제 2 오디오 정보와, 에러들의 검출 및 제 1 오디오 정보의 생략들을 가리키는 에러 신호를 수신한다. 디코더는 제 1 오디오 정보에 에러들 또는 생략들이 있는지에 따라 제 1 오디오 정보나 제 2 오디오 정보를 바탕으로 상기 제 1 타입의 디지털 오디오 코딩을 따르는 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공한다.

Description

연속 백업 오디오{CONTINUOUS BACKUP AUDIO}
여기에 인용된 참고문헌들 모두는 본원에 전체적으로 참고로써 통합된다.
본 발명은 일반적으로 디지털 오디오 시스템들에 관한 것이다. 특히, 본 발명은 예를 들어 디지털 텔레비젼 시스템에 사용하기 위한 백업(즉, 선택적) 디지털 오디오 시스템에 관한 것이고, 여기서 오디오 시스템은 시간 불연속 또는 성가신 가청음없이 메인 오디오 및 백업 오디오 사이를 스위칭한다. 비록 본 발명의 바람직한 실시예가 특정 디지털 텔레비젼 표준과 관련하여 기술되었지만, 본 발명은 메인 및 백업 디지털 오디오를 사용하는 임의의 디지털 오디오 시스템에 폭넓게 이용할 수 있다. 본 발명의 측면들은 디지털 오디오 인코딩 방법들, 디지털 오디오 디코딩 방법들, 디지털 오디오 인코더들, 디지털 오디오 디코더들 및 그 위에 인코드된 프로그램 코드를 가진 머신 판독 가능 매체를 포함하고, 여기서 프로그램 코드가 머신에 의해 실행될 때, 상기 머신은 디지털 오디오 디코딩 방법을 구현한다.
미국에서 DTV(디지털 텔레비젼)용 현재 ATSC(Advanced Television Systems Committee) 표준은 이후 디지털 오디오 압축 표준(돌비 AC-3)에 기술된 "AC-3" 지각 코딩이라 불리는 오디오 코딩 시스템을 사용하고, 이는 도큐먼트 A/52, Advanced Television Systems Committee, Approved 10 November 1994. (Rev 1) Annes A added 12 April 1995. (Rev 2) corrigenda added 24 May 1995. (Rev 3) Annex B 및 C added 20 Dec 1995에 기술된다. 2001년 8월 20일 A/52A에 대한 개정은 annex B를 제거하였고, Annex C를 Annex B로 다시 번호를 붙이고, 새로운 Annex C를 부가하고, 다수의 오자를 수정했다. A/52A 도큐먼트는 월드 와이드 웹 http://www.atsc.org/Standards에서 이용할 수 있다. Steve Vernon에 의한 "AC-3 코더들의 설계 및 구현", IEEE Trans. Consumer Electronics, Vol.41, No.3, August 1995를 참조하라. "돌비"는 Dolby Laboratories Licensing Corporation의 상표명이다.
새로운 ATSC 표준들 및 종래 표준들에 대한 개정 표준은 오디오 및/또는 비디오를 위한 신뢰적 백업 또는 "로버스트(robust): 전송 시스템을 제공하도록 고려된다. 보다 큰 로버스트 오디오 및/또는 비디오 백업 시스템은 수정되지 않은 에러 또는 생략이 메인 오디오 또는 비디오 데이터에서 발생할 때 메인 시스템에 대한 백업을 제공한다. 이것은 예를 들어, 오디오/비디오 데이터를 운반하는 SF 신호의 SNR(신호 대 노이즈 비율)이 빈약한 수신, 간섭 또는 이동 수신기들 같은 어려운 수신 환경들의 짧은 버스트들로 인해 약한 신호 세기의 경우에서 발생할 수 있는 것과 같이 불충분할 때, 발생할 수 있다.
유용하기 위해서, 로버스트 전송 시스템은 메인 오디오 데이터를 손상시켜, 가청할 수 있게 수정될 수 없는 메인 오디오 데이터의 에러들 또는 생략들을 유발하는 신호 품질 저하의 존재시조차 신뢰적으로 수신되어야 한다. 오디오 데이터의 수정할 수 없는 에러들 및 생략들을 검출하는 많은 공지된 기술들이 있다. 이와 같이, 노이즈와 별개인 보다 많은 비트들을 형성하도록 보다 낮은 데이터 속도 변조 방법을 사용하거나 보다 강력한 에러 수정을 사용하는 것을 포함하는 보다 로버스트한 신호를 형성하는 많은 공지된 방법들이 있다. 상기 기술들은 로버스트 백업 시스템의 전송 효율성을 감소시킨다. 그러므로, 로버스트 백업 시스템에서 전송된 데이터는 통상적으로 메인 채널에서 전송된 데이터보다 비트당 대역폭의 측면에서 비싸다.
비록 백업 전송 시스템 오디오 및/도는 비디오가 로버스트니스를 달성하는 방식이 본 발명의 부분은 아니지만, 본 발명의 일측면은 2개의 오디오 코딩 기술들에 의해 메인 및 로버스트 오디오 신호들이 "동기화되어"(이하에서 설명됨), 재생된 오디오에서 시간 갭 또는 오버랩 없이 그리고 최소의 혼란을 가지고 메인 및 로버스트 오디오 재생 사이의 스위치 또는 페이드(fade)를 가능하게 하고, 바람직하게 메인 및 로버스트 오디오 신호들을 복구하기 위하여 장치들 및/또는 기능들, 또는 상기의 일부들을 공유하도록, 비트 비용을 감소시키는 로버스트 데이터에 대한 오디오 코딩 기술의 선택, 특히 메인 데이터에 적용된 오디오 코딩 기술에 적합하게 관련된 오디오 코딩 기술을 선택하는 것이다.
로버스트 시스템에 의해 전송된 데이터가 새롭거나 변형된 ATSC 표준의 메인 시스템에 의해 전송된 데이터보다 많은 대역폭을 요구하기 때문에, 백업 오디오 시스템에 의해 요구된 비트들을 최소화하는 것을 요구하는 것은 특성들 및 구조에 영향을 미치는 인자이다. 메인 전송 시스템에 비해, 로버스트 백업 전송 시스템이 등가량의 데이터를 운반하기 위하여 보다 많은 RF 대역폭을 요구하기 때문에, 로버스트 백업 시스템에 대한 오디오 시스템은 가능한한 효율적이어야 하고, 이것은 백업 오디오가 메인 오디오의 코딩 시스템보다 효율적인 오디오 코딩 시스템에 의해 운반되어야 하고 및/또는 메인 오디오보다 적은 채널들을 가져야 할 것을 요구한다. 다른 요구는 시간 불연속이 없거나 (예를 들어 스피치(speech)에서 반복이나 분실 음절들을 유발하는 시간 갭이 없음) 성가신 가청음(예를 들어 똑딱 또는 펑 소리가 없음) 없이 메인 및 백업 오디오 사이에서 재생 오디오가 변이할 수 있어야 한다는 것이다. 음장의 일부 변화들은 메인 및 백업 오디오 시스템들이 동일 방향 채널들을 운반할 수 없을 때 필수적으로 발생할 수 있다.
도 1은 인코더 또는 인코딩 처리의 기능적 및 개략적 블록도이고, 여기서 PCM 오디오 데이터 샘플들을 포함하는 선형 PCM 인코드 오디오 정보는 제 1 타입의 디지털 오디오 코딩으로 인코드되는데, 상기 인코드된 제 1 오디오 정보는 자기 함유 데이터 유니트들을 가지며, 제 2 타입의 디지털 오디오 코딩으로 인코딩되는데, 상기 인코드된 제 2 오디오 정보는 또한 가지 함유 데이터 유니트들을 가진다. 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유 데이터 유니트들의 대응하는 쌍들은 PCM 오디오 데이터 샘플들을 나타내어, 제 1 및 제 2 인코드된 오디오 정보는 동일한 기초 오디오 정보를 나타낸다.
도 2 내지 4는 제 1 및 제 2 타입의 오디오 코딩으로 각각 인코드된 제 1 및 제 2 오디오 정보에 응답하여 그리고 제 1 오디오 정보의 에러들 및 생략들의 검출에 응답하여 제 1 타입의 디지털 오디오 코딩에 순응하는 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공하기 위한 디코더 또는 디코딩 처리의 기능적 및 개략적 블록도이다.
도 2는 ATSC 운반 스트림 운송 멀티플렉스 AC-3(메인 채널) 및 변형된 AC-3(로버스트 채널) 비트스트림들에 응답하여 PCM 출력 및/또는 AC-3 순응 비트스트림을 제공하기 위한 기본 장치를 도시하는 디코더 또는 디코딩 처리의 기능적 및 개략적 블록도이다.
도 3은 ATSC 운반 스트림 운송 멀티플렉스 AC-3(메인 채널) 및 변형된 AC-3(로버스트 채널) 비트스트림들에 응답하여 PCM 출력 및/또는 AC-3 순응 비트스트림 출력을 제공하기 위한 다른 장치를 도시하는 디코더 또는 디코딩 처리의 기능적이고 개략적인 블록도이다. 도 3의 상기 장치는 도 2에 비해 덜 복잡하다 - 직렬 트랜스코더/디코더 장치로부터 발생할 수 있는 품질 저하를 피하고 임의의 이중 디코더 기능들을 제거한다.
도 4는 하드웨어 및/또는 처리 전력을 절약하기 위하여 임의의 기능들 또는 장치들을 추가로 공유하는 ATSC 운반 스트림 운송 멀티플렉스 AC-3(메인 채널) 및 변형된 AC-3(로버스트 채널) 비트스트림에 응답하여 PCM 출력 및/또는 AC-3 순응 비트스트림 출력을 제공하는 다른 장치를 도시하는 디코더 또는 디코딩 처리의 기능적이고 개략적인 블록도이다.
본 발명에 따른 디지털 오디오 인코딩 방법은 PCM 오디오 데이터 샘플들을 포함하는 PCM 인코드 오디오 정보를 수신하는 단계, 제 1 타입의 디지털 오디오 코딩으로 오디오 정보를 인코딩하는 단계를 포함하는데, 상기 인코딩된 오디오 정보는 자기 함유 데이터 유니트들을 가지며, 및 제 2 타입의 디지털 오디오 코딩으로 동일한 오디오 정보를 인코딩하는 단계를 포함하고, 상기 인코딩된 오디오 정보는 자기 함유 데이터 유니트들을 가지며, 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유된 데이터 유니트들의 대응 쌍들은 동일한 PCM 오디오 데이터 샘플들을 나타내어, 제 1 및 제 2 오디오 정보는 동일한 기초 오디오 정보를 나타낸다.
본 발명에 다른 디지털 오디오 디코딩 방법은 제 1 타입의 디지털 오디오 코딩으로 인코드된 제 1 오디오 정보 및 제 2 타입의 오디오 코딩으로 인코드된 제 2 오디오 정보를 수신하는 단계를 포함하는데, 상기 제 1 오디오 정보 및 제 2 오디오 정보는 각각 자기 함유 데이터 유니트들을 가지며 제 1 및 제 2 오디오 정보의 자기 함유 데이터 유니트들의 대응 쌍들은 동일한 기초 오디오 정보를 나타내고, 및 제 1 오디오 정보 에러들 및 생략들의 검출을 가리키는 에러 신호를 수신하거나, 수신된 데이터의 에러들 또는 생략들을 검출하는 단계를 포함한다. 상기 방법은 제 1 타입의 디지털 오디오 코딩에 따르는 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공하는 단계를 더 포함하고, 여기서
PCM 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에 의해 검출되지 않을 때 제 1 오디오 정보를 디코딩하고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 1 오디오 정보 대신 제 2 오디오 정보를 디코딩함으로써 제공되고, 및/또는
제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보에서 유도되고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 2 오디오 정보를 트랜스코딩함으로써 유도된다.
본 발명의 측면들에 따라, 메인 오디오 시스템은 AC-3 지각 코딩 시스템 같은 큰 인스톨 사용자 베이스를 가진 표준화된 코딩 시스템으로 인코딩될 수 있고, 백업 디지털 오디오 시스템은 AC-3 지각 코딩 시스템의 변형 같은 표준화된 코딩 시스템의 변형 또는 관련 버젼으로 인코딩될 수 있다. 선택적으로, 메인 오디오 시스템은 다른 코딩 시스템, 예를 들어 MPEG-2 AAC 또는 mp3(MPEG-레이어3) 지각 코딩 시스템으로 인코드될 수 있고 백업 오디오 시스템은 다른 코딩 시스템의 변형, 예를 들어 각각 aacPLUS 또는 mp3PRO 코딩 시스템 같은 스펙트랄 대역 반향(SBR)을 가진 AAC 또는 mp3의 관련 버젼으로 인코드될 수 있다. 예를 들어 Kietz, Liljeryd, Kjoerling and Kunz에 의한 "Spectral Band Replication, a novel approach in audio coding", Audion Engineering Society Convention Paper 5553, AES 112번째 Convention, Munich, May 10-13, 2002; Groeschel, Beer and Henn에 의한 "Enhancing audio coding efficiency of MPEG Layer-2 with Spectral Band Replication for DigitalRadio(DAB) in a backwards compatible way", Audio Engineering Society Convention Paper 5850, AES 114번째 Convention, Amsterdam, March 22-25, 2003; Ehret, Dietz and Kjoerling에 의한 "State-of-the-Art Audio Coding for Broadcasting and Mobile Applications", Audio Engineering Society Convention Paper 5834, AES 114번째 Convention, Amsterdam, March 22-25, 2003; 및 Ziegler, Ehret, Ekstrand and Lutzky에 의한 "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm", Audio Engineering Society Convention Paper 5560, AES 112번째 Convention, Munich, May 10-13, 2002를 참조하라.
백업 코딩 시스템은 적어도 각각의 메인 및 백업 코딩 시스템에서 "자기 함유 데이터 유니트들의 대응 쌍들"(이하에서 정의됨)이 각각 동일한 세트의 PCM 오디오 데이터 샘플들을 나타낼 수 있는 범위(즉, 동일한 기초 오디오를 나타내지만, 필수적으로 동일한 공간 해상도를 가지지 않는 범위 - 보다 작은 항목을 가진 기초 오디오의 방향 특성들을 나타낼 수 있다)까지 메인 코딩 시스템을 변형하여야 한다. 바람직하게, 메인 및 백업 코딩 시스템들은 각각은 자신의 독립된 디코더를 요구하지 않도록 일부 공통 특성들을 가지거나 적어도 일부의 디코더 또는 코딩 기능이 메인 및 백업 오디오 디코딩시 공유되도록 디코딩 기능을 가진다.
비록 인코드된 메인 및 백업 오디오의 자기 함유 데이터 유니트들의 대응 쌍들이 동일한 기초 오디오를 나타내어야 하지만, 메인 오디오 정보에서 자기 함유 데이터 유니트는 백업 또는 로버스트 오디오 정보에서 대응하는 자기 함유 데이터 유니트와 동일한 비트들의 수를 가질 필요가 없다. 통상적으로, 로버스트 오디오 정보의 데이터 유니트는 메인 오디오 정보의 대응 데이터 유니트보다 적은 비트들을 가지는데, 그 이유는 예를 들어, 상기 유니트가 보다 효율적으로 기초 오디오를 표현하고 및/또는 보다 적은 항목(보다 적은 채널들)으로 기초 오디오의 방향 특성들을 나타낼 수 있기 때문이다.
"자기 함유"는 각각의 데이터 유니트가 충분한 정보를 가져서 다른 데이터 유니트로부터의 데이터없이 디코드되거나 트랜스코드될 수 있는 것을 의미한다. 본래, 각각의 상기 데이터 유니트는 다중 데이터 서브유니트들을 포함할 수 있고, 그 각각은 자기 함유된다. 본 발명의 실제적인 실시예들에서, 가장 작은 자기 함유 데이터 유니트들은 사용된다. AC-3 인코드된 오디오 정보의 경우, 가장 작은 자기 함유 데이터 유니트는 프레임이다.
메인 및 로버스트 오디오 인코딩 시스템들에 의해 형성된 가지 함유 데이터 유니트들의 "대응" 쌍들은 하나 이상의 데이터 스트림들내의 데이터 서로에 대한 또는 다른 데이터(비디오 데이터 같은)에 대한 위치(예를 들어, 메인 및 백업 오디오 데이터 스트림들이 다른 메인 및 로버스트 오디오 데이터 유니트들을 멀티플렉스하여 대응 데이터 유니트들이 서로 뒤따르거나, 오디오 데이터 유니트가 비디오 프레임과 공지된 방식으로 관련될 수 있는 복합 데이터 스트림) 및/또는 각각의 자기 함유 오디오 데이터 유니트에 대해 식별기를 첨부함으로써 식별될 수 있다. 예를 들어, 타임 스탬프는 각각의 메인 자기 함유 오디오 데이터 유니트에 첨부되어, 대응 백업 오디오 데이터 유니트는 식별될 수 있다.
그 식별을 바탕으로, 메인 및 백업 오디오 정보에서 자기 함유 오디오 데이터 유니트들의 대응 쌍들은 디코딩 장치 도는 처리에서 "동기화"될 수 있다. 상기 "동기화"는 재생된 오디오의 시간 불연속 또는 성가신 가청음 없이 2개 사이에서 스위치 또는 페이드 되도록 하기 위해 디코더 또는 디코딩 방법에서 대응 메인 및 로버스트 오디오 데이터의 동시 이용성을 이용한다.
동시 이용성은 데이터 저장소에서 적당한 수의 대응하는 데이터 유니트들에 의해 달성되어, 각각의 대응하는 데이터 유니트들의 쌍들중 선택된 하나는 적당한 시간에 판독될 수 있다. 이것은 일반적으로 버퍼링을 사용하는 현대 마켓 바탕 데이터 시스템들에서 발생한다.
대응 자기 함유 데이터 유니트들이 디코더 또는 디코딩 방법에 이용되는한 디코더 또는 디코딩 기능에 의해 동시에 전달되거나 동시에 수신될 필요가 없는 메인 및 로버스트 오디오의 대응 데이터 유니트들은 식별되고 개념상 스위칭 포인트에 "동시"에 삽입될 수 있고, 여기서 상기 포인트는 디코더 또는 디코딩 처리가 메인 및 로버스트 오디오 사이에서 스위칭 백(back) 및 스위칭 포어스(forth)하는 장소이다. 물론, 메인 오디오의 대응 데이터 유니트가 손상되거나 손실될 때, 로버스트 오디오 데이터 유니트만이 개념상 스위칭 포인트에 제공될 수 있다.
PCM 샘플들(기초 오디오)와 동일한 세트를 나타내는 대응 데이터 유니트들의 쌍들은 PCM 샘플들이 인코드될 때 대응 데이터 유니트들이 실제 전송 동안 가장 바람직하게 동기화를 벗어나서 디코더 또는 디코딩 기능부에 전달될 수 있도록 식별된다(명백히 또는 절대적으로). 상기 전달의 경우, 대응하는 데이터 유니트들은 동기화가 의미를 가지지 않는 하나 이상의 메모리들에 저장될 수 있다. 하기된 디지털 텔레비젼 환경 같은 거의 실시간 시스템에서, 대응하는 그리고 로버스트 데이터 유니트들의 운반은 임의의 중요한 부가적인 잠복기를 도입하지 않는다.
백업 ATSC 오디오 시스템의 다른 바람직한 능력은 홈 A/V(오디오/비디오) 수신기 같은 외부 디코더에 예를 들어 인코드된 AC-3 오디오 비트스트림을 제공하는 능력이다. 종종, 홈 A/V 수신기는 메인 오디오 시스템이 서라운드 사운드용 5.1 채널들에서 재생되는 경우이다. 백업 오디오 시스템이 메인 오디오 시스템과 다를수록, 외부 디코더들에 연속적인 AC-3 비트스트림 출력을 유지하는 것은 보다 복잡하고 비싸다. 이렇게 하는 것은 복잡하고 비싼 AC-3 인코더를 요구한다.
메인 오디오가 AC-3 코딩으로 인코딩되는 경우, 백업 오디오는 바람직하게 AC-3 코딩의 변형으로 인코딩된다. 변형들은 예를 들어 제한되지는 않지만 "고주파 재생"(HFR) 및 "스펙트랄 대역 복제"(SBR)로서 공지된 스펙트럼의 재생 또는 복제 부분을 위한 다양한 기술들을 포함한다. 상기 기술들은 AC-3 시스템에 대한 최소 변형으로 데이터 속도를 상당히 감소시켜서, 부가적인 복잡성을 최소화한다.
HFR에 대한 공지된 방법들의 설명은 Makhoul and Berouti에 의한 "High-Frequency Regeneration in Speech Coding Systems," Proc. of the Intl. Conf. on Acoust., Speech and Signal Proc., April 1979에서 발견될 수 있다. 인코딩 고품질 음악을 위한 개선된 스펙트랄 재생 기술들은 2002년 3월 28일 출원되고 발명의 명칭이 "Broadband Frequency Translation for High Frequency Regeneration인 미국특허출원 10/113,858; 2002년 6월 17일 출원되고 발명의 명칭이 Audio Coding System Using Spectral Hole Filling인 10/174,493; 2002년 9월 6일 출원되고 발명의 명칭이 "Audio Coding System Using Characteristics of a Decoded Signal to Adapt Synthesized Spectral Components"인 10/238,047; 및 2003년 5월 8일 출원되고 발명의 명칭이 "Improved Audio Coding Systems and Methods Using Spectral Component Coupling and Spectral Component Regeneration"인 10/434,449에 기술되고, 여기에 전체적으로 참조로써 통합된다.
SBR 측면의 설명은 상기된 Audio Engineering Society Convention Papers중 하나에서 발견될 수 있다.
엔트로피 코딩(즉, 산술 또는 허프만 코딩)(때때로 "무손실" 코딩이라 함)을 변형된 AC-3코딩에 의해 형성된 비트스트림 정보의 일부에 적용하는 부가적인 기술들은 복잡성의 일부 증가와 함께 데이터 속도를 감소시키기 위하여 사용될 수 있다. 예를 들어, 간단한 허프만 코딩 방법은 전송 비용을 감소시키기 위하여 변형된 AC-3 비트스트림 지수들에 제공될 수 있다.
백업 오디오에 사용되는 AC-3 메인 오디오 시스템의 변형된 형태는 비트스트림의 임의의 다른 정보를 포함하고, 상기 정보는 하기될 바와같이 보다 낮은 복자성 트랜스코더에 의해 사용할 수 있다.
로버스트 백업 오디오 비트스트림을 생성하기 위하여 AC-3 오디오 시스템의 변형되고 보다 효율적인 버젼을 사용하는 것의 장점은 디코더 복잡성 증가를 최대화 할 수 있는 장점을 가진다. 예를 들어, 하기될 바와같이, AC-3 오디오 디코더의 변형된 버젼은 메인 오디오 및 로버스트 오디오 비트스트림 모두를 디코드하기 위하여 사용되어, 메인 및 로버스트 오디오에 대하여 독립된 디코더들에 대한 필요성을 제거한다.
종래 트랜스코딩 기술들은 그들이 지각 코딩 시스템들에 의해 인코드되는 신호들을 전환하기 위하여 사용될 때 단점을 가진다. 하나의 단점은 종래 트랜스코딩 장비가 복잡한 디코딩 및 인코딩 처리들을 수행하여야 하기 때문에 비교적 고가라는 것이다. 제 2 단점은 디코딩후 입력된 인코드 신호의 지각 품질에 비해 항상 디코딩후 트랜스코드 신호의 지각 품질이 떨어진다는 것이다.
비록 복잡성 및 비용을 감소시키기 위하여 디코드후 재인코드하는 형태의 종래 기술 트랜스코더가 사용될 수 있지만, 작은 복잡성 부분을 가진 트랜스코더는 외부 AC-3 디코더들에 사용하기 위하여 AC-3 순응 비트스트림으로 로버스트 백업 오디오 비트스트림을 전환하기 위하여 바람직하게 사용될 수 있다. 여기서 "AC-3 순응 데이터 스트림 또는 비트스트림"은 "순응" 비트스트림이 표준 AC-3 디코더에 의해 디코드될 수 있다는 것을 의미한다(비록 상기 "순응" 비트스트림이 S/PDIF, tOSLING, 또는 다른 결합 인터페이스의 요구들을 만족시키기 위하여 포맷팅을 요구할 수 있지만). 작은 복잡성 부분을 가진 트랜스코더는 2003년 6월 9일 출원되고 발명의 명칭이 "Conversion of Synthesized Spectral Components for Encoding and Low-Complexity Transcoding"인 미국특허출원 10/458,798에 기술되고, 이 출원은 여기 전체적으로 참조로써 통합된다. 상기 출원의 방법 및 장치에 따라, 전환은 최소 트랜스코딩 품질 손실과 함께 비교적 적은 복잡성 동작으로 수행될 수 있다.
상기 10/458,798에 기술된 트랜스코더는 종래 인코더들 및 디코더들에서 요구되는 분석 및 종합 필터링 같은 트랜스코딩 처리로부터 일부 기능들을 제거한다. 가장 간단한 형태에서, 상기 출원에 따른 트랜스코딩은 스펙트랄 정보를 비양자화 스펙트랄 정보에 필요한 범위까지만 부분 디코딩 처리를 수행하고 비양자화된 스펙트랄 정보를 재양자화할 필요가 있는 범위까지만 부분 인코딩 처리를 수행한다. 트랜스코딩 처리는 인코드된 신호로부터 비양자화 및 재양자화를 제어하기 위하여 필요한 제어 파라미터들을 얻음으로써 추가로 간략화된다.
낮은 복잡성 트랜스코더들의 다른 형태들은 본 발명의 다양한 실시예들에 사용될 수 있다. 상기 낮은 복잡성 인코더들은 N.D. Wells 및 N.H.C. Gilchrist에 의한 "ATLANTIC: Preserving video and audio quality in an MPEG-coded environment", ATLANTIC Technical Papers 1197-1998 및 2000년 9월 22-25일 109차 Convention of the Audio Engineering Society에서 제공된 논문들 : Natalie Peckham and Frank Kurth에 의한 "Transport of Context-Based Information in Digital Audio Data", Preprint No. 5250; "Juergen Herre and Michael Schug에 의한 "Analysis of Decompressed Audio - The Inverse Decoder", Preprint No. 5256; 및 Frank Kurth and Viktor Hassenrik에 의한 "A Dynamic Embedding Codec for Multiple Generatins Compression", Preprint No. 5257에 기술된다.
본 발명의 다양한 특징들 및 바람직한 실시예들은 다음 설명 및 첨부 도면들을 참조하여 보다 잘 이해될 수 있고, 여기서 동일한 참조 번호는 몇몇 도면들에서 동일 엘리먼트들을 나타낸다. 다음 설명 및 도면들의 내용들은 예시적으로 제공되고 본 발명의 범위를 제한하기 위한 것으로 이해되어서는 않된다.
도 1은 PCM 오디오 데이터 샘플들을 포함하는 선형 PCM 인코딩 오디오 정보가 수신되는 인코더 또는 인코딩 처리의 기능적이고 개략적인 블록도를 도시한다. 상기 오디오 정보는 제 1 타입의 디지털 오디오 코딩으로 인코딩되고, 상기 인코딩된 제 1 오디오 정보는 자기 함유 데이터 유니트들을 가지며, 제 2 타입의 디지털 오디오 코딩으로 인코드되고 상기 인코드된 제 2 오디오 정보는 자기 함유 데이터 유니트들을 가진다. 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유 데이터 유니트들의 대응하는 쌍들은 동일한 PCM 오디오 데이터 샘플들을 나타내어, 제 1 및 제 2 오디오 정보는 동일한 기초 오디오 정보를 나타낸다.
특히, 도 1은 메인 오디오, 비디오, 데이터 및 동기화 정보를 운송하는 메인 운반 데이터 스트림("메인 TS") 및 로버스트 오디오, 비디오, 데이터 및 동기화 정보를 운송하는 로버스트 운반 데이터 스트림("로버스트 TS")을 생성하기 위한 ATSC 텔레비젼 환경에서의 장치의 기능적이고 개략적인 블록도를 도시한다. 적당한 로버스트 오디오 및/또는 비디오 백업 시스템은 수정되지 않은 에러 또는 생략이 메인 오디오 또는 비디오 데이터에서 발생할 때 메인 시스템을 위한 백업을 제공할 수 있다. 비디오 및 데이터 정보 생성의 항목들은 본 발명의 범위를 넘어서고 도시되지 않는다.
통상적으로 오디오의 5.1 채널들(좌측, 중앙, 우측, 좌측 서라운드, 우측 서라운드 및 저주파 효과 채널)을 나타내는 선형 PCM(펄스 코드 변조)은 오디오 인코더 또는 인코딩 기능("AC-3 및 변형된 AC-3 인코더")(2)에 제공된다. 인코더는 데이터 스트림들 형태일 수 있는 2개의 인코드된 오디오 출력들을 제공한다 - 메인 AC-3 순응 데이터 스트림 및 로버스트 변형("확장") AC-3 데이터 스트림. 각각의 데이터 스트림은 프레임들로 분할되고, 상기 프레임들은 상기된 바와같이 자기 함유 데이터 유니트들을 구성한다. 2개의 데이터 스트림들에서 프레임들의 대응하는 쌍들은 동일한 PCM 샘플들을 나타낸다.
각각의 AC-3 순응 및 변형된 AC-3 순응 비트스트림은 하나 이상의 오디오 채널들을 나타낸다. 통상적으로, 메인 스트림은 오디오의 5.1 채널들을 나타낸다. 로버스트 스트림은 예를 들어 단일("모노토닉" 또는 "모노") 오디오 채널, 매트릭스 인코드 오디오의 2개의 채널들, 또는 메인 스트림과 같은 오디오의 5.1 채널들을 나타낼 수 있다. 인코드된 메인 AC-3 오디오 데이터는 메인 운반 데이터 스트림(TS)를 제공하기 위하여 메인 프로그램 멀티플렉서 또는 멀티플렉싱 기능("메인 프로그램 MUX")(4)의 비디오 및 다른 데이터와 멀티플렉스될 수 있다. 유사하게, 인코드된 로버스트 오디오 데이터는 로버스트 운반 데이터 스트림을 제공하기 위하여 로버스트 프로그램 멀티플렉서 도는 멀티플렉싱 기능("로버스트 프로그램 MUX")(6)의 비디오 및 다른 데이터와 멀티플렉스된다. 메인 운반 데이터 스트림 및 로버스트 운반 데이터 스트림은 ATSC DTV 운반 데이터 스트림을 형성하기 위하여 운반 데이터 스트림 멀티플렉서 또는 멀티플렉싱 기능("운반 데이터 스트림 MUX")(8)에서 함께 추후에 멀티플렉스된다.
도 2 내지 4는 제 1 및 제 2 타입의 오디오 코딩으로 각각 인코드된 제 1 및 제 2 오디오 정보에 응답하고 그리고 제 1 오디오 정보의 에러들 및 생략들의 검출에 응답하여 제 1 타입의 디지털 오디오 코딩에 따른 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공하기 위한 디코더 도는 디코딩 처리 장치들의 기능적 및 개략적인 블록을 도시한다. 비록 상기 장치들이 제 1 및 제 2 오디오 정보가 AC-3 및 변형된 AC-3이 인코드되는 ATSC 텔레비젼의 환경에서 기술되었지만, 본 발명의 원리들은 여기에 지시된 바와같이 폭넓게 응용할 수 있다는 것이 이해된다.
도 2 내지 4에서, 상기 장치들은 ATSC 운반 스트림 운송 멀티플렉스 AC-3(메인 채널) 및 변형된 AC-3(로버스트 채널) 비트스트림들에 응답하여 디코드된(PCM) 출력 및/또는 AC-3 순응 비트스트림 출력을 제공하기 위하여 도시된다. 운반 시스템 및/또는 오디오 시스템은 메인 프로그램 채널 데이터 스트림이 수정할 수 없는 에러들 또는 생략들을 가지는지를 결정할 수 있다. 생략은 예를 들어 메인 오디오 데이터 스트림에서 데이터의 완전한 손실을 포함한다. 인코드된 오디오 데이터 스트림에서 수정할 수 없는 에러들 도는 생략들을 검출하기 위한 다른 기술들은 종래 기술에 잘 공지되었고 특정 용도는 본 발명에 중요하지 않다. 만약 메인 데이터 스트림이 수정할 수 없는 에러 또는 생략을 가지면, 제어기는 로버스트 프로그램 채널의 디코딩을 유발한다. 그렇지 않으면, 제어기는 메인 프로그램 채널의 디코딩을 유발한다. 디코더 또는 디코딩 처리의 출력은 PCM 오디오 비트스트림 또는 AC-3 순응 비트스트림 또는 양쪽 모두일 수 있다. AC-3 순응 비트스트림은 S/PDIF, Toslink, 또는 다른 결합 인터페이스의 요구들을 만족시키기 위한 포맷을 요구할 수 있다.
도 2의 장치는 본 발명의 측면들에 따른 디코더 도는 디코딩 장치의 기본 원리들을 도시한다. 덜 복잡하고, 덜 복제적인 장치들은 도 3 및 4의 다른 실시예들에 도시된다.
도 2의 항목들을 참조하면, "ATSC 운반 DEMUX"(디멀티플렉서 또는 디멀티플렉서 기능)(10)는 ATSC 운반 데이터 스트림을 수신하고 메인(AC-3) 및 로버스트(변형된 AC-3) 디지털 오디오 데이터 스트림 출력들과 비디오 및 데이터 출력들(비디오 및 데이터 출력들이 본 발명의 범위를 넘어섬)을 제공한다. 메인(AC-3) 데이터 스트림은 메인 AC-3 데이터 속도를 변화시키기 위하여(통상적으로, 증가시킴) 선택적 데이터 속도 변호 장치 도는 기능("데이터 속도 변화")(12)에 제공된다. ATSC 시스템(384 또는 444 kb/s)에서 메인 AC-3 데이터 속도는 최대 AC-3 데이터 속도(640 kb/s)보다 작다. 트랜스코더 출력 데이터 속도를 하기와 같이 매칭하기 위하여, 메인 AC-3 데이터 속도를 640kb/s로 증가시키는 것이 바람직할 수 있다. 잘 공지된 바와같이, 이것은 예를 들어 오디오 품질을 감소시키지 않는 방식으로(예를 들어, 종래 양자화된 계수들을 보다 높은 비트 속도를 가진 비트스트림으로 다시 패킹함으로서) 데이터를 패딩함으로써 달성될 수 있다.
로버스트(변형된 AC-3) 데이터 스트림은 변형된 AC-3 로버스트 오디오를 AC-3 순응 비트스트림으로 트랜스코드하거나 전환하는 트랜스코더 또는 트랜스코딩 기능("트랜스코더")에 제공된다. 바람직하게, 트랜스코더(14)는 최대 표준 AC-3 비트 속도(640 kb/s)로 예를 들어 96kb/s일 수 있는 변형된 AC-3 비트 속도를 트랜스코드한다. 최대 표준 AC-3 비트 속도는 트랜스코딩 품질 저하를 최소화하기 위하여 사용된다.
제어기 또는 제어기 기능("메인/로버스트 제어기")(16)은 ATSC 운반 DEMUX(10)로부터 명백한 에러 정보를 수신하고, 메인 오디오가 손상될 때 제어기에게 알리고 로버스트 오디오는 메인 오디오 대신 선택되어야 한다. 선택적으로, 생략들은 데이터가 예상될 때 운반 디먹스(demux)에 의해 운반되지 않을 때 다른 처리 또는 처리기(도시되지 않음)에서 검출될 수 있다. 데이터 에러 도는 생략 검출기들 또는 검출 처리들을 구현하는 다양한 방식들은 종래 기술에 잘 공지되었다. 예를 들어, 만약 메인 오디오가 AC-3 코드화 오디오이면, 데이터 보전은 각각의 AC-3 프레임에 내장된 CRC 워드들 하나 또는 모두를 사용하여 검사될 수 있다. 만약 CRC 워드가 검사하면, 비트스트림은 합리적인 확실 정도로 이용될 수 있다고 가정될 수 있다. 만약 보다 높은 정도의 확실성이 요구되면, 검출기는 CRC 워드들이 각각의 프레임을 검사하고 및/또는 다중 프레임들에서 CRC 워드들이 검사하는 것을 요구한다.
제어기(16)는 스위치 또는 스위칭 기능("스위치")(18)을 제어하여, 메인 오디오가 손상되었는지 이용할 수 없는지에 따라 스위치가 트랜스코더(14) 또는 메인 AC-3 오디오(가능한한 변화된 데이터 속도를 가짐)로부터 AC-3 오디오로 트랜스코드된 로버스트 오디오를 선택하게 한다. 스위치(18)뿐 아니라, 도 2 내지 4의 다양한 실시예들에서 스위치들 및 스위칭 기능들은 다양한 공지된 방식으로 구현될 수 있다. 구현된 "스위치"는 소프트웨어이다. 스위치(18) 출력인 AC-3 순응 비트스트림은 선형 PCM 오디오 출력을 제공하는 표준 AC-3 디코더 또는 디코딩 기능("표준 AC-3 디코더")(20), 및/또는 외부 디코더에 적용하기 위하여 S/PDIF, Toslink, 또는 다른 결합 인터페이스의 요구들을 만족시키기 위하여 AC-3 순응 비트스트림을 포맷하는 선택적 포맷화기 또는 포맷 기능("포맷화기")(22)에 제공될 수 있다. 텔레비젼 세트는 예를 들어 AC-3 순응 비트스트림 출력을 가질 수 없고, 반면 "셋톱 박스"(통상적으로, 케이블 및/또는 위성 입력을 수신하는 컨버터 장치)는 가질 수 있다. 만약 상기 AC-3 순응 비트스트림만이 목표되면, 검출기(20)는 요구되지 않는다. 만약 선형 PCM 출력이 목표되면, 선택적 포맷화기(22)는 요구되지 않는다.
상기된 바와같이, AC-3 순응 비트스트림의 데이터 속도는 스위치(18)가 메인 오디오를 선택할지 트랜스코드 로버스트 오디오를 선택할지와 동일하다. 표준 AC-3 디코더(20)에 대한 일정한 입력 데이터 속도는 디코더가 디코드된 PCM 출력에서 왜곡을 덜 가지는 것을 보장한다. 또한 외부 AC-3 디코더가 오기능에 대한 선택적 포맷화된 AC-3 순응 비트스트림을 덜 수신하는 것을 보장한다.
처리 전력을 절약하기 위하여, 도 2 내지 4의 장치들에서 임의의 장치들 또는 기능들은 하나 또는 다른 메인 및 로버스트 오디오가 선택될 때를 비활성화될 수 있다. 예를 들어, 도 2의 장치에서, 스위치(18)가 메인 오디오를 선택할 때, 트랜스코더(14)는 비활성화될 수 있다. 유사하게, 스위치(18)가 로버스트 오디오를 선택할때, 선택적 변화 데이터 속도(12)는 비활성화될 수 있다. 상기 활성도 및 비활성도는 제어기(16) 같은 제어기에 의해 제어될 수 있다.
도 2를 다시 참조하여, 비록 디코드 및 재인코드하는 형태의 종래 기술 트랜스코더가 트랜스코더(14)의 기본 기능들을 제공하기 위하여 사용되어 복잡성 및 비용을 감소시키지만, 상기 미국특허 10/458,798에 기술된 바와같은 낮은 복잡성을 가진 트랜스코더는 로버스트 백업 오디오 비트스트림을 AC-3 디코더에 사용하기 위한 AC-3 순응 비트스트림으로 전환하기 위하여 사용될 수 있다.
트랜스코딩 기능들을 제공하는 것외에, 트랜스코더(14)는 만약 필요하다면, 5.1 채널 AC-3 메인 오디오의 포맷과 보다 잘 일치하는 로버스트 오디오를 형성하기 위하여 일정 정도의 채널 포맷화를 제공한다. 예를 들어, 만약 로버스트 오디오가 단지 하나의 오디오 채널들이면(즉, 모노포닉 또는 "모노")이면, 트랜스코더는 모노 채널을 좌측, 중앙 및 우측 AC-3 채널들에 적용하여, 디코드될 때, 재생된 사운드가 단일 채널로 쇠약해지지 않는다. 선택적으로, 예를 들어, 로버스트 오디오가 4개의 채널들(좌측, 중앙, 우측 및 서라운드)을 나타내는 매트릭스 인코드 오디오의 2개의 채널들이면, 2개의 매트릭스 인코드 채널들은 2개의 채널 비트스트림 또는 매트릭스 디코드로서 트랜스코드되고 다중채널 비트스트림(선택적 베이스 개선과 함께)로서 삽입될 수 있다. 로버스트 오디오는 메인 AC-3 채널들로서 5.1 채널들일 수 있고, 이 경우 포맷 전환은 요구되지 않는다.
도 3은 ATSC 운반 스트림 운송 멀티플렉스 AC-3(메인 채널) 및 변형된 AC-3(로버스트 채널) 비트스트림들에 응답하여 디코드된(PCM) 출력 및/또는 AC-3 순응 비트스트림 출력을 제공하기 위한 제 2 장치를 도시한다. 도 3의 장치는 도 2의 장치보다 덜 복잡하고 - 직렬의 트랜스코더/디코더 장치로부터 발생할 수 있는 품질 저하를 방지하고 임의의 이중 디코딩 기능들을 제거한다.
도 3 및 4의 장치들에서, 도 2와 같은 ATSC 운반 디멀티플렉서(10)는 사용될 수 있지만, 간략화를 위하여 도시되지 않는다. 도 2에서 처럼, 다른 데이터 에러 또는 생략 검출기들 또는 검출 처리들은 예를 들어, 상기 에러 정보가 디멀티플렉서(10)에 의해 제공되지 않으면 사용될 수 있다. 도 3을 참조하여, 디코더 또는 디코딩 기능("AC-3 및 변형된 AC-3 디코더")(32)은 PCM을 AC-3 인코드 메인 오디오 스트림 또는 변형된 AC-3 인코드된 로버스트 오디오 스트림으로 선형화하기 위하여 디코드한다. 디코더(32)는 부분 AC-3 디코더 또는 디코딩 기능("AC-3 부분 디코더")(36), 부분 변형된 AC-3 디코더 또는 디코딩 기능("변형된 AC-3 부분 디코더")(38), 부분 디코더들(36 및 38)에 결합된 최종 디코딩 기능 또는 장치("최조 디코딩")(40) 및 메인 오디오를 AC-3 부분 디코더(36)에 결합하거나 로버스트 오디오를 변형된 AC-3 부분 디코더(38)에 결합하는 스위치 또는 스위칭 기능("스위치")(34)를 포함하도록 구성될 수 있다. 부분 디코딩(36)은 인버스 양자화의 수행을 통하여 디코딩 처리시 특정 포인트까지 AC-3 디코딩을 수행할 수 있다. 부분 디코딩(38)은 예를 들어 인버스 양자화의 수행을 통하여 동일한 포인트까지 변형된 AC-3 비트스트림의 디코딩을 수행한다. 어느 경우, 최종 디코딩(40)은 부분 디코딩(36 및 38)에 의해 제공되지 않은 나머지 디코딩 기능들을 제공한다. 예를 들어, 만약 부분 디코딩(36 및 38)이 각각 인버스 양자화의 수행을 통하여 각각 디코드하면, 최종 디코딩(40)은 디코드된 PCM 출력을 제공하기 위하여 동적 범위 제어, 다운혼합 등 같은 AC-3 디코더에서 일반적으로 수행되는 임의의 다른 기능들 다음 인버스 변환을 수행한다. 필요할 때, 최종 디코딩(40)은 상기된 바와 같은 어느 정도의 채널 포맷화를 수행한다. 부분 디코딩(36 또는 38) 같은 부분 디코딩, 및 최종 디코딩(40) 사이로 통과된 정보가 직렬 비트스트림 - 예를 들어 양자화된 계수들일 수 있다 - 과 다를 수 있다는 것이 주의된다.
도 2의 제어기(16)는 ATSC 운반 DEMUX(10)로부터 에러 정보를 수신하고, 그것을 메인 오디오가 손상되고 로버스트 오디오가 선택될 때 알린다. 이런 경우, 제어기(16)는 스위치 또는 스위칭 기능("스위치")(30)를 제어하여, 디코더(32)가 그 입력으로서 로버스트 오디오를 수신하도록 하고 스위치(34)를 제어하여 변형된 AC-3 부분 디코더(38)가 로버스트 오디오 입력을 수신하도록 한다. 메인 오디오가 손상되지 않을 때, 제어기(16)는 스위치(30 및 34)이 메인 오디오를 AC-3 부분 디코더(36)에 제공하도록 한다. 로버스트 오디오가 또한 도 2에서 처럼 로버스트 오디오를 AC-3 순응 비트스트림으로 트랜스코드하거나 전환하는 트랜스코더(14)에 제공된다. 제어기(16)는 스위치 또는 스위칭 기능("스위치")(42)를 제어하여, 도 2에서 처럼 메인 오디오가 손상될 때 선택적 포맷화기(22)가 트랜스코더(14) 출력을 선택하고 손상되지 않을 때 외부 디코더에 제공을 위하여 메인 오디오(가능하게 변화된 데이터 속도로)를 선택하게 한다. 만약 AC-3 순응 비트스트림만이 목표되면, 디코더(32)나 스위치(30) 모두는 요구되지 않는다. 만약 선형 PCM 출력만이 목표되면, 변화 데이터 속도(12), 트랜스코더(14), 스위치(42) 또는 선택적 포맷화기(22)의 어느 것도 요구되지 않는다.
도 2 장치와 관련하여 상기된 바와같이, 트랜스코더(14)는 미국특허출원 10/458,798에 기술된 바와같은 낮은 복잡성 부분들을 가질 수 있다. 게다가, 도 2 장치와 관련하여 상기된 바와같이, 트랜스코더(18)는 5.1 채널 AC-3 메인 오디오의 포맷에 로버스트 오디오가 보다 잘 순응하도록 하기 위하여 어느 정도의 채널 포맷화를 제공할 수 있다.
도 3의 장치는 디코딩 기능들(최종 디코딩 40)의 일부 공유를 도시한다. 달ㄴ 임의의 기능들 또는 장치들의 공유는 하드웨어 및/또는 처리 전력을 절약하기 위하여 가능하다. 도 4는 다른 공유 장치를 개념을 도시한다.
메인 오디오 비트스트림은 도 3에서 처럼 AC-3 부분 디코딩(36)에 제공되고 로버스트 오디오 비트스트림은 도 3에서 처럼 변형된 AC-3 부분 디코딩(38)에 제공된다. 에러 정보에 응답하여, 도 3에서 처럼 메인/로버스트 제어기(16)는 메인 오디오가 손상되거나 부분적으로 디코드될 때 부분 디코더(38)로부터의 정보를 스위치 또는 스위칭 기능("스위치")(44)이 선택하게 하고, 손상되지 않거나 부분적으로 디코드되지 않을 때 부분 디코더(36)로부터의 메인 AC-3 정보를 선택하게 한다. 어느 경우에서나, 스위치(44)는 PCM 출력을 제공하기 위하여 부분 디코딩(36 또는 38)에 의해 제공되지 않은 나머지 디코딩 기능들을 제공하는 도 3과 같은 최종 디코딩(40)에 부분 디코딩 정보를 결합한다.
변형된 AC-3 부분 디코더(38)로부터의 정보는 부분 디코딩(38)과 결합하여, 도 2 및 3의 트랜스코더(14) 같은 트랜스코더로서 구성하거나 기능하는 최종 트랜스코딩 기능 또는 장치("최종 트랜스코딩")(46)에 결합된다. 도 3의 트랜스코더에서 처럼, 최종 트랜스코딩(46)은 어느 정도의 채널 포맷화를 수행하여 로버스트 오디오가 상기된 바와같이 5.1 채널 AC-3 메인 오디오의 포맷화와 보다 잘 순응하게 로버스트 오디오를 형성한다.
로버스트 데이터 스트림은 가장 높은 종래 AC-3 데이터 속도와 다른 데이터 속도를 가질 수 있다. 예를 들어, 96 kb/s 같은 보다 낮은 데이터 속도를 가질 수 있다. 데이터 속도가 다를 때, 최종 트랜스코딩(46)의 기능은 로버스트 스트림의 데이터 속도를 가장 높은 AC-3 데이터 속도인 640 kb/s로 전환시키는 것이다. 로버스트 오디오 및 AC-3 오디오 사이의 다른 차이는 부분 디코딩(38)에 의해 처리될 수 있다. 만약 부분 디코딩(38) 및 최종 트랜스코딩(46)의 결합이 오디오 인코더(2)(도 1)에 의해 제공된 정보를 사용하여 상기된 바와같이 낮은 복잡성 트랜스코더를 구성하면, 최종 트랜스코딩(46)은 AC-3 순응 비트스트림에 비트 할당, 양자화 및 데이터 패킷을 수행한다.
제어기(16)는 또한 스위치 또는 스위칭 기능("스위치")(48)을 수행하여, 메인 오디오가 손상될 때(그렇지 않으면, 도 2 및 3 처럼 선택적 변화 데이터 속도 12를 통하여 메인 데이터 스트림을 선택할 때), 선택적 S/PDIF, Toslink 또는 다른 디지털 출력 포맷화기 기능 또는 장치(22)가 최종 트랜스코딩(46) 출력을 선택하게 한다.
부분 디코딩(36 또는 38) 같은 부분 디코딩, 및 최종 디코딩(40) 또는 최종 트랜스코딩(46) 사이로 통과된 정보가 직렬 비트스트림과 다를 수 있다는 것이 주의된다 - 예를 들어 양자화된 계수들을 가질 수 있다.
만약 AC-3 순응 출력이 목표되면, AC-3 부분 디코딩(36), 최종 디코딩(40)이나 스위치(44) 어느 것도 요구되지 않는다. 만약 PCM 출력이 목표되면, 변화 데이터 속도(12), 최종 트랜스코딩(46), 스위치(48) 또는 포맷화기(22)의 어느 것도 요구되지 않는다.
개시된 실시예들의 상세한 것들이 동작의 원리들을 변화시키지 않고 변화될 수 있다는 것은 당업자에게 명백할 것이다. 예를 들어, 부가적인 스위치들 또는 스위칭 기능들은 하나 또는 다른 메인 및 로버스트 입력들이 선택되고 및/또는 스위치들 또는 스위칭 기능들이 생략될 때 동일한 결과가 비선택 장치들 또는 기능들을 턴오프하지 않고 얻어질 수 있도록 공전하는 장치들 또는 기능들에 입력을 분리시키기 위하여 사용될 수 있다. 게다가, 기능들은 지정된 장치들 또는 기능들중에서 기술된 것과 다르게 공유될 수 있다. 예를 들어, 로버스트 입력이 선택될 때, 포맷화기(22)는 트랜스코더(14) 또는 최종 트랜스코더(46)로부터 데이터를 수신할 수 있고, 이로 부터 AC-3 비트스트림보다 오히려 AC-3 비트스트림을 생성한다. 다른 실시예로서, 포맷화기(22)는 변화 데이터 속도(12) 기능을 수행할 수 있다. 다른 변형들은 당업자에게 명백할 것이다.
본 발명은 다양한 방식으로 구현될 수 있다. 아날로그 및 디지털 기술들은 목표된 바와같이 사용될 수 있다. 다양한 측면들은 이산 전기 구성요소들, 집적 회로들, 프로그램 가능 논리 어레이들, ASIC들 및 다른 형태의 전자 구성요소들, 및 예를 들어 실행 가능한 프로그램 명령들을 실행하는 장치들에 의해 구현될 수 있다. 프로그램들의 명령들은 자기 및 광학 저장 매체, 판독 전용 메모리 및 프로그램 가능 메모리 같은 임의의 장치 판독 매체에 의해 전달될 수 있다.
본 발명의 소프트웨어 구현물들은 초음파로부터 자외선 주파수들을 포함하는 스펙트럼을 통한 기저대역 또는 변조된 통신 경로들, 또는 자기 테이프, 카드들 또는 디스크 같은 머신 판독 매체, 또는 광학 카드들 또는 디스크, 및 매체형 종이상 검출 가능한 마킹들을 포함하는 필수적으로 임의의 기록 기술을 사용하여 정보를 전달하는 저장 매체에 의해 전달될 수 있다.

Claims (31)

  1. 디지털 오디오 인코딩 방법에 있어서,
    PCM 오디오 데이터 샘플들을 포함하는 PCM 인코드 오디오 정보를 수신하는 단계;
    제 1 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코딩하는 단계로서, 상기 인코드된 오디오 정보가 자기 함유 데이터 유니트들을 가지는, 인코딩 단계; 및
    제 2 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코딩하는 단계로서, 상기 인코드된 오디오 정보가 자기 함유 데이터 유니트들을 가지며, 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유 데이터 유니트들의 대응하는 쌍들은 동일한 PCM 오디오 데이터 샘플들을 나타내어, 제 1 및 제 2 오디오 정보는 동일한 기초 오디오 정보를 나타내는 인코딩 단계;를 포함하는 것을 특징으로 하는 디지털 오디오 인코딩 방법.
  2. 제 1 항에 있어서, 상기 제 1 인코딩은 제 1 타입의 디지털 오디오 코딩으로 인코드된 오디오 정보를 제 1 디지털 오디오 스트림으로 인코드하고 상기 제 2 인코딩은 제 2 타입의 디지털 오디오 코딩으로 인코드된 오디오 정보를 제 2 디지털 오디오 스트림으로 인코드하여, 상기 스트림들은 상기 자기 함유 데이터 유니트들로 분할되는 것을 특징으로 하는 디지털 오디오 인코딩 방법.
  3. 제 2 항에 있어서, 적어도 상기 제 1 및 제 2 디지털 오디오 스트림들을 복합 데이터 스트림으로 멀티플렉싱하는 단계를 더 포함하는 것을 특징으로 하는 디지털 오디오 인코딩 방법.
  4. 제 1 항에 있어서, 적어도 제 1 타입의 디지털 오디오 코딩으로 인코드된 오디오 정보 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 상기 오디오 정보를 복합 데이터 스트림으로 멀티플렉싱하는 단계를 더 포함하는 것을 특징으로 하는 디지털 오디오 인코딩 방법.
  5. 제 1 항에 있어서, 상기 각각의 자기 함유 데이터 유니트들은 하나 이상의 프레임들을 포함하는 것을 특징으로 하는 디지털 오디오 인코딩 방법.
  6. 제 1 항에 있어서, 상기 제 2 인코드된 오디오 정보는 제 1 인코드된 오디오 정보보다 덜 상세히 기초 오디오의 방향 정보를 나타내는 것을 특징으로 하는 디지털 오디오 인코딩 방법.
  7. 디지털 오디오 디코딩 방법에 있어서,
    제 1 타입의 디지털 오디오 코딩으로 인코드된 제 1 오디오 정보 및 제 2 타입의 오디오 코딩으로 인코드된 제 2 오디오 정보를 수신하는 단계로서, 상기 제 1 오디오 정보 및 제 2 오디오 정보는 각각 자기 함유 데이터 유니트들을 포함하고 제 1 및 제 2 오디오 정보의 자기 함유 데이터 유니트들의 대응하는 쌍들은 동일한 기초 오디오 정보를 나타내는, 단계;
    제 1 오디오 정보에서 에러들 및 생략들을 가리키는 에러 신호를 수신하거나 제 1 오디오 정보에서 에러들 및 생략들을 검출하는 단계; 및
    상기 제 1 타입의 디지털 오디오 코딩에 따른 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공하는 단계를 포함하고,
    PCM 오디오 출력은 에러 또는 생략들이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보를 디코딩하고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 1 오디오 정보 대신 제 2 오디오 정보를 디코딩함으로써 제공되고, 및/또는
    상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보로부터 도출되고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 2 오디오 정보를 트랜스코딩함으로써 도출되는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  8. 제 7 항에 있어서, 상기 동일한 기초 오디오 정보는 동일한 PCM 오디오 데이터 샘플들을 나타내는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  9. 제 7 항에 있어서, 상기 트랜스코딩은 제 1 오디오 정보의 디지털 오디오 코딩 타입으로 제 2 오디오 정보를 트랜스코드하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  10. 제 9 항에 있어서, 상기 트랜스코딩은 또한 제 2 오디오 정보의 채널 포맷화를 변형하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  11. 제 7 항에 있어서, 상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력이 제공될 때 상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력을 포맷화하는 인터페이스를 결합하는 단계를 더 포함하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  12. 제 7 항에 있어서, 상기 제 1 타입의 디지털 오디오 코딩에 따른 PCM 오디오 출력 및/또는 오디오 출력을 제공하는 단계는 상기 에러 신호에 따라 제 1 오디오 정보 및 제 2 오디오 정보로부터의 자기 함유 데이터 유니트들의 대응 쌍중 하나를 선택하는 단계를 포함하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  13. 제 7 항에 있어서, 상기 제공 단계는 인코드된 비트스트림 형태로 상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력을 제공하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  14. 제 7 항에 있어서, 상기 제 1 오디오 정보 및 제 2 오디오 정보는 각각 인코드된 비트스트림으로서 수신되는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  15. 제 14 항에 있어서, 상기 제공 단계는 인코드된 비트스트림 형태로 제 1 타입의 디지털 오디오 코딩에 따라 인코드된 오디오 출력을 제공하고, 상기 인코드된 오디오 출력 비트스트림은 제 1 오디오 정보 인코드 비트스트림의 데이터 속도와 다른 데이터 속도를 가지는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  16. 제 7 항에 있어서, 상기 제공 단계가 PCM 오디오 출력을 제공할 때, 제 1 오디오 정보를 디코딩하는 단계 및 제 2 오디오 정보를 디코딩하는 단계는 공통 디코딩 또는 공통 디코딩 부분을 포함하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  17. 제 7 항에 있어서, 제 1 타입의 디지털 오디오 코딩은 AC-3 코딩이고 제 2 타입의 디지털 오디오 코딩은 변형된 AC-3 코딩인 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  18. 제 2 항에 있어서, 상기 변형된 AC-3 코딩은 고주파 재생을 사용하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  19. 제 17 항에 있어서, 상기 제 2 오디오 정보는 제 2 오디오 정보를 트랜스코딩시 사용할 수 있는 트랜스코딩 정보를 포함하고, 상기 제공 단계가 상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 출력을 제공할 때, 상기 트랜스코딩은 상기 트랜스코딩 정보를 사용하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  20. 제 7 항에 있어서, 상기 제공 단계가 PCM 오디오 출력을 제공할 때, 상기 제 1 오디오 정보를 디코딩하는 단계는 제 1 타입의 디지털 오디오 코딩을 위한 디코더를 포함하는 장치에 의해 수행되고 상기 제 2 오디오 정보를 디코딩하는 단계는 제 1 타입의 디지털 오디오 코딩으로 상기 제 2 타입의 디지털 오디오 코딩을 트랜스코드하는 트랜스코더를 포함하는 장치 및 상기 제 1 타입의 디지털 오디오 코딩을 위한 상기 디코더에 의해 수행되어, 공통 디코더는 제 1 및 제 2 오디오 정보에 사용되는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  21. 제 7 항에 있어서, 상기 제공 단계가 PCM 오디오 출력을 제공할 때, 상기 제 1 및 제 2 오디오 정보를 디코딩하는 단계는 제 1 및 상기 제 2 타입의 디지털 오디오 코딩을 위해 공통 디코딩 부분을 포함하는 디코더(32)를 포함하는 장치에 의해 수행되는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  22. 제 7 항에 있어서, 상기 제공 단계가 PCM 오디오 출력을 제공할 때,
    PCM 오디오 출력을 제공하기 위한 제 1 오디오 정보를 디코딩하는 단계(36)는 부분적으로 디코드된 제 1 오디오 정보를 제공하기 위하여 제 1 오디오 정보를 부분적으로 디코딩하는 단계를 포함하고,
    PCM 오디오 출력을 제공하기 위하여 제 2 오디오 정보를 디코딩하는 단계(38)는 부분적으로 디코드된 제 2 오디오 정보를 제공하기 위하여 제 2 오디오 정보를 부분적으로 디코딩하는 단계를 포함하고,
    상기 제 1 오디오 정보를 디코딩하는 단계 및 제 2 오디오 정보를 디코딩하는 단계는 PCM 오디오 출력을 제공하기 위하여 부분적으로 디코드된 제 1 및 제 2 오디오 정보의 공통 최종 디코딩(40)을 더 포함하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  23. 제 22 항에 있어서, 상기 제공 단계는 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력을 제공하고, 제 2 오디오 정보를 트랜스코딩하는 단계는 제 2 오디오 정보로부터 유도된 부분적으로 디코드된 디지털 오디오 신호의 트랜스코딩(34)을 마무리하는 단계를 포함하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  24. 제 7 항에 있어서, 상기 제공 단계가 PCM 오디오 출력을 제공할 때, 제 1 오디오 정보를 디코딩하는 단계 및 제 2 오디오 정보를 디코딩하는 단계는 제 1 및 제 2 오디오 정보의 부분 디코딩 및 최종 디코딩을 포함하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  25. 제 24 항에 있어서, 상기 제공 단계가 상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력을 제공할 때, 제 2 오디오 정보를 트랜스코딩하는 단계는 상기 부분 디코딩하는 단계를 포함하고 부분적으로 디코드된 제 2 오디오 정보의 트랜스코딩을 마무리하는 단계를 더 포함하여, 제 2 오디오 정보의 부분 디코딩은 PCM 오디오 출력을 제공하기 위한 제 2 오디오 정보의 디코딩 및 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 출력을 제공하기 위한 제 2 오디오 정보의 트랜스코딩에 공통인 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  26. 디지털 오디오를 인코딩하는 장치에 있어서,
    PCM 오디오 데이터 샘플들을 포함하는 PCM 인코드된 오디오 정보를 수신하고,
    제 1 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코드하는데, 상기 인코드된 오디오 정보가 자기 함유 데이터 윤트들을 가지며, 및
    제 2 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코드하도록 구성된 오디오 인코더를 포함하고, 상기 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유 데이터 유니트들의 대응 쌍들은 동일한 PCM 오디오 데이터 샘플들을 나타내어, 제 1 및 제 2 오디오 정보는 동일한 기초 오디오 정보를 나타내는 것을 특징으로 하는 디지털 오디오 인코딩 장치.
  27. 디지털 오디오를 디코딩하는 장치에 있어서,
    제 1 타입의 디지털 오디오 코딩으로 인코드된 제 1 오디오 정보 및 제 2 타입의 오디오 코딩으로 인코드된 제 2 오디오 정보를 수신하는데, 상기 제 1 오디오 정보 및 제 2 오디오 정보가 각각 자기 함유 데이터 유니트들을 가지며 제 1 및 제 2 오디오 정보의 자기 함유 데이터 유니트들의 대응 쌍들이 동일한 기초 오디오 정보를 나타내고,
    제 1 오디오 정보에서 에러들 및 생략들을 가리키는 에러 신호를 수신하거나 제 1 오디오 정보에서 에러들 및 생략들을 검출하고, 및
    상기 제 1 타입의 디지털 오디오 코딩에 따른 PCM 오디오 출력 및/또는 인코드된 오이도 출력을 제공하도록 구성된 오디오 디코더를 포함하고,
    PCM 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보를 디코딩하고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 1 오디오 정보 대신 제 2 오디오 정보를 디코딩하여 제공되고, 및/또는
    상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보에서 도출되고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 2 오디오 정보를 트랜스코딩함으로써 도출되는 것을 특징으로 하는 디지털 오디오 디코딩 장치.
  28. PCM 오디오 데이터 샘플들을 포함하는 PCM 인코드된 오디오 정보를 수신하는 수단,
    제 1 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코딩하는 수단으로서, 상기 인코드된 오디오 정보가 자기 함유 데이터 유니트들을 가지며, 및
    제 2 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코딩하는 수단으로서, 상기 인코드된 오디오 정보가 자기 함유 데이터 유니트들을 가지며, 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유 데이터 유니트들의 대응하는 쌍이 동일한 PCM 오디오 데이터 샘플들을 나타내어, 상기 제 1 및 제 2 오디오 정보가 동일한 기초 오디오 정보를 나타내는 수단;을 포함하는 것을 특징으로 하는 디지털 오디오 디코딩 방법.
  29. 디지털 오디오 디코더에 있어서,
    제 1 타입의 디지털 오디오 코딩으로 인코드된 제 1 오디오 정보 및 제 2 타입의 오디오 코딩으로 인코드된 제 2 오디오 정보를 수신하는 수단으로서, 상기 제 1 오디오 정보 및 제 2 오디오 정보가 각각 자기 함유 데이터 유니트들을 포함하고 제 1 및 제 2 오디오 정보에서 자기 함유 데이터 유니트들의 대응하는 쌍들이 동일한 기초 오디오 정보를 나타내는, 수단,
    제 1 오디오 정보에서 에러들 및 생략들을 가리키는 에러 신호를 수신하거나 제 1 오디오 정보에서 에러들 및 생략들을 검출하는 수단, 및
    상기 제 1 타입의 디지털 오디오 코딩에 따라 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공하는 수단을 포함하고,
    PCM 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보를 디코딩하고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 1 오디오 정보 대신 제 2 오디오 정보를 디코딩함으로써 제공되고, 및/또는
    상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보에서 도출되고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 2 오디오 정보를 트랜스코딩함으로써 도출되는 것을 특징으로 하는 디지털 오디오 디코더.
  30. 인코드된 프로그램 코드를 그 위에 가진 머신 판독 가능 매체에 있어서,
    프로그램 코드가 머신에 의해 실행될 때, 머신은 디지털 오디오 디코딩 방법을 구현하고,
    제 1 타입의 디지털 오디오 코딩으로 인코드된 제 1 오디오 정보 및 제 2 타입의 오디오 코딩으로 인코드된 제 2 오디오 정보를 수신하는 단계로서, 상기 제 1 오디오 정보 및 제 2 오디오 정보가 자기 함유 데이터 유니트를 각각 가지며 제 1 및 제 2 오디오 정보에서 자기 함유 데이터 유니트들의 대응하는 쌍들은 동일한 기초 오디오 정보를 나타내는, 단계,
    제 1 오디오 정보에서 에러들 및 생략들을 나타내는 에러 신호를 수신하거나 제 1 오디오 정보에서 에러들 및 생략들을 검출하는 단계, 및
    상기 제 1 타입의 디지털 오디오 코딩에 따라 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공하는 단계를 포함하고,
    PCM 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보 및 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 1 오디오 정보 대신 제 2 오디오 정보를 디코딩하여 제공되고, 및/또는
    상기 제 1 타입의 디지털 오디오 코딩에 따른 인코드된 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 1 오디오 정보로부터 도출되고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 2 오디오 정보를 트랜스코딩하여 도출되는 것을 특징으로 하는 머신 판독 가능 매체.
  31. 디지털 오디오 인코딩 및 디코딩 방법에 있어서,
    PCM 오디오 데이터 샘플들을 포함하는 PCM 인코드된 오디오 정보를 수신하는 단계,
    제 1 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코딩하는 단계로서, 상기 인코드된 오디오 정보가 자기 함유 데이터 유니트들을 갖는, 단계,
    제 2 타입의 디지털 오디오 코딩으로 상기 오디오 정보를 인코딩하는 단계로서, 상기 인코드된 오디오 정보가기 함유 데이터 유니트들을 가지며, 제 1 타입 및 제 2 타입의 디지털 오디오 코딩으로 인코드된 자기 함유 데이터 유니트들의 대응 쌍들이 동일한 PCM 오디오 데이터 샘플들을 나타내어, 제 1 및 제 2 오디오 정보가 동일한 기초 오디오 정보를 나타내는, 단계,
    제 1 타입의 디지털 오디오 코딩으로 인코드된 오디오 정보 및 제 2 타입의 오디오 코딩으로 인코드된 오디오 정보를 수신하는 단계,
    제 1 오디오 정보의 에러들 또는 생략들을 가리키는 에러 신호를 수신하거나 제 1 오디오 정보에서 에러들 및 생략들을 검출하는 단계, 및
    상기 제 1 타입의 디지털 오디오 코딩에 따른 PCM 오디오 출력 및/또는 인코드된 오디오 출력을 제공하는 단계를 포함하고,
    PCM 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보를 디코딩하고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 1 오디오 정보 대신 제 2 오디오 정보를 디코딩하여 제공되고, 및/또는
    상기 제 1 타입의 디지털 오디오 코딩에 따라 인코드된 오디오 출력은 에러 또는 생략이 제 1 오디오 정보에서 검출되지 않을 때 제 1 오디오 정보로부터 도출되고 에러 또는 생략이 제 1 오디오 정보에서 검출될 때 제 2 오디오 정보를 트랜스코딩함으로써 도출되는 것을 특징으로 하는 디지털 오디오 인코딩 및 디코딩 방법.
KR1020057014503A 2003-02-06 2004-01-29 연속 백업 오디오 KR20050097989A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US44553703P 2003-02-06 2003-02-06
US60/445,537 2003-02-06

Publications (1)

Publication Number Publication Date
KR20050097989A true KR20050097989A (ko) 2005-10-10

Family

ID=32869376

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020057014503A KR20050097989A (ko) 2003-02-06 2004-01-29 연속 백업 오디오

Country Status (13)

Country Link
US (1) US20060069550A1 (ko)
EP (1) EP1590800B1 (ko)
JP (1) JP2006518049A (ko)
KR (1) KR20050097989A (ko)
CN (1) CN1739141A (ko)
AT (1) ATE447755T1 (ko)
AU (1) AU2004211829A1 (ko)
CA (1) CA2512725A1 (ko)
DE (1) DE602004023917D1 (ko)
IL (1) IL169443A0 (ko)
MX (1) MXPA05008317A (ko)
PL (1) PL377355A1 (ko)
WO (1) WO2004073178A2 (ko)

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
US7610205B2 (en) 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7461002B2 (en) 2001-04-13 2008-12-02 Dolby Laboratories Licensing Corporation Method for time aligning audio signals using characterizations based on auditory events
DE10129108A1 (de) * 2001-06-16 2003-01-02 Harman Becker Automotive Sys Verfahren und Schaltungsanordnung zur Datenübertragung
ATE390683T1 (de) 2004-03-01 2008-04-15 Dolby Lab Licensing Corp Mehrkanalige audiocodierung
US7508947B2 (en) 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
US8090120B2 (en) 2004-10-26 2012-01-03 Dolby Laboratories Licensing Corporation Calculating and adjusting the perceived loudness and/or the perceived spectral balance of an audio signal
WO2006104517A1 (en) * 2005-03-29 2006-10-05 Thomson Licensing Method and apparatus for improving reception of wireless signals using spatial redundancy
JP2008535374A (ja) * 2005-03-29 2008-08-28 トムソン ライセンシング 無線通信システムでロバスト受信を提供する方法及び装置
TWI397903B (zh) * 2005-04-13 2013-06-01 Dolby Lab Licensing Corp 編碼音訊之節約音量測量技術
WO2006132857A2 (en) 2005-06-03 2006-12-14 Dolby Laboratories Licensing Corporation Apparatus and method for encoding audio signals with decoding instructions
WO2007070007A1 (en) * 2005-12-14 2007-06-21 Matsushita Electric Industrial Co., Ltd. A method and system for extracting audio features from an encoded bitstream for audio classification
KR101364979B1 (ko) * 2006-02-24 2014-02-20 오렌지 신호 엔벨로프의 양자화 인덱스들의 이진 코딩 방법과 신호엔벨로프의 디코딩 방법, 및 대응하는 코딩 모듈과 디코딩모듈
TWI517562B (zh) 2006-04-04 2016-01-11 杜比實驗室特許公司 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式
MY141426A (en) 2006-04-27 2010-04-30 Dolby Lab Licensing Corp Audio gain control using specific-loudness-based auditory event detection
US8849433B2 (en) 2006-10-20 2014-09-30 Dolby Laboratories Licensing Corporation Audio dynamics processing using a reset
US8256005B2 (en) * 2007-01-08 2012-08-28 Apple Inc. Protection of audio or video data in a playback device
BRPI0813723B1 (pt) 2007-07-13 2020-02-04 Dolby Laboratories Licensing Corp método para controlar o nível de intensidade do som de eventos auditivos, memória legível por computador não transitória, sistema de computador e aparelho
US8457958B2 (en) * 2007-11-09 2013-06-04 Microsoft Corporation Audio transcoder using encoder-generated side information to transcode to target bit-rate
KR101597375B1 (ko) 2007-12-21 2016-02-24 디티에스 엘엘씨 오디오 신호의 인지된 음량을 조절하기 위한 시스템
US20100063825A1 (en) * 2008-09-05 2010-03-11 Apple Inc. Systems and Methods for Memory Management and Crossfading in an Electronic Device
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
TWI412023B (zh) * 2010-12-14 2013-10-11 Univ Nat Chiao Tung 可消除噪音且增進語音品質之麥克風陣列架構及其方法
CN103050123B (zh) * 2011-10-17 2015-09-09 多玩娱乐信息技术(北京)有限公司 一种传输语音信息的方法和系统
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
EP2933797B1 (en) * 2012-12-17 2016-09-07 Panasonic Intellectual Property Management Co., Ltd. Information processing device and control method
RU2602332C1 (ru) 2013-01-21 2016-11-20 Долби Лабораторис Лайсэнзин Корпорейшн Перекодировка метаданных
US9972357B2 (en) * 2014-01-08 2018-05-15 Adobe Systems Incorporated Audio and video synchronizing perceptual model
TWI758146B (zh) * 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5559891A (en) * 1992-02-13 1996-09-24 Nokia Technology Gmbh Device to be used for changing the acoustic properties of a room
JP2718344B2 (ja) * 1993-07-02 1998-02-25 日本電気株式会社 情報蓄積装置
JPH08139708A (ja) * 1994-11-10 1996-05-31 Casio Comput Co Ltd 無線受信機及び無線通信システム
DE19754297A1 (de) * 1997-12-08 1999-06-10 Thomson Multimedia Sa Audiodatendekoder
JPH11225161A (ja) * 1998-02-05 1999-08-17 Matsushita Electric Ind Co Ltd データ処理方法およびデータ処理装置
JP3974712B2 (ja) * 1998-08-31 2007-09-12 富士通株式会社 ディジタル放送用送信・受信再生方法及びディジタル放送用送信・受信再生システム並びにディジタル放送用送信装置及びディジタル放送用受信再生装置
JP2000099061A (ja) * 1998-09-25 2000-04-07 Sony Corp 効果音付加装置
US6263371B1 (en) * 1999-06-10 2001-07-17 Cacheflow, Inc. Method and apparatus for seaming of streaming content
US6721337B1 (en) * 1999-08-24 2004-04-13 Ibiquity Digital Corporation Method and apparatus for transmission and reception of compressed audio frames with prioritized messages for digital audio broadcasting
SE0001727L (sv) * 2000-05-10 2001-11-11 Global Ip Sound Ab Överföring över paketförmedlade nät
US6757654B1 (en) * 2000-05-11 2004-06-29 Telefonaktiebolaget Lm Ericsson Forward error correction in speech coding
DE60100131T2 (de) * 2000-09-14 2003-12-04 Lucent Technologies Inc Verfahren und Vorrichtung zur Diversity-Betriebsteuerung in der Sprachübertragung
JP3566931B2 (ja) * 2001-01-26 2004-09-15 日本電信電話株式会社 音声信号の符号列のパケット組立方法、装置及びパケット分解方法、装置並びにこれらの方法を実行するプログラム、プログラムを記録する記録媒体
FR2820573B1 (fr) * 2001-02-02 2003-03-28 France Telecom Methode et dispositif de traitement d'une pluralite de flux binaires audio
US20030028386A1 (en) * 2001-04-02 2003-02-06 Zinser Richard L. Compressed domain universal transcoder
JP2002368722A (ja) * 2001-06-05 2002-12-20 Kobe Steel Ltd 符号化装置及び復号化装置
CN1248194C (zh) * 2001-11-14 2006-03-29 松下电器产业株式会社 编码装置、解码装置及其系统和方法
JP2003022097A (ja) * 2002-04-09 2003-01-24 Matsushita Electric Ind Co Ltd 復号装置、再生装置及び蓄積媒体

Also Published As

Publication number Publication date
WO2004073178A3 (en) 2005-01-20
EP1590800A2 (en) 2005-11-02
PL377355A1 (pl) 2006-02-06
US20060069550A1 (en) 2006-03-30
DE602004023917D1 (de) 2009-12-17
EP1590800B1 (en) 2009-11-04
CN1739141A (zh) 2006-02-22
WO2004073178A2 (en) 2004-08-26
IL169443A0 (en) 2007-07-04
MXPA05008317A (es) 2005-11-04
JP2006518049A (ja) 2006-08-03
CA2512725A1 (en) 2004-08-26
ATE447755T1 (de) 2009-11-15
AU2004211829A1 (en) 2004-08-26

Similar Documents

Publication Publication Date Title
EP1590800B1 (en) Continuous backup audio
US9788136B2 (en) Apparatus and method for low delay object metadata coding
RU2380766C2 (ru) Адаптивное остаточное аудиокодирование
JP4772279B2 (ja) オーディオ信号のマルチチャネル/キュー符号化/復号化
US7275031B2 (en) Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
EP1667110B1 (en) Error reconstruction of streaming audio information
KR101283783B1 (ko) 고품질 다채널 오디오 부호화 및 복호화 장치
Andersen et al. Introduction to Dolby digital plus, an enhancement to the Dolby digital coding system
US20100324915A1 (en) Encoding and decoding apparatuses for high quality multi-channel audio codec
US20120078642A1 (en) Encoding method and encoding device, decoding method and decoding device and transcoding method and transcoder for multi-object audio signals
JP2007528025A (ja) オーディオ配信システム、オーディオエンコーダ、オーディオデコーダ、及びそれらの動作方法
EP3210206B1 (en) Encoding and decoding of audio signals
US20140310010A1 (en) Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same
EP2711924B1 (en) Bit stream transmission device, bit stream reception/transmission system, bit stream reception device, bit stream transmission method, bit stream reception method, and bit stream
US20110311063A1 (en) Embedding and extracting ancillary data
CN106463126B (zh) 基于对象的音频系统中的残差编码
US20140369503A1 (en) Simultaneous broadcaster-mixed and receiver-mixed supplementary audio services
JP2005521921A (ja) 信号処理
KR20180081504A (ko) 디코드 장치, 디코드 방법, 및 프로그램
Quackenbush et al. Digital Audio Compression Technologies
Komori Trends in Standardization of Audio Coding Technologies
JP2022553111A (ja) チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器
Rumsey Data reduction for high quality digital audio storage and transmission
Karsh et al. Diamond Audio—Explained

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application