KR100998450B1

KR100998450B1 - 오디오 코딩을 위한 인코더-보조 프레임 손실 은폐 기술

Info

Publication number: KR100998450B1
Application number: KR1020087012437A
Authority: KR
Inventors: 류상욱; 에디 엘 티 초이; 사미르 쿠마 굽타
Original assignee: 퀄컴 인코포레이티드
Priority date: 2005-10-26
Filing date: 2006-10-25
Publication date: 2010-12-06
Also published as: CN101346760A; DE602006020316D1; ATE499676T1; KR20080070026A; US20070094009A1; EP1941500A1; JP2009514032A; JP4991743B2; EP1941500B1; CN101346760B; WO2007051124A1; US8620644B2

Abstract

오디오 신호를 디코딩하는 인코더-보조 프레임 손실 은폐 (FLC) 기술이 개시되어 있다. 디코더는, 오디오 신호의 에러 프레임을 폐기할 수도 있으며, 인코더로부터 송신된 사이드 정보 및 이웃하는 프레임들에 기초하여 폐기된 프레임을 정확하게 은폐하기 위해 인코더-보조 FLC 기술을 구현할 수도 있다. 인코더-보조 FLC 기술은, 이웃하는 프레임들의 주파수 도메인 데이터에 기초하여 프레임에 대한 주파수 도메인 데이터의 크기를 추정하고, 사이드 정보로서 인코더로부터 송신된 사인의 서브세트에 기초하여 주파수 도메인 데이터의 사인을 추정하는 것을 포함한다. 오디오 신호의 프레임에 대한 주파수 도메인 데이터는 음조 성분 및 잡음 성분을 포함한다. 랜덤 신호로부터 추정된 사인은 주파수 도메인 데이터의 잡음 성분에 대해 실질적으로 정확할 수도 있다. 그러나, 음조 성분에 대한 매우 정확한 사인 추정을 달성하기 위해, 인코더는 사이드 정보로서 주파수 도메인 데이터의 음조 성분에 대한 사인을 송신한다.

인코더, 디코더, 인코더-보조 프레임 손실 은폐 (FLC) 기술, 프레임

Description

오디오 코딩을 위한 인코더-보조 프레임 손실 은폐 기술{ENCODER-ASSISTED FRAME LOSS CONCEALMENT TECHNIQUES FOR AUDIO CODING}

본 출원은 2005년 10월 26일 출원된 미국 가출원 제 60/730,459 호 및 2005년 10월 31일 출원된 미국 가출원 제 60/732,012 호의 이점을 주장한다.

기술 분야

본 발명은 오디오 코딩 기술에 관한 것으로, 특히 오디오 코딩을 위한 프레임 손실 은폐 기술에 관한 것이다.

배경

오디오 코딩은, 위성 라디오, 디지털 라디오, 인터넷 스트리밍 (웹 라디오), 디지털 음악 플레이어, 및 다양한 이동 멀티미디어 애플리케이션과 같은 다수의 애플리케이션 및 환경에서 사용된다. 동화상 전문가 그룹 (MPEG) 에 따른 표준, 윈도우즈 미디어 오디오 (WMA), 및 돌비 연구소에 의한 표준과 같은 다수의 오디오 코딩 표준이 존재한다. 애플 컴퓨터사에 의해 판매된 "iPod" 디바이스에서 사용된 고급 오디오 코딩 (AAC) 표준과 같은, MP3 표준 및 MP3 표준에 대한 후속물을 포함하는 다수의 오디오 코딩 표준들이 계속 나타나고 있다. 일반적으로, 오디오 코딩 표준들은, 압축 기술을 사용하여 낮은 비트레이트, 높은 품질의 오디오 코딩의 달성을 추구한다. 일부 오디오 코딩은 "코딩이 오디오 신호를 열화시키지 않는다는 것을 의미하는 "무손실 (loss-less)" 이지만, 다른 오디오 코딩은 추가 압축을 달성하기 위해 어떤 손실을 도입할 수도 있다.

다수의 애플리케이션에서, 비디오 전화 (VT) 또는 스트리밍 비디오와 같은 애플리케이션에 대해 멀티 미디어 컨텐츠를 제공하기 위해 오디오 코딩이 비디오 코딩과 사용된다. 예를 들어, MPEG 에 따른 비디오 코딩 표준들은 종종, 오디오 및 비디오 코딩을 사용한다. 현재, MPEG 표준들은, MPEG-1, MPEG-2 및 MPEG-4 를 포함하지만, 다른 표준들이 나타날 가능성도 있다. 다른 예시적인 비디오 표준들은, 국제 전기통신 연합 (ITU) H.263 표준, ITU H.264 표준, 애플 컴퓨터사에 의해 개발된 QuickTime™ 기술, 마이크로소프트사에 의해 개발된 Video for Windows™, 인텔사에 의해 개발된 Indeo™, RealNetworks, Inc 로부터의 RealVideo™, 및 SuperMac, Inc 에 의해 개발된 Cinepak™ 을 포함한다. 일부 오디오 및 비디오 표준들은 개방형 소스이지만, 다른 것들은 소유권이 있는 상태이다. 다수의 다른 오디오 및 비디오 코딩 표준들이 계속 나타나고 발전할 것이다.

송신된 오디오 신호에서 발생하는 비트스트림 에러는, 가청 인공현상의 도입으로 인해, 디코딩된 오디오 신호에 심각한 영향을 미칠 수도 있다. 이러한 품질 열화를 해결하기 위해, 에러 검출 모듈 및 프레임 손실 은폐 (FLC) 모듈을 포함하는 에러 제어 블록이 디코더에 부가될 수도 있다. 수신된 비트스트림의 프레임에서 에러가 검출되면, 에러 검출 모듈은 에러 프레임에 대한 모든 비트를 폐기한다. 그 후, FLC 모듈은, 지각적으로 심리스 (seamless) 한 사운딩 오디오 신호를 생성하기 위한 시도로, 그 폐기된 프레임을 대체하기 위해 오디오 데이터를 추정한다.

디코더 프레임 손실 은폐를 위한 다양한 기술이 제안되었다. 그러나, 대부분의 FLC 기술은, 은폐된 오디오 신호 품질과 구현 비용 사이의 과도한 트레이드오프로 인해 손상을 받는다. 예를 들어, 폐기된 프레임을 묵음, 잡음, 또는 이전 프레임의 오디오 데이터로 단순히 대체하는 것은, 낮은 계산적 비용이지만 불량한 은폐 성능으로 인해 어떤 과도한 트레이드오프를 나타낸다. 폐기된 프레임을 은폐하기 위한 소스 모델링에 기초하는 고급 기술은, 만족할 만한 은폐 성능을 달성하기 위해 높거나 심지어 엄청난 구현 비용을 요구함으로써 다른 과도함을 초래한다.

요약

일반적으로, 본 발명은 오디오 신호를 디코딩하는 인코더-보조 프레임 손실 은폐 (FLC) 기술에 관한 것이다. 인코더로부터 오디오 신호의 프레임에 대한 오디오 비트스트림을 수신할 때, 디코더는 에러 검출을 수행할 수도 있고, 에러가 검출될 때 프레임을 폐기할 수도 있다. 디코더는, 인코더로부터의 오디오 비트스트림과 송신된 사이드 정보 및 이웃하는 프레임들에 기초하여, 폐기된 프레임을 정확하게 은폐하기 위해 인코더-보조 FLC 기술을 구현할 수도 있다. 인코더-보조 FLC 기술은, 이웃하는 프레임들의 주파수 도메인 데이터에 기초하여 프레임에 대한 주파수 도메인 데이터의 크기를 추정하며, 사이드 정보로서 인코더로부터 송신된 사인 (sign) 의 서브세트에 기초하여 주파수 도메인 데이터의 사인을 추정하는 것을 포함한다. 이러한 방식으로, 인코더-보조 FLC 기술은, 가청 인공현상 의 발생을 감소시킬 수도 있어서 지각적으로 심리스한 사운딩 오디오 신호를 생성할 수도 있다.

오디오 신호의 프레임에 대한 주파수 도메인 데이터는 음조 (tonal) 성분 및 잡음 성분을 포함한다. 랜덤 신호로부터 추정된 사인은 주파수 도메인 데이터의 잡음 성분에 대해 실질적으로 정확할 수도 있다. 그러나, 음조 성분에 대한 매우 정확한 사인 추정을 달성하기 위해, 인코더는 사이드 정보로서 주파수 도메인 데이터의 음조 성분에 대한 사인을 송신한다. 디코더로 송신된 사이드 정보의 양을 최소화시키기 위해, 인코더는 프레임내의 음조 성분의 위치를 송신하지 않는다. 대신, 인코더 및 디코더 양자는 동일한 동작을 사용하여 음조 성분의 위치를 자체 유도한다. 따라서, 인코더-보조 FLC 기술은, 인코더가 최소량의 사이드 정보를 송신하면서, 디코더에서 프레임 은폐 품질의 현저한 개선을 달성한다.

본 명세서에 설명하는 인코더-보조 FLC 기술은 윈도우즈 미디어 오디오 (WMA) 표준, MP3 표준, 및 AAC (고급 오디오 코딩) 표준과 같은 오디오 코딩 표준을 사용하는 멀티미디어 애플리케이션에서 구현될 수도 있다. AAC 표준의 경우에서, 오디오 신호의 프레임의 주파수 도메인 데이터는 변형 이산 코사인 변환 (MDCT) 계수에 의해 표현된다. MDCT 계수 각각은 음조 성분 또는 잡음 성분을 포함한다. 일 프레임은 1024개 MDCT 계수를 포함할 수도 있으며, MDCT 계수 각각은 크기 및 사인을 포함한다. 인코더-보조 FLC 기술은 폐기된 프레임에 대한 MDCT 계수의 크기 및 사인을 개별적으로 추정한다.

일 실시형태에서, 본 발명은 오디오 신호의 프레임을 은폐하는 방법을 제공 한다. 이 방법은, 프레임의 이웃하는 프레임에 기초하여 프레임에 대한 주파수 도메인 데이터의 크기를 추정하는 단계; 사이드 정보로서 인코더로부터 송신된 프레임에 대한 사인의 서브세트에 기초하여 프레임에 대한 주파수 도메인 데이터의 사인을 추정하는 단계; 및 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합하는 단계를 포함한다.

다른 실시형태에서, 본 발명은 오디오 신호의 프레임을 은폐하는 명령들을 포함하는 컴퓨터 판독가능 매체를 제공한다. 이 명령들은, 프로그램가능한 프로세서로 하여금, 프레임의 이웃하는 프레임들에 기초하여 프레임에 대한 주파수 도메인 데이터의 크기를 추정하게 하며, 사이드 정보로서 인코더로부터 송신된 프레임에 대한 사인의 서브세트에 기초하여 프레임에 대한 주파수 도메인 데이터의 사인을 추정하게 한다. 또한, 이 명령들은, 프로그램가능한 프로세서로 하여금, 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합하게 한다.

또 다른 실시형태에서, 본 발명은 사이드 정보로서 프레임에 대한 사인의 서브세트를 송신하는 인코더, 및 그 인코더로부터 프레임에 대한 사이드 정보를 수신하는 FLC 모듈을 포함하는 디코더를 구비하는 오디오 신호의 프레임을 은폐하는 시스템을 제공한다. 디코더내의 FLC 모듈은, 프레임의 이웃하는 프레임들에 기초하여 프레임에 대한 주파수 도메인 데이터의 크기를 추정하고, 수신된 사이드 정보에 기초하여 프레임에 대한 주파수 도메인 데이터의 사인을 추정하며, 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합한다.

또 다른 실시형태에서, 본 발명은 오디오 신호의 프레임에 대한 주파수 도메인 데이터의 성분을 선택하는 성분 선택 모듈, 및 프레임에 대한 주파수 도메인 데이터로부터 선택된 성분에 대한 사인의 서브세트를 추출하는 사인 추출기를 구비하는 인코더를 제공한다. 이 인코더는 프레임에 대한 사인의 서브세트를 사이드 정보로서 디코더로 송신한다.

또 다른 실시형태에서, 본 발명은 프레임의 이웃하는 프레임들에 기초하여 오디오 신호의 프레임에 대한 주파수 도메인 데이터의 크기를 추정하는 크기 추정기, 및 사이드 정보로서 인코더로부터 송신된 프레임에 대한 사인의 서브세트에 기초하여 프레임에 대한 주파수 도메인 데이터의 사인을 추정하는 사인 추정기를 포함하는 FLC 모듈 구비하는 디코더를 제공한다. 이 디코더는 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합한다.

본 명세서에 설명하는 기술은 하드웨어, 소프트웨어, 펌웨어, 또는 이들의 임의의 조합에서 구현될 수도 있다. 소프트웨어에서 구현되는 경우에, 이 기술은, 프로그램가능한 프로세서에 의해 실행될 때, 본 명세서에 설명한 방법들 중 하나 이상을 수행하는 명령들을 포함하는 프로그램 코드를 구비한 컴퓨터 판독가능 매체에 의해 부분적으로 실현될 수도 있다.

하나 이상의 실시형태의 상세가 첨부한 도면 및 아래의 상세한 설명에 설명된다. 본 발명의 다른 특징, 목적, 및 이점은 상세한 설명 및 도면, 및 청구범위로부터 명백할 것이다.

도면의 간단한 설명

도 1 은, 인코더-보조 프레임 손실 은폐 (FLC) 기술을 구현하는 오디오 인코더-디코더 (코덱) 를 통합한 오디오 인코딩 및 디코딩 시스템을 예시하는 블록도이다.

도 2 는, 도 1 로부터의 오디오 인코딩 및 디코딩 시스템으로 인코더-보조 프레임 손실 은폐를 수행하는 예시적인 동작을 예시하는 플로우차트이다.

도 3 은, 사이드 정보로서 송신될 프레임에 대한 사인의 서브세트를 생성하는 프레임 손실 은폐 모듈을 포함하는 예시적인 오디오 인코더를 예시하는 블록도이다.

도 4 는, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브세트를 이용하는 프레임 손실 은폐 모듈을 포함하는 예시적인 오디오 디코더를 예시하는 블록도이다.

도 5 는, 사이드 정보로서 오디오 비트스트림과 송신될 프레임에 대한 사인의 서브세트를 생성하고 오디오 비트스트림을 인코딩하는 예시적인 동작을 예시하는 플로우차트이다.

도 6 은, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브세트를 사용하여 프레임 손실 은폐를 수행하고 오디오 비트스트림을 디코딩하는 예시적인 동작을 예시하는 플로우차트이다.

도 7 은, 사이드 정보로서 송신될 프레임에 대한 사인의 서브세트를 생성하는 사인 추출기 및 성분 선택 모듈을 포함하는 또 다른 예시적인 오디오 인코더를 예시하는 블록도이다.

도 8 은, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브세트를 이용하는 프레임 손실 은폐 모듈을 포함하는 또 다른 예시적인 오디오 디코더를 예시하는 블록도이다.

도 9 는, 사이드 정보로서 오디오 비트스트림과 송신될 프레임에 대한 사인의 서브세트를 생성하고 오디오 비트스트림을 인코딩하는 또 다른 예시적인 동작을 예시하는 플로우차트이다.

도 10 은, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브세트를 사용하여 프레임 손실 은폐를 수행하고 오디오 비트스트림을 디코딩하는 또 다른 예시적인 동작을 예시하는 플로우차트이다.

도 11 은, 본 명세서에 설명한 인코더-보조 프레임 손실 은폐 기술의 프레임 손실율과 종래의 프레임 손실 은폐 기술의 프레임 손실율 사이의 품질 비교를 예시하는 도면이다.

상세한 설명

도 1 은, 인코더-보조 프레임 손실 은폐 (FLC) 기술을 구현하는 오디오 인코더-디코더 (코덱) 을 통합한 오디오 인코딩 및 디코딩 시스템 (2) 을 예시하는 블록도이다. 도 1 에 도시되어 있는 바와 같이, 시스템 (2) 은 제 1 통신 디바이스 (3) 및 제 2 통신 디바이스 (4) 를 포함한다. 시스템 (2) 은 또한, 통신 디바이스들 (3 및 4) 을 접속시키는 송신 채널 (5) 을 포함한다. 시스템 (2) 은 송신 채널 (5) 을 통해 통신 디바이스들 (3 및 4) 사이의 2-방향 오디오 데이터 송신을 지원한다.

예시된 실시형태에서, 통신 디바이스 (3) 는 FLC 모듈 (7) 을 갖는 오디오 코덱 (6) 및 멀티플렉싱 (mux)/디멀티플렉싱 (demux) 컴포넌트 (8) 를 포함한다. 통신 디바이스 (4) 는 mux/demux 컴포넌트 (9) 및 FLC 모듈 (11) 을 갖는 오디오 코덱 (10) 을 포함한다. 각각의 오디오 코덱 (6 및 10) 의 FLC 모듈 (7 및 11) 은, 본 명세서에 설명한 인코더-보조 FLC 기술에 따라, 인코더로부터 송신된 사이드 정보 및 이웃하는 프레임들에 기초하여 오디오 신호의 폐기된 프레임을 정확하게 은폐할 수도 있다. 다른 실시형태에서, FLC 모듈 (7 및 11) 은 인코더로부터 송신된 추가 사이드 정보를 이용하여 이웃하는 프레임들에 기초하여 오디오 신호의 다중의 폐기된 프레임을 정확하게 은폐할 수도 있다.

통신 디바이스 (3 및 4) 는 오디오 데이터를 전송 및 수신하도록 구성될 수도 있다. 통신 디바이스 (3 및 4) 는 무선 이동 단말기 또는 유선 단말기로서 구현될 수도 있다. 이 목적을 위해, 통신 디바이스 (3 및 4) 는 적절한 무선 송신기, 수신기, 모뎀, 및 무선 통신을 지원하기 위한 프로세싱 전자장비를 더 포함할 수도 있다. 무선 이동 단말기의 예들로는, 이동 무선 전화, 이동 개인 보조 단말기 (PDA), 이동 컴퓨터, 또는 무선 통신 능력 및 오디오 인코딩 및/또는 디코딩 능력이 장착된 다른 이동 디바이스를 포함한다. 유선 단말기의 예들로는, 데스크탑 컴퓨터, 비디오 전화, 네트워크 기구, 셋탑 박스, 대화형 텔레비전 등을 포함한다.

송신 채널 (5) 은 유선 또는 무선 통신 매체일 수도 있다. 무선 통신에서, 대역폭은, 매우 낮은 비트레이트가 종종 요구되기 때문에 중요한 관심사이다. 특히, 송신 채널 (5) 는 채널 (5) 을 통한 대량의 오디오 데이터의 송신을 매우 문제점으로 만드는 제한된 대역폭을 가질 수도 있다. 예를 들어, 송신 채널 (5) 은, 채널 (5) 에서의 물리적 제약, 또는 가능하게는 송신 채널 (5) 의 제공자에 의해 부과된 대역폭 할당 제약 또는 서비스 품질 (QoS) 제한으로 인해 제한된 대역폭을 갖는 무선 통신 링크일 수도 있다.

각각의 통신 디바이스 (3 및 4) 내의 오디오 코덱 (6 및 10) 각각은 동화상 전문가 그룹 (MPEG) 에 따른 표준, 돌비 연구소에 의한 표준, 윈도우즈 미디어 오디오 (WMA) 표준, MP3 표준, 및 고급 오디오 코딩 (AAC) 표준과 같은 오디오 코딩 표준들에 따라 오디오 데이터를 인코딩 및 디코딩한다. 일반적으로, 오디오 코딩 표준들은 압축 기술을 사용하여 낮은 비트레이트, 고품질 오디오 코딩의 달성을 추구한다. 일부 오디오 코딩은, 코딩이 오디오 신호를 열화시키지 않는 "무손실" 이지만, 다른 오디오 코딩은 추가 압축을 달성하기 위해 어떤 손실을 도입할 수도 있다.

일부 실시형태에서, 통신 디바이스 (3 및 4) 는 또한, 각각의 오디오 코덱 (6 및 10) 과 통합된 비디오 코덱 (미도시) 을 포함할 수도 있으며, 데이터 스트림의 오디오 및 비디오 부분을 처리하기 위한 적절한 mux/demux 컴포넌트 (8 및 9) 를 포함할 수도 있다. mux/demux 컴포넌트 (8 및 9) 는 국제 전기통신 연합 (ITU) H.223 멀티플렉서 프로토콜, 또는 사용자 데이터그램 프로토콜 (UDP) 과 같은 다른 프로토콜에 따를 수도 있다.

오디오 코딩은 비디오 전화 (VT) 또는 스트리밍 비디오와 같은 애플리케이션 에 대해 멀티미디어 컨텐츠를 제공하기 위해 비디오 코딩과 함께 사용될 수도 있다. 예를 들어, MPEG 에 따른 비디오 코딩 표준은 종종 오디오 및 비디오 코딩을 사용한다. MPEG 표준은 현재 MPEG-1, MPEG-2 및 MPEG-4 를 포함하지만, 다른 표준들이 나타날 가능성이 있다. 다른 예시적인 비디오 표준들은, ITU H.263 표준, ITU H.264 표준, 애플 컴퓨터사에 의해 개발된 QuickTime™ 기술, 마이크로소프트사에 의해 개발된 Video for Windows™, 인텔사에 의해 개발된 Indeo™, RealNetworks, Inc 로부터의 RealVideo™, 및 SuperMac, Inc 에 의해 개발된 Cinepak™ 를 포함한다.

예시를 위해, 통신 디바이스 (3 및 4) 각각이 오디오 데이터의 전송자 및 수신자 모두로서 동작할 수 있다고 가정한다. 통신 디바이스 (3) 로부터 통신 디바이스 (4) 로 송신된 오디오 데이터에 대해, 통신 디바이스 (3) 는 전송 디바이스이고, 통신 디바이스 (4) 는 수신 디바이스이다. 이러한 경우에서, 통신 디바이스 (3) 내의 오디오 코덱 (6) 은 인코더로서 동작할 수도 있고, 통신 디바이스 (4) 내의 오디오 코덱 (10) 은 디코더로서 동작할 수도 있다. 반대로, 통신 디바이스 (4) 로부터 통신 디바이스 (3) 로 송신된 오디오 데이터에 대해, 통신 디바이스 (3) 는 수신 디바이스이고, 통신 디바이스 (4) 는 전송 디바이스이다. 이러한 경우에서, 통신 디바이스 (3) 내의 오디오 코덱 (6) 은 디코더로서 동작할 수도 있고, 통신 디바이스 (4) 내의 오디오 코덱 (10) 은 인코더로서 동작할 수도 있다. 또한, 본 명세서에 설명하는 기술은 이러한 오디오 데이터를 전송만 하거나 수신만 하는 디바이스에 적용될 수도 있다.

개시된 기술에 따르면, 수신 디바이스로서 동작하는 통신 디바이스 (4) 는 전송 디바이스로서 동작하는 통신 디바이스 (3) 로부터 오디오 신호의 프레임에 대한 오디오 비트스트림을 수신한다. 통신 디바이스 (4) 내에서 디코더로서 동작하는 오디오 코덱 (10) 은 에러 검출을 수행할 수도 있고, 에러가 검출될 때 프레임을 폐기한다. 오디오 코덱 (10) 은 통신 디바이스 (3) 로부터의 오디오 비트스트림과 함께 송신된 사이드 정보에 기초하여, 폐기된 프레임을 정확하게 은폐하기 위한 인코더-보조 FLC 기술을 구현할 수도 있다. 인코더-보조 FLC 기술은, 이웃하는 프레임들의 주파수 도메인 데이터에 기초하여 프레임에 대한 주파수 도메인 데이터의 크기를 추정하며, 사이드 정보로서 인코더로부터 송신된 사인의 서브세트에 기초하여 주파수 도메인 데이터의 사인을 추정하는 것을 포함한다.

오디오 신호의 프레임에 대한 주파수 도메인 데이터는 음조 성분 및 잡음 성분을 포함한다. 랜덤 신호로부터 추정된 사인은 주파수 도메인 데이터의 잡음 성분에 대해 실질적으로 정확할 수도 있다. 그러나, 음조 성분에 대한 매우 정확한 사인 추정을 달성하기 위해, 인코더는 주파수 도메인 데이터의 음조 성분에 대한 사인을 사이드 정보로서 디코더로 송신한다.

예를 들어, 통신 디바이스 (4) 내에서 디코더로서 동작하는 오디오 코덱 (10) 의 FLC 모듈 (11) 은, 크기 추정기, 성분 선택 모듈, 및 사인 추정기를 포함할 수도 있지만, 이들 컴포넌트는 도 1 에 도시하지 않았다. 크기 추정기는 오디오 신호의 이웃하는 프레임들로부터의 주파수 도메인 데이터를 카피한다. 그 후, 크기 추정기는 폐기된 프레임에 대한 주파수 도메인 데이터의 크기를 추정하기 위해, 카피된 주파수 도메인 데이터의 에너지를 스케일링한다. 성분 선택 모듈은 프레임에 대한 주파수 도메인 데이터의 음조 성분과 잡음 성분 사이를 구별한다. 이러한 방식으로, 성분 선택 모듈은 프레임내의 음조 성분의 위치를 유도한다. 사인 추정기는, 사이드 정보로서 통신 디바이스 (3) 로부터 송신된 프레임에 대한 사인의 서브세트에 기초하여 성분 선택 모듈에 의해 선택된 음조 성분에 대한 사인을 추정하기만 한다. 그 후, 디코더로서 동작하는 오디오 코덱 (10) 은, 음조 성분에 대한 사인 추정치를 대응하는 크기 추정치와 결합한다.

통신 디바이스 (3) 내에서 인코더로서 동작하는 오디오 코덱 (6) 은, 성분 선택 모듈 및 사인 추출기를 포함할 수도 있지만, 이들 컴포넌트는 도 1 에 도시하지 않았다. 성분 선택 모듈은 프레임에 대한 주파수 도메인 데이터의 음조 성분과 잡음 성분 사이를 구별한다. 이러한 방식으로, 성분 선택 모듈은 프레임내의 음조 성분의 위치를 유도한다. 사인 추출기는 성분 선택 모듈에 의해 선택된 음조 성분에 대한 사인의 서브세트를 추출한다. 그 후, 추출된 사인은 사이드 정보로서, 인코딩된 오디오 비트스트림으로 팩킹 (pack) 된다. 예를 들어, 프레임에 대한 사인의 서브세트는 이웃하는 프레임에 대한 오디오 비트스트림에 부착될 수도 있다.

송신 채널 (5) 을 가로질러 송신된 사이드 정보의 양을 최소화시키기 위해, 인코더로서 동작하는 오디오 코덱 (6) 은 음조 성분에 대한 사인의 서브세트와 함께 프레임내의 음조 성분의 위치를 송신하지 않는다. 대신, 오디오 코덱 (6 및 10) 모두는 동일한 동작을 사용하여 음조 성분의 위치를 자체 유도한다. 다시 말해서, 인코더로서 동작하는 오디오 코덱 (6) 은 디코더로서 동작하는 오디오 코덱 (10) 과 동일한 성분 선택 동작을 수행한다. 이러한 방식으로, 인코더-보조 FLC 기술은, 최소량의 사이드 정보가 인코더로부터 송신되면서, 디코더에서 프레임 은폐 품질의 현저한 개선을 달성한다.

AAC 표준을 이용하는 오디오 코덱 (6 및 10) 의 경우에서, 오디오 신호의 프레임의 주파수 도메인 데이터는 변형 이산 코사인 변환 (MDCT) 계수에 의해 표현된다. 일 프레임은 1024개 MDCT 계수를 포함할 수도 있으며, MDCT 계수 각각은 크기 및 사인을 포함한다. MDCT 계수중 일부는 음조 성분을 포함하며, 나머지 MDCT 계수는 잡음 성분을 포함한다. 오디오 코덱 (6 및 10) 은 폐기된 프레임에 대한 MDCT 계수의 크기 및 사인을 개별적으로 추정하기 위해 인코더-보조 FLC 기술을 구현할 수도 있다. 다른 오디오 표준의 경우에서, 다른 형태의 변환 계수가 프레임에 대한 주파수 도메인 데이터를 나타낼 수도 있다. 또한, 프레임은 임의의 수의 계수를 포함할 수도 있다.

도 2 는, 도 1 로부터의 오디오 인코딩 및 디코딩 시스템 (2) 으로 인코더-보조 프레임 손실 은폐를 수행하는 예시적인 동작을 예시하는 플로우차트이다. 예시를 위해, 통신 디바이스 (3) 는 인코더로서 동작하는 오디오 코덱 (6) 을 갖는 전송 디바이스로서 동작하며, 통신 디바이스 (4) 는 디코더로서 동작하는 오디오 코덱 (10) 을 갖는 수신 디바이스로서 동작한다.

통신 디바이스 (3) 는 프레임 (m+1) 에 대한 오디오 신호를 샘플링하며, 통신 디바이스 (3) 내의 오디오 코덱 (6) 은 시간 도메인 데이터를 프레임 (m+1) 에 대한 주파수 도메인 데이터로 변환한다. 그 후, 오디오 코덱 (6) 은 주파수 도메인 데이터를 프레임 (m+1) 에 대한 오디오 비트스트림으로 인코딩한다 (12). 오디오 코덱 (6) 은 프레임 (m) 에 대한 주파수 도메인 데이터를 생성하기 위해 프레임 지연을 수행할 수 있다. 주파수 도메인 데이터는 음조 성분 및 잡음 성분을 포함한다. 오디오 코덱 (6) 은 프레임 (m) 에 대한 주파수 도메인 데이터의 음조 성분에 대한 사인의 서브세트를 추출한다 (13).

일 실시형태에서, 오디오 코덱 (6) 은 추정된 인덱스 서브세트에 기초하여 프레임 (m) 에 대한 주파수 도메인 데이터의 음조 성분에 대한 사인의 서브세트를 추출하기 위해 FLC 모듈 (7) 을 이용한다. 추정된 인덱스 서브세트는 프레임 (m) 에 대한 주파수 도메인 데이터의 추정된 크기로부터 프레임 (m) 내의 음조 성분의 위치를 식별한다. FLC 모듈 (7) 은 크기 추정기, 성분 선택기 모듈, 및 사인 추출기를 포함할 수도 있지만, FLC 모듈 (7) 의 이들 컴포넌트는 도 1 에 도시하지 않았다. 성분 선택 모듈은 크기 추정기로부터의 프레임 (m) 에 대한 주파수 도메인 데이터의 추정된 크기에 기초하여 추정된 인덱스 서브세트를 생성할 수도 있다.

다른 실시형태에서, 오디오 코덱 (6) 은 프레임 (m+1) 에 대한 주파수 도메인 데이터의 크기로부터 프레임 (m+1) 내의 음조 성분의 위치를 식별하는 인덱스 서브세트에 기초하여 프레임 (m) 에 대한 주파수 도메인 데이터의 음조 성분에 대한 사인의 서브세트를 추출한다. 이러한 경우에서, 프레임 (m) 에 대한 인덱스 서브세트가 프레임 (m+1) 에 대한 인덱스 서브세트와 거의 등가이다고 가정한다. 오디오 코덱 (6) 은 성분 선택 모듈 및 사인 추출기를 포함할 수도 있지만, 이들 컴포넌트는 도 1 에 도시하지 않았다. 성분 선택 모듈은 프레임 (m+1) 에 대한 주파수 도메인 데이터의 크기에 기초하여 인덱스 서브세트를 생성할 수도 있다.

오디오 코덱 (6) 은 사이드 정보로서, 프레임 (m+1) 에 대한 오디오 비트스트림에 프레임 (m) 의 음조 성분에 대한 사인의 서브세트를 부착한다. 오디오 코덱 (6) 은 음조 성분의 위치를 프레임 (m+1) 에 대한 오디오 비트스트림에 부착하지 않는다. 대신, 오디오 코덱 (6 및 10) 모두는 동일한 동작을 사용하여 음조 성분의 위치를 자체 유도한다. 이러한 방식으로, 이 기술은 프레임 (m+1) 에 대한 오디오 비트스트림에 부착될 사이드 정보의 양을 최소화시킨다. 그 후, 통신 디바이스 (3) 는 프레임 (m) 에 대한 사인의 서브세트를 포함하는 프레임 (m+1) 에 대한 오디오 비트스트림을 송신 채널 (5) 을 통해 통신 디바이스 (4) 로 송신한다 (14).

통신 디바이스 (4) 는 프레임 (m) 에 대한 오디오 비트스트림을 수신한다 (15). 통신 디바이스 (4) 내의 오디오 코덱 (10) 은 오디오 비트스트림에 대한 에러 검출을 수행하고, 에러가 오디오 비트스트림에서 발견될 때 프레임을 폐기한다 (16). 통신 디바이스 (4) 는 프레임 (m) 의 음조 성분에 대한 사인의 서브세트를 포함하는 프레임 (m+1) 에 대한 오디오 비트스트림을 수신한다 (17). 그 후, 오디오 코덱 (10) 은 통신 디바이스 (3) 로부터 프레임 (m+1) 에 대한 오디오 비트스트림과 함께 송신된 프레임 (m) 의 음조 성분에 대한 사인의 서브세트를 사용함으로써, 폐기된 프레임 (m) 에 대한 프레임 손실 은폐를 수행하기 위해 FLC 모듈 (11) 을 사용한다 (18). FLC 모듈 (11) 은 크기 추정기, 성분 선택 모듈, 및 사인 추정기를 포함할 수도 있지만, FLC 모듈 (11) 의 이들 컴포넌트는 도 1 에 도시하지 않았다.

FLC 모듈 (11) 내의 크기 추정기는 이웃하는 프레임들 (m-1 및 m+1) 에 대한 주파수 도메인 데이터에 기초하여 프레임 (m) 에 대한 주파수 도메인 데이터의 크기를 추정할 수도 있다. 일 실시형태에서, 성분 선택 모듈은 크기 추정기로부터의 프레임 (m) 에 대한 주파수 도메인 데이터의 추정된 크기에 기초하여 프레임 (m) 내의 음조 성분의 위치를 식별하는 추정된 인덱스 서브세트를 생성할 수도 있다. 그 후, 사인 추정기는 프레임 (m) 에 대한 추정된 인덱스 서브세트에 기초하여 프레임 (m) 에 대한 사인의 서브세트로부터 프레임 (m) 내의 음조 성분에 대한 사인을 추정할 수도 있다.

다른 실시형태에서, 성분 선택 모듈은 프레임 (m+1) 에 대한 주파수 도메인 데이터의 크기로부터 프레임 (m+1) 내의 음조 성분의 위치를 식별하는 인덱스 서브세트를 생성할 수도 있다. 이러한 경우에서, 프레임 (m) 에 대한 인덱스 서브세트가 프레임 (m+1) 에 대한 인덱스 서브세트에 거의 등가이다고 가정한다. 그 후, 사인 추정기는 프레임 (m+1) 에 대한 인덱스 서브세트에 기초하여 프레임 (m) 에 대한 사인의 서브세트로부터 프레임 (m) 내의 음조 성분에 대한 사인을 추정한다.

FLC 모듈 (11) 내의 사인 추정기는 랜덤 신호로부터 프레임 (m) 내의 잡음 성분에 대한 사인을 추정할 수도 있다. 그 후, 오디오 코덱 (10) 은 프레임 (m) 에 대한 주파수 도메인 데이터를 추정하기 위해, 음조 성분 및 잡음 성분에 대한 사인 추정치를 대응하는 크기 추정치와 결합한다. 그 후, 오디오 코덱 (10) 은 프레임 (m) 에 대한 추정된 주파수 도메인 데이터를 프레임 (m) 에 대한 오디오 신호의 추정된 시간 도메인 데이터로 디코딩한다 (19).

도 3 은 사이드 정보로서 송신될 프레임에 대한 사인의 서브세트를 생성하는 FLC 모듈 (33) 을 포함하는 예시적인 오디오 인코더 (20) 를 예시하는 블록도이다. 오디오 인코더 (20) 는 도 1 로부터의 각각의 통신 디바이스 (3 및 4) 내의 오디오 코덱 (6 및 10) 과 실질적으로 유사할 수도 있다. 도 3 에 예시된 바와 같이, 오디오 인코더 (20) 는 변환 유닛 (22), 코어 인코더 (24), 제 1 프레임 지연부 (30), 제 2 프레임 지연부 (32), 및 FLC 모듈 (33) 을 포함한다. 예시를 위해, 본 명세서에서는 오디오 인코더 (20) 를, 오디오 신호의 프레임의 주파수 도메인 데이터가 MDCT 계수로 표현되는 AAC 표준에 따르는 것으로서 설명한다. 또한, 변환 유닛 (22) 을 변형 이산 코사인 변환 유닛으로서 설명한다. 다른 실시형태에서, 오디오 인코더 (20) 는 상기 리스트된 임의의 오디오 코딩 표준, 또는 다른 표준을 따를 수도 있다.

본 명세서에서는, 이 기술을 오디오 신호의 프레임 (m) 을 은폐하는 것으로서 설명한다. 프레임 (m+1) 은 오디오 신호의 프레임 (m) 의 직후의 오디오 프레임을 나타낸다. 유사하게, 프레임 (m-1) 은 오디오 신호의 프레임 (m) 의 직전의 오디오 프레임을 나타낸다. 다른 실시형태에서, 인코더-보조 FLC 기술은 프레임 (m) 을 은폐하기 위해 프레임 (m) 의 직전 또는 직후가 아닌 프레임 (m) 의 이웃하는 프레임을 이용할 수도 있다.

변환 유닛 (22) 은 프레임 (m+1) 에 대한 오디오 신호의 샘플 x_m ₊₁[n] 을 수신하고, 그 샘플을 계수 X_m ₊₁(k) 로 변환한다. 그 후, 코어 인코더 (24) 는 그 계수를 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 으로 인코딩한다. FLC 모듈 (33) 은, 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 뿐만 아니라 프레임 (m) 에 대한 계수 X_m(k) 및 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 사용하여, 프레임 (m) 에 대한 계수 X_m(k) 의 음조 성분에 대한 사인 S_m (28) 의 서브세트를 생성한다. FLC 모듈 (33) 은 사이드 정보로서 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 에 사인 S_m (28) 의 서브세트를 부착한다.

FLC 모듈 (33) 은 크기 추정기 (34), 성분 선택 모듈 (36), 사인 추출기 (38) 를 포함한다. 변환 유닛 (22) 은 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 크기 추정기 (34) 및 제 1 프레임 지연부 (30) 로 전송한다. 제 1 프레임 지연부 (30) 는 프레임 (m) 에 대한 계수 X_m(k) 를 생성하여, 프레임 (m) 에 대한 계수를 제 2 프레임 지연부 (32) 로 전송한다. 제 2 프레임 지연부 (32) 는 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 생성하여, 프레임 (m-1) 에 대한 계수를 크기 추정기 (34) 로 전송한다.

크기 추정기 (34) 는 프레임 (m+1 및 m-1) 에 대한 계수에 기초하여 프레임 (m) 에 대한 계수의 크기를 추정한다. 크기 추정기 (34) 는 프레임 (m) 에 대한 계수 크기를 추정하기 위해 다양한 보간 기술중 하나를 구현할 수도 있다. 예를 들어, 크기 추정기 (34) 는 프레임 (m-1) 에 대한 이전의 프레임 계수 X_m _-1(k) 및 프레임 (m+1) 에 대한 다음의 프레임 계수 X_m ₊₁(k) 의 에너지에 기초하여 에너지 보간을 구현할 수도 있다. 크기 추정은,

[수학식 1]

와 같이 제공되며, 여기서,

는,

[수학식 2]

에 의해 계산된 에너지 스케일링 팩터이고, 여기서, B_b 는 b번째 스케일팩터 대역에서의 MDCT 계수의 세트이다. 다른 실시형태에서, 크기 추정기 (34) 는 프레임 (m) 의 직전 또는 직후가 아닌 프레임 (m) 의 이웃하는 프레임을 이용하여, 프레임 (m) 에 대한 계수의 크기를 추정할 수도 있다.

그 후, 크기 추정기 (34) 는 프레임 (m) 에 대한 추정된 계수 크기

를 성분 선택 모듈 (36) 로 전송한다. 성분 선택 모듈 (36) 은, 프레임 (m) 에 대한 추정된 계수 크기를 정렬함으로써 프레임 (m) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기 또는 가장 현저한 스펙트럼 피크를 갖는 계수가 음조 성분으로서 고려될 수도 있고, 나머지 계수가 잡음 성분으로 고려될 수도 있다.

선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 예를 들어, 가장 높은 크기를 갖는 10개의 계수가 프레임 (m) 의 음조 성분으로서 선택될 수도 있다. 다른 경우에서, 성분 선택 모듈 (36) 은 10개 보다 많은 또는 적은 음조 성분을 선택할 수도 있다. 또 다른 경우에서, 프레임 (m) 에 대한 선택된 음조 성분의 수는 오디오 신호에 기초하여 변화할 수도 있다. 예를 들어, 오디오 신호가 오디오 신호의 다른 프레임에서 보다 프레임 (m) 에서 다수의 음조 성분을 포함하는 경우에, 성분 선택 모듈 (36) 은 다른 프레임으로부터 보다는 프레임 (m) 으로부터 다수의 음조 성분을 선택할 수도 있다.

다른 실시형태에서, 성분 선택 모듈 (36) 은 프레임 (m) 의 음조 성분과 잡음 성분 사이를 구별하기 위해 다양한 다른 방식을 사용하여 프레임 (m) 에 대한 추정된 계수 크기로부터 음조 성분을 선택할 수도 있다. 예를 들어, 성분 선택 모듈 (36) 은 일부 음향심리학 원리에 기초하여 계수의 서브세트를 선택할 수도 있다. FLC 모듈 (33) 은 오디오 인코더 (20) 의 복잡도 레벨이 허용하는 만큼 더욱 정확한 성분 구별방식을 이용할 수도 있다.

그 후, 성분 선택 모듈 (36) 은 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 추정된 인덱스 서브세트

를 생성한다. 음조 성분은 가장 현저한 크기를 갖는 프레임 (m) 에 대한 계수로서 선택된다. 그러나, 프레임 (m) 에 대한 계수는, 프레임 (m) 의 은폐를 수행할 때 오디오 디코더에 이용가능하지 않다. 따라서, 인덱스 서브세트는 프레임 (m) 에 대한 추정된 계수 크기

에 기초하여 유도되며, 추정된 인덱스 서브세트라 칭한다. 추정된 인덱스 서브세트는,

[수학식 3]

과 같이 제공되며, 여기서, M 은 프레임 (m) 내의 MDCT 계수의 수이고, Thr 은

이도록 결정된 임계값이며, B_m 은 송신될 사인의 수이다. 예를 들어, B_m 은 예시적인 실시형태에서 10개의 사인과 동일할 수도 있다. 다른 실시형태에서, B_m 은 10개 보다 크거나 작을 수도 있다. 또 다른 실시형태에서, B_m 은 프레임 (m) 의 오디오 신호에 기초하여 변화할 수도 있다.

성분 선택 모듈 (36) 은 프레임 (m) 에 대한 추정된 인덱스 서브세트를 사인 추출기 (38) 로 전송한다. 또한, 사인 추출기 (38) 는 제 1 프레임 지연부 (30) 로부터 프레임 (m) 에 대한 계수 X_m(k) 를 수신한다. 그 후, 사인 추출기 (38) 는 추정된 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 계수 X_m(k) 로 부터 사인을 추출한다. 예를 들어, 추정된 인덱스 서브세트는 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분을 식별하는 소정의 수, 예를 들어, 10개의 계수 인덱스를 포함한다. 그 후, 사인 추출기 (38) 는 추정된 인덱스 서브세트내의 인덱스와 동일한 인덱스 (k) 를 갖는 프레임 (m) 에 대한 계수 X_m(k) 에 대응하는 사인을 추출한다. 그 후, 사인 추출기 (38) 는 추정된 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 음조 성분으로부터 추출된 사인 S_m (28) 의 서브세트를 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 에 부착한다.

성분 선택 모듈 (36) 은 오디오 인코더 (20) 로부터의 송신을 수신하는 오디오 디코더와 동일한 동작을 사용하여 프레임 (m) 내의 음조 성분을 선택한다. 따라서, 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 동일한 추정된 인덱스 서브세트

가 오디오 인코더 (20) 및 오디오 디코더 모두에서 생성될 수도 있다. 그 후, 오디오 디코더는 프레임 (m) 의 음조 성분에 대한 사인 S_m (28) 의 서브세트를, 추정된 인덱스 서브세트에 의해 식별된 프레임 (m) 의 적절한 추정된 계수 크기에 적용할 수도 있다. 이러한 방식으로, 오디오 인코더 (20) 가 사인 S_m (28) 의 서브세트와 함께 프레임 (m) 내의 음조 성분의 위치를 송신할 필요가 없기 때문에, 송신된 사이드 정보의 양이 최소화될 수도 있다.

도 4 는, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브 세트를 이용하는 프레임 손실 은폐 모듈 (43) 을 포함하는 예시적인 오디오 디코더 (40) 를 예시하는 블록도이다. 오디오 디코더 (40) 는 도 1 로부터의 각각의 통신 디바이스 (3 및 4) 내의 오디오 코덱 (6 및 10) 과 실질적으로 유사할 수도 있다. 오디오 디코더 (40) 는 도 3 으로부터의 오디오 인코더 (20) 와 실질적으로 유사한 오디오 인코더로부터 오디오 비트스트림을 수신할 수도 있다. 도 4 에 예시된 바와 같이, 오디오 디코더 (40) 는 코어 디코더 (41), 에러 검출 모듈 (42), FLC 모듈 (43) 및 역변환 유닛 (50) 을 포함한다.

예시를 위해, 오디오 디코더 (40) 는 본 명세서에서, 오디오 신호의 프레임의 주파수 도메인 데이터가 MDCT 계수에 의해 표현되는 AAC 표준에 따르는 것으로서 설명될 것이다. 또한, 역변환 유닛 (50) 은 변형 이산 코사인 역변환 유닛으로서 설명될 것이다. 다른 실시형태에서, 오디오 디코더 (40) 는 상기 리스트된 임의의 오디오 코딩 표준을 따를 수도 있다.

코어 디코더 (41) 는 계수 X_m(k) 를 포함하는 프레임 (m) 에 대한 오디오 비트스트림을 수신하며, 프레임 (m) 에 대한 오디오 비트스트림을 에러 검출 모듈 (42) 로 전송한다. 그 후, 에러 검출 모듈 (42) 은 프레임 (m) 에 대한 오디오 비트스트림에 대해 에러 검출을 수행한다. 코어 디코더 (41) 는 사이드 정보로서 프레임 (m) 에 대한 사인 S_m (28) 의 서브세트 및 계수 X_m ₊₁(k) 를 포함하는 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 을 연속적으로 수신한다. 코어 디코더 (41) 는, 폐기되지 않는 경우에, 프레임 (m) 에 대한 계수를 생성하기 위해 제 1 프레임 지연부 (51) 를 사용하며, 프레임 (m+1) 에 대한 오디오 비트스트림으로부터 프레임 (m-1) 에 대한 계수를 생성하기 위해 제 2 프레임 지연부 (52) 를 사용한다. 프레임 (m) 에 대한 계수가 폐기되지 않은 경우에, 제 1 프레임 지연부 (51) 는 프레임 (m) 에 대한 계수를 멀티플렉서 (49) 로 전송한다. 제 2 프레임 지연부 (52) 는 프레임 (m-1) 에 대한 계수를 FLC 모듈 (43) 로 전송한다.

에러가 프레임 (m) 내에서 검출되지 않으면, 에러 검출 모듈 (42) 은, 프레임 (m) 에 대한 오디오 신호 샘플로 변환될 프레임 (m) 에 대한 계수 X_m(k) 를, 멀티플렉서 (49) 가 제 1 프레임 지연부 (51) 로부터 역변환 유닛 (50) 으로 직접 통과시키는 것을 가능하게 할 수도 있다.

에러가 프레임 (m) 내에서 검출되면, 에러 검출 모듈 (42) 은 프레임 (m) 에 대한 모든 계수를 폐기하며, 멀티플렉서 (49) 가 FLC 모듈 (43) 로부터의 프레임 (m) 에 대한 계수 추정치

를 역변환 유닛 (50) 으로 통과시키는 것을 가능하게 할 수 있다. FLC 모듈 (43) 은 코어 디코더 (41) 로부터 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 수신하고, 제 2 프레임 지연부 (52) 로부터 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 수신한다. FLC 모듈 (43) 은 프레임 (m) 에 대한 계수의 크기를 추정하기 위해 프레임 (m+1 및 m-1) 에 대한 계수를 사용한다. 또한, FLC 모듈 (43) 은 프레임 (m) 에 대한 계수의 사인을 추정하기 위해 오디오 인코더 (20) 로부터 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 과 함께 송신된 프레임 (m) 에 대한 사인 S_m (28) 의 서브세트를 사용한다. 그 후, FLC 모듈 (43) 은 프레임 (m) 에 대한 계수를 추정하기 위해 크기 추정치와 사인 추정치를 결합한다. FLC 모듈 (43) 은, 프레임 (m) 에 대한 계수 추정을 프레임 (m) 에 대한 오디오 신호의 추정된 샘플

로 변환시키는 역변환 유닛 (50) 으로 계수 추정치

를 전송한다.

FLC 모듈 (43) 은, 크기 추정기 (44), 성분 선택 모듈 (46), 및 사인 추정기 (48) 를 포함한다. 코어 디코더 (41) 는, 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 크기 추정기 (44) 로 전송하고, 제 2 프레임 지연부 (52) 는 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 크기 추정기 (44) 로 전송한다. 오디오 인코더 (20) 내의 크기 추정기 (34) 와 실질적으로 유사하게, 크기 추정기 (44) 는 프레임 (m+1 및 m-1) 에 대한 계수에 기초하여 프레임 (m) 에 대한 계수의 크기를 추정한다. 크기 추정기 (44) 는 프레임 (m) 에 대한 계수 크기를 추정하기 위해 다양한 보간 기술들 중 하나를 구현할 수도 있다. 예를 들어, 크기 추정기 (44) 는 프레임 (m-1) 에 대한 이전의 프레임 계수 X_m _-1(k) 및 프레임 (m+1) 에 대한 다음의 프레임 계수 X_m+1(k) 의 에너지에 기초하여 에너지 보간을 구현할 수도 있다. 크기 추정은 상기 수학식 (1) 에 제공되었다. 다른 실시형태에서, 크기 추정기 (44) 는 프레임 (m) 에 대한 계수의 크기를 추정하기 위해 프레임 (m) 의 직전 또는 직후가 아닌 프레임 (m) 의 이웃하는 프레임을 이용할 수도 있다.

그 후, 크기 추정기 (44) 는 프레임 (m) 에 대한 추정된 계수 크기

를 성분 선택 모듈 (46) 로 전송한다. 성분 선택 모듈 (46) 은 프레임 (m) 에 대한 추정된 계수 크기를 정렬함으로써 프레임 (m) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기 또는 가장 현저한 스펙트럼 피크를 갖는 계수가 음조 성분으로서 고려될 수도 있으며, 나머지 계수가 잡음 성분으로서 고려될 수도 있다. 선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 다른 경우에서, 프레임 (m) 에 대한 선택된 음조 성분의 수는 오디오 신호에 기초하여 변화할 수도 있다. 그 후, 성분 선택 모듈 (46) 은 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 추정된 인덱스 서브세트

를 생성한다. 추정된 인덱스 서브세트는 상기 수학식 (3) 에 제공된다.

성분 선택 모듈 (46) 은, 오디오 비트스트림이 수신되는 오디오 인코더 (20) 내의 성분 선택 모듈 (36) 과 정확히 동일한 동작을 사용하여 프레임 (m) 내의 음조 성분을 선택한다. 따라서, 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 동일한 추정된 인덱스 서브세트

가 오디오 인코더 (20) 및 오디오 디코더 (40) 모두에서 생성될 수도 있다. 그 후, 오디오 디코더 (40) 는 프레임 (m) 의 음조 성분에 대한 사인 S_m (28) 의 서브세트를, 추정된 인덱스 서브세트에 의해 식별된 프레임 (m) 의 적절한 추정된 계수 크기에 적용할 수도 있다.

성분 선택 모듈 (46) 은 프레임 (m) 에 대한 추정된 인덱스 서브세트를 사인 추정기 (48) 로 전송한다. 또한, 사인 추정기 (48) 는 오디오 인코더 (20) 로부터 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 과 함께 송신된 프레임 (m) 에 대한 사인 S_m (28) 의 서브세트를 수신한다. 그 후, 사인 추정기 (48) 는 프레임 (m) 에 대한 음조 성분 및 잡음 성분 모두에 대한 사인을 추정한다.

잡음 성분의 경우에서, 사인 추정기 (48) 는 랜덤 신호로부터 사인을 추정한다. 음조 성분의 경우에서, 사인 추정기 (48) 는 추정된 인덱스 서브세트

에 기초하여 사인 S_m (28) 의 서브세트로부터 사인을 추정한다. 예를 들어, 추정된 인덱스 서브세트는 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분을 식별하는 소정의 수, 예를 들어, 10개의 계수 인덱스를 포함한다. 그 후, 사인 추정기 (48) 는, 추정된 인덱스 서브세트내의 인덱스들과 동일한 인덱스들 (k) 을 갖는 사인 S_m (28) 의 서브세트로서 프레임 (m) 의 음조 성분에 대한 사인을 추정한다. 사인 추정치

는,

[수학식 4]

와 같이 제공되며, 여기서, sgn() 은 사인 함수를 나타내고,

은 선택된 음조 성분에 대응하는 계수의 추정된 인덱스 서브세트이며, S_m(k) 는 샘플 스페이스 {-1,1} 을 갖는 랜덤 변수이다.

상술한 바와 같이, 프레임 (m) 의 음조 성분에 대한 사인을 추정하기 위해, 오디오 디코더 (40) 는 프레임 (m) 의 원래 음조 성분의 대응하는 사인 뿐만 아니라 프레임 (m) 내의 음조 성분의 위치를 알 필요가 있다. 이러한 정보를 수신하기 위한 오디오 디코더 (40) 에 대한 단순한 방식은, 증가된 비트 레이트를 이용하여 오디오 인코더 (20) 로부터 오디오 디코더 (40) 로 파라미터 모두를 명시적으로 송신하는 것이다. 예시된 실시형태에서, 추정된 인덱스 서브세트

는 정확히 동일한 유도 프로세스를 사용하여 오디오 인코더 (20) 및 오디오 디코더 (40) 모두에서 자체 유도되는 반면에, 추정된 인덱스 서브세트

에 의해 인덱스된 프레임 (m) 의 음조 성분에 대한 사인은 사이드 정보로서 오디오 인코더 (20) 로부터 송신된다.

그 후, FLC 모듈 (43) 은 프레임 (m) 에 대한 계수를 추정하기 위해 크기 추정기 (44) 로부터의 크기 추정치

와 사인 추정기 (48) 로부터의 사인 추정치 를 결합한다. 프레임 (m) 에 대한 계수 추정치

는,

[수학식 5]

와 같이 제공된다.

그 후, FLC 모듈 (43) 은, 프레임 (m) 에 대한 계수 추정치를 통과시키도록 인에이블된 멀티플렉서 (49) 를 통해 계수 추정치를 역변환 유닛 (50) 으로 전송하고, 이 역변환 유닛은 프레임 (m) 에 대한 계수 추정치를 프레임 (m) 에 대한 오디오 신호의 추정된 샘플

로 변환한다.

도 5 는, 오디오 비트스트림을 인코딩하고, 사이드 정보로서 오디오 비트스트림과 송신될 프레임에 대한 사인의 서브세트를 생성하는 예시적인 동작을 예시하는 플로우차트이다. 본 명세서에서는, 이 동작을 도 3 으로부터의 오디오 인코더 (20) 를 참조하여 설명할 것이다.

변환 유닛 (22) 이 프레임 (m+1) 에 대한 오디오 신호의 샘플 x_m ₊₁[n] 을 수신하고, 이 샘플을 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 로 변환한다 (54). 그 후, 코어 인코더 (24) 가 이 계수를 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 으로 인코딩한다 (56). 변환 유닛 (22) 은 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 크기 추정기 (34) 및 제 1 프레임 지연부 (30) 로 전송한다. 제 1 프레임 지연부 (30) 는 프레임 지연을 수행하고, 프레임 (m) 에 대한 계수 X_m(k) 를 생성한다 (58). 그 후, 제 1 프레임 지연부 (30) 는 프레임 (m) 에 대한 계수를 제 2 프레임 지연부 (32) 로 전송한다. 제 2 프레임 지연부 (32) 는 프레임 지연을 수행하고, 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 생성한다 (60). 그 후, 제 2 프레임 지연부 (32) 는 프레임 (m-1) 에 대한 계수를 크기 추정기 (34) 로 전송한다.

크기 추정기 (34) 는 프레임 (m+1 및 m-1) 에 대한 계수에 기초하여 프레임 (m) 에 대한 계수의 크기를 추정한다 (62). 예를 들어, 크기 추정기 (34) 는 계수 크기를 추정하기 위해 수학식 (1) 에 제공된 에너지 보간 기술을 구현할 수도 있다. 그 후, 크기 추정기 (34) 는 프레임 (m) 에 대한 추정된 계수 크기

를 성분 선택 모듈 (36) 로 전송한다. 성분 선택 모듈 (36) 은 프레임 (m) 에 대한 추정된 계수 크기를 정렬함으로써 프레임 (m) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기를 갖는 계수가 음조 성분으로 고려될 수도 있고, 나머지 계수가 잡음 성분으로 고려될 수도 있다. 선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 다른 경우에서, 프레임 (m) 에 대한 선택된 음조 성분의 수는 오디오 신호에 기초하여 변화할 수도 있다. 그 후, 성분 선택 모듈 (36) 은 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 추정된 인덱스 서브세트

를 생성한다 (64).

성분 선택 모듈 (36) 은 프레임 (m) 에 대한 추정된 인덱스 서브세트를 사인 추출기 (38) 로 전송한다. 또한, 사인 추출기 (38) 는 프레임 (m) 에 대한 계 수 X_m(k) 를 제 1 프레임 지연부 (30) 로부터 수신한다. 그 후, 사인 추출기 (38) 는, 추정된 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 계수 X_m(k) 로부터 사인을 추출한다 (66). 그 후, 사인 추출기 (38) 는 추정된 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 음조 성분으로부터 추출된 사인 S_m (28) 의 서브세트를 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 에 부착한다 (68).

도 6 은, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브세트를 사용하여 프레임 손실 은폐를 수행하고 오디오 비트스트림을 디코딩하는 예시적인 동작을 예시하는 플로우차트이다. 이 동작은 도 4 로부터의 오디오 디코더 (40) 를 참조하여 본 명세서에서 설명한다.

코어 디코더 (41) 는 계수 X_m(k) 를 포함하는 프레임 (m) 에 대한 오디오 비트스트림을 수신한다 (72). 그 후, 에러 검출 모듈 (42) 은 프레임 (m) 에 대한 오디오 비트스트림에 대해 에러 검출을 수행한다 (74). 코어 디코더 (41) 는 사이드 정보로서 프레임 (m) 에 대한 사인 S_m (28) 의 서브세트 및 계수 X_m(k) 를 포함하는 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 을 연속적으로 수신한다 (75). 코어 디코더 (41) 는 폐기되지 않은 경우에, 프레임 (m) 에 대한 계수를 생성하기 위해 제 1 프레임 지연부 (51) 를 사용하며, 프레임 (m+1) 에 대한 오디오 비트스트림으로부터 프레임 (m-1) 에 대한 계수를 생성하기 위해 제 2 프레임 지연부 (52) 를 사용한다. 프레임 (m) 에 대한 계수가 폐기되지 않은 경우 에, 제 1 프레임 지연부 (51) 는 프레임 (m) 에 대한 계수를 멀티플렉서 (49) 로 전송한다. 제 2 프레임 지연부 (52) 는 프레임 (m-1) 에 대한 계수를 FLC 모듈 (43) 로 전송한다.

에러가 프레임 (m) 내에서 검출되지 않으면, 에러 검출 모듈 (42) 은, 프레임 (m) 에 대한 오디오 신호 샘플로 변환될 프레임 (m) 에 대한 계수를, 멀티플렉서 (49) 가 제 1 프레임 지연부 (51) 로부터 역변환 유닛 (50) 으로 직접 통과시키는 것을 가능하게 할 수도 있다. 에러가 프레임 (m) 내에서 검출되면, 에러 검출 모듈 (42) 은 프레임 (m) 에 대한 모든 계수를 폐기하며, 멀티플렉서 (49) 가 FLC 모듈 (43) 로부터의 프레임 (m) 에 대한 계수 추정치를 역변환 유닛 (50) 으로 통과시키는 것을 가능하게 할 수 있다 (76).

코어 디코더 (41) 는 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 크기 추정기 (44) 로 전송하고, 제 2 프레임 지연부 (52) 는 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 크기 추정기 (44) 로 전송한다. 크기 추정기 (44) 는 프레임 (m+1 및 m-1) 에 대한 계수에 기초하여 프레임 (m) 에 대한 계수의 크기를 추정한다 (78). 예를 들어, 크기 추정기 (44) 는 계수 크기를 추정하기 위해 수학식 (1) 에 제공된 에너지 보간 기술을 구현할 수도 있다. 그 후, 크기 추정기 (44) 는 프레임 (m) 에 대한 추정된 계수 크기

를 성분 선택 모듈 (46) 로 전송한다.

성분 선택 모듈 (46) 은 프레임 (m) 에 대한 추정된 계수 크기를 정렬함으로써 프레임 (m) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기를 갖 는 계수가 음조 성분으로 고려될 수도 있으며, 나머지 계수가 잡음 성분으로 고려될 수도 있다. 선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 다른 경우에서, 프레임 (m) 에 대한 선택된 음조 성분의 수가 오디오 신호에 기초하여 변화할 수도 있다. 그 후, 성분 선택 모듈 (46) 은 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 추정된 인덱스 서브세트

를 생성한다 (80).

성분 선택 모듈 (46) 은, 오디오 비트스트림이 수신되는 오디오 인코더 (20) 내의 성분 선택 모듈 (36) 과 정확히 동일한 동작을 사용하여 프레임 (m) 내에서 음조 성분을 선택한다. 따라서, 프레임 (m) 에 대한 추정된 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 동일한 추정된 인덱스 서브세트

성분 선택 모듈 (46) 은 프레임 (m) 에 대한 추정된 인덱스 서브세트를 사인 추정기 (48) 로 전송한다. 또한, 사인 추정기 (48) 는 오디오 인코더 (20) 로부터 프레임 (m+1) 에 대한 오디오 비트스트림 (26) 과 함께 송신된 프레임 (m) 에 대한 사인 S_m (28) 의 서브세트를 수신한다. 그 후, 사인 추정기 (48) 는 프레 임 (m) 에 대한 음조 성분과 잡음 성분 모두에 대한 사인을 추정한다. 음조 성분의 경우에서, 사인 추정기 (48) 는 추정된 인덱스 서브세트에 기초하여 프레임 (m) 에 대한 사인 S_m (28) 의 서브세트로부터 사인을 추정한다 (82). 잡음 성분의 경우에서, 사인 추정기 (48) 는 랜덤 신호로부터 사인을 추정한다 (84).

와 사인 추정기 (48) 로부터의 사인 추정치

를 결합한다 (86). FLC 모듈 (43) 은, 프레임 (m) 에 대한 계수 추정을 프레임 (m) 에 대한 오디오 신호의 추정된 샘플

로 변환하는 역변환 유닛 (50) 으로 계수 추정치

를 전송한다 (88).

도 7 은, 사이드 정보로서 송신될 프레임에 대한 사인의 서브세트를 생성하는 사인 추출기 (104) 및 성분 선택 모듈 (102) 을 포함하는 또 다른 예시적 오디오 인코더 (90) 를 예시하는 블록도이다. 오디오 인코더 (90) 는 도 1 로부터의 각각의 통신 디바이스 (3 및 4) 내의 오디오 코덱 (6 및 10) 과 실질적으로 유사할 수도 있다. 도 7 에 예시된 바와 같이, 오디오 인코더 (90) 는 변환 유닛 (92), 코어 인코더 (94), 프레임 지연부 (100), 성분 선택 모듈 (102), 및 사인 추출기 (104) 를 포함한다. 예시를 위해, 오디오 인코더 (90) 를 본 명세서에서는, 오디오 신호의 프레임의 주파수 도메인 데이터가 MDCT 계수에 의해 표현되는 AAC 표준에 따르는 것으로서 설명할 것이다. 또한, 변환 유닛 (92) 을 변형 이 산 코사인 변환 유닛으로서 설명할 것이다. 다른 실시형태에서, 오디오 인코더 (90) 는 상기 리스트된 임의의 오디오 코딩 표준을 따를 수도 있다.

본 명세서에서는 이 기술을 오디오 신호의 프레임 (m) 을 은폐하는 것으로서 설명할 것이다. 프레임 (m+1) 은 오디오 신호의 프레임 (m) 의 직후의 오디오 프레임을 나타낸다. 유사하게, 프레임 (m-1) 은 오디오 신호의 프레임 (m) 의 직전의 오디오 프레임을 나타낸다. 다른 실시형태에서, 인코더-보조 FLC 기술은 프레임 (m) 을 은폐하기 위해 프레임 (m) 의 직전 또는 직후가 아닌 프레임 (m) 의 이웃하는 프레임들을 이용할 수도 있다.

변환 유닛 (92) 은 프레임 (m+1) 에 대한 오디오 신호의 샘플 x_m ₊₁[n] 을 수신하고, 그 샘플을 계수 X_m ₊₁(k) 로 변환한다. 그 후, 코어 인코더 (94) 는 그 계수를 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 으로 인코딩한다. 프레임 (m) 에 대한 사인 S_m (98) 의 서브세트를 생성하기 위해, 성분 선택 모듈 (102) 은 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 사용하고, 사인 추출기 (104) 는 프레임 (m) 에 대한 계수 X_m(k) 를 사용한다. 사인 추출기 (104) 는 사인 S_m (98) 의 서브세트를 사이드 정보로서 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 에 부착한다.

더욱 구체적으로, 변환 유닛 (92) 은 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 성분 선택 모듈 (102) 및 프레임 지연부 (100) 로 전송한다. 프레임 지연부 (100) 는 프레임 (m) 에 대한 계수 X_m(k) 를 생성하고, 프레임 (m) 에 대한 계수를 사인 추출기 (104) 로 전송한다. 성분 선택 모듈 (102) 은 프레임 (m+1) 에 대한 계수 크기를 정렬함으로써 프레임 (m+1) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기 또는 가장 현저한 스펙트럼 피크를 갖는 계수가 음조 성분으로 고려될 수도 있으며, 나머지 계수는 잡음 성분으로 고려될 수도 있다.

선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 예를 들어, 가장 높은 크기를 갖는 10 개의 계수가 프레임 (m+1) 의 음조 성분으로서 선택될 수도 있다. 다른 경우에서, 성분 선택 모듈 (102) 은 10개 보다 많거나 작은 음조 성분을 선택할 수도 있다. 또 다른 경우에서, 프레임 (m+1) 에 대한 선택된 음조 성분의 수는 오디오 신호에 기초하여 변화할 수도 있다. 예를 들어, 오디오 신호가 오디오 신호의 다른 프레임들 보다는 프레임 (m+1) 에서 다수의 음조 성분을 포함하는 경우에, 성분 선택 모듈 (102) 은 다른 프레임들 보다는 프레임 (m+1) 로부터 다수의 음조 성분을 선택할 수도 있다.

다른 실시형태에서, 성분 선택 모듈 (102) 은 프레임 (m+1) 의 음조 성분과 잡음 성분 사이를 구별하기 위해, 다양한 다른 방식을 사용하여 프레임 (m+1) 에 대한 계수 크기로부터 음조 성분을 선택할 수도 있다. 예를 들어, 성분 선택 모듈 (102) 은 일부 음향심리학 원리에 기초하여 계수의 서브세트를 선택할 수도 있다. 오디오 인코더 (90) 는, 오디오 인코더 (90) 의 복잡도 레벨이 허용하는 만큼 더욱 정확한 성분 구별 방식을 이용할 수도 있다.

그 후, 성분 선택 모듈 (102) 은 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 인덱스 서브세트 I_m ₊₁ 를 생성한다. 음조 성분은 가장 현저한 크기를 갖는 프레임 (m+1) 에 대한 계수로서 선택된다. 프레임 (m+1) 에 대한 계수는, 프레임 (m) 의 은폐를 수행할 때 오디오 디코더에 이용가능하다. 따라서, 인덱스 서브세트가 프레임 (m+1) 에 대한 계수 크기 X_m ₊₁(k) 에 기초하여 유도된다. 인덱스 서브세트는,

[수학식 6]

과 같이 제공되며, 여기서, M 은 프레임 (m+1) 내의 MDCT 계수의 수이고, Thr 은

이도록 결정된 임계값이며, B_m ₊₁ 은 송신될 사인의 수이다. 예를 들어, B_m ₊₁ 은 10 개의 사인과 동일할 수도 있다. 다른 실시형태에서, B_m+1 은 10 개 보다 크거나 작을 수도 있다. 또 다른 실시형태에서, B_m ₊₁ 은 프레임 (m) 의 오디오 신호에 기초하여 변화할 수도 있다.

성분 선택 모듈 (102) 은 프레임 (m+1) 에 대한 인덱스 서브세트를 사인 추출기 (104) 로 전송한다. 또한, 사인 추출기 (104) 는 프레임 지연부 (100) 로부터 프레임 (m) 에 대한 계수 X_m(k) 를 수신한다. 프레임 (m) 에 대한 인덱스 서브세트가 프레임 (m+1) 에 대한 인덱스 서브세트와 거의 동일하다고 가정한다. 그 후, 사인 추출기 (104) 는 프레임 (m+1) 에 대한 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 계수 X_m(k) 로부터 사인을 추출한다. 예를 들어, 인덱스 서브세트는, 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분을 식별하는 소정의 수, 예를 들어, 10개의 계수 인덱스를 포함한다. 그 후, 사인 추출기 (104) 는 프레임 (m+1) 에 대한 인덱스 서브세트내의 인덱스들과 동일한 인덱스들 (k) 을 갖는 프레임 (m) 에 대한 계수 X_m(k) 에 대응하는 사인을 추출한다. 그 후, 사인 추출기 (104) 는 프레임 (m+1) 에 대한 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 음조 성분으로부터 추출된 사인 S_m (98) 의 서브세트를 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 에 부착한다.

성분 선택 모듈 (102) 은 오디오 디코더가 오디오 인코더 (90) 로부터의 송신을 수신하는 것과 정확히 동일한 동작을 사용하여 프레임 (m+1) 내의 음조 성분을 선택한다. 따라서, 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 동일한 인덱스 서브세트 I_m ₊₁ 가 오디오 인코더 (90) 및 오디오 디코더 모두에서 생성될 수도 있다. 그 후, 오디오 디코더는 프레임 (m) 의 음조 성분에 대한 사인 S_m (98) 의 서브세트를 프레임 (m+1) 에 대한 인덱스 서브세트에 의해 식별된 프레임 (m) 의 적절한 추정된 계수 크기에 적용할 수도 있다. 이러한 방식으로, 송신된 사이드 정보의 양은, 오디오 인코더 (90) 가 사인 S_m (98) 의 서브세트와 함께 프레임 (m) 내의 음조 성분의 위치를 송신할 필요가 없기 때문에 최소화될 수도 있다.

도 8 은, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브세트를 이용하는 프레임 손실 은폐 모듈 (113) 을 포함하는 또 다른 예시적 오디오 디코더 (110) 를 예시하는 블록도이다. 오디오 디코더 (110) 는 도 1 로부터의 각각의 통신 디바이스 (3 및 4) 내의 오디오 코덱 (6 및 10) 과 실질적으로 유사할 수도 있다. 오디오 디코더 (110) 는 도 7 로부터의 오디오 인코더 (90) 와 실질적으로 유사한 오디오 인코더로부터 오디오 비트스트림을 수신할 수도 있다. 도 8 에 예시된 바와 같이, 오디오 디코더 (110) 는 코어 디코더 (111), 에러 검출 모듈 (112), FLC 모듈 (113), 및 역변환 유닛 (120) 을 포함한다.

예시를 위해, 오디오 디코더 (110) 를 본 명세서에서는, 오디오 신호의 프레임의 주파수 도메인 데이터가 MDCT 계수에 의해 표현되는 AAC 표준에 따르는 것으로서 설명할 것이다. 또한, 역변환 유닛 (120) 을 변형 이산 코사인 역변환 유닛으로서 설명할 것이다. 다른 실시형태에서, 오디오 디코더 (110) 는 상기 리스트된 임의의 오디오 코딩 표준을 따를 수도 있다.

코어 디코더 (111) 는 계수 X_m(k) 를 포함하는 프레임 (m) 에 대한 오디오 비트스트림을 수신하고, 프레임 (m) 에 대한 오디오 비트스트림을 에러 검출 모듈 (112) 로 전송한다. 그 후, 에러 검출 모듈 (112) 은 프레임 (m) 에 대한 오디오 비트스트림에 대해 에러 검출을 수행한다. 코어 디코더 (111) 는 사이드 정보로서 프레임 (m) 에 대한 사인 S_m (98) 의 서브세트 및 계수 X_m ₊₁(k) 를 포함하는 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 을 연속적으로 수신한다. 코어 디코더 (111) 는 폐기되지 않은 경우에, 프레임 (m) 에 대한 계수를 생성하기 위해 제 1 프레임 지연부 (121) 를 사용하고, 프레임 (m+1) 에 대한 오디오 비트스트림으로부터 프레임 (m-1) 에 대한 계수를 생성하기 위해 제 2 프레임 지연부 (122) 를 사용한다. 프레임 (m) 에 대한 계수가 폐기되지 않은 경우에, 제 1 프레임 지연부 (121) 는 프레임 (m) 에 대한 계수를 멀티플렉서 (119) 로 전송한다. 제 2 프레임 지연부 (122) 는 프레임 (m-1) 에 대한 계수를 FLC 모듈 (113) 로 전송한다.

에러가 프레임 (m) 내에서 검출되지 않으면, 에러 검출 모듈 (112) 은, 프레임 (m) 에 대한 오디오 신호 샘플로 변환될 프레임 (m) 에 대한 계수 X_m(k) 를, 멀티플렉서 (119) 가 제 1 프레임 지연부 (121) 로부터 역변환 유닛 (120) 으로 직접 통과시키는 것을 가능하게 할 수도 있다.

에러가 프레임 (m) 내에서 검출되면, 에러 검출 모듈 (112) 은 프레임 (m) 에 대한 모든 계수를 폐기하며, 멀티플렉서 (119) 가 FLC 모듈 (113) 로부터의 프레임 (m) 에 대한 계수 추정치

를 역변환 유닛 (120) 으로 통과시키는 것을 가능하게 할 수 있다. FLC 모듈 (113) 은 코어 디코더 (111) 로부터 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 수신하고, 제 2 프레임 지연부 (122) 로부터 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 수신한다. FLC 모듈 (113) 은 프레임 (m) 에 대 한 계수의 크기를 추정하기 위해 프레임 (m+1 및 m-1) 에 대한 계수를 사용한다. 또한, FLC 모듈 (113) 은 프레임 (m) 에 대한 계수의 사인을 추정하기 위해 오디오 인코더 (90) 로부터 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 과 함께 송신된 프레임 (m) 에 대한 사인 S_m (98) 의 서브세트를 사용한다. 그 후, FLC 모듈 (113) 은 프레임 (m) 에 대한 계수를 추정하기 위해 크기 추정치와 사인 추정치를 결합한다. FLC 모듈 (113) 은, 프레임 (m) 에 대한 계수 추정치를 프레임 (m) 에 대한 오디오 신호의 추정된 샘플

로 변환시키는 역변환 유닛 (120) 으로 계수 추정치

를 전송한다.

FLC 모듈 (113) 은, 크기 추정기 (114), 성분 선택 모듈 (116), 및 사인 추정기 (118) 를 포함한다. 코어 디코더 (111) 는, 프레임 (m+1) 에 대한 계수 X_m+1(k) 를 크기 추정기 (114) 로 전송하고, 제 2 프레임 지연부 (122) 는 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 크기 추정기 (114) 로 전송한다. 크기 추정기 (114) 는 프레임 (m+1 및 m-1) 에 대한 계수에 기초하여 프레임 (m) 에 대한 계수의 크기를 추정한다. 크기 추정기 (114) 는 프레임 (m) 에 대한 계수 크기를 추정하기 위해 다양한 보간 기술중 하나를 구현할 수도 있다. 예를 들어, 크기 추정기 (114) 는 프레임 (m-1) 에 대한 이전의 프레임 계수 X_m _-1(k) 및 프레임 (m+1) 에 대한 다음의 프레임 계수 X_m ₊₁(k) 의 에너지에 기초하여 에너지 보간을 구 현할 수도 있다. 계수 크기 추정치

는 상기 수학식 (1) 에 제공되었다. 다른 실시형태에서, 인코더-보조 FLC 기술은 프레임 (m) 에 대한 계수의 크기를 추정하기 위해 프레임 (m) 의 직전 또는 직후가 아닌 프레임 (m) 의 이웃하는 프레임들을 이용할 수도 있다.

성분 선택 모듈 (116) 은 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 수신하고, 프레임 (m+1) 에 대한 계수의 크기를 정렬함으로써 프레임 (m+1) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기 또는 가장 현저한 스펙트럼 피크를 갖는 계수가 음조 성분으로 고려될 수도 있으며, 나머지 계수가 잡음 성분으로 고려될 수도 있다. 선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 다른 경우에서, 프레임 (m+1) 에 대한 선택된 음조 성분의 수는 오디오 신호에 기초하여 변화할 수도 있다. 그 후, 성분 선택 모듈 (116) 은 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 인덱스 서브세트 I_m ₊₁ 를 생성한다. 프레임 (m+1) 에 대한 인덱스 서브세트는 상기 수학식 (6) 에서 제공된다. 프레임 (m) 에 대한 인덱스 서브세트가 프레임 (m+1) 에 대한 인덱스 서브세트와 거의 동일하다고 가정한다.

성분 선택 모듈 (116) 은 오디오 비트스트림이 수신되는 오디오 인코더 (90) 내의 성분 선택 모듈 (102) 과 정확히 동일한 동작을 사용하여 프레임 (m+1) 내의 음조 성분을 선택한다. 따라서, 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 동일한 인덱스 서브세트 I_m ₊₁ 가 오디오 인코더 (90) 및 오디오 디코더 (110) 모두에서 생성될 수도 있다. 그 후, 오디오 디코더 (110) 는 프레임 (m) 의 음조 성분에 대한 사인 S_m (98) 의 서브세트를 프레임 (m+1) 에 대한 인덱스 서브세트에 의해 식별된 프레임 (m) 의 적절한 추정된 계수 크기에 적용할 수도 있다.

성분 선택 모듈 (116) 은 프레임 (m+1) 에 대한 인덱스 서브세트를 사인 추정기 (118) 로 전송한다. 또한, 사인 추정기 (118) 는 인코더 (90) 로부터 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 과 함께 송신된 프레임 (m) 에 대한 사인 S_m (98) 의 서브세트를 수신한다. 그 후, 사인 추정기 (118) 는 프레임 (m) 에 대한 음조 성분 및 잡음 성분 모두에 대한 사인을 추정한다.

잡음 성분의 경우에서, 사인 추정기 (118) 는 랜덤 신호로부터 사인을 추정한다. 음조 성분의 경우에서, 사인 추정기 (118) 는 프레임 (m+1) 에 대한 인덱스 서브세트에 기초하여 사인 S_m (98) 의 서브세트로부터 사인을 추정한다. 예를 들어, 인덱스 서브세트는 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분을 식별하는 소정의 수, 예를 들어, 10개의 계수 인덱스를 포함한다. 그 후, 사인 추정기 (118) 는 프레임 (m+1) 에 대한 인덱스 서브세트내의 인덱스들과 동일한 인덱스들 (k) 을 갖는 사인 S_m (98) 의 서브세트로서 프레임 (m) 의 음조 성분에 대한 사인을 추정한다. 사인 추정치는,

[수학식 7]

과 같이 제공되고, 여기서, sgn() 은 사인 함수를 나타내고, I_m ₊₁ 은 선택된 음조 성분에 대응하는 계수의 인덱스 서브세트이며, S_m(k) 는 샘플 스페이스 {-1,1} 를 갖는 랜덤 변수이다.

상술한 바와 같이, 프레임의 음조 성분에 대한 사인을 추정하기 위해, 오디오 디코더 (110) 는 프레임 (m) 의 원래 음조 성분의 대응하는 사인 뿐만 아니라 프레임 (m) 내의 음조 성분의 위치를 알 필요가 있다. 이러한 정보를 수신하기 위한 오디오 디코더 (110) 에 있어서의 단순한 방식은, 증가된 비트 레이트를 이용하여 오디오 인코더 (90) 로부터의 파라미터를 모두 오디오 디코더 (110) 로 명시적으로 송신하는 것이다. 예시된 실시형태에서, 인덱스 서브세트 I_m ₊₁ 은 정확히 동일한 유도 프로세스를 사용하여 오디오 인코더 (90) 및 오디오 디코더 (110) 모두에서 자체 유도되지만, 프레임 (m+1) 에 대한 인덱스 서브세트 I_m ₊₁ 에 의해 인덱스된 프레임 (m) 의 음조 성분에 대한 사인은 사이드 정보로서 오디오 인코더 (90) 로부터 송신된다.

그 후, FLC 모듈 (113) 은 프레임 (m) 에 대한 계수를 추정하기 위해 크기 추정기 (114) 로부터의 크기 추정치

와 사인 추정기 (118) 로부터의 사인 추정치

를 결합한다. 프레임 (m) 에 대한 계수 추정치

는 수학식 (5) 에 제공된다. 그 후, FLC 모듈 (113) 은 프레임 (m) 에 대한 계수 추정을 프레임 (m) 에 대한 오디오 신호의 추정된 샘플

로 변환하는 역변환 유닛 (120) 으로 계수 추정치를 전송한다.

도 9 는, 사이드 정보로서 오디오 비트스트림과 함께 송신될 프레임에 대한 사인의 서브세트를 생성하고 오디오 비트스트림을 인코딩하는 또 다른 예시적인 동작을 예시하는 플로우차트이다. 이 동작을 본 명세서에서는 도 7 로부터의 오디오 인코더 (90) 를 참조하여 설명할 것이다.

변환 유닛 (92) 은 프레임 (m+1) 에 대한 오디오 신호의 샘플 x_m ₊₁[n] 을 수신하여, 그 샘플을 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 로 변환한다 (124). 그 후, 코어 인코더 (94) 가 그 계수를 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 으로 인코딩한다 (126). 변환 유닛 (92) 은 프레임 (m+1) 에 계수 X_m ₊₁(k) 를 성분 선택 모듈 (102) 및 프레임 지연부 (100) 로 전송한다. 프레임 지연부 (100) 는 프레임 지연을 수행하고, 프레임 (m) 에 대한 계수 X_m(k) 를 생성한다 (128). 그 후, 프레임 지연부 (100) 는 프레임 (m) 에 대한 계수를 사인 추출기 (104) 로 전송한다.

성분 선택 모듈 (102) 은 프레임 (m+1) 에 대한 계수 크기를 정렬함으로써 프레임 (m+1) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기를 갖 는 계수가 음조 성분으로 고려될 수도 있으며 나머지 계수가 잡음 성분으로 고려될 수도 있다. 선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 다른 경우에서, 프레임 (m+1) 에 대한 선택된 음조 성분의 수는 오디오 신호에 기초하여 변화할 수도 있다. 그 후, 성분 선택 모듈 (102) 은 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분을 식별하는 인덱스 서브세트 I_m ₊₁ 를 생성한다 (130).

성분 선택 모듈 (102) 은 프레임 (m+1) 에 대한 인덱스 서브세트를 사인 추출기 (104) 로 전송한다. 또한, 사인 추출기 (104) 는 프레임 지연부 (100) 로부터 프레임 (m) 에 대한 계수 X_m(k) 를 수신한다. 프레임 (m) 에 대한 인덱스 서브세트가 프레임 (m+1) 에 대한 인덱스 서브세트와 거의 동일하다고 가정한다. 그 후, 사인 추출기 (104) 는 프레임 (m+1) 에 대한 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 계수 X_m(k) 로부터 사인을 추출한다 (132). 그 후, 사인 추출기 (104) 는 프레임 (m+1) 에 대한 인덱스 서브세트에 의해 식별된 프레임 (m) 에 대한 음조 성분으로부터 추출된 사인 S_m (98) 의 서브세트를 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 에 부착한다 (134).

도 10 은, 사이드 정보로서 인코더로부터 수신된 프레임에 대한 사인의 서브세트를 사용하여 프레임 손실 은폐를 수행하고 오디오 비트스트림을 디코딩하는 또 다른 예시적인 동작을 예시하는 플로우차트이다. 이 동작을 본 명세서에서는 도 8 로부터의 오디오 디코더 (110) 를 참조하여 설명할 것이다.

코어 디코더 (111) 는 계수 X_m(k) 를 포함하는 프레임 (m) 에 대한 오디오 비트스트림을 수신한다 (138). 그 후, 에러 검출 모듈 (112) 은 프레임 (m) 에 대한 오디오 비트스트림에 대해 에러 검출을 수행한다 (140). 코어 디코더 (111) 는 사이드 정보로서 프레임 (m) 에 대한 사인 S_m (98) 의 서브세트 및 계수 X_m+1(k) 를 포함하는 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 을 연속적으로 수신한다 (141). 코어 디코더 (111) 는 폐기되지 않은 경우에, 프레임 (m) 에 대한 계수를 생성하기 위해 제 1 프레임 지연부 (121) 를 사용하고, 프레임 (m+1) 에 대한 오디오 비트스트림으로부터 프레임 (m-1) 에 대한 계수를 생성하기 위해 제 2 프레임 지연부 (122) 를 사용한다. 프레임 (m) 에 대한 계수가 폐기되지 않으면, 제 1 프레임 지연부 (121) 는 프레임 (m) 에 대한 계수를 멀티플렉서 (119) 로 전송한다. 제 2 프레임 지연부 (122) 는 프레임 (m-1) 에 대한 계수를 FLC 모듈 (113) 로 전송한다.

에러가 프레임 (m) 내에서 검출되지 않으면, 에러 검출 모듈 (112) 은, 프레임 (m) 에 대한 오디오 신호 샘플로 변환될 프레임 (m) 에 대한 계수를, 멀티플렉서 (119) 가 제 1 프레임 지연부 (121) 로부터 역변환 유닛 (120) 으로 직접 통과시키는 것을 가능하게 할 수도 있다. 에러가 프레임 (m) 내에서 검출되면, 에러 검출 모듈 (112) 은 프레임 (m) 에 대한 모든 계수를 폐기하며, 멀티플렉서 (119) 가 FLC 모듈 (113) 로부터의 프레임 (m) 에 대한 계수 추정치를 역변환 유닛 (120) 으로 통과시키는 것을 가능하게 할 수 있다 (142).

코어 디코더 (111) 는 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 크기 추정기 (114) 로 전송하고, 제 2 프레임 지연부 (122) 는 프레임 (m-1) 에 대한 계수 X_m _-1(k) 를 크기 추정기 (114) 로 전송한다. 크기 추정기 (114) 는 프레임 (m+1 및 m-1) 에 대한 계수에 기초하여 프레임 (m) 에 대한 계수의 크기를 추정한다 (144). 예를 들어, 크기 추정기 (114) 는 계수 크기를 추정하기 위해 수학식 (1) 에 제공된 에너지 보간 기술을 구현할 수도 있다.

성분 선택 모듈 (116) 은 프레임 (m+1) 에 대한 계수 X_m ₊₁(k) 를 수신하고, 프레임 (m+1) 에 대한 계수의 크기를 정렬함으로써 프레임 (m+1) 의 음조 성분과 잡음 성분 사이를 구별한다. 가장 큰 크기를 갖는 계수가 음조 성분으로 고려될 수도 있으며, 나머지 계수가 잡음 성분으로 고려될 수도 있다. 선택된 음조 성분의 수는 송신될 사인의 소정의 수에 기초할 수도 있다. 다른 경우에서, 프레임 (m+1) 에 대한 선택된 음조 성분의 수는 오디오 신호에 기초하여 변화할 수도 있다. 그 후, 성분 선택 모듈 (116) 은 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 인덱스 서브세트 I_m ₊₁ 를 생성한다 (146). 프레임 (m) 에 대한 인덱스 서브세트가 프레임 (m+1) 에 대한 인덱스 서브세트와 거의 동일하다고 가정한다.

성분 선택 모듈 (116) 은, 오디오 비트스트림이 수신되는 오디오 인코더 (90) 내의 성분 선택 모듈 (102) 과 정확히 동일한 동작을 사용하여 프레임 (m+1) 내의 음조 성분을 선택한다. 따라서, 프레임 (m+1) 에 대한 계수 크기로부터 선택된 음조 성분의 위치를 식별하는 동일한 인덱스 서브세트 I_m ₊₁ 가 오디오 인코더 (90) 및 오디오 디코더 (110) 모두에서 생성될 수도 있다. 그 후, 오디오 디코더 (110) 는, 프레임 (m) 의 음조 성분에 대한 사인 S_m (98) 의 서브세트를 프레임 (m+1) 에 대한 인덱스 서브세트에 의해 식별된 프레임 (m) 의 적절한 추정된 계수 크기에 적용할 수도 있다.

성분 선택 모듈 (116) 은 프레임 (m+1) 에 대한 인덱스 서브세트를 사인 추정기 (118) 로 전송한다. 또한, 사인 추정기 (118) 는 인코더 (90) 로부터 프레임 (m+1) 에 대한 오디오 비트스트림 (96) 과 함께 송신된 프레임 (m) 에 대한 사인 S_m (98) 의 서브세트를 수신한다. 사인 추정기 (118) 는 프레임 (m+1) 에 대한 인덱스 서브세트에 기초하여 사인 S_m (98) 의 서브세트로부터 프레임 (m) 의 음조 성분에 대한 사인을 추정한다 (148). 사인 추정기 (118) 는 랜덤 신호로부터 잡음 성분에 대한 사인을 추정한다 (150).

와 사인 추정기 (118) 로부터의 사인 추정치

를 결합한다 (152). FLC 모듈 (113) 은, 프레임 (m) 에 대한 계수 추정치를 프레임 (m) 에 대한 오디오 신호의 추정된 샘플

로 변환하는 역변환 유닛 (120) 으로 계수 추정치

를 전송한다 (154).

도 11 은, 본 명세서에 설명한 인코더-보조 FLC 기술 (162) 의 프레임 손실율과 종래의 FLC 기술 (160) 의 프레임 손실율 사이의 품질 비교를 예시하는 도면이다. 이 비교는 0%, 5%, 10%, 15% 및 20% 의 프레임 손실율 (FLR) 하에서 2개의 FLC 방법 사이에서 수행된다. CD 로부터 샘플링된 다수의 모노 오디오 시퀀스가 48 kbps 의 비트레이트에서 인코딩되며, 그 인코딩된 프레임이 단일 프레임 손실로의 제한을 갖는 특정 레이트에서 랜덤하게 드롭된다.

본 명세서에서 설명한 인코더-보조 FLC 기술에 대해, 인코더가 사이드 정보로서 송신한 사인의 수가 모든 프레임에 대해 고정되며, 10 비트/프레임으로 제한되었으며, 이것은 0.43 kbps 의 비트레이트와 등가이다. 2개의 상이한 비트스트림, 즉, (i) 종래의 FLC 기술에 대한 48 kbps AAC 비트스트림, 및 (ii) 인코더-보조 FLC 기술에 대한 0.43 kbps 의 비트레이트에서의 사인 정보를 포함하는 47.57 kbps AAC 비트스트림이 생성되었다. 은폐된 오디오 품질의 주관적인 평가를 위해, 44.1 kHz 샘플링 레이트를 갖는 다양한 종류의 다성 (polyphonic) 오디오 시퀀스가 선택되며, 다양한 FLR 하에서 방법 양자에 의한 디코더 재구성이 비교되었다. 앵커를 갖는 멀티-자극 히든 참조 (MUSHRA) 테스트가 이용되었고, 11 명의 청취자에 의해 수행되었다.

도 11 로부터, 인코더-보조 FLC 기술 (162) 이 모든 FLR 에서 오디오 디코더 재구성 품질을 개선시킨다는 것을 알 수 있다. 예를 들어, 인코더-보조 FLC 기 술은 적당한 (5% 및 10%) FLR 에서 80 포인트 MUSHRA 스코어 보다 양호한 재구성 품질을 유지한다. 또한, 15% FLR 에서의 인코더-보조 FLR 기술 (162) 의 재구성 품질은 5% FLR 에서의 종래의 FLC 기술 (160) 의 재구성 품질과 통계적으로 등가이고, 이것은, 인코더-보조 FLC 기술에 의해 제공된 강화된 에러 내성을 나타낸다.

다수의 실시형태를 설명하였다. 그러나, 이들 실시형태에 대한 다양한 변형이 가능하며, 본 명세서에 제공된 원리가 다른 실시형태들에 또한 적용될 수도 있다. 본 명세서에 설명한 바와 같은 방법들은 하드웨어, 소프트웨어, 및/또는 펌웨어에서 구현될 수도 있다. 이러한 방법들의 다양한 작업이 마이크로프로세서, 통합된 제어기, 또는 IP 코어와 같은 로직 엘리먼트의 하나 이상의 어레이에 의해 실행가능한 명령들의 세트로서 구현될 수도 있다. 일 예에서, 하나 이상의 이러한 작업이 셀룰러 전화와 같은 개인 통신 디바이스의 다양한 디바이스의 동작을 제어하기 위해 구성된 이동국 모뎀 칩 또는 칩셋내의 실행을 위해 배열된다.

본 명세서에 설명한 기술은 범용 마이크로프로세서, 디지털 신호 프로세서 (DSP), 응용 주문형 집적 회로 (ASIC), 필드 프로그램가능 게이트 어레이 (FPGA), 또는 다른 등가의 로직 디바이스내에서 구현될 수도 있다. 소프트웨어에서 구현되면, 이 기술은 랜덤 액세스 메모리 (RAM), 판독전용 메모리 (ROM), 비휘발성 랜덤 액세스 메모리 (NVRAM), 전기적으로 제거가능한 프로그램가능 판독전용 메모리 (EEPROM), FLASH 메모리 등과 같은 컴퓨터-판독가능 매체상에서 명령들로서 수록될 수도 있다. 이 명령들은 하나 이상의 프로세서로 하여금, 본 명세서에 설 명한 기능의 특정 양태들을 수행하게 한다.

또 다른 예로서, 일 실시형태가 하드-유선 회로로서, 응용 주문형 집적 회로로서 제조된 회로 구성으로서, 또는 비휘발성 저장부에 로딩된 펌웨어 프로그램 또는 머신-판독가능 코드와 같이 데이터 저장 매체로부터 또는 거기에 로딩된 소프트웨어 프로그램으로서 부분적으로 또는 전체적으로 구현될 수도 있으며, 이러한 코드는 마이크로프로세서 또는 다른 디지털 신호 프로세싱 유닛과 같은 로직 엘리먼트의 어레이에 의해 실행가능한 명령들이다. 데이터 저장 매체는 (동적, 또는 정적 RAM, ROM, 및/또는 플래시 RAM 을 제한없이 포함할 수도 있는) 반도체 메모리, 강유전체, 오보닉, 중합체, 또는 상-변화 메모리와 같은 저장 엘리먼트의 어레이; 또는 자기 또는 광학 디스크와 같은 디스크 매체일 수도 있다.

본 명세서에서, 인코더로부터의 오디오 비트스트림과 함께 송신된 사이드 정보 및 이웃하는 프레임들에 기초하여 오디오 신호의 폐기된 프레임을 정확하게 은폐하는 디코더에서의 인코더-보조 프레임 손실 은폐를 위한 다양한 기술을 설명하였다. 이 인코더-보조 FLC 기술들은 또한, 인코더로부터 송신된 추가 사이드 정보를 이용하여 이웃하는 프레임에 기초하여 오디오 신호의 다중의 폐기된 프레임을 정확하게 은폐할 수도 있다. 이 인코더-보조 FLC 기술들은 이웃하는 프레임들의 주파수 도메인 데이터에 기초하여 프레임에 대한 주파수 도메인 데이터의 크기를 추정하며, 사이드 정보로서 인코더로부터 송신된 사인의 서브세트에 기초하여 주파수 도메인 데이터의 사인을 추정하는 것을 포함한다.

오디오 신호의 프레임에 대한 주파수 도메인 데이터는 음조 성분 및 잡음 성 분을 포함한다. 랜덤 신호로부터 추정된 사인은 주파수 도메인 데이터의 잡음 성분에 대해 실질적으로 정확할 수도 있다. 그러나, 음조 성분에 대한 매우 정확한 사인 추정을 달성하기 위해, 인코더는 사이드 정보로서 주파수 도메인 데이터의 음조 성분에 대한 사인을 송신한다. 디코더로 송신된 사이드 정보의 양을 최소화시키기 위해, 인코더는 프레임내의 음조 성분의 위치를 송신하지 않는다. 대신, 인코더 및 디코더 모두는 동일한 동작을 사용하여 음조 성분의 위치를 자체 유도한다. 이러한 방식으로, 인코더-보조 FLC 기술은, 최소량의 사이드 정보가 인코더로부터 송신되면서, 디코더에서 프레임 은폐 품질의 현저한 개선을 달성한다.

인코더-보조 FLC 기술을, 오디오 신호의 프레임의 주파수 도메인 데이터가 MDCT 계수에 의해 표현되는 AAC 표준을 이용하는 멀티미디어 애플리케이션에 관하여 본 명세서에서 주로 설명하였다. 이 기술은 임의의 다양한 오디오 코딩 표준을 사용하는 멀티미디어 애플리케이션에 적용될 수도 있다. 예를 들어, 이 표준들은 MPEG, WMA 표준, 돌비 연구소에 의한 표준, MP3 표준, 및 MP3 표준에 대한 후속물에 따른다. 이들 및 다른 실시형태들은 아래의 청구항의 범위내에 있다.

Claims

오디오 신호의 프레임을 은폐하는 방법으로서,

상기 프레임의 이웃하는 프레임들에 기초하여 상기 프레임에 대한 주파수 도메인 데이터의 크기를 추정하는 단계;

사이드 정보로서 인코더로부터 송신된 상기 프레임에 대한 사인들 (signs) 의 서브세트에 기초하여 상기 프레임에 대한 주파수 도메인 데이터의 사인들을 추정하는 단계; 및

상기 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 인코더로부터 주파수 도메인 데이터를 포함하는 상기 프레임에 대한 오디오 비트스트림을 수신하는 단계; 및

상기 인코더로부터 이웃하는 프레임에 대한 오디오 비트스트림과 상기 프레임에 대한 상기 사이드 정보를 수신하는 단계를 더 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 인코더로부터 송신된 프레임에 대한 오디오 비트스트림에 대해 에러 검 출을 수행하는 단계; 및

하나 이상의 에러가 검출될 때 상기 프레임에 대한 주파수 도메인 데이터를 폐기하는 단계를 더 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 프레임에 대한 상기 주파수 도메인 데이터의 크기를 추정하는 단계는, 상기 프레임의 선행 프레임과 상기 프레임의 후속 프레임의 에너지에 기초하여 에너지 보간을 수행하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 프레임에 대한 상기 주파수 도메인 데이터의 사인들을 추정하는 단계는,

랜덤 신호로부터 상기 프레임에 대한 상기 주파수 도메인 데이터의 잡음 성분들에 대한 사인들을 추정하는 단계; 및

상기 사이드 정보로서 상기 인코더로부터 송신된 상기 프레임에 대한 상기 사인들의 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들에 대한 사인들을 추정하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 프레임에 대한 상기 주파수 도메인 데이터의 사인들을 추정하는 단계는,

상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들을 선택하는 단계;

상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 단계; 및

상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 6 항에 있어서,

상기 음조 성분들을 선택하는 단계는,

크기의 순서로 상기 주파수 도메인 데이터를 정렬하는 단계; 및

상기 음조 성분들로서, 가장 높은 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 프레임에 대한 상기 주파수 도메인 데이터의 사인들을 추정하는 단계는,

상기 프레임에 대한 상기 주파수 도메인 데이터의 상기 크기 추정치로부터 음조 성분들을 선택하는 단계;

상기 프레임에 대한 상기 주파수 도메인 데이터의 상기 크기 추정치로부터 선택된 상기 음조 성분들의 위치들을 식별하는 추정된 인덱스 서브세트를 생성하는 단계; 및

상기 프레임에 대한 상기 추정된 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 프레임에 대한 상기 주파수 도메인 데이터의 사인들을 추정하는 단계는,

상기 프레임의 이웃하는 프레임에 대한 주파수 도메인 데이터의 크기로부터 음조 성분들을 선택하는 단계;

상기 이웃하는 프레임에 대한 상기 주파수 도메인 데이터의 상기 크기로부터 선택된 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 단계; 및

상기 이웃하는 프레임에 대한 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

주파수 도메인 데이터를 포함하는 상기 프레임에 대한 오디오 비트스트림을 디코더로 송신하는 단계; 및

이웃하는 프레임에 대한 오디오 비트스트림과 상기 프레임에 대한 상기 사이드 정보를 상기 디코더로 송신하는 단계를 더 포함하는, 오디오 신호의 프레임 은폐 방법.
제 10 항에 있어서,

상기 사이드 정보를 송신하는 단계는,

상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 사인들의 서브세트를 추출하는 단계; 및

상기 사이드 정보로서, 상기 이웃하는 프레임에 대한 상기 오디오 비트스트림에 상기 사인들의 서브세트를 부착하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 11 항에 있어서,

상기 프레임에 대한 상기 사인들의 서브세트를 추출하는 단계는,

상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들을 선택하는 단계;

상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 단계; 및

상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 12 항에 있어서,

상기 음조 성분들을 선택하는 단계는,

크기의 순서로 상기 주파수 도메인 데이터를 정렬하는 단계; 및

상기 음조 성분들로서, 가장 높은 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 11 항에 있어서,

상기 프레임에 대한 상기 사인들의 서브세트를 추출하는 단계는,

상기 프레임의 이웃하는 프레임들에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터의 크기를 추정하는 단계;

상기 프레임에 대한 상기 주파수 도메인 데이터의 크기 추정치로부터 음조 성분들을 선택하는 단계;

상기 프레임에 대한 상기 주파수 도메인 데이터의 크기 추정치로부터 선택된 상기 음조 성분들의 위치들을 식별하는 추정된 인덱스 서브세트를 생성하는 단계; 및

상기 프레임에 대한 상기 추정된 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 11 항에 있어서,

상기 프레임에 대한 상기 사인들의 서브세트를 추출하는 단계는,

상기 이웃하는 프레임에 대한 주파수 도메인 데이터 크기로부터 음조 성분들을 선택하는 단계;

상기 이웃하는 프레임에 대한 상기 주파수 도메인 데이터 크기로부터 선택된 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 단계; 및

상기 이웃하는 프레임에 대한 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하는 단계를 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 인코더에 포함된 변환 유닛을 사용하여, 상기 프레임에 대한 시간 도메인 오디오 신호를 상기 프레임에 대한 주파수 도메인 데이터로 인코딩하는 단계; 및

디코더에 포함된 역변환 유닛을 사용하여, 상기 프레임에 대한 상기 추정된 주파수 도메인 데이터를 상기 프레임에 대한 추정된 시간 도메인 데이터로 디코딩 하는 단계를 더 포함하는, 오디오 신호의 프레임 은폐 방법.
제 1 항에 있어서,

상기 사이드 정보는 상기 프레임에 대한 주파수 도메인 데이터의 음조 성분들에 대한 사인의 서브세트를 포함하며,

상기 방법은,

상기 인코더를 사용하여 상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 단계;

상기 인코더를 사용하여 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하는 단계;

상기 사이드 정보로서 상기 음조 성분들에 대한 상기 사인들의 서브세트를 디코더로 송신하는 단계;

상기 인코더와 동일한 프로세스를 사용하여 상기 디코더로 상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 단계; 및

상기 인덱스 서브세트에 기초하여 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는 단계를 더 포함하는, 오디오 신호의 프레임 은폐 방법.
오디오 신호의 프레임을 은폐하는 명령들을 포함하는 컴퓨터-판독가능 매체 로서,

상기 명령들은, 프로그램가능한 프로세서로 하여금,

상기 프레임의 이웃하는 프레임들에 기초하여 상기 프레임에 대한 주파수 도메인 데이터의 크기를 추정하고,

사이드 정보로서 인코더로부터 송신된 상기 프레임에 대한 사인들의 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터의 사인들을 추정하며,

상기 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합하게 하는, 컴퓨터-판독가능 매체.
제 18 항에 있어서,

상기 명령들은, 상기 프로그램가능한 프로세서로 하여금,

랜덤 신호로부터 상기 프레임에 대한 상기 주파수 도메인 데이터의 잡음 성분들에 대한 사인들을 추정하며,

상기 사이드 정보로서 상기 인코더로부터 송신된 상기 프레임에 대한 상기 사인들의 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들에 대한 사인들을 추정하게 하는, 컴퓨터-판독가능 매체.
제 18 항에 있어서,

상기 명령들은, 상기 프로그램가능한 프로세서로 하여금,

크기의 순서로 상기 프레임에 대한 상기 주파수 도메인 데이터를 정렬하고,

상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들로서, 가장 높은 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하고,

상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하며,

상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하게 하는, 컴퓨터-판독가능 매체.
제 18 항에 있어서,

상기 프로그램가능한 프로세서로 하여금,

상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 사인들의 서브세트를 추출하고,

상기 사이드 정보로서 이웃하는 프레임에 대한 오디오 비트스트림에 상기 사인들의 서브세트를 부착하며,

상기 이웃하는 프레임에 대한 오디오 비트스트림과 상기 프레임에 대한 상기 사이드 정보를 디코더로 송신하게 하는 명령들을 더 포함하는, 컴퓨터-판독가능 매체.
제 21 항에 있어서,

상기 명령들은, 상기 프로그램가능한 프로세서로 하여금,

크기의 순서로 상기 프레임에 대한 상기 주파수 도메인 데이터를 정렬하고,

상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들로서, 가장 큰 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하고,

상기 프레임내의 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하며,

상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하게 하는, 컴퓨터-판독가능 매체.
오디오 신호의 프레임을 은폐하기 위한 시스템으로서,

사이드 정보로서 상기 프레임에 대한 사인들의 서브세트를 송신하는 인코더; 및

상기 인코더로부터 상기 프레임에 대한 상기 사이드 정보를 수신하는 프레임 손실 은폐 (FLC) 모듈을 포함하는 디코더를 포함하며,

상기 FLC 모듈은, 상기 프레임의 이웃하는 프레임들에 기초하여 상기 프레임에 대한 주파수 도메인 데이터의 크기를 추정하고, 상기 수신된 사이드 정보에 기초하여 상기 프레임에 대한 주파수 도메인 데이터의 사인들을 추정하며, 상기 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합하는, 오디오 신호의 프레임 은폐 시스템.
제 23 항에 있어서,

상기 FLC 모듈은, 상기 인코더로부터 송신된 상기 프레임에 대한 오디오 비트스트림에 대해 에러 검출을 수행하며, 하나 이상의 에러가 검출될 때 상기 프레임에 대한 주파수 도메인 데이터를 폐기하는 에러 검출 모듈을 포함하는, 오디오 신호의 프레임 은폐 시스템.
제 23 항에 있어서,

상기 FLC 모듈은, 상기 프레임에 대한 상기 주파수 도메인 데이터의 크기를 추정하기 위해 상기 프레임의 선행 프레임과 상기 프레임의 후속 프레임의 에너지에 기초하여 에너지 보간을 수행하는 크기 추정기를 포함하는, 오디오 신호의 프레임 은폐 시스템.
제 23 항에 있어서,

상기 FLC 모듈은,

랜덤 신호로부터 상기 프레임에 대한 상기 주파수 도메인 데이터의 잡음 성분들에 대한 사인들을 추정하며,

상기 사이드 정보로서 상기 인코더로부터 송신된 상기 프레임에 대한 상기 사인들의 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들에 대한 사인들을 추정하는 사인 추정기를 포함하는, 오디오 신호의 프 레임 은폐 시스템.
제 26 항에 있어서,

상기 FLC 모듈은, 크기의 순서로 상기 프레임에 대한 상기 주파수 도메인 데이터를 정렬하고, 상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들로서 가장 높은 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하며, 상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 성분 선택 모듈을 포함하며,

상기 사인 추정기는 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는, 오디오 신호의 프레임 은폐 시스템.
제 23 항에 있어서,

상기 인코더는, 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 사인들의 서브세트를 추출하며, 상기 사이드 정보로서 이웃하는 프레임에 대한 오디오 비트스트림에 상기 사인들의 서브세트를 부착하는 사인 추출기를 포함하고,

상기 인코더는 상기 이웃하는 프레임에 대한 상기 오디오 비트스트림과 상기 프레임에 대한 상기 사이드 정보를 상기 디코더로 송신하는, 오디오 신호의 프레임 은폐 시스템.
제 28 항에 있어서,

상기 인코더는, 크기의 순서로 상기 프레임에 대한 상기 주파수 도메인 데이터를 정렬하고, 상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들로서 가장 높은 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하며, 상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 성분 선택 모듈을 포함하며,

상기 사인 추출기는, 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하는, 오디오 신호의 프레임 은폐 시스템.
제 23 항에 있어서,

상기 프레임에 대한 상기 주파수 도메인 데이터는, 변형 이산 코사인 변환 (MDCT) 계수들로 표현되는, 오디오 신호의 프레임 은폐 시스템.
제 23 항에 있어서,

상기 인코더는, 상기 프레임에 대한 시간 도메인 오디오 신호를 상기 프레임에 대한 주파수 도메인 데이터로 인코딩하는 변환 유닛을 포함하며,

상기 디코더는, 상기 프레임에 대한 상기 추정된 주파수 도메인 데이터를 상기 프레임에 대한 추정된 시간 도메인 데이터로 디코딩하는 역변환 유닛을 포함하는, 오디오 신호의 프레임 은폐 시스템.
제 31 항에 있어서,

상기 인코더에 포함된 상기 변환 유닛은 변형 이산 코사인 변환 유닛을 포함하며,

상기 디코더에 포함된 상기 역변환 유닛은 변형 이산 코사인 역변환 유닛을 포함하는, 오디오 신호의 프레임 은폐 시스템.
제 23 항에 있어서,

상기 사이드 정보는 상기 프레임에 대한 주파수 도메인 데이터의 음조 성분들에 대한 사인들의 서브세트를 포함하고,

상기 인코더는, 상기 인코더를 사용하여 상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하고, 상기 인코더를 사용하여 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하며, 상기 사이드 정보로서 상기 음조 성분들에 대한 상기 사인들의 서브세트를 상기 디코더로 송신하며,

상기 디코더는, 상기 인코더와 동일한 프로세스를 사용하여 상기 디코더로 상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하며, 상기 인덱스 서브세트에 기초하여 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는, 오디오 신호의 프레임 은폐 시스템.
오디오 신호의 프레임에 대한 주파수 도메인 데이터의 성분을 선택하는 성분 선택 모듈; 및

상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 선택된 성분들에 대한 사인들의 서브세트를 추출하는 사인 추출기를 포함하며,

사이드 정보로서 상기 프레임에 대한 상기 사인들의 서브세트를 디코더로 송신하는, 인코더.
제 34 항에 있어서,

상기 인코더는, 주파수 도메인 데이터를 포함하는 상기 프레임에 대한 오디오 비트스트림을 상기 디코더로 송신하며, 이웃하는 프레임에 대한 오디오 비트스트림과 상기 프레임에 대한 상기 사이드 정보를 상기 디코더로 송신하고,

상기 사인 추출기는, 상기 이웃하는 프레임에 대한 상기 오디오 비트스트림에 상기 프레임에 대한 상기 사이드 정보를 부착하는, 인코더.
제 34 항에 있어서,

상기 성분 선택 모듈은 상기 프레임내의 상기 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는, 인코더.
제 34 항에 있어서,

상기 선택된 성분들은 상기 프레임에 대한 상기 주파수 도메인 데이터의 음 조 성분들을 포함하고,

상기 성분 선택 모듈은, 크기의 순서로 상기 프레임에 대한 상기 주파수 도메인 데이터를 정렬하며, 상기 음조 성분들로서, 가장 높은 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하는, 인코더.
제 34 항에 있어서,

상기 프레임의 이웃하는 프레임들에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터의 크기를 추정하는 크기 추정기를 더 포함하고,

상기 성분 선택 모듈은 상기 프레임에 대한 상기 주파수 도메인 데이터의 크기 추정치로부터 음조 성분들을 선택하고, 상기 프레임에 대한 상기 주파수 도메인 데이터의 크기 추정치로부터 선택된 상기 음조 성분들의 위치들을 식별하는 추정된 인덱스 서브세트를 생성하고,

상기 사인 추출기는 상기 프레임에 대한 상기 추정된 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하고,

상기 인코더는 FLC 모듈을 포함하고,

상기 크기 추정기, 상기 성분 선택 모듈 및 상기 사인 추출기는 상기 FLC 모듈에 포함되는, 인코더.
제 34 항에 있어서,

상기 성분 선택 모듈은, 이웃하는 프레임에 대한 주파수 도메인 데이터 크기로부터 음조 성분들을 선택하고, 상기 이웃하는 프레임에 대한 상기 주파수 도메인 데이터 크기로부터 선택된 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트 를 생성하고,

상기 사인 추출기는, 상기 이웃하는 프레임에 대한 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터로부터 상기 음조 성분들에 대한 상기 사인들의 서브세트를 추출하는, 인코더.
프레임 손실 은폐 (FLC) 모듈을 포함하는 디코더로서,

상기 FLC 모듈은,

프레임의 이웃하는 프레임들에 기초하여 오디오 신호의 프레임에 대한 주파수 도메인 데이터의 크기를 추정하는 크기 추정기; 및

사이드 정보로서 인코더로부터 송신된 상기 프레임에 대한 사인들의 서브세트에 기초하여 상기 프레임에 대한 주파수 도메인 데이터의 사인들을 추정하는 사인 추정기를 포함하며,

상기 디코더는 상기 프레임에 대한 주파수 도메인 데이터를 추정하기 위해 크기 추정치와 사인 추정치를 결합하는, 디코더.
제 40 항에 있어서,

상기 디코더는, 상기 인코더로부터, 주파수 도메인 데이터를 포함하는 상기 프레임에 대한 오디오 비트스트림을 수신하고, 상기 인코더로부터, 이웃하는 프레임에 대한 오디오 비트스트림과 상기 프레임에 대한 상기 사이드 정보를 수신하는, 디코더.
제 40 항에 있어서,

상기 FLC 모듈은, 상기 인코더로부터 송신된 상기 프레임에 대한 오디오 비트스트림에 대해 에러 검출을 수행하고, 하나 이상의 에러가 검출될 때 상기 프레임에 대한 주파수 도메인 데이터를 폐기하는 에러 검출 모듈을 포함하는, 디코더.
제 40 항에 있어서,

상기 FLC 모듈은, 상기 프레임에 대한 상기 주파수 도메인 데이터의 크기를 추정하기 위해 상기 프레임의 선행 프레임과 상기 프레임의 후속 프레임의 에너지에 기초하여 에너지 보간을 수행하는 크기 추정기를 포함하는, 디코더.
제 40 항에 있어서,

상기 사인 추정기는, 랜덤 신호로부터 상기 프레임에 대한 상기 주파수 도메인 데이터의 잡음 성분들에 대한 사인들을 추정하고, 상기 사이드 정보로서 상기 인코더로부터 송신된 상기 프레임에 대한 상기 사인들의 서브세트에 기초하여 상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성분들에 대한 사인들을 추정하는, 디코더.
제 40 항에 있어서,

상기 FLC 모듈은, 상기 프레임에 대한 상기 주파수 도메인 데이터의 음조 성 분들을 선택하고, 상기 프레임내의 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 성분 선택 모듈을 포함하며,

상기 사인 추정기는, 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는, 디코더.
제 45 항에 있어서,

상기 성분 선택 모듈은, 크기의 순서로 상기 주파수 도메인 데이터를 정렬하고, 상기 음조 성분들로서, 가장 높은 크기를 갖는 소정의 수의 상기 주파수 도메인 데이터를 선택하는, 디코더.
제 40 항에 있어서,

상기 FLC 모듈은, 상기 프레임에 대한 상기 주파수 도메인 데이터의 상기 크기 추정치로부터 음조 성분들을 선택하고, 상기 프레임에 대한 상기 주파수 도메인 데이터의 상기 크기 추정치로부터 선택된 상기 음조 성분들의 위치들을 식별하는 추정된 인덱스 서브세트를 생성하는 성분 선택 모듈을 포함하며,

상기 사인 추정기는, 상기 프레임에 대한 상기 추정된 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는, 디코더.
제 40 항에 있어서,

상기 FLC 모듈은, 상기 프레임의 이웃하는 프레임에 대한 주파수 도메인 데이터의 크기로부터 음조 성분들을 선택하고, 상기 이웃하는 프레임에 대한 상기 주파수 도메인 데이터의 상기 크기로부터 선택된 상기 음조 성분들의 위치들을 식별하는 인덱스 서브세트를 생성하는 성분 선택 모듈을 포함하며,

상기 사인 추정기는, 상기 이웃하는 프레임에 대한 상기 인덱스 서브세트에 기초하여 상기 프레임에 대한 상기 사인들의 서브세트로부터 상기 음조 성분들에 대한 사인들을 추정하는, 디코더.