KR20120013894A

KR20120013894A - 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체

Info

Publication number: KR20120013894A
Application number: KR1020110069498A
Authority: KR
Inventors: 이남숙; 문한길
Original assignee: 삼성전자주식회사
Priority date: 2010-08-06
Filing date: 2011-07-13
Publication date: 2012-02-15
Also published as: KR101837084B1; KR20120013892A; KR20120013893A; KR101819027B1; KR101837083B1; KR20120013884A; KR20120013885A; KR20120013887A

Abstract

부가 정보가 포함된 비트 스트림을 전송받는 단계, 상기 비트 스트림 내의 추가적인 비트 스트림 정보, 스킵필드 및 보조 데이터 비트들 중 적어도 하나에 포함되는, 상기 부가 정보의 추출과 관련된 정보인 제1 정보를 추출하는 단계, 및 상기 제1 정보를 이용하여 상기 부가 정보를 추출 및 디코딩하는 단계를 포함하여, 빠르고 용이하게 부가 정보를 추출할 수 있는 신호 처리 방법이 기재되어 있다.

Description

신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체 {Method for signal processing, encoding apparatus thereof, decoding apparatus thereof, and information storage medium}

본원 발명은 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체에 관한 것이다.

더욱 상세하게는, 비트 스트림에 부가 정보를 삽입 또는 추출하기 위한 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체에 관한 것이다.

오디오 신호를 압축하여 전송하고, 압축된 오디오 신호를 수신하여 원래의 오디오 신호로 복원하기 위해서, 송신단에서는 디코더를 이용하고, 수신단에서는 엔코더를 이용한다. 송신단 및 수신단은 소정 규격에 맞춰 오디오 신호를 압축 및 복원한다.

오디오 신호를 전송하기 위한 규격으로는 AC-3(Audio Coding-3) 가 있다. AC-3는 미국의 돌비연구소에서 개발한 오디오 코딩방식의 3번째 형태를 말하는 것으로 DVD(Digital Video Disc)의 오디오 부분의 규격이다. AC-3는 소리를 표현하기 위하여 5.1 채널을 사용한다. 구체적으로, 6개의 스피커인 전방 좌우(Left, Right), 중앙(Center), 후방 좌우(Left Surround, Right Surround)에 설치한 5개의 스피커와 중저음대역 전용(low frequency effect)의 서브 우퍼 스피커를 통하여 오디오 신호들을 분리 출력하는 5.1 채널을 이용한다.

최근에는 더욱 입체적인 음향 시스템을 구현하기 위해서, 오디오 채널의 개수를 5.1 채널 이상으로 증가시켜 오디오 신호를 생성하는 방법 및 장치가 개발되고 있다. 예를 들어, 12개의 스피커로 분리된 오디오 신호들 각각을 출력할 수 있는 10.2 채널의 오디오 시스템이 개발되었다.

AC-3 규격은 압축 가능한 오디오 채널의 개수가 최대 5+1=6 개로 제한된다. 따라서, AC-3는 5.1 채널에 따른 비트 스트림만을 생성 및 전송할 수 있으며, 오디오 채널의 개수가 6개를 초과할 경우에는 비트 스트림을 생성 및 전송할 수 없다.

또한, AC-3 규격을 개선시킨 인핸스드 AC-3(Enhanced AC-3) 규격은, 압축 가능한 오디오 채널이 최대 13.1 채널로 제한된다. 따라서, 13.1 채널 이상의 경우에는 인핸스드 AC-3(Enhanced AC-3) 규격에 따라서 비트 스트림을 생성 및 전송할 수 없다.

따라서, AC-3 또는 인핸스드 AC-3의 규격을 준수하면서 해당 스트림이 제공할 수 있는 기능을 확장하기 위한 방법 및 장치가 계발되고 있으며, 다양한 기능을 제공할 수 있는 신호 처리 방법 및 장치를 제공할 필요가 있다.

본원 발명은 AC-3 규격 또는 인핸스드 AC-3(Enhanced AC-3) 규격에 위배되지 않으면서 비트 스트림 내에 부가 정보를 삽입할 수 있는 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체의 제공을 목적으로 한다.

본원 발명은 비트 스트림 내에 부가 정보를 빠르고 용이하게 추출할 수 있는 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체의 제공을 목적으로 한다.

구체적으로, 본원 발명은 AC-3 규격 또는 인핸스드 AC-3(Enhanced AC-3) 규격에 위배되지 않으면서 부가 정보를 이용하여 오디오 신호의 입체감을 증가시킬 수 있는 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체의 제공을 목적으로 한다.

본 발명의 일 실시예에 따른 신호 처리 방법은, 동기 정보, 비트 스트림 정보, 적어도 하나의 오디오 블럭, 및 보조 데이터 필드를 포함하는 비트 스트림을 처리하는 방법이다. 상기 비트 스트림 정보에 포함되는 추가적인 비트 스트림 정보, 상기 오디오 블럭에 포함되는 스킵필드, 및 상기 보조 데이터 필드에 포함되는 보조 데이터 비트들 중 적어도 하나에 부가 정보가 포함된 비트 스트림을 전송받는 단계, 상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 포함되는, 상기 부가 정보의 추출과 관련된 정보인 제1 정보를 추출하는 단계, 및 상기 제1 정보를 이용하여 상기 부가 정보를 추출 및 디코딩하는 단계를 포함한다.

또한, 상기 부가 정보는 상기 비트 스트림에 포함된 채널들의 개수 이상으로 채널 개수를 확장하기 위한 멀티 채널의 복원 정보 및 오디오 신호의 3차원 정보 중 적어도 하나를 포함할 수 있다.

또한, 상기 제1 정보는 상기 부가 정보가 포함되어 있는지 여부를 나타내는 정보, 상기 부가 정보의 위치 정보, 및 상기 부가 정보의 길이 정보 중 적어도 하나를 포함할 수 있다.

또한, 상기 제1 정보를 추출하는 단계는 상기 동기 정보를 검출하는 단계, 검출된 상기 동기 정보를 기준으로 역방향으로 상기 비트 스트림을 독출하는 단계, 및 상기 보조 데이터 비트들에 포함되는 상기 제1 정보를 추출하는 단계를 포함할 수 있다.

또한, 상기 제1 정보를 추출하는 단계는 상기 동기 정보를 검출하는 단계, 검출된 상기 동기 정보를 기준으로 순방향으로 상기 비트 스트림을 독출하는 단계, 및 상기 추가적인 비트 스트림 정보에 포함되는 상기 제1 정보를 추출하는 단계를 포함할 수 있다.

또한, 상기 제1 정보를 추출하는 단계는 상기 부가 정보가 삽입된 지점을 나타내는 식별자를 상기 제1 정보로써 추출하는 단계를 더 포함할 수 있다.

또한, 상기 오디오 신호의 3차원 정보는 상기 비트 스트림에 포함된 채널들 각각에 대응되는 3차원 정보, 및 상기 확장된 채널 개수에 맞춰 3차원 정보를 생성하기 위한 3차원 정보의 복원 정보 중 적어도 하나를 포함할 수 있다.

또한, 상기 오디오 채널들 각각에 대응되는 3차원 정보는 비디오 데이터의 뎁스 맵, 하나의 상기 오디오 신호에 매핑되는 다수개의 뎁스 값들, 및 하나의 상기 오디오 신호에 매핑되는 다수개의 뎁스 값을 생성하기 위한 뎁스 값 복원 정보 중 적어도 하나를 포함할 수 있다.

또한, 본 발명의 일 실시예에 따른 신호 처리 방법은 엔코딩 장치에서, 상기 부가 정보를 생성하는 단계, 적어도 하나의 상기 오디오 신호를 소정 규격에 맞춰 엔코딩하는 단계, 엔코딩된 상기 오디오 신호를 상기 비트 스트림으로 포맷팅하는 단계, 상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 상기 부가 정보를 삽입하는 단계, 및 상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 상기 제1 정보를 삽입하는 단계를 더 포함할 수 있다.

또한, 본 발명의 일 실시예에 따른 신호 처리 방법은 상기 부가 정보 및 상기 제1 정보가 삽입된 상기 비트 스트림을 디코딩 장치로 전송하는 단계를 더 포함할 수 있다.

본 발명의 일 실시예에 따른 정보 저장 매체는 적어도 하나의 오디오 신호를 포함하는 비트 스트림을 저장하는 정보 저장 매체이다. 상기 비트 스트림은 동기 정보, 추가적인 비트 스트림 정보를 포함하는 비트 스트림 정보, 스킵필드를 포함하는 적어도 하나의 오디오 블럭, 및 보조 데이터 비트들을 포함하는 보조 데이터 필드를 포함한다. 그리고, 상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나는 채널 개수 확장 및 상기 오디오 신호의 3차원적 재생 중 적어도 하나를 수행하기 위한 부가 정보를 포함한다. 그리고, 상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나는 상기 부가 정보의 추출과 관련된 정보인 제1 정보를 포함한다.

본 발명의 일 실시예에 따른 엔코딩 장치는 적어도 하나의 오디오 신호를 소정 규격에 맞춰 엔코딩하는 엔코더, 및 엔코딩된 상기 오디오 신호를 동기 정보, 비트 스트림 정보, 적어도 하나의 오디오 블럭, 및 보조 데이터 필드를 포함하는 비트 스트림으로 포맷팅하는 포맷터, 및 상기 비트 스트림 정보에 포함되는 추가적인 비트 스트림 정보, 상기 오디오 블럭에 포함되는 스킵필드, 및 상기 보조 데이터 필드에 포함되는 보조 데이터 비트들 중 적어도 하나에 부가 정보가 삽입되도록 제어하며, 상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 상기 부가 정보의 추출과 관련된 정보인 제1 정보가 삽입되도록 제어하는 제어부를 포함한다.

본 발명의 일 실시예에 따른 디코딩 장치는 동기 정보, 비트 스트림 정보, 적어도 하나의 오디오 블럭, 및 보조 데이터 필드를 포함하는 비트 스트림을 디포맷팅하는 디포맷터, 상기 비트 스트림 정보에 포함되는 추가적인 비트 스트림 정보, 상기 오디오 블럭에 포함되는 스킵필드, 및 상기 보조 데이터 필드에 포함되는 보조 데이터 비트들 중 적어도 하나에 포함되는 부가 정보의 추출과 관련된 정보인 제1 정보를 추출하고, 추출된 상기 제1 정보를 이용하여 상기 추가적인 비트 스트림 정보, 상기 스킵필드, 및 상기 보조 데이터 비트들 중 적어도 하나에서 상기 부가 정보를 추출하는 제어부, 및 추출된 상기 부가 정보를 디코딩하는 디코더를 포함한다.

도 1은 본 발명의 일 실시예에 따른 엔코딩 장치를 나타내는 블럭 다이어그램이다.
도 2는 본 발명의 일 실시예에 따른 신호 처리 방법을 나타내는 도면이다.
도 3은 채널 개수 확장을 위한 부가 정보를 설명하기 위한 일 도면이다.
도 4는 5.1 채널에 따른 오디오 신호들을 설명하기 위한 도면이다.
도 5는 오디오 신호의 3차원적 재생을 위한 부가 정보를 설명하기 위한 다른 도면이다.
도 6은 오디오 신호의 3차원적 재생을 위한 부가 정보를 설명하기 위한 다른 도면이다.
도 7은 본 발명에서 이용되는 비트 스트림을 나타내는 도면이다.
도 8은 AC-3 규격 및 인핸스드 AC-3(Enhanced AC-3) 규격에 따른 비트 스트림을 나타내는 도면이다.
도 9는 본 발명의 일 실시예에 따른 정보 저장 매체에 저장되는 비트 스트림을 나타내는 도면이다.
도 10은 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블럭 다이어그램이다.
도 11은 본 발명의 다른 실시예에 따른 신호 처리 방법을 나타내는 도면이다.
도 12는 도 11의 1120 및 1130 단계의 동작을 설명하기 위한 일 도면이다.
도 13은 도 11의 1120 및 1130 단계의 동작을 설명하기 위한 다른 도면이다.
도 14는 도 12는 도 11의 1120 및 1130 단계의 동작을 설명하기 위한 다른 도면이다.

본원에서는 AC-3 규격 또는 인핸스드 AC-3 규격에 따른 비트 스트림이 제공하는 기능을 확장하기 위하여, 부가 정보를 이용한다. 구체적으로, 부가 정보는 AC-3 규격에 따른 비트 스트림이 5.1 채널 이상으로 채널의 개수를 확장시킬 수 있도록 한다. 또한, 부가 정보는 AC-3 규격에 따른 비트 스트림에 포함된 채널들 각각에 대응되는 오디오 신호가 2개 이상의 뎁스(depth) 값을 가지며 재생될 수 있도록 한다.

이하에서는, AC-3 규격 또는 인핸스드 AC-3(Enhanced AC-3) 규격을 준수하면서, 부가 정보를 삽입 또는 추출할 수 본 발명에 따른 신호 처리 방법, 그에 따른 엔코딩 장치, 디코딩 장치, 및 정보 저장 매체를 첨부된 도면을 참조하여 상세히 설명한다.

도 1은 본 발명의 일 실시예에 따른 엔코딩 장치를 나타내는 블럭 다이어그램이다.

도 1을 참조하면, 엔코딩 장치(100)는 적어도 하나의 채널에 대응되는 적어도 하나의 오디오 신호를 입력받고, 입력된 오디오 신호를 소정 규격에 따라 압축하여 비트 스트림을 생성 및 출력한다. 여기서, 소정 규격은 AC-3 또는 인핸스드 AC-3(Enhanced AC-3) 규격 등과 같이 오디오 신호를 처리하는 규격이 될 수 있다. 이하에서는, AC-3 규격에 따라 동작하는 엔코딩 장치(100)를 예로 들어 설명한다.

구체적으로, 엔코딩 장치(100)는 AC-3 엔코딩을 수행하여, 엔코딩 된 비트 스트림을 디코딩 장치(미도시)로 전송한다.

엔코딩 장치(100)는 엔코더(encoder)(120), 포맷터(formatter)(125) 및 제1 제어부(130)를 포함한다. AC-3 규격을 따르는 엔코딩 장치(110)는 5.1 채널로 제한된 채널 개수를 갖는 비트 스트림을 출력한다.

엔코더(120)는 적어도 하나의 채널에 대응되는 적어도 하나의 오디오 신호를 입력받고, 제1 제어부(230)의 제어에 따라서 입력된 오디오 신호를 소정 규격에 맞춰 엔코딩한다.

예를 들어, 엔코더(120)로 입력되는 신호는 10.2 채널에 대응되는 오디오 신호들일 수 있다. 엔코더(120)는 AC-3 규격에 따라서 입력된 10+2=12개의 오디오 신호들을 최대 5.1 채널의 오디오 신호들로 압축한다. 즉, 엔코더(120)는 입력받은 10.2 채널의 오디오 신호들을 다운 믹싱(down-mixing)하여 5.1 채널을 포함하는 오디오 신호들을 생성 및 출력한다.

포맷터(225)는 제1 제어부(230)의 제어에 따라서, 엔코딩된 오디오 신호를 비트 스트림 정보(BSI: bit stream information), 적어도 하나의 오디오 블럭(AB: Audio Block), 및 보조 데이터(AUX: Auxiliary data field)를 포함하는 비트 스트림으로 포맷팅(formatting)하여 출력한다. 비트 스트림은 이하에서 도 7 내지 도 9를 참조하여 상세히 설명한다.

제1 제어부(230)는 비트 스트림 정보(BSI)에 포함되는 추가적인 비트 스트림 정보(addbsi: additional bit stream information), 오디오 블럭(AB)에 포함되는 스킵필드(skipfld: skip filed), 및 보조 데이터(AUX)에 포함되는 보조 데이터 비트들(Auxbits: Auxiliary data bits) 중 적어도 하나에 부가 정보(additional information)가 삽입되도록 제어한다.

여기서, 부가 정보는 소정 규격에 따른 비트 스트림이 제공하는 기능을 확장하기 위한 데이터이다. 구체적으로, 부가 정보는 비트 스트림에 포함된 오디오 채널들의 개수 이상으로 채널 개수를 확장하기 위한 멀티 채널의 복원 정보 및 오디오 신호의 3차원 정보 중 적어도 하나를 포함할 수 있다.

예를 들어, AC-3 규격에 따른 비트 스트림은 5.1 채널까지만 지원할 수 있으므로, 부가 정보는 채널 개수를 7 개 이상으로 확장하기 위해서 필요한 복원 정보 등이 될 수 있다. 채널 확장을 위한 복원 정보는 이하에서 도 3을 참조하여 상세히 설명한다. 또한, 부가 정보는 적어도 하나의 채널들 각각에 대응되는 적어도 하나의 오디오 신호 각각을 3차원적으로 재생하기 위한 음원 별 뎁스(depth) 정보를 포함할 수 있다. 여기서 음원이란 소리를 낼 수 있는 주체로, 예로 들어 각각의 악기들, 음성을 내는 사람 등이 될 수 있다. 부가 정보는 이하에서 도 3 내지 도 6을 참조하여 상세히 설명한다.

또한, 제1 제어부(130)는 추가적인 비트 스트림 정보(addbsi), 스킵필드(skipfld) 및 보조 데이터 비트들(Auxbits) 중 적어도 하나에 부가 정보의 추출과 관련된 정보인 제1 정보가 삽입되도록 제어한다.

구체적으로, 제1 정보는 부가 정보가 포함되어 있는지 여부를 나타내는 정보, 부가 정보의 위치 정보, 및 부가 정보의 길이 정보 중 적어도 하나를 포함할 수 있다. 예를 들어, 부가 정보의 위치 정보는 부가 정보가 삽입된 영역의 시작 주소 또는 부가 정보가 삽입된 영역의 종료 주소 중 적어도 하나를 포함할 수 있다. 예를 들어, 디코딩 장치(미도시)가 부가 정보의 시작 주소 및 부가 정보의 길이 정보를 알면, 부가 정보를 용이하게 추출할 수 있다.

또한, 제1 정보는 부가 정보의 종류를 나타내는 정보를 더 포함할 수 있다. 예를 들어, 제1 정보는 확장 채널과 관련된 부가 정보면 플래그 00을 포함하고, 3차원 정보와 관련된 부가 정보면 플래그 01을 포함하고, 확장 채널 및 3차원 정보와 관련된 부가 정보면 플래그 11을 포함할 수 있다. 여기서, 확장 채널이란 소정 규격이 허용하는 채널의 개수 이상의 채널들을 뜻한다.

또한, 제1 제어부(130)는 엔코딩 장치(110)가 오디오 신호를 엔코딩 및 포맷팅하여 비트 스트림으로 출력할 수 있도록, 엔코더(120) 및 포맷터(125)의 동작을 전반적으로 제어한다.

또한, 제1 제어부(130)는 포맷터(125)에서 생성된 비트 스트림이 디코딩 장치(미도시)로 전송되도록 제어할 수 있다.

디코딩 장치(100)의 상세 동작은 본 발명의 일 실시예에 따른 신호 처리 방법과 동일하므로, 이하에서 도 2 내지 도 9를 참조하여 상세히 설명한다.

도 2는 본 발명의 일 실시예에 따른 신호 처리 방법을 나타내는 도면이다. 도 2의 각 단계 동작들은 도 1에서 설명한 엔코딩 장치(100)에서 수행될 수 있다.

도 2를 참조하면, 본 발명의 일 실시예에 따른 신호 처리 방법(200)은 부가 정보를 추출 또는 생성한다(210 단계). 210 단계는 엔코딩 장치(100)의 제1 제어부(130) 또는 엔코더(120)에서 수행될 수 있다. 여기서, 부가 정보는 외부에서 엔코딩 장치(100)로 직접 입력될 수 있으며, 그에 따라 제1 제어부(130)가 입력된 부가 정보를 추출할 수 있다. 또한, 부가 정보는 사용자 등의 요청에 의해서 또는 엔코딩 장치(100) 자체적으로 생성할 수 있다.

전술한 바와 같이, 부가 정보는 멀티 채널의 복원 정보 및 오디오 신호의 3차원 정보 중 적어도 하나를 포함할 수 있다. 멀티 채널의 복원 정보를 포함하는 복원 정보는 이하에서 도 3을 참조하여 설명하고, 오디오 신호의 3차원 정보를 포함하는 복원 정보는 이하에서 도 4 내지 도 6을 참조하여 설명한다.

도 3은 채널 개수 확장을 위한 부가 정보를 설명하기 위한 일 도면이다. 도 3의 (a)는 다운 믹싱 동작을 수행하는 엔코더를 나타내는 도면이다. 도 3의 (b)는 다운 믹싱을 위한 다운 믹싱 메트릭스를 설명하기 위한 도면이다.

도 3의 (a)를 참조하면, 소정 규격에서 허용하는 채널의 최대 개수가 N 개일 경우, 엔코더(320)는 입력된 총 M 개의 오디오 신호들을 N 개의 오디오 신호로 다운 믹싱한다. 여기서, N<M 이 된다. 따라서, N 개를 초과하는 (N+1) 채널부터 M 채널에 대응되는 오디오 신호들은 엔코딩 장치(100)에서 출력되는 비트 스트림에 포함될 수 없다.

도 3의 (b)를 참조하면, 엔코더(320)는 디운 믹싱 시, 소정 변환 식 또는 변환 메트릭스를 입력된 오디오 신호들(360)에 적용하여, 엔코딩된 오디오 신호들(370)을 출력한다. 도 3의 (b)에서는 전술한 소정 변환 식 또는 변환 메트릭스로 다운 믹싱 메트릭스(down-mixing matrix)(350)가 이용된 경우를 예로 들어 도시하였다. 도 3의 예에서, 채널 개수 확장을 위한 부가 정보는 N 개 채널로 엔코딩된 오디오 신호들(370)을 M 개 채널의 오디오 신호들로 복원하기 위한 정보가 된다.

예를 들어, 디코딩 장치에서, N 개의 채널을 포함하는 비트스트림을 디코딩하여 M 개의 채널을 포함하는 오디오 신호들 생성하려면, 역 다운 믹싱 메트릭스(inverse down-mixing matrix)를 엔코딩된 오디오 신호들(370)에 적용시켜야 한다. 비트 스트림을 M 개의 채널에 대응되는 오디오 신호들로 복원, 즉, 업 믹싱(up-mixing),하기 위해서는 역 다운 믹싱 메트릭스에 관한 정보가 필요하다.

따라서, 채널 개수 확장을 위한 부가 정보는 다운 믹싱된 오디오 신호를 업 믹싱 할 때 사용되는 파라미터 정보(parameter information)를 포함할 수 있다. 상기 파라미터 정보는 입력 신호와 출력 신호 간의 신호 레벨(level) 상관 관계를 나타내는 파라미터, 입력 신호와 출력 신호 간의 위상(phase) 상관 관계를 나타내는 파라미터, 및 입력 신호와 출력 신호 간의 연관도(correlation) 정보 중 적어도 하나를 포함할 수 있다.

구체적으로, 파라미터 정보는 다운 믹싱 메트릭스(350) 자체, 다운 믹싱 메트릭스 내에 포함되는 각 파라미터 값들, 또는 역 다운 믹싱 메트릭스 등이 될 수 있다. 구체적인 파라미터 정보는 엔코딩 장치의 제품 사양, 다운 믹싱 방법 등에 따라서 달라질 수 있으므로, 상세 설명은 생략한다.

또한, 채널 개수 확장을 위한 부가 정보는 확장된 오디오 채널들에 관한 정보(channel information), 소정 규격에서 정의하는 채널 개수에 맞춰 입력된 오디오 신호를 다운 믹싱하는 방법(down mixing method) 등이 더 포함될 수 있다.

도 4는 5.1 채널에 따른 오디오 신호들을 설명하기 위한 도면이다.

AC-3 규격은 최대 5.1 채널을 포함하는 비트 스트림을 정의한다. 도 4는 5.1 채널에 대응되는 오디오 신호들은 6개의 스피커를 통해서 소정 뎁스를 가지며 출력될 수 있다. 도 4는 하나의 뎁스만을 갖는 오디오 신호인 2차원 오디오 신호를 도시하였다. 5.1 채널에 따른 오디오 신호들은 도 4에서 도시된 바와 같이 배치되어 출력될 수 있다. 또는, 도 4와 다른 형태로 배치되어 오디오 신호들이 출력될 수 있다.

도 4를 참조하면, 오디오 신호들(L, R, C, SL, SR)은 각각 전방 레이어의 좌우(Left, Right), 전방 레이어의 중앙(Center), 및 후방 레이어의 좌우(Left Surround, Right Surround)에 설치한 5개의 스피커를 통해 출력된다. 그리고, 및 중저음대역 오디오 신호(미도시)는 중저음대역 전용(low frequency effect)의 서브 우퍼 스피커를 통하여 출력된다. 5.1 채널에 대응되는 오디오 신호들은 스윗 스팟(sweet spot)(410)으로부터 등 거리에서 출력되게 된다.

AC-3 규격은 동일 뎁스를 갖는 오디오 신호들을 생성할 뿐, 서로 다른 뎁스를 갖는 오디오 신호들을 지원하지 않는다. 따라서, 본원에서는 부가 정보가 오디오 신호의 3차원 정보를 포함하도록 하여, 오디오 신호들이 3차원적으로 재생될 수 있도록 할 수 있다.

도 5는 오디오 신호의 3차원적 재생을 위한 부가 정보를 설명하기 위한 다른 도면이다.

도 5를 참조하면, 오디오 신호의 3차원적 재생을 위하여, 오디오 신호들(L, R, C, SL, SR) 각각은 다수개의 뎁스 값들(510, 520, 530, 540, 550)을 가지며 출력될 수 있다. 부가 정보는 오디오 신호의 3차원 정보를 포함할 수 있다. 구체적으로, 하나의 채널에 대응되는 오디오 신호(예를 들어, 중앙 채널의 오디오 신호인 'C')에 매핑되는 다수개의 뎁스 값들(예를 들어, 510의 C2, C, C1)을 생성하기 위한 정보(이하 '오디오 신호의 3차원 정보')가 부가 정보에 포함된다.

오디오 신호의 3차원 정보를 이용해 일 오디오 신호에 다수개의 뎁스 값들을 적용하고, 상기 오디오 신호를 재생하면, 사용자는 음원이 근거리 또는 원거리에 있는 것과 같은 입체 음향 효과를 느낄 수 있다.

도 6은 오디오 신호의 3차원적 재생을 위한 부가 정보를 설명하기 위한 다른 도면이다.

구체적으로, AC-3 규격은 오디오 신호에 다수개의 뎁스 값을 부여하지 않는다. 따라서, 엔코더(620)는 일 채널을 통하여 다수개의 뎁스 값(L1, L2..Ln)(621)이 부여된 오디오 신호가 입력되더라도, 단일 뎁스(L)(623)를 갖는 오디오 신호만을 출력한다. 이때, 엔코딩 장치(100)는 다수개의 뎁스 값(621)에서 하나의 뎁스 값(623)을 생성하기 위하여 적용하는 변환식 또는 메트릭스, 또는 파라미터 값들을 부가 정보로써 추출한다.

구체적으로, 오디오 신호의 3차원 정보는 비트 스트림에 포함된 오디오 채널들 각각에 대응되는 3차원 정보(이하, '제1 오디오 신호의 3차원 정보'), 및 확장된 채널 개수에 맞춰 3차원 정보를 생성하기 위한 3차원 정보의 복원 정보(이하, '제2 오디오 신호의 3차원 정보') 중 적어도 하나를 포함한다.

여기서, 제1 오디오 신호의 3차원 정보는, 입력된 오디오 신호들의 채널 개수가 소정 규격에서 허용하는 채널 개수 이하인 경우, 오디오 신호를 3차원 적으로 재생하기 위해 필요한 정보이다. 구체적으로, 제1 오디오 신호의 3차원 정보는 비디오 데이터의 뎁스 맵(depth map), 하나의 오디오 신호에 매핑되는 다수개의 뎁스 값들, 및 하나의 오디오 신호에 매핑되는 다수개의 뎁스 값을 생성하기 위한 뎁스 값 복원 정보 중 적어도 하나를 포함한다.

비디오 데이터의 뎁스 맵은 영상에 대응되는 뎁스 값들을 포함하는 정보이다. 오디오 신호의 3차원 정보가 직접적으로 제공되지 않는 경우, 비디오 데이터의 뎁스 맵에 근거하여 오디오 신호의 뎁스 값들을 계산할 수 있다.

또한, 제2 오디오 신호의 3차원 정보는, 입력된 오디오 신호들의 채널 개수가 소정 규격에서 허용하는 채널 개수를 초과하는 경우, 확장된 채널 개수를 갖는 오디오 신호들을 3차원적으로 재생하기 위해서 필요한 정보이다. 즉, 단일 뎁스 값을 갖는 N 개의 채널들에 대응되는 오디오 신호들을 다수개의 뎁스 값을 갖는 M 개의 채널들로 복원하기 하는 경우, M 개의 채널들 각각에 매핑되는 다수개의 뎁스 값들을 생성하기 위한 정보가 된다.

적어도 하나의 오디오 신호를 소정 규격에 맞춰 엔코딩(encoding) 한다(220 단계). 구체적으로, 입력된 오디오 신호들에 대응되는 채널 개수가 소정 규격에서 허용하는 채널 개수보다 많을 경우, 입력된 오디오 신호들을 다운 믹싱(down-mixing) 한다.

예를 들어, AC-3 규격에 따른 엔코딩 장치(100)의 경우, 입력된 오디오 신호들을 5.1 채널에 맞춰 엔코딩한다. 구체적으로, 입력된 오디오 신호가 10.2 채널의 오디오 신호들인 경우, 입력된 오디오 신호는 5.1 채널로 다운 믹싱된다. 이 경우, 부가 정보는 5.1 채널을 10.2 채널로 확장하기 위한 복원 정보를 포함할 수 있다. 220 단계는 제1 제어부(130)의 제어에 따라서, 엔코더(120)에서 수행될 수 있다.

220 단계에서 생성되는 엔코딩된 오디오 신호를 동기 정보(SI: Synchronization Information), 비트 스트림 정보, 적어도 하나의 오디오 블럭, 및 보조 데이터를 포함하는 비트 스트림으로 포맷팅한다(230 단계). 230 단계는 제1 제어부(130)의 제어에 따라서 포맷터(125)에서 수행될 수 있다. 230 단계에서 생성되는 비트 스트림은 이하에서 도 7 내지 도 8을 참조하여 상세히 설명한다.

도 7은 본 발명에서 이용되는 비트 스트림을 나타내는 도면이다.

도 7을 참조하면, 230 단계에서 생성되는 비트 스트림(700)은 연속되는 다수개의 프레임(710)을 포함한다. 하나의 프레임(710)은 동기 정보(SI: Synchronization Information)(401), 비트 스트림 정보(BSI: bit stream information)(702), 오디오 블럭 영역(703) 및 보조 데이터 필드 (AUX: Auxiliary data field)(704)를 포함한다. 여기서, 오디오 블럭 영역(703)은 적어도 하나의 오디오 블럭(AB: Audio Block)(미도시)을 포함한다. 그리고, 프레임(710)은 주기적인 여분 체크(CRC: Cyclic Redundancy Check)(405) 또는 에러 감지 코드(Error detection code)(미도시)를 더 포함할 수 있다.

동기 정보(701)는 프레임의 시작을 알리기 위한 것이며, 고정된 비트 수를 갖는다. 비트 스트림 정보(702)는 실질적인 오디오 신호를 재생하기 위해 필요한 정보 또는 오디오 신호를 디코딩하기 위해 필요한 정보를 포함한다. 오디오 블럭 영역(703)은 실질적인 오디오 신호가 실려 있는 영역이다.

보조 데이터(704)는 하나의 프레임(710)에서 실질적인 오디오 신호 이외의 데이터를 포함할 수 있다. 또한, 버퍼 컨트롤(buffer control)을 수행하기 위해 존재할 수 있다.

도 8은 AC-3 규격 및 인핸스드 AC-3(Enhanced AC-3) 규격에 따른 비트 스트림을 나타내는 도면이다.

도 8의 (a)는 AC-3 규격에 따른 비트 스트림을 나타내는 도면이다. 도 8의 (a) 에 있어서, 프레임(810), 동기 정보(SI)(811), 비트 스트림 정보(BSI)(812), 오디오 블럭 영역(813), 보조 데이터 필드(AUX)(814), 및 주기적인 여분 체크(CRC)(815)는 각각 도 7의 프레임(710), 동기 정보(SI)(701), 비트 스트림 정보(BSI)(702), 오디오 블럭 영역(703), 보조 데이터 필드(AUX)(704), 및 주기적인 여분 체크(CRC)(705)와 동일 대응되므로, 도 7에서와 중복되는 설명은 생략한다.

도 8의 (a)에 있어서, AC-3 규격에 따르면, 오디오 블럭 영역(813)은 6개의 오디오 블럭들(AB0, AB1, AB2, AB3, AB4, AB5)을 포함한다. 각각의 오디오 블럭들은 가변되는 크기를 가지며, 실질적인 오디오 신호들을 포함한다.

구체적으로, AC-3 규격에 따라서 최대 5.1 채널을 갖는 실질적인 오디오 신호가 오디오 블럭들(AB0, AB1, AB2, AB3, AB4, AB5)에 실려서 디코딩 장치로 전송된다.

AC-3 규격에 있어서, 동기 정보(SI), 비트 스트림 정보(BSI), 첫 번째 및 두 번째 오디오 블럭들(AB0, AB1)이 차지하는 정보 크기는 전체 프레임(810)의 5/8을 초과하면 안 된다. 또한, 마지막 오디오 블럭(AB5)의 멘티사(mantissa) 영역과 보조 데이터 필드(AUX)가 차지하는 정보 크기는 전체 프레임(810)의 5/8을 초과하면 안 된다.

도 8의 (b)는 인핸스드 AC-3(Enhanced AC-3) 규격에 따른 비트 스트림을 나타내는 도면이다. 도 8의 (b) 에 있어서, 프레임(860), 동기 정보(SI)(861), 비트 스트림 정보(BSI)(862), 오디오 블럭 영역(863), 보조 데이터 필드(AUX)(864), 및 주기적인 여분 체크(CRC)(865)는 각각 도 7의 프레임(710), 동기 정보(SI)(701), 비트 스트림 정보(BSI)(702), 오디오 블럭 영역(703), 보조 데이터 필드(AUX)(704), 및 주기적인 여분 체크(CRC)(705)와 동일 대응되므로, 도 7에서와 중복되는 설명은 생략한다.

도 8의 (b)에 있어서, 인핸스드 AC-3(Enhanced AC-3) 규격에 따르면, 오디오 블럭 영역(863)은 오디오 프레임(AudFrm: Audio Frame) 및 n 개의 오디오 블럭들을 포함한다. 인핸스드 AC-3(Enhanced AC-3) 규격에 따르면, n은 1, 2, 3 또는 6의 값을 가질 수 있다. 도 8의 (b)에서는 n=6인 경우를 예로 들어 도시하였다. 오디오 블럭들(AB0 내지 AB5)은 가변되는 크기를 가지며, 실질적인 오디오 신호들이 포함된다.

구체적으로, 인핸스드 AC-3(Enhanced AC-3) 규격에 따라서 최대 13.1 채널을 갖는 실질적인 오디오 신호가 오디오 블럭들(AB0 내지 AB5)에 실려서 디코딩 장치로 전송된다.

도 9는 본 발명의 일 실시예에 따른 정보 저장 매체에 저장되는 비트 스트림을 나타내는 도면이다.

도 9에 도시된 비트 스트림(900)은 AC-3 규격에 따른 비트 스트림을 예로 들어 도시하였다. 도 9의 비트 스트림(900)은 도 8의 (a)에서 도시한 비트 스트림과 동일 대응된다. 이하에서는 도 9를 참조하여, 240 및 250단계의 동작을 설명한다.

비트 스트림 정보(BSI)(912) 내에 포함되는 추가적인 비트 스트림 정보(addbsi)(910), 오디오 블럭(AB0, AB1, AB2, AB3, AB4, 및/또는 AB5)에 포함되는 스킵필드(skipfld)(920, 930, 940, 950, 960, 970) 및 보조 데이터 필드(AUX)에 포함되는 보조 데이터 비트들(Auxbits)(980) 중 적어도 하나에, 210 단계에서 추출된 부가 정보를 삽입한다(240 단계).

또한, 오디오 블럭(AB0, AB1, AB2, AB3, AB4, 및/또는 AB5)에 부가 정보를 삽입하는 경우, 오디오 블럭들 각각에 대응되는 적어도 하나의 스킵필드에 부가 정보를 삽입할 수 있다.

비트 스트림 정보(BSI)의 추가적인 비트 스트림 정보(addbsi)(910)에 포함시킬 수 있는 부가 정보의 양은 최대 64byte이며, 44.1kHz의 동작 주파수에서 14.7kbps(kilo bit per sec.)로 비트 스트림을 처리할 수 있다.

또한, 오디오 블럭(AB0, AB1, AB2, AB3, AB4, 및/또는 AB5)에 포함되는 스킵필드(skipfld)(920, 930, 940, 950, 960, 970)에 포함시킬 수 있는 부가 정보의 양은 하나의 오디오 블럭에 해당하는 스킵 필드 당 512byte 이며, 44.1kHz의 동작 주파수에서 117.6kbps(kilo bit per sec.)로 기록 및 독출할 수 있다.

추가적인 비트 스트림 정보(addbsi)(910), 스킵필드(skipfld)(920, 930, 940, 950, 960, 970) 및 보조 데이터 비트들(Auxbits)(980) 중 적어도 하나에 전술한 제1 정보를 삽입한다(250 단계). 250 단계의 동작은 이하에서 도 12 내지 도 14를 참조하여 상세히 설명한다.

전술한 240 및 250 단계의 동작은 제1 제어부(130)의 제어에 따라서 수행될 수 있다.

또한, 신호 처리 방법(200)은 부가 정보 및 제1 정보가 삽입된 비트 스트림(900)을 디코딩 장치로 전송하는 단계(260 단계)를 더 포함할 수 있다.

도 10은 본 발명의 일 실시예에 따른 디코딩 장치를 나타내는 블럭 다이어그램이다.

도 10을 참조하면, 디코딩 장치(1000)는 도 1의 엔코딩 장치(100)에서 생성되어 전송되는 비트 스트림(900)을 수신하고, 이를 원래의 오디오 신호로 복원하여 출력한다. 즉, 디코딩 장치(1000)는 AC-3 디코딩을 수행하여, 복원된 오디오 신호를 생성한다.

또한, 본 발명의 일 실시예에 따른 디코딩 장치(1000)의 동작은 이하에서 도 11 내지 도 14를 참조하여 설명할 본 발명의 다른 실시예에 따른 신호 처리 방법의 각 단계 동작들과 동일하다. 따라서, 이하에서는 도 10 내지 도 14를 참조하여, 본 발명에 따른 디코딩 장치(1000) 및 신호 처리 방법(1100)을 설명한다.

도 10을 참조하면, 디코딩 장치(1050)는 디코더(decoder)(1060), 디포맷터(Deformatter)(1065) 및 제2 제어부(1070)를 포함할 수 있다.

도 11은 본 발명의 다른 실시예에 따른 신호 처리 방법을 나타내는 도면이다. 도 11의 신호 처리 방법에서 처리하는 부가 정보 및 제1 정보를 포함하는 비트 스트림은 도 1 내지 도 9에서 상술한 비트 스트림과 동일 대응되므로, 도 1 내지 도 9와 중복되는 설명은 생략한다.

디포맷터(1065)는 엔코딩 장치(100)로부터 동기 정보, 비트 스트림 정보, 오디오 블럭, 및 보조 데이터를 포함하는 비트 스트림을 수신한다(1110 단계). 그리고, 디포맷터(1065)는 수신된 비트 스트림을 디포맷팅(deformatting)한다. 구체적으로, 디포맷터(1065)는 수신된 비트 스트림이 포맷터(125)를 통과하기 이전의 형태를 갖도록, 수신된 비트 스트림의 형태를 변환한다.

제2 제어부(1070)는 추가적인 비트 스트림 정보(addbsi), 스킵필드(skipfld) 및 상기 보조 데이터 비트들(Auxbits) 중 적어도 하나에 포함되는, 제1 정보를 추출한다(1120 단계). 여기서, 제1 정보는 부가 정보의 추출과 관련된 정보이다.

제2 제어부(1070)는 1120 단계에서 추출된 제1 정보를 이용하여, 비트 스트림 정보에 포함되는 추가적인 비트 스트림 정보, 오디오 블럭에 포함되는 스킵필드, 및 보조 데이터에 포함되는 보조 데이터 비트들 중 적어도 하나에서, 전술한 부가 정보를 추출하여 디코딩한다(1130 단계).

구체적으로, 디코더(1060)는 디포맷팅 된 비트 스트림을 소정 규격에 따라서 디코딩한다. 구체적으로, 제2 제어부(1070)는 추출된 부가 정보에 근거하여 확장 채널이 존재하는지 여부를 판단할 수 있다. 그리고, 상기 판단 결과 확장 채널이 존재하면, 디포맷터(1065)에서 디포맷팅된 비트 스트림이 확장된 채널 개수에 맞춰 디코딩되도록 제어한다. 또한, 추출된 부가 정보를 이용하여 비트 스트림을 디코딩시킨다.

여기서, 확장 채널이 존재하는지 여부는 부가 정보에 멀티 채널의 복원 정보가 포함되어 있는지 여부를 확인함으로써 판단할 수 있다.

예를 들어, 디코딩 장치(1000)로 입력된 비트 스트림이 AC-3 규격에 따라서 5.1 채널을 포함할 경우, 부가 정보는 5.1 채널의 비트 스트림을 10.2 채널의 오디오 신호들로 확장하기 위한 멀티 채널 복원 정보를 포함할 수 있다. 이 경우, 제2 제어부(1070)는 멀티 채널 복원 정보를 포함하는 부가 정보를 추출하고, 멀티 채널 복원 정보를 이용하여 5.1 채널의 비트 스트림이 10.2 채널의 오디오 신호들로 출력되도록 디코더(1060)를 제어한다.

또한, 제2 제어부(1070)는 추출된 부가 정보에 오디오 신호의 3차원 정보가 포함된 경우, 오디오 신호의 3차원 정보를 이용하여 오디오 신호가 3차원적으로 재생될 수 있도록 디코더(1060)를 제어할 수 있다. 구체적으로, 디코더(1060)는 제어부의 제어에 따라서, 적어도 하나의 소정 뎁스(depth)를 갖는 오디오 신호가 출력되도록 비트 스트림을 디코딩한다.

또한, 추출된 부가 정보에 멀티 채널 복원 정보 및 3차원 정보가 모두 포함된 경우, 제2 제어부(1070)는 비트 스트림이 소정 규격에 따른 채널 개수 이상의 채널 개수를 갖도록 디코딩시키고, 디코딩된 오디오 신호들 각각이 소정 뎁스(depth)를 가지며 출력되도록 제어할 수 있다.

또한, 신호 처리 방법(1100)은 도 2에서 설명한 신호 처리 방법(200)에 후속하여 수행될 수 있다.

신호 처리 방법(1100)의 1120 및 1130 단계는 이하에서 도 12 내지 도 14를 참조하여 상세히 설명한다.

도 12는 도 11의 1120 및 1130 단계의 동작을 설명하기 위한 일 도면이다.

부가 정보의 추출과 관련된 정보인 제1 정보는 보조 데이터 필드(AUX)(1220)의 보조 데이터 비트들(Auxbits)에 포함될 수 있다.

제2 제어부(1070)는 동기 정보(SI)를 검출하여 동기 정보(SI)의 시작 지점(P1)부터 비트 스트림의 역방향(1210 방향)으로 비트 스트림의 독출을 시작한다. CRC가 차지하는 영역은 비교적 작으므로, 제2 제어부(1070)는 빠르게 보조 데이터 필드(AUX)(1220)의 보조 데이터 비트들(Auxbits)이 저장된 지점(P2)에 접근할 수 있다. 제2 제어부(1070)는 보조 데이터 비트들(Auxbits) 영역에 저장된 제1 정보를 독출한다.

제1 정보는 부가 정보가 포함되어 있는지 여부를 나타내는 정보, 부가 정보의 위치 정보, 및 부가 정보의 길이 정보 중 적어도 하나를 포함한다.

제1 정보가 부가 정보가 포함되어 있는지 여부를 나타내는 정보를 포함하면, 제2 제어부((1070)는 전체 비트 스트림을 독출 및 파싱하여 디코딩하지 않아도, 부가 정보가 포함되었는지 여부를 빠르게 확인할 수 있다.

또한, 제1 정보가 부가 정보의 위치 정보, 및 부가 정보의 길이 정보를 포함하는 경우, 제1 정보를 독출하면, 부가 정보가 기록된 영역에 직접 접근할 수 있다. 그에 따라서, 전체 비트 스트림을 독출하여 각 블럭별 파싱(parsing)하여 부가 정보를 찾을 필요가 없이, 부가 정보를 빠르고 쉽게 추출할 수 있다.

예를 들어, 제1 정보에 포함된 부가 정보의 위치 정보가 P3 지점을 가리키면, 제2 제어부(1070)는 P3 지점으로 이동하여, 부가 정보의 길이 정보를 이용하여 부가 정보를 추출할 수 있다. 또한, 제1 정보에 포함된 부가 정보의 위치 정보가 P4 및 P5 중 적어도 하나를 가리키면, 제2 제어부(1070)는 해당 지점으로 이동하여, 부가 정보의 길이 정보를 이용하여 부가 정보를 추출할 수 있다.

도 13은 도 11의 1120 및 1130 단계의 동작을 설명하기 위한 다른 도면이다.

부가 정보의 추출과 관련된 정보인 제1 정보는 비트 스트림 정보(BSI)(1320)의 추가적인 비트 스트림 정보(addbsi)(1330)에 포함될 수 있다.

제2 제어부(1070)는 동기 정보(SI)를 검출하여 동기 정보(SI)의 시작 지점(P11)부터 비트 스트림의 순방향(1310 방향)으로 비트 스트림의 독출을 시작한다. 동기 정보(SI)에 바로 인접한 영역에 비트 스트림 정보(BSI)(1320)가 배치되므로, 전체 비트스트림을 독출, 파싱 및 디코딩하지 않아도, 빠르게 추가적인 비트 스트림 정보(addbsi)(1330)가 저장된 지점(P12)에 접근하여 제1 정보를 추출할 수 있다. 그에 따라서, 추출된 제1 정보를 이용하여 부가 정보를 빠르고 쉽게 추출할 수 있다.

예를 들어, 제1 정보에 포함된 부가 정보의 위치 정보가 P13, P14, P15 중 적어도 하나를 가리키면, 제2 제어부(1070)는 해당 지점으로 이동하여, 부가 정보의 길이 정보를 이용하여 부가 정보를 추출할 수 있다.

도 14는 도 12는 도 11의 1120 및 1130 단계의 동작을 설명하기 위한 다른 도면이다.

제1 정보는 부가 정보가 삽입된 지점을 나타내는 식별자(ID:ID1, ID2, ID3, ID4, ID5, ID6, ID7, ID8) 일 수 있다. 바람직하게, 식별자는 부가 정보가 실질적으로 존재하는 영역에만 위치한다. 또한, 식별자는 부가 정보가 삽입된 영역의 시작 지점 및 종료 지점 중 적어도 하나의 지점에 삽입될 수 있다.

제2 제어부(1070)는 식별자만을 검출하여, 부가 정보의 시작 지점을 추출할 수 있다. 그에 따라서, 식별자가 존재하는 지점부터 비트 스트림을 독출함으로써, 부가 정보를 빠르게 추출할 수 있다. 예를 들어, 식별자는 추가적인 비트 스트림 영역(addbsi)(140), 첫 번째 오디오 블럭(AB0), 두 번째 오디오 블럭(AB1) 및 보조 데이터 비트틀(Auxbits)(1450)에만 존재하는 경우, 비트 스트림에는 4개의 식별자들(ID1, ID2, ID3, ID8)이 포함되게 된다.

전술한 바와 같이 본 발명의 일 실시예에 따른 신호 처리 방법, 엔코딩 장치, 디코딩 장치 및 정보 저장 매체는 부가 정보를 추출하기 위한 정보를 비트 스트림 내에 삽입하여 이용함으로써, 부가 정보를 빠르게 추출 및 디코딩할 수 있다. 또한, 부가 정보 내에 채널 확장을 위한 복원 정보 및 3차원 정보를 포함시킴으로써, 오디오 신호가 더욱 입체적으로 재생될 수 있도록 한다.

또한 본 방법 발명은 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드 또는 프로그램으로서 구현하는 것도 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 하드디스크, 플로피디스크, 플래쉬 메모리, 광 데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드로서 저장되고 실행될 수 있다.

이상의 설명은 본 발명의 일 실시예에 불과할 뿐, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진자는 본 발명의 본질적 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현할 수 있을 것이다. 따라서, 본 발명의 범위는 전술한 실시예에 한정되지 않고 특허 청구 범위에 기재된 내용과 동등한 범위내에 있는 다양한 실시 형태가 포함되도록 해석되어야 할 것이다.

100: 엔코딩 장치
1000: 디코딩 장치
120: 엔코더
125: 포맷터
130: 제1 제어부
1060: 디코더
1065: 디포맷터
1070: 제2 제어부
700, 900: 비트 스트림

Claims

동기 정보, 비트 스트림 정보, 적어도 하나의 오디오 블럭, 및 보조 데이터 필드를 포함하는 비트 스트림을 처리하는 방법에 있어서,
상기 비트 스트림 정보에 포함되는 추가적인 비트 스트림 정보, 상기 오디오 블럭에 포함되는 스킵필드, 및 상기 보조 데이터 필드에 포함되는 보조 데이터 비트들 중 적어도 하나에 부가 정보가 포함된 비트 스트림을 전송받는 단계;
상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 포함되는, 상기 부가 정보의 추출과 관련된 정보인 제1 정보를 추출하는 단계; 및
상기 제1 정보를 이용하여 상기 부가 정보를 추출 및 디코딩하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
제1항에 있어서, 상기 부가 정보는
상기 비트 스트림에 포함된 채널들의 개수 이상으로 채널 개수를 확장하기 위한 멀티 채널의 복원 정보 및 오디오 신호의 3차원 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 신호 처리 방법.
제1항에 있어서, 상기 제1 정보는
상기 부가 정보가 포함되어 있는지 여부를 나타내는 정보, 상기 부가 정보의 위치 정보, 및 상기 부가 정보의 길이 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 신호 처리 방법.
제3항에 있어서, 상기 제1 정보를 추출하는 단계는
상기 동기 정보를 검출하는 단계;
검출된 상기 동기 정보를 기준으로 역방향으로 상기 비트 스트림을 독출하는 단계; 및
상기 보조 데이터 비트들에 포함되는 상기 제1 정보를 추출하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
제3항에 있어서, 상기 제1 정보를 추출하는 단계는
상기 동기 정보를 검출하는 단계;
검출된 상기 동기 정보를 기준으로 순방향으로 상기 비트 스트림을 독출하는 단계; 및
상기 추가적인 비트 스트림 정보에 포함되는 상기 제1 정보를 추출하는 단계를 포함하는 것을 특징으로 하는 신호 처리 방법.
제1항에 있어서, 상기 제1 정보를 추출하는 단계는
상기 부가 정보가 삽입된 지점을 나타내는 식별자를 상기 제1 정보로써 추출하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
제2항에 있어서, 상기 오디오 신호의 3차원 정보는
상기 비트 스트림에 포함된 채널들 각각에 대응되는 3차원 정보, 및 상기 확장된 채널 개수에 맞춰 3차원 정보를 생성하기 위한 3차원 정보의 복원 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 신호 처리 방법.
제7항에 있어서, 상기 오디오 채널들 각각에 대응되는 3차원 정보는
비디오 데이터의 뎁스 맵, 하나의 상기 오디오 신호에 매핑되는 다수개의 뎁스 값들, 및 하나의 상기 오디오 신호에 매핑되는 다수개의 뎁스 값을 생성하기 위한 뎁스 값 복원 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 신호 처리 방법.
제8항에 있어서, 상기 제1 정보는
부가 정보의 종류를 나타내는 정보를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
제2항에 있어서,
엔코딩 장치에서, 상기 부가 정보를 생성하는 단계;
적어도 하나의 상기 오디오 신호를 소정 규격에 맞춰 엔코딩하는 단계;
엔코딩된 상기 오디오 신호를 상기 비트 스트림으로 포맷팅하는 단계;
상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 상기 부가 정보를 삽입하는 단계; 및
상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 상기 제1 정보를 삽입하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
제10항에 있어서,
상기 부가 정보 및 상기 제1 정보가 삽입된 상기 비트 스트림을 디코딩 장치로 전송하는 단계를 더 포함하는 것을 특징으로 하는 신호 처리 방법.
적어도 하나의 오디오 신호를 포함하는 비트 스트림을 저장하는 정보 저장 매체에 있어서, 상기 비트 스트림은
동기 정보;
추가적인 비트 스트림 정보를 포함하는 비트 스트림 정보;
스킵필드를 포함하는 적어도 하나의 오디오 블럭; 및
보조 데이터 비트들을 포함하는 보조 데이터 필드를 포함하며,
상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나는
채널 개수 확장 및 상기 오디오 신호의 3차원적 재생 중 적어도 하나를 수행하기 위한 부가 정보를 포함하며,
상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나는 상기 부가 정보의 추출과 관련된 정보인 제1 정보를 포함하는 것을 특징으로 하는 정보 저장 매체.
제12항에 있어서, 상기 부가 정보는
상기 비트 스트림에 포함된 채널들의 개수 이상으로 채널 개수를 확장하기 위한 멀티 채널의 복원 정보 및 오디오 신호의 3차원 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 정보 저장 매체.
제13항에 있어서, 상기 제1 정보는
상기 추가적인 비트 스트림 정보 및 상기 보조 데이터 비트들 중 적어도 하나에 포함되며,
상기 부가 정보가 포함되어 있는지 여부를 나타내는 정보, 상기 부가 정보의 위치 정보, 및 상기 부가 정보의 길이 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 정보 저장 매체.
제13항에 있어서, 상기 제1 정보는
상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 포함되며,
상기 부가 정보가 삽입된 지점을 나타내는 식별자인 것을 특징으로 하는 정보 저장 매체.
제13항에 있어서, 상기 오디오 신호의 3차원 정보는
상기 비트 스트림에 포함된 채널들 각각에 대응되는 3차원 정보, 및 상기 확장된 채널 개수에 맞춰 3차원 정보를 생성하기 위한 3차원 정보의 복원 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 정보 저장 매체.
적어도 하나의 오디오 신호를 소정 규격에 맞춰 엔코딩하는 엔코더; 및
엔코딩된 상기 오디오 신호를 동기 정보, 비트 스트림 정보, 적어도 하나의 오디오 블럭, 및 보조 데이터 필드를 포함하는 비트 스트림으로 포맷팅하는 포맷터; 및
상기 비트 스트림 정보에 포함되는 추가적인 비트 스트림 정보, 상기 오디오 블럭에 포함되는 스킵필드, 및 상기 보조 데이터 필드에 포함되는 보조 데이터 비트들 중 적어도 하나에 부가 정보가 삽입되도록 제어하며, 상기 추가적인 비트 스트림 정보, 상기 스킵필드 및 상기 보조 데이터 비트들 중 적어도 하나에 상기 부가 정보의 추출과 관련된 정보인 제1 정보가 삽입되도록 제어하는 제어부를 포함하는 것을 특징으로 하는 엔코딩 장치.
동기 정보, 비트 스트림 정보, 적어도 하나의 오디오 블럭, 및 보조 데이터 필드를 포함하는 비트 스트림을 디포맷팅하는 디포맷터;
상기 비트 스트림 정보에 포함되는 추가적인 비트 스트림 정보, 상기 오디오 블럭에 포함되는 스킵필드, 및 상기 보조 데이터 필드에 포함되는 보조 데이터 비트들 중 적어도 하나에 포함되는 부가 정보의 추출과 관련된 정보인 제1 정보를 추출하고, 추출된 상기 제1 정보를 이용하여 상기 추가적인 비트 스트림 정보, 상기 스킵필드, 및 상기 보조 데이터 비트들 중 적어도 하나에서 상기 부가 정보를 추출하는 제어부; 및
추출된 상기 부가 정보를 디코딩하는 디코더를 포함하는 것을 특징으로 하는 디코딩 장치.
제18항에 있어서, 상기 제1 정보는
상기 부가 정보가 포함되어 있는지 여부를 나타내는 정보, 상기 부가 정보의 위치 정보, 및 상기 부가 정보의 길이 정보 중 적어도 하나를 포함하는 것을 특징으로 하는 디코딩 장치.
제19항에 있어서, 상기 제어부는
상기 동기 정보를 검출하고, 검출된 상기 동기 정보를 기준으로 역방향으로 상기 비트 스트림을 독출하여 상기 보조 데이터 비트들에 포함되는 상기 제1 정보를 추출하는 것을 특징으로 하는 디코딩 장치.
제19항에 있어서, 상기 제어부는
상기 동기 정보를 검출하고, 검출된 상기 동기 정보를 기준으로 순방향으로 상기 비트 스트림을 독출하여 상기 추가적인 비트 스트림 정보에 포함되는 상기 제1 정보를 추출하는 것을 특징으로 하는 디코딩 장치.
제19항에 있어서, 상기 제어부는
상기 부가 정보가 삽입된 시작 지점을 나타내는 식별자를 상기 제1 정보로써 추출하는 것을 특징으로 하는 디코딩 장치.