KR101003415B1 - Dmb 신호의 디코딩 방법 및 이의 디코딩 장치 - Google Patents

Dmb 신호의 디코딩 방법 및 이의 디코딩 장치 Download PDF

Info

Publication number
KR101003415B1
KR101003415B1 KR1020080101878A KR20080101878A KR101003415B1 KR 101003415 B1 KR101003415 B1 KR 101003415B1 KR 1020080101878 A KR1020080101878 A KR 1020080101878A KR 20080101878 A KR20080101878 A KR 20080101878A KR 101003415 B1 KR101003415 B1 KR 101003415B1
Authority
KR
South Korea
Prior art keywords
signal
audio signal
additional information
channel
decoding
Prior art date
Application number
KR1020080101878A
Other languages
English (en)
Other versions
KR20090039642A (ko
Inventor
임재현
김동수
윤성용
이현국
Original Assignee
엘지전자 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사 filed Critical 엘지전자 주식회사
Publication of KR20090039642A publication Critical patent/KR20090039642A/ko
Application granted granted Critical
Publication of KR101003415B1 publication Critical patent/KR101003415B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/233Processing of audio elementary streams
    • H04N21/2335Processing of audio elementary streams involving reformatting operations of audio signals, e.g. by converting from one coding standard to another
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H20/00Arrangements for broadcast or for distribution combined with broadcast
    • H04H20/86Arrangements characterised by the broadcast information itself
    • H04H20/88Stereophonic broadcast systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H2201/00Aspects of broadcast communication
    • H04H2201/10Aspects of broadcast communication characterised by the type of broadcast system
    • H04H2201/11Aspects of broadcast communication characterised by the type of broadcast system digital multimedia broadcasting [DMB]

Abstract

본 발명은 DMB 신호를 복호화하는 방법 및 이를 복호화하는 장치에 관한 것이다. 본 발명의 DMB 신호를 복호화하는 방법은, BSAC 오디오 신호 및 오브젝트 기술자를 포함하는 비트스트림을 수신하는 단계; 상기 오브젝트 기술자로부터 부가 정보를 추출하는 단계; 상기 BSAC 오디오 신호를 디코딩하여 다운믹스 신호를 획득하는 단계; 및 상기 다운믹스 신호에 상기 부가 정보를 적용하여 멀티 채널 신호를 생성하는 단계를 포함한다.
DMB, 오브젝트 기술자, 멀티채널, 오디오 신호

Description

DMB 신호의 디코딩 방법 및 이의 디코딩 장치{METHOD OF DECODING A DMB SIGNAL AND APPARATUS OF DECODING THEREOF}
본 발명은 DMB 신호를 디코딩하는 방법 및 이의 디코딩 장치에 관한 것으로, 더욱 상세하게는, DMB 신호의 오디오 신호로 멀티채널 오디오 신호가 이용된 경우, DBM 신호를 디코딩하는 방법 및 이의 디코딩 장치에 관한 것이다.
멀티채널 오디오는 스피커가 청취자의 전방뿐만 아니라, 측면 및 후방에도 설치되므로, 스피커가 청취자의 전방에만 존재하는 스테레오 신호에 비해 보다 현장감있는 오디오 신호를 제공할 수 있다. 따라서, 최근 제작되는 영화 및 음악 등에 널리 이용되고 있다.
또한, DMB 는 차량과 같은 이동환경에서 잡음이 없는 영상 및 오디오를 청취할 수 있도록 하는 이동 멀티미디어 방송 서비스로써, 최근 국내외적으로 상용 서비스가 이루어지기 시작한 서비스이다. 지상파 DMB 서비스의 경우, QVGA 급의 영상과 스테레오 오디오 서비스를 제공하고 있는데, 최근 멀티채널 오디오 재생 환경을 구축한 차량의 증가 추세에 따라, DMB 를 통하여 멀티채널 오디오 신호 서비스를 제공하고자 하는 요구가 계속되어 왔다.
따라서, 본 발명이 이루고자 하는 기술적 과제는, 소량의 데이터율 증가만으로 멀티채널 오디오 신호를 제공하는 DMB 신호의 디코딩 방법을 제공하는 것이다.
또한, 본 발명이 이루고자 하는 다른 기술적 과제는, 기존의 스테레오 DMB 장치와 호환성을 유지할 수 있는 구조를 갖고, 멀티채널 오디오 신호를 제공할 수 있는 DMB 신호의 디코딩 장치를 제공하는 것이다.
상기 기술적 과제를 달성하기 위한 본 발명의 일실시예에 따른 DMB 신호의 디코딩 방법은, SAC 오디오 신호 및 오브젝트 기술자를 포함하는 비트스트림을 수신하는 단계; 상기 오브젝트 기술자로부터 부가 정보를 추출하는 단계; 상기 BSAC 오디오 신호를 디코딩하여 다운믹스 신호를 획득하는 단계; 및 상기 다운믹스 신호에 상기 부가 정보를 적용하여 멀티 채널 신호를 생성하는 단계를 포함한다.
상기 다른 기술적 과제를 달성하기 위한 본 발명의 DMB 신호의 디코딩 장치는, BSAC 오디오 신호 및 오브젝트 기술자를 포함하는 비트스트림을 수신하는 비트스트림 수신기; 상기 비트스트림으로부터 상기 BSAC 오디오 신호 및 상기 오브젝트 기술자를 분리하는 역다중화부; 상기 오브젝트 기술자로부터 부가 정보를 추출하는 부가 정보 추출부; 상기 BSAC 신호를 디코딩하여 다운믹스 신호를 출력하는 BSAC 디코딩부; 및 상기 다운믹스 신호에 상기 부가 정보를 적용하여 멀티 채널 신호를 생성하는 멀티채널 디코딩부를 포함한다.
본 발명의 DMB 신호의 디코딩 방법에 따르면, DMB 신호의 비트스트림에 포함된 멀티채널 오디오 신호를 디코딩하여 청취자에게 보다 현장감이 있는 오디오 신호를 제공할 수 있다.
본 발명의 DMB 신호의 디코딩 방법 및 이의 장치에 따르면, 종래의 DMB 신호의 디코딩 장치에 보다 적은 수정만을 가하여 청취자에게 멀티채널 오디오 신호를 제공할 수 있고, 종래의 DMB 신호의 디코딩 장치와 호환성을 갖는 이점이 있다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다.
본 발명의 실시예들은 당해 기술 분야에서 통상의 지식을 가진 자에게 본 발명을 더욱 완전하게 설명하기 위하여 제공되는 것이며, 하기 실시예는 여러 가지 다른 형태로 변형될 수 있으며, 본 발명의 범위가 하기 실시예에 한정되는 것은 아니다. 도면상에서 동일 부호는 동일한 요소를 지칭한다.
도 1은 일반적인 DMB 신호의 인코딩 장치를 개략적으로 나타내는 것이다. 도 1을 참조하면, 본 발명의 DMB 신호의 인코딩 장치는 AVC 인코딩부(110), BSAC 인코딩부(120), OD/BIFS 생성부(130), IOD 생성부(140), SL 패킷부(150), PES 패킷부(160), 14496 section 패킷화부(170), PSI 생성부(180), TS 패킷부(190)를 포함한다. 국내의 지상파 DMB 의 경우, 비디오 신호 및 오디오 신호를 부호화하기 위하여, MPEG-4 AVC 와 MPEG-4 BSAC 을 각각 사용하고 있으며, MPEG-4 시스템 규격을 포함하여 다양한 대화형 서비스까지 제공할 수 있도록 규정하고 있다. 도 1에 나타난 바와 같이, 비디오 신호는 AVC 인코딩부(110)에서 MPEG-4 AVC 신호로 부호화되고, 모노 신호 또는 스테레오 신호인 오디오 신호는 BSAC 인코딩부(120)에서 MPEG-4 BSAC 신호로 부호화된다. 상기 MPEG-4 AVC 신호 및 상기 MPEG-4 BSAC 신호는 MPEG-4 시스템 규격 및 MPEG-2 시스템 규격에 따라, SL 패킷부(150) 및 PES 패킷부(160)를 통하여 MPEG-2 TS로 패킷화된다.
또한, MPEG-4 시스템 및 MPEG-2 시스템의 시그널링을 위한 초기 오브젝트 기술자(Initial Object Descriptor, IOD), 오브젝트 기술자(Object Descriptor, OD), 이진 포맷(Binary Format for Scene, BIFS) 및 PAT(Program Association Table), PMT(Program Map Table)도 IOD 생성부(140), SL 패킷부(150), PES 패킷부(160), 14496 section 패킷화부(170), PSI 생성부(180), TS 패킷부(190)를 통하여 MPEG-2 TS로 패킷화된다.
그러나, 상술한 바와 같이 DMB의 이용자에게 멀티채널 오디오 신호를 제공하기 위하여는, DMB 시스템에 멀티채널 오디오를 전송하는 기능이 추가되어야 한다. 본 발명에서는 종래의 DMB 시스템에서 멀티채널 오디오 신호를 이용할 수 있도록 멀티채널 인코딩부 및 멀티채널 디코딩부를 이용한다.
도 2는 본 발명의 일실시예에 따른 DMB 신호의 인코딩 장치를 나타내는 것이다. 도 2 를 참조하면, DMB 신호의 인코딩 장치는, 멀티채널 인코딩부(210), BSAC 인코딩부(220), 오브젝트 기술자 생성부(230), 및 비트스트림 생성부(240)를 포함한다.
도 2에 나타난 바와 같이, 멀티채널 인코딩부(210)는 입력된 멀티채널 오디오 신호를 부호화하여 모노 또는 스테레오의 다운믹스 신호 및 부가 정보를 생성한다. 상기 다운믹스 신호는 종래의 DMB 장치에서 BSAC 인코딩부(120)에 입력되는 스테레오 신호와 같이 취급되며, BSAC 인코딩부(220)에 입력되어 MPEG-4 BSAC 신호로 부호화된다. 상기 부가 정보는 입력된 오디오 신호, 비디오 신호(미도시) 등과 함께 오브젝트 기술자 생성부(230)로 입력되어 오브젝트 기술자를 생성하며, 상기 오디오 신호가 멀티채널 오디오 신호인 경우, 상기 오브젝트 기술자에 멀티채널 플래그 정보(multi_channel_flag)를 '1'로 설정하여 포함시킨다. 하기 표 1 은 멀티채널 오디오 신호 플래그 정보의 의미를 나타낸다,
[표 1]멀티채널 오디오 신호 플래그 정보의 의미
multi_channel_flag meaning
0 멀티채널 오디오 신호의 부가 정보를 포함하지 않음
1 멀티채널 오디오 신호의 부가 정보가 포함됨
멀티채널 오디오 신호 플래그 정보가 '0'인 경우는, 비트스트림에 포함된 오디오 신호가 모노 또는 스테레오 신호이므로, 멀티채널 오디오 신호의 부가 정보가 포함되지 아니하였음을 나타내며, 멀티채널 오디오 신호 플래그 정보가 '1'인 경우는, 비트스트림에 포함된 오디오 신호가 멀티채널 오디오 신호이므로, 멀티채널 오디오 신호의 부가 정보가 오브젝트 식별자에 포함되어 있음을 나타낸다.
상기 MPEG-4 BSAC 신호 및 오브젝트 기술자는 비트스트림 생성부(240)를 통하여 비트스트림으로 생성된다. 상기 비트스트림은 하나의 비트스트림일 수 있으나, 이에 한정되지 아니하고, 두 개 이상의 비트스트림, 예를 들면, 부가 정보를 포함하는 비트스트림 및 오디오 신호와 비디오 신호를 포함하는 비트스트림으로 생성될 수 있다.
도 3은 본 발명의 일실시예에 따른 DMB 신호의 디코딩 장치를 나타낸 것이다. 도 3을 참조하면, DMB 신호의 디코딩 장치는 비트스트림 수신부(310), 역다중화부(320), BSAC 디코딩부(330), 부가 정보 추출부(340), 멀티채널 디코딩부(350), 제 1 출력부(360), 및 제 2 출력부(370)를 포함한다. 먼저 MPEG-2 TS 형태의 비트스트림이 비트스트림 수신부(310)로 입력되고, 수신된 비트스트림은 역다중화부(320)로 입력된다. 역다중화부(320)는 상기 비트스트림에서 BSAC 형태로 인코딩된 오디오 신호 및 오브젝트 기술자를 분리한다. BSAC 디코딩부(330)는 BSAC 형태로 인코딩된 오디오 신호를 스테레오 신호로 디코딩하며, 부가 정보 추출부(340)는 오브젝트 기술자로부터 멀티채널 오디오 신호에 관한 부가 정보를 추출한다. 이 때, 부가 정보 추출부(340)는 상기 오브젝트 기술자에 포함된 멀티채널 플래그 정보(multi_channel_flag)에 기초하여 상기 부가 정보를 추출할지 여부를 결정하며, 더 상세하게는, 상기 멀티채널 플래그 정보가 '1'로 셋팅된 경우, 상기 오브젝트 기술자로부터 상기 부가 정보를 추출한다.
멀티채널 디코딩부(360)는 BSAC 디코딩부(330)에서 디코딩된 스테레오 신호와 오브젝트 기술자로부터 추출된 부가 정보를 이용하여, 멀티채널 오디오 신호를 생성하여, 제 2 출력부(370)로 멀티채널 오디오 신호, 예를 들어, 5.1 채널 오디오 신호,를 출력하게 된다. 반면, 이용자의 요구 및 오디오 신호의 특성에 따라, 모노 또는 스테레오 신호를 출력하는 것이 효율적인 경우, BSAC 디코딩부(330)에서 디코딩된 스테레오 신호는 멀티채널 디코딩부(360)로 입력되지 아니하고, 직접적으로 제 1 출력부(360)를 통하여 출력될 수도 있다.
또한, 종래의 DMB 서비스에서는 부가정보가 전송되지 않기 때문에, 종래의 DMB 신호의 비트스트림이 수신되는 경우,BSAC 디코딩부(330)를 통해 디코딩된 스테레오 신호는 멀티채널 디코딩부(360)에 입력되지 아니하고, 그대로 제 1 출력부(360)를 통하여 출력될 수도 있다. 반면, 종래의 DMB 신호의 디코딩 장치에 멀티채널 오디오 신호가 수신되는 경우에는, 인코딩되어 전송된 부가 정보를 무시하고, BSAC 디코딩부에서 디코딩된 스테레오 신호를 그대로 출력하므로 본 발명의 DMB 신호의 디코딩 장치는 종래의 DMB 신호의 디코딩 장치와 호환성을 가질 수 있다.
도 2 및 도 3에서는 오디오 신호의 인코딩 및 디코딩 장치에 대하여 개시하고 있으나, 상기 비트스트림에는 비디오 신호 등이 포함될 수 있다. 따라서, 상기 스테레오 신호 또는 멀티채널 오디오 신호는 제 1 출력부(360) 또는 제 2 출력부(370)로 출력되기 이전에, 장면생성기(미도시)에 입력되어 비디오 신호와 함께 출력될 영상을 생성하고, 이후에 제 1 출력부(360) 또는 제 2 출력부(370)를 통하여 출력될 수 있다.
도 4는 본 발명의 일실시예에 따른 DMB 신호의 디코딩 방법의 순서를 나타내는 것이다. 도 4를 참조하면, BSAC 오디오 신호 및 오브젝트 기술자를 포함한 비트스트림이 수신되면(S410 단계), 상기 오브젝트 기술자로부터 멀티채널 오디오 신호와 관련된 부가 정보를 추출한다(S420 단계). 그 후, 상기 BSAC 오디오 신호를 디코딩하여 다운믹스 신호를 획득하고(S430 단계), 상기 다운믹스 신호 및 상기 부가 정보를 이용하여 멀티채널 오디오 신호를 생성한다(S440 단계).
이와 같이, DMB 신호의 오디오 신호로 멀티채널 오디오 신호가 이용된 경우, 본 발명의 DMB 신호의 디코딩 방법에 따라 멀티채널 오디오 신호를 디코딩하여 제공할 수 있으므로, 이용자에게 보다 현장감 있는 오디오 신호를 제공할 수 있게 된다.
본 발명의 DMB 신호의 비트스트림은 오디오 신호를 포함하여 여러가지 성분들을 포함하며, 예를 들어, 오디오 전용 신호, 비디오 신호, 데이터 신호, 프로그램 정보 등이 포함될 수 있다.
본 발명의 일실시예에 따른 DMB 신호의 디코딩 방법 및 디코딩 장치는 비트스트림 중 상기 오디오 신호를 추출하여 처리하는 과정에 대하여 서술한다. 상기 오디오 신호는 멀티채널을 갖는 오디오 신호일 수 있으며, 상기 오디오 신호는 상기 멀티채널 오디오 신호의 부가 정보를 포함하는 의미로 지칭된다. 상기 부가 정보는 멀티채널 오디오 신호 전체에 관한 비트레이트, 샘플링 주파수, 채널의 수 등 뿐만 아니라, 각 채널간의 상관도(Inter Channel Correlation, ICC), 채널의 레벨차(Channel Level Difference, CLD), 채널 예측 계수(Channel Prediction Coefficient) 등을 포함할 수 있다.
상기 오디오 신호는 오디오 전용 신호일 수 있으며, 비디오 신호 내에 포함된 오디오 신호일 수도 있다. 상기 비디오 신호 내에 포함된 오디오 신호도 부가 정보를 포함할 수 있다.
또한, 상기 부가 정보는 오브젝트 기술자 인코딩부(230)을 통하여 오브젝트 기술자에 포함되며, 비트스트림으로 생성된다. 일반적으로 디코딩시 필요한 상기 부가 정보는 비트스트림의 헤더 부분에 포함되는데, DMB 코덱에서는 다양한 서비스와 다양한 형태의 정보를 인코딩/디코딩 하기 위한 정보가 비트스트림 내에 함께 포함되므로, 단일한 정보를 다루는 일반적인 코덱에 비하여 구조가 복잡하고, 헤더 역시 여러 부분으로 나뉘어 있다.
도 5 및 도 6은 본 발명의 일실시예에 따른 부가 정보가 존재하는 위치를 나타내는 것이다. 도 5를 참조하면, DMB 신호의 비트스트림도 특정 시간구간을 한정하는 프레임 단위로 구별되며, 현재 프레임을 상세히 살펴보면, 디코딩시 전체 프레임에 공통적으로 해당되는 포괄적인 정보를 담는 프레임 헤더 영역(a)과 오디오 전용 서비스에 해당하는 정보를 포함하는 오디오 전용 신호 영역(b), 비디오 서비스에 해당하는 정보를 포함하는 비디오 신호 영역(c), 상기 인코딩된 데이터를 담고 있는 데이터 영역(d), 그리고 이들의 연관관계 등을 나타내는 기타 정보를 담는 기타 정보 영역(e)으로 구분된다. 이 때, 상기 부가 정보는 상기 프레임 헤더 영역(a) 또는 상기 오디오 신호 영역(b)에 포함될 수 있다.
도 6은 도 5와 같은 비트스트림 구조에서 비디오 신호를 포함하는 영역(c)을 보다 상세하게 나타낸 것이다. 도 6을 참조하면, 비디오 신호를 포함하는 영역(c)은 비디오 신호 전체에 적용되는 정보를 담는 비디오 헤더 영역(c1), 비디오 신호에 포함되는 영상 신호에 대한 정보를 포함하는 비디오 신호 헤더 영역(c21) 및 비디오 신호에 대한 정보를 인코딩한 데이터를 포함하는 비디오 정보 데이터 영 역(c22), 비디오 신호에 포함되는 오디오 신호에 대한 정보를 포함하는 오디오 신호 헤더 영역(c31) 및 상기 오디오 신호에 대한 정보를 인코딩한 데이터를 포함하는 오디오 정보 데이터 영역(c32), 오디오 신호를 포함하는 비디오 신호의 디코딩에 필요한 보조 정보를 포함하는 영역(c4)으로 구성된다. 이 때, 상기 비디오 신호에 포함된 오디오 신호가 멀티채널 오디오 신호인 경우, 상기 멀티채널 오디오 신호에 대한 부가 정보는 앞서 언급한 프레임 헤더 영역(a), 상기 비디오 헤더 영역(c1) 또는 오디오 신호 헤더 영역(c31) 중 어느 하나 이상에 포함될 수 있다.
일반적인 코덱의 경우, 프레임 단위에 헤더 영역 및 데이터 영역이 존재하는 것 이외에, 디코딩하고자 하는 비트스트림 전체에 대하여 기본적인 정보를 담고 있는 비트스트림의 헤더 영역이 존재한다. 상기 헤더 영역은 비트스트림의 맨 첫머리에 한번만 포함되고, 상기 헤더 영역에 포함된 정보는 해당 비트스트림의 디코딩이 끝날때까지 계속적으로 적용된다.
반면, DMB 과 같은 디지털 멀티미디어 방송용 비트스트림인 경우, 전송환경의 문제로 인하여 비트스트림이 전송 도중에 에러가 발생하거나, 전송 자체가 되지 않는 경우가 발생할 수 있다. 따라서, 방송용 비트스트림인 경우, 특정 시간 간격을 정하여 상기 시간 간격마다 상기 헤더 영역에 포함된 정보를 재전송하도록 규정하고 있다.
도 7은 본 발명의 일실시예에 따른 방송용 비트스트림의 일예를 도시한 것이다. 도 7을 참조하면, 비트스트림 전체에 대한 정보를 포함하는 헤더 영역(A), 각 프레임 영역(B,...,G,...I...)뿐만 아니라, 상기 헤더 영역(A)에 포함된 정보가 특 정 시간 간격으로 재전송되는 재전송 헤더 영역(H)를 포함한다. 따라서, 본 발명의 DMB 신호의 부가 정보가 비트스트림의 헤더 영역에 포함된 경우, 상기 재전송 헤더 영역(H)에도 포함될 수 있다. 그러나, 상기 부가 정보가 헤더 영역(A)만 포함되도록 하는 설정이 되어 있는 경우에는, 이에 한정되지 아니하고, 재전송 헤더 영역(H)이 존재할지라도, 상기 부가 정보는 헤더 영역(A)만 존재하고, 재전송 헤더 영역(H)에는 존재하지 아니할 수도 있다.
본 발명의 일실시예에 따르면, 멀티채널 오디오 신호를 이용함으로써, 종래의 DMB 신호의 인코딩/디코딩 방법에 비하여 멀티채널 오디오 신호의 인코딩/디코딩 단계를 더 포함하므로, 시간 지연이 발생하게 된다. 따라서, 오디오 신호와 이를 제외한 나머지 부분과의 동기화를 위한 고려를 필요로 한다. 시간 지연은, 일예로, 멀티채널을 갖는 오디오 전용 신호와 비디오 신호 사이에 또는 비디오 신호에 포함되는 오디오 신호가 멀티채널을 갖는 경우, 상기 오디오 신호와 비디오 신호 사이에 발생할 수 있다.
이러한 시간 지연을 해결하기 위하여, 본 발명의 일실시예에 따른 DMB 신호의 디코딩 방법은, 상기 비디오 신호와 상기 멀티 채널 신호 사이의 시간 지연을 보상하는 단계를 더 포함한다. 상기 시간 지연을 보상하는 단계는, 미리 저장된 지연 정보를 이용하거나 상기 부가 정보에 포함되어 전송된 지연 정보를 이용할 수 있다. 상기 미리 저장된 지연 정보는 클락(clock) 신호 등으로 저장되어 있을 수 있으며, 상기 비디오 신호는 상기 멀티 채널 신호를 생성하는 단계에서 발생한 시간을 고려하여 지연된 신호일 수 있다.
또한, 본 발명의 다른 실시예 따른 DMB 신호 중 부가 정보는 출력채널에 대한 정보를 포함할 수 있으며, 이는 비트스트림의 헤더 영역에 포함된다. 모노 또는 스테레오 신호를 이용한 종래의 DMB 신호의 비트스트림을 이용하는 방법을 생각할 수 있다. 이 경우, 종래의 헤더 영역 중 채널 구성(channel configuration) 항목에 보류 영역(reversed field)이 존재하는 경우, 상기 보류 영역에 멀티채널 오디오 신호의 출력채널에 대한 정보를 포함시킬 수 있고, 상기 보류 영역이 없거나 상기 보류 영역이 상기 멀티채널 오디오 신호의 출력채널에 대한 정보를 포함하기에 비트수가 부족한 경우에는, 상기 채널 구성 영역의 할당 비트수를 증가시켜 증가된 채널 구성 영역에 기재할 수 있다. 또한, 상기 출력채널에 대한 정보를 포함시키기 위한 영역을 비트스트림의 헤더 영역에 따로 할당할 수도 있다.
본 발명의 또다른 실시예에 따른 DMB 신호의 디코딩 방법 및 이의 장치는, 스테레오 신호만으로 청취자에게로 하여금 멀티채널 오디오 신호를 느낄 수 있는 가상 3D 신호를 디코딩하는 방법을 도 8을 참조하여 상세히 설명하기로 한다. 도 8은 가상 3D 신호를 디코딩하는 장치의 개략적인 블록도를 나타낸 것이다. DMB 신호의 디코딩 장치에 입력된 비트스트림에 멀티채널을 갖는 오디오 신호를 다운믹싱하여 생성된 다운믹스 신호 및 상기 멀티채널 오디오 신호에 관한 부가 정보가 포함되어 있는 경우라도, 실제 멀티채널 오디오 신호를 출력할 수 있는 환경을 가지기 어려운 경우가 발생할 수 있다. 이 경우, 멀티채널 오디오 신호는 모노/스테레오 신호로 변형이 필요하게 된다.
도 8에 나타난 바와 같이, 본 발명의 또다른 실시예에 따른 DMB 신호의 디코 딩 방법 및 이의 장치는, 다운믹싱부(850, 860), 제 1 가상 3D 신호 디코딩부(880) 및 제 2 가상 3D 신호 디코딩부(890)을 포함한다. 도 8의 DMB 신호의 디코딩 장치는 도 3의 DMB 신호의 디코딩 장치에서 동일한 명칭을 가진 블록의 경우, 동일한 구성 및 효과를 가지므로 이에 대한 설명은 생략하기로 한다. BSAC 디코더(830)에 입력된 MPEG-4 BSAC 형태의 비트스트림은 스테레오 다운믹스 신호로 디코딩된다. 이 때, 상기 스테레오 다운믹스 신호는 멀티채널 디코딩부(860)로 입력되지 아니하고, 직접적으로 스테레오 신호로써 출력될 수 있다(a 신호). 또한, 출력부가 1개인 경우에는, 상기 스테레오 다운믹스 신호는 다운믹싱부(850)에 입력되어 모노 신호로 다운믹싱되어 출력될 수도 있다(b 신호).
한편, 상기 스테레오 다운믹스 신호는 부가정보 추출부(840)에서 추출된 부가 정보와 함께 멀티채널 디코딩부(860)으로 입력될 수 있고, 멀티채널을 갖는 오디오 신호, 예를 들어, 5.1 채널 등, 으로 디코딩할 수 있다. 이어서, 상기 멀티채널 오디오 신호는 다운믹싱부(870)에 입력되어 출력장치 및 환경에 따라 모노 신호 또는 스테레오 신호로 다운믹싱되어 출력될 수 있다(c 신호). 또한, 상기 멀티채널 오디오 신호는 제 1 가상 3D 신호 디코딩부(880)로 입력되어, 스테레오 신호이지만 삼차원적인 음장감을 갖는 가상 3D 신호로 디코딩될 수 있다(d 신호).
멀티채널 디코딩부(860)에 입력되기 이전에, BSAC 디코더(830)으로부터 출력된 다운믹스 신호와 부가정보 추출부(840)에서 추출된 부가 정보가 제 2 가상 3D 신호 디코딩부(890)로 입력되어, 상기 부가 정보에 의하여 상기 다운믹스 신호가 변형되어 가상 3D 신호를 생성할 수 있다. 위에 언급한 바와 같이, 상기 가상 3D 신호는 스테레오 채널을 갖는 신호이며, 삼차원적인 음장감을 갖는 3D 신호로써 청취자로 하여금 스테레오 출력장치로부터 멀티채널 오디오 신호를 듣는 것과 같은 효과를 느낄 수 있게 한다.
도 8에 나타난 바와 같이, 다운믹싱부(850, 870)통하여 스테레오 신호 또는 멀티채널 오디오 신호가 다운믹싱 되는 경우, 다운믹싱부(850, 870)는 단순히 다운믹싱부(850, 870)의 입력 신호들의 값을 합하여 다운믹싱하거나, 각 입력 신호들의 값에 가중치를 두어 다운믹싱하거나, 다운믹싱된 신호에 이득값을 주어 신호를 변화시켜서 사용하거나, 상기 방법을 조합하여 이용할 수 있다.
또한, 본 발명의 일실시예에 따라 가상 3D 신호를 생성하는 방법을 선택하기 위하여 여러 가지 방법을 이용할 수 있다. 예를 들어, 디코딩 장치에 입력되는 비트스트림에 멀티채널 오디오 플래그 정보(multi_channel_flag)가 포함된 경우, 무조건 가상 3D 신호를 만들도록 설정하는 방법과 같이, 디코딩 장치에 고정된 설정을 이용하는 방법, 디코딩 장치의 출력 환경을 판단하여 멀티채널 오디오와 가상 3D 신호 중 어느 신호로 출력할지를 선택하는 방법, 디코딩 과정에서 사용자의 제어 신호를 받아 멀티채널 오디오 신호와 가상 3D 신호 중 어느 신호로 출력할지 여부를 선택하는 방법을 이용할 수 있다.
또한, 상기 가상 3D 신호를 생성하기 위한 정보는, 위에서 언급한 오디오 신호의 부가 정보에 더 포함될 수 있으며, 상기 부가 정보가 비트스트림상에 존재할 수 있는 위치는 도 5 내지 도 7을 참조하여 설명된 바와 같다.
상기 3D 신호를 생성하기 위하여 상기 제 1 가상 3D 신호 디코딩부(880) 및 상기 제 2 가상 3D 신호 디코딩부(890)는, 매트릭스 연산 또는 HRTF 함수 중 어느 하나 이상을 포함할 수 있으며, 이에 한정되지는 아니한다.
또한, 본 발명의 또다른 실시예에 따르면, 부가 정보의 활용이 어렵거나 불가능한 경우에도 BSAC 디코더(830)에서 디코딩된 모노 또는 스테레오 다운믹스 신호를 이용하여 가상 3D 신호를 생성할 수 있다. 이는 방송용 비트스트림에 멀티채널 오디오 신호에 관한 부가 정보가 포함된 경우라도, 방송의 특성상 전송과정 중에 소실되거나, 에러가 발생하여 전송된 부가 정보를 사용하기 어려운 경우에 해당한다.
이러한 경우, 상기 제 2 가상 3D 신호 디코딩부(890)는 모노 또는 스테레오 신호를 입력받아 단순한 입력신호의 조합연산을 통하여 가상 3D 신호를 생성할 수 있는 매트릭스를 더 포함할 수 있다. 또한, 모노 또는 스테레오 신호를 분석하여 가상 3D 신호를 생성하기 위한 3D 부가 정보를 생성하고, 상기 모노 또는 스테레오 신호 및 상기 3D 부가 정보를 이용하여 가상 3D 신호를 생성할 수 있다.
상기 가상 3D 신호를 생성하기 위한 상기 3D 부가 정보 및 상기 매트릭스 등은 위에서 언급한 오디오 신호의 부가 정보에 더 포함될 수 있으며, 상기 부가 정보가 비트스트림상에 존재할 수 있는 위치는 도 5 내지 도 7을 참조하여 설명된 바와 같다.
본 발명의 또 다른 일실시예에 따른 DMB 신호의 부가 정보는 레지듀얼 신호를 더 포함할 수 있다. 상기 레지듀얼 신호는 다음과 같은 방법으로 생성된다. 첫째로, 도 2의 멀티채널 인코딩부(210)에서 생성된 다운믹스 신호(DMX)를 BSAC 인 코딩부(220)에서 인코딩하는 경우에 양자화 전, 후의 신호 차이를 레지듀얼 신호로 이용할 수 있다. 둘째로, 도 2의 오브젝트 기술자 생성부(230)에서 부가 정보를 포함하는 오브젝트 기술자를 생성하는 경우, 상기 부가 정보의 생성시 이용되는 양자화 전후의 신호 차이를 레지듀얼 신호로 이용할 수 있다. 셋째로, 도 2의 멀티채널 인코딩부(210)에 입력되는 멀티채널 오디오 신호와 도 3의 멀티채널 디코딩부(350)에서 생성되는 멀티채널 오디오 신호의 차이를 레지듀얼 신호로 이용할 수 있고, 이들의 조합을 이용할 수도 있으며, 이에 한정되지는 아니하다.
상기 레지듀얼 신호는 위에서 언급한 오디오 신호의 부가 정보에 더 포함될 수 있으며, 상기 부가 정보가 비트스트림상에 존재할 수 있는 위치는 도 5 내지 도 7을 참조하여 설명된 바와 같다.
이상에서 설명한 본 발명이 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러가지 치환, 변형 및 변경이 가능하다는 것은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
도 1은 일반적인 DMB 신호의 인코딩 장치를 개략적으로 나타내는 것이다.
도 2는 본 발명의 일실시예에 따른 DMB 신호의 인코딩 장치를 개략적으로 나타내는 것이다.
도 3은 본 발명의 일실시예에 따른 DMB 신호의 디코딩 장치를 개략적으로 나타내는 것이다.
도 4는 본 발명의 일실시예에 따른 DMB 신호의 디코딩 방법을 나타내는 순서도이다.
도 5 및 도 6은 본 발명의 일실시예에 따른 부가 정보가 존재하는 위치를 나타내는 것이다.
도 7은 본 발명의 다른 실시예에 따라 비트스트림 상에 부가 정보를 포함하는 헤더 정보가 2 이상의 위치에 포함되는 경우, 부가 정보가 존재하는 위치를 나타내는 것이다.
도 8은 본 발명의 다른 실시예에 따른 DMB 신호의 디코딩 장치를 개략적으로 나타내는 것이다.

Claims (14)

  1. BSAC 오디오 신호 및 오브젝트 기술자를 포함하는 비트스트림을 수신하는 단계;
    상기 BSAC 오디오 신호를 디코딩하여 다운믹스 신호를 획득하는 단계;
    상기 오브젝트 기술자로부터 멀티 채널 오디오 신호의 부가 정보를 포함하는지 여부를 나타내는 멀티 채널 오디오 신호 플래그 정보를 추출하는 단계;
    상기 멀티 채널 오디오 신호 플래그 정보에 기초하여 상기 오브젝트 기술자로부터 부가 정보를 추출하는 단계; 및
    상기 다운믹스 신호에 상기 부가 정보를 적용하여 멀티 채널을 갖는 오디오 신호를 생성하는 것을 특징으로 하는 DMB 신호의 디코딩 방법.
  2. 제 1 항에 있어서,
    상기 부가 정보는 상기 BSAC 오디오 신호가 멀티 채널을 갖는 오디오 신호로부터 생성된 경우, 상기 멀티 채널을 갖는 오디오 신호에 관한 것을 특징으로 하는 DMB 신호의 디코딩 방법.
  3. 제 2 항에 있어서,
    상기 멀티 채널을 갖는 오디오 신호는, 비디오 신호를 구성하는 오디오 신호 또는 오디오 전용 신호인 것을 특징으로 하는 DMB 신호의 디코딩 방법.
  4. 삭제
  5. 제 1 항에 있어서,
    상기 부가 정보는 상기 비트스트림의 프레임 헤더, 오디오 전용 신호의 헤더, 비디오 신호의 헤더, 비디오 신호를 구성하는 오디오 신호의 헤더 또는 프레임 재전송 헤더 중 어느 하나 이상에 위치하는 것을 특징으로 하는 DMB 신호의 디코딩 방법.
  6. 제 1 항에 있어서,
    상기 비트스트림으로부터 비디오 신호를 디코딩하는 단계; 및
    상기 비디오 신호와 상기 멀티 채널 신호 사이의 시간 지연을 보상하는 단계를 더 포함하는 것을 특징으로 하는 DMB 신호의 디코딩 방법.
  7. 제 6 항에 있어서,
    상기 시간 지연을 보상하는 단계는, 미리 저장된 지연 정보를 이용하거나 상기 부가정보에 포함되어 전송된 지연 정보를 이용하는 것을 특징으로 하는 DMB 신호의 디코딩 방법.
  8. 제 1 항에 있어서,
    상기 비트스트림으로부터 비디오 신호를 디코딩하는 단계를 더 포함하고,
    상기 비디오 신호는 상기 멀티 채널 신호를 생성하는 단계에서 발생한 시간을 고려하여 지연된 것을 특징으로 하는 DMB 신호의 디코딩 방법.
  9. BSAC 오디오 신호 및 오브젝트 기술자를 포함하는 비트스트림을 수신하는 비트스트림 수신기;
    상기 비트스트림으로부터 상기 BSAC 오디오 신호 및 상기 오브젝트 기술자를 분리하는 역다중화부;
    상기 오브젝트 기술자로부터 멀티 채널 오디오 신호의 부가 정보를 포함하는지 여부를 나타내는 멀티 채널 오디오 신호 플래그 정보를 추출하고, 상기 멀티 채널 오디오 신호 플래그 정보에 기초하여 상기 오브젝트 기술자로부터 부가 정보를 추출하는 부가 정보 추출부;
    상기 BSAC 신호를 디코딩하여 다운믹스 신호를 출력하는 BSAC 디코딩부; 및
    상기 다운믹스 신호에 상기 부가 정보를 적용하여 멀티 채널 신호를 생성하는 멀티채널 디코딩부를 포함하는 것을 특징으로 하는 DMB 신호의 디코딩 장치.
  10. 제 9 항에 있어서,
    상기 부가 정보 추출부는 상기 BSAC 오디오 신호가 멀티 채널을 갖는 오디오 신호로부터 생성된 경우에 상기 오브젝트 기술자로부터 상기 부가 정보를 추출하는 것을 특징으로 하는 DMB 신호의 디코딩 장치.
  11. 제 10 항에 있어서,
    상기 멀티 채널을 갖는 오디오 신호는, 비디오 신호를 구성하는 오디오 신호 또는 오디오 전용 신호인 것을 특징으로 하는 DMB 신호의 디코딩 장치.
  12. 제 9 항에 있어서,
    상기 BSAC 디코딩부에서 출력된 상기 다운믹스 신호를 출력하는 제 1 출력부를 더 포함하는 것을 특징으로 하는 DMB 신호의 디코딩 장치.
  13. 제 12 항에 있어서,
    상기 다운믹스 신호는 모노 신호 또는 스테레오 신호인 것을 특징으로 하는 DMB 신호의 디코딩 장치.
  14. 제 9 항에 있어서,
    상기 멀티채널 디코딩부에서 출력된 멀티채널 오디오 신호를 출력하는 제 2 출력부를 더 포함하는 것을 특징으로 하는 DMB 신호의 디코딩 장치.
KR1020080101878A 2007-10-17 2008-10-17 Dmb 신호의 디코딩 방법 및 이의 디코딩 장치 KR101003415B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US98077807P 2007-10-17 2007-10-17
US60/980,778 2007-10-17
US98357207P 2007-10-30 2007-10-30
US60/983,572 2007-10-30

Publications (2)

Publication Number Publication Date
KR20090039642A KR20090039642A (ko) 2009-04-22
KR101003415B1 true KR101003415B1 (ko) 2010-12-23

Family

ID=40974472

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080101878A KR101003415B1 (ko) 2007-10-17 2008-10-17 Dmb 신호의 디코딩 방법 및 이의 디코딩 장치

Country Status (1)

Country Link
KR (1) KR101003415B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014058275A1 (ko) * 2012-10-11 2014-04-17 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US10282160B2 (en) 2012-10-11 2019-05-07 Electronics And Telecommunications Research Institute Apparatus and method for generating audio data, and apparatus and method for playing audio data

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120071072A (ko) 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
KR102005929B1 (ko) * 2018-07-26 2019-07-31 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014058275A1 (ko) * 2012-10-11 2014-04-17 한국전자통신연구원 오디오 데이터 생성 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US10282160B2 (en) 2012-10-11 2019-05-07 Electronics And Telecommunications Research Institute Apparatus and method for generating audio data, and apparatus and method for playing audio data

Also Published As

Publication number Publication date
KR20090039642A (ko) 2009-04-22

Similar Documents

Publication Publication Date Title
KR101283783B1 (ko) 고품질 다채널 오디오 부호화 및 복호화 장치
JP5006315B2 (ja) オーディオ信号のエンコーディング及びデコーディング方法及び装置
EP2695162B1 (en) Audio encoding method and system for generating a unified bitstream decodable by decoders implementing different decoding protocols
US9373333B2 (en) Method and apparatus for processing an audio signal
US8705747B2 (en) Object-based 3-dimensional audio service system using preset audio scenes
US20100324915A1 (en) Encoding and decoding apparatuses for high quality multi-channel audio codec
US8238561B2 (en) Method for encoding and decoding multi-channel audio signal and apparatus thereof
US20140310010A1 (en) Apparatus for encoding and apparatus for decoding supporting scalable multichannel audio signal, and method for apparatuses performing same
EP2369836A2 (en) Object-based 3-dimensional audio service system using preset audio scenes
US20080015867A1 (en) Systems and methods for multi-dialog surround audio
KR101003415B1 (ko) Dmb 신호의 디코딩 방법 및 이의 디코딩 장치
RU2383941C2 (ru) Способ и устройство для кодирования и декодирования аудиосигналов
EP2658253A2 (en) Broadcast transmitting apparatus and broadcast transmitting method for providing an object-based audio, and broadcast playback apparatus and broadcast playback method
KR101531510B1 (ko) 수신 시스템 및 오디오 데이터 처리 방법
KR101114431B1 (ko) 실시간 스트리밍을 위한 오디오 생성장치, 오디오 재생장치 및 그 방법
KR20070003574A (ko) 오디오 신호 인코딩 및 디코딩 방법 및 장치
KR102471718B1 (ko) 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
JP2022553111A (ja) チャネルベースオーディオからオブジェクトベースオーディオへの変換のためのシステム、方法、及び機器
KR102191260B1 (ko) 다채널 오디오 코덱과 다객체 오디오 코덱을 이용한 오디오 부호화/복호화 장치 및 방법
KR980013417A (ko) 오디오 데이터 전송 방법 및 그 장치
KR20100020889A (ko) 오디오 신호 부호화/복호화 방법 및 그 장치
TWI412021B (zh) 音頻訊號之解碼方法
Series Recommendation ITU-R BS. 1548-2
Series User requirements for audio coding systems for digital broadcasting

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20131122

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20141124

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20151124

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20161114

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee