KR101092663B1

KR101092663B1 - 실감 객체 오디오 재생 및 생성 장치

Info

Publication number: KR101092663B1
Application number: KR20100030408A
Authority: KR
Inventors: 조충상; 김제우; 최병호; 송혁
Original assignee: 전자부품연구원
Priority date: 2010-04-02
Filing date: 2010-04-02
Publication date: 2011-12-13
Also published as: KR20110111032A; US20110246207A1; US8838460B2

Abstract

본 발명은 실감 객체 오디오 재생 및 생성 장치에 관한 것으로, 본 발명의 일면에 따른 실감 객체 오디오 재생 장치는 입력되는 오디오 파일로부터 SD(Scene Description) 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리하는 디포맷터부, SD 압축 데이터를 복호화하여 SD 정보(Scene Description Information)를 복원하는 SD 복호화부, 객체 오디오 압축 데이터를 복호화하여 복수 객체 각각의 오디오 신호인 객체 오디오 신호를 복원하는 객체 오디오 복호화부 및 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 객체 오디오 효과부를 포함한다.

Description

실감 객체 오디오 재생 및 생성 장치 {APPARATUS FOR PLAYING AND PRODUCING REALISTIC OBJECT AUDIO}

본 발명은 실감 객체 오디오 재생 및 생성 장치에 관한 것으로서, 구체적으로, 사용자가 객체별로 다양한 음을 생성 및 재생하게 하는 실감 객체 오디오 재생 및 생성 장치에 관한 것이다.

일반적으로 라디오 및 MP3, CD 등을 통해 제공되는 오디오 서비스는 음원에 따라 2 개에서 수십개에 이르는 음원으로부터 획득된 신호를 합성하여 모노 및 스테레오, 5.1 채널 신호 등으로 저장 및 재생한다. 이러한 서비스에서 사용자가 주어진 음원과 상호작용(interaction)을 가질 수 있는 것은 음량의 조절 및 이퀄라이저(equalizer)를 통한 대역 증폭 및 감쇄이며, 주어진 음원에 대해 특정 객체에 대한 조절 및 효과를 줄 수 없다. 이러한 단점을 극복하기 위해 오디오 컨텐츠를 제작할 때, 각 음원에 해당하는 신호를 서비스 제공자에서 합성하지 않고, 합성에 필요한 객체들과 각 객체에 필요한 효과 및 음량 등에 해당하는 정보를 저장하여 사용자가 합성할 수 있는 서비스를 객체 기반의 오디오 서비스라 한다.

이러한 객체기반 오디오 서비스는 각 객체에 대한 압축 정보와 각 객체를 합성하는데 필요한 SD 정보(Scene Description Information)으로 구성된다. 각 객체에 대한 압축 정보는 MP3 (MPEG-1,2,2.5 layer 3), AAC (Advanced Audio Coding), ALS (MPEG-4 Audio Lossless Coding) 등의 오디오 코덱이 사용될 수 있다. 하지만, SD 정보 생성을 위한 기술 및 생성된 SD 정보와 각 객체별 오디오 신호를 통합하여 해석하는 SD 정보 재생 기술이 요구된다.

종래의 오디오 재생 및 생성 장치는 다채널 오디오 객체를 위해 단순히 객체별 오디오 신호를 다운믹싱(Downmixing)하여 음을 가공한다. 따라서, 종래의 오디오 재생 및 생성 장치로는 객체별로 SD 정보를 포함하여 할 수 없다.

본 발명은 SD 정보에 따라 객체 오디오 신호를 가공하고, 실감 객체 오디오를 생성 및 재생하려는 목적을 달성하기 위한 것으로, 본 발명이 해결하고자 하는 과제는 실감 객체 오디오 재생 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 다른 과제는 실감 객체 오디오 인코딩 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 또 다른 과제는 실감 객체 오디오 생성 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 또 다른 과제는 컨퍼런스 오디오 재생 장치를 제공하는 것이다.

본 발명이 해결하고자 하는 또 다른 과제는 컨퍼런스 오디오 생성 장치를 제공하는 것이다.

본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 당업자에게 명확하게 이해될 수 있을 것이다.

전술한 목적을 달성하기 위한 본 발명의 일면에 따른 실감 객체 오디오 재생 장치는, 입력되는 오디오 파일로부터 SD 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리하는 디포맷터부, SD 압축 데이터를 복호화하여 SD 정보(Scene Description Information)를 복원하는 SD 복호화부, 객체 오디오 압축 데이터를 복호화하여 복수 객체 각각의 오디오 신호인 객체 오디오 신호를 복원하는 객체 오디오 복호화부 및 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 객체 오디오 효과부를 포함한다.

본 발명의 다른 면에 따른 실감 객체 오디오 인코딩 장치는, 입력되는 오디오 파일로부터 SD 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리하는 디포맷터부, 사용자의 설정에 의한 사용자 SD 정보를 입력받는 사용자 SD 입력부, 사용자 SD 정보를 사용자 SD 압축 데이터로 부호화하는 사용자 SD 부호화부, SD 압축 데이터, 객체 오디오 압축 데이터 및 사용자 SD 압축 데이터를 오디오 파일로 통합하는 사용자 파일 포맷터부를 포함한다.

본 발명의 또 다른 면에 따른 실감 객체 오디오 인코딩 장치 실감 객체 오디오 생성 장치는, 3차원의 오디오 효과를 위한 SD 정보를 부호화하여 SD 압축 데이터를 생성하는 SD 부호화부, 복수 객체 각각의 오디오 신호인 객체 오디오 신호를 부호화하여 객체 오디오 압축 데이터를 생성하는 객체 오디오 부호화부 및 SD 압축 데이터 및 객체 오디오 압축 데이터를 오디오 파일로 통합하는 포맷터부를 포함한다.

본 발명의 또 다른 면에 따른 컨퍼런스 오디오 재생 장치는, 입력되는 컨퍼런스 오디오 파일로부터 컨퍼런스 SD 압축 데이터 및 컨퍼런스 참가자 음성 압축 데이터를 각각 분리하는 디포맷터부, 컨퍼런스 SD 압축 데이터를 복호화하여 컨퍼런스 장면에 대한 컨퍼런스 SD 정보를 복원하는 컨퍼런스 SD 복호화부, 컨퍼런스 참가자 음성 압축 데이터를 복호화하여 복수의 컨퍼런스 참가자 음성 신호를 생성하는 컨퍼런스 참가자 음성 복호화부 및 각 컨퍼런스 참가자 음성 신호에 컨퍼런스 SD 정보에 따라 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성하는 컨퍼런스 참가자 효과부를 포함한다.

본 발명의 또 다른 면에 따른 컨퍼런스 오디오 생성 장치는, 컨퍼런스 장면에 대한 컨퍼런스 SD 정보를 부호화하여 컨퍼런스 SD 압축 데이터를 생성하는 컨퍼런스 SD 부호화부, 복수의 컨퍼런스 참가자 음성에 대한 컨퍼런스 참가자 음성 신호를 부호화하여 컨퍼런스 참가자 음성 압축 데이터를 생성하는 컨퍼런스 참가자 음성 부호화부 및 컨퍼런스 SD 압축 데이터 및 컨퍼런스 참가자 음성 압축 데이터를 컨퍼런스 오디오 파일로 통합하는 포맷터부를 포함한다.

기타 실시예들의 구체적인 사항들은 상세한 설명 및 도면들에 포함되어 있다.

본 발명에 따르면, 사용자는 실감 객체 오디오 재생 장치를 통하여 객체별로 실감 객체 오디오 신호를 생성할 수 있어, 다양한 음을 재생할 수 있다. 또한, 사용자는 입력되는 오디오 파일 이외에 사용자의 입력에 따라 객체 오디오를 추가하여 실감 객체 오디오 신호를 생성할 수 있고, 다양한 음을 재생할 수 있다.

또한, 사용자는 실감 객체 오디오 생성 장치를 통하여 3차원 오디오 효과를 위한 실감 객체 오디오를 생성하고, SD 정보 및 객체 오디오 신호를 부호화하여 오디오 파일로 통합할 수 있다.

또한, 사용자는 컨퍼런스 오디오 재생 장치를 이용하여, 각 컨퍼런스 참가자 음성에 다양한 컨퍼런스 오디오 효과를 부가한 컨퍼런스 오디오를 재생할 수 있다.

또한, 사용자는 컨퍼런스 오디오 생성 장치를 이용하여, 사용자는 컨퍼런스를 위한 컨퍼런스 오디오를 생성하고, 컨퍼런스 SD 정보 및 컨퍼런스 참가자 음성 신호를 부호화하여 오디오 파일로 통합할 수 있다.

도 1은 본 발명의 일 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.
도 2는 본 발명의 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.
도 3은 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.
도 4는 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.
도 5는 본 발명의 일 실시예에 따른 실감 객체 오디오 인코딩 장치를 나타내는 블록도이다.
도 6은 본 발명의 다른 실시예에 따른 실감 객체 오디오 인코딩 장치를 나타내는 블록도이다.
도 7은 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.
도 8은 본 발명의 일 실시예에 따른 실감 객체 오디오 생성 장치를 나타내는 블록도이다.
도 9는 본 발명의 다른 실시예에 따른 실감 객체 오디오 생성 장치를 나타내는 블록도이다.
도 10은 본 발명의 일 실시예에 따른 컨퍼런스 오디오 재생 장치를 나타내는 블록도이다.
도 11은 본 발명의 다른 실시예에 따른 컨퍼런스 오디오 재생 장치를 나타내는 블록도이다.
도 12는 본 발명의 또 다른 실시예에 따른 컨퍼런스 오디오 재생 장치를 나타내는 블록도이다.
도 13은 본 발명의 일 실시예에 따른 컨퍼런스 오디오 생성 장치를 나타내는 블록도이다.
도 14는 본 발명의 다른 실시예에 따른 컨퍼런스 오디오 생성 장치를 나타내는 블록도이다.

본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다. 한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며, 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 “포함한다(comprises)" 및/또는”포함하는(comprising)"은 언급된 구성요소, 단계, 동작 및/또는 소자는 하나 이상의 다른 구성요소, 단계, 동작 및/또는 소자의 존재 또는 추가를 배제하지 않는다.

이하, 첨부된 도면을 참조하여 본 발명의 실시예들를 상세히 설명하기로 한다.

도 1을 참조하여 본 발명의 일 실시예에 따른 실감 객체 오디오 재생 장치를 설명한다. 도 1은 본 발명의 일 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.

도 1을 참조하면, 본 발명의 일 실시예에 따른 실감 객체 오디오 재생 장치(10)는 디포맷터부(1100), SD 복호화부(1200), 객체 오디오 복호화부(1300) 및 객체 오디오 효과부(1400)을 포함한다.

디포맷터부(1100)는 입력되는 오디오 파일로부터 SD(Scene Description) 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리한다.

SD 복호화부(1200)는 SD 압축 데이터를 복호화하여 SD 정보를 복원한다.

객체 오디오 복호화부(1300)는 객체 오디오 압축 데이터를 복호화하여 복수 객체 각각의 오디오 신호인 객체 오디오 신호(1310~1330)를 생성한다.

객체 오디오 효과부(1400)는 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보(1210~1230)에 따라 객체별 오디오 효과를 객체 오디오 신호(1310~1330)에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성한다.

한편, 객체 오디오 신호(1310~1330)는 복수 객체 각각의 오디오 신호이다. 음악의 경우를 가정한다면, 각 객체는 음악 연주에 이용된 악기들일 수 있다. 또한, 각각의 객체 오디오 신호는 각각의 악기들에 대한 오디오 신호일 수 있다.

또한, SD 정보는 객체 오디오 신호(1310~1330)에 오디오 효과를 부가하여 실감 객체 오디오 신호를 생성하기 위한 정보를 포함한다. 여기서, 오디오 효과는 객체별 오디오 효과를 포함할 수 있다. 객체별 오디오 효과는 각 객체 오디오 신호에 부가하는 오디오 효과이다.

또한, SD 정보는 객체별 SD 정보(1210~1230)를 포함할 수 있다.

여기서, 객체별 SD 정보(1210~1230)는 객체 오디오 신호 각각에 개별적으로 적용되는 오디오 효과들과 재생 구간에 대한 내용이 수록되어 있는 정보이다.

객체별 SD 정보(1210~1230)는 객체별 오디오의 개수 정보, 객체별 오디오의 이름 정보, 객체별 오디오의 종류 정보, 객체별 오디오의 효과 정보, 객체별 오디오의 효과 적용 시간 정보, 객체별 오디오의 음량 정보, 객체별 오디오의 각도 및 거리 정보, 객체별 오디오의 외재화(Extermalization) 효과를 위한 각도 및 거리 정보, 객체별 오디오의 3D 효과 정보 및 3D 효과 정보를 위한 파라미터 정보, 객체별 오디오의 배경 정보, 객체별 오디오의 적용 시작 시각 정보, 객체별 오디오의 적용 종료 시각 정보, 객체별 오디오의 재생 관련 시각 정보 및 객체별 오디오의 파라미터 정보 중 적어도 하나를 포함하는 것일 수 있다.

여기서, 객체별 오디오의 파라미터 정보는 객체별 오디오가 가질 수 있는 파라미터를 나타내는 정보이다.

또한, 객체별 오디오의 파라미터 정보는 각 객체별 오디오의 잔향(Echo) 효과를 위한 반사계수, 공간의 모양 및 크기 정보를 포함할 수 있다.

또한, 객체별 오디오의 파라미터 정보는 오디오 패닝(Panning) 효과를 위한 각도 및 거리 정보를 포함할 수 있다.

또한, 객체별 오디오의 파라미터 정보는 각 객체별 오디오의 특성에 따라 각 객체별로 가지는 특성 파라미터 정보를 포함할 수 있다.

한편, 객체별 오디오의 배경 정보는 각 객체별 오디오의 객체가 위치하는 공간(예를 들어: 극장, 집 등)을 나타내는 정보이다.

한편, 객체별 오디오의 3D 효과 정보는 각 객체별 오디오의 3D 효과(예를 들어, 잔향 효과, 외재화 효과, 패닝 효과)를 나타내기 위한 정보이다.

한편, SD 복호화부(1200)가 복호화하는 SD 정보는 SD 정보1(1210), SD 정보2(1220)에서 SD 정보n(1230)까지 복수개의 객체별 정보가 있을 수 있다.

또한, 객체 오디오 복호화부(1300)가 복호화하는 객체 오디오 신호는 객체 오디오 신호1(1310), 객체 오디오 신호2(1320)에서 객체 오디오 신호n(1330)까지 복수개의 객체 오디오 신호가 있을 수 있다.

따라서, 객체 오디오 효과부(1400)는 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성한다.

예를 들어, SD 정보1(1210)에는 객체 오디오 신호1(1310)에 대응하는 객체별 오디오의 배경 정보가 포함될 수 있다.

객체 오디오 신호1(1310)의 객체가 바이올린이고, 객체 오디오 신호1(1310)에 대응하는 SD 정보1(1210)는 특정 객체를 극장에서 연주하는 효과 정보라고 하면, 객체 오디오 효과부(1400)는 바이올린을 극장에서 연주하는 것처럼 객체별 오디오 효과를 객체 오디오 신호1(1310)에 부가하여, 실감 객체 오디오 신호를 생성하는 것 일 수 있다. SD 정보2(1220)부터 SD 정보n까지도 동일하게 적용될 수 있다. 또한, 하나의 SD 정보와 대응되는 객체 오디오 신호는 하나 또는 그 이상이 될 수 있다.

한편, 객체 오디오 효과부(1400)가 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는데 있어서, 각 객체 오디오 신호의 시간을 분할하여 객체별 SD 정보에 따라 객체별 오디오 효과를 부가하는 것일 수 있다.

예를 들어, 객체 오디오 효과부(1400)는 객체별 SD 정보에 따라 객체 오디오 신호1(1310)를 1초부터 3초까지는 운동장에서 연주하는 것처럼 객체별 오디오 효과를 부가하고, 10초부터 20초까지는 객체별 오디오의 음량이 최대가 되도록 객체별 오디오 효과를 부가할 수 있다.

따라서, 객체별 SD 정보(1210~1230)는 각 객체 오디오 신호(1310~1330)의 시간을 분할하여 객체별 오디오 효과를 부가하기 위해, 객체별 오디오의 효과 적용 시간 정보, 객체별 오디오의 적용 시작 시각 정보, 객체별 오디오의 적용 종료 시각 정보, 객체별 오디오의 재생 관련 시각 정보를 포함할 수 있다.

한편, SD 압축 데이터로는 MPEG-4 BIFs (Binary Format for Scenes), MPEG-4 LASeR (Lightweight Application Scene Representation) 등이 사용될 수 있다.

또한, 객체 오디오 압축 데이터에는 MP3 (MPEG-1,2,2.5 layer 3), AAC (Advanced Audio Coding), ALS (MPEG-4 Audio Lossless Coding) 등의 오디오 코덱이 사용될 수 있다.

따라서, 사용자는 실감 객체 오디오 재생 장치(10)를 이용하여, 객체 오디오 신호에 SD 정보를 부가할 수 있고, 실감 객체 오디오 신호를 생성할 수 있다.

도 2를 참조하여 본 발명의 다른 실시예에 따른 실감 객체 오디오 재생 장치를 설명한다. 도 2는 본 발명의 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.

도 2를 참조하면, 본 발명의 다른 실시예에 따른 실감 객체 오디오 재생 장치(11)는 디포맷터부(1100), SD 복호화부(1200), 객체 오디오 복호화부(1300), 객체 오디오 효과부(1400) 및 오디오 믹싱부(1500)를 포함한다.

여기서, 도 1에 도시된 구성요소와 동일한 기능을 수행하는 구성요소에 대해서는 동일한 도면 부호를 사용하고, 해당 구성요소에 대한 상세한 설명을 생략한다.

오디오 믹싱부(1500)는 각 실감 객체 오디오 신호를 적어도 하나의 음(Sound)으로 합성한다.

한편, SD 정보는 객체 관계 SD 정보를 더 포함할 수 있다.

여기서, 객체 관계 SD 정보는 객체간의 상대적인 관계를 나타내는 정보이다. 객체 관계 SD 정보는 객체 오디오 신호를 합성하는데 있어서 사용된다.

객체 관계 SD 정보는 객체 오디오 신호의 합성 비율 정보, 객체 오디오 간의 상대적인 위치 정보, 합성된 음 및 객체 오디오들 전체에 적용되는 효과의 종류 정보, 합성된 음 및 객체 오디오들 전체에 적용되는 효과의 적용 시간 정보, 합성된 음 및 객체 오디오들 전체에 적용되는 효과를 위한 오디오 파라미터 정보, 합성된 음에 적용되는 3D 효과 정보, 합성된 음에 적용되는 3D 효과 정보를 위한 파라미터 정보, 합성된 음의 외재화(Extermalization) 효과를 위한 각도 정보, 합성된 음의 외재화(Extermalization) 효과를 위한 거리 정보, 객체 오디오 신호의 합성을 위한 오디오 믹싱 정보 및 객체 오디오 간의 음량 조절 정보 중 적어도 하나를 포함할 수 있다.

여기서, 오디오 파라미터 정보는 합성된 음이 가질 수 있는 파라미터를 나타내는 정보이다.

여기서, 오디오 파라미터 정보는 합성된 음의 잔향(Echo) 효과를 위한 반사계수, 공간의 모양 및 크기 정보를 포함할 수 있다.

또한, 오디오 파라미터 정보는 합성된 음의 오디오 패닝(Panning) 효과를 위한 각도 및 거리 정보를 포함할 수 있다.

한편, 객체 오디오 간의 상대적인 위치 정보는 각 객체별 각도 및 거리 정보로 나타낼 수 있다.

또한, 오디오 믹싱부(1500)는 SD 정보 중 객체간의 상대적인 관계를 나타내는 객체 관계 SD 정보에 따라 적어도 하나의 음으로 실감 객체 오디오 신호를 합성하는 것일 수 있다.

따라서, 사용자는 실감 객체 오디오 재생 장치(11)를 이용하여, 객체 오디오 신호에 SD 정보를 부가할 수 있고, 실감 객체 오디오 신호를 생성할 수 있다. 또한, 복수개의 실감 객체 오디오 신호를 합성할 수 있다.

한편, 본 발명의 다른 실시예에 따른 실감 객체 오디오 재생 장치(11)는 사용자 SD 입력부(1700)를 더 포함할 수 있다.

사용자 SD 입력부(1700)는 사용자 SD 정보를 사용자로부터 제공받는다.

여기서, 사용자 SD 정보는 사용자가 입력하는 SD 정보이다. 사용자 SD 정보는 SD 정보에 대응되며, 동일한 구조를 가진다. 사용자 SD 정보는 객체별 SD 정보 및 객체 관계 SD 정보 중 적어도 하나를 포함할 수 있다.

한편, 객체 오디오 효과부(1400)는 사용자 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 부가하여 실감 객체 오디오 신호를 생성하는 것일 수 있다.

예를 들어, 사용자가 특정 객체를 집 안에서 연주하는 효과 정보를 사용자 SD 정보로 입력하고, 대응하는 객체 오디오 신호의 객체가 바이올린이라면, 객체 오디오 효과부(1400)는 바이올린을 집 안에서 연주하는 것처럼 객체별 오디오 효과를 객체 오디오 신호에 부가하여, 실감 객체 오디오 신호를 생성하는 것 일 수 있다.

한편, 사용자 SD 정보는 SD 복호화부(1200)에서 생성된 SD 정보와는 독립적일 수 있다. 따라서, 객체 오디오 효과부(1400)는 SD 복호화부(1200)에서 생성된 SD 정보를 변경하지 않고 실감 객체 오디오 신호를 생성할 수 있다. 또한, 객체 오디오 효과부(1400)는 실감 객체 오디오 신호를 생성하는데 있어서, SD 복호화부(1200)에서 생성된 SD 정보와 사용자 SD 정보를 모두 이용할 수 있다.

한편, 오디오 믹싱부(1500)는 사용자 SD 정보 중 객체간의 상대적인 관계를 나타내는 객체 관계 SD 정보에 따라 적어도 하나의 음으로 실감 객체 오디오 신호를 합성하는 것일 수 있다.

따라서, 사용자는 사용자의 선호에 따라 SD 정보를 입력하여 실감 객체 오디오 신호를 생성할 수 있다. 또한, 사용자는 객체별로 실감 객체 오디오 신호를 생성할 수 있어, 다양한 음을 생성할 수 있다.

도 3을 참조하여 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 설명한다. 도 3은 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.

도 3을 참조하면, 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치(12)는 디포맷터부(1100), SD 복호화부(1200), 객체 오디오 복호화부(1300), 객체 오디오 효과부(1400), 오디오 믹싱부(1500) 및 통합 오디오 효과부(1600)를 포함한다.

여기서, 도 2에 도시된 구성요소와 동일한 기능을 수행하는 구성요소에 대해서는 동일한 도면 부호를 사용하고, 해당 구성요소에 대한 상세한 설명을 생략한다.

통합 오디오 효과부(1600)는 오디오 믹싱부(1500)로부터 생성된 음에 통합 오디오 효과를 부가한다.

여기서, 통합 오디오 효과는 오디오 믹싱부(1500)에서 합성된 음에 효과를 부가하기 위한 오디오 효과이다. 통합 오디오 효과는 합성된 음을 진폭 조절, 시간축 조절 및 주파수 조절하는 것일 수 있다.

한편, SD 정보 및 사용자 SD 정보는 통합 오디오 효과 정보를 포함할 수 있다. 통합 오디오 효과 정보는 통합 오디오 효과를 나타내는 정보이다.

통합 오디오 효과 정보는 진폭 조절 정보, 시간축 조절 정보 및 주파수 조절 정보를 포함하는 것일 수 있다.

또한, 통합 오디오 효과 정보는 오디오 이퀄라이제이션(Audio Equalization) 정보를 포함하는 것일 수 있다.

또한, 통합 오디오 효과 정보는 잔향 효과 정보, 외제화 효과 정보, 패닝 효과 정보를 포함하는 것일 수 있다.

따라서, 통합 오디오 효과부(1600)는 SD 복호화부(1200)로부터 SD 정보를 제공 받아 오디오 믹싱부(1500)로부터 생성된 음에 통합 오디오 효과를 부가할 수 있다.

도 4를 참조하여 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 설명한다. 도 4는 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.

도 4를 참조하면, 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치(13)는 디포맷터부(1100), SD 복호화부(1200), 객체 오디오 복호화부(1300), 객체 오디오 효과부(1400), 오디오 믹싱부(1500) 및 사용자 객체 생성부(1800)를 포함한다.

사용자 객체 생성부(1800)는 사용자의 입력에 따라 객체 오디오를 추가하고 추가된 객체 오디오의 오디오 신호인 사용자 객체 오디오 신호를 저장한다.

한편, 객체 오디오 효과부(1400)는 사용자 객체 오디오 신호를 더 제공 받아 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 것일 수 있다.

한편, 오디오 믹싱부(1500)는 사용자 객체 오디오 신호를 더 제공 받아 적어도 하나의 음으로 합성하는 것일 수 있다.

또한, 오디오 믹싱부(1500)는 SD 정보 중 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보에 따라 각 실감 객체 오디오 신호를 적어도 하나의 음(Sound)으로 합성하는 것일 수 있다.

따라서, 사용자는 입력되는 오디오 파일 이외에 사용자의 입력에 따라 객체 오디오를 추가하여 실감 객체 오디오 신호를 생성할 수 있고, 다양한 음을 재생할 수 있다.

한편, 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치는 SD 정보 및 객체 오디오 신호가 입력되는 경우 디포맷터부(1100), SD 복호화부(1200) 및 객체 오디오 복호화부(1300)를 생략할 수 있다.

구체적으로, 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치는 객체 오디오 효과부(1400) 및 오디오 믹싱부(1500)를 포함할 수 있다.

여기서, 객체 오디오 효과부(1400)는 SD(Scene Description) 정보를 입력받아 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 것이다.

오디오 믹싱부(1500)는 각 실감 객체 오디오 신호를 적어도 하나의 음(Sound)으로 합성하는 것이다.

한편, 오디오 믹싱부(1500)는 SD 정보 중 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보에 따라 각 실감 객체 오디오 신호를 적어도 하나의 음(Sound)으로 합성하는 것일 수 있다.

따라서, 사용자는 SD 정보를 이용하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성할 수 있다.

한편, 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치는 사용자 SD 입력부(1700) 및 객체 오디오 효과부(1400)를 포함할 수 있다.

여기서, 사용자 SD 입력부(1700)는 사용자 SD 정보를 사용자로부터 제공받는다.

객체 오디오 효과부(1400)는 사용자 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성한다.

따라서, 사용자는 사용자 SD 정보를 입력하여, 사용자의 선호에 따른 실감 객체 오디오 신호를 생성할 수 있다.

한편, 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치는 사용자 SD 입력부(1700), 객체 오디오 효과부(1400) 및 오디오 믹싱부(1500)를 포함할 수 있다.

따라서, 사용자는 사용자 SD 정보를 입력하여, 사용자의 선호에 따른 실감 객체 오디오 신호를 생성할 수 있고, 각 실감 객체 오디오 신호를 하나의 음으로 합성할 수 있다.

도 5를 참조하여 본 발명의 일 실시예에 따른 실감 객체 오디오 인코딩 장치를 설명한다. 도 5는 본 발명의 일 실시예에 따른 실감 객체 오디오 인코딩 장치를 나타내는 블록도이다.

도 5를 참조하면, 실감 객체 오디오 인코딩 장치(14)는 디포맷터부(1100), 사용자 SD 입력부(1700), 사용자 SD 부호화부(1710) 및 사용자 파일 포맷터부(1720)를 포함한다.

디포맷터부(1100)는 입력되는 오디오 파일로부터 SD 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리한다.

사용자 SD 입력부(1700)는 사용자의 설정에 의한 사용자 SD 정보를 입력받는다.

사용자 SD 부호화부(1710)는 사용자 SD 정보를 사용자 SD 압축 데이터로 부호화 한다.

사용자 파일 포맷터부(1720)는 SD 압축 데이터, 객체 오디오 압축 데이터 및 사용자 SD 압축 데이터를 오디오 파일로 통합한다.

따라서, 사용자는 실감 객체 오디오 인코딩 장치(14)를 이용하여, 입력되는 사용자 SD 정보를 사용자 SD 압축 데이터로 부호화하고, 입력되는 오디오 파일에 추가할 수 있다. 또한, 사용자는 사용자 SD 정보를 입력되는 오디오 파일에 통합하여, 사용자 SD 정보를 오디오 파일에 보관하고, 재사용할 수 있다.

도 5를 참조하면, 실감 객체 오디오 인코딩 장치(14)는 사용자 객체 오디오 생성부(1800) 및 사용자 객체 부호화부(1810)를 더 포함할 수 있다.

사용자 객체 부호화부(1810)는 사용자 객체 오디오 신호를 사용자 객체 오디오 압축 데이터로 부호화한다.

사용자 파일 포맷터부(1720)는 사용자 객체 부호화부(1810)에서 사용자 객체 오디오 압축 데이터를 제공받아 SD 압축 데이터, 객체 오디오 압축 데이터 및 사용자 객체 오디오 압축 데이터를 오디오 파일로 통합하는 것일 수 있다.

따라서, 사용자는 사용자 객체 오디오 신호를 입력되는 오디오 파일에 통합하여, 사용자 객체 오디오 신호를 오디오 파일에 보관하고, 재사용할 수 있다.

도 6을 참조하여 본 발명의 다른 실시예에 따른 실감 객체 오디오 인코딩 장치를 설명한다. 도 6은 본 발명의 다른 실시예에 따른 실감 객체 오디오 인코딩 장치를 나타내는 블록도이다.

도 6을 참조하면, 실감 객체 오디오 인코딩 장치(15)는 디포맷터부(1100), SD 복호화부(1200), 객체 오디오 복호화부(1300), 객체 오디오 효과부(1400), 오디오 믹싱부(1500), 사용자 SD 입력부(1700), 사용자 SD 부호화부(1710) 및 사용자 파일 포맷터부(1720)를 포함한다.

여기서, 도2 및 도 5에 도시된 구성요소와 동일한 기능을 수행하는 구성요소에 대해서는 동일한 도면 부호를 사용하고, 해당 구성요소에 대한 상세한 설명을 생략한다.

실감 객체 오디오 인코딩 장치(15)는 본 발명의 실시예들에 따른 실감 객체 오디오 재생 장치의 SD 복호화부(1200), 객체 오디오 복호화부(1300), 객체 오디오 효과부(1400) 및 오디오 믹싱부(1500)를 이용하여 사용자 SD 정보가 부가된 실감 객체 오디오 신호 및 합성된 음을 쉽게 알 수 있다.

여기서, 객체 오디오 효과부(1400)는 사용자 SD 입력부(1700)에서 입력받은 사용자 SD 정보 중 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성할 수 있다.

한편, 사용자 SD 정보는 객체 오디오 신호에 대응하는 객체별 SD 정보, 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보 및 객체의 통합된 음에 효과를 부가하기 위한 통합 오디오 효과를 나타내는 통합 오디오 효과 정보 중 적어도 하나를 포함하는 것일 수 있다.

또한, 오디오 믹싱부(1500)는 사용자 SD 정보 중 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보에 따라 각 실감 객체 오디오 신호를 적어도 하나의 음(Sound)으로 합성하는 것일 수 있다.

따라서, 사용자는 실감 객체 오디오 인코딩 장치(15)를 이용하여, 입력되는 사용자 SD 정보를 사용자 SD 압축 데이터로 부호화하고, 입력되는 오디오 파일에 추가할 수 있다. 또한, 사용자는 사용자 SD 정보를 입력되는 오디오 파일에 통합하여, 사용자 SD 정보를 오디오 파일에 보관하고, 재사용할 수 있다. 또한, 사용자는 객체 오디오 효과부(1400) 및 오디오 믹싱부(1500)를 이용하여, 사용자 SD 정보가 부가된 실감 객체 오디오 신호 및 합성된 음을 쉽게 알 수 있다.

도 7을 참조하여 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 설명한다. 도 7은 본 발명의 또 다른 실시예에 따른 실감 객체 오디오 재생 장치를 나타내는 블록도이다.

한편, 전술한 실시예들에 따른 실감 객체 오디오 인코딩 장치는 본 발명의 실시예들에 따른 실감 객체 오디오 재생 장치의 일부분으로서 포함될 수 있다.

따라서, 사용자는 실감객체 오디오 재생 장치를 사용하면서 실감 객체 오디오 인코딩 장치를 함께 사용할 수 있어, 실감 객체 오디오 신호의 편집, 보관, 재생을 한번에 할 수 있다.

도 7을 참조하면, 실감 객체 오디오 재생 장치(16)는 디포맷터부(1100), SD 복호화부(1200), 객체 오디오 복호화부(1300), 객체 오디오 효과부(1400), 오디오 믹싱부(1500), 통합 오디오 효과부(1600), 사용자 SD 입력부(1700), 사용자 SD 부호화부(1710), 사용자 파일 포맷터부(1720), 사용자 객체 생성부(1800) 및 사용자 객체 부호화부(1810)를 포함한다.

여기서, 도3 및 도 4에 도시된 구성요소와 동일한 기능을 수행하는 구성요소에 대해서는 동일한 도면 부호를 사용하고, 해당 구성요소에 대한 상세한 설명을 생략한다.

한편, 사용자 파일 포맷터부(1720)은 SD 압축 데이터, 객체 오디오 압축 데이터 및 사용자 객체 오디오 압축 데이터를 오디오 파일로 통합하는 것일 수 있다.

한편, 객체 오디오 효과부(1400)는 사용자 SD 입력부(1700)에서 입력받은 사용자 SD 정보 중 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성할 수 있다.

또한, 객체 오디오 효과부(1400)는 사용자 객체 생성부(1800)로부터 사용자 객체 오디오 신호를 더 제공 받아 객체별 SD 정보에 따라 객체별 오디오 효과를 객체 오디오 신호에 부가하여 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 것일 수 있다.

한편, 오디오 믹싱부(1500)는 사용자 객체 생성부(1800)로부터 사용자 객체 오디오 신호를 더 제공 받아 적어도 하나의 음으로 합성하는 것일 수 있다.

또한, 오디오 믹싱부(1500)는 사용자 SD 입력부(1700)에서 입력받은 사용자 SD 정보 중 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보에 따라 각 실감 객체 오디오 신호를 적어도 하나의 음(Sound)으로 합성하는 것일 수 있다.

따라서, 사용자는 객체별로 실감 객체 오디오 신호를 생성하여 다양한 음을 재생함과 동시에, 실감 객체 오디오 인코딩 장치를 이용하여, 입력되는 사용자 SD 정보를 사용자 SD 압축 데이터로 부호화하고, 입력되는 오디오 파일에 추가할 수 있다. 또한, 실감 객체 오디오 인코딩 장치를 이용하여, 입력되는 사용자 객체 오디오 신호를 사용자 객체 오디오 압축 데이터로 부호화하여, 입력되는 오디오 파일에 추가할 수 있다.

또한, 사용자는 사용자 SD 정보를 입력되는 오디오 파일에 통합하여, 사용자 SD 정보를 오디오 파일에 보관하고, 재사용할 수 있다. 또한, 사용자는 실감객체 오디오 재생 장치를 사용하면서 실감 객체 오디오 인코딩 장치를 함께 사용할 수 있어, 실감 객체 오디오 신호의 편집, 보관, 재생을 한번에 할 수 있다.

도 8을 참조하여 본 발명의 일 실시예에 따른 실감 객체 오디오 생성 장치를 설명한다. 도 8은 본 발명의 일 실시예에 따른 실감 객체 오디오 생성 장치를 나타내는 블록도이다.

도 8을 참조하면 실감 객체 오디오 생성 장치(20)는 SD 부호화부(2100), 객체 오디오 부호화부(2200) 및 포맷터부(2300)를 포함한다.

SD 부호화부(2100)는 3차원의 오디오 효과를 위한 SD 정보(Scene Description Information)를 부호화하여 SD 압축 데이터를 생성한다.

객체 오디오 부호화부(2200)는 복수 객체 각각의 오디오 신호인 객체 오디오 신호를 부호화하여 객체 오디오 압축 데이터를 생성한다.

포맷터부(2300)는 SD 압축 데이터 및 객체 오디오 압축 데이터를 오디오 파일로 통합한다.

따라서, 사용자는 3차원 오디오 효과를 위한 실감 객체 오디오를 생성하고, SD 정보 및 객체 오디오 신호를 부호화하여 오디오 파일로 통합할 수 있다.

도 9를 참조하여 본 발명의 다른 실시예에 따른 실감 객체 오디오 생성 장치를 설명한다. 도 9는 본 발명의 다른 실시예에 따른 실감 객체 오디오 생성 장치를 나타내는 블록도이다.

도 9를 참조하면, 실감 객체 오디오 생성 장치(21)는 SD 부호화부(2100), 객체 오디오 부호화부(2200), 포맷터부(2300)를 포함한다.

또한, 객체 오디오 부호화부(2200)는 사용자의 선택에 따라 부호화의 코덱의 종류를 설정하는 사용자 부호화 설정부(2400)를 더 포함한다.

또한, 포맷터부(2300)는 사용자가 선택한 코덱의 종류에 따라 오디오 파일로 통합하는 것일 수 있다.

한편, 사용자가 선택할 수 있는 코덱은 SD 정보 및 객체 오디오 신호를 부호화 할 수 있으면 되고, 해당 코덱의 형태에 제한되지 않는다.

예를 들어, SD 압축 데이터로는 MPEG-4 BIFs (Binary Format for Scenes), MPEG-4 LASeR (Lightweight Application Scene Representation) 등이 사용될 수 있다.

도 10을 참조하여 본 발명의 일 실시예에 따른 컨퍼런스 오디오 재생 장치를 설명한다. 도 10은 본 발명의 일 실시예에 따른 컨퍼런스 오디오 재생 장치를 나타내는 블록도이다.

본 발명의 실시예들에 따른 컨퍼런스 오디오 재생 장치는 전술한 본 발명의 실시예들에 따른 실감 객체 오디오 재생 장치와 구조적으로 대응될 수 있다.

도 10을 참조하면, 컨퍼런스 오디오 재생 장치(30)는 디포맷터부(3100), 컨퍼런스 SD 복호화부(3200), 컨퍼런스 참가자 음성 복호화부(3300), 컨퍼런스 참가자 효과부(3400), 컨퍼런스 오디오 믹싱부(3500) 및 컨퍼런스 통합 오디오 효과부(3600)를 포함한다.

디포맷터부(3100)는 입력되는 컨퍼런스 오디오 파일로부터 컨퍼런스 SD 압축 데이터 및 컨퍼런스 참가자 음성 압축 데이터를 각각 분리한다.

컨퍼런스 SD 복호화부(3200)는 컨퍼런스 SD 압축 데이터를 복호화하여 컨퍼런스 장면에 대한 컨퍼런스 SD 정보를 생성한다.

컨퍼런스 참가자 음성 복호화부(3300)는 컨퍼런스 참가자 음성 압축 데이터를 복호화하여 복수의 컨퍼런스 참가자 음성 신호를 생성한다.

컨퍼런스 참가자 효과부(3400)는 각 컨퍼런스 참가자 음성 신호에 컨퍼런스 SD 정보에 따라 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성한다.

컨퍼런스 오디오 믹싱부(3500)는 컨퍼런스 SD 정보에 따라 컨퍼런스 참가자 오디오 신호를 적어도 하나의 음(Sound)으로 합성한다.

컨퍼런스 통합 오디오 효과부(3600)는 컨퍼런스 오디오 믹싱부(3500)로부터 생성된 음에 통합 오디오 효과를 부가한다.

한편, 컨퍼런스 장면은 좌석 배치, 컨퍼런스 도구 등에 대한 컨퍼런스 SD 정보로 표현될 수 될 수 있다.

컨퍼런스 SD 정보는 컨퍼런스 컨트롤 정보, 컨퍼런스 참가자 정보, 컨퍼런스 참가자 ID(Identification) 정보 및 컨퍼런스 참가자 위치 정보 중 적어도 하나를 포함하는 것일 수 있다.

컨퍼런스 컨트롤 정보는 컨퍼런스 참가자 음성 신호를 조절하는 정보 및 컨퍼런스 도구를 컨트롤하는 정보 중 적어도 하나를 포함하는 것일 수 있다.

예를 들어, 컨퍼런스 도구로 마이크가 있는 경우, 컨퍼런스 컨트롤 정보는 마이크를 전원 제어 및 음량 조절하는 정보를 포함하는 것일 수 있다.

컨퍼런스 참가자 정보는 컨퍼런스 참가자의 이름, 성별 등에 대한 개인 신상에 관련된 정보이다.

컨퍼런스 참가자 ID 정보는 다른 컨퍼런스 참가자와 구별을 위한 ID정보이다.

컨퍼런스 참가자 위치 정보는 컨퍼런스에 있어서, 컨퍼런스 참가자의 절대적 위치와 상대적 위치를 포함한다.

예를 들어, 회의실에서 참가자가 착석한 특정 자리에 대한 좌표일 수 있다. 또한, 회의 진행자를 기준으로 반대편 자리에 참가자가 위치하는 것일 수 있다.

컨퍼런스 참가자 음성 신호는 각각의 컨퍼런스 참가자에 대한 음성을 오디오 신호로 변환한 것이다. 이러한 신호는 마이크 등으로부터 제공될 수 있다.

따라서, 컨퍼런스 참가자 효과부(3400)는 각 컨퍼런스 참가자 음성 신호에 컨퍼런스 SD 정보에 따라 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성한다.

예를 들어, 컨퍼런스 SD 정보에는 각 컨퍼런스 참가자 음성 신호에 대응하는 참가자가 사용하는 마이크의 음량 정보가 포함될 수 있다.

따라서, 사용자는 컨퍼런스 오디오 재생 장치(30)를 이용하여, 각 컨퍼런스 참가자 음성에 다양한 컨퍼런스 오디오 효과를 부가한 컨퍼런스 오디오를 재생할 수 있다.

도 11을 참조하여 본 발명의 다른 실시예에 따른 컨퍼런스 오디오 재생 장치를 설명한다. 도 11은 본 발명의 다른 실시예에 따른 컨퍼런스 오디오 재생 장치를 나타내는 블록도이다.

여기서, 도 11에 도시된 구성요소와 동일한 기능을 수행하는 구성요소에 대해서는 동일한 도면 부호를 사용하고, 해당구성요소에 대한 상세한 설명을 생략한다.

도 11을 참조하면, 컨퍼런스 오디오 재생 장치(31)는 디포맷터부(3100), 컨퍼런스 SD 복호화부(3200), 컨퍼런스 참가자 음성 복호화부(3300), 컨퍼런스 참가자 효과부(3400), 컨퍼런스 오디오 믹싱부(3500) 및 컨퍼런스 통합 오디오 효과부(3600)를 포함한다. 또한, 컨퍼런스 오디오 재생 장치(31)는 사용자 컨퍼런스 컨트롤 정보부(3900)를 더 포함할 수 있다.

사용자 컨퍼런스 컨트롤 정보부(3900)는 컨퍼런스 SD 정보, 컨퍼런스 참가자 음성 신호 및 컨퍼런스 오디오 효과를 컨트롤하는 정보를 포함하는 사용자 컨퍼런스 컨트롤 정보를 사용자로부터 제공받는다.

한편, 컨퍼런스 참가자 효과부(3400)는 사용자 컨퍼런스 컨트롤 정보에 따라 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성하는 것일 수 있다.

또한, 컨퍼런스 오디오 믹싱부(3500)는 사용자 컨퍼런스 컨트롤 정보에 따라 적어도 하나의 음으로 컨퍼런스 참가자 오디오 신호를 합성하는 것일 수 있다.

따라서, 사용자는 사용자 컨퍼런스 컨트롤 정보를 입력하여, 컨퍼런스를 컨트롤 할 수 있고, 컨퍼런스 참가자 오디오 신호에 다양한 컨퍼런스 오디오 효과를 부가할 수 있다.

도 12를 참조하여 본 발명의 또 다른 실시예에 따른 컨퍼런스 오디오 재생 장치를 설명한다. 도 12는 본 발명의 또 다른 실시예에 따른 컨퍼런스 오디오 재생 장치를 나타내는 블록도이다.

여기서, 도 10에 도시된 구성요소와 동일한 기능을 수행하는 구성요소에 대해서는 동일한 도면 부호를 사용하고, 해당구성요소에 대한 상세한 설명을 생략한다.

도 12를 참조하면, 컨퍼런스 오디오 재생 장치(32)는 디포맷터부(3100), 컨퍼런스 SD 복호화부(3200), 컨퍼런스 참가자 음성 복호화부(3300), 컨퍼런스 참가자 효과부(3400), 컨퍼런스 오디오 믹싱부(3500) 및 컨퍼런스 통합 오디오 효과부(3600)를 포함할 수 있다. 또한, 컨퍼런스 오디오 재생 장치(32)는 사용자 컨퍼런스 SD 입력부(3700), 사용자 컨퍼런스 SD 부호화부(3710) 및 컨퍼런스 참가자 추가부(3800)를 더 포함할 수 있다.

사용자 컨퍼런스 SD 입력부(3700)는 사용자의 설정에 의한 사용자 컨퍼런스 SD 정보를 입력 받는다.

사용자 컨퍼런스 SD 부호화부(3710)는 사용자 컨퍼런스 SD 정보를 컨퍼런스 SD 압축 데이터로 부호화한다.

컨퍼런스 참가자 추가부(3800)는 사용자에 의해 신규의 컨퍼런스 참가자를 추가하고 신규 컨퍼런스 참가자의 컨퍼런스 참가자 음성 신호를 저장한다.

한편, 컨퍼런스 참가자 효과부(3400)는 사용자 컨퍼런스 SD 정보에 따라 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성하는 것일 수 있다.

또한, 컨퍼런스 오디오 믹싱부(3500)는 신규 컨퍼런스 참가자의 컨퍼런스 참가자 음성 신호를 더 제공 받아 적어도 하나의 음으로 합성하는 것일 수 있다.

따라서, 사용자는 사용자 컨퍼런스 SD 정보를 입력하여 컨퍼런스를 컨트롤 할 수 있고, 사용자 컨퍼런스 SD 정보를 부호화하여 저장 및 관리할 수 있다. 또한, 사용자는 신규의 컨퍼런스 참가자를 추가할 수 있고, 또한, 컨퍼런스 참가자 오디오 신호에 다양한 컨퍼런스 오디오 효과를 부가할 수 있다.

도 13을 참조하여 본 발명의 일 실시예에 따른 컨퍼런스 오디오 생성 장치를 설명한다. 도 13은 본 발명의 일 실시예에 따른 컨퍼런스 오디오 생성 장치를 나타내는 블록도이다.

도 13을 참조하면, 컨퍼런스 오디오 생성 장치(40)는 컨퍼런스 SD 부호화부(4100), 컨퍼런스 참가자 음성 부호화부(4200) 및 포맷터부(4300)를 포함한다.

컨퍼런스 SD 부호화부(4100)는 컨퍼런스 장면에 대한 컨퍼런스 SD 정보를 부호화하여 컨퍼런스 SD 압축 데이터를 생성한다.

컨퍼런스 참가자 음성 부호화부(4200)는 복수의 컨퍼런스 참가자 음성에 대한 컨퍼런스 참가자 음성 신호를 부호화하여 컨퍼런스 참가자 음성 압축 데이터를 생성한다.

포맷터부(4300)는 컨퍼런스 SD 압축 데이터 및 컨퍼런스 참가자 음성 압축 데이터를 컨퍼런스 오디오 파일로 통합한다.

따라서, 사용자는 컨퍼런스를 위한 컨퍼런스 오디오를 생성하고, 컨퍼런스 SD 정보 및 컨퍼런스 참가자 음성 신호를 부호화하여 오디오 파일로 통합할 수 있다.

도 14를 참조하여 본 발명의 일 실시예에 따른 컨퍼런스 오디오 생성 장치를 설명한다. 도 14는 본 발명의 다른 실시예에 따른 컨퍼런스 오디오 생성 장치를 나타내는 블록도이다.

도 14를 참조하면, 본 발명의 다른 실시예에 따른 컨퍼런스 오디오 생성 장치(41)는 컨퍼런스 SD 부호화부(4100), 컨퍼런스 참가자 음성 부호화부(4200) 및 포맷터부(4300)를 포함하고, 컨퍼런스 컨트롤 정보부(4400) 및 컨퍼런스 참가자 정보부(4500)를 더 포함할 수 있다.

컨퍼런스 컨트롤 정보부(4400)는 컨퍼런스를 컨트롤하는 컨퍼런스 컨트롤 정보를 저장 및 관리한다.

컨퍼런스 참가자 정보부(4500)는 컨퍼런스 참가자에 대한 컨퍼런스 참가자 정보를 저장 및 관리한다.

한편, 컨퍼런스 SD 부호화부(4100)는 컨퍼런스 컨트롤 정보부(4400) 및 컨퍼런스 참가자 정보부(4500)로부터 컨퍼런스 컨트롤 정보 및 컨퍼런스 참가자 정보를 제공 받고, 컨퍼런스 장면에 대한 컨퍼런스 SD 정보를 부호화하여 컨퍼런스 SD 압축 데이터를 생성할 수 있다.

따라서, 사용자는 컨퍼런스 컨트롤 정보 및 컨퍼런스 참가자 정보를 독립적으로 저장 및 관리할 수 있으며, 컨퍼런스 오디오를 생성하는데 있어서, 필수적인 컨퍼런스 컨트롤 정보 및 컨퍼런스 참가자 정보가 컨퍼런스 오디오 파일에서 누락되는 것을 방지할 수 있다.

본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 또한, 본 발명의 실시예들은 실감 객체 오디오 재생 방법, 실감 객체 오디오 생성 방법, 실감 객체 오디오 인코딩 방법, 컨퍼런스 오디오 재생 방법 및 컨퍼런스 오디오 생성 방법과 같이 카테고리를 달리하여 구현될 수 있다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims

입력되는 오디오 파일로부터 SD(Scene Description) 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리하는 디포맷터부;
상기 SD 압축 데이터를 복호화하여 SD 정보(Scene Description Information)를 복원하는 SD 복호화부;
상기 객체 오디오 압축 데이터를 복호화하여 복수 객체 각각의 오디오 신호인 객체 오디오 신호를 복원하는 객체 오디오 복호화부; 및
상기 SD 정보 중 상기 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 상기 객체 오디오 신호에 부가하여 상기 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 객체 오디오 효과부
를 포함하는 실감 객체 오디오 재생 장치.
제 1 항에 있어서,
상기 각 실감 객체 오디오 신호를 합성하는 오디오 믹싱부
를 더 포함하는 실감 객체 오디오 재생 장치.
제 2 항에 있어서,
사용자 SD 정보를 사용자로부터 제공받는 사용자 SD 입력부를 더 포함하고,
상기 객체 오디오 효과부는 상기 사용자 SD 정보 중 상기 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 부가하여 실감 객체 오디오 신호를 생성하는 것
인 실감 객체 오디오 재생 장치.
제 3 항에 있어서,
상기 오디오 믹싱부는 상기 사용자 SD 정보 중 상기 객체간의 상대적인 관계를 나타내는 객체 관계 SD 정보에 따라 상기 실감 객체 오디오 신호를 합성하는 것
인 실감 객체 오디오 재생 장치.
제 2 항에 있어서,
상기 오디오 믹싱부로부터 생성된 음에 통합 오디오 효과를 부가하는 통합 오디오 효과부
를 더 포함하는 것인 실감 객체 오디오 재생 장치.
제 5 항에 있어서,
상기 통합 오디오 효과부는 상기 SD 복호화부로부터 상기 SD 정보를 제공받아, 상기 SD 정보에 따라 상기 오디오 믹싱부로부터 생성된 음에 통합 오디오 효과를 부가하는 것
인 실감 객체 오디오 재생 장치.
제 2 항에 있어서,
사용자의 입력에 따라 객체 오디오를 추가하고 추가된 상기 객체 오디오의 오디오 신호인 사용자 객체 오디오 신호를 저장하는 사용자 객체 생성부를 더 포함하고,
상기 오디오 믹싱부는 상기 사용자 객체 오디오 신호를 더 제공받아 합성하는 것
인 실감 객체 오디오 재생 장치.
제 2 항에 있어서,
상기 오디오 믹싱부는
상기 SD 정보 중 객체간의 상대적인 관계를 나타내는 객체 관계 SD 정보에 따라 상기 각 실감 객체 오디오 신호를 합성하는 것
인 실감 객체 오디오 재생 장치.
제 1 항에 있어서,
상기 객체별 SD 정보는 객체별 오디오의 개수 정보, 객체별 오디오의 이름 정보, 객체별 오디오의 종류 정보, 객체별 오디오의 효과 정보, 객체별 오디오의 효과 적용 시간 정보, 객체별 오디오의 음량 정보, 객체별 오디오의 각도 및 거리 정보, 객체별 오디오의 외재화(Extermalization) 효과를 위한 각도 및 거리 정보, 객체별 오디오의 3D 효과 정보 및 3D 효과 정보를 위한 파라미터 정보, 객체별 오디오의 배경 정보, 객체별 오디오의 적용 시작 시각 정보, 객체별 오디오의 적용 종료 시각 정보, 객체별 오디오의 재생 관련 시각 정보 및 객체별 오디오의 파라미터 정보 중 적어도 하나를 포함하는 것
인 실감 객체 오디오 재생 장치.
입력되는 오디오 파일로부터 SD(Scene Description) 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리하는 디포맷터부;
사용자의 설정에 의한 사용자 SD 정보를 입력받는 사용자 SD 입력부;
상기 사용자 SD 정보를 사용자 SD 압축 데이터로 부호화하는 사용자 SD 부호화부;
상기 SD 압축 데이터, 상기 객체 오디오 압축 데이터 및 상기 사용자 SD 압축 데이터를 오디오 파일로 통합하는 사용자 파일 포맷터부
를 포함하는 실감 객체 오디오 인코딩 장치.
제 10 항에 있어서,
상기 SD 압축 데이터를 복호화하여 SD 정보(Scene Description Information)를 복원하는 SD 복호화부;
상기 객체 오디오 압축 데이터를 복호화하여 적어도 하나의 음원을 제공하는 객체의 객체 오디오 신호를 생성하는 객체 오디오 복호화부; 및
상기 사용자 SD 입력부에서 입력받은 상기 사용자 SD 정보 중 상기 객체별 SD 정보에 따라 객체별 오디오 효과를 상기 객체 오디오 신호에 부가하여 상기 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 객체 오디오 효과부를 더 포함하고
상기 객체 오디오 효과부는 상기 객체별 SD 정보에 따라 상기 객체별 오디오 효과를 부가하여 실감 객체 오디오 신호를 생성하는 것
인 실감 객체 오디오 인코딩 장치.
제 11 항에 있어서,
상기 사용자 SD 정보는
상기 객체 오디오 신호에 대응하는 객체별 SD 정보, 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보 및 객체의 통합된 음에 효과를 부가하기 위한 통합 오디오 효과를 나타내는 통합 오디오 효과 정보 중 적어도 하나를 포함하는 것
인 실감 객체 오디오 인코딩 장치
제 11 항에 있어서,
상기 각 실감 객체 오디오 신호를 합성하는 오디오 믹싱부
를 더 포함하는 실감 객체 오디오 인코딩 장치.
3차원의 오디오 효과를 위한 SD 정보(Scene Description Information)를 부호화하여 SD 압축 데이터를 생성하는 SD 부호화부;
복수 객체 각각의 오디오 신호인 객체 오디오 신호를 부호화하여 객체 오디오 압축 데이터를 생성하는 객체 오디오 부호화부; 및
상기 SD 압축 데이터 및 상기 객체 오디오 압축 데이터를 오디오 파일로 통합하는 포맷터부
를 포함하는 실감 객체 오디오 생성 장치.
제 14 항에 있어서,
상기 SD 정보는
상기 객체 오디오 신호에 대응하는 객체별 SD 정보, 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보 및 객체의 통합된 음에 효과를 부가하기 위한 통합 오디오 효과를 나타내는 통합 오디오 효과 정보 중 적어도 하나를 포함하는 것
인 실감 객체 오디오 생성 장치.
제 15 항에 있어서,
상기 객체별 SD 정보는 객체별 오디오의 개수 정보, 객체별 오디오의 이름 정보, 객체별 오디오의 종류 정보, 객체별 오디오의 효과 정보, 객체별 오디오의 효과 적용 시간 정보, 객체별 오디오의 음량 정보, 객체별 오디오의 각도 및 거리 정보, 객체별 오디오의 외재화(Extermalization) 효과를 위한 각도 및 거리 정보, 객체별 오디오의 3D 효과 정보 및 3D 효과 정보를 위한 파라미터 정보, 객체별 오디오의 배경 정보, 객체별 오디오의 적용 시작 시각 정보, 객체별 오디오의 적용 종료 시각 정보, 객체별 오디오의 재생 관련 시각 정보 및 객체별 오디오의 파라미터 정보 중 적어도 하나를 포함하는 것
인 실감 객체 오디오 생성 장치.
제 14 항에 있어서,
상기 객체 오디오 부호화부는
사용자의 선택에 따라 부호화의 코덱의 종류를 설정하는 사용자 부호화 설정부를 더 포함하고
상기 포맷터부는 사용자가 선택한 코덱의 종류에 따라 오디오 파일로 통합하는 것
인 실감 객체 오디오 생성 장치.
입력되는 컨퍼런스 오디오 파일로부터 컨퍼런스 SD 압축 데이터 및 컨퍼런스 참가자 음성 압축 데이터를 각각 분리하는 디포맷터부;
상기 컨퍼런스 SD 압축 데이터를 복호화하여 컨퍼런스 장면에 대한 컨퍼런스 SD 정보를 복원하는 컨퍼런스 SD 복호화부;
상기 컨퍼런스 참가자 음성 압축 데이터를 복호화하여 복수의 컨퍼런스 참가자 음성 신호를 생성하는 컨퍼런스 참가자 음성 복호화부; 및
상기 각 컨퍼런스 참가자 음성 신호에 상기 컨퍼런스 SD 정보에 따라 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성하는 컨퍼런스 참가자 효과부
를 포함하는 컨퍼런스 오디오 재생 장치.
제 18 항에 있어서,
상기 컨퍼런스 SD 정보에 따라 상기 컨퍼런스 참가자 오디오 신호를 합성하는 컨퍼런스 오디오 믹싱부
를 더 포함하는 컨퍼런스 오디오 재생 장치.
제 19 항에 있어서,
상기 컨퍼런스 SD 정보, 상기 컨퍼런스 참가자 음성 신호 및 상기 컨퍼런스 오디오 효과를 컨트롤하는 정보를 포함하는 사용자 컨퍼런스 컨트롤 정보를 사용자로부터 제공받는 사용자 컨퍼런스 컨트롤 정보부를 더 포함하고,
상기 컨퍼런스 참가자 효과부는 상기 사용자 컨퍼런스 컨트롤 정보에 따라 상기 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성하는 것
인 컨퍼런스 오디오 재생 장치.
제 20 항에 있어서,
상기 컨퍼런스 오디오 믹싱부는 상기 사용자 컨퍼런스 컨트롤 정보에 따라 상기 컨퍼런스 참가자 오디오 신호를 합성하는 것
인 컨퍼런스 오디오 재생 장치.
제 19 항에 있어서,
상기 컨퍼런스 오디오 믹싱부로부터 생성된 음에 통합 오디오 효과를 부가하는 컨퍼런스 통합 오디오 효과부
를 더 포함하는 것인 컨퍼런스 오디오 재생 장치.
제 18 항에 있어서,
사용자에 의해 신규의 컨퍼런스 참가자를 추가하고 신규 컨퍼런스 참가자의 컨퍼런스 참가자 음성 신호를 저장하는 컨퍼런스 참가자 추가부를 더 포함하고,
상기 컨퍼런스 오디오 믹싱부는 상기 신규 컨퍼런스 참가자의 컨퍼런스 참가자 음성 신호를 더 제공받아 상기 컨퍼런스 참가자 오디오 신호를 합성하는 것
인 컨퍼런스 오디오 재생 장치.
제 18 항에 있어서,
사용자의 설정에 의한 사용자 컨퍼런스 SD 정보를 입력받는 사용자 컨퍼런스 SD 입력부를 더 포함하고,
상기 컨퍼런스 참가자 효과부는 상기 사용자 컨퍼런스 SD 정보에 따라 컨퍼런스 오디오 효과를 부가하여 컨퍼런스 참가자 오디오 신호를 생성하는 것
인 컨퍼런스 오디오 재생 장치.
제 24 항에 있어서,
상기 사용자 컨퍼런스 SD 정보를 컨퍼런스 SD 압축 데이터로 부호화하는 사용자 컨퍼런스 SD 부호화부
를 더 포함하는 컨퍼런스 오디오 재생 장치.
컨퍼런스 장면에 대한 컨퍼런스 SD 정보를 부호화하여 컨퍼런스 SD 압축 데이터를 생성하는 컨퍼런스 SD 부호화부;
복수의 컨퍼런스 참가자 음성에 대한 컨퍼런스 참가자 음성 신호를 부호화하여 컨퍼런스 참가자 음성 압축 데이터를 생성하는 컨퍼런스 참가자 음성 부호화부; 및
상기 컨퍼런스 SD 압축 데이터 및 상기 컨퍼런스 참가자 음성 압축 데이터를 컨퍼런스 오디오 파일로 통합하는 포맷터부
를 포함하는 컨퍼런스 오디오 생성 장치.
제 26 항에 있어서,
컨퍼런스 참가자 음성신호를 조절하는 정보 및 컨퍼런스 도구를 컨트롤 하는 정보 중 적어도 하나를 포함하는 컨퍼런스 컨트롤 정보를 저장 및 관리하는 컨퍼런스 컨트롤 정보부; 및
컨퍼런스 참가자에 대한 컨퍼런스 참가자 정보를 저장 및 관리하는 컨퍼런스 참가자 정보부;
를 더 포함하고,
상기 컨퍼런스 SD 정보는 상기 컨퍼런스 컨트롤 정보, 상기 컨퍼런스 참가자 정보, 컨퍼런스 참가자 ID(Identification) 정보 및 컨퍼런스 참가자 위치 정보 중 적어도 하나를 포함하는 것
인 컨퍼런스 오디오 생성 장치.
SD(Scene Description) 정보를 입력받아 상기 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 상기 객체 오디오 신호에 부가하여 상기 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 객체 오디오 효과부; 및
상기 각 실감 객체 오디오 신호를 합성하는 오디오 믹싱부
를 포함하는 실감 객체 오디오 재생 장치.
제 28 항에 있어서, 상기 오디오 믹싱부는
상기 SD 정보 중 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보에 따라 상기 각 실감 객체 오디오 신호를 합성하는 것
인 실감 객체 오디오 재생 장치.
사용자 SD 정보를 사용자로부터 제공받는 사용자 SD 입력부; 및
상기 사용자 SD 정보 중 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 상기 객체 오디오 신호에 부가하여 상기 각 객체 오디오 신호에 대응하는 실감 객체 오디오 신호를 생성하는 객체 오디오 효과부
를 포함하는 실감 객체 오디오 재생 장치.
제 30 항에 있어서,
상기 객체 오디오 효과부는 상기 사용자 SD 정보 중 상기 각 객체 오디오 신호에 대응하는 객체별 SD 정보에 따라 객체별 오디오 효과를 부가하여 실감 객체 오디오 신호를 생성하는 것
인 실감 객체 오디오 재생 장치.
제 30 항에 있어서,
상기 각 실감 객체 오디오 신호를 합성하는 오디오 믹싱부를 더 포함하는 것
인 실감 객체 오디오 재생 장치.
제 32 항에 있어서,
상기 오디오 믹싱부는
상기 SD 정보 중 객체간의 상대적인 관계를 나타내는 정보가 포함된 객체 관계 SD 정보에 따라 상기 각 실감 객체 오디오 신호를 합성하는 것
인 실감 객체 오디오 재생 장치.
제 33 항에 있어서,
상기 객체 관계 SD 정보는
상기 각 객체 오디오 신호의 합성 비율 정보, 상기 객체 오디오 간의 상대적인 위치 정보, 상기 합성된 음 및 상기 객체 오디오들 전체에 적용되는 효과의 종류 정보, 상기 합성된 음 및 상기 객체 오디오들 전체에 적용되는 효과의 적용 시간 정보, 상기 합성된 음 및 상기 객체 오디오들 전체에 적용되는 효과를 위한 오디오 파라미터 정보, 상기 합성된 음에 적용되는 3D 효과 정보, 상기 합성된 음에 적용되는 3D 효과 정보를 위한 파라미터 정보, 상기 합성된 음의 외재화(Extermalization) 효과를 위한 각도 정보, 상기 합성된 음의 외재화 효과를 위한 거리 정보, 상기 객체 오디오 신호의 합성을 위한 오디오 믹싱 정보 및 상기 객체 오디오 간의 음량 조절 정보 중 적어도 하나를 포함하는 것
인 실감 객체 오디오 재생 장치.
입력되는 오디오 파일로부터 SD(Scene Description) 압축 데이터 및 객체 오디오 압축 데이터를 각각 분리하는 디포맷터부;
사용자의 입력에 따라 객체 오디오를 추가하고 추가된 객체 오디오의 오디오 신호인 사용자 객체 오디오 신호를 저장하는 사용자 객체 생성부;
상기 사용자 객체 오디오 신호를 사용자 객체 오디오 압축 데이터로 부호화하는 사용자 객체 부호화부;
상기 SD 압축 데이터, 상기 객체 오디오 압축 데이터 및 상기 사용자 객체 오디오 압축 데이터를 오디오 파일로 통합하는 사용자 파일 포맷터부
를 포함하는 실감 객체 오디오 인코딩 장치.