KR100275779B1

KR100275779B1 - 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치 및 방법

Info

Publication number: KR100275779B1
Application number: KR1019980043712A
Authority: KR
Inventors: 김도형
Original assignee: 윤종용; 삼성전자주식회사
Priority date: 1998-10-19
Filing date: 1998-10-19
Publication date: 2000-12-15
Also published as: KR20000026251A

Abstract

본 발명은 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하기 위한 장치 및 방법에 관한 것으로, 이러한 장치는 좌측, 우측, 중앙, 좌측 서라운드 및 우측 서라운드 채널로 구성된 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하는 장치에 있어서, 중앙채널을 제외한 각각의 채널로부터 출력되는 오디오 데이터와 각 채널별로 소정의 위치에 가상음원을 생성시켜주는 머리전달함수를 콘볼루션하는 제1필터부, 중앙채널로부터 출력되는 오디오 데이터와 복수개의 좌,우 대칭되는 소정의 각도를 갖고 중앙채널에 해당하는 소정의 위치에 가상음원을 생성시켜주는 머리전달함수를 소정의 시간 주기로 번갈아가며 선택하여 콘볼루션하는 제2필터부 및 제1필터부와 제2필터부로부터 출력된 음원들중 좌측음원은 좌측음원끼리 우측음원은 우측음원끼리 합성하는 합성부를 포함함을 특징으로 한다.

본 발명에 의하면, 기존의 2채널 출력 헤드폰으로 5채널 오디오 재생효과를 즐길 수 있기 때문에 최소의 비용으로 최대의 3차원 음향효과를 즐길 수 있다. 특히 소형 카세트인 경우에는 장소에 구애받지 않고 어디서나 다채널 방송을 헤드폰으로 즐길 수 있기 때문에 다양한 응용분야에 적용할 수 있다.

Description

5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치 및 방법

본 발명은 3차원 입체음향에 관한 것으로, 특히 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하여 헤드폰으로 재생하는 장치 및 방법에 관한 것이다.

종래의 오디오 산업에서는 청각사건이 1차원적인 전방 혹은 2차원적인 평면 상에서 형성되도록 하여 현장감에 충실한 음향을 재생하고자 하였다. 즉, 초창기의 모노 시스템에서 스테레오 시스템을 거쳐 돌비 서라운드 입체음향 시스템도 모두 현장감이 있는 음향의 재생을 추구하였다. 그러나, 멀티미디어 산업이 발전되면서, 시각적인 정보와 더불어 청각적인 정보 즉, 음향신호의 기록 및 재생 기술은 그 목표를 현장감의 충실한 재생에서 좀 더 적극적으로 나아가 청각 사건을 임의의 위치에 둘 수 있는 3차원 음향 공간의 자유로운 재생으로 바꾸고 있다.

근래에는 대부분의 오디오 기기들이 모노 음향 신호를 재생하기 보다는 스테레오 음향 신호를 재생한다. 스테레오 음향 신호를 재생할 때 재생되는 신호들에 의해 느낄 수 있는 현장감의 범위는 재생 스피커들이 설치되는 위치에 따라 한정된다. 이에, 현장감의 범위를 보다 확장하기 위하여, 스피커의 재생 능력을 개선하고, 신호처리에 의해 가상 신호들을 만들어 주는 연구들이 진행되었다.

이러한 연구의 결과, 대표적인 시스템이 5개의 스피커를 이용한 서라운드 재생 방식의 돌비 서라운드 입체음향 시스템이다. 이것은 후방 스피커로 출력되는 가상 신호를 별도로 처리한다. 이러한 가상 신호를 만드는 방법은 신호의 공간적인 이동에 따른 지연을 주고, 신호의 크기를 줄여서 후방으로 전달하는 것이었다. 현재, 가정용 비디오 및 레이저 디스크의 대부분은 돌비 프로로직 서라운드(DOLBY PROLOGIC SURROUND)라는 입체음향 기술을 채용하고 있어, 이를 재생할 수 있는 기기만 있으면, 일반 가정에서도 영화관 수준의 긴장감 넘치는 음향을 체험할 수 있다.

이와 같이 채널 수를 증가시킴으로써 보다 현장감에 충실한 음향 재생 효과를 얻을 수는 있으나, 늘어나는 채널 수 만큼의 스피커가 추가도 필요하게 되어, 이에 따른 비용과 설치 공간의 문제가 발생하였다.

이러한 문제는 인간이 3차원 공간에 존재하는 소리를 듣고 느끼는 것에 대한 연구 결과를 적용시킴으로써 개선될 수 있다. 특히, 인간의 소리 인식에 대한 연구들 가운데 양쪽 귀를 함께 고려한 연구들이 3차원 공간에서의 음원 인식에 중대한 영향을 미치는 것이다.

이와 같은 양쪽 귀에 대한 연구는 양쪽 귀로 들어오는 입력 신호들의 상호 영향에 대한 연구, 즉 오른쪽 귀와 왼쪽 귀로 느끼는 소리의 신호의 크기의 차이(Interaural Intensity Difference) 또는 소리의 전달 시간의 차이(Interaural Time Difference)로 발생하는 오른쪽 귀와 왼쪽 귀로 들어오는 소리의 위상의 차이에 대한 것들에 관한 것이다. 이러한 양쪽 귀에 대한 연구 결과에 의해 인간이 공간상의 한 점에 존재하는 음원을 인식하는 인식 특성이 모델링되었다. 이러한 인식 특성은 머리 전달 함수(Head Related Transfer Function:이하에서 HRTF라 칭한다)라고 불린다.

머리 전달 함수(HRTF)는 음원으로부터 귀의 고막으로 전달되는 경로를 모델링한 필터 계수로서, 음원과 머리와의 상대적인 위치 관계에 따라 그 값이 다른 성질을 갖는다. 머리 전달 함수(HRTF)는 공간상의 어떤 한 점에 음원이 존재할 때 그 신호가 양쪽 귀로 전송되는 경우의 특징에 대한 중이(Middle Ear)에서의 임펄스 응답 또는 전달함수로 표현된다. 이러한 머리 전달 함수(HRTF)를 응용하여, 소리가 존재하는 곳을 3차원 공간상의 임의의 위치로 옮겨주는 처리가 가능하게 되었다.

한편, 인간의 청각이 어떻게 3차원 음향 공간을 인식하는가에 대하여 많은 연구가 이루어져, 근래에는 가상 음원을 만들어 실제의 응용분야를 찾고 있는 상태이다.

일반적으로, 스테레오 음향이 가장 균형있게 들리는 위치는 두 스피커를 연결하는 직선을 밑변으로 하는 정삼각형의 점정이 되는 부분이다. 그러나, 청취자가 이 위치에서만 음향을 듣는다는 것은 공간 제약상 많은 문제가 발생한다. 또한, 청취자가 듣고 있는 위치에 따라 음향의 좌우 균형을 맞추는 것을 매우 어렵다.

특히, 최근 들어 개인용 멀티미디어 PC나 휴대형 카세트 등과 같이 1인용 멀티미디어 기기가 각광을 받으면서 헤드폰에 의한 사운드 재생이 두각을 나타내기 시작하였다. 요즘들어 3차원 입체영상과 사운드를 지원하는 게임들이 급속하게 개발되고 있는 시점에서 헤드폰을 이용한 게임은 그 부가가치가 매우 높아지고 있는 상황이다. 그러나 헤드폰에 의한 재생은 스피커의 그것에 비해 또 다른 한계가 있다. 그것은 재생되는 음의 위치가 머리 안에서 느껴지는 현상이다. 이러한 현상을 극복하기 위한 노력들이 많이 연구되고 있다.

앞서 언급하였지만 최근들어 채널수를 늘려서 현장감을 느낄 수 있는 재생이 가능하도록 하는 연구들이 많이 수행되고 있는데 그 대표적인 기기가 DVD(Digital Video Disc)와 고화질 TV(High Definition TV)를 대상으로 하는 5.1채널 오디오 시스템이다. 그리고 이러한 기기들은 향후 가정용 극장 시스템(Home Theater System)의 일대 변화를 불러일으킬 핵심적인 기기로 부상하고 있다. 특히 다채널 오디오 방송이 대중화가 되면 개인용 카세트를 이용하여 헤드폰으로 이동중에 언제든지 음악을 즐길 수 있는 날이 멀지 않았으므로 헤드폰에 의한 음장재생은 매우 시장성이 있는 응용분야이다.

하지만 스피커 재생의 경우를 예를 들더라도, 이렇게 채널수를 증가시켜줌에 따라서, 보다 현장감에 충실한 음악 재생 효과는 얻을 수가 있으나, 늘어나는 채널 수 만큼의 스피커와 앰프가 추가로 필요하게 됨에 따라, 많은 수의 스피커와 앰프들 때문에 많은 비용이 드는 문제와 넓은 재생 공간을 필요로 하는 문제가 있다.

현재 대중화 되어 있는 스테레오 오디오 재생은 단순히 2채널 출력만 존재하기 때문에 2개의 스피커나 헤드폰만으로 충분히 그 효과를 즐길 수 있다. 그러나 과거의 오디오 발전추세로 미루어 짐작해 보면, 향후에는 오디오 매체가 차츰 다채널화 되어갈 것이 분명하다. 현재 DVD나 HDTV 방송 등에서도 이미 다채널 오디오를 적용하고 있고 멀티미디어 국제 표준화 기구인 MPEG-4(Moving Picture Expert Group)에서도 다채널 오디오에 대한 표준화 규격을 채택하고 있다.

이것은 곧, 다가오는 21세기에는 대부분 오디오 매체가 스테레오에서 다채널로 대중화되어 갈 것을 미리 암시하는 것이다. 이럴 경우 제대로 된 사운드 효과를 청취자가 즐기기 위해서는 5개 이상의 스피커와 앰프가 구비되어야 한다. 그리고 헤드폰을 이용하여 들을 경우에는 2채널 출력만 존재하기 때문에, 5채널 출력을 2채널로 다운믹싱해서 들을 수 밖에 없다. 그러나 이 다운믹싱 기법은 앞에서도 기술하였지만 제대로 된 다채널 효과를 얻을 수 없다.

그리고 인간이 들을 수 있는 현장감 또는 입체감의 효과를 배가시키기 위해 두 개의 스피커에 추가하여 다채널 오디오 신호를 만들어 주는 방식이 있는데 그 대표적인 것이 돌비(Dolby)사의 프로로직(Prologic)이다. 이것의 제 기능을 최대한 살릴려면 각 채널별로 별도의 앰프와 스피커를 구비하고 청취자를 중심으로 5개의 스피커를 배치해야 그 효과를 크게 느낄 수 있다. 이렇게 들을려면 우선 5개의 스피커를 배치할 수 있는 충분한 공간 확보가 되어야 하고, 5개의 스피커를 구비하는 데 드는 비용도 감수해야 할 것이다. 이러한 점들을 고려해 볼때 사용자 입장에서는 결코 실용적이지 못하다.

이러한 비용 및 재생 환경의 제약조건들을 풀고, 또한 기존에 존재하는 2채널 재생 장치들과의 완벽한 호환성을 위해, 채널 수를 줄여 재생해주는 다운믹싱(down mixing) 방식들에 대한 연구가 많이 진행되어 왔다. 이러한 다운믹싱방식들은 거의 대부분의 경우에 있어서 수학식 1에서 보는 것과 같이 각 채널에 어떤 상수값을 곱해주는 처리를 하여 어떤 채널의 정보를 다른 채널들로 전달해주고 있다.

이와 같은 선형 변환에 의해 쉽게 각 가상채널에 해당하는 신호값들을 구해줄 수가 있고, 어느 정도의 음질의 개선 효과는 얻을 수가 있었으나, 실제 상황과는 다른 음질 재생 성능을 갖는다는 것이 현재까지 음악 매니아들의 평가이다.

여기서, 실제 상황과 다른 재생 효과를 갖는 이유는 인간이 갖는 소리 음원의 공간 위치에 따른 인식 차이를 단순히 어떤 채널에 같은 상수 값을 곱해 처리해 주었기 때문으로, 즉 실제 상황에 대한 고려가 제대로 되지 않았기 때문이다. 기존의 다채널 오디오 신호의 채널 수 변환 기법들은 다음과 같은 특징들을 가지고 있다.

다채널 오디오 신호의 채널수 변환시에 후방채널 신호들에 대해서는 주파수 대역을 줄여주는 처리를 한다. 채널수 변환시에 후방 채널 신호들에 대해, 전 주파수 대역에 대해 같은 상수 가중치를 곱해서 다운믹싱을 한다.

위와 같은 특징들로부터 발생되는 문제점들은 다음과 같은 것들이 있다.

첫째, 전체 가청 주파수 대역 신호들에 대한 처리가 아니기 때문에 소리 정보의 손실이 발생한다. 둘째, 전 주파수 대역에 대해서 같은 상수 가중치를 곱해줌으로써 인간이 특정 위치의 음원에 대해 가지고 있는 각 위치와 주파수들에 대한 민감도 차이 특성을 고려해 주지 않아 결과적으로 처리된 신호로부터 원래 신호와의 차이를 느낄 수 있다. 셋째, 스피커를 이용한 재생은 상호 간섭(cross-talk)현상이 발생하고 헤드폰을 이용한 재생은 상호 간섭은 일어나지 않지만 음장이 머리 내부에서 형성이 되는 문제점이 있다.

본 발명이 이루고자하는 기술적 과제는 중앙채널을 제외한 나머지 채널은 머리전달함수를 이용하여 콘볼루션된 결과만을 이용하고 중앙채널은 복수개의 머리전달함수를 이용하여 콘볼루션된 결과를 멀티플렉싱기법을 이용하여 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하여 헤드폰으로 재생하는 장치 및 방법을 제공함에 있다.

도 1은 ITU 국제 위원회에서 권고하는 5채널 오디오 음원의 표준 재생 위치를 나타낸 구성도이다.

도 2는 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 장치의 일실시예를 도시한 것이다.

상기 기술적 과제를 해결하기 위한 본 발명에 의한 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하여 헤드폰으로 재생하는 장치는 좌측, 우측, 중앙, 좌측 서라운드 및 우측 서라운드 채널로 구성된 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하는 장치에 있어서, 상기 중앙채널을 제외한 각각의 채널로부터 출력되는 오디오 데이터와 각 채널별로 소정의 위치에 가상음원을 생성시켜주는 머리전달함수를 콘볼루션하는 제1필터부; 상기 중앙채널로부터 출력되는 오디오 데이터와 복수개의 좌,우 대칭되는 소정의 각도를 갖고 상기 중앙채널에 해당하는 소정의 위치에 가상음원을 생성시켜주는 머리전달함수를 소정의 시간 주기로 번갈아가며 선택하여 콘볼루션하는 제2필터부; 및 상기 제1필터부와 상기 제2필터부로부터 출력된 음원들중 좌측음원은 좌측음원끼리 우측음원은 우측음원끼리 합성하는 합성부를 포함함을 특징으로 한다.

상기 다른 기술적 과제를 해결하기 위한 본 발명에 의한 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하는 방법은 좌측, 우측, 중앙, 좌측 서라운드 및 우측 서라운드 채널로 구성된 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하여 헤드폰으로 출력하기 위한 방법에 있어서, (a)상기 5채널 오디오 데이터중 상기 중앙채널을 제외한 4채널 오디오 데이터와 각 채널별로 소정의 위치에 가상음원을 생성시켜주는 좌,우 머리전달함수를 콘볼루션하는 단계; (b)상기 중앙채널 오디오 데이터와 복수개의 좌,우 대칭되는 소정의 각도를 갖고 상기 중앙채널에 해당하는 위치에 가상음원을 생성시켜주는 머리전달함수를 소정의 시간 주기로 번갈아가며 선택하여 콘볼루션하는 단계; 및 (c)상기 각 채널별 최종 필터 처리된 음원들중 좌측음원은 좌측음원끼리 우축음원은 우측음원끼리 합성하는 단계를 포함함을 특징으로 한다.

이하 도면을 참조하여 본 발명을 상세히 설명하기로 한다.

먼저, 본 발명에서 사용한 머리전달 함수에 대해 간단히 살펴보기로 한다. 이것은 자유음장(free field)에서 음원으로부터 인간의 귀의 외이도(ear canal)에 이르기까지의 음의 전파를 나타내는 주파수 평면 상에서의 전달 함수를 의미하며, 또한 인간의 머리 부분, 귓바퀴, 그리고 몸통으로 인한 주파수 왜곡이라고 볼 수 있다.

귀의 구조 측면에서 보면, 귓바퀴의 불규칙한 모양으로 인해 외이도로 소리가 들어가기 전 귀에 도달하는 신호의 주파수 스펙트럼이 왜곡되게 되는데, 이러한 왜곡은 소리의 방향이나 거리 등에 따라서 그 양상이 달라지므로 인간이 소리의 방향을 인지하는데 있어 이러한 주파수 성분의 변화가 큰 역할을 하게 되며 이러한 주파수 왜곡의 정도를 나타내는 것이 바로 머리전달 함수이다.

결국 머리전달 함수는 음원의 위치에 따라 크게 좌우되며, 같은 음원의 위치라도 왼쪽 귀와 오른쪽 귀의 머리전달 함수는 달라질 수 있다. 또한 사람마다 귓바퀴, 얼굴 모양이 모두 다르기 때문에 개인에 따라 이 머리전달 함수는 차이가 생기게 된다.

이러한 머리전달 함수를 이용하여 3차원 입체 음장을 재현해 줄 수 있는데 그 기본 원리는 특정한 위치의 머리전달 함수와 입력 오디오 신호를 콘볼루션하면 그 특정한 위치에서 소리가 나는 것처럼 느끼게 된다. 본 발명에서 사용한 머리전달 함수는 엠아이티(MIT)에서 제공한 것으로 케마르(KEMAR) 더미 헤드(dummy head) 모델을 이용한 실험측정 데이터이다. 이것은 44.1 kHz의 샘플링 주파수에서 오른쪽, 왼쪽 귀의 임펄스 응답 128 포인트로 구성이 되고 고도각(elevation)의 범위는 -40^o~ 90^o이고, 방위각(azimuth)의 범위는 0^o~ 360^o까지 총 710개의 위치에 대한 값들이다.

일반적으로 두 신호 h[n], x[n]의 시간 영역에서의 콘볼루션은 수학식 2에서 보는 것과 같이 FFT처리한 두 신호 H[k], X[k]의 주파수 영역에서의 곱을 IFFT하는 것과 같으므로, 주어진 128 포인트 머리전달 함수에 대해서는 256 포인트 FFT처리를 하게 된다. 일반적으로 시간 영역에서의 콘볼루션보다 주파수 영역에서 곱한 다음 시간영역 값을 다시 산출하는 것이 처리 속도가 더 빠르기 때문에 이 방법이 효과적이다.

이러한 기본적인 이론을 바탕으로 본 발명에서 제안하는 다채널 입력 오디오 소스에 대한 처리 방식을 설명한다.

우선, 5채널 오디오 데이타를 재생하여 들을 때 각 음원의 이상적인 조건을 살펴보면, 도 1에서 보는 것과 같이 좌측 음원(L)은 청취자를 중심으로 좌측 30^o의 각도를 갖고, 우측음원(R)은 청취자를 중심으로 우측 30^o의 각도를 갖는다. 그리고 좌측스테레오음원(LS)은 청취자를 중심으로 좌측 110^o의 각도를 갖고, 우측스테레오음원(RS)은 청취자를 중심으로 우측 110^o의 각도를 갖는다. 그리고 중앙 채널의 음원(C)은 청취자의 바로 정면 0^o에 위치한다. 이것은 ITU 국제 위원회에서 공식적으로 권고하는 음원의 위치이다.

따라서, 본 발명은 ITU 국제 위원회에서 공식적으로 권고하는 음원의 위치에 해당하는 가상음원을 생성하여 청취자로 하여금 3차원 스테레오 입체음향을 들을 수 있도록 5채널 데이터를 2채널 데이터로 변환하여 헤드폰으로 들을 수 있도록 한다.

도 2는 본 발명에 의한 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하여 헤드폰으로 재생하는 장치의 일실시예로서, 제1필터부(210), 제2필터부(220), 타임-멀티플렉싱부(230), 합성부(240)로 이루어진다.

제1필터부(210)는 5채널 오디오 데이터중 중앙채널을 제외한 4채널 오디오 데이터를 각 채널별로 좌,우측 머리전달함수와 콘볼루션하여 음원을 좌측과 우측으로 분리하고 각 채널에 해당하는 특정 위치에 가상음원을 생성시켜준다.

제2필터부(220)는 중앙채널 오디오 데이터를 소정의 각도를 갖는 복수개의 좌,우측 머리전달함수와 콘볼루션하여 음원을 좌측과 우측으로 분리하고 상기 중앙채널에 해당하는 위치에 가상음원을 생성시켜준다.

타임-멀티플렉싱부(230)은 제2필터부의 머리전달함수를 소정의 시간 주기로 번갈아가며 선택한다.

합성부(240)는 각 채널별 최종 필터 처리된 음원들을 좌측과 우측으로 나누어 합성한다.

상술한 구성에 의거하여 본 발명의 동작을 상세히 설명하기로 한다.

먼저, 중앙 채널(C)을 제외한 나머지 4채널에 대해서는 모두 같은 기법을 적용하여 처리하므로 따로 구분하여 기술한다.

전, 후방 4채널(L,R,LS,RS) 입력 소스에 대한 처리 방법은 위 수학식 2와 같은 방식으로 처리하면 되는데 여기서 h[n]이 듣고자 하는 가상의 음원으로부터 인간의 두 귀로 전달되는 음의 경로를 모델링한 머리전달 함수라고 생각하면 되고, x[n]은 입력 모노 신호라고 보면 된다. 즉, 각각의 입력 소스를 듣고자하는 위치에 해당되는 머리전달 함수와 콘볼루션한다. 본 발명에서 실험한 것은 주파수 영역에서의 두 함수의 곱이므로 256 포인트 FFT한 두 함수를 곱한 다음 다시 IFFT해서 그 결과를 얻을 수 있었다.

중앙 채널(C) 입력 소스에 대한 처리 방법은 단순히 위에서 기술한 전, 후방 채널과 같은 방식으로 처리를 하면 청취자의 정면에 해당하는 0^o에서의 머리전달 함수가 좌, 우가 같기 때문에 결과적으로 양쪽 헤드폰으로 출력되는 사운드는 모노와 같은 효과가 나므로 머리속에서 음상이 느껴지게 되는 문제점이 있다. 즉, 0^o를 포함하는 모든 평면(median plane)상의 음원은 아무리 머리전달 함수를 이용한 처리를 하더라도 모두 이렇게 머리속에서 느껴지게 된다.

이러한 문제점을 제거해 주기 위해 본 발명에서는 새로운 방식을 제안하였다. 즉, 처리해야 할 머리전달 함수를 좌, 우 다르게 설정하기 위해 0^o에 해당하는 머리전달 함수가 아닌 5^o~10^o의 머리전달 함수들을 사용하였다. 다만 단순히 이들 머리전달 함수를 단순히 콘볼루션만 하는 것이 아니고 도 2에서 보는 것과 같이 타임-멀티플렉싱기법을 도입하여 일정한 시간 주기를 두고 번갈아 가며 처리함으로써 일종의 귀의 잔청을 이용하여 청취자로 하여금 두 개의 머리전달 함수를 사용한 처리가 아니게끔 느끼게 해 주는 것이다.

즉, 각각의 필터 처리 결과는 서로 독립적이지만 이 결과들을 일정한 시간 간격을 두고 연속적으로 청취자에게 번갈아가며 출력시켜주면 청취자는 마치 끊기지 않은 연속된 음향인 것 처럼 느껴지게 된다. 여기서 가장 중요한 것이 각 필터간의 시간 간격이다. 만약 한 필터당 처리 시간을 너무 길게 설정하면 다른 필터 처리 결과를 청취자가 들을 수 있고 또 너무 짧으면 완전한 재생음을 들을 시간적 여유가 없게 되므로 아주 적절한 시간 간격을 설정해 주어야 한다.

일반적으로 인간의 청각 특성이 소리를 에코(echo)로 인지하기 시작하는 최소 시간이 20ms~50ms라고 알려져 있으므로 본 발명에서의 각 필터별 재생 주기는 최소한 20ms를 넘게 설정하여 실험하였다. 다시 한 번 정리하면 5^o와 -5^o에 해당하는 머리전달 함수를 이용하여 입력되는 신호에 대해 위에서 기술한 특정 시간 주기로 번갈아 가며 콘볼루션하여 센터채널에 대한 출력으로 만드는 방식이다.

이렇게 채널별로 계산되어진 각각의 처리 결과를 최종 출력시켜 주기 위해서는 이것들을 더해주는 연산 부분이 필요하다. 기존의 일반적인 방식을 살펴보면 왼쪽 출력단에는 전방 왼쪽, 중앙, 후방 왼쪽 신호를 보내고 오른쪽 출력단에는 전방 오른쪽, 중앙, 후방 오른쪽 신호를 보낸다. 그러나 본 발명에서는 각 채널별 필터 처리방식이 모두 같기 때문에 모노입력에 대한 스테레오 출력 결과를 단순히 좌, 우 출력끼리 더해주기만 하면 된다.

Claims

좌측, 우측, 중앙, 좌측 서라운드 및 우측 서라운드 채널로 구성된 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하는 장치에 있어서,

상기 중앙채널을 제외한 각각의 채널로부터 출력되는 오디오 데이터와 각 채널별로 소정의 위치에 가상음원을 생성시켜주는 머리전달함수를 콘볼루션하는 제1필터부;

상기 중앙채널로부터 출력되는 오디오 데이터와 복수개의 좌,우 대칭되는 소정의 각도를 갖고 상기 중앙채널에 해당하는 소정의 위치에 가상음원을 생성시켜주는 머리전달함수를 소정의 시간 주기로 번갈아가며 선택하여 콘볼루션하는 제2필터부; 및

상기 제1필터부와 상기 제2필터부로부터 출력된 음원들중 좌측음원은 좌측음원끼리 우측음원은 우측음원끼리 합성하는 합성부를 포함함을 특징으로 하는 5채널 오디오 데이타를 2채널로 변환하여 헤드폰으로 재생하는 장치.
제1항에 있어서, 상기 제2필터부는

청취자의 정면을 0^o라 할 때, 좌,우 대칭으로 소정의 각도 사이에 해당하는 복수개의 머리전달 함수를 이용함을 특징으로 하는 5채널 오디오 데이타를 2채널로 변환하여 헤드폰으로 재생하는 장치.
제2항에 있어서, 상기 제2필터부는

소정의 시간 주기를 갖고 상기 복수개의 좌우 대칭되는 머리전달함수를 번갈아가며 선택하기 위한 타임-멀티플렉싱부를 더 구비함을 특징으로 하는 5채널 오디오 데이타를 2채널로 변환하여 헤드폰으로 재생하는 장치.
좌측, 우측, 중앙, 좌측 서라운드 및 우측 서라운드 채널로 구성된 5채널 오디오 데이터를 2채널 오디오 데이터로 변환하여 헤드폰으로 출력하기 위한 방법에 있어서,

(a)상기 5채널 오디오 데이터중 상기 중앙채널을 제외한 4채널 오디오 데이터와 각 채널별로 소정의 위치에 가상음원을 생성시켜주는 좌,우 머리전달함수를 콘볼루션하는 단계;

(b)상기 중앙채널 오디오 데이터와 복수개의 좌,우 대칭되는 소정의 각도를 갖고 상기 중앙채널에 해당하는 위치에 가상음원을 생성시켜주는 머리전달함수를 소정의 시간 주기로 번갈아가며 선택하여 콘볼루션하는 단계; 및

(c)상기 각 채널별 최종 필터 처리된 음원들중 좌측음원은 좌측음원끼리 우축음원은 우측음원끼리 합성하는 단계를 포함함을 특징으로 하는 5채널 오디오 데이터를 2채널로 변환하여 헤드폰으로 재생하는 방법.