KR101600082B1

KR101600082B1 - 오디오 신호의 음질 평가 방법 및 장치

Info

Publication number: KR101600082B1
Application number: KR1020090006999A
Authority: KR
Inventors: 최인용
Original assignee: 삼성전자주식회사
Priority date: 2009-01-29
Filing date: 2009-01-29
Publication date: 2016-03-04
Also published as: US8879762B2; US20100189290A1; KR20100087928A

Abstract

본 발명의 실시 예에 따른 오디오 신호의 음질 평가 방법은, 현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 과정과, 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 과정과, 상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 과정을 포함한다.

오디오 코덱, 음질 평가, 멀티 채널 신호

Description

오디오 신호의 음질 평가 방법 및 장치{METHOD AND APPRATUS FOR A EVALUATION OF AUDIO SIGNAL QUALITY}

본 발명은 오디오 신호의 음질 평가 방법 및 장치에 관한 것이다. 더 상세하게는 채널 개수에 따른 오디오 신호의 음질 평가 방법 및 장치에 관한 것이다.

오디오 코덱(Codec)은 음성을 비롯한 여러 오디오 신호를 부호화하고, 복호화하기 위한 장치를 말한다. 최근에는 다양한 종류의 멀티 채널 코덱이 개발되고 있다. 일 예로, 5.1채널 오디오 코덱과 같은 멀티채널 코덱은 주로 영화 등의 멀티미디어 컨텐츠에서 오디오 신호의 부호화 및 복호화에 사용되는데, 후방 스피커 등을 이용해 서라운드 효과를 주기 위한 추가적인 오디오 채널을 지원한다. 한편, IPTV(Internet Protocol TV)나 DMB(Digiatal Multimedia Broadcasting) 등 무선망을 이용한 방송, 혹은 인터넷 방송 등의 서비스가 증가하면서 다양한 음성 코덱에 대한 수요도 증가하고 있으며, 서비스의 목적에 따라 적합한 음성 코덱을 선택하는 일은 중요해지고 있다.

이렇게 서비스의 종류에 따라 적합한 음성 코덱을 선택하기 위해서, 음성 코 덱을 통해 출력된 오디오 신호에 대한 음질을 평가할 수 있어야 한다. 이렇게 음질을 평가하기 위해서 다수의 청취자들이 직접 오디오 신호를 듣는 청취 평가를 수행할 수 있다. 그러나 이 경우 많은 시간과 비용이 소요된다는 문제가 있기 때문에, 음질 평가 장치를 이용하여 음질을 평가하는 방식이 사용되고 있다. 참고로 국제통신연합 방송분과(ITU(International Telecommunication Union)-R)에서는 오디오 코덱의 음질 평가 방법에 대한 권고안인 ITU-R Recommendation BS. 1387을 발행한 바 있다.

오디오 신호는 신호의 채널 수에 따라 크게 모노 신호, 스테레오 신호, 멀티 채널 신호로 분류할 수 있다. 멀티 채널의 대표적인 예는 5.1 채널 신호이다.

음질 평가 시 고려되어야 할 요소는 오디오 신호의 채널 수에 차이가 있다. 일 예로, 오디오 신호에 포함된 잡음의 크기, 음색의 차이, 시간 영역에서의 음 출렁임 등은 오디오 신호의 종류에 무관하게 음질 평가에 포함될 요소이다. 반면, 음장감, 음상의 위치, 음원의 넓이와 같은 공간적인 요소는 모노 신호의 평가 시에는 고려되지 않는다. 반면, 스테레오 신호의 평가 시에는 상기 공간적인 요소가 고려되어야 하며, 멀티 채널 신호의 평가 시 상기 공간적인 요소는 스테레오 신호의 평가시보다 더 많이 고려되어야 한다. 즉, 모노 채널만을 지원하는 오디오 코덱에 대한 음질 평가 시에는 서라운드 효과를 내기 위한 음향 품질들을 평가하는 요소가 필요하지 않지만, 멀티 채널 오디오 코덱의 음질 평가 시에는 서라운드 효과를 내기 위한 음향 품질을 평가하는 요소가 매우 중요하다. 그러나 기존의 음질 평가 장치는 이러한 오디오 신호의 종류에 따라 음질 평가 장치의 구조를 변경해야 하는 문제가 있다.

또한, 기존의 음질 평가 장치는 멀티 채널 신호를 평가할 때 스테레오 신호의 평가 방식과 유사한 방식을 사용한다. 따라서 멀티 채널 신호의 경우 음질 평가 장치를 이용한 평가 결과와 실제 사람이 평가한 청취 평가와의 상관도가 떨어지는 문제점이 있다. 이는 평가 장치의 성능이 좋지 못함을 의미한다.

이렇게 오디오 신호의 채널 수에 따라 음질 평가 시 고려되어야 할 요소가 다르기 때문에, 음질 평가에 있어서 오디오 신호의 채널 수에 따라 적절한 평가 방식을 선택하는 것은 매우 중요하다. 그러나 이를 위하여 사용자가 해당 오디오 신호가 몇 개의 채널을 가지는지를 음질 평가 전에 직접 알아내야 하는 것은 매우 불편한 일이다. 따라서 음질 평가 시 오디오 신호의 채널 수를 자동으로 검사할 필요가 있다.

또한, 청취자는 오디오 신호를 헤드폰 등을 통하여 들을 수도 있고, 스피커를 통해 듣기도 한다. 따라서 오디오 신호의 음질 평가 시 청취자의 청취 환경도 고려되어야 한다. 즉, 오디오 신호의 청취 환경에 따라서 오디오 신호의 음질 평가를 위한 오디오 코덱의 출력 신호를 가공하는 방법이 달라져야 한다. 그러나 기존의 음질 평가 장치는 이러한 요소를 고려하지 않았기 때문에 음질 평가의 성능이 떨어지는 문제가 있다.

본 발명은 오디오 신호의 종류에 따라 최적의 음질 평가를 위한 음질 평가 방법 및 장치를 제공한다.

본 발명은 오디오 신호의 채널 수를 결정하고, 결정된 채널 수에 따라 최적의 음질 평가기를 결정하는 방법 및 장치를 제공한다.

본 발명은 오디오 신호의 청취 환경에 따라 최적의 음질 평가기를 결정하는 방법 및 장치를 제공한다.

삭제

또한 본 발명의 실시 예에 따른 오디오 신호의 음질 평가 장치는, 현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 유효 채널 검사부와, 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 평가기 선택부와, 상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 음질 평가부를 포함한다.
또한 본 발명의 실시 예에 따른 오디오 신호의 음질 평가 방법은, 입력 오디오 신호의 기준 신호와 테스트 신호를 미리 정해진 시간 구간의 프레임들로 분할하는 과정과, 현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 과정과, 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 과정과, 상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 과정과, 상기 분할된 프레임들의 종합 음질 평가 점수를 계산하는 과정을 포함한다.
또한 본 발명의 실시 예에 따른 오디오 신호의 음질 평가 장치는, 입력 오디오 신호의 기준 신호와 테스트 신호를 미리 정해진 시간 구간의 프레임들로 분할하는 프레임 분할부와, 현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 유효 채널 결정부와, 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 평가기 선택부와, 상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 음질 평가부를 포함한다.

삭제

본 발명의 구성에 의하여 얻어지는 대표적인 효과는 다음과 같다.

본 발명은 오디오 신호의 종류, 즉, 오디오 신호가 가지는 채널의 개수에 따라 최적의 음질 평가기를 선택하여 음질 평가 성능을 향상시킨다. 또한, 멀티 채널 오디오 신호의 평가 시 종래에는 스테레오 신호의 평가 방식과 동일한 방식을 사용하였던 데 비하여, 본 발명에서는 멀티 채널의 성능 평가에 중요한 평가 인자를 추가하여 멀티 채널의 성능 평가시 평가의 정확도를 크게 향상시킬 수 있다. 또한, 본 발명은 전체 오디오 신호를 프레임 단위로 나누어 음질 평가를 수행하여 음질 평가의 유연성을 높일 수 있다.

이하 본 발명의 바람직한 실시 예들을 첨부한 도면을 참조하여 상세히 설명한다. 도면들 중 동일한 구성 요소들은 가능한 한 어느 곳에서든지 동일한 부호들로 나타내고 있음에 유의해야 한다. 또한, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능 및 구성에 대한 상세한 설명은 생략한다.

본 발명의 상세한 설명에 앞서, 본 발명의 주요 개념을 먼저 설명한다.

본 발명은 사용자가 오디오 신호의 채널 수를 미리 알고 있지 않아도, 오디오 신호의 채널 수를 자동으로 판정하고, 오디오 채널 수에 가장 적합한 음질 평가기를 선택하여 음질 평가를 수행할 수 있다. 한편, 오디오의 청취 환경이 스피커를 통하여 직접 듣는 경우인지, 또는 헤드폰 등을 사용하는 환경인지에 따라 음질 평가 방식이 달라지도록 할 수 있다. 또한, 본 발명은 전체 오디오 신호를 프레임별로 나누어 별도로 평가한 결과를 이용하여 전체 신호의 음질 평가를 하는 방식을 사용한다.

한편, 본 발명에서는 종합 점수 방식에 따라 음질 평가 방식을 수행한다. 상기 종합 점수 방식이란 음질을 평가하는 여러 가지 평가 항목을 별도로 평가하는 것이 아니라 평가 항목 전체에 대한 종합 점수를 산출하는 방식이다. 통상 상기 종합 점수를 기본 오디오 품질(Basic Audio Quality: BAQ)이라 칭한다. 참고로 오디오 신호의 음질 평가 시스템의 중요한 성능 지표는 음질 평가 시스템에 의한 평가 시의 BAQ와 사람의 귀로 직접 평가할 때의 BAQ와의 상관도이다.

이하의 본 발명의 설명에서는 편의상 멀티 채널 신호를 5.1 채널 신호로 가정하여 설명할 것이다. 스테레오 신호보다 많은 채널 수를 가지는, 즉, 3개 이상의 채널을 가지는 오디오 신호를 말한다. 참고로 상기 5.1 채널은 1번인 좌측전면(left front) 채널, 2번인 우측전면(right front) 채널, 3번인 중앙(center) 채널, 4번인 저주파(low-frequency effect) 채널, 5번인 좌측 서라운드(left surround) 채널, 6번인 우측 서라운드(right surround) 채널로 구성된다. 한편, 5.1 채널이 아닌 멀티 채널, 예를 들어 7.1 채널 신호의 경우에도 당업자는 적절한 변형을 통하여 본 발명을 구현할 수 있을 것이다.

도 1은 본 발명의 실시예에 따른 음질 평가 방식을 설명하는 흐름도이다.

101 단계에서는 음질 평가를 수행하기 위하여 기준 신호(Reference Signal) 및 테스트 신호(Test Signal)가 입력된다. 상기 기준 신호란 오디오 코덱에 입력되기 전의 원본(source) 신호를 말하며, 상기 테스트 신호란 상기 기준 신호가 오디오 코덱에 입력되어 부호화 및 복호화가 수행된 이후의 신호로서 음질 평가의 대상 이 되는 신호를 말한다.

103 단계에서는 상기 입력된 신호(기준 신호 및 테스트 신호)를 소정 시간의 프레임 단위로 분할한다. 이때 한 프레임의 시간 구간은 시스템의 설정에 따라 변경될 수 있으나, 1초에서 10초 사이의 값으로 설정하는 것이 바람직하다.

105 단계에서는 현재 프레임에 대한 유효 채널 수를 결정하고, 기준 신호 및 테스트 신호를 결정된 유효 채널 수에 따라 적절한 음질 평가기로 입력한다.

여기서 유효 채널 수를 판단하는 방식은 다음과 같다.

우선, 입력된 기준 신호 및 테스트 신호 각각의 헤더 정보를 통하여 오디오 부가 정보 등을 통하여 채널 수를 알 수 있다. 그러나 헤더 정보가 없는 오디오 신호의 경우에는 오디오 신호의 데이터 부분을 통하여 채널 수를 결정하여야 한다.

일 예로, 오디오 신호가 PCM(Pulse Coded Modulation) 신호인 경우, 상기 PCM 신호는 헤더 정보를 포함하지 않기 때문에 상기 PCM 신호의 매트릭스 구조를 보고 채널 수를 결정해야 한다. 일 예로, 기준 신호 및 테스트 신호의 매트릭스 구조가 각각 1개의 열로 구성되었다면 이 신호는 모노 신호이고, 2개의 열로 구성되었다면 스테레오 신호가 해당 신호가 된다.

한편, 기준 신호 또는 테스트 신호 중 어느 하나라도 매트릭스 구조가 6개인 5.1채널 신호인 경우에는, 1번 채널과 2번 채널을 제외한 3, 4, 5, 6번 채널에 대해 유효 채널인지 여부를 판단한다.

여기서 유효 채널이란 해당 프레임에서 일정 정도 이상의 에너지가 존재하는 채널을 말한다. 유효 채널인지 여부를 판단하기 위하여 신호 분석을 통하여 묵음 구간이 해당 프레임 중 몇 %에 해당하는지를 판정하고, 묵음 구간이 소정 수준(예를 들어, 90%) 이상이라면 해당 채널을 유효 채널이 아니라고 판정한다. 묵음 구간인지 여부의 판정은 해당 프레임을 30ms 의 시간 단위로 분할하고 30ms 시간 동안의 신호 분석을 통해 이 시간 동안 음압의 RMS(Root Mean Square) 값이 -60dB 이하인 경우 묵음구간으로 판단할 수 있다.

상기 음압의 RMS 값은 하기 <수학식 1>로 계산된다.

, 상기 x[n]은 해당 채널의 시간 영역 신호

, 상기 N은 x[n]의 해당 구간 값들(sample들)의 개수이다.

참고로, 상기 <수학식 1>에서 통상 x[n]은 -1과 1사이의 값들로 표현되고, 이에 따르면 음압의 RMS 값의 최대값은 0이 되며, 통상적으로 음(-)의 값을 가진다.

본 발명에서는 해당 채널이 아래의 (1), (2)를 모두 만족하면 유효 채널이 아닌 것으로 판정할 것이다. 다만, 이 조건들이 시스템에 따라 다르게 설정될 수 있음은 물론이다.

(1)해당 프레임의 90% 이상이 묵음 구간임

(2)해당 프레임의 RMS 값의 전체 평균이 -60dB 이하일 것.

상기 유효 채널 판단에 따라 6개의 채널을 가지는 5.1 채널 신호라도 1번, 2번 채널을 제외한 나머지 채널(3번 내지 6번 채널)이 유효 채널이 아니라면 해당 신호를 스테레오 신호로 판단한다.

상술한 바에 따라 유효 채널수를 판정한 결과에 따라 적절한 음질 평가기에서 음질 평가를 수행한다.

즉, 판정 결과 현재 프레임의 신호가 모노 신호라면 107 단계로 진행하여 모노 평가기에서 음질 평가를 수행한다. 입력 신호가 스테레오 신호라면 109 단계로 진행한다. 109 단계에서는 스테레오 신호에 대해서 청취 환경이 헤드폰인지 스피커인지에 따라 헤드폰인 경우 111 단계로 진행하여 헤드폰-스테레오 평가기에서 음질 평가를 수행하고, 스피커인 경우 113 단계로 진행하여 스피커-스테레오 평가기에서 음질 평가를 수행한다. 109 단계에서 평가기의 선택은 사용자의 사전 설정에 의할 수도 있고, 사용자에게 메시지를 디스플레이하고 사용자의 선택에 의하여 결정될 수도 있다.

한편, 기준 신호 또는 테스트 신호 중 하나라도 5.1 채널 신호에 해당하고, 유효 채널의 판정 결과 기준 신호의 채널 개수가 테스트 신호의 채널 개수보다 적은 경우, 일 예로, 기준 신호의 채널 개수가 2개이고, 테스트 신호의 채널 개수가 5개인 경우에는 115 단계로 진행하여 업 믹스(Up-mix) 평가기에서 음질 평가를 수행한다. 한편, 기준 신호의 채널 개수와 테스트 신호의 채널 개수가 동일한 5.1 채널 신호인 경우에는 117 단계로 진행하여 멀티 채널(multi-channel) 평가기에서 음질 평가를 수행한다.

119 단계에서는 상기 107 단계 내지 117 단계 중 어느 하나의 단계에서 평가된 해당 프레임의 점수를 이용하여 현재 시간까지의 종합 점수를 산출한다. 즉, 이전 프레임까지의 음질 평가 점수의 합들과 현재 프레임의 음질 평가 점수를 합하고 이를 평균하는 방식으로 현재 프레임까지의 종합 점수를 산출한다. 이때, 프레임 구간들의 점수에 대해 일정한 가중치를 부여할 수도 있다.

121 단계에서는 전체 프레임에 대한 음질 평가가 완료되었는지를 판단하여, 완료되지 않았다면 123 단계로 진행하여 다음 프레임에 대해서 상기 105 단계 내지 119 단계의 과정을 반복하고, 완료되었다면 125 단계로 진행하여 전체 프레임에 대한 종합 점수를 최종적으로 산출한다.

이렇게 모든 프레임들의 점수를 합하여 전체 프레임의 종합 점수를 산출하는 이유는 다음과 같다. 일 예로, 5.1채널 신호의 경우 특정한 효과음은 어떤 특정 프레임에만 존재하고, 다른 시간 프레임에서는 존재하지 않을 수 있다. 따라서 상기 특정한 효과음이 있는 프레임을 제외한 다른 시간 프레임들의 신호는 스테레오 신호와 같은 특성을 나타낼 수 있다. 본 발명은 전체 프레임을 시간 프레임으로 나누어 개별적으로 점수를 산출하여 시스템 특성에 따라 프레임의 평가 방식을 다르게 설정할 수 있다. 일 예로, 특정한 프레임의 점수에 가중치를 어느 정도 부여하는지에 따라 전체 프레임의 종합 점수가 달라질 수 있기 때문에 신호의 특정 또는 시스템의 특성에 따라 평가 방식을 적절하게 조정할 수 있는 효과가 있다.

이때, 전체 시간에 대한 종합 점수의 산출은 하기 <수학식 2>에 의하여 계산될 수 있다.

, 상기 R_Total은 전체 시간에 대한 종합 점수의 평균 점수

, 상기 x[k]는 k번째 시간 구간의 종합 점수

, 상기 M은 시간 구간의 개수

, 상기 s[k]는 k번째 시간 구간의 중요도(saliency)를 나타낸다.

즉, 이렇게 해당 프레임에 중요도, 즉, 가중치를 부여하면, 해당 시간 구간의 중요도를 전체 종합 점수에 반영할 수 있도록 한다. 이 때, 중요도의 값을 결정하는 방식은 여러 가지 방식이 사용될 수 있는데, 본 발명에서는 해당 시간 프레임의 기준 신호의 크기 정도(loudness)를 s[k] 값으로 설정한다. 상기 크기 정도(Loudness)는 ISO(International Standard Orgarnization) 표준에 제시된 바에 따라 계산될 수 있으며 이에 대한 상세한 설명은 생략한다.

이하에서는 상기 도 1의 107 단계 내지 117 단계에서 언급된 음질 평가기의 동작을 상세히 설명한다.

(1) 헤드폰-스테레오 평가기

헤드폰-스테레오 평가기를 간략히 설명하면, 헤드폰-스테레오 평가기는 크게 PEM(Peripheral Ear Model) 블록과, 인식 모델(cognition model)블록, 회귀모델(regression model) 블록으로 구성된다. PEM 블록과 인식 블록을 통하여 음질 평 가에 사용되는 인자들(Model Output Variables: MOV)을 추출하고, 이 인자들을 조합해 단일 종합 점수(BAQ)를 만들어 낸다. 헤드폰-스테레오 평가기에서 사용하는 평가 방식의 개념은 다음과 같다. 스테레오 신호는 두 개의 채널 각각이 왼쪽 신호와 오른쪽 신호를 가지고 있기 때문에, 왼쪽 신호는 왼쪽 신호끼리, 오른쪽 신호는 오른쪽 신호끼리 짝을 짓고 짝지어진 왼쪽 신호 및 짝지어진 오른쪽 신호에 대한 점수를 산출하고, 왼쪽 신호에 대한 점수와 오른쪽 신호에 대한 점수를 산술 평균하는 방식이다. 도 2를 참조하여 상세히 설명한다.

도 2는 본 발명에서 사용되는 헤드폰-스테레오 평가기를 설명하는 블록도이다.

기준 신호와 테스트 신호 각각은 PEM(Peripheral Ear Model)(201-1, 201-2)에 입력된다. 상기 PEM(201-1, 201-2)은 사람의 귀에 입력되는 공기의 진동인 음악 신호가 외이, 중이, 내이를 거치면서 청신경을 자극하는 전기화학적 신호로 변환되는 과정을 모사한 기능 블록으로, PEM(201-1, 201-2)의 출력을 자극 패턴(Excitation pattern)이라 칭한다. 상기 PEM(201-1, 201-2)에서 출력된 자극 패턴은 인식 모델(cognition model) 블록(203)으로 입력된다.

상기 인식 모델 블록(203)은 입력된 자극 패턴으로부터 소정의 연산을 통하여 평가 인자(factor)들을 추출하는 기능 블록이다. 즉, 상기 인식 모델 블록(203)에 입력된 자극 패턴들은 왼쪽 신호에 대한 자극 패턴과 오른쪽 신호에 대한 자극 패턴으로 구성되는데, 왼쪽 신호에 대한 자극 패턴끼리, 오른쪽 신호에 대한 자극 패턴끼리 짝을 짓고 이를 인식 모델링(cognition modeling)을 통하여 평가 인자들 을 추출한다. 이렇게 추출된 인자들을 MOV(Model Output Variables)라고 부른다.

상기 MOV 들은 잡음의 정도, 음 균형의 왜곡 등 사용자가 느끼는 음질 열화의 요소를 숫자로 나타낸 값이며, 하나의 MOV가 하나의 음질 요소를 나타낸다. 상기 인식 모델 블록(203)은 MOV들의 값들을 추출한 뒤 이를 회귀모델((regression model) 블록(205)으로 입력한다. 상기 회귀모델(regression model) 블록(205)은 상기 입력된 MOV들을 다양한 방식으로 조합하여 종합 점수(BAQ)를 산출한다. 참고로 ITU-R BS.1387-1에서는 상기 회귀모델 블록을 신경계 네트워크(neural network)라는 모델링 방식을 사용하고 있다.

(2) 모노 채널 평가기

모노 채널 평가기는 도 2에서 설명된 헤드폰-스테레오 평가기와 비교하여 하나의 PEM만을 사용한다는 차이점이 있다. 즉, 하나의 PEM에 기준 신호와 테스트 신호를 입력하여 음질 평가를 수행한다. 이는 모노 신호가 하나의 채널만을 가지고 있기 때문이다.

(3) 멀티 채널(5.1 채널) 평가기

도 3은 본 발명에서 사용되는 멀티 채널 평가기의 구성을 설명하는 블록도이다.

5.1 채널 신호를 구성하는 각각의 채널의 테스트 신호 및 기준 신호들이 바이노럴 신호 합성기(Binaural signal synthesis)(301-1, 301-2)로 입력된다. 바이노럴 합성기(301-1, 301-2)는 입력된 테스트 신호들 및 기준 신호들을 합성하여 바이노럴 신호를 출력한다. 바이노럴 신호를 출력할 때 헤드폰- 스테레오 평가기와 비교하여 공간감 평가 인자(factor)가 추가된다.

상기 공간감 평가 인자란 청취자가 느끼는 오디오 신호의 공간적인 위치에 감각을 평가하는 인자들이다. 본 발명에서는 양이 시간 차이 왜곡(Interaural Time Difference Distortion: ITDDist), 양이 레벨 차이 왜곡(Interaural Level Difference Distortion: ILDDist), 양이 상관계수 왜곡(Interaural Cross Correlation Distortion: IACCDist)라는 3개의 인자들 중 적어도 하나를 추가할 수 있다. 멀티 채널에 있어서, 상기 공간감 평가 인자들은 멀티 채널 신호를 스테레오 신호와 구별되게 하는 중요한 특징 중의 하나에 해당하므로 상기 공간감 평가 인자들은 BAQ 산출 시 높은 가중치를 부여할 수 있다.

상기 바이노럴 합성기(301-1, 301-2) 이후의 기능 블록들은 도 2에서 설명된 헤드폰-스테레오 평가기의 구성과 동일하다. 즉, PEM(303-1, 303-2), 인식 모델 블록(305), 회귀 모델 블록(305)이 추가된다. 다만, 인식 모델 블록(305)에서는 상기 3개의 공간감 평가 인자를 추가로 측정한다는 차이가 있다. 이 인자들을 측정하는 방식은 하기 문서에 설명되어 있다. <Choi, IY, BG Shinn-Cunningham, SB Chon, and K-M Sung (2008). "Objective Measurement of Perceived Auditory Quality in Multi-channel Audio Compression Coding Systems," Journal of the Audio Engineering Society, 56, 3-17.>

또한, 회귀 모델 블록(307)에서는 상기 추가된 3개의 인자들을 포함한 회귀 방식을 사용해야 하므로, BAQ를 출력하기 위한 회귀 모델 블록(305)의 신경계 네트워크의 구조도 변경되어야 한다.

(4)스테레오 스피커 평가기

도 4는 본 발명에서 사용되는 스테레오-스피커 평가기의 구성을 설명하는 블록도이다.

기본적인 구성은 도 3의 멀티 채널 평가기와 유사하다. 다만, 스테레오 신호이기 때문에 바이노럴 신호 합성기(401-1, 401-2)로 입력되는 기준 신호 및 테스트 신호가 두 개의 채널로부터의 유래한 신호라는 차이점이 있다.

또한, 도 3에서 설명된 3개의 공간감 평가 인자들에 대한 가중치가 멀티 채널 평가기의 가중치와 달라지며, 회귀 모델 블록(407)에서 상기 달라진 가중치를 고려하여 BAQ를 산출하기 위하여 회귀 모델 블록(407)의 내부 구성이 달라진다는 차이점이 있다. 즉, 전체 구성은 도 3의 멀티 채널 평가기와 동일하나, 바이노럴 신호 합성기(401-1, 401-2)와 회귀 모델 블록(407)의 내부 구조가 멀티채널 평가기의 그것과 달라질 것이다.

(5) 업 믹스(Up-mix) 평가기

도 5는 본 발명에서 사용되는 업-믹스 평가기의 구성을 설명하는 블록도이다.

기본적인 구성은 도 3의 멀티 채널 평가기와 유사하다. 다만, 기준 신호의 채널 개수는 2개이고, 테스트 신호의 채널 수는 5개로 가정하면, 바이노럴 신호 합성기(401-1, 401-2)로 입력되는 기준 신호 및 테스트 신호의 개수가 도 3에서의 그것과 달라진다.

또한, 도 3에서 설명된 공간감 평가 인자들에 대한 가중치가 멀티 채널 평가 기의 가중치와 달라진다. 회귀 모델 블록(507)에서 상기 달라진 가중치를 고려하여 BAQ를 산출하기 위하여 회귀 모델 구성(507)의 내부 구성이 달라진다. 즉, 전체 구성은 도 3의 멀티 채널 평가기와 동일하나, 바이노럴 신호 합성기(501-1, 501-2)와 회귀 모델 블록(507)의 내부 구조가 멀티채널 평가기와 다르다.

도 6은 본 발명의 실시예에 따른 음질 평가 장치의 구성도이다.

프레임 분할부(601)는 테스트 신호와 기준 신호를 입력받아 소정 시간 구간의 프레임들로 분할하여 출력한다. 유효채널 검사부(603)는 상기 입력된 신호들의 유효 채널들을 검사하여 이 결과를 평가기 선택부(605)로 출력한다. 유효 채널인지 여부를 검사하는 방식에 대한 설명은 도 1에서 설명된 바와 같으므로 상세한 설명은 생략한다. 평가기 선택부(605)는 상기 유효 채널 검사 결과에 따라 상기 기준 신호 및 테스트 신호의 유효 채널의 개수에 따라 음질 평가부(607) 내부에 포함된 적합한 평가기로 입력한다. 다만, 스테레오 신호의 경우에는 사용자에게 청취 환경에 따라 어느 평가기를 선택할지를 묻기 위하여 디스플레이 장치(도시되지 않음)를 통하여 메시지를 표시하고 사용자의 선택에 따라 평가기를 선택할 수 있다. 음질 평가부(607)는 모노 평가기(607a), 헤드폰 스테레오 평가기(609b), 스피커 스테레오 평가기(609c), 업-믹스 평가기(609d), 멀티 채널 평가기(609e)를 포함하여 신호의 종류에 따라 평가기 선택부(605)에서 입력된 오디오 신호의 음질을 평가한다. 각 평가기들의 동작에 대한 구체적인 설명은 도 1에서 설명한 바 있다. 점수 산출부(609)는 음질 평가부(607)에 평가 결과에 따른 해당 프레임에서의 음질 평가 점수와 이전 프레임들까지의 음질 평가 점수를 이용하여 소정의 연산을 통하여 전체 시간에 대한 음질의 종합 점수를 산출한다. 이 때, 각 프레임에 대한 가중치를 부여하여 연산할 수도 있다.

도 7 및 도 8을 참조하여 본 발명의 음질 평가 방법 및 장치의 효과를 설명한다.

도 7은 종래의 음질 평가 방식에 따라 멀티 채널 신호의 평가 점수와 청취 평가의 상관도를 나타내는 도면이며, 도 8은 본 발명의 음질 평가 방식에 따라 멀티 채널 신호의 평가 점수와 청취 평가의 상관도를 나타내는 도면이다.

도 7에서 x축은 실제 사람들이 청취한 결과에 따른 청취 평가 점수를 나타내며, y축은 종래의 음질 평가 방식에 의한 평가 점수이다. 양자의 상관 계수는 0.82이다. 한편, 도 8에서 x축은 청취 평가 점수이며, y축은 본 발명에 따른 평가 점수이다. 양자의 상관 계수는 0.88이다. 이 결과를 분석하면 멀티 채널에서 본 발명에 따른 음질 평가 방식의 상관도는 종래 기술에 따른 음질 평가 방식의 상관도보다 약 7.4% 증가하였음을 알 수 있다.

도 1은 본 발명의 실시예에 따른 음질 평가 방식을 설명하는 흐름도,

도 2는 본 발명에서 사용되는 헤드폰-스테레오 평가기를 설명하는 블록도,

도 3은 본 발명에서 사용되는 멀티 채널 평가기의 구성을 설명하는 블록도,

도 4는 본 발명에서 사용되는 스테레오-스피커 평가기의 구성을 설명하는 블록도,

도 5는 본 발명에서 사용되는 업-믹스 평가기의 구성을 설명하는 블록도,

도 6은 본 발명의 실시예에 따른 음질 평가 장치의 구성도,

도 7은 종래의 음질 평가 방식에 따라 멀티 채널 신호의 평가 점수와 청취 평가의 상관도를 나타내는 도면,

도 8은 본 발명의 음질 평가 방식에 따라 멀티 채널 신호의 평가 점수와 청취 평가의 상관도를 나타내는 도면.

Claims

오디오 신호의 음질 평가 방법에 있어서,

현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 과정과,

채널의 수에 따라 구분된 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 과정과,

상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 과정을 포함하는 오디오 신호의 음질 평가 방법.
제 1항에 있어서,

상기 현재 프레임의 음질 평가 점수에 미리 결정된 가중치를 부여하는 과정과,

상기 가중치가 부여된 현재 프레임의 음질 평가 점수와 상기 현재 프레임의 이전 프레임까지의 음질 평가 점수를 이용한 소정의 연산을 통하여 상기 현재 프레임까지의 음질 평가 점수를 산출하는 과정을 더 포함하는 오디오 신호의 음질 평가 방법.
제 1항에 있어서, 상기 유효 채널 수를 결정하는 과정은,

상기 현재 프레임을 소정 길이의 시간 구간들로 분할하고, 상기 분할된 시간 구간들의 에너지가 소정 임계값 이하인 시간 구간을 묵음 구간으로 판정하고, 상기 묵음 구간으로 판정된 시간 구간이 전체 시간 구간들 중 일정 비율 이하인 경우 상기 현재 프레임의 유효 채널로 판정하는 과정을 포함하는 오디오 신호의 음질 평가 방법.
제 1항에 있어서, 상기 현재 프레임의 음질을 평가하는 과정은,

상기 기준 신호 및 상기 테스트 신호의 상기 결정된 유효 채널의 수가 동일한 멀티 채널인 경우, 상기 현재 프레임의 음질을 멀티 채널 평가기를 이용하여 평가하는 과정을 포함하며,

상기 멀티 채널 평가기는 양이 시간 차이 왜곡(Interaural Time Difference Distortion: ITDDist), 양이 레벨 차이 왜곡(Interaural Level Difference Distortion: ILDDist), 양이 상관 계수 왜곡(Interaural Cross Correlation Distortion: IACCDist) 인자 중 적어도 하나를 이용하여 상기 현재 프레임의 음질을 평가하는 오디오 신호의 음질 평가 방법.
제 1항에 있어서, 상기 현재 프레임의 음질을 평가하는 과정은,

상기 기준 신호 및 상기 테스트 신호의 상기 결정된 유효 채널의 수가 2개인 스테레오 신호인 경우,

청취 환경이 스피커이면 스피커 스테레오 평가기를 사용하여 평가하는 과정과,

청취 환경이 헤드폰이면 헤드폰 스테레오 평가기를 사용하여 평가하는 과정을 포함하는 오디오 신호의 음질 평가 방법.
오디오 신호의 음질 평가 장치에 있어서,

현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 유효 채널 검사부와,

채널의 수에 따라 구분된 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 평가기 선택부와,

상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 음질 평가부를 포함하는 오디오 신호의 음질 평가 장치.
제 6항에 있어서,

상기 현재 프레임의 음질 평가 점수에 미리 결정된 가중치를 부여하고, 상기 가중치가 부여된 현재 프레임의 음질 평가 점수와 상기 현재 프레임의 이전 프레임까지의 음질 평가 점수를 이용한 소정의 연산을 통하여 상기 현재 프레임까지의 음 질 평가 점수를 산출하는 점수 산출부를 더 포함하는 오디오 신호의 음질 평가 장치.
제 6항에 있어서, 상기 유효 채널 검사부는,

상기 현재 프레임을 소정 길이의 시간 구간들로 분할하고, 상기 분할된 시간 구간들의 에너지가 소정 임계값 이하인 시간 구간을 묵음 구간으로 판정하고, 상기 묵음 구간으로 판정된 시간 구간이 전체 시간 구간들 중 일정 비율 이하인 경우 상기 현재 프레임의 유효 채널로 판정하는 오디오 신호의 음질 평가 장치.
제 6항에 있어서, 상기 음질 평가부는,

상기 기준 신호 및 상기 테스트 신호의 상기 결정된 유효 채널의 수가 동일한 멀티 채널인 경우, 상기 현재 프레임의 음질을 평가하는 멀티 채널 평가기를 포함하며,

상기 멀티 채널 평가기는 양이 시간 차이 왜곡(Interaural Time Difference Distortion: ITDDist), 양이 레벨 차이 왜곡(Interaural Level Difference Distortion: ILDDist), 양이 상관계수 왜곡(Interaural Cross Correlation Distortion: IACCDist) 인자 중 적어도 하나를 이용하여 상기 현재 프레임의 음질을 평가하는 오디오 신호의 음질 평가 장치.
제 6항에 있어서, 상기 음질 평가부는,

상기 기준 신호 및 상기 테스트 신호의 상기 결정된 유효 채널의 수가 2개인 스테레오 신호인 경우, 청취 환경이 스피커일 때 상기 현재 프레임의 음질을 평가하는 스피커 스테레오 평가기와, 청취 환경이 헤드폰일 때 상기 현재 프레임의 음질을 평가하는 헤드폰 스테레오 평가기를 포함하는 오디오 신호의 음질 평가 장치.
삭제
제 1항에 있어서,

상기 기준 신호 및 상기 테스트 신호의 각각에 대해 상기 결정된 유효 채널의 수가 서로 다른 경우, 상기 다수의 음질 평가기 중에서 해당 음질 평가기가 선택되는 오디오 신호의 음질 평가 방법.
삭제
제 6항에 있어서,

상기 기준 신호 및 상기 테스트 신호의 각각에 대해 상기 결정된 유효 채널의 수가 서로 다른 경우, 상기 다수의 음질 평가기 중에서 해당 음질 평가기가 선택되는 오디오 신호의 음질 평가 장치.
오디오 신호의 음질 평가 방법에 있어서,

입력 오디오 신호의 기준 신호와 테스트 신호를 미리 정해진 시간 구간의 프레임들로 분할하는 과정과,

현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 과정과,

채널의 수에 따라 구분된 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 과정과;

상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 과정과,

상기 분할된 프레임들의 종합 음질 평가 점수를 계산하는 과정을 포함하는 오디오 신호의 음질 평가 방법.
제 15항에 있어서,

상기 유효 채널의 수를 결정하는 과정은,

어떤 채널들이 프레임에서 특정 레벨 보다 큰 에너지 레벨을 갖는 지를 결정하는 과정을 포함하는 오디오 신호의 음질 평가 방법.
삭제
제 15항에 있어서,

상기 기준 신호 및 상기 테스트 신호의 각각에 대해 상기 결정된 유효 채널의 수가 서로 다른 경우, 상기 다수의 음질 평가기 중에서 해당 음질 평가기가 선택되는 오디오 신호의 음질 평가 방법.
제 15항에 있어서,

상기 분할된 프레임들의 종합 음질 평가 정수를 산출하는 과정은,

상기 분할된 프레임들의 개별적인 점수를 계산하는 과정과,

각 프레임에 부가된 가중치를 근거로 서로 다른 프레임 평가 방식을 설정하는 과정을 포함하는 오디오 신호의 음질 평가 방법.
오디오 신호의 음질 평가 장치에 있어서,

입력 오디오 신호의 기준 신호와 테스트 신호를 미리 정해진 시간 구간의 프레임들로 분할하는 프레임 분할부와,

현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 유효 채널 결정부와,

채널의 수에 따라 구분된 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 평가기 선택부와,

상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 음질 평가부를 포함하는 오디오 신호의 음질 평가 장치.
삭제
제 20항에 있어서,

상기 기준 신호 및 상기 테스트 신호의 각각에 대해 상기 결정된 유효 채널의 수가 서로 다른 경우, 상기 다수의 음질 평가기 중에서 해당 음질 평가기가 선택되는 오디오 신호의 음질 평가 장치.
제 20항에 있어서,

상기 음질 평가부는 모노 평가기, 헤드폰 스테레오 평가기, 스피커 스테레오 평가기, 업-믹스 평가기, 멀티 채널 평가기 중 적어도 하나를 포함하는 오디오 신호의 음질 평가 장치.
제 20항에 있어서,

상기 현재 프레임에서 음질 평가 점수를 이용하여 미리 정해진 동작을 통해 전체 시간에 대한 음질의 종합 점수와 상기 음질 평가부에 의한 평가 결과를 근거로 이전 프레임까지의 음질 평가 점수를 산출하는 점수 산출부를 더 포함하는 오디오 신호의 음질 평가 장치.
컴퓨터에서 읽을 수 있는 기록 매체에 있어서,

현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 과정과,

채널의 수에 따라 구분된 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 과정과,

상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 과정을 수행하는 코드들을 포함하는 기록 매체.
컴퓨터에서 읽을 수 있는 기록 매체에 있어서,

입력 오디오 신호의 기준 신호와 테스트 신호를 미리 정해진 시간 구간의 프레임들로 분할하는 과정과,

현재 프레임의 기준 신호 및 오디오 코덱을 통해 상기 기준 신호를 부호화 또는 복호화하여 획득된 테스트 신호의 각각에 대해 유효 채널의 수를 결정하는 과정과,

채널의 수에 따라 구분된 다수의 음질 평가기 중에서 상기 결정된 유효 채널의 수에 해당되는 음질 평가기를 선택하는 과정과,

상기 결정된 유효 채널 수에 따라 상기 선택된 음질 평가기를 이용하여 상기 현재 프레임의 음질을 평가하는 과정과,

상기 분할된 프레임들의 종합 음질 평가 점수를 계산하는 과정을 수행하는 코드들을 포함하는 기록 매체.