KR20000053311A - 오디오 신호의 청취하기 적합한 음질 평가 - Google Patents

오디오 신호의 청취하기 적합한 음질 평가 Download PDF

Info

Publication number
KR20000053311A
KR20000053311A KR1019990704307A KR19997004307A KR20000053311A KR 20000053311 A KR20000053311 A KR 20000053311A KR 1019990704307 A KR1019990704307 A KR 1019990704307A KR 19997004307 A KR19997004307 A KR 19997004307A KR 20000053311 A KR20000053311 A KR 20000053311A
Authority
KR
South Korea
Prior art keywords
audio
signal
test signal
filter
reference signal
Prior art date
Application number
KR1019990704307A
Other languages
English (en)
Inventor
디테 자이쩌
토마스 스포러
Original Assignee
슈베르트 헬무트
프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 슈베르트 헬무트, 프라운호퍼-게젤샤프트 츄어 푀르더룽 데어 안게반텐 포르슝에.파우. filed Critical 슈베르트 헬무트
Publication of KR20000053311A publication Critical patent/KR20000053311A/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

N-(트랜스-4-이소프로필사이클로헥산카보닐)-D-페닐알라닌 및 저치환도 하이드록시프로필셀룰로즈를 함유하는 정제 조성물이 개시된다. 이 정제 조성물은 투여후 위 안에서 빠르게 붕괴함으로써, 식사의 영향을 받는 일없이 흡수되어 당뇨병 환자의 식후 혈당 상승을 억제할 수 있다.

Description

오디오 신호의 청취하기 적합한 음질 평가{HEARING-ADAPTED QUALITY ASSESSMENT OF AUDIO SIGNALS}
수년간 청취하기 적합한 디지털 부호화 방법이 표준화됨에 따라서(Kh. Brandenbrug and G. Stoll, The iso/mpeg-audio codec: A generic standard for coding of high quality digital audio, 92nd AES-Convention, Vienna, 1992, Preprint 3336), 그의 응용이 점차로 증가하고 있는 추세이다. 그 실례로는 디지털 콤팩트 카세트(DCC), 미니디스크, 디지털 지상 방송(DAB: Digital Audio Broadcasting) 그리고 디지털 비디오 디스크(DVD)가 있다. 일반적으로 아날로그 전송에서 발생하는 방해 레벨이 디지털 비부호화 오디오 신호 전송에서는 일어나지 않는다. 오디오 신호의 부호화가 수행되지 않는다면, 측정 기술은 아날로그에서 디지털로, 그리고 디지털에서 아날로그로의 전환에만 한정시킬 수 있다.
그러나 청취하기 적합한 부호화 방법을 이용하여 부호화하는 경우에는 아날로그 오디오 신호 처리에서는 발생하지 않았던 가청의 인위적인 소리가 발생할 수 있다.
조파 왜곡 계수나 신호 대 잡음비와 같은 측정값은 청취하기 적합한 부호화 방법에는 이용되지 않는다. 많은 청취하기 적합한 부호화 음악 신호가 신호 대 잡음비가 15 dB 이하이고 비부호화 오리지널 신호의 가청 차이는 느낄 수 없다. 반대로, 신호 대 잡음비가 40 dB 이상인 경우에는 가청 방해레벨이 나타난다.
최근에는, 여러 가지 청취하기 적합한 측정법이 도입되었는데 그 중에서 NMR(Noise to Mask Ratio)법을 언급하고자 한다(Kh. Brandenburg and Th. Sporer. "NMR" and "Masking Flag": Evaluation of quality using perceptual criteria. In Proceedings of the 11th International Conference of the AES, Portland, 1992).
NMR법을 수행함에 있어서, 길이 1024이고 오리지널 신호와 차신호에 대해서 진행 속도가 512 샘플링값을 갖는 Hann 윈도우를 이용하여 오리지널 신호와 처리 신호 사이에 이산 푸리에 변환을 계산한다. 여기서 얻은 스펙트럼 계수들을 대역폭을 Zwicker in E. Zwicker, Psychoacoustics, publisher Springer-Verlag, Berlin Heidelberg New York, 1982에서 제안한 주파수군에 대략 해당하는 주파수 대역에서 결합하여 각 주파수의 에너지 밀도를 결정한다. 오리지널 신호의 에너지 밀도로부터, 각 주파수군 내의 마스킹, 주파수군 사이의 마스킹, 그리고 각 주파수 대역에 대한 사후 마스킹을 고려하여 실제 마스킹 또는 커버링 한계값을 결정한다. 상기 마스킹 한계값은 차신호의 에너지 밀도와 비교한다. 오디오 신호의 청취자가 듣고자 하는 음악음 또는 오디오음의 세기에 이르게 되므로 소리크기를 고정시킨 상태에서 측정법의 입력 신호를 확인할 수 없기 때문에 사람의 나머지 한계값은 완전히 생각하지 않는다.
예를 들어, 샘플링 속도가 44.1 kHz인 경우, NMR법의 주파수 분해능이 약 43 Hz이고 시간 분해능이 약 23 ms인 것으로 밝혀졌다. 저주파수인 경우에는 주파수 분해능이 매우 낮은 반면에, 고주파수인 경우에는 주파수 분해능이 매우 높다. 그럼에도, NMR법은 많은 시간 효과에 좋은 반응을 나타낸다. 드럼 비트와 같이 일련의 비트가 매우 낮으면, 비트 이전의 블록이 에너지가 매우 낮아서 프리에코를 정확히 인식할 수 있게 된다. 분석 윈도우의 진행 속도가 11.6이면 많은 프리에코를 인식할 수 있다. 그러나, 분석 윈도우의 위치가 좋지 않으면 프리에코를 인식할 수 없게 된다.
NMR 방법에서는 음색 신호에 의한 마스킹과 잡음에 의한 마스킹 사이의 차이를 고려하지 않는다. 사용되는 마스킹 곡선은 주관적인 청각 시험으로부터 얻은 실험값이다. 이를 위하여, 주파수군이 주파수 스펙트럼 내의 일정한 위치에 존재하는 반면에, 귀는 스펙트럼에서 특히 두드러진 음 주위에 동적으로 주파수군을 형성한다. 그러므로, 에너지 밀도의 중심 주위에 동적으로 배열된 것이 보다 정확할 것이다. 일정한 주파수군의 폭 때문에, 정현파가 주파수군의 중심에 있는지 혹은 가장 자리에 있는지를 구별할 수 없다. 따라서, 마스킹 곡선은 가장 극단적인 경우 즉, 최저 마스킹 효과에 기초한 것이다. 그러므로, NMR 방법은 인간이 들을 수 없는 방해 레벨을 보여주기도 한다.
앞서 언급한 43 Hz의 저주파수 분해능은 특히 저주파수 범위에서 NMR 방법을 이용한 오디오 신호의 청취하기 적합한 음질 평가의 한계를 이룬다. 이는 특히 남성 화자가 내는 낮은 음조의 목소리나 베이스 트럼본과 같이 음조가 낮은 악기의 음을 평가할 때 문제가 된다.
본 발명을 보다 잘 이해하기 위하여, 다음에는 오디오 신호의 청취하기 적합한 음질 평가를 위한 몇가지 중요한 정신 음향학적이고 인식적인 원리를 설명하기로 한다. 청각 적응형 부호화 및 측정 기술의 분야에서 가장 중요한 용어는 영어인 "마스킹"과 동의어로서 "Maskierung"이라고도 부르는 "Verdeckung"(=마스킹)이다. 소리크기가 낮고 불연속적으로 발생하는 지각 가능한 음은 보다 큰 소리로 차폐된다. 즉, 더 소리크기가 더 큰 음이 존재하여 더 이상 지각되지 않는다. 마스킹 효과는 시간 구조와 마스커(즉, 마스킹 신호)와 차폐되는 신호의 스펙트럼 구조의 영향을 받는다.
도 1은 주파수가 250 Hz, 1,000 Hz 및 4,000 Hz이고 음압 레벨이 60 dB일 때 협대역 잡음 신호 1, 2, 3에 의한 음의 마스킹을 나타내기 위한 것이다. 도 1은 E. Zwicker and H. Fas시, Concerning the dependency of post-masking on disturbance pulse duration, in Acustica, Vol. 26, pages 78-82, 1982에서 발췌한 것이다.
인간의 귀는 상호 중복되는 수없이 많은 대역 필터들로 이루어진 필터 뱅크로 생각할 수 있다. 주파수에 대한 이들 필터의 방해 레벨은 일정하지 않다. 특히, 저주파수에서의 주파수 분해능이 높은 주파수에서보다 훨씬 좋다. 최저의 지각 가능한 주파수 차이를 보면, 이 값은 약 500 Hz 이하인 주파수에서 약 3 Hz이고, 500 Hz 이상의 값일 때 주파수 또는 주파수군의 중심 주파수에 비례하여 높아진다. 최저의 지각 가능한 주파수 차이를 주파수 눈금으로 병치하면, 640개의 지각 가능한 단계들을 얻을 수 있다. 인간의 주파수 지각에 알맞은 주파수 눈금은 바크 눈금으로 구성된다. 바크 눈금은 약 15.5 kHz 이하의 전체 가청 범위를 24 부분으로 세분한 것이다.
한정된 경사도를 갖는 필터들이 중복되기 때문에, 소리크기가 큰 오디오 신호에 근접한 소리크기가 작은 오디오 신호는 차폐된다. 그러므로, 도 1에서는 스펙트럼 상에서 개별적인 선으로 나타나는 협대역 잡음 곡선 1, 2, 3의 아래에 있는 모든 정현파 오디오 신호들이 차폐되어 들리지 않게 된다.
모델에서 가정한 바와 같이 인간의 귀에서 필터 뱅크들의 각 마스킹 필터들의 가장자리 경사도는 들리는 신호의 음압 레벨과 각 밴트 필터의 중심 주파수에 따라 달라진다. 최대 마스킹은 마스커의 구조에 의존하며 잡음을 마스킹하는 경우에는 약 -5 dB이다. 정현파 음에 의한 마스킹의 경우, 최대 마스킹은 상당히 작은 것으로서, 중심 주파수에 따라 -14 내지 -35 dB이다(참고: M.R. Schroeder, B.S. Atal and J.L. Hall, Optimizing digital speech coders by exploiting masking properties of the human ear, The Journal of the Acoustic Society of America, Vol. 66 (No. 6), pages 1647-1652, December 1979).
두 번째로 중요한 효과는 도 2에서 설명하고 있는 바와 같이 시간으로 나타낸 마스킹이다. 소리크기가 큰 음의 바로 이전의 소리크기가 더 낮은 음은 지각되지 않는다. 시간으로 환산한 마스킹은 마스커의 구조와 지속 시간에 크게 의존한다(참고: H. Fas시, Thresholds of masking as a measure for the resolution capacity of the human ear in terms of time and spectrum. Dissertation, faculty for mechanical and electrotechnical engineering of the Technical University of Munich, Munich, May 1974). 사후 마스킹은 특히 지속 시간이 100 ms에 이른다. 최대 감도와 최단 마스킹 효과는 가우스 펄스에 의한 잡음을 마스킹할 때에 해당된다. 이로써, 사전 마스킹과 사후 마스킹은 약 2 ms일 뿐이다.
마스커나 도 1에서의 참조 번호 4로부터 충분한 거리를 두었을 때, 마스킹 곡선은 한계값(5)으로 변한다. 사전 마스킹(6)과 사후 마스킹(7) 중에, 마스킹 신호의 처음과 끝에서 마스킹 곡선이 동시 마스킹(8)으로 바뀐다. 도 2는 E. Zwicker, Psychoacoustics, publisher Springer-Verlag, Berlin Heidelberg New York, 1982에서 발췌한 것이다.
사전 마스킹 효과는 신호가 귀로부터 뇌로 전달되고 있을 때와 뇌에 전달되었을 때 신호를 다른 속도로 처리하는 것으로 설명한다. 큰 자극 즉, 소리크기가 큰 음이나 음압 레벨(SPL)이 큰 음은 작은 자극보다 빨리 지나간다. 그러므로, 큰 소리는 잘 받아들여서 시간상 그 이전의 소리크기가 작은 음을 마스킹한다.
사후 마스킹은 소리 수용체의 "회복 시간"과, 특히 신경 시냅스에서 전달 물질의 분해가 되는 자극의 전달에 해당한다.
마스킹 범위나 마스킹 정도는 시간과 스펙트럼으로 나타낸 마스커 즉, 마스킹 신호의 구조에 따라 다르다. 사전 마스킹은 펄스와 같은 마스커의 경우에는 가장 짧고(약 1.5 ms), 잡음 신호의 경우에는 매우 길다(15 ms). 100 ms가 지나면, 사후 마스킹이 한계값에 도달한다. 사후 마스킹 곡선의 정확한 구성은 문헌에 따라 다르게 설명되고 있다. 그러므로, 잡음 신호의 경우, 사후 마스킹은 15 내지 40 ms 사이에서 다양하다. 앞서 지적한 값들은 각각 잡음의 최대치를 구성한다. 마스커로서 가우스 펄스에 대한 최근의 연구에 의하면, 사후 마스킹이 1.5 ms의 범위 이내에서도 발생하는 것으로 밝혀졌다(J. Spille, Measurement of pre- and post-masking in pulses under critical conditions, Internal Report, Thomson Consumer Electronics, Hanover, 1992). 마스커 신호와 방해 신호 모두가 저역 필터에 의해 제한되면, 사전 마스킹과 사후 마스킹이 모두 길어진다.
시간 단위의 마스킹은 오디오 부호화 방법의 평가에서 중요한 역할을 한다. 대부분의 경우에 해당하는 블록형 동작인 경우와 블록 내에서 작용하는 경우, 유용한 신호 레벨의 레벨 이상인 작용 이전에 방해 레벨이 발생할 수 있다. 이와 같은 방해 레벨은 사전 마스킹 효과를 이용하여 마스킹할 수 있다. 그러나, 방해 레벨이 차폐되지 않는 경우를 "프리 에코"라고 한다. 일반적으로, 프리 에코는 작용과 별개로 지각되지 않고 소리의 특성으로 감지된다.
정지 한계값(도 1의 4번)은 외이와 중이의 주파수 응답으로 발생한 것으로, 혈액의 흐름에 의해 발생하는 기본적인 잡음을 갖고 내이에 도달한 소리 신호가 포개어진 것에 의한다. 이 기본적인 잡음과 정지 한계값은 주파수 범위에서 일정하지 않으므로 소리크기가 매우 작은 음을 차폐한다. 도 1을 보면, 청각이 좋은 경우 20 Hz에서 18 kHz까지의 주파수 범위를 지각할 수 있음을 알 수 있다.
주관적으로 지각되는 소리 신호의 크기는 스펙트럼 구성과 시간에 따른 구성비에 따라 크게 다르다. 신호의 일부가 동일한 신호의 다른 일부를 차폐하여 더 이상 들리지 않는 경우도 있다. 청각 한계값에 가까운 신호(즉, 여전히 지각되는 신호)는 실제의 음압 레벨보다 작게 들린다. 이 효과를 "초킹(choking)"이라고 한다(E. Zwicker and R. ?Feldtkeller, The ear as recipient of message, publisher Hirzel-Verlag, Stuttgart, 1967).
또한, 오디오 신호를 평가할 때 인식 효과가 개입된다. 특히, 5단계의 소위 "감손 눈금"(감손 = 저하)이 마련되었다. 시험자는 이중 블라인드 시험에서 두 개의 신호를 평가하도록 되어 있다. 그 중 하나는 부호화나 복호화가 되지 않은 원래의 신호이고, 다른 하나는 부호화와 복호화를 거쳐서 얻은 신호이다. 청각 시험은 세 가지 자극 A, B, C를 사용한다. 신호 A는 항상 기준 신호이다. 청각 시험자는 항상 신호 B와 C를 A와 비교하게 되어 있다. 이 때, 부호화되지 않은 신호를 기준 신호라 하고, 기준 신호를 부호화하고 복호화하여 얻은 신호를 시험 신호라 한다. 그러므로, 가청 방해를 평가함에 있어서, 정신 음향학적 효과뿐만 아니라 인식 /또는 주관적인 효과도 작용한다.
인간 청취자에 의한 오디오 신호의 평가에서, 인식 효과는 감손 눈금을 이용하는 평가에 큰 영향을 미친다. 영구히 존재하는 방해 레벨보다도 불연속적이고 매우 강한 방해 레벨이 많은 시험자에게 덜 교란적으로 느껴진다. 그러나, 소정수의 매우 강한 방해 레벨로부터 시작하면 그 느낌이 지배적이다. 이 것의 체계적인 연구는 문헌에 나와 있지 않다.
각 청취자의 지각 한계값은 정신음향학적 시험에서는 별로 다르지 않지만, 각종 인위적인 소리가 시험자마다 다르게 느껴진다. 일부 시험자에게는 대역폭의 제한이 고주파수에서의 잡음 변조보다 덜 교란적으로 느껴지지만, 어떤 시험자에게는 그 반대로 느껴진다.
여러 시험자의 평가 척도는 각각 다르다. 많은 청취자들이 분명히 들을 수 있는 방해 레벨을 1급("매우 교란적")으로 분류할 수 있지만 평균 등급을 매기지는 않는다. 다른 청취자는 가끔 평균 등급을 매긴다(Thomas Sporer, Evaluating small impairments with the mean opinion scale - reliable or just a guess? In 101nd AES-Convention, Los Angeles, 1996, Preprint).
DE 44 37 287 C2는 스테레오 방식 오디오 신호의 유지를 측정하는 방법과 공동으로 부호화된 스테레오 방식 오디오 신호들을 인식하는 방법을 설명하고 있다. 두 개의 스테레오 채널을 갖는 시험 대상인 신호는 기준 신호를 부호화한 후 복호화하여 얻는다. 시험할 신호와 기준 신호는 주파수 범위로 변형된다. 기준 신호의 각 부분 대역과 시험할 신호의 각 부분 대역에 있어서, 신호 특성이 기준 신호와 시험할 신호에 대하여 각기 형성된다. 어떤 부분 대역에 속하는 신호 특성을 다른 신호 특성과 비교한다. 이 비교로부터 스테레오 방식 오디오 신호 특성의 유지 또는 부호화 기술에서의 스테레오음의 음향 방해를 결정한다. 인간의 귀의 전파 특성 때문에 기준 신호와 시험할 신호에 미치는 주관적인 느낌은 고려하고 있지 않다.
본 발명은 각각 음성 부호화 및 복호화에 관한 것으로, 특히 오디오 신호의 청취하기 적합한 음질 평가를 수행하기 위한 방법과 장치에 관한 것이다.
도 1은 여러 주파수에서 협대역 잡음 신호에 의한 음의 마스킹을 나타낸 도면이다;
도 2는 시간에 대한 마스킹의 원리를 나타낸다;
도 3은 오디오 측정 시스템을 도시한 일반 블록도이다;
도 4는 본 발명에 따라 오디오 신호의 청취하기 적합한 음질 평가를 위한 장치를 나타낸 블록도이다;
도 5는 도 4에 따른 필터 뱅크의 블록도이다;
도 6은 마스킹 필터의 구성을 나타낸 실례도이다;
도 7은 외이와 중이의 전파 함수와 내부 잡음을 고려하는 마스킹 필터의 구성을 나타낸다;
도 8은 본 발명에 따라 오디오 신호의 청취하기 적합한 음질 평가를 위한 장치의 상세 블록도이다;
도 9는 여러 샘플링 속도에서 필터 곡선을 나타낸다;
도 10은 검출 확률의 스펙트럼 영역에서 매핑 레벨차에 대한 한계 함수를 나타낸다;
도 11은 오디오 시험 신호의 세부 검출 확률을 나타낸 그래프이다; 그리고
도 12는 도 11에서 사용된 오디오 시험 신호의 주파수군 검출 확률을 나타낸 그래프이다.
본 발명의 목적은 개선된 시간 분해능을 이용하여 인간의 귀의 청각을 모형화하여 주관적인 영향을 배재하기 위한, 오디오 신호의 청취하기 적합한 음질 평가를 수행하는 방법과 장치를 제공하는 것이다.
상기 목적은 청구범위 제 1 항에 따른 방법과 제 18 항에 따른 장치로서 달성된다.
본 발명은 기준 신호와 시험 신호에 동일하게 나타나는 모든 비선형의 청각 효과를 시뮬레이션하고, 신호가 와우각에서 청각 신경으로 전파될 때 귀 밖에서의 시험 신호의 음질을 비교 평가하기 위한 것이다. 그러므로, 오디오 신호의 청취하기 적합한 음질 평가에서는 와우각 영역에서의 비교를 이용한다. 따라서, 귀에서 시험 신호와 기준 신호에 의한 자극을 비교한다. 이를 위하여, 오디오 기준 신호와 오디오 시험 신호를 모두 필터 뱅크를 이용하여 스펙트럼 구성비로 분절한다. 주파수가 중복되는 많은 필터들을 사용하여 시간과 주파수에 대한 충분한 분해능을 확보한다. 그리고, 각 필터가 외이(外耳) 및 중이(中耳) 전파 함수와 귀의 내부 잡음을 이용하여, 필터의 중간 주파수 fm을 이용하여, 그리고 평가될 오디오 신호의 음압 레벨 L을 이용하여 결정되는 구성을 갖도록 귀의 청각 효과를 고려한다. 복잡도와 계산 비용을 줄이기 위하여, 각 필터 전파 함수에 대하여 최악의 경우를 고려함으로써, 각 필터의 중심 주파수에서 여러 음압 레벨에 대한 소위 최악 경우의 자극 곡선을 동일하게 얻을 수 있다.
계산 비용을 더욱 줄이기 위하여, 샘플링 속도를 줄여서 필터 뱅크의 일부를 계산함으로써 처리될 데이터 스트림을 크게 줄여준다. 신속한 푸리에 변환을 동시에 수행하기 위하여, 필터 뱅크를 이용하였던 것과 같은 샘플링 속도를 사용한다. 그러므로, 원래의 샘플링 속도와 전력의 지수(샘플링 또는 데이터 전송 속도의 1/2, 1/4, 1/8, 1/16, 1/32배)가 되는 샘플링 속도가 이용된다. 이와 같은 방식으로, 같은 샘플링 주파수로 동작하는 여러 필터 그룹의 윈도우 길이를 균일하게 얻을 수 있다.
마지막으로, 필터 뱅크의 각 필터는 사전 마스킹과 사후 마스킹을 위한 모형화 수단과 하향 연결된다. 사전 마스킹과 사후 마스킹을 모형화하면, 필터에 따라 샘플링 속도를 보다 줄일 수 있을 정도로 필요한 대역폭을 감소시킨다. 본 발명의 바람직한 일 실시예에서, 모든 필터의 샘플링 속도는 입력 데이터 속도의 1/32에 해당한다. 모든 필터 뱅크에 대한 이와 같은 샘플링 속도는 매우 큰 이점을 가지며 처리에 있어서 필수적이다.
필터 뱅크에 이어서, 오디오 시험 신호와 오디오 기준 신호를 계산함에 있어서 존재할 수 있는 비공시성을 보충하기 위하여 각 필터의 출력 신호의 지연을 결정한다.
앞서 언급한 바와 같이, "와우각(cochlea) 뒤에서" 오디오 기준 신호를 오디오 시험 신호와 비교한다. 오디오 시험 신호에 대한 필터 뱅크의 필터의 출력 신호와 오디오 기준 신호에 대한 필터 뱅크의 해당 필터의 출력 신호의 차이를 검출하여, 레벨 차이가 뇌에서 인식하기에 충분히 큰지를 고려하는 검출 확률에서 매핑한다. 본 발명에 다른 청취하기 적합한 음질 평가는 공동으로 평가된 필터가 정의하는 대역폭에서 주관적으로 지각되는 방해 레벨을 측정하기 위하여 몇 개의 인접한 필터들의 레벨차를 공동으로 평가한다. 귀에 합치되는 주관적인 감각을 얻기 위하여, 대역폭은 정신음향학적인 주파수군보다 작거나 같다.
이제부터, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명하기로 한다:
도 1은 여러 주파수에서 협대역 잡음 신호에 의한 음의 마스킹을 나타낸 도면이다;
도 2는 시간에 대한 마스킹의 원리를 나타낸다;
도 3은 오디오 측정 시스템을 도시한 일반 블록도이다;
도 4는 본 발명에 따라 오디오 신호의 청취하기 적합한 음질 평가를 위한 장치를 나타낸 블록도이다;
도 5는 도 4에 따른 필터 뱅크의 블록도이다;
도 6은 마스킹 필터의 구성을 나타낸 실례도이다;
도 7은 외이와 중이의 전파 함수와 내부 잡음을 고려하는 마스킹 필터의 구성을 나타낸다;
도 8은 본 발명에 따라 오디오 신호의 청취하기 적합한 음질 평가를 위한 장치의 상세 블록도이다;
도 9는 여러 샘플링 속도에서 필터 곡선을 나타낸다;
도 10은 검출 확률의 스펙트럼 영역에서 매핑 레벨차에 대한 한계 함수를 나타낸다;
도 11은 오디오 시험 신호의 세부 검출 확률을 나타낸 그래프이다; 그리고
도 12는 도 11에서 사용된 오디오 시험 신호의 주파수군 검출 확률을 나타낸 그래프이다.
도 3은 본 발명에 따른 오디오 측정 시스템의 일반 블록도이다. 측정 방법은 한편으로는 소리 신호원의 처리되지 않은 출력 신호(기준)를 입력으로 하고, 다른 한편으로는 평가될 신호(시험)를 입력으로 한다. 평가될 신호는 오디오 부호/복호 수단(또는 "오디오 코덱")과 같은 전파 경로로부터 얻은 것이다. 측정 방법에서는 기준 신호와 비교하여 시험 신호의 음질을 나타내는 각종 특성들을 결정한다.
발명에 따른 오디오 신호의 음질 평가 방법의 기본 개념은 시간과 스펙트럼에 대한 분해능이 동시에 높은 경우에만 적확한 청취하기 적합한 분석이 가능하다는 사실이다. 모든 공지의 측정 방법에서, 시간 분해능은 (블록 길이가 보통 10.67 ms 내지 21.33 ms인) 이산 푸리에 변환(DFT)을 이용함으로써 매우 제한적이고, 또는 스펙트럼 분해능은 분석 채널수가 아주 적을 때에는 크게 감소한다. 발명에 따라 오디오 신호의 음질을 평가하는 방법에서는 시간 분해능이 0.67 ms이고 분석 채널수가 241개로 많다.
도 4는 본 발명에 따라 오디오 신호의 청취하기 적합한 음질 평가를 위한 장치의 블록도로서, 본 발명에 따른 방법을 수행한다. 오디오 신호의 청취하기 적합한 음질 평가를 수행하고 목적형 오디오 신호 평가(OASE)를 수행하기 위한 방법에서 오디오 기준 신호(12)와 오디오 시험 신호(14)의 내부 표시한다. 이를 위하여, 오디오 기준 신호(12)를 제 1 필터 뱅크(16)에 입력시키면, 스펙트럼 구성비에 따라서 오디오 기준 신호가 부분 오디오 기준 신호로 쪼개어진다. 이와 동일하게, 오디오 시험 신호(14)는 제 2 필터 뱅크(20)에 입력되어, 스펙트럼 구성비에 따라서 오디오 시험 신호(14)에서 다수의 부분 오디오 시험 신호(22)가 발생한다. 제 1 모형화 수단(24)과 제 2 모형화 수단(26)은 각각 부분 오디오 기준 신호(18)와 부분 오디오 시험 신호(22)에 대한 시간 영역에서의 마스킹의 영향을 시간 마스킹 모형화하기 위한 것이다.
여기서, 한 개의 필터 뱅크나 시간에 대하여 마스킹을 모형화하기 위한 한 개의 모형화 수단을 가지고도 본 발명에 따른 오디오 신호의 청취하기 적합한 음질 평가를 구현할 수 있다는 사실에 주의해야 한다. 설명을 위하여, 도면에서는 각 오디오 기준 신호(12)와 각 오디오 시험 신호(14)에 대한 개별 수단이 나타나 있다. 한 개의 필터 뱅크를 오디오 기준 신호와 오디오 시험 신호의 스펙트럼 분해에 이용하는 경우, 미리 결정된 오디오 기준 신호의 스펙트럼 구성비를 오디오 시험 신호를 처리하는 동안에 임시로 저장할 수 있어야 한다.
시간 마스킹에 대하여 모형화된 부분 오디오 기준 신호(18)와 부분 오디오 시험 신호(22)는 각각 나중에 설명되겠지만 검출과 결과의 측정을 수행하는 평가 수단(28)에 입력된다. 평가 수단(28)은 오디오 기준 신호(12)와 오디오 기준 신호(12)를 부호화 및 복호화하여 얻은 오디오 시험 신호(14) 사이의 차이를 다르게 나타내는 한 개의 또는 복수개의 모델 출력값 MAW1 ... MAn을 출력한다. 이후에 설명되는 바와 같이, 모델 출력값 MAW1 ... MAn은 오디오 시험 신호(14)의 주파수 및 시간에 민감한 음질 평가를 가능케 한다.
평가 수단(20)에서 평가 기준을 구성하는 오디오 기준 신호(12)와 오디오 시험 신호(14)의 내부 표현은 청신경을 통하여 귀에서 사람의 뇌로 전달되는 정보에 해당한다. 몇가지 모델 출력값 MAW1 ... MAn이 출력되기 때문에, 오직 한 개의 모델 출력값이 출력되었는지 보다는 양적 그리고 주관적인 인상에 더 자세한 설명을 할 수 있다. 특히, 여러 가지 인위적인 소리를 측정함에 있어서 주관적인 차이가 보다 적은 방해 효과를 나타낸다.
두 개의 개별 필터 뱅크를 이용하는 경우, 도 5는 제 1 필터 뱅크(16)와 제 2 필터 뱅크(20)의 구조를 도시한 것이다. 임시로 저장하거나 래칭함과 동시에 양 신호를 처리하기 위한 한 개의 필터 뱅크를 사용하는 경우에는, 도 5는 사용된 한 개의 필터 뱅크를 도시한 것이다. 필터 뱅크(16)(20)의 출력 장치에서 복수개의 부분 신호(18)(22)를 얻기 위하여 신호 입력 장치(40)에 스펙트럼 구성비로 분해될 오디오 신호가 입력된다. 필터 뱅크(16)(20)는 복수개의 필터 서브뱅크(42a-42f)로 세분된다. 신호 입력 장치(40)에 인가된 신호는 직접 제 1 필터 서브뱅크(42a)로 전달된다. 제 2 필터 서브뱅크(42b)에 이르기 위하여, 신호는 제 2 저역 필터(44b)에 의해 여과되고 제 1 제거 수단(46)으로 처리되어 제거 수단(46b)의 출력 신호가 데이터 속도가 24 kHz이 되도록 한다. 계산 비용과 필터 뱅크의 처리될 데이터량을 반으로 줄이기 위하여 제거 수단(46)은 신호 입력 장치(40)로 인가된 데이터 스트림의 나머지 값들을 모두 없앤다. 제 1 제거 수단(46b)의 출력 신호는 제 2 필터 서브뱅크로 입력된다. 또한, 상기 신호는 데이터 속도를 다시 반으로 줄이기 위하여 제 2 저역 필터(44c)와 다음의 제 2 제거 수단(46c)으로 입력된다. 그 결과, 데이터 속도가 12 kHz가 된다. 제 2 제거 수단(46c)의 출력 신호는 제 3 필터 서브뱅크(42c)로 입력된다. 도 5에 나타낸 바와 같이, 그와 비슷하게 나머지 필터 뱅크(42d)(42e)(42f)의 입력 신호들도 생성된다. 필터 뱅크(16)(20)는 복수개의 ("다중") 서로 다른 샘플링 속도를 가지고 동작하는 복수개의 필터 서브뱅크(42a-42f)를 가지므로 소위 다중 속도 구조를 구현한다.
필터 서브뱅크(42a-42b) 각각은 복수개의 저역 필터들(48)로 이루어진다. 본 발명의 바람직한 일 실시예에서, 필터 뱅크(16)(20)는 중심 주파수가 0.1 바크씩 차이가 나는 바크 단위로 균일한 격자 형태로 배열된 241개의 개별적인 저역 필터들(48)을 포함한다. 단위 바크는 정신 음향학의 분야에서 알려져 있는 전문 장치로서 E. Zwicker, Psychoacoustics, publisher Springer-Verlag, Berlin Heidelberg New York, 1982에 설명되어 있다.
도 9는 샘플링 속도가 3 kHz일 때 필터 곡선을 나타낸 것이다. 도 9에서 필터 곡선의 왼쪽은 샘플링 속도가 3 kHz일 때에 해당하고, 중간은 12 kHz일 때에 해당하고, 오른쪽은 48 kHz일 때이다.
각 개별 대역 필터(48)의 최소 샘플링 속도는 원칙적으로 도 9에서 상단에서 감쇄가 -100 dB 이하로 떨어지는 지점 때문이다. 그러나, 간단히 설명하기 위하여 도면에서는 두 번째로 높은 샘플링 속도가 각 대역 필터(48)에 대하여 시간마다 선택되었고, 방정식 fA= 2-n·48 kHz (이 때, fA는 고려되고 있는 각 대역 필터(48)의 데이터 또는 샘플링 속도이고, 지수 n은 1에서 5까지의 값을 갖는다. 필터 뱅크(16)(20)를 다섯 개의 필터 서브뱅크 FB1-FB5로 세분하면 동일한 결과를 가져온다. 같은 샘플링 속도에서 작동하는 모든 필터들이 각 저역 필터(44b-44f)와 각 제거 수단(46b-46f)에 의한 공동의 전처리 동작을 이용할 수 있다. 다음은 각 필터 자극 곡선 또는 필터 함수의 발생에 대하여 상세히 설명하기로 한다.
바람직한 일 실시예에서, 도 5에 도시된 모든 대역 필터(48)는 디지털 FIR 필터를 가지고 실현되며, 각 FIR 필터는 필터 곡선이나 필터 함수를 알고 있을 때 공지된 방법을 통하여 계산할 수 있는 128 가지의 필터 계수를 갖는다. 이는 신속한 콘벌루션을 통하여 계산할 수 있으며, 이 때 모든 필터들, FB0(42a)과 LP1(44b)(LP = 저역)은 공통적으로 필터를 계산하기 위한 FFT를 이용할 수 있다. 저역 필터(44b-44f)의 한계 주파수는 각 필터 서브뱅크와 관련한 샘플링 속도와 함께 샘플링 법칙이 위배되지 않도록 선택해야 한다.
이 때, 각 필터의 출력 신호 1, 2, …, 241 즉, 부분 시험 신호와 부분 기준 신호는 부분 신호를 발생한 해당 필터에 의해 정의되는 대역폭을 갖는다는 사실에 주의해야 한다. 단일 필터의 대역폭도 스펙트럼 영역이라고 한다. 그러므로, 스펙트럼 영역의 중심 주파수는 해당 대역 필터의 중심 주파수에 해당하는 반면에, 스펙트럼 영역의 대역폭은 해당 필터의 대역폭과 같다. 그러므로, 스펙트럼 영역이 0.05 바크(0.1 바크는 한 대역 필터에서 다음 대역 필터까지의 중간 주파수 거리이다)보다 넓으므로, 각 스펙터럼 영역 또는 대역 필터 대역폭은 각각 중첩된다.
도 6은 중간 주파수 fm이 1,000 Hz인 대역 필터에서 마스킹 필터(48)의 구성을 나타낸 도면이다. 도 6의 세로좌표는 필터 감쇠를 dB 단위로 나타낸 것이고, 가로좌표는 중간 주파수 fm으로부터 왼쪽과 오른쪽으로 바크 단위로 나타낸 주파수 편차를 나타낸다. 도 6에서 매개 변수는 필터를 거친 오디오 신호의 음압 레벨이다. 필터링된 오디오 신호의 음압 레벨은 0 dB에서 100 dB까지의 값을 갖는다. 앞서 언급한 바와 같이, 모델에서처럼 사람 귀의 대역 필터의 필터 구성은 수신한 오디오 신호의 음압 레벨에 따라 다르다. 도 6에서 나타낸 바와 같이, 왼쪽 필터 에지는 음압 레벨이 높은 비교적 평평한 부분이고 더 낮은 음압 레벨로 감소하고 있다. 반대로, 보다 낮은 음압 레벨의 경우 경사진 에지가 한계값으로 더 빨리 변하고 있다.
오디오 신호의 음압 레벨에 대한 의존성은 필터 뱅크의 디지털 대역 필터(48)들의 각종 계수들을 스위칭하여 얻는다. 그러나, 이것은 복잡도가 매우 높을 뿐만 아니라, 청취 세기가 쉽게 변하는 단점의 폐단이 있다. (Kh. Brandenburg and Th. Sporer. "NMR" and "Masking Flag": Evaluation of quality using perceptual criteria. In proceedings of the 11th International Conference of the AES, Portland, 1992. 참조)
본 발명에 따른 오디오 신호의 청취하기 적합한 음질 평가는 또 다른 접근이 가능하다. 여러 가지 음압 레벨에 대하여 가능한 필터 곡선을 보면, 곡선(50)은 최악의 마스킹 경우 또는 최악의 경우에 형성된다. 중간 주파수 fm에서 나온 특정 주파수 편차의 경우, 최악의 경우에 해당하는 곡선(50)은 0 dB에서 100 dB로 확장될 수 있는 특정 음압 레벨 범위 내의 모든 음압 레벨 곡선의 최소값으로부터 나온다. 그러므로, 도 6의 곡선(50)에서 알 수 있는 바와 같이, 경사진 에지가 중심 주파수에 가깝고, 줌심 주파수로부터 거리가 멀어질수록 평평해진다. 도 6에서, 한계값으로부터 떨어져 있고 중간 주파수 fm의 오른쪽에 있는 대역 필터(48)의 필터 에지는 필터링된 오디오 신호의 음압 레벨에 의존하지 않는다. 이는, 오른쪽에서 곡선 에지의 경사가 음악 레벨 0 dB에서부터 100 dB에 이르기까지 거의 같다는 것을 의미한다.
본 발명에 따른 오디오 신호의 청취하기 적합한 음질 평가에서, 귀 속에서 혈액의 흐름이 외이와 중이의 전파 함수와 내부 잡음에 미치는 영향도 고려한다. 0 dB에서 100 dB에 이르는 각 음압 레벨에 대한 곡선이 도 7에 나타나 있다. 도 6과는 대조적으로, 도 7의 가로좌표는 바크 단위의 주파수 대신에 Hz 단위의 스펙트럼 영역을 나타낸다. 이 것을 음조라고도 한다. 수학적으로 표현하면, 외이와 내이(內耳)의 전파 함수와 귀의 내부 잡음을 다음 방정식으로 모형화할 수 있다:
매개 변수 a0(f)은 전 주파수 영역에 대하여 귀의 감쇠를 나타내고 dB 단위로 나타낸다.
각 대역 필터(48)에 대한 마스킹 곡선 또는 필터 곡선은 중간 주파수 fm과 음압 레벨 L의 함수로서 다음의 수학 방정식으로 모형화할 수 있다:
방정식에서 사용되는 각 매개 변수는 다음과 같다:
fm= 대역 필터의 중심 주파수;
Δb = 필터의 중간 주파수 fm과 시험 주파수 사이의 주파수 차이:
L = 필터링된 오디오 신호의 음압 레벨;
반올림 계수 c2= 0.1;
하단 에지의 경사도 S1= 27 (dB/bark);
상단 에지의 경사도: S2(fm,L) = 24 + 230 Hz/fm- 0.2·L/dB;
상수 C1:;
상수
주파수 단위를 헤르쯔에서 바크로 변환시키는 방정식은 하기와 같다:
-10 dB에서 가상 한계값이 마스킹 곡선 A에서 적분되면, 한계 마스킹 곡선 Alim은 다음과 같이 정의된다:
외이 및 중이의 전파 함수 A0(f)과 함께 가상 한계값을 포함하는 마스킹 곡선에서 바크(BARK) 단위에서 헤르쯔(Hz) 단위로 바꾸어주면 확장된 한계 마스킹 곡선 Alim이 된다. 한계 마스킹 곡선 Alim은 오디오 신호의 음악 레벨의 함수이다:
앞서 언급한 바와 같이. 각 음압 레벨에 대하여 필터 곡선 또는 마스킹 곡선을 선택하는 데에 너무 많은 비용이 소요되기 된다. 이 것은 최악 곡선을 계산하는 이유가 된다. 최악 곡선 Awc(f,fm)은 Hz 단위로 실제 주파수 f에서 중심 주파수가 fm인 마지막으로 사용된 필터의 감쇠를 나타낸다. 최악 곡선 Awc의 수학적 표현은 다음과 같다:
도 8은 본 발명에 따라 오디오 신호의 청취하기 적합한 음질 평가를 수행하기 위한 장치와 방법을 나타낸 블록도이다. 도 5를 참조하여 앞서 설명한 바와 같이, 부분 오디오 기준 신호(18)를 생성하기 위하여 오디오 기준 신호(12)가 필터 뱅크(16)에 입력된다. 마찬가지로, 부분 오디오 시험 신호(22)를 생성하기 위하여 오디오 시험 신호(14)가 필터 뱅크(20)에 입력된다. 도 6과 도 7에서 알 수 있는 바와 같이, 각 필터의 중심 주파수가 0.1 바크씩 서로 떨어져 있기 때문에 대역 필터(48)의 각 필터 곡선은 서로 중첩되어 있다. 그러므로, 각 대역 필터(48)는 사람 귀의 기저막에서 털세포가 자극받는 것을 모형화한 것이다.
필터 뱅크(16)(20)의 각 대역 필터의 출력 신호는 각각 부분 오디오 기순 신호(18)와 부분 오디오 시험 신호(22)로서 각각 모형화 수단(24)(26)에 입력된다. 모형화 수단(24)(26)은 처음에 설명한 시간 마스킹을 모형화하는 것이다. 모형화 수단(24)(26)은 한계값과 포스트마스킹을 모형화한다. 앞서 계산한 바와 같이 한계값의 주파수 의존도를 이미 필터 뱅크에 고려해 넣었으므로, 필터 뱅크의 출력값을 제곱하고 여기에 한계값의 일정한 값을 더한다. 시간 상수가 3 ms인 순환 필터는 출력 신호를 평활화한다. 이어서, 비선형 필터가 한편으로는 음이 들리는 동안에 축적되는 에너지를 적분하는 적분기로서 작용하고, 다른 한편으로는 음이 끝난 후 자극이 지수적으로 감소하는 것을 모형화한다. 모형화 수단(24)(26)의 상세한 구조는 M. Krajalainen, A new auditory model for the evaluation of sound quality of audio system, Proceedings of the ICASSP, pagas 608-611, Tampa, Florida, March 1985, IEEE에 설명된 바 있다. 지적할 점은, 이와 같은 시간 마스킹의 모형화를 수행함으로써 모든 대역이 1.5 kHz의 같은 샘플링 속도가 되게 하는 부가적인 언더샘플링 단계가 가능할 정도로 모든 대역 필터들(48)의 필터 대역을 줄여준다는 것이다.
그런 다음, 모형화 수단(24)(26)의 출력 신호는 검출 계산 수단(52)에 입력된다. 도 8에 나타낸 바와 같이, 1번으로 지정된 제 1 대역 필터의 검출 계산 수단(52)에는 1번 대역 필터에서 출력된 부분 오디오 기준 신호와, 오디오 신험 신호용 필터 뱅크의 1번 대역 필터에서 출력된 부분 오디오 시험 신호가 입력된다. 검출 계산 수단(52)은 한편으로는 부분 오디오 기준 신호와 부분 오디오 시험 신호 사이의 레벨차를 검출 확률의 형태로 매핑한다. 오디오 기준 신호와 오디오 시험 신호 때문에 같은 중간 주파수 fm을 갖는 필터 대역(48)에서의 자극이 차감되고 도 10에 나타낸 한계 함수와 비교된다. 도 10에 나타낸 한계 함수는 소위 "세부 검출 확률"에서 레벨차의 절대값을 dB 단위로 매핑한다. 사람 뇌에 적당한 검출 한계값은 2.3 dB이다. 그러나, 검출의 불확실성이 2.3 dB라는 검출 한계값에 존재한다는 사실에 주의해야 한다. 그러므로, 도 10에 나와 있는 확률 곡선을 이용해야 한다. 레벨차 2.3 dB가 검출 확률 0.5 상에 매핑된다. 각 검출 계산 수단(52)은 대역 필터(48)와 연결되어 서로에 대하여 병렬로 동작하고 검출 확룰 Pi,t에서 시간 연속적으로 각 레벨차를 매핑한다.
오디오 신호의 청취하기 적합한 음질 평가는 시간에 대하여 수행되는 것이고, 오디오 기준 신호(12)와 오디오 시험 신호(14)의 시간별 입력 신호가 필터 뱅크의 디지털 필터를 이용하여 순차적으로 처리된다는 것에 주목해야 한다. 그러므로, 검출 계산 수단(52)의 입력 신호도 각각의 순간 또는 시간대에서 해당 대역 필터(48)의 각 주파수 범위에 대한 검출 확률을 나타내는 시간에 의한 연속적인 데이터 스트림이다. 소정의 시간대에서 특정한 검출 계산 수단(52)의 검출 확률이 낮으면, 오디오 기준 신호(12)를 부호화 및 복호화하여 얻은 오디오 시험 신호(14)가 그 순간에 특정 주파수 범위에서 부호화 에러를 갖는 것으로 평가된다. 이 때, 부호화 에러는 뇌에 의해 감지될 수 없다. 이와 반대로, 검출 확률이 높으면, 오디오 시험 신호가 특정한 시간 대와 특정한 주파수 범위에서 가청 결점을 가지므로 사람의 뇌가 오디오 시험 신호의 부호화 또는 복호화 에러를 감지할 수 있게 된다.
검출 계산 수단(52)의 출력 신호는 선택적으로 전체 검출 수단(54)이나 복수개의 그룹 검출 수단(56)으로 입력된다. 전체 검출 수단(54)은 국제적으로 사용되는 소정의 시험 신호에 대하여 도 11에 나타낸 전체 검출 확률을 낸다. 도 11의 상단 그림은 세로좌표가 바크 단위로 주파수를 나타내고 가로좌표가 ms 단위로 시간을 나타낸다. 하단 그림에서, 백분율로 나타낸 검출 확률이 상단 그림의 음영 부분과 관련된다. 상단 그림에서 흰색 영역은 뇌에서 100% 확인될 수 있는 부호화 및 복호화 에러를 나타낸다. 사용된 기준 신호는 종래의 관련 분야에 알려진 것으로서, CD SQAM(Sound Quality Assessment Material)의 트랙 10에 위치하고 SQAM, Track 10으로 지정된다. 이로부터, 부호화 또는 복호화 에러를 품고 있는 오디오 신호를 얻는다. 이 때, 오디오 신호는 두 번의 악센트가 있는 a를 첼로로 연주한 것을 잘못 부호화하고 복호화하였을 때에 해당한다. 상기 오디오 신호의 길이는 2.7초이지만, 도 11과 도 12에서 그래프에서는 신호의 첫 번째 1.2초이다.
그룹 검출 수단(56)은 다음과 같이 동작한다. 그룹 검출 수단(56)은 인가된 검출 확률 pi,t로부터 시간대 t의 제 1 역확률 pgi,t= 1 - pi,t을 형성한다. 역확률 pg는 시간대 t에서 아무런 방해 레벨도 검출되지 않음을 나타내는 측정값이다. 도 8에서 적부호로 나타낸 바와 같이 다수개의 대역 필터의 레벨차에 대한 역확률이 서로 곱해지면, 검출 계산 수단(52)의 출력 신호가 도 8에 나타낸 바와 같이 모두 전체 검출 계산 수단(54)으로 입력될 때, 곱셈 결과가 교대로 형성됨에 의해 만들어진 역확률의 역확률이 시간대에 대한 전체 검출 확률을 제공한다. 이 검출 확률을 시간 단위로 평균하면 평균 전체 검출 확률이 얻어진다. 그러나, 어느 시간대에 전체 검출 확률이 10%, 20%, ..., 90% 이상이 되는지를 나타내는 히스토그램은 오디오 시험 신호의 음질을 보다 정확히 설명한다.
앞서 언급한 바와 같이, 도 11은 검출 계산 수단의 출력 신호를 그래프로 나타내었을 때의 세부 검출 확률을 보여준다. 대략 5 바크(530 Hz) 이하, 2 바크(200 Hz) 이상인 저주파수 범위에서는 시간 범위 약 100 ms 내지 1,100 ms에서 오디오 시험 신호의 부호화 및 복호화 에러를 뇌가 검출할 확률이 매우 높다. 또한, 간단한 방해 신호도 22 바크에서 구별해낼 수 있다.
그래프에서는 검출 계산 수단(52)이 출력 신호로 구성된 세부 검출 확률보다 그룹 검출 수단(56)으로 계산한 주파수군 검출 확률을 선택하였을 때 방해 레벨이 분명히 나타낸다. 그룹 검출 확률은 주파수군을 포함하는 범위에서 필터 k 주위에서 방해 레벨이 감지되는 현상을 측정한 것이다.
본 발명의 바람직한 일 실시예에서, 열 개의 인접한 세부 검출 확률이 합쳐진다. 열 개의 인접한 대역 필터가 0.1 바크씩 거리를 두고 떨어져 있으므로, 열 개의 인접 검출 확률은 결합 그룹은 1 바크의 주파수 범위에 해당한다. 인접 검출 확률의 결합 그룹을 선택할 수 있다. 주파수군이 실질적으로 정신 음향학적인 주파수군과 일치하도록 인접 검출 확률의 결합 그룹을 선택할 수 있다. 이렇게 하면 사람 귀의 주파수군 형성을 시뮬레이션하여 방해 레벨의 주관적인 음향을 그래프로도 나타낼 수 있다. 도 12를 도 11과 비교하면 검출 확률은 도 11의 주파수보다 높은 주파수를 가지고 오디오 시험 신호의 부호화 및 복호화 에러를 들을 수 있음을 나타낸다. 그러므로, 도 12에 나타낸 그룹 검출은 사람 귀에서 주파군의 형성을 시뮬레이션하기 때문에 도 11에서의 세부 검출보다 사실적인 음질 평가를 한다. 따라서, (주파수군과 같거나 작게 선택된) 인접 필터 출력값의 차이가 공동으로 평가되어 해당 주파수 범위에서 주관적인 신호 방해를 측정할 수 있다.
또는, 주파수 축을 세 부분(200 Hz 이하, 200-6,500 Hz, 6,500 Hz 이상)으로 세분할 수 있다. 오디오 기준 신호와 오디오 시험 신호의 레벨도 각각 세 부분(무성 레벨; 저레벨(20 dB 이하); 고성 레벨(20 dB 이상)로 세분할 수 있다. 이렇게 하여, 필터 샘플링값이 속하는 아홉 개의 서로 다른 유형을 얻는다. 두 개의 입력 신호의 모든 필터 출력값이 무성 레벨에 속하는 시간 영역은 자세히 설명할 필요가 없다. 나머지 여섯 가지 유형 중에서, 입력 신호차의 검출 확률 측정값을 앞서 설명한 바와 같이 각 시간대에 대하여 측정할 수 있다. 검출 확률의 결정과 더불어, 검출 계산 수단(52)으로 계산된 레벨차와 상관 관계가 있고 음질의 결함으로 인한 방해를 받는 세기를 나타내는 소위 방해 소리크기를 정의할 수 있다. 그런 다음, 방해 소리크기의 평균치와 검출 확률의 평균치를 여섯 가지 각 유형별로 계산한다.
그리고, 완전 오디오 신호의 30 가지 최악 단시간 평균치를 저장한 상태에서 10 ms의 시간 동안에 단시간 평균치를 계산한다. 이들 30 가지 최악 단시간 평균치의 평균값은 전체 평균값과 더불어 음향을 발생한다. 이 때, 방해 레벨이 매우 고르게 퍼져 있을 때 최악의 경우값을 감지한다. 이와 반대로, 작은 가청 방해 레벨이 이따금 생기면 전체 평균값을 감지한다. 오디오 시험 신호를 평가하는 데에 전체 평균값을 사용하는지 아니면 최악의 경우값을 사용하는지는 이들 두 개의 평가치의 극치를 서로 연결하여 선택할 수 있다.
지금까지 언급한 오디오 신호의 청취하기 적합한 음질 평가는 단청 오디오 신호나 모노 오디오 신호를 대상으로 한 것이다. 그러나, 본 발명에 따른 오디오 신호의 청취하기 적합한 음질 평가도 필터 뱅크(16)(20) 사이의 비선형 전처리와 검출 계산 수단(52)에서의 검출을 통하여 바이노럴 방식 또는 스테레오 방식의 오디오 시험 신호를 평가할 수 있다. 관계 전문가에게 알려진 바와 같이, 스테레오 방식 오디오 신호는 좌우 채널을 각각 구비한다. 오디오 시험 신호와 오디오 기준 신호의 좌우 채널은 각각 주파수 선택 방식으로 하는 경과음을 중점으로 하고 정지 신호를 줄여주는 비선형 소자에 의해 필터링된다. 이 동작의 출력 신호를 각각 변형 오디오 시험 신호와 변형 오디오 기준 신호라고 한다. 이제는 앞서 설명한 바와 같이 검출 계산 수단(52)에서의 검출을 한 번 수행하지 않고, 검출 계산 수단(52)에 번갈아 입력된 연속 입력 신호에 대하여 네 번 수행된다:
1차 검출, 좌측 채널 D1L: 오디오 기준 신호의 좌측 채널과 오디오 시험 신호의 좌측 채널;
1차 검출, 우측 채널 D1R: 오디오 기준 신호의 우측 채널과 오디오 시험 신호의 우측 채널;
2차 검출, 좌측 채널 D2L: 변형 오디오 기준 신호의 좌측 채널과 변형 오디오 시험 신호의 좌측 채널; 및
2차 검출, 우측 채널 D2R: 변형 오디오 기준 신호의 우측 채널과 변형 오디오 시험 신호의 우측 채널.
검출 D2L 및 D2R 이외에 검출 D1L 및 D1R을 통하여 최악의 경우값을 구한 다음, 스테레오 방식의 오디오 시험 신호의 음질을 평가하기 위하여 상기에서 계산한 값들을 평균 가중치를 통하여 합한다.
본 발명은 각각 음성 부호화 및 복호화에 관한 것으로, 특히 오디오 신호의 청취하기 적합한 음질 평가를 수행하기 위한 방법과 장치에 관한 것이다.

Claims (22)

  1. 부호화 및 복호화를 통하여 오디오 기준 신호(12)로부터 얻은 오디오 시험 신호(14)의 음질을 평가하는 방법에 있어서,
    주파수가 서로 중복되고 스펙트럼 영역을 정의하는 필터들(48)로 이루어진 제 1 필터 뱅크(20)를 이용하여, 오디오 시험 신호(14)를 스펙트럼 구성비에 따라 부분 오디오 시험 신호(22)로 세분하며, 상기 필터들은 각 필터의 중간 주파수 fm에서 얻은 사람 귀의 자극 곡선에 따라 각각 결정되는 서로 다른 필터 기능을 갖게 되는 단계와;
    제 1 필터 뱅크(20)와 일치하는 제 2 필터 뱅크(16)를 이용하여 오디오 기준 신호(12)를 스펙트럼 구성비에 따라 부분 오디오 기준 신호(18)로 세분하는 단계와;
    같은 스펙트럼 영역에 속하는 부분 오디오 시험 신호(22)와 부분 오디오 기준 신호(18) 사이의 레벨차를 스펙트럼 영역별로 형성하는 단계와; 그리고
    각 레벨차에 따라 특정 스펙트럼 영역에서 오디오 시험 신호(14)의 부호화 에러를 검출하기 위한 검출 확률을 스펙트럼 영역별로 결정하는 단계를 포함하는 오디오 신호의 음질 평가 방법.
  2. 청구항 1에 있어서,
    상기 자극 곡선은 사람 귀의 외이 및 중이 전파 함수와 내부 잡음을 고려하는 것이특징인 오디오 신호의 음질 평가 방법.
  3. 청구항 1 또는 2에 있어서,
    고주파수로 갈수록 줄어드는 사람 귀의 주파수 분해능에 근사하기 위하여 제 1 및 제 2 필터 뱅크(16)(20)의 필터들(48)의 자극 곡선이 필터들의 중심 주파수에 따라 결정되는 것이 특징인 오디오 신호의 음질 평가 방법.
  4. 청구항 1 내지 3 중 한 항에 있어서,
    제 1 및 제 2 필터 뱅크(16)(20)의 필터들(48)의 자극 곡선이 각각 오디오 시험 신호(14)와 오디오 기준 신호(12)의 음압 레벨에 따라 결정되어, 낮은 음압 레벨에서보다 높은 음압 레벨에서 평탄한 필터 에지와 낮은 한계값을 갖는 것이 특징인 오디오 신호의 음질 평가 방법.
  5. 청구항 1 내지 3 중 한 항에 있어서,
    제 1 및 제 2 필터 뱅크(16)(20)의 필터들(48)의 자극 곡선이 각각 오디오 시험 신호(14)와 오디오 기준 신호(12)의 음압 레벨에 따라 결정되어, 음압 레벨 영역에 존재할 수 있고 특정 음압 레벨에 해당하는 모든 필터 함수들의 최소 감쇠값으로부터 하나의 필터 함수를 각각 형성하는 것이 특징인 오디오 신호의 음질 평가 방법.
  6. 청구항 1 내지 5 중 한 항에 있어서,
    스펙트럼 영역별로 레벨차를 형성하는 단계 이전에, 오디오 시험 신호(14)와 오디오 기준 신호(12)의 시간 마스킹을 스펙트럼 영역별로 모형화하는 단계를 포함하는 것이 특징인 오디오 신호의 음질 평가 방법.
  7. 청구항 6에 있어서,
    스펙트럼 영역별로 시간 마스킹을 모형화하는 단계는 사후 마스킹을 고려하기 위하여 오디오 기준 신호(12)나 오디오 시험 신호(14)를 스펙트럼 영역별로 지수적으로 감쇠시킴과 동시에, 사전 마스킹을 고려하기 위하여 오디오 기준 신호(12)나 오디오 시험 신호(14)를 스펙트럼 영역별로 통합하는 것을 포함하는 것이 특징인 오디오 신호의 음질 평가 방법.
  8. 청구항 1 내지 7 중 한 항에 있어서,
    제 1 및 제 2 필터 뱅크(16)(20)의 필터들(48)이 서로 다른 샘플링 속도를 가지며, 샘플링 속도는 기 설정된 필터 감쇠에서 필터(48)의 중간 주파수 fm보다 높은 주파수에 위치한 필터 에지의 교차점에 의해 결정되는 것이 특징인 오디오 신호의 음질 평가 방법.
  9. 청구항 8에 있어서,
    오디오 시험 신호(14)와 오디오 기준 신호(12)는 샘플링 속도에 의해 이산되며, 각기 다른 샘플링 속도는 원래의 샘플링 속도와 제곱의 비에 의해 결정되고, 다수의 인접하는 필터들(48)은 필터의 서브뱅크(42a-42f)를 형성하도록 그룹핑되는 것이 특징인 오디오 신호의 음질 평가 방법.
  10. 청구항 1 내지 9 중 한 항에 있어서,
    스펙트럼 영역별로 레벨차를 형성하는 단계 이전에, 오디오 기준 신호(12)와 오디오 시험 신호(14) 사이의 지연이 결정되고 보상되는 것이 특징인 오디오 신호의 음질 평가 방법.
  11. 청구항 1 내지 10 중 한 항에 있어서,
    한계 레벨차에서의 검출 확률은 0.5이며, 한계 레벨차보다 더 작은 레벨차로 감소하고 더 높은 레벨차로 증가하는 것이 특징인 오디오 신호의 음질 평가 방법.
  12. 청구항 1 내지 11 중 한 항에 있어서,
    정신 음향학적 주파수군보다 작거나 같은 스펙트럼 범위에서 인접한 스펙트럼 영역의 검출 확률이 공동으로 평가되어 오디오 시험 신호(14)의 부호화 에러를 주관적으로 감지하는 것이 특징인 오디오 신호의 음질 평가 방법.
  13. 청구항 1 내지 12 중 한 항에 있어서,
    적절한 때에 다수 개의 연속적인 검출 확률을 결합하여 하나의 타임 슬롯을 형성하고, 하나의 타임 슬롯에 대한 전체적 검출 확률을 얻도록 적절한 때에 다수 개의 연속적인 검출 확률을 결합하는 것이 특징인 오디오 신호의 음질 평가 방법.
  14. 청구항 1 내지 13 중 한 항에 있어서,
    하나의 스펙트럼 영역에서 검출 확률의 단시간 평균값이 형성되고, 오디오 시험 신호의 수많은 단시간 평균값들이 저장되고, 모든 단시간 평균값들의 전체 평균값이 저장된 단시간 평균값들과 함께 오디오 시험 신호(14)의 각 스펙트럼 영역의 전체 음향을 생성하는 것이 특징인 오디오 신호의 음질 평가 방법.
  15. 청구항 1 내지 14 중 한 항에 있어서,
    오디오 시험 신호와 오디오 기준 신호가 좌측 채널과 우측 채널을 갖는 스테레오 신호들이고;
    오디오 시험 신호와 오디오 기준 신호를 세분하는 단계는 일시적 신호를 강조하고 정지 신호를 줄이는 비선형 소자를 이용하여 신호의 좌측 채널과 우측 채널을 각각 세분하여 좌측 채널과 우측 채널을 갖는 변형 오디오 시험 신호와 좌측 채널과 우측 채널을 갖는 변형 오디오 기준 신호를 만드는 것을 포함하며; 그리고
    스펙트럼 영역별로 레벨차를 형성하는 단계는 같은 스펙트럼 영역에 속하는 부분 신호들 즉, 좌측 채널의 부분 오디오 시험 신호와 좌측 채널의 부분 오디오 기준 신호, 우측 채널의 부분 오디오 시험 신호와 우측 채널의 부분 오디오 기준 신호, 좌측 채널의 변형된 부분 오디오 시험 신호와 좌측 채널의 변형된 부분 오디오 기준 신호, 그리고 우측 채널의 변형된 부분 오디오 시험 신호와 우측 채널의 변형된 부분 오디오 기준 신호 사이의 레벨차를 형성하는 것을 포함하는 것이 특징인 오디오 신호의 음질 평가 방법.
  16. 청구항 15에 있어서,
    좌측 채널의 신호와 우측 채널의 신호 사이의 레벨차로부터 스펙트럼 영역별로 최악의 값을 결정하고;
    좌측 채널의 변형 신호와 우측 채널의 변형 신호 사이의 레벨차로부터 스펙트럼 영역별로 최악의 값을 결정하고; 그리고
    스테레오 방식 오디오 시험 신호의 부호화 에러를 검출하기 위하여 오디오 시험 신호의 최악의 값과 변형 오디오 시험 신호의 최악의 값을 가중 평균치를 통하여 합하는 것을 특징으로 하는 오디오 신호의 음질 평가 방법.
  17. 청구항 1 내지 16 중 한 항에 있어서,
    제 1 및 제 2 필터 뱅크(16)(20)를 한 개의 단일 필터 뱅크로 구성하고, 오디오 시험 신호(14)나 오디오 기준 신호(12)를 세분하는 동안에 부분 오디오 기준 신호와 부분 오디오 시험 신호를 각각 임시 저장하는 것이 특징인 오디오 신호의 음질 평가 방법.
  18. 부호화 및 복호화를 통하여 오디오 기준 신호(12)로부터 얻은 오디오 시험 신호(14)의 음질을 평가하는 장치에 있어서,
    주파수가 서로 중복되는 필터를 포함하고 있으며, 스펙트럼 영역을 정의하고, 각 필터 중심 주파수에서의 사람 귀의 자극 곡선을 기준으로 각각 결정되는 서로 다른 필터 기능을 가지며, 오디오 시험 신호(14)를 스펙트럼 구성비에 따라 부분 오디오 시험 신호(22)로 세분하기 위한 제 1 필터 뱅크(16)와;
    1 필터 뱅크(16)와 일치하고, 오디오 기준 신호(12)를 스펙트럼 구성비에 따라 부분 오디오 기준 신호(18)로 세분하기 위한 제 2 필터 뱅크(20)와;
    같은 스펙트럼 영역에 속하는 부분 오디오 시험 신호(22)와 부분 오디오 기준 신호(18) 사이의 레벨차를 스펙트럼 영역별로 형성하기 위한 계산 수단과; 그리고
    각 레벨차에 따라 특정 스펙트럼 영역에서 오디오 시험 신호(14)의 부호화 에러를 검출하기 위한 검출 확률을 스펙트럼 영역별로 결정하고, 상기 검출 확률이 부분 오디오 기준 신호와 부분 오디오 시험 신호 사이의 레벨차가 사람의 뇌에서 감지되는 확률을 시뮬레이션하는 할당 수단(52)을 포함하는 오디오 신호의 음질 평가 장치.
  19. 청구항 18에 있어서,
    스펙트럼 영역별로 오디오 시험 신호(14)와 오디오 기준 신호(12)의 시간 마스킹을 모형화하기 위한 모형화 수단(24)을 부가적으로 포함하는 것이 특징인 오디오 신호의 음질 평가 장치.
  20. 청구항 19에 있어서,
    모형화 수단(24)은 사후 마스킹을 고려하기 위하여 오디오 기준 신호나 오디오 시험 신호를 스펙트럼 영역별로 지수적으로 감쇠시킴과 동시에, 사전 마스킹을 고려하기 위하여 오디오 기준 신호나 오디오 시험 신호를 스펙트럼 영역별로 검출하기 위한 적분 수단을 포함하는 것이 특징인 오디오 신호의 음질 평가 장치.
  21. 청구항 18 내지 20 중 한 항에 있어서,
    오디오 시험 신호(14)의 부호화 에러를 주관적으로 감지하기 위하여 인접하는 스펙트럼 영역을 공동으로 평가하기 위한 복수개의 평가 수단 그룹(56)을 부가적으로 포함하며, 공동으로 평가된 스펙트럼 영역에 의해 형성된 대역폭이 정신 음향학적 주파수군보다 작거나 같게 되도록 상기 인접한 스펙트럼 영역의 수가 선택되는 것이 특징인 오디오 신호의 음질 평가 장치.
  22. 청구항 18 내지 21 중 한 항에 있어서,
KR1019990704307A 1996-11-15 1997-10-02 오디오 신호의 청취하기 적합한 음질 평가 KR20000053311A (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE19647399.3 1996-11-15
DE19647399A DE19647399C1 (de) 1996-11-15 1996-11-15 Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen

Publications (1)

Publication Number Publication Date
KR20000053311A true KR20000053311A (ko) 2000-08-25

Family

ID=7811841

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990704307A KR20000053311A (ko) 1996-11-15 1997-10-02 오디오 신호의 청취하기 적합한 음질 평가

Country Status (10)

Country Link
US (1) US6271771B1 (ko)
EP (1) EP0938831B1 (ko)
JP (1) JP3418198B2 (ko)
KR (1) KR20000053311A (ko)
AT (1) ATE211347T1 (ko)
AU (1) AU4780497A (ko)
CA (1) CA2271880C (ko)
DE (2) DE19647399C1 (ko)
NO (1) NO992355L (ko)
WO (1) WO1998023130A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101052432B1 (ko) * 2002-07-01 2011-07-29 알카텔-루센트 유에스에이 인코포레이티드 음성 품질 평가를 위한 발음 종속 조음 보상

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2296327T3 (es) * 1998-03-27 2008-04-16 Ascom (Schweiz) Ag Procedimiento y dispositivo para la valoracion de la calidad de transmision.
DE19821273B4 (de) * 1998-05-13 2006-10-05 Deutsche Telekom Ag Meßverfahren zur gehörrichtigen Qualitätsbewertung von codierten Audiosignalen
DE19902317C1 (de) * 1999-01-21 2000-01-13 Fraunhofer Ges Forschung Vorrichtung und Verfahren zur Qualitätsbeurteilung von mehrkanaligen Audiosignalen
DE19933317C2 (de) * 1999-07-16 2002-07-04 Bayerische Motoren Werke Ag Verfahren und Vorrichtung zur Ermittlung der akustischen Raumeigenschaften insbesondere eines Fahrgastraumes in einem Kraftfahrzeug
DE10000934C1 (de) * 2000-01-12 2001-09-27 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Bestimmen eines Codierungs-Blockrasters eines decodierten Signals
NL1014075C2 (nl) * 2000-01-13 2001-07-16 Koninkl Kpn Nv Methode en inrichting voor het bepalen van de kwaliteit van een signaal.
JP3448586B2 (ja) 2000-08-29 2003-09-22 独立行政法人産業技術総合研究所 聴覚障害を考慮した音の測定方法およびシステム
US6895374B1 (en) * 2000-09-29 2005-05-17 Sony Corporation Method for utilizing temporal masking in digital audio coding
EP1241663A1 (en) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Method and device for determining the quality of speech signal
AU2003219426A1 (en) * 2002-04-22 2003-11-03 Koninklijke Philips Electronics N.V. pARAMETRIC REPRESENTATION OF SPATIAL AUDIO
AU2003283221A1 (en) * 2002-12-09 2004-06-30 Microsound A/S Method of fitting portable communication device to a hearing impaired user
AU2003233101A1 (en) * 2003-05-27 2005-01-21 Koninklijke Philips Electronics N.V. Audio coding
EP1492084B1 (en) * 2003-06-25 2006-05-17 Psytechnics Ltd Binaural quality assessment apparatus and method
DE102004029872B4 (de) * 2004-06-16 2011-05-05 Deutsche Telekom Ag Verfahren und Anordnung zur Verbesserung der Qualität bei der Übertragung codierter Audio-/Video-Signale
WO2006048814A1 (en) 2004-11-02 2006-05-11 Koninklijke Philips Electronics N.V. Encoding and decoding of audio signals using complex-valued filter banks
US20070027687A1 (en) * 2005-03-14 2007-02-01 Voxonic, Inc. Automatic donor ranking and selection system and method for voice conversion
WO2007089189A1 (en) * 2006-01-31 2007-08-09 Telefonaktiebolaget Lm Ericsson (Publ). Non-intrusive signal quality assessment
WO2007098258A1 (en) * 2006-02-24 2007-08-30 Neural Audio Corporation Audio codec conditioning system and method
FR2940565B1 (fr) * 2008-12-19 2010-12-31 Thales Sa Dispositif de generation de messages sonores a detection de defaut integree
CN101770776B (zh) * 2008-12-29 2011-06-08 华为技术有限公司 瞬态信号的编码方法和装置、解码方法和装置及处理系统
KR101600082B1 (ko) * 2009-01-29 2016-03-04 삼성전자주식회사 오디오 신호의 음질 평가 방법 및 장치
JP5637130B2 (ja) * 2011-12-26 2014-12-10 コニカミノルタ株式会社 音響出力装置
DK3245797T3 (en) * 2015-01-14 2019-03-04 Widex As PROCEDURE TO OPERATE A HEARING SYSTEM AND HEARING SYSTEM

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS532728B2 (ko) 1974-01-25 1978-01-31
US4060701A (en) * 1975-09-15 1977-11-29 Hearing Evaluation & Acoustic Research, Inc. Method for testing acoustical attenuation of hearing protectors
DE3131193A1 (de) 1981-08-06 1983-02-24 Siemens AG, 1000 Berlin und 8000 München Geraet zur kompensation von gehoerschaeden
JP3033156B2 (ja) 1990-08-24 2000-04-17 ソニー株式会社 ディジタル信号符号化装置
DE4222050C2 (de) 1991-07-09 1995-10-05 Head Acoustics Gmbh Vorrichtung zur gehörgerechten Schallfeldanalyse
US5384793A (en) 1992-01-28 1995-01-24 Ericsson Ge Mobile Communications Inc. Fading and random pattern error protection method for dynamic bit allocation sub-band coding
US5412734A (en) 1993-09-13 1995-05-02 Thomasson; Samuel L. Apparatus and method for reducing acoustic feedback
DE4345171C2 (de) 1993-09-15 1996-02-01 Fraunhofer Ges Forschung Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen
DE4437287C2 (de) 1994-10-18 1996-10-24 Fraunhofer Ges Forschung Verfahren zur Messung der Erhaltung stereophoner Audiosignale und Verfahren zur Erkennung gemeinsam codierter stereophoner Audiosignale

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101052432B1 (ko) * 2002-07-01 2011-07-29 알카텔-루센트 유에스에이 인코포레이티드 음성 품질 평가를 위한 발음 종속 조음 보상

Also Published As

Publication number Publication date
AU4780497A (en) 1998-06-10
NO992355D0 (no) 1999-05-14
CA2271880C (en) 2002-04-09
EP0938831A1 (de) 1999-09-01
CA2271880A1 (en) 1998-05-28
JP3418198B2 (ja) 2003-06-16
NO992355L (no) 1999-06-03
EP0938831B1 (de) 2001-12-19
JP2000506631A (ja) 2000-05-30
DE59705914D1 (de) 2002-01-31
ATE211347T1 (de) 2002-01-15
US6271771B1 (en) 2001-08-07
WO1998023130A1 (de) 1998-05-28
DE19647399C1 (de) 1998-07-02

Similar Documents

Publication Publication Date Title
KR20000053311A (ko) 오디오 신호의 청취하기 적합한 음질 평가
Huber et al. PEMO-Q—A new method for objective audio quality assessment using a model of auditory perception
Thiede et al. PEAQ-The ITU standard for objective measurement of perceived audio quality
US5794188A (en) Speech signal distortion measurement which varies as a function of the distribution of measured distortion over time and frequency
JP4308278B2 (ja) 電気通信装置の客観的音声品質測定の方法および装置
Karjalainen A new auditory model for the evaluation of sound quality of audio systems
Plomp The role of modulation in hearing
EP2048657B1 (en) Method and system for speech intelligibility measurement of an audio transmission system
US7398204B2 (en) Bit rate reduction in audio encoders by exploiting inharmonicity effects and auditory temporal masking
Beerends Audio quality determination based on perceptual measurement techniques
Steeneken et al. Basics of the STI measuring method
Huber Objective assessment of audio quality using an auditory processing model
Hansen Assessment and prediction of speech transmission quality with an auditory processing model.
Gunawan et al. Spectral envelope sensitivity of musical instrument sounds
Tesic et al. An experimental study on the phase importance in digital processing of speech signal
Ghimire Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863
Raso et al. Comparison of optimum filter length in linear prediction between speech and musical signals
Zhang Applicability of Different Loudness Models to Time-Varying Sound in Vehicle
Steeneken Subjective and objective intelligibility measures
Krimi et al. Realization of a psychoacoustic model for MPEG 1 using gammachirp wavelet transform
EP1777698A1 (en) Bit rate reduction in audio encoders by exploiting inharmonicity effects and auditory temporal masking
Aichinger et al. Investigation of psychoacoustic principles for automatic mixdown algorithms
Kaplanis QUALITY METERING
Boggs A preliminary model of subjective voice quality
Abrahamsson Compression of multi channel audio at low bit rates using the AMR-WB+ codec

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application