KR100623214B1 - Real-time quality analyzer for voice and audio signals - Google Patents
Real-time quality analyzer for voice and audio signals Download PDFInfo
- Publication number
- KR100623214B1 KR100623214B1 KR1020017000881A KR20017000881A KR100623214B1 KR 100623214 B1 KR100623214 B1 KR 100623214B1 KR 1020017000881 A KR1020017000881 A KR 1020017000881A KR 20017000881 A KR20017000881 A KR 20017000881A KR 100623214 B1 KR100623214 B1 KR 100623214B1
- Authority
- KR
- South Korea
- Prior art keywords
- test signal
- audio
- audio test
- received
- quality
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Abstract
본 발명은, 오디오 시험신호를 포함하는 품질 시험신호가 시험하고자 하는 장치에 의해 수신되는 오디오 신호의 실시간 지각성 품질 측정을 제공하기 위한 방법이다. 오디오 신호의 미리 기억된 표시의 재생은, 예컨대 품질 시험신호의 헤더의 동기신호를 이용하여 수신된 오디오 시험신호와 대충 동기된다. 그 후, 재생은 예컨대 수신된 오디오 시험신호의 윈도우 부분의 데이터와 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 비교하여 그 비교의 결과에 따라 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 조정함으로써 수신된 오디오 신호와 미세하게 동기된다. 그 후, 수신된 오디오 시험신호의 윈도우는, 수신된 오디오 시험신호의 품질 측정을 출력하기 위해, 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 재생의 일부와 비교된다.The present invention is a method for providing a real-time perceptual quality measurement of an audio signal received by a device to be tested by a quality test signal comprising an audio test signal. The reproduction of the pre-stored display of the audio signal is roughly synchronized with the received audio test signal using, for example, the synchronization signal of the header of the quality test signal. Then, the reproduction compares, for example, the data of the window portion of the received audio test signal with the window portion of the pre-stored display of the audio test signal and adjusts the window portion of the pre-stored display of the audio test signal according to the result of the comparison. Thereby finely synchronizing with the received audio signal. The window of the received audio test signal is then compared with a portion of the finely synchronized reproduction of the pre-stored representation of the audio test signal to output the quality measurement of the received audio test signal.
Description
본 발명은, 시험하고자 하는 음성장치에 품질측정을 제공하기 위한 방법 및 장치에 관한 것으로, 특히 그러한 장치가 수신한 음성이나 오디오신호의 실시간 객관지각 품질측정(real-time objective perceptual quality measurement)을 제공하기 위한 방법 및 장치에 관한 것이다.The present invention relates to a method and apparatus for providing a quality measurement to a speech device to be tested, and in particular to providing a real-time objective perceptual quality measurement of a speech or audio signal received by such a device. A method and apparatus for
통상의 파형 및 스펙트럼 유사도 기준이 수신한 음성신호의 인지된 품질과 특히 잘 상관하지 않기 때문에, 음성 시스템, 특히 압축 및 부호화를 포함하는 시스템에 있어서는 음성품질 평가가 어려운 작업이다. 이전에는 전기통신 시스템의 음성품질 평가는 미리 준비된 음성 재료를 이용하여 주의깊게 제어된 환경에서 수행되는 정식의 지각성 청취시험(listening test)을 이용하여 오프라인(off-line)으로 측정되고 있었다. 이 방법은 유효한 것이지만, 비용 및 시간이 많이 소비된다. 게다가, 그 시험으로부터 얻어지는 결과는 각각의 시험 대상 및 그들의 환경에 의해 결정된다. 그 결과, 그 시험으로부터의 결과는 항상 재현가능하지 않거나 일정하지 않다.Since conventional waveform and spectral similarity criteria do not correlate well with the perceived quality of the received speech signal, speech quality evaluation is a difficult task in speech systems, particularly those involving compression and encoding. Previously, voice quality evaluation of telecommunication systems was measured off-line using a formal perceptual listening test conducted in a carefully controlled environment using prepared speech materials. This method is valid but costly and time consuming. In addition, the results obtained from that test are determined by each test subject and their environment. As a result, the results from the test are not always reproducible or constant.
심리 음향학의 분야에서의 최근의 연구는 인간이 음성 및 소리를 어떻게 인식하는가 하는 더 좋은 이해에 이르렀다. 임계 대역 이론, 청각 마스킹 및 지각성 소리크기 등과 같은 이 분야의 몇가지 지견(知見)을 적용함으로써, 이제는 정식의 주관적인 청취시험의 결과와 밀접하게 매치하는 객관적인 소리측정을 개발하는 것이 가능하다. 예컨대 ITU(International Telecommunications Union: 국제 전기통신 연합)를 포함하는 각종 기관이 컴퓨터에 기억된 파일을 이용하여 오프라인의 음성 품질을 측정하기 위한 알고리즘을 개발했다. 알려진 객관적인 측정 알고리즘의 예로서는, PSQM(Perceptual Speech Quality Measure), MNB(Measuring Normalizing Blocks), PAMS(Perceptual Analysis Measurement System) 및 MBSD(Modified Bark Spectral Distortion) 측정 등이 있다. 후자의 측정은, 예컨대 인간의 청각 수신을 반사하는 대역으로 주파수를 분할한다.Recent research in the field of psychoacoustics has led to a better understanding of how humans perceive voice and sound. By applying some knowledge in this area, such as critical band theory, auditory masking, and perceptual loudness, it is now possible to develop objective sound measurements that closely match the results of formal subjective listening tests. For example, various organizations, including the International Telecommunications Union (ITU), have developed algorithms for measuring offline voice quality using files stored on a computer. Examples of known objective measurement algorithms include Perceptual Speech Quality Measure (PSQM), Measuring Normalizing Blocks (NBN), Perceptual Analysis Measurement System (PAMS), and Modified Bark Spectral Distortion (MBSD) measurements. The latter measurement, for example, divides the frequency into bands that reflect the human auditory reception.
알려진 객관적인 지각성 품질측정 시스템은, 음성 품질의 측정이 오프라인, 즉 수신되어 기억된 음성 데이터로부터 행해지는 것을 필요로 한다. 그러한 객관적인 지각성 품질측정은 연산장치내에서 실시간으로 이루어지거나 거의 실시간으로 이루어지는 것이 바람직하다.Known objective perceptual quality measurement systems require that the measurement of voice quality be done off-line, ie from received and stored voice data. Such objective perceptual quality measurements are preferably made in real time or near real time in the computing device.
본 발명은, 객관적인 지각성 품질측정을 실시간으로 또는 거의 실시간으로 실행할 수 있는 음성이나 오디오신호의 실시간 객관지각 품질측정을 제공하기 위한 방법 및 장치를 제공한다.
한 태양(態樣)에서는, 본 발명은 오디오신호의 실시간 지각성 품질측정을 제공하기 위한 방법을 제공한다. 오디오 시험신호를 포함하는 품질 시험신호가 시험하고자 하는 장치에 의해 수신된다. 오디오 신호의 미리 기억된 표시(pre-stored representation)의 재생(playback)은, 예컨대 품질 시험신호의 헤더에서 동기 펄스를 이용하여 수신된 오디오 시험신호와 대충 동기된다. 이 재생은, 그 후 예컨대 수신된 오디오 시험신호의 윈도우 부분과 오디오 시험신호의 미리 기억된 표시의 윈도우 부분의 데이터를 비교하고, 그 비교의 결과에 따라 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 조정함으로써, 수신된 오디오 시험신호와 미세하게 동기된다. 그 후, 수신된 오디오 시험신호의 윈도우는, 수신된 오디오 시험신호의 품질측정을 출력하기 위해, 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 재생의 일부와 비교된다.The present invention provides a method and apparatus for providing a real-time objective perceptual quality measurement of a speech or audio signal capable of performing the objective perceptual quality measurement in real time or near real time.
In one aspect, the present invention provides a method for providing real-time perceptual quality measurement of an audio signal. A quality test signal containing an audio test signal is received by the device under test. The playback of the pre-stored representation of the audio signal is roughly synchronized with the received audio test signal, for example using a sync pulse in the header of the quality test signal. This reproduction then compares, for example, the window portion of the received audio test signal with the data of the window portion of the pre-stored display of the audio test signal, and according to the result of the comparison By adjusting, it is finely synchronized with the received audio test signal. The window of the received audio test signal is then compared with a portion of the finely synchronized reproduction of the pre-stored representation of the audio test signal to output the quality measurement of the received audio test signal.
다른 태양에서는, 본 발명은 시험하고자 하는 장치에 의해 수신되는 품질 시험신호의 품질을 평가하기 위한 오디오 품질 분석기(audio quality analyzer: AQA)를 구비하고 있고, 품질 시험신호가 오디오 시험신호를 포함하고 있다. AQA는 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 대충 동기시키고, 상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 미세하게 동기시키며, 수신된 오디오 시험신호의 품질측정을 출력하기 위해 수신된 오디오 시험신호의 윈도우를 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 부분과 비교하도록 구성되어 있다.In another aspect, the invention includes an audio quality analyzer (AQA) for evaluating the quality of a quality test signal received by a device to be tested, wherein the quality test signal comprises an audio test signal. . The AQA roughly synchronizes the reproduction of the prestored representation of the audio test signal with the received audio test signal, finely synchronizes the reproduction of the prestored representation of the audio test signal with the received audio test signal, and receives the received audio test. Configured to compare a window of the received audio test signal with a finely synchronized portion of a pre-stored representation of the audio test signal for outputting a quality measurement of the signal.
따라서, 본 발명은 연산장치내에서 실시간 또는 거의 실시간으로 오디오 및 음성신호의 객관적인 지각성 품질측정을 제공할 수 있다.Accordingly, the present invention can provide an objective perceptual quality measurement of audio and voice signals in real time or near real time within a computing device.
도 1은 본 발명에 따른 음성 품질 인식기의 한 실시예의 블럭도,1 is a block diagram of one embodiment of a speech quality recognizer in accordance with the present invention;
도 2는 품질 시험 메시지 프레임을 나타낸 도면,2 illustrates a quality test message frame;
도 3은 본 발명에 따른 음성 품질 인식기의 다른 실시예의 블럭도,3 is a block diagram of another embodiment of a speech quality recognizer in accordance with the present invention;
도 4는 본 발명에 따른 동기 윈도우잉과 선택 윈도우잉을 제공하는 버퍼의 실시예의 블럭도,4 is a block diagram of an embodiment of a buffer providing synchronous windowing and selective windowing in accordance with the present invention;
도 5는 사각형 윈도우 함수 형상을 나타낸 도면,5 illustrates a rectangular window function shape;
도 6은 비선형 강화된 윈도우 함수 형상을 나타낸 도면,6 shows a non-linear enhanced window function shape;
도 7은 불연속 사각형 윈도우 함수를 나타낸 도면,7 shows a discrete rectangular window function,
도 8은 본 발명에 따른 시험 구성의 블럭도,8 is a block diagram of a test configuration in accordance with the present invention;
도 9는 본 발명에 따른 시험 방법의 실시예의 플로우차트이다.9 is a flowchart of an embodiment of a test method according to the present invention.
도 1은 VEUT(voice equipment under test: 시험하고자 하는 음성장치)(12)에 의해 출력된 음성신호를 수신하는 VQA(voice quality analyzer: 음성 품질 분석기)(10)의 블럭도이다. VQA(10)는 VEUT(12)로부터 수신한 음성 시험신호의 품질 요구를 발생시키는 품질 평가기(14)를 구비하고 있다. VQA(10)는 또한 DTMF(dual tone multiple frequency) 검출기(18) 및 시퀀서(sequencer; 20)를 차례로 갖춘 헤더 검출기(16)를 구비하고 있다. DTMF 검출기(18)는 VEUT(12)로부터 수신한 신호를 감시하여 수신한 신호내에 존재하고 있는 시그널링 톤(signaling tone)을 검출하여 디코드한다. 디코드된 신호는 음성문장 발생기(voice sentence generator; 22)의 동작을 제어하기 위해 시퀀서(20)에 의해 사용된다.1 is a block diagram of a voice quality analyzer (VQA) 10 that receives a voice signal output by a voice equipment under test (VEUT) 12. The VQA 10 is provided with a
음성 시험신호의 미리 기억된 표시는 음성문장 발생기(22)내에 기억되어 있다. 이러한 "문장(sentence)"은 어떤 특정의 언어로 완전한 문장이나 단어를 반드시 표현해야 한다든지 어떤 특정의 인간으로부터의 음성을 반드시 표현해야 할 필요는 없다. 오히려, 그 표시는 품질 평가기(14)에 의해 수행되는 음성품질 측정을 용이하게 하기 위해 선택된다. 음성 시험신호를 선행하는 헤더 신호가 수신된 때, 시퀀서(20)는 그 헤더에 있어서 식별되는 특정의 음성 시험신호에 기초하여 음성문장 발생기(22)로부터의 특정의 미리 기억된 음성 시험신호 표시의 재생을 초기화한다. 음성 시험신호의 미리 기억된 표시와 품질 평가기(14)를 이용하여 객관적인 지각성 품질 비교를 수행하기에 충분한 수신 음성 시험신호의 동기를 얻기 위해, 미세 동기화기(fine synchronizer; 24)가 제공된다. 음성품질 측정은, 미세 동기화기(24)로부터 동기되고 국부적으로 발생된 기준신호의 일부를 VEUT(12)로부터 수신한 신호의 윈도우 부분과 비교하는데 객관적인 지각성 품질측정 알고리즘을 적용함으로써 수행된다. 한 실시예에서는, 다음의 알고리즘, 즉 PSQM(Perceptual Speech Quality Measure), MNB(Measuring Normalizing Blocks), PAMS(Perceptual Analysis Measurement System) 및 MBSD(Modified Bark Spectral Distortion) 측정 중의 하나가 사용된다. 다른 실시예에서는, 복수의 다른 알고리즘이 이용가능하고, 알고리즘 선택이 수동으로 이루어진다. 도시하지 않은 다른 실시예에서는, 복수의 다른 알고리즘이 이용가능하고, 음성문장 발생기(22)의 미리 기억된 표시가 시퀀서(20)에 의해 선택되었는가에 따라 선택이 이루어진다.The pre-stored display of the voice test signal is stored in the
한 실시예에서는, 도 2를 참조하면, 품질 시험 메시지(30)의 일례가 나타내어져 있다. 품질 시험 메시지(30)는, 세 부분이 DTMF 시그널링을 이용하여 송신되는 헤더(40)를 구성하는 32, 34, 36와, 네번째 부분이 음성 시험 메시지(38)를 포함하고 있는 4개의 부분(32, 34, 36, 38)으로 구성되어 있다. 유일어(unique word; 32)는 새로운 품질 시험 메시지(30)의 선두(시작)를 신호로 알려 주기 위해 사용된다. 유일어(32)는 엄격한 채널 열화의 기간, 예컨대 셀룰러 네트워크로부터의 신호 중 VEUT(12)에 의한 매우 시끄러운 소리가 나는 수신의 기간에 측정 시작신호가 잘못되는 것을 방지하기 위해 포함된다. 문장 ID(34)는 음성 시험 메시지(38)의 지수나 식별자를 포함하고 있고, 이에 따라 다른 시험 메시지가 VEUT(12)로 송신되어 VQA(10)에 의해 식별되도록 되어 있다. 동기 펄스(36)는 음성 시험신호(38)의 선두를 신호로 알려 주기 위해 사용되는 짧은 DTMF 펄스이다. 동기 펄스(36)는 시퀀서(20)에 의해 사용되어 음성문장 발생기(22)가 VEUT(12)에 의해 수신되는 것과의 비교를 위해 적당한 미리 기억된 음성 시험신호 표시를 재생하는 것을 개시하도록 한다. 다른 실시예에서는, 헤더(40)는 다른 방법, 예컨대 다른 형태의 대역내 시그널링(in-band signaling)을 이용하거나, 혹은 대역외 시그널링(out-of-band signaling)을 이용함으로써 전송된다. 이들 다른 실시예에서는, 헤더(40)를 검출하여 그에 응답하기 위해 DTMF 검출기(18) 이외의 수단이 사용된다. 적당한 대역내 시그널링의 예는 모노톤 시그널링(monotone signaling: 단조 시그널링)과 전화기술 데이터 프로토콜을 포함한다. 적당한 대역외 시그널링의 예는 분리된 페이징(paging) 채널상에서의 시그널링이다.In one embodiment, referring to FIG. 2, an example of a
한 실시예에서는, 도 3을 참조하면, 시퀀서(20)는 유일어 검출기(42), 문장 ID 검출기(44) 및 도 1의 DTMF 검출기(18)의 기능을 포함하고 있는 대충 동기 검출기(coarse sync detector; 46)를 갖추고 있다. 그래서, 분리된 DTMF 검출기(18)는 도 3에는 나타내고 있지 않다. 유일어(32)가 유일어 검출기(42)에 의해 인식된 경우, 순차적으로 수신된 데이터는 문장 ID 검출기(44)를 통과하게 된다. 문장 ID 검출기(44)는 유일어 다음에 수신된 문장 ID(34)를 검출한다. 문장 ID가 식별된 때에, 문장 ID(34)에 의해 식별된 음성 시험신호에 대응하는 음성 시험신호의 적합한 미리 기억된 표시를 출력할 수 있도록 음성문장 발생기(22)를 통과하게 되고, 순차적으로 수신된 데이터는 대충 동기 검출기(46)를 통과하게 된다. 대충 동기 검출기(46)는, 한 실시예에서 짧은 DTMF 펄스로 부호화된 동기 펄스(36)를 검출한다. 대충 동기 검출기(46)로부터 대충 동기 신호가 수신된 때에, 음성문장 발생기(22)는 결정된 문장 ID(34)에 대응하는 음성신호의 미리 기억된 표시의 재생을 개시한다.In one embodiment, referring to FIG. 3, the
한 실시예에 있어서, 동기 펄스(36)에 의해 제공되는 대충 동기는, 신호 비교기(14)가 실시간 즉 신호 비교기(14)에 의해 수행되는 품질 평가가 사용자에 의해 인식되는 바와 같이 명백한 지연이 약간 있거나 없는 음성 시험신호(38)의 수신중에 발생하도록 음성 시험신호(38)를 음성신호의 미리 기억된 표시와 비교하기에 충분하지 않다. 한 실시예에서는, 대충 동기는 PSQM(Perceptual Speech Quality Measure), MNB(Measuring Normalizing Blocks), PAMS(Perceptual Analysis Measurement System) 및 MBSD(Modified Bark Spectral Distortion) 측정 알고리즘을 이용하여 음성 시험신호(38)를 분석하기에 충분하지 않다. 따라서, 더욱 정확한 동기를 위해 미세 동기 검출기(fine sync detector; 24)가 제공된다. 미세 동기 검출기(24)는 음성문장 발생기(22)의 출력을 동기 윈도우잉 모듈(sync windowing module; 52)에 의해 선택된 음성 데이터의 윈도우와 비교한다. 한 실시예에서는, 이 비교는 ITU(International Telecommunications Union: 국제 전기통신 연합) 표준 P.931, "Multimedia Communications Delay, Synchronization and Frame Rate Measurement"에 따라 수행된다. 이 비교의 결과, 미세 동기가 이루어질 때 닫히는 스위치(54)를 제어하기 위해 미세 동기 검출기(24)의 출력이 생성된다. 스위치(54)는 미세 동기가 이루어지기 전에 품질 평가가 출력되는 것을 방지한다. 게다가, 음성 시험신호의 미리 기억된 표시의 동기된 부분을 나타내는 데이터 윈도우는 선택 윈도우잉 모듈(56)로의 출력이다. 선택 윈도우잉 모듈(56)은 미리 기억된 표시(60)의 동기된 부분과 비교하기 위해 도입되는 음성 시험 데이터(58)의 동기된 부분을 선택한다. 이 비교는 지각성 비교기(14)에 의해 수행되고, 품질 평가가 생성된다. 품질 평가는 상술한 바와 같이 스위치(54)가 닫힐 때의 출력이다.In one embodiment, the coarse synchronization provided by the
도 4는 본 발명의 한 실시예의 동기 윈도우잉 모듈(52)과 선택 윈도우잉 모듈(56)의 윈도우잉 동작을 나타낸 도면이다. 동기 윈도우(62)는 동기 윈도우잉 모듈(52)에 의해 버퍼(48)로부터 선택된다. 동기 윈도우(62)와 선택 윈도우잉 모듈(56)에 의해 선택된 선택 윈도우(64)의 선두가 정렬된다. 버퍼(48)는 계수화된 음성 입력을 수용하는 환상 버퍼(circular buffer)이다. 동기 윈도우(62)의 위치는, 도 3에 나타낸 바와 같이 지각성 비교기(14)에 의해 이루어진 품질 측정에 따라 조정된다. 이 실시예에서 선택 윈도우(64)의 동기 윈도우(62)와의 정렬은, 음성문장 발생기(22)로부터 출력되는 윈도우 데이터의 선택에 의해 포함하고 있는 미세 동기 검출기(24)에 의해 이루어진다.4 is a view showing the windowing operation of the
도 3에 나타낸 실시예에서는, 선택 윈도우잉 모듈(56)은 또한 데이터 가중(data weighting)을 위해 적어도 수신된 음성과 음성 시험신호의 미리 기억된 표시의 하나에 윈도우 함수(window function)를 적용한다. 한 실시예에서는, 도 5에 나타내어진 바와 같은 사각형 가중(rectangular weighting), 일례로서 도 6에 나타내어진 비선형의 강조된 가중(nonlinear emphasized weighting) 및 일례로서 도 7에 나타내어진 불연속 사각형 가중(discontinuous rectangular weighting)을 포함하는 복수의 가중함수가 제공된다. 가중함수의 선택은 품질 알고리즘의 선택을 통해 미리 선택된다. 이 선택은 또한 도 3에 나타낸 바와 같이 지각성 비교기(14)로부터의 품질 측정에 따라 적응적으로 변경할 수 있다. 불연속 사각형 가중은, 예컨대 셀룰러 시스템에서의 핸드오프(hand-off) 등의 장애가 음성신호 데이터의 수신을 방해할 때 사용된다. 이 경우, 한 실시예에서는, 지각성 비교기(14)에 의해 사용되는 알고리즘이 품질 평가로부터 교란된 기간을 차단한다. 한 실시예에 있어서, 교란된 기간의 발생 및 길이는 품질 측정과 독립하여 보고된다.In the embodiment shown in FIG. 3, the
본 발명에 따른 시험 구성의 일례가 도 8에 나타내어져 있다. VQA(10)내의 많은 기능 구성요소나 모든 기능 구성요소는 설계상의 선택으로서 컴퓨터의 소프트웨어나 펌웨어로 실현될 수 있고, 따라서 VQA(10)는 도 8에 컴퓨터로서 나타내고 있다. 한 실시예에 있어서, VEUT(12)의 출력 포트에 연결된 VQA(10)는 핸즈프리 포트(hands-free port)를 갖춘 셀룰러 전화기(12)이다. 이와 같이 해서, 셀룰러 전화기(12)에 의해 수신된 품질 시험 메시지(30)는 분석을 위해 VQA(10)로 전송된다. 셀룰러 전화기(12)는, 예컨대 셀룰러 무선 네트워크 등의 네트워크(68)를 통해 메시지 소스(66)로부터 품질 시험 메시지(30)를 수신한다. 한 실시예에서는, 메시지 소스(66)는 음성 메일박스내에 기억되어 있는 기록된 품질 시험 메시지(30)를 가지고 있는 응답머신으로서 구성되어 있다. 음성 메일박스내의 기록된 품질 시험 메시지(30)는 문장 ID(34)와 식별된다. 메시지 소스(66)내에 기억되어 있는 음성 시험신호(38)는 VQA(10)의 음성문장 발생기(22)에서의 음성 시험 메시지의 대응하는 미리 기억된 표시를 식별하는 문장 ID(34)와 식별된다.An example of the test configuration according to the present invention is shown in FIG. 8. Many or all of the functional components in the
한 실시예에서는, 도 9를 참조하면, VEUT(12)가 네트워크(68)를 통해 메시지 소스(66)를 다이얼링하고(스텝 100), 그로부터 음성 메일 메시지를 검색한다(스텝 102). 검색된 음성 메일 메시지는 품질 시험 메시지(30)이다. 그 후, VQA(10)는 유일어(32)가 인식될 때까지 대기한다(스텝 104, 106). 다음에, 문장 ID(34)를 얻는다(스텝 108). 그 후, VQA(10)는 동기 펄스(36)가 수신될 때까지 대기한다(스텝 110, 112). 동기 펄스(36)가 수신된 때에는, 음성 시험신호(38)의 국부적인 복사가, 예컨대 음성문장 발생기(22)로부터 검색된다(스텝 114). 그 후, 음성 시험신호(38)의 국부적인 복사의 미세 동기가 수행되고(스텝 116), 음성 시험신호(38)가 종료되었다는 것이 판단될 때까지 음성 품질 측정이 계산된다(스텝 118). 음성 시험신호(38)가 종료된 때에는, 계산된 품질이 표시되고(스텝 122), 시험의 종료에 도달하게 된다(스텝 124). 다른 실시예에서는, 품질 시험이 수동 또는 자동으로 반복되도록 할 수 있다.In one embodiment, referring to FIG. 9,
당업자라면, 여기에 설명된 발명이 음성신호의 실시간 지각성 품질 측정을 제공함을 알 수 있을 것이다. 본 발명은, 이전에는 신호의 실시간 측정에 적당하다고 알려지지 않았던 알고리즘을 이용하여 그러한 측정을 수행하는데 특히 바람직하다. 본 발명은 또한 고도로 압축된 음성신호가 전송될 때의 실시간 지각성 품질 측정을 제공하는데 특히 바람직하다. 여기에 설명된 실시예는 음성신호의 품질측정에 적용가능하지만, 본 발명은 비음성 오디오 시험신호(non-voice audio test signal)의 품질 측정에 더 적합함을 알 수 있을 것이다. 따라서, 이들 실시예에서 음성 품질 분석기(10)는 일반적으로 오디오 품질 분석기(audio quality analyzer: AQA)이고, 음성 시험신호(38)는 오디오 시험신호이며, 음성문장 발생기(22)는 (계수화된 파형 발생기 등의) 오디오 파형 발생기이고, 오디오 파형 발생기에서의 음성 시험신호의 미리 기억된 표시는 오디오 시험신호의 미리 기억된 표시이다.
이상 설명한 바와 같이 본 발명에 의하면, 객관적인 지각성 품질측정을 실시간으로 또는 거의 실시간으로 실행할 수 있는 음성이나 오디오신호의 실시간 객관지각 품질측정을 제공하기 위한 방법 및 장치를 제공할 수 있다.Those skilled in the art will appreciate that the invention described herein provides a real time perceptual quality measure of a speech signal. The present invention is particularly desirable for making such measurements using algorithms that were not previously known to be suitable for real time measurements of signals. The present invention is also particularly desirable to provide real-time perceptual quality measurements when highly compressed voice signals are transmitted. While the embodiments described herein are applicable to the measurement of the quality of speech signals, it will be appreciated that the present invention is more suitable for measuring the quality of non-voice audio test signals. Thus, in these embodiments the
As described above, according to the present invention, it is possible to provide a method and apparatus for providing a real-time objective perception quality measurement of a voice or audio signal capable of performing the objective perceptual quality measurement in real time or near real time.
당업자에게는 본 발명의 범위내에서의 각종의 변형이 가능함을 알 수 있다. 따라서, 본 발명의 범위는 이후에 첨부된 청구범위 및 그 등가내용의 참조에 의해 판단되어야 한다.It will be appreciated by those skilled in the art that various modifications are possible within the scope of the invention. Accordingly, the scope of the invention should be determined by reference to the following claims and their equivalents.
Claims (32)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US1999/011473 WO2000072306A1 (en) | 1999-05-25 | 1999-05-25 | Real-time quality analyzer for voice and audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20010106412A KR20010106412A (en) | 2001-11-29 |
KR100623214B1 true KR100623214B1 (en) | 2006-09-12 |
Family
ID=22272829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020017000881A KR100623214B1 (en) | 1999-05-25 | 1999-05-25 | Real-time quality analyzer for voice and audio signals |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP4500458B2 (en) |
KR (1) | KR100623214B1 (en) |
AU (1) | AU4097099A (en) |
WO (1) | WO2000072306A1 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004008207B4 (en) * | 2004-02-19 | 2006-01-05 | Opticom Dipl.-Ing. Michael Keyhl Gmbh | Method and apparatus for quality assessment of an audio signal and apparatus and method for obtaining a quality evaluation result |
US20060093094A1 (en) * | 2004-10-15 | 2006-05-04 | Zhu Xing | Automatic measurement and announcement voice quality testing system |
US9300694B2 (en) | 2011-01-11 | 2016-03-29 | INHA—Industry Partnership Institute | Audio signal quality measurement in mobile device |
JP5792994B2 (en) * | 2011-05-18 | 2015-10-14 | 日本放送協会 | Voice comparison device and voice comparison program |
US9412373B2 (en) * | 2013-08-28 | 2016-08-09 | Texas Instruments Incorporated | Adaptive environmental context sample and update for comparing speech recognition |
CN107785031B (en) * | 2017-10-18 | 2021-01-22 | 京信通信系统(中国)有限公司 | Method and base station for testing voice damage of wired network side in wireless communication |
CN108877839B (en) * | 2018-08-02 | 2021-01-12 | 南京华苏科技有限公司 | Voice quality perception evaluation method and system based on voice semantic recognition technology |
CN109979487B (en) * | 2019-03-07 | 2021-07-30 | 百度在线网络技术(北京)有限公司 | Voice signal detection method and device |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS622286A (en) * | 1985-06-27 | 1987-01-08 | 松下電器産業株式会社 | Pronounciation practicing apparatus |
US5633909A (en) * | 1994-06-17 | 1997-05-27 | Centigram Communications Corporation | Apparatus and method for generating calls and testing telephone equipment |
US6035270A (en) * | 1995-07-27 | 2000-03-07 | British Telecommunications Public Limited Company | Trained artificial neural networks using an imperfect vocal tract model for assessment of speech signal quality |
US5809108A (en) * | 1996-09-27 | 1998-09-15 | Mci Communications Corporation | Automated test call generation and execution system |
US5805646A (en) * | 1996-10-08 | 1998-09-08 | Ericsson Inc. | Synchronization method, and associated circuitry, for improved synchronization of a receiver with a transmitter using early-late testing during coarse synchronization |
DE19730716A1 (en) * | 1996-10-21 | 1998-04-23 | Fraunhofer Ges Forschung | Triggering a measurement procedure for quality assessment of audio and / or speech signals |
-
1999
- 1999-05-25 AU AU40970/99A patent/AU4097099A/en not_active Abandoned
- 1999-05-25 WO PCT/US1999/011473 patent/WO2000072306A1/en active IP Right Grant
- 1999-05-25 JP JP2000620620A patent/JP4500458B2/en not_active Expired - Fee Related
- 1999-05-25 KR KR1020017000881A patent/KR100623214B1/en not_active IP Right Cessation
Non-Patent Citations (2)
Title |
---|
CDMA 이동통신 시스템에서의 Frame Erasure 1999.2 * |
Objective quality measurement of telephone-band (300-3400 Hz) speech codecs 1996.8 * |
Also Published As
Publication number | Publication date |
---|---|
JP2003500701A (en) | 2003-01-07 |
AU4097099A (en) | 2000-12-12 |
WO2000072306A1 (en) | 2000-11-30 |
JP4500458B2 (en) | 2010-07-14 |
KR20010106412A (en) | 2001-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6823302B1 (en) | Real-time quality analyzer for voice and audio signals | |
JP4308278B2 (en) | Method and apparatus for objective voice quality measurement of telecommunications equipment | |
EP0840975B1 (en) | Assessment of signal quality | |
US7680056B2 (en) | Apparatus and method for extracting a test signal section from an audio signal | |
CA2196554C (en) | Test method | |
JPH0654364A (en) | Apparatus for comparison of subjective dialogue in mobile telephone system | |
JPH09505701A (en) | Testing telecommunications equipment | |
RU2312405C2 (en) | Method for realizing machine estimation of quality of sound signals | |
KR100623214B1 (en) | Real-time quality analyzer for voice and audio signals | |
US7050924B2 (en) | Test signalling | |
US5799133A (en) | Training process | |
CA2396455C (en) | Method and device for determining the quality of a signal | |
Steeneken et al. | Basics of the STI measuring method | |
Barnwell III | Objective measures for speech quality testing | |
Terekhov et al. | Improved accuracy intrusive method for speech quality evaluation based on consideration of intonation impact | |
Brachmanski | Experimental comparison between speech transmission index (STI) and mean opinion scores (MOS) in rooms | |
JP4116955B2 (en) | Voice quality objective evaluation apparatus and voice quality objective evaluation method | |
Côté et al. | Speech Quality Measurement Methods | |
BRACHMAŃSKI | Automation of subjective measurements of speech intelligibility in analogue telecommunication channels | |
Song et al. | Subjective and objective assessment of loudness for mobile phone applications | |
Holub et al. | Impact of end to end encryption on GSM speech transmission quality-a case study | |
KR20020044687A (en) | APParatus and method of speech quality estimation in mobile communication system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
N231 | Notification of change of applicant | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120830 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20130830 Year of fee payment: 8 |
|
FPAY | Annual fee payment |
Payment date: 20140828 Year of fee payment: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160629 Year of fee payment: 11 |
|
FPAY | Annual fee payment |
Payment date: 20170629 Year of fee payment: 12 |
|
FPAY | Annual fee payment |
Payment date: 20180628 Year of fee payment: 13 |
|
EXPY | Expiration of term |