KR20010106412A - 음성 및 오디오신호의 실시간 품질 분석기 - Google Patents

음성 및 오디오신호의 실시간 품질 분석기 Download PDF

Info

Publication number
KR20010106412A
KR20010106412A KR1020017000881A KR20017000881A KR20010106412A KR 20010106412 A KR20010106412 A KR 20010106412A KR 1020017000881 A KR1020017000881 A KR 1020017000881A KR 20017000881 A KR20017000881 A KR 20017000881A KR 20010106412 A KR20010106412 A KR 20010106412A
Authority
KR
South Korea
Prior art keywords
test signal
audio
audio test
received
quality
Prior art date
Application number
KR1020017000881A
Other languages
English (en)
Other versions
KR100623214B1 (ko
Inventor
이안앤드류앗킨슨
마틴리
웨이마
감비즈호마연파
Original Assignee
크리스토퍼 제이. 바이른
내셔널 세미컨덕터 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 크리스토퍼 제이. 바이른, 내셔널 세미컨덕터 코포레이션 filed Critical 크리스토퍼 제이. 바이른
Publication of KR20010106412A publication Critical patent/KR20010106412A/ko
Application granted granted Critical
Publication of KR100623214B1 publication Critical patent/KR100623214B1/ko

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Abstract

본 발명은, 오디오 시험신호를 포함하는 품질 시험신호가 시험하의 장치에 의해 수신되는 오디오 신호(12)의 실시간 지각성 품질 측정을 제공하기 위한 방법이다. 오디오 신호의 미리 기억된 표시의 재생은, 예컨대 품질 시험신호의 헤더의 동기신호를 이용하여 수신된 오디오 시험신호와 대충 동기된다(20). 그 후, 재생은 예컨대 수신된 오디오 시험신호의 윈도우 부분의 데이터와 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 비교하여 그 비교의 결과에 따라 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 조정함으로써 수신된 오디오 신호와 미세하게 동기된다(24). 그 후, 수신된 오디오 시험신호의 윈도우는, 수신된 오디오 시험신호의 품질 측정을 출력하기 위해, 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 재생의 일부와 비교된다(14).

Description

음성 및 오디오신호의 실시간 품질 분석기 {REAL-TIME QUALITY ANALYZER FOR VOICE AND AUDIO SIGNALS}
공통의 파형 및 스펙트럼 유사도 기준이 수신한 음성신호의 인지된 품질과 특히 잘 연관되지 않기 때문에, 음성 시스템, 특히 압축 및 코딩을 포함하는 시스템에 있어서는 음성품질 평가가 어려운 작업이다. 이전에는 전기통신 시스템의 음성품질 평가는 미리 준비된 음성 재료를 이용하여 주의깊게 제어된 환경에서 수행되는 정식의 지각성 청취시험(listening test)을 이용하여 오프라인(off-line)으로 측정하고 있었다. 이 실시는 유효한 것이지만, 비용 및 시간이 많이 소비된다. 게다가, 그러한 시험으로부터 얻어지는 결과는 각각의 시험 대상 및 그들의 환경에 의해 결정된다. 그 결과, 그러한 시험으로부터의 결과는 항상 되풀이할 수 없거나 일치하지 않는다.
심리 음향학의 분야에서의 최근의 연구는 인간이 음성 및 소리를 어떻게 인식하는가 하는 더 좋은 이해에 이르렀다. 임계 대역 이론, 청각 마스킹 및 지각성 소리크기 등과 같은 이 분야의 몇가지 결과를 적용함으로써, 이제는 정식의 주관적인 청취시험의 결과와 밀접하게 매치하는 객관적인 소리측정을 개발하는 것이 가능하다. 예컨대 ITU(International Telecommunications Union: 국제 전기통신 연합)를 포함하는 각종 기구는 컴퓨터내에 기억된 파일을 이용하여 음성 품질 오프라인을 측정하기 위한 알고리즘을 개발했다. 알려진 객관적인 측정 알고리즘의 예로서는, PSQM(Perceptual Speech Quality Measure), MNB(Measuring Normalizing Blocks), PAMS(Perceptual Analysis Measurement System) 및 MBSD(Modified Bark Spectral Distortion) 측정 등이 있다. 후자의 측정은, 예컨대 인간의 청각 수신을 반향하는 대역으로 주파수를 분할한다.
알려진 객관적인 지각성 품질측정 시스템은, 음성 품질의 측정이 오프라인, 즉 수신되어 기억된 음성 데이터로부터 행해지는 것을 필요로 한다. 그러한 객관적인 지각성 품질측정은 연산장치내에서 실시간으로 이루어지거나 거의 실시간으로 이루어지는 것이 바람직하다.
본 발명은, 시험하의 음성장치에 품질측정을 제공하기 위한 방법 및 장치에 관한 것으로, 특히 그러한 장치가 수신한 음성이나 오디오신호의 객관적인 실시간 지각성 품질측정(real-time objective perceptual quality measurement)을 제공하기 위한 방법 및 장치에 관한 것이다.
도 1은 본 발명에 따른 음성 품질 인식기의 한 실시예의 블럭도,
도 2는 품질 시험 메시지 프레임을 나타낸 도면,
도 3은 본 발명에 따른 음성 품질 인식기의 다른 실시예의 블럭도,
도 4는 본 발명에 따른 동기 윈도잉과 선택 윈도잉을 제공하는 버퍼의 실시예의 블럭도,
도 5는 사각형 윈도우 기능 파형을 나타낸 도면,
도 6은 비선형 강화된 윈도우 기능 파형을 나타낸 도면,
도 7은 불연속 사각형 윈도우 기능을 나타낸 도면,
도 8은 본 발명에 따른 시험 구성의 블럭도,
도 9는 본 발명에 따른 시험 방법의 실시예의 플로우차트이다.
한 태양(態樣)에서는, 본 발명은 오디오신호의 실시간 지각성 품질측정을 제공하기 위한 방법을 제공한다. 오디오 시험신호를 포함하는 품질 시험신호가 시험하의 장치에 의해 수신된다. 오디오 신호의 미리 기억된 표시(pre-stored representation)의 재생(playback)은, 예컨대 품질 시험신호의 헤더에서 동기 펄스를 이용하여 수신된 오디오 시험신호와 대충 동기된다. 이 재생은, 그 후 예컨대수신된 오디오 시험신호의 윈도우 부분과 오디오 시험신호의 미리 기억된 표시의 윈도우 부분의 데이터를 비교하고, 그 비교의 결과에 따라 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 조정함으로써, 수신된 오디오 시험신호와 미세하게 동기된다. 그 후, 수신된 오디오 시험신호의 윈도우는, 수신된 오디오 시험신호의 품질측정을 출력하기 위해, 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 재생의 일부와 비교된다.
다른 태양에서는, 본 발명은 품질 시험신호가 오디오 시험신호를 포함하는 경우에 시험하의 장치에 의해 수신된 품질 시험신호의 품질을 평가하기 위한 오디오 품질 분석기(audio quality analyzer: AQA)를 구비한다. AQA는 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 대충 동기시키고, 상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 미세하게 동기시키며, 수신된 오디오 시험신호의 품질측정을 출력하기 위해 수신된 오디오 시험신호의 윈도우를 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 부분과 비교하도록 구성되어 있다.
따라서, 본 발명은 연산장치내에서 실시간 또는 거의 실시간으로 오디오 및 음성신호의 객관적인 지각성 품질측정을 제공할 수 있다.
도 1은 VEUT(voice equipment under test: 시험하의 음성장치)(12)에 의해 출력된 음성신호를 수신하는 VQA(voice quality analyzer: 음성 품질 분석기)(10)의 블럭도이다. VQA(10)는 VEUT(12)로부터 수신한 음성 시험신호의 품질 요구를 발생시키는 품질 평가기(14)를 구비하고 있다. VQA(10)는 또한 DTMF(dual tone multiple frequency) 검출기(18) 및 시퀀서(sequencer; 20)를 차례로 갖춘 헤더 검출기(16)를 구비하고 있다. DTMF 검출기(18)는 VEUT(12)로부터 수신한 신호를 감시하여 수신한 신호내에 존재하고 있는 시그널링 톤(signaling tone)을 검출하여 디코드한다. 디코드된 신호는 음성문장 발생기(voice sentence generator; 22)의 동작을 제어하기 위해 시퀀서(20)에 의해 사용된다.
음성 시험신호의 미리 기억된 표시는 음성문장 발생기(22)내에 기억되어 있다. 이러한 "문장(sentence)"은 어떤 특정의 언어로 완전한 문장이나 단어를 반드시 표현해야 한다든지 어떤 특정의 인간으로부터의 음성을 반드시 표현해야 할 필요는 없다. 오히려, 그 표시는 품질 평가기(14)에 의해 수행되는 음성품질 측정을 촉진하기 위해 선택되고 있다. 음성 시험신호를 선행하는 헤더 신호가 수신된 때, 시퀀서(20)는 그 헤더로 식별되는 특정의 음성 시험신호에 기초하여 음성문장 발생기(22)로부터의 특정의 미리 기억된 음성 시험신호 표시의 재생을 초기화한다. 음성 시험신호의 미리 기억된 표시와 품질 평가기(14)를 이용하여 객관적인 지각성 품질 비교를 수행하기에 충분한 수신 음성 시험신호의 동기를 얻기 위해, 미세 동기화기(fine synchronizer; 24)가 제공된다. 음성품질 측정은, 미세 동기화기(24)로부터 동기되고 국부적으로 발생된 기준신호의 일부를 VEUT(12)로부터 수신한 신호의 윈도우 부분과 비교하는데 객관적인 지각성 품질측정 알고리즘을 적용함으로써 수행된다. 한 실시예에서는, 다음의 알고리즘, 즉 PSQM(Perceptual Speech Quality Measure), MNB(Measuring Normalizing Blocks), PAMS(Perceptual Analysis Measurement System) 및 MBSD(Modified Bark Spectral Distortion) 측정 중의 하나가 사용된다. 다른 실시예에서는, 복수의 다른 알고리즘이 이용가능하고, 알고리즘 선택이 수동으로 이루어진다. 도시하지 않은 다른 실시예에서는, 복수의 다른 알고리즘이 이용가능하고, 음성문장 발생기(22)의 미리 기억된 표시가 시퀀서(20)에 의해 선택되는 것에 따라 선택이 이루어진다.
한 실시예에서는, 도 2를 참조하면, 품질 시험 메시지(30)의 일례가 나타내어져 있다. 품질 시험 메시지(30)는, 세 부분이 DTMF 시그널링을 이용하여 송신되는 헤더(40)를 구성하는 32, 34, 36와, 네번째 부분이 음성 시험 메시지(38)를 포함하고 있는 네 부분(32, 34, 36, 38)으로 구성되어 있다. 유일어(unique word;32)는 새로운 품질 시험 메시지(30)의 선두(시작)를 신호로 알려 주기 위해 사용된다. 유일어(32)는 엄격한 채널 저하의 주기, 예컨대 셀룰러 네트워크로부터 신호 중 VEUT(12)에 의한 매우 시끄러운 소리가 나는 수신의 주기에 오측정 시작신호를 방지하기 위해 포함된다. 문장 ID(34)는 음성 시험 메시지(38)의 지수나 식별자를 포함하고 있고, 이에 따라 다른 시험 메시지가 VEUT(12)로 송신되어 VQA(10)에 의해 식별되도록 되어 있다. 동기 펄스(36)는 음성 시험신호(38)의 선두를 신호로 알려 주기 위해 사용되는 짧은 DTMF 펄스이다. 동기 펄스(36)는 시퀀서(20)에 의해 사용되어 음성문장 발생기(22)가 VEUT(12)에 의해 수신된 것과 비교를 위해 적당한 미리 기억된 음성 시험신호 표시를 재생하는 것을 개시하도록 한다. 다른 실시예에서는, 헤더(40)가 다른 방법, 예컨대 다른 형태의 대역내 시그널링(in-band signaling)을 이용하거나, 혹은 대역외 시그널링(out-of-band signaling)을 이용함으로써 전송된다. 이들 다른 실시예에서는, 헤더(40)를 검출하여 그에 응답하기 위해 DTMF 검출기(18) 이외의 수단이 사용된다. 적당한 대역내 시그널링의 예는 모노톤 시그널링(monotone signaling: 단조 시그널링)과 전화기술 데이터 프로토콜을 포함한다. 적당한 대역외 시그널링의 예는 분리된 페이징(paging) 채널상에서의 시그널링이다.
한 실시예에서는, 도 3을 참조하면, 시퀀서(20)는 유일어 검출기(42), 문장 ID 검출기(44) 및 도 1의 DTMF 검출기(18)의 기능을 포함하고 있는 대충 동기 검출기(coarse sync detector; 46)를 갖추고 있다. 따라서, 분리된 DTMF 검출기(18)는 도 3에 나타내고 있지 않다. 유일어(32)가 유일어 검출기(42)에 의해 인식된 경우, 순차적으로 수신된 데이터가 문장 ID 검출기(44)를 통과하게 된다. 문장 ID 검출기(44)는 유일어 다음에 수신된 문장 ID(34)를 검출한다. 문장 ID가 식별된 때에, 문장 ID(34)에 의해 식별된 음성 시험신호에 대응하는 음성 시험신호의 적합한 미리 기억된 표시를 출력할 수 있도록 음성문장 발생기(22)를 통과하게 되고, 순차적으로 수신된 데이터는 대충 동기 검출기(46)를 통과하게 된다. 대충 동기 검출기(46)는, 한 실시예에서 짧은 DTMF 펄스로 부호화된 동기 펄스(36)를 검출한다. 대충 동기 검출기(46)로부터 대충 동기 신호가 수신된 때에, 음성문장 발생기(22)가 결정된 문장 ID(34)에 대응하는 음성신호의 미리 기억된 표시의 재생을 개시한다.
한 실시예에 있어서, 동기 펄스(36)에 의해 제공되는 대충 동기는, 신호 비교기(14)가 실시간 즉 신호 비교기(14)에 의해 수행되는 품질 평가가 사용자에 의해 인식되는 바와 같이 명백한 지연이 약간 있거나 없는 음성 시험신호(38)의 수신중에 발생하도록 음성 시험신호(38)를 음성신호의 미리 기억된 표시와 비교하도록 하는데 충분하지 않다. 한 실시예에서는, 대충 동기는 PSQM(Perceptual Speech Quality Measure), MNB(Measuring Normalizing Blocks), PAMS(Perceptual Analysis Measurement System) 및 MBSD(Modified Bark Spectral Distortion) 측정 알고리즘을 이용하여 음성 시험신호(38)를 분석하기에 충분하지 않다. 따라서, 더욱 정확한 동기를 위해 미세 동기 검출기(fine sync detector; 24)가 제공된다. 미세 동기 검출기(24)는 음성문장 발생기(22)의 출력을 동기 윈도우잉 모듈(sync windowing module; 52)에 의해 선택된 음성 데이터의 윈도우와 비교한다. 한 실시예에서는, 이 비교는 ITU(International Telecommunications Union: 국제 전기통신 연합) 표준 P.931, "Multimedia Communications Delay, Synchronization and Frame Rate Measurement"에 따라 수행된다. 이 비교의 결과, 미세 동기가 이루어질 때 닫히는 스위치(54)를 제어하기 위해 미세 동기 검출기(24)의 출력이 생성된다. 스위치(54)는 미세 동기가 이루어지기 전에 품질 평가가 출력되는 것을 방지한다. 게다가, 음성 시험신호의 미리 기억된 표시의 동기된 부분을 나타내는 데이터 윈도우는 선택 윈도우잉 모듈(56)로의 출력이다. 선택 윈도우잉 모듈(56)은 미리 기억된 표시(60)의 동기된 부분과 비교하기 위해 도입되는 음성 시험 데이터(58)의 동기된 부분을 선택한다. 이 비교는 지각성 비교기(14)에 의해 수행되고, 품질 평가가 생성된다. 품질 평가는 상술한 바와 같이 스위치(54)가 닫힐 때의 출력이다.
도 4는 본 발명의 한 실시예의 동기 윈도우잉 모듈(52)과 선택 윈도우잉 모듈(56)의 윈도우잉 동작을 나타낸 도면이다. 동기 윈도우(62)는 동기 윈도우잉 모듈(52)에 의해 버퍼(48)로부터 선택된다. 동기 윈도우(62)와 선택 윈도우잉 모듈(56)에 의해 선택된 선택 윈도우(64)의 선두가 정렬된다. 버퍼(48)는 계수화된 음성 입력을 수용하는 환상 버퍼(circular buffer)이다. 동기 윈도우(62)의 위치는, 도 3에 나타낸 바와 같이 지각성 비교기(14)에 의해 이루어진 품질 측정에 따라 조정된다. 이 실시예에서 선택 윈도우(64)의 동기 윈도우(62)와의 정렬은, 음성문장 발생기(22)로부터 출력되는 윈도우 데이터의 선택에 의해 포함하는 미세 동기 검출기(24)에 의해 이루어진다.
도 3에 나타낸 실시예에서는, 선택 윈도우잉 모듈(56)은 또한 데이터가중(data weighting)을 위해 적어도 수신된 음성과 음성 시험신호의 미리 기억된 표시의 하나에 윈도우 기능(window function)을 적용한다. 한 실시예에서는, 도 5에 나타내어진 바와 같은 사각형 가중(rectangular weighting), 일례로서 도 6에 나타내어진 비선형의 강조된 가중(nonlinear emphasized weighting) 및 일례로서 도 7에 나타내어진 불연속 사각형 가중(discontinuous rectangular weighting)을 포함하는 복수의 가중기능이 제공된다. 가중기능의 선택은 품질 알고리즘의 선택을 통해 미리 선택된다. 이 선택은 또한 도 3에 나타낸 바와 같이 지각성 비교기(14)로부터의 품질 측정에 따라 적응적으로 변경할 수 있다. 불연속 사각형 가중은, 예컨대 셀룰러 시스템에서의 핸드오프(hand-off) 등의 장애가 음성신호 데이터의 수신을 방해할 때 사용된다. 이 경우, 한 실시예에서는, 지각성 비교기(14)에 의해 사용되는 알고리즘이 품질 평가로부터의 교란된 주기를 차단한다. 한 실시예에 있어서, 교란된 주기의 발생 및 길이는 품질 측정과 독립하여 보고된다.
본 발명에 따른 시험 구성의 일례가 도 8에 나타내어져 있다. VQA(10)내의 많은 기능요소나 모든 기능요소는 설계 선택권으로서 컴퓨터내에 소프트웨어나 펌웨어로 구현될 수 있고, 따라서 VQA(10)는 도 8에 컴퓨터로서 나타내고 있다. 한 실시예에 있어서, VEUT(12)의 출력 포트에 연결된 VQA(10)는 핸즈프리 포트(hands-free port)를 갖춘 셀룰러 전화기(12)이다. 이와 같이 해서, 셀룰러 전화기(12)에 의해 수신된 품질 시험 메시지(30)는 분석을 위해 VQA(10)로 전송된다. 셀룰러 전화기(12)는, 예컨대 셀룰러 무선 네트워크 등의 네트워크(68)를 통해 메시지소스(66)로부터 품질 시험 메시지(30)를 수신한다. 한 실시예에서는, 메시지 소스(66)는 음성 메일박스내에 기억되어 있는 기록된 품질 시험 메시지(30)를 가지고 있는 응답머신으로서 구성되어 있다. 음성 메일박스내의 기록된 품질 시험 메시지(30)는 문장 ID(34)로 식별된다. 메시지 소스(66)내에 기억되어 있는 음성 시험신호(38)는 VQA(10)의 음성문장 발생기(22)에서의 음성 시험 메시지의 대응하는 미리 기억된 표시를 식별하는 문장 ID(34)로 식별된다.
한 실시예에서는, 도 9를 참조하면, VEUT(12)가 네트워크(68)를 통해 메시지 소스(66)를 다이얼링하고(스텝 100), 그로부터 음성 메일 메시지를 검색한다(스텝 102). 검색된 음성 메일 메시지는 품질 시험 메시지(30)이다. 그 후, VQA(10)는 유일어(32)가 인식될 때까지 대기한다(스텝 104, 106). 다음에, 문장 ID(34)를 얻는다(스텝 108). 그 후, VQA(10)는 동기 펄스(36)가 수신될 때까지 대기한다(스텝 110, 112). 동기 펄스(36)가 수신된 때에는, 음성 시험신호(38)의 국부적인 복사가, 예컨대 음성문장 발생기(22)로부터 검색된다(스텝 114). 그 후, 음성 시험신호(38)의 국부적인 복사의 미세 동기가 수행되고(스텝 116), 음성 시험신호(38)가 종료되었다는 것이 판단될 때까지 음성 품질 측정이 계산된다(스텝 118). 음성 시험신호(38)가 종료된 때에는, 계산된 품질이 표시되고(스텝 122), 시험의 종료에 도달하게 된다(스텝 124). 다른 실시예에서는, 품질 시험이 수동 또는 자동으로 반복되도록 할 수 있다.
당업자라면, 여기에 설명된 발명이 음성신호의 실시간 지각성 품질 측정을 제공함을 알 수 있을 것이다. 본 발명은, 이전에는 신호의 실시간 측정에 적당하다고 알려지지 않았던 알고리즘을 이용하여 그러한 측정을 수행하는데 특히 바람직하다. 본 발명은 또한 고도로 압축된 음성신호가 전송될 때의 실시간 지각성 품질 측정을 제공하는데 특히 바람직하다. 여기에 설명된 실시예는 음성신호의 품질측정에 적용가능하지만, 본 발명은 비음성 오디오 시험신호(non-voice audio test signal)의 품질 측정에 더 적합함을 알 수 있을 것이다. 따라서, 이들 실시예에서 음성 품질 분석기(10)는 일반적으로 오디오 품질 분석기(audio quality analyzer: AQA)이고, 음성 시험신호(38)는 오디오 시험신호이며, 음성문장 발생기(22)는 (계수화된 파형 발생기 등의) 오디오 파형 발생기이고, 오디오 파형 발생기에서의 음성 시험신호의 미리 기억된 표시는 오디오 시험신호의 미리 기억된 표시이다.
당업자에게는 본 발명의 범위내에서의 각종의 변형이 가능함을 알 수 있다. 따라서, 본 발명의 범위는 이후에 첨부된 청구범위의 참조 및 균등에 의해 판단되어야 한다.

Claims (32)

  1. 오디오 시험신호를 수신하는 것을 포함하고, 품질 시험신호를 수신하는 단계와,
    상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 대충 동기시키는 단계,
    상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 미세하게 동기시키는 단계 및,
    수신된 오디오 시험신호의 품질 측정을 출력하기 위해, 수신된 오디오 시험신호의 윈도우를 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 재생의 일부와 비교하는 단계를 구비한 것을 특징으로 하는 오디오 신호의 실시간 지각성 품질 측정을 제공하기 위한 방법.
  2. 제1항에 있어서, 상기 품질 시험신호는 동기 펄스를 포함하는 헤더 신호를 를 갖추고 있고, 상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 대충 동기시키는 단계는 상기 동기 펄스를 이용하여 오디오 시험신호의 미리 기억된 표시의 재생을 동기시키는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  3. 제2항에 있어서, 상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된오디오 시험신호와 미세하게 동기시키는 단계는,
    수신된 오디오 시험신호의 윈도우 부분의 데이터와 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 비교하는 단계와,
    상기 비교의 결과에 따라 수신된 오디오 시험신호의 윈도우 부분과 오디오 시험신호의 미리 기억된 표시의 윈도우 부분의 정렬을 조정하는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  4. 제3항에 있어서, 대역외 헤더신호를 수신하는 단계를 더 구비한 것을 특징으로 하는 방법.
  5. 제3항에 있어서, 대역내 헤더신호를 수신하는 단계를 더 구비한 것을 특징으로 하는 방법.
  6. 제5항에 있어서, 상기 헤더신호를 수신하는 단계는, DTMF 톤을 수신하는 단계와, 오디오 시험신호의 미리 기억된 표시의 재생을 DTMF 펄스와 동기시키는 것을 갖추고 오디오 시험신호의 미리 기억된 표시의 재생을 대충 동기시키는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  7. 제3항에 있어서, 오디오 시험신호는 음성 시험신호이고, 오디오 시험신호의 미리 기억된 표시는 음성 시험신호의 미리 기억된 표시인 것을 특징으로 하는 방법.
  8. 제7항에 있어서, 수신된 음성 시험신호를 식별하는 문장 ID를 수신하는 단계와,
    수신된 문장 ID에 따라 복수의 미리 기억된 표시로부터 음성 시험신호의 미리 기억된 표시를 선택하는 단계를 더 구비한 것을 특징으로 하는 방법.
  9. 제8항에 있어서, 수신된 음성 시험신호를 식별하는 문장 ID를 수신하는 단계는, 수신된 음성 시험신호를 식별하는 DTMF 톤을 수신하는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  10. 제3항에 있어서, 수신된 오디오 시험신호의 품질 측정을 출력하기 위해 수신된 오디오 시험신호의 윈도우를 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 재생의 일부와 비교하는 단계는, ITU P.861 PSQM(perceptual speech quality measurement), MNB(modified normalized block), MSBD(modified Bark spectral distortion) 및 PAMS(perceptual analysis measurement system)로 이루어진 품질 측정군으로부터 선택된 적어도 하나의 품질 측정 알고리즘에 따라 품질 측정을 발생시키는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  11. 제10항에 있어서, 헤더신호내의 문장 ID를 수신하는 단계와,
    수신된 문장 ID에 따라 품질 측정을 발생시키기 위한 품질 측정 알고리즘을 선택하는 단계를 더 구비한 것을 특징으로 하는 방법.
  12. 제3항에 있어서, 헤더신호내에 전송된 유일어를 수신하는 단계와,
    수신된 오디오 시험신호의 품질 측정을 출력하기 전에 유일어가 수신되었는지를 검증하는 단계를 더 구비한 것을 특징으로 하는 방법.
  13. 제12항에 있어서, 상기 유일어를 수신하는 단계는, 유일어를 나타내는 DTMF 신호를 수신하는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  14. 제1항에 있어서, 품질 측정을 발생시키기 위해 윈도우 부분을 비교하기 전에 적어도 수신된 오디오 시험신호의 윈도우와 오디오 시험신호의 미세하게 동기된 미리 기억된 표시의 윈도우의 하나의 윈도우에 윈도우잉 기능을 적용하는 단계를 더 구비한 것을 특징으로 하는 방법.
  15. 제14항에 있어서, 윈도우잉 기능을 적용하는 단계는 윈도우잉 기능을 미리 선택하는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  16. 제15항에 있어서, 윈도우잉 기능을 적용하는 단계는 윈도우잉 기능을 적응적으로 선택하는 단계를 구비하고 있는 것을 특징으로 하는 방법.
  17. 시험하의 장치에 의해 수신된 오디오 시험신호를 갖춘 품질 시험신호를 평가하기 위한 오디오 품질 분석기(audio quality analyzer: AQA)에 있어서,
    상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 대충 동기시키고,
    상기 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 미세하게 동기시키며,
    수신된 오디오 시험신호의 품질 측정을 출력하기 위해, 수신된 오디오 시험신호의 윈도우를 오디오 시험신호의 미리 기억된 표시의 미세하게 동기된 재생의 일부와 비교하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  18. 제17항에 있어서, 상기 품질 시험신호는 동기 펄스를 갖추고 있고, 상기 동기 펄스를 이용하여 오디오 시험신호의 미리 기억된 표시의 재생을 수신된 오디오 시험신호와 대충 동기시키도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  19. 제18항에 있어서, 수신된 오디오 시험신호의 윈도우 부분의 데이터와 오디오 시험신호의 미리 기억된 표시의 윈도우 부분을 비교하고,
    상기 비교의 결과에 따라 수신된 오디오 시험신호의 윈도우 부분과 오디오 시험신호의 미리 기억된 표시의 윈도우 부분의 정렬을 조정하도록 구성되어 있는것을 특징으로 하는 오디오 품질 분석기.
  20. 제19항에 있어서, 더욱이 대역외 헤더신호를 수신하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  21. 제19항에 있어서, 더욱이 대역내 헤더신호를 수신하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  22. 제21항에 있어서, 더욱이 상기 헤더신호로서 DTMF 톤을 수신하고, 오디오 시험신호의 미리 기억된 표시의 재생을 DTMF 펄스와 대충 동기시키도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  23. 제19항에 있어서, 오디오 시험신호는 음성 시험신호이고, 오디오 시험신호의 미리 기억된 표시는 음성 시험신호의 미리 기억된 표시인 것을 특징으로 하는 오디오 품질 분석기.
  24. 제23항에 있어서, 더욱이 수신된 음성 시험신호를 식별하는 문장 ID를 수신하고,
    수신된 문장 ID에 따라 복수의 미리 기억된 표시로부터 음성 시험신호의 미리 기억된 표시를 선택하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  25. 제24항에 있어서, 더욱이 문장 ID로서 DTMF 신호를 수신하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  26. 제19항에 있어서, ITU P.861 PSQM(perceptual speech quality measurement), MNB(modified normalized block), MSBD(modified Bark spectral distortion) 및 PAMS(perceptual analysis measurement system)로 이루어진 품질 측정군으로부터 선택된 적어도 하나의 품질 측정 알고리즘에 따라 품질 측정을 발생시키도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  27. 제26항에 있어서, 더욱이 헤더신호내의 문장 ID를 수신하고,
    수신된 문장 ID에 따라 품질 측정을 발생시키기 위한 품질 측정 알고리즘을 선택하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  28. 제19항에 있어서, 더욱이 헤더신호내에 전송된 유일어를 수신하고,
    수신된 오디오 시험신호의 품질 측정을 출력하기 전에 유일어가 수신되었는지를 검증하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  29. 제28항에 있어서, 더욱이 유일어를 나타내는 DTMF 신호를 수신하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  30. 제19항에 있어서, 더욱이 수신된 오디오 시험신호의 품질 측정을 발생시키기 위해 그들을 비교하기 전에 적어도 수신된 오디오 시험신호의 윈도우 부분과 오디오 시험신호의 미세하게 동기된 미리 기억된 표시의 윈도우 부분의 하나의 윈도우에 윈도우잉 기능을 적용하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  31. 제30항에 있어서, 더욱이 미리 선택된 윈도우잉 기능을 적용하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
  32. 제32항에 있어서, 더욱이 윈도우잉 기능을 적응적으로 적용하도록 구성되어 있는 것을 특징으로 하는 오디오 품질 분석기.
KR1020017000881A 1999-05-25 1999-05-25 음성 및 오디오신호의 실시간 품질 분석기 KR100623214B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1999/011473 WO2000072306A1 (en) 1999-05-25 1999-05-25 Real-time quality analyzer for voice and audio signals

Publications (2)

Publication Number Publication Date
KR20010106412A true KR20010106412A (ko) 2001-11-29
KR100623214B1 KR100623214B1 (ko) 2006-09-12

Family

ID=22272829

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020017000881A KR100623214B1 (ko) 1999-05-25 1999-05-25 음성 및 오디오신호의 실시간 품질 분석기

Country Status (4)

Country Link
JP (1) JP4500458B2 (ko)
KR (1) KR100623214B1 (ko)
AU (1) AU4097099A (ko)
WO (1) WO2000072306A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101527710B1 (ko) * 2011-01-11 2015-06-09 인하대학교 산학협력단 모바일 장치에서의 오디오 신호 품질 측정

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004008207B4 (de) 2004-02-19 2006-01-05 Opticom Dipl.-Ing. Michael Keyhl Gmbh Verfahren und Vorrichtung zur Qualitätsbeurteilung eines Audiosignals und Vorrichtung und Verfahren zum Erhalten eines Qualitätsbeurteilungsergebnisses
US20060093094A1 (en) * 2004-10-15 2006-05-04 Zhu Xing Automatic measurement and announcement voice quality testing system
JP5792994B2 (ja) * 2011-05-18 2015-10-14 日本放送協会 音声比較装置及び音声比較プログラム
US9412373B2 (en) * 2013-08-28 2016-08-09 Texas Instruments Incorporated Adaptive environmental context sample and update for comparing speech recognition
CN107785031B (zh) * 2017-10-18 2021-01-22 京信通信系统(中国)有限公司 一种测试无线通信中有线网络侧语音损伤的方法及基站
CN108877839B (zh) * 2018-08-02 2021-01-12 南京华苏科技有限公司 基于语音语义识别技术的语音质量感知评估的方法及系统
CN109979487B (zh) * 2019-03-07 2021-07-30 百度在线网络技术(北京)有限公司 语音信号检测方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS622286A (ja) * 1985-06-27 1987-01-08 松下電器産業株式会社 発音練習装置
US5633909A (en) * 1994-06-17 1997-05-27 Centigram Communications Corporation Apparatus and method for generating calls and testing telephone equipment
EP0840975B1 (en) * 1995-07-27 2003-02-05 BRITISH TELECOMMUNICATIONS public limited company Assessment of signal quality
US5809108A (en) * 1996-09-27 1998-09-15 Mci Communications Corporation Automated test call generation and execution system
US5805646A (en) * 1996-10-08 1998-09-08 Ericsson Inc. Synchronization method, and associated circuitry, for improved synchronization of a receiver with a transmitter using early-late testing during coarse synchronization
DE19730716A1 (de) * 1996-10-21 1998-04-23 Fraunhofer Ges Forschung Triggerung eines Meßverfahrens zur Qualitätsbeurteilung von Audio- und/oder Sprachsignalen

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101527710B1 (ko) * 2011-01-11 2015-06-09 인하대학교 산학협력단 모바일 장치에서의 오디오 신호 품질 측정
US9300694B2 (en) 2011-01-11 2016-03-29 INHA—Industry Partnership Institute Audio signal quality measurement in mobile device
US9729602B2 (en) 2011-01-11 2017-08-08 Inha-Industry Partnership Institute Audio signal quality measurement in mobile device

Also Published As

Publication number Publication date
KR100623214B1 (ko) 2006-09-12
WO2000072306A1 (en) 2000-11-30
JP2003500701A (ja) 2003-01-07
AU4097099A (en) 2000-12-12
JP4500458B2 (ja) 2010-07-14

Similar Documents

Publication Publication Date Title
US6823302B1 (en) Real-time quality analyzer for voice and audio signals
Holmes The JSRU channel vocoder
JP3964456B2 (ja) 電気通信装置の客観的音声品質測定の方法および装置
JP4098083B2 (ja) 電気通信網における電話リンクの会話品質の測定
EP0981888B1 (en) Testing telecommunications equipment
EP0840975B1 (en) Assessment of signal quality
CA2196554C (en) Test method
US7680056B2 (en) Apparatus and method for extracting a test signal section from an audio signal
JPH0654364A (ja) 移動電話システムにおける主観的な対話の質を比較するための装置
RU2312405C2 (ru) Способ осуществления машинной оценки качества звуковых сигналов
JP2004282700A (ja) エコー検出および監視
US6996068B1 (en) Audio testing in a packet switched network
US8731184B2 (en) Performance testing of echo cancellers using a white noise test signal
EP1492085A2 (en) Method of reflecting time/language distortion in objective speech quality assessment
KR100623214B1 (ko) 음성 및 오디오신호의 실시간 품질 분석기
US7050924B2 (en) Test signalling
US6834040B2 (en) Measurement synchronization method for voice over packet communication systems
EP1250830B1 (en) Method and device for determining the quality of a signal
EP1492084B1 (en) Binaural quality assessment apparatus and method
Terekhov et al. Improved accuracy intrusive method for speech quality evaluation based on consideration of intonation impact
WO2002065456A1 (en) System and method for voice quality of service measurement
JP2014171021A (ja) 遅延時間測定装置、遅延時間測定方法及びプログラム
BRACHMAŃSKI Automation of subjective measurements of speech intelligibility in analogue telecommunication channels
Holub et al. Impact of end to end encryption on GSM speech transmission quality-a case study
Raake Perceptual dimensions of speech sound quality in modern transmission systems

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120830

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20130830

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20140828

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20160629

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20170629

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20180628

Year of fee payment: 13

EXPY Expiration of term