KR100307701B1 - 객관적음질평가를위한음성동기방법 - Google Patents

객관적음질평가를위한음성동기방법 Download PDF

Info

Publication number
KR100307701B1
KR100307701B1 KR1019980049122A KR19980049122A KR100307701B1 KR 100307701 B1 KR100307701 B1 KR 100307701B1 KR 1019980049122 A KR1019980049122 A KR 1019980049122A KR 19980049122 A KR19980049122 A KR 19980049122A KR 100307701 B1 KR100307701 B1 KR 100307701B1
Authority
KR
South Korea
Prior art keywords
time
synchronization
voice
tone
sound
Prior art date
Application number
KR1019980049122A
Other languages
English (en)
Other versions
KR20000032617A (ko
Inventor
김영렬
김광훈
김병철
서성희
김주완
Original Assignee
조정남
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 조정남, 에스케이 텔레콤주식회사 filed Critical 조정남
Priority to KR1019980049122A priority Critical patent/KR100307701B1/ko
Publication of KR20000032617A publication Critical patent/KR20000032617A/ko
Application granted granted Critical
Publication of KR100307701B1 publication Critical patent/KR100307701B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L27/00Modulated-carrier systems
    • H04L27/26Systems using multi-frequency codes
    • H04L27/30Systems using multi-frequency codes wherein each code element is represented by a combination of frequencies

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Telephonic Communication Services (AREA)

Abstract

1. 청구범위에 기재된 발명이 속하는 기술분야
본 발명은 객관적 음질 평가를 위한 음성 동기 방법에 관한 것임.
2. 발명이 해결하고자하는 과제
본 발명은, 이중음 다주파(DTMF) 톤 및 빠른 상호 상관 계산 방법을 채용하여, 통신망 등에서 원음의 송신 시작 시간과 수신 왜곡음의 수신 시작 시간을 일치시키므로써, 객관적인 음질 평가를 수행할 수 있도록 하여 음질 평가에 대한 신뢰성을 현저하게 높일 수 있는 음성 동기 방법 및 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하고자 함.
3. 발명의 해결방법의 요지
본 발명은, 객관적 음질 평가를 위한 음성 동기 방법에 있어서, 이중음 다주파(DTMF) 톤을 사용하여 송신측과 수신측 장비간 시간 동기를 맞추는 제 1 단계; 및 상기 장비간 시간 동기로 인한 소정 동기 오차 범위내에서, 실시간 음성 동기를 위해 원음과 수신 왜곡음의 빠른 퓨리에 변환(FFT)과 역 빠른 퓨리에 변환(IFFT)을 취하여 상호 상관을 빠르게 계산하여, 상기 송신측과 수신측의 음성 동기를 실시간으로 맞추는 제 2 단계를 포함함.
4. 발명의 중요한 용도
본 발명은 통신망 등에서의 객관적 음질 평가에 이용됨.

Description

객관적 음질 평가를 위한 음성 동기 방법{Vice synchronization method for objective voice quality estimation}
본 발명은 객관적 음질 평가를 위한 음성 동기 방법에 관한 것으로서, 특히 통신망 등에서 생기는 다양한 잡음 환경과 채널이 손상되는 환경 속에서 음성을 동기시켜 객관적인 음성의 품질을 평가할 수 있도록 하는 음성 동기 방법에 관한 것이다.
일반적으로, 통신망의 음성 품질을 측정하는 방법은 크게 두 가지로 나누어지는데, 첫번째는 직접 사람이 음성을 듣고 평가하는 주관적 음질 평가 방법이고, 두번째는 사람에 의한 주관적인 평가와는 달리 객관적인 측정 기준에 의해 평가하는 방법이 있다.
그리고, 최종적으로 통신망이 구현하고자 하는 목표는 좀 더 깨끗하고 좋은 음성을 제공하는데 있기 때문에, 최종 품질은 사람에 의한 주관적 평가를 만족시켜야 한다.
그러나, 통신망의 품질을 매번 사람에 의해 평가한다면 매우 번거롭고 지나치게 많은 비용이 소요될 뿐만 아니라, 주관적 평가에서 오는 오차가 발생하게 되어 주관적 음질과 높은 상관도를 갖는 객관 음질 평가 방법이 요구된다.
이렇게, 요구되는 객관적 음질 평가 방법에는 시간영역에서 야기된 편차를 측정하는 신호대 잡음비(SNR : Signal to Noise Ratio)를 측정하는 방법, 선형 예측 부호화(LPC : Linear Predictive Coding)를 이용한 방법, 주파수 영역에서의 편차를 측정하는 방법 및 사람의 청각 특성을 모델링하여 측정하는 PSQM(Perceptual Speech Quality Measure) 방법 등이 있다.
그리고, 전술한 객관적 음질 평가 방법 중 신호대 잡음비 측정 방법을 제외한 나머지 방법은 원음과 왜곡음의 차이를 계산하는 방법을 사용하기 때문에 원음과 왜곡음의 음성 동기가 매우 중요하다.
이러한, 종래의 음성 동기 방법은 송신 음성에 특정 부호를 삽입하여 수신단에서 특정 부호와 같은 부호를 곱하여 음성 동기를 하는 방법을 사용하였다.
그러나, 상기한 바와 같은 종래의 음성 동기 방법은, 송신 음성에 특정 코드를 삽입하여 전송하는 경우에 디지털 이동 전화와 같이 보코더(Vocoder)를 사용하는 통신망에서는 특정 코드가 모두 소실되어 음성 동기를 할 수 없는 문제점이 있었다.
본 발명은, 상기한 바와 같은 요구에 부응하기 위하여 제안된 것으로, 이중음 다주파(DTMF ; Dual Tone Multi Frequency) 톤 및 빠른 상호 상관 계산 방법을 채용하여, 통신망 등에서 원음의 송신 시작 시간과 수신 왜곡음의 수신 시작 시간을 일치시키므로써, 객관적인 음질 평가를 수행할 수 있도록 하여 음질 평가에 대한 신뢰성을 현저하게 높일 수 있는 음성 동기 방법 및 그를 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.
도 1은 본 발명이 적용되는 음질 평가 장치의 구성 블록도.
도 2는 본 발명에 적용되는 DTMF 톤 검출 과정에 대한 예시도.
도 3은 본 발명에 따른 객관적 음질 평가를 위한 음성 동기 방법에 대한 일실시예 절차도.
* 도면의 주요 부분에 대한 부호의 설명 *
110: 이동 모듈 120: 유선 모듈
111, 121: 출력부 112, 122: 입력부
113, 123: 저장부 114, 124: 중앙처리부
115, 125: 아날로그/디지털 변환부
116, 126: 디지털/아날로그 변환부
117: 이동전화 단말장치 127: 유선전화 접속부
130: 이동전화 기지국 131: 이동전화 교환국
132: 공중전화 교환국
이와 같은 목적을 달성하기 위한 본 발명은, 객관적 음질 평가를 위한 음성 동기 방법에 있어서, 이중음 다주파(DTMF) 톤을 사용하여 송신측과 수신측 장비간 시간 동기를 맞추는 제 1 단계; 및 상기 장비간 시간 동기로 인한 소정 동기 오차 범위내에서, 실시간 음성 동기를 위해 원음과 수신 왜곡음의 빠른 퓨리에 변환(FFT)과 역 빠른 퓨리에 변환(IFFT)을 취하여 상호 상관을 빠르게 계산하여, 상기 송신측과 수신측의 음성 동기를 실시간으로 맞추는 제 2 단계를 포함하여 이루어진 것을 특징으로 한다.
또한, 본 발명은, 프로세서를 구비한 정보제공 시스템에, 이중음 다주파(DTMF) 톤을 사용하여 송신측과 수신측 장비간 시간 동기를 맞추는 제 1 기능; 및 상기 장비간 시간 동기로 인한 소정 동기 오차 범위내에서, 실시간 음성 동기를 위해 원음과 수신 왜곡음의 빠른 퓨리에 변환(FFT)과 역 빠른 퓨리에 변환(IFFT)을 취하여 상호 상관을 빠르게 계산하여, 상기 송신측과 수신측의 음성 동기를 실시간으로 맞추는 제 2 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.
상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.
도 1은 본 발명이 적용되는 음질 평가 장치의 구성 블록도로서,이동모듈(110)과, 유선모듈(120)과, 이동전화 기지국(130)과, 이동전화 교환국(131)과, 공중전화 교환국(132)을 구비한다.
이동모듈(110)은 출력부(111)와, 입력부(112)와, 저장부(113)와, 중앙처리부(114)와, 아날로그/디지털 변환부(115)와, 디지털/아날로그 변환부(116)와, 이동전화 단말장치(117)를 구비한다.
유선모듈(120)은 출력부(121)와, 입력부(122)와, 저장부(123)와, 중앙처리부(124)와, 아날로그/디지털 변환부(125)와, 디지털/아날로그 변환부(126)와, 유선전화 접속부(127)를 구비한다.
상기한 바와 같은 구조를 갖는 본 발명이 적용되는 음질 평가 장치의 동작에 대하여 상세히 설명하면 다음과 같다.
이동모듈(110)의 저장부(113)와 유선모듈(120)의 저장부(123)에는 원음과 이중음 다주파(DTMF : Dual Tone Multi Frequency) 톤을 저장한다.
먼저, 이동모듈(110)의 저장부(113)에 저장된 유성 원음 또는 DTMF 톤은 중앙처리부(114)를 거친 다음 디지털/아날로그 변환부(116)를 통해 아날로그 신호로 변환되어 이동전화 단말장치(117)로 전송된다.
이렇게, 이동전화 단말장치(117)로 전달된 신호는 이동전화 기지국(130), 이동전화 교환국(131) 및 공중전화교환국(132)을 순차적으로 거쳐 유선모듈(120)의 유선전화 접속부(127)로 전송한다.
유선전화 접속부(127)는 수신된 음성 또는 DTMF 톤을 아날로그/디지털 변환부(125)를 거쳐 디지털 신호로 변환한 후에 중앙처리부(124)로 전송한다.
중앙처리부(124)는 수신한 음성 또는 DTMF 톤을 저장부(123)에 일시 저장한 후에 음성동기 알고리즘을 수행한다.
또한, 역으로 유선모듈(120)의 중앙처리부(124)는 저장부(123)로부터 저장되어 있는 원음 또는 DTMF 톤을 읽어와서 디지털/아날로그 변환부(126)를 거쳐 아날로그 신호로 변환한 후에 유선전화 접속부(127)로 전송한다.
그리고, 유선모듈(120)의 유선전화 접속부(127)는 디지털/아날로그 변환부(126)로부터 전달된 아날로그 음성 또는 DTMF 톤을 공중전화 교환국(132), 이동전화 교환국(131) 및 이동전화 기지국(130)을 순차적으로 통해 이동전화 단말장치(117)로 전달한다.
이렇게, 이동모듈(110)로 전달된 신호는 아날로그/디지털 변환부(115)에 의해 디지털 신호로 변환된 후에 중앙처리부(114)로 전송된다.
이동모듈(110)의 중앙처리부(114)는 수신한 음성 또는 DTMF 톤을 저장부(123)에 일시 저장한 후에 음성 동기 알고리즘을 수행한다.
이와 같은, 음성 동기 과정은 다음과 같은 2단계 과정으로 구분된다.
우선, 제 1 단계 장비동기는 이동모듈(110)과 유선모듈(120)의 장비 동기로서, 이동모듈(110)과 유선모듈(120) 간의 시간 오차를 DTMF 톤을 사용하여 특정 범위 내로 한정시키는 단계이고, 제 2 단계 음성 동기는 특정 범위 내로 한정된 음성 동기 오차를 원음과 왜곡음의 빠른 상호 상관을 취하여 정확한 음성 동기를 맞추는 단계이다.
제 1 단계 장비 동기는 DTMF 톤을 사용하여 이루어진다. 즉, 이동모듈(110)또는 유선모듈(120)의 DTMF 톤을 송신하고, 유선모듈(120) 또는 이동모듈(110)에서 톤 검출 알고리즘을 적용하여 송신된 톤을 검출하여 이동모듈(110)과 유선모듈(120)의 시간을 특정 범위 내로 맞추는 과정이다.
도 2는 본 발명에 적용되는 DTMF 톤 검출 과정에 대한 예시도로서, 여기서 톤 검출 과정은 수신된 톤의 끝에서 검출이 이루어지는 것으로 가정한다.
도 2에 도시된 바와 같이, 이동모듈(210)에서 W1초 길이의 DTMF 톤을 송신하면(211), 통신망에 의한 지연 시간 후에 톤은 유선모듈(220)에 수신된다.
그러나, 통신망의 다양한 환경 때문에 이동모듈(210)에서 송신된 톤은 수신 톤1(212)과 같이 손실 없이 수신되는 경우, 수신 톤2(213)와 같이 송신 톤의 절반만 수신되는 경우 및 수신 톤3(214)과 같이 송신 톤의 극히 일부만이 수신되는 경우로 나누어 생각할 수 있다.
수신 톤1(212)의 경우에, 이동모듈(210)에서 W1초 길이 DTMF 톤을 송신하여 유선모듈(220)에서 톤이 검출되는 시간은 통신망에 의한 지연 시간 W2초만큼 지연되어 (W2+W1초)에 검출된다.
수신 톤2(213)의 경우에, 이동모듈(210)에서 W1초 길이 DTMF 톤을 송신하여 유선모듈(220)에서 검출되는 시간은 통신망 지연시간 W2초만큼 지연되어 (W2+(W1/2))초에 검출된다.
수신 톤3(214)의 경우에, 이동모듈(210)에서 W1초 길이 DTMF 톤을 송신하여 유선모듈(220)에서 검출되는 시간은 통신망 지연시간 W2초 동안 검출에 필요한 최소한의 길이 D초만큼 지연되어 (W2+D)초에 검출된다.
따라서, 이동모듈(210)에서 W1초 길이 DTMF 톤을 송신하여 유선모듈(220)에서 검출되는 시간은 (W1-D)초만큼 변한다. 만약, 극단적으로 수신 톤3(124)의 경우에 톤 검출에 필요한 최소한의 톤 길이 D초가 0에 가까운 값이라면 DTMF 톤 검출 방식에 의한 시간 오차는 최대 W1초라고 생각할 수 있다.
그리고, 제 1 단계 장비 동기는 이동모듈(110)과 유선모듈(120)의 장비 동기 과정으로서, 이동모듈(110)과 유선모듈(120)의 시간 오차를 DTMF 톤을 사용하여 특정 범위 내로 한정시키는 단계이다.
즉, 장비 동기란, 이동모듈(110)에서 유선모듈(210)로 DTMF 톤을 송신한 후, 유선모듈(210)로부터 이동모듈(110)로 음성이 전달되는 시간을 한정하거나, 또는 유선모듈(210)에서 이동모듈(110)로 DTMF 톤을 송신한 후, 이동모듈(110)로부터 유선모듈(210)로 음성이 전달되는 시간을 한정하는 것이다.
도 3은 본 발명에 따른 객관적 음질 평가를 위한 음성 동기 방법에 대한 일실시예 절차도이다.
도 3에 도시된 바와 같이, 제1 단계(330) 장비 동기는 DTMF 톤을 사용하여 이루어진다. 즉, 이동모듈(310)에서 길이 W1초인 DTMF 톤1을 송신하면 통신망 지연시간 W2초 후에 유선모듈(320)에 수신되어 W3초 후에 DTMF 톤1을 검출하고, 유선모듈(320)은 DTMF 톤1을 검출한 후, W4초 후에 DTMF 톤2를 송신하여 통신망 지연시간 W2초 후에 이동모듈(310)에 수신되어 W5초 후에 DTMF 톤2를 검출한다.
이동모듈(310)은 톤 검출 후 W4초 후에 음성1을 송신하고, 유선모듈(320)이 DTMF 톤2를 송신한 후부터 W6초 후에, 음성 수신을 시작하는 시점인 T3(333)시점에서 이동모듈(310)과 유선모듈(320)의 진행시간은 T1(331)시점을 기준으로 하여 다음 [수학식 1] 및 [수학식 2]와 같다.
T3 시점에서 이동모듈의 진행시간 = W2+W3+W4+W2+W5+W4
T3 시점에서 유선모듈의 진행시간 = W2+W3+W4+W6
그러나, 상기 [수학식 1] 및 [수학식 2]에서 톤 검출 시간인 W3와 W5는 톤 검출 시간 오차 때문에 0에서 W1까지 변한다.
따라서, T3(333)시점에서 이동모듈(310)의 진행시간은 톤 검출 시간 오차 때문에 다음 [수학식 3]과 같은 오차 범위 내에 존재하게 된다.
2W2+2W4 < T3 시점에서 이동모듈의 진행시간 < 2W2+2W4+2W1
또한, T3(333)시점에서 유선모듈(320)의 진행시간도 W3에 의한 톤 검출시간 오차 때문에 다음 [수학식 4]와 같은 오차 범위 내에 존재하게 된다.
W2+W4+W6 < T3시점에서 유선모듈의 진행시간 < W2+W4+W6+W1
상기 [수학식 3]과 [수학식 4]를 이용하여 T3(333)시점에서 유선모듈(320)과 이동모듈(310) 간의 진행 시간 오차 범위를 계산하면 다음 [수학식 5]와 같다.
W2+W4-W6-W1 < T3시점에서 유선모듈과 이동모듈 간의 진행시간 범위 < W2+W4-W6+2W1
상기 [수학식 5]에서 W6은 임의로 선정할 수 있는 값이므로, W4와 같게 선정하면 T3(333)시점에서 유선모듈(320)과 이동모듈(310) 간의 진행시간 오차 범위는 다음 [수학식 6]과 같다.
W2+W4-W6 < T3시점에서 유선모듈과 이동모듈 간의 진행시간 오차 < W2+W1
따라서, T3(333)시점에서 유선모듈(320)과 이동모듈(310)의 진행시간 오차는 최대 (W2+W1)초이다.
제 2 단계 음성 동기는 제 1 단계 장비 동기에서 0 내지 (W1+W2)초 범위로특정된 동기 오차 범위 내에서 정확한 음성 동기를 맞추는 과정으로 원음과 수신 왜곡음의 빠른 상호 상관 방법을 사용한다.
그리고, T3(333)시점에서 이동모듈(310)과 유선모듈(320) 간의 시간 오차가 최대 2W1초로 한정된 상태에서 이동 모듈(310)은 길이 W7초인 음성1을 송신하고, 유선모듈(320)은 통신망 지연시간 W2초 후에 음성을 수신하기 시작하여 음성 길이 W7초 동안 저장부(123)에 저장한다.
이때, 수신 음성은 이동모듈(310)과 유선모듈(320) 간의 시간 오차 때문에 유선모듈(120)의 저장부(123)에 저장되어 있는 원음1보다 0 내지 (W1+W2)초만큼 빨리 수신된다. 이와 같은 상태에서, 저장부(123)에 저장되어 있는 원음과 수신 왜곡음의 상호 상관(cross correlation)을 0에서 (W1+W2)초 사이에 취하면, 원음과 수신 왜곡음이 일치할 때 최고 상관 값을 나타내고 바로 이때가 동기 시점이다.
원음과 수신 왜곡음의 상호 상관(cross correlation)은 다음 [수학식 7]과 같이 계산된다.
상기 [수학식 7]에서 x[n]은 원음, y[n]은 왜곡음이고 N은 원음의 샘플 길이를 의미한다.
여기서, 샘플 길이 N은 W7초 음성 길이이고, 8kHz 아날로그/디지털 변환기를 사용한다면 8,000 x W7 샘플이 된다.
그러나, 원음과 왜곡음의 상호 상관을 직접 계산하기 위해서는 많은 계산량을 필요로 한다.
예를 들어, 음성을 8kHz 아날로그/디지털 변환기를 이용하여 변환한다면, 5초 음성은 40,000(=5초x8000)개의 샘플이기 때문에 음성의 길이 N은 40,000이 된다.
그리고, 0.5초 길이 DTMF 톤을 사용한다면, 8kHz 아날로그/디지털 변환기를 이용한 변환시 DTMF 톤 길이 0.5초는 4,000(=0.5x8,000) 샘플이 된다.
또한, 통신망 지연시간 W2도 통신망에 따라 약간씩 변화하는데, 최대 0.5초라고 생각 할 수 있으므로, 이때의 통신망 지연시간도 4,000 샘플이 된다.
따라서, 40,000개의 음성 샘플에 대하여 최대 (W1+W2)초 동안 이동모듈(110)과 유선모듈(120) 간에는 시간 차이가 발생되므로, 상호 상관(cross correlation)은 0부터 8,000(=4,000+4,000)까지 계산하기 위해서는 3.2x108(=40,000x8,000)의 곱셈을 하여야 한다.
만약, 상기 계산을 16MIPS(Mega Instruction Per Second, 초당 16x106개의 명령 처리 능력)의 계산 능력을 갖는 중앙처리부(124)로 계산한다면, 최소 20초(=3.2x108/1.6x107\)의 계산 시간이 소요되어, 음성2를 송신하는 중에 음성 동기가 필요한 실시간 시스템에서는 구현이 불가능하다.
따라서, 실시간 처리하는 방법을 빠른 상호 상관이라 한다.
이와 같은, 빠른 상호 상관을 나타내는 관계식은 다음 [수학식 8]과 같다.
상기 [수학식 8]에서 F-1는 역 FFT(inverse Fast Fourier Transform)이고, X*(k)는 원음 x[n]의 FFT(Fast Fourier Transform)의 공액 복소수(complex conjugate)이며, Y(k)는 수신 왜곡음의 FFT이고 N은 원음의 샘플 길이를 의미한다.
상기 빠른 상호 상관(fast cross correlation) 방법을 사용한 계산량은 다음과 같다.
즉, 원음의 길이 N=40,000일 때, 상기 FFT는 제 1 단계에서의 장비 동기 오차 8,000(=(0.5초+0.5초)x8,000) 샘플을 고려하여 48,000 FFT을 하여야 한다.
그러나, 보통 FFT는 2의 제곱 승으로 이루어지기 때문에, 48,000보다 큰 2의 제곱승인 616(=65,536) FFT(Fast Fourier Transform)을 하여야 한다.
따라서, 원음x[N]에는 40,000개의 원음 샘플에 25536개의 0을 삽입하여 상기 FFT을 수행하고 수신 왜곡음에는 수신 왜곡음 샘플 48,000개에 17,536개의 0을 삽입하여 상기 FFT을 계산한다.
그리고, 상기 FFT는 Nlog2N 만큼의 곱셈이 필요하므, 원음과 수신 왜곡음의 FFT에 필요한 곱셈은 1,048,576(=65,536 x 16)이고 X*(k)와 Y(k)의 곱셈은 65,536이며, 역 FFT에 필요한 곱셈도 FFT와 같이 1,048,576(=65,536 x 16)이다. 따라서, 빠른 상호 상관(fast cross correlation)에 필요한 곱셈은 다음 [수학식 9]와 같다.
빠른 상호 상관 곱셈량 = 원음의 FFT 곱셈량 + 수신 왜곡음의 FFT 곱셈량
+ 원음과 수신 왜곡음의 주파수 곱셈량 + 역 FFT 곱셈량
= 1,048,576 + 1,048,576 + 65,536 + 1,048,576
= 3,211,264곱셈
이를, 16MIPS(Mega Instruction Per Second)의 계산 능력을 갖는 중앙처리부(124)로 다시 처리하면, 약 0.2초(3,211,264/1.6x107초)의 시간이 소요되어 실시간 처리가 가능하다.
또한, T4시점(334)에서 이동모듈(310)과 유선모듈(320)의 진행시간은 다음 [수학식 10] 및 [수학식 11]과 같다.
T4시점에서 이동모듈의 진행시간 = W2+W3+W4+W2+W5+W4+W7+W2
T4시점에서 유선모듈의 진행시간 = W2+W3+W4+W6+W2+W7
그러나, 상기 [수학식 10] 및 [수학식 11]에서 톤 검출 시간 W3과 W5는 톤 검출 시간 오차 때문에 0에서 W1초까지 변화한다.
따라서, T4(334)시점에서 이동모듈(310)의 진행시간은 톤 검출 시간 오차 때문에 다음 [수학식 12]와 같은 오차 범위 내에 있게 된다.
3W2+2W4+W7 < T4시점에서 이동모듈의 진행시간 < 3W2+2W4+W7+2W1
또한, T4(334)시점에서 유선모듈(320)의 진행시간도 W3에 의한 톤 검출시간 오차 때문에 다음 [수학식 13]과 같은 오차 범위 내에 있게 된다.
2W2+W4+W6+W7 < T4시점에서 유선모듈의 진행시간 < 2W2+W4+W6+W7+W1
상기 [수학식 12]와 [수학식 13]을 참조하여, T4(334)시점에서 유선모듈(320)과 이동모듈(310) 간의 진행시간 오차 범위는 다음 [수학식 14]와 같다.
W2+W4-W6+W7 < T4시점에서 유선모듈의 진행시간 < 2W2+W4+W6+W7+W1
상기 [수학식 12]와 [수학식 13]을 참조하여, T4(334)시점에서 유선모듈(320)과 이동모듈(310) 간의 진행시간 오차 범위는 다음 [수학식 15]와 같다.
W2+W4-W6 < T4시점에서 유선모듈과 이동모듈 간의 진행시간 오차 < W2+W4-W6+W1
상기 [수학식 15]에서 W6은 임의로 선정할 수 있는 값이므로 W4와 같게 선정하면, T4(334)시점에서 유선모듈(320)과 이동모듈(310) 간의 진행시간 오차 범위는 다음 [수학식 16]과 같다.
W2 < T4시점에서 유선모듈과 이동모듈 간의 진행시간 오차 < W2+W1
따라서, T4시점(334)에서 유선모듈(320)과 이동모듈(310) 간의 진행시간 오차는 T3(333)시점에서와 같이 최대 (W2+W1)초가 된다.
그리고, T4(334)시점에서 이동모듈(310)과 유선모듈(320) 간의 장비 동기 오차는 최대 W1xW2초로 유선모듈(320)이 0 내지 (W1+W2)초만큼 빠른 상태이다.
또한, T4(334)시점에서 유선모듈(320)은 음성1을 모두 수신한 후, W1초 후에 음성 2를 송신하면 이동모듈은 통신망 지연시간 W2초 후에 음성2를 수신한다.
이때, 이동모듈(110)은 T4(334)시점부터 톤 수신을 시작하도록 하였다면, 유선모듈(120)에서 송신한 음성은 T4(334)시점부터 시작하여 다음 [수학식 17]과 같은 범위에서 수신한다.
0 < T4시점부터 시작하여 음성이 수신되는 오차 범위 < W1+W2
따라서, 이동모듈(110)도 유선모듈(120)과 같이 최대 W1+W2 범위 내에서 유선모듈(120)에서 한 방법과 같이 빠른 상호 상관을 계산하여 정확한 음성 동기를 맞춘다.
즉, 음성 동기란, 이동모듈(110)로부터 보내지는 원음의 송신 시작 시간과 유선모듈(210)에서의 수신 왜곡음의 수신 시작 시간을 일치시키거나, 또는 유선모듈(210)로부터 보내지는 원음의 송신 시작 시간과 이동모듈(110)에서의 수신 왜곡음의 수신 시작 시간을 일치시키는 것이다. 여기서, 수신 왜곡음은, 이동모듈(110)로부터 송신된 원음이 유선모듈(210)에서 수신된 신호이거나, 또는 유선모듈(210)로부터 송신된 원음이 이동모듈(110)에서 수신된 신호를 의미한다.
이와 같이, 음성 동기는 제 1 단계의 DTMF 톤을 사용하여 톤 길이 W1초 범위 내에서 대략적인 장비 동기를 맞춘 후, 제 2 단계로 실시간 음성 동기를 위한 빠른 상호 상관(fast cross correlation)방법을 사용하여 정확한 음성 동기를 맞추는 과정으로 이루어진다.
즉, 본 발명에서는 상호 상관(cross correlation)을 취하여 정확한 동기를 맞추도록 하였다. 음성이 거쳐가는 루틴이 거의 이상적인 무선 공간이므로 동기방법은 이 방법 외에도 여러 가지 다른 방법이 있지만 구현의 간편성과 사용자의 편의성을 위해 상호 상관을 FFT(Fast Fourier Transform)와 IFFT(INVERSE Fast Fourier Transform)를 사용하여 어셈블리로 구현한다.
따라서, 상호 상관을 취하여 음성동기를 찾기 위해서는, IIR(Infinite Impulse Response) 필터를 사용한 DTMF 톤 검출로 대략적인 동기를 맞춘 후에, 상호 상관을 취하여 정확한 음성동기를 맞춘다. 원래 타임 상호 상관(time cross correlation)으로 음성 전체에 대해 다 계산하려면 계산량이 많아서 5초 내에 나머지 계산을 다 할 수가 없으므로 실시간으로 음성 시작점을 찾고 다음 단계를 수행하기에는 무리가 너무 많다. 이에 대한 해결책으로 FFT와 IFFT를 응용하여 계산 속도를 향상시킨 빠른 상호 상관(fast cross correlation)을 방법을 제시한 것이다.
원음에 대한 FFT는 하드웨어(H/W) 보드의 초기화 루틴에서 행하게 되고, 왜곡음성에 대한 샘플링 데이터 60,000개(N=60000)의 데이터가 직렬포트를 통해 버퍼에 저장이 되면 이로부터 FFT를 수행하고 H/W에 저장된 원음성의 FFT데이터와 IFFT를 하여 상관 값을 계산하게 된다.
시작점이 정확하게 일치되었을 때 상관 값이 최대값을 가지므로 최대값을 가지는 옵셋(offset)만큼 수신 음성의 포인터(pointer)를 옮기면 원음과 왜곡음의 시작점이 같게 된다. 이렇게 하면, 33MHz "RISC" 마이크로 프로세서로 0.5초 이내에 음성 시작점을 찾을 수가 있다.
타임 상호 상관(일반적인 상호 상관 방법)을 취할 경우에는 계산량이 N ×N 번의 계산이 필요하지만, 빠른 상호 상관을 취하면 log2N ×log2N 번만 필요하므로, 본 연구에서 N=60000으로 놓았으므로 타임 상호 상관을 취할 경우 3,600,000,000번의 곱하기 계산을 해야 하지만, 빠른 상호 상관을 취하면 252번만 계산하면 되므로 상당한 시간의 절약을 이룰 수 있다.
상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.
이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.
상기한 바와 같은 본 발명은, DTMF 톤을 송신한 후 상대 모듈로부터 음성이전달되는 시간을 한정한 다음, 미리 저장된 원음과 수신 왜곡음의 빠른 상호 상관 계산을 취하여, 원음의 송신 시작 시간과 수신 왜곡음의 수신 시작 시간을 일치시키므로써, 객관적인 음질 평가을 수행하여 음질 평가에 대한 신뢰성을 높이면서, 특히 이동 통신 시스템의 품질을 지속적으로 감시하여 최상의 품질을 제공할 수 있는 효과가 있다.

Claims (3)

  1. 객관적 음질 평가를 위한 음성 동기 방법에 있어서,
    이중음 다주파(DTMF) 톤을 사용하여 송신측과 수신측 장비간 시간 동기를 맞추는 제 1 단계; 및
    상기 장비간 시간 동기로 인한 소정 동기 오차 범위내에서, 실시간 음성 동기를 위해 원음과 수신 왜곡음의 빠른 퓨리에 변환(FFT)과 역 빠른 퓨리에 변환(IFFT)을 취하여 상호 상관을 빠르게 계산하여, 상기 송신측과 수신측의 음성 동기를 실시간으로 맞추는 제 2 단계
    를 포함하는 객관적 음질 평가를 위한 음성 동기 방법.
  2. 제 1 항에 있어서,
    상기 제 1 단계는,
    상기 송신측이 제 1 이중음 다주파 톤을 송신하는 제 3 단계;
    상기 제 1 이중음 다주파 톤이통신망을 통해 지연되어 상기 수신측으로 수신된 후, 상기 수신측이 상기 제 1 이중음 다주파 톤을 검출하는 제 4 단계;
    상기 제 1 이중음 다주파 톤을 검출한 후, 상기 수신측은 제 2 이중음 다주파 톤을 송신하는 제 5 단계;
    상기 제 2 이중음 다주파 톤이 상기 통신망을 통해 지연되어 상기 송신측으로 수신된 후, 상기 송신측이 상기 제 2 이중음 다주파 톤을 검출하는 제 6 단계;
    상기 제 6 단계에서 상기 제 2 이중음 다주파 톤을 검출한 후, 상기 송신측은 제 1 음성 신호를 송신하면서 상기 제 2 이중음 다주파 톤을 송신한 후부터, 소정의 제 1 시간 후에 상기 수신측으로부터 제 2 음성 신호의 수신을 시작하는 제 7 단계; 및
    상기 제 7 단계에서 상기 제 2 음성 신호의 수신을 시작하는 시점에서, 상기 소정의 제 1 시간을 제 2 시간으로 설정하는 제 8 단계
    를 포함하는 객관적 음질 평가를 위한 음성 동기 방법.
  3. 프로세서를 구비한 정보제공 시스템에,
    이중음 다주파(DTMF) 톤을 사용하여 송신측과 수신측 장비간 시간 동기를 맞추는 제 1 기능; 및
    상기 장비간 시간 동기로 인한 소정 동기 오차 범위내에서, 실시간 음성 동기를 위해 원음과 수신 왜곡음의 빠른 퓨리에 변환(FFT)과 역 빠른 퓨리에 변환(IFFT)을 취하여 상호 상관을 빠르게 계산하여, 상기 송신측과 수신측의 음성 동기를 실시간으로 맞추는 제 2 기능
    을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1019980049122A 1998-11-16 1998-11-16 객관적음질평가를위한음성동기방법 KR100307701B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019980049122A KR100307701B1 (ko) 1998-11-16 1998-11-16 객관적음질평가를위한음성동기방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980049122A KR100307701B1 (ko) 1998-11-16 1998-11-16 객관적음질평가를위한음성동기방법

Publications (2)

Publication Number Publication Date
KR20000032617A KR20000032617A (ko) 2000-06-15
KR100307701B1 true KR100307701B1 (ko) 2001-10-20

Family

ID=19558552

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980049122A KR100307701B1 (ko) 1998-11-16 1998-11-16 객관적음질평가를위한음성동기방법

Country Status (1)

Country Link
KR (1) KR100307701B1 (ko)

Also Published As

Publication number Publication date
KR20000032617A (ko) 2000-06-15

Similar Documents

Publication Publication Date Title
CN101122636B (zh) 声音到达方向的估测方法以及声音到达方向的估测设备
KR100636317B1 (ko) 분산 음성 인식 시스템 및 그 방법
CN101826892B (zh) 回声消除器
US6937723B2 (en) Echo detection and monitoring
CN101641735B (zh) 估计通信系统中的噪声电平的方法
US20050131678A1 (en) Communication system tonal component maintenance techniques
JPH0624398B2 (ja) ト−ン検出方法
US20030204543A1 (en) Device and method for estimating harmonics in voice encoder
US6199036B1 (en) Tone detection using pitch period
KR100307701B1 (ko) 객관적음질평가를위한음성동기방법
US6629049B2 (en) Method for non-harmonic analysis of waveforms for synthesis, interpolation and extrapolation
US20030123574A1 (en) System and method for robust tone detection
EP1436805B1 (en) 2-phase pitch detection method and appartus
US20040252652A1 (en) Cross correlation, bulk delay estimation, and echo cancellation
EP1376997A1 (en) Method for testing and adapting an audio unit parameters to a telecommunication system
US20190096432A1 (en) Speech processing method, speech processing apparatus, and non-transitory computer-readable storage medium for storing speech processing computer program
US20050254629A1 (en) Measurement noise reduction for signal quality evaluation
JPH0944186A (ja) 雑音抑制装置
EP1729287A1 (en) Method and apparatus for adaptively suppressing noise
JP2014171021A (ja) 遅延時間測定装置、遅延時間測定方法及びプログラム
KR0171004B1 (ko) Samdf를 이용한 기본 주파수와 제1포만트의 비율 측정방법
Holub et al. Impact of end to end encryption on GSM speech transmission quality-a case study
CN117896462A (zh) 链路质量监测方法、系统、电子设备及存储介质
Dresler et al. Wavelet Transform in Voice Transmission Quality Measurement
JPH0683301B2 (ja) デイジタル電話機測定装置

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100802

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee