KR970004581A

KR970004581A - 전화망 음성의 실시간 특징추출 방법

Info

Publication number: KR970004581A
Application number: KR1019950016284A
Authority: KR
Inventors: 유창규; 김종교; 정광재; 김태일; 이형호
Original assignee: 양승택; 한국전자통신연구소; 조백제; 한국전기통신공사
Priority date: 1995-06-19
Filing date: 1995-06-19
Publication date: 1997-01-29
Also published as: KR0146767B1

Abstract

본 발명은 전화선을 통해 입력되는 음성의 패턴매칭을 위하여 실시간으로 정확한 음성특징을 추출하는 전화망 음성의 실시간 특징추출 방법에 관한 것으로, 전화망 음성의 실시간 특징추출 방법에 있어서, 상기 PC(16)내의 DSP 보드는 음성 데이타가 입력되면 LCR 값을 계산하여 새로운 데이타 처리를 완료하는 제1단계와, 새로운 데이타의 처리가 완료되면 소정 시간동안 데이타를 받아 FFT(Fast Foureir Transform)를 통하여 각 주파수 성분의 크기를 구하는 제2단계와, 상기 각 주파수 성분의 크기를 주파수축상과 시간축상에서 평균화하여 특징을 추출하는 제3단계를 포함하는 것을 특징으로 하여 전화망 음성에 대해 실시간으로 특징을 추출하는데 있어서 비음성분등의 성도 특성을 나타낼 수 있는 특징 파라미터를 구할 수 있게 되었으며, 이를 이용하여 전화망 음성에 대해 인식할 경우 정확한 성도 모델을 나타내는 특징 파라미터를 제공하여 높은 인식률을 얻을 수 있는 효과가 있다.

Description

전화망 음성의 실시간 특징추출 방법

본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음

제1도는 본 발명이 적용되는 시스템의 구성 블럭도, 제2A도 내지 제2B도는 본 발명에 따른 전화망 음성의 실시간 특징 추출 처리 흐름도, 제3도는 LCR 값 계산의 설명도.

Claims

송신 전화기(11)를 수용하는 구내 전화기(12), 상기 구내 전화기(12)와 수신 전화기(14)를 수용하는 전화국 교환기(13)를 포함하는 전화망(100); 상기 전화망(100) 내의 전화국 교환기(13)에 연결되어 스테레오 및 오디오 신호를 정합하는 SAIB(Stereo and Audio Interface BoX)(15); 상기 SAIB(15)에 동기식 직렬포트로 연결되되, 디지탈 신호 처리(DSP : Digital Signal Processing) 보드를 내장하는 개인용 컴퓨터(PC : Personal Computer)(16)를 구비하는 시스템에 적용되는 전화망 음성의 실시간 특징추출 방법에 있어서, 상기 PC(16)내의 DSP 보드는 음성 데이타가 입력되면 LCR(Level Crossing Rate) 값을 계산하여 새로운 데이타 처리를 완료하는 제1단계; 새로운 데이타의 처리가 완료되면 소정 시간동안 데이타를 받아 고속 퓨리에 변환(FFT : Fast Foureir Transform)을 통하여 각 주파수 성분의 크기를 구하는 제2단계; 및 상기 각 주파수 성분의 크기를 주파수축상과 시간축상에서 평균화하여 특징을 추출하는 제3단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제1항에 있어서, 상기 제1단계는, 입력되는 음성 데이타를 수집하여 시스템의 응답으로, H(z)=1-0.95z^-1에 의한 전역 필터링을 수행하는 제4단계; 상기 전역 필터링에 의해 계산된 정수(integer)값을 시스템 내부에 가지고 있는 1초 분량의 링 버퍼에 인덱스값을 이용하여 저장하는 제5단계; 및 현재 입력된 값까지의 소정 시간동안 특정값을 초과한 회수인 LCR(Level Crossing Rate) 값을 계산하고 종료 플래그를 세트하여 새로운 음성 데이타 처리가 완료되었음을 나타내는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제2항에 있어서, 상기 제6단계는, 다수개의 데이타를 갖는 소정 블럭을 시간에 따라 A가 들어있는 과거의 블럭과 새로운 데이타가 들어 있는 현재의 블럭으로 구분하는 제7단계; 상기 A의 값이 LCR값보다 큰 경우 LCR값에서 1을 빼고, 상기 새로운 데이타가 LCR값보다 큰 경우 LCR값에 1을 더하는 제8단계; 및 종료 플래그를 세트하여 새로운 음성 데이타 처리가 완료되었음을 나타내는 제9단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제1항에 있어서, 상기 제2단계는, 새로운 음성 데이타에 대한 처리가 완료 되었는지 계속 확인하여 완료되었으면 PC의 호스트측이 소정 시간동안의 데이타를 받아들이는 제4단계; 과거 소정의 시간동안의 데이타 샘플의 값에 해밍 창함수(Hamming window)를 씌우고 나머지 소정개의 값은 모두 0으로 채우는 제5단계; 및 소정 포인트 FFT(Fast Fourier Transform)를 위하여 소정 주파수대, 소정 샘플의 주파수 성분별 대수값을 구하는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제4항에 있어서, 상기 제4단계는, 새로운 음성 데이타에 대한 처리가 완료되었는지 계속 확인하는 제7단계; 상기 새로운 음성 데이타에 대한 처리가 완료되었으면 소정 시간이 경과되었는지 확인하는 제8단계; 상기 소정 시간이 경과되지 않았으면 상기 제7단계로 리턴하고 소장 시간이 경과되었으면 PC의 호스트측이 소정 시간동안의 데이타를 받아들이는 제9단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제1항에 있어서, 상기 제3단계는, 상기 각 주파수를 성분별 대수값들을 위, 아래 주파수 2칸씩 모두 5칸, 321.5Hz범위의 값들을 평균하고 새로운 현재값으로 결정하여 스펙트럼의 평균화(spectral smoothing)를 취하는 제4단계; 상기 스펙트럼의 평균화를 취한 후, 소정 대역별로 소정 시간동안의 값들을 평균하고 소정개의 새로운 값을 만들어 시간 주파수를 구하는 제5단계; 및 상기 소정개의 시간 주파수를 이용하여 특징추출을 하는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제6항에 있어서, 상기 제6단계는, 소정의 주파수 대역을 소정의 주파수 할당표에 따라 소정개의 대역으로 구분하는 제7단계; 및 가중 함수를 적용하여 켑스트럼을 구하는 제8단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제7항에 있어서, 상기 주파수 할당표는, 시작위치와 끝위치가 해당하는 주파수 성분들을 모두 더하여 비균등 주파수(mel-frequency) 에너지를 구하도록 하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
제7항에 있어서, 상기 가중 함수는, L_i이 각 밴드별 에너지이고, N=20일때,인 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.

※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.