KR970004581A - 전화망 음성의 실시간 특징추출 방법 - Google Patents

전화망 음성의 실시간 특징추출 방법 Download PDF

Info

Publication number
KR970004581A
KR970004581A KR1019950016284A KR19950016284A KR970004581A KR 970004581 A KR970004581 A KR 970004581A KR 1019950016284 A KR1019950016284 A KR 1019950016284A KR 19950016284 A KR19950016284 A KR 19950016284A KR 970004581 A KR970004581 A KR 970004581A
Authority
KR
South Korea
Prior art keywords
value
predetermined
frequency
time
data
Prior art date
Application number
KR1019950016284A
Other languages
English (en)
Other versions
KR0146767B1 (ko
Inventor
유창규
김종교
정광재
김태일
이형호
Original Assignee
양승택
한국전자통신연구소
조백제
한국전기통신공사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 양승택, 한국전자통신연구소, 조백제, 한국전기통신공사 filed Critical 양승택
Priority to KR1019950016284A priority Critical patent/KR0146767B1/ko
Publication of KR970004581A publication Critical patent/KR970004581A/ko
Application granted granted Critical
Publication of KR0146767B1 publication Critical patent/KR0146767B1/ko

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q1/00Details of selecting apparatus or arrangements
    • H04Q1/18Electrical details
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2201/00Electronic components, circuits, software, systems or apparatus used in telephone systems
    • H04M2201/40Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 전화선을 통해 입력되는 음성의 패턴매칭을 위하여 실시간으로 정확한 음성특징을 추출하는 전화망 음성의 실시간 특징추출 방법에 관한 것으로, 전화망 음성의 실시간 특징추출 방법에 있어서, 상기 PC(16)내의 DSP 보드는 음성 데이타가 입력되면 LCR 값을 계산하여 새로운 데이타 처리를 완료하는 제1단계와, 새로운 데이타의 처리가 완료되면 소정 시간동안 데이타를 받아 FFT(Fast Foureir Transform)를 통하여 각 주파수 성분의 크기를 구하는 제2단계와, 상기 각 주파수 성분의 크기를 주파수축상과 시간축상에서 평균화하여 특징을 추출하는 제3단계를 포함하는 것을 특징으로 하여 전화망 음성에 대해 실시간으로 특징을 추출하는데 있어서 비음성분등의 성도 특성을 나타낼 수 있는 특징 파라미터를 구할 수 있게 되었으며, 이를 이용하여 전화망 음성에 대해 인식할 경우 정확한 성도 모델을 나타내는 특징 파라미터를 제공하여 높은 인식률을 얻을 수 있는 효과가 있다.

Description

전화망 음성의 실시간 특징추출 방법
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 본 발명이 적용되는 시스템의 구성 블럭도, 제2A도 내지 제2B도는 본 발명에 따른 전화망 음성의 실시간 특징 추출 처리 흐름도, 제3도는 LCR 값 계산의 설명도.

Claims (9)

  1. 송신 전화기(11)를 수용하는 구내 전화기(12), 상기 구내 전화기(12)와 수신 전화기(14)를 수용하는 전화국 교환기(13)를 포함하는 전화망(100); 상기 전화망(100) 내의 전화국 교환기(13)에 연결되어 스테레오 및 오디오 신호를 정합하는 SAIB(Stereo and Audio Interface BoX)(15); 상기 SAIB(15)에 동기식 직렬포트로 연결되되, 디지탈 신호 처리(DSP : Digital Signal Processing) 보드를 내장하는 개인용 컴퓨터(PC : Personal Computer)(16)를 구비하는 시스템에 적용되는 전화망 음성의 실시간 특징추출 방법에 있어서, 상기 PC(16)내의 DSP 보드는 음성 데이타가 입력되면 LCR(Level Crossing Rate) 값을 계산하여 새로운 데이타 처리를 완료하는 제1단계; 새로운 데이타의 처리가 완료되면 소정 시간동안 데이타를 받아 고속 퓨리에 변환(FFT : Fast Foureir Transform)을 통하여 각 주파수 성분의 크기를 구하는 제2단계; 및 상기 각 주파수 성분의 크기를 주파수축상과 시간축상에서 평균화하여 특징을 추출하는 제3단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  2. 제1항에 있어서, 상기 제1단계는, 입력되는 음성 데이타를 수집하여 시스템의 응답으로, H(z)=1-0.95z-1에 의한 전역 필터링을 수행하는 제4단계; 상기 전역 필터링에 의해 계산된 정수(integer)값을 시스템 내부에 가지고 있는 1초 분량의 링 버퍼에 인덱스값을 이용하여 저장하는 제5단계; 및 현재 입력된 값까지의 소정 시간동안 특정값을 초과한 회수인 LCR(Level Crossing Rate) 값을 계산하고 종료 플래그를 세트하여 새로운 음성 데이타 처리가 완료되었음을 나타내는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  3. 제2항에 있어서, 상기 제6단계는, 다수개의 데이타를 갖는 소정 블럭을 시간에 따라 A가 들어있는 과거의 블럭과 새로운 데이타가 들어 있는 현재의 블럭으로 구분하는 제7단계; 상기 A의 값이 LCR값보다 큰 경우 LCR값에서 1을 빼고, 상기 새로운 데이타가 LCR값보다 큰 경우 LCR값에 1을 더하는 제8단계; 및 종료 플래그를 세트하여 새로운 음성 데이타 처리가 완료되었음을 나타내는 제9단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  4. 제1항에 있어서, 상기 제2단계는, 새로운 음성 데이타에 대한 처리가 완료 되었는지 계속 확인하여 완료되었으면 PC의 호스트측이 소정 시간동안의 데이타를 받아들이는 제4단계; 과거 소정의 시간동안의 데이타 샘플의 값에 해밍 창함수(Hamming window)를 씌우고 나머지 소정개의 값은 모두 0으로 채우는 제5단계; 및 소정 포인트 FFT(Fast Fourier Transform)를 위하여 소정 주파수대, 소정 샘플의 주파수 성분별 대수값을 구하는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  5. 제4항에 있어서, 상기 제4단계는, 새로운 음성 데이타에 대한 처리가 완료되었는지 계속 확인하는 제7단계; 상기 새로운 음성 데이타에 대한 처리가 완료되었으면 소정 시간이 경과되었는지 확인하는 제8단계; 상기 소정 시간이 경과되지 않았으면 상기 제7단계로 리턴하고 소장 시간이 경과되었으면 PC의 호스트측이 소정 시간동안의 데이타를 받아들이는 제9단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  6. 제1항에 있어서, 상기 제3단계는, 상기 각 주파수를 성분별 대수값들을 위, 아래 주파수 2칸씩 모두 5칸, 321.5Hz범위의 값들을 평균하고 새로운 현재값으로 결정하여 스펙트럼의 평균화(spectral smoothing)를 취하는 제4단계; 상기 스펙트럼의 평균화를 취한 후, 소정 대역별로 소정 시간동안의 값들을 평균하고 소정개의 새로운 값을 만들어 시간 주파수를 구하는 제5단계; 및 상기 소정개의 시간 주파수를 이용하여 특징추출을 하는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  7. 제6항에 있어서, 상기 제6단계는, 소정의 주파수 대역을 소정의 주파수 할당표에 따라 소정개의 대역으로 구분하는 제7단계; 및 가중 함수를 적용하여 켑스트럼을 구하는 제8단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  8. 제7항에 있어서, 상기 주파수 할당표는, 시작위치와 끝위치가 해당하는 주파수 성분들을 모두 더하여 비균등 주파수(mel-frequency) 에너지를 구하도록 하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
  9. 제7항에 있어서, 상기 가중 함수는, Li이 각 밴드별 에너지이고, N=20일때,인 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
    ※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
KR1019950016284A 1995-06-19 1995-06-19 전화망 음성의 실시간 특징추출 방법 KR0146767B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019950016284A KR0146767B1 (ko) 1995-06-19 1995-06-19 전화망 음성의 실시간 특징추출 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019950016284A KR0146767B1 (ko) 1995-06-19 1995-06-19 전화망 음성의 실시간 특징추출 방법

Publications (2)

Publication Number Publication Date
KR970004581A true KR970004581A (ko) 1997-01-29
KR0146767B1 KR0146767B1 (ko) 1998-08-17

Family

ID=19417503

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019950016284A KR0146767B1 (ko) 1995-06-19 1995-06-19 전화망 음성의 실시간 특징추출 방법

Country Status (1)

Country Link
KR (1) KR0146767B1 (ko)

Also Published As

Publication number Publication date
KR0146767B1 (ko) 1998-08-17

Similar Documents

Publication Publication Date Title
Nakatani et al. Robust and accurate fundamental frequency estimation based on dominant harmonic components
Serra et al. Spectral modeling synthesis: A sound analysis/synthesis system based on a deterministic plus stochastic decomposition
CN100382141C (zh) 抑制风噪声的系统和方法
US3649765A (en) Speech analyzer-synthesizer system employing improved formant extractor
CN103854646B (zh) 一种实现数字音频自动分类的方法
CN111128213B (zh) 一种分频段进行处理的噪声抑制方法及其系统
EP0737351B1 (en) Method and system for detecting and generating transient conditions in auditory signals
CN110880329B (zh) 一种音频识别方法及设备、存储介质
Shahnaz et al. Pitch estimation based on a harmonic sinusoidal autocorrelation model and a time-domain matching scheme
CN109473091A (zh) 一种语音样本生成方法及装置
CN111383646A (zh) 一种语音信号变换方法、装置、设备和存储介质
CN108108357A (zh) 口音转换方法及装置、电子设备
Scarr Zero crossings as a means of obtaining spectral information in speech analysis
CN108847253A (zh) 车辆型号识别方法、装置、计算机设备及存储介质
US10068558B2 (en) Method and installation for processing a sequence of signals for polyphonic note recognition
CN112967738A (zh) 人声检测方法、装置及电子设备和计算机可读存储介质
CN112116909A (zh) 语音识别方法、装置及系统
Kadiri et al. Speech polarity detection using strength of impulse-like excitation extracted from speech epochs
KR970004581A (ko) 전화망 음성의 실시간 특징추출 방법
CN112233693B (zh) 一种音质评估方法、装置和设备
CN115410602A (zh) 一种语音情感识别方法、装置及电子设备
CN104900227A (zh) 语音特征信息的提取方法及电子设备
CN110767238B (zh) 基于地址信息的黑名单识别方法、装置、设备及存储介质
Hainsworth et al. Time-frequency reassignment for music analysis
KR100579797B1 (ko) 음성 코드북 구축 시스템 및 방법

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20110504

Year of fee payment: 14

LAPS Lapse due to unpaid annual fee