KR0146767B1 - 전화망 음성의 실시간 특징추출 방법 - Google Patents
전화망 음성의 실시간 특징추출 방법Info
- Publication number
- KR0146767B1 KR0146767B1 KR1019950016284A KR19950016284A KR0146767B1 KR 0146767 B1 KR0146767 B1 KR 0146767B1 KR 1019950016284 A KR1019950016284 A KR 1019950016284A KR 19950016284 A KR19950016284 A KR 19950016284A KR 0146767 B1 KR0146767 B1 KR 0146767B1
- Authority
- KR
- South Korea
- Prior art keywords
- value
- predetermined
- time
- frequency
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 11
- 238000012545 processing Methods 0.000 claims abstract description 17
- 238000012935 Averaging Methods 0.000 claims abstract description 9
- 238000000034 method Methods 0.000 claims description 8
- 230000005236 sound signal Effects 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims description 3
- 230000001360 synchronised effect Effects 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000007796 conventional method Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 210000000214 mouth Anatomy 0.000 description 1
- 210000003928 nasal cavity Anatomy 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q1/00—Details of selecting apparatus or arrangements
- H04Q1/18—Electrical details
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
Claims (9)
- 송신 전화기(11)를 수용하는 구내 전화기(12), 상기 구내 전화기(12)와 수신 전화기(14)를 수용하는 전화국 교환기(13)를 포함하는 전화망(100)과, 상기 전화망(100)내의 전화국 교환기(13)에 연결되어 스테레오 및 오디오 신호를 정합하는 SAIB(Stereo and Audio Interface BoX)(15); 상기 SAIB(15)에 동기식 직렬 포트로 연결되되, DSP(Digital Signal Processing)보드를 내장하는 PC(Personal Computer)(16)를 구비하는 시스템에 적용되는 전화망 음성의 실시간 특징추출 방법에 있어서, 상기 PC(16)내의 DSP보드는 음성 데이타가 입력되면 LCR(Level Crossing Rate)값을 계산하여 새로운 데이타 처리를 완료하는데 제1단계; 새로운 데이타의 처리가 완료되면 소정 시간동안 데이타를 받아 고속 퓨리에 변환(FFT: Fast Foureir Transform)을 통하여 각 주파수 성분의 크기를 구하는 제2단계; 상기 각 주파수 성분의 크기를 주파수축상과 시간축상에서 평균화하여 특징을 추출하는 제3단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제1항에 있어서, 상기 제1단계는, 입력되는 음성 데이타를 수집하여 시스템의 응답으로, H(z)=1-0.95z-1에 의한 전역 필터링을 수행하는 제4단계;상기 전역 필터링에 의해 계산된 정수(integer)값을 시스템 내부에 가지고 있는 1초 분량의 링 버퍼에 인덱스값을 이용하여 저장하는 제5단계; 및 현재 입력된 값까지의 소정 시간동안 특정값을 초과한 회수인 LCR(Level Crossing Rate)값을 계산하고 종료 플래그를 세트하여 새로운 음성 데이타 처리가 완료되었음을 나타내는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제2항에 있어서, 상기 제6단계는, 다수개의 데이타를 갖는 소정 블럭을 시간에 따라 A가 들어 있느 과거의 블럭과 새로운 데이타가 들어 있는 현재의 블럭으로 구분하는 제7단계; 상기 A의 값이 LCR값 보다 큰 경우 LCR값에서 1을 빼고, 상기 새로운 데이타가 LCR값보다 큰 경우 LCR값에 1을 더하는 제8단게; 및 종료 플래그를 세트하여 새로운 음성 데이타 처리가 완료되었음을 나타내는 제9단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제1항에 있어서, 상기 제2단계는, 새로운 음성 데이타에 대한 처리가 완료 되었는지 계속 확인하여 완료 되었으면 PC의 호스트측이 소정 시간동안의 데이타를 받아들이는 제4단계; 과거 소정의 시간동안 데이타 샘플의 값에 해밍 창함수(Hamming window)를 씌우고 나머지 소정개의 값을 모두 0으로 채우는 제5단계; 소정 포인트 FFT(Fast Fourier Transform)를 위하여 소정 주파수대, 소정 샘플의 주파수 성분별 대수값을 구하는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제4항에 있어서, 상기 제4단계는, 새로운 음성 데이타에 대한 처리가 완료되었는지 계속 확인하는 제7단계; 상기 새로운 음성 데이타에 대한 처리가 완료되었으면 소정 시간이 경과되었는지 확인하는 제8단게; 상기 소정 시간이 경과되지 않았으면 상기 제7단계로 리턴하고 소장 시간이 경과되었으면 PC의 호스트측이 소정 시간동안이 데이타를 받아들이는 제9단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제1항에 있어서, 상기 제3단계는, 상기 각 주파수를 대수값들을 위, 아래 주파수 2칸씩 모두 5칸, 321.5Hz범위의 값들을 평균하고 새로운 현재값으로 결정하여 스펙트럼의 평균화(spectral smoothing)를 취하는 제4단계; 상기 스펙트럼의 평균화를 취한 후, 소정 대역별로 소정 시간동안의 값들을 평균하고 소정개의 새로운 값을 만들어 시간 주파수를 구하는 제5단계; 및 상기 소정개의 시간 주파수를 이용하여 특징추출을 하는 제6단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제6항에 있어서, 상기 제6단계는, 소정의 주파수 대역을 소정의 주파수 할당표에 따라 소정개의 대역으로 구분하는 제7단계; 및 가중 함수를 적용하여 켑스트럼을 구하는 제8단계를 포함하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제7항에 있어서, 상기 주파수 할당표는, 시작위치와 끝위치가 해당하는 주파수 성분들을 모두 더하여 비균등 주파수(mel-frequency)에너지를 구하도록 하는 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
- 제7항에 있어서, 상기 가중 함수는 Li이 각 밴드별 에너지이고, N=20일때,인 것을 특징으로 하는 전화망 음성의 실시간 특징추출 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950016284A KR0146767B1 (ko) | 1995-06-19 | 1995-06-19 | 전화망 음성의 실시간 특징추출 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019950016284A KR0146767B1 (ko) | 1995-06-19 | 1995-06-19 | 전화망 음성의 실시간 특징추출 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR970004581A KR970004581A (ko) | 1997-01-29 |
KR0146767B1 true KR0146767B1 (ko) | 1998-08-17 |
Family
ID=19417503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019950016284A Expired - Fee Related KR0146767B1 (ko) | 1995-06-19 | 1995-06-19 | 전화망 음성의 실시간 특징추출 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR0146767B1 (ko) |
-
1995
- 1995-06-19 KR KR1019950016284A patent/KR0146767B1/ko not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
KR970004581A (ko) | 1997-01-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1638083B1 (en) | Bandwidth extension of bandlimited audio signals | |
EP0698876B1 (en) | Method of decoding encoded speech signals | |
CA1216673A (en) | Text to speech system | |
JP4624552B2 (ja) | 狭帯域言語信号からの広帯域言語合成 | |
EP0528324A2 (en) | Auditory model for parametrization of speech | |
Yamashita et al. | Nonstationary noise estimation using low-frequency regions for spectral subtraction | |
RU2366007C2 (ru) | Способ и устройство для восстановления речи в системе распределенного распознавания речи | |
JP2002516420A (ja) | 音声コーダ | |
CN109473091A (zh) | 一种语音样本生成方法及装置 | |
EP1093112B1 (en) | A method for generating speech feature signals and an apparatus for carrying through this method | |
FI96247C (fi) | Menetelmä puheen muuntamiseksi | |
Aneeja et al. | Extraction of fundamental frequency from degraded speech using temporal envelopes at high SNR frequencies | |
Denbigh et al. | Pitch extraction and separation of overlapping speech | |
JP3205560B2 (ja) | オーディオ信号の調性を決定するための方法および装置 | |
Christensen et al. | A comparison of three methods of extracting resonance information from predictor-coefficient coded speech | |
CN112116909A (zh) | 语音识别方法、装置及系统 | |
KR0146767B1 (ko) | 전화망 음성의 실시간 특징추출 방법 | |
Kadiri et al. | Determination of glottal closure instants from clean and telephone quality speech signals using single frequency filtering | |
Sun et al. | Phase modelling of speech excitation for low bit-rate sinusoidal transform coding | |
KR100217372B1 (ko) | 음성처리장치의 피치 추출방법 | |
Chowdhury et al. | Formant estimation from speech signal using the magnitude spectrum modified with group delay spectrum | |
Van Schalkwyk et al. | Linear predictive speech coding at 2400 b/s | |
WO1995020216A1 (en) | Method and apparatus for indicating the emotional state of a person | |
EP0713208B1 (en) | Pitch lag estimation system | |
CN111048072A (zh) | 一种应用于电力企业的声纹识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 19950619 |
|
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 19950619 Comment text: Request for Examination of Application |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 19980331 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 19980513 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 19980513 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20010427 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20020430 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20030430 Start annual number: 6 End annual number: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20040401 Start annual number: 7 End annual number: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20050502 Start annual number: 8 End annual number: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20060502 Start annual number: 9 End annual number: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20070502 Start annual number: 10 End annual number: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20080428 Start annual number: 11 End annual number: 11 |
|
PR1001 | Payment of annual fee |
Payment date: 20090504 Start annual number: 12 End annual number: 12 |
|
PR1001 | Payment of annual fee |
Payment date: 20100510 Start annual number: 13 End annual number: 13 |
|
FPAY | Annual fee payment |
Payment date: 20110504 Year of fee payment: 14 |
|
PR1001 | Payment of annual fee |
Payment date: 20110504 Start annual number: 14 End annual number: 14 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20130409 |