KR920001430A - 음성 데이타 시종점 검출 방법 및 그 장치 - Google Patents
음성 데이타 시종점 검출 방법 및 그 장치 Download PDFInfo
- Publication number
- KR920001430A KR920001430A KR1019900009405A KR900009405A KR920001430A KR 920001430 A KR920001430 A KR 920001430A KR 1019900009405 A KR1019900009405 A KR 1019900009405A KR 900009405 A KR900009405 A KR 900009405A KR 920001430 A KR920001430 A KR 920001430A
- Authority
- KR
- South Korea
- Prior art keywords
- value
- energy
- voice data
- filter bank
- starting point
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims description 8
- 238000000034 method Methods 0.000 claims 7
- 239000000872 buffer Substances 0.000 claims 6
- 230000003044 adaptive effect Effects 0.000 claims 4
- 102100029158 Consortin Human genes 0.000 claims 2
- 101000771062 Homo sapiens Consortin Proteins 0.000 claims 2
- 238000010606 normalization Methods 0.000 claims 2
- 238000007781 pre-processing Methods 0.000 claims 2
- 238000006243 chemical reaction Methods 0.000 claims 1
- 238000003379 elimination reaction Methods 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/84—Detection of presence or absence of voice signals for discriminating voice from noise
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Filters That Use Time-Delay Elements (AREA)
- Telephonic Communication Services (AREA)
Abstract
내용 없음
Description
본 내용은 요부공개 건이므로 전문내용을 수록하지 않았음
제1도는 (a)(b)(c)(d)는 본 발명에 의한 음성 데이타 시종점 검출방법의 세부 흐름도.
Claims (5)
- 적음 잡음 제거 처리 과정에서 잡음 감소된 고속푸리에 변환 신호를 다수 채널을 갖는 필터 뱅크로 변환하여 이 필터 뱅크에 의한 신호를 일정 프레임 길이만큼 평균화하여 다수 채널로 나누어 정규화하는 과정과, 상기 과정에서 다수 채널로 나뉘어 정규화된 신호의 소정 주파수 이하에 실려있는 잡음을 제거할 때 동시에 제거된 저주파 성분의 음성신호를 보상해 주기위한 에너지값과 한 프레임내의 다수채널에 걸쳐있는 필터뱅크의 출력에너지값을 합하여 음성데이타의 시종점을 검출하는 과정과, 상기 과정에서 시종점이 검출된 음성데이타의 해밍윈도우를 구하여 전처리하고 이 전처리된 음성데이타의 특징 계수를 산출하는 과정과, 상기 과정에서 산출된 특징계수를 기준 및 테스트 패턴으로 생성시키는 과정을 포함하여 구성된 것을 특징으로 하는 음성데이타 시종점 검출방법.
- 제1항에 있어서, 음성데이타의 시종점 검출하는 과정은 스타트프래그(STFLG)와 앤드프래그(ENDFRG)가 "0"로 초기화되었을 때 그 특징값을 구해서 세이브시키는 단계(213)와, 상기 211단계에서 평활화된 에너지값(SENG)이 파라메터(K1)보다 작은 경우와 동일하게 적응에너지 드레솔드 레벨을 세팅하기 위해 버퍼(BuF)값을 계산하는 단계(214)와, 프레임수 카운터(CNST)가 매번 2번째 프레임이 되는 가를 판단하는 단계(215)와, 상기 215단계에서 프레임수 카운터(CNST)가 매번 2번째 프레임이 될때마다 버퍼(BuF2)와 (BuF3)에 저장된 평균값(AVE)을 각기 버퍼(BuF1)와 버퍼(BuF2)로 이동시켜 새로운 버퍼값(BuF3)을 계산함으로써 에너지레솔드 레벨인 평균값(AVE)을 정하여 현재의 버퍼값(BuF2)에 웨이팅을 주어 평균값(AVE)을 강조하게 하는 단계(216)를 포함함을 특징으로 하는 음성데이타 시종점 검출방법.
- 제1항에 있어서, 음성데이타의 시종점을 검출하는 과정은 버퍼(BuF1,BuF2,BuF3)에 저장된 드레솔드의 평균값을 계산하여 세트시키고 시점을 잡기위한 드로솔드 레벨(K1)의 값을 정하는 단계(201)와, 상기 드레솔드 값(TLTH)을 파라메터 (K1/2)와 비교하는 단계(202)와, 상기 202단계에서 드레솔드 값 (TLTH)이 파라메터(K1/2)보다 큰 경우에는 파라메터(TLB)를 0으로 리세트하는 단계(203)와, 상기 드레솔드 값 (TLTH)이 파라메터(K1/2)보다 작은 경우에는 파라메터(TLB)를 1로 세트하는 단계(204)를 포함하여 종점 검출을 평활화된 에너지값 (SENG) 또는 평활화된 4번째 채널까지의 에너지값 (STL)으로 사용하도록 하여 저주파 성분의 음성을 검출하기 위한 단계 (204)를 포함함을 특징으로 하는 음성 데이타 시종점 검출방법.
- 제1항에 있어서, 음성 데이타의 시종점을 검출하는 과정은 종점을 정하기 위한 데이타인 SENG와 STL을 다음 프레임의 앞선 프레임으로서의 데이타를 저장하게 되는 단계(233)와, 상기 233단계에서 SENG가 K1보다 작은 경우에는 TLB값을 검사하는 단계(234)와, 상기 234단계를 수행하고 나서 종점을 잡는 파라메터를 SENG또는 STL로 할 것인지를 정하여 저주파 성분의 음성을 검출하기 위한 단계(235,236)를 포함함을 특징으로 하는 음성데이타 시종점 검출방법.
- 음성데이타 처리 시스템에 있어서, 잡음이 혼재한 아날로그신호가 릴데크(10와 아날로그/디지탈변환부(20)를 통과하여 변환된 디지틀 신호를 받아들여 잡음 제거 알고리즘을 이용함으로써 적응 잡음을 제거처리하는 적응 잡음 처리부(30)와, 상기 적응 잡음 처리부(30)에서 처리되지 못한 잡음을 감소시키는 고속 푸리에 변환 신호부(31)와, 상기 고속 푸리에 변환 신호부(31)에서 전송되는 신호를 필터 뱅크에서 다수 채널을 갖도록 하는 필터 뱅크부(32)와, 상기 필터 뱅크부(32)에서 전송되는 필터뱅크의 채널별 에너지를 정규화하는 음성에너지 정규화부(33)와, 상기 음성에너지 정규화부(33)에서 전송되는 정규화된 신호의 프레임별로 필터뱅크 에너지를 산출하는 필터뱅크 에너지 추출부(34)와, 상기 적응 잡음 처리부(30)와 필더 뱅크 에너지 추출부(34)의 각 출력 에너지값을 이용함으로써 음성데이타의 시종점을 산출하여 전처리부(50)와 특징계수 추출부(60) 및 단어패턴 발생부 (70)로 전송하는 시종점 검출부(40)를 포함함을 특징으로 하는 음성데이타 시종점 검출장치.※ 참고사항 : 최초출원 내용에 의하여 공개하는 것임.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900009405A KR0135878B1 (ko) | 1990-06-25 | 1990-06-25 | 음성 데이타 시종점 검출 방법 및 그 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1019900009405A KR0135878B1 (ko) | 1990-06-25 | 1990-06-25 | 음성 데이타 시종점 검출 방법 및 그 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR920001430A true KR920001430A (ko) | 1992-01-30 |
KR0135878B1 KR0135878B1 (ko) | 1998-05-15 |
Family
ID=19300477
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1019900009405A KR0135878B1 (ko) | 1990-06-25 | 1990-06-25 | 음성 데이타 시종점 검출 방법 및 그 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR0135878B1 (ko) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR970071462A (ko) * | 1996-04-15 | 1997-11-07 | 김광호 | 음성 인식 시스템에서의 인식 결과 거부 방법 |
KR100396748B1 (ko) * | 1996-12-23 | 2003-11-28 | 엘지전자 주식회사 | 유음구간추출처리장치및방법 |
-
1990
- 1990-06-25 KR KR1019900009405A patent/KR0135878B1/ko not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR970071462A (ko) * | 1996-04-15 | 1997-11-07 | 김광호 | 음성 인식 시스템에서의 인식 결과 거부 방법 |
KR100396748B1 (ko) * | 1996-12-23 | 2003-11-28 | 엘지전자 주식회사 | 유음구간추출처리장치및방법 |
Also Published As
Publication number | Publication date |
---|---|
KR0135878B1 (ko) | 1998-05-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5323337A (en) | Signal detector employing mean energy and variance of energy content comparison for noise detection | |
US6556967B1 (en) | Voice activity detector | |
US4821325A (en) | Endpoint detector | |
US4696041A (en) | Apparatus for detecting an utterance boundary | |
KR0161258B1 (ko) | 음성활동 검출 방법 및 장치 | |
CN109829515B (zh) | 一种音频指纹匹配方法以及音频指纹匹配装置 | |
US20020021789A1 (en) | Method and apparatus for facilitating speech barge-in in connection with voice recognition systems | |
JP2005535920A (ja) | バックエンドの音声検出装置を有する配信音声認識および方法 | |
CA2458428A1 (en) | System for suppressing wind noise | |
KR910020641A (ko) | 잡음예측장치와 이것을 사용한 신호처리장치 | |
JPS6245730B2 (ko) | ||
KR910015962A (ko) | 음성신호처리장치 | |
US7127392B1 (en) | Device for and method of detecting voice activity | |
US10014906B2 (en) | Acoustic echo path change detection apparatus and method | |
US6865529B2 (en) | Method of estimating the pitch of a speech signal using an average distance between peaks, use of the method, and a device adapted therefor | |
US20200402499A1 (en) | Detecting speech activity in real-time in audio signal | |
KR102000227B1 (ko) | 디지털 오디오 신호의 프리에코 판별 및 감쇠 | |
US6199036B1 (en) | Tone detection using pitch period | |
GB2380644A (en) | Speech detection | |
JP2000250568A (ja) | 音声区間検出装置 | |
KR920001430A (ko) | 음성 데이타 시종점 검출 방법 및 그 장치 | |
Vahatalo et al. | Voice activity detection for GSM adaptive multi-rate codec | |
JP2992324B2 (ja) | 音声区間検出方法 | |
JP2564821B2 (ja) | 音声判定検出装置 | |
JPS6147437B2 (ko) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120116 Year of fee payment: 15 |
|
EXPY | Expiration of term |