KR100349656B1 - 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 - Google Patents
다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 Download PDFInfo
- Publication number
- KR100349656B1 KR100349656B1 KR1020000079046A KR20000079046A KR100349656B1 KR 100349656 B1 KR100349656 B1 KR 100349656B1 KR 1020000079046 A KR1020000079046 A KR 1020000079046A KR 20000079046 A KR20000079046 A KR 20000079046A KR 100349656 B1 KR100349656 B1 KR 100349656B1
- Authority
- KR
- South Korea
- Prior art keywords
- voice
- detection
- detector
- combining
- point
- Prior art date
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 147
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012549 training Methods 0.000 claims description 26
- 238000012545 processing Methods 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Telephonic Communication Services (AREA)
- Electrically Operated Instructional Devices (AREA)
Abstract
Description
Claims (7)
- 다수의 하위 음성검출 시스템을 이용한 음성검출 장치에 있어서,외부로부터 전달되는 음성 입력신호를 입력받기 위한 음성신호 입력수단;상기 음성신호 입력수단을 통해 전달된 음성 입력신호에 대해 독립적으로 음성의 시작점과 끝점을 검출하기 위한 다수의 검출수단;상기 다수의 검출수단을 통해 각각 구해진 검출결과들을 조합하여 가중 평균값을 구하기 위한 검출결과 조합수단; 및상기 검출결과 조합수단을 통해 전달된 음성의 시작점 및 끝점에 대한 검출 결과를 출력하기 위한 검출결과 출력수단을 포함하는 다수의 하위 음성검출 시스템을 이용한 음성검출 장치.
- 제 1 항에 있어서,상기 가중 평균값은,하기의 수학식에 의하여 구해지고, 전체 음성검출 시스템이 검출한 최종적인 음성부분의 시작점과 끝점에 대한 시간정보인 것을 특징으로 하는 다수의 하위 음성검출 시스템을 이용한 음성검출 장치.,(여기서, S와 E는 전체 검출시스템의 최종결과로 출력되는 음성부분의 시작점(시간)과 끝점이고,는 음성검출시스템이 최종적으로 음성의 시작점을 구하기 위해 각 검출기들의 검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이며,는 최종적으로 음성의 끝점을 구하기 위해 각 검출기들의 검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이고,및는 입력음성에 대해 i번째 검출기에서 구한 시작점과 끝점임)
- 제 1 항 또는 제 2 항에 있어서,상기 가중치는,하기의 수학식에 의해 각 검출기별로 구하되, 훈련용 데이터로부터 구하는 과정에서 결정되는 것을 특징으로 하는 다수의 하위 음성검출 시스템을 이용한 음성검출 장치.,(여기서,는 음성검출 시스템이 최종적으로 음성의 시작점을 구하기 위해 각 검출기들의 검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이고,는 최종적으로 음성의 끝점을 구하기 위해 각 검출기들의 검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이며,는 훈련과정에서 j번째 입력음성에 대해 i번째 검출기에서 구한 음성의 시작점이고,는 훈련과정에서 j번째 입력음성에 대해 i번째 검출기에서 구한 음성의 끝점이며,는 훈련과정에서 j번째 입력음성에 대해 수작업으로 구한 음성의 시작점이고,는 훈련과정에서 j번째 입력음성에 대해 수작업으로 구한 음성의 끝점이며, N은 하위 음성검출기의 총 개수이고, M은 훈련용 데이터의 크기(발화의 개수)임)
- 다수의 하위 음성검출 시스템을 이용한 음성검출 장치에 적용되는 음성검출 방법에 있어서,외부로부터 전달되는 음성 입력신호를 입력받는 제 1 단계;상기 입력된 음성 입력신호에 대해 독립적으로 음성의 시작점과 끝점을 검출하는 제 2 단계;상기 각각 구해진 검출결과들을 조합하여 가중 평균값을 구하는 제 3 단계; 및상기 구해진 가중평균값을 전체 시스템이 구한 음성의 시작점 및 끝점으로 하여 출력하는 제 4 단계를 포함하는 다수의 하위 음성검출 시스템을 이용한 음성검출 방법.
- 제 4 항에 있어서,상기 가중 평균값은,하기의 수학식에 의하여 구해지고, 전체 음성검출 시스템이 검출한 최종적인 음성부분의 시작점과 끝점에 대한 시간정보인 것을 특징으로 하는 다수의 하위 음성검출 시스템을 이용한 음성검출 방법.,(여기서, S와 E는 전체 검출시스템의 최종결과로 출력되는 음성부분의 시작점(시간)과 끝점이고,는 음성검출 시스템이 최종적으로 음성의 시작점을 구하기 위해 각 검출기들의 검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이며,는 최종적으로 음성의 끝점을 구하기 위해 각 검출기들의검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이고,및는 i번째 검출기에서 구한 시작점과 끝점임)
- 제 4 항 또는 제 5 항에 있어서,상기 가중치는,하기의 수학식에 의해 각 검출기별로 구하되, 훈련용 데이터로부터 구하는 과정을 통해 결정되는 것을 특징으로 하는 다수의 하위 음성검출 시스템을 이용한 음성검출 방법.,(여기서,는 음성검출 시스템이 최종적으로 음성의 시작점을 구하기 위해 각 검출기들의 검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이고,는 최종적으로 음성의 끝점을 구하기 위해 각 검출기들의 검출결과를 조합하는 과정에서 i번째 검출기에 대해 적용하는 가중치이며,는 훈련과정에서 j번째 입력음성에 대해 i번째 검출기에서 구한 음성의 시작점이고,는 훈련과정에서 j번째 입력음성에 대해 i번째 검출기에서 구한 음성의 끝점이며,는 훈련과정에서 j번째 입력음성에 대해 수작업으로 구한 음성의 시작점이고,는 훈련과정에서 j번째 입력음성에 대해 수작업으로 구한 음성의 끝점이며, N은 하위 음성검출기의 총 개수이고, M은 훈련용 데이터의 크기(발화의 개수)임)
- 프로세서를 구비한 다수의 하위 음성검출 시스템을 이용한 음성검출 장치에,외부로부터 전달되는 음성 입력신호를 입력받는 제 1 기능;상기 입력된 음성 입력신호에 대해 독립적으로 음성의 시작점과 끝점을 검출하는 제 2 기능;상기 각각 구해진 검출결과들을 조합하여 가중 평균값을 구하는 제 3 기능; 및상기 구해진 가중평균값을 전체 시스템이 구한 음성의 시작점 및 끝점으로 하여 출력하는 제 4 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000079046A KR100349656B1 (ko) | 2000-12-20 | 2000-12-20 | 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000079046A KR100349656B1 (ko) | 2000-12-20 | 2000-12-20 | 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20020049764A KR20020049764A (ko) | 2002-06-26 |
KR100349656B1 true KR100349656B1 (ko) | 2002-08-24 |
Family
ID=27683719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020000079046A KR100349656B1 (ko) | 2000-12-20 | 2000-12-20 | 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100349656B1 (ko) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4432096A (en) * | 1975-08-16 | 1984-02-14 | U.S. Philips Corporation | Arrangement for recognizing sounds |
US4879748A (en) * | 1985-08-28 | 1989-11-07 | American Telephone And Telegraph Company | Parallel processing pitch detector |
JPH06289894A (ja) * | 1993-03-31 | 1994-10-18 | Nippon Telegr & Teleph Corp <Ntt> | 日本語音声認識方法 |
JPH08179798A (ja) * | 1994-12-27 | 1996-07-12 | Nec Corp | 音声のピッチラグ符号化方法および装置 |
KR0173913B1 (ko) * | 1995-06-30 | 1999-04-01 | 조백제 | 다수의 마이크로 프로세서를 이용한 음성 인식 장치 및 그 방법 |
JPH11102199A (ja) * | 1997-09-29 | 1999-04-13 | Nec Corp | 音声通信装置 |
US5960393A (en) * | 1995-07-31 | 1999-09-28 | Lucent Technologies Inc. | User selectable multiple threshold criteria for voice recognition |
-
2000
- 2000-12-20 KR KR1020000079046A patent/KR100349656B1/ko not_active IP Right Cessation
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4432096A (en) * | 1975-08-16 | 1984-02-14 | U.S. Philips Corporation | Arrangement for recognizing sounds |
US4879748A (en) * | 1985-08-28 | 1989-11-07 | American Telephone And Telegraph Company | Parallel processing pitch detector |
JPH06289894A (ja) * | 1993-03-31 | 1994-10-18 | Nippon Telegr & Teleph Corp <Ntt> | 日本語音声認識方法 |
JPH08179798A (ja) * | 1994-12-27 | 1996-07-12 | Nec Corp | 音声のピッチラグ符号化方法および装置 |
KR0173913B1 (ko) * | 1995-06-30 | 1999-04-01 | 조백제 | 다수의 마이크로 프로세서를 이용한 음성 인식 장치 및 그 방법 |
US5960393A (en) * | 1995-07-31 | 1999-09-28 | Lucent Technologies Inc. | User selectable multiple threshold criteria for voice recognition |
JPH11102199A (ja) * | 1997-09-29 | 1999-04-13 | Nec Corp | 音声通信装置 |
Also Published As
Publication number | Publication date |
---|---|
KR20020049764A (ko) | 2002-06-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105261357B (zh) | 基于统计模型的语音端点检测方法及装置 | |
JP4568371B2 (ja) | 少なくとも2つのイベント・クラス間を区別するためのコンピュータ化された方法及びコンピュータ・プログラム | |
US20120022863A1 (en) | Method and apparatus for voice activity detection | |
JPS62231997A (ja) | 音声認識システム及びその方法 | |
KR100631786B1 (ko) | 프레임의 신뢰도를 측정하여 음성을 인식하는 방법 및 장치 | |
US7809555B2 (en) | Speech signal classification system and method | |
US4937870A (en) | Speech recognition arrangement | |
CN106023986A (zh) | 一种基于声效模式检测的语音识别方法 | |
JP3798530B2 (ja) | 音声認識装置及び音声認識方法 | |
Yarra et al. | Noise robust speech rate estimation using signal-to-noise ratio dependent sub-band selection and peak detection strategy | |
JPH03120598A (ja) | 音声認識方法及び装置 | |
JP2007017620A (ja) | 発話区間検出装置、そのためのコンピュータプログラム及び記録媒体 | |
KR100349656B1 (ko) | 다수의 하위 음성검출 시스템을 이용한 음성검출 장치 및그 방법 | |
Keshet et al. | Plosive spotting with margin classifiers. | |
JPS60114900A (ja) | 有音・無音判定法 | |
JP3091537B2 (ja) | 音声パターン作成方法 | |
EP1524650A1 (en) | Confidence measure in a speech recognition system | |
JPH01255000A (ja) | 音声認識システムに使用されるテンプレートに雑音を選択的に付加するための装置及び方法 | |
Niederjohn et al. | Computer recognition of the continuant phonemes in connected English speech | |
Modi et al. | Discriminative utterance verification using multiple confidence measures. | |
JPH1097269A (ja) | 音声検出装置及び方法 | |
JPH0455518B2 (ko) | ||
Liu et al. | Utterance verification based on dynamic garbage evaluation approach | |
JPH0316040B2 (ko) | ||
JPH0398098A (ja) | 音声認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20001220 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20020730 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20020809 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20020812 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20050801 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20060728 Start annual number: 5 End annual number: 5 |
|
FPAY | Annual fee payment |
Payment date: 20070730 Year of fee payment: 6 |
|
PR1001 | Payment of annual fee |
Payment date: 20070730 Start annual number: 6 End annual number: 6 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |