KR100717393B1 - 음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치 - Google Patents
음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치 Download PDFInfo
- Publication number
- KR100717393B1 KR100717393B1 KR1020060012527A KR20060012527A KR100717393B1 KR 100717393 B1 KR100717393 B1 KR 100717393B1 KR 1020060012527 A KR1020060012527 A KR 1020060012527A KR 20060012527 A KR20060012527 A KR 20060012527A KR 100717393 B1 KR100717393 B1 KR 100717393B1
- Authority
- KR
- South Korea
- Prior art keywords
- speech
- reliability
- state change
- speech recognition
- change position
- Prior art date
Links
- 238000000691 measurement method Methods 0.000 title claims description 5
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000004364 calculation method Methods 0.000 claims abstract description 7
- 239000000945 filler Substances 0.000 claims description 17
- 238000001514 detection method Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 4
- 238000005259 measurement Methods 0.000 abstract description 8
- 238000010586 diagram Methods 0.000 description 11
- 238000007796 conventional method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003657 Likelihood-ratio test Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007257 malfunction Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H01—ELECTRIC ELEMENTS
- H01H—ELECTRIC SWITCHES; RELAYS; SELECTORS; EMERGENCY PROTECTIVE DEVICES
- H01H53/00—Relays using the dynamo-electric effect, i.e. relays in which contacts are opened or closed due to relative movement of current-carrying conductor and magnetic field caused by force of interaction between them
- H01H53/06—Magnetodynamic relays, i.e. relays in which the magnetic field is produced by a permanent magnet
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/01—Assessment or evaluation of speech recognition systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
Claims (19)
- 음성 인식기의 음성 인식에 대한 신뢰도를 측정하는 방법에 있어서,음성 신호에 대한 상태 변화 위치를 검출하는 단계;상기 음성 신호의 음성 인식 결과에 따른 음소열의 변화 위치를 검출하는 단계; 및상기 검출된 상태 변화 위치와 상기 검출된 음소열의 변화 위치의 차이 및 우도비를 이용하여 상기 음성 인식에 대한 신뢰도를 계산하는 단계를 포함하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제1항에 있어서,음성 신호에 대한 상태 변화 위치를 검출하는 상기 단계는,상기 음성 신호에 대한 스펙트로그램, 웨이브 파형 또는 상기 음성 신호에 대한 특징으로부터 상기 음성 신호에 대한 상태 변화 위치를 검출하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제2항에 있어서,음성 신호에 대한 상태 변화 위치를 검출하는 상기 단계는,상기 음성 신호에 대한 스펙트로그램상에서 프레임간 유클리디안 거리를 계산하는 단계; 및상기 계산된 피크(peak)와 밸리(valley)를 이용하여 상기 음성 신호에 대한 상태 변화 위치를 검출하는 단계를 포함하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제3항에 있어서,피크와 밸리를 이용하여 상기 음성 신호에 대한 상태 변화 위치를 검출하는 상기 단계는,상기 계산된 피크와 밸리간 거리가 큰 상위 N개의 위치를 이용하여 상기 음성 신호에 대한 상태 변화 위치를 검출하는 단계를 포함하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제4항에 있어서,상기 검출된 상태 변화 위치와 상기 검출된 음소열의 변화 위치의 차이를 이용하여 상기 음성 인식에 대한 신뢰도를 계산하는 상기 단계는,상기 거리가 큰 상위 N개 중 상기 검출된 음소열의 변화 위치에 대응되지 않는 위치를 파악하고, 파악된 위치에 패널티 점수(penalty score)를 부여하여 상기 음성 인식에 대한 신뢰도를 계산하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제1항에 있어서,상기 검출된 상태 변화 위치와 상기 검출된 음소열의 변화 위치의 차이 및 우도비를 이용하여 상기 음성 인식에 대한 신뢰도를 계산하는 상기 단계는,상기 검출된 위치 차이에 따른 상태 변화 점수 및 상기 음성 인식에 대한 우도비(likelihood ratio)을 이용하여 상기 음성 인식에 대한 신뢰도를 계산하는 것을 특징으로 하는 신뢰도 측정 방법.
- 음성 인식기의 음성 인식에 대한 신뢰도를 측정하는 방법에 있어서,음성 신호에 대한 특징을 추출하는 단계;상기 음성 신호에 대한 스펙트로그램을 계산하는 단계;소정의 음성 인식 모델을 이용하여 상기 추출된 음성 신호에 대한 특징으로부터 음성을 인식하는 단계;상기 음성 인식 결과와 상기 계산된 스펙트로그램을 이용하여 음성 신호의 상태 변화를 비교하는 단계;상기 음성 인식 모델에 따라 상기 음성 인식에 대한 우도비를 계산하는 단계; 및상기 상태 변화 비교 결과와 상기 우도비를 고려하여 상기 음성 인식에 대한 신뢰도를 계산하는 단계를 포함하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제7항에 있어서,상기 음성 인식 모델은,키워드 모델(Keyword-Model) 및 필러 모델(Filler Model)을 포함하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제8항에 있어서,상기 음성 인식 결과와 상기 계산된 스펙트로그램을 이용하여 음성 신호의 상태 변화를 비교하는 상기 단계는,상기 키워드 모델(Keyword-Model)에 따른 음성 인식 결과인 음소열 변화 위치와 일정 범위내에서 가장 가까운 상태 변화 위치를 비교하는 단계; 및상기 비교 결과에 따라 상기 스펙트로그램 상의 거리가 큰 상위 N개 중 음소열의 변화 위치에 대응되지 않은 경우, 패널티 점수를 부여하는 단계를 포함하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제8항에 있어서,상기 계산된 신뢰도에 따라 상기 인식된 음성 신호에 대한 수락(accept) 여부를 결정하는 단계를 더 포함하는 것을 특징으로 하는 신뢰도 측정 방법.
- 제1항 내지 제10항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록하는 컴퓨터 판독 가능한 기록매체.
- 음성 인식기의 음성 인식에 대한 신뢰도를 측정하는 장치에 있어서,음성 신호에 대한 상태 변화 위치를 검출하는 상태 변화 검출부;상기 음성 인식기에서 상기 음성 신호의 음성 인식 결과에 따른 음소열의 변화 위치를 검출하는 음소열 변화 검출부; 및상기 검출된 상태 변화 위치와 상기 검출된 음소열의 변화 위치를 비교한 결과와 우도비를 이용하여 상기 음성 인식에 대한 신뢰도를 계산하는 신뢰도 계산부를 포함하는 것을 특징으로 하는 신뢰도 측정 장치.
- 제12항에 있어서,상기 상태 변화 검출부는,상기 음성 신호에 대한 스펙트로그램, 웨이브 파형 또는 상기 음성 신호의 특징으로부터 상기 음성 신호에 대한 상태 변화 위치를 검출하는 것을 특징으로 하는 신뢰도 측정 장치.
- 제13항에 있어서,상기 상태 변화 검출부는,상기 음성 신호에 대한 스펙트로그램상에서 피크와 밸리를 이용하여 상기 음성 신호에 대한 상태 변화 위치를 검출하는 것을 특징으로 하는 신뢰도 측정 장치.
- 제12항에 있어서,상기 신뢰도 계산부는,상기 스펙트로그램상에서 검출된 상태 변화 위치가 상기 검출된 음소열의 변화 위치에 대응되지 않는 경우, 패널티 점수를 부여하여 상기 신뢰도를 계산하는 것을 특징으로 하는 신뢰도 측정 장치.
- 음성 인식기의 음성 인식에 대한 신뢰도를 측정하는 장치에 있어서,음성 신호에 대한 특징을 추출하는 특징 추출부;상기 음성 신호에 대한 스펙트로그램을 계산하는 스펙트로그램 계산부;소정의 음성 인식 모델을 이용하여 상기 추출된 음성 신호에 대한 특징으로부터 음성을 인식하는 음성 인식부;상기 음성 인식 결과와 상기 계산된 스펙트로그램을 이용하여 상태 변화를 비교하는 상태 변화 비교부;상기 음성 인식 결과에 따른 상기 음성 인식에 대한 우도비(likelihood ratio)을 계산하는 우도비 계산부; 및상기 상태 변화 비교 결과와 상기 우도비를 고려하여 상기 음성 인식에 대한 신뢰도를 계산하는 신뢰도 계산부를 포함하는 것을 특징으로 하는 신뢰도 측정 장치.
- 제16항에 있어서,상기 음성 인식부는,상기 추출된 특징으로부터 키워드 모델(Keyword-Model) 및 필러 모델(Filler Model)을 통해 상기 음성을 인식하는 것을 특징으로 하는 신뢰도 측정 장치.
- 제17항에 있어서,상기 상태 변화 비교부는,상기 키워드 모델(Keyword-Model)에 의한 음성 인식 결과인 음소열의 변화 위치와 일정 범위내에서 가장 가까운 스펙트로그램의 변화 위치를 비교하고, 상기 비교 결과에 따라 상기 스펙트로그램 상의 거리가 큰 상위 N개 중 음소열의 변화 위치에 대응되지 않는 경우, 패널티 점수를 부여하는 것을 특징으로 하는 신뢰도 측정 장치.
- 제16항에 있어서,상기 계산된 신뢰도에 따라 상기 인식된 음성 신호에 대한 수락(accept) 여부를 결정하는 결정부를 더 포함하는 것을 특징으로 하는 신뢰도 측정 장치.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060012527A KR100717393B1 (ko) | 2006-02-09 | 2006-02-09 | 음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치 |
US11/477,628 US20070185712A1 (en) | 2006-02-09 | 2006-06-30 | Method, apparatus, and medium for measuring confidence about speech recognition in speech recognizer |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020060012527A KR100717393B1 (ko) | 2006-02-09 | 2006-02-09 | 음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR100717393B1 true KR100717393B1 (ko) | 2007-05-11 |
Family
ID=38270511
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020060012527A KR100717393B1 (ko) | 2006-02-09 | 2006-02-09 | 음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20070185712A1 (ko) |
KR (1) | KR100717393B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210050087A (ko) | 2019-10-28 | 2021-05-07 | 삼성에스디에스 주식회사 | 신뢰도 측정 방법 및 장치 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7650628B2 (en) | 2004-10-21 | 2010-01-19 | Escription, Inc. | Transcription data security |
US7940552B2 (en) * | 2007-04-30 | 2011-05-10 | Samsung Electronics Co., Ltd. | Multiple level cell phase-change memory device having pre-reading operation resistance drift recovery, memory systems employing such devices and methods of reading memory devices |
KR100914267B1 (ko) * | 2007-06-20 | 2009-08-27 | 삼성전자주식회사 | 가변저항 메모리 장치 및 그것의 형성방법 |
KR101308549B1 (ko) * | 2007-07-12 | 2013-09-13 | 삼성전자주식회사 | 멀티-레벨 상변환 메모리 장치 및 그것의 쓰기 방법 |
CN107545904B (zh) * | 2016-06-23 | 2021-06-18 | 杭州海康威视数字技术股份有限公司 | 一种音频检测方法及装置 |
WO2019018480A1 (en) | 2017-07-20 | 2019-01-24 | Nuance Communications, Inc. | AUTOMATED MASKING SYSTEM AND METHOD |
CN107610715B (zh) * | 2017-10-10 | 2021-03-02 | 昆明理工大学 | 一种基于多种声音特征的相似度计算方法 |
CN107481734B (zh) * | 2017-10-13 | 2020-09-11 | 清华大学 | 语音质量评价方法及装置 |
US11715042B1 (en) | 2018-04-20 | 2023-08-01 | Meta Platforms Technologies, Llc | Interpretability of deep reinforcement learning models in assistant systems |
US20190327330A1 (en) | 2018-04-20 | 2019-10-24 | Facebook, Inc. | Building Customized User Profiles Based on Conversational Data |
US11886473B2 (en) | 2018-04-20 | 2024-01-30 | Meta Platforms, Inc. | Intent identification for agent matching by assistant systems |
US11307880B2 (en) | 2018-04-20 | 2022-04-19 | Meta Platforms, Inc. | Assisting users with personalized and contextual communication content |
US11676220B2 (en) | 2018-04-20 | 2023-06-13 | Meta Platforms, Inc. | Processing multimodal user input for assistant systems |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03116099A (ja) * | 1989-09-29 | 1991-05-17 | Nec Corp | 音声認識装置 |
US5748840A (en) | 1990-12-03 | 1998-05-05 | Audio Navigation Systems, Inc. | Methods and apparatus for improving the reliability of recognizing words in a large database when the words are spelled or spoken |
KR20000074086A (ko) * | 1999-05-18 | 2000-12-05 | 김영환 | 음성의 피치 차이값을 이용한 음성 파일의 끝점 검출방법 |
JP2001117579A (ja) | 1999-10-21 | 2001-04-27 | Casio Comput Co Ltd | 音声照合装置、音声照合方法、及び音声照合処理プログラムを記憶した記憶媒体 |
JP2005221811A (ja) | 2004-02-06 | 2005-08-18 | Matsushita Electric Ind Co Ltd | 音声速度変換装置と音声速度変換方法 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2554623B1 (fr) * | 1983-11-08 | 1986-08-14 | Texas Instruments France | Procede d'analyse de la parole independant du locuteur |
US4896358A (en) * | 1987-03-17 | 1990-01-23 | Itt Corporation | Method and apparatus of rejecting false hypotheses in automatic speech recognizer systems |
CN1013525B (zh) * | 1988-11-16 | 1991-08-14 | 中国科学院声学研究所 | 认人与不认人实时语音识别的方法和装置 |
JPH02195400A (ja) * | 1989-01-24 | 1990-08-01 | Canon Inc | 音声認識装置 |
US5165008A (en) * | 1991-09-18 | 1992-11-17 | U S West Advanced Technologies, Inc. | Speech synthesis using perceptual linear prediction parameters |
US5799276A (en) * | 1995-11-07 | 1998-08-25 | Accent Incorporated | Knowledge-based speech recognition system and methods having frame length computed based upon estimated pitch period of vocalic intervals |
GB2319379A (en) * | 1996-11-18 | 1998-05-20 | Secr Defence | Speech processing system |
US6571210B2 (en) * | 1998-11-13 | 2003-05-27 | Microsoft Corporation | Confidence measure system using a near-miss pattern |
US6535851B1 (en) * | 2000-03-24 | 2003-03-18 | Speechworks, International, Inc. | Segmentation approach for speech recognition systems |
EP1524650A1 (en) * | 2003-10-06 | 2005-04-20 | Sony International (Europe) GmbH | Confidence measure in a speech recognition system |
-
2006
- 2006-02-09 KR KR1020060012527A patent/KR100717393B1/ko active IP Right Grant
- 2006-06-30 US US11/477,628 patent/US20070185712A1/en not_active Abandoned
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03116099A (ja) * | 1989-09-29 | 1991-05-17 | Nec Corp | 音声認識装置 |
US5748840A (en) | 1990-12-03 | 1998-05-05 | Audio Navigation Systems, Inc. | Methods and apparatus for improving the reliability of recognizing words in a large database when the words are spelled or spoken |
KR20000074086A (ko) * | 1999-05-18 | 2000-12-05 | 김영환 | 음성의 피치 차이값을 이용한 음성 파일의 끝점 검출방법 |
JP2001117579A (ja) | 1999-10-21 | 2001-04-27 | Casio Comput Co Ltd | 音声照合装置、音声照合方法、及び音声照合処理プログラムを記憶した記憶媒体 |
JP2005221811A (ja) | 2004-02-06 | 2005-08-18 | Matsushita Electric Ind Co Ltd | 音声速度変換装置と音声速度変換方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20210050087A (ko) | 2019-10-28 | 2021-05-07 | 삼성에스디에스 주식회사 | 신뢰도 측정 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
US20070185712A1 (en) | 2007-08-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100717393B1 (ko) | 음성 인식기의 음성 인식에 대한 신뢰도 측정 방법 및 그장치 | |
KR100612839B1 (ko) | 도메인 기반 대화 음성인식방법 및 장치 | |
US7647224B2 (en) | Apparatus, method, and computer program product for speech recognition | |
US8532991B2 (en) | Speech models generated using competitive training, asymmetric training, and data boosting | |
US6535850B1 (en) | Smart training and smart scoring in SD speech recognition system with user defined vocabulary | |
KR100755677B1 (ko) | 주제 영역 검출을 이용한 대화체 음성 인식 장치 및 방법 | |
US8990086B2 (en) | Recognition confidence measuring by lexical distance between candidates | |
US8775184B2 (en) | Evaluating spoken skills | |
US20160086609A1 (en) | Systems and methods for audio command recognition | |
US7058575B2 (en) | Integrating keyword spotting with graph decoder to improve the robustness of speech recognition | |
US7921014B2 (en) | System and method for supporting text-to-speech | |
US20090138260A1 (en) | Voice judging system, voice judging method and program for voice judgment | |
CN101452701B (zh) | 基于反模型的置信度估计方法及装置 | |
CN110491375B (zh) | 一种目标语种检测的方法和装置 | |
Dey et al. | Exploiting sequence information for text-dependent speaker verification | |
KR100609521B1 (ko) | 음성 인식 시스템의 발화 검증 방법 | |
KR100298177B1 (ko) | 음성인식시스템에서의반음소모델구축방법및그를이용한발화검증방법 | |
JP2005275348A (ja) | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 | |
JP2019040148A (ja) | 音声区間検出装置、その方法、及びプログラム | |
JP2010044239A (ja) | 音声認識装置およびプログラム | |
JPWO2010024052A1 (ja) | 音声認識仮説検証装置、音声認識装置、それに用いられる方法およびプログラム | |
Tsiartas et al. | Robust word boundary detection in spontaneous speech using acoustic and lexical cues | |
Anguita et al. | Detection of confusable words in automatic speech recognition | |
KR100755483B1 (ko) | 단어 끝점 검출 오류 보상을 가지는 비터비 디코딩 방법 | |
KR100449912B1 (ko) | 음성인식시스템의 핵심어 검출을 위한 후처리방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20060209 |
|
PA0201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20070426 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20070504 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20070507 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20100412 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20110428 Start annual number: 5 End annual number: 5 |
|
PR1001 | Payment of annual fee |
Payment date: 20120427 Start annual number: 6 End annual number: 6 |
|
FPAY | Annual fee payment |
Payment date: 20130429 Year of fee payment: 7 |
|
PR1001 | Payment of annual fee |
Payment date: 20130429 Start annual number: 7 End annual number: 7 |
|
FPAY | Annual fee payment |
Payment date: 20140429 Year of fee payment: 8 |
|
PR1001 | Payment of annual fee |
Payment date: 20140429 Start annual number: 8 End annual number: 8 |
|
FPAY | Annual fee payment |
Payment date: 20150429 Year of fee payment: 9 |
|
PR1001 | Payment of annual fee |
Payment date: 20150429 Start annual number: 9 End annual number: 9 |
|
FPAY | Annual fee payment |
Payment date: 20160428 Year of fee payment: 10 |
|
PR1001 | Payment of annual fee |
Payment date: 20160428 Start annual number: 10 End annual number: 10 |
|
PC1903 | Unpaid annual fee |