KR20050083547A - 음성 처리 장치 및 방법, 기록 매체와 프로그램 - Google Patents
음성 처리 장치 및 방법, 기록 매체와 프로그램 Download PDFInfo
- Publication number
- KR20050083547A KR20050083547A KR1020047011216A KR20047011216A KR20050083547A KR 20050083547 A KR20050083547 A KR 20050083547A KR 1020047011216 A KR1020047011216 A KR 1020047011216A KR 20047011216 A KR20047011216 A KR 20047011216A KR 20050083547 A KR20050083547 A KR 20050083547A
- Authority
- KR
- South Korea
- Prior art keywords
- unknown
- word
- processing
- recognition
- network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 64
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000008569 process Effects 0.000 claims description 26
- 238000003672 processing method Methods 0.000 claims description 5
- 230000004044 response Effects 0.000 claims description 5
- 238000012217 deletion Methods 0.000 abstract description 16
- 230000037430 deletion Effects 0.000 abstract description 16
- 230000007704 transition Effects 0.000 description 14
- 238000003780 insertion Methods 0.000 description 12
- 230000037431 insertion Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 238000006467 substitution reaction Methods 0.000 description 7
- 230000014509 gene expression Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 238000001228 spectrum Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000007796 conventional method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- RSPISYXLHRIGJD-UHFFFAOYSA-N OOOO Chemical compound OOOO RSPISYXLHRIGJD-UHFFFAOYSA-N 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/187—Phonemic context, e.g. pronunciation rules, phonotactical constraints or phoneme n-grams
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/022—Demisyllables, biphones or triphones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/027—Syllables being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
- G10L2015/0631—Creating reference templates; Clustering
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Machine Translation (AREA)
Abstract
Description
Claims (13)
- 입력 음성을 처리하고, 그 처리 결과에 기초하여, 상기 입력 음성에 포함되는 단어를 등록하는 음성 처리 장치로서,연속되는 상기 입력 음성을 인식하는 인식 수단과,상기 인식 수단에 의해 인식된 인식 결과에, 미지어가 포함되어 있는지의 여부를 판정하는 미지어 판정 수단과,상기 미지어 판정 수단에서 상기 인식 결과에 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어의 단어 경계에 대응하는 시각의 서브 워드를 포함하는 패스와, 그 서브 워드를 포함하지 않는 패스를 갖는 네트워크를 생성하는 네트워크 생성 수단과,상기 미지어 판정 수단에 의해, 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어에 대응하는 단어를 획득하는 획득 수단과,상기 획득 수단에 의해 획득된 상기 단어를 다른 정보와 관련시켜 등록하는 등록 수단을 포함하는 것을 특징으로 하는 음성 처리 장치.
- 제1항에 있어서,상기 인식 결과가 특정 패턴에 매치되는지의 여부를 판정하는 패턴 판정 수단을 더 포함하고,상기 등록 수단은 상기 패턴 판정 수단에 의해, 상기 인식 결과가 특정 패턴에 매치되어 있다고 판정된 경우, 상기 단어를 등록하는 것을 특징으로 하는 음성 처리 장치.
- 제2항에 있어서,상기 미지어 판정 수단에 의해, 상기 미지어가 포함되어 있지 않다고 판정된 경우, 또는 상기 패턴 판정 수단에 의해, 상기 인식 결과가 특정 패턴에 매치되지 않는다고 판정된 경우, 상기 입력 음성에 대응하는 응답을 생성하는 응답 생성 수단을 더 포함하는 것을 특징으로 하는 음성 처리 장치.
- 제2항에 있어서,상기 등록 수단은 상기 다른 정보로서, 카테고리와 관련시켜 상기 단어를 등록하는 것을 특징으로 하는 음성 처리 장치.
- 제2항에 있어서,상기 등록 수단은 상기 패턴 판정 수단에 의해 매치된다고 판정된 상기 패턴과 관련시켜, 상기 다른 정보를 등록하는 것을 특징으로 하는 음성 처리 장치.
- 제1항에 있어서,상기 획득 수단은 상기 미지어를 클러스터링함으로써 상기 단어를 획득하는 것을 특징으로 하는 음성 처리 장치.
- 제1항에 있어서,상기 네트워크 생성 수단에 의해 생성된 상기 네트워크는, 상기 단어와 음절 간의 네트워크인 것을 특징으로 하는 음성 처리 장치.
- 제7항에 있어서,상기 입력 음성과 상기 네트워크의 매칭에 기초하여, 상기 네트워크 상의 스코어가 높은 패스를 선택하는 선택 수단과,상기 선택 수단에 의해 선택된 상기 패스를 포함하는 상기 네트워크에 기초하여, 상기 미지어에 대응하는 발음을 취득하는 발음 취득 수단을 더 포함하는 것을 특징으로 하는 음성 처리 장치.
- 제1항에 있어서,상기 입력 음성의 소정의 구간에 대하여, 기지어로 매칭시킨 경우와 음절 타입 라이터로 인식시킨 경우의 음성 스코어를 비교하는 비교 수단을 더 포함하며,상기 비교 수단은 상기 음절 타입 라이터로 인식시킨 상기 음향 스코어쪽이 우수한 경우, 그 구간을 미지어라고 추정하는 것을 특징으로 하는 음성 처리 장치.
- 제9항에 있어서,상기 비교 수단은 상기 기지어로 매칭시킨 경우의 음향 스코어에 대하여, 상기 음절 타입 라이터로 인식시킨 경우의 음향 스코어에 보정을 행한 후에 비교를 행하는 것을 특징으로 하는 음성 처리 장치.
- 입력 음성을 처리하고, 그 처리 결과에 기초하여, 상기 입력 음성에 포함되는 단어를 등록하는 음성 처리 장치의 음성 처리 방법으로서,연속되는 상기 입력 음성을 인식하는 인식 단계와,상기 인식 단계의 처리에 의해 인식된 인식 결과에, 미지어가 포함되어 있는지의 여부를 판정하는 판정 단계와,상기 판정 단계의 처리에서 상기 인식 결과에 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어의 단어 경계에 대응하는 시각의 서브 워드를 포함하는 패스와, 그 서브 워드를 포함하지 않는 패스를 갖는 네트워크를 생성하는 네트워크 생성 단계와,상기 판정 단계의 처리에 의해, 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어에 대응하는 단어를 획득하는 획득 단계와,상기 획득 단계의 처리에 의해 획득된 상기 단어를 다른 정보와 관련시켜 등록하는 등록 단계를 포함하는 것을 특징으로 하는 음성 처리 방법.
- 입력 음성을 처리하고, 그 처리 결과에 기초하여, 상기 입력 음성에 포함되는 단어를 등록하는 음성 처리 장치의 프로그램으로서,연속되는 상기 입력 음성을 인식하는 인식 단계와,상기 인식 단계의 처리에 의해 인식된 인식 결과에, 미지어가 포함되어 있는지의 여부를 판정하는 판정 단계와,상기 판정 단계의 처리에서 상기 인식 결과에 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어의 단어 경계에 대응하는 시각의 서브 워드를 포함하는 패스와, 그 서브 워드를 포함하지 않는 패스를 갖는 네트워크를 생성하는 네트워크 생성 단계와,상기 판정 단계의 처리에 의해, 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어에 대응하는 단어를 획득하는 획득 단계와,상기 획득 단계의 처리에 의해 획득된 상기 단어를 다른 정보와 관련시켜 등록하는 등록 단계를 포함하는 것을 특징으로 하는 컴퓨터가 판독 가능한 프로그램이 기록되어 있는 기록 매체.
- 입력 음성을 처리하고, 그 처리 결과에 기초하여, 상기 입력 음성에 포함되는 단어를 등록하는 음성 처리 장치의 프로그램으로서,연속되는 상기 입력 음성을 인식하는 인식 단계와,상기 인식 단계의 처리에 의해 인식된 인식 결과에, 미지어가 포함되어 있는지의 여부를 판정하는 판정 단계와,상기 판정 단계의 처리에서 상기 인식 결과에 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어의 단어 경계에 대응하는 시각의 서브 워드를 포함하는 패스와, 그 서브 워드를 포함하지 않는 패스를 갖는 네트워크를 생성하는 네트워크 생성 단계와,상기 판정 단계의 처리에 의해, 상기 미지어가 포함되어 있다고 판정된 경우, 상기 미지어에 대응하는 단어를 획득하는 획득 단계와,상기 획득 단계의 처리에 의해 획득된 상기 단어를 다른 정보와 관련시켜 등록하는 등록 단계를 컴퓨터에 실행시키는 것을 특징으로 하는 프로그램.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JPJP-P-2002-00337892 | 2002-11-21 | ||
JP2002337892A JP4072718B2 (ja) | 2002-11-21 | 2002-11-21 | 音声処理装置および方法、記録媒体並びにプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20050083547A true KR20050083547A (ko) | 2005-08-26 |
KR101014086B1 KR101014086B1 (ko) | 2011-02-14 |
Family
ID=32321860
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020047011216A Expired - Fee Related KR101014086B1 (ko) | 2002-11-21 | 2003-11-12 | 음성 처리 장치 및 방법, 및 기록 매체 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7653541B2 (ko) |
EP (1) | EP1460615B1 (ko) |
JP (1) | JP4072718B2 (ko) |
KR (1) | KR101014086B1 (ko) |
CN (1) | CN100354929C (ko) |
AU (1) | AU2003280726A1 (ko) |
DE (1) | DE60318385T2 (ko) |
WO (1) | WO2004047075A1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10140974B2 (en) | 2014-12-29 | 2018-11-27 | Samsung Electronics Co., Ltd. | Method and apparatus for speech recognition |
Families Citing this family (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7813928B2 (en) * | 2004-06-10 | 2010-10-12 | Panasonic Corporation | Speech recognition device, speech recognition method, and program |
JP4301102B2 (ja) * | 2004-07-22 | 2009-07-22 | ソニー株式会社 | 音声処理装置および音声処理方法、プログラム、並びに記録媒体 |
JP2007133033A (ja) * | 2005-11-08 | 2007-05-31 | Nec Corp | 音声テキスト化システム、音声テキスト化方法および音声テキスト化用プログラム |
JP5322655B2 (ja) * | 2005-12-08 | 2013-10-23 | ニュアンス コミュニケーションズ オーストリア ゲーエムベーハー | 莫大な語彙を有する音声認識システム |
US8756058B2 (en) * | 2006-02-23 | 2014-06-17 | Nec Corporation | Speech recognition system, speech recognition result output method, and speech recognition result output program |
US9245526B2 (en) * | 2006-04-25 | 2016-01-26 | General Motors Llc | Dynamic clustering of nametags in an automated speech recognition system |
WO2008069139A1 (ja) * | 2006-11-30 | 2008-06-12 | National Institute Of Advanced Industrial Science And Technology | 音声認識システム及び音声認識システム用プログラム |
JP5386692B2 (ja) * | 2007-08-31 | 2014-01-15 | 独立行政法人情報通信研究機構 | 対話型学習装置 |
CN101452702B (zh) * | 2007-12-05 | 2011-08-10 | 财团法人工业技术研究院 | 语音模型的调整方法及其调整模块 |
US8326631B1 (en) * | 2008-04-02 | 2012-12-04 | Verint Americas, Inc. | Systems and methods for speech indexing |
JP5810912B2 (ja) * | 2011-12-28 | 2015-11-11 | 富士通株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
CN103076893B (zh) * | 2012-12-31 | 2016-08-17 | 百度在线网络技术(北京)有限公司 | 一种用于实现语音输入的方法与设备 |
CN104157285B (zh) | 2013-05-14 | 2016-01-20 | 腾讯科技(深圳)有限公司 | 语音识别方法、装置及电子设备 |
JP6655835B2 (ja) * | 2016-06-16 | 2020-02-26 | パナソニックIpマネジメント株式会社 | 対話処理方法、対話処理システム、及びプログラム |
JP6711343B2 (ja) * | 2017-12-05 | 2020-06-17 | カシオ計算機株式会社 | 音声処理装置、音声処理方法及びプログラム |
US11232783B2 (en) | 2018-09-12 | 2022-01-25 | Samsung Electronics Co., Ltd. | System and method for dynamic cluster personalization |
US20220335951A1 (en) * | 2019-09-27 | 2022-10-20 | Nec Corporation | Speech recognition device, speech recognition method, and program |
JP6807586B1 (ja) * | 2020-01-30 | 2021-01-06 | ベルフェイス株式会社 | 情報処理装置、情報処理方法及びプログラム |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0384707A (ja) * | 1989-08-28 | 1991-04-10 | Victor Co Of Japan Ltd | 垂直磁気記録方式 |
JPH06266386A (ja) | 1993-03-16 | 1994-09-22 | Nippon Telegr & Teleph Corp <Ntt> | ワードスポッティング方法 |
FI971822A0 (fi) * | 1994-11-01 | 1997-04-29 | British Telecomm | Puheentunnistus |
JP3576272B2 (ja) | 1995-06-22 | 2004-10-13 | シャープ株式会社 | 音声認識装置および方法 |
JP2886117B2 (ja) | 1995-09-11 | 1999-04-26 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 音声認識装置 |
JP3459712B2 (ja) * | 1995-11-01 | 2003-10-27 | キヤノン株式会社 | 音声認識方法及び装置及びコンピュータ制御装置 |
US5960395A (en) * | 1996-02-09 | 1999-09-28 | Canon Kabushiki Kaisha | Pattern matching method, apparatus and computer readable memory medium for speech recognition using dynamic programming |
JPH09274496A (ja) | 1996-04-09 | 1997-10-21 | Fuji Xerox Co Ltd | 音声認識装置 |
JP2999726B2 (ja) | 1996-09-18 | 2000-01-17 | 株式会社エイ・ティ・アール音声翻訳通信研究所 | 連続音声認識装置 |
JP3428309B2 (ja) | 1996-09-24 | 2003-07-22 | 松下電器産業株式会社 | 音声認識装置 |
US5956668A (en) * | 1997-07-18 | 1999-09-21 | At&T Corp. | Method and apparatus for speech translation with unrecognized segments |
JPH1185179A (ja) | 1997-09-16 | 1999-03-30 | Nippon Telegr & Teleph Corp <Ntt> | 統計的言語モデルの作成方法 |
US5983180A (en) * | 1997-10-23 | 1999-11-09 | Softsound Limited | Recognition of sequential data using finite state sequence models organized in a tree structure |
US6631349B1 (en) * | 1997-11-27 | 2003-10-07 | Hitachi, Ltd. | Speech recognition method and system |
JP3476008B2 (ja) * | 1999-09-10 | 2003-12-10 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 音声情報の登録方法、認識文字列の特定方法、音声認識装置、音声情報の登録のためのソフトウエア・プロダクトを格納した記憶媒体、及び認識文字列の特定のためのソフトウエア・プロダクトを格納した記憶媒体 |
US7310600B1 (en) * | 1999-10-28 | 2007-12-18 | Canon Kabushiki Kaisha | Language recognition using a similarity measure |
JP2001249684A (ja) * | 2000-03-02 | 2001-09-14 | Sony Corp | 音声認識装置および音声認識方法、並びに記録媒体 |
JP4543294B2 (ja) * | 2000-03-14 | 2010-09-15 | ソニー株式会社 | 音声認識装置および音声認識方法、並びに記録媒体 |
DE60016722T2 (de) * | 2000-06-07 | 2005-12-15 | Sony International (Europe) Gmbh | Spracherkennung in zwei Durchgängen mit Restriktion des aktiven Vokabulars |
DE10042942C2 (de) * | 2000-08-31 | 2003-05-08 | Siemens Ag | Verfahren zur Sprachsynthese |
GB0027178D0 (en) * | 2000-11-07 | 2000-12-27 | Canon Kk | Speech processing system |
-
2002
- 2002-11-21 JP JP2002337892A patent/JP4072718B2/ja not_active Expired - Fee Related
-
2003
- 2003-11-12 EP EP03772681A patent/EP1460615B1/en not_active Expired - Lifetime
- 2003-11-12 WO PCT/JP2003/014342 patent/WO2004047075A1/ja active IP Right Grant
- 2003-11-12 KR KR1020047011216A patent/KR101014086B1/ko not_active Expired - Fee Related
- 2003-11-12 AU AU2003280726A patent/AU2003280726A1/en not_active Abandoned
- 2003-11-12 US US10/502,169 patent/US7653541B2/en not_active Expired - Fee Related
- 2003-11-12 DE DE60318385T patent/DE60318385T2/de not_active Expired - Lifetime
- 2003-11-12 CN CNB2003801003011A patent/CN100354929C/zh not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10140974B2 (en) | 2014-12-29 | 2018-11-27 | Samsung Electronics Co., Ltd. | Method and apparatus for speech recognition |
Also Published As
Publication number | Publication date |
---|---|
US7653541B2 (en) | 2010-01-26 |
WO2004047075A1 (ja) | 2004-06-03 |
EP1460615A1 (en) | 2004-09-22 |
EP1460615B1 (en) | 2008-01-02 |
CN1692405A (zh) | 2005-11-02 |
JP2004170765A (ja) | 2004-06-17 |
JP4072718B2 (ja) | 2008-04-09 |
DE60318385T2 (de) | 2009-01-02 |
EP1460615A4 (en) | 2007-04-25 |
US20050143998A1 (en) | 2005-06-30 |
DE60318385D1 (de) | 2008-02-14 |
AU2003280726A1 (en) | 2004-06-15 |
KR101014086B1 (ko) | 2011-02-14 |
CN100354929C (zh) | 2007-12-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4301102B2 (ja) | 音声処理装置および音声処理方法、プログラム、並びに記録媒体 | |
US11062694B2 (en) | Text-to-speech processing with emphasized output audio | |
US8019602B2 (en) | Automatic speech recognition learning using user corrections | |
US10276149B1 (en) | Dynamic text-to-speech output | |
KR101014086B1 (ko) | 음성 처리 장치 및 방법, 및 기록 매체 | |
JP4351385B2 (ja) | 連続および分離音声を認識するための音声認識システム | |
US20160379638A1 (en) | Input speech quality matching | |
Young | HMMs and related speech recognition technologies | |
Knill et al. | Hidden Markov models in speech and language processing | |
Demuynck | Extracting, modelling and combining information in speech recognition | |
Williams | Knowing what you don't know: roles for confidence measures in automatic speech recognition | |
Manasa et al. | Comparison of acoustical models of GMM-HMM based for speech recognition in Hindi using PocketSphinx | |
Huang et al. | From Sphinx-II to whisper—making speech recognition usable | |
US20040006469A1 (en) | Apparatus and method for updating lexicon | |
JP4048473B2 (ja) | 音声処理装置および音声処理方法、並びにプログラムおよび記録媒体 | |
El Ouahabi et al. | Amazigh speech recognition using triphone modeling and clustering tree decision | |
JPH1097293A (ja) | 音声認識用単語辞書作成装置及び連続音声認識装置 | |
JPH09160586A (ja) | ヒドン・マルコフ・モデルの学習方法 | |
JPH09114482A (ja) | 音声認識のための話者適応化方法 | |
JP4163207B2 (ja) | 多言語話者適応方法、装置、プログラム | |
Fabian | Confidence measurement techniques in automatic speech recognition and dialog management | |
JPH09212190A (ja) | 音声認識装置及び文認識装置 | |
JPH0981185A (ja) | 連続音声認識装置 | |
JPH0916192A (ja) | 連続音声認識方式及び標準パタン訓練方式 | |
Şahin | Language modeling for Turkish continuous speech recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20040720 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application | ||
A201 | Request for examination | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20081112 Comment text: Request for Examination of Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20100623 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20101129 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20110201 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20110201 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
FPAY | Annual fee payment |
Payment date: 20140124 Year of fee payment: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20140124 Start annual number: 4 End annual number: 4 |
|
LAPS | Lapse due to unpaid annual fee | ||
PC1903 | Unpaid annual fee |
Termination category: Default of registration fee Termination date: 20160109 |