JPWO2009008055A1 - 音声認識装置、音声認識方法、および、音声認識プログラム - Google Patents
音声認識装置、音声認識方法、および、音声認識プログラム Download PDFInfo
- Publication number
- JPWO2009008055A1 JPWO2009008055A1 JP2009522448A JP2009522448A JPWO2009008055A1 JP WO2009008055 A1 JPWO2009008055 A1 JP WO2009008055A1 JP 2009522448 A JP2009522448 A JP 2009522448A JP 2009522448 A JP2009522448 A JP 2009522448A JP WO2009008055 A1 JPWO2009008055 A1 JP WO2009008055A1
- Authority
- JP
- Japan
- Prior art keywords
- phoneme
- word
- conversion rule
- unit
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 37
- 238000006243 chemical reaction Methods 0.000 claims description 395
- 238000004364 calculation method Methods 0.000 claims description 34
- 239000000284 extract Substances 0.000 claims description 17
- 230000003247 decreasing effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 38
- 241000282414 Homo sapiens Species 0.000 description 22
- 230000001186 cumulative effect Effects 0.000 description 17
- 230000006870 function Effects 0.000 description 10
- 238000012795 verification Methods 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 102100024237 Stathmin Human genes 0.000 description 1
- 108050003387 Stathmin Proteins 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
- Document Processing Apparatus (AREA)
- Character Discrimination (AREA)
Abstract
Description
図1は、本実施形態に係る音声認識装置1の概略構成を示すブロック図である。図1に示す音声認識装置1は、例えば、音声対話アプリケーションなどの上位プログラムからユーザの発話音声が渡され、その認識結果を上位プログラムへ返す音声認識エンジンとして使用される。また、音声認識装置1は、例えば、パーソナルコンピュータ、サーバマシンなどの汎用コンピュータによって構成される。なお、音声認識装置1は、例えば、車載情報端末、携帯電話、家電製品などの電子機器に組み込まれたコンピュータによって構成されていてもよい。
(1)各時刻における類似度の平均値が閾値T1以上
(2)各時刻における類似度の中で最小の類似度が閾値T2以上
(3)発話音声の発声区間のうち、第1閾値条件に対応付けられた音素または音素列に対応する区間の各時刻における類似度が、第1閾値条件が示す閾値C以上
図9は、本実施形態に係る音声認識装置2の概略構成を示すブロック図である。すなわち、本実施形態に係る音声認識装置2は、図1に示す変換規則記憶部13の代わりに、変換規則記憶部21〜23を備えている。なお、図9では、説明の簡略化のために、変換規則記憶部21〜23を3つ図示したが、音声認識装置2を構成する変換規則記憶部の数は任意である。また、本実施形態に係る音声認識装置2は、図1に示す音素列変換部14の代わりに、音素列変換部24を備えている。なお、図9において、図1と同様の機能を有する構成については、同じ参照符号を付記し、その詳細な説明を省略する。
図11は、本実施形態に係る音声認識装置3の概略構成を示すブロック図である。すなわち、本実施形態に係る音声認識装置3は、図1に示す音声認識装置1に加えて、変換規則計数部31、使用頻度算出部32、および、第1閾値条件更新部34を備えている。また、本実施形態に係る音声認識装置3は、図1に示す変換規則記憶部13の代わりに、変換規則記憶部33を備えている。なお、上記の変換規則計数部31、使用頻度算出部32、および、第1閾値条件更新部34は、コンピュータのCPUがこの機能を実現するプログラムに従って動作することによっても具現化される。なお、図11において、図1と同様の機能を有する構成については、同じ参照符号を付記し、その詳細な説明を省略する。
図16は、本実施形態に係る音声認識装置4の概略構成を示すブロック図である。すなわち、本実施形態に係る音声認識装置4は、図1に示す音声認識装置1に加えて、入力部41、変換規則計数部42、使用頻度算出部43、および、第1閾値条件更新部45を備えている。また、本実施形態に係る音声認識装置4は、図1に示す変換規則記憶部13の代わりに、変換規則記憶部44を備えている。なお、上記の入力部41、変換規則計数部42、使用頻度算出部43、および、第1閾値条件更新部45は、コンピュータのCPUがこの機能を実現するプログラムに従って動作することによっても具現化される。なお、図16において、図1と同様の機能を有する構成については、同じ参照符号を付記し、その詳細な説明を省略する。
図21は、本実施形態に係る音声認識装置5の概略構成を示すブロック図である。すなわち、本実施形態に係る音声認識装置5は、図1に示す変換規則記憶部13および音声照合部17の代わりに、変換規則記憶部51および音声照合部52を備えている。なお、図21において、図1と同様の機能を有する構成については、同じ参照符号を付記し、その詳細な説明を省略する。
Claims (7)
- 入力された発話音声を特徴量に変換する音声分析部と、
認識単語の読みを格納した認識単語記憶部と、
読みと音素との変換規則または読みと音素列との変換規則を格納した変換規則記憶部と、
前記変換規則記憶部に格納されている変換規則に従って、前記認識単語記憶部に格納されている認識単語の読みを音素列に変換する音素列変換部と、
音素がどのような特徴量になりやすいかをモデル化した標準パターンを格納した音素モデル記憶部と、
前記音素列変換部により変換された音素列に基づいて、前記音素モデル記憶部に格納されている標準パターンを抽出し、抽出した標準パターンを連結することによって、標準パターン列である単語モデルを生成する単語モデル生成部と、
前記音声分析部により変換された特徴量と、前記単語モデル生成部により生成された単語モデルとの各時刻における類似度を算出する音声照合部とを備え、
前記変換規則記憶部は、前記変換規則のうち少なくとも1つの変換規則の音素または音素列に対応付けられた第1閾値条件をさらに格納し、
前記音声照合部は、前記単語モデル生成部により生成された単語モデルのうち、前記各時刻における類似度の中で最小の類似度あるいは前記各時刻における類似度から得られる全体類似度が第2閾値条件を満たし、かつ、前記発話音声の発声区間のうち、前記第1閾値条件に対応付けられた音素または音素列に対応する区間の各時刻における類似度が当該第1閾値条件を満たす単語モデルを抽出し、抽出した単語モデルに対応する認識単語を認識結果として出力する、音声認識装置。 - 前記変換規則記憶部は、前記第1閾値条件が示す条件毎に複数備えられており、
前記音素列変換部は、前記認識単語記憶部に格納されている認識単語の読みの数に基づいて、複数の変換規則記憶部から認識単語の読みを音素列に変換するために使用する変換規則記憶部を選択し、選択した変換規則記憶部に格納されている変換規則に従って、前記認識単語記憶部に格納されている認識単語の読みを音素列に変換する、請求項1に記載の音声認識装置。 - 前記音声照合部により出力された認識結果の認識単語に対応する単語モデルを生成するために使用した変換規則の使用頻度を算出する使用頻度算出部と、
前記使用頻度算出部により算出された変換規則の使用頻度が境界条件より大きい場合、当該変換規則の音素または音素列に対応付けられた第1閾値条件が低くなるように、当該第1閾値条件を更新し、前記使用頻度算出部により算出された変換規則の使用頻度が境界条件より小さい場合、当該変換規則の音素または音素列に対応付けられた第1閾値条件が高くなるように、当該第1閾値条件を更新する第1閾値条件更新部とをさらに備える、請求項1に記載の音声認識装置。 - 前記音声照合部により出力された認識結果が誤っているか否かをユーザから受け付ける入力部と、
前記入力部が前記音声照合部により出力された認識結果が誤っていることをユーザから受け付けた場合、当該認識結果の認識単語に対応する単語モデルを生成するために使用した変換規則の使用頻度を算出する使用頻度算出部と、
前記使用頻度算出部により算出された変換規則の使用頻度が境界条件より大きい場合、当該変換規則の音素または音素列に対応付けられた第1閾値条件が高くなるように、当該第1閾値条件を更新し、前記使用頻度算出部により算出された変換規則の使用頻度が境界条件より小さい場合、当該変換規則の音素または音素列に対応付けられた第1閾値条件が低くなるように、当該第1閾値条件を更新する第1閾値条件更新部とをさらに備える、請求項1に記載の音声認識装置。 - 前記変換規則記憶部は、前記変換規則の音素または音素列に対応付けられた継続時間をさらに格納し、
前記音声照合部は、前記発話音声の発声区間のうち、前記継続時間に対応付けられた音素または音素列に対応する区間における発声時間が、前記継続時間以上であるか否かを判定し、前記区間における発声時間が前記継続時間以上であると判定した場合、抽出した単語モデルを棄却し、前記区間における発声時間が前記継続時間未満であると判定した場合、抽出した単語モデルに対応する認識単語を認識結果として出力する、請求項1に記載の音声認識装置。 - コンピュータが備える音声分析部が、入力された発話音声を特徴量に変換する音声分析工程と、
前記コンピュータが備える音素列変換部が、読みと音素との変換規則または読みと音素列との変換規則を格納した変換規則記憶部に格納されている変換規則に従って、認識単語の読みを格納した認識単語記憶部に格納されている認識単語の読みを音素列に変換する音素列変換工程と、
前記コンピュータが備える単語モデル生成部が、前記音素列変換工程により変換された音素列に基づいて、音素がどのような特徴量になりやすいかをモデル化した標準パターンを格納した音素モデル記憶部に格納されている標準パターンを抽出し、抽出した標準パターンを連結することによって、標準パターン列である単語モデルを生成する単語モデル生成工程と、
前記コンピュータが備える音声照合部が、前記音声分析工程により変換された特徴量と、前記単語モデル生成工程により生成された単語モデルとの各時刻における類似度を算出する音声照合工程とを含み、
前記変換規則記憶部は、前記変換規則のうち少なくとも1つの変換規則の音素または音素列に対応付けられた第1閾値条件をさらに格納し、
前記音声照合工程は、前記単語モデル生成工程により生成された単語モデルのうち、前記各時刻における類似度の中で最小の類似度あるいは前記各時刻における類似度から得られる全体類似度が第2閾値条件を満たし、かつ、前記発話音声の発声区間のうち、前記第1閾値条件に対応付けられた音素または音素列に対応する区間の各時刻における類似度が当該第1閾値条件を満たす単語モデルを抽出し、抽出した単語モデルに対応する認識単語を認識結果として出力する、音声認識方法。 - 入力された発話音声を特徴量に変換する音声分析処理と、
読みと音素との変換規則または読みと音素列との変換規則を格納した変換規則記憶部に格納されている変換規則に従って、認識単語の読みを格納した認識単語記憶部に格納されている認識単語の読みを音素列に変換する音素列変換処理と、
前記音素列変換処理により変換された音素列に基づいて、音素がどのような特徴量になりやすいかをモデル化した標準パターンを格納した音素モデル記憶部に格納されている標準パターンを抽出し、抽出した標準パターンを連結することによって、標準パターン列である単語モデルを生成する単語モデル生成処理と、
前記音声分析処理により変換された特徴量と、前記単語モデル生成処理により生成された単語モデルとの各時刻における類似度を算出する音声照合処理とをコンピュータに実行させ、
前記変換規則記憶部は、前記変換規則のうち少なくとも1つの変換規則の音素または音素列に対応付けられた第1閾値条件をさらに格納し、
前記音声照合処理は、前記単語モデル生成処理により生成された単語モデルのうち、前記各時刻における類似度の中で最小の類似度あるいは前記各時刻における類似度から得られる全体類似度が第2閾値条件を満たし、かつ、前記発話音声の発声区間のうち、前記第1閾値条件に対応付けられた音素または音素列に対応する区間の各時刻における類似度が当該第1閾値条件を満たす単語モデルを抽出し、抽出した単語モデルに対応する認識単語を認識結果として出力する処理を前記コンピュータに実行させる、音声認識プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/063688 WO2009008055A1 (ja) | 2007-07-09 | 2007-07-09 | 音声認識装置、音声認識方法、および、音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009008055A1 true JPWO2009008055A1 (ja) | 2010-09-02 |
JP4973731B2 JP4973731B2 (ja) | 2012-07-11 |
Family
ID=40228252
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009522448A Active JP4973731B2 (ja) | 2007-07-09 | 2007-07-09 | 音声認識装置、音声認識方法、および、音声認識プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8738378B2 (ja) |
JP (1) | JP4973731B2 (ja) |
CN (1) | CN101689364B (ja) |
WO (1) | WO2009008055A1 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5533042B2 (ja) * | 2010-03-04 | 2014-06-25 | 富士通株式会社 | 音声検索装置、音声検索方法、プログラム及び記録媒体 |
US9634855B2 (en) | 2010-05-13 | 2017-04-25 | Alexander Poltorak | Electronic personal interactive device that determines topics of interest using a conversational agent |
KR20120046627A (ko) * | 2010-11-02 | 2012-05-10 | 삼성전자주식회사 | 화자 적응 방법 및 장치 |
US9384731B2 (en) * | 2013-11-06 | 2016-07-05 | Microsoft Technology Licensing, Llc | Detecting speech input phrase confusion risk |
CN106205601B (zh) * | 2015-05-06 | 2019-09-03 | 科大讯飞股份有限公司 | 确定文本语音单元的方法及系统 |
US9922647B2 (en) * | 2016-01-29 | 2018-03-20 | International Business Machines Corporation | Approach to reducing the response time of a speech interface |
US20190005523A1 (en) * | 2017-06-28 | 2019-01-03 | Facebook, Inc. | Identifying changes in estimated actions performed by users presented with a content item relative to different budgets for presenting the content item |
US10546062B2 (en) * | 2017-11-15 | 2020-01-28 | International Business Machines Corporation | Phonetic patterns for fuzzy matching in natural language processing |
JP2019211599A (ja) * | 2018-06-04 | 2019-12-12 | 本田技研工業株式会社 | 音声認識装置、音声認識方法およびプログラム |
WO2020261357A1 (ja) * | 2019-06-25 | 2020-12-30 | 日本電信電話株式会社 | 発話評価装置、発話評価方法、およびプログラム |
CN111627422B (zh) * | 2020-05-13 | 2022-07-12 | 广州国音智能科技有限公司 | 语音加速检测方法、装置、设备及可读存储介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS635395A (ja) * | 1986-06-25 | 1988-01-11 | 富士通株式会社 | 音声認識装置 |
JPS63253997A (ja) * | 1987-04-10 | 1988-10-20 | 富士通株式会社 | 音声認識装置 |
JPH0573087A (ja) * | 1991-09-13 | 1993-03-26 | Matsushita Electric Ind Co Ltd | 音声認識方法 |
JPH06110493A (ja) * | 1992-09-29 | 1994-04-22 | Ibm Japan Ltd | 音声モデルの構成方法及び音声認識装置 |
JPH07261789A (ja) * | 1994-03-22 | 1995-10-13 | Mitsubishi Electric Corp | 音声認識の境界推定方法及び音声認識装置 |
JPH1097285A (ja) * | 1996-09-24 | 1998-04-14 | Mitsubishi Electric Corp | 音声認識装置 |
JP2003140683A (ja) * | 2001-11-02 | 2003-05-16 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラム |
WO2003088209A1 (fr) * | 2002-04-12 | 2003-10-23 | Mitsubishi Denki Kabushiki Kaisha | Systeme de navigation de voiture et dispositif de reconnaissance vocale de ce systeme |
Family Cites Families (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62116999A (ja) | 1985-11-18 | 1987-05-28 | 株式会社日立製作所 | 音節単位音声認識装置 |
JPH01302295A (ja) | 1988-05-30 | 1989-12-06 | Nippon Telegr & Teleph Corp <Ntt> | 単語位置検出方法及びその音素標準パターン作成方法 |
US5737723A (en) * | 1994-08-29 | 1998-04-07 | Lucent Technologies Inc. | Confusable word detection in speech recognition |
WO1996010795A1 (en) * | 1994-10-03 | 1996-04-11 | Helfgott & Karas, P.C. | A database accessing system |
JPH08248979A (ja) | 1995-03-06 | 1996-09-27 | Fuji Xerox Co Ltd | 音声認識装置 |
US6064959A (en) * | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
US6321195B1 (en) * | 1998-04-28 | 2001-11-20 | Lg Electronics Inc. | Speech recognition method |
US6400805B1 (en) * | 1998-06-15 | 2002-06-04 | At&T Corp. | Statistical database correction of alphanumeric identifiers for speech recognition and touch-tone recognition |
US6185530B1 (en) * | 1998-08-14 | 2001-02-06 | International Business Machines Corporation | Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system |
JP2001005488A (ja) * | 1999-06-18 | 2001-01-12 | Mitsubishi Electric Corp | 音声対話システム |
US6434521B1 (en) * | 1999-06-24 | 2002-08-13 | Speechworks International, Inc. | Automatically determining words for updating in a pronunciation dictionary in a speech recognition system |
JP4201470B2 (ja) * | 2000-09-12 | 2008-12-24 | パイオニア株式会社 | 音声認識システム |
US6859774B2 (en) * | 2001-05-02 | 2005-02-22 | International Business Machines Corporation | Error corrective mechanisms for consensus decoding of speech |
US7013276B2 (en) * | 2001-10-05 | 2006-03-14 | Comverse, Inc. | Method of assessing degree of acoustic confusability, and system therefor |
CN1198260C (zh) * | 2001-11-28 | 2005-04-20 | 财团法人工业技术研究院 | 识别多种语言的语音识别系统的方法 |
US6985861B2 (en) * | 2001-12-12 | 2006-01-10 | Hewlett-Packard Development Company, L.P. | Systems and methods for combining subword recognition and whole word recognition of a spoken input |
US7509259B2 (en) * | 2004-12-21 | 2009-03-24 | Motorola, Inc. | Method of refining statistical pattern recognition models and statistical pattern recognizers |
KR100679044B1 (ko) * | 2005-03-07 | 2007-02-06 | 삼성전자주식회사 | 사용자 적응형 음성 인식 방법 및 장치 |
US20070016399A1 (en) * | 2005-07-12 | 2007-01-18 | International Business Machines Corporation | Method and apparatus for detecting data anomalies in statistical natural language applications |
CN102176310B (zh) * | 2005-12-08 | 2013-08-21 | 纽昂斯奥地利通讯有限公司 | 具有巨大词汇量的语音识别系统 |
US8626506B2 (en) * | 2006-01-20 | 2014-01-07 | General Motors Llc | Method and system for dynamic nametag scoring |
US8600760B2 (en) * | 2006-11-28 | 2013-12-03 | General Motors Llc | Correcting substitution errors during automatic speech recognition by accepting a second best when first best is confusable |
-
2007
- 2007-07-09 JP JP2009522448A patent/JP4973731B2/ja active Active
- 2007-07-09 CN CN200780053719XA patent/CN101689364B/zh not_active Expired - Fee Related
- 2007-07-09 WO PCT/JP2007/063688 patent/WO2009008055A1/ja active Application Filing
-
2009
- 2009-12-09 US US12/634,208 patent/US8738378B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS635395A (ja) * | 1986-06-25 | 1988-01-11 | 富士通株式会社 | 音声認識装置 |
JPS63253997A (ja) * | 1987-04-10 | 1988-10-20 | 富士通株式会社 | 音声認識装置 |
JPH0573087A (ja) * | 1991-09-13 | 1993-03-26 | Matsushita Electric Ind Co Ltd | 音声認識方法 |
JPH06110493A (ja) * | 1992-09-29 | 1994-04-22 | Ibm Japan Ltd | 音声モデルの構成方法及び音声認識装置 |
JPH07261789A (ja) * | 1994-03-22 | 1995-10-13 | Mitsubishi Electric Corp | 音声認識の境界推定方法及び音声認識装置 |
JPH1097285A (ja) * | 1996-09-24 | 1998-04-14 | Mitsubishi Electric Corp | 音声認識装置 |
JP2003140683A (ja) * | 2001-11-02 | 2003-05-16 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラム |
WO2003088209A1 (fr) * | 2002-04-12 | 2003-10-23 | Mitsubishi Denki Kabushiki Kaisha | Systeme de navigation de voiture et dispositif de reconnaissance vocale de ce systeme |
Also Published As
Publication number | Publication date |
---|---|
CN101689364B (zh) | 2011-11-23 |
CN101689364A (zh) | 2010-03-31 |
US20100088098A1 (en) | 2010-04-08 |
US8738378B2 (en) | 2014-05-27 |
JP4973731B2 (ja) | 2012-07-11 |
WO2009008055A1 (ja) | 2009-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4973731B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
US8244522B2 (en) | Language understanding device | |
JP4845118B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
JP4812029B2 (ja) | 音声認識システム、および、音声認識プログラム | |
JP3716870B2 (ja) | 音声認識装置および音声認識方法 | |
EP2048655B1 (en) | Context sensitive multi-stage speech recognition | |
JP5957269B2 (ja) | 音声認識サーバ統合装置および音声認識サーバ統合方法 | |
JP5200712B2 (ja) | 音声認識装置、音声認識方法及びコンピュータプログラム | |
EP1701338B1 (en) | Speech recognition method | |
JP6085538B2 (ja) | 音響認識装置、音響認識方法、及び音響認識プログラム | |
JP2011033680A (ja) | 音声処理装置及び方法、並びにプログラム | |
CN103971685A (zh) | 语音命令识别方法和系统 | |
US20070038453A1 (en) | Speech recognition system | |
JP2003308091A (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
JP3803029B2 (ja) | 音声認識装置 | |
KR101014086B1 (ko) | 음성 처리 장치 및 방법, 및 기록 매체 | |
CN112750445A (zh) | 语音转换方法、装置和系统及存储介质 | |
JP3444108B2 (ja) | 音声認識装置 | |
JP4666129B2 (ja) | 発声速度正規化分析を用いた音声認識装置 | |
JP3628245B2 (ja) | 言語モデル生成方法、音声認識方法及びそのプログラム記録媒体 | |
JP2001312293A (ja) | 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体 | |
JP3378547B2 (ja) | 音声認識方法及び装置 | |
JP4749990B2 (ja) | 音声認識装置 | |
JP4604424B2 (ja) | 音声認識装置及び方法、並びにプログラム | |
JPH09114482A (ja) | 音声認識のための話者適応化方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111222 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120313 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120326 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150420 Year of fee payment: 3 |