JP5141687B2 - 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法 - Google Patents
音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法 Download PDFInfo
- Publication number
- JP5141687B2 JP5141687B2 JP2009525221A JP2009525221A JP5141687B2 JP 5141687 B2 JP5141687 B2 JP 5141687B2 JP 2009525221 A JP2009525221 A JP 2009525221A JP 2009525221 A JP2009525221 A JP 2009525221A JP 5141687 B2 JP5141687 B2 JP 5141687B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- type
- learning
- rule
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 75
- 238000006243 chemical reaction Methods 0.000 claims description 212
- 230000008569 process Effects 0.000 claims description 58
- 238000000605 extraction Methods 0.000 claims description 34
- 238000012545 processing Methods 0.000 claims description 28
- 239000000284 extract Substances 0.000 claims description 9
- 239000000470 constituent Substances 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 description 40
- 238000010586 diagram Methods 0.000 description 18
- 230000006870 function Effects 0.000 description 10
- 238000004364 calculation method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000003780 insertion Methods 0.000 description 3
- 230000037431 insertion Effects 0.000 description 3
- 230000011218 segmentation Effects 0.000 description 3
- 241001189372 Satanas Species 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000013138 pruning Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000513 principal component analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000002922 simulated annealing Methods 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/063—Training
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/025—Phonemes, fenemes or fenones being the recognition units
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
- G10L2015/027—Syllables being the recognition units
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Description
図1は、本実施形態にかかるルール学習装置と、それに接続される音声認識装置の構成を表す機能ブロック図である。図1に示す音声認識装置20は、音声データを入力して、音声認識を行い、認識結果を出力する装置である。そのために、音声認識エンジン21、音響モデル記録部22および認識語彙(単語辞書)記録部23を備えている。
図2は、音声認識装置20の音声認識エンジン21の詳細な構成を説明するための機能ブロック図である。図2に示す機能ブロックで、図1と同じ機能ブロックには同じ番号が付されている。また、図2に示すルール学習装置1では、一部の機能ブロックの掲載を省略している。音声認識エンジン21は、音声分析部24、音声照合部25、音素列変換部27を備える。
次に、図1を参照して、ルール学習装置1の構成について説明する。システム監視部13は、音声認識装置20およびルール学習装置1の動作状況を監視し、ルール学習装置1の動作を制御する。システム監視部13は、例えば、監視情報記録部14および認識語彙情報記録部15に記録されたデータを基に、ルール学習装置1が実行すべき処理を決定し、各機能部に対して決定した処理の実行を指示する。
次に、ルール学習装置1の初期学習時の動作例について説明する。図8は、システム監視部13が初期学習のためのデータを系列A−系列B記録部3に記録する処理を示すフローチャートである。図9は、ルール学習部9が、系列A−系列B記録部3に記録されたデータを用いて、初期学習する処理を示すフローチャートである。
図11は、抽出部12およびルール学習部9による再学習処理を示すフローチャートである。図11に示す処理は、例えば、認識語彙記録部23において、認識語彙が新規登録された場合に、システム監視部13からの指示を受けて、抽出部12およびルール学習部9が再学習処理を実行する場合の動作である。
あい → a i
いう → y u u
うえ → u w e
新たに再学習した変換規則が次の2つである場合、
いう → y u u
えお → e h o
ルール学習部9は、過去の学習結果と新たな再学習結果とをマージして、次のような変換規則のデータセットを作成することができる。すなわち、「いう → y u u」については、過去の学習結果と新たな再学習結果が同じなので、ルール学習部9は、いずれかを削除することができる。
次に、不要ルール削除処理について説明する。図13は、基準文字列作成部6および不要ルール判定部8による不要ルール削除処理の一例を示すフローチャートである。図13において、まず、基準文字列作成部6は、学習ルール記録部5に記録された変換規則で示される学習音節列SGとそれに対応する学習音素列PGの組を取得する(Op31)。ここでは、一例として、図5に示す学習ルール記録部5のデータから、学習音節列SG=「あか」、学習音素列PG=「akas」の組を取得する場合を例にあげて説明する。
以上、本実施形態では、系列Aが音素列、系列Bが音節列である場合について説明したが、系列Aおよび系列Bの他のとりうる態様について説明する。系列Aは、例えば、音に対応する記号列等のような、音を表す文字列である。系列Aの表記および言語は任意である。例えば、下記表4に示すような音素記号、発音記号、音に割り当てられたID番号列が系列Aに含まれる。
/a/ /k/ /a/ → [01] [06] [01] → 「あか」
この場合、ルール学習装置1は、音素記号と音素IDとの間の変換規則、および音素IDと音節列との間の変換規則のいずれか一方または双方を学習の対象とすることができる。
本実施形態は、日本語の音声認識装置で用いられる変換規則を学習する場合について、説明したが、本発明は日本語に限らず任意の言語に適用できる。ここで、上記実施形態を、英語に適用した場合のデータ例について説明する。ここでは、一例として、系列Aが発音記号列であり、系列Bが単語列である場合について説明する。この例では、単語列に含まれるそれぞれの単語が、系列Bの最小単位である要素となる。
Claims (8)
- 音響モデルおよび単語辞書を用いて、入力した音声データについて照合処理を実行することにより認識結果を生成する音声認識装置であって、前記照合処理において、音を表す第1の型の文字列と、認識結果を形成するための第2の型の文字列との間の変換規則を用いて、前記入力した音声データの音を表す第1の型の文字列を第2の型の文字列に変換し、変換した第2の型の文字列に対応する単語辞書の単語を含む認識結果を出力する音声認識装置に接続された音声認識用ルール学習装置であって、
前記音声認識装置で認識結果が生成される過程で生成される第1の型の文字列と、当該第1の型の文字列に対応する第2の型の文字列とを対応付けて記録する文字列記録部と、
前記単語辞書に記録された単語に対応する第2の型の文字列から、第2の型の文字列の最小単位である第2型要素が複数連なって構成される文字列を、第2型学習文字列候補として抽出する抽出部と、
前記抽出部が抽出した第2型学習文字列候補のうち、前記文字列記録部に記録された第2の型の文字列の少なくとも一部に一致する文字列を第2型学習文字列とし、当該第2の型の文字列に対応付けられて前記文字列記録部に記録された前記第1の型の文字列中で、前記第2型学習文字列に対応する箇所を、第1型学習文字列として抽出し、当該第1型学習文字列と第2型学習文字列との対応関係を示すデータを、前記音声認識装置で用いられる変換規則に含めるルール学習部とを備える、音声認識用ルール学習装置。 - 第2の型の文字列の構成単位である第2型要素それぞれに対応する理想的な第1の型の文字列を示すデータである基本ルールを予め記録する基本ルール記録部と、
前記基本ルールを用いて前記第2型学習文字列に対応する第1の型の文字列を、第1型基準文字列として生成し、当該第1型基準文字列と、前記第1型学習文字列との類似度合を示す値を計算し、当該値が所定の許容範囲内である場合に、前記第1型学習文字列を前記変換規則に含めると判断する、不要ルール判定部とをさらに備える請求項1に記載の音声認識用ルール学習装置。 - 前記不要ルール判定部は、前記第1型基準文字列と前記第1型学習文字列との文字列長の違い、および前記第1型基準文字列と前記第1型学習文字列とで一致する文字の割合のうち、少なくとも1つに基づいて類似度合を示す値を計算することを特徴とする、請求項2に記載の音声認識用ルール学習装置。
- 前記ルール学習部が抽出した前記第1型学習文字列および前記第2型学習文字列の少なくともいずれか一方の前記音声認識装置における出現頻度が、所定の許容範囲内である場合に、当該第1型学習文字列と前記第2型学習文字列との対応関係を示すデータを前記変換規則に含めると判断する不要ルール判定部をさらに備える、請求項1に記載の音声認識用ルール学習装置。
- 前記所定の許容範囲を示す許容範囲データを記録する閾値記録部と、
ユーザから許容範囲を示すデータの入力を受け付け、当該入力に基づいて前記閾値記録部に記録された前記許容範囲データを更新する設定部をさらに備える、請求項2〜4のいずれか1項に記載の音声認識ルール学習装置。 - 音を表す第1の型の文字列と、認識結果を形成するための第2の型の文字列との間の変換規則を記録するルール記録部と、
音響モデルおよび単語辞書を用いて入力した音声データの照合処理を実行し、当該照合処理において、前記入力した音声データの音を表す第1の型の文字列を、前記変換規則を用いて第2の型の文字列に変換し、変換した第2の型の文字列に対応する単語辞書の単語を含む認識結果を出力する音声認識部と、
前記音声認識部で認識結果が生成される過程で生成される第1の型の文字列と、当該第1の型の文字列に対応する第2の型の文字列とを対応付けて記録する文字列記録部と、
前記単語辞書に記録された単語に対応する第2の型の文字列から、第2の型の文字列の最小単位である第2型要素が複数連なって構成される文字列を、第2型学習文字列候補として抽出する抽出部と、
前記抽出部が抽出した第2型学習文字列候補のうち、前記文字列記録部に記録された第2の型の文字列の少なくとも一部に一致する文字列を第2型学習文字列とし、当該第2の型の文字列に対応付けられて前記文字列記録部に記録された前記第1の型の文字列中で、前記第2型学習文字列に対応する箇所を、第1型学習文字列として抽出し、当該第1型学習文字列と第2型学習文字列との対応関係を示すデータを、前記音声認識部で用いられる変換規則に含めるルール学習部とを備える、音声認識装置。 - 音響モデルおよび単語辞書を用いて、入力した音声データについて照合処理を実行することにより認識結果を生成する音声認識装置であって、前記照合処理において、音を表す第1の型の文字列と、認識結果を形成するための第2の型の文字列との間の変換規則を用いて、前記入力した音声データの音を表す第1の型の文字列を第2の型の文字列に変換し、変換した第2の型の文字列に対応する単語辞書の単語を含む認識結果を出力する音声認識装置で用いられる前記変換規則を、コンピュータが学習する音声認識用ルール学習方法であって、
前記音声認識装置で認識結果が生成される過程で生成される第1の型の文字列と、当該第1の型の文字列に対応する第2の型の文字列とを対応付けて記録する文字列記録部へアクセス可能なコンピュータが実行する工程であって、
前記単語辞書に記録された単語に対応する第2の型の文字列から、第2の型の文字列の最小単位である第2型要素が複数連なって構成される文字列を、第2型学習文字列候補として抽出する工程と、
前記抽出した第2型学習文字列候補のうち、前記文字列記録部に記録された第2の型の文字列の少なくとも一部に一致する文字列を第2型学習文字列とし、
当該第2の型の文字列に対応付けられて前記文字列記録部に記録された前記第1の型の文字列中で、前記第2型学習文字列に対応する箇所を、第1型学習文字列として抽出し、
当該第1型学習文字列と第2型学習文字列との対応関係を示すデータを、前記音声認識装置で用いられる変換規則に含める工程とを含む、音声認識用ルール学習方法。 - 音響モデルおよび単語辞書を用いて、入力した音声データについて照合処理を実行することにより認識結果を生成する音声認識装置であって、前記照合処理において、音を表す第1の型の文字列と、認識結果を形成するための第2の型の文字列との間の変換規則を用いて、前記入力した音声データの音を表す第1の型の文字列を第2の型の文字列に変換し、変換した第2の型の文字列に対応する単語辞書の単語を含む認識結果を出力する音声認識装置に接続または内蔵されたコンピュータに処理を実行させる音声認識用ルール学習プログラムであって、
前記音声認識装置で認識結果が生成される過程で生成される第1の型の文字列と、当該第1の型の文字列に対応する第2の型の文字列とを対応付けて記録する文字列記録部にアクセスする処理と、
前記単語辞書に記録された単語に対応する第2の型の文字列から、第2の型の文字列の最小単位である第2型要素が複数連なって構成される文字列を、第2型学習文字列候補として抽出する抽出処理と、
前記抽出処理で抽出された第2型学習文字列候補のうち、前記文字列記録部に記録された第2の型の文字列の少なくとも一部に一致する文字列を第2型学習文字列とし、当該第2の型の文字列に対応付けられて前記文字列記録部に記録された前記第1の型の文字列中で、前記第2型学習文字列に対応する箇所を、第1型学習文字列として抽出し、当該第1型学習文字列と第2型学習文字列との対応関係を示すデータを、前記音声認識装置で用いられる変換規則に含めるルール学習処理とをコンピュータに実行させる、音声認識用ルール学習プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2007/064957 WO2009016729A1 (ja) | 2007-07-31 | 2007-07-31 | 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2009016729A1 JPWO2009016729A1 (ja) | 2010-10-07 |
JP5141687B2 true JP5141687B2 (ja) | 2013-02-13 |
Family
ID=40303974
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009525221A Expired - Fee Related JP5141687B2 (ja) | 2007-07-31 | 2007-07-31 | 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20100100379A1 (ja) |
JP (1) | JP5141687B2 (ja) |
CN (1) | CN101785050B (ja) |
WO (1) | WO2009016729A1 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110093263A1 (en) * | 2009-10-20 | 2011-04-21 | Mowzoon Shahin M | Automated Video Captioning |
JP6045175B2 (ja) * | 2012-04-05 | 2016-12-14 | 任天堂株式会社 | 情報処理プログラム、情報処理装置、情報処理方法及び情報処理システム |
WO2014013910A1 (ja) | 2012-07-19 | 2014-01-23 | 住友建機株式会社 | ショベル |
CN103354089B (zh) * | 2013-06-25 | 2015-10-28 | 天津三星通信技术研究有限公司 | 一种语音通信管理方法及其装置 |
KR102117082B1 (ko) * | 2014-12-29 | 2020-05-29 | 삼성전자주식회사 | 음성 인식 방법 및 음성 인식 장치 |
CN106157141B (zh) * | 2015-04-27 | 2021-06-29 | 创新先进技术有限公司 | 数值处理方法及装置 |
CN105893414A (zh) * | 2015-11-26 | 2016-08-24 | 乐视致新电子科技(天津)有限公司 | 筛选发音词典有效词条的方法及装置 |
US10831366B2 (en) * | 2016-12-29 | 2020-11-10 | Google Llc | Modality learning on mobile devices |
US10593320B2 (en) * | 2018-01-07 | 2020-03-17 | International Business Machines Corporation | Learning transcription errors in speech recognition tasks |
US10607596B2 (en) * | 2018-01-07 | 2020-03-31 | International Business Machines Corporation | Class based learning for transcription errors in speech recognition tasks |
US11838459B2 (en) | 2019-06-07 | 2023-12-05 | Canon Kabushiki Kaisha | Information processing system, information processing apparatus, and information processing method |
JP7353806B2 (ja) * | 2019-06-07 | 2023-10-02 | キヤノン株式会社 | 情報処理システム、情報処理装置、情報処理方法 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02255944A (ja) * | 1989-01-26 | 1990-10-16 | Nec Corp | かな漢字変換装置 |
JPH1185737A (ja) * | 1997-09-12 | 1999-03-30 | Ee I Soft Kk | 辞書管理装置および方法並びに記録媒体 |
JP2001092494A (ja) * | 1999-09-24 | 2001-04-06 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラム記録媒体 |
JP2004062262A (ja) * | 2002-07-25 | 2004-02-26 | Hitachi Ltd | 未知語を自動的に辞書へ登録する方法 |
JP2007171275A (ja) * | 2005-12-19 | 2007-07-05 | Canon Inc | 言語処理装置及び現後処理方法 |
JP2008021235A (ja) * | 2006-07-14 | 2008-01-31 | Denso Corp | 読み登録システム及び読み登録プログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4797929A (en) * | 1986-01-03 | 1989-01-10 | Motorola, Inc. | Word recognition in a speech recognition system using data reduced word templates |
US5033087A (en) * | 1989-03-14 | 1991-07-16 | International Business Machines Corp. | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system |
CA2126380C (en) * | 1993-07-22 | 1998-07-07 | Wu Chou | Minimum error rate training of combined string models |
JP2980228B2 (ja) * | 1994-10-25 | 1999-11-22 | 日本ビクター株式会社 | 音声認識用音響モデル生成方法 |
US5875426A (en) * | 1996-06-12 | 1999-02-23 | International Business Machines Corporation | Recognizing speech having word liaisons by adding a phoneme to reference word models |
US5884259A (en) * | 1997-02-12 | 1999-03-16 | International Business Machines Corporation | Method and apparatus for a time-synchronous tree-based search strategy |
US6385579B1 (en) * | 1999-04-29 | 2002-05-07 | International Business Machines Corporation | Methods and apparatus for forming compound words for use in a continuous speech recognition system |
US6434521B1 (en) * | 1999-06-24 | 2002-08-13 | Speechworks International, Inc. | Automatically determining words for updating in a pronunciation dictionary in a speech recognition system |
US7120582B1 (en) * | 1999-09-07 | 2006-10-10 | Dragon Systems, Inc. | Expanding an effective vocabulary of a speech recognition system |
US6973427B2 (en) * | 2000-12-26 | 2005-12-06 | Microsoft Corporation | Method for adding phonetic descriptions to a speech recognition lexicon |
US7103542B2 (en) * | 2001-12-14 | 2006-09-05 | Ben Franklin Patent Holding Llc | Automatically improving a voice recognition system |
US7974843B2 (en) * | 2002-01-17 | 2011-07-05 | Siemens Aktiengesellschaft | Operating method for an automated language recognizer intended for the speaker-independent language recognition of words in different languages and automated language recognizer |
US7089188B2 (en) * | 2002-03-27 | 2006-08-08 | Hewlett-Packard Development Company, L.P. | Method to expand inputs for word or document searching |
JP3724649B2 (ja) * | 2002-11-11 | 2005-12-07 | 松下電器産業株式会社 | 音声認識用辞書作成装置および音声認識装置 |
US7529668B2 (en) * | 2004-08-03 | 2009-05-05 | Sony Corporation | System and method for implementing a refined dictionary for speech recognition |
-
2007
- 2007-07-31 JP JP2009525221A patent/JP5141687B2/ja not_active Expired - Fee Related
- 2007-07-31 CN CN2007801000793A patent/CN101785050B/zh not_active Expired - Fee Related
- 2007-07-31 WO PCT/JP2007/064957 patent/WO2009016729A1/ja active Application Filing
-
2009
- 2009-12-22 US US12/644,906 patent/US20100100379A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH02255944A (ja) * | 1989-01-26 | 1990-10-16 | Nec Corp | かな漢字変換装置 |
JPH1185737A (ja) * | 1997-09-12 | 1999-03-30 | Ee I Soft Kk | 辞書管理装置および方法並びに記録媒体 |
JP2001092494A (ja) * | 1999-09-24 | 2001-04-06 | Mitsubishi Electric Corp | 音声認識装置、音声認識方法および音声認識プログラム記録媒体 |
JP2004062262A (ja) * | 2002-07-25 | 2004-02-26 | Hitachi Ltd | 未知語を自動的に辞書へ登録する方法 |
JP2007171275A (ja) * | 2005-12-19 | 2007-07-05 | Canon Inc | 言語処理装置及び現後処理方法 |
JP2008021235A (ja) * | 2006-07-14 | 2008-01-31 | Denso Corp | 読み登録システム及び読み登録プログラム |
Non-Patent Citations (4)
Title |
---|
CSNJ200000002001; 平石智宣 他: '"英語固有名詞のカナ表記への変換"' 情報処理学会第59回(平成11年後期)全国大会講演論文集(2) , 19990928, p.2-363-2-364 * |
CSNJ201010058001; 横田和章 他: '"コーパスに基づく日本語文法の自動獲得法"' 情報処理学会第51回(平成7年後期)全国大会講演論文集(3) , 19950920, p.3-1-3-2 * |
JPN6012000011; 横田和章 他: '"コーパスに基づく日本語文法の自動獲得法"' 情報処理学会第51回(平成7年後期)全国大会講演論文集(3) , 19950920, p.3-1-3-2 * |
JPN6012000012; 平石智宣 他: '"英語固有名詞のカナ表記への変換"' 情報処理学会第59回(平成11年後期)全国大会講演論文集(2) , 19990928, p.2-363-2-364 * |
Also Published As
Publication number | Publication date |
---|---|
US20100100379A1 (en) | 2010-04-22 |
WO2009016729A1 (ja) | 2009-02-05 |
JPWO2009016729A1 (ja) | 2010-10-07 |
CN101785050A (zh) | 2010-07-21 |
CN101785050B (zh) | 2012-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5141687B2 (ja) | 音声認識用照合ルール学習システム、音声認識用照合ルール学習プログラムおよび音声認識用照合ルール学習方法 | |
CN108305634B (zh) | 解码方法、解码器及存储介质 | |
US7421387B2 (en) | Dynamic N-best algorithm to reduce recognition errors | |
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
JP4105841B2 (ja) | 音声認識方法、音声認識装置、コンピュータ・システムおよび記憶媒体 | |
JP5440177B2 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
US8738378B2 (en) | Speech recognizer, speech recognition method, and speech recognition program | |
JP2008262279A (ja) | 音声検索装置 | |
US20030088416A1 (en) | HMM-based text-to-phoneme parser and method for training same | |
CN112951211B (zh) | 一种语音唤醒方法及装置 | |
WO2010044123A1 (ja) | 検索装置、検索用索引作成装置、および検索システム | |
KR101424193B1 (ko) | 타 언어권 화자음성에 대한 음성인식 시스템의 성능 향상을위한 비직접적 데이터 기반 발음변이 모델링 시스템 및방법 | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP5590549B2 (ja) | 音声検索装置および音声検索方法 | |
JP4595415B2 (ja) | 音声検索システムおよび方法ならびにプログラム | |
CN111429886B (zh) | 一种语音识别方法及系统 | |
JP2009271117A (ja) | 音声検索装置および音声検索方法 | |
JP2004177551A (ja) | 音声認識用未知発話検出装置及び音声認識装置 | |
JPH09134192A (ja) | 統計的言語モデル生成装置及び音声認識装置 | |
KR101095864B1 (ko) | 연속 숫자의 음성 인식에 있어서 혼동행렬과 신뢰도치 기반의 다중 인식후보 생성 장치 및 방법 | |
JP2004309928A (ja) | 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム | |
JP2000075885A (ja) | 音声認識装置 | |
CN113284487B (zh) | 基于语音识别结果的匹配方法 | |
JP2008249761A (ja) | 統計的言語モデル生成装置及び方法、及びこれを用いた音声認識装置 | |
JP3818154B2 (ja) | 音声認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120110 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120309 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121023 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121105 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20151130 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5141687 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |