JP2009217006A - 辞書修正装置、システム、およびコンピュータプログラム - Google Patents
辞書修正装置、システム、およびコンピュータプログラム Download PDFInfo
- Publication number
- JP2009217006A JP2009217006A JP2008061037A JP2008061037A JP2009217006A JP 2009217006 A JP2009217006 A JP 2009217006A JP 2008061037 A JP2008061037 A JP 2008061037A JP 2008061037 A JP2008061037 A JP 2008061037A JP 2009217006 A JP2009217006 A JP 2009217006A
- Authority
- JP
- Japan
- Prior art keywords
- data
- reading
- entry
- notation
- threshold
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 title claims abstract description 73
- 238000004590 computer program Methods 0.000 title claims description 5
- 238000012545 processing Methods 0.000 claims abstract description 96
- 239000000284 extract Substances 0.000 claims abstract description 16
- 238000012217 deletion Methods 0.000 claims description 78
- 230000037430 deletion Effects 0.000 claims description 78
- 238000000034 method Methods 0.000 claims description 37
- 238000000605 extraction Methods 0.000 claims description 36
- 230000015572 biosynthetic process Effects 0.000 claims description 24
- 230000008569 process Effects 0.000 claims description 24
- 238000003786 synthesis reaction Methods 0.000 claims description 24
- 238000012360 testing method Methods 0.000 claims description 19
- 238000004458 analytical method Methods 0.000 claims description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000008859 change Effects 0.000 description 12
- 238000013500 data storage Methods 0.000 description 11
- 241000036848 Porzana carolina Species 0.000 description 8
- 230000006870 function Effects 0.000 description 7
- 235000008536 Capsicum baccatum var pendulum Nutrition 0.000 description 4
- 244000003211 Capsicum baccatum var. pendulum Species 0.000 description 4
- 238000013518 transcription Methods 0.000 description 4
- 230000035897 transcription Effects 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000012804 iterative process Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004886 process control Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Abstract
【解決手段】辞書修正装置が、第一閾値を記憶する閾値記憶部と、表記と、読みと、当該表記および当該読みが発生する頻度である発生頻度との組をエントリとして有する頻度データを読み込み、前記閾値記憶部から前記第一閾値を読み込み、前記発生頻度が前記第一閾値以上である前記エントリが存在する前記表記に関して、その表記を有して且つ前記発生頻度が所定の第二閾値以下となるような前記エントリを、削除対象エントリとして抽出する削除対象エントリ抽出部と、表記と読みとの組を有する発音辞書データから、前記削除対象エントリ抽出部によって抽出された前記削除対象エントリに対応するデータを削除して、修正発音辞書データを作成する辞書修正処理部を具備する。
【選択図】図1
Description
音声認識処理や音声合成処理などでは、この発音辞書をもとにして単語の表記とその発声の仕方である読みを対応付けしているため、正しい読みが発音辞書に登録されていなければ、その表記が正しく認識されなかったり、音声を正しく合成できなかったりするということになる。
また、単語の読みを構成する音素に対し、所定のパターン定義を用いて異なる読みを発生させ、それを発音辞書に自動で追加していく手法も提案されている(特許文献1)。
緒方淳、外2名,「PodCastleの実現:Web2.0に基づく音声認識性能の向上について」,情処研報,音声言語情報処理2007−SLP−65−8,社団法人情報処理学会,2007年,p.41−46
また、インターネットを介して公開された発音辞書への追加登録を、一般のインターネットユーザに任せた場合には、表記に対する誤った読みが登録されてしまう可能性があり、このことが問題となる。
また、本発明は、上記のような辞書修正装置を応用した音声認識システムや音声合成システムを提供することを目的とする。
上記頻度データは、例えば学習データセットに基づくものであり、表記と読みの組とその組の発生頻度を表わす。発生頻度が適宜設定される第一閾値以上であるような表記と読みの組については、その表記の発生頻度は充分に高い。そのように発生頻度の高い表記について、発生頻度が第二閾値以下であるような表記と読みの組み合わせが存在するとき、その読みは、不要なエントリの候補と見なせる。従って、削除対象エントリ抽出部は、そのような表記と読みの組を削除対象エントリとして抽出する。辞書修正処理部は、このような基準で削除対象とされたエントリを発音辞書データから削除する。このように作成された修正発音辞書データは、不要なエントリが含まれていない。よって、この修正発音辞書データを用いて例えば音声処理等を行なうと、処理の正確性が向上する。
仮に、発生頻度が第二閾値以下であるようなエントリであっても、そのエントリと同じ表記を有して且つ発生頻度が第一閾値以上であるようなエントリが存在しない場合には、頻度データの元になる学習データ自体が、その表記に関しては充分ではない。しかしながら本態様の構成では第一閾値を用いた判断を行なっていることにより、このようなエントリは削除対象エントリには含まれない。従って、抽出される削除対象エントリの信頼性は、高まる。
なお、上記の第二閾値としては0(ゼロ)が好適である。つまり、第二閾値が0であるとき、発生頻度が0であることが削除対象エントリとして抽出されるための必要条件となる。
この構成により、発話された音声の書き起こし文とこの発話された音声に対応する読み(これらをあわせたものが学習データセット)から頻度データを作成して、削除エントリ抽出部の処理のために用いることができる。
知識データは、例えば発音アクセント辞典や用字用語辞典などのデータであり、表記および読みについて信頼できる情報を含む。本態様では、このような知識データに基づいて得られる表記と読みの組を信頼エントリとして保持する。たとえ削除対象エントリに含まれているような表記と読みの組であっても、その組が信頼エントリにも含まれていれば、辞書修正処理部はそのようなエントリを発音辞書データから削除しない。つまり、何らかの理由によって頻度データにおいては発生頻度が第二閾値以下となってしまっている表記と読みの組が偶々存在していたとしても無条件にその組が発音辞書データから削除されるわけではなく、修正発音辞書データの内容が安定的になる。
発音決定部は、修正発音辞書データを用いてテストデータの音声の読みを決定する。このとき、修正発音辞書データの精度に応じて、決定された読みには誤りが含まれる可能性がある。発音決定部は、正解データを用いて、決定された読みの正解率を算出する。この正解率に応じて、閾値決定部が、次回の第一閾値を決定する。この構成により、正解率に応じた閾値を適応的に決定することができる。
一例としては、正解率が高いほど今回の第一閾値から次回の第一閾値への変化量の絶対値を小さくし、正解率が低いほど今回の第一閾値から次回の第一閾値への変化量の絶対値を大きくする。これにより、正解率が低い領域においては、次回の第一閾値を大きく変化させるため、適切な第一閾値に速く近付く(言い換えれば、少ない回数で適切な第一閾値に近付く)。また、正解率が高い領域においては、次回の第一閾値への変化量は小さいため、過度な変化とならず、微調整を効かせることができる。
これによれば、より正確な音声認識を行なうことが可能となる。
これによれば、より正確な音声合成を行なうことが可能となる。
以下、本発明の実施形態について、図面を参照しながら説明する。
図1は、本実施形態による発音辞書修正装置の機能構成を示すブロック図である。図示するように、発音辞書修正装置100は、閾値記憶部7と、学習データセット処理部5と、知識データ処理部6と、削除対象エントリ抽出部8と、辞書修正処理部9とを含んで構成される。また、発音辞書修正装置100は、発音辞書データ1と、学習データセット2と、知識データ3とを使用し、処理の結果として修正された発音辞書データ4(修正発音辞書データ)を作成し、出力するようになっている。これらの各データは、例えば、磁気ハードディスク装置などに記録されている。また、閾値記憶部7は、例えば、書き換え可能な半導体リードライトメモリ(半導体RWM)によって構成される。
発音辞書データ1は、音声認識や音声合成などといった音声処理に用いるための辞書のデータであり、単語の文字での表記と、その単語の読みとの関係を表わす。発音辞書データ1の詳細については後述する。
学習データセット2は、過去に実際に発話された音声とその音声に対応する書き起こし文を含むデータである。
知識データ3は、発音アクセント辞典や用字用語辞典など、単語の表記と読みの情報を含むデータであり、音声処理のための信頼できるデータである。
また、各処理部の概略は、次の通りである。
学習データセット処理部5は、学習データセット2に含まれる音声(またはその読みのデータ)と対応する書き起こし文とのアライメント処理を行なうことによって、形態素ごとの表記と読みとの組を抽出する。そして、これらの組について、標記と読みとの組み合わせの頻度をカウントすることによって、表記と読みと発生頻度との組をエントリとして有する処理済み学習データセット(頻度データ)を作成する。
知識データ処理部6は、外部から読み込む知識データ3に基づき、表記と読みとの組を信頼エントリとして保持する(処理済み知識データ)。
削除対象エントリ抽出部8は、上記の処理済み学習データセットを読み込み、閾値記憶部から閾値を読み込み、この閾値を用いて、処理済み学習データセットの中から削除対象エントリを抽出する。
辞書修正処理部9は、発音辞書データ1から、削除対象エントリ抽出部8によって抽出された削除対象エントリに対応するデータを削除して、修正発音辞書データ4を作成する。
図2は、発音辞書データ1の構成及びそのデータ例を示す概略図である。図示するように、発音辞書データ1は表記と読みとの対応関係を表わす組を有するデータであり、本実施形態では、2次元の表形式のデータとして構成されている。この図に示すデータ例では、「家」という表記が存在し、この表記「家」に対しては4種類の読み「ie」と「ka」と「ke」と「chi」が存在している。また、「宇宙」という表記が存在し、この表記「宇宙」に対しては2種類の読み「uchu:」と「sora」が存在している。ここで、読みは、ローマ字表記で表現されている。また、読み「uchu:」の中の「:」は、日本語の長音を表わしている。
知識データ処理部6は、知識データ3を読み込み、この知識データ3を基に単語の表記と読みの組を抽出し、この組を信頼エントリとする。そして、これらの信頼エントリを有する処理済み知識データを出力する。前述の通り、知識データ3は、例えば発音アクセント辞典や用字用語辞典などであり、これらに含まれる単語の表記と読みを信頼エントリとして抽出することは妥当である。
削除対象エントリ抽出部8は、まずステップS11において、処理済み学習データセット2bと、処理済み知識データ3aとを読み込み、処理済み学習データセット内をサーチし、そして、削除対象エントリ抽出部8によってまだ処理されていない表記を抽出する。
削除対象エントリ抽出部8は、次にステップS13において、当該表記において発生頻度が「0」回の読みのエントリを抽出し(つまり、第二閾値が「0」の場合、頻度が第二閾値以下の読みを抽出することと同じ)、そのようなエントリをすべて、削除対象エントリデータ2cに追加する。
次に第2の実施形態について、図面を参照しながら説明する。この第2の実施形態が前述した実施形態と異なる特徴的な点は、ある閾値(第一閾値)を用いて作成した修正発音辞書データを用いて、テストデータの発音決定を実際に行ない、既知の読みからその決定された発音の正解率を算出し、この正解率に応じて、適応的に閾値の決定を行なう点である。
本実施形態の発音辞書修正装置は、最適な結果を得るための第一閾値を適切に決めることが困難であるというさらなる課題を解決するものである。
図示するように、本実施形態による発音辞書修正装置101は、学習データセット処理部5と、知識データ処理部6と、削除対象エントリ抽出部8と、辞書修正処理部9と、テストデータ記憶部20と、発音決定部21と、正解率データ記憶部22と、閾値決定部23と、閾値記憶部27とを含んで構成される。第1の実施形態における発音辞書修正装置100と同様の構成(発音辞書データ1、学習データセット2、知識データ3、修正された発音辞書データ4、学習データセット処理部5、知識データ処理部6、削除対象エントリ抽出部8、辞書修正処理部9)についてはここでは説明を省略し、本実施形態特有の構成及び処理について以下で説明する。
発音決定部21は、辞書修正処理部9によって作成された修正された発音辞書データ4を用いて音声認識処理を行なうことにより、テストデータ記憶部20から読み出したテストデータ(音声)の読みを決定するとともに、ここで決定された読みとテストデータ記憶部20から読み出した正解の読みのデータとを比較することによって、上記決定された読みの正解率を算出する。ここでの正解率とは、例えば、両データの形態素単位での対応関係をとり、決定された読みのデータの各形態素が正解データの形態素に合っているかどうかを判断して、合っている形態素の割合を計算することによって算出する。なお、発音決定部21における音声認識処理は、既存技術を用いて行なう。
閾値決定部23は、上記の正解率のデータを正解率データ記憶部22から読み出し、この正解率に応じて、閾値(第一閾値)を決定して閾値記憶部27を書き換える。
閾値記憶部27は、現在の閾値を記憶するものであり、閾値決定部23によって書き込まれ、削除対象エントリ抽出部8によって参照される。
このフローチャートのステップS41において、閾値決定部23が、閾値(第一閾値)の初期値θ0を決定する。この初期値θ0は、例えば学習データセット2のサイズなどに応じて適宜決めればよく、例えばθ0=10000とする。決定された閾値は、閾値記憶部27に書き込まれる。
また、ここで、正解率の初期値α0を便宜的に0としておく。
ステップS42において、発音辞書修正装置101は、発音辞書データを初期状態にする。つまり、このフローチャートで示す繰り返し処理によって、前回、発音辞書データのエントリの一部が削除された状態の修正された発音辞書データ4が作成されていた場合も、このステップS42において、それらのエントリを削除する前の状態に一旦戻される。
このフローチャートに示した処理手順によれば、正解率が高くなるように、適応的に閾値を変化させているため、最終的に好適な閾値を得ることができる。
また、この処理手順によれば、正解率が低いほど閾値変化量を大きくしているため、正解率が低い領域では正解率が収束方向に向かう速さを上げることができる。また、正解率が高いほど閾値変化量を小さくしているため、正解率が収束に近付いた領域では、より良い正解率を得るために閾値を微調整することができる。
なお、この処理手順では、閾値の初期値を大きめに設定しておいて繰り返し処理に従って閾値を徐々に小さくする方向に変化させているが、逆に、閾値の初期値を小さめに設定しておいて閾値を徐々に大きくする方向に変化させても良い。
第3の実施形態は、発音辞書修正装置を音声認識処理に適用したものである。
図9は、本実施形態による音声認識システムの機能構成を示すブロック図である。図示するように、音声認識システム201は、入力文書データ51と、音響分析部52と、デコーダ部53と、認識結果データ54と、発音辞書データ1Aと、発音辞書修正装置100Aと、修正された発音辞書データ4Aとを含んで構成される。
第4の実施形態は、発音辞書修正装置を音声合成処理に適用したものである。
図10は、本実施形態による音声合成システムの機能構成を示すブロック図である。図示するように、音声合成システム202は、入力文書データ61と、テキスト解析部62と、音声合成処理部63と、合成音を表わす合成結果(データ)64と、発音辞書データ1Bと、発音辞書修正装置100Bと、修正された発音辞書データ4Bとを含んで構成される。
例えば、図2の発音辞書データや、図3の処理済み学習データセットや、図4の削除対象エントリデータは、表形式のデータとして図示し説明したが、データの形式はこれに限られず他の形式を用いてもよい。他の形式とは、例えば、オブジェクト指向データベースやXMLデータベースなどの形式である。
また、発音辞書データからエントリを削除する際に、削除対象エントリから信頼エントリを除外することとしているが、このように信頼エントリを削除対象から除外する処理は、削除対象エントリ抽出部8で行なっても良いし、辞書修正処理部9で行なってもよい。
また、削除対象エントリ抽出部8が削除対象エントリを抽出する際に用いる第二閾値は、0とすることが好適であるが、0以外の数値でもよい。また、第二閾値を、固定的な値とするのではなく、当該表記における読みの中の最大発生頻度に所定比率(例えば0.1%)を乗じたものとするなど、相対的な値としてもよい。
本発明の発明者らは、実際に大語彙発音辞書データを用いた音声認識の実験を行なった。修正前の発音辞書データには、誤りのエントリも含まれていた。そのような発音辞書データを用いて、放送番組の音声をテストデータとして入力してその発音(読み)を決定し、その正解率を算出した。また、本発明による発音辞書修正装置を用いて、発音辞書データの修正を行ない、修正された発音辞書データを用いて同テストデータの読みを決定し、その正解率を算出した。発音辞書データの修正前後での正解率を比較したところ、修正後の正解率のほうが高い結果が出て、本発明の有効性を確認できた。実験の具体例としては、約8万5千のエントリを持つ発音辞書から、本発明による発音辞書修正装置を用いて発音辞書データの修正を行うことにより、約200のエントリ(一例としては、前述した、表記が「宇宙」で読みが「sora」といったエントリ)が削除され、誤り率が0.1%削減された。つまり、発音辞書が改善された。
2 学習データセット
3 知識データ
4,4A,4B 修正された発音辞書データ(修正発音辞書データ)
5 学習データセット処理部
6 知識データ処理部
7,27 閾値記憶部
8 削除対象エントリ抽出部(削除対象エントリ抽出処理過程)
9 辞書修正処理部(辞書修正処理過程)
20 テストデータ記憶部
21 発音決定部
22 正解率データ記憶部
23 閾値決定部
51 入力文書データ
52 音響分析部
53 デコーダ部
54 認識結果データ
61 入力文書データ
62 テキスト解析部
63 音声合成処理部
64 合成結果(合成音)
100,100A,100B,101 発音辞書修正装置(辞書修正装置)
201 音声認識システム
202 音声合成システム
Claims (7)
- 第一閾値を記憶する閾値記憶部と、
表記と、読みと、当該表記および当該読みが発生する頻度である発生頻度との組をエントリとして有する頻度データを読み込み、前記閾値記憶部から前記第一閾値を読み込み、前記発生頻度が前記第一閾値以上である前記エントリが存在する前記表記に関して、その表記を有して且つ前記発生頻度が所定の第二閾値以下となるような前記エントリを、削除対象エントリとして抽出する削除対象エントリ抽出部と、
表記と読みとの組を有する発音辞書データから、前記削除対象エントリ抽出部によって抽出された前記削除対象エントリに対応するデータを削除して、修正発音辞書データを作成する辞書修正処理部と、
を具備することを特徴とする辞書修正装置。 - 請求項1に記載の辞書修正装置において、
発話された音声の書き起こし文と、前記発話された音声に対応する読みとから、形態素ごとの表記と読みとの組を抽出し、これら複数の組を基に、表記と、読みと、当該表記および当該読みが発生する頻度である発生頻度との組をエントリとして有する頻度データを作成する学習データセット処理部をさらに具備し、
前記削除対象エントリ抽出部は、前記学習データセット処理部が作成した前記頻度データを読み込んで、前記削除エントリを抽出する処理を行なう、
ことを特徴とする辞書修正装置。 - 請求項1または2に記載の辞書修正装置において、
外部から読み込む知識データに基づく、表記と読みとの組を信頼エントリとして保持する知識データ処理部をさらに具備し、
前記辞書修正処理部は、前記削除対象エントリと前記信頼エントリの両方に含まれるデータを発音辞書データからの削除対象から除外する、
ことを特徴とする辞書修正装置。 - 請求項1から3までのいずれか一項に記載の辞書修正装置において、
前記修正発音辞書データを用いてテストデータである音声の読みを決定するとともに、前記テストデータである音声に対応して与えられる正解の読みのデータを用いて、上で決定された読みの正解率を算出する発音決定部と、
前記発音決定部によって算出された前記正解率に応じて、新たな第一閾値を決定して前記閾値記憶部を書き換える閾値決定部と、
をさらに具備することを特徴とする辞書修正装置。 - 請求項1から4までのいずれか一項に記載の辞書修正装置と、
入力音声データの音響特徴量を抽出する音響分析部と、
前記辞書修正装置によって修正された修正発音辞書データを用いて、前記音響特徴量から認識結果を決定して認識結果データを出力するデコーダ部と、
を具備することを特徴とする音声認識システム。 - 請求項1から4までのいずれか一項に記載の辞書修正装置と、
前記辞書修正装置によって修正された修正発音辞書データを用いて、入力文書データから読みを決定するテキスト解析部と、
前記テキスト解析部によって決定された読みを合成音として出力する音声合成処理部と、
を具備することを特徴とする音声合成システム。 - 第一閾値を記憶する閾値記憶部を備えるコンピュータに、
表記と、読みと、当該表記および当該読みが発生する頻度である発生頻度との組をエントリとして有する頻度データを読み込み、前記閾値記憶部から前記第一閾値を読み込み、前記発生頻度が前記第一閾値以上である前記エントリが存在する前記表記に関して、その表記を有して且つ前記発生頻度が所定の第二閾値以下となるような前記エントリを、削除対象エントリとして抽出する削除対象エントリ抽出処理過程と、
表記と読みとの組を有する発音辞書データから、前記削除対象エントリ抽出過程によって抽出された前記削除対象エントリに対応するデータを削除して、修正発音辞書データを作成する辞書修正処理過程と、
の処理を実行させるコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008061037A JP4990822B2 (ja) | 2008-03-11 | 2008-03-11 | 辞書修正装置、システム、およびコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008061037A JP4990822B2 (ja) | 2008-03-11 | 2008-03-11 | 辞書修正装置、システム、およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009217006A true JP2009217006A (ja) | 2009-09-24 |
JP4990822B2 JP4990822B2 (ja) | 2012-08-01 |
Family
ID=41188929
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008061037A Active JP4990822B2 (ja) | 2008-03-11 | 2008-03-11 | 辞書修正装置、システム、およびコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4990822B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016011995A (ja) * | 2014-06-27 | 2016-01-21 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 発音辞書の拡張システム、拡張プログラム、拡張方法、該拡張方法により得られた拡張発音辞書を用いた音響モデルの学習方法、学習プログラム、および学習システム |
KR101854369B1 (ko) * | 2011-11-14 | 2018-05-04 | 에스케이텔레콤 주식회사 | 음성 인식 서비스를 제공하는 장치 및 그의 오류 발음 검출 능력 향상을 위한 음성 인식 방법 |
WO2023139769A1 (ja) * | 2022-01-21 | 2023-07-27 | ファナック株式会社 | 文法調整装置、及びコンピュータが読み取り可能な記憶媒体 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204434A (ja) * | 1996-01-24 | 1997-08-05 | Fujitsu Ltd | 音声合成装置、音声合成方法及び記録媒体 |
JPH09310137A (ja) * | 1996-05-17 | 1997-12-02 | Furukawa Electric Co Ltd:The | 熱交換器のフイン用ブレージングシート |
JP2001022374A (ja) * | 1999-07-05 | 2001-01-26 | Victor Co Of Japan Ltd | 電子番組ガイドの操作装置および電子番組ガイドの送信装置 |
JP2001195081A (ja) * | 2000-01-13 | 2001-07-19 | Toshiba Corp | 日本語ディクテーションシステム |
JP2002041081A (ja) * | 2000-07-28 | 2002-02-08 | Sharp Corp | 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体 |
JP2002341892A (ja) * | 2001-05-16 | 2002-11-29 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2005077438A (ja) * | 2003-08-29 | 2005-03-24 | Toshiba Corp | 認識辞書編集装置、認識辞書編集方法、及びプログラム |
JP2007213005A (ja) * | 2006-01-10 | 2007-08-23 | Nissan Motor Co Ltd | 認識辞書システムおよびその更新方法 |
JP2007310137A (ja) * | 2006-05-18 | 2007-11-29 | Fujitsu Ltd | 音声認識装置および音声認識プログラム |
JP2008046538A (ja) * | 2006-08-21 | 2008-02-28 | Internatl Business Mach Corp <Ibm> | テキスト音声合成を支援するシステム |
-
2008
- 2008-03-11 JP JP2008061037A patent/JP4990822B2/ja active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09204434A (ja) * | 1996-01-24 | 1997-08-05 | Fujitsu Ltd | 音声合成装置、音声合成方法及び記録媒体 |
JPH09310137A (ja) * | 1996-05-17 | 1997-12-02 | Furukawa Electric Co Ltd:The | 熱交換器のフイン用ブレージングシート |
JP2001022374A (ja) * | 1999-07-05 | 2001-01-26 | Victor Co Of Japan Ltd | 電子番組ガイドの操作装置および電子番組ガイドの送信装置 |
JP2001195081A (ja) * | 2000-01-13 | 2001-07-19 | Toshiba Corp | 日本語ディクテーションシステム |
JP2002041081A (ja) * | 2000-07-28 | 2002-02-08 | Sharp Corp | 音声認識用辞書作成装置および音声認識用辞書作成方法、音声認識装置、携帯端末器、並びに、プログラム記録媒体 |
JP2002341892A (ja) * | 2001-05-16 | 2002-11-29 | Matsushita Electric Ind Co Ltd | 音声認識装置 |
JP2005077438A (ja) * | 2003-08-29 | 2005-03-24 | Toshiba Corp | 認識辞書編集装置、認識辞書編集方法、及びプログラム |
JP2007213005A (ja) * | 2006-01-10 | 2007-08-23 | Nissan Motor Co Ltd | 認識辞書システムおよびその更新方法 |
JP2007310137A (ja) * | 2006-05-18 | 2007-11-29 | Fujitsu Ltd | 音声認識装置および音声認識プログラム |
JP2008046538A (ja) * | 2006-08-21 | 2008-02-28 | Internatl Business Mach Corp <Ibm> | テキスト音声合成を支援するシステム |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101854369B1 (ko) * | 2011-11-14 | 2018-05-04 | 에스케이텔레콤 주식회사 | 음성 인식 서비스를 제공하는 장치 및 그의 오류 발음 검출 능력 향상을 위한 음성 인식 방법 |
JP2016011995A (ja) * | 2014-06-27 | 2016-01-21 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 発音辞書の拡張システム、拡張プログラム、拡張方法、該拡張方法により得られた拡張発音辞書を用いた音響モデルの学習方法、学習プログラム、および学習システム |
WO2023139769A1 (ja) * | 2022-01-21 | 2023-07-27 | ファナック株式会社 | 文法調整装置、及びコンピュータが読み取り可能な記憶媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP4990822B2 (ja) | 2012-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3782943B2 (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
JP3232289B2 (ja) | 記号挿入装置およびその方法 | |
US8311825B2 (en) | Automatic speech recognition method and apparatus | |
US6801891B2 (en) | Speech processing system | |
JP5932869B2 (ja) | N−gram言語モデルの教師無し学習方法、学習装置、および学習プログラム | |
US8849668B2 (en) | Speech recognition apparatus and method | |
JP2003195889A (ja) | 言語モデルと共に使用されるクラスエンティティディクショナリを適応させるための方法および装置 | |
JP2020042257A (ja) | 音声認識方法及び装置 | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
US11869491B2 (en) | Abstract generation device, method, program, and recording medium | |
JP2018004947A (ja) | テキスト補正装置、テキスト補正方法、およびプログラム | |
JP4990822B2 (ja) | 辞書修正装置、システム、およびコンピュータプログラム | |
JP6300394B2 (ja) | 誤り修正モデル学習装置、及びプログラム | |
JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
CN112259084A (zh) | 语音识别方法、装置和存储介质 | |
JP2008241970A (ja) | 話者適応装置、話者適応方法及び話者適応プログラム | |
KR20200102309A (ko) | 단어 유사도를 이용한 음성 인식 시스템 및 그 방법 | |
KR102299269B1 (ko) | 음성 및 스크립트를 정렬하여 음성 데이터베이스를 구축하는 방법 및 장치 | |
JP4808764B2 (ja) | 音声認識システムおよび方法 | |
Davel et al. | Efficient generation of pronunciation dictionaries: machine learning factors during bootstrapping | |
JP6086714B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
JP2006018028A (ja) | 対話方法、対話装置、音声対話装置、対話プログラム、音声対話プログラム及び記録媒体 | |
WO2007083496A1 (ja) | 音声認識用言語モデル作成用のシステム、方法およびプログラムならびに音声認識システム | |
JP4981076B2 (ja) | 発音辞書修正装置、音声認識装置、およびコンピュータプログラム | |
US20220115003A1 (en) | Systems and methods for aligning a reference sequence of symbols with hypothesis requiring reduced processing and memory |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100310 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110714 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110726 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110922 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20111122 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120118 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120403 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120502 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4990822 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150511 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |