JP6193726B2 - 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 - Google Patents

音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 Download PDF

Info

Publication number
JP6193726B2
JP6193726B2 JP2013226121A JP2013226121A JP6193726B2 JP 6193726 B2 JP6193726 B2 JP 6193726B2 JP 2013226121 A JP2013226121 A JP 2013226121A JP 2013226121 A JP2013226121 A JP 2013226121A JP 6193726 B2 JP6193726 B2 JP 6193726B2
Authority
JP
Japan
Prior art keywords
wfst
unigram
common
stage
speech recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013226121A
Other languages
English (en)
Other versions
JP2015087556A (ja
Inventor
山口 義和
義和 山口
祥子 山畠
祥子 山畠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2013226121A priority Critical patent/JP6193726B2/ja
Publication of JP2015087556A publication Critical patent/JP2015087556A/ja
Application granted granted Critical
Publication of JP6193726B2 publication Critical patent/JP6193726B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

この発明は、複数種類の音響モデル及び言語モデルを用いた重み付有限状態トランスデューサ(以下、WFSTと称する)を作成する音声認識用WFST作成装置と、音声認識装置と、それらの方法とプログラムと記録媒体に関する。
WFSTを用いた音声認識は、音響モデルや辞書、言語モデルなど音声認識に必要な情報を統合したWFSTに変換し、入力である音声認識対象音声を、WFSTを探索空間と見たててデコードし、音声認識結果文字列に変換する手法である。WFSTを用いた音声認識については、例えば特許文献1や2に開示されている。
特許第5175325号公報 特許第4478088号公報
様々な話者、環境、話題を対象とした音声認識サービスで認識精度の高いWFSTを用いた音声認識で実現するためには、複数の音響モデルと複数の言語モデルを同時に利用する必要がある。同時に利用する音響モデルと言語モデルの数が増えるとWFSTサイズが増大し、音声認識処理に要するメモリが膨大になる課題がある。
この発明は、このような課題に鑑みてなされたものであり、複数の音声認識サービスに対応する場合でもメモリサイズの増加を少なくしたWFSTを作成できる音声認識用WFST作成装置と、音声認識装置と、それらの方法とプログラムと記録媒体を提供することを目的とする。
この発明の音声認識用WFST作成装置は、共通ユニグラムWFST作成部と、共通ユニグラムWFST記憶部と、第1段WFST作成部と、第2段WFST作成部と、を具備する。共通ユニグラムWFST作成部は、複数の言語モデルからそれぞれの単語の出現頻度を読み込んで共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する。共通ユニグラムWFST記憶部は、共通ユニグラム値と共通ユニグラムWFSTを記憶する。第1段WFST作成部は、N個(N≧1)の音響モデルのWFSTとトライフォンWFSTと辞書WFSTと共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する。第2段WFST作成部は、共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する。
また、この発明の音声認識装置は、上記音声認識用WFST作成装置で作成した第1段WFSTを記憶した第1段WFST記憶部と、第2段WFSTを記憶した第2段WFST記憶部と、音声認識部と、を具備する。音声認識部は、第1段WFST記憶部と第2段WFST記憶部を参照して多段on-the-fly合成による音声認識を実行する。
本発明の音声認識用WFST作成装置によれば、複数の言語モデルからそれぞれの単語の出現頻度を読み込んで共通ユニグラム値を計算して共通ユニグラムWFSTを作成する。そして、複数の音響モデルの各音響モデルごとに共通ユニグラムで共有化した第1段WFSTを構成するので、第1段WFSTのメモリサイズを抑制することができる。また、この発明の音声認識装置は、上記した音声認識用WFST作成装置で作成した第1段WFSTと第2段WFSTを用いて音声認識を行うので、複数の音声認識サービスに対応する場合でも、少ないメモリ量で高精度な音声認識を可能にする。
この発明の音声認識用WFST作成装置100の機能構成例を示す図。 音声認識用WFST作成装置100の動作フローを示す図。 単語wの共通ユニグラムWFSTを示す図。 第1段WFSTの例を示す図。 この発明の音声認識装置200の機能構成例を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
図1に、この発明の音声認識用WFST作成装置100の機能構成例を示す。その動作フローを図2に示す。音声認識用WFST作成装置100は、共通ユニグラムWFST作成部11と、共通ユニグラムWFST記憶部12と、第1段WFST作成部16と、第2段WFST作成部17と、を具備する。音声認識用WFST作成装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現される。
共通ユニグラムWFST作成部11は、複数の言語モデル10,10,…,10からそれぞれの単語の出現頻度を読み込んで共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する。言語モデル10は例えばスポーツ分野の言語モデル、言語モデル10は例えば芸能分野の言語モデル、言語モデル10は例えば政治分野の言語モデルである。このように複数の分野ごとに言語モデルが用意されている。なお、各言語モデルには単語(ユニグラムのみで良い)の出現頻度情報も含むものとする。
言語モデル10(1≦*≦N)における単語wの共通ユニグラム値(出現確率)Pc(w)は次式で計算される。
Figure 0006193726
ここでC(w)は言語モデル10における単語wの出現頻度、Wは全ての言語モデルに含まれる単語数である。共通ユニグラムWFST作成部11は、全ての単語wについて共通ユニグラム値(式(1))を計算して求め、共通ユニグラムモデルを形成する。共通ユニグラムモデルとは、全ての単語wを含む共通ユニグラム値の集合(例えば、ファイル)のことである。
図3に、共通ユニグラムWFSTを示す。共通ユニグラムWFSTは3つのノード(node)で構成され、各ノードには状態番号が記される。初期状態は状態0とする。二重線で囲まれた状態2は終了状態を表す。アークは状態遷移を表す。状態0から状態1へ遷移するアークに併記されている<s>は文頭を表す。状態1から出て状態1に戻るアークが、単語wの入力に対して単語wを共通ユニグラム値で表される出現確率で出力されることを表している。このアークが単語数分作成される。状態1から状態2へのアークに併記されている</s>は文末を表す。共通ユニグラムWFSTは、共通ユニグラムWFST記憶部12に記憶される。
第1段WFST作成部16は、M個(M≧1)の音響モデル13,13,…13と、トライフォンWFST14と、辞書WFST15と、共通ユニグラム作成部11で作成した共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを求め、その音響モデルごとのWFSTを全て結合させて第1段WFSTを作成する(ステップS16)。
合成演算した音響モデル13(1≦*≦M)ごとのWFSTを次式に示す。
Figure 0006193726
ここでoptはWFSTの最適化演算、○はWFSTの合成演算を表す。Hは各音響モデルのWFSTである。CはトライフォンWFSTであり、音響モデルWFSTが出力するトライフォンを音素に変換するWFSTである。Lは音素を単語に変換する辞書WFSTである。Gcは共通ユニグラムWFSTである。WFSTの合成・最適化方法は、例えば参考文献1(堀貴明,塚田元,「重み付き有限状態トランスデューサによる音声認識」情報処理,2004年10月15日,第45巻10号)に記載されているように周知である。
第1段WFST作成部16は、合成・最適化した音響モデルごとのWFST(HCLGc)を、全て結合して第1段WFSTを構成する。図4に、第1段WFSTの例を示す。図4を参照して、第1段WFST作成部13の動作を説明する。
第1段WFST作成部13は、状態s1(初期状態)と状態s2を作成する。次に入力シンボルと出力シンボルが共にε(空)で、状態s1から音響モデル1を含むHCLGcの初期状態へ接続する遷移を作成する。同様に全ての音響モデルに対応するHCLGc,…,HCLGcについても状態s1からの遷移を作成する。次に入力シンボルと出力シンボルが共にεで、全てのHCLGc〜HCLGcのそれぞれの終了状態から状態s2へ接続する遷移を作成して1つの第1段WFSTを構成する。
このように第1段WFSTは、音響モデルごとのWFST(HCLGc)が並列に結合されて構成される。第1段WFSTは、第1段WFST作成部16から外部に出力される。若しくは第1段WFST記憶部19に記憶するようにしても良い。
第2段WFST作成部17は、共通ユニグラム値Pc(w)を入力として、複数の言語モデル10,10,…10を参照して各言語モデルごとのnグラム確率に対して共通ユニグラム値Pc(w)を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記nグラム確率のWFSTを並列に結合した第2段WFSTを作成する(ステップS17)。共通ユニグラム値Pc(w)を除去した各言語モデルごとのnグラム確率Pc(w|uv)(u,v,wは単語)は、次式で計算できる。
Figure 0006193726
第2段WFST作成部17は、全ての言語モデルについて、共通ユニグラム値Pc(w)を除去した各言語モデルごとのnグラム確率P(w|uv)から、言語モデルごとのWFSTを作成する。そして、その各言語モデルごとのWFSTを並列に結合して第2段WFSTを構成する。第2段WFSTは、式(3)から明らかなようにトライグラム確率P(w|uv)から、共通ユニグラム値Pc(w)を除去したnグラム確率に基づくWFSTである。
各言語モデルごとのWFSTを並列に結合して第2段WFSTを構成する方法は、図4を参照して説明した第1段WFSTと同じである。作成された第2段WFSTは外部に出力される。若しくは第2段WFST記憶部20に記憶するようにしても良い。
以上説明した共通ユニグラム作成部11と第1段WFST作成部16と第2段WFST作成部17の処理は、全ての音響モデルと言語モデルについての処理が終了するまで繰り返される(ステップS18のNo)。このステップS11とステップS16とステップS17の時系列動作の制御と動作終了の制御は制御部18が行う。この制御部18の機能は、この実施例の特別な技術的特徴では無く一般的なものである。
以上説明した音声認識用WFST作成装置100は、共通ユニグラムWFST(Gc)を用いることで第1段WFSTのサイズを大きく削減することができる。具体的には、第1段WFSTの数をN−1個削減することができる。
なお、共通ユニグラム作成部11では、言語モデルごとの単語wの出現頻度を数えて共通ユニグラム値を計算して求める例を説明したが、単語wの出現頻度を利用しないで共通ユニグラム値を求めるようにしても良い。その場合は、言語モデルがそもそも持っている単語wのユニグラム確率P(w)を用いて共通ユニグラム値Pc(w)を次式で計算する。
Figure 0006193726
共通ユニグラム値Pc(w)を求めた後の第1段WFSTを作成する方法は、上記したものと同じである。ユニグラム確率P(w)は、各言語モデルにおいて既知の値であるので、単語wの出現頻度を別途準備する必要が無い。
なお、以上の説明は、全ての言語モデル10に含まれる単語は共通しておなじである前提で行って来た。各言語モデル10に含まれる単語は異なっていても良い。言語モデル10に含まれる単語が異なる場合は、辞書WFST15に言語モデル10に含まれる全ての単語を登録しておき、その全ての単語に対して式(1)若しくは式(4)により算出した共通ユニグラム値Pc(w)を求めれば良い。その後の第1段WFSTを作成する方法は、上記した方法と同じである。
〔音声認識装置〕
図5に、この発明の音声認識装置200の機能構成例を示す。音声認識装置200は、上記した音声認識用WFST作成装置100で作成した第1段WFSTを記憶した第1段WFST記憶部19と、第2段WFSTを記憶した第2段WFST記憶部20と、音声認識部210とを具備する。
音声認識部210は、第1段WFST記憶部19と第2段WFST記憶部20に記憶された第1段WFSTと第2段WFSTを用いて多段on-the-fly合成による音声認識を実行する。音声認識部210は、共通ユニグラムWFST(Gc)を用いることでサイズを縮小した第1段WFSTと、共通ユニグラムを、トライグラムに変換する第2段WFSTを探索して音声認識処理を行うので、少ないメモリサイズでも精度の良い音声認識処理を行うことができる。多段on-the-fly音声認識については参考文献2(Takaaki Hori,Atsushi Nakamura “Generalized Fast On-the-fly Composition Algorithm fot WFST-Based Speech Recognition”,Proc. Of INTERSPEECH 2005.)に記載されているように周知である。
本発明の音声認識用WFST作成装置100は、複数の音響モデルのそれぞれに対応したWFSTを、共有ユニグラムで共有化したWFSTを第1段WFSTとするので、音響モデルごとに作成する第1段WFSTのサイズを抑制することが出来る。また、本発明の音声認識装置200は、この発明の音声認識用WFST作成装置100で作成した第1段WFSTと第2段WFSTを用いて多段on-the-fly音声認識を行うので、小さなメモリサイズでも高精度な音声認識を行うことが可能である。
上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1. 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語の出現頻度の総和と全言語モデルにおける全単語の出現頻度の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成部と、
    上記共通ユニグラム値と上記共通ユニグラムWFSTを記憶する共通ユニグラムWFST記憶部と、
    N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成部と、
    上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成部と、
    を具備する音声認識用WFST作成装置。
  2. 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語のユニグラム確率の総和と全言語モデルにおける全単語のユニグラム確率の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成部と、
    上記共通ユニグラム値と上記共通ユニグラムWFSTを記憶する共通ユニグラムWFST記憶部と、
    N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成部と、
    上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成部と、
    を具備する音声認識用WFST作成装置。
  3. 請求項1又は2に記載した音声認識用WFST作成装置で作成した第1段WFSTを記憶した第1段WFST記憶部と、第2段WFSTを記憶した第2段WFST記憶部と、
    上記第1段WFST記憶部と上記第2段WFST記憶部を参照して多段on-the-fly合成による音声認識を実行する音声認識部と、
    を具備する音声認識装置。
  4. 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語の出現頻度の総和と全言語モデルにおける全単語の出現頻度の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成過程と、
    N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成過程と、
    上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成過程と、
    を備える音声認識用WFST作成方法。
  5. 複数の言語モデルに含まれる各単語について全言語モデルにおける当該単語のユニグラム確率の総和と全言語モデルにおける全単語のユニグラム確率の総和の比である共通ユニグラム値を計算し、当該共通ユニグラム値から共通ユニグラムWFSTを作成し、当該共通ユニグラム値と上記共通ユニグラムWFSTを出力する共通ユニグラムWFST作成過程と、
    N個(N≧1)の音響モデルについて各音響モデルのWFSTとトライフォンWFSTと辞書WFSTと上記共通ユニグラムWFSTとを合成演算した音響モデルごとのWFSTを作成し、全ての上記音響モデルごとのWFSTを結合させて第1段WFSTを構成する第1段WFST作成過程と、
    上記共通ユニグラム値を入力として、複数の言語モデルのそれぞれを参照して各言語モデルごとのnグラム確率に対して上記共通ユニグラム値を除去したnグラム確率を算出して当該nグラム確率のWFSTを作成し、全ての言語モデルの上記各言語モデルのnグラム確率のWFSTを結合させて第2段WFSTを構成する第2段WFST作成過程と、
    を具備する音声認識用WFST作成方法。
  6. 請求項4又は5に記載した音声認識用WFST作成方法で作成した第1段WFSTと第2段WFSTを用いて多段on-the-fly合成による音声認識を実行する音声認識過程を、
    含む音声認識方法。
  7. 請求項1又は2に記載した音声認識用WFST作成装置、請求項3に記載した音声認識装置、の何れかの装置の各部の機能を、コンピュータに実行させるためのプログラム。
  8. 請求項7記載した何れかのプログラムを記録したコンピュータで読み取り可能な記録媒体。
JP2013226121A 2013-10-31 2013-10-31 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体 Expired - Fee Related JP6193726B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013226121A JP6193726B2 (ja) 2013-10-31 2013-10-31 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013226121A JP6193726B2 (ja) 2013-10-31 2013-10-31 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体

Publications (2)

Publication Number Publication Date
JP2015087556A JP2015087556A (ja) 2015-05-07
JP6193726B2 true JP6193726B2 (ja) 2017-09-06

Family

ID=53050410

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013226121A Expired - Fee Related JP6193726B2 (ja) 2013-10-31 2013-10-31 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体

Country Status (1)

Country Link
JP (1) JP6193726B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106683677B (zh) 2015-11-06 2021-11-12 阿里巴巴集团控股有限公司 语音识别方法及装置
CN106356054A (zh) * 2016-11-23 2017-01-25 广西大学 一种基于语音识别的农产品信息采集方法和系统
CN113011198B (zh) * 2021-03-05 2022-07-22 北京嘀嘀无限科技发展有限公司 一种信息交互方法、装置及电子设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4956334B2 (ja) * 2007-08-29 2012-06-20 株式会社東芝 オートマトンの決定化方法、有限状態トランスデューサの決定化方法、オートマトン決定化装置及び決定化プログラム
JP5888729B2 (ja) * 2012-01-10 2016-03-22 国立研究開発法人情報通信研究機構 言語モデル結合装置、言語処理装置、およびプログラム
JP6095588B2 (ja) * 2013-06-03 2017-03-15 日本電信電話株式会社 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム

Also Published As

Publication number Publication date
JP2015087556A (ja) 2015-05-07

Similar Documents

Publication Publication Date Title
JP5377889B2 (ja) 言語処理装置およびプログラム
WO2017213055A1 (ja) 音声認識装置及びコンピュータプログラム
JP6614639B2 (ja) 音声認識装置及びコンピュータプログラム
CN107705787A (zh) 一种语音识别方法及装置
JPH0772840B2 (ja) 音声モデルの構成方法、音声認識方法、音声認識装置及び音声モデルの訓練方法
JP2010540976A (ja) 自動音声認識の方法および装置
JP2006243728A (ja) 音素をテキストに変換する方法、そのコンピュータシステム、及びコンピュータプログラム
KR20220062349A (ko) 디코딩 네트워크 구축 방법, 음성 인식 방법, 디바이스 및 장치, 및 저장 매체
JP4930379B2 (ja) 類似文検索方法、類似文検索システム及び類似文検索用プログラム
JP6095588B2 (ja) 音声認識用wfst作成装置、音声認識装置、音声認識用wfst作成方法、音声認識方法及びプログラム
JP5249967B2 (ja) 音声認識装置、重みベクトル学習装置、音声認識方法、重みベクトル学習方法、プログラム
JP2017009842A (ja) 音声認識結果出力装置、音声認識結果出力方法及び音声認識結果出力プログラム
JP6193726B2 (ja) 音声認識用wfst作成装置と音声認識装置とそれらの方法とプログラムと記録媒体
KR20120052591A (ko) 연속어 음성인식 시스템에서 오류수정 장치 및 방법
JP6301794B2 (ja) オートマトン変形装置、オートマトン変形方法およびプログラム
JP5875569B2 (ja) 音声認識装置とその方法とプログラムとその記録媒体
JP6078435B2 (ja) 記号列変換方法、音声認識方法、それらの装置及びプログラム
JP6558856B2 (ja) 形態素解析装置、モデル学習装置、及びプログラム
JP5881157B2 (ja) 情報処理装置、およびプログラム
JP4478088B2 (ja) 記号列変換方法、音声認識方法、記号列変換装置とプログラム、記録媒体
JP3950957B2 (ja) 言語処理装置および方法
JP4733436B2 (ja) 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体
JP6167063B2 (ja) 発話リズム変換行列生成装置、発話リズム変換装置、発話リズム変換行列生成方法、及びそのプログラム
Pilar Knowledge-driven subword grammar modeling for automatic speech recognition in tamil and kannada
JP6277659B2 (ja) 音声認識装置および音声認識方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170330

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170808

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170810

R150 Certificate of patent or registration of utility model

Ref document number: 6193726

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees