JP5274191B2 - 音声認識装置 - Google Patents

音声認識装置 Download PDF

Info

Publication number
JP5274191B2
JP5274191B2 JP2008259708A JP2008259708A JP5274191B2 JP 5274191 B2 JP5274191 B2 JP 5274191B2 JP 2008259708 A JP2008259708 A JP 2008259708A JP 2008259708 A JP2008259708 A JP 2008259708A JP 5274191 B2 JP5274191 B2 JP 5274191B2
Authority
JP
Japan
Prior art keywords
recognition
language model
result
statistical language
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008259708A
Other languages
English (en)
Other versions
JP2010091675A (ja
Inventor
利行 花沢
洋平 岡登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2008259708A priority Critical patent/JP5274191B2/ja
Publication of JP2010091675A publication Critical patent/JP2010091675A/ja
Application granted granted Critical
Publication of JP5274191B2 publication Critical patent/JP5274191B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は複数個の音声認識手段の各々を異なる型式の言語モデルを用い、同じ入力音声に対して音声認識動作させ、各音声認識手段から得られた認識結果から最適な認識結果を選択して出力する音声認識装置に関するものである。
より広い範囲の話題やタスクを認識対象とするためには、認識対象語彙と語彙間の接続情報を記述した言語モデルが大きなものとなり、認識率が低下するという課題があった。認識率改善の方策として、言語モデルを話題やタスクごとに分類した複数個の言語モデルを作成しておき、それぞれの言語モデルごとに認識器を並列に動作させて音声認識を行う方法が開発されている。このような従来技術の一例として「磯部、伊藤、武田“複数の認識器を選択的に用いる音声認識システムのためのスコア補正法”、電子情報通信学会論文誌D, 2007、Vol.J90-D, No.7, pp1773-1780」がある。
図13は前記従来技術の音声認識装置の一構成例を示すブロック図である。図中の14〜16が複数個の認識器であり、各認識器14〜16で使用する統計言語モデルは、例えば認識対象とするタスクの話題ごとに大量に収集した学習データを用い、例えば単語単位のトライグラムを言語モデルとして事前に学習しておく。
次にこの従来技術の音声認識装置の認識動作について説明する。音声の入力端1から音声2を入力すると音響分析手段3は音響分析を行い、音声2を特徴ベクトルの時系列4に変換して出力する。認識器14〜16は特徴ベクトルの時系列4を入力とし、例えばビタビアルゴリズムによってパターンマッチングを行い、各認識器ごとに認識スコアが最大となる単語列Wiと認識スコアSi(i=1,2,…N, Nは認識器の個数)を出力する。結果選択手段7は、前記認識スコアSiを各認識器で用いている言語モデルのバイグラムエントロピを用いて補正したスコアを算出し、前記補正した認識スコアが最大となる認識器の出力結果を認識結果12として出力する。
磯部、伊藤、武田"複数の認識器を選択的に用いる音声認識システムのためのスコア補正法"、電子情報通信学会論文誌D、2007、Vol.J90-D, No.7、pp1773-1780
前記従来技術では、各認識器で用いる言語モデルは全て統計言語モデルであり、単語間の接続に確率情報を使用しない構文規則型の言語モデルを用いた認識器とのスコア比較は容易ではないという課題があった。
この発明は上記課題を解決するためになされたもので、単語間の接続に確率情報を使用しない構文規則型の言語モデルと、単語トライグラム言語モデルのように言語尤度の算出基準が異なる複数個の言語モデルを用いて得られた複数個の認識結果から、最も適切な認識結果を選択し認識性能を改善した音声認識装置を得ることを目的とする。
この発明に係る音声認識装置は、
入力音声の音声認識手段として構文規則型の言語モデルを用いる構文規則型認識手段と、
同じく入力音声の音声認識手段として統計言語モデルを用いる統計言語モデル型認識手段と、
同じ入力音声に対し前記両音声認識手段が音声認識した認識結果の単語列と認識スコアを入力し、統計言語モデル型認識手段の認識結果について、その表記、あるいは表記の上位概念である品詞またはクラスの系列が、前記統計言語モデル作成時に使用する学習データから抽出された学習例文中に存在するか否かにより言語的妥当性を評価し、その評価結果に基づいて前記入力された統計言語モデル型認識手段の認識結果の認識スコアを修正し、この修正された認識スコアと前記構文規則型認識手段の認識結果の認識スコアを比較し、前記両音声認識手段の何れかの認識結果を選択する結果選択手段を備える。
この発明に係る音声認識装置によれば、入力音声の音声認識手段に異なる型式の言語モデルを用い、結果選択手段がその各認識結果の表記の言語的妥当性を評価して、異なる型式の言語モデルによる音声認識手段から出力される認識スコアを修正し、修正結果に基き認識結果を選択する構成にされるので、音声認識結果の認識精度が向上し、また異なる形式の言語モデルによる音声認識手段の認識結果の比較が同じ性質のスコアで行なえ、言語的に不自然な結果の選択を抑制できる。
実施の形態1.
本実施の形態では、カーナビゲーションシステム向けの音声認識を例にとり説明する。カーナビゲーションシステムでは「東京都千代田区丸の内」など住所発話のような定型発話と、「画面3次元表示」、「地図を立体表示に切り替え」など、比較的非定型なナビゲーション操作コマンドが音声認識対象となることが考えられる。そこで本実施の形態では音声認識手段として、構文規則型の言語モデルを用いる構文規則型認識手段と、統計言語モデルを用いる統計言語モデル型認識手段の2つを備えるものとする。
そして構文規則型認識では住所を認識対象、統計言語モデル型認識ではナビゲーションの画面表示切替やオーディオ、ラジオの操作等、カーナビゲーションシステムを制御するコマンドを認識対象とすることとして説明する。
図1はこの発明による音声認識装置の実施の形態1の構成を示すブロック図である。
同図において、1は音声の入力端、2は入力音声、3は音響分析手段、4は特徴ベクトルの時系列、5は統計言語モデル型認識手段、6は構文規則型認識手段、7は結果選択手段、8は統計言語モデル、9は構文規則、10は学習例文、11は音響モデル、12は認識結果である。
統計言語モデル8は、カーナビゲーションシステムを音声で操作する発話文を大量に収集した学習データを用い、例えば単語を単位としたトライグラム確率を算出し、単語トライグラムの単語列とのペアからなるデータである。言語モデルの内容例を図2に示す。
構文規則9は単語間の接続規則を記述した構文規則である。住所を認識対象とした場合の構文規則の例を図3に示す。この構文規則では単語間の接続に対して確率値は付与しないものとする。
学習例文10は、前記統計言語モデル8の作成時に使用する学習データから、異なり文(すなわち同一文は1文のみ)を抽出したテキストデータである。学習例文10の内容例を図4に示す。
音響モデル11は音声の特徴をモデル化したデータであり、本実施の形態では音響モデルは例えばHMM(Hidden Markov Model)とする。
次に音声認識の動作について説明する。
音声の入力端1から音声2を入力すると音響分析手段3は音響分析を行い、音声2を特徴ベクトルの時系列4に変換して出力する。前記特徴ベクトルは例えばLPC(Linear Predictive Coding)ケプストラムとする。
統計言語モデル型認識手段5は特徴ベクトルの時系列4を入力とし、統計言語モデル8を用い、例えばビタビアルゴリズムによって音響モデル11とのパターンマッチングを行い、認識スコアStが最大となる単語列Wt=w1 ,w2 ,w3 ,…wI、(Iは単語数)と、前記単語列Wtに対する音響尤度LAt、および言語尤度Ltを出力する。ここで添字tは統計言語モデル型認識の結果であることを示す記号である。なお前記認識スコアStは、(1)式に示すとおり前記音響尤度LAtと言語尤度Ltの和である。前記言語尤度Ltは、(2)式に示すとおり、前記単語列の表記Wtに対するトライグラム確率の対数値なので0以下の値である。
Figure 0005274191
また構文規則型認識手段6は、統計言語モデル型認識手段5への入力と同一の特徴ベクトルの時系列4を入力とし、構文規則9の記述にしたがって単語を連結しながら、例えばビタビアルゴリズムによって音響モデル11とのパターンマッチングを行い認識スコアSkが最大となる単語列Wkを求める。そして前記単語列Wkと認識スコアSkを出力する。ここで添字kは構文規則型認識の結果であることを示す記号である。なお本実施の形態では構文規則型認識手段6では統計言語モデルを用いていないため、言語尤度は常に0であり、前記認識スコアSkは、前記音響尤度LAkと同一値である。すなわち Sk = LAk である。
次に結果選択手段7は統計言語モデル型認識手段5から認識結果である単語列の表記Wt、音響尤度LAt、言語尤度Ltを入力とする。また構文規則型認識手段6の結果である単語列の表記Wkと認識スコアSkを入力とし、以下の手順に従って統計言語モデル型認識または構文規則型認識の結果を選択し、認識結果として出力する。図5を参照しながら結果選択手段7の選択手順を説明する。
(手順1)統計言語モデル型認識手段5による統計言語モデル型認識の認識結果Wtと同一の単語列が学習例文10中に存在するか否かを調べ(図5のST101)、存在する場合は統計言語モデル型認識の結果は言語的に自然であるとみなし、言語尤度の重み係数cを0にする(図5のST102)。
例えば認識結果がWt=「地図,を,拡大,表示」である場合、前記単語列は図4に示すとおり、学習例文10中に存在するため、言語尤度の重み係数は0になる。
一方存在しない場合は統計言語モデル型認識の結果は言語的に不自然である可能性があるため、言語スコアの重み係数を実験的に定めた定数αにする(図5のST103)。
上記のとおり設定した言語重み係数c(c=α)を用い(3)式によって統計言語モデル型認識の認識スコアを再計算する(図5のST104)。
Figure 0005274191
(手順2)上記手順1で再計算した統計言語モデル型認識のスコアSt'を、構文規則型認識のスコアSkと比較し、スコアの高いほうを認識結果として選択する(図5のST105,ST106,ST107)。
上記選択手順により、統計言語モデル型認識の結果が学習例文10中に存在する場合には、構文規則型認識とは音響スコア同士の比較となるため、統計言語モデル型認識の結果が選択されにくくなるという問題が解消できる。また存在しない場合は言語尤度α* Ltをペナルティとして加えるため、言語的に不自然な統計言語モデル型認識の結果が選択されるのを抑制することができる。
なお、本実施の形態では構文規則型認識手段6では統計言語モデルを用いていなかったが、任意の言語モデルを使用してもよい。例えば図6に示すように単語間に遷移確率を付与するような言語モデルを用いることができる。言語モデルを使用する場合は、前記認識スコアSkは言語尤度Lkを含んだものになる。例えば認識結果が「(無音)、東京都、千代田区、丸の内」であった場合、図6を参照すると言語尤度Lkは(4)式のようになる。
Figure 0005274191
このように言語モデルを用いた場合は、結果選択手段7に出力する際に言語尤度を差し引いた音響尤度のみのスコア、すなわちSk-Lk= LAkを認識スコアとして出力すればよい。
実施の形態2.
本実施の形態は前記実施の形態1に、単語カテゴリ変換テーブル13を新たに付加したものである。本実施の形態による音声認識装置の構成例を図7に示す。また単語カテゴリ変換テーブル13の内容例を図8に示す。単語カテゴリ変換テーブル13には単語の表記とカテゴリ名がペアで記述されている。
本実施の形態では前記実施の形態1に比べ、動作を以下のように変更する。
まず認識処理の開始する前に事前に、単語カテゴリ変換テーブル13を参照し、学習例文10の内容を単語から施設名や放送局名等のカテゴリに変換しておく。図4に示した学習例文10の内容の変換例を図9に示す。本実施の形態では単語カテゴリ変換テーブル13において「駐車場」のカテゴリが「施設」として登録されているので、元の例文「近くの駐車場までの経路を設定」が「近くの<施設>までの経路を設定」に変換されている。ここで<>はカテゴリに変換したことを示す記号である。
統計言語モデル8と構文規則9は、実施の形態1と同様に、認識処理の事前に作成しておく。
次に認識動作について説明する。音声の入力端1から音声2を入力すると、音響分析手段3、統計言語モデル型認識手段5、および構文規則型認識手段6は実施の形態1と同一の動作をする。すなわち統計言語モデル型認識手段5は認識スコアStが最大となる単語列Wt=w 1 ,w 2 ,w 3 ,…W I、(Iは単語数)と、前記単語列Wtに対する音響尤度LAt、および言語尤度Ltを出力する。また構文規則型認識手段6は音響尤度LAkが最大となる単語列Wkと、認識スコアSkを出力する。
次に結果選択手段7は統計言語モデル型認識手段5から認識結果である単語列の表記Wt、音響尤度LAt、言語尤度Ltを入力とし、また構文規則型認識手段6の結果である単語列の表記Wkと認識スコアSkを入力とし、実施の形態1と同様の方法で認識結果を選択する。
但し本実施の形態では、結果選択手段7は、まず統計言語モデル型認識手段5からの出力結果である前記単語列Wt中の各単語が単語カテゴリ変換テーブル13中に存在するか調べ、存在する場合には単語をカテゴリに変換する。その後、統計言語モデル型認識の認識結果Wtと同一の単語列が学習例文10中に存在するか否かを調べる。例えば、認識結果Wtが「近くの,レストラン,までの,経路,を,設定」であった場合、単語カテゴリ変換テーブル13中に「レストラン」のカテゴリが「施設」として登録されているので、認識結果Wtを「近くの,<施設名>,までの,経路,を,設定」に変換して例文メモリ中に存在するかを調べる。ここで<>はカテゴリに変換したことを示す記号である。
このようにすると、学習例文10も図9に示すとおり、「近くの駐車場までの経路を設定」という元の例文が「近くの<施設>までの経路を設定」という例文に事前に変換されているため、前記認識結果Wtが学習例文10中に存在することになり、学習例文10を少ない文で効率的に表現できる効果がある。
また学習例文10は、図10に示すようにネットワーク形式で表現しておいてもよい。
このようにネットワーク形式で表現すると、一部の単語のみが異なる複数の学習例文同士の共通部分をまとめて表現できるため、学習例文10の記憶領域を少なくできる効果がある。
実施の形態3.
本実施の形態は前記実施の形態1の音声認識装置から学習例文10を取り除き、結果選択手段7が学習例文10の代わりに統計言語モデル8を参照するようにしたものである。本実施の形態の音声認識装置の構成例を図11に示す。
統計言語モデル8と構文規則9は、実施の形態1と同様に、認識処理の事前に作成しておく。
次に認識動作について説明する。音声の入力端1から音声2を入力すると、音響分析手段3、統計言語モデル型認識手段5、および構文規則型認識手段6は実施の形態1と同一の動作をする。すなわち統計言語モデル型認識手段5は認識スコアStが最大となる単語列Wt=w1 ,w2 ,w3 ,…wI、(Iは単語数)と、前記単語列Wtに対する音響尤度LAt、および言語尤度Ltを出力する。また構文規則型認識手段6は音響尤度LAkが最大となる単語列Wkと、認識スコアSkを出力する。
次に結果選択手段7は統計言語モデル型認識手段5から認識結果である単語列の表記Wt、音響尤度LAt、言語尤度Lt、および構文規則型認識手段6の出力結果である単語列の表記Wkと認識スコアSkを入力とし、以下の手順に従って統計言語モデル型認識または構文規則型認識の結果を選択し、認識結果として出力する。図12を参照しながら選択手順を説明する。
(手順1)統計言語モデル型認識の認識結果単語列Wt=w1 ,w2 ,w3 ,…wI、中の未知n-gram数Nuを算出する(図12のST201)。本実施の形態では例えばn=3、すなわちトライグラムとすると、前記単語列Wt=w1 ,w2 ,w3 ,…wI中には、(w1,w2,w3), (w2,w3,w4),…,(wI-2,wI-1,wI)の計(I-2) 個のトライグラムがあるので、それぞれに対して、統計言語モデル8を参照し、統計言語モデル8中に存在しないトライグラム数を数えあげ、その数を未知n-gram数Nuとして記憶する。
(手順2)前記未知n-gram数Nuの値を調べ(図12のST202)、前記未知n-gram数Nuが0の場合は統計言語モデル型認識の結果は言語的に自然であるとみなし、言語重み係数cを実験的に定めた0以上の小さい値βとし、また未知n-gramペナルティPuの値を0に設定する(図12のST203)。
一方、前記未知n-gram数Nuが1以上の場合は統計言語モデル型認識の結果は言語的に不自然である可能性があるため、前記言語重み係数をc=γ(但し,γはγ>βを満たす定数)とし、かつ未知n-gramペナルティPuを(5)式に従って計算する(図12のST204)。
Figure 0005274191
(5)式中でf()は定数もしくは単調増加する関数であり、例えば(6)式である。
Figure 0005274191
(手順3)上記手順2で算出した前記言語重み係数cと前記未知ngramペナルティPuを用い、(7)式により統計言語モデル型認識の認識スコアを再計算する(図12のST205)。
Figure 0005274191
(手順4)上記手順3で再計算した統計言語モデル型認識のスコアSt'を、構文規則型認識のスコアSkと比較し、スコアの高いほうを認識結果として選択する(図12のST206,207,208)。
以上の選択手順により統計言語モデル型認識の結果の未知n-gram数が0の場合には、言語スコアによるペナルティを0または小さな値にするので統計言語モデル型認識の結果が選択されにくくなるという問題が解消できる。また未知n-gram数が1以上の場合は言語スコアおよび未知トライグラム数に応じたペナルティを加えるため、言語的に不自然な統計言語モデル型認識の結果が選択されるのを抑制することができる。
また実施の形態1と比較すると、学習例文10中に存在するか否かを調べる必要がないので演算量・メモリ量を抑えることができる
なお本実施の形態では統計言語モデルとして単語単位のトライグラムを例として説明したが、単語ではなく、単語を施設名や放送局名、あるいは品詞等のカテゴリに変換した統計言語モデル(クラス言語モデル)を用いてもよい。また統計言語モデルの単位としては単語以外の、音節等の単位を用いてもよい。
また本実施の形態では未知n-gram数のnをn=3として説明したが、n=2や4以上でもよい。
この発明は、入力された音声を認識する音声認識装置に適用され、殊に定型発話と、非定型発話を音声認識対象とする用途、例えばカーナビゲーションシステム向けの音声認識の利用に好適である。
この発明による音声認識装置の実施の形態1の構成を示すブロック図である。 統計言語モデルの内容例を示す図である。 住所を認識対象とした場合における構文規則の内容例を示す図である。 学習例文の内容例を示す図である。 結果選択手段の認識処理手順のフロー図である。 単語間に遷移確率を付与した言語モデルの内容例を示す図である。 この発明による音声認識装置の実施の形態2の構成を示すブロック図である。 単語カテゴリ変換テーブルの内容例を示す図である。 実施の形態2における学習例文の内容例を示す図である。 実施の形態2における学習例文の内容例をネットワーク形式で表現した場合の図である。 この発明による音声認識装置の実施の形態3の構成を示すブロック図である。 実施の形態3における結果選択手段の認識処理手順のフロー図である。 従来の音声認識装置の構成例を示すブロック図である。
符号の説明
1;音声の入力端、2;入力音声、3;音響分析手段、4;特徴ベクトルの時系列、5;統計言語モデル型認識手段、6;構文規則型認識手段、7;結果選択手段、8;統計言語モデル、9;構文規則、10;学習例文、11;音響モデル、12;認識結果、13;単語カテゴリ変換テーブル。

Claims (3)

  1. 入力音声の音声認識手段として構文規則型の言語モデルを用いる構文規則型認識手段と、
    同じく入力音声の音声認識手段として統計言語モデルを用いる統計言語モデル型認識手段と、
    同じ入力音声に対し前記両音声認識手段が音声認識した認識結果の単語列と認識スコアを入力し、統計言語モデル型認識手段の認識結果について、その表記、あるいは表記の上位概念である品詞またはクラスの系列が、前記統計言語モデル作成時に使用する学習データから抽出された学習例文中に存在するか否かにより言語的妥当性を評価し、その評価結果に基づいて前記入力された統計言語モデル型認識手段の認識結果の認識スコアを修正し、この修正された認識スコアと前記構文規則型認識手段の認識結果の認識スコアを比較し、前記両音声認識手段の何れかの認識結果を選択する結果選択手段を備えたことを特徴とする音声認識装置。
  2. 前記結果選択手段は、請求項1記載の結果選択手段に代え、前記統計言語モデル型認識手段の認識結果の表記中の形態素列の各n組連鎖が前記統計言語モデル中に存在するか否かを調べ、存在しないn組連鎖の個数を前記言語的妥当性の評価に用いる構成とされたことを特徴とする請求項記載の音声認識装置。
  3. 前記結果選択手段は、前記存在しないn組連鎖の個数が0個の場合と1以上の場合とで、前記統計言語モデル型認識手段から出力される認識スコアの修正方法として異なる修正方法を用いることを特徴とする請求項記載の音声認識装置。
JP2008259708A 2008-10-06 2008-10-06 音声認識装置 Expired - Fee Related JP5274191B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008259708A JP5274191B2 (ja) 2008-10-06 2008-10-06 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008259708A JP5274191B2 (ja) 2008-10-06 2008-10-06 音声認識装置

Publications (2)

Publication Number Publication Date
JP2010091675A JP2010091675A (ja) 2010-04-22
JP5274191B2 true JP5274191B2 (ja) 2013-08-28

Family

ID=42254477

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008259708A Expired - Fee Related JP5274191B2 (ja) 2008-10-06 2008-10-06 音声認識装置

Country Status (1)

Country Link
JP (1) JP5274191B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101329281B1 (ko) * 2010-10-26 2013-11-13 한국전자통신연구원 음성 인식 장치 및 방법
JP6155592B2 (ja) * 2012-10-02 2017-07-05 株式会社デンソー 音声認識システム
DE112013006770B4 (de) 2013-03-06 2020-06-18 Mitsubishi Electric Corporation Spracherkennungsvorrichtung und Spracherkennungsverfahren
CN107796415B (zh) * 2016-09-07 2022-11-18 阿尔派株式会社 导航装置及其显示控制方法
CN110738989B (zh) * 2019-10-21 2021-12-07 浙江大学 一种利用多种语言模型的端到端网络学习解决基于地点的语音的自动识别任务的方法
CN111144359B (zh) * 2019-12-31 2023-06-30 安徽智恒信科技股份有限公司 一种展品评价装置和方法及展品推送方法
CN111986655B (zh) 2020-08-18 2022-04-01 北京字节跳动网络技术有限公司 音频内容识别方法、装置、设备和计算机可读介质

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0683388A (ja) * 1992-09-04 1994-03-25 Fujitsu Ten Ltd 音声認識装置
JP4244423B2 (ja) * 1999-01-28 2009-03-25 株式会社デンソー 適正単語列推定装置
JP2003323196A (ja) * 2002-05-08 2003-11-14 Nec Corp 音声認識システム、音声認識方法および音声認識用プログラム
JP2004198831A (ja) * 2002-12-19 2004-07-15 Sony Corp 音声認識装置および方法、プログラム、並びに記録媒体
US7475015B2 (en) * 2003-09-05 2009-01-06 International Business Machines Corporation Semantic language modeling and confidence measurement

Also Published As

Publication number Publication date
JP2010091675A (ja) 2010-04-22

Similar Documents

Publication Publication Date Title
JP5258959B2 (ja) 音声認識装置
EP1575030B1 (en) New-word pronunciation learning using a pronunciation graph
JP4301102B2 (ja) 音声処理装置および音声処理方法、プログラム、並びに記録媒体
JP4465564B2 (ja) 音声認識装置および音声認識方法、並びに記録媒体
CN107705787A (zh) 一种语音识别方法及装置
WO2019116604A1 (en) Speech recognition system
JP5274191B2 (ja) 音声認識装置
WO2013154010A1 (ja) 音声認識サーバ統合装置および音声認識サーバ統合方法
US20090099841A1 (en) Automatic speech recognition method and apparatus
US20060064177A1 (en) System and method for measuring confusion among words in an adaptive speech recognition system
EP1557822A1 (en) Automatic speech recognition adaptation using user corrections
EP1215662A1 (en) Speech recognition device and speech recognition method, and recording medium
JPH08278794A (ja) 音声認識装置および音声認識方法並びに音声翻訳装置
JP2001249684A (ja) 音声認識装置および音声認識方法、並びに記録媒体
US11450320B2 (en) Dialogue system, dialogue processing method and electronic apparatus
Neubig et al. Learning a language model from continuous speech
JP2013125144A (ja) 音声認識装置およびそのプログラム
Tanaka et al. Neural speech-to-text language models for rescoring hypotheses of dnn-hmm hybrid automatic speech recognition systems
Réveil et al. An improved two-stage mixed language model approach for handling out-of-vocabulary words in large vocabulary continuous speech recognition
JP3776391B2 (ja) 多言語音声認識方法、装置、プログラム
JP4595415B2 (ja) 音声検索システムおよび方法ならびにプログラム
JP3364631B2 (ja) 統計的言語モデル生成装置及び音声認識装置
JP2886121B2 (ja) 統計的言語モデル生成装置及び音声認識装置
JP3088364B2 (ja) 音声言語理解装置及び音声言語理解システム
KR20230156125A (ko) 룩업 테이블 순환 언어 모델

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20121002

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130416

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130514

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 5274191

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees