JP2007072393A - 音声認識装置及びプログラム - Google Patents
音声認識装置及びプログラム Download PDFInfo
- Publication number
- JP2007072393A JP2007072393A JP2005262231A JP2005262231A JP2007072393A JP 2007072393 A JP2007072393 A JP 2007072393A JP 2005262231 A JP2005262231 A JP 2005262231A JP 2005262231 A JP2005262231 A JP 2005262231A JP 2007072393 A JP2007072393 A JP 2007072393A
- Authority
- JP
- Japan
- Prior art keywords
- word
- probability
- syllable
- string
- phoneme
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】
単語認識部201は音声の単語認識を行い単語列候補と対数ゆう度を求める。音節認識部211は音声の音節認識を行い音節列候補と対数ゆう度を求める。音素認識部221は音声の音素認識を行い音素列候補と対数ゆう度を求める。単語正規化ゆう度計算部203は正規化ゆう度を求め、単語条件付確率計算部207は単語条件付確率を求める。音節正規化ゆう度計算部213は正規化ゆう度を求め、音節条件付確率計算部217は音節条件付確率を求める。音素正規化ゆう度計算部223は正規化ゆう度を求め、音素条件付確率計算部227は音素条件付確率を求める。対話管理部208は単語条件付確率と音節条件付確率と音素条件付確率とに基づいて信頼度を求め、単語列候補を受理又は棄却する。
【選択図】図2
Description
社団法人電子情報通信学会論文誌D−II、Vol.J75−D−II、No.12(1992年)2002〜2009ページ、「音節認識を用いたゆう度補正による未知発話のリジェクション」渡辺隆夫・塚田聡 社団法人情報処理学会研究報告2003−SLP−49(2003年)281〜286ページ、「2パス探索アルゴリズムにおける高速な単語事後確率に基づく信頼度算出法」李晃伸・河原達也・鹿野清宏
音声を認識して複数の音素列候補とゆう度とを求める音素認識部と、
前記音素認識部により求められたゆう度に基づいて、前記音声が音素列のいずれかであると仮定した場合に前記音声が音節列のいずれかである割合を示す第1の正規化ゆう度を求め、前記音声が前記音素列のいずれかである場合に前記音声が前記音節列のいずれかである第1の確率を求める第1の確率取得部と、
前記音声を認識して複数の音節列候補とゆう度とを求める音節認識部と、
前記音節認識部により求められたゆう度に基づいて、前記音声が前記音節列のいずれかであると仮定した場合に前記音声が既知の単語列のいずれかである割合を示す第2の正規化ゆう度を求め、前記音声が前記音節列のいずれかである場合に前記音声が前記既知の単語列のいずれかである第2の確率を求める第2の確率取得部と、
前記音声を認識して複数の単語列候補とゆう度とを求める単語認識部と、
前記単語認識部により求められた前記ゆう度に基づいて、前記音声が前記既知の単語列のいずれかであると仮定した場合に前記音声が前記単語列候補の中で最も大きいゆう度を持つ第1位の単語候補である割合を示す第3の正規化ゆう度を求め、前記音声が前記既知の単語列のいずれかである場合に前記音声が前記第1位の単語列候補である第3の確率を求める第3の確率取得部と、
前記第1の確率と前記第2の確率と前記第3の確率とに基づいて、前記第1位の単語候補を棄却する判定部と、を備える。
音節列に関するデータを格納する音節列言語モデル格納部と、
単語列に関するデータを格納する単語列言語モデル格納部と、
前記第1の確率取得部により求められる第1の正規化ゆう度と、前記音声が前記音素列言語モデル格納部に格納された音素列のいずれかである場合に前記音声が前記音節列言語モデル格納部に格納された音節列のいずれかである第1の確率との関係を示す第1の関数を格納する第1の関数格納部と、
前記第2の確率取得部により求められる第2の正規化ゆう度と、前記音声が前記音節列言語モデル格納部に格納された音節列のいずれかである場合に前記音声が前記単語列言語モデル格納部に格納された単語列のいずれかである第2の確率との関係を示す第2の関数を格納する第2の関数格納部と、
前記第3の確率取得部により求められる第3の正規化ゆう度と、前記音声が前記単語列候補のいずれかである場合に前記音声が前記第1位の単語列候補である第3の確率との関係を示す第3の関数を格納する第3の関数格納部と、を更に備え、
前記第1の確率取得部は、前記第1の正規化ゆう度と、前記第1の関数格納部に格納される第1の関数とに基づいて、前記第1の確率を求め、
前記第2の確率取得部は、前記第2の正規化ゆう度と、前記第2の関数格納部に格納される第2の関数とに基づいて、前記第2の確率を求め、
前記第3の確率取得部は、前記第3の正規化ゆう度と、前記第3の関数格納部に格納される第3の関数とに基づいて、前記第3の確率を求めてもよい。
前記各区間ごとに前記音素列、音節列又は単語列に該当する対象事象のサンプル音声数の総サンプル数に対する割合を求め、更に、
各区間に対して前記割合をプロットして得られる分布において隣り合う区間の2点を直線で結んで得られる関数、又は、当該分布を示す近似曲線関数を求めて前記第1、第2又は第3の関数格納部に格納する関数決定部を更に備えてもよい。
前記各区間ごとに前記音素列、音節列又は単語列に該当する対象事象のサンプル音声数を累積した値の総サンプル数に対する累積割合を求め、更に、
各区間に対して前記累積割合をプロットして得られる分布において隣り合う区間の2点を直線で結んで得られる関数、又は、当該分布を示す近似曲線関数を求めて前記第1、第2又は第3の関数格納部に格納する関数決定部を更に備えてもよい。
前記各区間ごとに前記音素列、音節列又は単語列に該当する対象事象のサンプル音声数を累積した値の総サンプル数に対する累積割合を求め、更に、
前記各区間に対して前記累積割合をプロットして得られる分布において隣り合う区間の2点を直線で結んで得られる関数、又は、当該分布を示す近似曲線関数を求めて前記第1、第2又は第3の関数格納部に格納する関数決定部を更に備えてもよい。
コンピュータを、
音声を認識して複数の音素列候補とゆう度とを求める音素認識部、
前記音素認識部により求められたゆう度に基づいて、前記音声が音素列のいずれかであると仮定した場合に前記音声が音節列のいずれかである割合を示す第1の正規化ゆう度を求め、前記音声が前記音素列のいずれかである場合に前記音声が前記音節列のいずれかである第1の確率を求める第1の確率取得部、
前記音声を認識して複数の音節列候補とゆう度とを求める音節認識部、
前記音節認識部により求められたゆう度に基づいて、前記音声が前記音節列のいずれかであると仮定した場合に前記音声が既知の単語列のいずれかである割合を示す第2の正規化ゆう度を求め、前記音声が前記音節列のいずれかである場合に前記音声が前記既知の単語列のいずれかである第2の確率を求める第2の確率取得部、
前記音声を認識して複数の単語列候補とゆう度とを求める単語認識部、
前記単語認識部により求められた前記ゆう度に基づいて、前記音声が前記既知の単語列のいずれかであると仮定した場合に前記音声が前記単語列候補の中で最も大きいゆう度を持つ第1位の単語列候補である割合を示す第3の正規化ゆう度を求め、前記音声が前記既知の単語列のいずれかである場合に前記音声が前記第1位の単語候補である第3の確率を求める第3の確率取得部、
前記第1の確率と前記第2の確率と前記第3の確率とに基づいて、前記第1位の単語候補を棄却する判定部、として機能させる。
尚、単語列とは、単語一語、あるいは、複数の単語から構成されるもののことである。また、音素には母音と子音とがあり、日本語の場合、音素は5種類の母音と約20種類の子音から構成される。また、音節は通常1つの母音と1つ又は複数の子音から構成され、日本語の場合、音節は約100種類存在する。
制御部110は、例えば、p(Cw1|Cw)とp(Cw|Cs)とp(Cs|Cp)の3つの確率の積を信頼度として求め、信頼度が所定値以上の単語列候補を受理し、所定値に満たない単語列候補を棄却する。以下、詳述する。
また、後述する音節認識部211と音素認識部221も同様に、HMMの集合である音響モデルと、音節列言語モデル又は音素列言語モデルと、を用いて音節認識又は音素認識を行う。なお、当該構成は、例えば、特開平10−171489号等に記載される公知の技術である。
尚、以下の説明では、条件付確率p(B|A)におけるAを条件事象、Bを対象事象、Bの余事象を対立事象と呼ぶ。
例えば、対象事象が、音声認識装置100の認識成功する既知の単語であるとすると、この対立事象は、音声認識装置100が誤認識する既知の単語である。また、例えば、対象事象が、既知の単語であるとすると、この対立事象は、未知の単語である。また、例えば、対象事象が、音節列(言語)であるとすると、この対立事象は、音節列でない非言語である。
条件事象を満たすサンプルについて、図3(a)に示すような対象事象の単語正規化ゆう度CMwの頻度分布を作成する。同様に、図3(b)に示すような対立事象の単語正規化ゆう度CMwの頻度分布を作成する。
上述した方法1では、条件事象を満たす対象事象と対立事象とのサンプルを、全区間nについて十分な数だけ用意する必要がある。しかし、一般に、競合語や未知語による誤認識が発生するサンプルを大量に収集することは困難である。本方法では、少ないサンプル数で確率分布を累積した累積分布関数を用いる。
あるいは、例えば、条件付確率p(n)の分布の全体を、数4で表されるようなシグモイド関数を用いて条件付確率p(n)の分布の全体を示す近似曲線を求めて、変換関数f(CMw)を得る。
本方法では、方法2と異なり、対象事象の累積確率分布のみを用いる。
まず、方法1と同様に、対象事象を満たすサンプルについて単語正規化ゆう度CMwの頻度分布を作成し、条件事象を包含する総サンプル数で正規化して図5(a)に示すような確率分布を得る。
また、条件付確率p(Cw|Cs)は、入力された音声が音節列言語モデル格納部212に格納される音節列のいずれかであると仮定した場合に、当該音声が単語列言語モデル格納部202に格納される既知語のいずれかである確率であり、入力された音声が既知語か未知語かを判別するために有効な値である。
また、条件付確率p(Cs|Cp)は、入力された音声が音素列言語モデル格納部222に格納される音素列のいずれかであると仮定した場合に、当該音声が音節列言語モデル格納部212に格納される音節列のいずれかである確率であり、入力された音声が言語か非言語かを判別するために有効な値である。
したがって、これらの積によって表される条件付確率p(Cw1|Cp)は、非言語が入力されることによる誤認識と、未知語が入力されることによる誤認識と、競合語による誤認識とをすべて考慮した信頼度として用いられる。言い換えれば、この条件付確率p(Cw1|Cp)を用いれば、誤認識が発生する要素である非言語、未知語、競合語が混在する条件下で精度よく音声認識を行うことができる。
尚、本実施形態では、音声認識装置100は、単語正解確率変換関数決定部205、音節正解確率変換関数決定部215及び音素正解確率変換関数決定部225を装置内に備えるが、それぞれ別の装置により単語正解確率変換関数、音節正解確率変換関数及び音素正解確率変換関数を決定し、各関数格納部206,216,226に格納するように構成してもよい。
一方、受理された単語列候補がない場合(ステップS710;No)、制御部110は、取得した音声の認識に失敗したことをユーザに通知する(ステップS712)。例えば、制御部110は、出力部114に接続されたモニタ等に単語列候補が無い旨のメッセージ等を表示させる。あるいは、例えば、出力部114に接続されたスピーカ等に単語列候補が無い旨の音声アナウンスを出力させてもよい。
まず、制御部110は、対象事象である音声V1と、対立事象である音声V2とを取得する(図8、ステップS801)。尚、対象事象である音声V1や対立事象である音声V2の数は、なるべく多くのサンプル数であることが望ましい。
方法2が方法1と異なる点は、確率分布ではなく累積確率分布を用いる点である。
まず、制御部110は、対象事象である音声V1と、対立事象である音声V2とを取得する(図9、ステップS901)。尚、方法1と同様に、対象事象である音声V1や対立事象である音声V2の数はそれぞれ1つとは限らず、複数であることが望ましい。
方法3が方法2と異なる点は、対象事象の累積確率分布のみを用いる点である。
まず、制御部110は、対象事象である音声V1を取得する(図10、ステップS1001)。尚、方法2と同様に、対象事象である音声V1の数は1つとは限らず、複数であることが望ましい。
110 制御部
111 RAM
112 ROM
113 記憶部
114 出力部
115 I/F
116 入力部
117 システムバス
121 ネットワーク
201 単語認識部
202 単語列言語モデル格納部
203 単語正規化ゆう度計算部
204 単語正規化ゆう度格納部
205 単語正解確率変換関数決定部
206 単語正解確率変換関数格納部
207 単語条件付確率計算部
208 対話管理部
211 音節認識部
212 音節列言語モデル格納部
213 音節正規化ゆう度計算部
214 音節正規化ゆう度格納部
215 音節正解確率変換関数決定部
216 音節正解確率変換関数格納部
217 音節条件付確率計算部
221 音素認識部
222 音素列言語モデル格納部
223 音素正規化ゆう度計算部
224 音素正規化ゆう度格納部
225 音素正解確率変換関数決定部
226 音素正解確率変換関数格納部
227 音素条件付確率計算部
Claims (6)
- 音声を認識して複数の音素列候補とゆう度とを求める音素認識部と、
前記音素認識部により求められたゆう度に基づいて、前記音声が音素列のいずれかであると仮定した場合に前記音声が音節列のいずれかである割合を示す第1の正規化ゆう度を求め、前記音声が前記音素列のいずれかである場合に前記音声が前記音節列のいずれかである第1の確率を求める第1の確率取得部と、
前記音声を認識して複数の音節列候補とゆう度とを求める音節認識部と、
前記音節認識部により求められたゆう度に基づいて、前記音声が前記音節列のいずれかであると仮定した場合に前記音声が既知の単語列のいずれかである割合を示す第2の正規化ゆう度を求め、前記音声が前記音節列のいずれかである場合に前記音声が前記既知の単語列のいずれかである第2の確率を求める第2の確率取得部と、
前記音声を認識して複数の単語列候補とゆう度とを求める単語認識部と、
前記単語認識部により求められた前記ゆう度に基づいて、前記音声が前記既知の単語列のいずれかであると仮定した場合に前記音声が前記単語列候補の中で最も大きいゆう度を持つ第1位の単語列候補である割合を示す第3の正規化ゆう度を求め、前記音声が前記既知の単語列のいずれかである場合に前記音声が前記第1位の単語列候補である第3の確率を求める第3の確率取得部と、
前記第1の確率と前記第2の確率と前記第3の確率とに基づいて、前記第1位の単語列候補を棄却する判定部と、
を備えることを特徴とする音声認識装置。 - 音素列に関するデータを格納する音素列言語モデル格納部と、
音節列に関するデータを格納する音節列言語モデル格納部と、
単語列に関するデータを格納する単語列言語モデル格納部と、
前記第1の確率取得部により求められる第1の正規化ゆう度と、前記音声が前記音素列言語モデル格納部に格納された音素列のいずれかである場合に前記音声が前記音節列言語モデル格納部に格納された音節列のいずれかである第1の確率との関係を示す第1の関数を格納する第1の関数格納部と、
前記第2の確率取得部により求められる第2の正規化ゆう度と、前記音声が前記音節列言語モデル格納部に格納された音節列のいずれかである場合に前記音声が前記単語列言語モデル格納部に格納された単語列のいずれかである第2の確率との関係を示す第2の関数を格納する第2の関数格納部と、
前記第3の確率取得部により求められる第3の正規化ゆう度と、前記音声が前記単語列候補のいずれかである場合に前記音声が前記第1位の単語列候補である第3の確率との関係を示す第3の関数を格納する第3の関数格納部と、を更に備え、
前記第1の確率取得部は、前記第1の正規化ゆう度と、前記第1の関数格納部に格納される第1の関数とに基づいて、前記第1の確率を求め、
前記第2の確率取得部は、前記第2の正規化ゆう度と、前記第2の関数格納部に格納される第2の関数とに基づいて、前記第2の確率を求め、
前記第3の確率取得部は、前記第3の正規化ゆう度と、前記第3の関数格納部に格納される第3の関数とに基づいて、前記第3の確率を求める
ことを特徴とする、請求項1に記載の音声認識装置。 - 前記第1、第2又は第3の確率取得部により求められる第1、第2又は第3の正規化ゆう度が取りうる範囲を所定の区間に分割した各区間ごとに、判別対象の音素列、音節列又は単語列に該当する対象事象のサンプル音声数と、前記対象事象に対応する対立事象のサンプル音声数とを求め、更に、
前記各区間ごとに前記音素列、音節列又は単語列に該当するサンプル音声数の総サンプル数に対する割合を求め、更に、
各区間に対して前記割合をプロットして得られる分布において隣り合う区間の2点を直線で結んで得られる関数、又は、当該分布を示す近似曲線関数を求めて前記第1、第2又は第3の関数格納部に格納する関数決定部
を更に備えることを特徴とする、請求項2に記載の音声認識装置。 - 前記第1、第2又は第3の確率取得部により求められる第1、第2又は第3の正規化ゆう度が取りうる範囲を所定の区間に分割した各区間ごとに、判別対象の音素列、音節列又は単語列に該当する対象事象のサンプル音声数の割合と、前記対象事象に対応する対立事象のサンプル音声数の割合とを求め、更に、
前記各区間ごとに前記音素列、音節列又は単語列に該当するサンプル音声数を累積した値の総サンプル数に対する累積割合を求め、更に、
各区間に対して前記累積割合をプロットして得られる分布において隣り合う区間の2点を直線で結んで得られる関数、又は、当該分布を示す近似曲線関数を求めて前記第1、第2又は第3の関数格納部に格納する関数決定部
を更に備えることを特徴とする、請求項2に記載の音声認識装置。 - 前記第1、第2又は第3の確率取得部により求められる第1、第2又は第3の正規化ゆう度が取りうる範囲を所定の区間に分割した各区間ごとに、判別対象の音素列、音節列又は単語列に該当する対象事象のサンプル音声数の割合を求め、更に、
前記各区間ごとに前記音素列、音節列又は単語列に該当する対象事象のサンプル音声数を累積した値の総サンプル数に対する累積割合を求め、更に、
前記各区間に対して前記累積割合をプロットして得られる分布において隣り合う区間の2点を直線で結んで得られる関数、又は、当該分布を示す近似曲線関数を求めて前記第1、第2又は第3の関数格納部に格納する関数決定部
を更に備えることを特徴とする、請求項2に記載の音声認識装置。 - コンピュータを、
音声を認識して複数の音素列候補とゆう度とを求める音素認識部、
前記音素認識部により求められたゆう度に基づいて、前記音声が音素列のいずれかであると仮定した場合に前記音声が音節列のいずれかである割合を示す第1の正規化ゆう度を求め、前記音声が前記音素列のいずれかである場合に前記音声が前記音節列のいずれかである第1の確率を求める第1の確率取得部、
前記音声を認識して複数の音節列候補とゆう度とを求める音節認識部、
前記音節認識部により求められたゆう度に基づいて、前記音声が前記音節列のいずれかであると仮定した場合に前記音声が既知の単語列のいずれかである割合を示す第2の正規化ゆう度を求め、前記音声が前記音節列のいずれかである場合に前記音声が前記既知の単語列のいずれかである第2の確率を求める第2の確率取得部、
前記音声を認識して複数の単語列候補とゆう度とを求める単語認識部、
前記単語認識部により求められた前記ゆう度に基づいて、前記音声が前記既知の単語列のいずれかであると仮定した場合に前記音声が前記単語列候補の中で最も大きいゆう度を持つ第1位の単語候補である割合を示す第3の正規化ゆう度を求め、前記音声が前記既知の単語列のいずれかである場合に前記音声が前記第1位の単語列候補である第3の確率を求める第3の確率取得部、
前記第1の確率と前記第2の確率と前記第3の確率とに基づいて、前記第1位の単語列候補を棄却する判定部
として機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005262231A JP4610451B2 (ja) | 2005-09-09 | 2005-09-09 | 音声認識装置及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005262231A JP4610451B2 (ja) | 2005-09-09 | 2005-09-09 | 音声認識装置及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007072393A true JP2007072393A (ja) | 2007-03-22 |
JP4610451B2 JP4610451B2 (ja) | 2011-01-12 |
Family
ID=37933857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005262231A Active JP4610451B2 (ja) | 2005-09-09 | 2005-09-09 | 音声認識装置及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4610451B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075249A (ja) * | 2007-09-19 | 2009-04-09 | Ntt Data Corp | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム |
JP2016042298A (ja) * | 2014-08-18 | 2016-03-31 | 株式会社豊田中央研究所 | 事故情報算出装置、及びプログラム |
WO2016147292A1 (ja) * | 2015-03-16 | 2016-09-22 | 三菱電機株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004177551A (ja) * | 2002-11-26 | 2004-06-24 | Matsushita Electric Ind Co Ltd | 音声認識用未知発話検出装置及び音声認識装置 |
JP2005181386A (ja) * | 2003-12-16 | 2005-07-07 | Mitsubishi Electric Corp | 音声対話処理装置及び音声対話処理方法並びにプログラム |
-
2005
- 2005-09-09 JP JP2005262231A patent/JP4610451B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004177551A (ja) * | 2002-11-26 | 2004-06-24 | Matsushita Electric Ind Co Ltd | 音声認識用未知発話検出装置及び音声認識装置 |
JP2005181386A (ja) * | 2003-12-16 | 2005-07-07 | Mitsubishi Electric Corp | 音声対話処理装置及び音声対話処理方法並びにプログラム |
Non-Patent Citations (2)
Title |
---|
CSNG199800730002, 渡辺 隆夫 Takao WATANABE, "音節認識を用いたゆう度補正による未知発話のリジェクション Unknown Utterance Rejection Using Likeliho", 電子情報通信学会論文誌 (J75−D−II) 第12号 THE TRANSACTIONS OF THE INSTITUTE OF ELECTRO, 19921225, p.2002−2009, JP, 社団法人電子情報通信学会 THE INSTITUTE OF ELECTRO * |
CSNG200100240025, 北岡 教英 Norihide KITAOKA, "認識結果の正解確率に基づく信頼度とリジェクション Confidence Measure and Rejection based on Correct", 情報処理学会研究報告 Vol.99 No.108 IPSJ SIG Notes, 19991221, p.175−180, JP, 社団法人情報処理学会 Information Processing Socie * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009075249A (ja) * | 2007-09-19 | 2009-04-09 | Ntt Data Corp | 書き起こし内容確認方法、書き起こし内容確認装置、コンピュータプログラム |
JP2016042298A (ja) * | 2014-08-18 | 2016-03-31 | 株式会社豊田中央研究所 | 事故情報算出装置、及びプログラム |
WO2016147292A1 (ja) * | 2015-03-16 | 2016-09-22 | 三菱電機株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
JPWO2016147292A1 (ja) * | 2015-03-16 | 2017-06-22 | 三菱電機株式会社 | 音声認識装置、音声認識方法および音声認識プログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4610451B2 (ja) | 2011-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5282737B2 (ja) | 音声認識装置および音声認識方法 | |
JP4224250B2 (ja) | 音声認識装置、音声認識方法および音声認識プログラム | |
US7013276B2 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
JP4786384B2 (ja) | 音声処理装置、音声処理方法および音声処理プログラム | |
KR101153078B1 (ko) | 음성 분류 및 음성 인식을 위한 은닉 조건부 랜덤 필드모델 | |
JP4355322B2 (ja) | フレーム別に重み付けされたキーワードモデルの信頼度に基づく音声認識方法、及びその方法を用いた装置 | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
CN110706714B (zh) | 说话者模型制作系统 | |
JP4340685B2 (ja) | 音声認識装置及び音声認識方法 | |
JP6866715B2 (ja) | 情報処理装置、感情認識方法、及び、プログラム | |
KR20100115093A (ko) | 음성 검출 장치 및 방법 | |
CN111243599A (zh) | 语音识别模型构建方法、装置、介质及电子设备 | |
JP5007401B2 (ja) | 発音評定装置、およびプログラム | |
JP4769098B2 (ja) | 音声認識信頼度推定装置、その方法、およびプログラム | |
JP4353202B2 (ja) | 韻律識別装置及び方法、並びに音声認識装置及び方法 | |
JP4610451B2 (ja) | 音声認識装置及びプログラム | |
JP3444108B2 (ja) | 音声認識装置 | |
Manjunath et al. | Articulatory and excitation source features for speech recognition in read, extempore and conversation modes | |
JP4259100B2 (ja) | 音声認識用未知発話検出装置及び音声認識装置 | |
JP2005275348A (ja) | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 | |
JP3633254B2 (ja) | 音声認識システムおよびそのプログラムを記録した記録媒体 | |
JP2009116075A (ja) | 音声認識装置 | |
Savchenko et al. | Optimization of gain in symmetrized itakura-saito discrimination for pronunciation learning | |
JP4962930B2 (ja) | 発音評定装置、およびプログラム | |
JP4798606B2 (ja) | 音声認識装置、およびプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080327 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100916 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101012 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101012 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131022 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4610451 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |