JP2006201553A - 識別的学習方法、装置、プログラム、音声認識装置、プログラム、これらのプログラムを記録した記録媒体 - Google Patents
識別的学習方法、装置、プログラム、音声認識装置、プログラム、これらのプログラムを記録した記録媒体 Download PDFInfo
- Publication number
- JP2006201553A JP2006201553A JP2005013890A JP2005013890A JP2006201553A JP 2006201553 A JP2006201553 A JP 2006201553A JP 2005013890 A JP2005013890 A JP 2005013890A JP 2005013890 A JP2005013890 A JP 2005013890A JP 2006201553 A JP2006201553 A JP 2006201553A
- Authority
- JP
- Japan
- Prior art keywords
- value
- symbol sequence
- correct
- symbol
- function
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Discrimination (AREA)
Abstract
【解決手段】 一つの特徴量情報系列に対し、複数の正解シンボル系列候補を含む正解シンボル系列集合を用意して正解シンボル系列識別関数値の計算を行い、誤識別尺度の計算に用いる不正解シンボル系列を認識シンボル系列集合の中から正解シンボルと系列と、正解シンボル系列集合に含まれる正解シンボル系列に類似したシンボル系列とを除いた上で選択し、それぞれについて正解シンボル系列識別関数値と不正解シンボル系列識別関数値の計算を行う。
【選択図】図1
Description
このようにシンボル間識別能力の向上を積極的に図る枠組みは総称として識別的学習(Discriminative training)と呼ばれている。
以下、識別的学習方法の代表的な実現法のひとつである最小識別誤り(MCE:Minimum Classification Error)学習(非特許文献1)を、孤立シンボルを同定するパターン認識に適用する場合を例にとり説明する。
まず、長さTの特徴量情報系列1,T(x*はベクトルを表わす)がシンボルcに属するか否かを評価するための識別関数g(x* 1,T|c;Λ)を定義する。
ここでΛはシンボルが持つパラメータの集合である。特徴量情報系列x* 1,Tの所属シンボルc^はこの識別関数g(x* 1,T|c;Λ)によって、
c^=arg max g(x* 1,T|c;Λ) (1.1)
c
のように識別される。
このとき特徴量情報系列x* 1,Tが実際に所属するシンボルc~(正解シンボル)の識別関数と、他シンボル(不正解シンボル)の識別関数を全て用いて、
ここで被る損失の大きさ、すなわち損失値が、誤識別があるとき1、誤識別が無い時0、というように定まるものとし、d(x* 1,T|c~;Λ)の値を損失値に変換する関数(損失関数)を考える。
s(d)=1/(1+exp(−αd)) (1.3)
式(1.3)の損失関数はd=d(x* 1,T|c~;Λ)=0となる周辺、すなわちシンボル境界周辺の狭い領域ではd(x* 1,T|c~;Λ)の値に応じた0から1の間の値をとり、それ以外では、0(d<0)、または1(d>0)の漸近した値をとる。
ここでαはシンボル境界周辺の領域におけるs(d)の傾きを制御するパラメータである。
ここで導関数∂L/∂λ(λ∈Λ)をもとにして降下法等各種の最適化手法によってL(Λ|X)を最小とするΛを見つければ、それは学習データに対する誤識別回数を最小化して識別能力を高めたことに相当する。
ここで学習データ中でL(Λ|X)の最小化に寄与する特徴量情報系列は、式(1.4)の損失関数によりシンボル境界周辺のものに限られており、この場合クラス境界を明確化する学習が行われる。
孤立のシンボルだけではなくシンボル系列の同定をも目的としたパターン認識の場合には、シンボル系列c1,N ={c1,…,cN}に対する識別関数を、
式(1.6)は各シンボルの識別関数を用いてシンボル系列の識別関数値が最大となるように特徴量情報系列x*1 1,TをN個の部分特徴量情報系列x* 1,t(1),x* t(1)+1,t(2) ,…,x* t(N-1)+1,T に分割する動的計画法により計算できる。
ここで正解シンボル係数をc~1,N~とすると、誤識別の尺度は、
単語シンボルcの識別関数は、例えば、図7に示すある単語シンボルを意図して発声された音声の音声特徴量情報系列の挙動を表現するM状態left-to-right型隠れマルコフモデルに基づいて実現することができる。
図7の隠れマルコフモデルに基づいて、ある単語シンボル系列中の単語シンボルcnの識別関数を具体的な形にすると、
式(1.8)は単語シンボルの識別関数値が最大となるようにx*1 t(n)をM個の部分特徴量情報系列x* 1,τ(1),x* τ(1)+1,τ(2) ,…,x* τ(M-1)+1,T(n)に分割する動的計画法により計算できる。
ここで式(1.8)を式(1.6)に代入することで、単語シンボル系列単位の識別関数を定義できる。
まず「あの田中太郎です」と発声された音声の波形から抽出された音声特徴量情報系列
上記代表不正解単語シンボル系列の計算と代表不正解識別関数値の計算とは、音声特徴
[Juang & Katagiri 92] Biing-Hwang JUANG and Shigeru KATAGIRI; Discriminative Learning for Minimum Error Classification, IEEE, Trans. On SP., Vol. 40, No.12, pp.3043-3054 (1992). [Katagiri et al., 98] Shigeru KATAGIRI, Biing-Hwang JUANG and Chin-Hui LEE; Pattern Recognition Using a Family of Design Algorithms Based Upon the Generalized Probabilistic Descent Method, Proc. IEEE. Vol. 86, No. 11, pp. 2345-2373 (1998). [McDermott & Katagiri, 97] Erik MCDERMOTT and Shigeru KATAGIRI; String-Level MCE for Continuous Phoneme Recognition, Proc. Eurospeech97, Vol. 1, pp. 123-126 (1997).
第一の問題は、正解シンボル系列を用意する際、複数存在する候補の中から唯一の正解シンボル系列を選択する判断に誤りが起きると、式(1.7)の右辺第一項、すなわち正解シンボル系列についての識別関数の計算誤りを回避することが出来ず、識別的学習の効果によるパターン認識性能の向上が必ずしも十分でない、という問題が発生する。
つまり、計算の対象から唯一の正解シンボル系列c~1,N~のみを除外しているため、正解シンボル系列との類似度に関わらず複数の不正解シンボル系列の内で最大の識別関数値を与える不正解シンボル系列、すなわち、正解シンボル系列に非常に類似した不正解シンボル系列のみが識別的学習に寄与することになる。
特に、正解シンボル系列の中に、シンボル系列の背景にある概念情報との関連付けに直接寄与しないフィラー・シンボルが含まれている場合、当該フィラー・シンボルのみが不正解で他のシンボルはその順序も含めて正解であるようなシンボル系列が、複数の不正解シンボル系列の内で最大の識別関数値を与えるシンボル系列となり得る。
つまり、唯一の正解シンボル系列を用いた従来技術による識別的学習では正解シンボル系列のフィラー・シンボルと不正解シンボル系列のフィラー・シンボルとの識別関数パラメータのみが更新の対象となる可能性が大きくなり、特徴量情報系列が表現するものと等価な概念情報を表現するシンボル系列を同定するというパターン認識の本来の目的に添った識別的学習の効果は高くなく、パターン認識性能の向上は必ずしも十分でない。
上述したように従来の識別的学習では、識別的学習の効果が必ずしも高くなく、パターン認識と識別的学習とに要する時間が長くなり、識別関数パラメータを格納する記憶領域が大きくなっていた。
この発明の第3の実施形態としてはコンピュータに、予め用意された特徴量情報系列が表現する概念情報の種別を離散値で表現した正解シンボル系列集合と、前記特徴量系列を用いて識別関数値を計算し、識別関数値の最大値と、その最大値を与えるシンボル系列とを計算し格納する正解識別関数値計算部と、特徴量系列をパターン認識して、その結果として認識シンボル系列集合と、この認識シンボル系列集合に含まれる各々のシンボル系列に対する識別関数値とを計算し、前記認識シンボル系列集合に含まれる各々のシンボル系列が、正解シンボル系列集合に含まれるか否かを判定する不正解識別関数値計算部と認識シンボル系列集合に含まれるシンボル系列であって、正解シンボル系列集合に含まれない不正解単語シンボル系列から得られる識別関数値の最大値と正解スコアとから得られる誤識別尺度と、この誤識別尺度を損失関数に代入して損失値を計算し格納する識別関数比較部と、学習データを構成するすべての特徴量情報系列についての損失値の総和を計算し、総損失値として格納する損失関数値計算・積算部と、総損失値がより小さい値となるように識別関数パラメータの値を更新する識別関数パラメータ更新計算部と、正解識別関数値計算部と、不正解識別関数値計算部と、識別関数比較部と、損失関数値計算・積算部を予め設定した識別関数パラメータの初期値を用いて演算し、爾後前記演算終了毎にその時点で得られた識別関数パラメータの値を用いて演算を実行させる制御部と、損失関数計算・積算部に得られた総和損失値が収束に至ったか否かを判断し、収束に至っていれば終了して最終的な識別関数パラメータの値とし、収束に至っていなければ、再度前記制御部の動作を実行させる総損失値収束判定部とを備えることを特徴とする識別的学習装置を提案する。
この発明の第5の実施形態としては入力音声の特徴量情報系列が、別途指定された単語シンボル系列を表現したものであるか否かの度合いを表わす音響スコア、例えば対数尤度を実施形態3又は4の識別的学習装置で学習した識別関数パラメータを用いて計算する音響モデル部と、単語シンボル系列の文としての言語的妥当性の度合いを表わす言語スコアを計算する言語モデル部と、単語辞書に登録された単語シンボルからなる単語シンボル系列の中で前記音響スコアと言語スコアによって計算される総合スコア、例えば前記音響スコアと言語スコアの重み付き和が最大となる単語シンボル系列を探索し出力する単語系列探索部を備えた音声認識装置を提案する。
この発明の第7の実施形態としてはコンピュータが解読可能なプログラム言語によって記述され、コンピュータに実施形態5で提案した音声認識装置として機能させる音声認識プログラムを提案する。
作用
本発明の識別的学習方法の特徴とするところは、一つの特徴量情報系列に対し複数の正解シンボル系列候補を含む正解シンボル系列集合を用意して正解シンボル系列識別関数値の計算を行い、誤識別尺度の計算に用いる不正解シンボル系列を、認識シンボル系列集合の中から、正解シンボル系列と、正解シンボル系列集合に含まれる正解シンボル系列に類似したシンボル系列とを除いた上で選択する点にある。
ここで、正解単語シンボル系列の識別関数値と代表不正解識別関数値の計算を行う際に、各々の単語シンボル系列の出現可能性に関する事前知識に基づくバイアス・スコアを加えることにしてもよい。
当該バイアス・スコアは、連続単語音声認識において広く用いられている言語モデルに基づいて容易に計算することができる。
また、誤識別尺度の計算に用いる不正解シンボル系列を、認識シンボル系列集合の中で、正解シンボル系列と、正解シンボル系列集合に含まれる正解シンボル系列に類似したシンボル系列とを除いた上で、特徴量情報系列に対して最大の識別関数を与えるものとすることで、正解シンボル系列に非常に類似したシンボル系列が誤識別尺度の計算が用いられる可能性が低くなり、更新の対象となる識別関数パラメータの種類が多くなり、より大きなパターン認識性能向上をもたらす識別的学習が可能となる。
コンピュータに本発明で提案する識別的学習プログラムをインストールし、識別的学習装置として機能させる場合、コンピュータには請求項3に明記している正解識別関数値計算部と、不正解識別関数値計算部と、識別関数比較部と、損失関数値計算部と、制御部と、総損失値収束判定部とが構築され、これら各構成要素がコンピュータに備えられたCPUの制御指令に従って動作し、識別的学習装置として機能する。
図1に示す本発明の識別的学習装置の特徴とする構成は正解識別関数値計算部3と、不正解識別関数値計算部4の構成及び正解単語シンボル系列バイアススコア計算部6と不正解単語シンボル系列バイアススコア計算部7とを付加した点に特徴を有する。以下に各部の機能及び構成を順に説明する。ここでは音声波形を認識対象として説明するが、認識対象としては冒頭で説明したように音声に限らず静止画像、動画像等を対象とすることができる。
音声特徴量抽出部2は音声波形データを入力としてこれを分析し、特徴量を抽出する。ここでは音声特徴量を抽出し、この音声特徴量を正解識別関数値計算部3と不正解識別関数値計算部4とに出力する。
正解識別関数値計算部3は音声特徴量と、これに対応する正解単語シンボル系列集合と、正解単語シンボル系列集合の各単語シンボル系列のバイアススコアとを入力とし、各シンボル系列の中で最大の識別関数値を出力する。
不正解識別関数値計算部4は音声特徴量と、この音声特徴量に対応する正解単語シンボル系列集合と、正解単語シンボル系列集合の各単語シンボル系列のバイアススコアと、任意の不正解単語シンボル系列のバイアススコアとを入力とし、不正解シンボル系列の中で最大の識別関数値を出力する。
識別関数値比較部5は正解識別関数値計算部3と不正解識別関数値計算部4とが出力する正解識別関数値と不正解識別関数値とを入力とし、不正解識別関数値から正解識別関数値を差し引いた値を誤分類尺度による評価値として出力する。
損失関数値計算・積算部8は誤分類尺度による評価値を入力とし、これを0乃至1の間の値に変換して得られる損失値を計算し、全ての学習データにわたる損失値を積算した総和を損失値として出力する。
総損失偏導関数値計算・積算部10は損失関数値計算・積算部8が出力する総損失値を入力とし、この総損失値を識別関数パラメータの関数とした場合の偏導関数値を計算し、出力する。
識別関数パラメータ一時記憶部11は識別関数パラメータ値を記憶し、総損失値収束判定部13が収束に至らずと判定する場合は暫定的な値とし、総損失値収束判定部が収束に至ったと判定する場合は最終的な値として記憶し出力する。
総損失値収束判定部13は総損失値一時記憶部9に記憶された歴代の総損失値を入力とし、総損失値が収束に至ったか否かを判定する。収束に至ったか否かを判定するアルゴリズムとしては例えば総損失値一時記憶部9に新たな総損失値が記憶される毎に、総損失値収束判定部13は先の総損失値との差を計算し、差の値が所定値以下に至った時点で収束に至ったと判定する方法が考えられる。
以下では図2を用いて各部の動作状況を説明する。
図2において、図6に示した従来技術による識別的学習方法とは正解単語シンボル系列が複数用意されており、正解単語シンボル系列識別関数値が複数定義された正解単語シンボル系列による識別関数値の中の最大値となっている点と、代表不正解識別関数値の計算の対象から複数の正解単語シンボル系列の全てが除かれている点とが異なっている。
図2をみると、従来技術の例で代表不正解単語シンボル系列であった{‘えーと’,‘田中’, ‘太郎’,‘です’}が複数の正解単語シンボル系列の中に含まれているために代表不正解識別関数値の計算の対象から除かれ、代わって、{‘あ’,‘竹中’,‘太郎’,‘です’}が代表不正解単語シンボル系列となっている。
従来の技術では唯一の正解単語シンボル系列しか用意していなかったため、正解単語シンボル系列を用意する際、正しくは「えーと田中太郎です」と発声していた音声の特徴量情報系列に対する正解単語シンボル系列を、誤って「あの田中太郎です」としてしまった場合、正解シンボル系列についての識別関数の計算誤りを回避することができない。
つぎに、従来の技術では、式(1.7)の右辺第2項、すなわち代表不正解識別関数値の計算において、計算の対象から唯一の正解シンボル系列c~1,N~のみを除外していた(式(1.7)中のc ̄1,n≠ c~1,N~)ため、正解単語シンボル系列{‘あ’,‘田中’,‘太郎’,‘です’}に非常に類似した{‘えーと’,‘田中’,‘太郎’,‘です’}が代表不正解単語シンボル系列となっていた。
また上記発声は通常、姓名を伝えることを意図したものと考えるのが妥当であり、その場合‘あ’、‘えーと’のような単語シンボルは概念情報との関連付けに直接寄与しないフィラー・シンボルに属すると考えるのが妥当である。
つまり図6に示した従来の技術では、概念情報との関連付けに直接寄与するシンボルの識別関数パラメータは更新されないことになる。
一方本発明によれば、互いに非常に類似した単語シンボル系列が正解単語シンボル系列集合の中に含まれており、これを代表不正解シンボル系列を選択する際に候補から除外するので、正解単語シンボルと代表不正解シンボル系列とのシンボルの類似性はより小さくなり、値が更新されるパラメータの種類が大きくなる。
さらに、識別関数パラメータの総和を削減するためのパラメータの共有化を十分に行うことが出来、パターン認識と識別的学習とに要する時間がより短くなり、識別関数パラメータを格納する記憶領域がより小さくなる。
この場合、正解単語シンボル系列識別関数値、代表不正解識別関数値の計算を以下の方法により効率的に実行することが出来る。
まず、正解単語シンボル系列識別関数値はネットワーク表現による正解単語シンボル系列集合を単語シンボルを単位とするネットワークと考え、特徴量情報系列とこのネットワークとの間で識別関数値を最大化する動的計画法を実行すれば、複数の正解単語シンボル系列の一つ一つの識別関数値を計算してその最大値を求めるよりもはるかに効率的な計算が出来る。
これは単語グラフ、あるいは単語ラティスと呼ばれる表現形式を出力可能な連続音声認識によって得ることができる。
認識単語シンボル系列集合を表現するネットワークもまた一つの正規言語と考えることが可能である。
ここで正解単語シンボル系列集合、認識単語シンボル系列集合のそれぞれの正規言語同士の積集合をとる。
積集合が空(図4参照)でなければ、N-best認識結果の上位から順に積集合正規言語を受理する有限状態機械で受理可能か否かを検査し、最初に見つかった受理不可である認識単語シンボル系列の識別関数値を代表不正解識別関数値とすればよい。
上記実施形態ではパターン認識対象たる何らかの概念情報を表現する信号の特徴量情報系列として音声から抽出した特徴量情報系列を用いて説明したが、本発明はこれに限定されるものではなく、静止画像、動画像等の時間軸上、空間軸上あるいはその双方において変化し、何らかの概念情報を表現する特徴両情報系列等の他の特徴量情報系列をパターン認識対象としても、同様に本発明を適用することができるものである。具体的には、手書き文字を画像情報として読み込んでパターン認識を行う場合等においても本発明は同様に適用することができる。
図5にその音声認識装置の実施例を示す。図1と対応する部分には同一符号を付して示す。つまり、識別関数パラメータ保持部14には図1及び図2を用いて説明した識別的学習装置で学習した識別関数パラメータが保存されている。音響モデル部15はこの識別関数パラメータ保持部14に保持されている識別関数パラメータを用いて音声特徴量抽出部2が出力する特徴量情報系列が、別途指定された単語シンボル系列を表現したものであるか否かの度合い、例えば対数尤度を表わす音響スコアを計算し出力する。
単語系列探索部19は単語辞書に登録された単語シンボルからなる単語シンボル系列の中で音響スコアと言語スコアを用いて計算される総合スコア、例えば重み付き和を最大とする単語シンボル系列を探索し出力する。
認識結果表示部20は単語系列探索部19が探索した単語シンボル系列を音声認識結果として出力する。
上述した識別的学習装置及び音声認識装置はプログラム言語によって記述された識別的学習プログラム及び音声認識プログラムをコンピュータにインストールし、コンピュータに備えられたCPU(演算処理装置)でこれらのプログラムを解読し、プログラムを実行することにより実現される。
2 音声特徴量抽出部 14 識別関数パラメータ保持部
3 正解識別関数値計算部 15 音響モデル部
4 不正解識別関数値計算部 16 言語モデル部
5 識別関数値比較部 17 マイクロホン
6 正解単語シンボル系列バイアススコア計算部 18 A/D変換部
7 不正解単語シンボル系列バイアススコア計算部 19 単語系列探索部
8 損失関数値計算・積算部 20 認識結果表示部
9 総損失値一時記憶部
10 総損失偏導関数値計算・積算部
11 識別関数パラメータ一時記憶部
12 識別関数パラメータ更新計算部
Claims (8)
- コンピュータに、
予め用意された特徴量情報系列が表現する概念情報の種別を離散値で表現した複数のシンボル系列からなる正解シンボル系列集合と、前記特徴量系列を用いて識別関数値を計算し、識別関数値の最大値と、その最大値を与えるシンボル系列とを計算し格納するステップ1と、
前記特徴量情報系列をパターン認識して、その結果として認識シンボル系列集合と、この認識シンボル系列集合に含まれる各々のシンボル系列に対する識別関数値とを計算し、前記認識シンボル系列集合に含まれる各々のシンボル系列が、正解シンボル系列集合に含まれるか否かを判定するステップ2と、
前記認識シンボル系列集合に含まれるシンボル系列であって、正解シンボル系列集合に含まれない不正解単語シンボル系列から得られる識別関数値の最大値と正解スコアとから得られる誤識別尺度と、この誤識別尺度を損失関数に代入して損失値を計算し格納するステップ3と、
学習データを構成するすべての特徴量情報系列についての損失値の総和を計算し、総損失値として格納するステップ4と、
総損失値がより小さい値となるように識別関数パラメータの値を更新するステップ5と、
前記ステップ1乃至5の動作を予め設定した識別関数パラメータの初期値を用いて実行し、爾後前記ステップ1乃至ステップ5の動作を終了する毎にその時点で得られた識別関数パラメータの値を用いて演算を繰り返すステップ6と、
前記ステップ4によって得られた総損失値が収束に至ったか否かを判断し、収束に至っていれば終了して最終的な識別関数パラメータの値とし、収束に至っていなければ、再度前記ステップ6の動作を実行させることを特徴とする識別的学習方法。 - 請求項1記載の識別的学習方法において、前記特徴量情報系列が入力音声を分析することによって得られる音声特徴量情報系列であることを特徴とする識別学習方法。
- コンピュータに、
予め用意された特徴量情報系列が表現する概念情報の種別を離散値で表現した正解シンボル系列集合と、前記特徴量系列を用いて識別関数値を計算し、識別関数値の最大値と、その最大値を与えるシンボル系列とを計算し格納する正解識別関数値計算部と、
前記特徴量系列をパターン認識して、その結果として認識シンボル系列集合と、この認識シンボル系列集合に含まれる各々のシンボル系列に対する識別関数値とを計算し、前記認識シンボル系列集合に含まれる各々のシンボル系列が、正解シンボル系列集合に含まれるか否かを判定する不正解識別関数値計算部と、
前記認識シンボル系列集合に含まれるシンボル系列であって、正解シンボル系列集合に含まれない不正解単語シンボル系列から得られる識別関数値の最大値と正解スコアとから得られる誤識別尺度と、この誤識別尺度を損失関数に代入して損失値を計算し格納する識別関数比較部と、
学習データを構成するすべての特徴量情報系列についての損失値の総和を計算し、総損失値として格納する損失関数値計算・積算部と、
総損失値がより小さい値となるように識別関数パラメータの値を更新する識別関数パラメータ更新計算部と、
前記正解識別関数値計算部と、不正解識別関数値計算部と、識別関数比較部と、損失関数値計算・積算部で予め設定した識別関数パラメータの初期値を用いて演算し、爾後前記演算終了毎にその時点で得られた識別関数パラメータの値を用いて演算を実行させる制御部と、
前記損失関数計算・積算部に得られた総和損失値が収束に至ったか否かを判断し、収束に至っていれば終了して最終的な識別関数パラメータの値とし、収束に至っていなければ、再度前記制御部の動作を実行させる総損失値収束判定部とを備えることを特徴とする識別的学習装置。 - 請求項3記載の識別的学習装置において、前記特徴量情報系列が入力音声を分析することによって得られた音声特徴量情報であることを特徴とする識別的学習装置。
- 入力音声の特徴量情報系列が、別途指定された単語シンボル系列を表現したものであるか否かの度合いを表わす音響スコアを請求項2の識別的学習装置で学習した識別関数パラメータを用いて計算する音響モデル部と、
指定された単語シンボル系列の文としての言語的妥当性の度合いを表わす言語スコアを計算する言語モデル部と、
単語辞書に登録された単語シンボルからなる単語シンボル系列の中で前記音響スコアと言語スコアによって計算される総合スコアが最大となる単語シンボル系列を探索し出力する単語系列探索部と、
によって構成したことを特徴とする音声認識装置。 - コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項3または4の何れかに記載の識別的学習装置として機能させる識別的学習プログラム。
- コンピュータが解読可能なプログラム言語によって記述され、コンピュータに請求項5記載の音声認識装置として機能させる音声認識プログラム。
- コンピュータが読み取り可能な記録媒体で構成され、この記録媒体に少なくとも請求項6又は請求項7記載の識別的学習プログラム又は音声認識プログラムの何れかを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005013890A JP4533160B2 (ja) | 2005-01-21 | 2005-01-21 | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005013890A JP4533160B2 (ja) | 2005-01-21 | 2005-01-21 | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006201553A true JP2006201553A (ja) | 2006-08-03 |
JP4533160B2 JP4533160B2 (ja) | 2010-09-01 |
Family
ID=36959592
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005013890A Expired - Fee Related JP4533160B2 (ja) | 2005-01-21 | 2005-01-21 | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4533160B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010164780A (ja) * | 2009-01-15 | 2010-07-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成装置、音響モデル作成方法、音響モデル作成プログラム |
JP2010250161A (ja) * | 2009-04-17 | 2010-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 相違度利用型識別的学習装置とその方法、そのプログラム |
JP2011039432A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム |
JP2012118441A (ja) * | 2010-12-03 | 2012-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成方法とその装置とプログラム |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09245125A (ja) * | 1996-03-06 | 1997-09-19 | Toshiba Corp | パターン認識装置及び同装置における辞書修正方法 |
JPH10198395A (ja) * | 1997-01-10 | 1998-07-31 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 統計的言語モデル生成装置及び音声認識装置 |
JPH10319986A (ja) * | 1997-05-16 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成方法 |
JPH1196306A (ja) * | 1997-09-18 | 1999-04-09 | Toshiba Corp | パターン認識辞書学習方法 |
JP2000003190A (ja) * | 1998-06-17 | 2000-01-07 | Nec Corp | 音声モデル学習装置及び音声認識装置 |
JP2000172294A (ja) * | 1998-12-07 | 2000-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、その装置及びプログラム記録媒体 |
JP2002251592A (ja) * | 2001-02-22 | 2002-09-06 | Toshiba Corp | パターン認識辞書学習方法 |
-
2005
- 2005-01-21 JP JP2005013890A patent/JP4533160B2/ja not_active Expired - Fee Related
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09245125A (ja) * | 1996-03-06 | 1997-09-19 | Toshiba Corp | パターン認識装置及び同装置における辞書修正方法 |
JPH10198395A (ja) * | 1997-01-10 | 1998-07-31 | Atr Onsei Honyaku Tsushin Kenkyusho:Kk | 統計的言語モデル生成装置及び音声認識装置 |
JPH10319986A (ja) * | 1997-05-16 | 1998-12-04 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成方法 |
JPH1196306A (ja) * | 1997-09-18 | 1999-04-09 | Toshiba Corp | パターン認識辞書学習方法 |
JP2000003190A (ja) * | 1998-06-17 | 2000-01-07 | Nec Corp | 音声モデル学習装置及び音声認識装置 |
JP2000172294A (ja) * | 1998-12-07 | 2000-06-23 | Nippon Telegr & Teleph Corp <Ntt> | 音声認識方法、その装置及びプログラム記録媒体 |
JP2002251592A (ja) * | 2001-02-22 | 2002-09-06 | Toshiba Corp | パターン認識辞書学習方法 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010164780A (ja) * | 2009-01-15 | 2010-07-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成装置、音響モデル作成方法、音響モデル作成プログラム |
JP2010250161A (ja) * | 2009-04-17 | 2010-11-04 | Nippon Telegr & Teleph Corp <Ntt> | 相違度利用型識別的学習装置とその方法、そのプログラム |
JP2011039432A (ja) * | 2009-08-18 | 2011-02-24 | Nippon Telegr & Teleph Corp <Ntt> | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム |
JP2012118441A (ja) * | 2010-12-03 | 2012-06-21 | Nippon Telegr & Teleph Corp <Ntt> | 音響モデル作成方法とその装置とプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4533160B2 (ja) | 2010-09-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4860265B2 (ja) | テキスト処理方法/プログラム/プログラム記録媒体/装置 | |
JP4215418B2 (ja) | 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム | |
JP6831343B2 (ja) | 学習装置、学習方法及び学習プログラム | |
US20050010412A1 (en) | Phoneme lattice construction and its application to speech recognition and keyword spotting | |
JP5294086B2 (ja) | 重み係数学習システム及び音声認識システム | |
US20160180839A1 (en) | Voice retrieval apparatus, voice retrieval method, and non-transitory recording medium | |
JP5861649B2 (ja) | モデル適応化装置、モデル適応化方法およびモデル適応化用プログラム | |
US20110218805A1 (en) | Spoken term detection apparatus, method, program, and storage medium | |
US20100100379A1 (en) | Voice recognition correlation rule learning system, voice recognition correlation rule learning program, and voice recognition correlation rule learning method | |
JPWO2009025356A1 (ja) | 音声認識装置および音声認識方法 | |
WO2010100853A1 (ja) | 言語モデル適応装置、音声認識装置、言語モデル適応方法、及びコンピュータ読み取り可能な記録媒体 | |
JP6031316B2 (ja) | 音声認識装置、誤り修正モデル学習方法、及びプログラム | |
US20090055177A1 (en) | Apparatus and method for generating noise adaptive acoustic model for environment migration including noise adaptive discriminative adaptation method | |
JP4533160B2 (ja) | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 | |
JP5740368B2 (ja) | 識別的音声認識精度推定装置、識別的音声認識精度推定方法、プログラム | |
KR101483947B1 (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP6027754B2 (ja) | 適応化装置、音声認識装置、およびそのプログラム | |
JP5079760B2 (ja) | 音響モデルパラメータ学習装置、音響モデルパラメータ学習方法、音響モデルパラメータ学習プログラム | |
JP5980142B2 (ja) | 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム | |
JP5738216B2 (ja) | 特徴量補正パラメータ推定装置、音声認識システム、特徴量補正パラメータ推定方法、音声認識方法及びプログラム | |
KR20090065102A (ko) | 어휘 디코딩 방법 및 장치 | |
JP5308102B2 (ja) | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 | |
WO2010024052A1 (ja) | 音声認識仮説検証装置、音声認識装置、それに用いられる方法およびプログラム | |
JP2018025717A (ja) | 音声認識精度推定装置、音声認識精度推定方法及び音声認識精度推定プログラム | |
JP5679345B2 (ja) | 音声認識精度推定装置、音声認識精度推定方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061225 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070130 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100204 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100209 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100330 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100601 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100611 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4533160 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130618 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140618 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |