JP2009210976A - 音声認識装置、方法、プログラム及びその記録媒体 - Google Patents
音声認識装置、方法、プログラム及びその記録媒体 Download PDFInfo
- Publication number
- JP2009210976A JP2009210976A JP2008055978A JP2008055978A JP2009210976A JP 2009210976 A JP2009210976 A JP 2009210976A JP 2008055978 A JP2008055978 A JP 2008055978A JP 2008055978 A JP2008055978 A JP 2008055978A JP 2009210976 A JP2009210976 A JP 2009210976A
- Authority
- JP
- Japan
- Prior art keywords
- state
- likelihood
- max
- storage unit
- self
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
【解決手段】フレーム数決定部90が、フレーム数Kを状態jごとに適宜定める。例えば、尤度計算率qjが高いほど、状態jのフレーム数Kを大きくする。状態尤度計算部31が、状態jのフレームtについての状態状態尤度bj(Xt)を計算するときに、状態jのフレームt+1,…,t+Kについての状態尤度bj(Xt+1),…,bj(Xt+K)をついでに計算して状態尤度記憶部80に格納する。状態尤度参照部32が、状態尤度bj(Xt+1),…,bj(Xt+K)の何れかが必要になったときに、状態尤度記憶部80を参照して、その状態尤度を求める。
【選択図】図1
Description
入力音声が、音響分析部10に入力される。音響分析部10は、入力音声から、一定時間長のフレームごとに特徴量ベクトルを計算し、特徴量ベクトルの時系列を生成する。生成された特徴量ベクトルの時系列は、探索部30’に送られる。
探索部30’は、音響モデル記憶部40から読み込んだ音響モデルを用いて、文法記憶部50から読み出した文法で表現される単語又は単語列と特徴量ベクトルの時系列との照合を行い、すなわち探索処理を行い、最も尤度が高い単語又は単語列を認識結果として出力する。
monophone−HMMは、中心音素に先行する音素と後続する音素の両方を音素環境として考慮しない音素環境非依存型の音素HMMである。例えば、音素aのmonophone−HMMは、*を任意の音素として、*−a−*と表すことができる。
monophone−HMMよりもbiphone−HMMの方が、また、biphone−HMMよりもtriphone−HMMの方が音素環境を詳細に表現したモデルである。
音素HMMで表現される音素カテゴリの種類の数は、音響モデルの学習データに依存するが、t−t−t等の日本語の音素連鎖としてあり得ないものは除かれるため、一般的には数千から数万程度になる。
状態Sは、図8に例示するように、混合確率分布として表現される。混合確率分布の各要素分布には、離散確率分布と連続確率分布があるが、現在最もよく用いられているのは、連続確率分布の1つである多次元正規分布(多次元ガウス分布ともいう。)である。その内でも次元間の相関がない、すなわち共分散行列の対角成分が0である多次元無相関正規分布が最もよく用いられている。多次元正規分布の各次元は、特徴量ベクトルの各次元に対応する。
図8に例示するような状態Sの数個から十数個程度の確率連鎖によって、音素HMMが構成される。音素HMMが、いくつの状態のどのような確率連鎖によって構成されるかには、様々なバリエーションがある。また、音素HMMごとに異なる構造を取ることもある。
以下、非特許文献4に記載された状態尤度bj(Xt)を求める処理の高速化の手法について説明する。非特許文献4の手法は、以下の2つの実験的事実に基づいて状態尤度bj(Xt)を求める処理の高速化を実現している。
鹿野清宏,外4名,「IT Text 音声認識システム」,オーム社,2001年5月,p.1−51 安藤彰男,「リアルタイム音声認識」,(社)電子情報通信学会,2003年9月,p.1−58,p.125−170 嵯峨山茂樹,外4名,「音声認識における新しい高速化」,日本音響学会講演論文集,1−5−12,平成8年3月,p.25−28 M.Saraclar,外3名,「Towards automatic closed captioning: low latency real time broadcast news transcription」,Proc.ICSLP’02,2002年9月,p.1741−1744
非特許文献4の手法においては、Kの値は諸事情を考慮せずに固定されていたため、状態尤度の無駄な計算が行われていた可能性がある。このため、音声認識処理を十分に高速化できていない可能性があった。
以下、図面を参照してこの発明の実施形態の例を説明する。背景技術と同様な部分については、同じ符号をつけて重複説明を略する。
第一実施形態は、音声認識処理の対象となる目的音声と音響的に近い性質を有する音声(以下、適応先データ、開発用データともいう。)が得られる場合の実施形態である。
開発用データに対して、バッチ状態尤度計算を行わない通常の状態尤度計算により音声認識処理を行い、例えば状態尤度テーブルを得ることにより、全フレームにおける状態尤度の計算が行われたフレームの割合(以下、尤度計算率qjという。)を状態jごとに求める。この尤度計算率qjが高い状態jほど、あるフレームtについての状態尤度bj(Xt)が計算された場合に、次のフレームt+1についての状態尤度bj(Xt+1)が計算される可能性が高いと考えることができる。
このように、ついでに状態尤度が計算されるフレーム数Kを状態ごとに適宜異ならせることにより、状態尤度の無駄な計算処理の量を少なくすることができる。したがって、従来よりも音響尤度の計算を高速化することができ、音声認識処理を高速化することができる。
第一実施形態の音声認識装置100は、図1において実線で示す、音響分析部10、特徴量ベクトル記憶部20、探索部30、音響モデル記憶部40、文法記憶部50、フェッチ部60、状態パラメータ記憶部70、状態尤度記憶部80及びフレーム数決定部90を例えば含む。探索部30は、状態尤度計算部31及び状態尤度参照部32を例えば含む。フレーム数決定部90は、尤度計算率計算部92、尤度計算率フレーム数決定部93を例えば含む。
入力音声が、音響分析部10に入力される。音響分析部10は、入力音声から、一定時間長のフレームごとに特徴量ベクトルXtを計算し、特徴量ベクトルXtの時系列を生成する。生成された特徴量ベクトルXtの時系列は、特徴量ベクトル記憶部20に送られる。
特徴量ベクトル記憶部20は、例えば一時的に特徴量ベクトルXtを記憶するバッファである。
フェッチ部60は、状態尤度計算部31が状態jのフレームtについての状態尤度bj(Xt)を計算する前に、状態jの状態パラメータを、音響モデルが記憶された音響モデル記憶部40から読み込み、状態パラメータ記憶部70に格納する。
状態パラメータとは、状態尤度Bj(Xt)を計算するために必要な数値のことであり、例えば、背景技術の欄の式(2)で登場する分布重みWjm(m=1,…,mj)、式(4)で登場する平均μjmi(m=1,…,mj,i=1,…,I),分散σjmi 2(m=1,…,mj,i=1,…,I)である。
尤度計算率計算部92は、開発用データに対して、バッチ状態尤度計算を行わない通常の状態尤度計算により音声認識処理を行い、尤度計算率qjを状態jごとに求める。尤度計算率qjは、尤度計算率フレーム数決定部93に送られる。
尤度計算率フレーム数決定部93は、尤度計算率qjが高い状態jほど大きい整数KB(j)を決定する。KB(j)は、状態尤度計算部31に送られる。
例えば、qlを0以上1以下の数、qhをql以上1以下の数、Kminを0以上の整数、KmaxをKmin+1以上の整数、f(・)を・の小数点以下を切り捨てして整数を出力する関数として、KB(j)を以下の式により求めることができる。ql,qh,Kmin及びKmaxは、目的音声、ハードウェアの性能及び目標とする音声認識処理速度等に応じて適宜に予め定められた数である。例えば、qlは0.2から0.3、qhは0.7から0.8、Kminは3から4、Kmaxは10から12に設定される。
状態尤度計算部31は、状態パラメータ記憶部70から読み込んだ状態jのパラメータと、特徴量ベクトル記憶部20から読み込んだフレームtの特徴量ベクトルXtとを用いて、状態jのフレームtについての状態尤度bj(Xt)を計算する。また、これと共に、状態パラメータ記憶部70から読み込んだ状態jのパラメータと、特徴量ベクトル記憶部20から読み込んだフレームt+1,…,t+Kの特徴量ベクトルXt+1,…,Xt+Kとを用いて、状態jのフレームt+1,…,t+Kについての状態尤度bj(Xt+1),…,bj(Xt+K)を更に計算する。
探索部30が音響尤度を計算するために状態尤度bj(Xt+1),…,bj(Xt+K)の何れかが必要になったときに、状態尤度参照部32は状態尤度記憶部80を参照してその状態尤度を求める。
探索部30は、状態尤度参照部32が求めた状態尤度を用いて、背景技術と同様に、音響尤度を計算して、音声認識結果を出力する。
第一実施形態は、尤度計算率qjと共に音素HMMの各状態の自己遷移確率ajjを用いる。/a/等の母音の継続長は、/p/等の子音の継続長よりも通常長い。このため、中心音素が母音である音素HMMの各状態の自己遷移確率は、中心音素が子音である音素HMMの各状態の自己遷移確率よりも大きくなる。自己遷移確率が高い状態jほど、あるフレームtについての状態尤度bj(Xt)の計算が行われた場合に、次のフレームt+1についての状態尤度bj(Xt)の計算が行われる可能性が高いと考えることができる。
すなわち、第二実施形態においては、自己遷移確率ajjと尤度計算率qjの両方を考慮して、フレーム数Kを決定する。
第二実施形態の音声認識装置のフレーム数決定部90は、尤度計算率計算部92、尤度計算率フレーム数決定部93に加えて、図1において破線で示す、自己遷移確率フレーム数決定部91及び統合フレーム数決定部94を例えば含む。
尤度計算率フレーム数決定部93は、第一実施形態と同様に尤度計算率qjが高いほど大きい整数KB(j)を決定する。KB(j)は、統合フレーム数決定部94に送られる。第一実施形態とは異なり、KB(j)がKとしてそのまま状態尤度計算部31には送られない。すなわち、第二実施形態においては、一律にK=KB(j)とはならず、後述するステップS7の処理によりKは定められる。
フレーム数決定部90の自己遷移確率フレーム数決定部91は、音響モデル記憶部40から読み込まれた状態jの自己遷移確率ajjを用いて、その自己遷移確率ajjが高いほど、大きい整数KA(j)を決定する。KA(j)についての情報は、統合フレーム数決定部94に送られる。
統合フレーム数決定部94は、KA(j)とKB(j)との両方を考慮して、フレーム数Kを決定する。決定されたフレーム数Kは、状態尤度計算部31に送られる。例えば、f(・)を・の小数点以下を切り捨てして整数を出力する関数、重み係数λを0以上1以下の予め定められた数として、下記の、KA(j)とKB(j)の線形補間式に基づいて、Kを求めてもよい。
K=f((1−λ)KA(j)−λKB(j))
λは、KB(j)にどの程度信頼をおくかを調整する重み係数である。手に入る開発データの量が多い等の理由によりKB(j)に信頼がおけると考えられる場合には、重み係数λに1に近い値を与え、逆の場合には、重み係数λには0に近い値を与える。
上記の例では、f(・)を・の小数点以下を切り捨てして整数を出力する関数としたが、f(・)を、・の小数点以下を切り上げして整数を出力する関数、又は、・の小数点以下を四捨五入して整数を出力する関数としてもよい。
上述の構成をコンピュータによって実現する場合、音声認識装置の各部が有する機能の処理内容はプログラムによって記述される。そして、このプログラムを図5に例示するコンピュータで実行することにより、上記各部の機能がコンピュータ上で実現される。
−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
20 特徴量ベクトル記憶部
30 探索部
31 状態尤度計算部
32 状態尤度参照部
40 音響モデル記憶部
50 文法記憶部
60 フェッチ部
70 状態パラメータ記憶部
80 状態尤度記憶部
90 フレーム数決定部
91 自己遷移確率フレーム数決定部
92 尤度計算率計算部
93 尤度計算率フレーム数決定部
94 統合フレーム数決定部
Claims (10)
- 状態パラメータ、自己遷移確率を含む音響モデルを記憶する音響モデル記憶部と、
上記音響モデル記憶部よりも高速な状態パラメータ記憶部と、
入力された音声から一定時間長のフレームごとに特徴量ベクトルを求め、特徴量ベクトルの時系列を求める音響分析部と、
上記求まった特徴量ベクトルの時系列を記憶する特徴量ベクトル記憶部と、
j,tをそれぞれ任意の整数、ある状態jがフレームtの特徴量ベクトルXtを出力する確率を状態尤度bj(Xt)として、状態尤度bj(Xt)が計算される前に、状態jの状態パラメータを上記音響モデル記憶部から上記状態パラメータ記憶部に読み込むフェッチ部と、
処理の対象となる目的音声と近い音響的な性質を有する音声に対して行った音声認識処理において、全フレームにおける状態尤度の計算が行われたフレームの割合(以下、尤度計算率qjとする。)を状態ごとに求める尤度計算率計算部と、
上記求まった尤度計算率qjが高い状態ほど、大きい整数KB(j)をフレーム数Kとして決定する尤度計算率フレーム数決定部と、
上記状態パラメータ記憶部から読み込んだ状態jの状態パラメータと、上記特徴量ベクトル記憶部から読み込んだ特徴量ベクトルXtとを用いて状態尤度bj(Xt)を計算すると共に、上記状態パラメータ記憶部から読み込んだ状態jの状態パラメータと、上記特徴量ベクトル記憶部から読み込んだ特徴量ベクトルXt+1,…,Xt+Kとを用いて、状態尤度bj(Xt+1),…,bj(Xt+K)を更に計算する状態尤度計算部と、
上記更に計算された状態尤度bj(Xt+1),…,bj(Xt+K)を格納する状態尤度記憶部と、
状態尤度bj(Xt+1),…,bj(Xt+K)の何れかが必要になったときに、上記状態尤度記憶部を参照して、その状態尤度を求める状態尤度参照部と、
を有する音声認識装置。 - 請求項1に記載の音声認識装置において、
qlを予め定められた0以上1以下の数、qhを予め定められたql以上1以下の数、Kminを予め定められた0以上の整数、KmaxをKmin+1以上の予め定められた整数として、
上記尤度計算率フレーム数決定部は、
尤度計算率qjがqlより下であればKB(j)=Kminとし、
尤度計算率qjがqlより上qhより下であればKB(j)=f((Kmax−Kmin)qjj/(qh−ql))+((Kminah−Kmaxql)/(qh−ql)))とし、
尤度計算率qjがqhより上であればKB=Kmaxとし、
尤度計算率qj=qlであればKB(j)=Kmin又はKB(j)=f((Kmax−Kmin)qj/(qh−ql))+((Kminqh−Kmaxql)/(qh−ql)))とし、
自己遷移確率qj=qhであればKB(j)=Kmax又はKB(j)=f((Kmax−Kmin)qj/(qh−ql))+((Kminqh−Kmaxql)/(qh−ql)))
とする部である、
ことを特徴とする音声認識装置。 - 請求項1又は2に記載の音声認識装置において、
上記音響モデル記憶部から読み込んだ上記状態jの自己遷移確率ajjが高いほど、大きい整数KA(j)を決定する自己遷移確率フレーム数決定部と、
f(・)を・の小数点以下を切り捨て、切り上げ、四捨五入の何れかをして整数を出力する関数、重み係数λを0以上1以下の予め定められた数として、K=f((1−λ)KA(j)−λKB(j))とする統合フレーム数決定部と、
を更に備える音声認識装置。 - 請求項3に記載の音声認識装置において、
alを予め定められた0以上1以下の数、ahを予め定められたal以上1以下の数、Kminを予め定められた0以上の整数、KmaxをKmin+1以上の予め定められた整数、f(・)を・の小数点以下を切り捨て、切り上げ、四捨五入の何れかをして整数を出力する関数として、
上記自己遷移確率フレーム数決定部は、
自己遷移確率ajjがalより下であれば、KA(j)=Kminとし、
自己遷移確率ajjがalより上ahより下であれば、KA(j)=f((Kmax−Kmin)ajj/(ah−al))+((Kminah−Kmaxal)/(ah−al)))とし、
自己遷移確率ajjがahより上であれば、KA=Kmaxとし、
自己遷移確率ajj=alであれば、KA(j)=Kmin又はKA(j)=f((Kmax−Kmin)ajj/(ah−al))+((Kminah−Kmaxal)/(ah−al)))とし、
自己遷移確率ajj=ahであれば、KA(j)=Kmax又はKA(j)=f((Kmax−Kmin)ajj/(ah−al))+((Kminah−Kmaxal)/(ah−al)))
とする部である、
ことを特徴とする音声認識装置。 - 音響モデル記憶部を、状態パラメータ、自己遷移確率を含む音響モデルを記憶する記憶部とし、
状態パラメータ記憶部を、上記音響モデル記憶部よりも高速な記憶部とし、
音響分析部が、入力された音声から一定時間長のフレームごとに特徴量ベクトルを求め、特徴量ベクトルの時系列を特徴量ベクトル記憶部に格納する音響分析ステップと、
フェッチ部が、j,tをそれぞれ任意の整数、ある状態jがフレームtの特徴量ベクトルXtを出力する確率を状態尤度bj(Xt)として、状態尤度bj(Xt)が計算される前に、状態jの状態パラメータを上記音響モデル記憶部から上記状態パラメータ記憶部に読み込むフェッチステップと、
尤度計算率計算部が、処理の対象となる目的音声と近い音響的な性質を有する音声に対して行った音声認識処理において、全フレームにおける状態尤度の計算が行われたフレームの割合(以下、尤度計算率qjとする。)を状態ごとに求める尤度計算率計算ステップと、
尤度計算率フレーム数決定部が、上記求まった尤度計算率qjが高い状態ほど、大きい整数KB(j)をフレーム数Kとして決定する尤度計算率フレーム数決定ステップと、
状態尤度計算部が、上記状態パラメータ記憶部から読み込んだ状態jの状態パラメータと、上記特徴量ベクトル記憶部から読み込んだ特徴量ベクトルXtとを用いて状態尤度bj(Xt)を計算すると共に、上記状態パラメータ記憶部から読み込んだ状態jの状態パラメータと、上記特徴量ベクトル記憶部から読み込んだ特徴量ベクトルXt+1,…,Xt+Kとを用いて、状態尤度bj(Xt+1),…,bj(Xt+K)を更に計算して、それらの更に計算された状態尤度bj(Xt+1),…,bj(Xt+K)を状態尤度記憶部に格納する状態尤度計算ステップと、
状態尤度参照部が、状態尤度bj(Xt+1),…,bj(Xt+K)の何れかが必要になったときに、上記状態尤度記憶部を参照して、その状態尤度を求める状態尤度参照ステップと、
を有する音声認識方法。 - 請求項5に記載の音声認識方法において、
qlを予め定められた0以上1以下の数、qhを予め定められたql以上1以下の数、Kminを予め定められた0以上の整数、KmaxをKmin+1以上の予め定められた整数として、
上記尤度計算率フレーム数決定ステップは、
尤度計算率qjがqlより下であればKB(j)=Kminとし、
尤度計算率qjがqlより上qhより下であればKB(j)=f((Kmax−Kmin)qjj/(qh−ql))+((Kminah−Kmaxql)/(qh−ql)))とし、
尤度計算率qjがqhより上であればKB=Kmaxとし、
尤度計算率qj=qlであればKB(j)=Kmin又はKB(j)=f((Kmax−Kmin)qj/(qh−ql))+((Kminqh−Kmaxql)/(qh−ql)))とし、
自己遷移確率qj=qhであればKB(j)=Kmax又はKB(j)=f((Kmax−Kmin)qj/(qh−ql))+((Kminqh−Kmaxql)/(qh−ql)))
とするステップである、
ことを特徴とする音声認識方法。 - 請求項5又は6に記載の音声認識方法において、
自己遷移確率フレーム数決定部が、上記音響モデル記憶部から読み込んだ上記状態jの自己遷移確率ajjが高いほど、大きい整数KA(j)を決定する自己遷移確率フレーム数決定ステップ、
を更に有することを特徴とする音声認識方法 - 請求項7に記載の音声認識方法において、
alを予め定められた0以上1以下の数、ahを予め定められたal以上1以下の数、Kminを予め定められた0以上の整数、KmaxをKmin+1以上の予め定められた整数、f(・)を・の小数点以下を切り捨て、切り上げ、四捨五入の何れかをして整数を出力する関数として、
上記自己遷移確率フレーム数決定ステップは、
自己遷移確率ajjがalより下であれば、KA(j)=Kminとし、
自己遷移確率ajjがalより上ahより下であれば、KA(j)=f((Kmax−Kmin)ajj/(ah−al))+((Kminah−Kmaxal)/(ah−al)))とし、
自己遷移確率ajjがahより上であれば、KA=Kmaxとし、
自己遷移確率ajj=alであれば、KA(j)=Kmin又はKA(j)=f((Kmax−Kmin)ajj/(ah−al))+((Kminah−Kmaxal)/(ah−al)))とし、
自己遷移確率ajj=ahであれば、KA(j)=Kmax又はKA(j)=f((Kmax−Kmin)ajj/(ah−al))+((Kminah−Kmaxal)/(ah−al)))
とするステップである、
ことを特徴とする音声認識方法。 - 請求項1から4の何れかに記載の音声認識装置の各部としてコンピュータを機能させるための音声認識プログラム。
- 請求項9に記載の音声認識プログラムが記録されたコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008055978A JP4801108B2 (ja) | 2008-03-06 | 2008-03-06 | 音声認識装置、方法、プログラム及びその記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008055978A JP4801108B2 (ja) | 2008-03-06 | 2008-03-06 | 音声認識装置、方法、プログラム及びその記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2009210976A true JP2009210976A (ja) | 2009-09-17 |
JP4801108B2 JP4801108B2 (ja) | 2011-10-26 |
Family
ID=41184168
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008055978A Expired - Fee Related JP4801108B2 (ja) | 2008-03-06 | 2008-03-06 | 音声認識装置、方法、プログラム及びその記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4801108B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102436815A (zh) * | 2011-09-13 | 2012-05-02 | 东南大学 | 一种应用于英语口语网络机考系统的语音识别装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000242295A (ja) * | 1999-02-24 | 2000-09-08 | Mitsubishi Electric Corp | 音声認識装置および音声対話装置 |
JP2004272251A (ja) * | 2003-03-04 | 2004-09-30 | Microsoft Corp | ブロック同期復号 |
-
2008
- 2008-03-06 JP JP2008055978A patent/JP4801108B2/ja not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000242295A (ja) * | 1999-02-24 | 2000-09-08 | Mitsubishi Electric Corp | 音声認識装置および音声対話装置 |
JP2004272251A (ja) * | 2003-03-04 | 2004-09-30 | Microsoft Corp | ブロック同期復号 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102436815A (zh) * | 2011-09-13 | 2012-05-02 | 东南大学 | 一种应用于英语口语网络机考系统的语音识别装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4801108B2 (ja) | 2011-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20080077404A1 (en) | Speech recognition device, speech recognition method, and computer program product | |
US20070067171A1 (en) | Updating hidden conditional random field model parameters after processing individual training samples | |
JP2006510933A (ja) | センサ・ベース音声認識装置の選択、適応、および組合せ | |
JP5752060B2 (ja) | 情報処理装置、大語彙連続音声認識方法及びプログラム | |
JP2010152751A (ja) | 統計モデル学習装置、統計モデル学習方法、およびプログラム | |
JP2005208648A (ja) | スイッチング状態空間モデルによるマルチモーダル的変分推論を使用して音声を認識する方法 | |
JP6552999B2 (ja) | テキスト補正装置、テキスト補正方法、およびプログラム | |
JP5180800B2 (ja) | 統計的発音変異モデルを記憶する記録媒体、自動音声認識システム及びコンピュータプログラム | |
JP7409381B2 (ja) | 発話区間検出装置、発話区間検出方法、プログラム | |
WO2019107170A1 (ja) | 緊急度推定装置、緊急度推定方法、プログラム | |
JP4705557B2 (ja) | 音響モデル生成装置、方法、プログラム及びその記録媒体 | |
JP2009128490A (ja) | 学習データ選択装置、学習データ選択方法、プログラムおよび記録媒体、音響モデル作成装置、音響モデル作成方法、プログラムおよび記録媒体 | |
JP2006293033A (ja) | 混合分布hmmの状態の出力確率計算方法および装置 | |
JP4881357B2 (ja) | 音響モデル作成装置、その装置を用いた音声認識装置、これらの方法、これらのプログラム、およびこれらの記録媒体 | |
JP4950600B2 (ja) | 音響モデル作成装置、その装置を用いた音声認識装置、これらの方法、これらのプログラム、およびこれらの記録媒体 | |
JP2007078943A (ja) | 音響スコア計算プログラム | |
JP4801108B2 (ja) | 音声認識装置、方法、プログラム及びその記録媒体 | |
JP2007249051A (ja) | 音響モデル作成装置、音響モデル作成方法、そのプログラムおよびその記録媒体 | |
JP4801107B2 (ja) | 音声認識装置、方法、プログラム及びその記録媒体 | |
JP4729078B2 (ja) | 音声認識装置とその方法と、プログラムとその記録媒体 | |
JP4537970B2 (ja) | 言語モデル作成装置、言語モデル作成方法、そのプログラムおよびその記録媒体 | |
JP5982265B2 (ja) | 音声認識装置、音声認識方法、およびプログラム | |
JP2005156593A (ja) | 音響モデル作成方法、音響モデル作成装置、音響モデル作成プログラムおよび音声認識装置 | |
JP5369079B2 (ja) | 音響モデル作成方法とその装置とプログラム | |
JP5166195B2 (ja) | 音響分析パラメータ生成方法とその装置と、プログラムと記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110624 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110726 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110804 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140812 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |