JP5513439B2 - 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム - Google Patents

単語関連度テーブル作成装置とその方法と音声認識装置とプログラム Download PDF

Info

Publication number
JP5513439B2
JP5513439B2 JP2011118144A JP2011118144A JP5513439B2 JP 5513439 B2 JP5513439 B2 JP 5513439B2 JP 2011118144 A JP2011118144 A JP 2011118144A JP 2011118144 A JP2011118144 A JP 2011118144A JP 5513439 B2 JP5513439 B2 JP 5513439B2
Authority
JP
Japan
Prior art keywords
word
occurrences
words
relevance
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011118144A
Other languages
English (en)
Other versions
JP2012247555A (ja
Inventor
太一 浅見
浩和 政瀧
義和 山口
哲 小橋川
済央 野本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2011118144A priority Critical patent/JP5513439B2/ja
Publication of JP2012247555A publication Critical patent/JP2012247555A/ja
Application granted granted Critical
Publication of JP5513439B2 publication Critical patent/JP5513439B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

この発明は、音声認識結果の確からしさを表す認識信頼度の計算に用いる単語関連度テーブルを作成する単語関連度テーブル作成装置と、その方法と、単語関連度テーブルを用いた音声認識装置と、プログラムに関する。
音声認識結果の確からしさを表す認識信頼度を算出するための従来技術として、音声文書認識結果内の単語の文脈的な一貫性を、信頼度計算に利用する方法がある(非特許文献1)。この方法は、文脈的な一貫性を音声文書内の各単語ペアの関連度の平均値を算出して利用する。単語xとyの関連度S(x,y)として自己相互情報量(PMI:Pointwise Mutual Information)の値を用いる。
式(1)に単語xとyの関連度S(x,y)の計算を示す。
Figure 0005513439
ここで、Nは単語集合の個数、C(x,y)は単語xとyが共に含まれる単語集合の個数、C(x),C(y)は、それぞれ単語xが含まれる単語集合の個数と単語yが含まれる単語集合の個数である。
自己相互情報量PMI(x,y)の値は、単語xとyに関連が無い(独立に現れる)場合に0、一方の単語が現れた時に他方も現れ易い(独立よりも共起し易い)傾向がある場合に正の値、一方の単語が現れた時に他方が現れ難い(独立よりも共起し難い)傾向がある場合に負の値となる。傾向が強くなるにつれて、正の値の場合、負の値の場合、共に絶対値が大きくなる。
この自己相互情報量PMI(x,y)は、取り扱う単語集合の全ての単語間の関連度として単語関連度テーブル作成装置によって計算される。図9に、従来の単語関連度テーブル作成装置900の機能構成例を示してその動作を簡単に説明する。単語関連度テーブル作成装置900は、学習コーパス90と、形態素解析部91と、学習コーパス単語集合取得部92と、単語リスト93と、単語カウント部94と、単語関連度計算部95と、テーブル配列部96と、を具備する。
学習コーパス90は音声文書を大規模に集積したものである。形態素解析部91は、学習コーパス90から音声文書を読み出して単語に分割する周知の形態素解析処理を行い、各単語の前後に単語境界を表す記号、例えば「\n」を付与した単語境界付き学習コーパスを出力する。
学習コーパス単語集合取得部92は、形態素解析部91が出力する単語境界付き学習コーパスの先頭から末尾まで、窓幅n単語、窓シフト量m単語で窓かけを行い、各窓に含まれる単語リスト93に記載された単語をまとめて単語集合とし、窓ごとの単語集合を出力する。単語リスト93は、音声認識結果に出現し得る全ての単語が記載されたものであり、事前に作成しておく。図10に、単語集合を概念的に示す。横方向は時間経過であり、単語集合をN1〜Nhで示す。mは窓シフト量であり、nは窓幅である。隣り合う単語集合は、n-m個の単語を共有する関係にある。
単語カウント部94は、学習コーパス単語集合取得部92が出力する単語集合を入力として、単語集合内の各単語の単独生起回数C(w)、各単語ペアの生起回数C(wi,wj)、単語集合の個数Nをカウントして出力する。単語wの生起回数C(w)とは、単語wを含む単語集合の個数である。単語ペア(wi,wj)の生起回数C(wi,wj)とは、wiとwjを共に含む単語集合の個数である。
単語関連度計算部95は、各単語ペア(wi,wj)の関連度S(wi,wj)を例えば上記した式(1)で計算する。テーブル配列部96は、単語wiとwjから計算した関連度S(wi,wj)を参照できるテーブルの形式に配列する。図11に単語関連度テーブル97の一例を示す。最上列と最左列は単語w1〜wNであり、各行と各列の交差する欄にそれぞれの単語の関連度S(wi,wj)が配列される。
浅見太一、小橋川哲、山口義和、政瀧浩和、高橋敏、「単語の文脈一貫性と音響尤度を用いた音声ドキュメント認識信頼度推定」信学技報、電子情報通信学会、2010年7月 Gang Guo他、「A COMPARATIVE STUDY ON VARIOUS CONFIDENCE MEASURES IN LARGE VOCABULARY SPEECH RECOGNITION」 International Symposium on Chinese Spoken Language Processing(ISCSLP 2004) December 15-18,2004 I.J.Good 「The Population Frequencies of Species and the Estimation of Population Parameters」,http://www.jstor.org Thu Feb 7 2008
関連度S(wi,wj)を表す自己相互情報量PMI(x,y)には2つの問題がある。その1つは、共起頻度0回の単語ペアの自己相互情報量PMI(x,y)の計算が出来ない。C(x,y)=0の時、PMI(x,y)=-∞となる。計算機では-∞を表現できないため、関連度が不明であることを示す0が一般的に用いられる。例えば、単語xとyが多数出現しており、かつ共起していない場合(例えばC(x)=C(y)=10000,C(x,y)=0)は、単語xとyは非常に共起し難いと考えられるため、自己相互情報量PMI(x,y)は大きな負の値とすべきであるが、上記したようにPMI(x,y)=0となってしまう。このような自己相互情報量PMI(x,y)を用いて音声文書認識結果の信頼度を計算すると、実際には認識精度が低いのに信頼度の値が高く算出されてしまう場合がある。
2つ目は、頻度の低い単語同士が共起した場合に自己相互情報量PMI(x,y)の値が非常に大きくなる問題がある。例えば、N=500000の時、単語xとyが1回ずつしか現れず、且つ共起していた(C(x)=C(y)=C(x,y)=1)場合、PMI(x,y)=log(500000)となる。一方、単語xとyが50回ずつ現れ、且つ常に共起していた(C(x)=C(y)=C(x,y)=50)場合、1回ずつしか現れない場合よりもxとyの関連度は強いと言えるにも関わらず、PMI(x,y)=log(10000)と低い値となる。
上記した2つの問題点により、正しい認識信頼度を計算することが出来ない。1つ目の共起頻度0回の単語ペアの自己相互情報量PMI(x,y)が計算できない問題については、その都度、パラメータを手動で調整する方法(非特許文献2)や、共起頻度0の単語ペアの共起頻度を補正する考え(非特許文献3)が検討されている。しかしながら、これらの方法では、2つ目の「頻度の低い単語同士が共起した場合に自己相互情報量PMI(x,y)の値が非常に大きくなる」課題を、解決することが出来ない。
この発明は、このような課題に鑑みてなされたものであり、単語の共起回数を補正すると共に、単語xとyの関係が独立かどうかを判断してその単語間の関連度を計算して単語関連度テーブルを作成する単語関連度テーブル作成装置と、その単語関連度テーブルを用いて音声認識処理を行う音声認識装置と、それらの方法とプログラムを提供することを目的とする。
この発明の単語関連度テーブル作成装置は、音声文書を集積した学習コーパスと、学習コーパスから音声文書を読み出して音声文書を単語に分割して単語境界付き学習コーパスを出力する形態素解析部と、単語境界付き学習コーパスを入力として単語境界付き学習コーパスの先頭から末尾まで、窓幅n単語、窓シフト量m単語で窓掛けを行い、各窓に含まれる単語リストに記載された単語をまとめて単語集合とし、窓ごとの単語集合を出力する学習コーパス単語集合取得部と、単語集合を入力として単語集合内の各単語wの単独生起回数C(w)と、各単語ペアの生起回数C(wi,wj)と、単語集合の個数Nとをカウントして出力する単語カウント部と、単語集合内の各単語の単独生起回数C(w)と上記各単語ペアの生起回数C(wi,wj)と上記単語集合の個数Nを入力として、2個の単語間の単語関連度を計算する単語関連度計算部と、2個の単語間の関連度を参照できるテーブルの形式に配列するテーブル配列部と、を具備する単語関連度テーブル作成装置であって、単語関連度計算部は、生起回数補正手段と、検定値計算手段と、補正関連度計算手段とを備える。
生起回数補正手段は、各単語の単独生起回数C(w)と各単語ペアの生起回数C(wi,wj)を入力として、生起回数C(wi,wj)がr回となっている単語ペア(wi,wj)の種類数Nrと、生起回数C(wi,wj)がr-1回となっている単語ペア(wi,wj)の種類数Nr-1を数え、生起回数C(wi,wj)がr-1回より大きな単語ペア(wi,wj)の生起回数C(wi,wj)をそのまま補正後の生起回数C′(wi,wj)とし、生起回数C(wi,wj)がr-1回の単語ペア(wi,wj)の補正後の生起回数C′(wi,wj)を、r-1回に種類数Nrを種類数Nr-1で除した値を乗じた値として出力する。検定値計算手段は、各単語の単独生起回数C(w)と補正後の生起回数C′(wi,wj)を入力として、単語ペア(wi,wj)が同時に発生する回数と各単語が単独で発生する回数の積との差を統計的手法に基づいて検定する検定値を、計算する。補正関連度計算手段は、単独生起回数C(w)と補正後の生起回数C′(wi,wj)と検定値を入力として、検定値が閾値より大きな単語ペア(wi,wj)の関連度を、補正後の生起回数C′(wi,wj)に単語集合の個数Nを乗じた値を各単語の単独生起回数の積で除した値の対数値として出力し、検定値が閾値よりも小さな単語ペア(wi,wj)の関連度をそのまま出力する。
また、この発明の音声認識装置は、音声認識部と、単語関連度テーブルと、音声文書認識信頼度計算部と、を具備する。音声認識部は、入力される音声文書を音声認識処理した単語集合毎に単語認識信頼度を付与した音声認識結果を出力する。単語関連度テーブルは、上記した単語関連度テーブル作成装置を用いて音声認識部で扱う単語集合の各単語ペア(wi,wj)の単語間の関連度を各単語C(w)から参照できるテーブル形式に配列したものである。音声文書認識信頼度計算部は、各単語集合に含まれる全ての単語ペア(wi,wj)に対して、その単語間の関連の強さを表す関連度S(wi,wj)を、単語関連度テーブルを参照して求め、その平均値を上記音声文書の音声文書認識信頼度として計算する。
この発明の単語関連度テーブル作成装置の単語関連度計算部は、単語ペア(wi,wj)の生起回数がr-1回の生起回数を、0では無い小さな値(r-1)Nr/Nr-1に補正すると共に、単語ペア(wi,wj)が共起する回数と各単語が単独で発生する回数との積の差を統計的に検定する検定値を求め、検定値が大きな単語ペア(wi,wj)の関連度を、補正した生起回数に基づいて計算する。その結果、認識精度が低いのに信頼度の値が高く算出されてしまう課題と、頻度が低い単語同士が共起した場合に自己相互情報量PMI(x,y)の値が非常に大きくなる課題を、解決することが出来る。
また、この発明の音声認識装置は、この発明の単語関連度テーブル作成装置で作成した単語関連度テーブルを用いて音声文書認識信頼度を求めるので、その値の精度を高めることが出来る。その結果、この発明の音声認識装置は、従来よりも正確に認識精度の高い音声文書認識結果を収集することを可能にするので、テキストマイニング処理や検索の精度を向上させることが出来る。
この発明の単語関連度テーブル作成装置100の機能構成例を示す図。 単語関連度計算部10の機能構成例を示す図。 単語関連度計算部10の動作フローを示す図。 この発明の音声認識装置200の機能構成例を示す図。 音声認識装置200の動作フローを示す図。 Nベスト候補と単語認識信頼度について説明する図。 音声文書認識信頼度計算部22の機能構成例を示す図。 音声文書認識信頼度計算部40の機能構成例を示す図。 従来の単語関連度テーブル作成装置900の機能構成例を示す図。 単語集合を概念的に示す図。 単語関連度テーブルの一例を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。
図1に、この発明の単語関連度テーブル作成装置100の機能構成例を示す。単語関連度テーブル作成装置100は、従来の単語関連度テーブル作成装置900に対して単語関連度計算部10のみの構成が異なるものである。単語関連度テーブル作成装置100は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
学習コーパス90、形態素解析部91、学習コーパス単語集合取得部92、単語リスト93、単語カウント部94、テーブル配列部96は、単語関連度テーブル作成装置900(図9)と同じであるのでその説明は省略する。図2に、より具体的な単語関連度計算部10の機能構成例を示してその動作を説明する。その動作フローを図3に示す。
単語関連度計算部10は、生起回数補正手段11と、検定値計算手段12と、補正関連度計算手段13と、を具備する。生起回数補正手段10は、単語カウント部94が出力する各単語wの単独生起回数C(w)と各単語ペアの生起回数C(wi,wj)を入力として、生起回数C(wi,wj)がr回となっている単語ペア(wi,wj)の種類数Nr(ステップS111)と、生起回数C(wi,wj)がr-1回となっている単語ペア(wi,wj)の種類数Nr-1を数える(ステップS112)。そして、生起回数C(wi,wj)がr-1回より大きな単語ペア(wi,wj)の生起回数C(wi,wj)をそのまま補正後の生起回数C′(wi,wj)とし(ステップS114)、生起回数C(wi,wj)がr-1回の単語ペア(wi,wj)の補正後の生起回数C′(wi,wj)を、r-1回に上記種類数Nrを上記種類数Nr-1で除した値を乗じた値とする(式(2))(ステップS115)。
Figure 0005513439
ここで生起回数のr回は、例えばr=1とすることが考えられる。これは、共起しない単語の数が最も大きいので、r=1とすることで、殆んどの単語の生起回数が補正されることになるためである。また、rは2以上の整数に設定しても良い。その場合はr-1回から0回の生起回数C′(wi,wj)が補正される。
検定値計算手段12は、生起回数補正手段11が出力する単語集合の個数N、各単語の単独生起回数C(w)、単語ペアの補正後の生起回数C′(wi,wj)を入力として、上記単語ペア(wi,wj)が同時に発生する回数と各単語が単独で発生する回数の積との差を、統計的手法に基づいて検定する検定値を計算する(ステップS12)。検定値には例えばt値(式3)を用いることが出来る。
Figure 0005513439
補正関連度計算手段13は、検定値計算手段12が出力する例えばt値と、生起回数補正手段11が出力する単語集合の個数N、各単語の単独生起回数C(w)、単語ペアの補正後の生起回数C′(wi,wj)を入力として、t値と閾値θを比較する(ステップS131)。そして、t値が閾値θより大きな単語ペア(wi,wj)の関連度S(wi,wj)を、補正後の生起回数C′(wi,wj)に単語集合の個数Nを乗じた値を各単語の単独生起回数の積C(w i)・C(w j)で除した値の対数値(式(4))として出力する(ステップS133)。また、t値が閾値θより小さな単語ペア(wi,wj)の関連度S(wi,wj)は、関連度S(wi,wj)=0として出力する(ステップS132)。閾値θは、補正関連度計算手段13に予め設定しておいても良いし、外部から設定できるようにしても良い。
Figure 0005513439
閾値θは、統計的手法のt検定の有意水準によって定める。閾値θを高く設定すると、より多くの単語ペア(wi,wj)が独立(関連なし)だと判定される。閾値θを高くし過ぎると、実際には関連のある単語ペア(wi,wj)まで独立だと判定するようになり、低くし過ぎると実際には独立な単語ペア(wi,wj)を独立でないと判定するようになる。閾値θには、例えば有意水準5%の場合の値である閾値θ=1.65を用いると良い。
このようにt値の値に応じて関連度S(wi,wj)を補正することで、解決すべき課題のところで述べた2つ目の課題である「頻度の低い単語同士が共起した場合に自己相互情報量PMI(x,y)の値が非常に大きくなる」現象を、抑制することが出来る。例えば、単語xとyが1回ずつしか現れず、且つ共起していた(C(x)=C(y)=C(x,y)=1)場合のt値は、t値t(wi,wj)=1-1/Nとなり、閾値θ=1.65とするとt(wi,wj)<θであるので関連度S(wi,wj)=0とされ、その単語ペアには関連性が無いとされる。
このように処理された関連度S(wi,wj)は、各単語C(w)から参照できるテーブル形式に配列され単語関連度テーブル作成装置100の出力となる。この単語関連度テーブル20を利用することで、より適切な認識信頼度を付与することが可能な音声認識装置を実現することが出来る。なお、検定値としてt値を用いる例で説明を行ったが、カイ二乗検定に基づくカイ二乗値χ2を用いても良い。その場合、検定値計算手段12はカイ二乗値χ2を計算する。次に、その音声認識装置200について説明する。
〔音声認識装置〕
図4に、この発明の音声認識装置200の機能構成例を示す。その動作フローを図5に示す。音声認識装置200は、音声認識部21と、音声文書認識信頼度計算部22と、単語関連度テーブル20と、制御部23と、を具備する。音声認識装置200の各部の機能は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
音声認識部21は、入力される音声文書を音声認識処理した単語wk毎に単語認識信頼度D(wk)を付与した音声認識結果を出力する(ステップS21)。音声認識部21は、図示しない内部の音響分析部によって、音声文書を数十msecのフレームと呼ばれる単位でLPCケプストラム、MFCC、その他の音響特徴パラメータ系列に分析する。そして、辞書と言語モデルを用いて入力音声に対する認識結果候補の探索を、音響特徴パラメータ系列について行う。探索の結果、上位N位までのNベスト候補が、単語認識信頼度D(wk)と共に音声認識結果wkとして出力される。なお、音声文書とは、例えば、コールセンターにおける顧客とオペレータとの間で交わされる会話の集合のことであり、一要件についてまとめられた音声データである。または、例えば一つの講義が1個の音声ファイルにまとめられた様なものである。
ここで、図6を参照してNベスト候補と単語認識信頼度D(wk)について説明する。なお、Nベスト候補と単語認識信頼度D(wk)については従来技術である。図6の横軸は、経過時間でありフレームで表す。縦軸は、フレーム単位で探索された単語列候補を、スコアの高い順番に並べたNベスト候補である。スコアとは探索時の尤度のことである。
単語認識信頼度D(wk)は、フレームtにおいて単語w**(*は任意の整数)と異なる単語がNベスト候補中に存在する場合、単語w**のフレームtにおけるスコアと対立候補単語のフレームtにおける次の順位のスコアとの間のスコア差によって与えられる。図6に示す例では、フレームt1〜t4の音響特徴パラメータ系列で探索された第1位候補の単語w11(11は第1候補の1番目の単語であることを表す)の単語認識信頼度D(wk)は、対抗する単語が第3位候補の単語w31と第2位候補の単語w21であるので、それぞれのスコア差(●)の合計をフレーム数で除した値が単語認識信頼度D(wk)となる。対立候補が存在しない単語w13については、予め決められた固定値(○)が用いられて単語認識信頼度D(wk)となる。この単語認識信頼度D(wk)が候補毎に累積されて単語列の認識信頼度となる。
音声文書認識信頼度計算部22は、各単語集合に含まれる全ての2単語の組み合わせ(wi,wj)に対して単語の関連の強さを表す関連度S(wi,wj)を、単語関連度テーブル20を参照して求め、その平均値を各単語集合の文脈信頼度CL(Nk)として計算する。図7に、音声文書認識信頼度計算部22のより具体的な機能構成例を示す。音声文書認識信頼度計算部22は、認識結果単語集合取得手段221と、単語集合文脈信頼度計算手段222と、を備える。
認識結果単語集合取得手段221は、音声認識部21が出力する単語を所定数まとめて単語集合Nkとして出力する。単語を所定数まとめて単語集合Nkとする動作は、上記した学習コーパス単語集合取得部92と同じである。
単語集合文脈信頼度計算手段222は、各単語集合Nkに含まれる全ての2単語の組み合わせ(wi,wj)に対して単語の関連の強さを表す関連度S(wi,wj)を、単語関連度テーブル20を参照して求め、その平均値を各単語集合の文脈信頼度CL(Nk)として計算する。
この文脈信頼度CL(Nk)は、頻度の低い単語同士が共起した場合の自己相互情報量PMI(x,y)を抑制した値に基づいて求められるので音声認識の信頼度をより適切に表す値となる。
〔変形例〕
音声文書認識信頼度を、上記した文脈信頼度CL(Nk)と音響信頼度CA(Nk)とを統合した値としても良い。その場合の音声文書認識信頼度計算部40の機能構成例を図8に示す。音声文書認識信頼度計算部40は、上記した音声文書認識信頼度計算部22に対して単語集合音響信頼度計算手段401と信頼度統合手段402を備える点で異なる。
単語集合音響信頼度計算手段401は、各単語集合(Nk)に含まれる全ての単語の単語認識信頼度D(wk)と単語時間長wdkを取得して単語集合(Nk)毎に音響信頼度CA(Nk)を計算する。信頼度統合手段402は、Nk個の音響信頼度CA(Nk)とNk個の文脈信頼度CL(Nk)を、音声文書単位で平均して音声文書認識信頼度として出力する。
このように文脈信頼度CL(Nk)と音響信頼度CA(Nk)とを統合して音声文書の認識信頼度を計算するので、より精度の高い音声文書認識信頼度とすることが出来る。
〔評価実験〕
この発明の単語関連度テーブルを用いた音声文書認識信頼度の有効性を確認する目的で評価実験を行った。実験には、話者48名(男性17名、女声31名)による電話会話をマイクで収録した音声782通話、計61時間の評価セットを用い、音声認識エンジンにはVoicerex(参考文献、政瀧ほか、「顧客との自然な会話を聞き取る自由発話音声技術Voicerex,NTT Tech.rev.,5(1):22-27,2007.」を用いた。検定値にはt値を用い、閾値θは有意水準5%の場合の閾値θ=1.65を用いた。
表1に実験結果を示す。
Figure 0005513439
表1中の数値は、文脈信頼度と認識信頼度との相関係数であり、この発明の方が相関係数が高い結果となり、その有効性を確認することが出来た。
上記装置における処理手段をコンピュータによって実現する場合、各機能部が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各機能部における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD-RAM(Random Access Memory)、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP-ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD-ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェアで実現することとしてもよい。

Claims (4)

  1. 音声文書を集積した学習コーパスと、
    上記学習コーパスから音声文書を読み出して音声文書を単語に分割して単語境界付き学習コーパスを出力する形態素解析部と、
    上記単語境界付き学習コーパスを入力として上記単語境界付き学習コーパスの先頭から末尾まで、窓幅n単語、窓シフト量m単語で窓掛けを行い、各窓に含まれる単語リストに記載された単語をまとめて単語集合とし、窓ごとの単語集合を出力する学習コーパス単語集合取得部と、
    上記単語集合を入力として単語集合内の各単語の単独生起回数C(w)と、各単語ペアの生起回数C(wi,wj)と、単語集合の個数Nとをカウントして出力する単語カウント部と、
    上記単語集合内の各単語の単独生起回数C(w)と上記各単語ペアの生起回数C(wi,wj)と上記単語集合の個数Nを入力として、2個の単語間の単語関連度を計算する単語関連度計算
    部と、
    2個の単語間の関連度を参照できるテーブルの形式に配列するテーブル配列部と、を具備する単語関連度テーブル作成装置であって、
    上記単語関連度計算部は、
    各単語の単独生起回数C(w)と各単語ペアの生起回数C(wi,wj)を入力として、上記生起回数C(wi,wj)がr回となっている単語ペア(wi,wj)の種類数Nrと、生起回数C(wi,wj)がr-1回
    となっている単語ペア(wi,wj)の種類数Nr-1を数え、生起回数C(wi,wj)がr-1回より大きな単語ペア(wi,wj)の生起回数C(wi,wj)をそのまま補正後の生起回数C′(wi,wj)とし、それ以外の補正後の生起回数C′(wi,wj)を、r回に上記種類数Nrを上記種類数Nr-1で除した値を乗じた値として出力する生起回数補正手段と、
    上記各単語の単独生起回数C(w)と補正後の生起回数C′(wi,wj)を入力として、上記単語ペア(wi,wj)が同時に発生する回数と各単語が単独で発生する回数の積との差を、統計的
    手法に基づいて検定する検定値を計算する検定値計算手段と、
    上記単独生起回数C(w)と上記補正後の生起回数C′(wi,wj)と上記検定値を入力として、上記検定値が閾値より大きな単語ペア(wi,wj)の関連度を、補正後の生起回数C′(wi,wj)
    に単語集合の個数Nを乗じた値を各単語の単独生起回数の積で除した値の対数値として出
    力し、上記検定値が閾値よりも小さな単語ペア(wi,wj)の関連度を0として出力する補正関連度計算手段と、
    を具備することを特徴とする単語関連度テーブル作成装置。
  2. 入力される音声文書を音声認識処理した単語集合毎に単語認識信頼度を付与した音声認識結果を出力する音声認識部と、
    請求項1に記載した単語関連度テーブル作成装置を用いて上記音声認識部で扱う単語集合の各単語ペア(wi,wj)の単語間の関連度を各単語C(w)から参照できるテーブル形式に
    配列した単語関連度テーブルと、
    各単語集合に含まれる全ての上記単語ペア(wi,wj)に対して、その単語間の関連の強
    さを表す関連度S(wi,wj)を、上記単語関連度テーブルを参照して求め、その平均値を
    上記音声文書の音声文書認識信頼度として計算する音声文書認識信頼度計算部と、
    を具備する音声認識装置。
  3. 音声文書を集積した学習コーパスから音声文書を読み出して音声文書を単語に分割して単語境界付き学習コーパスを出力する形態素解析過程と、
    上記単語境界付き学習コーパスを入力として上記単語境界付き学習コーパスの先頭から末尾まで、窓幅n単語、窓シフト量m単語で窓掛けを行い、各窓に含まれる単語リストに記載された単語をまとめて単語集合とし、窓ごとの単語集合を出力する学習コーパス単語集合取得過程と、
    上記単語集合を入力として単語集合内の各単語の単独生起回数C(w)と、各単語ペアの生起回数C(wi,wj)と、単語集合の個数Nとをカウントして出力する単語カウント過程と、
    上記単語集合内の各単語の単独生起回数C(w)と上記各単語ペアの生起回数C(wi,wj)と上記単語集合の個数Nを入力として。2個の単語間の単語関連度を計算する単語関連度計算
    過程と、
    2個の単語間の関連度を参照できるテーブルの形式に配列するテーブル配列過程と、を備える単語関連度テーブル作成方法であって、
    上記単語関連度計算過程は、
    各単語の単独生起回数C(w)と各単語ペアの生起回数C(wi,wj)を入力として、上記生起回数C(wi,wj)がr回となっている単語ペア(wi,wj)の種類数Nrと、生起回数C(wi,wj)がr-1回
    となっている単語ペア(wi,wj)の種類数Nr-1を数え、生起回数C(wi,wj)がr-1回より大きな単語ペア(wi,wj)の生起回数C(wi,wj)をそのまま補正後の生起回数C′(wi,wj)とし、それ以外の補正後の生起回数C′(wi,wj)を、r回に上記種類数Nrを上記種類数Nr-1で除した値を乗じた値として出力する生起回数補正ステップと、
    上記各単語の単独生起回数C(w)と補正後の生起回数C′(wi,wj)を入力として、上記単語ペア(wi,wj)が同時に発生する回数と各単語が単独で発生する回数の積との差を、統計的
    手法に基づいて検定する検定値を計算する検定値計算ステップと、
    上記単独生起回数C(w)と上記補正後の生起回数C′(wi,wj)と上記検定値を入力として、上記検定値が閾値より大きな単語ペア(wi,wj)の関連度を、補正後の生起回数C′(wi,wj)
    に単語集合の個数Nを乗じた値を各単語の単独生起回数の積で除した値の対数値として出
    力し、上記検定値が閾値よりも小さな単語ペア(wi,wj)の関連度を0として出力する補正関連度計算ステップと、
    を含むことを特徴とする単語関連度テーブル作成方法。
  4. 請求項1に記載した単語関連度テーブル作成装置又は請求項2に記載した音声認識装置としてコンピュータを機能させるためのプログラム。
JP2011118144A 2011-05-26 2011-05-26 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム Active JP5513439B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011118144A JP5513439B2 (ja) 2011-05-26 2011-05-26 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011118144A JP5513439B2 (ja) 2011-05-26 2011-05-26 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム

Publications (2)

Publication Number Publication Date
JP2012247555A JP2012247555A (ja) 2012-12-13
JP5513439B2 true JP5513439B2 (ja) 2014-06-04

Family

ID=47468052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011118144A Active JP5513439B2 (ja) 2011-05-26 2011-05-26 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム

Country Status (1)

Country Link
JP (1) JP5513439B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6972653B2 (ja) * 2017-05-16 2021-11-24 富士通株式会社 解析プログラム、解析方法および解析装置
JP6509391B1 (ja) * 2018-01-31 2019-05-08 株式会社Fronteo 計算機システム

Also Published As

Publication number Publication date
JP2012247555A (ja) 2012-12-13

Similar Documents

Publication Publication Date Title
Ryant et al. The third DIHARD diarization challenge
US11005995B2 (en) System and method for performing agent behavioral analytics
US10839335B2 (en) Call center agent performance scoring and sentiment analytics
US11037553B2 (en) Learning-type interactive device
JP4745094B2 (ja) クラスタリングシステム、クラスタリング方法、クラスタリングプログラムおよびクラスタリングシステムを用いた属性推定システム
Mairesse et al. Can prosody inform sentiment analysis? experiments on short spoken reviews
US10019514B2 (en) System and method for phonetic search over speech recordings
JP2013145429A (ja) 会話から雑談部分を抽出するための雑談抽出システム、方法、およびプログラム
US10223442B2 (en) Prioritizing survey text responses
CN104137102A (zh) 非事实型询问应答系统以及计算机程序
JP6812381B2 (ja) 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム
US9224383B2 (en) Unsupervised language model adaptation for automated speech scoring
Matton et al. Into the wild: Transitioning from recognizing mood in clinical interactions to personal conversations for individuals with bipolar disorder
JP5713963B2 (ja) 音声認識単語追加装置とその方法とプログラム
JP5513439B2 (ja) 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム
JP2013109635A (ja) 単語重要度算出装置とその方法とプログラム
JP5513461B2 (ja) 音声認識装置とその方法とプログラム
JP5149941B2 (ja) 音声認識方法とその装置とプログラム
JP2010197411A (ja) 音声認識装置用言語モデル更新装置および音声認識装置
JP5406797B2 (ja) 音声認識方法とその装置とプログラム
JP5325176B2 (ja) 2チャネル音声の音声認識方法とその装置とプログラム
JP7293826B2 (ja) 問題検出装置、問題検出方法および問題検出プログラム
JP2012247556A (ja) 音声認識方法とその装置とプログラム
Danoff et al. CS105 Final Project December 15, 2018
Schubert et al. Speech Recognition Errors in ASR Engines and Their Impact on Linguistic Analysis in Psychotherapies

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130710

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140327

R150 Certificate of patent or registration of utility model

Ref document number: 5513439

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150