JP5513439B2 - 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム - Google Patents
単語関連度テーブル作成装置とその方法と音声認識装置とプログラム Download PDFInfo
- Publication number
- JP5513439B2 JP5513439B2 JP2011118144A JP2011118144A JP5513439B2 JP 5513439 B2 JP5513439 B2 JP 5513439B2 JP 2011118144 A JP2011118144 A JP 2011118144A JP 2011118144 A JP2011118144 A JP 2011118144A JP 5513439 B2 JP5513439 B2 JP 5513439B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- occurrences
- words
- relevance
- pair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
図4に、この発明の音声認識装置200の機能構成例を示す。その動作フローを図5に示す。音声認識装置200は、音声認識部21と、音声文書認識信頼度計算部22と、単語関連度テーブル20と、制御部23と、を具備する。音声認識装置200の各部の機能は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
音声文書認識信頼度を、上記した文脈信頼度CL(Nk)と音響信頼度CA(Nk)とを統合した値としても良い。その場合の音声文書認識信頼度計算部40の機能構成例を図8に示す。音声文書認識信頼度計算部40は、上記した音声文書認識信頼度計算部22に対して単語集合音響信頼度計算手段401と信頼度統合手段402を備える点で異なる。
この発明の単語関連度テーブルを用いた音声文書認識信頼度の有効性を確認する目的で評価実験を行った。実験には、話者48名(男性17名、女声31名)による電話会話をマイクで収録した音声782通話、計61時間の評価セットを用い、音声認識エンジンにはVoicerex(参考文献、政瀧ほか、「顧客との自然な会話を聞き取る自由発話音声技術Voicerex,NTT Tech.rev.,5(1):22-27,2007.」を用いた。検定値にはt値を用い、閾値θは有意水準5%の場合の閾値θ=1.65を用いた。
Claims (4)
- 音声文書を集積した学習コーパスと、
上記学習コーパスから音声文書を読み出して音声文書を単語に分割して単語境界付き学習コーパスを出力する形態素解析部と、
上記単語境界付き学習コーパスを入力として上記単語境界付き学習コーパスの先頭から末尾まで、窓幅n単語、窓シフト量m単語で窓掛けを行い、各窓に含まれる単語リストに記載された単語をまとめて単語集合とし、窓ごとの単語集合を出力する学習コーパス単語集合取得部と、
上記単語集合を入力として単語集合内の各単語の単独生起回数C(w)と、各単語ペアの生起回数C(wi,wj)と、単語集合の個数Nとをカウントして出力する単語カウント部と、
上記単語集合内の各単語の単独生起回数C(w)と上記各単語ペアの生起回数C(wi,wj)と上記単語集合の個数Nを入力として、2個の単語間の単語関連度を計算する単語関連度計算
部と、
2個の単語間の関連度を参照できるテーブルの形式に配列するテーブル配列部と、を具備する単語関連度テーブル作成装置であって、
上記単語関連度計算部は、
各単語の単独生起回数C(w)と各単語ペアの生起回数C(wi,wj)を入力として、上記生起回数C(wi,wj)がr回となっている単語ペア(wi,wj)の種類数Nrと、生起回数C(wi,wj)がr-1回
となっている単語ペア(wi,wj)の種類数Nr-1を数え、生起回数C(wi,wj)がr-1回より大きな単語ペア(wi,wj)の生起回数C(wi,wj)をそのまま補正後の生起回数C′(wi,wj)とし、それ以外の補正後の生起回数C′(wi,wj)を、r回に上記種類数Nrを上記種類数Nr-1で除した値を乗じた値として出力する生起回数補正手段と、
上記各単語の単独生起回数C(w)と補正後の生起回数C′(wi,wj)を入力として、上記単語ペア(wi,wj)が同時に発生する回数と各単語が単独で発生する回数の積との差を、統計的
手法に基づいて検定する検定値を計算する検定値計算手段と、
上記単独生起回数C(w)と上記補正後の生起回数C′(wi,wj)と上記検定値を入力として、上記検定値が閾値より大きな単語ペア(wi,wj)の関連度を、補正後の生起回数C′(wi,wj)
に単語集合の個数Nを乗じた値を各単語の単独生起回数の積で除した値の対数値として出
力し、上記検定値が閾値よりも小さな単語ペア(wi,wj)の関連度を0として出力する補正関連度計算手段と、
を具備することを特徴とする単語関連度テーブル作成装置。 - 入力される音声文書を音声認識処理した単語集合毎に単語認識信頼度を付与した音声認識結果を出力する音声認識部と、
請求項1に記載した単語関連度テーブル作成装置を用いて上記音声認識部で扱う単語集合の各単語ペア(wi,wj)の単語間の関連度を各単語C(w)から参照できるテーブル形式に
配列した単語関連度テーブルと、
各単語集合に含まれる全ての上記単語ペア(wi,wj)に対して、その単語間の関連の強
さを表す関連度S(wi,wj)を、上記単語関連度テーブルを参照して求め、その平均値を
上記音声文書の音声文書認識信頼度として計算する音声文書認識信頼度計算部と、
を具備する音声認識装置。 - 音声文書を集積した学習コーパスから音声文書を読み出して音声文書を単語に分割して単語境界付き学習コーパスを出力する形態素解析過程と、
上記単語境界付き学習コーパスを入力として上記単語境界付き学習コーパスの先頭から末尾まで、窓幅n単語、窓シフト量m単語で窓掛けを行い、各窓に含まれる単語リストに記載された単語をまとめて単語集合とし、窓ごとの単語集合を出力する学習コーパス単語集合取得過程と、
上記単語集合を入力として単語集合内の各単語の単独生起回数C(w)と、各単語ペアの生起回数C(wi,wj)と、単語集合の個数Nとをカウントして出力する単語カウント過程と、
上記単語集合内の各単語の単独生起回数C(w)と上記各単語ペアの生起回数C(wi,wj)と上記単語集合の個数Nを入力として。2個の単語間の単語関連度を計算する単語関連度計算
過程と、
2個の単語間の関連度を参照できるテーブルの形式に配列するテーブル配列過程と、を備える単語関連度テーブル作成方法であって、
上記単語関連度計算過程は、
各単語の単独生起回数C(w)と各単語ペアの生起回数C(wi,wj)を入力として、上記生起回数C(wi,wj)がr回となっている単語ペア(wi,wj)の種類数Nrと、生起回数C(wi,wj)がr-1回
となっている単語ペア(wi,wj)の種類数Nr-1を数え、生起回数C(wi,wj)がr-1回より大きな単語ペア(wi,wj)の生起回数C(wi,wj)をそのまま補正後の生起回数C′(wi,wj)とし、それ以外の補正後の生起回数C′(wi,wj)を、r回に上記種類数Nrを上記種類数Nr-1で除した値を乗じた値として出力する生起回数補正ステップと、
上記各単語の単独生起回数C(w)と補正後の生起回数C′(wi,wj)を入力として、上記単語ペア(wi,wj)が同時に発生する回数と各単語が単独で発生する回数の積との差を、統計的
手法に基づいて検定する検定値を計算する検定値計算ステップと、
上記単独生起回数C(w)と上記補正後の生起回数C′(wi,wj)と上記検定値を入力として、上記検定値が閾値より大きな単語ペア(wi,wj)の関連度を、補正後の生起回数C′(wi,wj)
に単語集合の個数Nを乗じた値を各単語の単独生起回数の積で除した値の対数値として出
力し、上記検定値が閾値よりも小さな単語ペア(wi,wj)の関連度を0として出力する補正関連度計算ステップと、
を含むことを特徴とする単語関連度テーブル作成方法。 - 請求項1に記載した単語関連度テーブル作成装置又は請求項2に記載した音声認識装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011118144A JP5513439B2 (ja) | 2011-05-26 | 2011-05-26 | 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011118144A JP5513439B2 (ja) | 2011-05-26 | 2011-05-26 | 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012247555A JP2012247555A (ja) | 2012-12-13 |
JP5513439B2 true JP5513439B2 (ja) | 2014-06-04 |
Family
ID=47468052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011118144A Active JP5513439B2 (ja) | 2011-05-26 | 2011-05-26 | 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5513439B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6972653B2 (ja) * | 2017-05-16 | 2021-11-24 | 富士通株式会社 | 解析プログラム、解析方法および解析装置 |
JP6509391B1 (ja) * | 2018-01-31 | 2019-05-08 | 株式会社Fronteo | 計算機システム |
-
2011
- 2011-05-26 JP JP2011118144A patent/JP5513439B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2012247555A (ja) | 2012-12-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Ryant et al. | The third DIHARD diarization challenge | |
US11005995B2 (en) | System and method for performing agent behavioral analytics | |
US10839335B2 (en) | Call center agent performance scoring and sentiment analytics | |
US11037553B2 (en) | Learning-type interactive device | |
JP4745094B2 (ja) | クラスタリングシステム、クラスタリング方法、クラスタリングプログラムおよびクラスタリングシステムを用いた属性推定システム | |
Mairesse et al. | Can prosody inform sentiment analysis? experiments on short spoken reviews | |
US10019514B2 (en) | System and method for phonetic search over speech recordings | |
JP2013145429A (ja) | 会話から雑談部分を抽出するための雑談抽出システム、方法、およびプログラム | |
US10223442B2 (en) | Prioritizing survey text responses | |
CN104137102A (zh) | 非事实型询问应答系统以及计算机程序 | |
JP6812381B2 (ja) | 音声認識精度劣化要因推定装置、音声認識精度劣化要因推定方法、プログラム | |
US9224383B2 (en) | Unsupervised language model adaptation for automated speech scoring | |
Matton et al. | Into the wild: Transitioning from recognizing mood in clinical interactions to personal conversations for individuals with bipolar disorder | |
JP5713963B2 (ja) | 音声認識単語追加装置とその方法とプログラム | |
JP5513439B2 (ja) | 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム | |
JP2013109635A (ja) | 単語重要度算出装置とその方法とプログラム | |
JP5513461B2 (ja) | 音声認識装置とその方法とプログラム | |
JP5149941B2 (ja) | 音声認識方法とその装置とプログラム | |
JP2010197411A (ja) | 音声認識装置用言語モデル更新装置および音声認識装置 | |
JP5406797B2 (ja) | 音声認識方法とその装置とプログラム | |
JP5325176B2 (ja) | 2チャネル音声の音声認識方法とその装置とプログラム | |
JP7293826B2 (ja) | 問題検出装置、問題検出方法および問題検出プログラム | |
JP2012247556A (ja) | 音声認識方法とその装置とプログラム | |
Danoff et al. | CS105 Final Project December 15, 2018 | |
Schubert et al. | Speech Recognition Errors in ASR Engines and Their Impact on Linguistic Analysis in Psychotherapies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20130710 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20140131 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20140212 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20140226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140325 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140327 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5513439 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |