JP5513461B2 - 音声認識装置とその方法とプログラム - Google Patents
音声認識装置とその方法とプログラム Download PDFInfo
- Publication number
- JP5513461B2 JP5513461B2 JP2011210274A JP2011210274A JP5513461B2 JP 5513461 B2 JP5513461 B2 JP 5513461B2 JP 2011210274 A JP2011210274 A JP 2011210274A JP 2011210274 A JP2011210274 A JP 2011210274A JP 5513461 B2 JP5513461 B2 JP 5513461B2
- Authority
- JP
- Japan
- Prior art keywords
- utterance
- word
- relevance
- current
- past
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
〔単語関連度テーブル作成装置〕
Claims (4)
- 入力される音声文書の発話区間を検出して発話列として出力する発話分割部と、
上記発話列を入力として音声認識を行い発話区間ごとに音声認識スコアが上位N個の認識結果候補と認識スコアを組みにしたNベスト候補を求めNベスト候補列として出力する音声認識部と、
上記Nベスト候補列を入力として、当該Nベスト候補列中の現在発話区間を中心として当該現在発話区間から上記音声文書の冒頭方向にある順位1位の上記認識結果候補を過去発話単語集合として抽出すると共に、当該現在発話区間を中心として当該現在発話区間から音声文書の末尾方向にある順位1位の上記認識結果候補を未来発話単語集合として抽出し、上記過去発話単語集合と上記未来発話単語集合の全ての2単語ペアの関連度の平均値である過去・未来間関連度平均値meanSpfを求め、当該過去・未来間関連度平均値meanSpfと所定の閾値δとを比較して上記音声文書の話題境界を判定し、話題境界と判定した場合、現在発話区間を1つ更新して、上記過去発話単語集合を抽出する処理から繰り返す話題境界検出部と、
上記話題境界検出部において話題境界と判定されなかった現在発話区間の各順位ごとに、対象にしている順位の認識結果候補単語列から現在発話単語を現在発話単語集合として抽出し、上記過去発話単語集合と当該現在発話単語集合の全ての2単語ペアの関連度の合計値である過去・現在間関連度合計値sumSkpcを計算すると共に、上記現在発話単語集合と上記未来発話単語集合の全ての2単語ペアの関連度の合計値である現在・未来間関連度合計値sumSkfcを計算し、当該現在発話区間の認識スコアを、上記過去・現在間関連度合計値sumSkpcと上記現在・未来間関連度合計値sumSkfcの平均値を用いた値に再計算し、その再計算した認識スコアに基づいて上記現在発話区間のNベスト候補を並べ替える処理を、上記音声文書の最後の発話区間についての処理が終了するまで上記話題境界検出部の処理から繰り返すNベスト候補スコア再計算部と、
各発話区間の順位1位の候補を連結した音声認識結果を出力する音声認識結果出力部と、
を具備する音声認識装置。 - 請求項1に記載した音声認識装置において、
上記Nベスト候補スコア再計算部は、
上記話題境界検出部において話題境界と判定されなかった現在発話区間の各順位ごとに、対象にしている順位の認識結果候補単語列から現在発話単語を現在発話単語集合として抽出し、
上記過去発話単語集合の全ての2単語の組み合わせを過去発話単語ペアとして抽出し、その過去発話単語ペアの関連度の平均値である過去発話単語関連度平均値meanSpを算出すると共に、上記未来発話単語集合の全ての2単語の組み合わせを未来発話単語ペアとして抽出し、その未来発話単語ペアの関連度の平均値である未来発話単語関連度平均値meanSfを算出し、
上記過去発話単語集合と上記現在発話単語集合の全ての単語の組み合わせを過去・現在単語ペアとして抽出し、当該過去・現在単語ペアの関連度の合計値である過去・現在間発話関連度合計値sumSkpcと過去・現在単語ペアの個数Nkpcを算出すると共に、上記未来発
話単語集合と上記現在発話単語集合の全ての単語の組み合わせを未来・現在単語ペアとして抽出し、当該未来・現在単語ペアの関連度の合計値である未来・現在間発話関連度合計値sumSkfcと上記未来・現在単語ペアの個数Nkfcを算出し、
上記過去発話単語関連度平均値meanSpと閾値θ、及び上記未来発話単語関連度平均値meanSfと閾値θとを比較することで、上記過去発話単語集合内の関連性と上記未来発話単語集合内の関連性をそれぞれ評価し、関連性がある場合は上記過去・現在間発話関連度合計値sumSkpcと上記未来・現在間発話関連度合計値sumSkfcを考慮して認識スコアを再計算し、関連性がない場合は上記過去・現在間発話関連度合計値sumSkpcと上記未来・現在間発話関連度合計値sumSkfcを考慮しない認識スコアを再計算して、その再計算した認識スコアに基づいて上記現在発話区間のNベスト候補を並べ替えるもの、
であることを特徴とする音声認識装置。 - 入力される音声文書の発話区間を検出して発話列として出力する発話分割過程と、
上記発話列を入力として音声認識を行い発話区間ごとに音声認識スコアが上位N個の認識結果候補と認識スコアを組みにしたNベスト候補を求めNベスト候補列として出力する音声認識過程と、
上記Nベスト候補列を入力として、当該Nベスト候補列中の現在発話区間を中心として当該現在発話区間から上記音声文書の冒頭方向にある順位1位の上記認識結果候補を過去発話単語集合として抽出すると共に、当該現在発話区間を中心として当該現在発話区間から音声文書の末尾方向にある順位1位の上記認識結果候補を未来発話単語集合として抽出し、上記過去発話単語集合と上記未来発話単語集合の全ての2単語ペアの関連度の平均値である過去・未来間関連度平均値meanSpfを求め、当該過去・未来間関連度平均値meanSpfと所定の閾値δとを比較して上記音声文書の話題境界を判定し、話題境界と判定した場合、現在発話区間を1つ更新して、上記過去発話単語集合を抽出する処理から繰り返す話題境界検出過程と、
上記話題境界検出過程において話題境界と判定されなかった現在発話区間の各順位ごとに、対象にしている順位の認識結果候補単語列から現在発話単語を現在発話単語集合として抽出し、上記過去発話単語集合と上記現在発話単語集合の全ての2単語ペアの関連度の合計値である過去・現在間関連度合計値sumSkpcを計算すると共に、上記現在発話単語集合と上記未来発話単語集合の全ての2単語ペアの関連度の合計値である現在・未来間関連度合計値sumSkfcを計算し、当該現在発話区間の認識スコアを、上記過去・現在間関連度合計値sumSkpcと上記現在・未来間関連度合計値sumSkfcの平均値を用いた値に再計算し、その再計算した認識スコアに基づいて上記現在発話区間のNベスト候補を並べ替える処理を、上記音声文書の最後の発話区間についての処理が終了するまで上記話題境界検出過程の処理から繰り返すNベスト候補スコア再計算過程と、
各発話区間の順位1位の候補を連結した音声認識結果を出力する音声認識結果出力過程と、
を備える音声認識方法。 - 請求項1又は2に記載した音声認識装置としてコンピュータを機能させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011210274A JP5513461B2 (ja) | 2011-09-27 | 2011-09-27 | 音声認識装置とその方法とプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011210274A JP5513461B2 (ja) | 2011-09-27 | 2011-09-27 | 音声認識装置とその方法とプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013072922A JP2013072922A (ja) | 2013-04-22 |
JP5513461B2 true JP5513461B2 (ja) | 2014-06-04 |
Family
ID=48477498
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011210274A Active JP5513461B2 (ja) | 2011-09-27 | 2011-09-27 | 音声認識装置とその方法とプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5513461B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107680585A (zh) * | 2017-08-23 | 2018-02-09 | 海信集团有限公司 | 一种中文分词方法、中文分词装置和终端 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016126768A2 (en) * | 2015-02-03 | 2016-08-11 | Dolby Laboratories Licensing Corporation | Conference word cloud |
CN113763947B (zh) * | 2021-01-15 | 2024-04-05 | 北京沃东天骏信息技术有限公司 | 一种语音意图识别方法、装置、电子设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3660512B2 (ja) * | 1998-12-07 | 2005-06-15 | 日本電信電話株式会社 | 音声認識方法、その装置及びプログラム記録媒体 |
-
2011
- 2011-09-27 JP JP2011210274A patent/JP5513461B2/ja active Active
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107680585A (zh) * | 2017-08-23 | 2018-02-09 | 海信集团有限公司 | 一种中文分词方法、中文分词装置和终端 |
CN107680585B (zh) * | 2017-08-23 | 2020-10-02 | 海信集团有限公司 | 一种中文分词方法、中文分词装置和终端 |
Also Published As
Publication number | Publication date |
---|---|
JP2013072922A (ja) | 2013-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110457688B (zh) | 纠错处理方法及装置、存储介质和处理器 | |
US9672817B2 (en) | Method and apparatus for optimizing a speech recognition result | |
US9224386B1 (en) | Discriminative language model training using a confusion matrix | |
Wang et al. | Improved approaches of modeling and detecting error patterns with empirical analysis for computer-aided pronunciation training | |
Mairesse et al. | Can prosody inform sentiment analysis? experiments on short spoken reviews | |
US11282511B2 (en) | System and method for automatic speech analysis | |
KR101587866B1 (ko) | 음성 인식용 발음사전 확장 장치 및 방법 | |
US20100100379A1 (en) | Voice recognition correlation rule learning system, voice recognition correlation rule learning program, and voice recognition correlation rule learning method | |
CN101782941A (zh) | 评价口语能力的方法和系统 | |
Van Dalen et al. | Improving multiple-crowd-sourced transcriptions using a speech recogniser | |
KR20160059265A (ko) | 신뢰도 측점 점수를 고려한 음향 모델 학습 방법 및 장치 | |
JP5513461B2 (ja) | 音声認識装置とその方法とプログラム | |
Etxeberria et al. | Weighted finite-state transducers for normalization of historical texts | |
JP5152918B2 (ja) | 固有表現抽出装置、その方法およびプログラム | |
JP4756499B2 (ja) | 音声認識結果の検査装置及びコンピュータプログラム | |
JP2005084436A (ja) | 音声認識装置及びコンピュータプログラム | |
JP5513440B2 (ja) | 音声認識方法とその装置とプログラム | |
JP4533160B2 (ja) | 識別的学習方法、装置、プログラム、識別的学習プログラムを記録した記録媒体 | |
JP5513439B2 (ja) | 単語関連度テーブル作成装置とその方法と音声認識装置とプログラム | |
CN109427330A (zh) | 一种基于统计语言模型得分规整的语音识别方法及系统 | |
JP4733436B2 (ja) | 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体 | |
JP5749230B2 (ja) | 音声認識装置とその方法とプログラム | |
KR101227716B1 (ko) | 음성 합성 장치, 음성 합성 방법 및 음성 합성 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체 | |
JP2010197411A (ja) | 音声認識装置用言語モデル更新装置および音声認識装置 | |
JP5308102B2 (ja) | 誤り数別識別スコア・事後確率計算方法と、その方法を用いた誤り数重み付き識別学習装置とその方法と、その装置を用いた音声認識装置と、プログラムと記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Effective date: 20130722 Free format text: JAPANESE INTERMEDIATE CODE: A621 |
|
A977 | Report on retrieval |
Effective date: 20140131 Free format text: JAPANESE INTERMEDIATE CODE: A971007 |
|
A131 | Notification of reasons for refusal |
Effective date: 20140212 Free format text: JAPANESE INTERMEDIATE CODE: A131 |
|
A521 | Written amendment |
Effective date: 20140226 Free format text: JAPANESE INTERMEDIATE CODE: A523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Effective date: 20140325 Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140327 |
|
R150 | Certificate of patent (=grant) or registration of utility model |
Ref document number: 5513461 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |