JP2014160168A - 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム - Google Patents
学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム Download PDFInfo
- Publication number
- JP2014160168A JP2014160168A JP2013030772A JP2013030772A JP2014160168A JP 2014160168 A JP2014160168 A JP 2014160168A JP 2013030772 A JP2013030772 A JP 2013030772A JP 2013030772 A JP2013030772 A JP 2013030772A JP 2014160168 A JP2014160168 A JP 2014160168A
- Authority
- JP
- Japan
- Prior art keywords
- recognition result
- word
- recognition
- word string
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Machine Translation (AREA)
Abstract
【解決手段】Nベスト認識結果単語列が記憶されるNベスト認識結果記憶部と、1位認識結果単語列を記憶する学習用データ記憶部と、Nベスト認識結果記憶部からi位認識結果単語列を抽出するi位認識結果抽出部と、学習用データ記憶部の各認識結果単語列からi位認識結果単語列と最も近似するk位認識結果単語列を抽出するk位認識結果抽出部と、i位認識結果単語列とk位認識結果単語列のうち互いに異なる単語の数から異なり単語率Rを計算する異なり単語率計算部と、異なり単語率Rが予め定めた閾値Tを超える場合にはi位認識結果単語列を学習用データ記憶部に記憶する比較部とを備える。
【選択図】図11
Description
(参考非特許文献1)J. Lafferty, A. McCallum and F. Pereira, “Conditional random fields: probabilistic models for segmenting and labeling sequence data,”Proc. ICML, pp. 282-289, 2001.
Claims (8)
- Nを2以上の整数とし、
kをk<iを充たす正の整数とし、
Nベスト認識結果単語列が予め記憶されるNベスト認識結果記憶部と、
初期値として1位認識結果単語列を予め記憶する学習用データ記憶部と、
前記Nベスト認識結果記憶部を参照して、i位認識結果単語列を抽出するi位認識結果抽出部と、
前記学習用データ記憶部に記憶されている各認識結果単語列と前記i位認識結果単語列とをセグメント毎に照合し、前記学習用データ記憶部に記憶されている各認識結果単語列の中からi位認識結果単語列と最も近似する認識結果単語列であるk位認識結果単語列を抽出するk位認識結果抽出部と、
前記i位認識結果単語列と前記k位認識結果単語列のうち互いに異なる単語の数を前記認識結果単語列の長さで割ったものを異なり単語率Rとして計算する異なり単語率計算部と、
前記異なり単語率Rと予め定めた閾値Tとを比較して、R>Tである場合には前記i位認識結果単語列を前記学習用データ記憶部に記憶する比較部とを備え、
前記iの初期値をi=2とし、前記i位認識結果抽出部、前記k位認識結果抽出部、前記異なり単語率計算部、および前記比較部の処理が実行される度に、前記iはインクリメントされ、i=Nとなるまで、前記i位認識結果抽出部、前記k位認識結果抽出部、前記異なり単語率計算部、および前記比較部の処理が繰り返し実行される
学習データ選択装置。 - Nを2以上の整数とし、
N−best認識結果単語列と、単語コンフュージョンネットワークと、単語ラティスと、対立候補情報と、N−best認識結果中の各ランクの認識結果の単語アライメントネットワークと、N−best認識結果中の各ランクの認識結果の単語アライメント結果シンボル列と、単語関連情報とを入力とし、N−best認識結果中の各ランクの認識結果の単語特徴量ベクトルを作成するN−best単語特徴量ベクトル作成部と、
前記N−best認識結果中の各ランクの認識結果の単語特徴量ベクトルを入力とし、認識結果単語確率的分類モデルを用いて、N−best認識結果中の各ランクの認識結果単語列中の各単語を確率的に単語アライメント結果シンボルに分類し、各シンボルに対し確率を付与し、N−best認識結果中の各ランクの認識結果の確率的単語分類結果を取得するN−best認識結果単語確率的分類部と、
N−best認識結果中の各ランクの認識結果の確率的単語分類結果を用いてN−best認識結果中の各ランクの認識結果の確率的認識精度を計算するN−best確率的認識精度計算部とを備え、
kをk<iを充たす正の整数とし、Nベスト認識結果単語列からi位認識結果単語列を抽出し、前記i位認識結果単語列と最も近似する認識結果単語列であるk位認識結果単語列を抽出し、前記i位認識結果単語列と前記k位認識結果単語列のうち互いに異なる単語の数を前記認識結果単語列の長さで割ったものを異なり単語率Rとして計算し、前記異なり単語率Rと予め定めた閾値Tとを比較して、R>Tである場合には前記i位認識結果単語列を学習用データとして選択する処理を、前記iの初期値をi=2とし、前記学習用データ選択処理が1度実行される度に、前記iをインクリメントし、i=Nとなるまで、前記学習用データ選択処理を繰り返し実行することにより選択された学習用データを用い、認識結果単語列中の各単語の単語特徴量ベクトルと、当該単語が正解である確率、置換誤りである確率、挿入誤りである確率、削除誤りである確率、εである確率の関係を学習することにより、
前記認識結果単語確率的分類モデルを生成する
識別的音声認識精度推定装置。 - 請求項2に記載の識別的音声認識精度推定装置であって、
前記計算されたN−best認識結果中の各ランクの認識結果の確率的認識精度を用いて、前記N−best認識結果の順位を再度並び替える認識結果リランキング部
をさらに備える識別的音声認識精度推定装置。 - Nを2以上の整数とし、
kをk<iを充たす正の整数とし、
Nベスト認識結果単語列からi位認識結果単語列を抽出するi位認識結果抽出ステップと、
前記i位認識結果単語列と最も近似する認識結果単語列であるk位認識結果単語列を抽出するk位認識結果抽出ステップと、
前記i位認識結果単語列と前記k位認識結果単語列のうち互いに異なる単語の数を認識結果単語列の長さで割ったものを異なり単語率Rとして計算する異なり単語率計算ステップと、
前記異なり単語率Rと予め定めた閾値Tとを比較して、R>Tである場合には前記i位認識結果単語列を学習用データとして選択する比較ステップとを備え、
前記iの初期値をi=2とし、前記i位認識結果抽出ステップ、前記k位認識結果抽出ステップ、前記異なり単語率計算ステップ、および前記比較ステップの処理が実行される度に、前記iはインクリメントされ、i=Nとなるまで、前記i位認識結果抽出ステップ、前記k位認識結果抽出ステップ、前記異なり単語率計算ステップ、および前記比較ステップの処理が繰り返し実行される
学習データ選択方法。 - Nを2以上の整数とし、
N−best認識結果単語列と、単語コンフュージョンネットワークと、単語ラティスと、対立候補情報と、N−best認識結果中の各ランクの認識結果の単語アライメントネットワークと、N−best認識結果中の各ランクの認識結果の単語アライメント結果シンボル列と、単語関連情報とを入力とし、N−best認識結果中の各ランクの認識結果の単語特徴量ベクトルを作成するN−best単語特徴量ベクトル作成ステップと、
前記N−best認識結果中の各ランクの認識結果の単語特徴量ベクトルを入力とし、認識結果単語確率的分類モデルを用いて、N−best認識結果中の各ランクの認識結果単語列中の各単語を確率的に単語アライメント結果シンボルに分類し、各シンボルに対し確率を付与し、N−best認識結果中の各ランクの認識結果の確率的単語分類結果を取得するN−best認識結果単語確率的分類ステップと、
N−best認識結果中の各ランクの認識結果の確率的単語分類結果を用いてN−best認識結果中の各ランクの認識結果の確率的認識精度を計算するN−best確率的認識精度計算ステップとを有し、
kをk<iを充たす正の整数とし、Nベスト認識結果単語列からi位認識結果単語列を抽出し、前記i位認識結果単語列と最も近似する認識結果単語列であるk位認識結果単語列を抽出し、前記i位認識結果単語列と前記k位認識結果単語列のうち互いに異なる単語の数を前記認識結果単語列の長さで割ったものを異なり単語率Rとして計算し、前記異なり単語率Rと予め定めた閾値Tとを比較して、R>Tである場合には前記i位認識結果単語列を学習用データとして選択する処理を、前記iの初期値をi=2とし、前記学習用データ選択処理が1度実行される度に、前記iをインクリメントし、i=Nとなるまで、前記学習用データ選択処理を繰り返し実行することにより選択された学習用データを用い、認識結果単語列中の各単語の単語特徴量ベクトルと、当該単語が正解である確率、置換誤りである確率、挿入誤りである確率、削除誤りである確率、εである確率の関係を学習することにより、
前記認識結果単語確率的分類モデルを生成する
識別的音声認識精度推定方法。 - 請求項5に記載の識別的音声認識精度推定方法であって、
前記計算されたN−best認識結果中の各ランクの認識結果の確率的認識精度を用いて、前記N−best認識結果の順位を再度並び替える認識結果リランキングステップ
をさらに備える識別的音声認識精度推定方法。 - 請求項4に記載された学習データ選択方法の各ステップをコンピュータに実行させるためのプログラム。
- 請求項5、または6に記載された識別的音声認識精度推定方法の各ステップをコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013030772A JP5980142B2 (ja) | 2013-02-20 | 2013-02-20 | 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013030772A JP5980142B2 (ja) | 2013-02-20 | 2013-02-20 | 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014160168A true JP2014160168A (ja) | 2014-09-04 |
JP5980142B2 JP5980142B2 (ja) | 2016-08-31 |
Family
ID=51611895
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2013030772A Active JP5980142B2 (ja) | 2013-02-20 | 2013-02-20 | 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5980142B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017026808A (ja) * | 2015-07-22 | 2017-02-02 | 日本電信電話株式会社 | 音声認識装置、音声認識方法、プログラム |
WO2019044583A1 (ja) * | 2017-09-04 | 2019-03-07 | 日本電信電話株式会社 | コンフュージョンネットワーク分散表現生成装置、コンフュージョンネットワーク分類装置、コンフュージョンネットワーク分散表現生成方法、コンフュージョンネットワーク分類方法、プログラム |
CN113168836A (zh) * | 2018-09-27 | 2021-07-23 | 株式会社OPTiM | 计算机系统、语音识别方法以及程序 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007322757A (ja) * | 2006-06-01 | 2007-12-13 | Nissan Motor Co Ltd | 音声対話装置 |
-
2013
- 2013-02-20 JP JP2013030772A patent/JP5980142B2/ja active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007322757A (ja) * | 2006-06-01 | 2007-12-13 | Nissan Motor Co Ltd | 音声対話装置 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2017026808A (ja) * | 2015-07-22 | 2017-02-02 | 日本電信電話株式会社 | 音声認識装置、音声認識方法、プログラム |
WO2019044583A1 (ja) * | 2017-09-04 | 2019-03-07 | 日本電信電話株式会社 | コンフュージョンネットワーク分散表現生成装置、コンフュージョンネットワーク分類装置、コンフュージョンネットワーク分散表現生成方法、コンフュージョンネットワーク分類方法、プログラム |
JPWO2019044583A1 (ja) * | 2017-09-04 | 2020-10-08 | 日本電信電話株式会社 | コンフュージョンネットワーク分散表現生成装置、コンフュージョンネットワーク分類装置、コンフュージョンネットワーク分散表現生成方法、コンフュージョンネットワーク分類方法、プログラム |
CN113168836A (zh) * | 2018-09-27 | 2021-07-23 | 株式会社OPTiM | 计算机系统、语音识别方法以及程序 |
CN113168836B (zh) * | 2018-09-27 | 2024-04-23 | 株式会社OPTiM | 计算机系统、语音识别方法以及程序产品 |
Also Published As
Publication number | Publication date |
---|---|
JP5980142B2 (ja) | 2016-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102057184B1 (ko) | 흥미 판정 장치, 흥미 판정 방법, 및 기억 매체 | |
CN109726269B (zh) | 信息处理方法、信息处理装置以及程序 | |
JP5294086B2 (ja) | 重み係数学習システム及び音声認識システム | |
US20100100379A1 (en) | Voice recognition correlation rule learning system, voice recognition correlation rule learning program, and voice recognition correlation rule learning method | |
US11380301B2 (en) | Learning apparatus, speech recognition rank estimating apparatus, methods thereof, and program | |
CN116127953B (zh) | 一种基于对比学习的中文拼写纠错方法、装置和介质 | |
Kim et al. | Sequential labeling for tracking dynamic dialog states | |
JP5980142B2 (ja) | 学習データ選択装置、識別的音声認識精度推定装置、学習データ選択方法、識別的音声認識精度推定方法、プログラム | |
US20230034414A1 (en) | Dialogue processing apparatus, learning apparatus, dialogue processing method, learning method and program | |
JP5740368B2 (ja) | 識別的音声認識精度推定装置、識別的音声認識精度推定方法、プログラム | |
JP2020118929A (ja) | 要約生成装置、方法、プログラム、及び記憶媒体 | |
WO2016181474A1 (ja) | パターン認識装置、パターン認識方法およびプログラム | |
JP6577900B2 (ja) | 音素誤り獲得装置、音素誤り獲得方法、およびプログラム | |
JP2012063611A (ja) | 音声認識結果検索装置、音声認識結果検索方法および音声認識結果検索プログラム | |
JP6772394B1 (ja) | 情報学習装置、情報処理装置、情報学習方法、情報処理方法及びプログラム | |
JP6473112B2 (ja) | 音声認識精度推定装置、音声認識精度推定方法及び音声認識精度推定プログラム | |
JP2006201553A (ja) | 識別的学習方法、装置、プログラム、音声認識装置、プログラム、これらのプログラムを記録した記録媒体 | |
JP6389776B2 (ja) | 言語識別モデル学習装置、言語識別装置、言語識別方法、およびプログラム | |
JP7120064B2 (ja) | 言語モデルスコア計算装置、言語モデル作成装置、それらの方法、プログラム、および記録媒体 | |
JP2015018372A (ja) | 表現抽出モデル学習装置、表現抽出モデル学習方法、および、コンピュータ・プログラム | |
JP2018081294A (ja) | 音響モデル学習装置、音声認識装置、音響モデル学習方法、音声認識方法、およびプログラム | |
WO2019171538A1 (ja) | 意味推定システム、方法およびプログラム | |
WO2019171537A1 (ja) | 意味推定システム、方法およびプログラム | |
JP5264649B2 (ja) | 情報圧縮型モデルパラメータ推定装置、方法及びプログラム | |
JP5679345B2 (ja) | 音声認識精度推定装置、音声認識精度推定方法、プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150114 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20151224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160105 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160203 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20160719 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20160726 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5980142 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |