JP4981519B2 - 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 - Google Patents
学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 Download PDFInfo
- Publication number
- JP4981519B2 JP4981519B2 JP2007138626A JP2007138626A JP4981519B2 JP 4981519 B2 JP4981519 B2 JP 4981519B2 JP 2007138626 A JP2007138626 A JP 2007138626A JP 2007138626 A JP2007138626 A JP 2007138626A JP 4981519 B2 JP4981519 B2 JP 4981519B2
- Authority
- JP
- Japan
- Prior art keywords
- label
- score
- learning
- voice data
- reliability
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Description
学習データベース10には音声データと、その音声データの発話内容を示すラベルとが対とされた音声データ・ラベル対が多数格納されており、この学習データベース10から音声データ・ラベル対が読み出し手段21によって読み出される。
図1はこの発明による学習データのラベル誤り候補抽出装置の一実施例の構成を示したものであり、この例ではラベル誤り候補抽出装置は読み出し手段21と音声信号入力端子22とA/D変換手段23と音響モデルパラメータメモリ25と言語モデルパラメータメモリ26と認識スコア計算手段31と学習スコア計算手段32と信頼度計算手段33と書き込み手段34と信頼度蓄積手段35と信頼度ソート手段36とによって構成されている。
スコア差=学習スコア−認識スコア
とした時、スコア差<0となる区間長の総和の逆数を信頼度とし、この信頼度を計算する。信頼度計算手段33は計算した信頼度と音声データ・ラベル対とを組として出力する。
Claims (8)
- 音声データと、その音声データの発話内容を示すラベルとが対とされた音声データ・ラベル対が多数格納されている学習データベースにおけるラベルの誤り候補を抽出する装置であって、 前記学習データベースから音声データ・ラベル対を読み出す手段と、
その読み出した音声データを音声認識し、その音声認識結果に対するフレーム単位の認識スコアを計算する認識スコア計算手段と、
前記読み出した音声データを音声認識し、前記読み出したラベルに対するフレーム単位の学習スコアを計算する学習スコア計算手段と、
前記認識スコアと前記学習スコアとを比較し、学習スコアが認識スコアより低い区間を誤りとして、前記読み出したラベルの信頼度を計算する信頼度計算手段と、
その計算された信頼度と前記読み出した音声データ・ラベル対とを組として蓄積する手段と、
その蓄積手段から信頼度が低い順にラベルの誤り候補を抽出して出力する手段とを具備し、
前記信頼度計算手段は、1つの音声データ・ラベル対における、フレーム単位の前記学習スコアがフレーム単位の前記認識スコアより低い区間長の総和の逆数を信頼度として計算することを特徴とする学習データのラベル誤り候補抽出装置。 - 音声データと、その音声データの発話内容を示すラベルとが対とされた音声データ・ラベル対が多数格納されている学習データベースにおけるラベルの誤り候補を抽出する装置であって、 前記学習データベースから音声データ・ラベル対を読み出す手段と、
その読み出した音声データを音声認識し、その音声認識結果に対するフレーム単位の認識スコアを計算する認識スコア計算手段と、
前記読み出した音声データを音声認識し、前記読み出したラベルに対するフレーム単位の学習スコアを計算する学習スコア計算手段と、
前記認識スコアと前記学習スコアとを比較し、学習スコアが認識スコアより低い区間を誤りとして、前記読み出したラベルの信頼度を計算する信頼度計算手段と、
その計算された信頼度と前記読み出した音声データ・ラベル対とを組として蓄積する手段と、
その蓄積手段から信頼度が低い順にラベルの誤り候補を抽出して出力する手段とを具備し、
前記信頼度計算手段は、1つの音声データ・ラベル対における、フレーム単位の前記学習スコアがフレーム単位の前記認識スコアより低いフレーム数の総和の逆数を信頼度として計算することを特徴とする学習データのラベル誤り候補抽出装置。 - 音声データと、その音声データの発話内容を示すラベルとが対とされた音声データ・ラベル対が多数格納されている学習データベースにおけるラベルの誤り候補を抽出する装置であって、 前記学習データベースから音声データ・ラベル対を読み出す手段と、
その読み出した音声データを音声認識し、その音声認識結果に対するフレーム単位の認識スコアを計算する認識スコア計算手段と、
前記読み出した音声データを音声認識し、前記読み出したラベルに対するフレーム単位の学習スコアを計算する学習スコア計算手段と、
前記認識スコアと前記学習スコアとを比較し、学習スコアが認識スコアより低い区間を誤りとして、前記読み出したラベルの信頼度を計算する信頼度計算手段と、
その計算された信頼度と前記読み出した音声データ・ラベル対とを組として蓄積する手段と、
その蓄積手段から信頼度が低い順にラベルの誤り候補を抽出して出力する手段とを具備し、
前記信頼度計算手段は前記学習スコアから前記認識スコアを減算してスコア差を求め、1つの音声データ・ラベル対における、フレーム単位の前記学習スコアがフレーム単位の前記認識スコアより低い区間のスコア差の総和を信頼度として計算することを特徴とする学習データのラベル誤り候補抽出装置。 - 音声データと、その音声データの発話内容を示すラベルとが対とされた音声データ・ラベル対が多数格納されている学習データベースにおけるラベルの誤り候補を抽出する方法であって、
前記学習データベースから音声データ・ラベル対を読み出す過程と、
その読み出した音声データを音声認識し、その音声認識結果に対するフレーム単位の認識スコアを計算する過程と、
前記読み出した音声データを音声認識し、前記読み出したラベルに対するフレーム単位の学習スコアを計算する過程と、
前記計算した認識スコアと学習スコアとを比較し、学習スコアが認識スコアより低い区間を誤りとして、前記読み出したラベルの信頼度を計算する過程と、
その計算された信頼度と前記読み出した音声データ・ラベル対とを組として蓄積する過程と、
その蓄積された信頼度と音声データ・ラベル対の組から信頼度が低い順にラベルの誤り候補を抽出して出力する過程とを含み、
1つの音声データ・ラベル対における、フレーム単位の前記学習スコアがフレーム単位の前記認識スコアより低い区間長の総和の逆数を信頼度として計算することを特徴とする学習データのラベル誤り候補抽出方法。 - 音声データと、その音声データの発話内容を示すラベルとが対とされた音声データ・ラベル対が多数格納されている学習データベースにおけるラベルの誤り候補を抽出する方法であって、
前記学習データベースから音声データ・ラベル対を読み出す過程と、
その読み出した音声データを音声認識し、その音声認識結果に対するフレーム単位の認識スコアを計算する過程と、
前記読み出した音声データを音声認識し、前記読み出したラベルに対するフレーム単位の学習スコアを計算する過程と、
前記計算した認識スコアと学習スコアとを比較し、学習スコアが認識スコアより低い区間を誤りとして、前記読み出したラベルの信頼度を計算する過程と、
その計算された信頼度と前記読み出した音声データ・ラベル対とを組として蓄積する過程と、
その蓄積された信頼度と音声データ・ラベル対の組から信頼度が低い順にラベルの誤り候補を抽出して出力する過程とを含み、
1つの音声データ・ラベル対における、フレーム単位の前記学習スコアがフレーム単位の前記認識スコアより低いフレーム数の総和の逆数を信頼度として計算することを特徴とする学習データのラベル誤り候補抽出方法。 - 音声データと、その音声データの発話内容を示すラベルとが対とされた音声データ・ラベル対が多数格納されている学習データベースにおけるラベルの誤り候補を抽出する方法であって、
前記学習データベースから音声データ・ラベル対を読み出す過程と、
その読み出した音声データを音声認識し、その音声認識結果に対するフレーム単位の認識スコアを計算する過程と、
前記読み出した音声データを音声認識し、前記読み出したラベルに対するフレーム単位の学習スコアを計算する過程と、
前記計算した認識スコアと学習スコアとを比較し、学習スコアが認識スコアより低い区間を誤りとして、前記読み出したラベルの信頼度を計算する過程と、
その計算された信頼度と前記読み出した音声データ・ラベル対とを組として蓄積する過程と、
その蓄積された信頼度と音声データ・ラベル対の組から信頼度が低い順にラベルの誤り候補を抽出して出力する過程とを含み、
前記学習スコアから前記認識スコアを減算してスコア差を求め、1つの音声データ・ラベル対における、フレーム単位の前記学習スコアがフレーム単位の前記認識スコアより低い区間のスコア差の総和を信頼度として計算することを特徴とする学習データのラベル誤り候補抽出方法。 - 請求項4乃至6記載のいずれかの学習データのラベル誤り候補抽出方法をコンピュータに実行させるためのプログラム。
- 請求項7記載のプログラムを記憶した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007138626A JP4981519B2 (ja) | 2007-05-25 | 2007-05-25 | 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007138626A JP4981519B2 (ja) | 2007-05-25 | 2007-05-25 | 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008292789A JP2008292789A (ja) | 2008-12-04 |
JP4981519B2 true JP4981519B2 (ja) | 2012-07-25 |
Family
ID=40167551
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007138626A Expired - Fee Related JP4981519B2 (ja) | 2007-05-25 | 2007-05-25 | 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4981519B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5387274B2 (ja) * | 2009-09-18 | 2014-01-15 | 日本電気株式会社 | 標準パタン学習装置、ラベル付与基準算出装置、標準パタン学習方法およびプログラム |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08194494A (ja) * | 1995-01-13 | 1996-07-30 | Canon Inc | 文解析方法および装置 |
JP2000352993A (ja) * | 1999-06-14 | 2000-12-19 | Oki Electric Ind Co Ltd | 音声認識システム及びヒドン・マルコフ・モデルの学習方法 |
JP2002132287A (ja) * | 2000-10-20 | 2002-05-09 | Canon Inc | 音声収録方法および音声収録装置および記憶媒体 |
JP2002215185A (ja) * | 2001-01-19 | 2002-07-31 | Nec Corp | 音声認識方式および音声認識プログラム |
JP4150645B2 (ja) * | 2003-08-27 | 2008-09-17 | 株式会社ケンウッド | 音声ラベリングエラー検出装置、音声ラベリングエラー検出方法及びプログラム |
JP3819896B2 (ja) * | 2003-11-14 | 2006-09-13 | 日本電信電話株式会社 | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 |
-
2007
- 2007-05-25 JP JP2007138626A patent/JP4981519B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2008292789A (ja) | 2008-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11037553B2 (en) | Learning-type interactive device | |
JP6251958B2 (ja) | 発話解析装置、音声対話制御装置、方法、及びプログラム | |
JP3782943B2 (ja) | 音声認識装置、コンピュータ・システム、音声認識方法、プログラムおよび記録媒体 | |
KR101262812B1 (ko) | 음성 인식 에러 예측자로서의 문법 적합성 평가를 위한 방법들 및 시스템 | |
US8271282B2 (en) | Voice recognition apparatus, voice recognition method and recording medium | |
US8355917B2 (en) | Position-dependent phonetic models for reliable pronunciation identification | |
US8738378B2 (en) | Speech recognizer, speech recognition method, and speech recognition program | |
US20160055763A1 (en) | Electronic apparatus, pronunciation learning support method, and program storage medium | |
CN111369974B (zh) | 一种方言发音标注方法、语言识别方法及相关装置 | |
KR101587866B1 (ko) | 음성 인식용 발음사전 확장 장치 및 방법 | |
JPWO2009081861A1 (ja) | 単語カテゴリ推定装置、単語カテゴリ推定方法、音声認識装置、音声認識方法、プログラム、および記録媒体 | |
JP2008129263A (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
US20210134277A1 (en) | System and method for automatic speech analysis | |
JP2007047412A (ja) | 認識文法モデル作成装置、認識文法モデル作成方法、および、音声認識装置 | |
JP6276513B2 (ja) | 音声認識装置および音声認識プログラム | |
US11495245B2 (en) | Urgency level estimation apparatus, urgency level estimation method, and program | |
JP4661239B2 (ja) | 音声対話装置及び音声対話方法 | |
JP5590549B2 (ja) | 音声検索装置および音声検索方法 | |
KR20130126570A (ko) | 핵심어에서의 음소 오류 결과를 고려한 음향 모델 변별 학습을 위한 장치 및 이를 위한 방법이 기록된 컴퓨터 판독 가능한 기록매체 | |
JP3444108B2 (ja) | 音声認識装置 | |
JP4951035B2 (ja) | 音声単位別尤度比モデル作成装置、音声単位別尤度比モデル作成方法、音声認識信頼度算出装置、音声認識信頼度算出方法、プログラム | |
JP4981519B2 (ja) | 学習データのラベル誤り候補抽出装置、その方法及びプログラム、その記録媒体 | |
JP2005275348A (ja) | 音声認識方法、この方法を実施する装置、プログラムおよび記録媒体 | |
JP2012255867A (ja) | 音声認識装置 | |
JP3440840B2 (ja) | 音声認識方法及びその装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090729 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110509 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110701 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20110810 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120410 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120420 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150427 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4981519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |