JP4191021B2 - ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム - Google Patents
ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム Download PDFInfo
- Publication number
- JP4191021B2 JP4191021B2 JP2003401706A JP2003401706A JP4191021B2 JP 4191021 B2 JP4191021 B2 JP 4191021B2 JP 2003401706 A JP2003401706 A JP 2003401706A JP 2003401706 A JP2003401706 A JP 2003401706A JP 4191021 B2 JP4191021 B2 JP 4191021B2
- Authority
- JP
- Japan
- Prior art keywords
- domain
- topic
- training
- verifier
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012549 training Methods 0.000 title claims abstract description 133
- 238000004590 computer program Methods 0.000 title claims description 4
- 238000012706 support-vector machine Methods 0.000 claims abstract description 53
- 238000012795 verification Methods 0.000 claims description 47
- 238000004364 calculation method Methods 0.000 claims description 19
- 230000004044 response Effects 0.000 claims description 15
- 238000001514 detection method Methods 0.000 claims 1
- 239000013598 vector Substances 0.000 description 60
- 238000000034 method Methods 0.000 description 31
- 238000012545 processing Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 16
- 230000006870 function Effects 0.000 description 14
- 230000001419 dependent effect Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 8
- 238000012217 deletion Methods 0.000 description 8
- 230000037430 deletion Effects 0.000 description 8
- 238000012935 Averaging Methods 0.000 description 6
- 238000002474 experimental method Methods 0.000 description 6
- 238000003058 natural language processing Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009118 appropriate response Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000007430 reference method Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 239000002344 surface layer Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
‐概論‐
以下に述べる第1の実施の形態は、入力された発話がドメイン外(Out−Of−Domain:以下「OOD」と呼ぶ。)の発話かドメイン内の発話かを検出することが可能な、音声認識装置とともに用いられるドメイン外検証装置に関するものである。この実施の形態にかかる装置は、対象ドメインに属する発話セットのみを用いて、入力された発話がこのドメインに属するか否かを判定する。
以下に、本実施の形態の構成について説明する。この実施の形態は本発明を実施するためのひとつの形態を述べているにすぎず、各構成要素についてはこれ以外にも種々の変形が可能で、また代替が可能なものもある。それらの全てを示すのは困難であるので、可能な変形のいくつかを、実施の形態の説明の最後に掲げる。
[1,M]中のトピックjごとに
{
トピックjを一時的なOODに設定する
他のトピックをドメイン内に設定する
トピックjをOOD、他のトピックをドメイン内と判別するように、式(2)によってドメイン検証モデルG in-domain (X)をトレーニングする
すなわち、GPDを用い、式(2)の識別エラーが最小化するように重み(λ 1j ,…,λ ij ,…,λ Mj )(i≠j)を計算する
λ i (1≦i≦M)の各々を、上記した繰り返しにより得られた値(λ i1 ,…,λ ij ,…,λ iM )(1≦j≦M,j≠i)の平均値として求める。
つまり、あるトピックを一時的にOODとし、このトピックに対応するSVMをモデルから削除して、残りのSVMを用い発話セット20の全ての発話に対する信頼度尺度を求める。発話が、OODに設定されたトピック以外の残りのトピックに属するような判定が上記したドメイン内検証モデルGin-domain(X)で行なえるように、重みλij(1≦i,j≦M、j≠i)をGPDにより算出する。最後に、λ i (1≦i≦M)の各々を、こうして得た重みλ ij (1≦j≦M,j≠i)を平均することにより求める。
一方、図1に示すドメイン外判定装置36は、このクラス分類器26及びドメイン検証器24を用いて、入力発話がOODか否かを判定するためのものであり、以下の構成を有する。図6を参照して、ドメイン外判定装置36は、マイクロフォン30から入力される発話音声に対し、ドメイン依存モデル34を用いた音声認識を行なうことにより音声認識装置32により出力される音声認識結果の発話テキストデータを入力とする。
以上説明システムの動作は3つのフェーズに分かれる。第1のフェーズは、ドメイン外判定トレーニングユニット22によるクラス分類器52(クラス分類器26)のトレーニングフェーズである。第2のフェーズは、ドメイン外判定トレーニングユニット22において、クラス分類器52のトレーニングの終了後、ドメイン検証器56(ドメイン検証器24)のトレーニングを行なうフェーズである。第3のフェーズは、このようにトレーニングの終了したクラス分類器52(クラス分類器26)及びドメイン検証器56(ドメイン検証器24)を備えたドメイン外判定装置36を用い、音声応答装置において入力された音声がドメイン外か否かを判定するフェーズである。以下、これらについて順番に説明する。
ドメイン外判定トレーニングユニット22は以下のように動作する。この処理に先立ち、発話セット20が準備されており、かつその中の各発話が第1〜第Mのトピックからなる発話セット70−1〜70−Mに分類されているものとする。この分類は、手作業で行なってもよいし、何らかの手段で機械的に行なってもよい。
クラス分類器52の各SVMのトレーニングが終了すると、ドメイン検証器56のトレーニングが可能になる。
マイクロフォン30により入力された音声に対し、音声認識装置32がドメイン依存モデル34を用いて音声認識を行ない、音声認識結果の発話データをテキスト形式で特徴ベクトル作成部180に与える。ドメイン依存モデル34のドメインは、信頼度ベクトル作成部182及びドメイン検証部184のクラス分類器26及びドメイン検証器24がトレーニングを行なった際のドメインと一致しているものとする。
上記した実施の形態の装置では、SVMへの入力など、発話の特徴ベクトルとして1−,2−,及び3−グラムと品詞情報とからなるものを用いた。しかし本発明はそのようなものに限定されるわけではない。例えば、1−グラムのみ、2−グラムのみ、4−グラム以上、及びそれらの任意の組合わせ、並びにそれらと品詞情報との組合わせ等も用いることができる。
上記したような種々の条件を組合わせて、ドメイン検証の実験を行なった。実験には、出願人において準備したコーパスを用いた。このコーパスの概略構成についてテーブル1に示す。
FAR(False Acceptance Rate):ドメイン内に分類されたOODの発話の率
EER(Equal Error Rate):FRRとFARとが等しくなった点における誤り率
また、テーブル3に、トピッククラス分類に関して上記した種々の方式、及び発話の特徴ベクトルに関して前述した種々のフォーマットに関するトピック分類の性能について示す。
Claims (7)
- 複数のトピックに分類された、一つのドメインに属する機械可読なドメイン内データを記憶するための手段と、
前記ドメイン内データの前記複数のトピックの一つがそれぞれ割り当てられ、トレーニングデータが自己に割り当てられたトピックに属するか否かを判定するようにトレーニング可能な複数のトピック判定手段と、
前記ドメイン内データをトレーニングデータとして用い、前記複数のトピック判定手段をトレーニングするための第1のトレーニング手段と、
与えられる入力データが所定のドメインに属するか否かを検証するためのドメイン検証器と、
前記第1のトレーニング手段によりトレーニングされた前記複数のトピック判定手段と前記ドメイン内データとを用いて、与えられる入力データが前記ドメイン内データのドメインに属するか否かを前記ドメイン検証器が判定可能となるように、前記ドメイン検証器をトレーニングするための第2のトレーニング手段とを含み、
前記第2のトレーニング手段は、
前記複数のトピックのうちのj番目(jは自然数)の一つを選択してドメイン外に設定するためのトピック選択手段と、
前記トピック選択手段によりドメイン外に設定されたトピックに対応する前記トピック判定手段を除く、残りのトピック判定手段に対し、前記ドメインに属するトレーニングデータを与え、トレーニングデータごとに前記複数のトピック判定手段による判定結果を、各トピックに属すると判定される信頼度尺度として得るための手段と、
前記判定結果を得る手段により得られた前記残りのトピック判定手段による判定結果と、前記トレーニングデータが属するトピックを示す情報とに基づいて、次式で表されるドメイン検証関数Gin-domain(X)
前記複数のトピックの各々が全て一度ずつ選択されるように前記トピック選択手段、前記判定結果を得るための手段、及び前記係数算出手段が繰返し動作するよう制御するための制御手段と、
前記制御手段による繰返しの結果、各トピックに対して算出された前記ドメイン内検証関数Gin-domain(X)の係数λ ij (1≦j≦M,j≠i)の平均値λ i (1≦i≦M)を算出するための平均算出手段と、
前記平均算出手段により算出された係数λ i (1≦i≦M)を前記ドメイン検証器のパラメータに設定するための手段とを含む、ドメイン検証器のトレーニング装置。 - 前記複数のトピック判定手段の各々は、トレーニングデータ及び当該トレーニングデータが自己に割り当てられたトピックに属するか否かを示す情報が与えられると、入力データが自己に割り当てられたトピックに属するか否かを判定するようにトレーニング可能なサポートベクターマシン(SVM)を含む、請求項1に記載のドメイン検証器のトレーニング装置。
- 前記SVMは、入力データが自己に割り当てられたトピックに属するか否かを示す情報を、所定範囲に正規化された数値として出力する、請求項2に記載のドメイン検証器のトレーニング装置。
- 前記SVMは、入力データが自己に割り当てられたトピックに属するか否かを示す情報を、前記所定範囲内の離散値として出力する、請求項3に記載のドメイン検証器のトレーニング装置。
- コンピュータにより実行されると、当該コンピュータを請求項1〜請求項4のいずれかに記載のドメイン検証器のトレーニング装置として動作させる、コンピュータプログラム。
- ドメイン内データの複数のトピックの一つがそれぞれ割り当てられ、入力データが自己に割り当てられたトピックに属する信頼度尺度を出力するようにトレーニングされた複数のトピック判定手段と、
与えられる入力データが前記ドメインに属するか否かを、前記複数のトピック判定手段の出力する前記信頼度尺度の加重和をしきい値と比較することにより検証するためのドメイン検証器と、
入力データを前記複数のトピック判定手段に与え、前記複数のトピック判定手段が出力した信頼度尺度を前記ドメイン検証器に入力するためのデータ入力手段とを含み、それによって、前記データ入力手段によるデータの入力に応答した前記ドメイン検出装置の出力は、前記入力データが前記ドメインに属するか否かを示す、ドメイン検証装置。 - 複数のトピックに分類された、一つのドメインに属する機械可読なドメイン内データを記憶するための手段と、
入力データが自己に割り当てられたトピックに属するか否かを判定するようにトレーニングされた複数のトピック判定手段と、
与えられる入力データが所定のドメインに属するか否かを検証するためのドメイン検証器と、
前記複数のトピック判定手段、及び前記ドメインに属する入力データを用いて、与えられる入力データが前記複数のトピック判定手段のトピックからなるドメインに属するか否かを前記ドメイン検証器が判定可能となるように、前記ドメイン検証器をトレーニングするためのトレーニング手段とを含む、ドメイン検証器のトレーニング装置であって、
前記トレーニング手段は、
前記複数のトピックのうちのj番目(jは自然数)の一つを選択してドメイン外に設定するためのトピック選択手段と、
前記トピック選択手段によりドメイン外に設定されたトピックに対応する前記トピック判定手段を除く、残りのトピック判定手段に対し、前記ドメインに属するトレーニングデータを与え、トレーニングデータごとに前記複数のトピック判定手段による判定結果を、各トピックに属すると判定される信頼度尺度として得るための手段と、
前記判定結果を得る手段により得られた前記残りのトピック判定手段による判定結果と、前記トレーニングデータが属するトピックを示す情報とに基づいて、次式で表されるドメイン検証関数Gin-domain(X)
前記複数のトピックの各々が全て一度ずつ選択されるように前記トピック選択手段、前記判定結果を得るための手段、及び前記係数算出手段が繰返し動作するよう制御するための制御手段と、
前記制御手段による繰返しの結果、各トピックに対して算出された前記ドメイン内検証関数Gin-domain(X)の係数λ ij (1≦j≦M,j≠i)の平均値λ i (1≦i≦M)を算出するための平均算出手段と、
前記平均算出手段により算出された係数λ i (1≦i≦M)を前記ドメイン検証器のパラメータに設定するための手段とを含む、ドメイン検証器のトレーニング装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003401706A JP4191021B2 (ja) | 2003-12-01 | 2003-12-01 | ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003401706A JP4191021B2 (ja) | 2003-12-01 | 2003-12-01 | ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2005164836A JP2005164836A (ja) | 2005-06-23 |
JP2005164836A5 JP2005164836A5 (ja) | 2006-01-19 |
JP4191021B2 true JP4191021B2 (ja) | 2008-12-03 |
Family
ID=34725548
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003401706A Expired - Fee Related JP4191021B2 (ja) | 2003-12-01 | 2003-12-01 | ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4191021B2 (ja) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7634406B2 (en) * | 2004-12-10 | 2009-12-15 | Microsoft Corporation | System and method for identifying semantic intent from acoustic information |
JP4301212B2 (ja) | 2005-06-03 | 2009-07-22 | 日産自動車株式会社 | 車両の制御装置 |
WO2007013521A1 (ja) * | 2005-07-26 | 2007-02-01 | Honda Motor Co., Ltd. | ユーザと機械とのインタラクションを実施するための装置、方法、およびプログラム |
JP5005291B2 (ja) * | 2006-08-14 | 2012-08-22 | トヨタ自動車株式会社 | 内燃機関の適合方法 |
JP4919282B2 (ja) * | 2007-03-19 | 2012-04-18 | 独立行政法人産業技術総合研究所 | 不明瞭音声コマンド認識装置および不明瞭音声コマンド認識処理方法 |
US8050929B2 (en) * | 2007-08-24 | 2011-11-01 | Robert Bosch Gmbh | Method and system of optimal selection strategy for statistical classifications in dialog systems |
US8024188B2 (en) * | 2007-08-24 | 2011-09-20 | Robert Bosch Gmbh | Method and system of optimal selection strategy for statistical classifications |
JP5170449B2 (ja) * | 2009-02-17 | 2013-03-27 | 日本電気株式会社 | 検出装置、音声認識装置、検出方法、及びプログラム |
WO2020036188A1 (ja) * | 2018-08-15 | 2020-02-20 | 日本電信電話株式会社 | 学習データ生成装置、学習データ生成方法およびプログラム |
-
2003
- 2003-12-01 JP JP2003401706A patent/JP4191021B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2005164836A (ja) | 2005-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5223673B2 (ja) | 音声処理装置およびプログラム、並びに、音声処理方法 | |
US7996218B2 (en) | User adaptive speech recognition method and apparatus | |
DK2713367T3 (en) | Speech Recognition | |
EP2028645B1 (en) | Method and system of optimal selection strategy for statistical classifications in dialog systems | |
JP6464650B2 (ja) | 音声処理装置、音声処理方法、およびプログラム | |
US8886532B2 (en) | Leveraging interaction context to improve recognition confidence scores | |
KR101590724B1 (ko) | 음성 인식 오류 수정 방법 및 이를 수행하는 장치 | |
US20030069729A1 (en) | Method of assessing degree of acoustic confusability, and system therefor | |
CN111326148B (zh) | 置信度校正及其模型训练方法、装置、设备及存储介质 | |
Lane et al. | Out-of-domain utterance detection using classification confidences of multiple topics | |
Campbell et al. | Advanced language recognition using cepstra and phonotactics: MITLL system performance on the NIST 2005 language recognition evaluation | |
WO2018051945A1 (ja) | 音声処理装置、音声処理方法、および記録媒体 | |
JP4191021B2 (ja) | ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム | |
JP2004198597A5 (ja) | ||
JPWO2007105409A1 (ja) | 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム | |
Kinnunen et al. | Comparative evaluation of maximum a posteriori vector quantization and Gaussian mixture models in speaker verification | |
You et al. | A GMM-supervector approach to language recognition with adaptive relevance factor | |
KR20200114705A (ko) | 음성 신호 기반의 사용자 적응형 스트레스 인식 방법 | |
KR101283271B1 (ko) | 어학 학습 장치 및 어학 학습 방법 | |
White et al. | An investigation of acoustic models for multilingual code-switching. | |
KR101229108B1 (ko) | 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법 | |
KR100940641B1 (ko) | 음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법 | |
Hazen et al. | Discriminative feature weighting using MCE training for topic identification of spoken audio recordings | |
Lane et al. | Topic classification and verification modeling for out-of-domain utterance detection | |
JP2007017548A (ja) | 音声認識結果の検証装置及びコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051125 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051125 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080806 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080909 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080917 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4191021 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110926 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120926 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130926 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |