JP4191021B2 - ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム - Google Patents

ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム Download PDF

Info

Publication number
JP4191021B2
JP4191021B2 JP2003401706A JP2003401706A JP4191021B2 JP 4191021 B2 JP4191021 B2 JP 4191021B2 JP 2003401706 A JP2003401706 A JP 2003401706A JP 2003401706 A JP2003401706 A JP 2003401706A JP 4191021 B2 JP4191021 B2 JP 4191021B2
Authority
JP
Japan
Prior art keywords
domain
topic
training
verifier
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003401706A
Other languages
English (en)
Other versions
JP2005164836A5 (ja
JP2005164836A (ja
Inventor
イアン・レーン
達也 河原
知子 松井
哲 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
ATR Advanced Telecommunications Research Institute International
Original Assignee
ATR Advanced Telecommunications Research Institute International
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ATR Advanced Telecommunications Research Institute International filed Critical ATR Advanced Telecommunications Research Institute International
Priority to JP2003401706A priority Critical patent/JP4191021B2/ja
Publication of JP2005164836A publication Critical patent/JP2005164836A/ja
Publication of JP2005164836A5 publication Critical patent/JP2005164836A5/ja
Application granted granted Critical
Publication of JP4191021B2 publication Critical patent/JP4191021B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Machine Translation (AREA)

Description

この発明は、自然言語処理に関し、特に、音声認識又は機械翻訳など、処理対象となる言語活動のドメインに依存したモデルを用いて行なう自然言語処理の改良に関する。
近年、電話と自動音声認識(Automatic Speech Recognition:ASR)とを用いた自動対話システムが広い範囲で使用される様になっている。そのための技術で現在重要と思われるのは、ユーザが複数のドメインの情報にアクセスできる様にする事で自動対話システムの適用範囲を広げ、使い勝手を向上させるための技術である(後掲の非特許文献1を参照されたい。)。
ここで「ドメイン」とは、対話が想定される種々の状況を分類する概念である。これは、いわゆる「トピック」という概念と同様であると考えると分かりやすい。たとえば旅行用の英会話のテキストブックでは、会話が行なわれる場面として「空港」、「ショッピング」、「両替」、「駅で」等というトピックに分けて、それらトピックでよく使われる例文をまとめて掲げている事が多い。こうした「トピック」と類似したものとしてドメインを考える。ただし、旅行用の英会話のテキストは、それ自体「海外旅行」という場面を想定している。この様に複数のトピックをまとめて一つの状況と捕らえる事もでき、それらも「ドメイン」とする事ができる。従ってドメインとは階層的な概念でもある。
簡単のために、以下の説明では、ドメインがトピックの上位の階層であって、あるドメインが複数のトピックを含むものとする。
複数ドメインにわたって音声認識を行なう場合、ドメインごとの言語モデル等を用いる事により音声認識システムの精度と効率とがともに向上する事が知られている。こうしたアプローチは、開発のモジュール性を考える上で都合がよい。なぜなら、新しいドメインをシステムに追加しても、既に存在しているドメインにおける精度には影響を与えないからである。トピックごとの言語モデルを、以下「トピック依存モデル」と呼ぶ。
こうしたトピック依存モデルを用いる従来の対話システムでは、主としてシステムが主導権を握る方式が採用されている。これについてはたとえば後掲の非特許文献2を参照されたい。これらシステムは、ユーザに各種の指示を出し、システムの内部状態に基づいて適切と判断された言語モデルを適用する。こうしたシステムではユーザが主導権を握る事はできず、従ってその使い勝手はよくない。ユーザがドメインを変更できる様にする事で使い勝手は向上すると考えられる。しかしその場合でもユーザは、特定のドメインに関する問合せを行なう場合、その前に明示的に必要なドメインを指定しなければならない。
電話の自動受付システムでは(非特許文献3を参照されたい。)、ユーザが最初に発した音声に対する音声認識の結果からトピックを検出する処理を行なう事で、明示的にではなくドメインが指定される。対話システムでも、同様の技術を用いて必要とされるドメインを自動的に判定する事ができる。連続する発話は同一のドメインのものである場合が多いので、ドメイン依存モデルを用いた効果が期待できる。
ドメイン依存モデルを用いて精度を向上させるシステムとして、出願人が開発したものがある(非特許文献4を参照されたい。)。このシステムでは、複数種類のドメイン依存モデルと、それらを用いて音声認識を行なう複数の音声認識装置とを予め用意し、入力される音声に対しこれら複数の音声認識装置を並列に動作させる。そして、これらから得られた複数の結果のうち、音声認識スコアが最も高いものを選択して出力する。音声認識スコアとは、音声認識装置の内部で複数の認識結果の候補から音声認識結果を選択する際に計算されるスコアの事であり、音声認識結果に付随して得る事ができるものである。
S.スネフ、R.ラウ、J.ポリフローニ著、「Galaxy−II会話システムの編成、通信、および制御」、ユーロスピーチ予稿集、1999年(S.Seneff,R.Lau,J.Polizfoni,"Organization,Communication,and Control in the Galaxy−II Conversational System",Proc.Eurospeech,1999.) F.ウェセル、A.バーダー著、「1点排除推定を用いたロバストな対話状態依存の言語モデリング」、ICASSP予稿集第2巻、741−744頁、1999年(F.Wessel,A.Baader,"Robust Dialogue−State Dependent Language Modeling using Leaving−One−Out",Proc.ICASSP Vol.2,1999.) G.リッカルディ、A.ゴーリン、A.リヨリエ、M.ライリー著、「自動電話受付のための話し言葉システム」、ICASSP予稿集、第2巻、1143−1146頁、1997年(G.Riccardi,A.Gorin,A.Ljolie,M.Riley、"A spoken Language System for Automated Call Routing",Proc.ICASSP,Vol.2,pp.1143−1146,1997) T.タケザワ、E.スミタ、F.スガヤ、H.ヤマモト、S.ヤマモト著、「実世界における旅行会話の音声翻訳のための大規模バイリンガルコーパスに向けて」、LREC2002、147−152頁、2002年(Towards a Broad−coverage Bilingual Corpus for Speech Translation of Travel Converastion in the Real World",LREC 2002,pp.147−152,2002.)
ある特定のドメインを自動的に選択する場合、選択結果が正しければよいが、選択結果が誤っていると音声認識が正しく行われないという問題がある。また、ドメインとして何を選択すべきかを知っているのがユーザであるとすれば、ユーザが明示的にドメインを指定することにより、ドメインに応じた適切なモデルを用いた精度の高い音声認識を実現できる。
しかし、この場合に問題となるのは、ユーザが明示的にドメインを指定した場合でも、時に意識せずドメイン外の発話を行なうことがあるということである。ドメイン外の発話があると音声認識装置は正しく動作せず、翻訳できずに何度も発話を繰返すことを求めたり、全く誤った認識結果を出力したりする。ユーザは自分が誤ったドメインの発話を行なったことは意識していないことが多いので、音声認識装置がこのような動作をすることによりユーザの不満が大きくなる。また、ユーザが音声認識装置のドメインという概念について正しく理解をしていない場合にも同様の問題が生じ得る。
こうした問題は、音声認識だけではなく、自然言語処理全般において、その処理対象となる文の領域ごとに異なるモデル又は辞書などを用いることによって処理の精度に大きな相違が生じるシステム全てに共通している。そこで、このような問題を解消することが必要である。
これまで、こうした問題についてはそれほど研究されてきていない。通常は例えば処理結果に対する信頼度尺度のような尺度を定義し、この値が所定の条件を充足していないものを棄却するというアプローチを用いている。入力がドメイン内のものか、ドメイン外のものかを確認することが重要であるという視点からの研究はほとんどされていない。
ところで、自然言語処理に関する誤りを防止する手立てとして、正誤双方を含む事例を多数集め、それらを用いて統計的な処理を行なうことにより正誤の判定を行なう判定器を用いることがよく行われている。そのためのツールとして、例えばSVM(Support Vector Machine)のようなものがよく知られている。しかし、そうした処理を行なうためには、誤りのデータを収集する必要がある。実際のところ、例えば音声認識装置等におけるドメイン外の発話の取り扱い等についてはそうした誤りのデータを多数収集することは困難であり、そのために入力がドメイン外が否かを判定するための判定器を実現することは極めて難しかった。
それゆえに本発明の目的は、ドメイン依存の自然言語処理において、指定されたドメインではない、ドメイン外の入力があったときにも適切に判定するドメイン検証装置及びそのトレーニング装置を提供することである。
本発明の他の目的は、ドメイン依存の自然言語処理において、指定されたドメインではない、ドメイン外の入力があったときにそれを信頼性高く検出することができるドメイン検証装置及びそのトレーニング装置であって、トレーニングにあたって誤入力に関する事例を収集する必要のないものを提供することである。
本発明に係るドメイン検証装置のトレーニング装置は、複数のトピックに分類された、一つのドメインに属する機械可読なドメイン内データを準備するための手段と、ドメイン内データの複数のトピックの一つがそれぞれ割り当てられ、トレーニングデータが自己に割り当てられたトピックに属するか否かを判定するようにトレーニング可能な複数のトピック判定手段と、ドメイン内データをトレーニングデータとして用い、複数のトピック判定手段をトレーニングするための第1のトレーニング手段と、与えられる入力データが所定のドメインに属するか否かを検証するためのドメイン検証器と、第1のトレーニング手段によりトレーニングされた複数のトピック判定手段とドメイン内データとを用いて、与えられる入力データがドメイン内データのドメインに属するか否かをドメイン検証器が判定可能となるようにドメイン検証器をトレーニングするための第2のトレーニング手段とを含む。
好ましくは、複数のトピック判定手段の各々は、トレーニングデータ及び当該トレーニングデータが自己に割り当てられたトピックに属するか否かを示す情報が与えられると、入力データが自己に割り当てられたトピックに属するか否かを判定するようにトレーニング可能なSVMを含む。
さらに好ましくは、SVMは、入力データが自己に割り当てられたトピックに属するか否かを示す情報を、所定範囲に正規化された数値として出力する。
SVMは、入力データが自己に割り当てられたトピックに属するか否かを示す情報を、所定範囲内の離散値として出力してもよい。
好ましくは、第2のトレーニング手段は、第1のトレーニング手段によりトレーニングされた複数のトピック判定手段、及びドメイン内データを用い、かつ削除補間法を用いることにより、ドメインに属さないトレーニングデータを用いずに、ドメイン検証器をトレーニングするための手段を含む。
第2のトレーニング手段は、複数のトピックのうちの番目(は自然数)の一つを選択してドメイン外に設定するためのトピック選択手段と、トピック選択手段によりドメイン外に設定されたトピックに対応するトピック判定手段を除く、残りのトピック判定手段に対し、ドメインに属するトレーニングデータを与え、トレーニングデータごとに複数のトピック判定手段による判定結果を、各トピックに属すると判定される信頼度尺度として得るための手段と、判定結果を得る手段により得られた残りのトピック判定手段による判定結果と、トレーニングデータが属するトピックを示す情報とに基づいて、次式で表されるドメイン検証関数Gin-domain(X)
Figure 0004191021
によって、トレーニングデータがドメイン外に設定されたトピックに属するか否かを判定できるように、ドメイン内検証関数Gin-domain(X)の係数λij(1≦j≦M,j≠i)の値を確率降下法により算出するための係数算出手段と、複数のトピックの各々が全て一度ずつ選択されるようにトピック選択手段、判定結果を得るための手段、及び係数算出手段が繰返し動作するよう制御するための制御手段と、制御手段による繰返しの結果、各トピックに対して算出されたドメイン内検証関数Gin-domain(X)の係数λij(1≦j≦M,j≠i)の平均値λi (1≦i≦M)を算出するための平均算出手段と、平均算出手段により算出された係数λi(1≦i≦M)をドメイン検証器のパラメータに設定するための手段とを含んでもよい。
本発明の第2の局面にかかるコンピュータプログラムは,コンピュータにより実行されると、当該コンピュータを上記したいずれかのドメイン検証器のトレーニング装置として動作させる。
本発明の第3の局面にかかる入力データのドメイン検証装置は、ドメイン内データの複数のトピックの一つがそれぞれ割り当てられ、入力データが自己に割り当てられたトピックに属するか否かを判定するようにトレーニングされた複数のトピック判定手段と、与えられる入力データがドメインに属するか否かを検証するためのドメイン検証器と、入力データを複数のトピック判定手段に与え、複数のトピック判定手段が出力した判定結果をドメイン検証器に入力するためのデータ入力手段とを含み、それによって、データ入力手段によるデータの入力に応答したドメイン検出装置の出力は、入力データが前記ドメインに属するか否かを示す。
本発明の第4の局面に係るドメイン検証装置のトレーニング装置は、入力データが自己に割り当てられたトピックに属するか否かを判定するようにトレーニングされた複数のトピック判定手段と、与えられる入力データが所定のドメインに属するか否かを検証するためのドメイン検証器と、複数のトピック判定手段、及びドメインに属する入力データを用いて、与えられる入力データが上記した複数のトピック判定手段のトピックからなるドメインに属するか否かをドメイン検証器が判定可能となるように、ドメイン検証器をトレーニングするためのトレーニング手段とを含む。
[第1の実施の形態]
‐概論‐
以下に述べる第1の実施の形態は、入力された発話がドメイン外(Out−Of−Domain:以下「OOD」と呼ぶ。)の発話かドメイン内の発話かを検出することが可能な、音声認識装置とともに用いられるドメイン外検証装置に関するものである。この実施の形態にかかる装置は、対象ドメインに属する発話セットのみを用いて、入力された発話がこのドメインに属するか否かを判定する。
そのための枠組みとして、当該ドメインを複数のトピックに分け、入力された発話がこれらトピックの各々に属すると考えられる信頼度尺度をトピックごとに算出する。このようにして複数のトピックに対して求めた信頼度尺度をこの入力発話のドメイン判定のための特徴ベクトルとし、予めドメイン内の発話を用いて同様の処理をすることにより得られた信頼度尺度によってトレーニングされたドメイン検証器を用いてOODか否かを判定する。
ドメイン検証器のトレーニングにはドメイン内の発話しか使用しないので、OODの発話を収集する必要はない。
‐構成‐
以下に、本実施の形態の構成について説明する。この実施の形態は本発明を実施するためのひとつの形態を述べているにすぎず、各構成要素についてはこれ以外にも種々の変形が可能で、また代替が可能なものもある。それらの全てを示すのは困難であるので、可能な変形のいくつかを、実施の形態の説明の最後に掲げる。
図1に、本実施の形態にかかるドメイン外判定装置36を用いた音声応答システムの使用環境を示す。図1を参照して、このドメイン外判定装置36を含む音声応答システム28は、ユーザの発話音声を電気信号に変換するためのマイクロフォン30と、マイクロフォン30からの音声信号に対して、所定のドメイン依存モデル34を用いて音声認識を行なうための音声認識装置32と、音声認識装置32により出力された音声認識の結果が、ドメイン依存モデル34がカバーしているドメイン内のものか、OODかを判定し、OODの場合にはユーザへのフィードバックとしてドメイン外警告信号を出力するための、本実施の形態に係るドメイン外判定装置36と、ドメイン外判定装置36からのドメイン外警告信号に応答して、ドメイン外警告を視覚的に表示したり、スピーカによって音声出力したりするためのドメイン外警告部40と、ドメイン外判定装置36によって入力発話がドメイン内のものであると判定されたことに応答して、音声認識装置32による音声認識結果に基づいてユーザに対し対話のための適切な出力を行なうための応答装置38とを含む。
この音声応答システム28で使用されるドメイン外判定装置36は、既に述べたように予めこのドメインに対応してトレーニングされている。図1には、そのためのドメイン外判定トレーニングユニット22も示してある。後述するように、ドメイン外判定装置36は処理対象のドメインに含まれる複数のトピックの各々に対して、入力発話がそのトピック内のものであると考えられる信頼度尺度を出力するクラス分類器26と、その結果に基づいて入力発話が対象ドメイン内のものかOODかを判定するドメイン検証器24とを使用する。ドメイン外判定トレーニングユニット22は、ドメイン依存モデル34のドメインに対応する発話を含む発話セット20を用いて、クラス分類器26とドメイン検証器24とをトレーニングする機能を持つ。
図2に、発話セット20の構成と、ドメイン外判定トレーニングユニット22の詳細なブロック図を示す。図2を参照して、発話セット20は、それぞれ別々のトピック(第1のトピックから第Mのトピックとする。)の発話からなるM個の発話セット70−1〜70−Mに分割されている。
ドメイン外判定トレーニングユニット22は、与えられた発話の各々に対して、上記したM個のトピックに属するか否かをトピックごとに信頼度尺度として出力するためのクラス分類器52と、上記したようにクラス分類器52が信頼度尺度を出力するように、発話セット20を用いてクラス分類器52をトレーニングするためのクラス分類器トレーニング部50とを含む。
本実施の形態の装置では、クラス分類器52に対して与えられる発話データは、発話を構成する1−、2−、及び3−グラムを用いて得られる特徴ベクトルの形である。この特徴ベクトル内の各語にはさらに、品詞情報(Part Of Speech:POS)が付加されている。
ドメイン外判定トレーニングユニット22はさらに、ある発話に対してトレーニング終了後のクラス分類器52が出力するM個の信頼度尺度を要素とする信頼度ベクトルが与えられると、当該発話が発話セット20のドメインに属するか否かを判定するためのドメイン検証器56と、トレーニング後のクラス分類器52及び発話セット20を用いて、後述する削除補間(Deleted Interpolation)法に基づいたトレーニング方法により、発話セット20のドメインに属さない発話をトレーニングデータとして用いずにドメイン検証器56をトレーニングするためのドメイン検証器トレーニング部54とを含む。本実施の形態で使用する削除補間法については後述する。
クラス分類器52は、発話セット20の各トピック70−1〜70−Mにそれぞれ対応して設けられ、発話の特徴ベクトルが与えられると、当該発話がその担当するトピックに属するか否かに関する信頼度尺度を出力するための、第1〜第MのSVM74−1〜74−Mを含む。本実施の形態では、各SVMに対し、発話の特徴ベクトルの要素と、その発話がこのSVMに割当てられたトピックに属するか否かを示す情報とからなるベクトルを与えることによりトレーニングが行なわれる。この際、トピック内の発話を正解データ、それ以外のトピックに属する発話を誤りデータとする。
トレーニング済みのSVMによる分類では、発話の特徴ベクトルの張る空間内において与えられた特徴ベクトルにより表される点と、SVMによる判別のためのハイパープレーンとの間の距離を用いて分類の尺度とする。入力がトピック内にあればこの距離の値は正、それ以外の場合には負とする。また、SVMの出力である距離は[−∞,∞]の範囲の値であるが、これにシグモイド変換を行なって[0,1]の範囲正規化することにより、信頼度尺度が得られる。
クラス分類器トレーニング部50は、クラス分類器52の第1〜第MのSVM74−1〜74−Mをそれぞれトレーニングするための第1〜第MのSVMトレーニング部72−1〜72−Mを含む。
ドメイン検証器56は、処理対象の発話Xを受けたトレーニング後のクラス分類器52から出力されるM個の信頼度尺度を要素とするベクトルに基づき、次の式Gin-domainを適用することで当該発話Xがドメイン外か否かを判定する。
Figure 0004191021
ドメイン検証器トレーニング部54は、ドメイン検証器56を削除補間法によりトレーニングする。式(1)中の係数λ ij はこのトレーニングにより得られる。ドメイン検証器トレーニング部54の詳細を説明する前に、削除補間法の概要について説明する。
ドメイン検証器56のトレーニングには、削除補間法を用いるので、発話セット20中のデータのみ、すなわち、対象ドメイン内のデータのみを用いる。OODのデータは用いない。ドメイン検証器トレーニング部54によるトレーニングではさらに、この削除補間法に、GPD(gradient probabilistic descent:確率降下法)を組み合わせて用いる。
この方法のアルゴリズムを擬似コードで書けば以下のようになる。

[1,M]中のトピックごとに

トピックを一時的なOODに設定する
他のトピックをドメイン内に設定する
トピックjをOOD、他のトピックをドメイン内と判別するように、式(2)によってドメイン検証モデルG in-domain (X)をトレーニングする
すなわち、GPDを用い、式(2)の識別エラーが最小化するように重み(λ 1j ,…,λ ij ,…,λ Mj (i≠j)を計算す
Figure 0004191021

λ i (1≦i≦M)の各々を、上記した繰り返しにより得られた値(λ i1 ,…,λ ij ,…,λ iM )(1≦j≦M,j≠i)の平均値として求める。

つまり、あるトピックを一時的にOODとし、このトピックに対応するSVMをモデルから削除して、残りのSVMを用い発話セット20の全ての発話に対する信頼度尺度を求める。発話が、OODに設定されたトピック以外の残りのトピックに属するような判定が上記したドメイン内検証モデルGin-domain(X)で行なえるように、重みλij(1≦i,j≦M、)をGPDにより算出する。最後に、λ i (1≦i≦M)の各々を、こうして得た重みλ ij (1≦j≦M,j≠i)を平均することにより求める。
ここで、一時的にOODに設定されたトピックの発話は、トレーニングにおいては誤り(OOD)の例として用いられ、残りのトピックの発話は、いずれも正しい例(ドメイン内)として用いられる。
このようにして重みλij(1≦i,j≦M、i≠j)を算出した後,これらを全て平均する。各重みλijについてはM−1個の値が算出されるので、重みλi=Σλij(1≦j≦M、ただしj≠i)/(M−1)として計算できる。これら重みλiが求められることにより、ドメイン検証器56のトレーニングが完了する。
図2を参照して、ドメイン検証器トレーニング部54は、上記した処理を行なうため、発話セット20のトピックをひとつずつOODに指定して繰り返し処理を行ない、重みλIを算出する制御を行なうためのトレーニング制御部60と、発話セット20の発話の各々に対するクラス分類器52からの出力のうち、トレーニング制御部60により指定されたトピック以外のトピックの信頼度尺度を要素とする信頼度ベクトルを作成するための信頼度ベクトル作成部62とを含む。
ドメイン検証器トレーニング部54はさらに、信頼度ベクトル作成部62により発話セット20の発話ごとに得られた信頼度ベクトルを用いて、上記した様にGPDを用いて重みλij(1≦i,j≦M、i≠j)を算出するための係数算出部64と、係数算出部64により算出された重みλijの合計を上記したようにM−1で除することにより平均するための係数平均部66とを含む。
クラス分類器トレーニング部50の処理を実現するアルゴリズムを図3にフローチャート形式で示す。図3を参照して、まずステップ100で初期化を行なう。コンピュータで当該処理を実行する場合には、ここでワークメモリの確保、変数への初期値の設定などを行なう。
ステップ102で、繰返し制御変数iに0を代入する。続くステップ104〜ステップ108の処理は、i=1〜Mまでの繰返し処理である。
まずステップ104で変数iに1を加算し、変数iの新たな値とする。続くステップ106で、変数iの値がトピック数Mを超えたか否かを判定する。変数iの値がMを超えていれば処理を終了する。さもなければステップ108に進む。
ステップ108では、i番目のトピックの発話セットを正解、他のトピックの発話セットを誤りとして、i番目のSVMの訓練を行なう。訓練が終了すればステップ104に戻り、次のトピックのSVMの訓練を行なう。
以上のアルゴリズムにより、クラス分類器52に含まれる第1〜第MのSVMの訓練を行なうことができる。
ドメイン検証器トレーニング部54によるドメイン検証器56の訓練を実現するアルゴリズムを図4に示す。図4を参照して、ドメイン検証器トレーニング部54による処理では、最初にステップ120で初期化が実行される。続いてステップ122で繰返し変数に0が代入される。以下のステップ124〜130は、削除補間法に従った繰返し処理である。
まずステップ124で、変数に1を加算する。続いてステップ126で変数がトピック数Mを超えたか否かを判定する。変数がMを超えていればステップ132に進み、さもなければステップ128に進む。
ステップ128では、番目のSVM72−をモデルから取除く。続くステップ130で、このように番目のSVM72−を除いたほかのSVM72−(1≦≦M,)を用いて、発話セット20の全発話を用いてGPDによって重みλij (1≦j≦M、j≠i)を算出する。この後、ステップ124に戻る。
ステップ126で変数がトピック数Mを超えていると判定された場合、ステップ132においてλij (1≦≦M、≠i)の和をM−1で除算することにより平均し、λi(1≦i≦M)を算出し処理を終了する。以上によりドメイン検証器56の訓練が終了する。
このドメイン検証器56によるドメイン外検証の基本的な考え方について説明する。ある発話が、あるトピックに属し、他のトピックには属さない場合、その発話から得られる特徴ベクトルをクラス分類器52の全てのSVMに与えると、理想的には、対応のSVMのみの出力が「正解」、他のSVMの出力は全て「誤り」となるであろう。従って、正解を「1」、誤りを「0」とすれば、それらを要素とするベクトルは、正解となった要素のトピックに対応する軸の、座標「1」の近傍を指すであろう。
同様に、各トピックのいずれかに属する発話に対してクラス分類器52から得られた信頼度尺度を要素とする信頼度ベクトルは、各トピックに対応する軸の座標「1」の付近に集まるであろう。
これに対し、いずれのトピックにも属さない発話、すなわちこのドメインに属さない発話の場合には、得られる信頼度ベクトルの要素はいずれも0に近い値となるであろう。従って、信頼度尺度の張る空間内において、ある発話の信頼度ベクトルが原点付近にあればその発話はドメイン外、原点付近になく各軸の近くに沿った付近にある信頼度ベクトルの場合には、その発話はドメイン内、と判定することができる。
実際には、そのように理想的な分類はできないので、上記したように削除補間法を用いて各重みλiを算出する。
なお、上のように考えた場合、各軸ごとに、ドメイン外かドメイン内かを判定するためのしきい値は異なってしかるべきである。ドメイン検証器トレーニング部54によるλiの算出は、このように軸ごとに異なるしきい値を、各要素ごとの重みに置き換えて算出することである。
図5に、簡略のためにM=3の場合の信頼度ベクトル空間を模式的に示す。この空間の軸がx1〜x3であるとする。x1軸に対応するトピックに属する発話の場合、信頼度ベクトルの終点(始点を原点とする。)はほぼ部分空間150のあたりに位置するであろう。同様に、x2軸に対応するトピックに属する発話の場合、信頼度ベクトルの終点は部分空間150のあたりに位置するであろう。x3軸に対応するトピックに属する発話の場合、その信頼度ベクトルの終点は部分空間154のあたりに位置するであろう。
いずれのトピックにも属さない発話の場合、その信頼度ベクトルの終点は、原点周辺の領域156のあたりに位置するであろう。
従って、図5に示すように領域150、152、及び154と、領域156とを分離する平面160(次元数が4以上になれば超平面)を定めることができれば、発話の信頼度ベクトルの終点がこの平面により分割される領域の原点側にあるか、それ以外かによって、領域外か否かを判定できる。
平面160と各軸との切片は、φ1〜φ3で示すように互いに異なった値となる。このように、各軸との切片を決めるのが、式(1)により表される加重和における重みλとしきい値φである。
図1示すクラス分類器26及びドメイン検証器24は、図2に示されるドメイン外判定トレーニングユニット22においてトレーニングの済んだクラス分類器52及びドメイン検証器56にそれぞれ相当する。
‐ドメイン外判定装置36‐
一方、図1に示すドメイン外判定装置36は、このクラス分類器26及びドメイン検証器24を用いて、入力発話がOODか否かを判定するためのものであり、以下の構成を有する。図6を参照して、ドメイン外判定装置36は、マイクロフォン30から入力される発話音声に対し、ドメイン依存モデル34を用いた音声認識を行なうことにより音声認識装置32により出力される音声認識結果の発話テキストデータを入力とする。
ドメイン外判定装置36は、入力の発話テキストデータの特徴ベクトルを作成するための特徴ベクトル作成部180を含む。特徴ベクトル作成部180による特徴ベクトルの作成は、図2においてクラス分類器52に与えられるものと同様である。すなわち、1−,2−,及び3−グラムと品詞(word+POS)とを要素として並べたものである。
ドメイン外判定装置36はさらに、特徴ベクトル作成部180から与えられる特徴ベクトルに対し、クラス分類器26により作成されるトピックごとのM個の信頼度尺度を要素として持つ信頼度ベクトルを作成するための信頼度ベクトル作成部182と、信頼度ベクトル作成部182の作成した信頼度ベクトルを入力として、ドメイン検証器24(図2のドメイン検証器56と同様)を用いて式(1)に示す演算を行ない、入力発話がOODいか否かを判定するためのドメイン検証部184と、ドメイン検証部184による判定結果に応じて、ドメイン外警告部40又は応答装置38を適切に動作させる処理を行なうための検証結果処理部186とを含む。
図7に、ドメイン外判定装置36を実現するためのアルゴリズムをフローチャート形式で示す。コンピュータプログラムによりドメイン外判定装置36を実現する場合には、このフローチャートに従った処理を実行するようにすればよい。
まずステップ200において、音声認識結果の入力Xを受ける。ステップ202で、この入力Xに対する特徴ベクトルを作成する。前述したとおり、この特徴ベクトルは入力発話テキストデータの1−、2−、及び3−グラムと品詞情報とを要素とする。
ステップ204で、第1〜第Mのトピックに対応するSVMを用い、この入力Xに対するトピックごとの信頼度尺度C(ti|X)(1≦i≦M)を算出する。
ステップ206で、ドメイン内検証モデル(ドメイン内検証関数)Gin-domain(X)をこの信頼度尺度を要素とする信頼度ベクトルに対して適用する。その結果は、式(1)に示すように入力Xがドメイン内であれば1、それ以外の場合には0である。
ステップ208で、ステップ206において算出されたドメイン内検証関数Gin-domain(X)の値が1か否かを判定する。1であればステップ210で音声認識結果に対する適切な応答処理を実行し、処理を終了する。0であればステップ212で入力された発話が、この音声認識装置32の対象とするドメイン外であったことを示すドメイン外警告表示を行ない、処理を終了する。
[動作]
以上説明システムの動作は3つのフェーズに分かれる。第1のフェーズは、ドメイン外判定トレーニングユニット22によるクラス分類器52(クラス分類器26)のトレーニングフェーズである。第2のフェーズは、ドメイン外判定トレーニングユニット22において、クラス分類器52のトレーニングの終了後、ドメイン検証器56(ドメイン検証器24)のトレーニングを行なうフェーズである。第3のフェーズは、このようにトレーニングの終了したクラス分類器52(クラス分類器26)及びドメイン検証器56(ドメイン検証器24)を備えたドメイン外判定装置36を用い、音声応答装置において入力された音声がドメイン外か否かを判定するフェーズである。以下、これらについて順番に説明する。
‐ドメイン外判定トレーニングユニット22の動作‐
ドメイン外判定トレーニングユニット22は以下のように動作する。この処理に先立ち、発話セット20が準備されており、かつその中の各発話が第1〜第Mのトピックからなる発話セット70−1〜70−Mに分類されているものとする。この分類は、手作業で行なってもよいし、何らかの手段で機械的に行なってもよい。
発話が第1〜第Mの発話セット70−1〜70−Mに対応するトピックに属するか否かを判定できるよう、第1〜第MのSVM74−1〜74−Mに対するトレーニングが実行される。第1〜第MのSVMトレーニング部72−1〜72−Mが、それぞれ担当するトピックに属する文を正解、それ以外のトピックに属する文を誤り、として各SVMに与えることによりSVM74−1〜74−Mのトレーニングが行なわれる。SVMのトレーニングには、一般に入手可能なSVMツールを用いることができる。
トレーニングが済むと、クラス分類器52の各SVM74−1〜74−Mは、自己が担当するトピックに属する文が入力されると1、それ以外の場合には0となる信頼度尺度を出力するようになる。
‐ドメイン検証器56のトレーニング‐
クラス分類器52の各SVMのトレーニングが終了すると、ドメイン検証器56のトレーニングが可能になる。
トレーニング制御部60は、まず1番目のトピックを選択し、これを一時的なOODとし、残りの第2〜第Mのトピックをドメイン内とする。そして、発話セット20に含まれる発話の各々を、第1〜第MのSVM74−1〜74−Mに対して与える。第1〜第MのSVM74−1〜74−Mは、これに対してそれぞれ信頼度尺度を出力する。
信頼度ベクトル算出部62は、第1〜第MのSVM74−1〜74−Mから出力される信頼度尺度からなる信頼度ベクトルを発話ごとに生成し、その発話が第1のトピックに属するか否かを示す情報とともに係数算出部64に与える。
係数算出部64は、信頼度ベクトル算出部62から与えられる全ての発話に対する信頼度ベクトルと、それぞれの発話が第1のトピックに属するか否かを示す情報とに基づき、GPDにより第1のトピックに関するM−1個の重みλ12〜λ1Mを算出し係数平均部66に与える。
次にトレーニング制御部60は、2番目のトピックを選択し、これを一時的なOODとし、残りのトピックの発話データをドメイン内データとして第1〜第MのSVM74−1〜74−Mに与える。第1のトピックの場合と同様に、クラス分類器52、信頼度ベクトル算出部62、及び係数算出部64を用い、第2のトピックに関するM−1個の重みλ21,λ23,…,λ2Mを算出し係数平均部66に与える。
トレーニング制御部60は、以下同様にして第3〜第Mのトピックの各々に関して、当該トピックに対応する重みを除くM−1個の重みを算出し係数平均部66に与える。
係数平均部66は、ドメイン検証器トレーニング部54による重みの計算が終了すると、1≦i≦Mの全てのiに関して、重みλij(1≦j≦M,i≠j)の合計を計算し、さらにその和をM−1で除算することにより、平均の重みλi(1≦i≦M)を算出する。この重みλiを全て算出することでドメイン検証器56のトレーニングが終了したことになる。
‐ドメイン外判定装置36の動作‐
マイクロフォン30により入力された音声に対し、音声認識装置32がドメイン依存モデル34を用いて音声認識を行ない、音声認識結果の発話データをテキスト形式で特徴ベクトル作成部180に与える。ドメイン依存モデル34のドメインは、信頼度ベクトル作成部182及びドメイン検証部184のクラス分類器26及びドメイン検証器24がトレーニングを行なった際のドメインと一致しているものとする。
特徴ベクトル作成部180は、入力されるテキストデータの1−、2−、及び3−グラムと品詞情報とからこの入力の特徴ベクトルを作成し信頼度ベクトル作成部182に与える。
信頼度ベクトル作成部182は、与えられた特徴ベクトルを各SVMに与えることにより、トピックごとの信頼度尺度を要素とする信頼度ベクトルを作成しドメイン検証部184に与える。
ドメイン検証部184は、与えられた信頼度ベクトルをドメイン検証部184に含まれるドメイン検証器24に与える。従ってドメイン検証部184は、前述したとおり、入力がドメイン依存モデル34のドメイン外であれば0、ドメイン内であれば1をそれぞれ出力し検証結果処理部186に与える。
検証結果処理部186は、ドメイン検証部184の出力が1であれば応答装置38を制御して、音声認識の結果に対応した適切な応答を出力させる。一方、ドメイン検証部184の出力が0であればドメイン外警告部40に対し、警告を出力する。ユーザは、ドメイン外警告を受けた場合にはその問に対する答えを得ることを直ちにあきらめるであろう。ユーザが、何度も発音しなおしたりすることがなくなり、ユーザの不満が大きくなることを防止できる。
また、ドメイン検証器56のトレーニングには、ドメイン内の発話データしか必要としない。ドメイン外のデータという、収集が困難なデータを用いなくても、ドメイン外か否かの判定を行なうことができ、システムを実現する上での困難が解消される。
[変形例]
上記した実施の形態の装置では、SVMへの入力など、発話の特徴ベクトルとして1−,2−,及び3−グラムと品詞情報とからなるものを用いた。しかし本発明はそのようなものに限定されるわけではない。例えば、1−グラムのみ、2−グラムのみ、4−グラム以上、及びそれらの任意の組合わせ、並びにそれらと品詞情報との組合わせ等も用いることができる。
さらに、単語としては、単語の原形のみ、単語の表層構造等を用いることもできる。さらに、単語の変種を含ませることも可能である。
また、上記実施の形態では、トピッククラスの分類にSVMを用いている。しかし本発明はそのような実施の形態に限定されるわけではない。例えば、トピック依存の単語N−グラム、又はLSA(Latent Semantic Analysis:潜在意味分析)等の手法を用いることもできる。
さらに、上記した実施の形態の手法ではトピックにより明確な判定が困難な場合が生ずることもあり得る。そうした場合には、そのトピックに特化した検証装置を作成し使用することもできる。例えば、上記した実施の形態でのドメイン内検証モデル(ドメイン内検証関数)Gin-domain(X)ではうまくモデル化できないようなトピックが存在した場合には、そのトピック専用の関数を付加してもよい。その場合には、その関数の重みを、当該トピックをよく検出できるようにトレーニングする必要がある。
ドメイン検証では、トピック専用の関数が存在する場合には最初に最も入力文が属する信頼度が高いトピックを求め、そのトピックに対し専用の検証用の関数を適用する。それ以外の場合には、式(1)を適用する。
[実験]
上記したような種々の条件を組合わせて、ドメイン検証の実験を行なった。実験には、出願人において準備したコーパスを用いた。このコーパスの概略構成についてテーブル1に示す。
Figure 0004191021
ここで、WERは単語誤り率、SERは文誤り率、OOVは語彙外を示す。
この実験では、音声翻訳システムにおいて「ショッピング」をOODとした。11のドメイン内トピックを用いて、音声認識のための言語モデル及びトピッククラス分類器をトレーニングした。
ドメイン内テストセット及びドメイン外テストセットに対する認識結果をテーブル2に示す。
Figure 0004191021
表2から分るように、ドメイン内データセットと比較するとOODデータセットは誤り率及び語彙外率はいずれも高くなっているが、発話の半数以上が正しく認識されている。これは、ドメイン全体に対応した言語モデルを音声認識において使用しているためである。これから、OODセットがドメイン内タスクに関連しており、その結果それらの間の区別は困難であろうと思われる。
システム性能は以下の基準により測定した。
FRR(False Rejection Rate):OODに分類されたドメイン外の発話の率
FAR(False Acceptance Rate):ドメイン内に分類されたOODの発話の率
EER(Equal Error Rate):FRRとFARとが等しくなった点における誤り率
また、テーブル3に、トピッククラス分類に関して上記した種々の方式、及び発話の特徴ベクトルに関して前述した種々のフォーマットに関するトピック分類の性能について示す。
Figure 0004191021
テーブル3から分るように、トピッククラス分類器としてSVMを用い、特徴ベクトルとして語+POSの1,2,3−グラムを用いた場合が最も低いERRを示した。次に説明するOOD検証においては、SVMを用い、語+POS及び1,2,3−グラムからなる特徴ベクトルを用いた実験を行なった。
実験では、全てのSVMの判定結果が否のときに発話がOODと判定するベースラインシステムと、上記した実施の形態に示したようにドメイン内のデータのみを用いてドメイン検証のトレーニングした装置(提案方式)と、ドメイン内データだけでなく、OODデータも用いてドメイン検証のトレーニングを行なったもの(参照方式)とを用い、結果の比較を行なった。その結果、EERにおいてベースラインシステムでは27.7%、参照システムが21.2%であるのに対し、本発明の実施の形態に係るシステムではEER=19.6%となった。すなわち、ベースラインシステムに対しEERにして6.5ポイントの改善を示す一方、参照システムとほぼ同等のEERを示した。本実施の形態に係るシステムでは、領域内発話データしか用いずにドメイン検証のトレーニングを行なったのであるから、この結果は十分に高いものということができる。
なお、上記した実施の形態に係るドメイン判定学習ユニット22(図1参照)は、通常のハードウェア構成及びオペレーティングシステムを備えたコンピュータ上で実行されるプログラムにより実現可能である。当該プログラムには、上記したドメイン判定学習ユニット22の機能を実現するために必要な全ての命令を含んでいる必要はなく,例えばオペレーティングシステムに備えられている命令を呼び出すことにより、所望の機能を実現するものでものよい。すなわち、コンピュータのハードウェア及びソフトウェア資源を利用して上記したドメイン判定学習ユニット22の各機能を実現するものであればよい。
また、図1に示す音声応答システム28及びそこで使用されるドメイン外判定装置36もマイクロフォン30及び音声処理専用のボードを除き、一般的な構成のコンピュータ及びソフトウェアにより実現可能である。
そして、そうしたプログラムによりプログラムされたコンピュータは、本発明に係るドメイン検証器のトレーニング装置又はドメイン検証装置となる。
今回開示された実施の形態は単に例示であって、本発明が上記した実施の形態のみに制限されるわけではない。本発明の範囲は、発明の詳細な説明の記載を参酌した上で、特許請求の範囲の各請求項によって示され、そこに記載された文言と均等の意味および範囲内でのすべての変更を含む。
本発明の第1の実施の形態に係るドメイン外判定装置を用いた音声応答システムの概略構成を示すブロック図である。 本発明の第1の実施の形態に係るドメイン判定学習ユニット22のブロック図である。 本発明の第1の実施の形態に係るドメイン判定学習ユニット22のクラス分類器トレーニング部50によるトレーニング処理のアルゴリズムを示すフローチャートである。 本発明の第1の実施の形態に係るドメイン判定学習ユニット22のドメイン検証器トレーニング部54によるトレーニング処理のアルゴリズムを示すフローチャートである。 本発明の第1の実施の形態に係るドメイン判定学習ユニット22のドメイン検証器56によるドメイン判定の原理を示す図である。 本発明の第1の実施の形態に係るドメイン外判定装置36のブロック図である。 ドメイン外判定装置36を含む音声応答システム28により実行される処理のアルゴリズムを示すフローチャートである。
符号の説明
20 発話セット、22 ドメイン判定学習ユニット、24 ドメイン検証器、26 クラス分類器、28 音声応答システム、30 マイクロフォン、32 音声認識装置、34 ドメイン依存モデル、36 ドメイン外判定装置、38 応答装置、40 ドメイン外警告部、50 クラス分類器トレーニング部、52 クラス分類器、54 ドメイン検証器トレーニング部、56 ドメイン検証器、60 トレーニング制御部、62 信頼度ベクトル算出部、64 係数算出部、66 係数平均部、70−1〜M 発話セット、72−1〜M SVMトレーニング部、180 特徴ベクトル作成部、182 信頼度ベクトル作成部、184 ドメイン検証部、186 検証結果処理部

Claims (7)

  1. 複数のトピックに分類された、一つのドメインに属する機械可読なドメイン内データを記憶するための手段と、
    前記ドメイン内データの前記複数のトピックの一つがそれぞれ割り当てられ、トレーニングデータが自己に割り当てられたトピックに属するか否かを判定するようにトレーニング可能な複数のトピック判定手段と、
    前記ドメイン内データをトレーニングデータとして用い、前記複数のトピック判定手段をトレーニングするための第1のトレーニング手段と、
    与えられる入力データが所定のドメインに属するか否かを検証するためのドメイン検証器と、
    前記第1のトレーニング手段によりトレーニングされた前記複数のトピック判定手段と前記ドメイン内データとを用いて、与えられる入力データが前記ドメイン内データのドメインに属するか否かを前記ドメイン検証器が判定可能となるように、前記ドメイン検証器をトレーニングするための第2のトレーニング手段とを含み、
    前記第2のトレーニング手段は、
    前記複数のトピックのうちのj番目(jは自然数)の一つを選択してドメイン外に設定するためのトピック選択手段と、
    前記トピック選択手段によりドメイン外に設定されたトピックに対応する前記トピック判定手段を除く、残りのトピック判定手段に対し、前記ドメインに属するトレーニングデータを与え、トレーニングデータごとに前記複数のトピック判定手段による判定結果を、各トピックに属すると判定される信頼度尺度として得るための手段と、
    前記判定結果を得る手段により得られた前記残りのトピック判定手段による判定結果と、前記トレーニングデータが属するトピックを示す情報とに基づいて、次式で表されるドメイン検証関数Gin-domain(X)
    Figure 0004191021
    によって、トレーニングデータが前記ドメイン外に設定されたトピックに属するか否かを判定できるように、前記ドメイン内検証関数Gin-domain(X)の係数λ ij (1≦j≦M,j≠i)の値を確率降下法により算出するための係数算出手段と、
    前記複数のトピックの各々が全て一度ずつ選択されるように前記トピック選択手段、前記判定結果を得るための手段、及び前記係数算出手段が繰返し動作するよう制御するための制御手段と、
    前記制御手段による繰返しの結果、各トピックに対して算出された前記ドメイン内検証関数Gin-domain(X)の係数λ ij (1≦j≦M,j≠i)の平均値λ i (1≦i≦M)を算出するための平均算出手段と、
    前記平均算出手段により算出された係数λ i (1≦i≦M)を前記ドメイン検証器のパラメータに設定するための手段とを含む、ドメイン検証器のトレーニング装置。
  2. 前記複数のトピック判定手段の各々は、トレーニングデータ及び当該トレーニングデータが自己に割り当てられたトピックに属するか否かを示す情報が与えられると、入力データが自己に割り当てられたトピックに属するか否かを判定するようにトレーニング可能なサポートベクターマシン(SVM)を含む、請求項1に記載のドメイン検証器のトレーニング装置。
  3. 前記SVMは、入力データが自己に割り当てられたトピックに属するか否かを示す情報を、所定範囲に正規化された数値として出力する、請求項2に記載のドメイン検証器のトレーニング装置。
  4. 前記SVMは、入力データが自己に割り当てられたトピックに属するか否かを示す情報を、前記所定範囲内の離散値として出力する、請求項3に記載のドメイン検証器のトレーニング装置。
  5. コンピュータにより実行されると、当該コンピュータを請求項1〜請求項のいずれかに記載のドメイン検証器のトレーニング装置として動作させる、コンピュータプログラム。
  6. ドメイン内データの複数のトピックの一つがそれぞれ割り当てられ、入力データが自己に割り当てられたトピックに属する信頼度尺度を出力するようにトレーニングされた複数のトピック判定手段と、
    与えられる入力データが前記ドメインに属するか否かを、前記複数のトピック判定手段の出力する前記信頼度尺度の加重和をしきい値と比較することにより検証するためのドメイン検証器と、
    入力データを前記複数のトピック判定手段に与え、前記複数のトピック判定手段が出力した信頼度尺度を前記ドメイン検証器に入力するためのデータ入力手段とを含み、それによって、前記データ入力手段によるデータの入力に応答した前記ドメイン検出装置の出力は、前記入力データが前記ドメインに属するか否かを示す、ドメイン検証装置。
  7. 複数のトピックに分類された、一つのドメインに属する機械可読なドメイン内データを記憶するための手段と、
    入力データが自己に割り当てられたトピックに属するか否かを判定するようにトレーニングされた複数のトピック判定手段と、
    与えられる入力データが所定のドメインに属するか否かを検証するためのドメイン検証器と、
    前記複数のトピック判定手段、及び前記ドメインに属する入力データを用いて、与えられる入力データが前記複数のトピック判定手段のトピックからなるドメインに属するか否かを前記ドメイン検証器が判定可能となるように、前記ドメイン検証器をトレーニングするためのトレーニング手段とを含む、ドメイン検証器のトレーニング装置であって、
    前記トレーニング手段は、
    前記複数のトピックのうちのj番目(jは自然数)の一つを選択してドメイン外に設定するためのトピック選択手段と、
    前記トピック選択手段によりドメイン外に設定されたトピックに対応する前記トピック判定手段を除く、残りのトピック判定手段に対し、前記ドメインに属するトレーニングデータを与え、トレーニングデータごとに前記複数のトピック判定手段による判定結果を、各トピックに属すると判定される信頼度尺度として得るための手段と、
    前記判定結果を得る手段により得られた前記残りのトピック判定手段による判定結果と、前記トレーニングデータが属するトピックを示す情報とに基づいて、次式で表されるドメイン検証関数Gin-domain(X)
    Figure 0004191021
    によって、トレーニングデータが前記ドメイン外に設定されたトピックに属するか否かを判定できるように、前記ドメイン内検証関数Gin-domain(X)の係数λ ij (1≦j≦M,j≠i)の値を確率降下法により算出するための係数算出手段と、
    前記複数のトピックの各々が全て一度ずつ選択されるように前記トピック選択手段、前記判定結果を得るための手段、及び前記係数算出手段が繰返し動作するよう制御するための制御手段と、
    前記制御手段による繰返しの結果、各トピックに対して算出された前記ドメイン内検証関数Gin-domain(X)の係数λ ij (1≦j≦M,j≠i)の平均値λ i (1≦i≦M)を算出するための平均算出手段と、
    前記平均算出手段により算出された係数λ i (1≦i≦M)を前記ドメイン検証器のパラメータに設定するための手段とを含む、ドメイン検証器のトレーニング装置。
JP2003401706A 2003-12-01 2003-12-01 ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム Expired - Fee Related JP4191021B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003401706A JP4191021B2 (ja) 2003-12-01 2003-12-01 ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003401706A JP4191021B2 (ja) 2003-12-01 2003-12-01 ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム

Publications (3)

Publication Number Publication Date
JP2005164836A JP2005164836A (ja) 2005-06-23
JP2005164836A5 JP2005164836A5 (ja) 2006-01-19
JP4191021B2 true JP4191021B2 (ja) 2008-12-03

Family

ID=34725548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003401706A Expired - Fee Related JP4191021B2 (ja) 2003-12-01 2003-12-01 ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム

Country Status (1)

Country Link
JP (1) JP4191021B2 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7634406B2 (en) * 2004-12-10 2009-12-15 Microsoft Corporation System and method for identifying semantic intent from acoustic information
JP4301212B2 (ja) 2005-06-03 2009-07-22 日産自動車株式会社 車両の制御装置
WO2007013521A1 (ja) * 2005-07-26 2007-02-01 Honda Motor Co., Ltd. ユーザと機械とのインタラクションを実施するための装置、方法、およびプログラム
JP5005291B2 (ja) * 2006-08-14 2012-08-22 トヨタ自動車株式会社 内燃機関の適合方法
JP4919282B2 (ja) * 2007-03-19 2012-04-18 独立行政法人産業技術総合研究所 不明瞭音声コマンド認識装置および不明瞭音声コマンド認識処理方法
US8050929B2 (en) * 2007-08-24 2011-11-01 Robert Bosch Gmbh Method and system of optimal selection strategy for statistical classifications in dialog systems
US8024188B2 (en) * 2007-08-24 2011-09-20 Robert Bosch Gmbh Method and system of optimal selection strategy for statistical classifications
JP5170449B2 (ja) * 2009-02-17 2013-03-27 日本電気株式会社 検出装置、音声認識装置、検出方法、及びプログラム
WO2020036188A1 (ja) * 2018-08-15 2020-02-20 日本電信電話株式会社 学習データ生成装置、学習データ生成方法およびプログラム

Also Published As

Publication number Publication date
JP2005164836A (ja) 2005-06-23

Similar Documents

Publication Publication Date Title
JP5223673B2 (ja) 音声処理装置およびプログラム、並びに、音声処理方法
US7996218B2 (en) User adaptive speech recognition method and apparatus
DK2713367T3 (en) Speech Recognition
EP2028645B1 (en) Method and system of optimal selection strategy for statistical classifications in dialog systems
JP6464650B2 (ja) 音声処理装置、音声処理方法、およびプログラム
US8886532B2 (en) Leveraging interaction context to improve recognition confidence scores
KR101590724B1 (ko) 음성 인식 오류 수정 방법 및 이를 수행하는 장치
US20030069729A1 (en) Method of assessing degree of acoustic confusability, and system therefor
CN111326148B (zh) 置信度校正及其模型训练方法、装置、设备及存储介质
Lane et al. Out-of-domain utterance detection using classification confidences of multiple topics
Campbell et al. Advanced language recognition using cepstra and phonotactics: MITLL system performance on the NIST 2005 language recognition evaluation
WO2018051945A1 (ja) 音声処理装置、音声処理方法、および記録媒体
JP4191021B2 (ja) ドメイン検証器のトレーニング装置、入力データのドメイン検証装置、及びコンピュータプログラム
JP2004198597A5 (ja)
JPWO2007105409A1 (ja) 標準パタン適応装置、標準パタン適応方法および標準パタン適応プログラム
Kinnunen et al. Comparative evaluation of maximum a posteriori vector quantization and Gaussian mixture models in speaker verification
You et al. A GMM-supervector approach to language recognition with adaptive relevance factor
KR20200114705A (ko) 음성 신호 기반의 사용자 적응형 스트레스 인식 방법
KR101283271B1 (ko) 어학 학습 장치 및 어학 학습 방법
White et al. An investigation of acoustic models for multilingual code-switching.
KR101229108B1 (ko) 단어별 신뢰도 문턱값에 기반한 발화 검증 장치 및 그 방법
KR100940641B1 (ko) 음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법
Hazen et al. Discriminative feature weighting using MCE training for topic identification of spoken audio recordings
Lane et al. Topic classification and verification modeling for out-of-domain utterance detection
JP2007017548A (ja) 音声認識結果の検証装置及びコンピュータプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051125

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20051125

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080610

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080909

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080917

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4191021

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110926

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120926

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130926

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees