JP2015232847A - 検出装置、修正システム、検出方法およびプログラム - Google Patents

検出装置、修正システム、検出方法およびプログラム Download PDF

Info

Publication number
JP2015232847A
JP2015232847A JP2014119959A JP2014119959A JP2015232847A JP 2015232847 A JP2015232847 A JP 2015232847A JP 2014119959 A JP2014119959 A JP 2014119959A JP 2014119959 A JP2014119959 A JP 2014119959A JP 2015232847 A JP2015232847 A JP 2015232847A
Authority
JP
Japan
Prior art keywords
test
training data
unit
classifier
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014119959A
Other languages
English (en)
Other versions
JP6173972B2 (ja
Inventor
政久 篠崎
Masahisa Shinozaki
政久 篠崎
敏行 加納
Toshiyuki Kano
敏行 加納
鈴木 優
Masaru Suzuki
優 鈴木
薫 平野
Kaoru Hirano
薫 平野
浜田 伸一郎
Shinichiro Hamada
伸一郎 浜田
幹門 小林
Mikito Kobayashi
幹門 小林
亮 木山
Akira Kiyama
亮 木山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba Digital Solutions Corp
Original Assignee
Toshiba Corp
Toshiba Solutions Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba Solutions Corp filed Critical Toshiba Corp
Priority to JP2014119959A priority Critical patent/JP6173972B2/ja
Priority to PCT/JP2015/063527 priority patent/WO2015190203A1/ja
Publication of JP2015232847A publication Critical patent/JP2015232847A/ja
Application granted granted Critical
Publication of JP6173972B2 publication Critical patent/JP6173972B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Electrically Operated Instructional Devices (AREA)

Abstract

【課題】訓練データの誤りの候補を容易に且つ確実に検出する。【解決手段】分類器を生成するための訓練データの誤りを検出する検出装置であって、訓練データを機械学習して生成した分類器をテストする第1テスト部と、訓練データから少なくとも1つの入力データを削除した縮小訓練データを生成する削除部と、縮小訓練データを機械学習して生成したテスト用分類器をテストする第2テスト部と、分類器のテストで不合格であり且つテスト用分類器のテストで合格である入力データが存在する場合、縮小訓練データを生成するために訓練データから削除した少なくとも1つの入力データを誤りの候補として出力する出力部と、を備える検出装置を提供する。【選択図】図1

Description

本発明の実施形態は、検出装置、修正システム、検出方法およびプログラムに関する。
音声対話システム等で用いられる意図理解モデルが知られている。意図理解モデルは、ユーザが発話等により入力した情報の意図を分類し、分類した意図を識別するラベルを出力する分類器の一例である。
分類器は、予め収集された訓練データ(学習データ)を機械学習することにより生成される。訓練データは、一例として、インターネットを介して、不特定多数のユーザから情報を収集することにより生成される。
特開2014−35625号公報 特開2011−203991号公報
ところで、元となる訓練データの信頼性は、分類器の精度に影響を与える。このため、精度の高い分類器を生成するためには、訓練データの誤りを修正して信頼性を向上させる必要がある。訓練データの誤りは、分類器に対してクローズドテストまたはクロスバリデーションテスト等をすれば検出することができる。
しかし、分類器に対してクローズドテストまたはクロスバリデーションテスト等をしても、実際には誤っているにも関わらず、テストでは合格(OK)となってしまう誤りを検出することは困難である。また、訓練データは、データ量が膨大である。このため、訓練データの全てを人手で確認して、このような誤りを検出することは困難である。
本実施形態に係る検出装置は、分類器を生成するための訓練データの誤りを検出する検出装置であって、前記訓練データを機械学習して生成した前記分類器をテストする第1テスト部と、前記訓練データから少なくとも1つの入力データを削除した縮小訓練データを生成する削除部と、前記縮小訓練データを機械学習して生成したテスト用分類器をテストする第2テスト部と、前記分類器のテストで不合格であり且つ前記テスト用分類器のテストで合格である入力データが存在する場合、前記縮小訓練データを生成するために前記訓練データから削除した前記少なくとも1つの入力データを誤りの候補として出力する出力部と、を備える。
図1は、実施形態に係る検出装置10の構成を示す図である。 図2は、訓練データおよび分類器を示す図である。 図3は、実施形態に係る検出装置10の処理フローを示す図である。 図4は、訓練データを機械学習して生成した分類器のテスト結果の一例を示す図である。 図5は、縮小訓練データを機械学習して生成したテスト用分類器のテスト結果の一例を示す図である。 図6は、変形例に係る検出装置10の処理フローを示す図である。 図7は、実施形態に係る修正システム50の構成を示す図である。 図8は、クローズドテストの処理内容を説明するための図である。 図9は、クロスバリデーションテストの処理内容を説明するための図である。 図10は、実施形態に係る修正システム50の処理フローを示す図である。 図11は、ポテンシャルテスト部64によるテストの結果の表示例を示す図である。 図12は、クローズドテストおよびクロスバリデーションテストのテスト結果の表示例を示す図である。 図13は、訓練データを修正するための操作例を示す図である。 図14は、訓練データの修正例を示す図である。 図15は、実施形態に係る検出装置10および修正システム50のハードウェア構成を示す図である。
以下、図面を参照しながら実施形態に係る検出装置10および修正システム50について詳細に説明する。本実施形態に係る検出装置10は、分類器を機械学習により生成するための訓練データの誤りの候補を容易に且つ確実に検出することを目的とする。なお、分類器は、入力データを入力し、入力した入力データを分類し、分類結果を表す出力データを出力する。また、本実施形態に係る修正システム50は、訓練データの誤りを効率良く修正することを目的とする。
図1は、実施形態に係る検出装置10の構成を示す図である。検出装置10は、入力部21と、第1機械学習部22と、第1テスト部23と、保存部24と、削除部25と、第2機械学習部26と、第2テスト部27と、判定部28と、出力部29とを備える。
入力部21は、ネットワーク上のサーバ等から訓練データを入力する。訓練データについては、図2において説明する。そして、入力部21は、入力した訓練データを第1機械学習部22および削除部25へと与える。
第1機械学習部22は、入力部21が入力した訓練データを機械学習して分類器を生成する。第1機械学習部22は、生成した分類器を第1テスト部23へと与える。
第1テスト部23は、訓練データを機械学習して生成した分類器をテストする。より具体的には、第1テスト部23は、予め定められた入力データを分類器に入力し、分類器から出力された出力データが、予め定められた期待データと一致するか否かを判定する。第1テスト部23は、分類器から出力された出力データが期待データと一致する場合には、その入力データを合格(OK)と判定し、一致しない場合には、その入力データを不合格(NG)と判定する。そして、第1テスト部23は、テストにより不合格(NG)となった入力データを保存部24へと与える。
第1テスト部23は、一例として、クローズドテストまたはクロスバリデーションテストを実行する。なお、クローズドテストについては図8においてさらに説明する。また、クロスバリデーションテストについては図9においてさらに説明する。また、第1テスト部23は、一例として、ランダムテストを実行してもよい。ランダムテストは、訓練データに含まれない未知の入力データを用いるテストである。ランダムテストは、未知の入力データに対する分類器の精度を検証することができる。
保存部24は、テストにより不合格(NG)となった入力データを第1テスト部23から受け取って保存する。
削除部25は、訓練データから少なくとも1つの入力データを削除した縮小訓練データを生成する。削除部25は、訓練データから1つの入力データを削除してもよいし、2以上の入力データを削除してもよい。削除部25は、生成した縮小訓練データを第2機械学習部26へと与える。また、削除部25は、削除した入力データ、および、訓練データにおいて削除した入力データに関連付けられている出力データを出力部29へ与える。
第2機械学習部26は、削除部25から与えられた縮小訓練データを機械学習してテスト用分類器を生成する。第2機械学習部26は、生成したテスト用分類器を第2テスト部27へと与える。
第2テスト部27は、縮小訓練データを機械学習して生成したテスト用分類器をテストする。より具体的には、第2テスト部27は、第1テスト部23によるテストと同一のテストを実行する。第2テスト部27は、一例として、第1テスト部23と同一のクローズドテストまたはクロスバリデーションテストを実行する。また、第2テスト部27は、一例として、第1テスト部23と同一のランダムテストを実行してもよい。第2テスト部27は、テストにより合格(OK)となった入力データを判定部28へと与える。
判定部28は、第2テスト部27から受け取った入力データと、保存部24に保存されている入力データとを比較して、一致するか否かを判断する。すなわち、判定部28は、分類器のテスト(第1テスト部23によるテスト)で不合格(NG)であり、且つ、テスト用分類器のテスト(第2テスト部27によるテスト)で合格(OK)である入力データが存在するか否かを判断する。判定部28は、このような入力データが存在する場合には、その旨を出力部29に通知する。
出力部29は、分類器のテストで不合格であり且つテスト用分類器のテストで合格である入力データが存在すると判定部28により判定された場合、縮小訓練データを生成するために訓練データから削除した少なくとも1つの入力データを、誤りの候補として出力する。この場合において、出力部29は、訓練データから削除した入力データと関連付けて出力データも出力する。
出力部29は、一例として、訓練データから削除した入力データと出力データとを関連付けて、誤りの候補として表示装置等に出力する。そして、ユーザは、表示装置に表示された誤りの候補を参照して、実際に誤りが存在するか否かを確認し、誤りが存在していれば、訓練データにおける対応する入力データを修正する。
図2は、訓練データおよび分類器を示す図である。訓練データは、複数の出力データと、それぞれの何れかの出力データに関連付けられた複数の入力データとを含むデータ集合である。出力データは、分類器から出力される情報を特定するためのデータである。入力データは、分類器に対して入力されるデータ例である。
本実施形態において、分類器は、人が発話または入力したテキストを入力データとして入力し、入力したテキストの意図を分類するラベルを出力データとして出力する。また、本実施形態において、訓練データに含まれる出力データは、ラベルと、IDと、問題文とを含む。ラベルは、出力データを特定するためのコードである。IDは、出力データを識別するための番号である。問題文は、意図の内容をユーザに認識させるためのテキストである。また、本実施形態において、訓練データに含まれる入力データは、人が発話するテキストの一例(発話例)である。
なお、分類器は、訓練データに含まれていない未知のテキストを入力データとして入力することができる。ただし、分類器は、訓練データに含まれる何れか1つの出力データを、入力データを分類した分類結果として出力する。
訓練データは、予め出力データを登録しておき、それぞれの出力データに関連する入力データ例を不特定多数の人から収集することにより生成される。例えば、訓練データは、それぞれの出力データの問題文をユーザに提示し、問題文と同一の意図のテキストをユーザから収集することにより生成される。ユーザへの問題文の提示およびテキストの収集は、例えばネットワークを介してクラウドソーシング等により実行される。
また、訓練データは、一例として、取得元(例えば、取得したユーザ)毎に入力データを管理してもよい。例えば、訓練データは、表の同一の列に、同一の取得元(同一のユーザ)から収集した入力データが配置されるように、それぞれの入力データを管理してもよい。
分類器は、このような訓練データを機械学習することにより生成される。分類器は、一例として、コンピュータ等により実行されるプログラム、または、有限状態トランスデューサ(出力符号付きの有限状態オートマトン)等であってよい。本実施形態においては、分類器は、ユーザが発話または入力したテキストを入力し、入力したテキストの意図を識別するラベルを出力する。なお、テスト用分類器も同様である。
図3は、実施形態に係る検出装置10の処理フローを示す図である。検出装置10は、訓練データの誤りの候補を検出する場合、以下のステップS11から処理を実行する。
まず、ステップS11において、入力部21は、訓練データを入力する。続いて、ステップS12において、第1機械学習部22は、入力した訓練データを機械学習して分類器を生成する。
続いて、ステップS13において、第1テスト部23は、分類器をテストする(第1のテスト)。第1テスト部23は、一例として、クローズドテスト、クロスバリデーションテストまたはランダムテスト等を実行する。続いて、ステップS14において、保存部24は、分類器のテストにより不合格(NG)となった入力データを保存する。
続いて、ステップS15において、削除部25は、訓練データから少なくとも1つの入力データを選択する。続いて、ステップS16において、削除部25は、訓練データから、選択した入力データを削除し、縮小訓練データを生成する。
続いて、ステップS17において、第2機械学習部26は、縮小訓練データを機械学習してテスト用分類器を生成する。続いて、ステップS18において、第2テスト部27は、縮小訓練データを機械学習して生成したテスト用分類器をテストする(第2のテスト)。この場合において、第2テスト部27は、ステップS13の第1テスト部23によるテスト(第1のテスト)と同一のテストを実行する。
続いて、ステップS19において、判定部28は、分類器のテスト(第1テスト部23による第1のテスト)で不合格(NG)であり、且つ、テスト用分類器のテスト(第2テスト部27による第2のテスト)で合格(OK)である入力データが存在するか否かを判断する。
分類器のテストで不合格(NG)であり且つテスト用分類器のテストで合格(OK)である入力データが存在しない場合(ステップS19のNo)、判定部28は、ステップS20に処理を進める。ステップS20において、判定部28は、ステップS15の処理で訓練データの全ての入力データが選択されたか否かを判断する。全ての入力データが選択された場合には(ステップS20のYes)、判定部28は、本フローを終了する。まだ全ての入力データは選択されていない場合には(ステップS20のNo)、判定部28は、処理をステップS15に戻して、処理を繰り返す。そして、ステップS15において、削除部25は、訓練データから、まだ選択されていない他の少なくとも1つの入力データを選択する。
分類器のテストで不合格(NG)であり且つテスト用分類器のテストで合格(OK)である入力データが存在する場合(ステップS19のYes)、判定部28は、ステップS21に処理を進める。
ステップS21において、出力部29は、ステップS16で訓練データから削除した入力データを、訓練データの誤りの候補として出力する。そして、出力部29は、ステップS21の処理を終えると、本フローを終了する。このような処理を実行することにより、検出装置10は、ユーザに対して訓練データの誤りの候補を提供することができる。
図4は、訓練データを機械学習して生成した分類器のテスト結果の一例を示す図である。検出装置10は、第1のテストにおいて、訓練データを機械学習して生成した分類器に対して、複数の入力データ(テキスト)を入力する。そして、検出装置10は、分類器から出力された出力データ(ラベル)と期待データとを比較し、ラベルと期待データとが一致すれば合格(OK)、一致しなければ不合格(NG)を出力する。
クローズドテストまたはクロスバリデーションテストでは、訓練データに含まれる入力データが入力され、期待データは、その入力データに関連付けられた出力データとなる。例えば、「ドアをあけないで」というテキストを入力した場合の期待データは、「ドアをしめる(s.door.close)」である。
ここで、図4の例においては、「ドアをあけないで」というテキストを入力した場合に、分類器は「ドアをあける(s.door.open)」というラベルを出力する。従って、図4の例においては、「ドアをあけないで」というテキストを入力した場合の分類器のテスト結果は、不合格(NG)である。
図5は、縮小訓練データを機械学習して生成したテスト用分類器のテスト結果の一例を示す図である。つぎに、検出装置10は、訓練データの一部の入力データを削除して、縮小訓練データを生成する。図5の例においては、訓練データから「ドアをあけない」および「ドアとじましょう」という入力データ(テキスト)を削除して、縮小訓練データが生成されている。
検出装置10は、第2のテストにおいて、縮小訓練データを機械学習して生成したテスト用分類器に対して、第1のテストと同一のテストを実行し、ラベルと期待データとが一致すれば合格(OK)、一致しなければ不合格(NG)を出力する。
ここで、図5の例においては、「ドアをあけないで」というテキストを入力した場合に、テスト用分類器は「ドアをしめる(s.door.close)」というラベルを出力する。「ドアをあけないで」というテキストを入力した場合の期待データは、「ドアをしめる(s.door.close)」である。従って、図5の例においては、「ドアをあけないで」というテキストを入力した場合のテスト用分類器のテスト結果は、合格(OK)である。
つまり、「ドアをあけないで」という入力データ(テキスト)は、第1のテスト(分類器のテスト)で不合格(NG)であったのに、第2のテスト(テスト用分類器のテスト)で合格(OK)となっている。このようなテスト結果の変化は、入力データの削除による影響であると推測される。すなわち、第1のテスト(分類器のテスト)において、「ドアをあけないで」というテキストを分類器に入力した場合に、テスト結果が不合格(NG)となる原因は、縮小訓練データを生成するために削除した入力データ(「ドアをあけない」および「ドアとじましょう」)に誤りが含まれるためであると推定される。
そこで、検出装置10は、縮小訓練データを生成するために訓練データから削除した入力データを、誤りの候補として出力する。そして、ユーザは、誤りの候補を参照し、実際に誤りが存在するか否かを目視等で確認し、誤りが存在していれば、訓練データにおける対応する入力データを修正する。これにより、ユーザは、全ての訓練データを確認するのではなく、絞り込まれた一部の誤りの候補を確認すればよいので、入力データの誤りを容易に修正することができる。
以上のように、本実施形態に係る検出装置10によれば、実際には誤っているにも関わらずテストでは合格(OK)となってしまうような、機械的には検出が困難な訓練データの誤りを、効率良く検出し、ユーザに容易に誤りを修正させることができる。
なお、削除部25は、訓練データから、取得元が共通する複数の入力データを削除して縮小訓練データを生成してもよい。例えば、削除部25は、表の同一の列に同一の取得元(同一のユーザ)から収集した入力データが配置されている場合には、訓練データを列単位で削除する。例えば、クラウドソーシングにより不特定多数の人から入力データを収集した場合、わざと誤りを含める人がいる可能性もある。従って、検出装置10は、ユーザ単位で削除することにより、このような要因による誤りを候補として出力することができる。
図6は、変形例に係る検出装置10の処理フローを示す図である。検出装置10は、図3のステップS19に続けて、図6に示すステップS31からの処理を追加して実行してもよい。
まず、分類器のテストで不合格(NG)であり且つテスト用分類器のテストで合格(OK)である入力データが存在する場合(ステップS19のYes)、判定部28は、ステップS31に処理を進める。
続いて、ステップS31において、削除部25は、ステップS15で選択した入力データ(実際に削除した入力データ)の中から、さらに一部の入力データを絞り込んで選択する。続いて、ステップS32において、削除部25は、訓練データから、絞り込んで選択した一部の入力データを削除し、新たな縮小訓練データを生成する。
続いて、ステップS33において、第2機械学習部26は、ステップS32で生成した新たな縮小訓練データを機械学習して、新たなテスト用分類器を生成する。続いて、ステップS34において、第2テスト部27は、新たな縮小訓練データを機械学習して生成した、新たなテスト用分類器をテストする(第3のテスト)。この場合において、第2テスト部27は、ステップS13の第1テスト部23によるテスト(第1のテスト)と同一のテストを実行する。
続いて、ステップS35において、判定部28は、分類器のテスト(第1テスト部23による第1のテスト)で不合格(NG)であり、且つ、新たなテスト用分類器のテスト(第2テスト部27による第3のテスト)で合格(OK)である入力データが存在するか否かを判断する。
分類器のテストで不合格(NG)であり且つ新たなテスト用分類器のテストで合格(OK)である入力データが存在しない場合(ステップS35のNo)、判定部28は、ステップS31に処理を戻して、処理を繰り返す。この場合、ステップS31において、削除部25は、ステップS15で選択した入力データ(実際に削除した入力データ)の中から、まだ選択されていない他の少なくとも1つの入力データを選択する。
分類器のテストで不合格(NG)であり且つ新たなテスト用分類器のテストで合格(OK)である入力データが存在する場合(ステップS35のYes)、判定部28は、ステップS36に処理を進める。
続いて、ステップS36において、出力部29は、削除した入力データから、さらに絞り込んで選択した入力データを誤りの候補として出力する。そして、出力部29は、ステップS36の処理を終えると、本フローを終了する。
このような処理を実行することにより、検出装置10は、ユーザに対して提供する誤りの候補の数を、より少なくすることができる。これにより、ユーザは、実際に誤りが存在するか否かを、容易に確認することができる。なお、検出装置10は、ステップS35のYesの後に、さらに、ステップS31からステップS36までと同様の処理を1回以上追加してもよい。これにより、検出装置10は、誤りの候補をより少なくすることができ、より容易に誤りの修正をさせることができる。
図7は、実施形態に係る修正システム50の構成を示す図である。修正システム50は、訓練データ記憶部60と、重複検出部61と、クローズドテスト部62と、クロスバリデーションテスト部63と、ポテンシャルテスト部64と、表示制御部65と、修正部66と、制御部67とを備える。
訓練データ記憶部60は、訓練データを記憶する。重複検出部61は、訓練データ記憶部60に記憶された訓練データに含まれる入力データの重複を検出する。
クローズドテスト部62は、訓練データ記憶部60に記憶された訓練データを機械学習して生成した分類器に対して、クローズドテストを実行する。クロスバリデーションテスト部63は、訓練データ記憶部60に記憶された訓練データを機械学習して生成した分類器に対して、クロスバリデーションテストを実行する。ポテンシャルテスト部64は、訓練データ記憶部60に記憶された訓練データを機械学習して生成した分類器に対して、図1から図6を参照して説明した検出装置10によりテストを実行する。
表示制御部65は、重複検出部61による入力データの重複の検出結果を表示装置に表示させる。また、表示制御部65は、クローズドテスト部62、クロスバリデーションテスト部63およびポテンシャルテスト部64によるテストの結果を表示装置に表示させる。
修正部66は、重複の検出結果の表示に応じたユーザの操作に従って、訓練データ記憶部60に記憶されている訓練データの重複を修正する。修正部66は、クローズドテスト部62、クロスバリデーションテスト部63およびポテンシャルテスト部64によるテストの結果の表示に応じたユーザ操作に従って、訓練データ記憶部60に記憶されている訓練データの誤りを修正する。
制御部67は、重複検出部61、クローズドテスト部62、クロスバリデーションテスト部63およびポテンシャルテスト部64によるテストの実行順序を制御する。
より具体的には、制御部67は、クローズドテスト部62、クロスバリデーションテスト部63およびポテンシャルテスト部64によるテストの実行に先だって、重複検出部61による重複の検出および訓練データの修正をさせる。
また、制御部67は、クローズドテスト部62によるクローズドテストおよび修正部66による訓練データの修正を、1回以上実行させる。また、制御部67は、クローズドテストの結果、分類器の精度が予め定められた第1の規定値以上である場合、クロスバリデーションテスト部63によるクロスバリデーションテストおよび修正部66による訓練データの修正を、1回以上実行させる。そして、制御部67は、クロスバリデーションテストの結果、分類器の精度が予め定められた第2の規定値(第2の規定値は第1の規定値より小さい)以上である場合、処理を終了させる。
一方、制御部67は、クローズドテストおよび訓練データの修正を予め定められた回数以上実行しても、分類器の精度が第1の規定値以上とならない場合、ポテンシャルテスト部64によるテストおよび修正部66による訓練データの修正を実行させる。そして、制御部67は、ポテンシャルテスト部64によるテストおよび訓練データの修正を実行した後、再度クローズドテストを実行して分類器の精度が第1の規定値以上となった場合には、クロスバリデーションテストおよび訓練データの修正を実行させる。
一方、制御部67は、クロスバリデーションテストおよび訓練データの修正を予め定められた回数以上実行しても、分類器の精度が第2の規定値以上とならない場合、ポテンシャルテスト部64によるテストおよび修正部66による訓練データの修正を実行させる。そして、制御部67は、ポテンシャルテスト部64によるテストおよび訓練データの修正を実行した後、再度クロスバリデーションテストを実行して分類器の精度が第2の規定値以上となった場合には、処理を終了させる。
図8は、クローズドテストの処理内容を説明するための図である。クローズドテストは、訓練データに含まれる入力データを、分類器に入力するテストである。クローズドテストは、処理量が少なく処理時間が比較的に短い。従って、修正システム50は、クローズドテストを、他のテストに先だって実行することにより、全体として効率良く訓練データの誤りを修正することができる。
図9は、クロスバリデーションテストの処理内容を説明するための図である。クロスバリデーションテストは、まず、訓練データを複数の分割訓練データに分割する。そして、それぞれの分割訓練データ毎に、他の全ての分割訓練データを機械学習してテスト用分類器を生成し、選択した分割訓練データに含まれる入力データをテスト用分類器に入力してテストする。
例えば、図9に示されるように、1つの訓練データを、第1の分割訓練データ、第2の分割訓練データおよび第3の分割訓練データの3つに分割したとする。この場合、最初に、第2、第3の分割訓練データを用いて第1のテスト用分類器を生成し、第1の分割訓練データを第1のテスト用分類器に入力してテストする。次に、第3、第1の分割訓練データを用いて第2のテスト用分類器を生成し、第2の分割訓練データを第2のテスト用分類器に入力してテストする。最後に、第1、第2の分割訓練データを用いて第3のテスト用分類器を生成し、第3の分割訓練データを第3のテスト用分類器に入力してテストする。
クロスバリデーションテストでは、未知の入力データに対する分類の精度を確認することができる。しかし、クロスバリデーションテストは、処理量が多く処理時間が比較的に長い。従って、修正システム50は、クロスバリデーションテストを、クローズドテストにより訓練データがある程度修正された後に実行することにより、全体として効率良く訓練データの誤りを修正することができる。
図10は、実施形態に係る修正システム50の処理フローを示す図である。修正システム50は、以下のステップS41から処理を実行する。
まず、ステップS41において、重複検出部61は、訓練データ記憶部60に記憶された訓練データに含まれる入力データの重複を検出する。続いて、ステップS42において、表示制御部65は、重複検出部61により検出された入力データの重複を表示装置に表示させる。続いて、ステップS43において、修正部66は、重複結果の表示に応じたユーザの操作に従って、訓練データ記憶部60に記憶されている訓練データの重複を修正する。これにより、修正部66は、入力データの重複を無くした訓練データを生成することができる。そして、制御部67は、ステップS43が終了すると、処理をステップS44に進める。
ステップS44において、クローズドテスト部62は、訓練データ記憶部60に記憶された訓練データを機械学習して生成した分類器に対して、クローズドテストを実行する。続いて、ステップS45において、クローズドテスト部62は、ステップS44のテスト結果に基づき分類器の精度を算出する。クローズドテスト部62は、一例として、テストのために入力した入力データ数に対して、合格(OK)であった入力データの数の割合を精度として算出する。
続いて、ステップS46において、制御部67は、ステップS45で算出した精度が、予め定められた第1の規定値以上であるか否かを判定する。例えば、制御部67は、ステップS45で算出した精度が、95%以上であるか否かを判定する。
ステップS45で算出した精度が第1の規定値以上ではない場合(ステップS46のNo)、制御部67は、ステップS47に処理を進める。ステップS47において、制御部67は、ステップS44のクローズドテストを所定回以上実行したか否かを判定する。制御部67は、一例として、クローズドテストを2回以上実行したか否かを判定する。
制御部67は、クローズドテストを所定回以上実行した場合(ステップS47のYes)、処理をステップS50に進める。制御部67は、クローズドテストを所定回以上実行していない場合(ステップS47のNo)、処理をステップS48に進める。
ステップS48において、表示制御部65は、クローズドテストにより検出されたテスト結果を表示装置に表示させる。続いて、ステップS49において、修正部66は、クローズドテストのテスト結果の表示に対するユーザの操作に従って、訓練データ記憶部60に記憶されている訓練データの誤りを修正する。これにより、修正部66は、訓練データにおけるクローズドテストにより検出された誤りを修正することができる。そして、制御部67は、ステップS49が終了すると、処理をステップS44に戻す。
また、ステップS50において、ポテンシャルテスト部64は、訓練データ記憶部60に記憶された訓練データを機械学習して生成した分類器に対して、図1から図6を参照して説明した検出装置10によりテストを実行する。続いて、ステップS51において、表示制御部65は、検出装置10によるテスト結果を表示装置に表示させる。続いて、ステップS52において、修正部66は、検出装置10によるテスト結果の表示に対するユーザの操作に従って、訓練データ記憶部60に記憶されている訓練データの誤りを修正する。これにより、修正部66は、テストでは不合格(NG)とならない入力データの誤りを修正することができる。そして、制御部67は、ステップS52が終了すると、処理をステップS44に戻す。
制御部67は、ステップS44からステップS52までを繰り返し実行した結果、クローズドテストに基づく分類器の精度(ステップS45で算出した精度)が第1の規定値以上となった場合(ステップS46のYes)、処理をステップS53に進める。なお、制御部67は、ステップS44からステップS52までを一定回数繰り返しても精度が第1の規定値以上とならなかった場合には、本フローを途中で中止してもよい。
ステップS53において、クロスバリデーションテスト部63は、訓練データ記憶部60に記憶された訓練データを機械学習して生成した分類器に対して、クロスバリデーションテストを実行する。続いて、ステップS54において、クロスバリデーションテスト部63は、ステップS53のテスト結果に基づき分類器の精度を算出する。
続いて、ステップS55において、制御部67は、ステップS54で算出した精度が、予め定められた第2の規定値以上であるか否かを判定する。例えば、制御部67は、ステップS54で算出した精度が、85%以上であるか否かを判定する。
ステップS54で算出した精度が第2の規定値以上ではない場合(ステップS55のNo)、制御部67は、ステップS56に処理を進める。ステップS56において、制御部67は、ステップS53のクロスバリデーションテストを所定回以上実行したか否かを判定する。制御部67は、一例として、クロスバリデーションテストを2回以上実行したか否かを判定する。
制御部67は、クロスバリデーションテストを所定回以上実行した場合(ステップS56のYes)、処理をステップS59に進める。制御部67は、クロスバリデーションテストを所定回以上実行していない場合(ステップS56のNo)、処理をステップS57に進める。
ステップS57において、表示制御部65は、クロスバリデーションテストにより検出されたテスト結果を表示装置に表示させる。続いて、ステップS58において、修正部66は、クロスバリデーションテストのテスト結果の表示に対するユーザの操作に従って、訓練データ記憶部60に記憶されている訓練データの誤りを修正する。これにより、修正部66は、訓練データにおけるクロスバリデーションテストにより検出された誤りを修正することができる。そして、制御部67は、ステップS58が終了すると、処理をステップS53に戻す。
また、ステップS59において、ポテンシャルテスト部64は、訓練データ記憶部60に記憶された訓練データを機械学習して生成した分類器に対して、図1から図6を参照して説明した検出装置10によりテストを実行する。続いて、ステップS60において、表示制御部65は、検出装置10によるテスト結果を表示装置に表示させる。続いて、ステップS61において、修正部66は、検出装置10によるテスト結果の表示に対するユーザの操作に従って、訓練データ記憶部60に記憶されている訓練データの誤りを修正する。これにより、修正部66は、テストでは不合格(NG)とならない入力データの誤りを修正することができる。そして、制御部67は、ステップS61が終了すると、処理をステップS53に戻す。
制御部67は、ステップS53からステップS61までを繰り返し実行した結果、クロスバリデーションテストに基づく分類器の精度(ステップS54で算出した精度)が第2の規定値以上となった場合(ステップS55のYes)、本フローを終了する。なお、制御部67は、ステップS53からステップS61までを一定回数繰り返しても精度が第2の規定値以上とならなかった場合には、本フローを途中で中止してもよい。
以上のように、本実施形態に係る修正システム50によれば、クローズドテスト、クロスバリデーションテストおよびポテンシャルテスト部64によるテストの3つの異なるテストを用いて、訓練データの誤りを検出して修正することができる。また、修正システム50は、クローズドテスト、クロスバリデーションテストおよびポテンシャルテスト部64によるテストを、効率の良い順番で実行するので、少ないコストで訓練データの精度を向上させることができる。
図11は、ポテンシャルテスト部64によるテストの結果の表示例を示す図である。表示制御部65は、ポテンシャルテスト部64によるテストの結果を受け取る。具体的には、表示制御部65は、ポテンシャルテスト部64によるテストで誤りの候補として検出された少なくとも1つの入力データと、訓練データ上で関連付けられている出力データとを受け取る。
本実施形態においては、表示制御部65は、出力データとして、ラベル、IDおよび問題文を受け取る。そして、表示制御部65は、受け取った少なくとも1つの入力データと、関連付けられた出力データ(ラベル、IDおよび問題文)を表形式で表示させる。これにより、表示制御部65は、ユーザに対して、誤りの候補となっている入力データと、関連付けられた問題文との関係が誤っていないかどうかを容易に判断させることができる。
図12は、クローズドテストおよびクロスバリデーションテストのテスト結果の表示例を示す図である。表示制御部65は、クローズドテスト部62およびクロスバリデーションテスト部63から、テストの結果が不合格(NG)であった入力データを受け取る。さらに、表示制御部65は、不合格(NG)であったそれぞれの入力データに関連付けられている訓練データに含まれる出力データ(ラベル、ID、問題文)、並びに、テストにより分類器から出力された出力データ(ラベル、ID、問題文)を受け取る。
そして、表示制御部65は、不合格であった入力データと、訓練データに含まれる出力データと、テストにより分類器から出力された出力データとを、表の1つの行に表示させる。これにより、表示制御部65は、ユーザに対して、訓練データに含まれる出力データが誤っているのか、テストにより分類器から出力された出力データが誤っているのか、または、両者が誤っているのか容易に判断させることができる。また、表示制御部65は、ユーザに対して、入力データが誤っているのかも容易に判断させることができる。
例えば、図12において、表示制御部65は、「カギをする」という入力データについて、訓練データに含まれる出力データ(「ドアをしめる」)が誤っており、テストにより分類器から出力された出力データ(「カギをしめる」)が正しいと判断させることができる。
また、図12において、表示制御部65は、「ミラーヒータwo停止する」という入力データが「ミラーヒータを停止する」の誤りであると判断させることができる。
また、図12において、表示制御部65は、「ミラーヒータwo停止する」という入力データについて、訓練データに含まれる出力データ(「ミラーヒータを停止する」)が正しく、テストにより分類器から出力された出力データ(「ミラーヒータを作動させる」)が誤っていると判断させることができる。
また、図12において、表示制御部65は、「窓をあけて」という入力データについて、訓練データに含まれる出力データ(「パワーウィンドウを操作する」)、および、テストにより分類器から出力された出力データ(「パワーウィンドウを開ける」)の両者が誤っていると判断させることができる。
図13は、訓練データを修正するための操作例を示す図である。修正部66は、表示制御部65により表示装置に表示された表に対する、ユーザの操作を受け付ける。
例えば、ある入力データについて、分類器から出力された出力データが正しく、訓練データに含まれる出力データが誤っている場合、ユーザは、表上において、訓練データに含まれる出力データの少なくとも一部(例えば、ID)を削除し、分類器から出力された出力データをそのまま残す操作をする。そして、修正部66は、このような操作、すなわち、分類器から出力された出力データが正しいとする操作がされた場合には、不合格であった入力データを、訓練データにおける分類器から出力された出力データに関連付ける処理を実行する。
また、例えば、ある入力データについて、訓練データに含まれる出力データが正しく、分類器から出力された出力データが誤っている場合、ユーザは、表上において、分類器から出力された出力データの少なくとも一部(例えば、ID)を削除し、訓練データに含まれる出力データをそのまま残す操作をする。そして、修正部66は、このような操作、すなわち、訓練データに含まれる出力データが正しいとする操作がされた場合には、不合格であった入力データを修正しない処理を実行する。
また、例えば、ある入力データについて、分類器から出力された出力データおよび訓練データに含まれる出力データの何れもが誤っている場合、ユーザは、表上において、分類器から出力された出力データの少なくとも一部(例えば、ID)、および、訓練データに含まれる出力データの少なくとも一部(例えば、ID)の両者を削除する操作をする。そして、修正部66は、このような操作、すなわち、分類器から出力された出力データおよび訓練データに含まれる出力データの何れも誤っているとする操作がされた場合には、訓練データにおける不合格であった入力データを削除する処理を実行する。
また、例えば、ある入力データが誤っている場合、ユーザは、表上において、その入力データの内容を修正する操作をする。そして、修正部66は、このような操作、すなわち、入力データを修正する操作がされた場合、訓練データにおけるその入力データの内容を修正する処理を実行する。
図14は、訓練データの修正例を示す図である。修正部66は、図13に示したような修正をすることにより、誤っていた入力データを正しい出力データに関連付けることができる。例えば、図14に示すように、「カギをする」という入力データを、「ドアをしめる」という出力データから「カギをしめる」という出力データへと関連付けを移動させることができる。このように、本実施形態に係る修正システム50によれば、訓練データの誤りを容易に且つ効率良く修正することができる。
図15は、実施形態に係る検出装置10および修正システム50のハードウェア構成を示す図である。検出装置10および修正システム50は、CPU(Central Processing Unit)101と、操作部102と、表示部103と、ROM(Read Only Memory)104と、RAM(Random Access Memory)105と、記憶部106と、通信装置107とを備える。各部は、バス108により接続される。
CPU101は、RAM105の所定領域を作業領域としてROM104または記憶部106に予め記憶された各種プログラムとの協働により各種処理を実行し、検出装置10および修正システム50を構成する各部の動作を統括的に制御する。また、CPU101は、ROM104または記憶部106に予め記憶されたプログラムとの協働により、操作部102、表示部103および通信装置107等を制御する。
操作部102は、マウスおよびキーボード等の入力デバイスであって、ユーザから操作入力された情報を指示信号として受け付け、その指示信号をCPU101に出力する。
表示部103は、LCD(Liquid Crystal Display)等の表示装置である。表示部103は、CPU101からの表示信号に基づいて、各種情報を表示する。例えば、表示部103は、検出装置10が出力する誤りの候補および修正システム50が出力するテスト結果等を表示する。
ROM104は、検出装置10および修正システム50の制御に用いられるプログラムおよび各種設定情報等を書き換え不可能に記憶する。RAM105は、SDRAM(Synchronous Dynamic Random Access Memory)等の揮発性の記憶媒体である。RAM105は、CPU101の作業領域として機能する。具体的には、検出装置10および修正システム50が用いる各種変数およびパラメータ等を一時記憶するバッファ等として機能する。
記憶部106は、フラッシュメモリ等の半導体による記憶媒体、磁気的または光学的に記録可能な記憶媒体等の書き換え可能な記録装置である。記憶部106は、検出装置10および修正システム50の制御に用いられるプログラムおよび各種設定情報等を記憶する。また、記憶部106は、訓練データおよび生成した分類器等に係る各種の情報等を記憶する。なお、検出装置10が備える保存部24および訓練データ記憶部60は、RAM105および記憶部106の何れにより実現されてもよい。
通信装置107は、外部の機器と通信して、データの入力および出力等に用いられる。
本実施形態の検出装置10および修正システム50で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、本実施形態の検出装置10および修正システム50で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、本実施形態の検出装置10および修正システム50で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。また、本実施形態の検出装置10および修正システム50で実行されるプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
本実施形態の検出装置10で実行されるプログラムは、上述した検出装置10の各部(入力部21、第1機械学習部22、第1テスト部23、保存部24、削除部25、第2機械学習部26、第2テスト部27、判定部28および出力部29)を含むモジュール構成となっており、CPU101(プロセッサ)が記憶媒体等からプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、検出装置10(入力部21、第1機械学習部22、第1テスト部23、保存部24、削除部25、第2機械学習部26、第2テスト部27、判定部28および出力部29)が主記憶装置上に生成されるようになっている。なお、検出装置10の一部または全部は、ハードウェアにより構成されていてもよい。
本実施形態の修正システム50で実行されるプログラムは、上述した修正システム50の各部(訓練データ記憶部60、重複検出部61、クローズドテスト部62、クロスバリデーションテスト部63、ポテンシャルテスト部64、表示制御部65、修正部66および制御部67)を含むモジュール構成となっており、CPU101(プロセッサ)が記憶媒体等からプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、修正システム50(訓練データ記憶部60、重複検出部61、クローズドテスト部62、クロスバリデーションテスト部63、ポテンシャルテスト部64、表示制御部65、修正部66および制御部67)が主記憶装置上に生成されるようになっている。なお、修正システム50の一部または全部は、ハードウェアにより構成されていてもよい。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、請求の範囲に記載された発明とその均等の範囲に含まれる。
10 検出装置
21 入力部
22 第1機械学習部
23 第1テスト部
24 保存部
25 削除部
26 第2機械学習部
27 第2テスト部
28 判定部
29 出力部
50 修正システム
60 訓練データ記憶部
61 重複検出部
62 クローズドテスト部
63 クロスバリデーションテスト部
64 ポテンシャルテスト部
65 表示制御部
66 修正部
67 制御部
101 CPU
102 操作部
103 表示部
104 ROM
105 RAM
106 記憶部
107 通信装置1
108 バス

Claims (16)

  1. 分類器を生成するための訓練データの誤りを検出する検出装置であって、
    前記訓練データを機械学習して生成した分類器をテストする第1テスト部と、
    前記訓練データから少なくとも1つの入力データを削除した縮小訓練データを生成する削除部と、
    前記縮小訓練データを機械学習して生成したテスト用分類器をテストする第2テスト部と、
    前記分類器のテストで不合格であり且つ前記テスト用分類器のテストで合格である入力データが存在する場合、前記縮小訓練データを生成するために前記訓練データから削除した前記少なくとも1つの入力データを誤りの候補として出力する出力部と、
    を備える検出装置。
  2. 前記第2テスト部は、前記第1テスト部によるテストと同一のテストを実行する
    請求項1に記載の検出装置。
  3. 前記第1テスト部および前記第2テスト部は、クローズドテストを実行する
    請求項2に記載の検出装置。
  4. 前記第1テスト部および前記第2テスト部は、クロスバリデーションテストを実行する
    請求項2に記載の検出装置。
  5. 前記削除部は、前記訓練データから、取得元が共通する複数の入力データを削除して前記縮小訓練データを生成する
    請求項1から4の何れか1項に記載の検出装置。
  6. 前記削除部は、前記分類器のテストで不合格であり且つ前記テスト用分類器のテストで合格である入力データが存在する場合、削除した複数の入力データの中からさらに一部の入力データを絞り込んで選択し、前記訓練データから、絞り込んで選択した一部の入力データを削除した新たな縮小訓練データを生成し、
    前記第2テスト部は、前記新たな縮小訓練データを機械学習して生成した新たなテスト用分類器をテストし、
    前記出力部は、前記分類器のテストで不合格となった入力データが、前記新たなテスト用分類器のテストで合格となった場合、絞り込んで選択した入力データを誤りの候補として出力する
    請求項1から5の何れか1項に記載の検出装置。
  7. 前記訓練データに含まれる入力データは、人が発話または入力したテキストである
    請求項1から6の何れか1項に記載の検出装置。
  8. 分類器を生成するための訓練データの誤りを修正する修正システムであって、
    前記分類器に対してクローズドテストを実行するクローズドテスト部と、
    前記分類器に対してクロスバリデーションテストを実行するクロスバリデーションテスト部と、
    前記分類器に対して請求項1から7の何れか1項に記載の検出装置によりテストを実行するポテンシャルテスト部と、
    前記クローズドテスト部、前記クロスバリデーションテスト部および前記ポテンシャルテスト部によるテスト結果の表示に対するユーザ操作に応じて、前記訓練データの誤りを修正する修正部と、
    テストの実行順序を制御する制御部と、
    を備え、
    前記制御部は、
    前記クローズドテスト部または前記クロスバリデーションテスト部によるテストを実行した後に、前記分類器の精度が予め定められた規定値より小さい場合に、前記修正部に前記訓練データの誤りを修正させ、
    前記クローズドテスト部または前記クロスバリデーションテスト部によるテストを予め定められた回数実行した後に、前記分類器の精度が前記規定値より小さい場合に、前記ポテンシャルテスト部によるテストを実行させる
    修正システム。
  9. 前記制御部は、
    前記クローズドテスト部によるテストを実行した後に、前記訓練データの精度が前記規定値以上である場合に、前記クロスバリデーションテスト部によるテストを実行させ、
    前記クロスバリデーションテスト部によるテストを実行した後に、前記訓練データの精度が前記規定値以上である場合に、修正を終了させる
    請求項8に記載の修正システム。
  10. 前記分類器をテストした結果が不合格であった場合、不合格であった入力データと、不合格であった入力データに関連付けられた前記訓練データに含まれる出力データと、テストにより前記分類器から出力された出力データとを関連付けて表示させる表示制御部をさらに備える
    請求項8または9に記載の修正システム。
  11. 前記表示制御部は、不合格であった入力データと、不合格であった入力データに関連付けられた前記訓練データに含まれる出力データと、テストにより前記分類器から出力された出力データとを、表の1つの行に表示させる
    請求項10に記載の修正システム。
  12. 前記修正部は、前記分類器から出力された出力データが正しいとする操作がされた場合には、不合格であった入力データを、前記訓練データにおける前記分類器から出力された出力データに関連付ける
    請求項10または11に記載の修正システム。
  13. 前記修正部は、前記訓練データに含まれる出力データが正しいとする操作がされた場合には、前記訓練データにおける、不合格であった入力データを修正しない
    請求項10から12の何れか1項に記載の修正システム。
  14. 前記修正部は、前記分類器から出力された出力データおよび前記訓練データに含まれる出力データの何れも誤っているとする操作がされた場合には、前記訓練データにおける不合格であった前記訓練データを削除する
    請求項10から13の何れか1項に記載の修正システム。
  15. 分類器を生成するための訓練データの誤りを検出する検出方法であって、
    前記訓練データを機械学習して生成した前記分類器をテストする第1テストステップと、
    前記訓練データから少なくとも1つの入力データを削除した縮小訓練データを生成する削除ステップと、
    前記縮小訓練データを機械学習して生成したテスト用分類器をテストする第2テストステップと、
    前記分類器のテストで不合格であり且つ前記テスト用分類器のテストで合格である入力データが存在する場合、前記縮小訓練データを生成するために前記訓練データから削除した前記少なくとも1つの入力データを誤りの候補として出力する出力ステップと、
    を備える検出方法。
  16. コンピュータを、分類器を生成するための訓練データの誤りを検出する検出装置として機能させるためのプログラムであって、
    前記コンピュータを、
    前記訓練データを機械学習して生成した前記分類器をテストする第1テスト部と、
    前記訓練データから少なくとも1つの入力データを削除した縮小訓練データを生成する削除部と、
    前記縮小訓練データを機械学習して生成したテスト用分類器をテストする第2テスト部と、
    前記分類器のテストで不合格であり且つ前記テスト用分類器のテストで合格である入力データが存在する場合、前記縮小訓練データを生成するために前記訓練データから削除した前記少なくとも1つの入力データを誤りの候補として出力する出力部と、
    して機能させるプログラム。
JP2014119959A 2014-06-10 2014-06-10 検出装置、修正システム、検出方法およびプログラム Expired - Fee Related JP6173972B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2014119959A JP6173972B2 (ja) 2014-06-10 2014-06-10 検出装置、修正システム、検出方法およびプログラム
PCT/JP2015/063527 WO2015190203A1 (ja) 2014-06-10 2015-05-11 検出装置、修正システム、検出方法およびプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014119959A JP6173972B2 (ja) 2014-06-10 2014-06-10 検出装置、修正システム、検出方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2015232847A true JP2015232847A (ja) 2015-12-24
JP6173972B2 JP6173972B2 (ja) 2017-08-02

Family

ID=54833308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014119959A Expired - Fee Related JP6173972B2 (ja) 2014-06-10 2014-06-10 検出装置、修正システム、検出方法およびプログラム

Country Status (2)

Country Link
JP (1) JP6173972B2 (ja)
WO (1) WO2015190203A1 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019216263A1 (ja) * 2018-05-10 2019-11-14 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2020021301A (ja) * 2018-08-01 2020-02-06 株式会社デンソー 訓練データ評価装置、訓練データ評価方法、およびプログラム
JP2020030138A (ja) * 2018-08-23 2020-02-27 アンリツ株式会社 信号解析装置及び信号解析方法並びに信号解析プログラム
JP2021022377A (ja) * 2019-07-26 2021-02-18 スアラブ カンパニー リミテッド データ管理方法
JP2022031555A (ja) * 2018-08-15 2022-02-18 日本電信電話株式会社 分類器評価装置、分類器評価方法、及びプログラム

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10387572B2 (en) * 2017-09-15 2019-08-20 International Business Machines Corporation Training data update
US11157479B2 (en) 2019-04-08 2021-10-26 Microsoft Technology Licensing, Llc Leveraging a collection of training tables to accurately predict errors within a variety of tables
JP7310673B2 (ja) * 2020-03-23 2023-07-19 横河電機株式会社 データ管理システム、データ管理方法、および、データ管理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059080A (ja) * 2006-08-29 2008-03-13 Matsushita Electric Works Ltd 信号識別装置の学習データの選択方法
JP2013080395A (ja) * 2011-10-04 2013-05-02 Nippon Telegr & Teleph Corp <Ntt> 誤分類検出装置、方法、及びプログラム
JP2014092878A (ja) * 2012-11-01 2014-05-19 Nippon Telegr & Teleph Corp <Ntt> 分類モデル更新支援装置及び方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008059080A (ja) * 2006-08-29 2008-03-13 Matsushita Electric Works Ltd 信号識別装置の学習データの選択方法
JP2013080395A (ja) * 2011-10-04 2013-05-02 Nippon Telegr & Teleph Corp <Ntt> 誤分類検出装置、方法、及びプログラム
JP2014092878A (ja) * 2012-11-01 2014-05-19 Nippon Telegr & Teleph Corp <Ntt> 分類モデル更新支援装置及び方法及びプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
高取大地,他4名: "Outlier除去によるサポートベクターマシン改良の提案と映像境界検出問題への応用", 電子情報通信学会 第19回データ工学ワークショップ論文集, JPN6015030211, 7 April 2008 (2008-04-07), JP, pages 1 - 7, ISSN: 0003570329 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019216263A1 (ja) * 2018-05-10 2019-11-14 ソニー株式会社 情報処理装置、情報処理方法およびプログラム
JP2020021301A (ja) * 2018-08-01 2020-02-06 株式会社デンソー 訓練データ評価装置、訓練データ評価方法、およびプログラム
JP7095467B2 (ja) 2018-08-01 2022-07-05 株式会社デンソー 訓練データ評価装置、訓練データ評価方法、およびプログラム
JP2022031555A (ja) * 2018-08-15 2022-02-18 日本電信電話株式会社 分類器評価装置、分類器評価方法、及びプログラム
JP7181490B2 (ja) 2018-08-15 2022-12-01 日本電信電話株式会社 分類器評価装置、分類器評価方法、及びプログラム
JP2020030138A (ja) * 2018-08-23 2020-02-27 アンリツ株式会社 信号解析装置及び信号解析方法並びに信号解析プログラム
JP7046760B2 (ja) 2018-08-23 2022-04-04 アンリツ株式会社 信号解析装置及び信号解析方法並びに信号解析プログラム
JP2021022377A (ja) * 2019-07-26 2021-02-18 スアラブ カンパニー リミテッド データ管理方法
JP7186200B2 (ja) 2019-07-26 2022-12-08 スアラブ カンパニー リミテッド データ管理方法

Also Published As

Publication number Publication date
JP6173972B2 (ja) 2017-08-02
WO2015190203A1 (ja) 2015-12-17

Similar Documents

Publication Publication Date Title
JP6173972B2 (ja) 検出装置、修正システム、検出方法およびプログラム
JP5607741B2 (ja) ランタイム挙動に基づくアプリケーションの自動修正
US9886372B2 (en) Automatic correction of application based on runtime behavior
JP5874891B2 (ja) プログラムテスト装置、プログラムテスト方法、およびプログラム
US20160117405A1 (en) Information Processing Method and Apparatus
US11580012B2 (en) Smart test case generator
US10261884B2 (en) Method for correcting violation of source code and computer readable recording medium having program performing the same
JP2008191963A (ja) ソースコード検証システム、ソースコード検証方法、およびソースコード検証用プログラム
JP2019029015A (ja) インタラクティブなソフトウェアプログラムの修復
AU2017202743A1 (en) Method for automatically validating data against a predefined data specification
JP2018092361A (ja) テストスクリプト修正装置及びテストスクリプト修正プログラム
JP6451417B2 (ja) デバッグ支援装置、デバッグ支援システム、デバッグ支援方法、および、デバッグ支援プログラム
KR101563494B1 (ko) 파일 변경에 따른 실시간 소스코드 보안 약점 탐지 장치 및 방법
JP2018092362A (ja) テストスクリプト修正装置及びテストスクリプト修正プログラム
KR102176133B1 (ko) 소프트웨어 테스트 케이스 자동 생성 방법 및 장치
EP4131010A1 (en) Method and system for performing human machine interface (hmi) automation testing
Barlas Credibility, validity and testing of Dynamic Simulation Models
KR102144044B1 (ko) 기계학습 기반 소프트웨어 정적 시험 거짓경보 분류 장치 및 방법
Muñoz Measuring the fidelity of digital twin systems
KR101534493B1 (ko) 구조 변환에 기초한 소스코드 보안 약점 탐지 장치 및 방법
US10915682B1 (en) Remodeling testing method for remodeling text-based display design to thereby achieve graphic-based display design and design remodeling testing device using the same
JP5900212B2 (ja) テストデータ生成装置、該プログラム、及び該方法
US20210200833A1 (en) Health diagnostics and analytics for object repositories
CN107704484B (zh) 网页错误信息处理方法、装置、计算机设备和存储介质
JP5910410B2 (ja) 図式プログラムのテストデータ生成装置およびその方法、並びにプログラム

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20151102

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160929

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170705

R150 Certificate of patent or registration of utility model

Ref document number: 6173972

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees