JP6492880B2 - 機械学習装置、機械学習方法、および機械学習プログラム - Google Patents

機械学習装置、機械学習方法、および機械学習プログラム Download PDF

Info

Publication number
JP6492880B2
JP6492880B2 JP2015070586A JP2015070586A JP6492880B2 JP 6492880 B2 JP6492880 B2 JP 6492880B2 JP 2015070586 A JP2015070586 A JP 2015070586A JP 2015070586 A JP2015070586 A JP 2015070586A JP 6492880 B2 JP6492880 B2 JP 6492880B2
Authority
JP
Japan
Prior art keywords
information
rule
unit
machine learning
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015070586A
Other languages
English (en)
Other versions
JP2016192007A (ja
Inventor
匡人 結城
匡人 結城
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2015070586A priority Critical patent/JP6492880B2/ja
Publication of JP2016192007A publication Critical patent/JP2016192007A/ja
Application granted granted Critical
Publication of JP6492880B2 publication Critical patent/JP6492880B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、画像から所望の対象物を判別する機械学習装置、機械学習方法、および機械学習プログラムに関する。
画像データから所望の対象物を検知する際に、ユーザが設定したルールに従って対象物を検知すると共に、対象物の検知結果を機械学習させることにより、検知精度を向上させる技術が知られている。
このような技術として、例えば、特許文献1には、ユーザ環境下の画像データに基づいて機械学習用の事例データを収集し、識別関数を生成して画像データを分類することにより、個々のユーザ環境に合った適切な分類を提供することができると共に、その分類方法を学習する技術が開示されている。
また、特許文献2には、評価データに適切な学習データを用いて精度の高い機械学習を行い、評価対象となるデータが与えられる度に、学習データと評価データから学習データを選択するための第2の素性を抽出し、第2の素性を基に機械学習に用いるのに適した学習データを選択する技術が開示されている。
また、特許文献3には、事例データベースは、各事例に関する情報を蓄積し、学習器は、正解事例の集合から、カテゴリを判定するための推論規則を生成して、未知事例のカテゴリを推論し、問い合わせ生成部は、未知事例の推論結果が正しいか否かの判定を仰ぐための問い合わせを生成し、ユーザインターフェースは、その問い合わせを画面に表示し、ユーザが判定結果を入力すると、中央コントローラは、判定された未知事例を、新たな正解事例として事例データベースに記録する技術が開示されている。
特開2010−92413号公報 特開2005−182696号公報 特開2002−222083号公報
しかしながら、特許文献1から3に開示された技術では、ユーザが設定したルールが対象物の検知に適さない場合、機械学習を行って好適な画像データを選択しても検知精度が向上しない場合がある。
本発明の目的は、上述した課題を解決する機械学習装置、機械学習方法、および機械学習プログラムを提供することである。
本発明は上記の課題を解決するためになされたものであり、画像データの所定領域から抽出される特徴を示す特徴情報に、予め定められたルールを適用して、前記所定領域内に対象物が存在しているか否かを判定する判定部と、ユーザに前記画像データが示す画像を視認させることにより入力させたユーザ情報を取得する取得部と、前記特徴情報と、前記取得部により取得されたユーザ情報とを組み合わせた情報を生成する情報生成部と、前記情報生成部により生成された情報に基づいて、機械学習方式により学習モデルを生成するモデル生成部と、前記モデル生成部により生成された学習モデルに従って、前記ルールを更新する更新部と、を備えることを特徴とする機械学習装置である。
また、本発明は、画像データの所定領域から抽出される特徴を示す特徴情報に、予め定められたルールを適用して、前記所定領域内に対象物が存在しているか否かを判定し、ユーザに前記画像データが示す画像を視認させることにより選択させたユーザ情報を取得し、前記特徴情報と、前記取得されたユーザ情報とを組み合わせた情報を生成し、前記生成された情報に基づいて、機械学習方式により学習モデルを生成し、前記生成された学習モデルに従って、前記ルールを更新する、機械学習方法である。
また、本発明は、コンピュータに、画像データの所定領域から抽出される特徴を示す特徴情報に、予め定められたルールを適用して、前記所定領域内に対象物が存在しているか否かを判定させ、ユーザに前記画像データが示す画像を視認させることにより選択させたユーザ情報を取得させ、前記特徴情報と、前記取得されたユーザ情報とを組み合わせた情報を生成させ、前記生成された情報に基づいて、機械学習方式により学習モデルを生成させ、前記生成された学習モデルに従って、前記ルールを更新させるための機械学習プログラムある。
本発明によれば、検知精度を向上させることができる。
本発明における機械学習装置1の基本構成の一例を示す図である。 一実施形態における機械学習装置1の構成の一例を示す図である。 上空から地上の飛行場を撮影した画像データの一例を示す図である。 ルール情報の一例を示す図である。 ルール検知実行部220による検知結果の一例を示す図である。 図5に示すルール検知実行部220の検知結果に対するユーザの検知判断結果の一例を示す図である。 教師データの一例を示す図である。 モデル分類実施部320による分類結果の一例を示す図である。 モデル分類実施部320におけるデータ列の分類処理の概念を説明するための図である。 モデル分類実施部320におけるデータ列の分類処理の概念を説明するための図である。 一実施形態における機械学習装置1の処理の一例を示すフローチャートである。
以下、本発明の実施形態の機械学習装置、機械学習方法、および機械学習プログラムを、図面を参照して説明する。
(基本構成)
図1は、本発明における機械学習装置1の基本構成の一例を示す図である。
本発明における機械学習装置1は、判定部10と、取得部20と、情報生成部30と、モデル生成部40と、更新部50とを基本構成とする。
判定部10は、画像データの検知領域から抽出される特徴を示す特徴情報に、ユーザによって設定されるルールを適用して、検知領域内に対象物OBが存在しているか否かを判定する。判定部10は、後述する実施形態における「ルール検知実行部220」に相当する。
取得部20は、上述したユーザの検知判断結果を取得する。取得部20は、後述する実施形態における「教師データ生成部311」に相当する。
情報生成部30は、取得部20により取得されたユーザの検知判断結果と画像データ上の検知領域Aから抽出される特徴を示す特徴情報とを組み合わせた教師データを生成する。情報生成部30は、後述する実施形態における「教師データ生成部311」に相当する。
モデル生成部40は、情報生成部30により生成された教師データに基づいて、機械学習方式により学習モデルを生成する。モデル生成部40は、後述する実施形態における「学習モデル生成部313」に相当する。
更新部50は、モデル生成部40により生成された学習モデルに従って、ユーザによって設定されるルールを更新する。更新部50は、は、後述する実施形態における「ルール検証実行部233」に相当する。
これによって、機械学習装置1は、画像データ全体に点在する対象物OBの検知に対するルールを、機械学習の結果に基づいて、より適切なルールに更新することができる。この結果、機械学習装置1は、検知精度を向上させることができる。
図2は、一実施形態における機械学習装置1の構成の一例を示す図である。
本実施形態における機械学習装置1は、画像データから所望の対象物OBを検知する装置である。機械学習装置1は、例えば、人工衛星や航空機を使用して上空から地上の飛行場を撮影した画像データから所望の対象物OBとして航空機を検知する。図3は、上空から地上の飛行場を撮影した画像データの一例を示す図である。図3の例の場合、画像データ上には、検知の対象物OBである航空機が複数機存在している。以下、図3に示す画像データを一例として参照し、機械学習装置1の動作を説明する。
機械学習装置1は、画像表示部100と、ルール制御部200と、機械学習部300と、データ管理部400とを備える。画像表示部100と、ルール制御部200と、機械学習部300と、データ管理部400とのうち一部または全部は、CPU(Central Processing Unit)等のプロセッサが図示しない記憶装置に記憶されたプログラムを実行することにより機能するソフトウェア機能部である。また、上述した機能部のうち一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)等のハードウェア機能部であってもよい。
画像表示部100は、入力された情報に基づく画像を表示する。画像表示部100は、液晶ディスプレイ、有機EL(Electroluminescence)ディスプレイ等である。
画像表示部100は、画像表示制御部110を有する。画像表示制御部110は、画像を表示させるように画像表示部100を制御する。画像表示制御部110は、例えば、後述するルール検知実行部220による実行結果や教師データを生成するための情報を画像表示部100に表示させる。
ルール制御部200は、ユーザにより設定されたルールに従って画像データから航空機を検知するための機能部である。ルール制御部200は、ルール情報管理部210と、ルール検知実行部220と、ルール検証部230とを有する。
ルール情報管理部210は、ユーザから入力されたルールを示す情報(以下、「ルール情報」と称する)をデータ管理部400に出力し、ルール情報をデータ管理部400に管理させる。ルール情報とは、航空機を検知する際に参照される制約条件であり、例えばプログラムの形式で表される。ルール制御部200は、例えば、ユーザから図示しないユーザインターフェースを介して入力されるルール情報を受け付けてもよいし、ハードウェアインターフェースを介して接続される記憶装置からルール情報を取得してもよい。
図4は、ルール情報の一例を示す図である。図4の例の場合、ルール情報には、後述するルール検知実行部220により抽出が予定されている特徴ごとにルールが設定される。特徴とは、長さ、幅、面積等の形状に関する特徴である。例えば、ルール番号r001には、長さの特徴が割り振られ、当該長さが300以上且つ400以下の場合に、検知領域A内に対象物OBが存在していると判断してよい旨の内容が格納されている。ルール番号は、一つ一つのルールを識別可能な識別情報である。また、ルール番号r002には、幅の特徴が割り振られ、当該幅が280以上且つ370以下の場合に、検知領域A内に対象物OBが存在していると判断してよい旨の内容が格納されている。図4の例の場合、ルールの数は15個としているが、特段数には制限が存在しない。従って、ルール情報を構成するルールの数は、割り振る特徴の数に応じて適時調整してもよい。また、ルールの内容もユーザによって適宜変更されてもよい。このような場合、ルール制御部200は、マウスやキーボード等のユーザインターフェースを介して、ユーザから入力されるルールの変更内容を示す情報を受け付ける。
ルール検知実行部220は、後述する代表データ取得部231により取得された画像データに対して、データ管理部400において記憶されているルールに従って、画像データから対象物OB(航空機)を検知する。
具体的には、まず、ルール検知実行部220は、画像データの全範囲(または一部範囲)に対して特徴の抽出処理を行う。次に、ルール検知実行部220は、ルール情報に含まれるルール番号r001からr015の全ルールを参照して、抽出した特徴ごとにルール内容に示される制約条件を満たすか否かを判定し、全ての特徴が制約条件(ルール内容)を満たす領域を、対象物OBが存在している検知領域Aである旨の検知結果を出力する。ルール検知実行部220は、対象物OBが存在している検知領域Aである旨の検知結果として、例えば、対象物OBが存在している検知領域Aのみを表示させた画像情報を画像表示部100に出力する。
図5は、ルール検知実行部220による検知結果の一例を示す図である。図5の例の場合、検知領域A内に対象物OBが存在していない領域が2箇所含まれている。すなわち、ルール検知実行部220は、誤検知を含む検知結果を出力する場合がある。誤検知の要因は、ルール内容に示される制約条件が、対象物OBの存在を検知する指標として適していないことが一例として挙げられる。
ルール検証部230は、ユーザにより設定されたルールが妥当であるか否かを検証する機能部である。ルールが妥当であるとは、画像データから対象物OBを精度良く検知することができることを表している。ルール検証部230は、代表データ取得部231と、調査データ生成部232と、ルール検証実行部233とを有する。
代表データ取得部231は、データ管理部400により管理される複数の画像データから代表となる画像データをランダムに選択する。以下、代表データ取得部231により取得される画像データを、「代表データ」と記載する。
調査データ生成部232は、後述するモデル分類実施部320により分類処理が行われている場合、検知領域A内に所望の対象物OBが存在しているデータ、或いは検知領域A内に所望の対象物OBが存在していないデータに分類されなかったデータ列をn次元空間上から抽出する。すなわち、調査データ生成部232は、信頼度が所定値と同値であるデータ列、または信頼度が所定範囲内のデータ列をn次元空間上から抽出する。調査データ生成部232は、抽出したデータ列を組み合わせた調査データを生成する。なお、調査データ生成部232は、「抽出部」の一例である。
ルール検証実行部233は、後述するモデル分類実施部320による学習モデルを適用した分類結果と、調査データを構成するデータ列の特徴情報をユーザにより設定されたルールに適用させた検知結果とを比較し、学習モデルを適用した分類結果とルールを適用した検知結果とが一致するか否かを判定する。ルール検証実行部233は、学習モデルを適用した分類結果とルールを適用した検知結果とが一致しない場合、学習モデルを適用した分類結果に対してルールを適用した検知結果を近づけるようにルールを変更する。ルール検証実行部233は、例えば、特徴ごとに設定される閾値を大きくし、ルールごとの制約条件(ルール内容)を緩める。なお、学習モデルを適用した分類結果は、「モデル判定結果」の一例であり、ユーザにより設定されたルールに適用させた検知結果は、「ルール判定結果」の一例である。
機械学習部300は、教師データ管理部310と、モデル分類実施部320とを有する。教師データ管理部310は、教師データ生成部311と、特徴情報生成部312と、学習モデル生成部313とを有する。
教師データ生成部311は、ルール検知実行部220による検知結果をユーザに提示し、当該検知結果が誤りであるか否かをユーザに判断させる。具体的には、教師データ生成部311は、上述したルール検知実行部220に対して検知結果(例えば図5)を画像表示部100に出力させる。この結果、画像表示部100は、ルール検知実行部220による検知結果を表示する。このとき、ユーザは、画像表示部100により表示されたルール検知実行部220の検知結果を見て、当該検知結果が誤りであるか否かを判断する。
例えば、ユーザは、ルール検知実行部220の検知結果の一部または全部が誤りであると判断した場合、誤りである旨の情報を、ユーザインターフェースを介して機械学習部300に入力する。この場合、教師データ生成部311は、ルール検知実行部220に対して検知結果を画像表示部100に出力させた後、ユーザから入力される情報を受け付ける。以下、ルール検知実行部220の検知結果を画像表示部100に出力させた後にユーザから入力される情報を、「ユーザの検知判断結果」と記載する。なお、ユーザの検知判断結果は、「ユーザ情報」の一例である。
図6は、図5に示すルール検知実行部220の検知結果に対するユーザの検知判断結果の一例を示す図である。図6の例では、ユーザは、誤検知であると判断した検知領域Aを指定する操作を行い、ルール検知実行部220の検知結果から誤検知の検知領域Aを削除している。このとき、教師データ生成部311は、ルール検知実行部220の検知結果上において、ユーザから誤検知の指定を受けた検知領域Aに誤りである識別子(ラベル)を付与しておく。なお、誤検知の指定を受けた検知領域Aは、図中において破線で示し、誤検知の指定を受けていない検知領域Aは、図中において実線で示している。
教師データ生成部311は、上述した方法で取得したユーザの検知判断結果と画像データ上の検知領域Aから抽出される特徴を示す特徴情報とを含む教師データを生成する。
図7は、教師データの一例を示す図である。教師データを構成する各データ列には、特徴ごとにルールを適用した際の特徴量と、ユーザの検知判断結果を示す情報が格納される。各データ列には、ルール検知実行部220により対象物OBが存在していると判定された検知領域Aごとにデータ番号が割り振られる。すなわち、データ番号は、ルール検知実行部220により対象物OBが存在していると判定された検知領域Aの数と対応する。
例えば、データ番号d000001で示されるデータ列には、ルール番号r001の制約条件を適用させた際に参照した特徴量390と、ルール番号r002の制約条件を適用させた際に参照した特徴量345と、以下省略し、ルール番号r015の制約条件を適用させた際に参照した特徴量55とが格納される。このデータ列において、データ番号d000001と対応する検知領域Aに誤検知を示す識別子(ラベル)が付与されている場合、当該データ列には、ユーザの検知判断結果として“NO”の情報が格納される。なお、検知領域Aに誤検知を示す識別子(ラベル)が付与されていない場合、当該検知領域Aと対応するデータ番号が示すデータ列には、ユーザの検知判断結果として“YES”の情報が格納される。
特徴情報生成部312は、例えば、2次微分処理やハフ変換等の画像処理技術を用いて、ルール検知実行部220により対象物OBが存在していると判定された検知領域Aから特徴を抽出し、当該特徴を示す特徴情報を生成する。なお、本実施形態において、特徴情報生成部312は、上述した形状に関する特徴を抽出するものに限られない。例えば、特徴情報生成部312は、特徴点や色に関する特徴を抽出するものであってもよい。また、特徴情報生成部312は、ユーザが指定する検知領域Aから特徴を抽出し、当該特徴を示す特徴情報を生成してもよい。
学習モデル生成部313は、教師データ生成部311により生成される教師データに対して、サポートベクトルマシン(SVM)等の機械学習手法を用いて学習モデルを生成する。学習モデルは、例えば、所望の対象物(本実施形態では航空機)の形状パターンを機械学習装置1に自動で認識させるためのモデル(プログラム)である。
モデル分類実施部320は、学習モデル生成部313により生成された学習モデルを適用し、教師データ生成部311により生成された教師データに含まれるデータ列ごとに、信頼度を算出する。信頼度とは、検知領域A内部に対象物OBが存在している確率を示す。すなわち、信頼度は、検知領域A内における対象物OBの存在の有無を判定するルールに適合する度合を表し、ルールに適合する度合が高いものほど信頼度の値は高くなる。なお、モデル分類実施部320は、「算出部」の一例である。
モデル分類実施部320は、学習モデル生成部313により生成された学習モデルを適用し、調査データ生成部232により生成された調査データを構成するデータ列ごとに検知領域A内に所望の対象物OBが存在しているか否かを判定し、調査データ上において、対象物OBが存在していると判定したデータ列と、対象物OBが存在していないと判定したデータ列との2パターンに分類する。以下、図8から図10を参照してモデル分類実施部320の信頼度に基づくデータ列の分類処理についてより詳細に説明する。
図8は、モデル分類実施部320による分類結果の一例を示す図である。また、図9および図10は、モデル分類実施部320におけるデータ列の分類処理の概念を説明するための図である。
モデル分類実施部320は、調査データを構成するデータ列の特徴情報(ルール番号)の数nを次元数としたn次元空間上に、データ列を一つ一つプロットする。図9の例の場合、モデル分類実施部320は、2つの特徴情報である特徴情報AおよびBを変数とした2次元空間上にデータ列をプロットしている。このとき、図9に示すように、モデル分類実施部320は、算出した信頼度が所定値(例えば0.5)である境界線BDを境に2次元空間を2つに分類する。
また、図10に示すように、モデル分類実施部320は、境界線BDにある程度の幅を持たせて2次元空間を2つに分類してもよい。モデル分類実施部320は、例えば、所定範囲(例えば0.4〜0.6程度)の信頼度を示す領域を境に2次元空間を2つに分類する。信頼度が0.5程度の場合、検知領域A内部に対象物OBが存在しているかの判断が難しいデータであることを表している。これによって、機械学習装置1は、信頼度が0や1に近いものはその結果になることが明らかなデータ列であり、このようなデータを利用せず、コンピュータの処理において判断が難しいデータ列に対して、検知領域A内部に対象物OBが存在しているかの判定を行うことができる。この結果、機械学習装置1は、信頼度が0.5程度のデータ列、すなわち、判断が難しいデータ列の特徴情報を教師データに取り入れることができる。従って、機械学習装置1は、判断が難しいデータ列の特徴情報を含む教師データに基づいて新しい学習モデルを生成し、新たに生成した学習モデルに従って画像データから対象物OBを検知することにより、対象物OBの検知精度を高めることができる。
モデル分類実施部320は、分類した空間のうち、信頼度が所定値(所定範囲)よりも大きい空間に属すデータ列を、検知領域A内に所望の対象物OBが存在しているデータとして判定し、信頼度が所定値(所定幅)よりも小さい空間に属すデータ列を、検知領域A内に所望の対象物OBが存在していないデータとして判定する。
モデル分類実施部320は、分類した結果を画像表示部100に出力する。モデル分類実施部320は、例えば、検知領域A内に所望の対象物が存在していると判定した場合、“YES”の分類結果を出力する。また、モデル分類実施部320は、例えば、検知領域A内に所望の対象物が存在していないと判定した場合、“NO”の分類結果を出力する。
データ管理部400は、画像データ管理部410と、ルールデータ管理部420と、機械学習データ管理部430とを有する。
画像データ管理部410は、ハードウェアインターフェースを介して接続される記憶装置から画像データを取得して、取得した画像データを画像データ記憶部411に記憶させる。画像データ管理部410は、ルール制御部200や機械学習部300から画像データを取得するための要求を受信した場合、画像データ記憶部411に記憶させた画像データを要求元に出力する。
ルールデータ管理部420は、ルール情報管理部210によって取得されたルール情報をルール情報記憶部421に記憶させる。ルールデータ管理部420は、ルール制御部200や機械学習部300からルール情報を取得するための要求を受信した場合、ルール情報記憶部421に記憶させたルール情報を要求元に出力する。
機械学習データ管理部430は、教師データ生成部311により生成された教師データを教師データ記憶部431に記憶させる。また、機械学習データ管理部430は、学習モデル生成部313により生成された学習モデルをモデルデータ記憶部432に記憶させる。機械学習データ管理部430は、ルール制御部200や機械学習部300から教師データや学習モデルを取得するための要求を受信した場合、各情報と対応した記憶部から要求されている情報を取得し、取得した情報を要求元に出力する。
上述した画像データ記憶部411、ルール情報記憶部421、教師データ記憶部431、およびモデルデータ記憶部432は、例えば、ROM(Read Only Memory)、フラッシュメモリ、HDD(Hard Disk Drive)等の不揮発性の記憶媒体と、RAM(Random Access Memory)、レジスタ等の揮発性の記憶媒体とを含む。
図11は、一実施形態における機械学習装置1の処理の一例を示すフローチャートである。本実施形態における機械学習装置1は、所定周期で本フローチャートの処理を行う。
まず、代表データ取得部231は、データ管理部400により管理される複数の画像データから代表となる画像データをランダムに選択する(ステップS100)。次に、ルール検知実行部220は、代表データ取得部231により取得された画像データに対して、データ管理部400において記憶されているルールに従って、画像データから対象物OB(航空機)を検知する(ステップS102)。
次に、特徴情報生成部312は、ルール検知実行部220により対象物OBが存在していると判定された検知領域Aから特徴を抽出し、当該特徴を示す特徴情報を生成する(ステップS104)。次に、教師データ生成部311は、ルール検知実行部220に対して検知結果を画像表示部100に出力させた後、ユーザから入力されるユーザの検知判断結果を受け付ける(ステップS106)。
次に、教師データ生成部311は、ユーザの検知判断結果と画像データ上の検知領域Aから抽出される特徴を示す特徴情報とを含む教師データを生成する(ステップS108)。次に、学習モデル生成部313は、教師データ生成部311により生成される教師データに対して、機械学習手法を用いて学習モデルを生成する(ステップS110)。
次に、調査データ生成部232は、モデル分類実施部320により分類処理が行われている場合、検知領域A内に所望の対象物OBが存在しているデータ、或いは検知領域A内に所望の対象物OBが存在していないデータに分類されなかったデータ列をn次元空間上から抽出する。すなわち、調査データ生成部232は、モデル分類実施部320により参照される教師データから所定の信頼度を有するデータ列を抽出する(ステップS112)。
次に、調査データ生成部232は、抽出したデータ列を組み合わせて調査データを生成する(ステップS114)。次に、モデル分類実施部320は、学習モデル生成部313により生成された学習モデルを適用し、調査データ生成部232により生成された調査データを構成するデータ列ごとに検知領域A内に所望の対象物OBが存在しているか否かを判定し、調査データ上において、対象物OBが存在していると判定したデータ列と、対象物OBが存在していないと判定したデータ列との2パターンに分類する(ステップS116)。
次に、ルール検証実行部233は、モデル分類実施部320による学習モデルを適用した分類結果と、調査データを構成するデータ列の特徴情報をユーザにより設定されたルールに適用させた検知結果とを比較し、学習モデルを適用した分類結果とルールを適用した検知結果とが一致するか否かを判定する(ステップS118)。
ルール検証実行部233は、学習モデルを適用した分類結果とルールを適用した検知結果とが一致しない場合(ステップS118;Yes)、学習モデルを適用した分類結果に対してルールを適用した検知結果を近づけるようにルールを変更する(ステップS120)。ルール検証実行部233は、学習モデルを適用した分類結果とルールを適用した検知結果とが一致する場合(ステップS118;No)、現在ルール情報記憶部421に記憶されているルールを保持する(ステップS122)。これによって、機械学習装置1は、本フローチャートの処理を終了する。
このように、本実施形態によれば、機械学習装置1は、画像データの検知領域から抽出される特徴を示す特徴情報に、ユーザによって設定されるルールを適用して、検知領域内に対象物OBが存在しているか否かを判定し、ユーザの検知判断結果と画像データ上の検知領域Aから抽出される特徴を示す特徴情報とを組み合わせた教師データを生成し、生成した教師データに基づいて、機械学習方式により学習モデルを生成し、生成した学習モデルに従って、ユーザによって設定されるルールを更新することができる。これによって、機械学習装置1は、画像データ全体に点在する対象物OBの検知に対するルールを、機械学習の結果に基づいて、より適切なルールに更新することができる。この結果、機械学習装置1は、検知精度を向上させることができる。
また、本実施形態によれば、機械学習装置1は、新しい画像データが追加された際にも、追加された画像データに対応したルールの更新が自動で行えるため、ルールの制約条件を画像データごとに設定する負担を軽減させることができる。
(その他の実施形態(変形例))
以下、発明のその他の実施例として、様々な事案に対応したルールベースの構成についても、本実施例が利用可能であることを説明する。
機械学習装置1は、例えば、ルール間の優先順位の見直しが必要となる場合については、今回の手法で教師データを作成したのと同様に、優先順位の関係上、適用されなかったルールの特徴についても情報を取得して教師データに格納しておいてもよい。これにより、機械学習装置1は、学習モデルによる判断結果をもとにし、調査データを使って、現状の優先順位に沿ってルールを適用した場合に正しく検知結果を得られるかどうか検証することができる。
また、機械学習装置1は、ルールの要不要については、ルール検知による精度結果を記憶して判断してもよい。機械学習装置1は、例えば、ルール更新によって精度が上がらない場合、パラメータ調整だけでは限界があり、矛盾するルールを抱えている可能性が想定される。このような場合、機械学習装置1は、矛盾している可能性のある2つのルールの特徴情報について、値を細かく変更した多数のパターンのサンプリングデータを作成することで、学習モデルによる判断を行うことが可能となる。
なお、上述の機械学習装置1は内部に、コンピュータシステムを有している。そして、上述した各処理部の動作は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータが読み出して実行することによって、上記処理が行われる。ここでコンピュータ読み取り可能な記録媒体とは、磁気ディスク、光磁気ディスク、CD−ROM、DVD−ROM、半導体メモリ等をいう。また、このコンピュータプログラムを通信回線によってコンピュータに配信し、この配信を受けたコンピュータが当該プログラムを実行するようにしても良い。
また、上記プログラムは、前述した機能の一部を実現するためのものであっても良い。さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるもの、いわゆる差分ファイル(差分プログラム)であっても良い。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
1…機械学習装置、100…画像表示部、110…画像表示制御部、200…ルール制御部、210…ルール情報管理部、220…ルール検知実行部、230…ルール検証部、231…代表データ取得部、232…調査データ生成部、233…ルール検証実行部、300…機械学習部、310…教師データ管理部、311…教師データ生成部、312…特徴情報生成部、313…学習モデル生成部、320…モデル分類実施部、400…データ管理部、410…画像データ管理部、411…画像データ記憶部、420…ルール情報管理部、421…ルール情報記憶部、430…機械学習データ管理部、431…教師データ記憶部、432…モデルデータ記憶部

Claims (7)

  1. 画像データの所定領域から抽出される特徴を示す特徴情報に、予め定められたルールを適用して、前記所定領域内に対象物が存在しているか否かを判定する判定部と、
    ユーザに前記画像データが示す画像を視認させることにより入力させたユーザ情報を取得する取得部と、
    前記特徴情報と、前記取得部により取得されたユーザ情報とを組み合わせた情報を生成する情報生成部と、
    前記情報生成部により生成された情報に基づいて、機械学習方式により学習モデルを生成するモデル生成部と、
    前記モデル生成部により生成された学習モデルに従って、前記ルールを更新する更新部と、
    を備えることを特徴とする機械学習装置。
  2. 前記情報生成部は、前記特徴情報と、前記取得部により取得されたユーザ情報とを組み合わせた情報を複数生成し、
    前記情報生成部により生成された情報に含まれる特徴情報が前記ルールに適合する度合を示す指標を算出する算出部と、
    前記情報生成部により生成された複数の情報から、前記算出部により算出された指標が所定範囲内の情報を抽出する抽出部と、をさらに備え、
    前記判定部は、前記抽出部により抽出された情報に含まれる特徴情報に対して、前記学習モデルを適用して前記所定領域内に対象物が存在しているか否かを判定し、
    前記更新部は、前記抽出部に抽出させた情報に含まれる特徴情報に対して、前記学習モデルを適用させて前記所定領域内に対象物が存在しているか否かを前記判定部に対して判定させたモデル判定結果と、前記ルールを適用させて前記所定領域内に対象物が存在しているか否かを前記判定部に対して判定させたルール判定結果とに基づいて、前記ルールを更新する、
    請求項1記載の機械学習装置。
  3. 前記更新部は、前記モデル判定結果と前記ルール判定結果とが一致しない場合に、前記ルール判定結果を前記前記モデル判定結果に一致させるように前記ルールを更新する、
    請求項2記載の機械学習装置。
  4. 前記所定範囲とは、前記指標が第1の所定値以上の範囲と、前記第1の所定値よりも低い第2の所定値以下の範囲とを除く範囲である、
    請求項2または3記載の機械学習装置。
  5. 前記算出部は、前記情報生成部により生成される情報に複数の特徴情報が含まれる場合、前記複数の特徴情報ごとに指標を算出し、
    前記抽出部は、前記複数の特徴情報の数と対応した次元数の空間上に、前記算出部により算出された指標を有する情報をプロットし、前記指標が前記所定範囲内であることを示す空間領域から前記情報を抽出する、
    請求項2記載の機械学習装置。
  6. 画像データの所定領域から抽出される特徴を示す特徴情報に、予め定められたルールを適用して、前記所定領域内に対象物が存在しているか否かを判定し、
    ユーザに前記画像データが示す画像を視認させることにより選択させたユーザ情報を取得し、
    前記特徴情報と、前記取得されたユーザ情報とを組み合わせた情報を生成し、
    前記生成された情報に基づいて、機械学習方式により学習モデルを生成し、
    前記生成された学習モデルに従って、前記ルールを更新する、
    機械学習方法。
  7. コンピュータに、
    画像データの所定領域から抽出される特徴を示す特徴情報に、予め定められたルールを適用して、前記所定領域内に対象物が存在しているか否かを判定させ、
    ユーザに前記画像データが示す画像を視認させることにより選択させたユーザ情報を取得させ、
    前記特徴情報と、前記取得されたユーザ情報とを組み合わせた情報を生成させ、
    前記生成された情報に基づいて、機械学習方式により学習モデルを生成させ、
    前記生成された学習モデルに従って、前記ルールを更新させるための、
    機械学習プログラム。
JP2015070586A 2015-03-31 2015-03-31 機械学習装置、機械学習方法、および機械学習プログラム Active JP6492880B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015070586A JP6492880B2 (ja) 2015-03-31 2015-03-31 機械学習装置、機械学習方法、および機械学習プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015070586A JP6492880B2 (ja) 2015-03-31 2015-03-31 機械学習装置、機械学習方法、および機械学習プログラム

Publications (2)

Publication Number Publication Date
JP2016192007A JP2016192007A (ja) 2016-11-10
JP6492880B2 true JP6492880B2 (ja) 2019-04-03

Family

ID=57246847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015070586A Active JP6492880B2 (ja) 2015-03-31 2015-03-31 機械学習装置、機械学習方法、および機械学習プログラム

Country Status (1)

Country Link
JP (1) JP6492880B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018181458A1 (ja) * 2017-03-29 2018-10-04 シンクサイト株式会社 学習結果出力装置及び学習結果出力プログラム
KR102425801B1 (ko) * 2017-12-19 2022-07-28 니혼온쿄엔지니어링 가부시키가이샤 항공기 운항 실적 정보의 수집 장치
AU2018412712A1 (en) * 2018-03-15 2020-09-24 Nihon Onkyo Engineering Co., Ltd. Training Data Generation Method, Training Data Generation Apparatus, And Training Data Generation Program
JP7143672B2 (ja) * 2018-08-06 2022-09-29 日本電信電話株式会社 誤り判定装置、誤り判定方法、及びプログラム
WO2020136761A1 (ja) * 2018-12-26 2020-07-02 日本電気株式会社 情報処理装置、情報処理方法、およびプログラム
JP6696059B1 (ja) * 2019-03-04 2020-05-20 Sppテクノロジーズ株式会社 基板処理装置のプロセス判定装置、基板処理システム及び基板処理装置のプロセス判定方法
JP7310933B2 (ja) * 2020-01-14 2023-07-19 日本電信電話株式会社 データ分類装置、データ分類方法、及びプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222083A (ja) * 2001-01-29 2002-08-09 Fujitsu Ltd 事例蓄積装置および方法
JP4644613B2 (ja) * 2006-02-27 2011-03-02 株式会社日立ハイテクノロジーズ 欠陥観察方法及びその装置
JP5246066B2 (ja) * 2009-06-30 2013-07-24 Jfeスチール株式会社 カテゴリ判定ルールの作成方法、装置およびコンピュータプログラム

Also Published As

Publication number Publication date
JP2016192007A (ja) 2016-11-10

Similar Documents

Publication Publication Date Title
JP6492880B2 (ja) 機械学習装置、機械学習方法、および機械学習プログラム
WO2017216980A1 (ja) 機械学習装置
JP6708385B2 (ja) 識別器作成装置、識別器作成方法、およびプログラム
US9886669B2 (en) Interactive visualization of machine-learning performance
US8595233B2 (en) Data processing apparatus, data processing method, program, and integrated circuit
JP6131723B2 (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体
EP3069302B1 (en) Memory facilitation using directed acyclic graphs
US9563822B2 (en) Learning apparatus, density measuring apparatus, learning method, computer program product, and density measuring system
JP2018173890A (ja) 情報処理装置、情報処理方法、及びプログラム
US20190138852A1 (en) Information processing apparatus, information processing method, and storage medium for generating teacher information
JP2018102916A (ja) 制御方法、情報端末、及びプログラム
US20160379088A1 (en) Apparatus and method for creating an image recognizing program having high positional recognition accuracy
CN112001488A (zh) 训练生成型对抗性网络
US20170091539A1 (en) ID Information for Identifying an Animal
US11164036B2 (en) Human-assisted machine learning through geometric manipulation and refinement
JP7189068B2 (ja) モデル作成支援方法、及びモデル作成支援システム
CN111783088B (zh) 一种恶意代码家族聚类方法、装置和计算机设备
Nguyen et al. Explaining how deep neural networks forget by deep visualization
KR102534936B1 (ko) 영상 분류 장치 및 방법
JP6393982B2 (ja) 空間分割方法、空間分割装置および空間分割プログラム
US20230134218A1 (en) Continuous learning for document processing and analysis
US20230138491A1 (en) Continuous learning for document processing and analysis
US20150178966A1 (en) System and method to check the correct rendering of a font
JP2019016128A (ja) 画像類否判断プログラム、画像類否判断装置および画像類否判断方法
Smith et al. CLustre: semi‐automated lineament clustering for palaeo‐glacial reconstruction

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180209

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20181227

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190205

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190218

R150 Certificate of patent or registration of utility model

Ref document number: 6492880

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150