JP6543066B2 - 機械学習装置 - Google Patents

機械学習装置 Download PDF

Info

Publication number
JP6543066B2
JP6543066B2 JP2015070128A JP2015070128A JP6543066B2 JP 6543066 B2 JP6543066 B2 JP 6543066B2 JP 2015070128 A JP2015070128 A JP 2015070128A JP 2015070128 A JP2015070128 A JP 2015070128A JP 6543066 B2 JP6543066 B2 JP 6543066B2
Authority
JP
Japan
Prior art keywords
learning
domain
unit
decision tree
trial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015070128A
Other languages
English (en)
Other versions
JP2016191975A (ja
Inventor
健太 西行
健太 西行
藤吉 弘亘
弘亘 藤吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MegaChips Corp
Original Assignee
MegaChips Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MegaChips Corp filed Critical MegaChips Corp
Priority to JP2015070128A priority Critical patent/JP6543066B2/ja
Priority to PCT/JP2016/059662 priority patent/WO2016158768A1/ja
Publication of JP2016191975A publication Critical patent/JP2016191975A/ja
Application granted granted Critical
Publication of JP6543066B2 publication Critical patent/JP6543066B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Image Analysis (AREA)

Description

本発明は、転移学習を用いて検出対象のパターンを学習する機械学習装置に関する。
画像データからの人物検出や、センサによる計測データの解析などに機械学習が用いられている。
例えば、監視カメラにより撮影された画像から人物を検出する場合、機械学習装置が、検出対象の人物を撮影した複数の学習サンプルの各々の特徴を学習し、学習した特徴を反映した識別用特徴データを生成する。人物検出装置は、機械学習装置により生成された識別用特徴データを用いて、監視カメラにより撮影された画像から人物を検出する。
監視カメラの設置環境が学習サンプルを収集する環境と異なる場合、監視カメラにより撮影される人物の見え方は、学習サンプルに含まれる人物の見え方と異なる。つまり、監視カメラにより撮影される人物の特徴が、学習サンプルに含まれる人物の特徴と異なる。従って、監視カメラにより生成された画像から人物を検出する際に、学習サンプルから生成された識別用特徴データを用いた場合、人物の検出精度が低下する。人物の検出精度を向上させる場合、カメラの設置環境に合わせて、膨大な数の学習サンプルを準備しなければならず、コストが増大する。
そこで、転移学習を導入した機械学習の手法が提案されている。転移学習は、学習サンプルの収集環境と異なる環境から得られた検出対象のサンプルを事前に学習し、事前学習により得られた検出対象の特徴を、学習サンプルの学習結果に適用(転移)させる手法である。また、学習サンプルの数を抑制することができるため、識別用特徴データを生成するためのコストを低減することができる。例えば、非特許文献1には、転移学習を導入した機械学習のアルゴリズムとして、転移学習を導入したランダムフォレストが開示されている。
特許文献1には、ニューラルネットワークに転移学習を適用した属性識別器が開示されている。特許文献1に係る属性識別器は、第1のクラスの属性を第2のクラスの属性として利用可能である場合、第1のクラスの属性を第2のクラスに転移させる。
特開2012−84117号公報
"Boosted Random Forest and Transfer Learning", [online], [平成27年3月26日検索], インターネット<http://mprg.jp/research/boostedrandomforest_e> Xiaoxiao Shi, Wei Fan, Jiangtao Ren, "Actively Transfer Domain Knowledge", [online], [平成27年3月1日検索],インターネット<URL: www.cs.columbia.edu/~wfan/PAPERS/ecml08transfer.pdf>
しかし、転移学習を用いた場合、負の転移と呼ばれる現象が起こることが知られている。負の転移とは、転移学習のために事前に学習する事前ドメインが、目標ドメインに含まれるデータと大きく異なるデータを含んでいることにより、学習の精度が低下する現象である。目標ドメインは、監視カメラにより撮影された画像から人物を検出する場合には、監視カメラの設置環境に合わせて生成された学習サンプルの集合である。事前ドメインは、監視カメラの設置環境と異なる環境で生成された学習サンプルの集合である。
負の転移の発生を防止するためには、事前ドメインに含まれるサンプルの特徴が、目標ドメインに含まれる学習サンプルの特徴と大きく異なるか否かを判断すればよい。しかし、転移学習に用いられるデータの数は膨大であるため、事前ドメインに含まれるデータを1つずつ人間の手で確認することは困難である。
特許文献1には、転移学習に用いるデータを事前ドメインに含めるか否かを判断する方法が開示されていない。
非特許文献2には、事前ドメインが転移学習に有効であるか否かを判断する方法が開示されている。具体的には、非特許文献2に係る方法は、3つの基準より事前ドメインの信頼性を求めている。1つ目の基準は、事前ドメインのみを用いて学習した識別器(事前識別器)と、事前ドメインと目標ドメインとを用いた転移学習を行う識別器(転移識別器)とにサンプルデータをそれぞれ入力する。サンプルデータに対する事前識別器による識別結果が転移識別器による識別結果と同じである場合、この事前ドメインは、転移学習に有効であると判断される。2つ目の基準は、目標ドメインに含まれるデータの数である。目標ドメインに含まれるデータの数が予め設定された基準値よりも少ない場合、転移学習を実行してもその有効性が低いと判断される。3つ目の基準は、転移識別器から出力される確度である。転移識別器から出力される確度が、予め設定された確度の基準値よりも大きい場合、転移識別器の信頼性が高く、転移学習に有効であると判断される。
しかし、非特許文献2に係る方法では、もともと信頼性が低い場合に専門家に判断を委ねることが前提となっている手法であり、事前ドメインの有効性を判断する精度は高くない。つまり、非特許文献2に係る方法は、転移学習に有効でない事前ドメインを誤って有効であると判断する可能性が高い。このため、事前ドメインの有効性を精度よく判断する技術が望まれている。
従って、本発明の目的は、事前ドメインが転移学習に有効であるかを精度よく判断することができる技術を提供することである。
上記課題を解決するため、請求項1記載の発明は、機械学習装置であって、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、を備える。
請求項2記載の発明は、請求項1に記載の機械学習装置であって、前記判断部は、前記試行転移学習部により生成された決定木を構成する各リーフノードの深さを積算することにより決定木の複雑度を計算し、計算した複雑度に基づいて前記事前ドメインを転移学習に用いるか否かを判断する複雑度計算部、を備える。
請求項3記載の発明は、請求項2に記載の機械学習装置であって、前記試行転移学習部は、第1決定木と前記第1の決定木と異なる第2決定木とを生成し、前記複雑度計算部は、前記第1決定木の複雑度と前記第2決定木の複雑度と計算し、計算した前記第1決定木の複雑度と前記第2決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する。
請求項4記載の発明は、請求項1ないし請求項3のいずれかに記載の機械学習装置であって、さらに、前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、前記試行転移学習部により生成された決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を備え、前記判断部は、前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とに基づいて、前記事前ドメインが有効であるか否かを判断する。
請求項5記載の発明は、請求項4に記載の機械学習装置であって、前記判断部は、学習用データが到達した前記決定木のリーフノードの確率分布と、各学習候補データが到達した前記決定木のリーフノードの確率分布との分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する分布相違度計算部、を備える。
請求項6記載の発明は、請求項5に記載の機械学習装置であって、前記試行転移学習部は、第1決定木と前記第1決定木と異なる第2決定木とを生成し、前記分布相違度計算部は、前記第1決定木を用いて第1分布相違度を計算し、前記第2決定木を用いて第2分布相違度を計算し、判断部は、前記分布相違度計算部により計算された第1分布相違度及び第2分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する。
請求項7記載の発明は、請求項2に記載の機械学習装置であって、さらに、前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、生成した決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を備え、前記判断部は、前記分類部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とを比較し、比較結果と、前記決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する転移評価部、を備える。
請求項8記載の発明は、機械学習方法であって、各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を備える。
請求項9記載の発明は、転移学習をコンピュータに実行させるプログラムであって、各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を実行させる。
本発明に係る機械学習装置において、試行転移学習部は、目標ドメイン及び事前ドメインを用いて、転移学習を導入した機械学習を実行する。これにより、検出対象の検出に用いられる決定木が生成される。判断部は、生成された決定木を構成する全てのリーフノードを用いて、事前ドメインが転移学習に有効であるか否かを判断する。事前ドメインにおけるデータの特徴と目標ドメインにおける学習用データの特徴との際に応じて、決定木の構造は、変化する。決定木を構成する全てのリーフノードを用いることにより、事前ドメインの転移学習における有効性を精度よく評価することができる。
本発明の実施の形態に係る機械学習装置の構成を示す機能ブロック図である。 図1に示す目標ドメイン及び事前ドメインの各々に含まれる画像の一例を示す図である。 図1に示す機械学習装置の動作を示すフローチャートである。 図1に示す競合値算出部により算出される競合値の変化の一例を示す図である。 図1に示す信頼度算出部により算出される信頼度の変化の一例を示す図である。 図1に示す試行転移識別部を構成する決定木の一例を示す模式図である。 図1に示す試行転移識別部による目標ドメインの識別結果に基づいて作成されるヒストグラムの一例を示す図である。 図1に示す試行転移識別部による事前ドメインの識別結果に基づいて作成されるヒストグラムの一例を示す図である。 図1に示す分布相違度算出部により算出される分布相違度の変化の一例を示す図である。 図1に示す複雑度算出部により算出される複雑度の変化の一例を示す図である。
以下、図面を参照しつつ、本発明の実施の形態を詳しく説明する。
[1.機械学習装置の構成]
図1は、本発明の実施の形態に係る機械学習装置100の構成を示す機能ブロック図である。図1に示す機械学習装置100は、転移学習を導入した機械学習を実行して、識別用特徴データ50を生成する。機械学習装置100は、転移学習を導入した機械学習を実行する際に、目標ドメイン21と、事前ドメイン22〜24のうち転移学習に有効と判断された事前ドメインとを用いる。識別用特徴データ50は、人物検出装置(図示省略)がカメラにより生成された撮影画像から人物を検出するために用いられる。
本実施の形態では、機械学習装置100が、俯角0°で撮影された画像から人物を検出するための識別用特徴データ50を生成する場合を例にして説明する。
機械学習装置100は、識別用特徴データ50の生成前に、事前ドメイン22〜24の各々が転移学習に有効であるか否かを評価するための機械学習(試行学習)を実行する。試行学習は、転移学習を導入した機械学習であり、識別用特徴データ50を生成するための機械学習と一部の点で異なる。試行学習では、転移学習を導入した機械学習に用いられる事前ドメインが、事前ドメイン22〜24から1つずつ選択される。
機械学習装置100は、試行学習の結果に基づいて、事前ドメイン22〜24の各々に対する転移学習の有効性を評価する。機械学習装置100は、目標ドメイン21と、転移学習に有効と判断された事前ドメインとを用いて、転移学習を導入した機械学習を実行して、識別用特徴データ50を生成する。
目標ドメイン21は、所定の条件下における検出対象(人物)の特徴を有する複数の画像のグループである。事前ドメイン22〜24は、上記の所定の条件と異なる条件下における検出対象の特徴を有する複数の画像のグループである。事前ドメイン22〜24は、複数の画像を所定の規則で分類することにより生成される。目標ドメイン21及び事前ドメイン22〜24の詳細については、後述する。
図1に示すように、機械学習装置100は、取得部11と、試行転移学習部12と、比較学習部13と、判断部14と、選択転移学習部15とを備える。
取得部11は、記憶装置2に記憶された目標ドメイン21と、事前ドメイン22〜24とを取得する。取得部11は、事前ドメイン22〜24を一括して取得するのではなく、事前ドメイン22〜24のうち、試行転移学習部12及び比較学習部13において機械学習の対象となる1つの事前ドメインを取得する。
試行転移学習部12は、取得部11により取得された目標ドメイン21と、取得部11により取得された1つの事前ドメイン(注目事前ドメイン)とを入力する。試行転移学習部12は、入力された目標ドメイン21及び注目事前ドメインを利用して、転移学習の有効性を評価するための機械学習(試行学習)を実行し、その結果、試行転移識別部32を生成する。試行転移識別部32は、事前ドメインごとに生成される。試行転移学習部12は、学習アルゴリズムとして、転移学習を導入したランダムフォレストを用いる。具体的には、試行転移学習部12により用いられるアルゴリズムは、トランスファーフォレスト(Transfer Forest)と呼ばれており、転移学習の際に、共変量を用いて事前ドメインに含まれるデータを重み付けする。従って、試行転移識別部32の実体は、複数の決定木により構成されるデータ群である。
比較学習部13は、注目事前ドメインのみを利用して、比較用の機械学習(比較学習)を実行し、その結果、比較識別部33を生成する。比較識別部33は、事前ドメインごとに生成される。比較学習部13は、学習アルゴリズムとして、転移学習を導入しないランダムフォレストを用いる。従って、比較識別部33の実体は、試行転移識別部32を構成する複数の決定木と異なる複数の決定木により構成されるデータ群である。
判断部14は、試行転移識別部32と比較識別部33とを用いて、注目事前ドメインが転移学習に有効であるか否かを判断する。判断部14は、競合値計算部141と、信頼度計算部142と、分布相違度計算部143と、複雑度計算部144と、転移評価部145とを備える。
競合値計算部141は、比較識別部33によるサンプルデータの識別結果を試行転移識別部32によるサンプルデータの識別結果と比較する。サンプルデータは、目標ドメイン21に含まれる画像及び注目事前ドメインに含まれる画像である。競合値計算部141は、比較結果に基づいて、競合値141Aを計算する。競合値141Aは、比較識別部33による識別結果と、試行転移識別部32による識別結果とが一致しない度合いを示す。
信頼度計算部142は、試行転移識別部32により生成されるサンプルデータの識別結果を用いて、信頼度142Aを計算する。信頼度142Aは、試行転移識別部32による識別結果の信頼性を示す。
分布相違度計算部143は、試行転移識別部32による目標ドメイン21に含まれる画像の分類結果と、試行転移識別部32による注目事前ドメインに含まれる画像の分類結果とに基づいて、分布相違度143Aを計算する。画像の分類は、試行転移識別部32を構成する決定木により行われる。分布相違度143Aは、注目事前ドメインに含まれる画像の分類結果が目標ドメイン21に含まれる画像の分類結果とどの程度異なるかを示す。
複雑度計算部144は、試行転移識別部32を構成する決定木の構造に基づいて、複雑度144Aを計算する。複雑度144Aは、試行転移識別部32を構成する決定木の複雑さを示す。
転移評価部145は、競合値141Aと、信頼度142Aと、分布相違度143Aと、複雑度144Aとに基づいて、注目事前ドメインが転移学習に有効であるか否かを評価する。転移評価部145は、注目事前ドメインの評価結果を選択転移学習部15に通知する。
選択転移学習部15は、転移評価部145から通知される事前ドメイン22〜24の各々の評価結果に基づいて、転移学習に用いる事前ドメインを特定する。選択転移学習部15は、取得部11を介して、目標ドメイン21と転移学習に用いる事前ドメインとを取得する。選択転移学習部15は、取得した目標ドメイン21と事前ドメインとを用いて、転移学習を導入した機械学習を実行して、識別用特徴データ50を生成する。選択転移学習部15は、試行転移学習部12が用いる学習アルゴリズム(転移学習を導入したランダムフォレスト)を用いる。
[2.目標ドメイン及び事前ドメイン]
以下、目標ドメイン21と事前ドメイン22〜24について説明する。また、機械学習装置100が識別用特徴データ50を生成する前に、事前ドメイン22〜24が転移学習に有効であるか否かを判断する理由を説明する。
図2は、図1に示す記憶装置2に記憶される目標ドメイン21又は事前ドメイン22〜24に属する画像の一例を示す図である。
識別用特徴データ50を利用する人物検出装置(図示省略)は、上述のように、俯角0°で撮影された画像から人物を検出することを想定している。この場合、目標ドメイン21は、図2に示すように、俯角0°で人物を撮影した画像21A〜21Cを含む。実際には、目標ドメイン21は、画像21A〜21Cだけでなく、俯角0°で人物を撮影した他の複数の画像を含む。
つまり、目標ドメイン21は、所定の条件下における検出対象の特徴を有する複数の学習用データを含む。本実施の形態では、検出対象は人物である。所定の条件は、検出対象(人物)が俯角0°で撮影された画像に含まれていることである。目標ドメイン21は、事前ドメイン22〜24の各々に対する判断結果に関係なく、識別用特徴データ50の生成に用いられる。
事前ドメイン22〜24は、それぞれ、0°よりも大きい俯角で人物を撮影した複数の画像を含む。図2に示すように、事前ドメイン22は、俯角20°で人物を撮影した画像22A〜22Cを含む。事前ドメイン23は、俯角30°で人物を撮影した画像23A〜23Cを含む。事前ドメイン24は、俯角50°で人物を撮影した画像24A〜24Cを含む。実際には、事前ドメイン22〜24の各々は、図2に示す画像だけでなく、それぞれの俯角で撮影した他の画像を含むが、図2では、他の画像の表示を省略している。
事前ドメイン22〜24は、0°よりも大きい俯角で人物を撮影した複数の画像を、撮影時の俯角に応じて分類することにより生成される。すなわち、事前ドメイン22〜24は、所定の条件と異なる条件下における検出対象の特徴を有するデータの集合である。
事前ドメイン22〜24に対する転移学習の有効性の評価は、以下の理由によって行われる。事前ドメイン22〜24に含まれる画像が、目標ドメイン21に含まれる画像21A〜21Cの特徴と同様の特徴を有する場合がある。転移学習は、事前ドメインに含まれる画像のうち、目標ドメイン21に含まれる画像と同様の特徴を有する画像を特定し、特定した画像が有する特徴を目標ドメイン21に含まれる画像の学習に適用する。
しかし、ある事前ドメインが、目標ドメイン21に含まれる画像の特徴と大きく異なる特徴を有する画像の集合である場合、負の転移が発生する。この理由は、この事前ドメインに含まれる画像の特徴が、転移学習により識別用特徴データ50に反映されるためである。機械学習装置100は、負の転移を引き起こす可能性の高い事前ドメインを、識別用特徴データ50の生成から除外するために、事前ドメイン22〜24が転移学習に有効であるか否かを評価する。
[3.機械学習装置100の動作]
図3は、機械学習装置100の動作を示すフローチャートである。機械学習装置100が図3に示す処理を開始する際に、試行転移識別部32が試行転移学習部12内に生成されておらず、比較識別部33が比較学習部13内に生成されていない。
{3.1.ドメインの取得}
最初に、機械学習装置100において、取得部11は、記憶装置2から目標ドメイン21を取得する(ステップS11)。取得部11は、記憶装置2に記憶されている事前ドメイン22〜24のうち、転移学習の有効性が評価されていない事前ドメインを取得する(ステップS12)。具体的には、取得部11は、事前ドメイン22〜24のうち、最初に事前ドメイン22を取得する。
{3.2.比較学習及び試行学習}
比較学習部13は、取得部11により取得された事前ドメイン22を入力する。比較学習部13は、入力した事前ドメイン22を学習する(ステップS13)。比較学習部13の学習アルゴリズムは、転移学習が導入されていないランダムフォレストである。比較学習部13は、ステップS13を実行することにより、事前ドメイン22の学習結果を反映した比較識別部33を生成する。比較識別部33は、複数の決定木により構成される。
試行転移学習部12は、取得部11により取得された目標ドメイン21及び事前ドメイン22を入力する。試行転移学習部12は、入力した目標ドメイン21及び事前ドメイン22を用いて、転移学習を導入した機械学習を行う(ステップS14)。試行転移学習部12の学習アルゴリズムは、転移学習を導入したランダムフォレストである。試行転移学習部12は、ステップS14を実行することにより、目標ドメイン21及び事前ドメイン22の学習結果を反映した試行転移識別部32を生成する。試行転移識別部32は、複数の決定木により構成される。試行転移学習部12において用いられる学習アルゴリズム及びドメインが比較学習部13のものと異なるため、試行転移識別部32の構成は、比較識別部33の構成と異なる。
なお、ステップS13及びステップS14において、目標ドメイン21に含まれる画像21A〜21Cと、事前ドメイン22に含まれる画像22A〜22Cとをそのまま学習する例を説明した。しかし、実際には、これらの画像から所定の特徴量を抽出した特徴抽出画像が学習に用いられる。抽出される特徴量は、たとえば、画像内の単位領域内におけるエッジの方向をヒストグラム化したHOG(Histograms of Oriented Gradients)特徴量や、画像内の複数の領域における明暗差を示すHaar−like特徴量などを用いることができる。
{3.3.転移学習の評価(ステップS15)}
判断部14は、試行転移学習部12により生成された試行転移識別部32と比較学習部13により生成された比較識別部33とを用いて、事前ドメイン22が転移学習に有効であるか否かを判断する(ステップS15)。
判断部14は、転移学習の有効性を判断するために、競合値141A、信頼度142A、分布相違度143A、複雑度144Aの4種類のパラメータを計算する。
判断部14は、信頼度142A、分布相違度143A、及び複雑度144Aを計算する場合、サンプルグループに含まれる各画像の試行転移識別部32による識別結果を利用する。ここで、サンプルグループとは、目標ドメイン21と、転移学習の有効性の評価対象である事前ドメイン22とを合わせた集合に含まれる画像である。判断部14は、競合値141Aを計算する場合、試行転移識別部32による識別結果に加えて、サンプルグループに含まれる各画像の比較識別部33による識別結果を利用する。
以下、それぞれのパラメータの詳細及び計算方法についてそれぞれ説明する。
{3.3.1.競合値141Aの計算}
競合値計算部141は、試行転移識別部32により生成される各画像のラベルと、比較識別部33により生成される各画像のラベルとの比較結果に基づいて、競合値141Aを計算する。
試行転移識別部32は、サンプルグループに含まれる画像のうち、いずれか1つ(サンプル画像)を入力する。試行転移識別部32は、サンプル画像に対して人物の識別処理を行い、サンプル画像の識別結果を示すラベル32Aを生成する。ラベル32Aの値は、例えば、0又は1である。ラベル32Aが0である場合、ラベル32Aは、サンプル画像が人物を含まないことを示す。ラベル32Aが1である場合、ラベル32Aは、サンプル画像が人物を含むことを示す。試行転移識別部32は、生成したラベル32Aを競合値計算部141に出力する。
なお、試行転移識別部32は、サンプル画像の識別結果として、ラベル32Aだけでなく、ラベル32Aの確からしさを示す確度32Bを計算する。確度32Bは、後述する信頼度142Aの計算に用いられる。
比較識別部33は、試行転移識別部32に入力されたサンプル画像と同じ画像を入力する。比較識別部33は、サンプル画像に対して人物の識別処理を行い、サンプル画像の識別結果を示すラベル33Aを生成する。ラベル33Aの値は、ラベル32Aと同様に、0又は1である。ラベル33Aが0である場合、ラベル33Aは、サンプル画像が人物を含まないことを示す。ラベル33Aが1である場合、ラベル33Aは、サンプル画像が人物を含むことを示す。比較識別部33は、生成したラベル33Aを競合値計算部141に出力する。
競合値計算部141は、サンプル画像から生成されるラベル32A及び33Aを用いて、競合値141Aを計算する。競合値141Aは、下記式(1)により計算される。
式(1)において、Ec1は、競合値141Aを示す。Xは、サンプルグループを示す。xは、サンプルグループを構成する要素(サンプル画像)を示す。M(x)は、要素xから生成されたラベル33Aを示す。T(x)は、要素xから生成されたラベル32Aを示す。[M(x)≠T(x)]は、ラベル33Aとラベル32Aとが一致しなかったサンプル画像の数を示す。|X|は、サンプルグループXを構成する要素の数である。
式(1)により計算される競合値141Aは、同一のサンプル画像から生成されるラベル32A及びラベル33Aが一致する確率を示す。競合値141Aは、0以上1以下の数値である。競合値141Aが0に近づくほど、競合値141Aは、転移学習における事前ドメイン22の有効性が高いことを示す。一方、競合値141Aが1に近づくほど。転移学習における事前ドメイン22の有効性が低いことを示す。
俯角が大きくなるにつれて、事前ドメインに含まれる画像の特徴と目標ドメインに含まれる画像の特徴との相違点の数が増加する。従って、俯角が大きくなるにつれて、事前ドメインの競合値141Aは、増加すると想定される。
図4は、競合値141Aの変化の一例を示すグラフである。図4に示すグラフは、以下のようにして作成される。
俯角5°から俯角80°まで5°おきに俯角を設定し、設定された俯角に基づいて画像を分類することにより、複数の事前ドメインを作成した。目標ドメイン21は、上記と同様に、俯角0°で人物を撮影した画像の集合である。各俯角に対応する試行転移識別部32及び比較識別部33を生成して、各俯角に対応する競合値141Aを上記の手順で計算した。
図4に示すように、競合値141Aは、俯角の増加に合わせて増加する傾向がある。従って、転移学習における事前ドメインの有効性を判断するパラメータとして競合値141Aを利用できることがわかる。しかし、競合値141Aは、上下に振動しながら増加している。このことは、競合値141Aの誤差が比較的大きいことを示している。
従って、競合値141Aのみを用いて、転移学習に対する事前ドメインの有効性を判断した場合、負の転移を引き起こす事前ドメインを誤って有効であると判断するおそれがある。このため、競合値141Aを用いて事前ドメインの有効性を判断する場合、他のパラメータ(信頼度142A等)を合わせて用いることが望ましい。
{3.3.2.信頼度の計算}
信頼度計算部142は、試行転移識別部32により生成される各画像のラベル32A及び確度32Bに基づいて、信頼度142Aを計算する。信頼度142Aの計算に当たり、比較識別部33によるサンプル画像の識別結果は使用されない。
試行転移識別部32は、上述のように、サンプル画像に対する人物の識別結果を示すラベル32Aと、ラベル32Aの確からしさを示す確度32Bを生成する。確度32Bは、0以上1以下の値であり、確度32Bが1に近づくほど、ラベル32Aが誤りである可能性が小さくなる。
信頼度計算部142は、試行転移識別部32から各サンプル画像のラベル32A及び確度32Bを入力する。信頼度計算部142は、入力した各サンプル画像のラベル32A及び確度32Bを用いて、下記式(2)を計算することにより信頼度142Aを計算する。
上記式(2)において、Ec2は、信頼度142Aを示す。xは、上記式(1)と同様に、サンプルグループXを構成する要素(サンプル画像)を示す。|X|は、サンプルグループXの要素数である。P(x)は、要素xの確度32Bを示す。T(x)は、要素xのラベル32Aを示す。yは、人物の存在を示すラベル(y=1)である。つまり、信頼度142Aは、ラベル32Aがラベルyと一致する場合に算出された確度32Bの合計値を、サンプルグループXの要素数で除算した値である。信頼度142Aは、0以上1以下の値であり、1に近いほど、転移学習における事前ドメイン22の有効性が高いことを示す。
図5は、信頼度142Aの変化の一例を示すグラフである。図4と同様に、俯角が5°おきに設定された複数の事前ドメインの各々から試行転移識別部32を生成して、各事前ドメインに対応する信頼度142Aを計算することにより、図5に示すグラフを作成した。
信頼度142Aは、図5に示すように、全体的な傾向として、俯角の増加に合わせて減少していく。つまり、事前ドメインの有効性が高くなるにつれて、信頼度142Aは1に近づく。以下、その理由を説明する。事前ドメイン22に含まれるデータが、目標ドメイン21に含まれるデータの特徴量と類似する特徴量を有している場合、試行転移学習部12は、試行転移学習により、事前ドメイン22の学習結果を目標ドメイン21の学習結果に転移させる。試行転移識別部32には、目標ドメイン21及び事前ドメイン22の両者の学習結果が反映されている。試行転移識別部32がサンプルグループに含まれる各画像に対して識別処理を行った場合、ラベル32Aは1となり、その確度32Bも1に近づくと考えられる。従って、事前ドメイン22に含まれるデータと目標ドメイン21に含まれるデータとが類似している場合(事前ドメイン22が転移学習において有効である場合)、信頼度142Aは、1に近づく。
図5に示すように、信頼度142Aは、上下に振動しながら増加する。これは、競合値141Aと同様に、信頼度142Aの誤差が比較的大きいことを示している。このため、信頼度142Aのみを用いて、転移学習に対する事前ドメインの有効性を判断した場合、負の転移を引き起こす事前ドメインを誤って有効であると判断するおそれがある。このため、信頼度142Aを用いて事前ドメインの有効性を判断する場合、他のパラメータ(分布相違度143A等)を合わせて用いることが望ましい。
{3.3.3.分布相違度}
分布相違度計算部143は、試行転移識別部32によるサンプル画像の識別結果のみを利用して、分布相違度143Aを計算する。分布相違度計算部143は、試行転移識別部32を構成する各決定木のリーフノードに到達した目標ドメイン21の画像の分布と事前ドメイン22の画像の分布との差に基づいて、分布相違度143Aを計算する。
試行転移識別部32は、学習アルゴリズムとして転移学習を導入したランダムフォレストを用いるため、複数の決定木により構成される。しかし、分布相違度143Aの計算の説明を簡略化するために、試行転移識別部32を構成する決定木が1つである場合を最初に説明する。
図6は、試行転移識別部32を構成する決定木40の一例を示す模式図である。図7は、目標ドメイン21の画像の識別結果に基づいて作成されるヒストグラム51の一例を示す図である。図8は、事前ドメイン22の画像の識別結果に基づいて作成されるヒストグラム52の一例を示す図である。ヒストグラム51及び52は、試行転移識別部32による識別結果に基づいて作成される。
ヒストグラム51は、以下のようにして作成される。試行転移識別部32は、目標ドメイン21に含まれる各画像を決定木40のルートノード40Rに入力する。入力された画像は、分岐ノードを経由して、リーフノード40A〜40Gのいずれかに到達する。
例えば、試行転移識別部32は、画像21A(図2参照)の特徴量をルートノード40Rで用いられるしきい値と比較し、比較結果に基づいて、画像21Aの遷移先を分岐ノード41A及び41Bのいずれかに決定する。画像21Aが分岐ノード41Aに遷移した場合、試行転移識別部32は、画像21A(図2参照)の特徴量を分岐ノード41Aで用いられるしきい値と比較し、遷移先のノードをリーフノード40A又は分岐ノード41Cに決定する。画像21Aがリーフノード40Aに遷移することにより、画像21Aの到達先が、リーフノード40Aに決定される。分岐ノード41Aで用いられる画像21Aの特徴量は、ルートノード40Rで用いられる画像21Aの特徴量と同じであっても異なっていてもよい。同じである場合、分岐ノード41Aで用いられるしきい値は、ルートノード40Rで用いられるしきい値と異なる。
試行転移識別部32は、目標ドメイン21に含まれる各画像が到達したリーフノードを特定する到達先データ32Cを分布相違度計算部143に出力する。分布相違度計算部143は、到達先データ32Cを参照して、リーフノード40A〜40Gの各々に到達した画像の数をカウントする。この結果、リーフノードに到達した目標ドメイン21の画像の分布を示すヒストグラム51が作成される。
試行転移識別部32は、事前ドメイン22に含まれる画像の各々が到達したリーフノードを特定する到達先データ32Dを生成する。分布相違度計算部143は、到達先データ32Dに基づいて、リーフノードに到達した事前ドメイン22の画像の分布を示すヒストグラム52を作成する。
分布相違度143Aは、下記式(3)を用いて計算される。具体的には、分布相違度143Aは、ヒストグラム51及び52を正規化した後、それらのBhattacharyya距離を算出することによりにより得られる。Bhattacharyya距離は、2つの確率分布の類似性を示す。
式(3)において、Ec3は、分布相違度143Aを示す。iは、図6に示す各リーフノードの番号である。p(i)は、リーフノードに到達した目標ドメイン21の画像の確率分布である。q(i)は、リーフノードに到達した事前ドメイン22の画像の確率分布である。確率分布p(i)は、ヒストグラム51から作成され、確率分布q(i)は、ヒストグラム52から作成される。Xは、サンプルグループを構成する要素(画像)の数である。
分布相違度143Aは、0以上1以下の数値であり、ヒストグラム51における画像の分布と、ヒストグラム52における画像の分布との類似性が低いほど1に近づく。つまり、分布相違度143Aが1に近づくほど、事前ドメイン22が転移学習に有効でないことを示す。
図9は、分布相違度143Aの変化の一例を示すグラフである。図4と同様に、俯角が5°おきに設定された複数の事前ドメインの各々に対応する試行転移識別部32を作成して、各事前ドメインに対応する分布相違度143Aを計算した。
図9に示すように、分布相違度143Aは、俯角の増加に合わせて増加する。これは、以下の理由による。俯角が増加するにつれて、目標ドメイン21に含まれる画像の特徴と事前ドメイン22に含まれる画像の特徴との差が大きくなる。この場合、事前ドメイン22に含まれる画像が決定木40内を遷移するルートが、目標ドメイン21に含まれる画像が決定木40内を遷移するルートから大きく外れる頻度が増加する。目標ドメイン21に含まれる画像の分布と、事前ドメイン22に含まれる画像の分布との差が大きくなり、俯角の増加に合わせて分布相違度143Aが増加する。
例えば、図7に示すヒストグラム51では、ピークがノード番号3のノード40Dに表れている。一方、図8に示すヒストグラム52では、ピークがノード番号6のノード40Gに表れている。つまり、ヒストグラム51及び52は、ヒストグラムの形状が互いに大きく異なる。この場合、分布相違度143Aは、1に近い値となるため、転移学習における事前ドメイン22の有効性は低いと考えられる。
また、図9に示すように、競合値141A及び信頼度142Aに比べて、分布相違度143Aは、上下に振動しない。これは、分布相違度143Aの誤差が小さく、転移学習における事前ドメインの有効性を精度よく判断できることを示している。
次に、試行転移識別部32が複数の決定木により構成される場合における、分布相違度143Aの計算について説明する。分布相違度計算部143は、式(3)を用いて、決定木ごとの分布相違度143Aを計算する。そして、分布相違度計算部143は、各決定木の分布相違度143Aの平均を、事前ドメイン22の分布相違度143Aとして算出する。
{3.3.4.木の複雑度}
複雑度計算部144は、試行転移識別部32を構成する決定木の構造に基づいて複雑度144Aを計算する。複雑度144Aは、試行転移識別部32を構成する決定木のリーフノードの深さに基づいて計算される。
複雑度144Aの計算方法について、分布相違度143Aの説明と同様に、試行転移識別部32を構成する決定木が1つである場合を最初に説明する。複雑度計算部144は、決定木を構成する各リーフノードの深さを記録したリーフノードデータ32Eを試行転移識別部32から取得する。複雑度計算部144は、下記式(4)を用いて、複雑度144Aを計算する。
上記式(4)において、Ec4は、複雑度144Aを示す。dは、決定木におけるk番目のリーフノードの深さを示す。nは、決定木におけるリーフノードの数である。dmaxは、決定木におけるリーフノードの最大深さを示し、式(4)の分子(リーフノードの深さの合計値)を正規化するために用いられる。リーフノードの深さは、リーフノードからルートノード40Rに到達するまでに通過するエッジ(枝)の数によって定義される。例えば、図4に示す決定木において、リーフノード40Aの深さは、2である。
一般的に、リーフノードの数又はリーフノードの深さが増加するにつれて、決定木の構造は複雑となる。目標ドメイン21の各画像の特徴と事前ドメイン22の各画像の特徴との差が大きくなるにつれて、決定木は複雑な構造を有する。以下、その理由について説明する。
目標ドメイン21の各画像の特徴と事前ドメイン22の各画像の特徴との差が大きい場合、試行転移学習部12は、決定木を作成する際に、目標ドメイン21の各画像の特徴に応じた分岐条件と、事前ドメイン22の各画像の特徴に応じた分岐条件とを別々に作成する。この結果、目標ドメインの各画像に対応する部分木と、事前ドメイン22の各画像の特徴を識別するための部分木とが、別々に作成される。この結果、決定木を構成するリーフノードの数が増加し、決定木の構造は複雑となる。従って、式(4)により計算される複雑度144Aを用いることにより、転移学習における事前ドメイン22の有効性を判断することができる。
図10は、複雑度144Aの変化の一例を示すグラフである。図4と同様に、俯角が5°おきに設定された複数の事前ドメインを作成し、各事前ドメインに対応する複雑度144Aを計算することにより、図10に示すグラフを作成した。
図10に示すように、複雑度144Aは、俯角の増加に合わせて増加する。これは、上述のように、事前ドメインに含まれる画像の特徴と、目標ドメインに含まれる画像の特徴との差が大きくなるにつれて、決定木の構造が複雑となるためである。なお、分布相違度143Aと同様に、複雑度144Aは、上下に振動しない。従って、複雑度144Aを用いることにより、転移学習における事前ドメイン22の有効性を精度よく判断することができる。
複数の決定木が試行転移識別部32を構成する場合の複雑度144Aの計算方法について説明する。決定木ごとの複雑度144Aが、式(4)により計算される。決定木ごとに計算された複雑度144Aを平均することにより、複数の決定木が試行転移識別部32を構成する場合における複雑度144Aが得られる。
{3.3.5.転移評価部145による事前ドメインの評価}
転移評価部145は、競合値141A、信頼度142A、分布相違度143A、及び複雑度144Aを入力する。転移評価部145は、入力した競合値141A、信頼度142A、分布相違度143A、及び複雑度144Aに基づいて、転移学習における事前ドメイン22の有効性を評価する。
転移評価部145は、下記の式(5)を用いて、総合評価値を計算する。
式(5)において、Eは、競合値141A、信頼度142A、分布相違度143A、及び複雑度144Aから得られる総合評価値である。事前ドメインの転移学習における有効性が低下するにつれて、競合値141A、分布相違度143A、及び複雑度144Aは増加する。一方、信頼度142Aは、逆に低下する。信頼度142Aの傾向を他の3つの評価値の傾向に合わせるために、1から信頼度142Aを減算した値を、総合評価値の計算に使用している。
上記式(5)により計算された総合評価値は、0以上の値であり、転移学習の有効性が高くなるにつれて0に近づく。転移評価部145は、計算された総合評価値が予め設定されたしきい値よりも小さい場合、事前ドメイン22が転移学習において有効であると判断する。転移評価部145は、転移学習の有効性の判断対象であった事前ドメイン22の評価結果を示す評価結果データ145Aを選択転移学習部15に出力する。
{3.4.次の事前ドメインの指定}
事前ドメイン22の有効性の評価(ステップS15)が終了した後に、事前ドメイン22の有効性の評価に用いられた試行転移識別部32及び比較識別部33が削除される(ステップS16)。事前ドメイン22に対応する試行転移識別部32及び比較識別部33は、転移学習における他の事前ドメインの有効性の評価で使用されないためである。
取得部11は、記憶装置2に記憶されている全ての事前ドメインの評価が終了したか否かを判断する(ステップS17)。全ての事前ドメインの評価が終了していない場合(ステップS17においてNo)、機械学習装置100は、転移学習の有効性が評価されていない事前ドメインを取得するために、ステップS12に戻る。
これにより、転移学習における事前ドメイン23及び24の有効性が評価される。転移評価部145は、事前ドメイン23及び24の各々の評価結果を示す評価結果データ145Aを、選択転移学習部15に出力する。
{3.5.識別用特徴データ50の生成}
全ての事前ドメインの評価が終了した場合(ステップS17においてYes)、選択転移学習部15は、事前ドメイン22〜24の各々の評価結果データ145Aに基づいて、転移学習に有効であると判断された事前ドメインを特定する。転移学習に有効と判断される事前ドメインの数は、特に限定されない。
選択転移学習部15は、目標ドメイン21及び特定した事前ドメインを、取得部11を介して記憶装置2から取得する。選択転移学習部15は、取得した目標ドメイン21及び事前ドメインを用いて、転移学習を導入したランダムフォレストに基づく機械学習を実行する(ステップS18)。この結果、識別用特徴データ50が生成される。生成された識別用特徴データ50は、人物検出装置(図示省略)により利用される。
以上説明したように、機械学習装置100は、事前ドメイン22〜24の各々の転移学習における有効性を評価し、目標ドメイン21と転移学習に有効と判断された事前ドメインとを用いて転移学習を導入した機械学習を実行する。事前ドメインが、目標ドメインに含まれる画像の特徴と大きく異なる特徴を有する画像により構成される場合、この事前ドメインが識別用特徴データ50の生成に用いられることが防止される。この結果、負の転移が発生することを防止することができ、検出対象の検出精度を高めることができる。
なお、上記実施の形態において、試行転移学習部12及び選択転移学習部15が、学習アルゴリズムとしてランダムフォレストを用いる場合を例に説明したが、これに限られない。学習アルゴリズムは、決定木を生成するアルゴリズムであれば、特に限定されない。例えば、学習アルゴリズムとして、ID3(Iterative Dichotomiser 3)や、ブースティングを用いることが可能である。いずれの学習アルゴズムを用いる場合であっても、試行転移学習部12は、転移学習を導入した機械学習を実行し、比較学習部13は、転移学習を導入しない機械学習を実行すればよい。
上記実施の形態において、事前ドメイン22〜24が、0°よりも大きい俯角で人物を撮影された画像を含む例を説明したが、これに限られない。機械学習装置100は、0°よりも大きい仰角で人物を撮影した画像を含む事前ドメインを用いてもよい。あるいは、目標ドメイン21に含まれる画像の明るさと異なる明るさを有する画像を含む事前ドメインを用いてもよい。また、目標ドメイン21が人物を撮影した画像である場合を例にして説明したが、検出対象に応じて目標ドメイン21に含まれるデータが設定されることは言うまでもない。
上記実施の形態において、転移評価部145が、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aを用いて、転移学習における事前ドメインの有効性を評価する例を説明したが、これに限られない。転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aの少なくとも1つを用いて、事前ドメインの有効性を評価すればよい。
なお、分布相違度143A及び複雑度144Aは、競合値141A及び信頼度142Aに比べて、誤差が小さい。このため、転移評価部145は、少なくとも、分布相違度143A及び複雑度144Aをいずれかを用いることが望ましい。転移評価部145が、事前ドメインの評価に競合値141A及び信頼度142Aを用いない場合、機械学習装置100は、比較学習部13を備えなくてもよい。
上記実施の形態において、分布相違度計算部143は、試行転移識別部32が複数の決定木により構成される場合、各決定木から計算される分布相違度を合計することにより分布相違度143Aを計算する例を説明したが、これに限られない。分布相違度計算部143は、試行転移識別部32を構成する決定木のうち、少なくとも一本の決定木を用いて分布相違度143Aを計算すればよい。複雑度計算部144も、同様に、試行転移識別部32を構成する決定木のうち、少なくとも一本の決定木を用いて複雑度144Aを計算すればよい。すなわち、判断部14は、試行転移識別部32を構成する複数の決定木のうち、少なくとも1つの決定木を構成する全てのリーフノードを用いて、転移学習における事前ドメインの有効性を評価すればよい。
上記実施の形態において、転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aを乗算することにより、総合評価値を計算する例を説明したが、これに限られない。たとえば、転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aの合計を総合評価値として計算してもよい。また、精度の高い分布相違度143A及び複雑度144Aの重みを大きくした上で、総合評価値を計算してもよい。つまり、転移評価部145は、競合値141A、信頼度142A、分布相違度143A及び複雑度144Aを用いて、総合評価値を計算すればよい。
上記実施の形態において、機械学習装置100が、人物を検出するための識別用特徴データ50を生成する例を例にしたが、これに限られない。学習の対象は、センサにより計測された測定データであってもよい。センサの種類は、特に限定されず、加速度センサ、光センサなどの様々な測定データを使用することができる。例えば、自動車の自動運転を行うために、これらのセンサの測定データを用いるために機械学習を実行してもよい。
上記実施の形態の機械学習装置100の一部または全部は、集積回路(例えば、LSI、システムLSI等)として実現されるものであってもよい。
上記実施の形態の各機能ブロックの処理の一部または全部は、プログラムにより実現されるものであってもよい。そして、上記実施形態の各機能ブロックの処理の一部または全部は、コンピュータにおいて、中央演算装置(CPU)により行われる。また、それぞれの処理を行うためのプログラムは、ハードディスク、ROMなどの記憶装置に格納されており、ROMにおいて、あるいはRAMに読み出されて実行される。
また、上記実施形態の各処理をハードウェアにより実現してもよいし、ソフトウェア(OS(オペレーティングシステム)、ミドルウェア、あるいは、所定のライブラリとともに実現される場合を含む。)により実現してもよい。さらに、ソフトウェアおよびハードウェアの混在処理により実現しても良い。なお、上記実施の形態に係る機械学習装置100をハードウェアにより実現する場合、各処理を行うためのタイミング調整を行う必要があるのは言うまでもない。上記実施形態においては、説明便宜のため、実際のハードウェア設計で生じる各種信号のタイミング調整の詳細については省略している。
また、上記実施形態における処理方法の実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えることができるものである。
前述した方法をコンピュータに実行させるコンピュータプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体は、本発明の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、CD−ROM、MO、DVD、DVD−ROM、DVD−RAM、大容量DVD、次世代DVD、半導体メモリを挙げることができる。
上記コンピュータプログラムは、上記記録媒体に記録されたものに限られず、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して伝送されるものであってもよい。
100 機械学習装置
2 記憶装置
11 取得部
12 試行転移学習部
13 比較学習部
14 判断部
15 選択転移学習部
141 競合値計算部
142 信頼度計算部
143 分布相違度計算部
144 複雑度計算部
145 転移評価部

Claims (8)

  1. 各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、
    前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、
    前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、
    を備える機械学習装置。
  2. 請求項1に記載の機械学習装置であって、
    前記判断部は、
    前記試行転移学習部により生成された決定木を構成する各リーフノードの深さを積算することにより決定木の複雑度を計算し、計算した複雑度に基づいて前記事前ドメインを転移学習に用いるか否かを判断する複雑度計算部、
    を備える機械学習装置。
  3. 請求項2に記載の機械学習装置であって、
    前記試行転移学習部は、第1決定木と前記第1決定木と異なる第2決定木とを生成し、
    前記複雑度計算部は、前記第1決定木の複雑度と前記第2決定木の複雑度と計算し、計算した前記第1決定木の複雑度と前記第2決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する機械学習装置。
  4. 請求項1ないし請求項3のいずれかに記載の機械学習装置であって、さらに、
    前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、前記試行転移学習部により生成された決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、
    を備え、
    前記判断部は、前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とに基づいて、前記事前ドメインが有効であるか否かを判断する機械学習装置。
  5. 請求項4に記載の機械学習装置であって、
    前記判断部は、
    学習用データが到達した前記決定木のリーフノードの確率分布と、各学習候補データが到達した前記決定木のリーフノードの確率分布との分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する分布相違度計算部、
    を備える機械学習装置。
  6. 請求項5に記載の機械学習装置であって、
    前記試行転移学習部は、第1決定木と前記第1決定木と異なる第2決定木とを生成し、
    前記分布相違度計算部は、前記第1決定木を用いて第1分布相違度を計算し、前記第2決定木を用いて第2分布相違度を計算し、
    前記判断部は、前記分布相違度計算部により計算された第1分布相違度及び第2分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する機械学習装置。
  7. 請求項2に記載の機械学習装置であって、
    前記試行転移学習部は、
    生成した前記決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、生成した前記決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、
    を含み、
    前記判断部は、
    前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とを比較し、比較結果と、前記決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する転移評価部、
    を備える機械学習装置。
  8. 転移学習をコンピュータに実行させるプログラムであって、
    各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、
    前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、
    生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、
    を実行させるプログラム。
JP2015070128A 2015-03-30 2015-03-30 機械学習装置 Active JP6543066B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015070128A JP6543066B2 (ja) 2015-03-30 2015-03-30 機械学習装置
PCT/JP2016/059662 WO2016158768A1 (ja) 2015-03-30 2016-03-25 クラスタリング装置及び機械学習装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015070128A JP6543066B2 (ja) 2015-03-30 2015-03-30 機械学習装置

Publications (2)

Publication Number Publication Date
JP2016191975A JP2016191975A (ja) 2016-11-10
JP6543066B2 true JP6543066B2 (ja) 2019-07-10

Family

ID=57245601

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015070128A Active JP6543066B2 (ja) 2015-03-30 2015-03-30 機械学習装置

Country Status (1)

Country Link
JP (1) JP6543066B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11914688B2 (en) 2019-12-09 2024-02-27 Samsung Electronics Co., Ltd. Electronic device and controlling method of electronic device for identifying transition suitability of a neural network model included in an external device

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102053527B1 (ko) * 2017-10-15 2019-12-06 알레시오 주식회사 이미지 처리 방법
US11694083B2 (en) 2017-10-15 2023-07-04 Alethio Co. Signal translation system and signal translation method
US10955851B2 (en) 2018-02-14 2021-03-23 Zoox, Inc. Detecting blocking objects
JP6760318B2 (ja) 2018-03-14 2020-09-23 オムロン株式会社 顔画像識別システム、識別器生成装置、識別装置、画像識別システム、及び識別システム
US11494612B2 (en) * 2018-10-31 2022-11-08 Sony Interactive Entertainment Inc. Systems and methods for domain adaptation in neural networks using domain classifier
JP7003953B2 (ja) * 2019-03-14 2022-01-21 オムロン株式会社 学習装置、推定装置、データ生成装置、学習方法、及び学習プログラム
EP4033417A4 (en) 2019-10-16 2022-10-12 Mitsubishi Electric Corporation SEARCH DEVICE, SEARCH METHOD, SEARCH PROGRAM, AND LEARNING MODEL SEARCH SYSTEM
JP7353940B2 (ja) * 2019-11-26 2023-10-02 株式会社日立製作所 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム
JP2022062362A (ja) 2020-10-08 2022-04-20 富士通株式会社 情報処理プログラム,情報処理装置および情報処理方法
JP7463996B2 (ja) 2021-03-26 2024-04-09 横河電機株式会社 装置、方法およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5442586B2 (ja) * 2010-11-30 2014-03-12 日本電信電話株式会社 情報検索装置、情報検索方法及びそのプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11914688B2 (en) 2019-12-09 2024-02-27 Samsung Electronics Co., Ltd. Electronic device and controlling method of electronic device for identifying transition suitability of a neural network model included in an external device

Also Published As

Publication number Publication date
JP2016191975A (ja) 2016-11-10

Similar Documents

Publication Publication Date Title
JP6543066B2 (ja) 機械学習装置
JP6516531B2 (ja) クラスタリング装置及び機械学習装置
JP4767595B2 (ja) 対象物検出装置及びその学習装置
CN106846355B (zh) 基于提升直觉模糊树的目标跟踪方法及装置
JP5880454B2 (ja) 画像識別装置及びプログラム
JP2023088913A (ja) 誤検知を減少させた分光学的分類のための識別
KR101780676B1 (ko) 트레이닝 이미지를 이용하여 분류 트리를 구성함으로써 rejector를 학습하고 상기 rejector를 이용하여 테스트 이미지 상의 객체를 검출하는 방법
WO2016158768A1 (ja) クラスタリング装置及び機械学習装置
JP6448325B2 (ja) 画像処理装置、画像処理方法及びプログラム
CN109727275B (zh) 目标检测方法、装置、系统和计算机可读存储介质
CN111914665B (zh) 一种人脸遮挡检测方法、装置、设备及存储介质
KR101708491B1 (ko) 압력 센서를 이용한 객체 인식 방법
JP2015082245A (ja) 画像処理装置、画像処理方法及びプログラム
US9014458B2 (en) Valuable document identification method and system
CN111368289B (zh) 一种恶意软件检测方法和装置
US20210158071A1 (en) Match determination device, match determination method, storage medium
CN110688883A (zh) 车辆和行人检测方法及装置
CN110998606A (zh) 生成标记数据用于深度对象跟踪
US20150332172A1 (en) Learning method, information processing device, and recording medium
KR20140052365A (ko) 영상에서 투명 오브젝트를 검출하는 영상 처리 장치 및 방법
JP6812076B2 (ja) ジェスチャ認識装置およびジェスチャ認識プログラム
JP2015232805A (ja) 画像処理方法、画像処理装置、および画像処理プログラム
CN114846513A (zh) 动作分析系统和动作分析程序
JP5623253B2 (ja) 多目標追尾装置
JP6659120B2 (ja) 情報処理装置、情報処理方法、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190520

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190604

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190614

R150 Certificate of patent or registration of utility model

Ref document number: 6543066

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250