JP2016191975A

JP2016191975A - 機械学習装置

Info

Publication number: JP2016191975A
Application number: JP2015070128A
Authority: JP
Inventors: 健太西行; Kenta Nishiyuki; 藤吉　弘亘; Hironobu Fujiyoshi; 弘亘藤吉
Original assignee: MegaChips Corp
Current assignee: MegaChips Corp
Priority date: 2015-03-30
Filing date: 2015-03-30
Publication date: 2016-11-10
Anticipated expiration: 2035-03-30
Also published as: JP6543066B2

Abstract

【課題】事前ドメインが転移学習に有効であるかを精度よく判断することができる技術を提供することを課題とする。【解決手段】機械学習装置１００において、取得部１１は、目標ドメイン２１と、転移学習の有効性の判断対象として指定された事前ドメイン２２とを記憶装置から取得する。目標ドメイン２１は、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む。事前ドメイン２２は、所定の条件と異なる条件下における検出対象の特徴を有するデータを含む。試行転移学習部１２は、取得部１１により取得された目標ドメイン２１及び事前ドメイン２２を用いて転移学習を導入した機械学習を実行して、検出対象の検出に用いられる決定木を生成する。判断部１４は、試行転移学習部１２により生成された決定木を構成する全てのリーフノードを用いて、事前ドメイン２２が転移学習に有効であるか否かを判断する。【選択図】図１

Description

本発明は、転移学習を用いて検出対象のパターンを学習する機械学習装置に関する。

画像データからの人物検出や、センサによる計測データの解析などに機械学習が用いられている。

例えば、監視カメラにより撮影された画像から人物を検出する場合、機械学習装置が、検出対象の人物を撮影した複数の学習サンプルの各々の特徴を学習し、学習した特徴を反映した識別用特徴データを生成する。人物検出装置は、機械学習装置により生成された識別用特徴データを用いて、監視カメラにより撮影された画像から人物を検出する。

監視カメラの設置環境が学習サンプルを収集する環境と異なる場合、監視カメラにより撮影される人物の見え方は、学習サンプルに含まれる人物の見え方と異なる。つまり、監視カメラにより撮影される人物の特徴が、学習サンプルに含まれる人物の特徴と異なる。従って、監視カメラにより生成された画像から人物を検出する際に、学習サンプルから生成された識別用特徴データを用いた場合、人物の検出精度が低下する。人物の検出精度を向上させる場合、カメラの設置環境に合わせて、膨大な数の学習サンプルを準備しなければならず、コストが増大する。

そこで、転移学習を導入した機械学習の手法が提案されている。転移学習は、学習サンプルの収集環境と異なる環境から得られた検出対象のサンプルを事前に学習し、事前学習により得られた検出対象の特徴を、学習サンプルの学習結果に適用（転移）させる手法である。また、学習サンプルの数を抑制することができるため、識別用特徴データを生成するためのコストを低減することができる。例えば、非特許文献１には、転移学習を導入した機械学習のアルゴリズムとして、転移学習を導入したランダムフォレストが開示されている。

特許文献１には、ニューラルネットワークに転移学習を適用した属性識別器が開示されている。特許文献１に係る属性識別器は、第１のクラスの属性を第２のクラスの属性として利用可能である場合、第１のクラスの属性を第２のクラスに転移させる。

特開２０１２−８４１１７号公報

"Boosted Random Forest and Transfer Learning", [online], [平成27年3月26日検索], インターネット<http://mprg.jp/research/boostedrandomforest_e> Xiaoxiao Shi, Wei Fan, Jiangtao Ren, "Actively Transfer Domain Knowledge", [online], [平成27年3月1日検索],インターネット<URL: www.cs.columbia.edu/~wfan/PAPERS/ecml08transfer.pdf>

しかし、転移学習を用いた場合、負の転移と呼ばれる現象が起こることが知られている。負の転移とは、転移学習のために事前に学習する事前ドメインが、目標ドメインに含まれるデータと大きく異なるデータを含んでいることにより、学習の精度が低下する現象である。目標ドメインは、監視カメラにより撮影された画像から人物を検出する場合には、監視カメラの設置環境に合わせて生成された学習サンプルの集合である。事前ドメインは、監視カメラの設置環境と異なる環境で生成された学習サンプルの集合である。

負の転移の発生を防止するためには、事前ドメインに含まれるサンプルの特徴が、目標ドメインに含まれる学習サンプルの特徴と大きく異なるか否かを判断すればよい。しかし、転移学習に用いられるデータの数は膨大であるため、事前ドメインに含まれるデータを１つずつ人間の手で確認することは困難である。

特許文献１には、転移学習に用いるデータを事前ドメインに含めるか否かを判断する方法が開示されていない。

非特許文献２には、事前ドメインが転移学習に有効であるか否かを判断する方法が開示されている。具体的には、非特許文献２に係る方法は、３つの基準より事前ドメインの信頼性を求めている。１つ目の基準は、事前ドメインのみを用いて学習した識別器（事前識別器）と、事前ドメインと目標ドメインとを用いた転移学習を行う識別器（転移識別器）とにサンプルデータをそれぞれ入力する。サンプルデータに対する事前識別器による識別結果が転移識別器による識別結果と同じである場合、この事前ドメインは、転移学習に有効であると判断される。２つ目の基準は、目標ドメインに含まれるデータの数である。目標ドメインに含まれるデータの数が予め設定された基準値よりも少ない場合、転移学習を実行してもその有効性が低いと判断される。３つ目の基準は、転移識別器から出力される確度である。転移識別器から出力される確度が、予め設定された確度の基準値よりも大きい場合、転移識別器の信頼性が高く、転移学習に有効であると判断される。

しかし、非特許文献２に係る方法では、もともと信頼性が低い場合に専門家に判断を委ねることが前提となっている手法であり、事前ドメインの有効性を判断する精度は高くない。つまり、非特許文献２に係る方法は、転移学習に有効でない事前ドメインを誤って有効であると判断する可能性が高い。このため、事前ドメインの有効性を精度よく判断する技術が望まれている。

従って、本発明の目的は、事前ドメインが転移学習に有効であるかを精度よく判断することができる技術を提供することである。

上記課題を解決するため、請求項１記載の発明は、機械学習装置であって、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、を備える。

請求項２記載の発明は、請求項１に記載の機械学習装置であって、前記判断部は、前記試行転移学習部により生成された決定木を構成する各リーフノードの深さを積算することにより決定木の複雑度を計算し、計算した複雑度に基づいて前記事前ドメインを転移学習に用いるか否かを判断する複雑度計算部、を備える。

請求項３記載の発明は、請求項２に記載の機械学習装置であって、前記試行転移学習部は、第１決定木と前記第１の決定木と異なる第２決定木とを生成し、前記複雑度計算部は、前記第１決定木の複雑度と前記第２決定木の複雑度と計算し、計算した前記第１決定木の複雑度と前記第２決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する。

請求項４記載の発明は、請求項１ないし請求項３のいずれかに記載の機械学習装置であって、さらに、前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、前記試行転移学習部により生成された決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を備え、前記判断部は、前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とに基づいて、前記事前ドメインが有効であるか否かを判断する。

請求項５記載の発明は、請求項４に記載の機械学習装置であって、前記判断部は、学習用データが到達した前記決定木のリーフノードの確率分布と、各学習候補データが到達した前記決定木のリーフノードの確率分布との分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する分布相違度計算部、を備える。

請求項６記載の発明は、請求項５に記載の機械学習装置であって、前記試行転移学習部は、第１決定木と前記第１決定木と異なる第２決定木とを生成し、前記分布相違度計算部は、前記第１決定木を用いて第１分布相違度を計算し、前記第２決定木を用いて第２分布相違度を計算し、判断部は、前記分布相違度計算部により計算された第１分布相違度及び第２分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する。

請求項７記載の発明は、請求項２に記載の機械学習装置であって、さらに、前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、生成した決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、を備え、前記判断部は、前記分類部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とを比較し、比較結果と、前記決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する転移評価部、を備える。

請求項８記載の発明は、機械学習方法であって、各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を備える。

請求項９記載の発明は、転移学習をコンピュータに実行させるプログラムであって、各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、を実行させる。

本発明に係る機械学習装置において、試行転移学習部は、目標ドメイン及び事前ドメインを用いて、転移学習を導入した機械学習を実行する。これにより、検出対象の検出に用いられる決定木が生成される。判断部は、生成された決定木を構成する全てのリーフノードを用いて、事前ドメインが転移学習に有効であるか否かを判断する。事前ドメインにおけるデータの特徴と目標ドメインにおける学習用データの特徴との際に応じて、決定木の構造は、変化する。決定木を構成する全てのリーフノードを用いることにより、事前ドメインの転移学習における有効性を精度よく評価することができる。

本発明の実施の形態に係る機械学習装置の構成を示す機能ブロック図である。図１に示す目標ドメイン及び事前ドメインの各々に含まれる画像の一例を示す図である。図１に示す機械学習装置の動作を示すフローチャートである。図１に示す競合値算出部により算出される競合値の変化の一例を示す図である。図１に示す信頼度算出部により算出される信頼度の変化の一例を示す図である。図１に示す試行転移識別部を構成する決定木の一例を示す模式図である。図１に示す試行転移識別部による目標ドメインの識別結果に基づいて作成されるヒストグラムの一例を示す図である。図１に示す試行転移識別部による事前ドメインの識別結果に基づいて作成されるヒストグラムの一例を示す図である。図１に示す分布相違度算出部により算出される分布相違度の変化の一例を示す図である。図１に示す複雑度算出部により算出される複雑度の変化の一例を示す図である。

以下、図面を参照しつつ、本発明の実施の形態を詳しく説明する。

［１．機械学習装置の構成］
図１は、本発明の実施の形態に係る機械学習装置１００の構成を示す機能ブロック図である。図１に示す機械学習装置１００は、転移学習を導入した機械学習を実行して、識別用特徴データ５０を生成する。機械学習装置１００は、転移学習を導入した機械学習を実行する際に、目標ドメイン２１と、事前ドメイン２２〜２４のうち転移学習に有効と判断された事前ドメインとを用いる。識別用特徴データ５０は、人物検出装置（図示省略）がカメラにより生成された撮影画像から人物を検出するために用いられる。

本実施の形態では、機械学習装置１００が、俯角０°で撮影された画像から人物を検出するための識別用特徴データ５０を生成する場合を例にして説明する。

機械学習装置１００は、識別用特徴データ５０の生成前に、事前ドメイン２２〜２４の各々が転移学習に有効であるか否かを評価するための機械学習（試行学習）を実行する。試行学習は、転移学習を導入した機械学習であり、識別用特徴データ５０を生成するための機械学習と一部の点で異なる。試行学習では、転移学習を導入した機械学習に用いられる事前ドメインが、事前ドメイン２２〜２４から１つずつ選択される。

機械学習装置１００は、試行学習の結果に基づいて、事前ドメイン２２〜２４の各々に対する転移学習の有効性を評価する。機械学習装置１００は、目標ドメイン２１と、転移学習に有効と判断された事前ドメインとを用いて、転移学習を導入した機械学習を実行して、識別用特徴データ５０を生成する。

目標ドメイン２１は、所定の条件下における検出対象（人物）の特徴を有する複数の画像のグループである。事前ドメイン２２〜２４は、上記の所定の条件と異なる条件下における検出対象の特徴を有する複数の画像のグループである。事前ドメイン２２〜２４は、複数の画像を所定の規則で分類することにより生成される。目標ドメイン２１及び事前ドメイン２２〜２４の詳細については、後述する。

図１に示すように、機械学習装置１００は、取得部１１と、試行転移学習部１２と、比較学習部１３と、判断部１４と、選択転移学習部１５とを備える。

取得部１１は、記憶装置２に記憶された目標ドメイン２１と、事前ドメイン２２〜２４とを取得する。取得部１１は、事前ドメイン２２〜２４を一括して取得するのではなく、事前ドメイン２２〜２４のうち、試行転移学習部１２及び比較学習部１３において機械学習の対象となる１つの事前ドメインを取得する。

試行転移学習部１２は、取得部１１により取得された目標ドメイン２１と、取得部１１により取得された１つの事前ドメイン（注目事前ドメイン）とを入力する。試行転移学習部１２は、入力された目標ドメイン２１及び注目事前ドメインを利用して、転移学習の有効性を評価するための機械学習（試行学習）を実行し、その結果、試行転移識別部３２を生成する。試行転移識別部３２は、事前ドメインごとに生成される。試行転移学習部１２は、学習アルゴリズムとして、転移学習を導入したランダムフォレストを用いる。具体的には、試行転移学習部１２により用いられるアルゴリズムは、トランスファーフォレスト（Transfer Forest）と呼ばれており、転移学習の際に、共変量を用いて事前ドメインに含まれるデータを重み付けする。従って、試行転移識別部３２の実体は、複数の決定木により構成されるデータ群である。

比較学習部１３は、注目事前ドメインのみを利用して、比較用の機械学習（比較学習）を実行し、その結果、比較識別部３３を生成する。比較識別部３３は、事前ドメインごとに生成される。比較学習部１３は、学習アルゴリズムとして、転移学習を導入しないランダムフォレストを用いる。従って、比較識別部３３の実体は、試行転移識別部３２を構成する複数の決定木と異なる複数の決定木により構成されるデータ群である。

判断部１４は、試行転移識別部３２と比較識別部３３とを用いて、注目事前ドメインが転移学習に有効であるか否かを判断する。判断部１４は、競合値計算部１４１と、信頼度計算部１４２と、分布相違度計算部１４３と、複雑度計算部１４４と、転移評価部１４５とを備える。

競合値計算部１４１は、比較識別部３３によるサンプルデータの識別結果を試行転移識別部３２によるサンプルデータの識別結果と比較する。サンプルデータは、目標ドメイン２１に含まれる画像及び注目事前ドメインに含まれる画像である。競合値計算部１４１は、比較結果に基づいて、競合値１４１Ａを計算する。競合値１４１Ａは、比較識別部３３による識別結果と、試行転移識別部３２による識別結果とが一致しない度合いを示す。

信頼度計算部１４２は、試行転移識別部３２により生成されるサンプルデータの識別結果を用いて、信頼度１４２Ａを計算する。信頼度１４２Ａは、試行転移識別部３２による識別結果の信頼性を示す。

分布相違度計算部１４３は、試行転移識別部３２による目標ドメイン２１に含まれる画像の分類結果と、試行転移識別部３２による注目事前ドメインに含まれる画像の分類結果とに基づいて、分布相違度１４３Ａを計算する。画像の分類は、試行転移識別部３２を構成する決定木により行われる。分布相違度１４３Ａは、注目事前ドメインに含まれる画像の分類結果が目標ドメイン２１に含まれる画像の分類結果とどの程度異なるかを示す。

複雑度計算部１４４は、試行転移識別部３２を構成する決定木の構造に基づいて、複雑度１４４Ａを計算する。複雑度１４４Ａは、試行転移識別部３２を構成する決定木の複雑さを示す。

転移評価部１４５は、競合値１４１Ａと、信頼度１４２Ａと、分布相違度１４３Ａと、複雑度１４４Ａとに基づいて、注目事前ドメインが転移学習に有効であるか否かを評価する。転移評価部１４５は、注目事前ドメインの評価結果を選択転移学習部１５に通知する。

選択転移学習部１５は、転移評価部１４５から通知される事前ドメイン２２〜２４の各々の評価結果に基づいて、転移学習に用いる事前ドメインを特定する。選択転移学習部１５は、取得部１１を介して、目標ドメイン２１と転移学習に用いる事前ドメインとを取得する。選択転移学習部１５は、取得した目標ドメイン２１と事前ドメインとを用いて、転移学習を導入した機械学習を実行して、識別用特徴データ５０を生成する。選択転移学習部１５は、試行転移学習部１２が用いる学習アルゴリズム（転移学習を導入したランダムフォレスト）を用いる。

［２．目標ドメイン及び事前ドメイン］
以下、目標ドメイン２１と事前ドメイン２２〜２４について説明する。また、機械学習装置１００が識別用特徴データ５０を生成する前に、事前ドメイン２２〜２４が転移学習に有効であるか否かを判断する理由を説明する。

図２は、図１に示す記憶装置２に記憶される目標ドメイン２１又は事前ドメイン２２〜２４に属する画像の一例を示す図である。

識別用特徴データ５０を利用する人物検出装置（図示省略）は、上述のように、俯角０°で撮影された画像から人物を検出することを想定している。この場合、目標ドメイン２１は、図２に示すように、俯角０°で人物を撮影した画像２１Ａ〜２１Ｃを含む。実際には、目標ドメイン２１は、画像２１Ａ〜２１Ｃだけでなく、俯角０°で人物を撮影した他の複数の画像を含む。

つまり、目標ドメイン２１は、所定の条件下における検出対象の特徴を有する複数の学習用データを含む。本実施の形態では、検出対象は人物である。所定の条件は、検出対象（人物）が俯角０°で撮影された画像に含まれていることである。目標ドメイン２１は、事前ドメイン２２〜２４の各々に対する判断結果に関係なく、識別用特徴データ５０の生成に用いられる。

事前ドメイン２２〜２４は、それぞれ、０°よりも大きい俯角で人物を撮影した複数の画像を含む。図２に示すように、事前ドメイン２２は、俯角２０°で人物を撮影した画像２２Ａ〜２２Ｃを含む。事前ドメイン２３は、俯角３０°で人物を撮影した画像２３Ａ〜２３Ｃを含む。事前ドメイン２４は、俯角５０°で人物を撮影した画像２４Ａ〜２４Ｃを含む。実際には、事前ドメイン２２〜２４の各々は、図２に示す画像だけでなく、それぞれの俯角で撮影した他の画像を含むが、図２では、他の画像の表示を省略している。

事前ドメイン２２〜２４は、０°よりも大きい俯角で人物を撮影した複数の画像を、撮影時の俯角に応じて分類することにより生成される。すなわち、事前ドメイン２２〜２４は、所定の条件と異なる条件下における検出対象の特徴を有するデータの集合である。

事前ドメイン２２〜２４に対する転移学習の有効性の評価は、以下の理由によって行われる。事前ドメイン２２〜２４に含まれる画像が、目標ドメイン２１に含まれる画像２１Ａ〜２１Ｃの特徴と同様の特徴を有する場合がある。転移学習は、事前ドメインに含まれる画像のうち、目標ドメイン２１に含まれる画像と同様の特徴を有する画像を特定し、特定した画像が有する特徴を目標ドメイン２１に含まれる画像の学習に適用する。

しかし、ある事前ドメインが、目標ドメイン２１に含まれる画像の特徴と大きく異なる特徴を有する画像の集合である場合、負の転移が発生する。この理由は、この事前ドメインに含まれる画像の特徴が、転移学習により識別用特徴データ５０に反映されるためである。機械学習装置１００は、負の転移を引き起こす可能性の高い事前ドメインを、識別用特徴データ５０の生成から除外するために、事前ドメイン２２〜２４が転移学習に有効であるか否かを評価する。

［３．機械学習装置１００の動作］
図３は、機械学習装置１００の動作を示すフローチャートである。機械学習装置１００が図３に示す処理を開始する際に、試行転移識別部３２が試行転移学習部１２内に生成されておらず、比較識別部３３が比較学習部１３内に生成されていない。

｛３．１．ドメインの取得｝
最初に、機械学習装置１００において、取得部１１は、記憶装置２から目標ドメイン２１を取得する（ステップＳ１１）。取得部１１は、記憶装置２に記憶されている事前ドメイン２２〜２４のうち、転移学習の有効性が評価されていない事前ドメインを取得する（ステップＳ１２）。具体的には、取得部１１は、事前ドメイン２２〜２４のうち、最初に事前ドメイン２２を取得する。

｛３．２．比較学習及び試行学習｝
比較学習部１３は、取得部１１により取得された事前ドメイン２２を入力する。比較学習部１３は、入力した事前ドメイン２２を学習する（ステップＳ１３）。比較学習部１３の学習アルゴリズムは、転移学習が導入されていないランダムフォレストである。比較学習部１３は、ステップＳ１３を実行することにより、事前ドメイン２２の学習結果を反映した比較識別部３３を生成する。比較識別部３３は、複数の決定木により構成される。

試行転移学習部１２は、取得部１１により取得された目標ドメイン２１及び事前ドメイン２２を入力する。試行転移学習部１２は、入力した目標ドメイン２１及び事前ドメイン２２を用いて、転移学習を導入した機械学習を行う（ステップＳ１４）。試行転移学習部１２の学習アルゴリズムは、転移学習を導入したランダムフォレストである。試行転移学習部１２は、ステップＳ１４を実行することにより、目標ドメイン２１及び事前ドメイン２２の学習結果を反映した試行転移識別部３２を生成する。試行転移識別部３２は、複数の決定木により構成される。試行転移学習部１２において用いられる学習アルゴリズム及びドメインが比較学習部１３のものと異なるため、試行転移識別部３２の構成は、比較識別部３３の構成と異なる。

なお、ステップＳ１３及びステップＳ１４において、目標ドメイン２１に含まれる画像２１Ａ〜２１Ｃと、事前ドメイン２２に含まれる画像２２Ａ〜２２Ｃとをそのまま学習する例を説明した。しかし、実際には、これらの画像から所定の特徴量を抽出した特徴抽出画像が学習に用いられる。抽出される特徴量は、たとえば、画像内の単位領域内におけるエッジの方向をヒストグラム化したＨＯＧ（Histograms of Oriented Gradients）特徴量や、画像内の複数の領域における明暗差を示すＨａａｒ−ｌｉｋｅ特徴量などを用いることができる。

｛３．３．転移学習の評価（ステップＳ１５）｝
判断部１４は、試行転移学習部１２により生成された試行転移識別部３２と比較学習部１３により生成された比較識別部３３とを用いて、事前ドメイン２２が転移学習に有効であるか否かを判断する（ステップＳ１５）。

判断部１４は、転移学習の有効性を判断するために、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ、複雑度１４４Ａの４種類のパラメータを計算する。

判断部１４は、信頼度１４２Ａ、分布相違度１４３Ａ、及び複雑度１４４Ａを計算する場合、サンプルグループに含まれる各画像の試行転移識別部３２による識別結果を利用する。ここで、サンプルグループとは、目標ドメイン２１と、転移学習の有効性の評価対象である事前ドメイン２２とを合わせた集合に含まれる画像である。判断部１４は、競合値１４１Ａを計算する場合、試行転移識別部３２による識別結果に加えて、サンプルグループに含まれる各画像の比較識別部３３による識別結果を利用する。

以下、それぞれのパラメータの詳細及び計算方法についてそれぞれ説明する。

｛３．３．１．競合値１４１Ａの計算｝
競合値計算部１４１は、試行転移識別部３２により生成される各画像のラベルと、比較識別部３３により生成される各画像のラベルとの比較結果に基づいて、競合値１４１Ａを計算する。

試行転移識別部３２は、サンプルグループに含まれる画像のうち、いずれか１つ（サンプル画像）を入力する。試行転移識別部３２は、サンプル画像に対して人物の識別処理を行い、サンプル画像の識別結果を示すラベル３２Ａを生成する。ラベル３２Ａの値は、例えば、０又は１である。ラベル３２Ａが０である場合、ラベル３２Ａは、サンプル画像が人物を含まないことを示す。ラベル３２Ａが１である場合、ラベル３２Ａは、サンプル画像が人物を含むことを示す。試行転移識別部３２は、生成したラベル３２Ａを競合値計算部１４１に出力する。

なお、試行転移識別部３２は、サンプル画像の識別結果として、ラベル３２Ａだけでなく、ラベル３２Ａの確からしさを示す確度３２Ｂを計算する。確度３２Ｂは、後述する信頼度１４２Ａの計算に用いられる。

比較識別部３３は、試行転移識別部３２に入力されたサンプル画像と同じ画像を入力する。比較識別部３３は、サンプル画像に対して人物の識別処理を行い、サンプル画像の識別結果を示すラベル３３Ａを生成する。ラベル３３Ａの値は、ラベル３２Ａと同様に、０又は１である。ラベル３３Ａが０である場合、ラベル３３Ａは、サンプル画像が人物を含まないことを示す。ラベル３３Ａが１である場合、ラベル３３Ａは、サンプル画像が人物を含むことを示す。比較識別部３３は、生成したラベル３３Ａを競合値計算部１４１に出力する。

競合値計算部１４１は、サンプル画像から生成されるラベル３２Ａ及び３３Ａを用いて、競合値１４１Ａを計算する。競合値１４１Ａは、下記式（１）により計算される。

式（１）において、Ｅ_ｃ１は、競合値１４１Ａを示す。Ｘは、サンプルグループを示す。ｘは、サンプルグループを構成する要素（サンプル画像）を示す。Ｍ（ｘ）は、要素ｘから生成されたラベル３３Ａを示す。Ｔ（ｘ）は、要素ｘから生成されたラベル３２Ａを示す。［Ｍ（ｘ）≠Ｔ（ｘ）］は、ラベル３３Ａとラベル３２Ａとが一致しなかったサンプル画像の数を示す。｜Ｘ｜は、サンプルグループＸを構成する要素の数である。

式（１）により計算される競合値１４１Ａは、同一のサンプル画像から生成されるラベル３２Ａ及びラベル３３Ａが一致する確率を示す。競合値１４１Ａは、０以上１以下の数値である。競合値１４１Ａが０に近づくほど、競合値１４１Ａは、転移学習における事前ドメイン２２の有効性が高いことを示す。一方、競合値１４１Ａが１に近づくほど。転移学習における事前ドメイン２２の有効性が低いことを示す。

俯角が大きくなるにつれて、事前ドメインに含まれる画像の特徴と目標ドメインに含まれる画像の特徴との相違点の数が増加する。従って、俯角が大きくなるにつれて、事前ドメインの競合値１４１Ａは、増加すると想定される。

図４は、競合値１４１Ａの変化の一例を示すグラフである。図４に示すグラフは、以下のようにして作成される。

俯角５°から俯角８０°まで５°おきに俯角を設定し、設定された俯角に基づいて画像を分類することにより、複数の事前ドメインを作成した。目標ドメイン２１は、上記と同様に、俯角０°で人物を撮影した画像の集合である。各俯角に対応する試行転移識別部３２及び比較識別部３３を生成して、各俯角に対応する競合値１４１Ａを上記の手順で計算した。

図４に示すように、競合値１４１Ａは、俯角の増加に合わせて増加する傾向がある。従って、転移学習における事前ドメインの有効性を判断するパラメータとして競合値１４１Ａを利用できることがわかる。しかし、競合値１４１Ａは、上下に振動しながら増加している。このことは、競合値１４１Ａの誤差が比較的大きいことを示している。

従って、競合値１４１Ａのみを用いて、転移学習に対する事前ドメインの有効性を判断した場合、負の転移を引き起こす事前ドメインを誤って有効であると判断するおそれがある。このため、競合値１４１Ａを用いて事前ドメインの有効性を判断する場合、他のパラメータ（信頼度１４２Ａ等）を合わせて用いることが望ましい。

｛３．３．２．信頼度の計算｝
信頼度計算部１４２は、試行転移識別部３２により生成される各画像のラベル３２Ａ及び確度３２Ｂに基づいて、信頼度１４２Ａを計算する。信頼度１４２Ａの計算に当たり、比較識別部３３によるサンプル画像の識別結果は使用されない。

試行転移識別部３２は、上述のように、サンプル画像に対する人物の識別結果を示すラベル３２Ａと、ラベル３２Ａの確からしさを示す確度３２Ｂを生成する。確度３２Ｂは、０以上１以下の値であり、確度３２Ｂが１に近づくほど、ラベル３２Ａが誤りである可能性が小さくなる。

信頼度計算部１４２は、試行転移識別部３２から各サンプル画像のラベル３２Ａ及び確度３２Ｂを入力する。信頼度計算部１４２は、入力した各サンプル画像のラベル３２Ａ及び確度３２Ｂを用いて、下記式（２）を計算することにより信頼度１４２Ａを計算する。

上記式（２）において、Ｅ_ｃ２は、信頼度１４２Ａを示す。ｘは、上記式（１）と同様に、サンプルグループＸを構成する要素（サンプル画像）を示す。｜Ｘ｜は、サンプルグループＸの要素数である。Ｐ_Ｔ（ｘ）は、要素ｘの確度３２Ｂを示す。Ｔ（ｘ）は、要素ｘのラベル３２Ａを示す。ｙは、人物の存在を示すラベル（ｙ＝１）である。つまり、信頼度１４２Ａは、ラベル３２Ａがラベルｙと一致する場合に算出された確度３２Ｂの合計値を、サンプルグループＸの要素数で除算した値である。信頼度１４２Ａは、０以上１以下の値であり、１に近いほど、転移学習における事前ドメイン２２の有効性が高いことを示す。

図５は、信頼度１４２Ａの変化の一例を示すグラフである。図４と同様に、俯角が５°おきに設定された複数の事前ドメインの各々から試行転移識別部３２を生成して、各事前ドメインに対応する信頼度１４２Ａを計算することにより、図５に示すグラフを作成した。

信頼度１４２Ａは、図５に示すように、全体的な傾向として、俯角の増加に合わせて減少していく。つまり、事前ドメインの有効性が高くなるにつれて、信頼度１４２Ａは１に近づく。以下、その理由を説明する。事前ドメイン２２に含まれるデータが、目標ドメイン２１に含まれるデータの特徴量と類似する特徴量を有している場合、試行転移学習部１２は、試行転移学習により、事前ドメイン２２の学習結果を目標ドメイン２１の学習結果に転移させる。試行転移識別部３２には、目標ドメイン２１及び事前ドメイン２２の両者の学習結果が反映されている。試行転移識別部３２がサンプルグループに含まれる各画像に対して識別処理を行った場合、ラベル３２Ａは１となり、その確度３２Ｂも１に近づくと考えられる。従って、事前ドメイン２２に含まれるデータと目標ドメイン２１に含まれるデータとが類似している場合（事前ドメイン２２が転移学習において有効である場合）、信頼度１４２Ａは、１に近づく。

図５に示すように、信頼度１４２Ａは、上下に振動しながら増加する。これは、競合値１４１Ａと同様に、信頼度１４２Ａの誤差が比較的大きいことを示している。このため、信頼度１４２Ａのみを用いて、転移学習に対する事前ドメインの有効性を判断した場合、負の転移を引き起こす事前ドメインを誤って有効であると判断するおそれがある。このため、信頼度１４２Ａを用いて事前ドメインの有効性を判断する場合、他のパラメータ（分布相違度１４３Ａ等）を合わせて用いることが望ましい。

｛３．３．３．分布相違度｝
分布相違度計算部１４３は、試行転移識別部３２によるサンプル画像の識別結果のみを利用して、分布相違度１４３Ａを計算する。分布相違度計算部１４３は、試行転移識別部３２を構成する各決定木のリーフノードに到達した目標ドメイン２１の画像の分布と事前ドメイン２２の画像の分布との差に基づいて、分布相違度１４３Ａを計算する。

試行転移識別部３２は、学習アルゴリズムとして転移学習を導入したランダムフォレストを用いるため、複数の決定木により構成される。しかし、分布相違度１４３Ａの計算の説明を簡略化するために、試行転移識別部３２を構成する決定木が１つである場合を最初に説明する。

図６は、試行転移識別部３２を構成する決定木４０の一例を示す模式図である。図７は、目標ドメイン２１の画像の識別結果に基づいて作成されるヒストグラム５１の一例を示す図である。図８は、事前ドメイン２２の画像の識別結果に基づいて作成されるヒストグラム５２の一例を示す図である。ヒストグラム５１及び５２は、試行転移識別部３２による識別結果に基づいて作成される。

ヒストグラム５１は、以下のようにして作成される。試行転移識別部３２は、目標ドメイン２１に含まれる各画像を決定木４０のルートノード４０Ｒに入力する。入力された画像は、分岐ノードを経由して、リーフノード４０Ａ〜４０Ｇのいずれかに到達する。

例えば、試行転移識別部３２は、画像２１Ａ（図２参照）の特徴量をルートノード４０Ｒで用いられるしきい値と比較し、比較結果に基づいて、画像２１Ａの遷移先を分岐ノード４１Ａ及び４１Ｂのいずれかに決定する。画像２１Ａが分岐ノード４１Ａに遷移した場合、試行転移識別部３２は、画像２１Ａ（図２参照）の特徴量を分岐ノード４１Ａで用いられるしきい値と比較し、遷移先のノードをリーフノード４０Ａ又は分岐ノード４１Ｃに決定する。画像２１Ａがリーフノード４０Ａに遷移することにより、画像２１Ａの到達先が、リーフノード４０Ａに決定される。分岐ノード４１Ａで用いられる画像２１Ａの特徴量は、ルートノード４０Ｒで用いられる画像２１Ａの特徴量と同じであっても異なっていてもよい。同じである場合、分岐ノード４１Ａで用いられるしきい値は、ルートノード４０Ｒで用いられるしきい値と異なる。

試行転移識別部３２は、目標ドメイン２１に含まれる各画像が到達したリーフノードを特定する到達先データ３２Ｃを分布相違度計算部１４３に出力する。分布相違度計算部１４３は、到達先データ３２Ｃを参照して、リーフノード４０Ａ〜４０Ｇの各々に到達した画像の数をカウントする。この結果、リーフノードに到達した目標ドメイン２１の画像の分布を示すヒストグラム５１が作成される。

試行転移識別部３２は、事前ドメイン２２に含まれる画像の各々が到達したリーフノードを特定する到達先データ３２Ｄを生成する。分布相違度計算部１４３は、到達先データ３２Ｄに基づいて、リーフノードに到達した事前ドメイン２２の画像の分布を示すヒストグラム５２を作成する。

分布相違度１４３Ａは、下記式（３）を用いて計算される。具体的には、分布相違度１４３Ａは、ヒストグラム５１及び５２を正規化した後、それらのBhattacharyya距離を算出することによりにより得られる。Bhattacharyya距離は、２つの確率分布の類似性を示す。

式（３）において、Ｅ_ｃ３は、分布相違度１４３Ａを示す。ｉは、図６に示す各リーフノードの番号である。ｐ（ｉ）は、リーフノードに到達した目標ドメイン２１の画像の確率分布である。ｑ（ｉ）は、リーフノードに到達した事前ドメイン２２の画像の確率分布である。確率分布ｐ（ｉ）は、ヒストグラム５１から作成され、確率分布ｑ（ｉ）は、ヒストグラム５２から作成される。Ｘは、サンプルグループを構成する要素（画像）の数である。

分布相違度１４３Ａは、０以上１以下の数値であり、ヒストグラム５１における画像の分布と、ヒストグラム５２における画像の分布との類似性が低いほど１に近づく。つまり、分布相違度１４３Ａが１に近づくほど、事前ドメイン２２が転移学習に有効でないことを示す。

図９は、分布相違度１４３Ａの変化の一例を示すグラフである。図４と同様に、俯角が５°おきに設定された複数の事前ドメインの各々に対応する試行転移識別部３２を作成して、各事前ドメインに対応する分布相違度１４３Ａを計算した。

図９に示すように、分布相違度１４３Ａは、俯角の増加に合わせて増加する。これは、以下の理由による。俯角が増加するにつれて、目標ドメイン２１に含まれる画像の特徴と事前ドメイン２２に含まれる画像の特徴との差が大きくなる。この場合、事前ドメイン２２に含まれる画像が決定木４０内を遷移するルートが、目標ドメイン２１に含まれる画像が決定木４０内を遷移するルートから大きく外れる頻度が増加する。目標ドメイン２１に含まれる画像の分布と、事前ドメイン２２に含まれる画像の分布との差が大きくなり、俯角の増加に合わせて分布相違度１４３Ａが増加する。

例えば、図７に示すヒストグラム５１では、ピークがノード番号３のノード４０Ｄに表れている。一方、図８に示すヒストグラム５２では、ピークがノード番号６のノード４０Ｇに表れている。つまり、ヒストグラム５１及び５２は、ヒストグラムの形状が互いに大きく異なる。この場合、分布相違度１４３Ａは、１に近い値となるため、転移学習における事前ドメイン２２の有効性は低いと考えられる。

また、図９に示すように、競合値１４１Ａ及び信頼度１４２Ａに比べて、分布相違度１４３Ａは、上下に振動しない。これは、分布相違度１４３Ａの誤差が小さく、転移学習における事前ドメインの有効性を精度よく判断できることを示している。

次に、試行転移識別部３２が複数の決定木により構成される場合における、分布相違度１４３Ａの計算について説明する。分布相違度計算部１４３は、式（３）を用いて、決定木ごとの分布相違度１４３Ａを計算する。そして、分布相違度計算部１４３は、各決定木の分布相違度１４３Ａの平均を、事前ドメイン２２の分布相違度１４３Ａとして算出する。

｛３．３．４．木の複雑度｝
複雑度計算部１４４は、試行転移識別部３２を構成する決定木の構造に基づいて複雑度１４４Ａを計算する。複雑度１４４Ａは、試行転移識別部３２を構成する決定木のリーフノードの深さに基づいて計算される。

複雑度１４４Ａの計算方法について、分布相違度１４３Ａの説明と同様に、試行転移識別部３２を構成する決定木が１つである場合を最初に説明する。複雑度計算部１４４は、決定木を構成する各リーフノードの深さを記録したリーフノードデータ３２Ｅを試行転移識別部３２から取得する。複雑度計算部１４４は、下記式（４）を用いて、複雑度１４４Ａを計算する。

上記式（４）において、Ｅ_ｃ４は、複雑度１４４Ａを示す。ｄ_ｋは、決定木におけるｋ番目のリーフノードの深さを示す。ｎは、決定木におけるリーフノードの数である。ｄ_ｍａｘは、決定木におけるリーフノードの最大深さを示し、式（４）の分子（リーフノードの深さの合計値）を正規化するために用いられる。リーフノードの深さは、リーフノードからルートノード４０Ｒに到達するまでに通過するエッジ（枝）の数によって定義される。例えば、図４に示す決定木において、リーフノード４０Ａの深さは、２である。

一般的に、リーフノードの数又はリーフノードの深さが増加するにつれて、決定木の構造は複雑となる。目標ドメイン２１の各画像の特徴と事前ドメイン２２の各画像の特徴との差が大きくなるにつれて、決定木は複雑な構造を有する。以下、その理由について説明する。

目標ドメイン２１の各画像の特徴と事前ドメイン２２の各画像の特徴との差が大きい場合、試行転移学習部１２は、決定木を作成する際に、目標ドメイン２１の各画像の特徴に応じた分岐条件と、事前ドメイン２２の各画像の特徴に応じた分岐条件とを別々に作成する。この結果、目標ドメインの各画像に対応する部分木と、事前ドメイン２２の各画像の特徴を識別するための部分木とが、別々に作成される。この結果、決定木を構成するリーフノードの数が増加し、決定木の構造は複雑となる。従って、式（４）により計算される複雑度１４４Ａを用いることにより、転移学習における事前ドメイン２２の有効性を判断することができる。

図１０は、複雑度１４４Ａの変化の一例を示すグラフである。図４と同様に、俯角が５°おきに設定された複数の事前ドメインを作成し、各事前ドメインに対応する複雑度１４４Ａを計算することにより、図１０に示すグラフを作成した。

図１０に示すように、複雑度１４４Ａは、俯角の増加に合わせて増加する。これは、上述のように、事前ドメインに含まれる画像の特徴と、目標ドメインに含まれる画像の特徴との差が大きくなるにつれて、決定木の構造が複雑となるためである。なお、分布相違度１４３Ａと同様に、複雑度１４４Ａは、上下に振動しない。従って、複雑度１４４Ａを用いることにより、転移学習における事前ドメイン２２の有効性を精度よく判断することができる。

複数の決定木が試行転移識別部３２を構成する場合の複雑度１４４Ａの計算方法について説明する。決定木ごとの複雑度１４４Ａが、式（４）により計算される。決定木ごとに計算された複雑度１４４Ａを平均することにより、複数の決定木が試行転移識別部３２を構成する場合における複雑度１４４Ａが得られる。

｛３．３．５．転移評価部１４５による事前ドメインの評価｝
転移評価部１４５は、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ、及び複雑度１４４Ａを入力する。転移評価部１４５は、入力した競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ、及び複雑度１４４Ａに基づいて、転移学習における事前ドメイン２２の有効性を評価する。

転移評価部１４５は、下記の式（５）を用いて、総合評価値を計算する。

式（５）において、Ｅは、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ、及び複雑度１４４Ａから得られる総合評価値である。事前ドメインの転移学習における有効性が低下するにつれて、競合値１４１Ａ、分布相違度１４３Ａ、及び複雑度１４４Ａは増加する。一方、信頼度１４２Ａは、逆に低下する。信頼度１４２Ａの傾向を他の３つの評価値の傾向に合わせるために、１から信頼度１４２Ａを減算した値を、総合評価値の計算に使用している。

上記式（５）により計算された総合評価値は、０以上の値であり、転移学習の有効性が高くなるにつれて０に近づく。転移評価部１４５は、計算された総合評価値が予め設定されたしきい値よりも小さい場合、事前ドメイン２２が転移学習において有効であると判断する。転移評価部１４５は、転移学習の有効性の判断対象であった事前ドメイン２２の評価結果を示す評価結果データ１４５Ａを選択転移学習部１５に出力する。

｛３．４．次の事前ドメインの指定｝
事前ドメイン２２の有効性の評価（ステップＳ１５）が終了した後に、事前ドメイン２２の有効性の評価に用いられた試行転移識別部３２及び比較識別部３３が削除される（ステップＳ１６）。事前ドメイン２２に対応する試行転移識別部３２及び比較識別部３３は、転移学習における他の事前ドメインの有効性の評価で使用されないためである。

取得部１１は、記憶装置２に記憶されている全ての事前ドメインの評価が終了したか否かを判断する（ステップＳ１７）。全ての事前ドメインの評価が終了していない場合（ステップＳ１７においてＮｏ）、機械学習装置１００は、転移学習の有効性が評価されていない事前ドメインを取得するために、ステップＳ１２に戻る。

これにより、転移学習における事前ドメイン２３及び２４の有効性が評価される。転移評価部１４５は、事前ドメイン２３及び２４の各々の評価結果を示す評価結果データ１４５Ａを、選択転移学習部１５に出力する。

｛３．５．識別用特徴データ５０の生成｝
全ての事前ドメインの評価が終了した場合（ステップＳ１７においてＹｅｓ）、選択転移学習部１５は、事前ドメイン２２〜２４の各々の評価結果データ１４５Ａに基づいて、転移学習に有効であると判断された事前ドメインを特定する。転移学習に有効と判断される事前ドメインの数は、特に限定されない。

選択転移学習部１５は、目標ドメイン２１及び特定した事前ドメインを、取得部１１を介して記憶装置２から取得する。選択転移学習部１５は、取得した目標ドメイン２１及び事前ドメインを用いて、転移学習を導入したランダムフォレストに基づく機械学習を実行する（ステップＳ１８）。この結果、識別用特徴データ５０が生成される。生成された識別用特徴データ５０は、人物検出装置（図示省略）により利用される。

以上説明したように、機械学習装置１００は、事前ドメイン２２〜２４の各々の転移学習における有効性を評価し、目標ドメイン２１と転移学習に有効と判断された事前ドメインとを用いて転移学習を導入した機械学習を実行する。事前ドメインが、目標ドメインに含まれる画像の特徴と大きく異なる特徴を有する画像により構成される場合、この事前ドメインが識別用特徴データ５０の生成に用いられることが防止される。この結果、負の転移が発生することを防止することができ、検出対象の検出精度を高めることができる。

なお、上記実施の形態において、試行転移学習部１２及び選択転移学習部１５が、学習アルゴリズムとしてランダムフォレストを用いる場合を例に説明したが、これに限られない。学習アルゴリズムは、決定木を生成するアルゴリズムであれば、特に限定されない。例えば、学習アルゴリズムとして、ＩＤ３（Iterative Dichotomiser 3）や、ブースティングを用いることが可能である。いずれの学習アルゴズムを用いる場合であっても、試行転移学習部１２は、転移学習を導入した機械学習を実行し、比較学習部１３は、転移学習を導入しない機械学習を実行すればよい。

上記実施の形態において、事前ドメイン２２〜２４が、０°よりも大きい俯角で人物を撮影された画像を含む例を説明したが、これに限られない。機械学習装置１００は、０°よりも大きい仰角で人物を撮影した画像を含む事前ドメインを用いてもよい。あるいは、目標ドメイン２１に含まれる画像の明るさと異なる明るさを有する画像を含む事前ドメインを用いてもよい。また、目標ドメイン２１が人物を撮影した画像である場合を例にして説明したが、検出対象に応じて目標ドメイン２１に含まれるデータが設定されることは言うまでもない。

上記実施の形態において、転移評価部１４５が、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ及び複雑度１４４Ａを用いて、転移学習における事前ドメインの有効性を評価する例を説明したが、これに限られない。転移評価部１４５は、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ及び複雑度１４４Ａの少なくとも１つを用いて、事前ドメインの有効性を評価すればよい。

なお、分布相違度１４３Ａ及び複雑度１４４Ａは、競合値１４１Ａ及び信頼度１４２Ａに比べて、誤差が小さい。このため、転移評価部１４５は、少なくとも、分布相違度１４３Ａ及び複雑度１４４Ａをいずれかを用いることが望ましい。転移評価部１４５が、事前ドメインの評価に競合値１４１Ａ及び信頼度１４２Ａを用いない場合、機械学習装置１００は、比較学習部１３を備えなくてもよい。

上記実施の形態において、分布相違度計算部１４３は、試行転移識別部３２が複数の決定木により構成される場合、各決定木から計算される分布相違度を合計することにより分布相違度１４３Ａを計算する例を説明したが、これに限られない。分布相違度計算部１４３は、試行転移識別部３２を構成する決定木のうち、少なくとも一本の決定木を用いて分布相違度１４３Ａを計算すればよい。複雑度計算部１４４も、同様に、試行転移識別部３２を構成する決定木のうち、少なくとも一本の決定木を用いて複雑度１４４Ａを計算すればよい。すなわち、判断部１４は、試行転移識別部３２を構成する複数の決定木のうち、少なくとも１つの決定木を構成する全てのリーフノードを用いて、転移学習における事前ドメインの有効性を評価すればよい。

上記実施の形態において、転移評価部１４５は、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ及び複雑度１４４Ａを乗算することにより、総合評価値を計算する例を説明したが、これに限られない。たとえば、転移評価部１４５は、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ及び複雑度１４４Ａの合計を総合評価値として計算してもよい。また、精度の高い分布相違度１４３Ａ及び複雑度１４４Ａの重みを大きくした上で、総合評価値を計算してもよい。つまり、転移評価部１４５は、競合値１４１Ａ、信頼度１４２Ａ、分布相違度１４３Ａ及び複雑度１４４Ａを用いて、総合評価値を計算すればよい。

上記実施の形態において、機械学習装置１００が、人物を検出するための識別用特徴データ５０を生成する例を例にしたが、これに限られない。学習の対象は、センサにより計測された測定データであってもよい。センサの種類は、特に限定されず、加速度センサ、光センサなどの様々な測定データを使用することができる。例えば、自動車の自動運転を行うために、これらのセンサの測定データを用いるために機械学習を実行してもよい。

上記実施の形態の機械学習装置１００の一部または全部は、集積回路（例えば、ＬＳＩ、システムＬＳＩ等）として実現されるものであってもよい。

上記実施の形態の各機能ブロックの処理の一部または全部は、プログラムにより実現されるものであってもよい。そして、上記実施形態の各機能ブロックの処理の一部または全部は、コンピュータにおいて、中央演算装置（ＣＰＵ）により行われる。また、それぞれの処理を行うためのプログラムは、ハードディスク、ＲＯＭなどの記憶装置に格納されており、ＲＯＭにおいて、あるいはＲＡＭに読み出されて実行される。

また、上記実施形態の各処理をハードウェアにより実現してもよいし、ソフトウェア（ＯＳ（オペレーティングシステム）、ミドルウェア、あるいは、所定のライブラリとともに実現される場合を含む。）により実現してもよい。さらに、ソフトウェアおよびハードウェアの混在処理により実現しても良い。なお、上記実施の形態に係る機械学習装置１００をハードウェアにより実現する場合、各処理を行うためのタイミング調整を行う必要があるのは言うまでもない。上記実施形態においては、説明便宜のため、実際のハードウェア設計で生じる各種信号のタイミング調整の詳細については省略している。

また、上記実施形態における処理方法の実行順序は、必ずしも、上記実施形態の記載に制限されるものではなく、発明の要旨を逸脱しない範囲で、実行順序を入れ替えることができるものである。

前述した方法をコンピュータに実行させるコンピュータプログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体は、本発明の範囲に含まれる。ここで、コンピュータ読み取り可能な記録媒体としては、例えば、フレキシブルディスク、ハードディスク、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、大容量ＤＶＤ、次世代ＤＶＤ、半導体メモリを挙げることができる。

上記コンピュータプログラムは、上記記録媒体に記録されたものに限られず、電気通信回線、無線又は有線通信回線、インターネットを代表とするネットワーク等を経由して伝送されるものであってもよい。

１００機械学習装置
２記憶装置
１１取得部
１２試行転移学習部
１３比較学習部
１４判断部
１５選択転移学習部
１４１競合値計算部
１４２信頼度計算部
１４３分布相違度計算部
１４４複雑度計算部
１４５転移評価部

Claims

各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、
前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、
前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、
を備える機械学習装置。
請求項１に記載の機械学習装置であって、
前記判断部は、
前記試行転移学習部により生成された決定木を構成する各リーフノードの深さを積算することにより決定木の複雑度を計算し、計算した複雑度に基づいて前記事前ドメインを転移学習に用いるか否かを判断する複雑度計算部、
を備える機械学習装置。
請求項２に記載の機械学習装置であって、
前記試行転移学習部は、第１決定木と前記第１の決定木と異なる第２決定木とを生成し、
前記複雑度計算部は、前記第１決定木の複雑度と前記第２決定木の複雑度と計算し、計算した前記第１決定木の複雑度と前記第２決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する機械学習装置。
請求項１ないし請求項３のいずれかに記載の機械学習装置であって、さらに、
前記試行転移学習部により生成された決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、前記試行転移学習部により生成された決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、
を備え、
前記判断部は、前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とに基づいて、前記事前ドメインが有効であるか否かを判断する機械学習装置。
請求項４に記載の機械学習装置であって、
前記判断部は、
学習用データが到達した前記決定木のリーフノードの確率分布と、各学習候補データが到達した前記決定木のリーフノードの確率分布との分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する分布相違度計算部、
を備える機械学習装置。
請求項５に記載の機械学習装置であって、
前記試行転移学習部は、第１決定木と前記第１決定木と異なる第２決定木とを生成し、
前記分布相違度計算部は、前記第１決定木を用いて第１分布相違度を計算し、前記第２決定木を用いて第２分布相違度を計算し、
前記判断部は、前記分布相違度計算部により計算された第１分布相違度及び第２分布相違度に基づいて前記事前ドメインが有効であるか否かを判断する機械学習装置。
請求項２に記載の機械学習装置であって、
前記試行転移学習部は、
生成した前記決定木を用いて前記目標ドメインに含まれる各学習用データを分類し、生成した前記決定木を用いて前記事前ドメインに含まれる各学習候補データを分類する試行転移識別部、
を含み、
前記判断部は、
前記試行転移識別部による前記複数の学習用データの分類結果と、前記複数の学習候補データの分類結果とを比較し、比較結果と、前記決定木の複雑度とに基づいて、前記事前ドメインが有効であるか否かを判断する転移評価部、
を備える機械学習装置。
各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、
前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、
生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、
を備える機械学習方法。
転移学習をコンピュータに実行させるプログラムであって、
各々が検出対象の特徴を有する複数の学習用データを含む目標ドメインと、所定の規則を満たし、かつ、各々が前記検出対象の学習に用いられる可能性のある複数の学習候補データを有する事前ドメインとを取得するステップと、
前記目標ドメイン及び前記事前ドメインを用いて転移学習を実行して、前記検出対象の検出に用いられる決定木を生成するステップと、
生成された決定木を用いて、前記事前ドメインが転移学習に有効であるか否かを判断するステップと、
を実行させるプログラム。