JP7479591B2

JP7479591B2 - アンサンブル学習システムおよびアンサンブル学習プログラム

Info

Publication number: JP7479591B2
Application number: JP2021030562A
Authority: JP
Inventors: 桂一伊藤; 真嘉井上; 展之大津
Original assignee: ADACOTECH INCORPORATED
Current assignee: ADACOTECH INCORPORATED
Priority date: 2021-02-26
Filing date: 2021-02-26
Publication date: 2024-05-09
Anticipated expiration: 2041-02-26
Also published as: JP2022131558A; WO2022181303A1

Description

本発明は、アンサンブル学習システムおよびアンサンブル学習プログラムに関する。

従来、機械学習におけるアプローチの一つとしてアンサンブル学習が知られている。アンサンブル学習とは、機械学習モデルが互いに異なる複数の判別器を設け、これらの判別器の判別結果を統合することによって、全体としての性能を向上させる手法である。

例えば、特許文献１には、従来のＣＮＮアプローチの計算速度や価格を改善し、大量の画像データを処理するアンサンブル学習ベースの画像分類システムが開示されている。このシステムは、画像分類タスクのアンサンブルの基本学習器のセットとして動作可能に接続する複数のセルラニューラルネットワーク（ＣＮＮ）ベースの集積回路を含み、フィルタ係数の形式の少なくとも１つの個別のディープラーニングモデルで構成されている。またこのシステムは、アンサンブルのメタ学習器として構成されている制御装置と、制御装置およびＣＮＮベースのＩＣがアンサンブルで使用する様々なデータを保持するメモリベースのデータバッファとを有する。

また、特許文献２には、処理手順を遺伝子とみた遺伝的アルゴリズムによるアンサンブル学習処理の最適化方法が示されている。具体的には、まず、複数の演算子からなる特徴量抽出式を複数含む特徴量抽出式リストを、前世代の特徴量抽出式リストに含まれる複数の特徴量抽出式を遺伝子とみなし、特徴量抽出式の評価値に基づいた遺伝的アルゴリズムを用いて、前世代の特徴量抽出式リストが更新される。つぎに、特徴量抽出式リストに含まれる各特徴量抽出式に、実データ、実データの特徴を示す情報、および、重みからなる教師データの実データを入力して、実データに対応する複数の特徴量が計算される。つぎに、計算された教師データの実データに対応する複数の特徴量から、教師データの実データに対応する情報を推定する機械学習により、特徴量抽出式リストに含まれる各特徴量抽出式にそれぞれ対応する情報抽出部候補が生成される。それとともに、生成した情報抽出部候補によって正しく推定された教師データの重みを用いて、各特徴量抽出式にそれぞれ対応する評価値が算出され、最終世代の特徴量抽出式リストに含まれる特徴量抽出式のうち、評価値が最も良い特徴量抽出式に対応する情報抽出部候補が、アンサンブル学習における１つの情報抽出部として決定される。また、決定した情報抽出部によって間違って推定された教師データの重みを用いて、決定した情報抽出部の信頼度が算出される。最後に、決定された情報抽出部の信頼度を用いて、教師データの重みが更新される。

さらに、特許文献３には、複数の判別器による結果を統合することによって、パターンを判別するアンサンブル判別器を自動構成する情報処理装置が開示されている。具体的には、まず、入力手段を介して入力された複数のパターン間における特徴量の差異の分布が算出される。つぎに、算出された差異の分布を正規化することによって、確率分布が生成される。つぎに、生成された確率分布が示す確率に基づいて、複数のパターンを判別するために参照するべきパターンにおける複数の画素が決定される。最後に、決定された複数の画素の特徴量を用いて、入力された複数のパターンを分類することによって、パターン判別に用いる複数の判別器が生成される。

特開２０２０－６８０２７号公報特開２０１３－１６４８６３号公報特開２０１２－４３１５６号公報

しかしながら、アンサンブル学習は、複数の判別器を用いた処理が併存するため、単一の判別器を用いた処理と比較して、演算量の増大を招くといった問題がある。この点、特許文献１では、アンサンブル学習モデルの計算速度向上と、計算機コストの削減とに着目しているが、アンサンブル学習モデルの性能自体は考慮していない。また、特許文献２および３では、アンサンブル学習モデルの最適化による性能向上のみに着目しており、演算量コストの削減は考慮していない。

そこで、本発明の目的は、アンサンブル学習における性能を最大化しつつ、演算量の低減を図ることである。

かかる課題を解決すべく、第１の発明は、判別ユニットと、テスト実行部と、評価指標算出部と、ユニット構築部とを有するアンサンブル学習システムを提供する。複数の判別ユニットは、データが共通で入力され、それぞれが学習済の機械学習モデルを有し、かつ、入力に対する判別結果の出力特性が互いに異なる。テスト実行部は、複数の判別ユニットのそれぞれに対して、正解付きのテストデータを用いたテストを実行する。評価指標算出部は、テストデータの正解と、判別ユニットの判別結果とに基づいて、判別ユニットがテストでどの程度性能を発揮できたかを示す第１の評価指標を判別ユニット毎に算出する。また、評価指標算出部は、テストデータの正解と、複数の判別ユニットを所定のパターンで組み合わせた再構築の選択肢の判別結果とに基づいて、選択肢がテストでどの程度性能を発揮できたかを示す第２の評価指標を選択肢毎に算出する。ユニット構築部は、第１の評価指標を所定のしきい値と比較することによって、判別ユニットを足切りするか否かを判別ユニット毎に判定し、足切りすべきと判定された判別ユニットを足切りした上で複数の選択肢（第２の評価指標の算出対象）を設定する。そして、ユニット構築部は、第２の評価指標に基づいて選択肢を選択することによって、複数の判別ユニットの再構築を許容する。

ここで、第１の発明において、上記複数の判別ユニットのそれぞれは、共通で入力された画像データに対して、所定の前処理を行う前処理部を有し、これらの前処理部は、判別ユニットによって画像処理の内容が異なっていてもよい。

第１の発明において、上記ユニット構築部は、第２の評価指標が同一値、または、同一とみなせる範囲内である選択肢が複数存在する場合、判別ユニット数が最も少ない選択肢を選択してもよい。

第２の発明は、以下の第１から第６のステップを有する処理をコンピュータに実行させるアンサンブル学習プログラムを提供する。第１のステップでは、データが共通で入力され、それぞれが機械学習モデルを有し、かつ、入力に対する判別結果の出力特性が互いに異なる複数の判別ユニットを構築する。第２のステップでは、複数の判別ユニットのそれぞれに対して、正解付きのテストデータを用いたテストを実行する。第３のステップでは、テストデータの正解と、判別ユニットの判別結果とに基づいて、判別ユニットがテストでどの程度性能を発揮できたかを示す第１の評価指標を判別ユニット毎に算出する。第４のステップでは、第１の評価指標を所定のしきい値と比較することによって、判別ユニットを足切りするか否かを判別ユニット毎に判定する。第５のステップでは、テストデータの正解と、足切りすべきと判定された判別ユニットを足切りした上で複数の判別ユニットを所定のパターンで組み合わせた再構築の選択肢の判別結果とに基づいて、選択肢がテストでどの程度性能を発揮できたかを示す第２の評価指標を選択肢毎に算出する。そして、第６のステップでは、第２の評価指標に基づいて選択肢を選択することによって、複数の判別ユニットの再構築を許容する。

ここで、第２の発明において、上記複数の判別ユニットのそれぞれは、共通で入力されたデータに対して、所定の前処理を行う前処理部を有し、これらの前処理部は、判別ユニットによって画像処理の内容が異なっていてもよい。

第２の発明において、上記第６のステップは、第２の評価指標が同一値、または、同一とみなせる範囲内である選択肢が複数存在する場合、判別ユニット数が最も少ない選択肢を選択してもよい。

本発明によれば、テストを実行することによって算出された評価指標を考慮した上で、複数の判別ユニットの再構築を許容することで、アンサンブル学習システム全体としての性能を最大化しつつ、演算量を有効に低減することができる。特に、再構築の候補として判別ユニットの組み合わせを設定する際、不要な判別ユニットを足切りすることで、最適なユニットの組み合わせを探すのに要する時間を削減できる。

アンサンブル学習システムのブロック図判別モデルの構築から再構築までの処理手順を示すフローチャート前処理の設定画面の一例を示す図第１の再構築例の説明図第２の再構築例の説明図第２の再構築例の説明図

図１は、本実施形態に係るアンサンブル学習システムのブロック図である。このアンサンブル学習システム１は、これを機能的に捉えると、複数の判別ユニット２と、判別部３と、ユニット構築部４と、学習処理部５と、テスト実行部６と、評価指標算出部７とを主体に構成されている。

複数の判別ユニット２には、同一のデータが共通で入力され、それぞれの判別ユニット２は、前処理部２ａと、特徴量抽出部２ｂと、機械学習モデル２ｃとを有する。前処理部２ａは、入力データ（トレーニングデータやテストデータを含む。）に対して所定の前処理を行う。処理対象が、カメラによって取得された画像データの場合、前処理としては、例えば、ラプラシアンフィルタ、分散フィルタ、３次モーメントフィルタ、最大値フィルタ、中央値フィルタ、最小値フィルタ、が牛案フィルタ、輝度補正処理、シェーディング処理、輝度反転などが挙げられる。

特徴量抽出部２ｂは、データの冗長性を低減すべく、前処理部２ａによって前処理が施されたデータの特徴量を抽出する。特徴量の抽出手法としては、既知の手法を任意に採用することができるが、処理対象が画像データの場合、例えば、高次局所自己相関（ＨＬＡＣ：Higher-order Local Auto Correlation）を用いることができる。ＨＬＡＣとは、画像の解析や認識等に用いられる認識精度に優れた汎用かつ高速な特徴抽出法であり、そのメリットとしては、積和演算のみで算出可能なので、検査対象の形状や大きさを瞬時に計算できること、位置不変性（認識対象の位置に依存しない）という特性から、対象の切り出しを必要としないこと（セグメンテーションフリー）、および、加法性（対象が２つあればそれぞれの特徴ベクトルの和となる）といった、画像認識にとって好ましい性質を備えていることが挙げられる。なお、ＨＬＡＣの詳細については、例えば、特開２００８－４６９０３号公報や特開２００８－１８５８４５号公報などに記載されているので、必要ならば参照されたい。

複数の判別ユニット２は、それぞれ処理が異なる特徴量抽出部２ｂを有していてもよい。この場合、上記ＨＬＡＣ特徴の他に、ＨＯＧ特徴（HOG：Histograms of Oriented Gradients）やＳＩＦＴ特徴（SIFT：Scale-Invariant Feature Transform）などの公知の特徴量を採用することが考えられる。ここで、ＨＯＧ特徴とは、局所領域における輝度（色，明るさ）の勾配方向をヒストグラム化した特徴量である。局所領域を複数のブロックに分割し、各ブロックの勾配をヒストグラム化することによって、物体の形状変化に頑健な特徴量を得ることができる。また、ＳＨＦＴ特徴とは、画像の類似検索や物体検出などに使われる局所特徴量と呼ばれるものの一種で、特徴量はある単位（特徴点やピクセル）に紐付けて表現されることが多い。

機械学習モデル２ｃは、前処理が行われ、かつ、冗長性を減らすために特徴量化されたデータの入力に応じて、例えば、カメラによって撮像された物品の外観検査における判別結果（ＯＫ／ＮＧ）を出力する。機械学習には、各種多変量解析手法、１ＣｌａｓｓＳＶＭ、ロジスティクス回帰分析、ニューラルネットなどの様々な手法が存在する。本明細書では、これらの機械学習手法に対してトレーニングデータを入力し、出力された生成物を「機械学習モデル」と定義する。このため、同一の機械学習手法を用いた場合であっても、トレーニングデータが別データであれば、機械学習モデルとしては別物になる。また、検査処理は、検査対象データと機械学習モデルを機械学習手法に入力して実施する。

複数の判別ユニット２は、アンサンブル学習の特性上、個々の判別ユニット２の入力に対する判別結果の出力特性が互いに異なっている。このような出力特性の差異は、典型的には、以下に例示する手法を採用することによって実現できる。第１に、前処理部２ａの処理内容を判別ユニット２毎に異ならせ、機械学習モデル２ｃを学習する手法を共通化することで、出力特性を相違させる。第２に、前処理部２ａの処理内容を共通化し、機械学習モデル２ｃを学習する手法を判別ユニット２毎に異ならせることで、出力特性を相違させる。そして、第３に、前処理部２ａの処理内容および機械学習モデル２ｃの学習手法の双方を判別ユニット２毎に異ならせることで、出力特性を相違させる。

なお、本実施形態では、上記第１のタイプを採用している関係上、特徴量抽出部２ｂを判別ユニット２毎に個別に設けているが、前処理の内容が同一である場合、または、前処理を行わない場合には、特徴量抽出部２ｂを複数の判別ユニット２で共通化できる。

判別部３は、それぞれの判別ユニット２の判別結果に基づいて、アンサンブル学習システム１としての最終的な判別結果を決定し、これを出力する。最終的な判別結果の決定手法としては、最大値投票（Max Voting）、重量平均投票（Weighted Average Voting）、バギングアンサンブル（Bagging Ensemble）、ブースティングアンサンブル（Boosting Ensemble）、スタッキングアンサンブル（Stacking Ensemble）などが存在し、適宜の手法を用いることができる。

ユニット構築部４は、ユニット数および処理内容を含む判別ユニット２の構築（初期設定）を行うと共に、テスト後における判別ユニット２の再構築を許容する。この再構築は、初期設定された複数の判別ユニット２の少なくとも一つを削除することによって行われる。学習処理部５は、初期設定された判別ユニット２のそれぞれが備える前処理、特徴抽出処理、機械学習手法を活用して、機械学習モデル２ｃの学習を行う。この学習は、教師あり学習および教師なし学習のどちらであってもよい。

テスト実行部６は、初期設定された学習済の判別ユニット２に対して、正解付きのテストデータを用いたテストを実行する。評価指標算出部７は、テストデータの正解と、テストデータの入力に対する個々の判別ユニット２の判別結果とに基づいて、評価指標を算出する。ここで、「評価指標」とは、テストにおいて、どの程度性能を発揮できたかを示す指標であり、本実施形態では、その一例として、正解数／テスト回数として規定される正解率を用いる。また、評価指標には、全体の評価指標と、個別の評価指標とが存在する。前者は、判別部３より出力される評価指標、すなわち、アンサンブル学習システム１全体としての評価指標であり、後者は、それぞれの判別ユニット２に関する個別的な評価指標である。ユニット構築部４における判別ユニット２の再構築は、評価指標算出部７によって算出された全体の評価指標または個別の評価指標に基づいて行われる。

図２は、判別モデル２の構築から再構築までの処理手順を示すフローチャートである。まず、ステップ１において、ユニット構築部４は、初期設定として、複数の判別ユニット２を構築する。この構築は、図３に示すように、設定画面上におけるユーザの操作・指示によって行われる。具体的には、ユーザは、「画像処理一覧」に表示された画像処理群（前処理の候補群）の中から所望のものを選択する。ユーザによって選択された画像処理は、「前処理一覧」に表示される。また、ユーザは、撮像画像上における検査範囲を定義するためのマスク画像を指定する。設定画面の右側には、ユーザによって選択された前処理によって、画像がどのように変化するかが対比可能な形態で表示される。判別モデル２の個数は、ユーザによって選択された前処理の個数に相当し、それぞれの判別ユニット２の内部構造（前処理部２ａ）は、ユーザによって指定された前処理の内容によって特定されることになる。

つぎに、ステップ２において、学習処理部５は、ステップ１で構築された複数の判別ユニット２が備える機械学習モデル２ｃに対する学習を個別に実行する。なお、本実施形態では、ユーザが行った一つの前処理の設定に対して、一つ判別モデル２が学習される形となっているが、これに限らず、実験的に前処理の設定を調整する方法や、複数の設定候補から最適な設定を探索的に決定する方法を採用してもよい。

つぎに、ステップ３において、テスト実行部６は、機械学習モデル２ｃの学習が完了した複数の判別ユニット２に対して、正解付きのテストデータを用いたテストを実行する。

つぎに、ステップ４において、評価指標算出部７は、テストデータの正解と、テストデータの入力に対する判別ユニット２のそれぞれの判別結果とに基づいて、判別部２より出力された判別結果の評価指標（例えば、システム全体の正解率）、または、個々の判別ユニット２より出力された判別結果の評価指標（例えば、個々の判定ユニット２の正解率）を算出する。

最後に、ステップ５において、ユニット構築部４は、ステップ１で構築された複数の判別ユニット２の再構築を許容する。この再構築は、ステップ４で算出された評価指標を閲覧したユーザによる手動削除、あるいは、ユニット構築部４による自動削除のどちらで行ってもよい。

以下、初期設定された複数の判別ユニット２の再構築について、具体例に基づいて詳述する。図４は、第１の再構築例の説明図であり、テストデータＡ～Ｄについて、３つの判別ユニット２Ａ～２Ｃの判別結果と、これらの多数決に基づく判別部３の判別結果とを示す。

特定の判別ユニット２を削除するか否かは、個別の評価指標と、所定のしきい値とを比較することによって判定される。同図の場合、判別ユニット２毎の正解率（個別正解率）は、判別ユニット２Ａが７５％、判別ユニット２Ｂが７５％、判別ユニット２Ｃが１００％である。ここで、しきい値が例えば８０％に設定されている場合、個別正解率が８０％以下の判別ユニット２は、全体的な性能に影響を及ぼさないものとして削除される。

これにより、個別正解率が７５％である２つの判別ユニット２Ａ，２Ｂは削除され、判別ユニット２Ｃのみが残ることになる。初期設定された３個の判別ユニット２Ａ～２Ｃを１個の判別ユニット２Ｃに減らしたとしても、アンサンブル学習システム１全体としての正解率は変わらず、アンサンブル学習システム１全体としての演算量は、１／３に低減されることになる。演算量の低減という観点において、判別ユニット２の個数を削減することの意義は大きい。

図５および図６は、第２の再構築例の説明図である。本構築例では、初期設定された複数の判別ユニット２のそれぞれを所定のパターンで組み合わせることによって、再構築が行われる。まず、図５に示すように、３つの判別ユニット２Ａ～２Ｃが存在する場合、その組み合わせは２×２×２－１の７通りとなり、７つの組み合わせパターンの中から最良なものが選択される。図６に示すように、７つの組み合わせパターンのそれぞれについて、全体の正解率、すなわち、判別部３より出力された判別結果の正解率が算出される。

特定の組み合わせパターンを再構築の選択肢から除外するか否かは、全体の正解指標と、所定のしきい値とを比較することによって判定される。具体的には、全体正解率が所定のしきい値以下である組み合わせパターンについては、再構築の選択肢から除外される。例えば、しきい値が８０％に設定されている場合、全体正解率が５０％である［判別ユニット２Ａ］、全体正解率が７５％である［判別ユニット２Ｂ］、［判別ユニット２Ａ＋２Ｂ］、［判別ユニット２Ａ＋２Ｃ］、［判別ユニット２Ａ＋２Ｂ＋２Ｃ］の５パターンが除外され、全体正解率が１００％である［判別ユニット２Ｃ］、［判別ユニット２Ｂ＋２Ｃ］の２パターンが再構築の選択肢となる。

ここで、再構築の選択肢が複数存在する場合、全体正解率が最も良好な組み合わせパターンが選択される。その際、全体正解率が同一値、または、同一とみなせる範囲内（例えば、±数％）である場合、組み合わせパターンを構成するユニット数が最も少ないものが選択される。同図の場合、［判別ユニット２Ｃ］、［判別ユニット２Ｂ＋２Ｃ］の２パターンは、全体正解率が共に１００％であるが、前者の方がユニット数が少ないので、［判別ユニット２Ｃ］の組み合わせパターンが最終的に選択されることになる。これは、全体正解率に変わりがなければ、演算量は少ない方が好ましいという考え方に基づいている。

同図の再構築例では、初期設定された３個の判別ユニット２Ａ～２Ｃを１個の判別ユニット２Ｃに減らすことで、アンサンブル学習システム１全体としての正解率は向上し、演算量も１／３に低減される。一般に、判別ユニット２を多数設ければ性能が向上するとは限らず、検査を行うにあたり妥当なユニット数が存在する。第２の再構築例では、判別ユニット２A～２Ｃの組み合わせを個別に評価することで、最良な組み合わせが能動的に特定できる。なお、判別ユニット２の最適な組み合わせの探し方に関しては、全探索のみならず、ベイズ最適などを利用してもよい。

なお、上述した第１および第２の再構築例は、二者択一的に採用してもよいし、両者を併用してもよい。例えば、最適なユニットの組み合わせを探すのに要する時間を削減するため、個別正解率が５０%以下の判別ユニット２については、足切りするといった仕組みが考えられる。

このように、本実施形態によれば、テストを実行することによって算出された評価指標を考慮した上で、初期的に構築された判別ユニット２の再構築を許容することで、アンサンブル学習システム１全体としての性能を大きく損なうことなく、演算量を有効に低減することができる。

なお、上述した実施形態では、所定のしきい値と比較される評価指標として正解率を例に説明したが、これは一例であって、本発明はこれに限定されるものではない。例えば、正解率の代わりに、誤答数／テスト回数として規定される誤答率を用いてもよい。誤答率は、（１００％－正解率）であり、しきい値との大小関係の比較が正解率とは逆になる点に留意すれば、正解指標として有効に用いることができる。また、Ｆ値（f-measure）、ＲＯＣ・ＡＵＣ、ＡＰ（Average Precision）などを正解指標として用いてもよい。ここで、「Ｆ値」は、予測結果の評価尺度の一つであり、適合率（precision）と再現率（recall）という２つの評価指標を踏まえた統計的な値である。また、「ＲＯＣ・ＡＵＣ」は、機械学習の評価指標の一つであり、ＲＯＣ（Receiver Operating Characteristic）は、推測曲線と呼ばれ、縦軸にＴＰＲ（True Positive Rate）、横軸にＦＰＲ（False Positive Rate）の割合をプロットしたものである。一方、ＡＣＵ（Area Under the Curve）は、ＲＯＣ曲線の下部分の面のことで、ＡＵＣの面積が大きいほど、一般的に機械学習の性能が良いことを意味する。さらに、「ＡＰ」は、物体検知モデルに使われる評価指標であり、ＰＲ曲線（Recallを横軸に、Precisionを縦軸にとってしきい値を変化させてプロットした曲線）の面積として算出される。

また、上述した実施形態では、正解率を用いており、誤答ケースについては考慮していないが、例えば、ＮＧテストデータに対する誤答率が０％という前提におけるＯＫテストデータの正答率を最大化するといったような形で、誤答ケースを考慮してもよい。

また、上述した実施形態では、カメラによって撮像された物品の外観検査における判別結果（ＯＫ／ＮＧ）を出力するシステムを例に説明したが、本発明はこれに限定されるものではない。例えば、駅ホームに設置された監視カメラから、ホームへの転落を発見する用途の場合では、入力されたデータに応じて、事故の有無を判定結果として出力する。この場合、入力されるデータは動画像となるが、特徴量化するための手法としては、例えば、立体高次局所自己相関（ＣＨＬＡＣ：Cubic Higher-order Local Auto Correlation）を用いることで同様の仕組みを実現できる。ＣＨＬＡＣの詳細については、特許第４０６１３７７号公報などに記載されているので、必要ならば参照されたい。また、音響データを解析する公知の機械学習手法は多く提案されているが、これらの手法に本発明を適用し、工場内の生産設備の異常音を検知することで、設備保全に応用することも可能である。

さらに、本発明は、図２のフローチャートに示した手順をコンピュータに実行させるアンサンブル学習プログラムとして捉えることができる。

１アンサンブル学習システム
２，２Ａ～２Ｃ判別ユニット
２ａ前処理部
２ｂ特徴量抽出部
２ｃ機械学習モデル
３判別部
４ユニット構築部
５学習処理部
６テスト実行部
７評価指標算出部

Claims

アンサンブル学習システムにおいて、
データが共通で入力され、それぞれが学習済の機械学習モデルを有し、かつ、入力に対する判別結果の出力特性が互いに異なる複数の判別ユニットと、
前記複数の判別ユニットのそれぞれに対して、正解付きのテストデータを用いたテストを実行するテスト実行部と、
前記テストデータの正解と、前記判別ユニットの判別結果とに基づいて、前記判別ユニットが前記テストでどの程度性能を発揮できたかを示す第１の評価指標を前記判別ユニット毎に算出するとともに、前記テストデータの正解と、前記複数の判別ユニットを所定のパターンで組み合わせた再構築の選択肢の判別結果とに基づいて、前記選択肢が前記テストでどの程度性能を発揮できたかを示す第２の評価指標を前記選択肢毎に算出する評価指標算出部と、
前記第１の評価指標を所定のしきい値と比較することによって、前記判別ユニットを足切りするか否かを前記判別ユニット毎に判定し、足切りすべきと判定された前記判別ユニットを足切りした上で複数の前記選択肢を設定するとともに、前記第２の評価指標に基づいて前記選択肢を選択することによって、前記複数の判別ユニットの再構築を許容するユニット構築部と
を有することを特徴とするアンサンブル学習システム。
前記複数の判別ユニットのそれぞれは、共通で入力された画像データに対して、所定の画像処理を前処理として行う前処理部を有し、
前記前処理部は、前記判別ユニットによって画像処理の内容が異なることを特徴とする請求項１に記載されたアンサンブル学習システム。
前記ユニット構築部は、前記第２の評価指標が同一値、または、同一とみなせる範囲内である前記選択肢が複数存在する場合、判別ユニット数が最も少ない前記選択肢を選択することを特徴とする請求項１に記載されたアンサンブル学習システム。
アンサンブル学習プログラムにおいて、
データが共通で入力され、それぞれが機械学習モデルを有し、かつ、入力に対する判別結果の出力特性が互いに異なる複数の判別ユニットを構築する第１のステップと、
前記複数の判別ユニットのそれぞれに対して、正解付きのテストデータを用いたテストを実行する第２のステップと、
前記テストデータの正解と、前記判別ユニットの判別結果とに基づいて、前記判別ユニットが前記テストでどの程度性能を発揮できたかを示す第１の評価指標を前記判別ユニット毎に算出する第３のステップと、
前記第１の評価指標を所定のしきい値と比較することによって、前記判別ユニットを足切りするか否かを前記判別ユニット毎に判定する第４のステップと、
前記テストデータの正解と、足切りすべきと判定された前記判別ユニットを足切りした上で前記複数の判別ユニットを所定のパターンで組み合わせた再構築の選択肢の判別結果とに基づいて、前記選択肢が前記テストでどの程度性能を発揮できたかを示す第２の評価指標を前記選択肢毎に算出する第５のステップと、
前記第２の評価指標に基づいて前記選択肢を選択することによって、前記複数の判別ユニットの再構築を許容する第６のステップと
を有する処理をコンピュータに実行させることを特徴とするアンサンブル学習プログラム。
前記複数の判別ユニットのそれぞれは、共通で入力された画像データに対して、所定の画像処理を前処理として行う前処理部を有し、
前記前処理部は、前記判別ユニットによって画像処理の内容が異なることを特徴とする請求項４に記載されたアンサンブル学習プログラム。
前記第６のステップは、前記第２の評価指標が同一値、または、同一とみなせる範囲内である前記選択肢が複数存在する場合、判別ユニット数が最も少ない前記選択肢を選択することを特徴とする請求項４に記載されたアンサンブル学習プログラム。