JP2024024504A

JP2024024504A - 学習済モデル選択方法、学習済モデル選択装置および学習済モデル選択プログラム

Info

Publication number: JP2024024504A
Application number: JP2022127374A
Authority: JP
Inventors: 将隆窪内; Masataka Kubouchi; 拓磨西本; Takuma Nishimoto
Original assignee: Sakai Chemical Industry Co Ltd
Current assignee: Sakai Chemical Industry Co Ltd
Priority date: 2022-08-09
Filing date: 2022-08-09
Publication date: 2024-02-22
Also published as: WO2024034196A1

Abstract

【課題】複数の学習済モデルから解析対象に適した学習済モデルを迅速に選択する。【解決手段】複数の学習済モデルＭ１～Ｍｎから解析対象を解析するための学習済モデルを選択する学習済モデル選択方法であって、学習済モデルＭ１～Ｍｎの各々に対応する言語ベクトルであるモデル言語ベクトルＶ１～Ｖｎ、学習済モデルＭ１～Ｍｎの各々の特徴量であるモデル特徴量Ｆ１～Ｆｎ、または、学習済モデルＭ１～Ｍｎの各々の機械学習に用いられた教師データと解析対象との類似度を用いて、解析対象に応じた学習済モデルを選択する。【選択図】図１

Description

本発明は、複数の学習済モデルから解析対象を解析するための学習済モデルを選択する技術に関する。

画像などのデータ解析において、深層学習などによって生成された学習済モデルを用いて解析が行われてきた。あらゆる課題に対応できることを重視する場合は、汎化性能をもつ学習済モデルを生成することが好ましいが、一般に、特化した学習済モデルと比較し、汎化性能が高い学習済モデルは各課題に対する精度が劣る。そのため、課題に合わせて特化した複数の学習済モデルを生成することが多い。

従来では、複数の学習済モデルがある場合、課題に対してどの学習済モデルを使えばいいかを判断するのは人であり、トライアル＆エラーが必要だった。そのため、最適な学習済モデルを選択するのに時間がかかっていた。

そこで、課題に対して最適な学習済モデルを自動的に選択する技術が提案されている。例えば、特許文献１では、データ（画像データ中の文字データ等）が入力されると、あらかじめ用意された類似データベースから、入力データと最も類似度が高い類似テストデータを算出して、類似テストデータを複数の学習済モデルで処理し、最も正解率が高い学習済モデルを選択することが開示されている。また、特許文献２では、属性情報（ユーザの年齢、性別等）を付与したテストデータ（ユーザの顔画像等）をあらかじめ用意した複数の学習済モデルで処理し、最も正解率が高い学習済モデルを選択することが開示されている。

特開２０１９－４０４１７号公報国際公開第２０１８／１４２７６６号

しかしながら、特許文献１、２に記載の従来技術では、用意された複数の学習済モデルにテストデータを入力して、各学習済モデルの正解率（性能）を評価する必要があるため、演算処理量が多くなり、学習済モデルの選択に時間がかかるという問題がある。

本発明は、上記問題を解決するためになされたものであって、複数の学習済モデルから解析対象に適した学習済モデルを迅速に選択することを課題とする。

本発明に係る学習済モデル選択方法は、複数の学習済モデルから解析対象を解析するための学習済モデルを選択する学習済モデル選択方法であって、前記複数の学習済モデルの各々に対応する言語ベクトルであるモデル言語ベクトル、前記複数の学習済モデルの各々の特徴量であるモデル特徴量、または、前記複数の学習済モデルの各々の機械学習に用いられた教師データと前記解析対象との類似度を用いて、前記解析対象に応じた学習済モデルを選択する。

好ましい実施形態によれば、前記モデル言語ベクトルは、前記学習済モデルの各々に付与された言語ラベルから生成される。

好ましい実施形態によれば、前記モデル言語ベクトルは、前記学習済モデルの各々の機械学習に用いられた教師データに付与された言語ラベルから生成される。

好ましい実施形態によれば、前記学習済モデル選択方法は、前記解析対象または前記解析対象に対応する言語データを検索データとして受け付ける受付ステップと、前記検索データを言語ベクトル化して検索言語ベクトルに変換する言語ベクトル変換ステップと、前記検索言語ベクトルを、前記モデル言語ベクトルの各々と比較する言語ベクトル比較ステップと、前記言語ベクトル比較ステップの比較結果に基づいて、前記複数の学習済モデルから少なくとも１つの学習済モデルを選択する選択ステップと、を備える。

好ましい実施形態によれば、前記選択ステップでは、前記検索言語ベクトルに対する類似度が最も大きいモデル言語ベクトルに対応する学習済モデルを選択する。

好ましい実施形態によれば、前記学習済モデル選択方法は、前記解析対象または前記解析対象に対応する言語データを検索データとして受け付ける受付ステップと、前記検索データを言語ベクトル化して検索言語ベクトルに変換する言語ベクトル変換ステップと、前記モデル言語ベクトルと前記モデル特徴量との関係を機械学習した特徴量変換用モデルを用いて、前記検索言語ベクトルを検索データ特徴量に変換する特徴量変換ステップと、前記検索データ特徴量を、前記モデル特徴量の各々と比較する特徴量比較ステップと、前記特徴量比較ステップの比較結果に基づいて、前記複数の学習済モデルから少なくとも１つの学習済モデルを選択する選択ステップと、を備える。

好ましい実施形態によれば、前記選択ステップでは、前記検索データ特徴量に対する類似度が最も大きいモデル特徴量に対応する学習済モデルを選択する。

好ましい実施形態によれば、前記学習済モデル選択方法は、前記解析対象または前記解析対象に対応する言語データを検索データとして受け付ける受付ステップと、前記検索データが言語データである場合に、前記言語データを前記教師データと同一形式のデータに変換する変換ステップと、前記検索データを前記教師データと比較する比較ステップと、前記比較ステップの比較結果に基づいて、前記複数の学習済モデルから少なくとも１つの学習済モデルを選択する選択ステップと、を備える。

好ましい実施形態によれば、前記教師データは、前記複数の学習済モデルにそれぞれ対応する複数の教師データセットを構成しており、前記比較ステップでは、前記複数の教師データセットを順次選択し、選択した教師データセットの教師データと前記検索データとを比較し、前記教師データセットごとに、教師データと検索データとの類似度を算出し、前記選択ステップでは、前記類似度を用いて前記複数の教師データセットから少なくとも１つの教師データセットを選択し、選択された教師データセットに対応する学習済モデルを選択する。

好ましい実施形態によれば、前期検索データは、画像である。

本発明に係る学習済モデル選択装置は、複数の学習済モデルから解析対象を解析するための学習済モデルを選択する学習済モデル選択装置であって、前記複数の学習済モデルの各々に付与された言語ラベルから生成された言語ベクトルであるモデル言語ベクトル、前記複数の学習済モデルの各々の特徴量であるモデル特徴量、または、前記複数の学習済モデルの各々の機械学習に用いられた教師データと前記解析対象との類似度を用いて、前記解析対象に応じた学習済モデルを選択する。

本発明に係る学習済モデル選択プログラムは、複数の学習済モデルから解析対象を解析するための学習済モデルを選択する学習済モデル選択プログラムであって、前記複数の学習済モデルの各々に対応する言語ベクトルであるモデル言語ベクトル、前記複数の学習済モデルの各々の特徴量であるモデル特徴量、または、前記複数の学習済モデルの各々の機械学習に用いられた教師データと前記解析対象との類似度を用いて、前記解析対象に応じた学習済モデルを選択する処理をコンピュータに実行させる。

本発明によれば、複数の学習済モデルから解析対象に適した学習済モデルを迅速に選択することができる。

本発明の実施形態１に係る学習済モデル選択装置のブロック図である。ベクトル空間の一例である。本発明の実施形態１に係る学習済モデル選択方法の処理手順を示すフローチャートである。検索のための言語データの一例である。本発明の実施形態１の変形例に係る学習済モデル選択方法の処理手順を示すフローチャートである。モデル言語ベクトルの生成する一例を示す説明図である。本発明の実施形態２に係る学習済モデル選択装置のブロック図である。ベクトル空間の一例である。本発明の実施形態２に係る学習済モデル選択方法の処理手順を示すフローチャートである。本発明の実施形態３に係る学習済モデル選択装置のブロック図である。本発明の実施形態３に係る学習済モデル選択方法の処理手順を示すフローチャートである。

以下、本発明の実施形態について添付図面を参照して説明する。なお、本発明は、下記の実施形態に限定されるものではない。

［実施形態１］
以下、本発明の実施形態１について説明する。

（学習済モデル選択装置）
図１は、実施形態１に係る学習済モデル選択装置１のブロック図である。学習済モデル選択装置１は、複数の学習済モデルから解析対象を解析するための学習済モデルを選択する機能を有している。本実施形態において、解析対象は画像であり、解析方法はセグメンテーションであるが、解析対象および解析方法は特に限定されない。

学習済モデル選択装置１は、汎用のコンピュータで構成することができ、ハードウェア構成として、ＣＰＵやＧＰＵなどのプロセッサ、ＤＲＡＭやＳＲＡＭなどの主記憶装置（図示省略）、および、ＨＤＤやＳＳＤなどの補助記憶装置１０を備えている。補助記憶装置１０には、画像を用いて機械学習された複数の学習済モデルＭ１～Ｍｎ、モデル言語ベクトルＶ１～Ｖｎの他、学習済モデル選択プログラム等の学習済モデル選択装置１を動作させるための各種プログラムが格納されている。

学習済モデルＭ１～Ｍｎは、互いに異なる学習データセットを用いて機械学習された人工知能モデルである。なお、各学習データセットは、同一の教師画像を共通に含んでもよいが、互いに特徴の異なる教師画像で構成されていることが好ましい。例えば、学習済モデルＭ１は、丸い粒子の教師画像を多く含む学習データセットを用いて機械学習されており、学習済モデルＭ２は、サクランボの教師画像を多く含む学習データセットを用いて機械学習されている。学習済モデルＭ１～Ｍｎの数はｎ（ｎ≧２）であるが、その数は特に限定されない。

本実施形態において、モデル言語ベクトルＶ１～Ｖｎはそれぞれ、学習済モデルＭ１～Ｍｎの各々に付与された言語ラベルから生成されたものである。例えば、学習済モデルＭ２は、サクランボの画像を多く含む画像群を用いて機械学習されており、サクランボおよびサクランボに類似する物体の画像を高精度に解析可能であるため、「形、大きさ、色、座標」＝「丸い、小さい、赤色、なんでもいい」という言語ラベルが付与されている。言語ラベルは、人間によって付与されてもよいし、画像キャプション、mirror GAN、image to textなどのアルゴリズムによって付与されてもよい。この言語ラベルを言語ベクトル化することで、（形、大きさ、色、座標）が符号化されたモデル言語ベクトルＶ２が生成される。

なお、上記の例では、モデル言語ベクトルの次元数は４次元であるが、次元数は特に限定されず、例えば数百次元であってもよい。ｋ次元のモデル言語ベクトルは、例えば図２に示すベクトル空間Ｖで表すことができる。また、上記の例では、モデル言語ベクトルは人間が認識できる要素のみを含んでいたが、人間が認識できない要素を含んでもよい。

学習済モデル選択装置１は、機能ブロックとして、受付部１１と、言語ベクトル変換部１２と、言語ベクトル比較部１３と、選択部１４と、解析部１５とを備えている。本実施形態において、これらの各部は、学習済モデル選択装置１のプロセッサが学習済モデル選択プログラムを主記憶装置に読み出して実行することによってソフトウェア的に実現される。

（学習済モデル選択方法）
学習済モデル選択装置１の上記各部の機能について、図３に基づいて説明する。図３は、本実施形態に係る学習済モデル選択方法の処理手順を示すフローチャートである。これらのステップＳ１～Ｓ８は、学習済モデル選択装置１によって実行される。なお、最終目的の観点では、ステップＳ１～Ｓ８は、画像解析方法の処理工程であり、前処理工程であるステップＳ１～Ｓ３と、解析工程であるステップＳ４～Ｓ８に区分される。なお、前処理工程はデータベース化することで計算負荷を軽減することも可能である。

ステップＳ１では、学習済モデルＭ１～Ｍｎを補助記憶装置１０に保存する。なお、学習済モデルＭ１～Ｍｎは、外部の記憶装置やクラウドに保存されてもよい。

ステップＳ２では、学習済モデルＭ１～Ｍｎの各々に付与された言語ラベルをモデル言語ベクトルＶ１～Ｖｎに変換する。ステップＳ２は、言語ベクトル変換部１２が実行してもよい。

ステップＳ３では、モデル言語ベクトルＶ１～Ｖｎを補助記憶装置１０に保存する。なお、モデル言語ベクトルＶ１～Ｖｎは、外部の記憶装置やクラウドに保存されてもよい。

ステップＳ４（受付ステップ）では、受付部１１が、解析対象または解析対象に対応する言語データを検索データとして受け付ける。本実施形態では、受付部１１は、解析対象に対応する言語データを検索データとして受け付ける。言語データは、例えば、サクランボの画像を解析対象とする場合、ユーザは、図４に示すように、「丸くて小さな赤い粒子」という言語データを検索欄Ｒに入力することにより検索を行う。言語データは、解析対象の内容や特徴を表現するものであれば特に限定されず、解析対象の名称（例えば「サクランボ」）であってもよい。

また、検索データは、解析対象そのものであってもよい。解析データが画像である場合、ユーザは画像データを学習済モデル選択装置１にアップロードすることにより検索を行う。アップロードされた画像は、画像キャプション、mirror GAN、image to textなどのアルゴリズムによって言語データに変換される。

ステップＳ５（言語ベクトル変換ステップ）では、言語ベクトル変換部１２が、検索データを言語ベクトル化して検索言語ベクトルＶａに変換する。例えば、検索データが、「丸くて小さな赤い粒子」である場合、言語ベクトル変換部１２は、「形、大きさ、色、座標」＝「丸い、小さい、赤色、なんでもいい」という検索言語ベクトルＶａに変換する。検索データを検索言語ベクトルに変換する手法は、特に限定されず、単語をベクトル化する辞書や、言語データをベクトル化するように機械学習された人工知能モデルを用いてもよい。なお、検索ワードに対応する検索言語ベクトルは可変長でもよい。

ステップＳ６（言語ベクトル比較ステップ）では、言語ベクトル比較部１３が、ステップＳ５で変換された検索言語ベクトルＶａを、モデル言語ベクトルＶ１～Ｖｎの各々と比較する。本実施形態では、言語ベクトル比較部１３は、数値計算により検索言語ベクトルＶａのモデル言語ベクトルＶ１～Ｖｎの各々に対する類似度を算出する。類似度は、コサイン類似度やパターンマッチングなどアルゴリズムによる方法、人の主観により類似度を評価したデータセットを学習した学習済みモデルによる推論の公知の技術によって求めることができる。

ステップＳ７（選択ステップ）では、選択部１４が、ステップＳ６の比較結果に基づいて、学習済モデルＭ１～Ｍｎから少なくとも１つの学習済モデルを選択する。本実施形態では、選択部１４は、モデル言語ベクトルＶ１～Ｖｎのうち、検索言語ベクトルＶａに対する類似度が最も大きいモデル言語ベクトルに対応する学習済モデルを、解析対象に適した学習済モデルとして選択する。なお、選択部１４は、検索言語ベクトルＶａに対する類似度が大きいモデル言語ベクトルに対応する学習済モデルであれば、学習済モデルを複数選択してもよい。また、検索言語ベクトルＶａに対する類似度が大きい順に学習済モデルをランキング化し、それらの学習済モデルからユーザが選んでもよい。

ステップＳ８では、解析部１５が、ステップＳ７で選択された学習済モデルを用いて、解析対象の解析を行う。

（変形例）
図５は、実施形態１の変形例に係る学習済モデル選択方法の処理手順を示すフローチャートであり、これらの処理は、図１に示す学習済モデル選択装置１によって実行される。本変形例は、補助記憶装置１０に保存されたモデル言語ベクトルＶ１～Ｖｎが、学習済モデルＭ１～Ｍｎの各々の機械学習に用いられた教師データに付与された言語ラベルから生成される点で、上記と異なっている。すなわち、図５に示すフローチャートは、図３に示すフローチャートにおいて、ステップＳ２をステップＳ２’に置き換えた点で異なっている。そのため、以下ではステップＳ１、Ｓ３～Ｓ８の説明は省略する。

ステップＳ２’では、学習済モデルＭ１～Ｍｎの各々の機械学習に用いられた教師データに付与された言語ラベルをモデル言語ベクトルＶ１～Ｖｎに変換する。例えば、図６に示すように、学習済モデルＭｘ（２≦ｘ≦ｎ）を生成するための教師データＴ１～Ｔｍの各々には、「丸い」、「四角い」等の言語ラベルが付与されている。言語ラベルは、人間によって付与されてもよいし、画像キャプション、mirror GAN、image to textなどのアルゴリズムによって付与されてもよい。これらの言語ラベルを、言語ベクトル化することにより、モデル言語ベクトルＶｘが生成される。

言語ベクトル化の具体的手法は特に限定されないが、例えば、以下の手法が挙げられる。
・one-hotベクトル：単語をそれぞれのベクトルで格納する方法
・分散表現：単語を低次元のベクトルで表現する手法
・Bag-of-words：文章内の単語出現回数をベクトルの要素とする方法
これらの手法については、例えば、https://deepage.net/bigdata/machine_learning/2
016/09/02/word2vec_power_of_word_vector.html、https://deepage.net/machine_lear
ning/2017/01/08/doc2vec.htmlを参照されたい。

また、上記手法は単語をベクトル化する手法であるが、image to textやＧＡＮ（Generative Adversarial Networks）などで文章が生成される場合は、文章のベクトル化も可能である(例えば、Doc2Vec、BERT)。

（小括）
以上のように、実施形態１では、学習済モデルＭ１～Ｍｎの各々に対応するモデル言語ベクトルＶ１～Ｖｎを用いることにより、学習済モデルＭ１～Ｍｎから解析対象に応じた学習済モデルを選択している。言語ベクトルは、ベクトル同士の比較のための演算量が少ないため、従来技術に比べ、解析対象に適した学習済モデルを迅速に選択することができる。

［実施形態２］
以下、本発明の実施形態２について説明する。なお、実施形態２において、上述の実施形態１におけるものと同様の機能を有する部材については、同一の符号を付し、詳細な説明を省略する。

（学習済モデル選択装置）
図７は、実施形態２に係る学習済モデル選択装置１’のブロック図である。学習済モデル選択装置１’は、図１に示す学習済モデル選択装置１と同様に、複数の学習済モデルから解析対象を解析するための学習済モデルを選択する機能を有している。本実施形態においても、解析対象は画像であり、解析方法はセグメンテーションであるが、解析対象および解析方法は特に限定されない。

学習済モデル選択装置１’のハードウェア構成は、学習済モデル選択装置１と同様である。学習済モデル選択装置１’の補助記憶装置１０には、ｎ個の学習済モデルＭ１～Ｍｎ、モデル特徴量Ｆ１～Ｆｎ、特徴量変換用モデルＭＣの他、学習済モデル選択プログラム等の学習済モデル選択装置１’を動作させるための各種プログラムが格納されている。

モデル特徴量Ｆ１～Ｆｎはそれぞれ、学習済モデルＭ１～Ｍｎの各々の特徴量である。本実施形態において、学習済モデルの特徴量は、学習済モデルに付随する潜在変数であり、例えば、学習済モデルがニューラルネットワークである場合、学習済モデルを生成する際のハイパーパラメータおよび特徴量フィルタである。モデル特徴量は、例えば図８に示すベクトル空間Ｗで表すことができる。

特徴量変換用モデルＭＣは、モデル言語ベクトルＶ１～Ｖｎ（図１）とモデル特徴量Ｆ１～Ｆｎとの関係（確率分布）をあらかじめ機械学習した人工知能モデルである。機械学習方法は特に限定されないが、例えば、線形回帰やランダムフォレストを適用できる。

学習済モデル選択装置１’は、機能ブロックとして、受付部１１と、言語ベクトル変換部１２と、選択部１４と、解析部１５と、特徴量変換部１６と、特徴量比較部１７とを備えている。すなわち、学習済モデル選択装置１’は、図１に示す学習済モデル選択装置１において、言語ベクトル比較部１３を特徴量変換部１６および特徴量比較部１７に置き換えたものである。本実施形態において、これらの各部は、学習済モデル選択装置１’のプロセッサが学習済モデル選択プログラムを主記憶装置に読み出して実行することによってソフトウェア的に実現される。

（学習済モデル選択方法）
学習済モデル選択装置１’の上記各部の機能について、図９に基づいて説明する。図９は、本実施形態に係る学習済モデル選択方法の処理手順を示すフローチャートであり、これらのステップＳ１１～Ｓ２１は、学習済モデル選択装置１’によって実行される。なお、最終目的の観点では、ステップＳ１１～Ｓ２１は、画像解析方法の処理工程であり、前処理工程であるステップＳ１１～Ｓ１５と、解析工程であるステップＳ１６～Ｓ２１に区分される。なお、前処理工程はデータベース化することで計算負荷を軽減することも可能である。

ステップＳ１１では、学習済モデルＭ１～Ｍｎを補助記憶装置１０に保存する。ステップＳ１１は、図３に示すステップＳ１と同様である。

ステップＳ１２では、学習済モデルＭ１～Ｍｎの各々に付与された言語ラベルをモデル言語ベクトルＶ１～Ｖｎに変換する。ステップＳ１２は、図３に示すステップＳ２と同様であるが、図５に示すステップＳ２’と同様であってもよい。

ステップＳ１３では、学習済モデルＭ１～Ｍｎのモデル特徴量Ｆ１～Ｆｎを演算する。

ステップＳ１４では、ステップＳ１２で生成されたモデル言語ベクトルＶ１～Ｖｎと、ステップＳ１３で生成されたモデル特徴量Ｆ１～Ｆｎとの関係を機械学習する。これにより、言語ベクトルを入力すると、当該言語ベクトルに対応する特徴量を出力する特徴量変換用モデルＭＣが生成される。

ステップＳ１５では、モデル特徴量Ｆ１～Ｆｎと、機械学習された特徴量変換用モデルＭＣを補助記憶装置１０に保存する。なお、これらは外部の記憶装置やクラウドに保存されてもよい。

ステップＳ１６（受付ステップ）では、受付部１１が、解析対象または解析対象に対応する言語データを検索データとして受け付ける。ステップＳ１６は、図３に示すステップＳ４と同様である。

ステップＳ１７（言語ベクトル変換ステップ）では、言語ベクトル変換部１２が、検索データを言語ベクトル化して検索言語ベクトルＶａに変換する。ステップＳ１７は、図３に示すステップＳ５と同様である。

ステップＳ１８（特徴量変換ステップ）では、特徴量変換部１６が、特徴量変換用モデルＭＣを用いて、ステップＳ１７で変換された検索言語ベクトルＶａを検索データ特徴量Ｆａに変換する。特徴量変換用モデルＭＣは、学習済モデルＭ１～Ｍｎのモデル言語ベクトルＶ１～Ｖｎとモデル特徴量Ｆ１～Ｆｎとの関係を機械学習しているため、検索言語ベクトルＶａが入力されると、検索言語ベクトルＶａに対応する特徴量である検索データ特徴量Ｆａを出力する。

ステップＳ１９（特徴量比較ステップ）では、特徴量比較部１７が、ステップＳ１８で変換された検索データ特徴量Ｆａを、モデル特徴量Ｆ１～Ｆｎの各々と比較する。本実施形態では、特徴量比較部１７は、数値計算により検索データ特徴量Ｆａのモデル特徴量Ｆ１～Ｆｎの各々に対する類似度を算出する。類似度は、コサイン類似度やパターンマッチングなどアルゴリズムによる方法、人の主観により類似度を評価したデータセットを学習した学習済みモデルによる推論の公知の技術によって求めることができる。

ステップＳ２０（選択ステップ）では、選択部１４が、ステップＳ１９の比較結果に基づいて、学習済モデルＭ１～Ｍｎから少なくとも１つの学習済モデルを選択する。本実施形態では、選択部１４は、モデル特徴量Ｆ１～Ｆｎのうち、検索データ特徴量Ｆａに対する類似度が最も大きいモデル特徴量に対応する学習済モデルを、解析対象に適した学習済モデルとして選択する。なお、選択部１４は、検索データ特徴量Ｆａに対する類似度が大きいモデル特徴量に対応する学習済モデルであれば、学習済モデルを複数選択してもよい。

ステップＳ２１では、解析部１５が、ステップＳ２０で選択された学習済モデルを用いて、解析対象の解析を行う。

（小括）
以上のように、実施形態２では、学習済モデルＭ１～Ｍｎの各々の特徴量であるモデル特徴量Ｆ１～Ｆｎを用いることにより、学習済モデルＭ１～Ｍｎから解析対象に応じた学習済モデルを選択している。特徴量も言語ベクトルと同様、特徴量同士の比較のための演算量が少ないため、従来技術に比べ、解析対象に適した学習済モデルを迅速に選択することができる。

［実施形態３］
以下、本発明の実施形態３について説明する。なお、実施形態３において、上述の実施形態１および２におけるものと同様の機能を有する部材については、同一の符号を付し、詳細な説明を省略する。

（学習済モデル選択装置）
図１０は、実施形態３に係る学習済モデル選択装置１”のブロック図である。学習済モデル選択装置１”は、図１および図７に示す学習済モデル選択装置１、１’と同様に、複数の学習済モデルから解析対象を解析するための学習済モデルを選択する機能を有している。本実施形態において、解析対象および教師データは画像であり、解析方法はセグメンテーションであるが、解析対象および教師データのデータ形式、並びに解析方法は特に限定されない。

学習済モデル選択装置１”のハードウェア構成は、学習済モデル選択装置１、１’と同様である。学習済モデル選択装置１”の補助記憶装置１０には、ｎ個の学習済モデルＭ１～Ｍｎ、ｎ個の教師データセットＳ１～Ｓｎの他、学習済モデル選択プログラム等の学習済モデル選択装置１”を動作させるための各種プログラムが格納されている。

教師データセットＳ１～Ｓｎはそれぞれ、学習済モデルＭ１～Ｍｎに対応しており、学習済モデルＭ１～Ｍｎの機械学習に用いられた教師データは、教師データセットＳ１～Ｓｎを構成している。すなわち、教師データセットＳｋ（１≦ｋ≦ｎ）は、学習済モデルＭｋの機械学習に用いられたｍ個の教師データｋ－１～ｋ－ｍ（ｍは不定の整数）で構成されている。なお、近年の機械学習では転移学習が行われることが多いため、ｍは数百程度である。

学習済モデル選択装置１”は、機能ブロックとして、受付部１１と、選択部１４と、解析部１５と、検索データ変換部１８と、検索データ比較部１９とを備えている。すなわち、学習済モデル選択装置１”は、図１に示す学習済モデル選択装置１において、言語ベクトル比較部１３を検索データ変換部１８および検索データ比較部１９に置き換えたものである。本実施形態において、これらの各部は、学習済モデル選択装置１”のプロセッサが学習済モデル選択プログラムを主記憶装置に読み出して実行することによってソフトウェア的に実現される。

（学習済モデル選択方法）
学習済モデル選択装置１”の上記各部の機能について、図１１に基づいて説明する。図１１は、本実施形態に係る学習済モデル選択方法の処理手順を示すフローチャートであり、これらのステップＳ３１～Ｓ３７は、学習済モデル選択装置１”によって実行される。なお、最終目的の観点では、ステップＳ３１～Ｓ３７は、画像解析方法の処理工程であり、前処理工程であるステップＳ３１と、解析工程であるステップＳ３２～Ｓ３７に区分される。なお、前処理工程はデータベース化することで計算負荷を軽減することも可能である。

ステップＳ３１では、学習済モデルＭ１～Ｍｎおよび教師データセットＳ１～Ｓｎを補助記憶装置１０に保存する。

ステップＳ３２（受付ステップ）では、受付部１１が、解析対象または解析対象に対応する言語データを検索データとして受け付ける。

検索データが教師データと同じ形式（本実施形態では画像）である場合（ステップＳ３３でＹＥＳ）、ステップＳ３５に移行する。検索データが教師データと異なる形式（例えば、言語データ）である場合（ステップＳ３３でＮＯ）、ステップＳ３４に移行する。

ステップＳ３４（変換ステップ）では、検索データ変換部１８が、検索データを教師データの形式（画像）に変換する。画像への変換には、mirror GAN等のアルゴリズムを用いることができる。

ステップＳ３５（比較ステップ）では、検索データ比較部１９が、検索データ（画像）を教師データと比較する。具体的には、検索データ比較部１９は、教師データセットＳ１～Ｓｎを順次選択し、選択した教師データセットの各教師データと検索データとを比較し、教師データセットごとに、教師データと検索データとの類似度を算出する。本実施形態では、検索データ比較部１９は、類似度の平均値または最大値を算出する。教師データと検索データとの類似度は、コサイン類似度やパターンマッチングなどアルゴリズムによる方法、人の主観により類似度を評価したデータセットを学習した学習済みモデルによる推論等の公知の技術によって求めることができる。なお、検索データ比較部１９は、各教師データセットの全ての教師データを比較対象とする必要はない。

ステップＳ３６（選択ステップ）では、選択部１４が、ステップＳ３５の比較結果に基づいて、学習済モデルＭ１～Ｍｎから少なくとも１つの学習済モデルを選択する。本実施形態では、選択部１４は、教師データと検索データとの類似度の平均値または最大値が最も大きい教師データセットに対応する学習済モデルを、解析対象に適した学習済モデルとして選択する。なお、選択部１４は、各教師データと検索データとの類似度の平均値または最大値が大きい教師データセットに対応する学習済モデルであれば、学習済モデルを複数選択してもよい。

ステップＳ３７では、解析部１５が、ステップＳ３６で選択された学習済モデルを用いて、解析対象の解析を行う。

（小括）
以上のように、実施形態３では、学習済モデルＭ１～Ｍｎの各々の機械学習に用いられた教師データと解析対象との類似度を用いることにより、学習済モデルＭ１～Ｍｎから解析対象に応じた学習済モデルを選択している。本実施形態では、学習済モデルにテストデータを入力する必要がないため、従来技術に比べ、解析対象に適した学習済モデルを迅速に選択することができる。

なお、本実施形態では、解析対象は画像であり、検索データが言語データである場合は、言語データを画像に変換して教師データと比較していたが、本発明はこれに限定されない。解析対象が画像以外の形式であり、検索データが言語データである場合は、言語データを教師データと同一形式のデータに変換して教師データと比較する。

（付記事項）
以上、本発明の実施形態について説明したが、本発明は上記実施形態に限定されるものではなく、その趣旨を逸脱しない限りにおいて、種々の変更が可能である。

１学習済モデル選択装置
１’ 学習済モデル選択装置
１” 学習済モデル選択装置
１０補助記憶装置
１１受付部
１２言語ベクトル変換部
１３言語ベクトル比較部
１４選択部
１５解析部
１６特徴量変換部
１７特徴量比較部
１８検索データ変換部
１９検索データ比較部
Ｆ１～Ｆｎモデル特徴量
Ｆａ検索データ特徴量
Ｍ１～Ｍｎ学習済モデル
ＭＣ特徴量変換用モデル
Ｓ１～Ｓｎ教師データセット
Ｔ１～Ｔｍ教師データ
Ｔ１－１～Ｔ１－ｍ教師データ
Ｔｎ－１～Ｔｎ－ｍ教師データ
Ｖ１～Ｖｎモデル言語ベクトル
Ｖａ検索言語ベクトル

Claims

複数の学習済モデルから解析対象を解析するための学習済モデルを選択する学習済モデル選択方法であって、
前記複数の学習済モデルの各々に対応する言語ベクトルであるモデル言語ベクトル、前記複数の学習済モデルの各々の特徴量であるモデル特徴量、または、前記複数の学習済モデルの各々の機械学習に用いられた教師データと前記解析対象との類似度を用いて、前記解析対象に応じた学習済モデルを選択する、学習済モデル選択方法。
前記モデル言語ベクトルは、前記学習済モデルの各々に付与された言語ラベルから生成される、請求項１に記載の学習済モデル選択方法。
前記モデル言語ベクトルは、前記学習済モデルの各々の機械学習に用いられた教師データに付与された言語ラベルから生成される、請求項１に記載の学習済モデル選択方法。
前記解析対象または前記解析対象に対応する言語データを検索データとして受け付ける受付ステップと、
前記検索データを言語ベクトル化して検索言語ベクトルに変換する言語ベクトル変換ステップと、
前記検索言語ベクトルを、前記モデル言語ベクトルの各々と比較する言語ベクトル比較ステップと、
前記言語ベクトル比較ステップの比較結果に基づいて、前記複数の学習済モデルから少なくとも１つの学習済モデルを選択する選択ステップと、
を備える、請求項２または３に記載の学習済モデル選択方法。
前記選択ステップでは、前記検索言語ベクトルに対する類似度が最も大きいモデル言語ベクトルに対応する学習済モデルを選択する、請求項４に記載の学習済モデル選択方法。
前記解析対象または前記解析対象に対応する言語データを検索データとして受け付ける受付ステップと、
前記検索データを言語ベクトル化して検索言語ベクトルに変換する言語ベクトル変換ステップと、
前記モデル言語ベクトルと前記モデル特徴量との関係を機械学習した特徴量変換用モデルを用いて、前記検索言語ベクトルを検索データ特徴量に変換する特徴量変換ステップと、
前記検索データ特徴量を、前記モデル特徴量の各々と比較する特徴量比較ステップと、
前記特徴量比較ステップの比較結果に基づいて、前記複数の学習済モデルから少なくとも１つの学習済モデルを選択する選択ステップと、
を備える、請求項１に記載の学習済モデル選択方法。
前記選択ステップでは、前記検索データ特徴量に対する類似度が最も大きいモデル特徴量に対応する学習済モデルを選択する、請求項６に記載の学習済モデル選択方法。
前記解析対象または前記解析対象に対応する言語データを検索データとして受け付ける受付ステップと、
前記検索データが言語データである場合に、前記言語データを前記教師データと同一形式のデータに変換する変換ステップと、
前記検索データを前記教師データと比較する比較ステップと、
前記比較ステップの比較結果に基づいて、前記複数の学習済モデルから少なくとも１つの学習済モデルを選択する選択ステップと、
を備える、請求項１に記載の学習済モデル選択方法。
前記教師データは、前記複数の学習済モデルにそれぞれ対応する複数の教師データセットを構成しており、
前記比較ステップでは、前記複数の教師データセットを順次選択し、選択した教師データセットの教師データと前記検索データとを比較し、前記教師データセットごとに、教師データと検索データとの類似度を算出し、
前記選択ステップでは、前記類似度を用いて前記複数の教師データセットから少なくとも１つの教師データセットを選択し、選択された教師データセットに対応する学習済モデルを選択する、請求項８に記載の学習済モデル選択方法。
前期検索データは、画像である、請求項９に記載の学習済みモデル選択方法。
複数の学習済モデルから解析対象を解析するための学習済モデルを選択する学習済モデル選択装置であって、
前記複数の学習済モデルの各々に付与された言語ラベルから生成された言語ベクトルであるモデル言語ベクトル、前記複数の学習済モデルの各々の特徴量であるモデル特徴量、または、前記複数の学習済モデルの各々の機械学習に用いられた教師データと前記解析対象との類似度を用いて、前記解析対象に応じた学習済モデルを選択する、学習済モデル選択装置。
複数の学習済モデルから解析対象を解析するための学習済モデルを選択する学習済モデル選択プログラムであって、
前記複数の学習済モデルの各々に対応する言語ベクトルであるモデル言語ベクトル、前記複数の学習済モデルの各々の特徴量であるモデル特徴量、または、前記複数の学習済モデルの各々の機械学習に用いられた教師データと前記解析対象との類似度を用いて、前記解析対象に応じた学習済モデルを選択する処理をコンピュータに実行させる学習済モデル選択プログラム。