JP2021086241A

JP2021086241A - 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム

Info

Publication number: JP2021086241A
Application number: JP2019212832A
Authority: JP
Inventors: 卓也小松田; Takuya Komatsuda; 琢也小田; Takuya Oda
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 2019-11-26
Filing date: 2019-11-26
Publication date: 2021-06-03
Anticipated expiration: 2039-11-26
Also published as: TWI787640B; JP7353940B2; TW202121221A; US20210157707A1

Abstract

【課題】複数の転移元データの中から転移先モデルで使用するデータの選択に要する工数を削減でき、転移元モデルを転移できるか否かを適切に判定できるようにする。【解決手段】転移元タスクに関する第１静的特性データと第１観測データとの入力を受け付けるデータ入力部１１０と、第１静的特性データを目的変数とし、第１観測データに関する特徴量を説明変数として、静的特性モデルを生成する静的特性情報モデリング部１２０と、転移先タスクの第２静的特性データを受理し、処理に利用する第１静的特性データを選択する転移元データ選択部１３０と、転移先タスクの第２観測データを受理し、第２観測データと静的特性モデルとに基づいて、拡張観測データを算出するデータ拡張部１４０と、分析モデルに拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、これに基づいて、転移可能性を評価する転移元モデル評価部と、を備えるように構成する。【選択図】図２

Description

本発明は、或るタスクのために構築した分析モデルを他のタスクのための分析モデルに転移することが可能であるか否かを判定する技術に関する。

センシング技術の向上に伴い、データを利活用して経営効果を得ている事例が増えている。特に、製造業における設備故障予兆や不良品検知の需要は高く、多くの工場で取り組まれている。

不良品検知向けのセンサデータ分析では、まず、製造中の設備から収集した温度や風量等に関するセンサデータを収集し、センサデータの平均や分散等統計量に基づく特徴量を算出し、不良発生前後での特徴量の変化点を識別する分析モデル（分析モデル又は単にモデルと呼ぶ）を構築する。これにより、分析モデルにより自動的に不良発生を検知することが可能となる。

一方、近年、顧客ニーズの多様化により少量多品種製造が求められている。製造品種の変更に伴って製造現場担当者は、温度や風量等の製造パラメータを変更する必要があり、製造パラメータが変わるとセンサデータの変化傾向が異なってくる。そのため、品種毎に分析モデルを構築する必要があり、全品種向けに分析モデルを構築するためには多大な工数を要する。このような背景から、モデル構築の工数削減が要請されている。

モデル構築の工数削減に向けて、過去に分析済みの品種に関するデータや分析モデルを新規の分析対象の品種の分析モデル構築に転移する取組みが行われている。しかし、転移元のデータや分析モデルが転移先の分析モデルに適合しない場合、負の転移（Negative Transfer）が発生する可能性がある。ここで、負の転移とは、転移元と転移先とのデータや分析モデルが互いに類似していないために、転移学習を適用した結果、転移先モデルの性能が低下する現象のことをいう。このために、転移元データが転移先モデルの性能向上に有効か否かを判定することが要請されている。

例えば、特許文献１には、事前ドメインが転移学習に有効であるかを精度よく判定することができる技術が記載されている。特許文献１に記載されている機械学習装置は、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、を備えている。

特開２０１６−１９１９７５号公開

特許文献１に記載の技術では、転移元データと転移先データの特徴が類似していない場合において、転移学習に有効なデータを抽出できず、転移学習を適用することができない。また、特許文献１に記載の技術では、転移元データの候補が複数ある場合には、その転移元データから使用するデータを選択するために工数を要する。
そこで、本発明は、上記事情に鑑みなされたものであり、複数の転移元データの中から転移先モデルで使用するデータの選択に要する工数を削減でき、転移元モデルを転移先モデルとして転移することができるか否かを適切に判定することができる技術を提供することを目的とする。

前記目的を達成するため、一観点に係る転移可能性判定装置は、転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する転移可能性判定装置であって、転移元タスクの対象物及び／又は事象に関する静的な特性を示す第１静的特性データと、転移元タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第１観測データとの入力を受け付けるデータ入力部と、第１静的特性データを目的変数とし、第１観測データに関する特徴量を説明変数として、静的特性モデルを生成する静的特性情報モデリング部と、転移先タスクの対象物及び／又は事象に関する静的な特性を示す第２静的特性データを受理し、第１静的特性データと、第２静的特性データとの距離に基づいて、複数の第１静的特性データの中から処理に利用する第１静的特性データを選択する転移元データ選択部と、転移先タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第２観測データを受理し、第２観測データと、選択された前記第１静的特性データと、静的特性モデルとに基づいて、分析モデルでの利用に適した拡張観測データを算出するデータ拡張部と、分析モデルに拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、汎化誤差に基づいて、分析モデルの転移先タスクへの転移可能性を評価する転移元モデル評価部と、を備える。

本発明によれば、複数の転移元データの中から転移先モデルで使用するデータの選択に要する工数を削減でき、転移元モデルを転移先モデルとして転移することができるか否かを適切に判定することができる。

図１は、一実施形態に係る分析モデル転移可能性判定装置の構成の一例を示すブロック図である。図２は、一実施形態に係る分析モデル転移可能性判定装置の概略ブロック図である。図３は、静的特性データテーブルの構成例を示す図である。図４は、観測データテーブルの構成例を示す図である。図５は、分析モデルテーブルの構成例を示す図である。図６は、静的特性モデルテーブルの構成例を示す図である。図７は、拡張データテーブルの構成例を示す図である。図８は、モデル転移可能性テーブルの構成例を示す図である。図９は、特徴量生成ファイルの一例を示す図である。図１０は、一実施形態に係る分析モデル転移可能性判定装置のメイン処理の一例を示すフローチャートである。図１１は、一実施形態に係る静的特性情報モデリング処理の一例を示すフローチャートである。図１２は、一実施形態に係る転移元データ選択処理の一例を示すフローチャートである。図１３は、一実施形態に係る転移先データ拡張処理の一例を示すフローチャートである。図１４は、一実施例に係る性能評価処理の一例を示すフローチャートである。図１５は、データ入力画面の一例を示す図である。図１６は、分析モデル情報入力画面の一例を示す図である。図１７は、転移可能性判定結果画面の一例を示す図である。

実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。

以下の説明では、「ＡＡＡテーブル」、「ＡＡＡファイル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「ＡＡＡテーブル」、「ＡＡＡファイル」を「ＡＡＡ情報」と呼ぶことができる。

図１は、一実施形態に係る分析モデル転移可能性判定装置の構成の一例を示すブロック図である。

転移可能性判定装置の一例としての分析モデル転移可能性判定装置１は、或るタスクを解決するために、このタスクに関する観測対象の物又は事象からその振る舞いとして得られた観測データに基づいて生成された分析モデル（転移元モデル）を、或るタスク（転移先タスク）に転用することが可能であるか否か、すなわち、転移可能性を判定し、判定結果を提示するための装置である。

ここで、タスクとは、対象業務における解決すべき課題であり、例えば、或る製品の不良発見や或る製造設備の故障予兆である。また、分析モデルは、タスクを実行するために使用されモデルである。分析モデルは、例えば、観測対象が製品であり、製品に対するタスクを実行する場合には、例えば観測対象の製品を観測するためのセンサで観測されて収集された数値データ（観測データ）及び／またはその数値データに関する特徴量を入力とし、この製品が不良である確率、あるいはこの製品が不良であるか否かの判定結果を出力する。数値データに関する特徴量とは、この数値データを加工したデータのことを示す。なお、観測対象に関する分析モデルは、例えばユーザから与えられる。

この分析モデル転移可能性判定装置１によると、対象とする製品の不良を判定するために生成された分析モデル（転移元モデル）を他の製品の不良を判定するための分析モデル（転移先モデル）として転移することができ、他の製品の不良判定（他のタスク）を低工数で解決することができる。

分析モデル転移可能性判定装置１は、例えば、ＰＣ（ＰｅｒｓｏｎａｌＣｏｍｐｕｔｅｒ）等の計算機で構成され、メモリ１０、ストレージ２０、プロセッサ３０、ネットワークインターフェース（Ｉ／Ｆ）４０、及びユーザインターフェース（Ｉ／Ｆ）５０を有する。

ネットワークＩ／Ｆ４０は、例えば、有線ＬＡＮカードや無線ＬＡＮカードなどのインターフェースであり、ＷＡＮ（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ）６０等のネットワークを介して他の装置と通信する。なお、ネットワークＩ／Ｆ４０を、ＬＡＮ（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ）やその他いかなるネットワークに接続してもよい。

ユーザＩ／Ｆ５０は、キーボード、マウス等の入力装置や、ディスプレイ等の出力装置であり、ユーザからの入力を受け付け、またユーザへ各種情報を出力（提示）する。

プロセッサ３０は、メモリ２０に格納されているプログラムを実行することにより各種処理を実行する。例えば、プロセッサ３０は、ユーザＩ／Ｆ５０から入力されたデータ等に応じて、メモリ１０のプログラムを実行し、処理結果に基づく情報をユーザＩ／Ｆ５０へ出力する。

メモリ１０は、例えば、ＲＡＭ（ＲＡＮＤＯＭＡＣＣＥＳＳＭＥＭＯＲＹ）であり、プロセッサ３０で実行されるプログラムや、必要な情報を記憶する。本実施形態では、メモリ１０は、データ入力プログラム１２、静的特性情報モデリングプログラム１３、転移元データ選択プログラム１４、データ拡張プログラム１５、及び転移モデル評価プログラム１６を含むモデル転移可能性判定プログラム１１を記憶する。

データ入力プログラム１２は、プロセッサ３０に実行されることにより、対象とするタスクに係る静的特性データ、観測データ、分析モデルに関するパラメータや特徴量生成ファイルをユーザから受理する。

ここで、静的特性データは、対象とするタスクの対象（対象物、対象事象）に関する静的な特性を示す数値データ及び／またはテキストデータであり、例えば、対象物である製品の規格や原料の種類・量に関する情報である。また、観測データは、対象からその振る舞いとして得られたデータであり、例えば、対象物である製品の製造時に原料に作用を及ぼした温度や風量に関する観測データや、製造中の製品を観測した画像データである。特徴量生成ファイルは、観測データを特徴量に加工するためのルールが記載されたファイルである。

静的特性情報モデリングプログラム１３は、プロセッサ３０に実行されることにより、静的特性データを観測データでモデリングして、静的特性モデルを構築する。モデリングとは、静的特性データを出力とする観測データに基づいた数式を生成することを示す。例えば、静的特性データｙを、２つの観測データｘ_１，ｘ_２でモデリングすると、例えば、ｙ＝０．１５＊ｘ_１＋０．０１＊ｘ_２との静的測定モデルが生成される。

転移元データ選択プログラム１４は、プロセッサ３０に実行されることにより、転移先タスクに関する静的特性データを受理し、転移先タスクに関する静的特性データとの距離が最も近い転移元タスクに関する静的特性データを選択する。

データ拡張プログラム１５は、プロセッサ３０に実行されることにより、静的特性モデリルに基づいて転移先タスクの観測データを拡張観測データに拡張する。ここで、拡張観測データは、他のタスクに対して生成された分析モデルを用いて対象タスクを解決するために、対象タスクに関する観測データを加工したデータである。

転移モデル評価プログラム１６は、プロセッサ３０に実行されることにより、転移先の拡張観測データを転移元の分析モデルに適用して分析モデルの汎化誤差を算出することにより、転移元の分析モデルを転移先タスクに転移可能か否かを判定する。ここで、汎化誤差とは、分析モデルの生成のために使用した観測データとは別の観測データを分析モデルに入力した場合における、出力値と実測値との差分に基づいた値である。

なお、データ入力プログラム１２、静的特性情報モデリングプログラム１３、転移元データ選択プログラム１４、データ拡張プログラム１５、及び転移モデル評価プログラム１６は、一部又は全てが一体的に構成されてもよいし、別々に構成されてもよい。また、データ入力プログラム１２、静的特性情報モデリングプログラム１３、転移元データ選択プログラム１４、データ拡張プログラム１５、及び転移モデル評価プログラム１６は、一部又は全てのプログラムを複数のプログラムで実現してもよい。

ストレージ２０は、例えば、ハードディスクやフラッシュメモリなどであり、静的特性データ記憶部２１、観測データ記憶部２２、分析モデル記憶部２３、静的特性モデル記憶部２４、拡張データ記憶部２５、モデル転移可能性記憶部２６、及びメモリ１０に呼び出す各種プログラムを格納する。

静的特性データ記憶部２１は、ユーザから受理した静的特性データを記憶する。観測データ記憶部２２は、ユーザから受理した観測データを記憶する。分析モデル記憶部２３は、対象タスクを解決するための出力を観測データでモデリングした分析モデルに係る情報を記憶する。静的特性モデル記憶部２４は、静的特性データを観測データでモデリングした分析モデルに係る情報を記憶する。拡張データ記憶部２５は、拡張観測データを記憶する。モデル転移可能性記憶部２６は、分析モデルを転移することが可能か否かを判定するための情報を記憶する。

図２は、一実施形態に係る分析モデル転移可能性判定装置の概略ブロック図である。

分析モデル転移可能性判定装置１は、データ入力部１１０と、静的特性情報モデリング部１２０と、転移元データ選択部１３０と、データ拡張部１４０と、転移元モデル評価部１５０とを有する。

データ入力部１１０は、プロセッサ３０がデータ入力プログラム１２を実行することにより実現され、静的特性情報モデリング部１２０は、プロセッサ３０が静的特性情報モデリングプログラム１３を実行することにより実現され、転移元データ選択部１３０は、プロセッサ３０が転移元データ選択プログラム１４を実行することにより実現され、データ拡張部１４０は、プロセッサ３０がデータ拡張プログラム１５を実行することにより実現され、転移元モデル評価部１６０は、プロセッサ３０が転移モデル評価プログラム１６を実行することにより実現される。

データ入力部１１０は、ユーザから静的特性データ（第１静的特性データ、第２静的特性データ）及び観測データ（第１観測データ、第２観測データ）を受理し、それぞれ静的特性データ記憶部２１及び観測データ記憶部２２に格納する。また、データ入力部１１０は、静的特性データ及び観測データを静的特性情報モデリング部１２０に送信する。また、データ入力部１１０は、静的特性データ及び観測データを転移元データ選択部１３０に送信する。

静的特性情報モデリング部１２０は、データ入力部１１０から静的特性データ及び観測データを受理し、静的特性モデルを構築し、静的特性モデルを静的特性モデル記憶部２４に記録する。なお、静的特性データ及び観測データを、静的特性データ記憶部２１や観測データ記憶部２２から受理してもよい。

転移元データ選択部１３０は、データ入力部１１０から転移先の静的特性データ（第２静的特性データ）を受理し、静的特性データ記憶部２１から転移元の静的特性データ（第１静的特性データ）群を受理し、転移先の静的特性データと転移元の静的特性データ群とに基づいて、処理に使用する転移元の静的特性レコードを選択し、静的特性レコードに係る転移元タスクＩＤをデータ拡張部１４０に送信する。ここで、転移元タスクＩＤは、対象となる転移元タスクを特定するためのＩＤである。

データ拡張部１４０は、転移元データ選択部１３０から転移元タスクＩＤを受理し、転移先タスクに係わる観測データ（第２観測データ）を観測データ記憶部２２から受理し、静的特性モデルを静的特性モデル記憶部２４から受理し、転移元タスクＩＤと転移先タスクに係わる観測データと、転移元の静的特性データと、に基づいて拡張観測データを算出し、拡張観測データを転移元モデル評価部１５０に送信する。ここで、拡張観測データは、対象となるタスクに関する観測データを他のタスク向け（他のタスクの分析モデル向け）に拡張したデータである。

転移元モデル評価部１５０は、データ拡張部１４０から転移先タスクに係る観測データ、拡張観測データ、及び転移元タスクＩＤを受理し、転移元タスクＩＤに基づいて分析モデル記憶部２３から転移元モデルに関する分析モデルを取得し、分析モデルに拡張観測データを適用して拡張観測データの転移元モデルに対する汎化誤差を算出し、分析モデルに観測データを適用して観測データの転移元モデルに対する汎化誤差を算出し、汎化誤差と転移元データの転移元モデルに対する汎化誤差に基づいて、転移後性能向上率、転移可能性及び転移可能判定結果を算出し、拡張観測データを拡張データ記憶部２５に記録し、モデル転移可能性記憶部２６に転移後性能向上率、転移可能性、及び転移可能判定結果を記録する。ここで、転移後性能向上率は、データ拡張前後における転移先データの転移元モデルへの性能向上率であり、数値で表される。転移可能性は、転移元モデルを転移先タスクに転移できる可能性であり、例えば、１から１００までの範囲の数値で表される。転移可能判定結果は、転移可能性に関する情報の一例であり、転移元モデルを転移先タスクに転移できるか否かを判定した結果であり、例えば、できるか否かの２値で表される。

次に、ストレージ２０に記憶された、静的特性データ記憶部２１、観測データ記憶部２２、分析モデル記憶部２３、静的特性モデル記憶部２４、拡張データ記憶部２５、及び、モデル転移可能性記憶部２６について詳細に説明する。

図３は、静的特性データテーブルの構成例を示す図である。

静的特性データテーブル２１０は、静的特性データ記憶部２１に記憶されている。静的特性データテーブル２１０には、ＩＤ２１１と、静的特性因子群２１２とを含むエントリが複数登録されている。ＩＤ２１１は、静的特性データを一意に特定するための識別番号である。静的特性因子群２１２は、複数の静的特性因子を含み、図３の例では、部位Ａ幅２１３、部位Ｂ幅２１４、原料Ｘ２１５等を含む。部位Ａ幅２１３は、製品の部位Ａの幅である。部位Ｂ幅２１４は、製品の部位Ｂの幅である。原料Ｘ２１５は、製品の原料Ｘの割合である。

例えば、図３において、静的特性データテーブル２１０のＩＤ２１１が“１”であるエントリは、静的特性因子としての部位Ａ幅２１３が“０．８”であり、部位Ｂ幅２１４が“１０”であり、原料Ｘ２１５が“１５”であることを示している。

図４は、観測データテーブルの構成例を示す図である。

観測データテーブル２２０は、観測データ記憶部２２に記憶されている。観測データテーブル２２０には、収集時刻２２１、ＴＩＤ２２２、観測データ群２２３、及び不良判定２２７を含むエントリが複数登録されている。収集時刻２２１は、センサから観測データが収集された時刻である。ＴＩＤ２２２は、タスクを一意に特定するための識別番号である。観測データ群２２３は、複数のセンサによる観測データ（センサデータ）を含み、図４の例では、例えば、温度Ａ２２４、温度Ｂ２２５、風量Ａ２２６等を含む。温度Ａ２２４は、温度Ａセンサによって観測された温度Ａである。温度Ｂ２２５は、温度Ｂセンサによって観測された温度Ｂである。風量Ａ２２６は、風量Ａセンサによって観測された風量Ａである。不良判定２２７は、観測データが収集された際に製造されていた製品についての検査結果であり、図４の例では、製品が良品であれば“０”が設定され、製品が不良品であれば“１”が設定される。

例えば、図４において、観測データテーブル２２０の収集時刻２２１が“８／９１３：０８：０１”であるエントリは、ＴＩＤ２２２が“１”であるタスクにおいて、その収集時刻において、温度Ａ２２４が“８０．４”であり、温度Ｂ２２５が“９５．０”であり、風量Ａ２２６が“１０．７”であり、不良判定２２７が“０”である製品が製造されたことを示している。

図５は、分析モデルテーブルの構成例を示す図である。

分析モデルテーブル２３０は、分析モデル記憶部２３に記憶されている。分析モデルテーブル２３０には、ＴＩＤ２３１、ベースモデル名２３２、モデルパラメータリスト２３３、特徴量生成ファイルへのパス２３４を含むエントリが複数登録されている。ＴＩＤ２３１は、タスクを一意に特定するための識別番号である。ベースモデル名２３２は、分析モデルを生成するために用いた手法名である。モデルパラメータリスト２３３は、ベースモデル名２３２に関するパラメータ名とパラメータの値とのリストである。特徴量生成ファイルへのパス２３４は、特徴量の生成方法について記載された特徴量生成ファイル２７０（図９参照）へのパスを示す。

例えば、図５において、分析モデルテーブル２３０のＴＩＤ２３１が“１”であるエントリは、ベースモデル名２３２が“ｋ−ＮＮ”であり、モデルパラメータリスト２３３が“ｋ：１、ｍｅｔｒｉｃ：‘ｍｉｎｋｏｗｓｋｉ’”であり、特徴量生成ファイルへのパス２３４が“ｐｒｏｄｕｃｔ＿ｘ／ｔｙｐｅ＿ａ．ｊｓｏｎ”であることを示している。

図６は、静的特性モデルテーブルの構成例を示す図である。

静的特性モデルテーブル２４０は、静的特性モデル記憶部２４に記憶されている。静的特性モデルテーブル２４０は、静的特性因子名２４１、特徴量・重みペア２４２を含むエントリが複数登録されている。静的特性因子名２４１は、静的特性因子の名前である。特徴量・重みペア２４２は、特徴量名と、この特徴量名の特徴量への重みとのペアのリストを示す。

例えば、図６において、静的特性モデルテーブル２４０の静的特性因子２４１が“部位Ａ幅”であるエントリは、特徴量・重みペア２４２が“ｘ_１：０．１５、ｘ_２：０．０１”であることを示している。

図７は、拡張データテーブルの構成例を示す図である。

拡張データテーブル２５０は、拡張データ記憶部２５に記憶されている。拡張データテーブル２５０には、ＩＤ２５１、転移元ＴＩＤ２５２、転移先ＴＩＤ２５３、拡張データ２５４を含むエントリが複数登録されている。ＩＤ２５１は、エントリを一意に特定するための識別番号である。転移元ＴＩＤ２５２は、転移元タスクを一意に特定するための識別番号である。転移先ＴＩＤ２５３は、転移先タスクを一意に特定するための識別番号である。拡張データ２５４は、特徴量名と特徴量とのペアのリストを示す。

例えば、図７において、拡張データテーブル２５０のＩＤ２５１が“１”であるエントリは、転移元ＴＩＤ２５２が“１”であり、転移先ＴＩＤ２５３が“５”であり、拡張データ２５４が“ｘ_１：３．９、ｘ_２：２１．１４”であることを示している。

図８は、モデル転移可能性テーブルの構成例を示す図である。

モデル転移可能性テーブル２６０は、モデル転移可能性記憶部２６に記憶されている。モデル転移可能性テーブル２６０には、ＴＩＤ２６１、転移後性能向上率２６２、転移可能性２６３、転移可能判定結果２６４を含むエントリが複数登録されている。ＴＩＤ２６１は、タスクを一意に特定するための識別番号である。転移後性能向上率２６２は、観測データの拡張前後における性能向上の割合である。転移可能性２６３は、転移元モデルを転移先タスクに転移することができる可能性である。転移可能判定結果２６４は、転移元モデルを転移先タスクに転移できるか否かの判定結果である。

例えば、図８において、モデル転移可能性テーブル２６０のＴＩＤ２６１が“５”であるエントリは、転移後性能向上率２６２が“１．０２”であり、転移可能性２６３が“９２％”であり、転移可能判定結果２６４が“ＯＫ”であることを示している。

図９は、特徴量生成ファイルの一例を示す図である。

特徴量生成ファイル２７０は、静的特性モデル記憶部２４に記憶されている。特徴量生成ファイル２７０は、静的特性モデルの特徴量を生成するための方法についての記述を含む。特徴量生成ファイル２７０は、分析モデルテーブル２３０の特徴量生成ファイルへのパス２３４の記述に基づいて参照される。

特徴量生成ファイル２７０は、ｍｏｄｅｌ＿ｉｄ２７１、ｍｏｄｅｌ＿ｎａｍｅ２７２、ｆｅａｔｕｒｅ＿ｌｉｓｔ２７３を含むエントリが記述されている。ｍｏｄｅｌ＿ｉｄ２７１は、モデルを一意に特定するための識別番号である。ｍｏｄｅｌ＿ｎａｍｅ２７２はモデルの名前である。ｆｅａｔｕｒｅ＿ｌｉｓｔ２７３は、複数の特徴量に関する情報を保持するリストである。ｆｅａｔｕｒｅ＿ｌｉｓｔ２７３には、ｆｅａｔｕｒｅ＿ｉｄ２７４、ｆｅａｔｕｒｅ＿ｎａｍｅ２７５、ｉｎｐｕｔ２７６、ｌｏｇｉｃ２７７を含むエントリが記述されている。ｆｅａｔｕｒｅ＿ｉｄ２７４は、特徴量を一意に特性するための識別番号である。ｆｅａｔｕｒｅ＿ｎａｍｅ２７５は、特徴量名である。ｉｎｐｕｔ２７６は、特徴量を生成するために使用する観測データ名である。ｉｎｐｕｔ２７６は、観測データテーブル２２０の観測データ群２２３に含まれる観測データのうちの一以上の観測データ名である。ｌｏｇｉｃ２７７は、特徴量を生成するための計算式である。

例えば、図９において、特徴量生成ファイル２７０のｍｏｄｅｌ＿ｉｄ２７１が“１”であるエントリは、ｍｏｄｅｌ＿ｎａｍｅ２７２が“ｍｏｄｅｌ＿ａ”であり、ｆｅａｔｕｒｅ＿ｌｉｓｔ２７３に３つ以上のエントリを含んでいる。ｆｅａｔｕｒｅ＿ｌｉｓｔ２７３のｆｅａｔｕｒｅ＿ｉｄ２７４が“１”であるエントリは、ｆｅａｔｕｒｅ＿ｎａｍｅ２７５が“ｘ_１”であり、ｉｎｐｕｔ２７６が“‘温度Ａ’、‘風量Ａ’”であり、ｌｏｇｉｃ２７７が“Ｍｅａｎ（‘温度Ａ’）＋１．５＊Ｍｅａｎ（‘風量Ａ’）”であることを示している。ここで、Ｍｅａｎ（ｘ）は、特徴量名ｘの平均値を算出するための関数である。

次に、分析モデル転移可能性判定装置１の処理動作について説明する。

図１０は、一実施形態に係る分析モデル転移可能性判定装置のメイン処理の一例を示すフローチャートである。

まず、データ入力部１１０は、後述するデータ入力画面７０（図１５参照）を介してユーザから入力された、転移元タスクに係る静的特性データ及び観測データをそれぞれ静的特性データ記憶部２１の静的特性データテーブル２１０及び観測データ記憶部２２の観測データテーブル２２０に記憶する（ステップＳ１０）。

次いで、静的特性情報モデリング部１２０は、静的特性情報モデリング処理（図１１参照）を実行する（ステップＳ１１）。静的特性情報モデリング処理では、静的特定モデリング部１２０は、データ入力部１１０から静的特性データ及び観測データを取得し、静的特性データを観測データでモデリングして静的特性モデルを構築し、静的特性モデルを静的特性モデル記憶部２４に記録する。

次いで、転移元データ選択部１３０は、転移元データ選択処理（図１２参照）を実行する（ステップＳ１２）。転移元データ選択処理では、転移元データ選択部１３０は、データ入力部１１０から転移先タスクに係る静的特性データを受理し、受理した転移先タスクに係る静的特性データに基づいて、所定の転移元タスクに係る静的特性データを静的特性データ記憶部２１から取得し、転移元タスクに関する転移元タスクＩＤをデータ拡張部１４０に送信する。

次いで、データ拡張部１４０は、転移先データ拡張処理（図１３参照）を実行する（ステップＳ１３）。転移先データ拡張処理では、データ拡張部１４０は、転移元データ選択部１３０から受理した転移元タスクＩＤに基づいて、観測データ記憶部２２から転移元タスクに関する観測データ（第１観測データ）を取得し、観測データ記憶部２２から転移先タスクに関する観測データ（第２観測データ）を取得し、静的特性モデルを静的特性モデル記憶部２４から取得し、転移元タスクＩＤに関する観測データ、転移先タスクに関する観測データ、及び静的特性モデルに基づいて、拡張観測データを算出し、拡張観測データ及び転移元タスクＩＤを転移元モデル評価部１５０に送信する。

転移元モデル評価部１５０は、性能評価処理（図１４参照）を実行する（ステップＳ１４）。性能評価処理では、転移元モデル評価部１５０は、データ拡張部１４０から受理した転移元タスクＩＤに基づいて分析モデル記憶部２３から転移元モデルに係る分析モデルを取得し、データ拡張部１４０から受理した拡張観測データと、取得した分析モデルとに基づいて、分析モデルの観測データに対する評価結果（転移可能性）を算出する。

次いで、転移元モデル評価部１５０は、評価結果が閾値以上であるか否かを判定し（ステップＳ１５）、評価結果が閾値以上である場合（ステップＳ１５：ＹＥＳ）には、転移の可能性が高いことを意味する転移可能性フラグを立て、例えば、モデル転移可能性テーブル２６０の転移可能性判定結果２６４を“ＯＫ”に設定し（ステップＳ１６）、処理を終了する一方、評価結果が閾値未満である場合（ステップＳ１５：ＮＯ）には、何もせずに処理を終了する。

次に、図１０のステップＳ１１に対応する静的特性情報モデリング処理について詳細に説明する。

図１１は、一実施形態に係る静的特性情報モデリング処理の一例を示すフローチャートである。

まず、静的特性情報モデリング部１２０は、観測データ記憶部２２から観測データを取得し、観測データに基づいて、１以上の種類の特徴量を算出する関数（算出式）を決定し、特徴量を算出する（ステップＳ１００）。なお、算出する特徴量の種類は、例えば、ユーザによって指示されてもよい。

次いで、静的特性情報モデリング部１２０は、各種変数等を初期化する（ステップＳ１０１）具体的には、静的特性情報モデリング部１２０は、変数ｃｏｕｎｔｅｒに１を代入し、変数ｃＧＥｒｒｏｒ及び変数ｐＢｅｓｔＧＥｒｒｏｒに無限大を代入し、オブジェクトＭ及びオブジェクトｐＢｅｓｔＭに空の値を代入する。ここで、オブジェクトは、任意の数の変数及び関数を含むデータ構造である。なお、変数ｃＧＥｒｒｏｒ及び変数ｐＢｅｓｔＧＥｒｒｏｒに無限大を代入するようにしているが、プログラムで無限大を表現することができない場合には、例えば、ユーザによって予め与えられた所定の値を無限大の代わりに用いてもよい。

次いで、静的特性情報モデリング部１２０は、ステップＳ１００で算出した特徴量の中から一部又は全ての特徴量を処理対象として選択し（ステップＳ１０２）、静的特性データ記憶部２２から静的特性データを受理し、静的特性データのうち一部又は全ての静的特性因子を処理対象として選択する（ステップＳ１０３）。ここで、静的特性因子は、静的特性データを構成する因子であり、例えば、対象となる製品における部位Ａの幅や原料Ｘの割合である。なお、特徴量から処理対象を選択する方法や、静的特性データから処理対象を選択する方法としては、ランダムに選択してもよいし、予め設定されたルール（例えば、ユーザに指定されたルール）に従って選択してもよい。

次いで、静的特性情報モデリング部１２０は、マルチアウトプット回帰を実行し、静的特性モデルを生成する処理を実行する（ステップＳ１０４）。具体的には、静的特性情報モデリング部１２０は、観測データ及び静的特性データを学習用データとテスト用データとの２つに分割する。ここで、観測データ及び静的特性データを学習用データとテスト用データとの２つに分割する方法としては、例えば、製品を単位として、観測データ及び静的特性データを２つに分割してもよい。次いで、静的特性情報モデリング部１２０は、学習用データを用いてステップＳ１０３で選択した静的特性因子を目的変数とし、ステップＳ１０２で選択した特徴量を説明変数としてマルチアウトプット回帰を実行し、静的特性モデルを生成し、静的特性モデルの静的特性因子、特徴量及びパラメータをオブジェクトＭに代入する。

静的特性情報モデリング部１２０によるマルチアウトプット回帰の処理は、例えば、以下に示すような手順で実行してもよい。

（手順１）以下の式（１）の重みｗ_ｉｊをランダムに決定する。

ここで、ｍは特徴量の数であり、ｉｔｅｒは、このマルチアウトプット回帰の処理における繰り返しの回数であり、ｗ_ｉｊ ^ｉｔｅｒは、ｉｔｅｒ回目の繰り返しにおけるｉ番目の静的特性因子に関するｊ番目の特徴量への重みであり、ｘ_（ｎ）ｊは、ｎ番目のタスク（ｎ番目の製品についてのタスク）におけるｊ番目の特徴量であり、ｘ_（ｎ）はｎ番目のタスクにおける特徴量群のベクトルであり、ｙ_ｉ ^ｉｔｅｒ（ｘ_（ｎ））は、ｉｔｅｒ回目の繰り返しにおいて特徴量群ｘ_（ｎ）を用いて算出したｉ番目の静的特徴因子の予測値である。

（手順２）以下の式（２）に特徴量及び静的特性データを入力し、重みの値を更新する。

ここで、ｗ_ｉｊ ^ｉｔｅｒ、ｘ_（ｎ）ｊ、ｘ_（ｎ）、ｙ_ｉ ^ｉｔｅｒ（ｘ_（ｎ））は式（１）の符号と同様であり、Ｎはタスクの数であり、ｙ_（ｎ）ｉはｎ番目のタスクにおけるｉ番目の静的特性因子の実測値であり、ηは学習率である。ηは、任意の値であり、ユーザによって設定されてもよい。

（手順３）以下の式（３）を用いて、学習誤差Ｅ（Ｅ_{ｔｒａｉｎ}）を算出し、過去ｘ回の学習誤差を含めた分散が閾値以下である場合、又は変数ｉｔｅｒの値が閾値より大きい場合に手順４に進む。そうでない場合、変数ｉｔｅｒをインクリメントして手順２に戻る。

ここで、ｆは関数ベクトル（ｆ_１、ｆ_２、…、ｆ_ｋ）であり、ｆ_ｉはｉ番目の関数を示す。ｋは、関数の数である。ｘは学習データベクトル（ｘ_（１）、ｘ_（２）、…、ｘ_（ｎ））である。ｘ_（ｎ）はｎ番目のタスクにおける特徴量群のベクトルである。ｙは（ｉ，ｎ）成分がｙ_（ｎ）ｉである実測値行列であり、ｙ_（ｎ）ｉはｎ番目のタスクにおけるｉ番目の関数に対応する実測値である。

ここで、手順３での式（３）を用いる際には、ｆ_ｉにｙ_ｉ ^ｉｔｅｒを入力し、ｘに学習用データを入力し、ｙに学習用データに対応する静的特性データを入力する。

（手順４）重みｗ_ｉｊを出力する。これにより、汎化誤差Ｅの分散が閾値以下となった場合又は所定回処理を繰り返した場合の重みを適切に決定することができる。なお、汎化誤差Ｅの分散が閾値を超える場合には、その際に選択されている静的特性因子については静的特性モデルから削除対象として、閾値以内の静的特性因子のみを目的変数とする静的特性モデルとしてもよい。

次いで、静的特性情報モデリング部１２０は、テスト用データ及び静的特性モデルを用いて、式（３）に従って静的特性モデルの汎化誤差Ｅ（Ｅ_ｔｅｓｔ）を算出し、変数ｃＧＥｒｒｏｒに代入する（ステップＳ１０５）。ここで、ステップＳ１０５で式（３）を用いる際には、ｆには、ステップＳ１０４の手順３で既に算出（学習）した静的特性モデル、すなわち、特徴量を入力として静的特性因子を予測するための関数ベクトル（ｙ_１、ｙ_２、…、ｙ_ｋ）を入力し、ｘには、テスト用データを入力し、ｙには、テスト用データに対応する静的特性データを入力する。なお、ｙ_ｉはｉ番目の静的特性因子を予測するための関数である。

なお、ステップＳ１０４における学習用データとテスト用データとの分割方法を変更しながら、ステップＳ１０４とステップＳ１０５とを繰り返し実行し、汎化誤差Ｅの平均値を算出して、算出した平均値を変数ｃＧＥｒｒｏｒに代入するようにしてもよい。

次いで、静的特性情報モデリング部１２０は、変数ｐＢｅｓｔＧＥｒｒｏｒの値（すなわち、今までで最も小さい汎化誤差の値）が変数ｃＧＥｒｒｏｒの値（直前に算出された汎化誤差の値）より大きいか否かを判定する（ステップＳ１０６）。この結果、変数ｐＢｅｓｔＧＥｒｒｏｒの値が変数ｃＧＥｒｒｏｒの値より大きい場合（ステップＳ１０６：ＹＥＳ）には、直前に算出された汎化誤差がより小さく、静的特性モデルとしてより精度が良いことを意味しているので、静的特性情報モデリング部１２０は、変数ｐＢｅｓｔＧＥｒｒｏｒに変数ｃＧＥｒｒｏｒの値を代入し、オブジェクトｐＢｅｓｔＭにオブジェクトＭを代入し（ステップＳ１０７）、処理をステップＳ１０８に進める。一方、変数ｐＢｅｓｔＧＥｒｒｏｒの値が変数ｃＧＥｒｒｏｒの値より大きくない場合（ステップＳ１０６：ＮＯ）には、静的特性情報モデリング部１２０は、そのまま処理をステップＳ１０８に進める。

次いで、ステップＳ１０８では、静的特性情報モデリング部１２０は、変数ｃｏｕｎｔｅｒが閾値以下であるか否かを判定する。

この結果、変数ｃｏｕｎｔｅｒが閾値以下である場合（ステップＳ１０８：ＹＥＳ）には、所定回を超えて処理を繰り返していないことを意味しているので、静的特性情報モデリング部１２０は、変数ｃｏｕｎｔｅｒをインクリメント（＋１）し（ステップＳ１０９）、ステップＳ１０２からの処理を再び実行する。なお、静的特性情報モデリング部１２０は、ステップＳ１０２からの処理を再度実行する場合には、ステップＳ１０２での特徴量の選択、及びステップＳ１０３での静的特性因子の選択においては、既に処理対象として選択した静的特性因子及び特徴量の組み合わせを再び選択しないようにしている。

一方、変数ｃｏｕｎｔｅｒの値が閾値以下でない場合（ステップＳ１０８：ＮＯ）には、所定回を超えて処理を繰り返したことを意味しているので、静的特性情報モデリング部１２０は、オブジェクトｐＢｅｓｔＭに含まれる変数に関する情報（すなわち、処理をした中で最も汎化誤差が小さい静的特性モデルの情報）を静的特性モデル記憶部２４に記録するとともに、ステップＳ１００で決定した特徴量の算出式と、オブジェクトｐＢｅｓｔＭの内容に基づいて特徴量生成ファイル２７０を作成し（ステップＳ１１０）、処理を終了する。

この静的特性モデル生成処理によると、複数の静的特性モデルの内の静的特性データの汎化誤差が最も小さい静的特性モデルが、以降の処理で使用する静的特性モデルに決定されることとなる。なお、上記例では、複数の静的特性モデルの内の静的特性データの汎化誤差が最も小さい静的特性モデルが、以降の処理で使用する静的特性モデルに決定されていたが、例えば、汎化誤差が所定の閾値以下の静的特性モデルを以降の処理で使用する静的特性モデルに決定するようにしてもよい。

次に、静的特性モデル生成処理の具体例を示す。具体例では、製品の不良を判定するためのタスクを対象としたモデル生成の処理であり、製品毎にモデルが構築されているものとする。対象のタスクは、タスクＩＤが１、２、３、４の４種類であり、各タスクの静的特性データ及び観測データを用いて静的特性モデルを生成する。静的特性データは、部位Ａ幅、部位Ｂ幅、原料Ｘ分量の３種類に関する静的特性因子を含むデータであり、観測データは、温度Ａセンサ、温度Ｂセンサ、風量Ａセンサ、及び風量Ｂセンサから一定の期間内に収集された数値データである。特徴量は、センサ毎に算出された平均値及び最大値であり、ステップＳ１０８で使用する閾値は２であり、ステップＳ１０４の手順４での汎化誤差Ｅの分散に対する閾値は、１．５である。

静的特性情報モデリング部１２０は、ステップＳ１００で、観測データ記憶部２２から温度Ａセンサ、温度Ｂセンサ、風量Ａセンサ、風量Ｂセンサの４種類に関する数値データを受理し、４種類のデータに関して、センサ毎に平均値及び最大値を算出する。この結果、タスクＩＤが１、２、３、４のそれぞれのタスクに関して、センサ毎に平均値及び最大値が特徴量として算出される。特徴量を算出した結果、例えば、温度Ａセンサの平均値として、タスクＩＤが１、２、３、４の順にそれぞれ１０、２０、２５、１５が算出される。

静的特性情報モデリング部１２０は、ステップＳ１０１で、変数ｃｏｕｎｔｅｒに１を代入し、変数ｃＧＥｒｒｏｒ及び変数ｐＢｅｓｔＧＥｒｒｏｒに無限大を代入し、オブジェクトＭ及びオブジェクトｐＢｅｓｔＭに空の値を代入する。

次いで、静的特性情報モデリング部１２０は、ステップＳ１０２で、特徴量を選択する。例えば、静的特徴モデリング部１２０は、温度Ａセンサにおける平均値と、風量Ａセンサの平均値とを選択する。

次いで、静的特性情報モデリング部１２０は、ステップＳ１０３で、静的特性因子を選択する。例えば、静的特性情報モデリング部１２０は、例えば、部位Ａ幅と原料Ｘ分量とを選択する。

次いで、静的特性情報モデリング部１２０は、ステップＳ１０４で、観測データ及び静的特性データを学習用データとテスト用データとに分割する。分割した結果、例えば、タスクＩＤが１、２、３であるタスクについての観測データ及び静的特性データが学習用データとされ、タスクＩＤが４であるタスクについての観測データ及び静的特性データがテスト用データとされて分割される。

次いで、静的特性情報モデリング部１２０は、マルチアウトプット回帰を実施し、静的特性モデルを算出する。この結果、静的特性モデルとして、例えば、以下の式（４）及び式（５）が得られる。

ここで、ｙ_{ｐａｒｔ＿ａ}，ｙ_{ｍａｔｅｒｉａｌ＿ｘ}，Ｘ_{ｍｅａｎ（ｔｅｍｐ＿１）}，Ｘ_{ｍｅａｎ（ａｉｒ＿ａ）}は、それぞれ部位Ａ幅、原料Ｘ分量、温度Ａセンサにおける平均値、風量Ａセンサの平均値を示す変数である。

次いで、静的特性情報モデリング部１２０は、式（４）及び式（５）に関する変数及びパラメータをオブジェクトＭに代入する。なお、この例では、変数及びパラメータをオブジェクトＭに格納するようにしているが、例えば、変数及びパラメータを含む式自体をオブジェクトＭに格納するようにしてもよい。

次いで、静的特性情報モデリング部１２０は、ステップＳ１０５で、タスクＩＤが４であるタスクについての特徴量を式（４）及び式（５）に代入し、式（３）を用いて汎化誤差を算出する。例えば、タスクＩＤが４であるタスクの部位Ａ幅、原料Ｘ分量、温度Ａセンサにおける平均値、風量Ａセンサの平均値がそれぞれ５．５、８、８０、１０であったとすると、これら値と、式（３）、式（４）、式（５）を用いて汎化誤差を算出すると、汎化誤差は、（（０．１５＊８０＋０．０１＊１０）−５．５）^２＋（（０．０２＊８０＋０．７＊１０）−８）^２＝４３．９２と算出される。

静的特性情報モデリング部１２０は、ステップＳ１０６で、変数ｐＢｅｓｔＧＥｒｒｏｒと変数ｃＧＥｒｒｏｒの値を比較する。変数ｐＢｅｓｔＧＥｒｒｏｒの値が無限大、変数ｃＧＥｒｒｏｒの値が４３．９２であり、変数ｐＢｅｓｔＧＥｒｒｏｒの値の方が大きいため、処理は、ステップＳ１０７に移る。

静的特性情報モデリング部１２０は、ステップＳ１０７で、変数ｐＢｅｓｔＧＥｒｒｏｒに変数ｃＧＥｒｒｏｒの値である４３．９２を代入し、オブジェクトｐＢｅｓｔＭにオブジェクトＭを代入する。

次いで、静的特性情報モデリング部１２０は、ステップＳ１０８で、変数ｃｏｕｎｔｅｒの値を閾値と比較する。この例では、変数ｃｏｕｎｔｅｒの値が１、閾値が２であり、変数ｃｏｕｎｔｅｒが閾値以下であるために、処理はステップＳ１０９に移る。

静的モデリング部１２０は、ステップＳ１０９で、変数ｃｏｕｎｔｅｒをインクリメントして２とし、ステップＳ１０２を実行する。

静的特性情報モデリング部１２０は、２度目のステップＳ１０２を実行し、その後ステップＳ１０６まで実行する。ここで、この結果、変数ｐＢｅｓｔＧＥｒｒｏｒが変数ｃＧＥｒｒｏｒ以下であるとすると、静的特性情報モデリング部１２０は、ステップＳ１０８及びステップＳ１０９を実行し、変数ｃｏｕｎｔｅｒの値を３にする。

次に、静的特性情報モデリング部１２０は、３度目のステップＳ１０２を実行し、その後ステップＳ１０６まで実行する。この結果、変数ｐＢｅｓｔＧＥｒｒｏｒが変数ｃＧＥｒｒｏｒ以下であるとすると、静的特性情報モデリング部１２０は、ステップＳ１０８を実行する。変数ｃｏｕｎｔｅｒが３であり、閾値２よりも大きいため、静的特性情報モデリング部１２０は、処理をステップＳ１１０に進め、オブジェクトｐＢｅｓｔＭに含まれる情報を静的特性モデル記憶部２４に記録し、処理を終了する。具体的には、静的特性情報モデリング部１２０は、式（４）及び式（５）に含まれる変数名及び重みの値を記録する。

上記した静的特性モデル生成処理によると、分析モデル転移可能性判定装置１は、静的特性因子とセンサとの相関関係を定式的に表現することができ、静的特性因子の変化に伴う観測データの変化を理解することができる。これによって、製品の規格の相違に伴う製造パラメータの変化を理解することができ、さらには製造パラメータに基づいて生成された分析モデルが製品間で再利用可能か否かの判断に利用することができる。

次に、図１０のステップＳ１２に対応する転移元データ選択処理について詳細に説明する。

図１２は、一実施形態に係る転移元データ選択処理の一例を示すフローチャートである。

まず、転移元データ選択部１３０は、データ入力部１１０から転移先タスクに関する静的特性レコードを受理した後、転移元タスクに関する静的特性レコード群を静的特性データ記憶部２１から取得する（ステップＳ２００）。

転移元データ選択部１３０は、変数ＮｅａｒｅｓｔＤｉｓｔに無限大、変数ＴＩＤに−１を代入する（ステップＳ２０１）。

次いで、転移元データ選択部１３０は、転移元タスクに関する静的特性レコード群の中から静的特性レコードを１種類選択する（ステップＳ２０２）。

次いで、転移元データ選択部１３０は、転移先タスクの静的特性レコードと、選択した転移元タスクに関する静的特性レコードとの距離を算出し、算出した値を変数Ｄｉｓｔに代入する（ステップＳ２０３）。ここで、各レコードの間で算出される距離としては、例えば、ユークリッド距離としてもよく、コサイン類似度を用いてもよく、その他いかなる方法で算出された距離を用いてもよい。

次いで、転移元データ選択部１３０は、変数ＮｅａｒｅｓｔＤｉｓｔが変数Ｄｉｓｔより大きいか否かを判定する（ステップＳ２０４）。この結果、変数ＮｅａｒｅｓｔＤｉｓｔが変数Ｄｉｓｔの値より大きい場合（ステップＳ２０４：ＹＥＳ）には、転移元データ選択部１３０は、処理をステップＳ２０５に移し、変数ＮｅａｒｅｓｔＤｉｓｔが変数Ｄｉｓｔの値より大きくない場合（ステップＳ２０４：ＮＯ）には、処理をステップＳ２０６に移す。

ステップＳ２０５では、転移元データ選択部１３０は、変数ＮｅａｒｅｓｔＤｉｓｔに変数Ｄｉｓｔの値を代入し、変数ＴＩＤに、選択した転移元の静的特性レコードのＴＩＤを代入し、処理をステップＳ２０６に移す。

ステップＳ２０６では、転移元データ選択部１３０は、転移元の静的特性レコード群の全レコードを処理対象として選択したか否かを判定する。この結果、転移元の静的特性レコード群の全レコードを処理対象として選択した場合（ステップＳ２０６：ＹＥＳ）には、転移元データ選択部１３０は、処理をステップＳ２０７に移し、転移元の静的特性レコード群の全レコードを処理対象として選択していない場合（ステップＳ２０６：ＮＯ）には、処理をステップＳ２０２に移す。

ステップＳ２０７では、転移元データ選択部１３０は、転移元及び転移先に係るＴＩＤの値をデータ拡張部１４０に出力し、その後処理を終了する。

次に、転移元データ選択処理の具体例を示す。具体例では、製品の不良を判定するためのタスクを対象としたモデルの生成における転移元データ選択処理であり、転移元タスクの製品についてはモデルが構築されているものとする。対象のタスクは、タスクＩＤが１、２、３、４、５の５種類であり、タスクＩＤが５のタスクを転移先タスクとし、その他のタスクを転移元タスクとする。静的特性レコードは、部位Ａ幅、部位Ｂ幅、原料Ｘ分量の３種類に関する静的特性因子を含むものとする。

転移元データ選択部１３０は、ステップＳ２００で、データ入力部１１０からタスクＩＤが５である転移先タスクに関する静的特性レコードを受理し、その後、静的特性データ記憶部２１からタスクＩＤが１、２、３、４である転移元タスクに関する静的特性レコードを受理する。

次いで、転移元データ選択部１３０は、ステップＳ２０１で、変数ＮｅａｒｅｓｔＤｉｓｔに無限大、変数ＴＩＤに−１を代入する。

次いで、転移元データ選択部１３０は、ステップＳ２０２で、タスクＩＤが１である転移元タスクに関する静的特性レコードを選択する。

次いで、転移元データ選択部１３０は、ステップＳ２０３で、転移先タスクと転移元タスクとの静的特性レコードに関する距離を求める。ここで、転移先タスクの静的特性レコードは、部位Ａ幅、部位Ｂ幅、原料Ｘ分量の順に“１．０”、“１０”、“１０”であり、転移元タスクの静的特性レコードは、部位Ａ幅、部位Ｂ幅、原料Ｘ分量の順に、“０．８”、“１０”、“１５”であるとする。また、転移先タスクと転移元タスクとの静的特性レコードに関する距離は、ユークリッド距離とする。この場合において、転移元データ選択部１３０は、（１．０−０．８）^２＋（１０−１０）^２＋（１０−１５）^２の平方根を算出し、転移先タスクと転移元タスクとの静的特性レコードの距離は５．００と算出される。その後、転移元データ選択部１３０は、変数Ｄｉｓｔに５．００を代入する。

次いで、転移元データ選択部１３０は、ステップＳ２０４で、変数ＮｅａｒｅｓｔＤｉｓｔと変数Ｄｉｓｔとを比較する。この比較の結果、この例では、変数ＮｅａｒｅｓｔＤｉｓｔの値の方が大きいため、転移元データ選択部１３０は、処理をステップＳ２０５に移す。

次いで、転移元データ選択部１３０は、ステップＳ２０５で、変数ＮｅａｒｅｓｔＤｉｓｔに変数Ｄｉｓｔの５．００を代入し、変数ＴＩＤに転移元タスクのＴＩＤである１を代入する。

次いで、転移元データ選択部１３０は、ステップＳ２０６で、転移元の静的特性レコード群の全レコードを処理対象として選択したか否かを判定する。この例では、転移元の静的特性レコード群のうちＴＩＤが２、３、４であるタスクに関する静的特性レコードを未だ選択していないために、転移元データ選択部１３０は、処理をステップＳ２０２に移す。

この後、転移元データ選択部１３０は、ステップＳ２０２〜ステップＳ２０６までの処理を３回繰り返し、ＴＩＤが２、３、４である転移元タスクに関する静的特性レコードのそれぞれと、転移先タスクに関する静的特定レコードとの距離を算出する。

そして、転移元データ選択部１３０は、ステップＳ２０６で、転移元の静的特性レコード群の全レコードを選択し終えたことを確認した後、処理をステップＳ２０７に移す。

転移元データ選択部１３０は、ステップＳ２０７で、転移先及び転移元に関するＴＩＤの値をデータ拡張部１４０に出力する。この例においては、転移元データ選択部１４０は、転移先タスクのＴＩＤである５と、転移元タスクのＴＩＤである１とを出力する。

上記した転移元データ選択処理によると、モデル転移可能性判定装置１は、複数の転移元タスクの中から転移先タスクに転移することが容易なタスクを選択することができ、ユーザが転移元タスクを選択する工数を削減することができる。

次に、図１０のステップＳ１３に対応する転移先データ拡張処理について詳細に説明する。

図１３は、一実施形態に係る転移先データ拡張処理の一例を示すフローチャートである。

まず、データ拡張部１４０は、転移元データ選択部１３０から転移元及び転移先に係るＴＩＤの値を受理する。その後、データ拡張部１４０は、転移元のＴＩＤに基づいて転移元の静的特性レコードを取得し、転移先のＴＩＤに基づいて転移先の観測データを取得する。また、データ拡張部１４０は、静的特性モデル記憶部２４から静的特性モデルに関する情報を取得する（ステップＳ３００）。

次いで、データ拡張部１４０は、ステップＳ３００で取得した観測データを用いて特徴量を算出する。また、データ拡張部１４０は、変数ｅｐｏｃｈに１を代入する（ステップＳ３０１）。

次いで、データ拡張部１４０は、ステップＳ３０１で算出した特徴量（説明変数）に基づいて静的特性因子に関する予測値（目的変数）を算出する（ステップＳ３０２）。

次いで、データ拡張部１４０は、以下の式（６）及び式（７）に基づいて特徴量を更新する（ステップＳ３０３）。

ここで、式（６）において、ｘ^ｉｔｅｒはｉｔｅｒ回目の繰り返しにおける特徴量ベクトル（ｘ_１ ^ｉｔｅｒ、ｘ_２ ^ｉｔｅｒ、…、ｘ_ｍ ^ｉｔｅｒ）であり、ｍは特徴量の数である。また、Ｈ（ｘ^ｉｔｅｒ）は、ｘ^ｉｔｅｒにおけるヤコビ行列である。ｆ（ｘ^ｉｔｅｒ）は、式（７）のｘにｘ^ｉｔｅｒを代入した際に得られるベクトルである。
また、式（７）において、ｙ（ｘ）は静的特性因子の予測値に関するベクトル（ｙ_１（ｘ）、ｙ_２（ｘ）、…、ｙ_ｋ（ｘ））であり、ｙ_ｉ（ｘ）はｉ番目の静的特性因子に関する予測値である。また、ｘは、特徴量ベクトル（ｘ_１、ｘ_２、…、ｘ_ｊ）であり、ｊは、特徴量の数である。また、ｙ_{ｔｒ＿ｓｒｃ}は、転移元タスクの静的特性因子の実測値を示すベクトル（ｙ_{ｔｒ＿ｓｒｃ，１}、ｙ_{ｔｒ＿ｓｒｃ，2}、…、ｙ_{ｔｒ＿ｓｒｃ，m}）であり、ｍは、静的特性因子の数である。

次いで、データ拡張部１４０は、変数ｅｐｏｃｈ（エポック数）が閾値以下であるか否かを判定する（ステップＳ３０４）。この結果、変数ｅｐｏｃｈが閾値以下である場合（ステップＳ３０４：ＹＥＳ）には、データ拡張部１４０は、変数ｅｐｏｃｈをインクリメントし（ステップＳ３０５）、処理をステップＳ３０２に移す。一方、変数ｅｐｏｃｈが閾値以下でない場合（ステップＳ３０４：ＮＯ）には、データ拡張部１４０は、処理をステップＳ３０６に移す。

上記したステップＳ３０２〜Ｓ３０５によると、転移先タスクに関する観測データに基づく特徴量を静的特性モデルの説明変数の初期値とし、転移元タスクに関する静的特性データの値と静的特性モデルの出力値との差を低減するように、反復法により、静的特性モデルの説明変数の解を算出することとなる。

ステップＳ３０６では、データ拡張部１４０は、更新後の特徴量もしくは更新後の特徴量を反映した観測データを拡張観測データとして転移元モデル評価部１５０に出力する。更新後の特徴量を反映する方法としては、例えば、ユーザによって与えられ、特徴量が温度センサの平均値であり、拡張前の特徴量の値が１０、拡張後の特徴量の値が２０である場合、温度センサの観測データの値全てに１０を加算するようにしてもよい。

次に、転移先データ拡張処理の具体例を示す。具体例では、変数ｅｐｏｃｈ用の閾値を１００とする。データ拡張部１４０は、ステップＳ３００で、転移元データ選択部１３０から転移元及び転移先のＴＩＤを受理する。ここで、転移元のＴＩＤとして１を受理し、転移先のＴＩＤとして５を受理した場合を例とする。

その後、データ拡張部１４０は、ＴＩＤが１である静的特性レコードを取得する。この結果、例えば、部位Ａ幅、部位Ｂ幅、原料Ｘ分量がそれぞれ“０．８”、“１０”、“１５”である静的特性レコードが取得される。

また、データ拡張部１４０は、ＴＩＤが５である観測データを取得する。この結果、図４に示す観測データテーブル２２０における収集時刻、ＴＩＤ、不良判定等に関するレコード群が取得される。

さらに、データ拡張部１４０は、静的特性モデル記憶部２４から静的特性モデルに関する情報を取得する。この結果、静的特性モデルを構成する静的特性因子である“部位Ａ幅”と“原料Ｘ”や、“部位Ａ幅”を予測するための特徴量名“ｘ_１”、“ｘ_２”及びそれら特徴量への重み“０．１５”、“０．０１”が取得される。また、静的特性モデルの特徴量“ｘ_１”及び“ｘ_２”の算出式が記載された特徴量生成ファイル２７０が取得される。

データ拡張部１４０は、ステップＳ３０１で、特徴量を算出し、変数ｅｐｏｃｈに１を代入する。特徴量の算出方法に関して、具体的には、ステップＳ３００で取得した特徴量生成ファイル２７０のｉｎｐｕｔ２７６に記載されている観測データ名と一致する観測データに関するレコードを転移先の観測データから取得し、ｌｏｇｉｃ２７７に記載の数式に観測データ名に関するレコードを適用し、転移元モデルで用いられる特徴量を算出する。例えば、ｆｅａｔｕｒｅ＿ｎａｍｅ２７５が“ｘ_１”である特徴量の算出方法について、ｉｎｐｕｔ２７６に記載されている“‘温度Ａ’、‘風量Ａ’”に従い、“温度Ａ”及び“風量Ａ”に関するレコードが転移先の観測データから取得され、ｌｏｇｉｃ２７７に記載されているロジック、すなわち“Ｍｅａｎ（‘温度Ａ’）＋１．５＊Ｍｅａｎ（‘風量Ａ’）”に従い、“温度Ａ”に関する観測データの平均値に対して“風量Ａ”に関する観測データの平均値を１．５倍した値を加算した値が算出される。特徴量ｘ_２についても、特徴量ｘ_１と同様の手順で算出される。

次いで、データ拡張部１４０は、ステップＳ３０２で、ステップＳ３０１で算出した特徴量を静的特性モデルに代入し、静的特性因子の予測値を算出する。この結果、静的特性モデルに含まれる静的特性因子である“部位Ａ幅”と“原料Ｘ”について、“部位Ａ幅”の予測値として、例えば、０．１５＊２１．０＋０．０１＊１２．５４＝３．２７５が算出され、“原料Ｘ”の予測値として、例えば、０．０２＊２１．０＋０．７＊１２．５４＝９．１９８が算出される。

データ拡張部１４０は、ステップＳ３０３で、式（６）及び式（７）に基づいて特徴量を更新する。式（７）において、ベクトルｙ（ｘ）は（３．２７５、９．１９８）であり、ベクトルｙ_{ｔｒ＿ｓｒｃ}は、（０．８、１５．０）であるため、ベクトルｆ（ｘ）は（２．４７５、−５．８０２）と算出される。また、式（６）のヤコビ行列Ｈの逆行列について、行列成分ａ_ｉ，ｊがそれぞれａ_１，１＝−１．２７２、ａ_１，２＝０．１８２、ａ_２，１＝０．０３６、ａ_２，２＝−０．２７３である２×２行列が算出される。以上の結果を用いて式（６）を計算した結果、特徴量ｘ_１及びｘ_２の更新値として、２５．２０４及び１０．８６７が算出される。

データ拡張部１４０は、ステップＳ３０４で、変数ｅｐｏｃｈの値１と、閾値である１００とを比較し、変数ｅｐｏｃｈの値が閾値以下であるために、ステップＳ３０５を実行する。

データ拡張部１４０は、ステップＳ３０５で、変数ｅｐｏｃｈにインクリメントをして、２とし、ステップＳ３０２を実行する。

データ拡張部１４０は、変数ｅｐｏｃｈの値が閾値である１００に達するまでステップＳ３０２からステップＳ３０５を繰り返し、変数ｅｐｏｃｈの値が１０１である状態でステップＳ３０４を実行すると、処理がステップＳ３０６に移る。

データ拡張部１４０は、ステップＳ３０６で特徴量を出力する。これにより、データ拡張部１４０は、例えば、特徴量ｘ_１が３．９、特徴量ｘ_２が２１．１４である特徴量ベクトル（ｘ_１、ｘ_２）を出力する。

上記した転移先データ拡張処理によると、分析モデル転移可能性判定装置１は、転移先タスクに係る観測データを転移元に係る分析モデルに適合しやすいデータに適切に変換することができる。これにより、転移元の観測データと転移先の観測データとの特徴が類似していない場合においても、転移学習を適用することが可能になる。

次に、図１０のステップＳ１４に対応する性能評価処理について詳細に説明する。

図１４は、一実施例に係る性能評価処理の一例を示すフローチャートである。

転移元モデル評価部１５０は、データ拡張部１４０から拡張観測データを受理し、その後、転移元タスクに係るＴＩＤに基づいて分析モデル記憶部２３から転移元の分析モデルを取得する（ステップＳ４００）。

転移元モデル評価部１５０は、式（３）のｆ、ｘ、及びｙにそれぞれ、転移元の分析モデル（転移元モデルともいう）、拡張観測データ、及び転移先の観測データに対応する不良判定結果を入力することによって、汎化誤差を算出する（ステップＳ４０１）。

転移元モデル評価部１５０は、転移先に係る観測データの転移元モデルに対する汎化誤差を、拡張観測データの転移元モデルに対する汎化誤差で除算することによって転移後性能向上率を算出し、また、転移元に係る観測データの転移元モデルに対する汎化誤差を、拡張観測データの転移元モデルに対する汎化誤差で除算することによって転移可能性を算出する（ステップＳ４０２）。

次に、性能評価処理の具体例を示す。

転移元モデル評価部１５０は、ステップＳ４００で、拡張観測データを受理し、また、転移元モデルを取得する。この結果、例えば、ｘ_１が０．０３であり、ｘ_２が１．５４である拡張観測データが受理される。また、図５の分析モデルテーブル２３０におけるＴＩＤが１であるレコードが取得される。すなわち、ベースモデル名が“ｋ−ＮＮ”であり、モデルパラメータリストが“ｋ：１、ｍｅｔｒｉｃ：‘ｍｉｎｋｏｗｓｋｉ’”であり、特徴量生成ファイルへのパスが“ｐｒｏｄｕｃｔ＿ｘ／ｔｙｐｅ＿ａ．ｊｓｏｎ”であるレコードが取得される。

次いで、転移元モデル評価部１５０は、ステップＳ４０１で、ステップＳ４００で取得された転移元モデルに関するレコード、拡張観測データ、及び転移先の観測データに対応する不良判定の実測値を式（３）に入力して汎化誤差を算出する。

具体的には、まず、転移元モデル評価部１５０は、転移元モデルに関するレコードに含まれるベースモデル名に記載の統計・機械学習手法にモデルパラメータリストに記載のパラメータ値を入力し、その後、算出したｎ個の拡張観測データを入力することによって、ｎ種類の不良判定に関する予測結果を得る。例えば、転移元モデル評価部１５０は、ベースモデル名に記載のｋ近傍法（ｋ−ｎｅａｒｅｓｔｎｅｉｇｈｂｏｒ；ｋ−ＮＮ）において、この手法のパラメータであるｋに１を入力し、また、ｍｅｔｒｉｃとして“ｍｉｎｋｏｗｓｋｉ”を選択する。次いで、転移元モデル評価部１５０は、ｋ近傍法にｎ種類の拡張観測データを１種類ずつ入力することによって、良品を意味する予測値である“０”等のｎ個の予測値を取得する。その後、転移元モデル評価部１５０は、予測値と拡張観測データに関する判定結果の実測値を式（３）に入力することによって、汎化誤差を算出する。例えば、３種類の予測値が順に“０”、“１”、“０”であり、拡張観測データに関する実測値が順に“０”、“０”、“０”である場合、汎化誤差として（（０−０）^２＋（１−０）^２＋（０−０）^２）／３＝０．３３が求められる。

次に、転移元モデル評価部１５０は、ステップＳ４０２で、転移後性能向上率、転移可能性を算出する。転移後性能向上率は、例えば、ステップＳ４０１で算出された拡張観測データの転移元モデルに対する汎化誤差が０．３３であり、転移先に係る観測データの転移元モデルに対する汎化誤差が０．３２２である場合、０．３３／０．３２２＝１．０２と算出される。転移可能性（評価結果）は、例えば、転移元に係る観測データの転移元モデルに対する汎化誤差が０．３０５である場合に、０．３０５／０．３３＊１００＝９２％と算出される。なお、以降に行われる図１０のステップＳ１５おいては、例えば、転移可能性に関する閾値が９０％である場合には、転移可能性９２％は閾値９０％以上であるために閾値以上と判定され、転移可能フラグ（“ＯＫ”）が立てられる。ステップＳ４０２で算出された転移後性能向上率及び転移可能性と、ステップＳ１５での転移可能フラグ（転移可能判定結果）とは、例えば、転移元モデル評価部１５０により、後述する転移可能性判定結果画面９０（図１７参照）に表示される。

上記した性能評価処理によると、分析モデル転移可能性判定装置１は、転移先のタスクに転移元モデルを転移することが可能か否かを容易且つ適切に判定することができる。

次に、モデル転移可能性判定装置１により表示される各種画面について説明する。

図１５は、データ入力画面の一例を示す図である。

データ入力画面７０は、データ入力部１１０によりユーザＩ／Ｆ５０に表示され、静的特性データ及び観測データを入力するための画面である。データ入力画面７０は、静的特性データ入力欄７００、観測データ入力欄７０１、転移可能性判定ボタン７０２、及び分析モデル情報登録画面への遷移ボタン７０３を含む。

静的特性データ入力欄７００は、静的特性データを入力するための欄である。静的特性データ入力欄７００では、静的特性因子とその値との組の入力を受け付ける。観測データ入力欄７０１は、観測データを格納しているファイル又はディレクトリを指定（入力）するための欄である。転移可能性判定ボタン７０２は、静的特性データ入力欄７００及び観測データ入力欄７０１に記載されたデータに係るタスクへの転移が可能な分析モデルを選択し、この分析モデルの転移可能性を算出する処理（上記したメイン処理）を起動させるためのボタンである。転移可能性判定ボタン７０２が押下されると、メイン処理が実行される。分析モデル情報入力画面への遷移ボタン７０３は、分析モデル情報入力画面８０（図１６参照）へ画面遷移させる処理を起動させるためのボタンである。分析モデル情報入力画面への遷移ボタン７０３が押下されると、データ入力部１１０は、分析モデル情報入力画面８０を表示する。

例えば、図１５に示すデータ入力画面７０においては、静的特性データ入力欄７００には、“部位Ａ幅”、“部位Ｂ幅”、“原料Ｘ割合”、“原料Ｙ割合”の４種類の静的特性因子に関する入力欄には、“０．８”、“１０”、“１５％”、“３％”等の静的特性因子の値が入力されている。また、観測データ入力欄７０１には、観測データが格納されているディレクトリ名である“ｐｒｏｄｕｃｔ＿ｘ／ｓｅｎｓｏｒ＿ｄａｔａ”が入力されている。

次に、分析モデル情報入力画面８０について説明する。

図１６は、分析モデル情報入力画面の一例を示す図である。

分析モデル情報入力画面８０は、分析モデルに関する情報を入力する画面である。分析モデル情報入力画面８０は、ベースモデル名入力欄８００、モデルパラメータ入力欄８０１、特徴量生成ファイル入力欄８０２、データ入力画面への遷移ボタン８０３、静的特性モデル生成ボタン８０４を含む。ベースモデル名入力欄８００は、分析モデルを生成するために用いた手法の名前を入力するための欄である。モデルパラメータ入力欄８０１は、ベースモデル名入力欄８００に入力された手法名の手法に係るパラメータ名と、このパラメータの値とを入力するための欄である。特徴量生成ファイル欄８０２は、特徴量生成ファイル２７０へのパスを入力するための欄である。データ入力画面への遷移ボタン８０３は、データ入力画面７０に画面遷移する処理を起動させるためのボタンである。データ入力画面への遷移ボタン８０３が押下されると、データ入力部１１０は、データ入力画面７０を表示する。静的特性モデル生成ボタン８０４は、静的特性モデルを生成する処理を起動させるためのボタンである。

例えば、図１６に示す分析モデル情報入力画面８０においては、ベースモデル名入力欄８００には“ｋ−ＮＮ”が入力されている。また、モデルパラメータ入力欄８０１には、パラメータ名が“ｋ”と、このパラメータの値を示す“１”とが入力されている。特徴量生成ファイル入力欄８０２には、特徴量生成ファイル２７０のパスである“ｐｒｏｄｕｃｔ＿ｘ／ｔｙｐｅ＿ａ．ｊｓｏｎ”が入力されている。

次に、転移可能性判定結果画面について説明する。

図１７は、転移可能性判定結果画面の一例を示す図である。

転移可能性判定結果画面９０は、転移可能性の判定結果に係る情報を出力するための画面である。転移可能性判定結果表示画面９０は、転移可能性判定結果表示欄９１と、データ拡張結果表示欄９２とを含む。転移可能性判定結果表示欄９１は、転移可能性に関する判定結果を表示する欄である。転移可能性判定結果表示欄９１は、転移元ＴＩＤ表示欄９１０、転移後性能向上率表示欄９１１、転移可能性表示欄９１２、及び転移可能性判定結果表示欄９１３を含む。転移元ＴＩＤ表示欄９１０は、転移元タスクに関するＴＩＤを表示するための欄である。転移後性能向上率表示欄９１１は、観測データの拡張前後における性能向上の割合を示す欄であり、例えば、転移後性能向上率２６２が表示される。転移可能性表示欄９１２は、転移元モデルを転移先タスクに転移することができる可能性を表示する欄であり、例えば、転移可能性２６３が表示される。転移可能性判定結果表示欄９１３は、転移元モデルを転移先タスクに転移できるか否かの判定結果を表示する欄であり、転移可能判定結果２６４が表示される。

データ拡張結果表示欄９２は、特徴量を拡張観測データに拡張する方法を示す欄である。データ拡張結果表示欄９２は、拡張対象表示欄９２０、拡張幅表示欄９２１、及び幅算出根拠表示欄９２２を含む。拡張対象表示欄９２０は、拡張の対象となった特徴量の名前を表示する欄である。拡張幅表示欄９２１は、拡張の対象となった特徴量の拡張幅を表示する欄である。幅算出根拠表示欄９２２は、拡張幅表示欄９２１に表示した拡張幅を算出する根拠を示す欄であり、例えば、横軸が拡張対象の特徴量（説明関数）を示し、縦軸が静的特性因子（目標関数）を示す静的特性モデルのグラフが表示され、このグラフ上において、転移先タスクに関するデータ（第２観測データ）及び、転移先タスクに関するデータ（拡張観測データ：図中移転元に対応）がプロットされている。なお、縦軸の静的特性因子の種類は、ユーザが選択可能としてもよい。

例えば、図１７に示す転移可能性判定結果表示画面９０の転移可能性判定結果表示欄９１には、転移元ＴＩＤ表示欄９１０が“１”であり、転移後性能向上率表示欄９１１が “１．０２”であり、転移可能性表示欄９１２が“９２％”であり、転移可能判定結果表示欄９１３が“ＯＫ”であるエントリが表示されている。また、データ拡張結果表示欄９２には、拡張対象表示欄９２０が“風量Ａ平均値”であり、拡張幅表示欄９２１が“１５．２”であり、幅算出根拠表示欄９２２にＳ字型の関数グラフが表示されているエントリを含む複数のエントリが表示されている。

この転移可能性判定結果表示画面９０によると、転移可能性判定結果表示欄９１を参照することにより、ユーザは転移元タスクの分析モデルについての転移後性能向上率や、転移可能性や、転移可能性の判定結果を適切に把握することができる。また、データ拡張結果表示欄９２を参照することにより、ユーザは拡張対象の特徴量と、拡張幅、及び拡張幅の算出根拠を適切に把握することができる。

なお、本発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。

例えば、上記実施形態において、転移後性能向上率や、転移可能性や、転移可能性の判定結果を表示させた転移元モデルの中から、転移先タスクに使用する転移元モデルの指定をユーザから受け付け、指定された転移元モデルを用いて、転移先タスクにおける不良判定を行うようにしてもよい。具体的には、プロセッサ３０は、ユーザから、所定の転移先タスクへ転移させる転移元タスクの分析モデルの指定を受け付け、転移先タスクに関する観測データを新たに受理し、観測データから転移元タスクの分析モデルに対応する拡張観測データを生成し、拡張観測データを転移元タスクの分析モデルに入力して、転移先タスクでの不良判定を行うようにしてもよい。この場合には、プロセッサ３０が、指定受付部と、不良判定部とに対応する。このようにすると、指定した転移元モデルを使用して、転移先タスクにおける不良判定を容易且つ適切に行うことができる。

また、上記実施形態において、プロセッサが行っていた処理の一部又は全部を、ハードウェア回路で行うようにしてもよい。また、上記実施形態におけるプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア（例えば可搬型の記憶メディア）であってもよい。

１…分析モデル転移可能性判定装置、１０…メモリ、１１…モデル転移可能性判定プログラム、２０…ストレージ、２１…静的特性データ記憶部、２２…観測データ記憶部、２３…分析モデル記憶部、２４…静的特性モデル記憶部、２５…拡張データ記憶部、２６…モデル転移可能性記憶部、３０…プロセッサ、４０…ネットワークＩ／Ｆ、５０…ユーザＩ／Ｆ、１１０…データ入力部、１２０…静的特性情報モデリング部、１３０…転移元データ選択部、１４０…データ拡張部、１５０…転移元モデル評価部

Claims

転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する転移可能性判定装置であって、
前記転移元タスクの対象物及び／又は事象に関する静的な特性を示す第１静的特性データと、前記転移元タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第１観測データとの入力を受け付けるデータ入力部と、
前記第１静的特性データを目的変数とし、前記第１観測データに関する特徴量を説明変数として、静的特性モデルを生成する静的特性情報モデリング部と、
転移先タスクの対象物及び／又は事象に関する静的な特性を示す第２静的特性データを受理し、前記第１静的特性データと、前記第２静的特性データとの距離に基づいて、複数の第１静的特性データの中から処理に利用する第１静的特性データを選択する転移元データ選択部と、
前記転移先タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第２観測データを受理し、前記第２観測データと、選択された前記第１静的特性データと、前記静的特性モデルとに基づいて、前記分析モデルでの利用に適した拡張観測データを算出するデータ拡張部と、
前記分析モデルに前記拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、前記汎化誤差に基づいて、前記分析モデルの前記転移先タスクへの転移可能性を評価する転移元モデル評価部と、
を備える転移可能性判定装置。
前記転移元モデル評価部は、前記転移可能性の情報を表示させる
請求項１に記載の転移可能性判定装置。
前記静的特性情報モデリング部は、
複数種類の特徴量の中から使用する特徴量を決定して静的特性モデルを生成し、生成した前記静的特性モデルによる静的特性データの汎化誤差を算出する処理を、使用する特徴量の組合せを変えて複数回繰り返し行い、
複数の前記静的特性モデルの内の前記静的特性データの汎化誤差が最も小さい又は所定の閾値以下の静的特性モデルを、使用する静的特性モデルに決定する
請求項１に記載の転移可能性判定装置。
前記静的特性情報モデリング部は、
生成された静的特性モデルで出力される静的特性データの静的特性因子毎に汎化誤差を算出し、汎化誤差が所定の閾値以下となる静的特性因子のみを目的変数とする静的特性モデルを、使用する静的特性モデルに決定する
請求項１に記載の転移可能性判定装置。
前記データ拡張部は、転移先タスクに関する第２観測データに基づく特徴量を前記静的特性モデルの説明変数の初期値とし、転移元タスクに関する選択された前記第１静的特性データの値と前記静的特性モデルの出力値との差を低減するように、反復法により、前記静的特性モデルの説明変数の解を算出し、説明変数の解を拡張観測データとして出力する
請求項１に記載の転移可能性判定装置。
転移元モデル評価部は、前記静的特性モデルの目的変数と説明変数との関係を示すグラフを表示させるとともに、前記グラフに対応させて、前記第２観測データと、前記拡張観測データとを表示させる
請求項１に記載の転移可能性判定装置。
前記転移先タスクへ転移させる転移元タスクの分析モデルの指定を受け付ける指定受付部をさらに備え、
前記データ入力部は、前記転移先タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を新たに観測した第３観測データを受理し、
前記データ拡張部は、前記第３観測データに基づいて、指定された前記分析モデルでの利用に適した拡張観測データを算出し、
指定された前記分析モデルに対して、前記拡張観測データを入力することにより、前記転移先タスクにおける不良判定を行う不良判定部をさらに備える
請求項１に記載の転移可能性判定装置。
転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する転移可能性判定装置による転移可能性判定方法であって、
前記転移元タスクの対象物及び／又は事象に関する静的な特性を示す第１静的特性データと、前記転移元タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第１観測データとの入力を受け付け、
前記第１静的特性データを目的変数とし、前記第１観測データに関する特徴量を説明変数として、静的特性モデルを生成し、
転移先タスクの対象物及び／又は事象に関する静的な特性を示す第２静的特性データを受理し、前記第１静的特性データと、前記第２静的特性データとの距離に基づいて、複数の前記第１静的特性データの中から処理に利用する第１静的特性データを選択し、
前記転移先タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第２観測データを受理し、前記第２観測データと、選択された前記第１静的特性データと、前記静的特性モデルとに基づいて、前記分析モデルでの利用に適した拡張観測データを算出し、
前記分析モデルに前記拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、前記汎化誤差に基づいて、前記分析モデルの前記転移先タスクへの転移可能性を評価する
転移可能性判定方法。
転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する処理をコンピュータに実行させるための転移可能性判定プログラムであって、
前記コンピュータを
前記転移元タスクの対象物及び／又は事象に関する静的な特性を示す第１静的特性データと、前記転移元タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第１観測データとの入力を受け付けるデータ入力部と、
前記第１静的特性データを目的変数とし、前記第１観測データに関する特徴量を説明変数として、静的特性モデルを生成する静的特性情報モデリング部と、
転移先タスクの対象物及び／又は事象に関する静的な特性を示す第２静的特性データを受理し、前記第１静的特性データと、前記第２静的特性データとの距離に基づいて、前記第１静的特性データの中から処理に利用する第１静的特性データを選択する転移元データ選択部と、
前記転移先タスクの対象物及び／又は事象へ作用を及ぼす物及び／又は事象を観測した第２観測データを受理し、前記第２観測データと、選択された前記第１静的特性データと、前記静的特性モデルとに基づいて、前記分析モデルでの利用に適した拡張観測データを算出するデータ拡張部と、
前記分析モデルに前記拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、前記汎化誤差に基づいて、前記分析モデルの前記転移先タスクへの転移可能性を評価する転移元モデル評価部として機能させる
転移可能性判定プログラム。