JP7353940B2 - 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム - Google Patents

転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム Download PDF

Info

Publication number
JP7353940B2
JP7353940B2 JP2019212832A JP2019212832A JP7353940B2 JP 7353940 B2 JP7353940 B2 JP 7353940B2 JP 2019212832 A JP2019212832 A JP 2019212832A JP 2019212832 A JP2019212832 A JP 2019212832A JP 7353940 B2 JP7353940 B2 JP 7353940B2
Authority
JP
Japan
Prior art keywords
data
static characteristic
model
transfer
static
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019212832A
Other languages
English (en)
Other versions
JP2021086241A (ja
Inventor
卓也 小松田
琢也 小田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2019212832A priority Critical patent/JP7353940B2/ja
Priority to TW109126639A priority patent/TWI787640B/zh
Priority to US17/012,395 priority patent/US20210157707A1/en
Publication of JP2021086241A publication Critical patent/JP2021086241A/ja
Application granted granted Critical
Publication of JP7353940B2 publication Critical patent/JP7353940B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3447Performance evaluation by modeling
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0208Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the configuration of the monitoring system
    • G05B23/0213Modular or universal configuration of the monitoring system, e.g. monitoring system having modules that may be combined to build monitoring program; monitoring system that can be applied to legacy systems; adaptable monitoring system; using different communication protocols
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3086Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves the use of self describing data formats, i.e. metadata, markup languages, human readable formats
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • G06F11/328Computer systems status display
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0259Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterized by the response to fault detection
    • G05B23/0283Predictive maintenance, e.g. involving the monitoring of a system and, based on the monitoring results, taking decisions on the maintenance schedule of the monitored system; Estimating remaining useful life [RUL]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Library & Information Science (AREA)
  • Computing Systems (AREA)
  • Automation & Control Theory (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Burglar Alarm Systems (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、或るタスクのために構築した分析モデルを他のタスクのための分析モデルに転移することが可能であるか否かを判定する技術に関する。
センシング技術の向上に伴い、データを利活用して経営効果を得ている事例が増えている。特に、製造業における設備故障予兆や不良品検知の需要は高く、多くの工場で取り組まれている。
不良品検知向けのセンサデータ分析では、まず、製造中の設備から収集した温度や風量等に関するセンサデータを収集し、センサデータの平均や分散等統計量に基づく特徴量を算出し、不良発生前後での特徴量の変化点を識別する分析モデル(分析モデル又は単にモデルと呼ぶ)を構築する。これにより、分析モデルにより自動的に不良発生を検知することが可能となる。
一方、近年、顧客ニーズの多様化により少量多品種製造が求められている。製造品種の変更に伴って製造現場担当者は、温度や風量等の製造パラメータを変更する必要があり、製造パラメータが変わるとセンサデータの変化傾向が異なってくる。そのため、品種毎に分析モデルを構築する必要があり、全品種向けに分析モデルを構築するためには多大な工数を要する。このような背景から、モデル構築の工数削減が要請されている。
モデル構築の工数削減に向けて、過去に分析済みの品種に関するデータや分析モデルを新規の分析対象の品種の分析モデル構築に転移する取組みが行われている。しかし、転移元のデータや分析モデルが転移先の分析モデルに適合しない場合、負の転移(Negative Transfer)が発生する可能性がある。ここで、負の転移とは、転移元と転移先とのデータや分析モデルが互いに類似していないために、転移学習を適用した結果、転移先モデルの性能が低下する現象のことをいう。このために、転移元データが転移先モデルの性能向上に有効か否かを判定することが要請されている。
例えば、特許文献1には、事前ドメインが転移学習に有効であるかを精度よく判定することができる技術が記載されている。特許文献1に記載されている機械学習装置は、各々が所定の条件下における検出対象の特徴を有する複数の学習用データを含む目標ドメインと、前記所定の条件と異なる条件下における検出対象の特徴を有する学習候補データを含む事前ドメインとを取得する取得部と、前記取得部により取得された目標ドメイン及び事前ドメインを用いて転移学習を導入した機械学習を実行して、前記検出対象の検出に用いられる決定木を生成する試行転移学習部と、前記試行転移学習部により生成された決定木を構成する全てのリーフノードを用いて、前記取得部により取得された事前ドメインが転移学習に有効であるか否かを判断する判断部と、を備えている。
特開2016-191975号公開
特許文献1に記載の技術では、転移元データと転移先データの特徴が類似していない場合において、転移学習に有効なデータを抽出できず、転移学習を適用することができない。また、特許文献1に記載の技術では、転移元データの候補が複数ある場合には、その転移元データから使用するデータを選択するために工数を要する。
そこで、本発明は、上記事情に鑑みなされたものであり、複数の転移元データの中から転移先モデルで使用するデータの選択に要する工数を削減でき、転移元モデルを転移先モデルとして転移することができるか否かを適切に判定することができる技術を提供することを目的とする。
前記目的を達成するため、一観点に係る転移可能性判定装置は、転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する転移可能性判定装置であって、転移元タスクの対象物及び/又は事象に関する静的な特性を示す第1静的特性データと、転移元タスクの対象物及び/又は事象へ作用を及ぼす物及び/又は事象を観測した第1観測データとの入力を受け付けるデータ入力部と、第1静的特性データを目的変数とし、第1観測データに関する特徴量を説明変数として、静的特性モデルを生成する静的特性情報モデリング部と、転移先タスクの対象物及び/又は事象に関する静的な特性を示す第2静的特性データを受理し、第1静的特性データと、第2静的特性データとの距離に基づいて、複数の第1静的特性データの中から処理に利用する第1静的特性データを選択する転移元データ選択部と、転移先タスクの対象物及び/又は事象へ作用を及ぼす物及び/又は事象を観測した第2観測データを受理し、第2観測データと、選択された前記第1静的特性データと、静的特性モデルとに基づいて、分析モデルでの利用に適した拡張観測データを算出するデータ拡張部と、分析モデルに拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、汎化誤差に基づいて、分析モデルの転移先タスクへの転移可能性を評価する転移元モデル評価部と、を備える。
本発明によれば、複数の転移元データの中から転移先モデルで使用するデータの選択に要する工数を削減でき、転移元モデルを転移先モデルとして転移することができるか否かを適切に判定することができる。
図1は、一実施形態に係る分析モデル転移可能性判定装置の構成の一例を示すブロック図である。 図2は、一実施形態に係る分析モデル転移可能性判定装置の概略ブロック図である。 図3は、静的特性データテーブルの構成例を示す図である。 図4は、観測データテーブルの構成例を示す図である。 図5は、分析モデルテーブルの構成例を示す図である。 図6は、静的特性モデルテーブルの構成例を示す図である。 図7は、拡張データテーブルの構成例を示す図である。 図8は、モデル転移可能性テーブルの構成例を示す図である。 図9は、特徴量生成ファイルの一例を示す図である。 図10は、一実施形態に係る分析モデル転移可能性判定装置のメイン処理の一例を示すフローチャートである。 図11は、一実施形態に係る静的特性情報モデリング処理の一例を示すフローチャートである。 図12は、一実施形態に係る転移元データ選択処理の一例を示すフローチャートである。 図13は、一実施形態に係る転移先データ拡張処理の一例を示すフローチャートである。 図14は、一実施例に係る性能評価処理の一例を示すフローチャートである。 図15は、データ入力画面の一例を示す図である。 図16は、分析モデル情報入力画面の一例を示す図である。 図17は、転移可能性判定結果画面の一例を示す図である。
実施形態について、図面を参照して説明する。なお、以下に説明する実施形態は特許請求の範囲に係る発明を限定するものではなく、また実施形態の中で説明されている諸要素及びその組み合わせの全てが発明の解決手段に必須であるとは限らない。
以下の説明では、「AAAテーブル」、「AAAファイル」の表現にて情報を説明することがあるが、情報は、どのようなデータ構造で表現されていてもよい。すなわち、情報がデータ構造に依存しないことを示すために、「AAAテーブル」、「AAAファイル」を「AAA情報」と呼ぶことができる。
図1は、一実施形態に係る分析モデル転移可能性判定装置の構成の一例を示すブロック図である。
転移可能性判定装置の一例としての分析モデル転移可能性判定装置1は、或るタスクを解決するために、このタスクに関する観測対象の物又は事象からその振る舞いとして得られた観測データに基づいて生成された分析モデル(転移元モデル)を、或るタスク(転移先タスク)に転用することが可能であるか否か、すなわち、転移可能性を判定し、判定結果を提示するための装置である。
ここで、タスクとは、対象業務における解決すべき課題であり、例えば、或る製品の不良発見や或る製造設備の故障予兆である。また、分析モデルは、タスクを実行するために使用されモデルである。分析モデルは、例えば、観測対象が製品であり、製品に対するタスクを実行する場合には、例えば観測対象の製品を観測するためのセンサで観測されて収集された数値データ(観測データ)及び/またはその数値データに関する特徴量を入力とし、この製品が不良である確率、あるいはこの製品が不良であるか否かの判定結果を出力する。数値データに関する特徴量とは、この数値データを加工したデータのことを示す。なお、観測対象に関する分析モデルは、例えばユーザから与えられる。
この分析モデル転移可能性判定装置1によると、対象とする製品の不良を判定するために生成された分析モデル(転移元モデル)を他の製品の不良を判定するための分析モデル(転移先モデル)として転移することができ、他の製品の不良判定(他のタスク)を低工数で解決することができる。
分析モデル転移可能性判定装置1は、例えば、PC(Personal Computer)等の計算機で構成され、メモリ10、ストレージ20、プロセッサ30、ネットワークインターフェース(I/F)40、及びユーザインターフェース(I/F)50を有する。
ネットワークI/F40は、例えば、有線LANカードや無線LANカードなどのインターフェースであり、WAN(Wide Area Network)60等のネットワークを介して他の装置と通信する。なお、ネットワークI/F40を、LAN(Local Area Network)やその他いかなるネットワークに接続してもよい。
ユーザI/F50は、キーボード、マウス等の入力装置や、ディスプレイ等の出力装置であり、ユーザからの入力を受け付け、またユーザへ各種情報を出力(提示)する。
プロセッサ30は、メモリ20に格納されているプログラムを実行することにより各種処理を実行する。例えば、プロセッサ30は、ユーザI/F50から入力されたデータ等に応じて、メモリ10のプログラムを実行し、処理結果に基づく情報をユーザI/F50へ出力する。
メモリ10は、例えば、RAM(RANDOM ACCESS MEMORY)であり、プロセッサ30で実行されるプログラムや、必要な情報を記憶する。本実施形態では、メモリ10は、データ入力プログラム12、静的特性情報モデリングプログラム13、転移元データ選択プログラム14、データ拡張プログラム15、及び転移モデル評価プログラム16を含むモデル転移可能性判定プログラム11を記憶する。
データ入力プログラム12は、プロセッサ30に実行されることにより、対象とするタスクに係る静的特性データ、観測データ、分析モデルに関するパラメータや特徴量生成ファイルをユーザから受理する。
ここで、静的特性データは、対象とするタスクの対象(対象物、対象事象)に関する静的な特性を示す数値データ及び/またはテキストデータであり、例えば、対象物である製品の規格や原料の種類・量に関する情報である。また、観測データは、対象からその振る舞いとして得られたデータであり、例えば、対象物である製品の製造時に原料に作用を及ぼした温度や風量に関する観測データや、製造中の製品を観測した画像データである。特徴量生成ファイルは、観測データを特徴量に加工するためのルールが記載されたファイルである。
静的特性情報モデリングプログラム13は、プロセッサ30に実行されることにより、静的特性データを観測データでモデリングして、静的特性モデルを構築する。モデリングとは、静的特性データを出力とする観測データに基づいた数式を生成することを示す。例えば、静的特性データyを、2つの観測データx,xでモデリングすると、例えば、y=0.15*x+0.01*xとの静的測定モデルが生成される。
転移元データ選択プログラム14は、プロセッサ30に実行されることにより、転移先タスクに関する静的特性データを受理し、転移先タスクに関する静的特性データとの距離が最も近い転移元タスクに関する静的特性データを選択する。
データ拡張プログラム15は、プロセッサ30に実行されることにより、静的特性モデリルに基づいて転移先タスクの観測データを拡張観測データに拡張する。ここで、拡張観測データは、他のタスクに対して生成された分析モデルを用いて対象タスクを解決するために、対象タスクに関する観測データを加工したデータである。
転移モデル評価プログラム16は、プロセッサ30に実行されることにより、転移先の拡張観測データを転移元の分析モデルに適用して分析モデルの汎化誤差を算出することにより、転移元の分析モデルを転移先タスクに転移可能か否かを判定する。ここで、汎化誤差とは、分析モデルの生成のために使用した観測データとは別の観測データを分析モデルに入力した場合における、出力値と実測値との差分に基づいた値である。
なお、データ入力プログラム12、静的特性情報モデリングプログラム13、転移元データ選択プログラム14、データ拡張プログラム15、及び転移モデル評価プログラム16は、一部又は全てが一体的に構成されてもよいし、別々に構成されてもよい。また、データ入力プログラム12、静的特性情報モデリングプログラム13、転移元データ選択プログラム14、データ拡張プログラム15、及び転移モデル評価プログラム16は、一部又は全てのプログラムを複数のプログラムで実現してもよい。
ストレージ20は、例えば、ハードディスクやフラッシュメモリなどであり、静的特性データ記憶部21、観測データ記憶部22、分析モデル記憶部23、静的特性モデル記憶部24、拡張データ記憶部25、モデル転移可能性記憶部26、及びメモリ10に呼び出す各種プログラムを格納する。
静的特性データ記憶部21は、ユーザから受理した静的特性データを記憶する。観測データ記憶部22は、ユーザから受理した観測データを記憶する。分析モデル記憶部23は、対象タスクを解決するための出力を観測データでモデリングした分析モデルに係る情報を記憶する。静的特性モデル記憶部24は、静的特性データを観測データでモデリングした分析モデルに係る情報を記憶する。拡張データ記憶部25は、拡張観測データを記憶する。モデル転移可能性記憶部26は、分析モデルを転移することが可能か否かを判定するための情報を記憶する。
図2は、一実施形態に係る分析モデル転移可能性判定装置の概略ブロック図である。
分析モデル転移可能性判定装置1は、データ入力部110と、静的特性情報モデリング部120と、転移元データ選択部130と、データ拡張部140と、転移元モデル評価部150とを有する。
データ入力部110は、プロセッサ30がデータ入力プログラム12を実行することにより実現され、静的特性情報モデリング部120は、プロセッサ30が静的特性情報モデリングプログラム13を実行することにより実現され、転移元データ選択部130は、プロセッサ30が転移元データ選択プログラム14を実行することにより実現され、データ拡張部140は、プロセッサ30がデータ拡張プログラム15を実行することにより実現され、転移元モデル評価部160は、プロセッサ30が転移モデル評価プログラム16を実行することにより実現される。
データ入力部110は、ユーザから静的特性データ(第1静的特性データ、第2静的特性データ)及び観測データ(第1観測データ、第2観測データ)を受理し、それぞれ静的特性データ記憶部21及び観測データ記憶部22に格納する。また、データ入力部110は、静的特性データ及び観測データを静的特性情報モデリング部120に送信する。また、データ入力部110は、静的特性データ及び観測データを転移元データ選択部130に送信する。
静的特性情報モデリング部120は、データ入力部110から静的特性データ及び観測データを受理し、静的特性モデルを構築し、静的特性モデルを静的特性モデル記憶部24に記録する。なお、静的特性データ及び観測データを、静的特性データ記憶部21や観測データ記憶部22から受理してもよい。
転移元データ選択部130は、データ入力部110から転移先の静的特性データ(第2静的特性データ)を受理し、静的特性データ記憶部21から転移元の静的特性データ(第1静的特性データ)群を受理し、転移先の静的特性データと転移元の静的特性データ群とに基づいて、処理に使用する転移元の静的特性レコードを選択し、静的特性レコードに係る転移元タスクIDをデータ拡張部140に送信する。ここで、転移元タスクIDは、対象となる転移元タスクを特定するためのIDである。
データ拡張部140は、転移元データ選択部130から転移元タスクIDを受理し、転移先タスクに係わる観測データ(第2観測データ)を観測データ記憶部22から受理し、静的特性モデルを静的特性モデル記憶部24から受理し、転移元タスクIDと転移先タスクに係わる観測データと、転移元の静的特性データと、に基づいて拡張観測データを算出し、拡張観測データを転移元モデル評価部150に送信する。ここで、拡張観測データは、対象となるタスクに関する観測データを他のタスク向け(他のタスクの分析モデル向け)に拡張したデータである。
転移元モデル評価部150は、データ拡張部140から転移先タスクに係る観測データ、拡張観測データ、及び転移元タスクIDを受理し、転移元タスクIDに基づいて分析モデル記憶部23から転移元モデルに関する分析モデルを取得し、分析モデルに拡張観測データを適用して拡張観測データの転移元モデルに対する汎化誤差を算出し、分析モデルに観測データを適用して観測データの転移元モデルに対する汎化誤差を算出し、汎化誤差と転移元データの転移元モデルに対する汎化誤差に基づいて、転移後性能向上率、転移可能性及び転移可能判定結果を算出し、拡張観測データを拡張データ記憶部25に記録し、モデル転移可能性記憶部26に転移後性能向上率、転移可能性、及び転移可能判定結果を記録する。ここで、転移後性能向上率は、データ拡張前後における転移先データの転移元モデルへの性能向上率であり、数値で表される。転移可能性は、転移元モデルを転移先タスクに転移できる可能性であり、例えば、1から100までの範囲の数値で表される。転移可能判定結果は、転移可能性に関する情報の一例であり、転移元モデルを転移先タスクに転移できるか否かを判定した結果であり、例えば、できるか否かの2値で表される。
次に、ストレージ20に記憶された、静的特性データ記憶部21、観測データ記憶部22、分析モデル記憶部23、静的特性モデル記憶部24、拡張データ記憶部25、及び、モデル転移可能性記憶部26について詳細に説明する。
図3は、静的特性データテーブルの構成例を示す図である。
静的特性データテーブル210は、静的特性データ記憶部21に記憶されている。静的特性データテーブル210には、ID211と、静的特性因子群212とを含むエントリが複数登録されている。ID211は、静的特性データを一意に特定するための識別番号である。静的特性因子群212は、複数の静的特性因子を含み、図3の例では、部位A幅213、部位B幅214、原料X215等を含む。部位A幅213は、製品の部位Aの幅である。部位B幅214は、製品の部位Bの幅である。原料X215は、製品の原料Xの割合である。
例えば、図3において、静的特性データテーブル210のID211が“1”であるエントリは、静的特性因子としての部位A幅213が“0.8”であり、部位B幅214が“10”であり、原料X215が“15”であることを示している。
図4は、観測データテーブルの構成例を示す図である。
観測データテーブル220は、観測データ記憶部22に記憶されている。観測データテーブル220には、収集時刻221、TID222、観測データ群223、及び不良判定227を含むエントリが複数登録されている。収集時刻221は、センサから観測データが収集された時刻である。TID222は、タスクを一意に特定するための識別番号である。観測データ群223は、複数のセンサによる観測データ(センサデータ)を含み、図4の例では、例えば、温度A224、温度B225、風量A226等を含む。温度A224は、温度Aセンサによって観測された温度Aである。温度B225は、温度Bセンサによって観測された温度Bである。風量A226は、風量Aセンサによって観測された風量Aである。不良判定227は、観測データが収集された際に製造されていた製品についての検査結果であり、図4の例では、製品が良品であれば“0”が設定され、製品が不良品であれば“1”が設定される。
例えば、図4において、観測データテーブル220の収集時刻221が“8/9 13:08:01”であるエントリは、TID222が“1”であるタスクにおいて、その収集時刻において、温度A224が“80.4”であり、温度B225が“95.0”であり、風量A226が“10.7”であり、不良判定227が“0”である製品が製造されたことを示している。
図5は、分析モデルテーブルの構成例を示す図である。
分析モデルテーブル230は、分析モデル記憶部23に記憶されている。分析モデルテーブル230には、TID231、ベースモデル名232、モデルパラメータリスト233、特徴量生成ファイルへのパス234を含むエントリが複数登録されている。TID231は、タスクを一意に特定するための識別番号である。ベースモデル名232は、分析モデルを生成するために用いた手法名である。モデルパラメータリスト233は、ベースモデル名232に関するパラメータ名とパラメータの値とのリストである。特徴量生成ファイルへのパス234は、特徴量の生成方法について記載された特徴量生成ファイル270(図9参照)へのパスを示す。
例えば、図5において、分析モデルテーブル230のTID231が“1”であるエントリは、ベースモデル名232が“k-NN”であり、モデルパラメータリスト233が“k:1、metric:‘minkowski’”であり、特徴量生成ファイルへのパス234が“product_x/type_a.json”であることを示している。
図6は、静的特性モデルテーブルの構成例を示す図である。
静的特性モデルテーブル240は、静的特性モデル記憶部24に記憶されている。静的特性モデルテーブル240は、静的特性因子名241、特徴量・重みペア242を含むエントリが複数登録されている。静的特性因子名241は、静的特性因子の名前である。特徴量・重みペア242は、特徴量名と、この特徴量名の特徴量への重みとのペアのリストを示す。
例えば、図6において、静的特性モデルテーブル240の静的特性因子241が“部位A幅”であるエントリは、特徴量・重みペア242が“x:0.15、x:0.01”であることを示している。
図7は、拡張データテーブルの構成例を示す図である。
拡張データテーブル250は、拡張データ記憶部25に記憶されている。拡張データテーブル250には、ID251、転移元TID252、転移先TID253、拡張データ254を含むエントリが複数登録されている。ID251は、エントリを一意に特定するための識別番号である。転移元TID252は、転移元タスクを一意に特定するための識別番号である。転移先TID253は、転移先タスクを一意に特定するための識別番号である。拡張データ254は、特徴量名と特徴量とのペアのリストを示す。
例えば、図7において、拡張データテーブル250のID251が“1”であるエントリは、転移元TID252が“1”であり、転移先TID253が“5”であり、拡張データ254が“x:3.9、x:21.14”であることを示している。
図8は、モデル転移可能性テーブルの構成例を示す図である。
モデル転移可能性テーブル260は、モデル転移可能性記憶部26に記憶されている。モデル転移可能性テーブル260には、TID261、転移後性能向上率262、転移可能性263、転移可能判定結果264を含むエントリが複数登録されている。TID261は、タスクを一意に特定するための識別番号である。転移後性能向上率262は、観測データの拡張前後における性能向上の割合である。転移可能性263は、転移元モデルを転移先タスクに転移することができる可能性である。転移可能判定結果264は、転移元モデルを転移先タスクに転移できるか否かの判定結果である。
例えば、図8において、モデル転移可能性テーブル260のTID261が“5”であるエントリは、転移後性能向上率262が“1.02”であり、転移可能性263が“92%”であり、転移可能判定結果264が“OK”であることを示している。
図9は、特徴量生成ファイルの一例を示す図である。
特徴量生成ファイル270は、静的特性モデル記憶部24に記憶されている。特徴量生成ファイル270は、静的特性モデルの特徴量を生成するための方法についての記述を含む。特徴量生成ファイル270は、分析モデルテーブル230の特徴量生成ファイルへのパス234の記述に基づいて参照される。
特徴量生成ファイル270は、model_id271、model_name272、feature_list273を含むエントリが記述されている。model_id271は、モデルを一意に特定するための識別番号である。model_name272はモデルの名前である。feature_list273は、複数の特徴量に関する情報を保持するリストである。feature_list273には、feature_id274、feature_name275、input276、logic277を含むエントリが記述されている。feature_id274は、特徴量を一意に特性するための識別番号である。feature_name275は、特徴量名である。input276は、特徴量を生成するために使用する観測データ名である。input276は、観測データテーブル220の観測データ群223に含まれる観測データのうちの一以上の観測データ名である。logic277は、特徴量を生成するための計算式である。
例えば、図9において、特徴量生成ファイル270のmodel_id271が“1”であるエントリは、model_name272が“model_a”であり、feature_list273に3つ以上のエントリを含んでいる。feature_list273のfeature_id274が“1”であるエントリは、feature_name275が“x”であり、input276が“‘温度A’、‘風量A’”であり、logic277が“Mean(‘温度A’)+1.5*Mean(‘風量A’)”であることを示している。ここで、Mean(x)は、特徴量名xの平均値を算出するための関数である。
次に、分析モデル転移可能性判定装置1の処理動作について説明する。
図10は、一実施形態に係る分析モデル転移可能性判定装置のメイン処理の一例を示すフローチャートである。
まず、データ入力部110は、後述するデータ入力画面70(図15参照)を介してユーザから入力された、転移元タスクに係る静的特性データ及び観測データをそれぞれ静的特性データ記憶部21の静的特性データテーブル210及び観測データ記憶部22の観測データテーブル220に記憶する(ステップS10)。
次いで、静的特性情報モデリング部120は、静的特性情報モデリング処理(図11参照)を実行する(ステップS11)。静的特性情報モデリング処理では、静的特定モデリング部120は、データ入力部110から静的特性データ及び観測データを取得し、静的特性データを観測データでモデリングして静的特性モデルを構築し、静的特性モデルを静的特性モデル記憶部24に記録する。
次いで、転移元データ選択部130は、転移元データ選択処理(図12参照)を実行する(ステップS12)。転移元データ選択処理では、転移元データ選択部130は、データ入力部110から転移先タスクに係る静的特性データを受理し、受理した転移先タスクに係る静的特性データに基づいて、所定の転移元タスクに係る静的特性データを静的特性データ記憶部21から取得し、転移元タスクに関する転移元タスクIDをデータ拡張部140に送信する。
次いで、データ拡張部140は、転移先データ拡張処理(図13参照)を実行する(ステップS13)。転移先データ拡張処理では、データ拡張部140は、転移元データ選択部130から受理した転移元タスクIDに基づいて、観測データ記憶部22から転移元タスクに関する観測データ(第1観測データ)を取得し、観測データ記憶部22から転移先タスクに関する観測データ(第2観測データ)を取得し、静的特性モデルを静的特性モデル記憶部24から取得し、転移元タスクIDに関する観測データ、転移先タスクに関する観測データ、及び静的特性モデルに基づいて、拡張観測データを算出し、拡張観測データ及び転移元タスクIDを転移元モデル評価部150に送信する。
転移元モデル評価部150は、性能評価処理(図14参照)を実行する(ステップS14)。性能評価処理では、転移元モデル評価部150は、データ拡張部140から受理した転移元タスクIDに基づいて分析モデル記憶部23から転移元モデルに係る分析モデルを取得し、データ拡張部140から受理した拡張観測データと、取得した分析モデルとに基づいて、分析モデルの観測データに対する評価結果(転移可能性)を算出する。
次いで、転移元モデル評価部150は、評価結果が閾値以上であるか否かを判定し(ステップS15)、評価結果が閾値以上である場合(ステップS15:YES)には、転移の可能性が高いことを意味する転移可能性フラグを立て、例えば、モデル転移可能性テーブル260の転移可能性判定結果264を“OK”に設定し(ステップS16)、処理を終了する一方、評価結果が閾値未満である場合(ステップS15:NO)には、何もせずに処理を終了する。
次に、図10のステップS11に対応する静的特性情報モデリング処理について詳細に説明する。
図11は、一実施形態に係る静的特性情報モデリング処理の一例を示すフローチャートである。
まず、静的特性情報モデリング部120は、観測データ記憶部22から観測データを取得し、観測データに基づいて、1以上の種類の特徴量を算出する関数(算出式)を決定し、特徴量を算出する(ステップS100)。なお、算出する特徴量の種類は、例えば、ユーザによって指示されてもよい。
次いで、静的特性情報モデリング部120は、各種変数等を初期化する(ステップS101)具体的には、静的特性情報モデリング部120は、変数counterに1を代入し、変数cGError及び変数pBestGErrorに無限大を代入し、オブジェクトM及びオブジェクトpBestMに空の値を代入する。ここで、オブジェクトは、任意の数の変数及び関数を含むデータ構造である。なお、変数cGError及び変数pBestGErrorに無限大を代入するようにしているが、プログラムで無限大を表現することができない場合には、例えば、ユーザによって予め与えられた所定の値を無限大の代わりに用いてもよい。
次いで、静的特性情報モデリング部120は、ステップS100で算出した特徴量の中から一部又は全ての特徴量を処理対象として選択し(ステップS102)、静的特性データ記憶部22から静的特性データを受理し、静的特性データのうち一部又は全ての静的特性因子を処理対象として選択する(ステップS103)。ここで、静的特性因子は、静的特性データを構成する因子であり、例えば、対象となる製品における部位Aの幅や原料Xの割合である。なお、特徴量から処理対象を選択する方法や、静的特性データから処理対象を選択する方法としては、ランダムに選択してもよいし、予め設定されたルール(例えば、ユーザに指定されたルール)に従って選択してもよい。
次いで、静的特性情報モデリング部120は、マルチアウトプット回帰を実行し、静的特性モデルを生成する処理を実行する(ステップS104)。具体的には、静的特性情報モデリング部120は、観測データ及び静的特性データを学習用データとテスト用データとの2つに分割する。ここで、観測データ及び静的特性データを学習用データとテスト用データとの2つに分割する方法としては、例えば、製品を単位として、観測データ及び静的特性データを2つに分割してもよい。次いで、静的特性情報モデリング部120は、学習用データを用いてステップS103で選択した静的特性因子を目的変数とし、ステップS102で選択した特徴量を説明変数としてマルチアウトプット回帰を実行し、静的特性モデルを生成し、静的特性モデルの静的特性因子、特徴量及びパラメータをオブジェクトMに代入する。
静的特性情報モデリング部120によるマルチアウトプット回帰の処理は、例えば、以下に示すような手順で実行してもよい。
(手順1)以下の式(1)の重みwijをランダムに決定する。
ここで、mは特徴量の数であり、iterは、このマルチアウトプット回帰の処理における繰り返しの回数であり、wij iterは、iter回目の繰り返しにおけるi番目の静的特性因子に関するj番目の特徴量への重みであり、x(n)jは、n番目のタスク(n番目の製品についてのタスク)におけるj番目の特徴量であり、x(n)はn番目のタスクにおける特徴量群のベクトルであり、y iter(x(n))は、iter回目の繰り返しにおいて特徴量群x(n)を用いて算出したi番目の静的特徴因子の予測値である。
(手順2)以下の式(2)に特徴量及び静的特性データを入力し、重みの値を更新する。
ここで、wij iter、x(n)j、x(n)、y iter(x(n))は式(1)の符号と同様であり、Nはタスクの数であり、y(n)iはn番目のタスクにおけるi番目の静的特性因子の実測値であり、ηは学習率である。ηは、任意の値であり、ユーザによって設定されてもよい。
(手順3)以下の式(3)を用いて、学習誤差E(Etrain)を算出し、過去x回の学習誤差を含めた分散が閾値以下である場合、又は変数iterの値が閾値より大きい場合に手順4に進む。そうでない場合、変数iterをインクリメントして手順2に戻る。
ここで、fは関数ベクトル(f、f、…、f)であり、fはi番目の関数を示す。kは、関数の数である。xは学習データベクトル(x(1)、x(2)、…、x(n))である。x(n)はn番目のタスクにおける特徴量群のベクトルである。yは(i,n)成分がy(n)iである実測値行列であり、y(n)iはn番目のタスクにおけるi番目の関数に対応する実測値である。
ここで、手順3での式(3)を用いる際には、fにy iterを入力し、xに学習用データを入力し、yに学習用データに対応する静的特性データを入力する。
(手順4)重みwijを出力する。これにより、汎化誤差Eの分散が閾値以下となった場合又は所定回処理を繰り返した場合の重みを適切に決定することができる。なお、汎化誤差Eの分散が閾値を超える場合には、その際に選択されている静的特性因子については静的特性モデルから削除対象として、閾値以内の静的特性因子のみを目的変数とする静的特性モデルとしてもよい。
次いで、静的特性情報モデリング部120は、テスト用データ及び静的特性モデルを用いて、式(3)に従って静的特性モデルの汎化誤差E(Etest)を算出し、変数cGErrorに代入する(ステップS105)。ここで、ステップS105で式(3)を用いる際には、fには、ステップS104の手順3で既に算出(学習)した静的特性モデル、すなわち、特徴量を入力として静的特性因子を予測するための関数ベクトル(y、y、…、y)を入力し、xには、テスト用データを入力し、yには、テスト用データに対応する静的特性データを入力する。なお、yはi番目の静的特性因子を予測するための関数である。
なお、ステップS104における学習用データとテスト用データとの分割方法を変更しながら、ステップS104とステップS105とを繰り返し実行し、汎化誤差Eの平均値を算出して、算出した平均値を変数cGErrorに代入するようにしてもよい。
次いで、静的特性情報モデリング部120は、変数pBestGErrorの値(すなわち、今までで最も小さい汎化誤差の値)が変数cGErrorの値(直前に算出された汎化誤差の値)より大きいか否かを判定する(ステップS106)。この結果、変数pBestGErrorの値が変数cGErrorの値より大きい場合(ステップS106:YES)には、直前に算出された汎化誤差がより小さく、静的特性モデルとしてより精度が良いことを意味しているので、静的特性情報モデリング部120は、変数pBestGErrorに変数cGErrorの値を代入し、オブジェクトpBestMにオブジェクトMを代入し(ステップS107)、処理をステップS108に進める。一方、変数pBestGErrorの値が変数cGErrorの値より大きくない場合(ステップS106:NO)には、静的特性情報モデリング部120は、そのまま処理をステップS108に進める。
次いで、ステップS108では、静的特性情報モデリング部120は、変数counterが閾値以下であるか否かを判定する。
この結果、変数counterが閾値以下である場合(ステップS108:YES)には、所定回を超えて処理を繰り返していないことを意味しているので、静的特性情報モデリング部120は、変数counterをインクリメント(+1)し(ステップS109)、ステップS102からの処理を再び実行する。なお、静的特性情報モデリング部120は、ステップS102からの処理を再度実行する場合には、ステップS102での特徴量の選択、及びステップS103での静的特性因子の選択においては、既に処理対象として選択した静的特性因子及び特徴量の組み合わせを再び選択しないようにしている。
一方、変数counterの値が閾値以下でない場合(ステップS108:NO)には、所定回を超えて処理を繰り返したことを意味しているので、静的特性情報モデリング部120は、オブジェクトpBestMに含まれる変数に関する情報(すなわち、処理をした中で最も汎化誤差が小さい静的特性モデルの情報)を静的特性モデル記憶部24に記録するとともに、ステップS100で決定した特徴量の算出式と、オブジェクトpBestMの内容に基づいて特徴量生成ファイル270を作成し(ステップS110)、処理を終了する。
この静的特性モデル生成処理によると、複数の静的特性モデルの内の静的特性データの汎化誤差が最も小さい静的特性モデルが、以降の処理で使用する静的特性モデルに決定されることとなる。なお、上記例では、複数の静的特性モデルの内の静的特性データの汎化誤差が最も小さい静的特性モデルが、以降の処理で使用する静的特性モデルに決定されていたが、例えば、汎化誤差が所定の閾値以下の静的特性モデルを以降の処理で使用する静的特性モデルに決定するようにしてもよい。
次に、静的特性モデル生成処理の具体例を示す。具体例では、製品の不良を判定するためのタスクを対象としたモデル生成の処理であり、製品毎にモデルが構築されているものとする。対象のタスクは、タスクIDが1、2、3、4の4種類であり、各タスクの静的特性データ及び観測データを用いて静的特性モデルを生成する。静的特性データは、部位A幅、部位B幅、原料X分量の3種類に関する静的特性因子を含むデータであり、観測データは、温度Aセンサ、温度Bセンサ、風量Aセンサ、及び風量Bセンサから一定の期間内に収集された数値データである。特徴量は、センサ毎に算出された平均値及び最大値であり、ステップS108で使用する閾値は2であり、ステップS104の手順4での汎化誤差Eの分散に対する閾値は、1.5である。
静的特性情報モデリング部120は、ステップS100で、観測データ記憶部22から温度Aセンサ、温度Bセンサ、風量Aセンサ、風量Bセンサの4種類に関する数値データを受理し、4種類のデータに関して、センサ毎に平均値及び最大値を算出する。この結果、タスクIDが1、2、3、4のそれぞれのタスクに関して、センサ毎に平均値及び最大値が特徴量として算出される。特徴量を算出した結果、例えば、温度Aセンサの平均値として、タスクIDが1、2、3、4の順にそれぞれ10、20、25、15が算出される。
静的特性情報モデリング部120は、ステップS101で、変数counterに1を代入し、変数cGError及び変数pBestGErrorに無限大を代入し、オブジェクトM及びオブジェクトpBestMに空の値を代入する。
次いで、静的特性情報モデリング部120は、ステップS102で、特徴量を選択する。例えば、静的特徴モデリング部120は、温度Aセンサにおける平均値と、風量Aセンサの平均値とを選択する。
次いで、静的特性情報モデリング部120は、ステップS103で、静的特性因子を選択する。例えば、静的特性情報モデリング部120は、例えば、部位A幅と原料X分量とを選択する。
次いで、静的特性情報モデリング部120は、ステップS104で、観測データ及び静的特性データを学習用データとテスト用データとに分割する。分割した結果、例えば、タスクIDが1、2、3であるタスクについての観測データ及び静的特性データが学習用データとされ、タスクIDが4であるタスクについての観測データ及び静的特性データがテスト用データとされて分割される。
次いで、静的特性情報モデリング部120は、マルチアウトプット回帰を実施し、静的特性モデルを算出する。この結果、静的特性モデルとして、例えば、以下の式(4)及び式(5)が得られる。
ここで、ypart_a,ymaterial_x,Xmean(temp_1),Xmean(air_a)は、それぞれ部位A幅、原料X分量、温度Aセンサにおける平均値、風量Aセンサの平均値を示す変数である。
次いで、静的特性情報モデリング部120は、式(4)及び式(5)に関する変数及びパラメータをオブジェクトMに代入する。なお、この例では、変数及びパラメータをオブジェクトMに格納するようにしているが、例えば、変数及びパラメータを含む式自体をオブジェクトMに格納するようにしてもよい。
次いで、静的特性情報モデリング部120は、ステップS105で、タスクIDが4であるタスクについての特徴量を式(4)及び式(5)に代入し、式(3)を用いて汎化誤差を算出する。例えば、タスクIDが4であるタスクの部位A幅、原料X分量、温度Aセンサにおける平均値、風量Aセンサの平均値がそれぞれ5.5、8、80、10であったとすると、これら値と、式(3)、式(4)、式(5)を用いて汎化誤差を算出すると、汎化誤差は、((0.15*80+0.01*10)-5.5)+((0.02*80+0.7*10)-8)=43.92と算出される。
静的特性情報モデリング部120は、ステップS106で、変数pBestGErrorと変数cGErrorの値を比較する。変数pBestGErrorの値が無限大、変数cGErrorの値が43.92であり、変数pBestGErrorの値の方が大きいため、処理は、ステップS107に移る。
静的特性情報モデリング部120は、ステップS107で、変数pBestGErrorに変数cGErrorの値である43.92を代入し、オブジェクトpBestMにオブジェクトMを代入する。
次いで、静的特性情報モデリング部120は、ステップS108で、変数counterの値を閾値と比較する。この例では、変数counterの値が1、閾値が2であり、変数counterが閾値以下であるために、処理はステップS109に移る。
静的モデリング部120は、ステップS109で、変数counterをインクリメントして2とし、ステップS102を実行する。
静的特性情報モデリング部120は、2度目のステップS102を実行し、その後ステップS106まで実行する。ここで、この結果、変数pBestGErrorが変数cGError以下であるとすると、静的特性情報モデリング部120は、ステップS108及びステップS109を実行し、変数counterの値を3にする。
次に、静的特性情報モデリング部120は、3度目のステップS102を実行し、その後ステップS106まで実行する。この結果、変数pBestGErrorが変数cGError以下であるとすると、静的特性情報モデリング部120は、ステップS108を実行する。変数counterが3であり、閾値2よりも大きいため、静的特性情報モデリング部120は、処理をステップS110に進め、オブジェクトpBestMに含まれる情報を静的特性モデル記憶部24に記録し、処理を終了する。具体的には、静的特性情報モデリング部120は、式(4)及び式(5)に含まれる変数名及び重みの値を記録する。
上記した静的特性モデル生成処理によると、分析モデル転移可能性判定装置1は、静的特性因子とセンサとの相関関係を定式的に表現することができ、静的特性因子の変化に伴う観測データの変化を理解することができる。これによって、製品の規格の相違に伴う製造パラメータの変化を理解することができ、さらには製造パラメータに基づいて生成された分析モデルが製品間で再利用可能か否かの判断に利用することができる。
次に、図10のステップS12に対応する転移元データ選択処理について詳細に説明する。
図12は、一実施形態に係る転移元データ選択処理の一例を示すフローチャートである。
まず、転移元データ選択部130は、データ入力部110から転移先タスクに関する静的特性レコードを受理した後、転移元タスクに関する静的特性レコード群を静的特性データ記憶部21から取得する(ステップS200)。
転移元データ選択部130は、変数NearestDistに無限大、変数TIDに-1を代入する(ステップS201)。
次いで、転移元データ選択部130は、転移元タスクに関する静的特性レコード群の中から静的特性レコードを1種類選択する(ステップS202)。
次いで、転移元データ選択部130は、転移先タスクの静的特性レコードと、選択した転移元タスクに関する静的特性レコードとの距離を算出し、算出した値を変数Distに代入する(ステップS203)。ここで、各レコードの間で算出される距離としては、例えば、ユークリッド距離としてもよく、コサイン類似度を用いてもよく、その他いかなる方法で算出された距離を用いてもよい。
次いで、転移元データ選択部130は、変数NearestDistが変数Distより大きいか否かを判定する(ステップS204)。この結果、変数NearestDistが変数Distの値より大きい場合(ステップS204:YES)には、転移元データ選択部130は、処理をステップS205に移し、変数NearestDistが変数Distの値より大きくない場合(ステップS204:NO)には、処理をステップS206に移す。
ステップS205では、転移元データ選択部130は、変数NearestDistに変数Distの値を代入し、変数TIDに、選択した転移元の静的特性レコードのTIDを代入し、処理をステップS206に移す。
ステップS206では、転移元データ選択部130は、転移元の静的特性レコード群の全レコードを処理対象として選択したか否かを判定する。この結果、転移元の静的特性レコード群の全レコードを処理対象として選択した場合(ステップS206:YES)には、転移元データ選択部130は、処理をステップS207に移し、転移元の静的特性レコード群の全レコードを処理対象として選択していない場合(ステップS206:NO)には、処理をステップS202に移す。
ステップS207では、転移元データ選択部130は、転移元及び転移先に係るTIDの値をデータ拡張部140に出力し、その後処理を終了する。
次に、転移元データ選択処理の具体例を示す。具体例では、製品の不良を判定するためのタスクを対象としたモデルの生成における転移元データ選択処理であり、転移元タスクの製品についてはモデルが構築されているものとする。対象のタスクは、タスクIDが1、2、3、4、5の5種類であり、タスクIDが5のタスクを転移先タスクとし、その他のタスクを転移元タスクとする。静的特性レコードは、部位A幅、部位B幅、原料X分量の3種類に関する静的特性因子を含むものとする。
転移元データ選択部130は、ステップS200で、データ入力部110からタスクIDが5である転移先タスクに関する静的特性レコードを受理し、その後、静的特性データ記憶部21からタスクIDが1、2、3、4である転移元タスクに関する静的特性レコードを受理する。
次いで、転移元データ選択部130は、ステップS201で、変数NearestDistに無限大、変数TIDに-1を代入する。
次いで、転移元データ選択部130は、ステップS202で、タスクIDが1である転移元タスクに関する静的特性レコードを選択する。
次いで、転移元データ選択部130は、ステップS203で、転移先タスクと転移元タスクとの静的特性レコードに関する距離を求める。ここで、転移先タスクの静的特性レコードは、部位A幅、部位B幅、原料X分量の順に“1.0”、“10”、“10”であり、転移元タスクの静的特性レコードは、部位A幅、部位B幅、原料X分量の順に、“0.8”、“10”、“15”であるとする。また、転移先タスクと転移元タスクとの静的特性レコードに関する距離は、ユークリッド距離とする。この場合において、転移元データ選択部130は、(1.0-0.8)+(10-10)+(10-15)の平方根を算出し、転移先タスクと転移元タスクとの静的特性レコードの距離は5.00と算出される。その後、転移元データ選択部130は、変数Distに5.00を代入する。
次いで、転移元データ選択部130は、ステップS204で、変数NearestDistと変数Distとを比較する。この比較の結果、この例では、変数NearestDistの値の方が大きいため、転移元データ選択部130は、処理をステップS205に移す。
次いで、転移元データ選択部130は、ステップS205で、変数NearestDistに変数Distの5.00を代入し、変数TIDに転移元タスクのTIDである1を代入する。
次いで、転移元データ選択部130は、ステップS206で、転移元の静的特性レコード群の全レコードを処理対象として選択したか否かを判定する。この例では、転移元の静的特性レコード群のうちTIDが2、3、4であるタスクに関する静的特性レコードを未だ選択していないために、転移元データ選択部130は、処理をステップS202に移す。
この後、転移元データ選択部130は、ステップS202~ステップS206までの処理を3回繰り返し、TIDが2、3、4である転移元タスクに関する静的特性レコードのそれぞれと、転移先タスクに関する静的特定レコードとの距離を算出する。
そして、転移元データ選択部130は、ステップS206で、転移元の静的特性レコード群の全レコードを選択し終えたことを確認した後、処理をステップS207に移す。
転移元データ選択部130は、ステップS207で、転移先及び転移元に関するTIDの値をデータ拡張部140に出力する。この例においては、転移元データ選択部140は、転移先タスクのTIDである5と、転移元タスクのTIDである1とを出力する。
上記した転移元データ選択処理によると、モデル転移可能性判定装置1は、複数の転移元タスクの中から転移先タスクに転移することが容易なタスクを選択することができ、ユーザが転移元タスクを選択する工数を削減することができる。
次に、図10のステップS13に対応する転移先データ拡張処理について詳細に説明する。
図13は、一実施形態に係る転移先データ拡張処理の一例を示すフローチャートである。
まず、データ拡張部140は、転移元データ選択部130から転移元及び転移先に係るTIDの値を受理する。その後、データ拡張部140は、転移元のTIDに基づいて転移元の静的特性レコードを取得し、転移先のTIDに基づいて転移先の観測データを取得する。また、データ拡張部140は、静的特性モデル記憶部24から静的特性モデルに関する情報を取得する(ステップS300)。
次いで、データ拡張部140は、ステップS300で取得した観測データを用いて特徴量を算出する。また、データ拡張部140は、変数epochに1を代入する(ステップS301)。
次いで、データ拡張部140は、ステップS301で算出した特徴量(説明変数)に基づいて静的特性因子に関する予測値(目的変数)を算出する(ステップS302)。
次いで、データ拡張部140は、以下の式(6)及び式(7)に基づいて特徴量を更新する(ステップS303)。
ここで、式(6)において、xiterはiter回目の繰り返しにおける特徴量ベクトル(x iter、x iter、…、x iter)であり、mは特徴量の数である。また、H(xiter)は、xiterにおけるヤコビ行列である。f(xiter)は、式(7)のxにxiterを代入した際に得られるベクトルである。
また、式(7)において、y(x)は静的特性因子の予測値に関するベクトル(y(x)、y(x)、…、y(x))であり、y(x)はi番目の静的特性因子に関する予測値である。また、xは、特徴量ベクトル(x、x、…、x)であり、jは、特徴量の数である。また、ytr_srcは、転移元タスクの静的特性因子の実測値を示すベクトル(ytr_src,1、ytr_src,2、…、ytr_src,m)であり、mは、静的特性因子の数である。
次いで、データ拡張部140は、変数epoch(エポック数)が閾値以下であるか否かを判定する(ステップS304)。この結果、変数epochが閾値以下である場合(ステップS304:YES)には、データ拡張部140は、変数epochをインクリメントし(ステップS305)、処理をステップS302に移す。一方、変数epochが閾値以下でない場合(ステップS304:NO)には、データ拡張部140は、処理をステップS306に移す。
上記したステップS302~S305によると、転移先タスクに関する観測データに基づく特徴量を静的特性モデルの説明変数の初期値とし、転移元タスクに関する静的特性データの値と静的特性モデルの出力値との差を低減するように、反復法により、静的特性モデルの説明変数の解を算出することとなる。
ステップS306では、データ拡張部140は、更新後の特徴量もしくは更新後の特徴量を反映した観測データを拡張観測データとして転移元モデル評価部150に出力する。更新後の特徴量を反映する方法としては、例えば、ユーザによって与えられ、特徴量が温度センサの平均値であり、拡張前の特徴量の値が10、拡張後の特徴量の値が20である場合、温度センサの観測データの値全てに10を加算するようにしてもよい。
次に、転移先データ拡張処理の具体例を示す。具体例では、変数epoch用の閾値を100とする。データ拡張部140は、ステップS300で、転移元データ選択部130から転移元及び転移先のTIDを受理する。ここで、転移元のTIDとして1を受理し、転移先のTIDとして5を受理した場合を例とする。
その後、データ拡張部140は、TIDが1である静的特性レコードを取得する。この結果、例えば、部位A幅、部位B幅、原料X分量がそれぞれ“0.8”、“10”、“15”である静的特性レコードが取得される。
また、データ拡張部140は、TIDが5である観測データを取得する。この結果、図4に示す観測データテーブル220における収集時刻、TID、不良判定等に関するレコード群が取得される。
さらに、データ拡張部140は、静的特性モデル記憶部24から静的特性モデルに関する情報を取得する。この結果、静的特性モデルを構成する静的特性因子である“部位A幅”と“原料X”や、“部位A幅”を予測するための特徴量名“x”、“x”及びそれら特徴量への重み“0.15”、“0.01”が取得される。また、静的特性モデルの特徴量“x”及び“x”の算出式が記載された特徴量生成ファイル270が取得される。
データ拡張部140は、ステップS301で、特徴量を算出し、変数epochに1を代入する。特徴量の算出方法に関して、具体的には、ステップS300で取得した特徴量生成ファイル270のinput276に記載されている観測データ名と一致する観測データに関するレコードを転移先の観測データから取得し、logic277に記載の数式に観測データ名に関するレコードを適用し、転移元モデルで用いられる特徴量を算出する。例えば、feature_name275が“x”である特徴量の算出方法について、input276に記載されている“‘温度A’、‘風量A’”に従い、“温度A”及び“風量A”に関するレコードが転移先の観測データから取得され、logic277に記載されているロジック、すなわち“Mean(‘温度A’)+1.5*Mean(‘風量A’)”に従い、“温度A”に関する観測データの平均値に対して“風量A”に関する観測データの平均値を1.5倍した値を加算した値が算出される。特徴量xについても、特徴量xと同様の手順で算出される。
次いで、データ拡張部140は、ステップS302で、ステップS301で算出した特徴量を静的特性モデルに代入し、静的特性因子の予測値を算出する。この結果、静的特性モデルに含まれる静的特性因子である“部位A幅”と“原料X”について、“部位A幅”の予測値として、例えば、0.15*21.0+0.01*12.54=3.275が算出され、“原料X”の予測値として、例えば、0.02*21.0+0.7*12.54=9.198が算出される。
データ拡張部140は、ステップS303で、式(6)及び式(7)に基づいて特徴量を更新する。式(7)において、ベクトルy(x)は(3.275、9.198)であり、ベクトルytr_srcは、(0.8、15.0)であるため、ベクトルf(x)は(2.475、-5.802)と算出される。また、式(6)のヤコビ行列Hの逆行列について、行列成分ai,jがそれぞれa1,1=-1.272、a1,2=0.182、a2,1=0.036、a2,2=-0.273である2×2行列が算出される。以上の結果を用いて式(6)を計算した結果、特徴量x及びxの更新値として、25.204及び10.867が算出される。
データ拡張部140は、ステップS304で、変数epochの値1と、閾値である100とを比較し、変数epochの値が閾値以下であるために、ステップS305を実行する。
データ拡張部140は、ステップS305で、変数epochにインクリメントをして、2とし、ステップS302を実行する。
データ拡張部140は、変数epochの値が閾値である100に達するまでステップS302からステップS305を繰り返し、変数epochの値が101である状態でステップS304を実行すると、処理がステップS306に移る。
データ拡張部140は、ステップS306で特徴量を出力する。これにより、データ拡張部140は、例えば、特徴量xが3.9、特徴量xが21.14である特徴量ベクトル(x、x)を出力する。
上記した転移先データ拡張処理によると、分析モデル転移可能性判定装置1は、転移先タスクに係る観測データを転移元に係る分析モデルに適合しやすいデータに適切に変換することができる。これにより、転移元の観測データと転移先の観測データとの特徴が類似していない場合においても、転移学習を適用することが可能になる。
次に、図10のステップS14に対応する性能評価処理について詳細に説明する。
図14は、一実施例に係る性能評価処理の一例を示すフローチャートである。
転移元モデル評価部150は、データ拡張部140から拡張観測データを受理し、その後、転移元タスクに係るTIDに基づいて分析モデル記憶部23から転移元の分析モデルを取得する(ステップS400)。
転移元モデル評価部150は、式(3)のf、x、及びyにそれぞれ、転移元の分析モデル(転移元モデルともいう)、拡張観測データ、及び転移先の観測データに対応する不良判定結果を入力することによって、汎化誤差を算出する(ステップS401)。
転移元モデル評価部150は、転移先に係る観測データの転移元モデルに対する汎化誤差を、拡張観測データの転移元モデルに対する汎化誤差で除算することによって転移後性能向上率を算出し、また、転移元に係る観測データの転移元モデルに対する汎化誤差を、拡張観測データの転移元モデルに対する汎化誤差で除算することによって転移可能性を算出する(ステップS402)。
次に、性能評価処理の具体例を示す。
転移元モデル評価部150は、ステップS400で、拡張観測データを受理し、また、転移元モデルを取得する。この結果、例えば、xが0.03であり、xが1.54である拡張観測データが受理される。また、図5の分析モデルテーブル230におけるTIDが1であるレコードが取得される。すなわち、ベースモデル名が“k-NN”であり、モデルパラメータリストが“k:1、metric:‘minkowski’”であり、特徴量生成ファイルへのパスが“product_x/type_a.json”であるレコードが取得される。
次いで、転移元モデル評価部150は、ステップS401で、ステップS400で取得された転移元モデルに関するレコード、拡張観測データ、及び転移先の観測データに対応する不良判定の実測値を式(3)に入力して汎化誤差を算出する。
具体的には、まず、転移元モデル評価部150は、転移元モデルに関するレコードに含まれるベースモデル名に記載の統計・機械学習手法にモデルパラメータリストに記載のパラメータ値を入力し、その後、算出したn個の拡張観測データを入力することによって、n種類の不良判定に関する予測結果を得る。例えば、転移元モデル評価部150は、ベースモデル名に記載のk近傍法(k-nearest neighbor;k-NN)において、この手法のパラメータであるkに1を入力し、また、metricとして“minkowski”を選択する。次いで、転移元モデル評価部150は、k近傍法にn種類の拡張観測データを1種類ずつ入力することによって、良品を意味する予測値である“0”等のn個の予測値を取得する。その後、転移元モデル評価部150は、予測値と拡張観測データに関する判定結果の実測値を式(3)に入力することによって、汎化誤差を算出する。例えば、3種類の予測値が順に“0”、“1”、“0”であり、拡張観測データに関する実測値が順に“0”、“0”、“0”である場合、汎化誤差として((0-0)+(1-0)+(0-0))/3=0.33が求められる。
次に、転移元モデル評価部150は、ステップS402で、転移後性能向上率、転移可能性を算出する。転移後性能向上率は、例えば、ステップS401で算出された拡張観測データの転移元モデルに対する汎化誤差が0.33であり、転移先に係る観測データの転移元モデルに対する汎化誤差が0.322である場合、0.33/0.322=1.02と算出される。転移可能性(評価結果)は、例えば、転移元に係る観測データの転移元モデルに対する汎化誤差が0.305である場合に、0.305/0.33*100=92%と算出される。なお、以降に行われる図10のステップS15おいては、例えば、転移可能性に関する閾値が90%である場合には、転移可能性92%は閾値90%以上であるために閾値以上と判定され、転移可能フラグ(“OK”)が立てられる。ステップS402で算出された転移後性能向上率及び転移可能性と、ステップS15での転移可能フラグ(転移可能判定結果)とは、例えば、転移元モデル評価部150により、後述する転移可能性判定結果画面90(図17参照)に表示される。
上記した性能評価処理によると、分析モデル転移可能性判定装置1は、転移先のタスクに転移元モデルを転移することが可能か否かを容易且つ適切に判定することができる。
次に、モデル転移可能性判定装置1により表示される各種画面について説明する。
図15は、データ入力画面の一例を示す図である。
データ入力画面70は、データ入力部110によりユーザI/F50に表示され、静的特性データ及び観測データを入力するための画面である。データ入力画面70は、静的特性データ入力欄700、観測データ入力欄701、転移可能性判定ボタン702、及び分析モデル情報登録画面への遷移ボタン703を含む。
静的特性データ入力欄700は、静的特性データを入力するための欄である。静的特性データ入力欄700では、静的特性因子とその値との組の入力を受け付ける。観測データ入力欄701は、観測データを格納しているファイル又はディレクトリを指定(入力)するための欄である。転移可能性判定ボタン702は、静的特性データ入力欄700及び観測データ入力欄701に記載されたデータに係るタスクへの転移が可能な分析モデルを選択し、この分析モデルの転移可能性を算出する処理(上記したメイン処理)を起動させるためのボタンである。転移可能性判定ボタン702が押下されると、メイン処理が実行される。分析モデル情報入力画面への遷移ボタン703は、分析モデル情報入力画面80(図16参照)へ画面遷移させる処理を起動させるためのボタンである。分析モデル情報入力画面への遷移ボタン703が押下されると、データ入力部110は、分析モデル情報入力画面80を表示する。
例えば、図15に示すデータ入力画面70においては、静的特性データ入力欄700には、“部位A幅”、“部位B幅”、“原料X割合”、“原料Y割合”の4種類の静的特性因子に関する入力欄には、“0.8”、“10”、“15%”、“3%”等の静的特性因子の値が入力されている。また、観測データ入力欄701には、観測データが格納されているディレクトリ名である“product_x/sensor_data”が入力されている。
次に、分析モデル情報入力画面80について説明する。
図16は、分析モデル情報入力画面の一例を示す図である。
分析モデル情報入力画面80は、分析モデルに関する情報を入力する画面である。分析モデル情報入力画面80は、ベースモデル名入力欄800、モデルパラメータ入力欄801、特徴量生成ファイル入力欄802、データ入力画面への遷移ボタン803、静的特性モデル生成ボタン804を含む。ベースモデル名入力欄800は、分析モデルを生成するために用いた手法の名前を入力するための欄である。モデルパラメータ入力欄801は、ベースモデル名入力欄800に入力された手法名の手法に係るパラメータ名と、このパラメータの値とを入力するための欄である。特徴量生成ファイル欄802は、特徴量生成ファイル270へのパスを入力するための欄である。データ入力画面への遷移ボタン803は、データ入力画面70に画面遷移する処理を起動させるためのボタンである。データ入力画面への遷移ボタン803が押下されると、データ入力部110は、データ入力画面70を表示する。静的特性モデル生成ボタン804は、静的特性モデルを生成する処理を起動させるためのボタンである。
例えば、図16に示す分析モデル情報入力画面80においては、ベースモデル名入力欄800には“k-NN”が入力されている。また、モデルパラメータ入力欄801には、パラメータ名が“k”と、このパラメータの値を示す“1”とが入力されている。特徴量生成ファイル入力欄802には、特徴量生成ファイル270のパスである“product_x/type_a.json”が入力されている。
次に、転移可能性判定結果画面について説明する。
図17は、転移可能性判定結果画面の一例を示す図である。
転移可能性判定結果画面90は、転移可能性の判定結果に係る情報を出力するための画面である。転移可能性判定結果表示画面90は、転移可能性判定結果表示欄91と、データ拡張結果表示欄92とを含む。転移可能性判定結果表示欄91は、転移可能性に関する判定結果を表示する欄である。転移可能性判定結果表示欄91は、転移元TID表示欄910、転移後性能向上率表示欄911、転移可能性表示欄912、及び転移可能性判定結果表示欄913を含む。転移元TID表示欄910は、転移元タスクに関するTIDを表示するための欄である。転移後性能向上率表示欄911は、観測データの拡張前後における性能向上の割合を示す欄であり、例えば、転移後性能向上率262が表示される。転移可能性表示欄912は、転移元モデルを転移先タスクに転移することができる可能性を表示する欄であり、例えば、転移可能性263が表示される。転移可能性判定結果表示欄913は、転移元モデルを転移先タスクに転移できるか否かの判定結果を表示する欄であり、転移可能判定結果264が表示される。
データ拡張結果表示欄92は、特徴量を拡張観測データに拡張する方法を示す欄である。データ拡張結果表示欄92は、拡張対象表示欄920、拡張幅表示欄921、及び幅算出根拠表示欄922を含む。拡張対象表示欄920は、拡張の対象となった特徴量の名前を表示する欄である。拡張幅表示欄921は、拡張の対象となった特徴量の拡張幅を表示する欄である。幅算出根拠表示欄922は、拡張幅表示欄921に表示した拡張幅を算出する根拠を示す欄であり、例えば、横軸が拡張対象の特徴量(説明関数)を示し、縦軸が静的特性因子(目標関数)を示す静的特性モデルのグラフが表示され、このグラフ上において、転移先タスクに関するデータ(第2観測データ)及び、転移先タスクに関するデータ(拡張観測データ:図中移転元に対応)がプロットされている。なお、縦軸の静的特性因子の種類は、ユーザが選択可能としてもよい。
例えば、図17に示す転移可能性判定結果表示画面90の転移可能性判定結果表示欄91には、転移元TID表示欄910が“1”であり、転移後性能向上率表示欄911が “1.02”であり、転移可能性表示欄912が“92%”であり、転移可能判定結果表示欄913が“OK”であるエントリが表示されている。また、データ拡張結果表示欄92には、拡張対象表示欄920が“風量A平均値”であり、拡張幅表示欄921が“15.2”であり、幅算出根拠表示欄922にS字型の関数グラフが表示されているエントリを含む複数のエントリが表示されている。
この転移可能性判定結果表示画面90によると、転移可能性判定結果表示欄91を参照することにより、ユーザは転移元タスクの分析モデルについての転移後性能向上率や、転移可能性や、転移可能性の判定結果を適切に把握することができる。また、データ拡張結果表示欄92を参照することにより、ユーザは拡張対象の特徴量と、拡張幅、及び拡張幅の算出根拠を適切に把握することができる。
なお、本発明は、上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で、適宜変形して実施することが可能である。
例えば、上記実施形態において、転移後性能向上率や、転移可能性や、転移可能性の判定結果を表示させた転移元モデルの中から、転移先タスクに使用する転移元モデルの指定をユーザから受け付け、指定された転移元モデルを用いて、転移先タスクにおける不良判定を行うようにしてもよい。具体的には、プロセッサ30は、ユーザから、所定の転移先タスクへ転移させる転移元タスクの分析モデルの指定を受け付け、転移先タスクに関する観測データを新たに受理し、観測データから転移元タスクの分析モデルに対応する拡張観測データを生成し、拡張観測データを転移元タスクの分析モデルに入力して、転移先タスクでの不良判定を行うようにしてもよい。この場合には、プロセッサ30が、指定受付部と、不良判定部とに対応する。このようにすると、指定した転移元モデルを使用して、転移先タスクにおける不良判定を容易且つ適切に行うことができる。
また、上記実施形態において、プロセッサが行っていた処理の一部又は全部を、ハードウェア回路で行うようにしてもよい。また、上記実施形態におけるプログラムは、プログラムソースからインストールされてよい。プログラムソースは、プログラム配布サーバ又は記憶メディア(例えば可搬型の記憶メディア)であってもよい。
1…分析モデル転移可能性判定装置、10…メモリ、11…モデル転移可能性判定プログラム、20…ストレージ、21…静的特性データ記憶部、22…観測データ記憶部、23…分析モデル記憶部、24…静的特性モデル記憶部、25…拡張データ記憶部、26…モデル転移可能性記憶部、30…プロセッサ、40…ネットワークI/F、50…ユーザI/F、110…データ入力部、120…静的特性情報モデリング部、130…転移元データ選択部、140…データ拡張部、150…転移元モデル評価部



Claims (9)

  1. 転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する転移可能性判定装置であって、
    前記転移元タスクの対象物又は事象に関する静的な特性を示す第1静的特性データと、前記転移元タスクの対象物又は事象へ作用を及ぼす物又は事象を観測した第1観測データとの入力を受け付けるデータ入力部と、
    前記第1静的特性データを目的変数とし、前記第1観測データに関する特徴量を説明変数として、静的特性モデルを生成する静的特性情報モデリング部と、
    転移先タスクの対象物又は事象に関する静的な特性を示す第2静的特性データを受理し、前記第1静的特性データと、前記第2静的特性データとの距離に基づいて、複数の第1静的特性データの中から処理に利用する第1静的特性データを選択する転移元データ選択部と、
    前記転移先タスクの対象物又は事象へ作用を及ぼす物又は事象を観測した第2観測データを受理し、前記第2観測データと、選択された前記第1静的特性データと、前記静的特性モデルとに基づいて、前記分析モデルでの利用に適した拡張観測データを算出するデータ拡張部と、
    前記分析モデルに前記拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、前記汎化誤差に基づいて、前記分析モデルの前記転移先タスクへの転移可能性を評価する転移元モデル評価部と、
    を備える転移可能性判定装置。
  2. 前記転移元モデル評価部は、前記転移可能性の情報を表示させる
    請求項1に記載の転移可能性判定装置。
  3. 前記静的特性情報モデリング部は、
    複数種類の特徴量の中から使用する特徴量を決定して静的特性モデルを生成し、生成した前記静的特性モデルによる静的特性データの汎化誤差を算出する処理を、使用する特徴量の組合せを変えて複数回繰り返し行い、
    複数の前記静的特性モデルの内の前記静的特性データの汎化誤差が最も小さい又は所定の閾値以下の静的特性モデルを、使用する静的特性モデルに決定する
    請求項1に記載の転移可能性判定装置。
  4. 前記静的特性情報モデリング部は、
    生成された静的特性モデルで出力される静的特性データの静的特性因子毎に汎化誤差を算出し、汎化誤差が所定の閾値以下となる静的特性因子のみを目的変数とする静的特性モデルを、使用する静的特性モデルに決定する
    請求項1に記載の転移可能性判定装置。
  5. 前記データ拡張部は、転移先タスクに関する第2観測データに基づく特徴量を前記静的特性モデルの説明変数の初期値とし、転移元タスクに関する選択された前記第1静的特性データの値と前記静的特性モデルの出力値との差を低減するように、反復法により、前記静的特性モデルの説明変数の解を算出し、説明変数の解を拡張観測データとして出力する
    請求項1に記載の転移可能性判定装置。
  6. 転移元モデル評価部は、前記静的特性モデルの目的変数と説明変数との関係を示すグラフを表示させるとともに、前記グラフに対応させて、前記第2観測データと、前記拡張観測データとを表示させる
    請求項1に記載の転移可能性判定装置。
  7. 前記転移先タスクへ転移させる転移元タスクの分析モデルの指定を受け付ける指定受付部をさらに備え、
    前記データ入力部は、前記転移先タスクの対象物又は事象へ作用を及ぼす物又は事象を新たに観測した第3観測データを受理し、
    前記データ拡張部は、前記第3観測データに基づいて、指定された前記分析モデルでの利用に適した拡張観測データを算出し、
    指定された前記分析モデルに対して、前記拡張観測データを入力することにより、前記転移先タスクにおける不良判定を行う不良判定部をさらに備える
    請求項1に記載の転移可能性判定装置。
  8. 転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する転移可能性判定装置による転移可能性判定方法であって、
    前記転移元タスクの対象物又は事象に関する静的な特性を示す第1静的特性データと、前記転移元タスクの対象物又は事象へ作用を及ぼす物又は事象を観測した第1観測データとの入力を受け付け、
    前記第1静的特性データを目的変数とし、前記第1観測データに関する特徴量を説明変数として、静的特性モデルを生成し、
    転移先タスクの対象物又は事象に関する静的な特性を示す第2静的特性データを受理し、前記第1静的特性データと、前記第2静的特性データとの距離に基づいて、複数の前記第1静的特性データの中から処理に利用する第1静的特性データを選択し、
    前記転移先タスクの対象物又は事象へ作用を及ぼす物又は事象を観測した第2観測データを受理し、前記第2観測データと、選択された前記第1静的特性データと、前記静的特性モデルとに基づいて、前記分析モデルでの利用に適した拡張観測データを算出し、
    前記分析モデルに前記拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、前記汎化誤差に基づいて、前記分析モデルの前記転移先タスクへの転移可能性を評価する
    転移可能性判定方法。
  9. 転移元タスクの分析モデルの転移先タスクへの転移可能性を判定する処理をコンピュータに実行させるための転移可能性判定プログラムであって、
    前記コンピュータを
    前記転移元タスクの対象物又は事象に関する静的な特性を示す第1静的特性データと、前記転移元タスクの対象物又は事象へ作用を及ぼす物又は事象を観測した第1観測データとの入力を受け付けるデータ入力部と、
    前記第1静的特性データを目的変数とし、前記第1観測データに関する特徴量を説明変数として、静的特性モデルを生成する静的特性情報モデリング部と、
    転移先タスクの対象物又は事象に関する静的な特性を示す第2静的特性データを受理し、前記第1静的特性データと、前記第2静的特性データとの距離に基づいて、前記第1静的特性データの中から処理に利用する第1静的特性データを選択する転移元データ選択部と、
    前記転移先タスクの対象物又は事象へ作用を及ぼす物又は事象を観測した第2観測データを受理し、前記第2観測データと、選択された前記第1静的特性データと、前記静的特性モデルとに基づいて、前記分析モデルでの利用に適した拡張観測データを算出するデータ拡張部と、
    前記分析モデルに前記拡張観測データを入力して得られる予測結果についての汎化誤差を算出し、前記汎化誤差に基づいて、前記分析モデルの前記転移先タスクへの転移可能性を評価する転移元モデル評価部として機能させる
    転移可能性判定プログラム。
JP2019212832A 2019-11-26 2019-11-26 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム Active JP7353940B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019212832A JP7353940B2 (ja) 2019-11-26 2019-11-26 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム
TW109126639A TWI787640B (zh) 2019-11-26 2020-08-06 可轉移性判定裝置、可轉移性判定方法、及可轉移性判定程式
US17/012,395 US20210157707A1 (en) 2019-11-26 2020-09-04 Transferability determination apparatus, transferability determination method, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019212832A JP7353940B2 (ja) 2019-11-26 2019-11-26 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム

Publications (2)

Publication Number Publication Date
JP2021086241A JP2021086241A (ja) 2021-06-03
JP7353940B2 true JP7353940B2 (ja) 2023-10-02

Family

ID=75973947

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019212832A Active JP7353940B2 (ja) 2019-11-26 2019-11-26 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム

Country Status (3)

Country Link
US (1) US20210157707A1 (ja)
JP (1) JP7353940B2 (ja)
TW (1) TWI787640B (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7056794B1 (ja) * 2021-11-10 2022-04-19 トヨタ自動車株式会社 モデル学習システム及びモデル学習装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160253597A1 (en) 2015-02-27 2016-09-01 Xerox Corporation Content-aware domain adaptation for cross-domain classification
US20180253628A1 (en) 2015-09-16 2018-09-06 Nec Corporation Pattern recognition apparatus, method, and program using domain adaptation

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6532076B1 (en) * 2000-04-04 2003-03-11 Therma-Wave, Inc. Method and apparatus for multidomain data analysis
WO2008036921A2 (en) * 2006-09-21 2008-03-27 Impact Technologies, Llc Systems and methods for predicting failure of electronic systems and assessing level of degradation and remaining useful life
TW200832243A (en) * 2007-01-19 2008-08-01 Ming-Shyan Huang Method for finding robust processing parameters using regression model
US9431006B2 (en) * 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8380647B2 (en) * 2009-08-14 2013-02-19 Xerox Corporation Training a classifier by dimension-wise embedding of training data
US8856050B2 (en) * 2011-01-13 2014-10-07 International Business Machines Corporation System and method for domain adaption with partial observation
US9177262B2 (en) * 2013-12-02 2015-11-03 Qbase, LLC Method of automated discovery of new topics
US20150317337A1 (en) * 2014-05-05 2015-11-05 General Electric Company Systems and Methods for Identifying and Driving Actionable Insights from Data
US20160078359A1 (en) * 2014-09-12 2016-03-17 Xerox Corporation System for domain adaptation with a domain-specific class means classifier
US9384450B1 (en) * 2015-01-22 2016-07-05 International Business Machines Corporation Training machine learning models for open-domain question answering system
JP6543066B2 (ja) * 2015-03-30 2019-07-10 株式会社メガチップス 機械学習装置
US9971856B2 (en) * 2015-05-28 2018-05-15 International Business Machines Corporation CFD modeling of a bounded domain with viscous region partitioning
EP3136270B1 (en) * 2015-08-26 2021-02-24 Viavi Solutions Inc. Raw material identification using spectroscopy
US11137462B2 (en) * 2016-06-10 2021-10-05 Board Of Trustees Of Michigan State University System and method for quantifying cell numbers in magnetic resonance imaging (MRI)
EP3312693A1 (en) * 2016-10-21 2018-04-25 ASML Netherlands B.V. Methods & apparatus for controlling an industrial process
US10489280B2 (en) * 2017-11-21 2019-11-26 International Business Machines Corporation Method and apparatus for test modeling
US11128648B2 (en) * 2018-01-02 2021-09-21 Maryam AMIRMAZLAGHANI Generalized likelihood ratio test (GLRT) based network intrusion detection system in wavelet domain
US10586001B2 (en) * 2018-01-08 2020-03-10 Synopsys, Inc. Automated root-cause analysis, visualization, and debugging of static verification results
US10810408B2 (en) * 2018-01-26 2020-10-20 Viavi Solutions Inc. Reduced false positive identification for spectroscopic classification
US11009452B2 (en) * 2018-01-26 2021-05-18 Viavi Solutions Inc. Reduced false positive identification for spectroscopic quantification
WO2019198143A1 (ja) * 2018-04-10 2019-10-17 株式会社日立製作所 加工レシピ生成装置
US10817805B2 (en) * 2018-05-18 2020-10-27 Google Llc Learning data augmentation policies
US10685172B2 (en) * 2018-05-24 2020-06-16 International Business Machines Corporation Generating a textual description of an image using domain-independent anomaly analysis
US11481664B2 (en) * 2018-09-05 2022-10-25 General Electric Company Methods and systems for generating device-specific machine learning model
US20200134090A1 (en) * 2018-10-26 2020-04-30 Ca, Inc. Content exposure and styling control for visualization rendering and narration using data domain rules
CA3060811A1 (en) * 2018-10-31 2020-04-30 Royal Bank Of Canada System and method for cross-domain transferable neural coherence model
US20220012611A1 (en) * 2018-11-21 2022-01-13 Telefonaktiebolaget Lm Ericsson (Publ) Method and machine learning manager for handling prediction of service characteristics
US12009060B2 (en) * 2018-12-14 2024-06-11 Merck Sharp & Dohme Llc Identifying biosynthetic gene clusters
US11768932B2 (en) * 2019-06-28 2023-09-26 Baidu Usa Llc Systems and methods for fast training of more robust models against adversarial attacks
US20210019665A1 (en) * 2019-07-18 2021-01-21 International Business Machines Corporation Machine Learning Model Repository Management and Search Engine
US11475128B2 (en) * 2019-08-16 2022-10-18 Mandiant, Inc. System and method for heterogeneous transferred learning for enhanced cybersecurity threat detection
EP4033417A4 (en) * 2019-10-16 2022-10-12 Mitsubishi Electric Corporation SEARCH DEVICE, SEARCH METHOD, SEARCH PROGRAM, AND LEARNING MODEL SEARCH SYSTEM
US11443236B2 (en) * 2019-11-22 2022-09-13 International Business Machines Corporation Enhancing fairness in transfer learning for machine learning models with missing protected attributes in source or target domains

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160253597A1 (en) 2015-02-27 2016-09-01 Xerox Corporation Content-aware domain adaptation for cross-domain classification
US20180253628A1 (en) 2015-09-16 2018-09-06 Nec Corporation Pattern recognition apparatus, method, and program using domain adaptation
JP2018529157A (ja) 2015-09-16 2018-10-04 日本電気株式会社 ドメイン適応を用いたパターン認識装置、方法およびプログラム

Also Published As

Publication number Publication date
TW202121221A (zh) 2021-06-01
TWI787640B (zh) 2022-12-21
US20210157707A1 (en) 2021-05-27
JP2021086241A (ja) 2021-06-03

Similar Documents

Publication Publication Date Title
JP6978541B2 (ja) 動的外れ値偏り低減のコンピュータ実装方法、コンピュータシステム及びコンピュータ装置
Chien et al. Analysing semiconductor manufacturing big data for root cause detection of excursion for yield enhancement
Gazalba et al. Comparative analysis of k-nearest neighbor and modified k-nearest neighbor algorithm for data classification
JP6969637B2 (ja) 因果関係分析方法および電子デバイス
RU2522037C2 (ru) Идентификация отказов в авиационном двигателе
JP6531821B2 (ja) 予測モデル更新システム、予測モデル更新方法および予測モデル更新プログラム
US8954910B1 (en) Device mismatch contribution computation with nonlinear effects
Ribeiro et al. A recommender system for process discovery
JP2018152063A (ja) 学習結果識別装置、学習結果識別方法、及びそのプログラム
JP2012226511A (ja) 歩留まり予測システムおよび歩留まり予測プログラム
CN107016416B (zh) 基于邻域粗糙集和pca融合的数据分类预测方法
Rydman Application of the peaks-over-threshold method on insurance data
JP2018180712A (ja) モデル変数候補生成装置および方法
CN112907026A (zh) 一种基于可编辑网状指标体系的综合评估方法
Kazakov et al. Development of the concept of management of economic systems processes through construction and calling of machine learning models
JP5146084B2 (ja) モデル作成支援システム、モデル作成支援方法、モデル作成支援プログラム
JP7353940B2 (ja) 転移可能性判定装置、転移可能性判定方法、及び転移可能性判定プログラム
Wu et al. Fuzzy nonlinear programming approach for evaluating and ranking process yields with imprecise data
Sawarkar et al. Predicting bug estimation time for newly reported bug using machine learning algorithms
US20200393799A1 (en) Information processing apparatus, information processing method, and non-transitory computer readable medium
Gunawan et al. C4. 5, K-Nearest Neighbor, Naïve Bayes, and Random Forest Algorithms Comparison to Predict Students' on TIME Graduation
CN114155412A (zh) 深度学习模型迭代方法、装置、设备及存储介质
Liu et al. Improved time-variant fuzzy time series forecast
WO2020225959A1 (ja) 設計支援システム、設計支援方法および設計支援プログラム
Giollo et al. Machine learning for fab automated diagnostics

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220608

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230612

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230919

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230920

R150 Certificate of patent or registration of utility model

Ref document number: 7353940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150