JP7287093B2

JP7287093B2 - 学習プログラム、学習方法および学習装置

Info

Publication number: JP7287093B2
Application number: JP2019086665A
Authority: JP
Inventors: 達也山本; 正芳橋間; 諒介若杉; 健太石脇
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2019-04-26
Filing date: 2019-04-26
Publication date: 2023-06-06
Anticipated expiration: 2039-04-26
Also published as: JP2020184111A

Description

本発明は、学習プログラム、学習方法および学習装置に関する。

製造業などでは、経験則に基づく判断が品質を左右する状況がある。このことから、経験則に基づく判断の可視化として、製造装置のＩｏＴ（Internet of Things）データを取得し、品質の傾向を機械学習し、品質を判定する品質モデルを生成する取り組みが行われている。

例えば、加工装置から得られる加工データと検査装置から得られる品質データの相関を計算することで、加工データから品質を予測する品質予測技術が知られている。この品質予測技術では、加工データから品質を予測する、加工データと品質データとの相関を表す線形モデルなどの学習モデルを量産工程の事前試験で生成する。そして、事前に生成した学習モデルに、加工データを入力して良品と不良品を判定することで、検査工程を削減する。

特開２０１７－２１５８３２号公報特開２０１８－１５６４１５号公報特開２０１７－１３０１００号公報

しかしながら、上記技術では、事前の試験工程のデータで学習した学習モデルを量産工程に適用した場合に、品質を正確に予測できないことあり、予測精度がよくない。

具体的には、試験工程と量産工程とでは、暖機運転時間や気温などの加工環境が異なるので、試験工程で生成した学習モデルが量産工程では適合しないことがある。また、製造バラつきの存在や、人の判断や操作などの不安定な動作環境で取得されたデータを学習データに用いるので、単純に機械学習でデータを学習するだけでは、高い品質判定の精度が期待できない。

例えば、特定の条件だけを反映した学習用のＩｏＴデータを得るために、試験工程の製造ラインを停止させた状態で取得されたデータを用いて、学習モデルが生成される。この場合、量産工程で取得されるデータは、連続動作状態で取得されるデータであり、学習データと予測対象データ（量産データ）との間で取得環境が異なるので、性質が異なる学習データから生成した学習モデルを量産データに適用しても高い精度は得られない。

なお、試験工程と量産工程との違いは、暖機の影響などが候補ではあるが、原因を突き詰めて調査を行うには工数がかかりすぎることから現実的ではない。

一つの側面では、予測精度の劣化を低減することができる学習プログラム、学習方法および学習装置を提供することを目的とする。

第１の案では、学習プログラムは、コンピュータに、製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第１の異常値割合を算出する処理を実行させる。学習プログラムは、コンピュータに、前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第２の異常値割合を算出する処理を実行させる。学習プログラムは、コンピュータに、前記第１の異常値割合と前記第２の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出する処理を実行させる。学習プログラムは、コンピュータに、前記試験工程で得られる試験データのうち、学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更する処理を実行させる。

一つの側面では、予測精度の劣化を低減することができる。

図１は、実施例１にかかる品質予測装置を説明する図である。図２は、実施例１にかかる品質予測装置の機能構成を示す機能ブロック図である。図３は、試験データＤＢに記憶される情報の例を示す図である。図４は、モデルリストＤＢに記憶される情報の例を示す図である。図５は、異常値割合の検出手法を説明する図である。図６は、類似度判定のパターンＡを説明する図である。図７は、類似度判定のパターンＢを説明する図である。図８は、類似度判定のパターンＣを説明する図である。図９は、適用モデルの決定を説明する図である。図１０は、学習データの抽出を説明する図である。図１１は、全体的な処理の流れを示すフローチャートである。図１２は、異常割合の算出処理の流れを示すフローチャートである。図１３は、指標算出処理の流れを示すフローチャートである。図１４は、ランダム性がある機械学習を採用したときの例を説明する図である。図１５は、ハードウェア構成例を説明する図である。

以下に、本願の開示する学習プログラム、学習方法および学習装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。

［品質予測装置の説明］
図１は、実施例１にかかる品質予測装置１０を説明する図である。図１に示すように、品質予測装置１０は、製造業などの工場等で生成される製品の品質を予測する学習モデル（予測モデル）を生成し、学習済みの学習モデルを用いて、品質を予測するコンピュータ装置である。

具体的には、品質予測装置１０は、製品の製造や品質検査などを事前に行う試験工程で得られる試験データを学習データに用いて、学習モデルを学習する。そして、品質予測装置１０は、試験完了後に実際に製品が製造される量産工程において製造された製品に関する量産データを、学習済みの学習モデルに入力して、量産工程で製造される製品の品質を予測する。

なお、試験工程を実施するのは、以下のような理由が挙げられる。例えば、研削加工機の振る舞いを確認するためである。同じ型式の加工機でも、それぞれの加工機が製造される際のバラツキに伴う機差があり、それぞれの特性を知るために、試験工程が実施される。また、量産工程では稀なケース（コーナーケース）を敢えて作り出し、その際の振る舞いを確認するためである。また、机上でのシミュレーションだけでは考慮しきれないケースが存在するので、生産性の向上やコスト削減のための研削条件変更の際に、振る舞いを確認するためである。

一般的には、製造装置の暖機の有無、室温、気候、製造装置の稼働時間など、試験工程の環境と量産工程の環境とが異なることから、試験工程のデータで学習された学習モデルは、試験工程にオーバーフィッティングする。このため、試験工程のデータにより学習された学習モデルを試験工程に適用したときに、品質の予測精度が劣化することがある。

そこで、実施例１にかかる品質予測装置１０は、試験工程の試験データと量産工程の量産データの間の類似度を算出し、類似度に合わせた量の試験データを用いて、学習モデルの学習することで、試験工程へのオーバーフィッティングを抑制する。

例えば、試験工程では、加工装置により、試験環境に関するデータである加工データが生成され、検査装置により、試験工程で生成された製品における異常な製品の割合などである品質データを生成される。同様に、量産工程では、一定期間、製品の量産を行って、量産環境に関する加工データが生成され、量産工程で生成された製品における異常な製品の割合などである品質データが生成される。

そして、品質予測装置１０は、試験工程の品質データと量産工程の品質データの類似度を算出する。続いて、品質予測装置１０は、試験工程の加工データと品質データとから構成される学習データのうち、類似度に基づく割合の学習データを抽出し、抽出した学習データを用いて学習モデルを学習する。ここで、品質予測装置１０は、加工データを説明変数、品質データを目的変数として、学習を実行する。

その後、品質予測装置１０は、学習データの割合制御が実行された上で学習された学習モデルを量産工程に適用する。すなわち、品質予測装置１０は、量産工程の加工装置により製造された製品のデータを、学習済みの学習モデルに入力し、その出力結果に基づいて、量産工程の品質を予測する。この結果、試験工程へのオーバーフィッティングを抑制でき、予測精度の劣化を低減することができる。

［機能構成］
図２は、実施例１にかかる品質予測装置１０の機能構成を示す機能ブロック図である。なお、各工程の加工装置と検査装置は、一般的に利用される各装置を用いることができるので、詳細な説明は省略する。図２に示すように、品質予測装置１０は、通信部１１、記憶部１２、制御部２０を有する。

通信部１１は、他の装置の間の通信を制御する処理部であり、例えば通信インタフェースなどである。例えば、通信部１１は、試験工程や量産工程の加工装置から加工データを受信し、各工程の検査装置から検査データを受信し、管理者端末に学習済みの学習モデルや予測結果などを送信する。

記憶部１２は、各種データや制御部２０が実行する各種プログラムなどを記憶する記憶装置であり、例えばメモリやハードディスクなどである。この記憶部１２は、試験データＤＢ１３、量産データＤＢ１４、モデルリストＤＢ１５、学習結果ＤＢ１６を記憶する。

試験データＤＢ１３は、試験工程で生成された加工データおよび品質データを記憶するデータベースである。図３は、試験データＤＢ１３に記憶される情報の例を示す図である。図３に示すように、試験データＤＢ１３は、「製品、加工データ、品質データ」を対応付けて記憶する。

ここで記憶される「製品」は、試験工程で製造された製品を特定する情報であり、例えば製品名、製品ＩＤなどである。「加工データ」は、試験工程の環境を示すデータであり、例えば切削速度や温度などである。「品質データ」は、試験工程で生成された製品の品質を示すデータであり、例えば製品の平面度や直角度などである。ここで記憶されるデータは、試験工程の加工装置や検査装置で測定されるデータであり、各装置が生成することもでき、管理者等により生成することもできる。

量産データＤＢ１４は、量産工程で生成された加工データおよび品質データを記憶するデータベースである。記憶される情報は、図３と同様なので、詳細な説明は省略する。なお、ここで記憶されるデータは、量産工程の加工装置や検査装置で測定されるデータであり、各装置が生成することもでき、管理者等により生成することもできる。

モデルリストＤＢ１５は、学習データの利用割合の決定に利用する情報を記憶するデータベースである。具体的には、モデルリストＤＢ１５は、試験工程と量産工程との類似度に基づいて、試験工程で生成された試験データのうち、学習データとして利用する割合を特定できるモデルリストを記憶する。

図４は、モデルリストＤＢ１５に記憶される情報の例を示す図である。図４に示すように、モデルリストＤＢ１５は、「Ｍｅｔｒｉｘ、類似度ランク、モデル（学習％、テスト％）」を対応付けて記憶する。ここで記憶される「Ｍｅｔｒｉｘ」は、試験データと量産データとの類似度の指標を示す情報である。「類似度ランク」は、試験データと量産データとの類似度を特定する情報である。「モデル（学習％）」は、全試験データのうち、学習に利用する割合を示す情報であり、「モデル（テスト％）」は、全試験データのうち、学習済みの学習モデルの検証に利用する割合を示す情報である。

図４の例では、「Ｍｅｔｒｉｘ」が「０．４」のとき、類似度ランクが４となり、試験データのうち、６０％を学習データとして用い、４０％を検証データとして用いることが定義されている。なお、ここで定義される情報は、ユーザ等により事前に定義される。また、図４の例では、１０段階の類似度ランクを定義する例を説明したが、あくまで一例であり、任意に設定変更することができる。また、各割合もあくまで一例であり、任意に設定変更することができる。

学習結果ＤＢ１６は、学習結果を記憶するデータベースである。例えば、学習結果ＤＢ１６は、後述する学習部２４により学習された学習モデルの各種パラメータなどを記憶する。ここで記憶される各種パラメータを用いることで、学習済みの学習モデルを構築することができる。

制御部２０は、品質予測装置１０全体を司る処理部であり、例えばプロセッサなどである。この制御部２０は、異常算出部２１、指標算出部２２、ランク決定部２３、学習部２４、品質予測部２５を有する。なお、異常算出部２１、指標算出部２２、ランク決定部２３、学習部２４、品質予測部２５は、プロセッサが有する電子回路の一例やプロセッサが実行するプロセスの一例である。

異常算出部２１は、試験工程と量産工程それぞれについて、製造された製品の異常割合を算出する処理部である。具体的には、異常算出部２１は、試験工程で得られた品質データにおける異常値（異常製品）の割合を、品質データのパラメータごとに算出する。同様に、異常算出部２１は、量産工程で得られた品質データにおける異常値（異常製品）の割合を、品質データのパラメータごとに算出する。そして、異常算出部２１は、算出結果を記憶部１２に記憶したり、指標算出部２２に出力したりする。

例えば、異常算出部２１は、ガンマ分布による異常検出や混合正規分布を仮定した異常検出など、一般的に利用されている手法を用いることができるが、ここでは、一例としてパラメータの値を閾値との比較により、異常検出を行う例を説明する。

図５を用いて、試験工程における異常検出を説明する。図５は、異常値割合の検出手法を説明する図である。図５に示すように、異常算出部２１は、試験工程で生成されたＭ個（Ｍは１以上の数）の製品に対応する品質データが有する平面度や直角度などの複数のパラメータから、１つのパラメータ（パラメータＡ）を選択する。そして、異常算出部２１は、各製品に対応するパラメータＡの値が閾値以上か否かを判定し、閾値以上であって異常と判定されるパラメータＡを有する製品の数を計数する。

ここで、異常算出部２１は、閾値以上である製品の数がＭａ個と計数された場合、パラメータＡの異常値割合を「異常数／全体個数＝Ｍａ／Ｍ」と算出する。このようにして、異常算出部２１は、品質データに含まれる各パラメータについて、上述した処理を実行して、異常値割合を算出する。すなわち、異常算出部２１は、品質データ内にＰ個（Ｐは１以上の数）のパラメータが存在する場合、Ｐ個のパラメータそれぞれについて、異常値割合を算出する。

また、異常算出部２１は、量産工程で製造された製品の品質データについても同様の処理により、各パラメータの異常値割合を算出する。なお、量産工程では、試験工程との類似度を測定するために、１０分などの所定時間分、製造ラインを稼働させて、品質データの収集が実行される。

指標算出部２２は、試験工程と量産工程との類似度を指標化する処理部である。具体的には、指標算出部２２は、異常算出部２１により算出された、試験工程における各パラメータの異常値割合および量産工程の各パラメータの異常値割合に基づき、試験工程と量産工程との比較結果（diff）を算出する。

例えば、指標算出部２２は、式（１）に示す混合正規分布を用いたクラスタリングにより、各パラメータについて「diff」を算出する。その後、指標算出部２２は、式（２）を用いて、各パラメータのdiffを加算した合計値を、パラメータの数（Ｎ：Ｎは１以上の数）で除算することで、試験工程と量産工程との類似度を示す指標「Ｍｅｔｒｉｘ」を算出する。そして、指標算出部２２は、算出した指標「Ｍｅｔｒｉｘ」をランク決定部２３に出力する。

ランク決定部２３は、指標算出部２２により算出された結果に基づいて、類似度ランクを決定する処理部である。具体的には、ランク決定部２３は、モデルリストＤＢ１５を参照し、指標算出部２２から入力された「Ｍｅｔｉｒｘ」に対応する類似度ランクを特定する。そして、ランク決定部２３は、特定した類似度ランクを、決定したランクとして学習部２４に出力する。

学習部２４は、ランク決定部２３により決定された類似度ランクに対応する割合に基づき、機械学習を実行して学習モデルを生成する処理部である。例えば、学習部２４は、類似度ランク「６」が通理されると、モデルリストＤＢ１５を参照して、「学習％＝４０」と「テスト％＝６０％」を特定する。

そして、学習部２４は、試験データに含まれるデータのうち、「４０％」のデータを抽出して、それらを学習データに決定する。その後、学習部２４は、読み出した試験データの加工データを「説明変数」、品質データを「目標変数（ラベル）」に用いた機械学習により、学習モデルを学習する。その後、学習部２４は、学習結果を学習結果ＤＢ１６に格納する。なお、抽出方法は、全試験データのうち、最新の４０％のデータを抽出したり、ランダムに４０％のデータを抽出したりするなど、任意に設定することができる。

品質予測部２５は、学習済みの学習モデルを用いて、品質予測を実行する処理部である。例えば、品質予測部２５は、学習結果ＤＢ１６に記憶される各種パラメータを読み出して、学習モデルを生成する。そして、品質予測部２５は、量産工程の加工データを学習済みの学習モデルに入力し、その出力結果を品質予測結果として取得する。その後、品質予測部２５は、品質予測結果をディスプレイ等の表示部に表示したり、管理者端末に送信したりする。例えば、品質予測部２５は、品質予測結果として、学習済みの学習モデルから、品質を特定する各パラメータが異常か正常かを示す確率や数値等を取得する。そして、品質予測部２５は、異常のパラメータが１つ以上または所定数以上存在する場合に、品質異常と予測する。

［具体例］
ここで、図６から図１０を用いて、異常値割合の算出、試験工程と量産工程との比較結果（diff）の算出、試験工程と量産工程との類似度を示す指標「Ｍｅｔｒｉｘ」の算出、学習手法の具体例を説明する。

（パターンＡ）
図６は、類似度判定のパターンＡを説明する図である。図６では、品質データのパラメータＸ０、Ｘ１、Ｘ２、Ｘ３それぞれについて、それぞれの閾値である異常値閾値（２．３）、異常値閾値（２．４）、異常値閾値（０．５）、異常値閾値（－０．８）を用いて、異常値割合を算出した例を示している。

具体的には、試験工程においては、パラメータＸ０の異常値割合が「１０％」、パラメータＸ１の異常値割合が「５％」、パラメータＸ２の異常値割合が「２０％」、パラメータＸ３の異常値割合が「３％」である。また、量産工程においては、パラメータＸ０の異常値割合が「１０％」、パラメータＸ１の異常値割合が「６％」、パラメータＸ２の異常値割合が「１５％」、パラメータＸ３の異常値割合が「２％」である。

このような状態において、指標算出部２２は、パラメータＸ０について、試験工程および量産工程の異常値割合のうち最大値が「１０」であり、各工程の異常値割合の差分が「１０－１０＝０」であることから、「diff＝０／１０＝０」と算出する。同様に、指標算出部２２は、パラメータＸ１について、試験工程および量産工程の異常値割合のうち最大値が「６」であり、各工程の異常値割合の差分が「６－５＝１」であることから、「diff＝１／６≒０．１７」と算出する。

同様に、指標算出部２２は、パラメータＸ２について、試験工程および量産工程の異常値割合のうち最大値が「２０」であり、各工程の異常値割合の差分が「２０－１５＝５」であることから、「diff＝５／２０＝０．２５」と算出する。また、指標算出部２２は、パラメータＸ３について、試験工程および量産工程の異常値割合のうち最大値が「３」であり、各工程の異常値割合の差分が「３－２＝１」であることから、「diff＝１／３≒０．３」と算出する。

そして、指標算出部２２は、パラメータＸ０、Ｘ１、Ｘ２、Ｘ３それぞれのdiffの合計値をパラメータの数である「４」で除算することで、「Ｍｅｔｒｉｘ＝（０＋０．１７＋０．２５＋０．３）／４＝０．１８」と算出する。この結果、ランク決定部２３は、モデルリストを参照し、Ｍｅｔｒｉｘ「０．１８」以上のうち最も低いランクである類似度ランク（２）を特定する。すなわち、パターンＡの量産工程は、試験工程に近い環境であることが特定され、パターンＡでは、試験工程へのフィット率を上げた学習が行われる。

（パターンＢ）
図７は、類似度判定のパターンＢを説明する図である。図６では、図６と同様に、品質データのパラメータＸ０、Ｘ１、Ｘ２、Ｘ３それぞれについて、それぞれの閾値である異常値閾値（２．３）、異常値閾値（２．４）、異常値閾値（０．５）、異常値閾値（－０．８）を用いて、異常値割合を算出した例を示している。

具体的には、試験工程においては、パラメータＸ０の異常値割合が「１０％」、パラメータＸ１の異常値割合が「５％」、パラメータＸ２の異常値割合が「２０％」、パラメータＸ３の異常値割合が「３％」である。また、量産工程においては、パラメータＸ０の異常値割合が「１１％」、パラメータＸ１の異常値割合が「３０％」、パラメータＸ２の異常値割合が「１０％」、パラメータＸ３の異常値割合が「２％」である。

このような状態において、指標算出部２２は、パラメータＸ０について、試験工程および量産工程の異常値割合のうち最大値が「１１」であり、各工程の異常値割合の差分が「１１－１０＝１」であることから、「diff＝１／１１≒０．１」と算出する。同様に、指標算出部２２は、パラメータＸ１について、試験工程および量産工程の異常値割合のうち最大値が「３０」であり、各工程の異常値割合の差分が「３０－５＝２５」であることから、「diff＝１０／３０≒０．８３」と算出する。

同様に、指標算出部２２は、パラメータＸ２について、試験工程および量産工程の異常値割合のうち最大値が「２０」であり、各工程の異常値割合の差分が「２０－１０＝１０」であることから、「diff＝１０／２０＝０．５」と算出する。また、指標算出部２２は、パラメータＸ３について、試験工程および量産工程の異常値割合のうち最大値が「３」であり、各工程の異常値割合の差分が「３－２＝１」であることから、「diff＝１／３≒０．３」と算出する。

そして、指標算出部２２は、パラメータＸ０、Ｘ１、Ｘ２、Ｘ３それぞれのdiffの合計値をパラメータの数である「４」で除算することで、「Ｍｅｔｒｉｘ＝（０．１＋０．８３＋０．５＋０．３）／４＝０．４３」と算出する。この結果、ランク決定部２３は、モデルリストを参照し、Ｍｅｔｒｉｘ「０．４３」以上のうち最も低いランクである類似度ランク（５）を特定する。

（パターンＣ）
図８は、類似度判定のパターンＣを説明する図である。図Ｃでは、図６と同様に、品質データのパラメータＸ０、Ｘ１、Ｘ２、Ｘ３それぞれについて、それぞれの閾値である異常値閾値（２．３）、異常値閾値（２．４）、異常値閾値（０．５）、異常値閾値（－０．８）を用いて、異常値割合を算出した例を示している。

具体的には、試験工程においては、パラメータＸ０の異常値割合が「１０％」、パラメータＸ１の異常値割合が「５％」、パラメータＸ２の異常値割合が「２０％」、パラメータＸ３の異常値割合が「３％」である。また、量産工程においては、パラメータＸ０の異常値割合が「４０％」、パラメータＸ１の異常値割合が「１０％」、パラメータＸ２の異常値割合が「８０％」、パラメータＸ３の異常値割合が「３０％」である。

このような状態において、指標算出部２２は、パラメータＸ０について、試験工程および量産工程の異常値割合のうち最大値が「４０」であり、各工程の異常値割合の差分が「４０－１０＝３０」であることから、「diff＝３０／４０＝０．７５」と算出する。同様に、指標算出部２２は、パラメータＸ１について、試験工程および量産工程の異常値割合のうち最大値が「１０」であり、各工程の異常値割合の差分が「１０－５＝５」であることから、「diff＝５／１０＝０．５」と算出する。

同様に、指標算出部２２は、パラメータＸ２について、試験工程および量産工程の異常値割合のうち最大値が「８０」であり、各工程の異常値割合の差分が「８０－２０＝６０」であることから、「diff＝６０／８０＝０．７５」と算出する。また、指標算出部２２は、パラメータＸ３について、試験工程および量産工程の異常値割合のうち最大値が「３０」であり、各工程の異常値割合の差分が「３０－３＝２７」であることから、「diff＝２７／３０＝０．９」と算出する。

そして、指標算出部２２は、パラメータＸ０、Ｘ１、Ｘ２、Ｘ３それぞれのdiffの合計値をパラメータの数である「４」で除算することで、「Ｍｅｔｒｉｘ＝（０．７５＋０．５＋０．７５＋０．９）／４＝０．７３」と算出する。この結果、ランク決定部２３は、モデルリストを参照し、Ｍｅｔｒｉｘ「０．７３」以上のうち最も低いランクである類似度ランク（８）を特定する。すなわち、パターンＣの量産工程は、試験工程とは類似しない環境であり、パターンＣでは、試験工程へのフィット率を下げた学習が行われる。

（学習処理の説明）
図９は、適用モデルの決定を説明する図である。ここでは、上記パターンＡ、Ｂ、Ｃのそれぞれに対する適用モデルの決定を説明する。図９に示すように、学習部２４は、パターンＡでは類似度ランクとして「２」が決定されたので、試験データの８０％を用いて学習を実行する。また、学習部２４は、パターンＢでは類似度ランクとして「５」が決定されたので、試験データの５０％を用いて学習を実行する。同様に、学習部２４は、パターンＣでは類似度ランクとして「８」が決定されたので、試験データの２０％を用いて学習を実行する。このように、各パターンについて、類似度ランクにより試験工程へのフィット率を調整した品質判定モデルの生成が実行される。

ここで、学習データの抽出イメージを説明する。図１０は、学習データの抽出を説明する図である。図１０に示すように、実施例１では、試験データと量産データの類似度を推定し、Ｘ％の一致度が推定された場合、学習データのうちＸ％の個数を抽出し、抽出した学習データを用いた学習が実行される。

一般的な技術では、試験データを全て使用することで、精度の高い品質予測モデルを作ろうとする。これに対して、実施例１では、類似度に合わせた量の試験データだけを使用する。例えば、類似度が８０ならば、試験データの８０％をランダムに抽出して使用する。これにより、試験データに対する予測精度が低くなるが、データのバラツキに強い品質予測モデルを作成することができる。

［処理の流れ］
図１１は、全体的な処理の流れを示すフローチャートである。図１１に示すように、品質予測装置１０は、処理開始が指示されると、試験工程の異常値割合を算出し（Ｓ１０１）、量産工程の異常値割合を算出する（Ｓ１０２）。

続いて、品質予測装置１０は、試験工程の異常値割合と量産工程の異常値割合とを用いて、指標を算出し（Ｓ１０３）、算出された指標に基づき、類似度ランクを決定する（Ｓ１０４）。

そして、品質予測装置１０は、決定された類似度ランクに基づく学習データの数を利用して、学習モデルを学習し（Ｓ１０５）、学習が完了すると、学習結果と量産工程の加工データとを用いて、量産工程の品質予測を実行する（Ｓ１０６）。

［異常割合算出処理］
図１２は、異常割合の算出処理の流れを示すフローチャートである。この処理は、図１１のＳ１０１とＳ１０２で実行される処理である。

図１２に示すように、異常算出部２１は、各工程の品質データに含まれる各パラメータを取得する（Ｓ２０１）。続いて、異常算出部２１は、取得したパラメータから１つのパラメータを抽出する（Ｓ２０２）。

そして、異常算出部２１は、抽出したパラメータの異常値割合を算出し（Ｓ２０３）、算出結果を記憶部１２等に格納する（Ｓ２０４）。その後、異常算出部２１は、未処理である残りのパラメータが存在する場合（Ｓ２０５：Ｙｅｓ）、未処理のパラメータについて、Ｓ２０２以降を繰り返す。一方、異常算出部２１は、残りのパラメータが存在しない場合（Ｓ２０５：Ｎｏ）、処理を終了する。

［指標算出処理］
図１３は、指標算出処理の流れを示すフローチャートである。この処理は、図１１のＳ１０３とＳ１０４で実行される処理である。

図１３に示すように、指標算出部２２は、各工程の品質データに含まれる各パラメータから１つのパラメータを選択し（Ｓ３０１）、選択したパラメータについて、試験工程と量産工程の異常値割合を取得する（Ｓ３０２）。続いて、指標算出部２２は、選択したパラメータの比較値（diff）を算出して記録する（Ｓ３０３）。

そして、指標算出部２２は、未算出である残りのパラメータが存在する場合（Ｓ３０４：Ｙｅｓ）、残りのパラメータについて、Ｓ３０１以降を繰り返す。

一方、未算出である残りのパラメータが存在しない場合（Ｓ３０４：Ｎｏ）、ランク決定部２３は、各パラメータの比較値（diff）を用いて、指標（Metrix）を算出して記憶部１２等に記録する（Ｓ３０５）。

そして、ランク決定部２３は、算出された指標（Metrix）に基づき、類似度ランクを決定する（Ｓ３０６）。その後、学習部２４により、類似度ランクに対応する学習データの割合に基づき、学習モデルの学習が実行される。

［効果］
上述したように、品質予測装置１０は、品質データの類似度に基づき、学習データに利用する試験データの割合を制御して、学習モデルの学習を実行する。このため、品質予測装置１０は、試験工程と環境が異なる量産工程に対しては、学習モデルが試験工程へオーバーフィッティングすることを抑制できるので、事前の試験工程のデータで学習した学習モデルを量産工程に適用した場合でも、予測精度の劣化を抑制することができる。また、品質予測装置１０は、試験工程と環境が類似する量産工程に対しては、多くの試験工程のデータを用いて学習モデルを生成することで、予測精度の劣化を抑制することができる。

したがって、品質予測装置１０は、量産工程の環境に応じて、学習に利用する試験データの割合を動的に制御することができるので、１つの試験工程のデータから、複数の量産工程それぞれに適した学習モデルを生成することができる。

さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。

［学習モデルの選択］
上記実施例では、類似度ランクに対応する割合の試験データを用いて学習する例を説明したが、これに限定されない。例えば、品質予測装置１０は、各類似度ランクに対応する割合の試験データを用いた複数の学習モデルを予め学習して用意しておく。そして、品質予測装置１０は、対象の量産工程と試験工程との類似度に基づく類似度ランクを特定し、特定した類似度ランクに対応する学習モデルを、予め保持する学習モデルの中から選択することもできる。このようにすることで、品質予測装置１０は、学習時間を短縮することができ、量産工程に適した学習モデルを用いた予測を迅速に実行することができる。

［ランダム性がある学習］
上記実施例では、ニューラルネットワークや線形モデルなどを利用した学習モデルを例示したが、これに限定されるものではなく、ランダムフォレストのように、ランダム性がある機械学習を用いることもできる。ランダム性がある機械学習では、同じ学習データであっても、テストデータに偏りが大きく、モデル構築毎にテストデータの選定にランダム性が発生し、大きく結果が変わる場合がある。つまり、同じ割合の試験データを学習データに用いても、精度が一律にならない。このため、品質予測装置１０は、複数の精度の学習モデルから適した学習モデルを選択することができる。

図１４は、ランダム性がある機械学習を採用したときの例を説明する図である。図１４に示すように、品質予測装置１０は、試験工程の品質データにおける異常値の割合と量産工程の品質データにおける異常値の割合とから、指標（Metrix）として「０．６」を算出したとする。この場合、品質予測装置１０は、類似度ランクを「６」と決定し、学習割合を「４０％」、検証割合を「６０％」と決定する。

そして、品質予測装置１０は、試験工程の試験データ（加工データおよび品質データ）の４０％を用いて、ランダムフォレストにより学習モデルを学習する。このとき、精度の異なるモデル１、モデル２、モデル３が生成されたとする。そして、品質予測装置１０は、試験工程の試験データのうち学習に利用されなかった残りの試験データ（残り６０％の加工データおよび品質データ）を用いて、モデル１、モデル２、モデル３それぞれの精度検証を実行し、モデル１の精度を９０％、モデル２の精度を８０％、モデル３の精度を８５％と算出する。ここで精度とは、正しく予測（識別）できた割合である。

すると、品質予測装置１０は、各精度の９０％、８０％、８５％の平均値「８５」を算出し、平均値に対応するモデル３を、量産工程用の学習モデルに決定する。このようにすることで、品質予測装置１０は、ランダム性がある機械学習であっても、類似度に基づくモデル選定を実行することができる。なお、平均値に限らず、最大値や最小値を採用することもできる。

［データや数値等］
上記実施例で用いたデータ例、数値例、表示例等は、あくまで一例であり、任意に変更することができる。また、入力データや学習方法などもあくまで一例であり、任意に変更することができる。なお、異常算出部２１は、第１算出部と第２算出部の一例であり、指標算出部２２は、第３算出部の一例であり、ランク決定部２３は、変更部の一例である。

［類似度算出］
類似度の算出には、公知の様々な手法を採用することができ、例えば、主成分分析（ＰＣＡ）による類似度検出を採用することができる。ＰＣＡを行うことで、パラメータを別軸に変換でき、この時のＰＣ１、ＰＣ２、ＰＣ３の軸に含まれるパラメータの種類の一致度を平均して、類似度とする。なお、完全にデータ発生の性質が同じであれば、ＰＣ１軸、ＰＣ２軸、ＰＣ３軸それぞれに含まれるパラメータは一致する。また、変数の種類のみを対象とし、値は考慮しない。

［システム］
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、ＣＰＵおよび当該ＣＰＵにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。

［ハードウェア］
図１５は、ハードウェア構成例を説明する図である。図１５に示すように、品質予測装置１０は、通信装置１０ａ、ＨＤＤ（Hard Disk Drive）１０ｂ、メモリ１０ｃ、プロセッサ１０ｄを有する。また、図１５に示した各部は、バス等で相互に接続される。

通信装置１０ａは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。ＨＤＤ１０ｂは、図２に示した機能を動作させるプログラムやＤＢを記憶する。

プロセッサ１０ｄは、図２に示した各処理部と同様の処理を実行するプログラムをＨＤＤ１０ｂ等から読み出してメモリ１０ｃに展開することで、図２等で説明した各機能を実行するプロセスを動作させる。例えば、このプロセスは、品質予測装置１０が有する各処理部と同様の機能を実行する。具体的には、プロセッサ１０ｄは、異常算出部２１、指標算出部２２、ランク決定部２３、学習部２４、品質予測部２５等と同様の機能を有するプログラムをＨＤＤ１０ｂ等から読み出す。そして、プロセッサ１０ｄは、異常算出部２１、指標算出部２２、ランク決定部２３、学習部２４、品質予測部２５等と同様の処理を実行するプロセスを実行する。

このように、品質予測装置１０は、プログラムを読み出して実行することで品質予測方法を実行する情報処理装置として動作する。また、品質予測装置１０は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、品質予測装置１０によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。

１０品質予測装置
１１通信部
１２記憶部
１３試験データＤＢ
１４量産データＤＢ
１５モデルリストＤＢ
１６学習結果ＤＢ
２０制御部
２１異常算出部
２２指標算出部
２３ランク決定部
２４学習部
２５品質予測部

Claims

コンピュータに、
製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第１の異常値割合を算出し、
前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第２の異常値割合を算出し、
前記第１の異常値割合と前記第２の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出し、
前記試験工程で得られる試験データのうち学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更し、
前記割合に基づき前記学習データとして取得された複数の試験データのうち、前記試験工程における製造環境を示す加工データを説明変数、前記試験工程で製造された製造物の品質を示す品質データを目的変数として、前記学習モデルを学習する、
処理を実行させることを特徴とする学習プログラム。
前記変更する処理は、
各類似度に割合を対応付けたリストを参照して、算出された前記類似度に対応する前記割合を特定し、
前記学習する処理は、
特定された前記割合のデータを前記試験データから抽出し、
抽出したデータを前記学習データに用いて、前記量産工程における製造物の品質を予測する前記学習モデルを学習する、ことを特徴とする請求項１に記載の学習プログラム。
前記量産工程における製造環境を示す加工データを、学習済みの学習モデルに入力し、
前記学習済みの学習モデルの出力結果に基づいて、前記量産工程における製造物の品質を予測する、処理を前記コンピュータに実行させることを特徴とする請求項１に記載の学習プログラム。
各類似度に対応付けられる複数の割合それぞれに対応する試験データを学習データに利用して学習された複数の学習モデルを保持し、
前記各類似度に割合を対応付けたリストを参照して、算出された前記類似度に対応する前記割合を特定し、
前記複数の学習モデルのうち、特定された割合に対応付けられる学習モデルを選択し、
選択された学習モデルを用いて、前記量産工程における製造物の品質を予測する、処理を前記コンピュータに実行させることを特徴とする請求項１に記載の学習プログラム。
前記試験工程と前記量産工程の類似度に基づく割合の試験データを用いて、ランダム性がある機械学習により、複数の学習済みの学習モデルが学習された場合に、前記試験データのうち、前記学習済みの学習モデルに利用された試験データを除く残りの試験データを用いて、前記複数の学習済みの学習モデルの精度を検証し、
検証した結果に基づき、前記複数の学習済みの学習モデルから１つの学習モデルを選択する、処理を前記コンピュータに実行させることを特徴とする請求項１から４のいずれか一つに記載の学習プログラム。
コンピュータが、
製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第１の異常値割合を算出し、
前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第２の異常値割合を算出し、
前記第１の異常値割合と前記第２の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出し、
前記試験工程で得られる試験データのうち学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更し、
前記割合に基づき前記学習データとして取得された複数の試験データのうち、前記試験工程における製造環境を示す加工データを説明変数、前記試験工程で製造された製造物の品質を示す品質データを目的変数として、前記学習モデルを学習する、
処理を実行することを特徴とする学習方法。
製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第１の異常値割合を算出し、
前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第２の異常値割合を算出し、
前記第１の異常値割合と前記第２の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出し、
前記試験工程で得られる試験データのうち、学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更し、
前記割合に基づき前記学習データとして取得された複数の試験データのうち、前記試験工程における製造環境を示す加工データを説明変数、前記試験工程で製造された製造物の品質を示す品質データを目的変数として、前記学習モデルを学習する、
を有することを特徴とする学習装置。