JP2022092419A - データ解析装置、方法およびシステム - Google Patents

データ解析装置、方法およびシステム Download PDF

Info

Publication number
JP2022092419A
JP2022092419A JP2020205231A JP2020205231A JP2022092419A JP 2022092419 A JP2022092419 A JP 2022092419A JP 2020205231 A JP2020205231 A JP 2020205231A JP 2020205231 A JP2020205231 A JP 2020205231A JP 2022092419 A JP2022092419 A JP 2022092419A
Authority
JP
Japan
Prior art keywords
data
state
product
individual
manufacturing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020205231A
Other languages
English (en)
Other versions
JP7524045B2 (ja
Inventor
航 渡邉
Wataru Watanabe
孝幸 伊東
Takayuki Ito
純平 安藤
Jumpei Ando
敬介 川内
Keisuke Kawauchi
利幸 小野
Toshiyuki Ono
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2020205231A priority Critical patent/JP7524045B2/ja
Priority to US17/446,607 priority patent/US11775512B2/en
Publication of JP2022092419A publication Critical patent/JP2022092419A/ja
Application granted granted Critical
Publication of JP7524045B2 publication Critical patent/JP7524045B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • G06F16/2445Data retrieval commands; View definitions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/217Validation; Performance evaluation; Active pattern learning techniques
    • G06F18/2193Validation; Performance evaluation; Active pattern learning techniques based on specific statistical tests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Factory Administration (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

【課題】適切な状態検知および原因推定を実行できる。【解決手段】本実施形態に係るデータ解析装置は、取得部と、算出部とを含む。取得部は、解析対象となる複数の製品について、製品ごとに1以上の製造条件を含む製造データを取得する。算出部は、前記製造データから抽出した1つの製造条件に関し取り得る1以上の項目における、前記製品が特定の状態である度合いを示す状態データの偏りに基づいて、前記製品が前記特定の状態となった原因が前記製造条件である度合いを示す指標値を算出する。【選択図】図1

Description

本発明の実施形態は、データ解析装置、方法およびシステムに関する。
製品の製造において、製品に異常があるなど、製品が特定の状態になった場合、その原因を早期に特定することが重要である。製造業の多くは、製造の過程で様々なデータを取得して製造工程を監視することにより、状態の検知および原因の特定に役立てており、特定の状態となった原因が特定できれば、歩留まりの維持向上に繋げることができる。
このような状態を検知する手法としては、例えば、異常と判定された製品の個数を数え上げ、当該個数を指標として提示する手法がある。しかし、当該手法では、製品が異常であるか正常であるかを「0」または「1」の2値で判定することに相当する。そのため、異常である確率が「0~1」の間の不確かさを含む場合には、異常の原因と仮定する製造条件への偏りが小さく見積もられたり、大きく見積もられたりする可能性がある。よって、当該手法により原因究明を行う場合、見逃しや過剰な検出につながり好ましくない。
特許第5014500号公報
本開示は、上述の課題を解決するためになされたものであり、より適切な状態検知および原因推定を実行できることを目的とする。
本実施形態に係るデータ解析装置は、取得部と、算出部とを含む。取得部は、解析対象となる複数の製品について、製品ごとに1以上の製造条件を含む製造データを取得する。算出部は、前記製造データから抽出した1つの製造条件に関し取り得る1以上の項目における、前記製品が特定の状態である度合いを示す状態データの偏りに基づいて、前記製品が前記特定の状態となった原因が前記製造条件である度合いを示す指標値を算出する。
第1の実施形態に係るデータ解析システムを示すブロック図。 データ格納装置に格納される製造データの一例を示す図。 データ格納装置に格納される状態データの一例を示す図。 製造データと状態データとを1つのデータベースに格納した例を示す図。 第1の実施形態に係るデータ解析装置のデータ解析処理を示すフローチャート。 指標値の算出方法の第1の具体例を示す図。 指標値の算出方法の第2の具体例を示す図。 第2の実施形態に係るデータ解析システムを示すブロック図。 第2の実施形態に係るデータ解析装置のデータ解析処理を示すフローチャート。 状態データの第1の生成例を示す図。 状態データの第2の生成例を示す図。 状態データの第3の生成例を示す図。 状態データの第3の生成例の別例を示す図。 状態データの第4の生成例を示す図。 状態データの第4の生成例の別例を示す図。 状態データの第5の生成例を示す図。 状態データの第5の生成例の別例を示す図。 第4の実施形態に係るデータ解析システムを示すブロック図。 第4の実施形態に係る可視化データの表示例を示す図。 第1表示領域に表示される第1解析結果の一例を示す図。 第1表示領域に表示される第1解析結果の別例を示す図。 第2表示領域に表示される第2解析結果の一例を示す図。 第2表示領域に表示される第2解析結果の別例を示す図。 データ解析装置のハードウェア構成の一例を示す図。
以下、図面を参照しながら本実施形態に係るデータ解析装置、方法およびシステムについて詳細に説明する。なお、以下の実施形態では、同一の参照符号を付した部分は同様の動作を行うものとして、重複する説明を適宜省略する。
(第1の実施形態)
第1の実施形態に係るデータ解析システムについて図1のブロック図を参照して説明する。
データ解析システム1は、データ解析装置10と、データ格納装置20を含む。
データ格納装置20は、製品ごとに、製品の識別子を示す製品番号と、製造工程において取得される製造条件とを含む製造データとを格納する。データ格納装置20はまた、製品ごとに、製品が特定の状態である度合いを示す状態データを格納する。状態データは、例えば、特定の状態が異常状態である場合は、製品が異常である確率を示す値である。
データ解析装置10は、データ取得部101と、算出部102とを含む。
データ取得部101は、データ格納装置20から解析対象となる複数の製品について、製品ごとに1以上の製造条件を含む製造データと状態データとを取得する。
算出部102は、データ取得部101から製造データと状態データとを受け取り、製造データから抽出した1つの製造条件に関して取り得る1以上の項目における、製品が特定の状態である度合いを示す状態データの偏りに基づいて、製品が特定の状態となった原因が当該製造条件である度合いを示す指標値を算出する。
次に、データ格納装置20に格納される製造データの一例について図2を参照して説明する。
図2は、製造データを格納するデータベースの一例であり、データベースには、製品番号201と、1以上の製造条件を含む製造データ202とが対応付けられて1つのエントリとして格納される。なお、製品番号に限らず、製品を一意に識別できる識別子であればよい。
製造データ202の製造条件の種類としては、例えば、製品に使用した材料名や、加工や組立てに使用した装置名などを用いることができる。より一般的には、「5M1E」に関する情報を用いる。「5M1E」は、「Man」、「Machine」、「Material」、「Method」、「Measurement」および「Environment」の頭文字を並べた用語で、製造工程の管理のための6つの要因として広く知られる。
例えば、データ格納装置20は、加工者名(Man)、装置名や製造ライン名、加工時の装置の状態(温度や圧力など)(Machine)、材料や部品のIDや名前(Material)、加工方法や加工プログラムの種類(Method)、計測を行った装置名や計測箇所(Measurement)、建屋名や気温や湿度(Environment)などを製造データとして格納すればよい。その他、解析や可視化に有用であるとユーザが判断した製造データを取得してもよい。
図2では、例えば製品番号201「XXXX-00001」と、装置(データ1)「A」、材料(データ2)「6」、計測値(データ3)「0.984976167」、建屋(データ4)「6」、プログラム(データ5)「A-1」の製造条件を含む製造データ202とが対応付けられる。
次に、データ格納装置20に格納される状態データの一例について図3を参照して説明する。
図3は、状態データを格納するデータベースの一例であり、データベースには、製品番号201と、状態データ301とが対応付けられて1つのエントリとして格納される。図2における具体例としては、例えば製品番号201「XXXX-00001」と、状態データ301「0.685569195」とが対応付けられる。
本実施形態では、製品の状態データが、「0.0~1.0」の実数である場合を例に説明する。これは、例えば製品が特定の状態となる確率を意味し、製品が特定の状態である可能性が高い場合に「1.0」に近い値をとる。例えば、製品の状態を異常とすると、製品の状態データは、異常の度合い、言い換えれば、製品が異常である確率を表す。本実施形態において、「異常」とは、正常または規定の状態に対し、好ましくない傾向に変化した状態(例えば、製品の出荷基準を満たさない不良品などを含む)を想定する。以下では、特定の状態である場合として、異常である場合を例に説明するが、特定の状態は、これに限らず、製造や製品検査において一般に想定される状態または特定の条件を満たす場合など、任意の状態を対象としてもよい。
なお、これに限らず、例えば、製品の状態が正常である度合い、または規定の状態に対しより好ましい傾向に変化した状態の度合いを対象としてもよい。この場合、製品がより好ましい状態になった原因を推定することができ、例えば歩留まりの向上や製品性能の向上に役立つ可能性がある。また、製品の状態データの値域は、「0.0~1.0」の実数であることに限るものではなく、例えば、任意の実数の範囲の値域をとってもよい。
また、例えば製品の状態が複数存在しうる場合には、状態データも複数存在してもよい。例えば製造現場においては特定の状態の種類として特定のモードが規定されている場合が多い。具体的には異常の種類(モード)が規定されていることが多く、モードごとに状態データを用意することで、モードごとの原因推定を行うことができる。
次に、製造データと状態データとを1つのデータベースに格納した例を図4に示す。
上述の例では、製造データのデータベースおよび状態データのデータベースをそれぞれ分けているが、図4に示すように、1つのデータベースに製造データおよび状態データを組み合わせて格納してもよい。
また、製品の状態データは、既存の装置や方法により設定されてもよいし、手動で設定されてもよい。また、状態データは、製品が特定の状態(異常)であるか否かを評価した結果を複数用意し、複数の結果を平均化するなどの手順により設定されてもよい。例えば、製品の外観の状態のように、評価者によって状態の評価値にばらつきが想定される場合は、複数の評価値を平均化した値を状態データとしてもよい。
データ取得部101は、データ格納装置20から解析対象となる複数の製品について、製品ごとに1以上の製造条件を含む製造データと状態データとを取得する。取得する製品の個数、つまりエントリのデータ数は、解析対象とする一定期間に製造されたデータ数を想定する。一定期間は、例えば、1時間、1日といった任意の期間である。なお、データベースに、各製品の加工や検査を行った時刻や日付などが記録されている場合、一定期間における製品のデータを取得する。また、予め一定期間や一定個数の製品単位を表す番号や文字列(ロット番号またはロットID)がデータベースに記録されている場合、指定した番号の範囲に該当するロット番号の製品のデータを取得してもよい。その他、ユーザが任意の条件を指定して製品のデータを取得してもよい。
次に、第1の実施形態に係るデータ解析装置10のデータ解析処理について図5のフローチャートを参照して説明する。
図5では、解析対象となるD個(D>1の正数)の製品Pについて解析処理を行う例について説明する。なお、本実施形態に係る解析対象の製品Pの個数Dは、例えば数十個から数百個であることを想定するが、解析処理においてデータの偏りを算出できる個数であればよい。また、製造データは、1つの製品Pに対してM個(M>0の正数)の製造条件C(j=1,... ,M)と、1つの個別状態データv(d=1,... ,D)が存在する場合を想定する。つまり、解析対象となる製品PはD個のデータ数を想定しているため、製造条件Cは、D個×M個のデータ数を有し、状態データVは、D個の個別状態データvを有する。
ステップS501では、データ取得部101が、D個の製品Pそれぞれについて、M個の製造条件Cを取得する。
ステップS502では、データ取得部101が、D個の製品Pに関する状態データVを取得する。
ステップS503では、算出部102が、状態データVとj番目の製造条件C(j=1,... ,M)とに基づいて、指標値F(V,C)を算出する。指標値F(V,C)は、製造条件Cが状態データVとなった原因である可能性を表す。例えば、状態データVが、製品が異常である確率を表す場合、指標値F(V,C)は、製造条件Cが製品の異常の原因であることを表す指標である。
ステップS504では、算出部102が、M個の製造条件について全て処理したか否かを判定する。言い換えれば、「j>M」であるか否かを判定する。M個の製造データについて全て処理した場合は、処理を終了し、M個の製造条件について全て処理していない、つまり指標値を算出していない製造条件Cが存在する場合は、ステップS505に進む。
ステップS505では、jが1つインクリメントされ、ステップS503に戻り同様の処理を繰り返す。つまり、次の製造条件Cについて指標値F(V,C)を算出する。
次に、ステップS503における指標値F(V,C)の算出方法の具体例について図6および図7を参照して説明する。
第1の実施形態に係る指標値F(V,C)は、状態データVから算出した値が、特定の製造条件に偏っている度合いを定量化した値を想定する。つまり、状態データVが製品に異常がある確率を表すことを想定しているため、特定の製造条件における、製品に異常がある確率の総和の偏りを指標値とする。言い換えれば、特定の製造条件における異常である製品の数を、確率による重み付き和でカウントすることに相当する。なお、確率の総和の偏りを指標値とすることに限らず、状態データの偏りを表す指標値であれば、どのような指標を用いてもよい。
図6および図7は、j番目の製造条件Cが「製造装置の種類」を表す場合における、製造装置ごとの個別状態データvの総和と、総和を算出した母集団となる製品数とを対応付けたテーブルである。製造装置の種類数が、「製造装置の種類」の製造条件に関し取り得る1以上の項目に相当する。図6および図7の例では、製造装置A、製造装置B、製造装置Cの3種類、つまり3つの項目を有するといえる。
例えば、図6の例では、製造装置「A」の項目に関する個別状態データvの総和が「20.2」、製造装置「B」の項目に関する個別状態データvの総和が「19.4」であり、製造装置「C」の項目に関する状態データの総和が「20.4」であり、製品数はそれぞれ「1000」個である。例えば、偏り率を「製造装置ごとの個別状態データvの総和/全製造装置の個別状態データvの総和」と定義し、最大の偏り率を指標値としてもよい。図6の場合、製造装置A~Cの偏り率はそれぞれ、「20.2/60≒0.337」「19.4/60≒0.323」「20.4/60≒0.340」となるため、指標値は「0.340」となる。
一方、図7は図6と異なり、製造装置「B」の個別状態データvの総和が、他の製造装置「A」の個別状態データvの総和および製造装置「C」の個別状態データvの総和よりも大幅に値が大きい場合である。つまり、異常の可能性がある製品が製造される割合が、特定の製造装置に偏っている場合を示す。図7の場合の製造装置A~Cの偏り率はそれぞれ、「3.1/60≒0.052」「49.8/60≒0.83」「7.1/60≒0.118」となるため、指標値は「0.83」となる。
なお、指標値に対する閾値が、例えば「0.7」と定められていた場合、算出部102は、指標値「0.83」が閾値「0.7」よりも高いと判定し、製品に異常が発生している原因は、製造条件Cjが原因である、つまり製造装置の種類に起因するものであり、製造装置「B」が原因である可能性が高いと推定できる。
なお、状態データが値を持つ製品の数が少ない場合、例えば複数の製造装置の種類のうち、特定の製造装置で製造された製品に関する状態データのみが値を持ち、他の製造装置で製造された製品に関する状態データが「0.0」になる場合は、最大の偏り率が大きくなりやすい。よって、例えば全装置の状態データの総和が小さいほど、最大の偏り率が小さくなるように補正した値を指標値としてもよい。
また、ある製造条件における項目数(条件数)が多い場合も、最大の偏り率が大きくなりやすい。つまり、例えば製造条件が「製造装置の種類」を表す場合は、項目数である製造装置の種類数が多い場合も最大の偏り率が大きくなりやすい。よって、例えば項目数(条件数)が多いほど、最大の偏り率が小さくなるように補正した値を指標値としてもよい。
また、指標値として用いる偏り率のような偏りを、統計的検定の枠組みで定式化して、異常の原因の候補となる製造条件を推定してもよい。本実施形態では、「製造装置」のように名義尺度の変数に対する検定方法として、G検定を用いる例を示すが、これに限らず、カイ二乗検定などその他の検定手法を用いてもよい。
以下、算出部102がG検定により指標値を算出する例について説明する。ここでは、製造データが製造装置の種類を示す場合を想定する。
まず、製造条件となる製造装置の種類数(項目数)をKとした場合、各製造装置で製造した製品数をN{i=1,2,...,K}と表し、製造装置ごとの個別状態データvの総和をO{i=1,2,...,K}とそれぞれ表す。また、総製品数をNall=N+N+・・・+Nと表し、全装置の個別状態データvの総和をN=O+O+・・・+Oと表す。
解析対象となる製造データを母集団と見なし、「特定の状態の製品(異常な製品)の条件ごとの分布は、母集団から無作為抽出した分布と同一である」という帰無仮説を立てる。次に、帰無仮説を検定し、そのp値を計算する。p値が小さいほど、仮説が棄却される可能性が高く、無作為抽出と同じとは言えない、つまり特定の条件においてある状態の製品の発生率が高いことが示唆される。このことからp値が小さい場合、製造条件Cが状態データの原因、つまり異常の原因に関連する可能性が高いと考えることができる。(1)式は、G検定におけるG値を算出する式である。
Figure 2022092419000002
は、帰無仮説で期待される製品の数であり、(2)式で計算される。
Figure 2022092419000003
P(i)は期待確率であり、帰無仮説が成立する場合に、項目i(i番目の製造装置)で異常と判定された製品が発生する確率である。確率値の真値が未知である場合は、解析の対象とする製品数の度数分布N/Nで近似する。次に、カイ二乗分布f(x、k)を用いて、G値に対応するp値を(3)式で計算する。
Figure 2022092419000004
k=K-1であり、カイ二乗分布の自由度をあらわす。カイ二乗分布は自由度kが大きいほどp値が小さくなりにくい。Kが多い場合、無作為抽出だとしても偏りが生じやすくなるが、上記の性質により項目数を考慮して、偏りの有意性が評価される。
上述のように算出したp値を指標値F(V,C)とし、指標値F(V,C)が小さいほど原因らしさが高いとする。
なお、上述したG検定では、製造データが名義尺度のようなカテゴリカルな製造条件の場合について説明したが、製造条件Cが連続値の場合においては、例えば、状態データVと製造条件Cとの相関係数を用いて偏りを指標値として定量化してもよい。すなわち、状態データが「1.0」に近い製品が、製造条件Cの高いあるいは低い値に偏っている場合、相関係数の絶対値が大きくなる。そのため、相関係数の絶対値を指標値F(V,C)としてもよい。相関係数(ピアソンの相関係数)は(4)式で定義される。
Figure 2022092419000005
ここではNallは、サンプル数であり、本実施形態ではデータベースにおけるエントリ数に相当する。C (Cの直上にバー)は、Cの平均であり、V(Vの直上にバー)はVの平均である。なお、ピアソンの相関係数以外の指標を用いてもよく、例えば、状態データVの分布が線形ではない場合は、スピアマンの相関係数などのような順位相関係数を用いてもよい。
相関係数の検定を行ったp値を指標値F(V,C)としてもよい。例えば、相関係数の検定(無相関検定)を用いてもよい。相関係数の検定では、(5)式で示される統計量tが自由度n-2のt分布に従うことを利用して、p値を計算することができる。
Figure 2022092419000006
以上、製造条件Cがカテゴリカルな場合と連続値の場合とについて、それぞれ製品の状態データVから算出した値が、特定の製造条件に偏っていることを指標値として定量化する例について説明したが、その他の偏りを算出方法、検定手法を用いてもよい。
以上に示した第1の実施形態によれば、製品の状態データVから算出した値が連続的な値になっていることを考慮して、特定の製造条件Cへの偏りを指標値F(V,C)として算出することができる。これにより、各製品が異常であるか否かの不確かさを考慮して、特定の製造条件への偏りを算出することができ、見逃しや過剰な検出を低減できる。
(第2の実施形態)
第2の実施形態に係るデータ解析システムについて図8のブロック図を参照して説明する。第2の実施形態に係るデータ解析装置10は、データ取得部101と、算出部102と、生成部801とを含む。
生成部801は、データ格納装置20から製品それぞれの状態を判定するための個体データを受け取り、個体データから製品の状態データを生成する。個体データは、例えば、製品の寸法、重量といった検査項目に関する計測値が挙げられる。また、製品の種類によって、電気的な特性または物理的な特性を計測した結果を個体データとしてもよい。例えば製品の寸法および重量は、外部の計測装置によって製品ごとに計測され、個体データとしてデータ格納装置20に格納されればよい。なお、これに限らず、個体データは、製品の状態を把握し、判定可能なデータであれば何でもよい。
次に、第2の実施形態に係るデータ解析装置10のデータ解析処理について図9のフローチャートを参照して説明する。
図9では、解析対象となるD個の製品Pそれぞれについて、N個の個体データYが存在する場合を想定する。つまり、個体データYは、D個×N個のデータ数を有する。
ステップS901では、データ取得部101が、D個の製品Pそれぞれについて、M個の製造条件Cと、N個(N>0の正数)の個体データYを取得する。
ステップS902では、生成部801が、i番目の個体データY(i=1,... ,N)を用いて、状態データV_Yを生成する。状態データV_Yは、第1の実施形態と同様の基準を想定する。すなわち、状態データV_Yは、個体データYごとに生成されるため、N個の状態データV_Yが生成される。
ステップS903では、算出部102が、状態データV_Yとj番目の製造条件Cとに基づいて、指標値F(V_Y,C)を算出する。指標値の算出方法については、第1の実施形態と同様であるため、ここでの説明を省略する。
続いて、ステップS504およびステップS505の処理により、i番目の個体データYに関する状態データV_Yに対して、M個の製造条件Cそれぞれの指標値F(V_Y,C)が算出される。つまり、i番目の個体データYに基づく状態データV_Yについて、M個の指標値F(V_Y,C)が算出される。
ステップS904では、例えば算出部102が、N個の個体データについて全て処理したか否かを判定する。つまり、i>Nとなるか否かを判定するN個の個体データについて全て処理した場合は、処理を終了し、未処理の個体データYがある場合には、ステップS905に進む。
ステップS905では、iを1つインクリメントし、次の個体データYについて処理すべくステップS902に戻り、同様の処理を繰り返す。
次に、ステップS902における状態データの第1の生成例について図10を参照して説明する。
図10上段及び下段の横軸は個体データYの値(例えば、製品の寸法)を示し、縦軸が個別状態データv_Yの値(図では単にvと表記する。以下同じ)を示す。また、個体データYの値に基づく個別状態データv_Yのグラフ1002を示す。図10の例では、個別状態データv_Yは「0.0」が正常な状態、「1.0」が異常の状態とする。
製品ごとの個体データY1001がそれぞれプロットされる。ここで、特定の状態であることを判定するための閾値THにより、個体データYの状態を区別する。
図10に示すように、生成部801は、閾値THを含む前後の値域をマージン値域1003として設け、マージン値域1003内では、線形補間により、個別状態データv_Yの値を「0.0~1.0」で決定する。例えば、マージン値域1003内のYiの最小値は、個別状態データ「v_Y=0.0」とし、マージン値域1003内のYiの最大値は、個別状態データ「v_Y=1.0」とし、マージン値域1003内のその他のYiについては、Yの値に比例した個別状態データv_Yの値が決定されればよい。
つまり、閾値THにより、一般的な方法で正常であるか異常であるかを判定する場合は、図10上段の例では、製品「A」「B」が正常であり、製品「C」「D」「E」が異常であると二値化されて判定される。一方、本実施形態では、個別状態データv_Yの値を「0.0~1.0」で付与するため、製品「B」は製品「A」よりも正常の可能性を含む、製品「C」は製品「D」よりも異常の可能性を含むといったように、その後の異常検知や原因推定において柔軟性を持たせることができる。
なお、閾値THの決定方法としては、例えば、生産管理で用いられる規格値または管理基準値を閾値THとすればよい。規格値は、出荷する製品に対して定められたものであり、規格値を超えた製品は出荷することができないため、閾値THとして用いてもよい。また、管理基準値は、規格値を確保するために、生産管理上設けられた値である。また、規格値または管理基準値そのものに限らず、規格値または管理基準値に関連した値(例えば、管理基準値の80%または90%)を閾値THとして用いてもよい。
また、閾値THは個体データYから算出されてもよい。例えば、製品の母集団に対し、個体データYの平均と標準偏差とを算出し、個体データYの値が予め定められたσの範囲外である場合に特定の状態である(例えば、異常である)と判定してもよい。製品の母集団は、例えば特定の期間に製造した製品群、特定数の製品群など任意の方法で指定すればよい。σの範囲外という決定方法に限らず、個体データYの値が±3σ、±4σの範囲外の値である場合に、特定の状態であると判定してもよい。また、正負でσの範囲を変えてもよい。
また、製造データには外れ値が含まれることが多いため、最小二乗法の代わりに、中央値と四分位数による外れ値に頑健な推定法を用いてもよい。例えば、計測値の中央値を正規分布の平均μとしてもよい。また標準偏差σ=0.7413×IQR(四分位範囲=第1四分位数と第3四分位数との距離)としてもよい。σ値ではなく、予め定めたパーセンタイル点を基準として閾値THを決定してもよい。これらの値を用いることで、特定の製品の集団に対し、ばらつきが大きい製品を異常として判定することができる。
また、閾値THを算出する製品の集団と、判定の対象とする製品の集団は別々であってもよい。例えば、過去の製品の集団から閾値THを決定し、現在の製品の集団に対し異常を判定してもよい。あるいは、別の環境(別の生産拠点等)の製品の集団から閾値THを決定してもよい。
なお、図10では、個体データYの値が閾値THよりも大きければ、異常である可能性が高いことを想定するが、反対に、個体データYが閾値よりも小さければ異常であるなどの判定でも同様に処理できる。この場合は、グラフ1002が閾値THを基準に、反転したグラフとなればよい。
次に、状態データの第2の生成例について図11を参照して説明する。
図11は、図10と同様であるが、マージン値域1003の代わりに、閾値THとなるYの場合に個別状態データ「v_Y=0.0」を、個体データYの値のうちの最大値1101に個別状態データ「v_Y=1.0」をそれぞれ設定してもよい。閾値THと最大値1101との間の値では、線形補間により個別状態データv_Yの値を設定する。図11の例では、製品「B」の個体データYの値が最大であるため、製品「B」の個体データYの値を最大値1101と設定し、閾値THとの間で線形に個別状態データv_Yの値が決定される。これにより、閾値THとの距離(差分)が大きいほど、異常である度合いを高く判定できる。
次に、状態データの第3の生成例について図12および図13を参照して説明する。
第3の生成例では、個体データの値に計測手段または計測条件に起因する計測誤差が存在する場合を想定する。例えば、計測手段で複数回の計測を行った場合、その計測結果は、ばらつき(計測ばらつき)を持つ。これは装置の計測機能の繰り返し精度や、計測時の環境(温度、湿度、振動、その他要因の干渉など)に起因することが多い。このように、閾値を基準に異常である製品を判定しようする場合、計測誤差に起因した不確実性が含まれる。
第2の実施形態に係る生成部801は、上述のような計測結果のばらつきを考慮して、個別状態データv_Yを算出する。
図12は、図10と同様であり、製品「A」および製品「B」の個体データYは閾値未満であり、製品「C」および製品「D」の個体データYは、閾値以上である。
図12の例では、製品「B」の個体データYの値において、真の個体データYの値が閾値以上であった確率は、製品「A」の個体データYの確率に比べて高い。反対に、製品「C」の個体データYについて、真の個体データYの値が閾値未満であった確率は、製品「D」の個体データYの確率に比べて高い。一方、製品「A」ついては、計測ばらつきの範囲1201から十分に離れているため、計測誤差によって、個体データYの値が閾値THを超える可能性は低い。同様に製品「D」についても、閾値TH未満となる可能性は十分に低いと考えられる。
よって、生成部801では、例えば計測ばらつきの範囲1201を標準偏差σで規定し、計測誤差に起因する不確実性(確率)に基づいて、製品の個別状態データv_Yを設定する。例えば、正規分布の累積確率を表す関数1203を用いれば、計測ばらつきの範囲1201内に存在する個体データYに対応する範囲1202において個別状態データv_Yの値を決定できる。なお、関数1203については、シグモイド関数やロジスティック関数のような関数を用いてもよい。この場合、関数のスケールパラメータに計測ばらつきσ、またはその定数倍を設定してもよい。
なお、計測ばらつきの範囲を正規分布で規定することに限らず、ポワソン分布やt分布など、そのほかの方法で規定してもよい。
次に、図13は、図12と同様であり、範囲1202において、線形補間の関数1301を適用して個別状態データv_Yの値を決定する例である。なお、図13のような線形補間に限らず、閾値THのある点(例えば、閾値THと関数1301との交点)を中心として点対称ではない、非対称な形状としてもよい。
このように、個体データYに含まれる計測誤差に起因する不確実性を考慮して、製品の個別状態データvd_を設定し、個別状態データvd_の偏りに基づいて原因推定を行うことができる。そのため、個体データYiに含まれる計測誤差などによる不確実性に起因する、見逃しや過剰な検出を低減できる。
次に、状態データの第4の生成例について図14および図15を参照して説明する。
第4の生成例では、個体データYの値に、データの量子化に関する量子化誤差を含む場合を想定する。一般に数値がデータとして記録される場合は、データは量子化される。また、データ容量の制約または有効桁数などの影響により、一定の小数点桁数に丸められて記録されることも多い。例えば、計測性能が小数点以下第3位までであり、量子化幅が0.1であり、四捨五入により量子化されていた場合、0.1の値を持つデータは、0.050~0.149の間の値であった可能性がある。そのため、記録されたデータは量子化幅の範囲で不確実性を持つ。
そのため、生成部801では、例えば、量子化誤差に起因する不確実性(確率)に基づいて、製品の個別状態データvd_を設定してもよい。
図14上段は、量子化前の、製品ごとの個体データYの分布図である。横軸は個体データYの値である。図14中段は、量子化後の、製品ごとの個体データYの分布である。ここでは、ある量子化幅Δで量子化されていると想定する。図14中段の量子化後の図では、製品「B」の個体データYは閾値TH未満の値であるが、量子化幅の範囲で不確実性を持つため、量子化前は、製品「B」の個体データYは閾値以上の値であった可能性がある。
図14下段は、図12と同様であり、量子化誤差を考慮した製品の個別状態データv_Yの図を示す。生成部801は、量子化幅の範囲1401において、状態データV_Y「0.0~1.0」の値域において、シグモイド関数やロジスティック関数のような関数1402を適用し、個別状態データv_Yの値を決定する。この場合、関数のスケールパラメータに、量子化幅Δ、もしくはその定数倍を設定してもよい。具体的に図14では、閾値から±Δ/2の範囲の個体データYを有する製品について、閾値との距離に応じて「0.0~1.0」の値が設定される。
次に、図15は、図14と同様であり、範囲1401において、状態データV_Yを、「0.0~1.0」の値域において線形補間したグラフ1501の例である。なお、図15のような線形補間に限らず、任意の関数を適用してもよい。
このように、個体データYに含まれる量子化誤差に起因する不確実性を考慮して、製品の個別状態データvd_を設定し、状態データV_Yの偏りから、原因推定を行うことができる。そのため、個体データYiに含まれる量子化誤差に起因する、見逃しや過剰な検出を減らせる可能性を向上させることができる。
次に、状態データの第5の生成例について図16および図17を参照して説明する。
生成部801は、閾値THではなく、個体データYの確率分布から、製品の個別状態データv_Yを算出してもよい。
図16は、図10と同様であり、上段が製品ごとの個体データYの値、下段が個体データYに対応する製品ごとの個別状態データv_Yの値を示すグラフである。
図16上段において、確率分布P(Y)(以下、確率分布1601ともいう)は、正常な製品がとりうる個体データYの値の確率分布である。確率分布1601は、例えば正常な製品の分布から決定することができる。つまり、確率分布1601の峰付近の値域で正常な製品の個体データYが多く分布する。
確率分布1601は、例えば、人による判断など、予め正常と判定された製品群をもとに決定されてもよいし、ある期間に製造した製品を正常な製品群とみなして、確率分布1601が決定されてもよい。また、例えば特定の日に製造した製品群に対する判定について、例えば、当該特定の日の前日に製造した製品群から確率分布1601が決定されてもよい。この場合、日々の製品製造において、日単位で異常検知を行うことができる。なお、日単位ではなく時間単位でもよいし、確率分布1601の決定により多数の製品群(例えば直近1週間分など)を用いてもよい。なお、例えば日単位で検知を行う場合、前日の製品群に異常が多い(異常の状態データの総和が大きいなど)場合は、前日の分布を正常とせず、それよりも前の日から確率分布を求めるなどしてもよい。すなわち、異常の状態データの総和が閾値以下となる製品群が得られた日から確率分布を求めてもよい。
なお、図16の例では、確率分布1601は、正規分布などのパラメトリックな分布を想定するが、ヒストグラムやParzen推定など密度推定の枠組みでノンパラメトリックな分布を適用してもよい。
生成部801は、例えば、「1-P(Y)」の値を個別状態データv_Yとして算出すればよい。これに限らず、確率分布1601に基づいて個別状態データv_Yを決定できる。
図17は、多峰の確率分布1701となる場合を示す。このように、製造過程において正常な個体データYの値域が複数に分散する場合は、「1-P(Y)」の値を個別状態データv_Yとして算出することにより、個別状態データvd_を好適に設定できる。
なお、生成部801は、製品データの個数Dに対応する製品の状態判定値を算出してもよく、{v∈V:d=1,...,D}に基づいて、1以上の状態判定値を算出し出力する。状態判定値は、例えば、{v∈V:d=1,...,D}の総和、平均、最大値または最小値といった統計的な値であり、上述の図6または図7における個別状態データvの総和が一例である。例えば、製品の状態を異常とすると、{v∈V:d=1,...,D}の総和は、D個の製品の内の重み付き異常個数となる。状態判定値が大きいほど、異常の確率が高い製品が多数発生していることを意味する。
以上に示した第2の実施形態によれば、製品の個体データから状態データを生成することで、製造過程の状況を考慮した、適切な状態データを算出できる。例えば、計測誤差や量子化誤差、または製品の個体データの確率分布などを考慮することで、後段で算出される指標値がより精度の高い値となり、見逃しまたは過剰検出を低減できる。
また、状態データおよび指標値に加えて、製品の状態を統計的に表す状態判定値を出力することにより、例えばユーザに、状態判定値の大きいデータに関する原因推定結果を優先的に提示するなどの利用ができる。
(第3の実施形態)
第3の実施形態では、生成部801が、例えば機械学習手法により学習した関数を用いて状態データを推論する点が上述の実施形態と異なる。
第3の実施形態に係る生成部801は、個体データが入力され、状態データを出力する関数を用いて、状態データを生成する。生成部801が用いる関数としては、例えば、機械学習によりモデルを学習した学習済みモデルを想定する。学習済みモデルは、例えばロジスティック回帰モデル、多層パーセプトロン、ニューラルネットワーク、サポートベクタマシン、ランダムフォレストなどに基づく関数を用いてもよい。ロジスティック回帰モデルは、ある変数を入力とした回帰モデルであり、本実施形態では、入力変数は個体データY、または個体データとその他のデータである。ロジスティック回帰モデルの出力として、ロジット値「0.0~1.0」の値を出力する。
モデルの機械学習手法としては、例えば個体データを入力データとし、正常な製品には「0.0」の値を、異常な製品には「1.0」の値を付与し教師データとを組とした学習用データにより、モデルを学習すればよい。なお、教師データとして「0.0~1.0」の間の値を与えてもよい。例えば正常か異常か判断が困難な場合については、「0.5」など中間的な値を与えてもよい。このように学習することで、学習用データに含まれる異常な製品に対し、推論対象として入力された個体データが異常として学習された値に近い値を有する場合は、状態データとして「1.0」に近い値が出力される関数が学習される。なお、複数の学習済みモデルからの出力を用いて、アンサンブルにより得られる状態データを出力してもよい。
学習用データが十分に存在していれば、正常と異常との中間的な入力データの場合には、出力も中間的な値(例えば0.5)が出力されることが期待できる。なお、一部のデータに対し、教師データを用意する、半教師あり学習や弱教師あり学習といった方法を用いてよい。また、複数のモデルからの結果の平均または多数決の結果を用いて別のモデル学習させる、いわゆるアンサンブル学習により学習済みモデルが生成されてもよい。
また、最近傍法などの手法を用いて、個体データと学習用データに含まれるデータとの距離を用いて状態データを生成してもよい。例えば、製品の状態を異常とした場合、多数の個体データを用意しておき、新たな入力データが与えられた際には、用意した個体データの中から最も類似度が近いデータを検索する。類似度は、単純には個体データ同士の距離を用いればよい。例えばN-近傍法の枠組みでは、新たな入力データについて、予め用意したデータからN個の近傍を取得する。それぞれ、予め用意されたデータには、正常な製品には「0.0」、異常な製品には「1.0」の状態データが教師データとして付与されているものとすると、新たな入力データに対する状態データは、N個の近傍データに付与された教師データ(状態データ)の平均により算出できる。なお、N個の近傍との距離を重みとした重み付き平均により状態データを決定してもよい。
また、多数の学習用データを用意することが困難な場合もあるため、教師無し学習により生成部801の関数を設計してもよい。例えば、製品の状態が異常であるか正常であるかを判定する場合を想定する。正常な製品と異常な製品とは、個体データにおいて異なる傾向を有することが仮定できる場合、例えばクラスタリングを用いて、正常な製品と異常な製品とを個体データのデータ空間において分離する。例えば、異常な製品は正常な製品よりも数が少ないなどと仮定すると、未知の状態からクラスタ分類により、正常と異常とに分類することが可能である。また、クラスタが2つ以上の場合に、正常クラスタと複数の異常クラスタとに分かれたと仮定すると、正常と、複数の異常(異なる異常モード)とに分類することが可能である。このとき、どの異常クラスタに分類されたかに応じてそれぞれ状態データを計算することで、異常モードごとの解析を行うことができる。新たな入力データについては、例えば各クラスタの代表点(セントロイドなど)との距離に応じ、代表点の個体データから算出される状態データに基づいて計算することで、新たな入力データの状態データを設定できる。このように、個体データから状態データを生成する方法をデータドリブンで決定し、その偏りに基づいて原因推定を行うことができる。
なお、上述した個体データは、製品の寸法または重量など計測結果に基づくデータを想定するが、画像データまたは時系列データのような1次元以上の多次元データであってもよい。画像としては、例えば製品の形状および外観の検査を目的とした、ラインセンサデータ、可視画像データ、および超音波画像データなど挙げられる。時系列データとしては、例えば製品の温度変化、電気的な値の変化を計測した値の時系列データ、製品の異音検査などにおける音響データなど挙げられる。
個体データが画像データの場合、生成部801において用いる関数として、畳み込みニューラルネットワーク(CNN)をベースとして機械学習したモデルを用いてもよい。また、個体データが時系列データの場合でも、生成部801において用いる関数として、再帰的ニューラルネットワーク(RNN)をベースとして機械学習したモデルを用いてもよい。なお、CNNおよびRNNに限らず、画像データや時系列データを扱う既存のモデルであれば、どのようなモデルを用いてもよい。
以上に示した第3の実施形態によれば、例えば外観検査を目的とした画像データの場合、汚れの大小など、主観的な検査項目が含まれることがあり、製品の正常、異常を決定的に判別することが難しい場合がある。このような場合でも、個体データを入力し、状態データを出力するように学習した学習済みモデルを用いて、個体データから状態データを推論することで、画像データまたは時系列データである個体データに含まれる不確実性を考慮した状態データを生成でき、状態データの偏りに基づいて原因推定を行うことができる。
(第4の実施形態)
第4の実施形態では、状態データ、指標値など上述の実施形態に係るデータ解析装置で算出した値を可視化して、ディスプレイなどに表示する。
第4の実施形態に係るデータ解析システム1について図18を参照して説明する。
第4の実施形態に係るデータ解析システム1は、データ解析装置10と、データ格納装置20と、表示装置30とを含む。第4の実施形態に係るデータ解析装置10は、データ取得部101と、算出部102と、表示制御部1801とを含む。なお、第4の実施形態に係るデータ解析装置10は、生成部801をさらに含んでもよい。
表示制御部1801は、算出部102から指標値を、データ取得部101から、製造データ、状態データおよび必要に応じて状態判定値をそれぞれ取得する。表示制御部1801は、生成部801がデータ解析装置10に含まれる場合は生成部801から状態データ(および状態判定値)を取得する。表示制御部1801は、製造データ、状態データ、指標値、およびその他のデータを用いて可視化データを生成し、外部の表示装置30などに表示する。表示制御部1801は、可視化データを画像、図面として出力してもよいし、表示装置30で表示可能なデータ形式、html(Hypertext Markup Language)、xml(eXtensible Markup Language)およびJSON(JavaScript(登録商標) Object Notation)などの形式で出力してもよい。
表示装置30は、ディスプレイ、プロジェクタなどのデバイスを想定するが、ユーザが表示装置30を介してデータを視認可能なデバイスであればよい。なお、表示装置30は、データ解析装置10に含まれてもよい。
次に、可視化データの表示例について図19を参照して説明する。
表示装置30における可視化データの表示例として、インタフェース画面に第1表示領域と第2表示領域とが表示される。
第1表示領域は、状態データごとに、検査項目と判定値とが表示される。第2の実施形態を例とすれば、N個の検査項目に関する個体データYについて状態データV_Yが生成されるため、N個の状態データV_Yと、対応する状態判定値とが表示される。状態判定値は、例えば、検査対象のD個の製品についてそれぞれ算出される個別状態データvの総和、または総和を製品数Dで除算した値(状態が異常の場合は、異常率を示す)などを用いればよい。
状態判定値の大きさに応じて第1表示領域1901に表示される情報が異なる。例えば、状態判定値が第1閾値以上である場合の第1表示領域1901には、個体データYに関する情報と、状態判定値と、個体データYに関する第1解析結果1902と、第2表示領域1911,1913および1914とが表示される。なお、状態判定値と共に、または状態判定値に変えて状態データV_Yに関する情報が表示されてもよい。
なお、図19の例では、個体データYに関する情報(「検査項目Y7」)は第1表示領域1901の左上に、状態判定値(「判定値:0.1」)は第1表示領域1901の右上にそれぞれ表示される。なおこれに限らず、第1表示領域1901内のどの位置に表示されてもよいし、個体データYと状態判定値との関係が把握できれば、どのような態様で表示されてもよい。
また、第1表示領域1901自体または第1表示領域1901内の文字およびグラフを強調表示してもよい。例えば、第1表示領域1901を目立つ色で囲んでもよいし、個体データに関する情報を太字にしてもよいし、および警告や注意を示す強調マークを付与してもよい。
続いて、状態判定値が第1閾値未満である場合の第1表示領域1903には、第1表示領域1901には、個体データYに関する情報と、状態判定値とが表示され、第1解析結果1902の表示は省略される。
さらに、状態判定値が第1閾値よりも小さい第2閾値未満である場合の第1表示領域1904は、第2閾値未満の状態判定値を有する個体データYに関する情報を1つだけ代表して表示してもよいし、状態判定値が第2閾値以下である旨を表示してもよいし、非表示としてもよい。また、第1表示領域1904については、第1表示領域1901と比較して目立たなくするように表示されてもよい。例えば、第1表示領域1904については色をグレーなど薄い色または破線などで表示してもよい。
第2表示領域1911,1913および1914の表示構造は、上述した第1表示領域1901,1903および1904の表示構造と同様である。例えば、第2表示領域1911には、製造条件C、個体データYに関する指標値F(V_Y,C)、指標値F(V_Y,C)に基づく原因の推定結果である第2解析結果1912が表示される。図19の例では、指標値F(V_Y,C)が第3閾値以上である製造条件Cに関する情報(「要因C5」)は第2表示領域1911の左上に、指標値F(V_Y,C)(「指標値:0.8」)は第2表示領域1911の右上にそれぞれ表示される。なおこれに限らず、第1表示領域1901内のどの位置に表示されてもよいし、どのような態様で表示されてもよい。指標値F(V_Y,C)が第3閾値未満である場合の第2表示領域1913には、製造条件と指標値とのみが表示され、第2解析結果1912は表示されない。指標値F(V_Y,C)が第3閾値よりも小さい第4閾値未満である場合の第2表示領域1914には、製造条件Cに関する情報を1つだけ代表して表示してもよいし、製造条件Cが第4閾値以下である旨を表示してもよい。なお、第1閾値および第2閾値の組と、第3閾値および第4閾値の組とは、それぞれ同じ値の組でもよいし、別の値でもよい。
図19では、第1表示領域1901内に第2表示領域1911が含まれるように表示する例を示すが、第1表示領域1901と第2表示領域1911とがそれぞれ独立して表示されてもよい。また、第1解析結果1902と第2解析結果1912とは、どちらが優先されて表示されてもよい。例えば、状態判定値が第2閾値以下であり、第1表示領域としては非表示に該当するが、指標値が計算され、当該指標値が閾値以上である場合には、第1表示領域1901と同様の表示態様としてもよい。また、第1解析結果1902と第2解析結果1912とは、プロット図に限らず、表形式など他の表示態様で表現されてもよい。
次に、第1表示領域1901に表示される第1解析結果1902の一例について図20および図21を参照して説明する。
図20に示すように、個体データYの値の散布図を第1解析結果1902として表示する。
縦軸が個体データの値を示し、横軸が識別番号(図20ではIDと表記)を示す。識別番号は、例えば識別番号の若い順に時系列で並べられればよい。各プロットが1つの製品を表す。
図20に示すように、閾値TH1よりも個体データYの値が大きい、つまり異常と判定される個体データのプロットが色を変えて表現される。これにより、個体データYの分布だけではなく、異常値の数、異常と判定された個体データと閾値との距離が直感的に把握しやすくなり、ユーザに異常の度合いを視覚的に示すことができる。
さらに、図21に示すように、状態データの算出基準を示すグラフ2101を表示してもよい。図21の例では、図12に示した計測ばらつきの範囲1201をグラフ2101として表示する。
また、散布図の横軸を識別番号順とすることで、異常が発生した製品を特定できる。なお、製品が製造された時刻情報を横軸としてもよい。これにより、異常の発生した時間帯が特定できる。なお、第1解析結果1902は散布図に限らず、ヒストグラム、箱ひげ図、ヴァイオリンプロットなどの他の表現方法により表示してもよい。
また、図に限らず、数値データをそのまま表示してもよい。表示制御部1801は、解析に含まれる製品の数、異常と判定された製品の数、その他基本的な数値データを解析結果として表示するように制御すればよい。これにより、ユーザは数値データも含めて異常について考察をすることができる。
なお、本実施形態では第2の実施形態を例に、個体データYに関する図を解析結果として表示する例を示したが、第1の実施形態に係る状態データVもしくはViに関する図(Vを縦軸もしくは横軸にした散布図、もしくはヒストグラム、箱ひげ図など)を表示してもよい。
なお、表示制御部1801は、算出部102が複数種類の解析結果を生成した場合は、複数種類の解析結果を表示してもよい。複数の指標値をG_r(Y){r:1,…,Q}と表し、ここでrは解析方法の種類を表す。例えば、第1表示領域1901に表示される状態判定値であれば、個別状態データv_Yの総和を1つの解析結果とし、個別状態データv_Yを製品数で割った値を別の解析結果として表示してもよい。また、前回の状態判定値と今回の状態判定値との差または比を、新たな解析結果としてもよい。複数の解析結果を生成することで、多角的にデータを捉えることができ、ユーザの判断を支援できる。
次に、第2表示領域1911に表示される第2解析結果1912の一例について図22および図23を参照して説明する。
第2解析結果1912である解析情報G(Y,C)は、指標値F(V_Y,C)に関するより詳細な情報をユーザに提示する。図22は、縦軸は個体データYの値、横軸は製造条件C、例えば、製造装置の種類を表す散布図とする。図22の各プロットは、製品一個体を表す。図22では、指標値F(V_Y,C)として、異常と判定された製品の特定の製造条件への偏りを用いる場合を想定する。
そのため、判定に用いた閾値TH1と、特定の製造条件への偏り率を折れ線グラフ2201で図示する。また、偏りが大きい製造条件の分布の色を変えて強調してもよい。これにより個体データYの分布と、製造条件Cごとの偏りが直感的に分かりやすくなり、ユーザに異常の度合いを視覚的に訴えることができる。
図23は、図22の散布図に加えて、ヒストグラム2301を表示した例である。各製造条件Cにおけるプロットの度数がヒストグラム2301として表示されることにより、容易に状態を把握できる。第2解析結果1912も第1解析結果1902と同様に、散布図以外の図であってもよい。
また、図22および図23の例では、製造条件Cがカテゴリカルなデータであるものとして説明したが、製造条件Cは数値データであってもよい。その場合、散布図を解析情報として生成してもよい。また、図21と同様に状態データの算出基準を示すグラフ2101をさらに表示してもよい。指標値に関する情報として、回帰直線や相関係数などを表示する。第1解析結果の場合と同様に、第2解析結果においても複数種類の解析結果を生成してもよい。複数の指標値をG_s(Y,C){s:1,…,S}と表す。ここでsは解析方法の種類を表す。なお、第1表示領域の場合と同様に、表示制御部1801は、算出部102が複数種類の解析結果を生成した場合は、複数種類の解析結果を表示してもよい。第2表示領域1911に表示される指標値として、上述の第1の実施形態で示した検定の種類ごとに算出された値をそれぞれ異なる解析結果として用いてもよい。また、前回の指標値と今回の指標値との差または比を、新たな解析結果としてもよい。このように複数の解析結果を生成することで、ユーザを支援できる。
以上に示した第4の実施形態によれば、製品の状態に関する製造データと製造条件に関する製造データを、状態判定値または指標値の大きさに基づいて、解析結果の情報量と優先度を決定して表示する。これにより、ユーザは異常との関係が高いと予想される製造データを優先して監視することができ、ユーザの確認の負担や見逃しが減ることが期待できる。
次に、上述の実施形態に係るデータ解析装置のハードウェア構成の一例を図24に示す。
データ解析装置は、CPU(Central Processing Unit)2401と、RAM(Random Access Memory)2402と、ROM(Read Only Memory)2403と、ストレージ2404と、表示装置2405と、入力装置2406と、通信装置2407とを含み、それぞれバスにより接続される。なお、表示装置2405はデータ解析装置のハードウェア構成として含まれなくてもよい。
CPU2401は、プログラムに従って演算処理および制御処理などを実行するプロセッサである。CPU2401は、RAM2402の所定領域を作業領域として、ROM2403およびストレージ2404などに記憶されたプログラムとの協働により各種処理を実行する。
RAM2402は、SDRAM(Synchronous Dynamic Random Access Memory)などのメモリである。RAM2402は、CPU2401の作業領域として機能する。ROM2403は、プログラムおよび各種情報を書き換え不可能に記憶するメモリである。
ストレージ2404は、HDD等の磁気記録媒体、フラッシュメモリなどの半導体による記憶媒体、または、HDD(Hard Disc Drive)などの磁気的に記録可能な記憶媒体、または光学的に記録可能な記憶媒体などにデータを書き込みおよび読み出しをする装置である。ストレージ2404は、CPU2401からの制御に応じて、記憶媒体にデータの書き込みおよび読み出しをする。
表示装置2405は、LCD(Liquid Crystal Display)などの表示デバイスである。表示装置2405は、CPU2401からの表示信号に基づいて、各種情報を表示する。
入力装置2406は、マウスおよびキーボード等の入力デバイスである。入力装置2406は、ユーザから操作入力された情報を指示信号として受け付け、指示信号をCPU2401に出力する。
通信装置2407は、CPU2401からの制御に応じて外部機器とネットワークを介して通信する。
上述の実施形態の中で示した処理手順に示された指示は、ソフトウェアであるプログラムに基づいて実行されることが可能である。汎用の計算機システムが、このプログラムを予め記憶しておき、このプログラムを読み込むことにより、上述したデータ解析装置およびデータ解析システムの制御動作による効果と同様な効果を得ることも可能である。上述の実施形態で記述された指示は、コンピュータに実行させることのできるプログラムとして、磁気ディスク(フレキシブルディスク、ハードディスクなど)、光ディスク(CD-ROM、CD-R、CD-RW、DVD-ROM、DVD±R、DVD±RW、Blu-ray(登録商標)Discなど)、半導体メモリ、又はこれに類する記録媒体に記録される。コンピュータまたは組み込みシステムが読み取り可能な記録媒体であれば、その記憶形式は何れの形態であってもよい。コンピュータは、この記録媒体からプログラムを読み込み、このプログラムに基づいてプログラムに記述されている指示をCPUで実行させれば、上述した実施形態のデータ解析装置およびデータ解析システムの制御と同様な動作を実現することができる。もちろん、コンピュータがプログラムを取得する場合又は読み込む場合はネットワークを通じて取得又は読み込んでもよい。
また、記録媒体からコンピュータや組み込みシステムにインストールされたプログラムの指示に基づきコンピュータ上で稼働しているOS(オペレーティングシステム)や、データベース管理ソフト、ネットワーク等のMW(ミドルウェア)等が本実施形態を実現するための各処理の一部を実行してもよい。
さらに、本実施形態における記録媒体は、コンピュータあるいは組み込みシステムと独立した媒体に限らず、LANやインターネット等により伝達されたプログラムをダウンロードして記憶または一時記憶した記録媒体も含まれる。
また、記録媒体は1つに限られず、複数の媒体から本実施形態における処理が実行される場合も、本実施形態における記録媒体に含まれ、媒体の構成は何れの構成であってもよい。
なお、本実施形態におけるコンピュータまたは組み込みシステムは、記録媒体に記憶されたプログラムに基づき、本実施形態における各処理を実行するためのものであって、パソコン、マイコン等の1つからなる装置、複数の装置がネットワーク接続されたシステム等の何れの構成であってもよい。
また、本実施形態におけるコンピュータとは、パソコンに限らず、情報処理機器に含まれる演算処理装置、マイコン等も含み、プログラムによって本実施形態における機能を実現することが可能な機器、装置を総称している。
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行なうことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
1…データ解析システム、10…データ解析装置、20…データ格納装置、29…データ、30,2405…表示装置、101…データ取得部、102…算出部、201…製品番号、202…製造データ、301…状態データ、801…生成部、1002,1501,2101…グラフ、1003…マージン値域、1101…最大値、1201,1202,1401…範囲、1203,1402…関数、1601,1701…確率分布、1801…表示制御部、1901,1903,1904…第1表示領域、1902…第1解析結果、1911,1913,1914…第2表示領域、1912…第2解析結果、2201…折れ線グラフ、2301…ヒストグラム、2401…CPU、2402…RAM、2403…ROM、2404…ストレージ、2405…表示装置、2406…入力装置、2407…通信装置。


Claims (19)

  1. 解析対象となる複数の製品について、製品ごとに1以上の製造条件を含む製造データを取得する取得部と、
    前記製造データから抽出した1つの製造条件に関して取り得る1以上の項目における、前記製品が特定の状態である度合いを示す状態データの偏りに基づいて、前記製品が前記特定の状態となった原因が前記製造条件である度合いを示す指標値を算出する算出部と、
    を具備するデータ解析装置。
  2. 前記取得部は、前記製品個別の計測値を示す個体データをさらに取得し、
    前記データ解析装置は、
    前記個体データから前記状態データを生成する生成部をさらに具備する、請求項1に記載のデータ解析装置。
  3. 前記生成部は、前記個体データの誤差に応じた前記状態データを生成する、請求項2に記載のデータ解析装置。
  4. 前記生成部は、前記個体データの計測誤差または量子化誤差に基づいて前記状態データを生成する、請求項2に記載のデータ解析装置。
  5. 前記生成部は、個体データが入力され、状態データを出力するように学習された学習済みモデルを用いて、解析対象の個体データから状態データを推論する、請求項2から請求項4のいずれか1項に記載のデータ解析装置。
  6. 前記算出部は、前記項目ごとの前記状態データの偏りを表す前記指標値を算出する、請求項1から請求項5のいずれか1項に記載のデータ解析装置。
  7. 前記算出部は、前記項目と前記状態データとに対し統計的検定を用いて前記指標値を算出する、請求項1から請求項5のいずれか1項に記載のデータ解析装置。
  8. 前記特定の状態は、製品に関する特定のモードである、請求項1から請求項7のいずれか1項に記載のデータ解析装置。
  9. 前記特定の状態は、異常状態である、請求項1から請求項8のいずれか1項に記載のデータ解析装置。
  10. 前記特定の状態は、未知の状態をクラスタ分類した場合における特定のクラスタに属することを表す、請求項1から請求項7のいずれか1項に記載のデータ解析装置。
  11. 前記個体データは、画像データまたは時系列データを含む多次元データのうちの1つである、請求項2に記載のデータ解析装置。
  12. 前記状態データに関する情報を第1表示領域に表示し、前記製造条件ごとに前記指標値に関する情報を第2表示領域に表示するように制御する表示制御部をさらに具備する、請求項1から請求項11のいずれか1項に記載のデータ解析装置。
  13. 前記表示制御部は、第1状態データから算出された状態判定値が第1閾値以上であれば、第1状態データに関する解析結果を、第1状態データとは異なる第2状態データに関する解析結果よりも優先して表示し、第1製造条件に関して算出された前記指標値が第2閾値以上であれば、第1製造条件とは異なる第2製造条件に関して算出された指標値および解析結果よりも優先して表示する、請求項12に記載のデータ解析装置。
  14. 前記第1状態データおよび前記第2状態データは、前記製品個別の計測値を示す個体データに関するデータであり、前記解析結果は、前記個体データに関する情報を含む、請求項13に記載のデータ解析装置。
  15. 前記表示制御部は、前記状態データから算出された状態判定値に基づき、前記解析結果を表示する際の情報量を制御する、請求項13または請求項14に記載のデータ解析装置。
  16. 前記表示制御部は、第1個体データに関する状態データから算出された状態判定値が閾値以上であれば、前記第1個体データに関する解析結果と前記状態判定値とに関する情報を表示し、前記状態判定値が前記閾値未満であれば、前記第1個体データの前記状態判定値に関する情報のみ表示する、請求項12から請求項15のいずれか1項に記載のデータ解析装置。
  17. 前記状態データは、前記製品個別の計測値を示す個体データに関するデータであり、
    前記表示制御部は、第1製造条件に関して算出された前記指標値が閾値以上であれば、前記第1製造条件に関する解析結果と前記指標値とに関する情報を表示し、前記指標値が前記閾値未満であれば、前記第1製造条件の前記指標値に関する情報のみ表示する、請求項12から請求項16のいずれか1項に記載のデータ解析装置。
  18. 解析対象となる複数の製品について、製品ごとに1以上の製造条件を含む製造データを取得し、
    前記製造データから抽出した1つの製造条件に関し取り得る1以上の項目における、前記製品が特定の状態である度合いを示す状態データの偏りに基づいて、前記製品が前記特定の状態となった原因が前記製造条件である度合いを示す指標値を算出する、データ解析方法。
  19. データ格納装置と、データ解析装置と、表示装置とを含むデータ解析システムであって、
    前記データ格納装置は、
    解析対象となる複数の製品について、製品ごとに1以上の製造条件を含む製造データを格納し、
    前記データ解析装置は、
    前記データ格納装置から前記製造データを取得する取得部と、
    前記製造データから抽出した1つの製造条件に関し取り得る1以上の項目における、前記製品が特定の状態である度合いを示す状態データの偏りに基づいて、前記製品が前記特定の状態となった原因が前記製造条件である度合いを示す指標値を算出する算出部と、を具備し、
    前記表示装置は、
    前記状態データに関する情報を第1表示領域に表示し、前記製造条件ごとに前記指標値に関する情報を第2表示領域に表示する、データ解析システム。
JP2020205231A 2020-12-10 2020-12-10 データ解析装置、方法およびシステム Active JP7524045B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2020205231A JP7524045B2 (ja) 2020-12-10 2020-12-10 データ解析装置、方法およびシステム
US17/446,607 US11775512B2 (en) 2020-12-10 2021-08-31 Data analysis apparatus, method and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020205231A JP7524045B2 (ja) 2020-12-10 2020-12-10 データ解析装置、方法およびシステム

Publications (2)

Publication Number Publication Date
JP2022092419A true JP2022092419A (ja) 2022-06-22
JP7524045B2 JP7524045B2 (ja) 2024-07-29

Family

ID=81941469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020205231A Active JP7524045B2 (ja) 2020-12-10 2020-12-10 データ解析装置、方法およびシステム

Country Status (2)

Country Link
US (1) US11775512B2 (ja)
JP (1) JP7524045B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11782426B2 (en) 2020-09-16 2023-10-10 Kabushiki Kaisha Toshiba Abnormality score calculation apparatus, method, and medium
US12061467B2 (en) 2021-08-19 2024-08-13 Kabushiki Kaisha Toshiba Data processing apparatus, data processing method, and storage medium storing program for determining an abnormality based on manufacturing data

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011054804A (ja) * 2009-09-02 2011-03-17 Toshiba Corp 半導体製造装置の管理方法およびシステム
JP2017076287A (ja) * 2015-10-15 2017-04-20 キヤノン株式会社 データ解析装置、データ解析方法及びプログラム
JP2019095232A (ja) * 2017-11-20 2019-06-20 三菱日立パワーシステムズ株式会社 水質診断システム、発電プラント、及び水質診断方法
JP2020181273A (ja) * 2019-04-23 2020-11-05 日立オートモティブシステムズ株式会社 製造不良原因探索装置、製造不良原因探索方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5014500B1 (ja) 1970-05-28 1975-05-28
JP4772377B2 (ja) 2005-05-13 2011-09-14 シャープ株式会社 異常設備推定装置、異常設備推定方法、異常設備推定プログラム、および、記録媒体
JP5014500B1 (ja) 2011-04-04 2012-08-29 シャープ株式会社 異常要因特定方法および装置、上記異常要因特定方法をコンピュータに実行させるためのプログラム、並びに上記プログラムを記録したコンピュータ読み取り可能な記録媒体
TWI543102B (zh) 2014-10-22 2016-07-21 財團法人工業技術研究院 異因分析與校正方法與系統
JP6008339B1 (ja) * 2015-04-28 2016-10-19 パナソニックIpマネジメント株式会社 商品モニタリング装置、商品モニタリングシステムおよび商品モニタリング方法
WO2021015093A1 (ja) 2019-07-19 2021-01-28 パナソニックIpマネジメント株式会社 不調要因特定装置、不調予兆検知装置、不調要因特定方法及び不調予兆検知方法
JP7446771B2 (ja) 2019-10-30 2024-03-11 株式会社東芝 可視化データ生成装置、可視化データ生成システム、及び可視化データ生成方法
WO2021083513A1 (en) * 2019-10-30 2021-05-06 Siemens Aktiengesellschaft Method and system for generating a design of a product
JP7524145B2 (ja) 2021-08-19 2024-07-29 株式会社東芝 データ処理装置、方法及びプログラム
JP2023043703A (ja) 2021-09-16 2023-03-29 株式会社東芝 データ解析装置、方法およびプログラム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011054804A (ja) * 2009-09-02 2011-03-17 Toshiba Corp 半導体製造装置の管理方法およびシステム
JP2017076287A (ja) * 2015-10-15 2017-04-20 キヤノン株式会社 データ解析装置、データ解析方法及びプログラム
JP2019095232A (ja) * 2017-11-20 2019-06-20 三菱日立パワーシステムズ株式会社 水質診断システム、発電プラント、及び水質診断方法
JP2020181273A (ja) * 2019-04-23 2020-11-05 日立オートモティブシステムズ株式会社 製造不良原因探索装置、製造不良原因探索方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11782426B2 (en) 2020-09-16 2023-10-10 Kabushiki Kaisha Toshiba Abnormality score calculation apparatus, method, and medium
US12061467B2 (en) 2021-08-19 2024-08-13 Kabushiki Kaisha Toshiba Data processing apparatus, data processing method, and storage medium storing program for determining an abnormality based on manufacturing data

Also Published As

Publication number Publication date
US20220188307A1 (en) 2022-06-16
US11775512B2 (en) 2023-10-03
JP7524045B2 (ja) 2024-07-29

Similar Documents

Publication Publication Date Title
JP7162442B2 (ja) プロセス及び製造業における業績評価指標のデータに基づく最適化のための方法及びシステム
JP7524045B2 (ja) データ解析装置、方法およびシステム
US20230213926A1 (en) Abnormal irregularity cause identifying device, abnormal irregularity cause identifying method, and abnormal irregularity cause identifying program
JP7446771B2 (ja) 可視化データ生成装置、可視化データ生成システム、及び可視化データ生成方法
US20230213924A1 (en) Abnormal irregularity cause identifying device, abnormal irregularity cause identifying method, and abnormal irregularity cause identifying program
CA3053894A1 (en) Defect prediction using historical inspection data
JP2020149181A (ja) データ分類装置
EP4160341A1 (en) Abnormal modulation cause identifying device, abnormal modulation cause identifying method, and abnormal modulation cause identifying program
JP7318612B2 (ja) 監視装置、監視方法、および監視プログラム
JP2021192155A (ja) 異常検知支援プログラム、異常検知支援方法および異常検知支援システム
JP7524145B2 (ja) データ処理装置、方法及びプログラム
JP2023113024A (ja) データ処理装置、方法及びプログラム
US20210157707A1 (en) Transferability determination apparatus, transferability determination method, and recording medium
JP7452509B2 (ja) 監視装置、監視方法、および監視プログラム
JP5566616B2 (ja) 特性解析装置、特性解析方法をコンピュータに実行させるためのプログラム、上記プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2011138374A (ja) 診断装置および診断方法
US20240094092A1 (en) Manufacturing data analysis device and method
JP2020149259A (ja) 異常診断装置
US20240232714A1 (en) Detection and visualization of novel data instances for self-healing ai/ml model-based solution deployment
US11783233B1 (en) Detection and visualization of novel data instances for self-healing AI/ML model-based solution deployment
US20240094091A1 (en) Manufacturing data analysis device, system, and method
Pakdil et al. Control Charts
US20230205194A1 (en) Abnormal irregularity cause display device, abnormal irregularity cause display method, and abnormal irregularity cause display program
EP4160340A1 (en) Abnormal modulation cause identifying device, abnormal modulation cause identifying method, and abnormal modulation cause identifying program
Numanovic Advanced Clinical Data Processing: A Predictive Maintenance Model for Anesthesia Machines

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20230105

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20231129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20231212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240502

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240618

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240717

R150 Certificate of patent or registration of utility model

Ref document number: 7524045

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150