JP6766103B2 - 分析方法及び計算機 - Google Patents

分析方法及び計算機 Download PDF

Info

Publication number
JP6766103B2
JP6766103B2 JP2018144427A JP2018144427A JP6766103B2 JP 6766103 B2 JP6766103 B2 JP 6766103B2 JP 2018144427 A JP2018144427 A JP 2018144427A JP 2018144427 A JP2018144427 A JP 2018144427A JP 6766103 B2 JP6766103 B2 JP 6766103B2
Authority
JP
Japan
Prior art keywords
column
target
surjective
graph
analysis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018144427A
Other languages
English (en)
Other versions
JP2020021278A (ja
Inventor
啓朗 室
室  啓朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018144427A priority Critical patent/JP6766103B2/ja
Priority to US16/356,697 priority patent/US11126948B2/en
Publication of JP2020021278A publication Critical patent/JP2020021278A/ja
Application granted granted Critical
Publication of JP6766103B2 publication Critical patent/JP6766103B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06395Quality analysis or management
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/41875Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by quality surveillance of production
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0221Preprocessing measurements, e.g. data collection rate adjustment; Standardization of measurements; Time series or signal analysis, e.g. frequency analysis or wavelets; Trustworthiness of measurements; Indexes therefor; Measurements using easily measured parameters to estimate parameters difficult to measure; Virtual sensor creation; De-noising; Sensor fusion; Unconventional preprocessing inherently present in specific fault detection methods like PCA-based methods
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/024Quantitative history assessment, e.g. mathematical relationships between available data; Functions therefor; Principal component analysis [PCA]; Partial least square [PLS]; Statistical classifiers, e.g. Bayesian networks, linear regression or correlation analysis; Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • G06F16/287Visualization; Browsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/15Correlation function computation including computation of convolution operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/04Manufacturing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/18Manufacturability analysis or optimisation for manufacturability
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2119/00Details relating to the type or aim of the analysis or the optimisation
    • G06F2119/22Yield analysis or yield optimisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F30/00Computer-aided design [CAD]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • General Engineering & Computer Science (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Automation & Control Theory (AREA)
  • Manufacturing & Machinery (AREA)
  • Software Systems (AREA)
  • Algebra (AREA)
  • Game Theory and Decision Science (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)

Description

本発明は、製造業における歩留まり分析に関する。
半導体装置及び金属等の製品は、多数の製造工程を経て製造される。完成した製品の品質検査では不良品及び良品の判別が行われる。不良品の発生した原因、すなわち、品質に影響を与える要因を特定するために、歩留まり分析が実行される。歩留まり分析では、製造工程において計測された状態値及び製造工程において設定された制御値等のパラメータと、品質に関する値とを対応づけたデータを用いて処理が行われる。
歩留まり分析では、製品に対して、多数のパラメータの中から不良品の発生に関連するパラメータ又はパラメータの組合せを特定する必要がある。
製品は様々な条件の下で製造され、また、様々な状態値をとるため、分析するパラメータの組合せの数が非常に多い。したがって、パラメータの相関関係を効率的に分析する手法が必要となる。パラメータの相関関係を効率的に分析する手法として主成分分析が知られている。
特開2012−103879号公報
主成分分析は、パラメータの値が数値であることを前提にしている。したがって、文字列等の非数値がパラメータに設定されている場合、主成分分析に基づいてパラメータの相関を特定できない。また、パラメータのカーディナリティが低い場合、及び、パラメータ間が一対一に対応していない場合、主成分分析では有用な結果を得ることができない。
本発明は、歩留まり分析を効率的に行い、かつ、精度を向上させることを目的とする。
本願において開示される発明の代表的な一例を示せば以下の通りである。すなわち、製品を製造する複数の装置を有するシステムから取得された分析データを分析する計算機が実行する分析方法であって、前記計算機は、演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続されるネットワークインタフェースを備え、前記分析データは、前記製品の製造に関するパラメータを格納する複数のフィールド、及び前記製品の品質を示す評価値を格納する少なくとも一つのフィールドから構成され、前記分析方法は、前記計算機が、前記分析データの各フィールドの値の集合をカラムとして管理する第1のステップと、前記計算機が、第一ターゲットカラムに属する値から第二ターゲットカラムに属する値への対応を分析し、前記対応が全射となる前記第一ターゲットカラム及び前記第二ターゲットカラムの組合せである全射カラムペアを特定する第2のステップと、前記計算機が、前記全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを接続することによって、前記カラムの接続関係を示す木構造の第一グラフを管理するためのグラフ情報を生成する第3のステップと、前記計算機が、前記グラフ情報を用いて、前記評価値に影響を与える前記パラメータを特定するための歩留まり分析を実行する第4のステップと、を含み、前記第2のステップは、前記計算機が、前記カラムに属する値を分類することによって一つ以上のカテゴリを生成する第5のステップと、前記計算機が、前記第一ターゲットカラムの前記カテゴリに属する値から前記第二ターゲットカラムの前記カテゴリに属する値への対応を分析する第6のステップと、を含み、前記第3のステップは、前記計算機が、第一ターゲット全射カラムペアを選択するステップと、前記計算機が、前記第一ターゲット全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを生成するステップと、前記計算機が、前記第一グラフの葉ノードに対応する末端カラムを選択するステップと、前記計算機が、前記第一ターゲット全射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致するか否かを判定するステップと、前記計算機が、前記第一ターゲット全射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致する場合、前記末端カラムに対応する葉ノードに前記第一ターゲット全射カラムペアの前記第二ターゲットカラムを接続するステップと、を含む。
本発明によれば、歩留まり分析を効率的に行い、かつ、精度を向上させることができる。上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。
実施例1のシステムの構成例を示す図である。 実施例1のデータ管理装置の構成の一例を示す図である。 実施例1の分析装置の構成の一例を示す図である。 実施例1のシステム全体のモジュール及びデータの関係を説明する図である。 実施例1の全射グラフ生成部の詳細な構成を説明する図である。 実施例1の分析部の詳細な構成を説明する図である。 実施例1の可視化部の詳細な構成を説明する図である。 実施例1のデータ構造の表記規則を説明する図である。 実施例1の制御データ管理情報のデータ構造の一例を示す図である。 実施例1のセンサデータ管理情報のデータ構造の一例を示す図である。 実施例1の処理範囲データ管理情報のデータ構造の一例を示す図である。 実施例1の状態データ管理情報のデータ構造の一例を示す図である。 実施例1の品質データ管理情報のデータ構造の一例を示す図である。 実施例1の分析データ管理情報のデータ構造の一例を示す図である。 実施例1のカーディナリティ情報のデータ構造の一例を示す図である。 実施例1のカラム対応情報のデータ構造の一例を示す図である。 実施例1の全射カラムペア情報のデータ構造の一例を示す図である。 実施例1の全射グラフ情報のデータ構造の一例を示す図である。 実施例1の分析装置のラベル生成部が実行する処理の一例を説明するフローチャートである。 実施例1の分析装置が実行するカラム分析処理の一例を説明するフローチャートである。 実施例1の分析装置が実行する出現頻度算出処理の一例を説明するフローチャートである。 実施例1の分析装置が実行するカラム対応抽出処理の一例を説明するフローチャートである。 実施例1の分析装置が実行する写像判定処理の一例を説明するフローチャートである。 実施例1の分析装置が実行する全単射判定処理の一例を説明するフローチャートである。 実施例1の分析装置が実行する全射判定処理の一例を説明するフローチャートである。 実施例1の分析装置が実行するグラフ生成処理の一例を説明するフローチャートである。 実施例1のカラム分析処理において入力される分析データ管理情報の一例を示す図である。 実施例1のカラム分析処理において出力される全射カラムペア情報の一例を示す図である。 実施例1の全射カラムペア情報が表すカラム間の対応(写像)の一例を示す図である。 実施例1のカラム分析処理において出力される全射グラフ情報の一例を示す図である。 実施例1のカラム分析処理において出力される全射グラフ情報の一例を示す図である。 実施例1の全射グラフ情報が表すグラフ(木)の一例を示す図である。 実施例1の全射グラフ情報が表すグラフ(木)の一例を示す図である。 実施例1の分析装置が実行する分析データ分析処理の一例を説明するフローチャートである。 実施例1の分析部が実行する散布図生成処理の一例を説明するフローチャートである。 実施例1の分析部が実行するカラムスコア算出処理の一例を説明するフローチャートである。 実施例1のユーザインタフェースが表示するグラフ表示画面3500の一例を示す図である。 実施例2の分析装置が実行するカラム削除処理の一例を説明するフローチャートである。
以下、本発明の実施例を、図面を用いて説明する。ただし、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更し得ることは当業者であれば容易に理解される。
以下に説明する発明の構成において、同一又は類似する構成又は機能には同一の符号を付し、重複する説明は省略する。
本明細書等における「第1」、「第2」、「第3」等の表記は、構成要素を識別するために付するものであり、必ずしも、数又は順序を限定するものではない。
図1は、実施例1のシステムの構成例を示す図である。
実施例1のシステムは、計画装置100、複数のコントローラ101、複数の製造装置102、品質管理装置103、複数のセンサ104、品質センサ105、データ管理装置106、及び分析装置107から構成される。複数のコントローラ101はコントローラ101−1及びコントローラ101−2を含み、複数の製造装置102は製造装置102−1及び製造装置102−2を含み、複数のセンサ104はセンサ104−1及びセンサ104−2を含む。
計画装置100は、ネットワーク120を介して複数のコントローラ101と接続し、また、ネットワーク120及びネットワーク121を介して、データ管理装置106と接続する。また、複数のコントローラ101、複数のセンサ104、及び品質センサ105は、ネットワーク121を介してデータ管理装置106と接続する。
ネットワーク120及びネットワーク121は、WAN(Wide Area Network)及びLAN(Local Area Network)等である。また、ネットワーク120及びネットワーク121の接続方式は、有線及び無線のいずれでもよい。
実施例1では、材料110から製品111を製造する工場にアクセス可能な計画装置100及びデータ管理装置106が接続されるシステムを想定している。
計画装置100は、製造装置102を制御するための制御データを生成し、制御データをコントローラ101に送信する。計画装置100は、CPU、メモリ、及びネットワークインタフェースを有する計算機である。なお、計画装置100は、仮想計算機を用いて実現してもよい。
計画者10は、計画装置100を用いて、製品111の製造計画及び製造装置102の運用計画等を設定する。
コントローラ101は、製造装置102を制御する。例えば、コントローラ101は、製造装置102の動きを制御するためのパラメータを製造装置102に設定する。コントローラ101は、CPU、メモリ、及びネットワークインタフェースを有する計算機である。また、コントローラ101は、製造装置102を制御する専用のハードウェアを用いて実現できる。なお、コントローラ101は、仮想計算機を用いて実現してもよい。
センサ104は、材料110の加工状態等を示す値及び製造装置102の状態等を示す値を計測する。また、センサ104は、計測された値をデータ管理装置106に送信する。
品質センサ105は、完成した製品111の品質を評価するための値である評価値を計測する。また、品質センサ105は、計測した評価値をデータ管理装置106に送信する。なお、中間製造物の品質に関する評価値を計測するために、複数の製造装置102の各々に品質センサ105を接続してもよい。
データ管理装置106は、製品111の製造に関するデータを管理する。データ管理装置106の構成については図2を用いて説明する。
分析装置107は、製品111の歩留まり分析を実行する。分析装置107の構成については図3を用いて説明する。分析者20は、任意のタイミングで分析装置107を用いて製品111の歩留まり分析を実行する。
図2は、実施例1のデータ管理装置106の構成の一例を示す図である。
データ管理装置106は、ハードウェア構成として、CPU201、メモリ202、記憶装置203、及びネットワークインタフェース204を有する。各ハードウェア構成は、内部バスを介して接続される。
CPU201は、メモリ202に格納されるプログラムを実行する。CPU201がプログラムにしたがって処理を実行することによって、特定の機能を実現する機能部(モジュール)として動作する。以下の説明では、機能部を主語に処理を説明する場合、CPUが当該機能部を実現するプログラムを実行していることを示す。
メモリ202は、CPU201が実行するプログラム及びプログラムが使用するデータを格納する。メモリ202には、データを管理するための機能部(図示省略)を実現するプログラムが格納される。
記憶装置203は、HDD(Hard Disk Drive)及びSSD(Solid State Drive)等であり、データを永続的に格納する。記憶装置203に格納されるデータについては後述する。メモリ202に格納されるプログラムは記憶装置203に格納されてもよい。プログラムを実行する場合、CPU201は、記憶装置203からプログラムを読み出し、メモリ202にロードし、メモリ202にロードされたプログラムを実行する。また、記憶装置203に格納されるデータは、メモリ202に格納されてもよい。
ネットワークインタフェース204は、ネットワークを介して他の装置と通信するためのインタフェースである。
ここで、記憶装置203に格納されるデータについて説明する。記憶装置203は、制御データ管理情報210、センサデータ管理情報211、処理範囲データ管理情報212、状態データ管理情報213、及び品質データ管理情報214を格納する。
制御データ管理情報210は、製造装置102を制御するための制御データを格納する。制御データには、例えば、製造装置102に設定する温度及び圧力等のパラメータが含まれる。制御データ管理情報210のデータ構造については図9を用いて説明する。
センサデータ管理情報211は、センサ104によって計測された材料110の加工状態等を示す値を含むセンサデータを格納する。センサデータ管理情報211のデータ構造については図10を用いて説明する。
処理範囲データ管理情報212は、処理範囲データを格納する。処理範囲データは、複数の種類の製品111を製造する製造装置102に接続するセンサ104から取得したセンサデータから、種類ごとに製品111に関連する時系列データを取得するための時間範囲を示すデータである。処理範囲データ管理情報212のデータ構造については図11を用いて説明する。
状態データ管理情報213は、センサ104によって計測された製造装置102の状態等を示す値を含む状態データを格納する。状態データ管理情報213のデータ構造については図12を用いて説明する。
品質データ管理情報214は、品質センサ105によって計測された製品111の品質を示す評価値を含む品質データを格納する。品質データ管理情報214のデータ構造については図13を用いて説明する。
図3は、実施例1の分析装置107の構成の一例を示す図である。
分析装置107は、CPU301、メモリ302、記憶装置303、ネットワークインタフェース304、入力装置305、及び出力装置306を有する。各ハードウェア構成は、内部バスを介して接続される。
CPU301、メモリ302、記憶装置303、及びネットワークインタフェース304は、CPU201、メモリ202、記憶装置203、及びネットワークインタフェース204と同様のハードウェアである。
入力装置305は、キーボード、マウス、タッチパネル等のデータを入力するための装置である。出力装置306は、ディスプレイ及びプリンタ等のデータを出力するための装置である。
ここで、記憶装置303に格納されるデータ及びメモリ302に格納されるプログラムについて説明する。
記憶装置303は、分析データ管理情報320、全射カラムペア情報321、及び全射グラフ情報322を格納する。
分析データ管理情報320は、製品111の製造に関連するデータを結合した分析データを格納する。分析データは、歩留まり分析に使用するデータであり、製品111の製造に関連する値を格納するフィールド群から構成される。分析データ管理情報320のデータ構造については図14を用いて説明する。
全射カラムペア情報321は、分析データを構成する一つのフィールドの値の集合(カラム)から他のフィールドの値の集合(カラム)への対応(correspondence)が写像であり、かつ、当該写像が全射又は全単射となる集合(カラム)の組合せを管理するための情報である。全射カラムペア情報321のデータ構造については図17を用いて説明する。
以下の説明では、カラム間の対応が全単射となるカラムの組合せを全単射カラムペアと記載し、カラム間の対応が全射となるカラムの組合せを全射カラムペアと記載する。なお、カラムペアと記載した場合、カラムの単なる組合せを表すものとする。
全射グラフ情報322は、全射カラムペア情報321に基づいてカラムを連結することによって生成される木構造のグラフを管理するための情報である。全射グラフ情報322のデータ構造については図18を用いて説明する。なお、カラムのグラフは、カラムをノードと、カラム間の対応が全射となるカラム間を接続するエッジとから構成される。
メモリ302は、ラベル生成部310、データ結合部311、データ修正部312、全射グラフ生成部313、分析部314、可視化部315、及びユーザインタフェース316を実現するプログラムを格納する。
ラベル生成部310は、時系列データであるセンサデータから、状態データ等のデータと結合可能な形式のデータであるラベルセンサデータを生成する。
データ結合部311は、データ管理装置106が管理するデータを結合して、分析データを生成する。また、データ結合部311は、分析データを分析データ管理情報320に登録する。
データ修正部312は、各種処理において分析データを修正又は加工する。
全射グラフ生成部313は、全単射カラムペア及び全射カラムペアを検索することによって全射カラムペア情報321を生成し、また、全射カラムペア情報321に基づいて全射グラフ情報322を生成する。
分析部314は、全射グラフ情報322に基づいて歩留まり分析を実行する。
可視化部315は、ユーザに各種データを提示するための表示情報を生成する。
ユーザインタフェース316は、ユーザに情報を提示し、また、ユーザからの入力を受け付けるためのインタフェースを提供する。
なお、分析装置107が有する各機能部については、複数の機能部を一つの機能部にまとめてもよいし、一つの機能部を機能毎に複数の機能部に分けてもよい。
図4は、実施例1のシステム全体のモジュール及びデータの関係を説明する図である。
データ管理装置106は、センサ104からセンサデータ及び状態データを取得し、コントローラ101から処理範囲データ及び制御データを取得し、計画装置100から制御データを取得し、また、品質センサ105から品質データを取得する。データ管理装置106は、取得したデータを記憶装置203に格納する。
分析装置107は、任意のタイミングで、データ管理装置106が管理する制御データ管理情報210、センサデータ管理情報211、処理範囲データ管理情報212、状態データ管理情報213、及び品質データ管理情報214を取得する。
分析装置107のラベル生成部310は、センサデータ及び処理範囲データに基づいてラベルセンサデータを生成し、データ結合部311に出力する。
データ結合部311は、制御データ、状態データ、ラベルセンサデータ、及び品質データを結合することによって分析データを生成する。また、データ結合部311は、生成された分析データを分析データ管理情報320に格納する。
全射グラフ生成部313は、分析データ管理情報320から分析データを取得し、分析データのカラム間の対応を抽出し、当該対応が全射又は全単射となるカラムペアを特定する。全射グラフ生成部313は、特定されたカラムペアに基づいて全射カラムペア情報321を生成する。さらに、全射グラフ生成部313は、全射カラムペア情報321に基づいて全射グラフ情報322を生成する。また、全射グラフ生成部313は、自ら又はユーザインタフェース316を介したユーザの指示に基づいて、分析データの修正指示をデータ修正部312に出力する。
データ修正部312は、分析データの修正指示を受け付けた場合、当該指示にしたがって、分析データを修正する。
分析部314は、分析データ管理情報320に基づいて、品質データを構成するフィールド(評価値)を軸とする特徴空間に分析データをプロットしたグラフ(散布図)の情報を散布図情報400として生成する。分析部314は、任意のタイミングで散布図情報400を可視化部315に出力する。また、分析部314は、分析データ管理情報320、全射グラフ情報322、及び散布図情報400に基づいて、歩留まり分析を実行し、分析結果401を生成する。
可視化部315は、全射グラフ情報322及び散布図情報400に基づいて、グラフ表示情報402を生成する。
ユーザインタフェース316は、グラフ表示情報402に基づいて画面を表示し、また、分析結果401に基づいた画面を表示する。また、ユーザインタフェース316は、分析データの修正指示、全射グラフ生成部313に設定するパラメータの修正指示等を受け付ける。
図5は、実施例1の全射グラフ生成部313の詳細な構成を説明する図である。
全射グラフ生成部313は、出現頻度算出部500、カラム対応抽出部501、全単射判定部502、全射判定部503、グラフデータ生成部504、及びノイズ除去部505を含む。
出現頻度算出部500は、カラムの値の出現頻度を算出する。出現頻度算出部500は、演算結果をカーディナリティ情報1500として出力する。カーディナリティ情報1500のデータ構造については図15を用いて説明する。
カラム対応抽出部501は、二つのカラムの間の対応を抽出する。カラム対応抽出部501は、対応の抽出結果をカラム対応情報1600として出力する。カラム対応情報1600のデータ構造については図16を用いて説明する。
全単射判定部502は、カラム対応情報1600に基づいて全単射カラムペアを検索する。全射判定部503は、カラム対応情報1600に基づいて全射カラムペアを抽出する。全射グラフ生成部313は、全単射カラムペア及び全射カラムペアの抽出結果に基づいて全射カラムペア情報321を生成する。
グラフデータ生成部504は、全射カラムペア情報321に基づいて全射グラフ情報322を生成する。
ノイズ除去部505は、カラムペアを抽出する場合に、カラムの値の中からノイズとなる値を除去する。
図6は、実施例1の分析部314の詳細な構成を説明する図である。
分析部314は、相関関係分析部600、分類精度評価部601、距離算出部602、及び分析順序決定部603を含む。
相関関係分析部600は、評価値を軸とする特徴空間における分析データの位置を管理するための散布図情報400を生成する。
分類精度評価部601は、全射カラムペア情報321及び散布図情報400に基づいて、任意のカラムに着目して特徴空間における分析データを分類した場合の分類精度を示す値を算出する。
距離算出部602は、木構造のグラフにおけるカラム間の距離を算出する。
分析順序決定部603は、全射カラムペア情報321、分類精度を示す値、及び構造データにおけるカラムの距離に基づいて、歩留まり分析において、相関関係を分析するカラムの組合せの処理順番を決定する。
図7は、実施例1の可視化部315の詳細な構成を説明する図である。
可視化部315は表示データ生成部700を含む。表示データ生成部700は、散布図及び全射グラフ情報322に基づいて、グラフ表示情報402を生成する。
次に、システムで扱われるデータのデータ構造について説明する。まず、本明細書で使用するデータ構造の表記について説明する。
図8は、実施例1のデータ構造の表記規則を説明する図である。
実施例1では、JSON形式のデータ構造を例に説明する。そこで、以下のような表記規則を適用する。
規則1は、配列の表記規則を表す。実施例1では集合の要素を値とする配列であるため、集合のラベルを用いて表記800を表記801のように記載する。大文字は集合の記号を表し、小文字は集合の要素を表すものとする。なお、本明細書では部分集合を表す記号も集合と同じ文字を使用する。
規則2は、オブジェクトの表記規則を表す。オブジェクトの表記規則についても集合のラベルを用いて表記810を表記811のように記載する。
規則3及び規則4は、規則1及び規則2を組み合わせた表記規則を表す。
次に、図9から図18を用いてデータ及び情報のデータ構造について説明する。
図9は、実施例1の制御データ管理情報210のデータ構造の一例を示す図である。
制御データ管理情報210は、FID901、PID902、温度903、及び圧力904から構成される制御データを格納する。
FID901は、製造装置102の識別情報を格納するフィールドである。PID902は、製品111の識別情報を格納するフィールドである。温度903及び圧力904は、製造装置102を制御するためのパラメータの値を格納するフィールドである。
図10は、実施例1のセンサデータ管理情報211のデータ構造の一例を示す図である。
センサデータ管理情報211は、FID1001、時刻1002、センサ1(1003)、及びセンサ2(1004)から構成されるセンサデータを格納する。FID1001は、FID901と同一のフィールドである。
時刻1002は、センサデータに含まれる値が計測された時刻(タイムスタンプ)を格納するフィールドである。センサ1(1003)は、センサ104−1が計測した値を格納するフィールドである。センサ2(1004)は、センサ104−2が計測した値を格納するフィールドである。
なお、種類が異なる値をセンサ104が計測する場合、センサデータには、各値を格納するフィールドが含まれる。なお、各センサ104の計測間隔が異なる場合、センサ104ごとにセンサデータ管理情報211を保持してもよい。
図11は、実施例1の処理範囲データ管理情報212のデータ構造の一例を示す図である。
処理範囲データ管理情報212は、FID1101、PID1102、T_START1103、及びT_END1104から構成される処理範囲データを格納する。FID1101及びPID1102は、FID901及びPID902と同一のフィールドである。
T_START1103は、FID1101に対応する製造装置102から取得したセンサデータから、PID1102に対応する製品111に関連する値を切り出す範囲の始点を示す時刻を格納するフィールドである。T_END1104は、FID1101に対応する製造装置102から取得したセンサデータから、PID1102に対応する製品111に関連する値を切り出す範囲の終点を示す時刻を格納するフィールドである。
図12は、実施例1の状態データ管理情報213のデータ構造の一例を示す図である。
状態データ管理情報213は、FID1201、PID1202、温度1203、及び圧力1204から構成される状態データを格納する。FID1201及びPID1202は、FID901及びPID902と同一のフィールドである。
温度1203及び圧力1204は、製造装置102を制御するためのパラメータの計測値を格納するフィールドである。
図13は、実施例1の品質データ管理情報214のデータ構造の一例を示す図である。
品質データ管理情報214は、PID1301、欠陥率1302、及び材料強度1303から構成される品質データを格納する。図13に示す品質データ管理情報214には、製品単位の品質データが格納される。PID1301は、PID902と同一のフィールドである。
欠陥率1302及び材料強度1303は、製品111の評価値を格納するフィールドである。具体的には、欠陥率1302は、不良品と判定された製品111の割合を格納するフィールドである。材料強度1303は、製品111の強度を格納するフィールドである。
図14は、実施例1の分析データ管理情報320のデータ構造の一例を示す図である。
分析データ管理情報320は、PID1401、制御データ1402、状態データ1403、及び品質データ1404から構成される分析データを格納する。図14に示す分析データ管理情報320は、製品111単位の分析データを格納する。PID1401は、PID902と同一のフィールドである。
制御データ1402は、PID1401に対応する製品111に関連する制御データを格納するフィールドである。制御データ1402には、計画装置100及び複数のコントローラ101から取得した制御データが格納される。
状態データ1403は、PID1401に対応する製品111に関連する状態データを格納するフィールドである。状態データ1403には、複数のセンサ104から取得した状態データが格納される。
品質データ1404は、PID1401に対応する製品111に関連する品質データを格納するフィールドである。
行1410は一つの分析データを示す。列1411は特定のフィールドの値の集合、すなわち、カラムである。カラムには、フィールドに格納される値の属性名がカラム名として設定される。一つのカラムからは一つ以上のカテゴリが構成される。
図15は、実施例1のカーディナリティ情報1500のデータ構造の一例を示す図である。
カーディナリティ情報1500は、各カラムのカテゴリ、及びカテゴリに属する値の出現頻度を管理するための情報である。
例えば、カーディナリティ情報1500のデータ構造は、スキーマ1501に示すように定義できる。スキーマ1501で定義されたカーディナリティ情報1500は、カラムのカテゴリ及びカテゴリに属する値の出現頻度を対応づけたデータをカラム名ごとに含む。サンプル1502は、カーディナリティ情報1500の具体例を示す。
図16は、実施例1のカラム対応情報1600のデータ構造の一例を示す図である。
カラム対応情報1600は、カラムのカテゴリから他のカラムのカテゴリへの対応を管理するための情報である。
例えば、カラム対応情報1600のデータ構造は、スキーマ1601に示すように定義できる。スキーマ1601で定義されたカラム対応情報1600は、カラムAの値がキーとなり、キーに対応するカラムBの集合が参照値となるデータを含む。サンプル1602は、カラム対応情報1600の具体例を示す。
図17は、実施例1の全射カラムペア情報321のデータ構造の一例を示す図である。
全射カラムペア情報321は、全単射カラムペア及び全射カラムペアを管理するための情報である。例えば、全射カラムペア情報321のデータ構造は、スキーマ1701に示すように定義できる。
スキーマ1701で定義された全射カラムペア情報321は、カラム単位のデータ群を含む。カラム単位のデータ群は、カラムのカテゴリごとの値の出現頻度を示すデータ、カラムと全単射カラムペアを構成する他のカラムを示すデータ、及びカラムと全射カラムペアを構成する他のカラムを示すデータを含む。サンプル1702は、全射カラムペア情報321の具体例を示す。
図18は、実施例1の全射グラフ情報322のデータ構造の一例を示す図である。
全射グラフ情報322は、カラムの全射又は全単射の関係を示す木構造のグラフを管理するための情報である。例えば、全射グラフ情報322のデータ構造は、スキーマ1801に示すように定義できる。
スキーマ1801で定義された全射グラフ情報322は、rootノードを最上位とするカラムのグラフを示す。カラムのグラフを構成するノードにはカラムの名称が付される。サンプル1802は、全射グラフ情報322の具体例を示す。
次に、分析装置107が実行する処理について説明する。
まず、分析装置107が実行する分析データ管理情報320の更新処理を説明する。分析装置107は、分析者20から指示を受け付けた場合、又は、周期的に、分析データ管理情報320の更新処理を実行する。
分析装置107は、データ管理装置106からセンサデータ管理情報211、処理範囲データ管理情報212、状態データ管理情報213、制御データ管理情報210、及び品質データ管理情報214を取得する。分析装置107のラベル生成部310は、各種情報を取得した場合、図19に示す処理を実行する。これによって、センサデータを他のデータと結合可能な形式のラベルセンサデータに変換することができる。
分析装置107のデータ結合部311は、FID及びPIDの組合せが一致する制御データ、状態データ及びラベルセンサデータを結合し、また、PID1301が結合されたデータのPIDと一致する品質データを結合することによって、分析データを生成する。データ結合部311は、分析データ管理情報320に、生成された分析データを格納する。
図19は、実施例1の分析装置107のラベル生成部310が実行する処理の一例を説明するフローチャートである。
ラベル生成部310は、センサデータ管理情報211及び処理範囲データ管理情報212を取得する(ステップS101)。
次に、ラベル生成部310は、処理範囲データ管理情報212から処理範囲データを一つ選択する(ステップS102)。例えば、ラベル生成部310は、処理範囲データ管理情報212の上から順に処理範囲データを選択する。
次に、ラベル生成部310は、選択した処理範囲データに基づいてセンサデータ管理情報211を参照して、処理するターゲットセンサデータを検索する(ステップS103)。
具体的には、ラベル生成部310は、FID1001が、選択した処理範囲データのFID1101と一致し、かつ、時刻1002が、T_START1103及びT_END1104で指定された時間範囲に含まれるセンサデータを検索する。
次に、ラベル生成部310は、ターゲットセンサデータを集約することによってラベルセンサデータを生成する(ステップS104)。
例えば、以下のような処理が実行される。ラベル生成部310は、ターゲットセンサデータのセンサ1(1003)及びセンサ2(1004)のそれぞれの平均値を算出する。ラベル生成部310は、FID、PID、並びに、センサ1及びセンサ2のフィールドから構成されるラベルセンサデータを生成する。ラベル生成部310は、FIDにFID1101を設定し、PIDにPID1102を設定する。また、ラベル生成部310は、センサ1及びセンサ2のそれぞれのフィールドに平均値を設定する。
なお、センサデータの集約方法は前述したものに限定されない。例えば、最大値又は最小値をフィールドに設定してもよい。
次に、ラベル生成部310は、処理範囲データ管理情報212に登録された全ての処理範囲データの処理が完了したか否かを判定する(ステップS105)。
処理範囲データ管理情報212に登録された全ての処理範囲データの処理が完了していない場合、ラベル生成部310は、ステップS102に戻り、同様の処理を実行する。
処理範囲データ管理情報212に登録された全ての処理範囲データの処理が完了した場合、ラベル生成部310は、生成されたラベルセンサデータをデータ結合部311に出力する(ステップS106)。その後、ラベル生成部310は処理を終了する。なお、実施例1では、ラベルセンサデータは状態データとして出力される。
次に、分析装置107が実行する全射カラムペア情報321及び全射グラフ情報322を生成するために実行するカラム分析処理について説明する。
図20は、実施例1の分析装置107が実行するカラム分析処理の一例を説明するフローチャートである。
分析装置107は、記憶装置303に格納される分析データ管理情報320を読み出す(ステップS201)。
次に、分析装置107は、カーディナリティ情報1500を生成するための出現頻度算出処理を実行する(ステップS202)。出現頻度算出処理の詳細は、図21を用いて説明する。
次に、分析装置107は、カラム対応情報1600を生成するためのカラム対応抽出処理を実行する(ステップS203)。カラム対応抽出処理の詳細は、図22を用いて説明する。
次に、分析装置107は、全射カラムペア情報321を生成するための写像判定処理を実行する(ステップS204)。写像判定処理の詳細は、図23を用いて説明する。
次に、分析装置107は、全射グラフ情報322を生成するためのグラフ生成処理を実行する(ステップS205)。グラフ生成処理の詳細は、図26を用いて説明する。
図21は、実施例1の分析装置107が実行する出現頻度算出処理の一例を説明するフローチャートである。
全射グラフ生成部313は、分析データ管理情報320のカラムの中からターゲットカラムを選択する(ステップS301)。
次に、全射グラフ生成部313は、ターゲットカラムのカテゴリを生成する(ステップS302)。
具体的には、全射グラフ生成部313は、ターゲットカラムの値の種類を分析することによって、ターゲットカラムのカテゴリを生成する。例えば、カラムの値が「a1、a1、a2、a3、a3、a4、a4、a4」である場合、ターゲットカラムのカテゴリは「a1」、「a2」、「a3」、及び「a4」となる。
なお、ターゲットカラムに格納される値がアナログな値である場合、値の種類が非常に多くなる。そのため、ターゲットカラムに格納される値がアナログな値である場合、全射グラフ生成部313は、値の範囲を設定し、当該値の範囲に基づいてカテゴリを生成する。例えば、10以上20未満の範囲をカテゴリ「a1」と設定する。
次に、全射グラフ生成部313は、ターゲットカラムのカーディナリティを算出する(ステップS303)。
具体的には、全射グラフ生成部313は、カテゴリの数を、カーディナリティとして算出する。なお、カーディナリティは1以上の値である。
次に、全射グラフ生成部313は、カーディナリティが1であるか否かを判定する(ステップS304)。
カーディナリティが1であると判定された場合、全射グラフ生成部313は、データ修正部312を介して、分析データ管理情報320からターゲットカラムを削除する。その後、全射グラフ生成部313は、ステップS310に進む。カーディナリティが1であるカラムは、他のカラムとの関係を確認する必要がないため、分析データ管理情報320から削除される。
カーディナリティが1ではないと判定された場合、全射グラフ生成部313は、ターゲットカラムのカテゴリの中からターゲットカテゴリを選択する(ステップS306)。
次に、全射グラフ生成部313は、ターゲットカテゴリに属する値の数を出現頻度として算出する(ステップS307)。
ターゲットカラムの値が「a1、a1、a2、a3、a3、a4、a4、a4」、かつ、ターゲットカテゴリが「a4」の場合、出現頻度は「3」となる。
次に、全射グラフ生成部313は、ターゲットカラムの全てのカテゴリの処理が完了したか否かを判定する(ステップS308)。
ターゲットカラムの全てのカテゴリの処理が完了していないと判定された場合、全射グラフ生成部313は、ステップS306に戻る。
ターゲットカラムの全てのカテゴリの処理が完了したと判定された場合、全射グラフ生成部313は、カーディナリティ情報1500を更新する(ステップS309)。
具体的には、全射グラフ生成部313は、カーディナリティ情報1500に、ターゲットカラムの名称、並びに、カテゴリの名称及び出現頻度から構成されるデータを追加する。
ステップS305又はステップS309の処理が完了した後、全射グラフ生成部313は、分析データ管理情報320の全てのカラムの処理が完了したか否かを判定する(ステップS310)。
分析データ管理情報320の全てのカラムの処理が完了していないと判定された場合、全射グラフ生成部313はステップS301に戻る。
分析データ管理情報320の全てのカラムの処理が完了したと判定された場合、全射グラフ生成部313は、カーディナリティ情報1500をメモリ302に出力し(ステップS311)、出現頻度算出処理を終了する。
図22は、実施例1の分析装置107が実行するカラム対応抽出処理の一例を説明するフローチャートである。
全射グラフ生成部313は、分析データ管理情報320のカラムの組合せであるカラムペア(P,C)を生成する(ステップS401)。カラムPは親カラムを表し、カラムCは子カラムを表す。実施例1では、全射グラフ生成部313は、親カラムのカテゴリから子カラムのカテゴリへの対応を分析する。したがって、カラムペア(温度、圧力)とカラムペア(圧力、温度)は異なるカラムペアとして扱われる。
なお、カラムペアの情報は他の処理でも使用されるため、全射グラフ生成部313は、カラム対応抽出処理が終了した後もメモリ302から削除しないように制御する。
次に、全射グラフ生成部313は、カラムペアの中からターゲットカラムペアを選択する(ステップS402)。
次に、全射グラフ生成部313は、カーディナリティ情報1500を参照して、親カラムのカテゴリの中からターゲットカテゴリを選択する(ステップS403)。
次に、全射グラフ生成部313は、親カラムのターゲットカテゴリに対して定まる子カラムのカテゴリを特定する(ステップS404)。
具体的には、全射グラフ生成部313は、行単位で、ターゲットカテゴリに属する値と子カラムの値との組を抽出する。全射グラフ生成部313は、カーディナリティ情報1500を参照し、子カラムの値が属するカテゴリを特定する。以上の処理によって、親カラムのターゲットカテゴリに対して定まる子カラムのカテゴリが特定される。
次に、全射グラフ生成部313は、カラム対応情報1600を更新する(ステップS405)。
具体的には、全射グラフ生成部313は、カラム対応情報1600に、ターゲットカテゴリ及び特定された子カラムのカテゴリから構成されるデータを追加する。
次に、全射グラフ生成部313は、親カラムの全てのカテゴリの処理が完了したか否かを判定する(ステップS406)。
親カラムの全てのカテゴリの処理が完了していないと判定された場合、全射グラフ生成部313は、ステップS403に戻る。
親カラムの全てのカテゴリの処理が完了したと判定された場合、全射グラフ生成部313は、全てのカラムペアの処理が完了したか否かを判定する(ステップS407)。
全てのカラムペアの処理が完了していないと判定された場合、全射グラフ生成部313はステップS402に戻る。
全てのカラムペアの処理が完了したと判定された場合、全射グラフ生成部313は、カラム対応情報1600をメモリ302に出力し(ステップS408)、カラム対応抽出処理を終了する。
図23は、実施例1の分析装置107が実行する写像判定処理の一例を説明するフローチャートである。
全射グラフ生成部313は、ターゲットカラムペアを選択する(ステップS501)。ここでは、ステップS401の処理結果をそのまま使用するものとする。
全射グラフ生成部313は、ターゲットカラムペアに対して全単射判定処理を実行し(ステップS502)、また、全射判定処理を実行する(ステップS503)。全単射判定処理の詳細は図24を用いて説明し、全射判定処理の詳細は図25を用いて説明する。
次に、全射グラフ生成部313は、全てのカラムペアの処理が完了したか否かを判定する(ステップS504)。
全てのカラムペアの処理が完了していないと判定された場合、全射グラフ生成部313はステップS501に戻る。
全てのカラムペアの処理が完了したと判定された場合、全射グラフ生成部313は、全射カラムペア情報321を記憶装置303に出力し(ステップS505)、全射判定処理を終了する。
具体的には、全射グラフ生成部313は、後述するリストを参照し、全単射カラムペア及び全射カラムペアのデータを、JSON形式のデータとして全射カラムペア情報321に登録する。
図24は、実施例1の分析装置107が実行する全単射判定処理の一例を説明するフローチャートである。
全射グラフ生成部313は、カーディナリティ情報1500を参照し、ターゲットカラムペアの親カラムのカーディナリティ及び子カラムのカーディナリティが同一であるか否かを判定する(ステップS601)。
親カラムのカーディナリティ及び子カラムのカーディナリティが同一でないと判定された場合、全射グラフ生成部313は全単射判定処理を終了する。
親カラムのカーディナリティ及び子カラムのカーディナリティが同一であると判定された場合、全射グラフ生成部313は、カラム対応情報1600を参照し、親カラムの各カテゴリについて、親カラムの一つのカテゴリに対応する子カラムのカテゴリが一つであるか否かを判定する(ステップS602)。以下の説明では、親カラムの一つのカテゴリに対応する子カラムのカテゴリが一つである条件を第一条件と記載する。
第一条件は、親カラムのカテゴリに対して、子カラムのカテゴリが一意に定まるか否かを判定するための条件である。別の表現では、第一条件は、親カラムのカテゴリから子カラムのカテゴリへの対応が写像となるか否かを判定するための条件である。
親カラムの少なくとも一つのカテゴリが第一条件を満たさないと判定された場合、全射グラフ生成部313は全単射判定処理を終了する。
親カラムの全てのカテゴリが第一条件を満たすと判定された場合、全射グラフ生成部313は、カラム対応情報1600を参照し、子カラムの各カテゴリについて、子カラムの一つのカテゴリに対応する親カラムのカテゴリが一つであるか否かを判定する(ステップS603)。以下の説明では、子カラムの一つのカテゴリに対応する親カラムのカテゴリが一つである条件を第二条件と記載する。
第二条件は、子カラムのカテゴリに対して、親カラムのカテゴリが一意に定まるか否かを判定するための条件である。
子カラムの少なくとも一つのカテゴリが第二条件を満たさないと判定された場合、全射グラフ生成部313は全単射判定処理を終了する。
子カラムの全てのカテゴリが第二条件を満たすと判定された場合、全射グラフ生成部313は、対応が全単射となるカラムペアのデータを格納するレコードをリストに追加し(ステップS604)、全単射判定処理を終了する。
具体的には、全射グラフ生成部313は、カラム対応情報1600からカラムペアのカテゴリ間の対応を示すデータを取得する。ここでは、親カラムのカテゴリから子カラムのカテゴリへの対応を示すデータと、子カラムのカテゴリから親カラムのカテゴリへの対応を示すデータとが取得される。全射グラフ生成部313は、親カラム及び子カラムの名称、取得したカラムペアのカテゴリ間の対応を示すデータ、及び文字列「injection」から構成されるレコードをリストに追加する。
また、全射グラフ生成部313は、ターゲットカラムペアの親カラム及び子カラムが入れ替わったカラムペアを処理対象がから除外するように制御する。カラム間の対応が全単射の場合、ターゲットカラムペアの親カラム及び子カラムが入れ替わったカラムペアに対する処理は必要ないためである。
図25は、実施例1の分析装置107が実行する全射判定処理の一例を説明するフローチャートである。
全射グラフ生成部313は、ターゲットカラムペアの対応が全単射となるか否かを判定する(ステップS701)。
具体的には、全射グラフ生成部313は、リストを参照し、当該ターゲットカラムペアが全単射カラムペアとして登録されているか否かを判定する。
ターゲットカラムペアの対応が全単射となると判定された場合、全射グラフ生成部313は全射判定処理を終了する。
ターゲットカラムペアの対応が全単射とならないと判定された場合、全射グラフ生成部313は、親カラムの各カテゴリが第一条件を満たすか否かを判定する(ステップS702)。
親カラムの少なくとも一つのカテゴリが第一条件を満たさないと判定された場合、全射グラフ生成部313は全射判定処理を終了する。
親カラムの全てのカテゴリが第一条件を満たすと判定された場合、全射グラフ生成部313は、対応が全射となるカラムペアのデータを格納するレコードをリストに追加し(ステップS703)、全射判定処理を終了する。
具体的には、全射グラフ生成部313は、カラム対応情報1600からカラムペアのカテゴリ間の対応を示すデータを取得する。ここでは、親カラムのカテゴリから子カラムのカテゴリへの対応を示すデータが取得される。全射グラフ生成部313は、親カラム及び子カラムの名称、取得したカラムペアのカテゴリ間の対応を示すデータ、及び文字列「surjection」から構成されるレコードをリストに追加する。
図26は、実施例1の分析装置107が実行するグラフ生成処理の一例を説明するフローチャートである。
全射グラフ生成部313は、全射グラフ情報322を初期化する(ステップS801)。
次に、全射グラフ生成部313は、リストからターゲットレコードを選択する(ステップS802)。
次に、全射グラフ生成部313は、ターゲットレコードのグラフデータを生成する(ステップS803)。
具体的には、全射グラフ生成部313は、親カラム及び子カラムに対応するノードをエッジで接続したグラフのデータを生成する。
なお、カラム間の対応が全単射となる場合、カラムを接続するエッジの太さや色を他のエッジと異なるように設定してもよい。また、子カラムのカテゴリに対する親カラムのカテゴリの重複度に基づいてエッジの太さや色を設定してもよい。これによって、分析データにおいて注目すべきパラメータの組合せを分析者20に提示できる。
次に、全射グラフ生成部313は、全射グラフ情報322を参照して、グラフの葉ノードに対応する末端カラムの中からターゲットカラムを選択する(ステップS804)。
次に、全射グラフ生成部313は、ターゲットカラムがターゲットレコードの親カラムに一致するか否かを判定する(ステップS805)。
ターゲットカラムがターゲットレコードの親カラムに一致すると判定された場合、全射グラフ生成部313は、全射グラフ情報322を更新する(ステップS806)。その後、全射グラフ生成部313はステップS808に進む。
具体的には、全射グラフ生成部313は、ターゲットレコードの親カラムが、ターゲットカラムの子カラムとして接続されるように、全射グラフ情報322にターゲットレコードのグラフデータを追加する。すなわち、ターゲットカラムにターゲットレコードの子カラムが接続される。
なお、ターゲットレコードが文字列「injection」を含む場合には、以下のような処理が実行される。
全射グラフ生成部313は、ターゲットカラムがターゲットレコードの親カラムに一致する場合、ターゲットカラムに直接接続されるカラムがターゲットレコードの子カラムと異なるか否かを判定する。
ターゲットカラムに直接接続されるカラムがターゲットレコードの子カラムと異なると判定された場合、全射グラフ生成部313は、ターゲットレコードの親カラムが、ターゲットカラムの子カラムとして接続されるように、全射グラフ情報322にターゲットレコードのグラフデータを追加する。すなわち、ターゲットカラムにターゲットレコードの子カラムが接続される。
前述の処理は、あるカラムの親カラムが、当該カラムの子カラムとして接続されるのを防止するための処理である。
なお、一つのカラムから他のカラムへの分岐の数に応じて、カラムの表示方法が異なるようにデータを設定してもよい。例えば、分岐の数が3以上のカラムをハイライトで表示することが考えられる。これによって、分析データにおいて重要なパラメータを分析者20に提示できる。
ターゲットカラムがターゲットレコードの親カラムに一致しないと判定された場合、全射グラフ生成部313は、全射グラフ情報322を更新する(ステップS807)。その後、全射グラフ生成部313はステップS808に進む。
具体的には、全射グラフ生成部313は、ターゲットレコードの親カラムがルートノードに接続されるように、全射グラフ情報322にターゲットレコードのグラフデータを追加する。
ステップS808では、全射グラフ生成部313は、全ての末端カラムについて処理が完了したか否かを判定する(ステップS808)。
全ての末端カラムについて処理が完了していないと判定された場合、全射グラフ生成部313は、ステップS804に戻る。
全ての末端カラムについて処理が完了したと判定された場合、全射グラフ生成部313は、リストの全てのレコードについて処理が完了したか否かを判定する(ステップS809)。
リストの全てのレコードについて処理が完了していないと判定された場合、全射グラフ生成部313は、ステップS802に戻る。
リストの全てのレコードについて処理が完了したと判定された場合、全射グラフ生成部313は、全射グラフ情報322を記憶装置303に出力する(ステップS810)。以上の処理によって生成されるグラフのデータをフォワード木構造データと記載する。
なお、全射グラフ情報322が空である場合、全射グラフ生成部313は、ターゲットレコードのグラフデータを全射グラフ情報322に追加する。
なお、ステップS805の処理は以下のような処理に置き換えてもよい。すなわち、全射グラフ生成部313は、ターゲットカラムの親カラムが、ターゲットレコードの子カラムと一致するか否かを判定する。この場合、ステップS806では、全射グラフ生成部313は、ターゲットレコードの子カラムが、ターゲットカラムの親カラムとして接続されるように、全射グラフ情報322にターゲットレコードのグラフデータを追加する。前述の処理によって生成されるグラフのデータをバックワード木構造データと記載する。
ここで、具体例を用いてカラム分析処理について説明する。図27は、実施例1のカラム分析処理において入力される分析データ管理情報320の一例を示す図である。図28は、実施例1のカラム分析処理において出力される全射カラムペア情報321の一例を示す図である。図29は、実施例1の全射カラムペア情報321が表すカラム間の対応(写像)の一例を示す図である。図30A及び図30Bは、実施例1のカラム分析処理において出力される全射グラフ情報322の一例を示す図である。図31A及び図31Bは、実施例1の全射グラフ情報322が表すグラフ(木)の一例を示す図である。
図27に示す分析データ管理情報320は、カラムの名称が「A」、「B」、「C」、「D」、及び「E」である六つの分析データを格納する。
図27に示す分析データ管理情報320に対する出現頻度算出処理の結果は以下のようになる。カラム「A」については、カテゴリ「a1」及び出現頻度「1」、カテゴリ「a2」及び出現頻度「1」、カテゴリ「a3」及び出現頻度「2」、カテゴリ「a4」及び出現頻度「2」という結果が得られる。カラム「B」については、カテゴリ「b1」及び出現頻度「2」、カテゴリ「b2」及び出現頻度「2」、カテゴリ「b3」及び出現頻度「2」という結果が得られる。カラム「C」については、カテゴリ「c1」及び出現頻度「2」、カテゴリ「c2」及び出現頻度「4」という結果が得られる。カラム「D」については、カテゴリ「d1」及び出現頻度「1」、カテゴリ「d2」及び出現頻度「5」という結果が得られる。カラム「E」については、カテゴリ「e1」及び出現頻度「3」、カテゴリ「e2」及び出現頻度「3」という結果が得られる。
図27に示す分析データ管理情報320に対してカラム対応抽出処理及び写像判定処理を実行した結果、図28に示す全射カラムペア情報321が生成される。図28に示す全射カラムペア情報321は、図29に示すカラム間の対応(写像)を定義した情報である。
また、図27に示す分析データ管理情報320に対してグラフ生成処理を実行した結果、図30Aに示すようなフォワード木構造データを表す全射グラフ情報322が生成される。なお、図30Aに示す全射グラフ情報322は、図31Aに示すグラフを定義した情報である。なお、バックワード木構造データを生成する処理が実行された場合、図30Bに示すような全射グラフ情報322が生成される。図30Bに示す全射グラフ情報322は、図31Bに示すグラフを定義した情報である。
次に、分析装置107が実行する歩留まり分析について説明する。
図32は、実施例1の分析装置107が実行する歩留まり分析の一例を説明するフローチャートである。
分析部314は、全射カラムペア情報321が出力された場合、分析者20から指示を受け付けた場合、又は、周期的に歩留まり分析を実行する。
まず、分析部314は散布図生成処理を実行する(ステップS901)。散布図生成処理の詳細は図33を用いて説明する。
次に、分析部314は、分析データ管理情報320を参照して、ターゲットカラムを選択する(ステップS902)。
次に、分析部314は、ターゲットカラム及び散布図を用いて、カラムスコア算出処理を実行する(ステップS903)。カラムスコア算出処理は、ターゲットカラムに基づく特徴空間での分析データの分類結果を評価するカラムスコアを算出するための処理である。カラムスコア算出処理の詳細は図34を用いて説明する。
次に、分析部314は、分析データ管理情報320の全てのカラムの処理が完了したか否かを判定する(ステップS904)。
分析データ管理情報320の全てのカラムの処理が完了していないと判定された場合、分析部314はステップS902に戻る。
分析データ管理情報320の全てのカラムの処理が完了したと判定された場合、分析部314は、ターゲットカラムペアを選択する(ステップS905)。
次に、分析部314は、ターゲットカラムペアを構成するカラム間のカラムのグラフにおける距離を算出する(ステップS906)。
具体的には、分析部314は、ターゲットカラムペアの一つのカラムから他のカラムへの移動するときに経由するカラムの数を距離として算出する。例えば、図31Aに示すカラムのグラフの場合、カラムペア(A,C)の距離は「2」と算出され、カラムペア(C,D)の距離は「3」と算出され、また、カラムペア(B,E)の距離は「3」と算出される。
次に、分析部314は、全てのカラムペアの処理が完了したか否かを判定する(ステップS907)。
全てのカラムペアの処理が完了していないと判定された場合、分析部314はステップS905に戻る。
全てのカラムペアの処理が完了したと判定された場合、分析部314は、改めてカラムペアのループ処理を開始する。すなわち、分析部314は、ターゲットカラムペアを選択する(ステップS908)。なお、分析部314は、カラムペアのループ処理を開始するために、各カラムペアの距離を正規化する。例えば、分析部314は、距離の最大値が「1」となるようにカラムペアの距離を正規化する。
次に、分析部314は、ターゲットカラムペアを構成する各カラムのカラムスコア、及び距離に基づいて総合スコアを算出する(ステップS909)。
分析部314は、例えば、下式(1)に基づいて総合スコアを算出する。ここで、Stは総合スコアを表し、S[Ci]はカラムCiのカラムスコアを表し、D[Ci,Cj]はカラムのグラフ上におけるカラムCi及びカラムCjの距離を表す。また、Dmaxは距離の最大値を表し、kは任意の係数を表す。
Figure 0006766103
次に、分析部314は、全てのカラムペアの処理が完了したか否かを判定する(ステップS910)。
全てのカラムペアの処理が完了していないと判定された場合、分析部314はステップS908に戻る。
全てのカラムペアの処理が完了したと判定された場合、分析部314は、総合スコアに基づいてカラムペアの分析順序を決定し、歩留まり分析を実行する(ステップS911)。
具体的には、分析部314は、総合スコアが高いカラムペアが優先的に分析されるように、カラムペアの分析順序を決定する。歩留まり分析は、公知の技術を用いればよいため詳細な説明は省略する。
このように、分析するカラムペアの数が膨大となる歩留まり分析において、分析装置107は、分析対象のカラムペアを絞り込むことができる。また、分析装置107は、分析の順番に基づいて分析を実行することによって、有用な結果を高速に得ることができる。すなわち、実施例1によれば、歩留まり分析を効率的に行い、かつ、精度を向上させることができる。
図33は、実施例1の分析部314が実行する散布図生成処理の一例を説明するフローチャートである。
まず、分析部314は、特徴空間を設定する(ステップS1001)。
具体的には、分析部314は、品質を示す値を格納するフィールドを軸とする特徴空間を設定する。なお、全てのフィールドを用いなくてもよい。この場合、特徴空間を構成するフィールドが予め指定される。
次に、分析部314は、分析データ管理情報320からターゲット分析データを選択する(ステップS1002)。
次に、分析部314は、特徴空間におけるターゲット分析データの座標を決定する(ステップS1003)。
具体的には、分析部314は、特徴空間を構成する軸に対応するフィールドの値の組を、特徴空間のターゲット分析データの座標に決定する。
次に、分析部314は、ターゲット分析データの表示色を決定する(ステップS1004)。具体的には、以下のような処理が実行される。
分析部314は、分析データを構成する制御データ及び状態データに対応するカラムの中からターゲットカラムを選択する。
分析部314は、ターゲットカラムに対応するフィールドの値からインデックスを算出する。例えば、分析部314はカテゴリをインデックスとして算出する。分析部314は、インデックスに割り当てる色を決定する。色は、例えば、ランダムに設定される。ただし、異なるインデックスに割り当てられている色と重複しないように決定される。分析部314は、各フィールドに対して同様の処理を実行する。
なお、特定のカラムについてのみ表示色を決定してもよい。この場合、表示色を決定するカラムが予め指定される。以上がステップS1004の処理の説明である。
次に、分析部314は、散布図情報400を更新する(ステップS1005)。
具体的には、分析部314は、座標、表示色、及びインデックスから構成されるデータを散布図情報400に追加する。なお、一つのカラムに対して一つの散布図情報400を生成する場合、分析部314は、一つのカラムの散布図情報400に、座標及び表示色から構成されるデータを追加する。
次に、分析部314は、全ての分析データの処理が完了したか否かを判定する(ステップS1006)。
全ての分析データの処理が完了していないと判定された場合、分析部314は、ステップS1002に戻る。
全ての分析データの処理が完了したと判定された場合、分析部314は、散布図情報400を記憶装置303に出力し(ステップS1007)、散布図生成処理を終了する。
図34は、実施例1の分析部314が実行するカラムスコア算出処理の一例を説明するフローチャートである。
分析部314は、ターゲットカラムに対応する散布図情報400を取得し、ターゲットカラムに基づいてクラスタリングを実行する(ステップS1101)。なお、本発明はクラスタリングの手法に限定されない。例えば、k−meansを用いる。
次に、分析部314は、クラスタリングの結果を評価するクラスタリングスコアを算出する(ステップS1102)。
例えば、分析部314は、クラスタリングを複数回実行する場合、クラスタリングを実行するたびに、クラスタの分離度をスコアとして算出する。
次に、分析部314は、終了条件を満たすか否かを判定する(ステップS1103)。
例えば、分析部314は、クラスタリングの実行回数が閾値以上であるか否かを判定する。
終了条件を満たさないと判定された場合、分析部314はステップS1101に戻る。
終了条件を満たすと判定された場合、分析部314は、カラムスコアを算出する(ステップS1104)。
例えば、分析部314は、クラスタリングスコアの平均値をカラムスコアとして算出する。なお、クラスタリングを複数回実行しない場合、分析部314は、クラスタリングスコアをカラムスコアとして算出してもよい。
図35は、実施例1のユーザインタフェース316が表示するグラフ表示画面3500の一例を示す図である。
グラフ表示画面3500は、カラムのグラフに、カラムのインデックスに基づいて色分けされた散布図を表示する画面である。
可視化部315は、全射グラフ情報322及び散布図情報400に基づいて、グラフ表示画面3500を表示するためのグラフ表示情報402を生成する。
可視化部315は、分析者20の要求に応じて、カラムのグラフのみを表示してもよい。この場合、可視化部315は、全射グラフ情報322に基づいて図31A又は図31Bに示すカラムのグラフを表示するためのグラフ表示情報402を生成する。
分析者20は、図31A及び図31Bに示すカラムのグラフを参照することによって、分析データのフィールド間の関係性等、データ構造を把握できる。例えば、カラムAに対応するフィールドの値に対して、カラムB及びカラムDに対応するフィールドの値が一意に決まることを視覚的に理解できる。また、品名が同一であるが制御データ等が異なる等、新たな知見を視覚的に発見し、理解することができる。
また、分析者20は、図35に示すグラフを参照することによって、品質のバラツキの要因となるパラメータを視覚的に把握することができる。また、グラフ上の距離が近いパラメータを用いてデータの違い等を理解できる。
以上で説明した処理では、全単射のカラムペア及び全射のカラムペアを区別して処理しているが、全射のカラムペアのみを用いた処理でもよい。この場合、全単射判定処理は実行されない。また、グラフ生成処理では、あるカラムの親カラムが子カラムとして接続されるのを防止するために、全射グラフ生成部313は、ターゲットカラムがターゲットレコードの親カラムに一致し、かつ、ターゲットカラムのターゲットカラムに直接接続されるカラムがターゲットレコードの子カラムと異なる場合にのみステップS806の処理を実行する。
以上で説明したように、実施例1によれば、歩留まり分析を効率的に行い、かつ、精度を向上できる。また、分析者20が視覚的に分析データの特徴及び歩留まり分析において重要なパラメータを把握することができる。
実施例2では、全射カラムペア情報321の生成方法が一部異なる。以下、実施例1との差異を中心に実施例2について説明する。
カラムのカテゴリの数が多い場合、カラム間の対応が全射又は全単射となる可能性は低いため、カラムの接続が多段となるカラムのグラフが生成されない。したがって、分析者20に有用な情報を提示できない。
そこで、実施例2では、カラム間の対応が全射又は全単射となるようにデータの加工処理を実行する。
実施例2のシステム構成及び装置構成は実施例1と同一である。実施例2の情報のデータ構造は、実施例1と同一である。
実施例2のラベル生成部310が実行する処理は、実施例1の処理と同一である。実施例2では、カラム分析処理が一部異なる。具体的には、分析装置107は、ステップS202の処理の後にカテゴリ削除処理を実行する。図36は、実施例2の分析装置107が実行するカラム削除処理の一例を説明するフローチャートである。
全射グラフ生成部313は、カーディナリティ情報1500を参照して、ターゲットカラムを選択する(ステップS1201)。
次に、全射グラフ生成部313は、ターゲットカラムの閾値を算出する(ステップS1202)。
具体的には、全射グラフ生成部313は、カーディナリティ情報1500を参照して、ターゲットカラムの各カテゴリに属する値の出現確率を算出する。全射グラフ生成部313は、出現確率の中央値を用いてターゲットカラムの閾値を算出する。例えば、出現確率の中央値に0.1を乗算した値を閾値として算出する。前述した閾値は、出現確率が低い値が属するカテゴリをノイズとして除去するために使用される。
なお、前述した算出方法は一例であってこれに限定されない。例えば、出現頻度に基づいて閾値を算出してもよい。また、機械学習を実行して閾値を決定してもよい。
次に、全射グラフ生成部313は、ターゲットカラムのカテゴリの中からターゲットカテゴリを選択する(ステップS1203)。
次に、全射グラフ生成部313は、ターゲットカテゴリに属する値の出現確率が閾値より小さいか否かを判定する(ステップS1204)。
ターゲットカテゴリに属する値の出現確率が閾値以上であると判定された場合、全射グラフ生成部313はステップS1206に進む。
ターゲットカテゴリに属する値の出現確率が閾値より小さいと判定された場合、全射グラフ生成部313は、カーディナリティ情報1500からターゲットカテゴリを削除する。
ステップS1206では、全射グラフ生成部313は、ターゲットカラムの全てのカテゴリの処理が完了したか否かを判定する(ステップS1206)。
ターゲットカラムの全てのカテゴリの処理が完了していないと判定された場合、全射グラフ生成部313はステップS1203に戻る。
ターゲットカラムの全てのカテゴリの処理が完了したと判定された場合、全射グラフ生成部313は、全てのカラムの処理が完了したか否かを判定する(ステップS1207)。
全てのカラムの処理が完了していないと判定された場合、全射グラフ生成部313はステップS1201に戻る。
全てのカラムの処理が完了したと判定された場合、全射グラフ生成部313はカテゴリ削除処理を終了する。
ノイズとなるカテゴリを削除することによって、全射カラムペア又は全単射カラムペアとして検索されるカラムペアの数を増やすことができる。
実施例2では、カラム対応抽出処理が一部異なる。具体的には、ステップS402の処理の後に、全射グラフ生成部313は、カラムペアのカテゴリの数を削減する。親カラム及び子カラムのカテゴリの数が非常に多い場合、カラム間の対応が全射又は全単射となる可能性は低い。そこで、全射グラフ生成部313は、IRM(Infinite Relational Model)等を用いて各カラムのカテゴリのクラスタリングを実行し、カテゴリの数を削減する。IRMは公知の技術であるため詳細な説明は省略する。
実施例2によれば、全単射カラムペア及び全射カラムペアとなるカラムペアを増やすことができるため、カラムの接続が多段となるカラムのグラフを生成できる。これによって、分析者20に有用な情報を提示できる。
なお、本発明は上記した実施例に限定されるものではなく、様々な変形例が含まれる。また、例えば、上記した実施例は本発明を分かりやすく説明するために構成を詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、各実施例の構成の一部について、他の構成に追加、削除、置換することが可能である。
また、上記の各構成、機能、処理部、処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、本発明は、実施例の機能を実現するソフトウェアのプログラムコードによっても実現できる。この場合、プログラムコードを記録した記憶媒体をコンピュータに提供し、そのコンピュータが備えるプロセッサが記憶媒体に格納されたプログラムコードを読み出す。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施例の機能を実現することになり、そのプログラムコード自体、及びそれを記憶した記憶媒体は本発明を構成することになる。このようなプログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、CD−ROM、DVD−ROM、ハードディスク、SSD(Solid State Drive)、光ディスク、光磁気ディスク、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどが用いられる。
また、各実施例に記載の機能を実現するプログラムコードは、例えば、アセンブラ、C/C++、perl、Shell、PHP、Java(登録商標)等の広範囲のプログラム又はスクリプト言語で実装できる。
さらに、実施例の機能を実現するソフトウェアのプログラムコードを、ネットワークを介して配信することによって、それをコンピュータのハードディスクやメモリ等の記憶手段又はCD−RW、CD−R等の記憶媒体に格納し、コンピュータが備えるプロセッサが当該記憶手段や当該記憶媒体に格納されたプログラムコードを読み出して実行するようにしてもよい。
上述の実施例において、制御線や情報線は、説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。全ての構成が相互に接続されていてもよい。
10 計画者
20 分析者
100 計画装置
101 コントローラ
102 製造装置
103 品質管理装置
104 センサ
105 品質センサ
106 データ管理装置
107 分析装置
110 材料
111 製品
120、121 ネットワーク
201、301 CPU
202、302 メモリ
203、303 記憶装置
204、304 ネットワークインタフェース
305 入力装置
306 出力装置
210 制御データ管理情報
211 センサデータ管理情報
212 処理範囲データ管理情報
213 状態データ管理情報
214 品質データ管理情報
310 ラベル生成部
311 データ結合部
312 データ修正部
313 全射グラフ生成部
314 分析部
315 可視化部
316 ユーザインタフェース
320 分析データ管理情報
321 全射カラムペア情報
322 全射グラフ情報
400 散布図情報
401 分析結果
402 グラフ表示情報
500 出現頻度算出部
501 カラム対応抽出部
502 全単射判定部
503 全射判定部
504 グラフデータ生成部
505 ノイズ除去部
600 相関関係分析部
601 分類精度評価部
602 距離算出部
603 分析順序決定部
700 表示データ生成部
1500 カーディナリティ情報
1600 カラム対応情報
3500 グラフ表示画面

Claims (10)

  1. 製品を製造する複数の装置を有するシステムから取得された分析データを分析する計算機が実行する分析方法であって、
    前記計算機は、演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続されるネットワークインタフェースを備え、
    前記分析データは、前記製品の製造に関するパラメータを格納する複数のフィールド、及び前記製品の品質を示す評価値を格納する少なくとも一つのフィールドから構成され、
    前記分析方法は、
    前記計算機が、前記分析データの各フィールドの値の集合をカラムとして管理する第1のステップと、
    前記計算機が、第一ターゲットカラムに属する値から第二ターゲットカラムに属する値への対応を分析し、前記対応が全射となる前記第一ターゲットカラム及び前記第二ターゲットカラムの組合せである全射カラムペアを特定する第2のステップと、
    前記計算機が、前記全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを接続することによって、前記カラムの接続関係を示す木構造の第一グラフを管理するためのグラフ情報を生成する第3のステップと、
    前記計算機が、前記グラフ情報を用いて、前記評価値に影響を与える前記パラメータを特定するための歩留まり分析を実行する第4のステップと、を含み、
    前記第2のステップは、
    前記計算機が、前記カラムに属する値を分類することによって一つ以上のカテゴリを生成する第5のステップと、
    前記計算機が、前記第一ターゲットカラムの前記カテゴリに属する値から前記第二ターゲットカラムの前記カテゴリに属する値への対応を分析する第6のステップと、を含み、
    前記第3のステップは、
    前記計算機が、第一ターゲット全射カラムペアを選択するステップと、
    前記計算機が、前記第一ターゲット全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを生成するステップと、
    前記計算機が、前記第一グラフの葉ノードに対応する末端カラムを選択するステップと、
    前記計算機が、前記第一ターゲット全射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致するか否かを判定するステップと、
    前記計算機が、前記第一ターゲット全射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致する場合、前記末端カラムに対応する葉ノードに前記第一ターゲット全射カラムペアの前記第二ターゲットカラムを接続するステップと、を含むことを特徴とする分析方法。
  2. 請求項1に記載の分析方法であって、
    前記第2のステップは、
    前記計算機が、前記対応が全単射となる前記第一ターゲットカラム及び前記第二ターゲットカラムの組合せである全単射カラムペアを特定するステップと、
    前記計算機が、前記全単射カラムペアを除くカラムの組合せの中から前記全射カラムペアを特定するステップと、を含み、
    前記第3のステップは、
    前記計算機が、ターゲット全単射カラムペアを選択するステップと、
    前記計算機が、前記ターゲット全単射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを生成するステップと、
    前記計算機が、前記末端カラムを選択するステップと、
    前記計算機が、前記ターゲット全単射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致し、かつ、前記ターゲット全単射カラムペアの前記第二ターゲットカラムが前記末端カラムに対応するノードと接続するノードに対応するカラムと異なるか否かを判定するステップと、
    前記計算機が、前記ターゲット全単射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致し、かつ、前記ターゲット全単射カラムペアの前記第二ターゲットカラムが前記末端カラムに対応するノードと接続するノードに対応するカラムと異なる場合、前記末端カラムに対応する葉ノードに前記ターゲット全単射カラムペアの前記第二ターゲットカラムに対応するノードを接続するステップと、を含むことを特徴とする分析方法。
  3. 請求項1に記載の分析方法であって、
    前記第5のステップは、
    前記計算機が、前記カラムに属する値がアナログな値である場合、値の範囲を設定するステップと、
    前記計算機が、前記値の範囲に基づいて前記カテゴリを生成するステップと、を含むことを特徴とする分析方法。
  4. 請求項1に記載の分析方法であって、
    前記第6のステップは、前記計算機が、前記第一ターゲットカラムの前記カテゴリ及び前記第二ターゲットカラムの前記カテゴリの数を削減した後に、前記第一ターゲットカラムの前記カテゴリに属する値から前記第二ターゲットカラムの前記カテゴリに属する値への対応を分析するステップを含むことを特徴とする分析方法。
  5. 請求項1に記載の分析方法であって、
    前記第4のステップは、
    前記計算機が、前記評価値を軸とする特徴空間における前記分析データの位置を示す第二グラフのデータを生成するステップと、
    前記計算機が、前記各カラムに対して、特定のカラムに着目した前記特徴空間における前記分析データのクラスタリングを実行するステップと、
    前記計算機が、前記クラスタリングの結果に基づいて、前記クラスタリングを評価する第一スコアを算出するステップと、
    前記計算機が、第二ターゲット全射カラムペアを選択するステップと、
    前記計算機が、前記第二グラフにおける、前記第二ターゲット全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムの距離を算出するステップと、
    前記計算機が、前記距離、並びに、前記第二ターゲット全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムの各々の前記第一スコアに基づいて、前記歩留まり分析における前記全射カラムペアの分析順序を決定するための第二スコアを算出するステップと、
    前記計算機が、前記第二スコアに基づいて、前記歩留まり分析における前記全射カラムペアの分析順序を決定するステップと、を含むことを特徴とする分析方法。
  6. 製品を製造する複数の装置を有するシステムから取得された分析データを分析する計算機であって、
    前記分析データは、前記製品の製造に関するパラメータを格納する複数のフィールド、及び前記製品の品質を示す評価値を格納する少なくとも一つのフィールドから構成され、
    前記計算機は、
    演算装置、前記演算装置に接続される記憶装置、及び前記演算装置に接続されるネットワークインタフェースを備え、
    前記分析データの各フィールドの値の集合であるカラム間の対応を分析し、分析の結果に基づいて、前記対応によって関連するカラムを接続したグラフを生成するグラフ生成部と、前記グラフ及び前記分析データに基づいて、前記評価値に影響を与える前記パラメータを特定するための歩留まり分析を実行する分析部と、を有し、
    前記グラフ生成部は、
    前記カラムに属する値を分類することによって一つ以上のカテゴリを生成して、第一ターゲットカラムの前記カテゴリに属する値から第二ターゲットカラムの前記カテゴリに属する値への対応を分析して、前記対応が全射となる前記第一ターゲットカラム及び前記第二ターゲットカラムの組合せである全射カラムペアを特定し、
    前記全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを接続することによって、前記カラムの接続関係を示す木構造の第一グラフを管理するためのグラフ情報を生成し、
    前記分析部は、前記グラフ情報を用いて、前記歩留まり分析を実行し、
    前記グラフ情報を生成する処理において、前記グラフ生成部は、
    第一ターゲット全射カラムペアを選択し、
    前記第一ターゲット全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを生成し、
    前記第一グラフの葉ノードに対応する末端カラムを選択し、
    前記第一ターゲット全射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致するか否かを判定し、
    前記第一ターゲット全射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致する場合、前記末端カラムに対応する葉ノードに前記第一ターゲット全射カラムペアの前記第二ターゲットカラムに対応するノードを接続することを特徴とする計算機。
  7. 請求項6に記載の計算機であって、
    前記第一ターゲットカラムの前記カテゴリに属する値から前記第二ターゲットカラムの前記カテゴリに属する値への対応を分析する処理において、前記グラフ生成部は、前記対応が全単射となる前記第一ターゲットカラム及び前記第二ターゲットカラムの組合せである全単射カラムペアを特定し、前記全単射カラムペアを除くカラムの組合せの中から前記全射カラムペアを特定し、
    前記グラフ情報を生成する処理において、前記グラフ生成部は、
    ターゲット全単射カラムペアを選択し、
    前記ターゲット全単射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムをノードとするグラフを生成し、
    前記末端カラムを選択し、
    前記ターゲット全単射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致し、かつ、前記ターゲット全単射カラムペアの前記第二ターゲットカラムが前記末端カラムに対応するノードと接続するノードに対応するカラムと異なるか否かを判定し、
    前記ターゲット全単射カラムペアの前記第一ターゲットカラムが前記末端カラムと一致し、かつ、前記ターゲット全単射カラムペアの前記第二ターゲットカラムが前記末端カラムに対応するノードと接続するノードに対応するカラムと異なる場合、前記末端カラムに対応するノードに前記ターゲット全単射カラムペアの前記第二ターゲットカラムに対応するノードを接続することを特徴とする計算機。
  8. 請求項6に記載の計算機であって、
    前記グラフ生成部は、
    前記カテゴリの生成対象の前記カラムに属する値がアナログな値である場合、値の範囲を設定し、
    前記値の範囲に基づいて前記カテゴリを生成することを特徴とする計算機。
  9. 請求項6に記載の計算機であって、
    前記グラフ生成部は、
    前記第一ターゲットカラムの前記カテゴリ及び前記第二ターゲットカラムの前記カテゴリの数を削減し、
    前記第一ターゲットカラムの前記カテゴリに属する値から前記第二ターゲットカラムの前記カテゴリに属する値への対応を分析することを特徴とする計算機。
  10. 請求項6に記載の計算機であって、
    前記分析部は、
    前記評価値を軸とする特徴空間における前記分析データの位置を示す第二グラフのデータを生成し、
    前記各カラムに対して、特定のカラムに着目した前記特徴空間における前記分析データのクラスタリングを実行し、
    前記クラスタリングの結果に基づいて、前記クラスタリングを評価する第一スコアを算出し、
    第二ターゲット全射カラムペアを選択し、
    前記第二グラフにおける、前記第二ターゲット全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムの距離を算出し、
    前記距離、並びに、前記第二ターゲット全射カラムペアの前記第一ターゲットカラム及び前記第二ターゲットカラムの各々の前記第一スコアに基づいて、前記歩留まり分析における前記全射カラムペアの分析順序を決定するための第二スコアを算出し、
    前記第二スコアに基づいて、前記歩留まり分析における前記全射カラムペアの分析順序を決定することを特徴とする計算機。
JP2018144427A 2018-07-31 2018-07-31 分析方法及び計算機 Active JP6766103B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2018144427A JP6766103B2 (ja) 2018-07-31 2018-07-31 分析方法及び計算機
US16/356,697 US11126948B2 (en) 2018-07-31 2019-03-18 Analysis method and computer

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018144427A JP6766103B2 (ja) 2018-07-31 2018-07-31 分析方法及び計算機

Publications (2)

Publication Number Publication Date
JP2020021278A JP2020021278A (ja) 2020-02-06
JP6766103B2 true JP6766103B2 (ja) 2020-10-07

Family

ID=69228873

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018144427A Active JP6766103B2 (ja) 2018-07-31 2018-07-31 分析方法及び計算機

Country Status (2)

Country Link
US (1) US11126948B2 (ja)
JP (1) JP6766103B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112286920B (zh) * 2020-10-27 2023-02-21 浙江中控技术股份有限公司 一种设备运行状态监控方法、装置及设备

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0934721A (ja) * 1995-07-21 1997-02-07 Hitachi Ltd データ分析装置
JP3489279B2 (ja) * 1995-07-21 2004-01-19 株式会社日立製作所 データ分析装置
JP3739201B2 (ja) * 1998-03-06 2006-01-25 富士通株式会社 半導体チップの相関解析方法及び装置、半導体チップ歩留まり調整方法並びに記憶媒体
US6766283B1 (en) * 2000-10-13 2004-07-20 Insyst Ltd. System and method for monitoring process quality control
JP2005235041A (ja) * 2004-02-23 2005-09-02 Nippon Telegr & Teleph Corp <Ntt> 検索画像表示方法および検索画像表示プログラム
US7363195B2 (en) * 2004-07-07 2008-04-22 Sensarray Corporation Methods of configuring a sensor network
DE102006001257A1 (de) * 2005-12-30 2007-07-12 Advanced Micro Devices, Inc., Sunnyvale Automatisiertes Zustandabschätzungssystem für Cluster-Anlagen und Verfahren zum Betreiben des Systems
US7494893B1 (en) * 2007-01-17 2009-02-24 Pdf Solutions, Inc. Identifying yield-relevant process parameters in integrated circuit device fabrication processes
US8271103B2 (en) * 2007-05-02 2012-09-18 Mks Instruments, Inc. Automated model building and model updating
WO2012127572A1 (ja) * 2011-03-18 2012-09-27 富士通株式会社 秘匿データ処理方法、プログラム及び装置
US9396443B2 (en) * 2013-12-05 2016-07-19 Tokyo Electron Limited System and method for learning and/or optimizing manufacturing processes
US10698390B2 (en) * 2015-05-05 2020-06-30 The Lake Companies, Inc. System and method for monitoring and controlling a manufacturing environment
EP3594749A1 (en) * 2018-07-10 2020-01-15 ASML Netherlands B.V. Method to label substrates based on process parameters

Also Published As

Publication number Publication date
US20200042926A1 (en) 2020-02-06
JP2020021278A (ja) 2020-02-06
US11126948B2 (en) 2021-09-21

Similar Documents

Publication Publication Date Title
JP6243080B1 (ja) プリプロセッサおよび異常予兆診断システム
US10366371B2 (en) Method and apparatus for processing service requests
JP6850806B2 (ja) 電子データ構造から属性を抽出するための注釈システム
WO2018052015A1 (ja) システムの分析支援装置、システムの分析支援方法及びプログラム
JP2017091178A (ja) イベント解析装置、イベント解析システム、イベント解析方法、およびイベント解析プログラム
KR20070117472A (ko) 정보처리장치 및 정보처리방법과 컴퓨터 프로그램
JP6691082B2 (ja) 指標選択装置及びその方法
JP7145059B2 (ja) モデルの予測根拠提示システム及びモデルの予測根拠提示方法
JP5588811B2 (ja) データ分析支援システム及び方法
CN108885628A (zh) 数据分析方法候选决定装置
Gitzel Data Quality in Time Series Data: An Experience Report.
Goossens et al. Effective steering of customer journey via order-aware recommendation
KR20210157303A (ko) 이종 언어로 구현된 워크플로우 기반의 자동 예측 모델링 방법 및 그를 위한 장치
JP2020135171A (ja) 機械学習プログラム検証装置および機械学習プログラム検証方法
JP6766103B2 (ja) 分析方法及び計算機
CN110544052A (zh) 关系网络图的展示方法及装置
WO2020223184A1 (en) Analytical model training method for customer experience estimation
JP2006277282A (ja) モデル評価解析システムおよびモデル評価解析プログラム
JP7292235B2 (ja) 分析支援装置及び分析支援方法
JP6775740B1 (ja) 設計支援装置、設計支援方法及び設計支援プログラム
JP4308113B2 (ja) データ分析装置及びその方法、プログラム
JP2019003333A (ja) バグ混入確率計算プログラム及びバグ混入確率計算方法
JP2016157173A (ja) 抽出方法、情報処理装置、及び抽出プログラム
JPWO2020183538A1 (ja) 計算機システム及びデータレイクに格納されるデータを用いた処理方法
Telli et al. Detecting Novel Behavior and Process Enhancement with Multimodal Process Mining

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190422

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200625

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200707

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200908

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200916

R150 Certificate of patent or registration of utility model

Ref document number: 6766103

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150