JP7230654B2 - Data analysis method, data analysis apparatus, and computer program - Google Patents
Data analysis method, data analysis apparatus, and computer program Download PDFInfo
- Publication number
- JP7230654B2 JP7230654B2 JP2019074580A JP2019074580A JP7230654B2 JP 7230654 B2 JP7230654 B2 JP 7230654B2 JP 2019074580 A JP2019074580 A JP 2019074580A JP 2019074580 A JP2019074580 A JP 2019074580A JP 7230654 B2 JP7230654 B2 JP 7230654B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- raw material
- correlation coefficient
- dependent
- data set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Description
本発明は、データ分析方法、データ分析装置、およびコンピュータプログラムに関する。 The present invention relates to a data analysis method, a data analysis device, and a computer program.
製品の元となる原料では、各原料の特性(例えば、粒度など)にばらつきがある。従来、このようなばらつきを含むデータを分析する方法が知られている(例えば、特許文献1参照)。特許文献1に記載された技術は、露光装置が所定の制御処理を行った場合に記録されるログデータを、グラフィカルラッソ(Graphical Lasso)を用いて評価している。非特許文献1には、データにおける各特性の関連度についての評価方法が記載されている。
Raw materials that form the basis of products have variations in the properties of each raw material (for example, particle size). Conventionally, a method of analyzing data containing such variations is known (see
製造工程において収集された種々のデータの関連性は、製造ラインに依存していることがある。このため、製造工程において収集された種々のデータの分析は、製造ライン毎にデータを分割して実施される(以降「層別」とも呼ぶ)。しかしながら、製造ラインには依存しない原料ロットのデータ等は、層別されることにより標本数が減少する。このように、少ない標本数のデータから評価された関連度は、真の値から大きく乖離する可能性があるという問題があった。また、関連度として相関係数を用いた場合、偶然に高い相関係数が得られる場合もあり、このような場合にガウス型グラフィカルモデルを適用すると、分散共分散行列や相関係数行列の正定値性が満足できなくなり、関連度の評価ができないという問題があった。 The relevance of various data collected in the manufacturing process may depend on the manufacturing line. For this reason, analysis of various data collected in the manufacturing process is performed by dividing the data for each manufacturing line (hereinafter also referred to as "stratification"). However, the number of specimens for raw material lot data that does not depend on production lines is reduced by stratification. Thus, there is a problem that the degree of association evaluated from data of a small number of samples may deviate greatly from the true value. In addition, when the correlation coefficient is used as the degree of association, there are cases where a high correlation coefficient is obtained by chance. There is a problem that the value becomes unsatisfactory and the degree of relevance cannot be evaluated.
本発明は、上述した課題の少なくとも一部を解決するためになされたものであり、同じ原料ロットから異なる製造ラインによって製造された製品間における特性の関連度を正しく評価することを目的とする。 The present invention has been made to solve at least part of the above-described problems, and an object thereof is to correctly evaluate the degree of property relevance between products manufactured from the same raw material lot on different production lines.
本発明は、上述の課題を少なくとも一部を解決するためになされたものであり、以下の形態として実現することが可能である。データ分析方法であって、製造工程において収集されたデータであって、前記製造工程中の分析対象とする特定のプロセスに依存しない非依存データと、前記特定のプロセスに依存する依存データと、を含むデータセットを取得する取得工程と、前記非依存データの全てと、前記特定のプロセスに対応した前記依存データと、を用いて、前記データセットの関連性を評価する評価工程と、を備え、前記関連性の評価は、前記特定のプロセス毎に前記データセットを分割した状態で求められた分散共分散行列又は相関係数行列の内の前記非依存データに対応する要素に、前記特定のプロセス毎に前記データセットを分割しない状態で求められた分散共分散行列又は相関係数行列を用いた行列をガウス型グラフィカルモデルに入力することで実施する、データ分析方法。そのほか、本発明は、以下の形態としても実現可能である。 The present invention has been made to solve at least part of the above problems, and can be implemented as the following modes. A data analysis method, which is data collected in a manufacturing process and includes independent data that does not depend on a specific process to be analyzed during the manufacturing process and dependent data that depends on the specific process. and an evaluation step of evaluating the relevance of the data set using all of the independent data and the dependent data corresponding to the specific process, The evaluation of the relevance is performed on the element corresponding to the independent data in the variance-covariance matrix or the correlation coefficient matrix obtained with the data set divided for each of the specific processes. A data analysis method by inputting a matrix using a variance-covariance matrix or a correlation coefficient matrix obtained without dividing the data set into a Gaussian graphical model. In addition, the present invention can also be implemented as the following modes.
(1)本発明の一形態によれば、データ分析方法が提供される。このデータ分析方法は、製造工程において収集されたデータであって、前記製造工程中の分析対象とする特定のプロセスに依存しない非依存データと、前記特定のプロセスに依存する依存データと、を含むデータセットを取得する工程と、前記非依存データの全てと、前記特定のプロセスに対応した前記依存データと、を用いて、前記データセットの関連性を評価する工程と、を備える。 (1) According to one aspect of the present invention, a data analysis method is provided. This data analysis method includes data collected in a manufacturing process, independent data that does not depend on a specific process to be analyzed during the manufacturing process, and dependent data that depends on the specific process. obtaining a data set; and using all of the non-dependent data and the dependent data corresponding to the particular process to assess the relevance of the data set.
この構成によれば、データセットの関連性の評価に、特定のプロセスに依存しない非依存データの全てと、特定のプロセスに対応した依存データ(すなわち、特定のプロセス毎に分割されたデータのうち、特定のプロセスに対応したデータ)とを用いる。このため、データセットの全てを特定のプロセス毎に分割した場合と比較して、非依存データの標本数の減少を抑制することができると共に、標本数の減少により生じていた問題(関連度が真の値から乖離する、ガウス型グラフィカルモデルを適用した際に分散共分散行列や相関係数行列の正定値性が満足できなくなる)の発生を抑制し、関連度の評価を正しく行うことができる。 According to this configuration, all non-dependent data that does not depend on a specific process and dependent data that corresponds to a specific process (that is, out of the data divided for each specific process, , data corresponding to a specific process). For this reason, compared to the case where the entire data set is divided for each specific process, it is possible to suppress the decrease in the number of samples of independent data, and the problem caused by the decrease in the number of samples (the degree of relevance is low). It is possible to suppress the occurrence of divergence from the true value, and the positive definiteness of the variance-covariance matrix and correlation coefficient matrix cannot be satisfied when applying the Gaussian graphical model), and to correctly evaluate the degree of association. .
(2)上記形態のデータ分析方法において、前記特定のプロセスは、前記製造工程を実現する製造ラインであってもよい。
この構成によれば、特定のプロセスが製造ラインであるため、製造ラインでの加工前の非依存データと、加工後の依存データとを含むデータセットの関連性を評価できる。
(2) In the data analysis method of the above aspect, the specific process may be a manufacturing line that implements the manufacturing process.
According to this configuration, since the specific process is the manufacturing line, it is possible to evaluate the relevance of the data set including the independent data before processing on the manufacturing line and the dependent data after processing.
(3)上記形態のデータ分析方法において、前記非依存データは、前記製造工程において使用される各原料における各種特性を表すデータであり、前記依存データは、前記製造工程中の各工程において取得された加工品の各種特性と、各原料を加工するための加工条件と、の少なくとも1つを表すデータであってもよい。
この構成によれば、非依存データとしての原料の各種特性間の関連性を評価でき、依存データとしての加工品の各種特性間と、製造工程での加工条件間との少なくとも1つの関連性を評価できる。
(3) In the data analysis method of the above aspect, the non-dependent data is data representing various characteristics of each raw material used in the manufacturing process, and the dependent data is acquired in each step in the manufacturing process. The data may represent at least one of various characteristics of the processed product and processing conditions for processing each raw material.
According to this configuration, it is possible to evaluate the relationship between various characteristics of the raw material as independent data, and at least one relationship between the various characteristics of the processed product as dependent data and the processing conditions in the manufacturing process. can be evaluated.
(4)上記形態のデータ分析方法において、前記関連性の評価は、前記特定のプロセス毎に前記データセットを分割した状態で求められた分散共分散行列又は相関係数行列の内の前記非依存データに対応する要素に、前記特定のプロセス毎に前記データセットを分割しない状態で求められた分散共分散行列又は相関係数行列を用いた行列をガウス型グラフィカルモデルに入力することで実施してもよい。
この構成によれば、データセットの関連性の評価に分散共分散行列または相関係数行列が用いられる。分割された依存データのデータセットの分散共分散行列または相関係数行列の内、非依存データに対応する要素が非依存データセットの分散共分散行列または相関係数行列に置換される。これにより、非依存データの変数間の偶然に高い相関係数に起因するガウス型グラフィカルモデルにおけるエラーを生じずに関連性の計算を実行でき、変数間のネットワークとしての関連性を評価できる。
(4) In the data analysis method of the above form, the evaluation of the relevance is the non-dependence of the variance-covariance matrix or the correlation coefficient matrix obtained with the data set divided for each of the specific processes By inputting a matrix using a variance-covariance matrix or a correlation coefficient matrix obtained without dividing the data set for each specific process into the Gaussian graphical model as an element corresponding to the data good too.
According to this configuration, a variance-covariance matrix or a correlation coefficient matrix is used to evaluate the relevance of data sets. Among the variance-covariance matrix or correlation coefficient matrix of the data set of the divided dependent data, the elements corresponding to the independent data are replaced with the variance-covariance matrix or correlation coefficient matrix of the independent data set. This allows the computation of associations to be performed without the errors in Gaussian graphical models caused by chance high correlation coefficients between variables in the independent data, and the association as a network between variables to be evaluated.
なお、本発明は、種々の態様で実現することが可能であり、例えば、データ分析装置、データ分析システム、データ分析方法、データ分析装置の制御方法、これら装置や方法を実行するためのコンピュータプログラム、このコンピュータプログラムを配布するためのサーバ装置、コンピュータプログラムを記憶した一時的でない記憶媒体等の形態で実現することができる。 It should be noted that the present invention can be implemented in various aspects, such as a data analysis device, a data analysis system, a data analysis method, a control method for a data analysis device, and a computer program for executing these devices and methods. , a server device for distributing the computer program, a non-temporary storage medium storing the computer program, or the like.
<第1実施形態>
図1は、本発明の一実施形態としてのデータ分析装置10のブロック図である。データ分析装置10は、図1に示されるように、原料粉A,Bが製造ラインL1,L2のそれぞれで加工されて製品に製造されるまでの工程において、原料粉A,Bの各種特性を表す原料データDTSと、製品の各種特性を表す製品データDTL1,DTL2を取得する。データ分析装置10は、取得した各データにおける各種特性間の関連性を評価する。
<First Embodiment>
FIG. 1 is a block diagram of a
データ分析装置10は、CPU(Central Processing Unit)1と、ROM(Read Only Memory)2と、RAM(Random Access Memory)3と、記憶部9とを備えている。CPU1は、ROM2に格納されているコンピュータプログラムをRAM3に展開して実行することにより、取得部4および評価部5として機能する。記憶部9は、原料データDTSおよび製品データDTL1,DTL2などの各種データを記憶する。記憶部9は、ハードディスクドライブ(HDD:Hard Disk Drive)などで構成されている。
The
本実施形態の製造工程では、図1に示されるように、2種類の原料粉A,Bにバインダが加えられた原料が製造ラインL1と製造ラインL2とに分割される。製造ラインL1,L2のそれぞれでは、原料は、撹拌された後、ギヤの形に圧縮成形され、所定温度および所定時間の間焼結され、製品として出荷される。取得部4は、製造工程において収集される原料データDTSおよび製品データDTL1,DTL2を取得する。原料データDTSは、バインダが加えられる前の、本実施形態の分析対象である製造ラインL1,L2に依存しない非依存データである。一方で、製品データDTL1,DTL2は、製造ラインL1,L2に依存する依存データである。なお、原料データDTSおよび製品データDTL1,DTL2の取得方法としては、図示されていないキーボードやマウスといった入力部を介して入力されてもよいし、有線通信または無線通信によりデータが取得されてもよい。以下では、収集されたデータの関連性を、製造ラインL1,L2ごとに評価する場合について例示する。このため、製造ラインL1,L2が、特定のプロセスに相当する。
In the manufacturing process of the present embodiment, as shown in FIG. 1, raw materials obtained by adding a binder to two types of raw material powders A and B are divided into a manufacturing line L1 and a manufacturing line L2. In each of the production lines L1 and L2, the raw material is agitated, compression-molded into a gear shape, sintered at a predetermined temperature for a predetermined time, and shipped as a product. The
図2は、原料データDTSおよび製品データDTL1,DTL2を含むデータセットDSの一例である。図2には、6つの製品IDに対応付けられた各種特性が表として示されている。例えば、製品ID1では、原料ロットIDがa、原料粉Aの純度が6.2、原料粉Aの水分率が1.1、製造されるラインが製造ラインL1、撹拌時の撹拌羽の回転数が3.2、圧縮前の重量が5.3、製品の硬さが10.5である。なお、これらの特性を表す数値は、正規化された基準値に対する数値を表すものであるため、単位が存在していない。他の実施形態では、正規化されていない測定値そのものをデータとしてもよい。
FIG. 2 is an example of a data set DS including raw material data DTS and product data DTL1 and DTL2. FIG. 2 shows a table of various characteristics associated with six product IDs. For example, for
図2に示されるように、製品ID1~3は、製造ラインL1により製造され、製品ID4~6は、製造ラインL2により製造されている。図2に示される原料粉Aの純度および原料粉Aの水分率は、製造ラインL1,L2に依存しない非依存データである。一方で、撹拌羽の回転数、圧縮前の重量、および硬さは、製造ラインL1,L2に依存する依存データである。依存データとしての製品データDTL1,DTL2のそれぞれは、製造工程中の各工程においた各種特性と、各原料を加工するための加工条件とを表すデータである。なお、本実施形態における他の非依存データとしては、原料粉A,Bの粒度などが挙げられる。また、本実施形態における他の依存データとしては、加工条件としての撹拌羽のトルク、圧縮荷重、焼結温度、および焼結時間と、加工された製品の特性としての圧縮後の重量および焼結後の重量などとが挙げられる。 As shown in FIG. 2, product IDs 1-3 are manufactured by manufacturing line L1, and product IDs 4-6 are manufactured by manufacturing line L2. The purity of the raw material powder A and the moisture content of the raw material powder A shown in FIG. 2 are independent data that do not depend on the production lines L1 and L2. On the other hand, the number of revolutions of the stirring blades, the weight before compression, and the hardness are dependent data depending on the production lines L1 and L2. Each of the product data DTL1 and DTL2 as dependent data is data representing various characteristics in each step in the manufacturing process and processing conditions for processing each raw material. Other non-dependent data in the present embodiment include particle sizes of the raw material powders A and B, and the like. In addition, other dependent data in this embodiment include the torque of the stirring blade, compression load, sintering temperature, and sintering time as processing conditions, and the weight after compression and sintering as characteristics of the processed product. After the weight and the like.
評価部5は、原料データDTSの全てと、製品データDTL1,DTL2とを用いて、図2に示されるデータセットDSにおける各種特性の関連性を評価する。評価部5は、製造ラインL1,L2に依存しない原料データDTSの全てを用いて、原料粉A,Bのそれぞれにおける各種特性間の関連性を評価する。本実施形態の評価部5は、図2に示される原料データDTSを用いて、相関係数行列を算出する。
The
図3は、原料データDTSから算出された相関係数行列の一例である。図3に示される原料粉Aの純度と、原料粉Aの水分率との相関係数は、0.7である。この相関係数行列は、図2における原料ロットIDa~IDfの6つの原料ロットから導かれている。次に、評価部5は、図2のデータセットDSを、製造ラインL1と、製造ラインL2とに分割する。
FIG. 3 is an example of a correlation coefficient matrix calculated from raw material data DTS. The correlation coefficient between the purity of raw material powder A and the moisture content of raw material powder A shown in FIG. 3 is 0.7. This correlation coefficient matrix is derived from the six raw material lots IDa to IDf in FIG. Next, the
図4は、製造ラインL1に対応するデータセットDS1である。図5は、製造ラインL2に対応するデータセットDS2である。図4に示されるデータセットDS1は、製造ラインL1で加工される原料ロットIDa~IDcの3つの原料データDTS1と、製品データDTL1とから構成されている。図5に示されるデータセットDS2は、製造ラインL2で加工される原料ロットIDd~IDfの3つの原料データDTS2と、製品データDTL2とから構成されている。 FIG. 4 is a data set DS1 corresponding to the production line L1. FIG. 5 is the data set DS2 corresponding to the production line L2. The data set DS1 shown in FIG. 4 is composed of raw material data DTS1 of three raw material lots IDa to IDc processed on the production line L1, and product data DTL1. The data set DS2 shown in FIG. 5 is composed of raw material data DTS2 of three raw material lots IDd to IDf processed on the production line L2, and product data DTL2.
評価部5は、図4および図5に示される分割されたデータセットDS1,DS2のそれぞれに対して、相関係数行列を算出する。図6は、製造ラインL1に対応するデータセットDS1から算出された相関係数行列の一部である。図6に示される相関係数行列は、製品ID1~3における各種特性に基づいて算出されている。そのため、図6中の太線で囲まれている範囲RG1の数値は、原料ロットIDa~IDcの3つの原料ロットにおける各種特性から算出されている。範囲RG1の数値は、製造ラインL1に依存しない非依存データから算出されている。
The
図7は、図6に示される相関係数行列の一部を置換した相関係数行列である。評価部5は、図6に示される相関係数行列を算出すると、非依存データに対応する範囲RG1の数値を、原料データDTSから算出した相関係数行列(図3)に置換する。そのため、図7中の太線で囲まれている範囲RG1の数値は、原料ロットIDa~IDfの6つ全ての原料ロットにおける各種特性から算出されている。評価部5は、図7に示される範囲RG1置換後の相関係数行列を入力として、ガウス型グラフィカルモデルを用いて、各種特性間の関連度を評価する。
FIG. 7 is a correlation coefficient matrix in which a part of the correlation coefficient matrix shown in FIG. 6 is replaced. After calculating the correlation coefficient matrix shown in FIG. 6, the
図8は、本実施形態におけるデータ分析方法のフローチャートである。データ分析方法では、初めに、取得部4は、原料データDTSおよび製品データDTL1,DTL2を含むデータセットDSを取得する(ステップS1)。評価部5は、製造ラインL1,L2に依存しない原料データDTSから、図3に示される相関係数行列を算出する(ステップS2)。評価部5は、図2のデータセットDSを、製造ラインL1のデータセットDS1と、製造ラインL2のデータセットDS2とに分割する(ステップS3)。評価部5は、製造ラインL1と製造ラインL2とのそれぞれのデータセットDS1,DS2から、相関係数行列を算出する(ステップS4)。評価部5は、製造ラインL1,L2のデータセットDS1,DS2のそれぞれに対応する相関係数行列の内の非依存データに対応する範囲RG1(図6)に、製造ラインL1,L2毎にデータセットDS1,DS2を分割してしない状態で求められた相関係数行列(図3)を置換する(ステップS5)。評価部5は、置換後の相関係数行列(図7)をガウス型グラフィカルモデルに入力することにより、各種特性間の関連性を評価し(ステップS6)、データ分析方法を終了する。なお、ステップS1は、取得工程に相当し、ステップS2~S6は、評価工程に相当する。
FIG. 8 is a flow chart of the data analysis method in this embodiment. In the data analysis method, first, the
以上説明したように、本実施形態のデータ分析装置10では、取得部4は、製造工程において収集される原料データDTSおよび製品データDTL1,DTL2を取得する。評価部5は、製造ラインL1,L2毎に分割される前の原料データDTSの全てと、製造ラインL1,L2毎の製品データDTL1,DTL2とを用いて、データセットDSの関連性を評価する。すなわち、関連性の評価に用いられる非依存データとして、製造ラインL1,L2毎に分割された原料データDTS1,DTS2の代わりに、製造ラインL1,L2に依存しない全ての原料データDTSが用いられる。このため、データセットDSの全てを製造ラインL1,L2ごとにデータセットDS1,DS2に分割した場合と比較して、非依存データである原料データDTSの標本数の減少を抑制できる。これにより、関連性が真の値から乖離するなどの標本数の減少によって生じていた問題の発生を抑制し、関連性の評価を正しく行うことができる。
As described above, in the
また、本実施形態のデータ分析装置10では、製造ラインL1,L2を基準として、非依存データである原料データDTSと、依存データである製品データDTL1,DTL2とが分けられている。そのため、製造ラインでの加工前後の非依存データおよび依存データを含むデータセットDSの関連性を評価できる。
In addition, in the
また、本実施形態のデータ分析装置10では、非依存データである原料データDTSは、原料の特性を表すデータである。また、依存データである製品データDTL1,DTL2は、製造ラインL1,L2における加工条件を表すデータと、製造ラインL1,L2の加工後の製品の特性を表すデータとを含んでいる。そのため、本実施形態のデータ分析装置10は、原料の各種特性間の関連性を評価でき、加工品の各種特性間の関連性と、製造ラインL1,L2での加工条件間の関連性とを評価できる。
In addition, in the
また、本実施形態のデータ分析装置10では、データセットDSの関連性の評価に相関係数行列が用いられる。評価部5は、分割されたデータセットDS1,DS2の内、非依存データに対応する範囲RG1の数値を、非依存データの原料データDTSから算出される相関係数行列に置換する。これにより、非依存データの変数間の偶然に高い相関係数に起因するガウス型グラフィカルモデルにおけるエラーを生じずに関連性の計算を実行できる。また、ガウス型グラフィカルモデルを適用した際に相関係数行列の正定値性が満足できなくなることの発生を抑制できる。よって、本実施形態のデータ分析装置10は、変数間のネットワークとしての関連性を評価できる。
Further, in the
<第2実施形態>
図9は、第2実施形態におけるデータ分析方法のフローチャートである。第2実施形態のデータ分析方法を実施するデータ分析装置は、第1実施形態のデータ分析装置10と同じである。第1実施形態のデータ分析方法の評価は、相関係数行列を用いたガウス型グラフィカルモデルによる評価とは異なる。第2実施形態では、第1実施形態と異なるデータ分析方法について説明し、第1実施形態と同じ構成などについての説明を省略する。
<Second embodiment>
FIG. 9 is a flow chart of a data analysis method in the second embodiment. A data analysis device that implements the data analysis method of the second embodiment is the same as the
図9に示されるように、第2実施形態のデータ分析方法では、初めに、取得部4が、原料データDTSおよび製品データDTL1,DTL2を含むデータセットDS(図2)を取得する(ステップS11)。評価部5は、製造ラインL1,L2に依存しない原料データDTSから、相関係数を算出する(ステップS12)。評価部5は、データセットDSを、製造ラインL1のデータセットDS1と、製造ラインL2のデータセットDS2とに分割する(ステップS13)。評価部5は、製造ラインL1と製造ラインL2とのそれぞれのデータセットDS1,DS2から、製品データDTL1,DTL2における各種特性間の相関係数および製品データDTL1,DTL2における各種特性間と、原料データにおける各種特性間との相関係数を算出する(ステップS14)。
As shown in FIG. 9, in the data analysis method of the second embodiment, first, the
第2実施形態のデータ分析方法では、評価部5は、原料データDTSおよび製品データDTL1,DTL2を用いて、製品データDTL1,DTL2のそれぞれのデータセットDS1,DS2の関連性を評価する。そのため、第1実施形態と同じように、第2実施形態のデータ分析装置10は、製造ラインL1,L2毎に分割されたデータセットDS1,DS2のそれぞれにおいて、原料データDTS間における各種特性の関連性をより正確に評価できる。
In the data analysis method of the second embodiment, the
<本実施形態の変形例>
本発明は上記の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の態様において実施することが可能であり、例えば次のような変形も可能である。
<Modification of this embodiment>
The present invention is not limited to the above-described embodiments, and can be implemented in various aspects without departing from the scope of the invention. For example, the following modifications are possible.
第1実施形態および第2実施形態では、データ分析方法を実施するデータ分析装置10を一例として説明したが、データ分析装置10については種々変形可能である。例えば、データ分析装置10は、音声入力を受け付けるマイク、関連性の評価結果を画像として表示するモニタ、関連性の評価結果をログとして出力する出力装置、および評価結果を音声出力するスピーカなどを備えていてもよい。
In the first and second embodiments, the
上記第1実施形態では、関連性の評価として、ガウス型グラフィカルモデルへの相関係数行列の入力が用いられたが、ガウス型グラフィカルモデルへの分散共分散行列の入力が用いられてもよい。この場合に、原料データDTSにおける各種特性間の関連性も、分散共分散行列によって表現される。また、評価部5は、必ずしもガウス型グラフィカルモデルに算出した相関係数行列を入力する必要はなく、相関係数行列を算出してデータ分析方法(図8)を終了してもよい。
In the above-described first embodiment, the correlation coefficient matrix input to the Gaussian graphical model is used to evaluate the relevance, but the variance-covariance matrix input to the Gaussian graphical model may be used. In this case, the relationship between various characteristics in the raw material data DTS is also represented by the variance-covariance matrix. Moreover, the
上記第1実施形態では、製造ラインL1,L2に依存しない原料データDTSと、製造ラインL1,L2に依存する製品データDTL1,DTL2とを含むデータセットDSの関連性が評価されたが、それ以外の組み合わせのデータセットの関連性が評価されてもよい。例えば、異なる材料メーカから納品された複数の異なる原料データを、製造ラインL1で加工する場合、複数の原料データのそれぞれが製造ラインL1に依存しない非依存データである。この場合に、例えば、評価部5は、原料ロットのそれぞれに対応する複数の非依存データにおける関連性を表す相関係数行列を算出してもよい。
In the first embodiment, the relationship between the data set DS including the raw material data DTS independent of the production lines L1 and L2 and the product data DTL1 and DTL2 dependent on the production lines L1 and L2 was evaluated. may be evaluated for relevance of the combined datasets. For example, when a plurality of different raw material data delivered from different material manufacturers are processed on the production line L1, each of the plurality of raw material data is non-dependent data that does not depend on the production line L1. In this case, for example, the
非依存データと依存データとを分ける特定のプロセスは、製造工程を実現する製造ラインL1,L2以外のプロセスであってもよい。例えば、製造ラインL1,L2中の撹拌および焼結の各工程に分割されたプロセスであってもよい。例えば、収集されたデータの関連性を、原料ロットごとに評価してもよい。この場合、原料ロットIDが相違する場合に、特定のプロセスが相違するとみなして処理を行う。 A specific process that separates the independent data and the dependent data may be a process other than the manufacturing lines L1 and L2 that implement the manufacturing process. For example, the process may be divided into steps of stirring and sintering in production lines L1 and L2. For example, the relevance of collected data may be evaluated for each raw material lot. In this case, if the raw material lot IDs are different, the processing is performed assuming that the specific processes are different.
依存データおよび非依存データは、各種特性を表すデータ以外でもよい。例えば、原料データDTSとして、原料の仕入れ先、仕入れ価格、および仕入れ時期などであってもよい。また、製品データDTL1,DTL2として、測定値、評価値、測定値と評価値との差違を表す指標、および販売価格などであってもよい。 Dependent data and non-dependent data may be data other than data representing various characteristics. For example, raw material data DTS may include the supplier of the raw material, the purchase price, and the purchase timing. Further, the product data DTL1 and DTL2 may be a measured value, an evaluation value, an index representing the difference between the measured value and the evaluation value, a sales price, and the like.
以上、実施形態、変形例に基づき本態様について説明してきたが、上記した態様の実施の形態は、本態様の理解を容易にするためのものであり、本態様を限定するものではない。本態様は、その趣旨並びに特許請求の範囲を逸脱することなく、変更、改良され得ると共に、本態様にはその等価物が含まれる。また、その技術的特徴が本明細書中に必須なものとして説明されていなければ、適宜、削除することができる。 The present aspect has been described above based on the embodiments and modifications, but the above-described embodiments are intended to facilitate understanding of the present aspect, and do not limit the present aspect. This aspect may be modified and modified without departing from the spirit and scope of the claims, and this aspect includes equivalents thereof. Also, if the technical features are not described as essential in this specification, they can be deleted as appropriate.
1…CPU
2…ROM
3…RAM
4…取得部
5…評価部
9…記憶部
10…データ分析装置
A,B…原料粉
DS,DS1,DS2…データセット
DTL1,DTL2…製品データ
DTS,DTS1,DTS2…原料データ
IDa~IDf…原料ロット
ID1~ID6…製品
L1,L2…製造ライン
RG1…範囲
1 CPU
2 ROM
3 RAM
4...
Claims (5)
製造工程において収集されたデータであって、前記製造工程中の分析対象とする特定のプロセスに依存しない非依存データと、前記特定のプロセスに依存する依存データと、を含むデータセットを取得する取得工程と、
前記非依存データの全てと、前記特定のプロセスに対応した前記依存データと、を用いて、前記データセットの関連性を評価する評価工程と、
を備え、
前記関連性の評価は、前記特定のプロセス毎に前記データセットを分割した状態で求められた分散共分散行列又は相関係数行列の内の前記非依存データに対応する要素に、前記特定のプロセス毎に前記データセットを分割しない状態で求められた分散共分散行列又は相関係数行列を用いた行列をガウス型グラフィカルモデルに入力することで実施する、データ分析方法。 A data analysis method comprising:
Acquisition for acquiring a data set that is data collected in a manufacturing process and that includes independent data that does not depend on a specific process to be analyzed during the manufacturing process and dependent data that depends on the specific process process and
an evaluation step of evaluating relevance of the data set using all of the non-dependent data and the dependent data corresponding to the specific process;
with
The evaluation of the relevance is performed on the element corresponding to the independent data in the variance-covariance matrix or the correlation coefficient matrix obtained with the data set divided for each of the specific processes. A data analysis method by inputting a matrix using a variance-covariance matrix or a correlation coefficient matrix obtained without dividing the data set into a Gaussian graphical model.
前記特定のプロセスは、前記製造工程を実現する製造ラインである、データ分析方法。 The data analysis method according to claim 1,
The data analysis method, wherein the specific process is a manufacturing line that implements the manufacturing process.
前記非依存データは、前記製造工程において使用される各原料における各種特性を表すデータであり、
前記依存データは、前記製造工程中の各工程において取得された加工品の各種特性と、各原料を加工するための加工条件と、の少なくとも1つを表すデータである、データ分析方法。 The data analysis method according to claim 2,
The independent data is data representing various characteristics of each raw material used in the manufacturing process,
The data analysis method, wherein the dependent data is data representing at least one of various characteristics of the processed product obtained in each step of the manufacturing process and processing conditions for processing each raw material.
製造工程において収集されたデータであって、前記製造工程中の分析対象とする特定のプロセスに依存しない非依存データと、前記特定のプロセスに依存する依存データと、を含むデータセットを取得する取得部と、
前記非依存データの全てと、前記特定のプロセスに対応した前記依存データと、を用いて、前記データセットの関連性を評価する評価部と、
を備え、
前記関連性の評価は、前記特定のプロセス毎に前記データセットを分割した状態で求められた分散共分散行列又は相関係数行列の内の前記非依存データに対応する要素に、前記特定のプロセス毎に前記データセットを分割しない状態で求められた分散共分散行列又は相関係数行列を用いた行列をガウス型グラフィカルモデルに入力することで実施する、データ分析装置。 A data analysis device,
Acquisition for acquiring a data set that is data collected in a manufacturing process and that includes independent data that does not depend on a specific process to be analyzed during the manufacturing process and dependent data that depends on the specific process Department and
an evaluation unit that evaluates the relevance of the data set using all of the non-dependent data and the dependent data corresponding to the specific process;
with
The evaluation of the relevance is performed on the element corresponding to the independent data in the variance-covariance matrix or the correlation coefficient matrix obtained with the data set divided for each of the specific processes. A data analysis device , which is implemented by inputting a matrix using a variance-covariance matrix or a correlation coefficient matrix obtained without dividing the data set into a Gaussian graphical model.
製造工程において収集されたデータであって、前記製造工程中の分析対象とする特定のプロセスに依存しない非依存データと、前記特定のプロセスに依存する依存データと、を含むデータセットを取得する取得機能と、
前記非依存データの全てと、前記特定のプロセスに対応した前記依存データと、を用いて、前記データセットの関連性を評価する評価機能と、
をコンピュータに実現させ、
前記関連性の評価は、前記特定のプロセス毎に前記データセットを分割した状態で求められた分散共分散行列又は相関係数行列の内の前記非依存データに対応する要素に、前記特定のプロセス毎に前記データセットを分割しない状態で求められた分散共分散行列又は相関係数行列を用いた行列をガウス型グラフィカルモデルに入力することで実施する、コンピュータプログラム。 A computer program,
Acquisition for acquiring a data set that is data collected in a manufacturing process and that includes independent data that does not depend on a specific process to be analyzed during the manufacturing process and dependent data that depends on the specific process function and
an evaluation function that evaluates the relevance of the data set using all of the non-dependent data and the dependent data corresponding to the specific process;
is realized on a computer,
The evaluation of the relevance is performed on the element corresponding to the independent data in the variance-covariance matrix or the correlation coefficient matrix obtained with the data set divided for each of the specific processes. A computer program executed by inputting a matrix using a variance-covariance matrix or a correlation coefficient matrix obtained without dividing the data set into a Gaussian graphical model.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019074580A JP7230654B2 (en) | 2019-04-10 | 2019-04-10 | Data analysis method, data analysis apparatus, and computer program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019074580A JP7230654B2 (en) | 2019-04-10 | 2019-04-10 | Data analysis method, data analysis apparatus, and computer program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020173581A JP2020173581A (en) | 2020-10-22 |
JP7230654B2 true JP7230654B2 (en) | 2023-03-01 |
Family
ID=72831462
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019074580A Active JP7230654B2 (en) | 2019-04-10 | 2019-04-10 | Data analysis method, data analysis apparatus, and computer program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7230654B2 (en) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001349883A (en) | 2000-06-09 | 2001-12-21 | Hitachi Metals Ltd | Characteristic forecasting method of metal material |
JP2005196512A (en) | 2004-01-08 | 2005-07-21 | Hitachi Ltd | Characteristic correlation analysis method and system, and test specification management method and system |
JP2008084039A (en) | 2006-09-28 | 2008-04-10 | Hitachi Ltd | Method for analyzing manufacturing process |
JP2017146908A (en) | 2016-02-19 | 2017-08-24 | 富士ゼロックス株式会社 | Quality management device and quality management program |
-
2019
- 2019-04-10 JP JP2019074580A patent/JP7230654B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001349883A (en) | 2000-06-09 | 2001-12-21 | Hitachi Metals Ltd | Characteristic forecasting method of metal material |
JP2005196512A (en) | 2004-01-08 | 2005-07-21 | Hitachi Ltd | Characteristic correlation analysis method and system, and test specification management method and system |
JP2008084039A (en) | 2006-09-28 | 2008-04-10 | Hitachi Ltd | Method for analyzing manufacturing process |
JP2017146908A (en) | 2016-02-19 | 2017-08-24 | 富士ゼロックス株式会社 | Quality management device and quality management program |
Also Published As
Publication number | Publication date |
---|---|
JP2020173581A (en) | 2020-10-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Shahiduzzaman et al. | Information technology and its changing roles to economic growth and productivity in Australia | |
JP4627674B2 (en) | Data processing method and program | |
JP5988419B2 (en) | Prediction method, prediction system, and program | |
CN107563645A (en) | A kind of Financial Risk Analysis method based on big data | |
CN107330467B (en) | Method for predicting influence of morphological characteristics of tobacco flakes on tobacco shred structure | |
Tarantola et al. | SIMLAB software for uncertainty and sensitivity analysis | |
JP2012226511A (en) | Yield prediction system and yield prediction program | |
KR20230135177A (en) | Manufacture condition output device, quality management system, and program | |
CN116882520A (en) | Prediction method and system for predetermined prediction problem | |
Liu et al. | Modeling and optimization of a tablet manufacturing line | |
JP2013084057A (en) | Management method for product quality and management device for product quality | |
CN113988325A (en) | Power system fault early warning method and device, terminal equipment and storage medium | |
JP7230654B2 (en) | Data analysis method, data analysis apparatus, and computer program | |
Nan et al. | A varying-coefficient Cox model for the effect of age at a marker event on age at menopause | |
CN114816711A (en) | Batch task processing method and device, computer equipment and storage medium | |
JP2007328744A (en) | Regression analyzing method and device therefor | |
TW202013186A (en) | Data processing method, data processing device, data processing system, and computer-readable recording medium | |
CN114112819B (en) | Method and device for measuring ore grinding granularity | |
US8805647B2 (en) | Evaluating and predicting computer system performance using kneepoint analysis | |
CN113205230A (en) | Data prediction method, device and equipment based on model set and storage medium | |
US11227288B1 (en) | Systems and methods for integration of disparate data feeds for unified data monitoring | |
DE102018121198A1 (en) | Method, device and system for determining measurement information | |
Žagar et al. | Big data collection in pharmaceutical manufacturing and its use for product quality predictions | |
JP7135435B2 (en) | Information processing device and program | |
WO2020203162A1 (en) | Simulation value calculating method and simulation value calculating device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220113 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20221109 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221115 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221214 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230117 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230130 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7230654 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |