CN113642823A - 数据分析系统、数据分析方法和非暂时性计算机可读介质 - Google Patents

数据分析系统、数据分析方法和非暂时性计算机可读介质 Download PDF

Info

Publication number
CN113642823A
CN113642823A CN202110461852.0A CN202110461852A CN113642823A CN 113642823 A CN113642823 A CN 113642823A CN 202110461852 A CN202110461852 A CN 202110461852A CN 113642823 A CN113642823 A CN 113642823A
Authority
CN
China
Prior art keywords
parameter
data
correlation
parameters
production
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110461852.0A
Other languages
English (en)
Other versions
CN113642823B (zh
Inventor
桧物亮一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yokogawa Electric Corp
Original Assignee
Yokogawa Electric Corp
Yokogawa Solution Service Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yokogawa Electric Corp, Yokogawa Solution Service Corp filed Critical Yokogawa Electric Corp
Publication of CN113642823A publication Critical patent/CN113642823A/zh
Application granted granted Critical
Publication of CN113642823B publication Critical patent/CN113642823B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • G06T7/001Industrial image inspection using an image reference approach
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2200/00Indexing scheme for image data processing or generation, in general
    • G06T2200/24Indexing scheme for image data processing or generation, in general involving graphical user interfaces [GUIs]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30164Workpiece; Machine component

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Databases & Information Systems (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • General Factory Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种数据分析系统,包括:存储器;以及处理器,该处理器与存储器连接并获取待分析数据。待分析数据包括:与每个生产批次中生产的产品的生产要素有关的参数;以及用于评估产品的指标。处理器将所获取的待分析数据输出至存储器。存储器以每个生产批次存储参数以及与参数相关联的指标。处理器基于参数之间的相关性以及该相关性和参数的数据来计算每个生产批次的相关特征值。处理器使显示器显示计算出的特征值。

Description

数据分析系统、数据分析方法和非暂时性计算机可读介质
技术领域
本发明涉及一种数据分析系统、数据分析方法以及非暂时性计算机可读介质。
背景技术
根据传统技术,当由于重复执行一系列操作(例如在工厂执行的制造过程)而导致某种指标(例如质量)时好时差时,可以从指标变差开始对过去的数据进行分析以筛选因素,以稳定产品性能和制造性能。
例如,专利文献1公开了用于定义生产产品性能变化的抑制因素的技术以及用于稳定产品性能和制造性能的技术。具体而言,在专利文献1中公开的技术中,由基于过程数据生成的主成分得分将制造过程的生产批次分为几组,基于产品数据确定这几组的优劣,定义促成组的优劣的抑制因素,并使产品性能和制造性能稳定。
专利文献
专利文献1JP 2016-177794 A
在传统技术中,为了从指标变差开始分析过去的数据并筛选因素,有必要从所观察到的参数(例如,温度、操作员、操作时间段等)中筛选出哪个参数影响指标的好/差。然而,在传统技术中,当有很多参数时,将无法筛选出哪个参数影响指标的好/差。此外,在传统技术中,当分析数据中的生产批次(例如,小批)很少时,分析精度不会提高。
发明内容
本发明的一个或多个实施例提供了一种即使在生产批次很少或参数很多的情况下也能够筛选出影响指标的好/差的参数的数据分析系统、数据分析方法以及指令。
根据一个或多个实施例的数据分析系统包括:数据获取单元(即,处理器),用于获取待分析数据,其中,与在每个生产批次中生产的产品的生产要素有关的参数以及用于评估所述产品的指标与每个生产批次相关;以及相关特征值提取单元(即,处理器),用于基于所述参数之间的相关性并且基于所述相关性和所述参数的数据来计算每个生产批次的相关特征值。
此外,根据一个或多个实施例的数据分析系统可以被配置为,使得所述相关特征值提取单元从待分析数据中选择两对或更多对所述参数、从所选择的参数对的数据中提取其中所述指标达到预先规定的标准的生产批次的数据、使用所提取的数据来计算表示所选择的参数对的相关性的近似并且针对每个生产批次计算表示所选择的参数对的数据与所述近似之间的距离的相关特征值。
此外,根据一个或多个实施例的数据分析系统可以包括参数提取单元(即,处理器),该参数提取单元用于基于计算出的相关特征值来提取影响所述指标的参数。
此外,根据一个或多个实施例的数据分析系统可以被配置为使得所述参数提取单元通过使用机器学习,基于所述相关特征值来提取影响所述指标的参数。
根据一个或多个实施例的数据分析方法使数据分析系统获取待分析数据(其中,与在每个生产批次中生产的产品的生产要素有关的参数以及用于评估所述产品的指标与每个生产批次相关)并基于所述参数之间的相关性以及基于所述相关性和所述参数的数据来计算每个生产批次的相关特征值。
根据一个或多个实施例的非暂时性计算机可读介质使计算机获取待分析数据(其中,与在每个生产批次中生产的产品的生产要素有关的参数以及用于评估所述产品的指标与每个生产批次相关)并基于所述参数之间的相关性以及基于所述相关性和所述参数的数据来计算每个生产批次的相关特征值。
根据一个或多个实施例,由于使用了表示参数对的相关性的相关特征值,因此即使在生产批次少或参数多的情况下,也可以筛选出影响所述指标的好/差的参数。
附图说明
图1是示出了根据一个或多个实施例的数据分析系统的配置示例的框图。
图2是示出了根据一个或多个实施例的由数据获取单元获取并存储在数据库中的数据的示例的图。
图3是根据一个或多个实施例的特征值提取程序的流程图。
图4是示出了根据一个或多个实施例的近似计算的示例的图。
图5是示出了根据一个或多个实施例的特征值提取方法的示例的图。
图6是示出了根据一个或多个实施例的根据一对参数的组合将相关特征值添加到数据库之后的数据示例的图。
图7是示出了根据一个或多个实施例的根据所有参数组合将相关特征值添加到数据库之后的数据示例的图。
图8是示出了根据一个或多个实施例的筛选参数的结果示例的图。
图9是示出了设置于根据一个或多个实施例的参数提取单元的第一学习模型的示例的图。
图10是示出了根据比较示例的数据分析系统的配置的框图。
图11是示出了根据比较示例的使用直方图来表示参数的示例的图。
图12是示出了根据比较示例的示出两个参数的相关性的示例的图。
图13是示出了根据比较示例的来自经过聚类处理的相关图的数据示例的图。
具体实施方式
在一个或多个实施例中,当由于重复执行一系列操作(例如在工厂执行的制造过程)而导致某种指标(与质量有关的标签,例如质量)时好(例如,生产批次(例如,小批))时差时,从指标变差开始对过去的数据进行分析以筛选因素。注意,指标为差是指例如在交付检查时未达到交付标准,指标为好是指例如在交付检查时达到交付标准。
以下将参照附图描述一个或多个实施例。
图1是示出了根据一个或多个实施例的数据分析系统1的配置示例的框图。如图1所示,数据分析系统1包括数据获取单元11、数据库12、特征值提取单元13、参数提取单元14、分析结果生成单元15以及输出单元16。注意,数据库12可以经由网络在云端上。此外,显示设备2与数据分析系统1连接。注意,在下面的描述中,将在一个示例中描述在工厂中执行的制造过程。此外,在一个或多个实施例中,在一个示例中描述了每预定生产数量或每生产体积的小批作为制造中的生产批次的一个例子,但生产批次不限于小批。生产批次可以按照预定数量、日期、时间、制造商班次、在制造中使用的材料的生产批次。
显示设备2是例如液晶图像显示设备、有机EL(电致发光)图像显示设备等。显示设备2显示由数据分析系统1输出的图像信息。
数据分析系统1分析所获取的与制造有关的数据,以针对制造估计影响指标的参数。指标是指例如制造过程中的质量检查结果,并且是指例如质量、产量、成本、生产时间等。在下面的示例中,将在一个示例中描述指标,其中在评估制成品的性能等时,达到或超过确定值的情况为“好”(第一指标),并且未达到确定值的情况是“差”(第二指标)。参数是指在制造过程中能够影响制成品的指标的因素(生产要素),例如与生产四要素(材料、设备、过程、人员)有关的变量。作为一个示例,参数是加热期间的温度、加热时间、冷却期间的温度、冷却时间、材料的成分等。注意,指标可以是例如前述“好”和“差”之类的标签,或者可以是数值。
数据获取单元11例如读取生产批次的数据,并将所读取的数据存储在数据库12中。注意,该数据包括指示生产批次的信息(以下称为生产批次信息)、多个参数以及指示指标的信息(以下称为指标信息)。生产批次信息是指例如在制造过程中由制造方定义的最小产品批次。此外,所获取的数据是要进行分析的数据。
数据库12将多个参数以及指标信息与生产批次信息进行关联,并存储该多个参数以及指标信息。注意,当数据库12存储多种产品的信息时,其针对每种产品将多个参数以及指标信息与生产批次信息进行关联并存储该多个参数以及指标信息。
特征值提取单元13将生产批次的数据(其由数据获取单元11存储在数据库12中)用作输入数据,并提取每个参数之间的相关性的特征值。特征值提取单元13将提取的每个参数之间的相关性的特征值与和生产批次信息相关联的多个参数以及指标信息进行关联,并将它们存储在数据库12中。注意,稍后将描述每个参数之间的相关性的特征值以及特征值的计算方法。
参数提取单元14经由例如机器学习从参数及其相关特征值中提取影响指标的好/差的参数或相关特征值,并且所提取的提取结果被输出至分析结果生成单元15。注意,稍后将描述影响指标的好/差的参数或相关特征值的提取方法。
分析结果生成单元15例如基于参数提取单元14输出的提取结果来创建图形图像,并将所创建的图形图像输出至输出单元16。
输出单元16在显示设备2上显示由分析结果生成单元15输出的图形图像。
<所获取的数据示例>
接下来,将描述由数据获取单元11获取并存储在数据库12中的数据的示例。图2是示出了根据一个或多个实施例的由数据获取单元11获取并存储在数据库12中的数据的示例的图。如图2所示,由数据获取单元11获取并存储在数据库12中的数据将500个参数以及指标信息与生产批次信息进行关联。注意,图2所示的示例是一个例子,并且参数的数量可以是与待分析环境相对应的数量。此外,指标信息也是一个例子,并且不限于此。
<特征值提取方法示例>
接下来,将使用图3至图7来描述特征值提取方法的示例。首先,将使用图3来描述特征值提取程序的示例。图3是根据一个或多个实施例的特征值提取程序的流程图。
(步骤S1)针对每个参数组合,特征值提取单元13从存储在数据库12的数据中相继对每个生产批次提取两个参数。例如,当参数数量为500时,特征值提取单元13每生产批次提取124750次(=500×499÷2)。注意,特征值提取单元13对每个生产批次执行类似的处理。
(步骤S2)特征值提取单元13辨别针对每个生产批次的参数对的提取处理是否结束。当特征值提取单元13辨别出针对每个生产批次的参数对的提取处理完成时(步骤S2;YES),其结束处理。当特征值提取单元13辨别出针对每个生产批次的参数对的提取处理未完成时(步骤S2;NO),其进行到步骤S3中的处理。
(步骤S3)关于在步骤S1中提取的两个参数,特征值提取单元13仅提取指标信息为“好”的生产批次,并使用所提取的生产批次数据的相关图中的坐标来计算相关性的近似。也就是说,特征值提取单元13从所选择的参数对的数据中提取其中指标满足或超过预先规定的标准的生产批次数据,换句话说,特征值提取单元13仅提取其中指标信息为第一指标(“好”,第一组)的生产批次数据,并求出近似。本示例中的标准为“好”,表示产品质量达到预先规定的标准。图4是示出了根据一个或多个实施例的近似计算的示例的图。在图4中,横轴是参数1(例如,0到10的值),纵轴是参数2(例如,0到10的值)。图4中的示例是针对参数1和参数2仅绘制其中指标信息为“好”的生产批次的数据g21并且例如使用最小二乘法来执行一次近似并计算近似g11的示例。
(步骤S4)特征值提取单元13在该两个参数的相关图中针对全部数据计算从所创建的近似到每个生产批次的标绘点的距离,并将计算出的距离设为特征值。在下文中,该特征值将被称为相关特征值。也就是说,特征值提取单元13计算近似分别与第一指标(第一组)的生产批次的数据以及第二指标(其为剩余指标(第二组))的生产批次的数据之间的距离。图5是示出了根据一个或多个实施例的特征值提取方法的示例的图。图5中的每个轴与图4中的每个轴相同。从图5中可以看出,当关联特征值时,特征值提取单元13不仅使用其中指标信息为“好”的生产批次的数据g21,也使用其中指标信息为“差”的生产批次的数据g22。在图5中,相关特征值g31是近似g11与生产批次n的数据g12之间的距离。注意,该距离是从近似g11到数据(g21、g22)的垂直线的长度。注意,特征值提取单元13使用点与线之间的距离公式来计算近似g11的线性线与数据之间的距离d。
(步骤S5)特征值提取单元13将计算出的相关特征值添加到数据库12中的生产批次表中。图6是示出了根据一个或多个实施例的根据一对参数的组合将相关特征值添加到数据库12之后的数据示例的图。在图6的示例中,将参数1和参数2的相关特征值添加到数据库12。特征值提取单元13使处理返回到步骤S1。
注意,如图5所示,当指标信息为“差”的距离大于指标信息为“好”的距离时,换句话说,当指标信息为“差”的相关特征值大于指标信息为“好”的特征值时,参数1和参数2对指标信息的好/差有很大影响。以这种方式,通过参数提取单元14来筛选对指标具有较大影响的参数。
图7是示出了根据一个或多个实施例的根据所有参数组合将相关特征值添加到数据库12之后的数据示例的图。如图7所示,特征值提取单元13将根据所有参数组合的相关特征值添加到数据库12。例如,当参数的数量为500时,针对每个生产批次记录124750个每个参数之间的相关特征值g51(参数1和参数2之间的相关特征值、参数1和参数3之间的相关特征值……参数499和参数500之间的相关特征值)。
<参数筛选结果示例>
接下来,将描述用于筛选参数的方法的示例。图8是示出了根据一个或多个实施例的筛选参数的结果示例的图。图8中的示例示出了从数百个参数或其相关特征值中筛选哪个参数或相关特征值影响指标的好/差的结果示例。在图8的示例中,有37个生产批次。28个生产批次的指标信息为好,而9个生产批次的指标信息为差(参考标记g101)。注意,在参考标记g101、g104、g107、g108和g109处,左侧的值表示其中指标信息为差的生产批次的数量,右侧的值表示其中指标信息为好的生产批次的数量。
参数提取单元14将用于参数1和参数2的相关特征值的阈值设置为最能分出“好”和“差”的值。接下来,参数提取单元14在参数1和参数2的相关特征值的值小于0.9(参考标记g102)与参数1和参数2的相关特征值的值大于或等于0.9(参考标记g103)之间进行分离。结果,示出了可以在其中指标信息为好的27个生产批次(参考标记g109)与其中指标信息为好的1个生产批次以及其中指标信息为差的9个生产批次(参考标记g104)之间进行区分。
示出了参数提取单元14可以将参考标记g104的10个生产批次(=9+1)分成参数3和参数4的相关特征值的值小于0.96(参考标记g105)以及参数3和参数4的相关特征值的值等于或大于0.96(参考标记g106)。此外,示出了可以在其中指标信息为差的9个生产批次(参考标记g107)与其中指标信息为好的1个生产批次(参考标记g108)之间进行区分。此外,示出了当不能在一轮处理中分出“好”和“差”时,可以使用与第一轮处理不同的参数对的相关特征值来进行分离。
因此,在图8中,将参数1和参数2的相关特征值=0.9设置为边界可以大体上划分好/差的指标信息。因此,可以理解,参数1和参数2对指标信息具有较大影响。此外,根据图8,可以通过进一步将参数3和参数4的相关特征值0.96设置为边界来分离不能仅由参数1和参数2的相关特征值分离的g104,因此应当理解,参数3和参数4影响指标信息。也就是说,图8的示例示出了好/差的指标信息可以由参数1和参数2大体上分开,并且可以由参数3和参数4进一步完全分开。具体而言,指标信息为“差”的因素是参数1和参数2的相关特征值小于0.9并且参数3和参数4的相关特征值小于0.96。注意,也可以通过设置于参数提取单元14的第一学习单元(图9)来估计这样的阈值(0.9、0.96)。
注意,在图8所示的分离示例中,阈值、两个参数、生产批次的数量等是一个示例,并且不限于此。例如,如果指标信息有组1、组2和组3,则可以将其分为三组。
参数提取单元14例如使用通过机器学习生成的第一学习模型来执行这种分离处理。图9是示出了设置于根据一个或多个实施例的参数提取单元14的第一学习模型141的示例的图。在第一学习模型141学习时,输入g101是将生产批次信息、参数信息、指标信息和相关特征值相关联的数据,而输出g102是对指标有较大影响的参数、相关特征值以及与如图8所示的决策树有关的信息中的至少一个。注意,在学习时,训练数据可以是例如分析员过去分析的结果(对指标有较大影响的参数)。注意,使用机器学习的方法例如是MT方法、深度学习等。
注意,在前述示例中,描述了其中参数提取单元14使用其设有的第一学习模型141来输出如图8所示的决策树的示例,但是不限于此。参数提取单元14在选择参数对时可以一次选择一对,并为每个所选择的参数对设置参数对的相关特征值具有最佳分离效果的阈值。例如,当参数1和参数2的相关特征值的值的范围是从0到1时,参数提取单元14可以将阈值以每次增加0.01的方式从0增加到1。此外,当使用所有阈值进行分离时,参数提取单元14可以选择能够最大程度地分离指标信息的阈值。当指标信息不能被完全分离时,参数提取单元14可以选择另一对参数并求出阈值。参数提取单元14可以重复这种处理方式以求出如图8所示的决策树。
结果,输出单元16可以在显示设备2上显示被估计为影响指标的参数和阈值(例如,图8)、根据参数组合的相关图、根据这些参数组合的相关特征值等。或者,输出单元16可以在显示设备2上显示与如图8所示的决策树有关的信息。用户可以看到如图8所示的结果以确立对策策略,例如首先针对参数1和参数2执行对策,结果,如果仍然无法获得足够数量的具有所需质量的生产批次,则针对参数3和参数4执行对策。
因此,根据一个或多个实施例,可以提取达到或超过标准的数据(例如,“好”的指标)(删除等于或低于标准的数据(例如,“差”的指标)),使用通过所创建的近似计算出的有效特征值,即使在生产批次数量较少的情况下也可以进行机器学习,从而精确地估计影响指标的参数。
<比较示例>
接下来,将使用图10至图13描述比较示例。
图10是示出了根据比较示例的数据分析系统900的配置的框图。如图10所示,数据分析系统900包括数据读取单元911、数据库912、参数筛选单元914、分析结果生成单元915以及输出单元916。
数据读取单元911例如读取生产批次的数据,并将所读取的数据存储在数据库912中。注意,所获取的数据类似于以上实施例。
数据库912将多个参数以及指标信息与生产批次信息进行关联,并存储该多个参数以及指标信息。
特征值创建单元913从所读取的参数值创建似乎影响指标的特征值。注意,分析主管设置特征。然而,应将什么设置为特征取决于分析主管的知识,并且如果分析主管没有在待分析领域中的专门知识,则无法定义与有效信息相关的特征值。特征值例如是当制造中的过程为连续时的趋势数据,并且是最大值、最小值、标准偏差、斜率等。
参数筛选单元914将所创建的特征值添加到所读取的参数,并且使用例如机器学习来从这些参数中筛选影响指标的好/差的参数(包括特征值)。参数筛选单元914输出机器学习的结果,以便能够最大可能地辨别出例如哪种参数组合可以辨别指标的好/差。
分析结果生成单元915例如将参数的分布转换为图形,并且将转换为图形的图形图像输出至输出单元916。
输出单元916在显示设备上显示由分析结果生成单元915输出的图形图像。
图11是示出了根据比较示例的使用直方图来表示参数的示例的图。
直方图g901是参数1的直方图,直方图g911是参数2的直方图。在直方图g901和直方图g911中,横轴是参数值(例如,0到10的值,间隔为1),纵轴为频率。注意,频率是指在多个生产批次中具有相同参数值的生产批次的数量。此外,参考标记902表示“好”的指标信息,参考标记g903表示“差”的指标信息。
在参数2的直方图g911中,“好”和“差”的分布是分离的且有偏向的,并且随着参数2的值增加,指标趋于变差。也就是说,应当理解,参数2的较大值可能是使指标变差的因素。然而,在参数1的直方图g901中,“好”和“差”的分布没有分离也没有偏向,因此找不到趋势。
图12是示出了根据比较示例的示出两个参数的相关性的示例的图。
相关图g921是参数3和参数4的相关图,相关图g931是参数5和参数6的相关图。在相关图g921中,横轴是参数4(例如,0到10的值),纵轴是参数3(例如,0到10的值)。在相关图g931中,横轴是参数6(例如,0到10的值),纵轴是参数5(例如,0到10的值)。此外,参考标记922表示“好”的指标信息,参考标记g923表示“差”的指标信息。
在参数5和参数6的相关图g931中,“好”和“差”的分布是分离的且有偏向的,可以理解,随着参数5的值减小而参数6的值增大,指标趋向于变差。也就是说,应当理解,参数5的较小值和参数6的较大值可能是使指标变差的因素。然而,在参数3和参数4的相关图g921中,“好”和“差”的分布没有分离也没有偏向,因此找不到趋势。
在比较示例的方法中,分析主管必须通过检查所有所创建的直方图以及所有相关图来估计因素的参数,以这种方式检查每个参数的趋势。然而,直方图和相关图的数量随参数数量的增加而增加。因此,分析主管很难看到所有输出图形,并且很难判断哪些参数会影响制造的指标。
此外,在比较示例的方法中,例如在使用机器学习进行参数筛选的情况下,如果存在大量的案例或生产批次(例如,十万个或更多),也可以准确地筛选出哪些参数影响指标的好/差。然而,在工厂执行的制造过程中,生产批次的数量通常为几十到几百。当生产批次的数量像这样较少时,机器学习的精度不会提高,并且不能实现准确的筛选。此外,存在一个问题,即无法理解该机器学习的结果在物理化学上意味着什么,并且不能使用这些结果。此外,当指标的“好”和“差”的分布的一部分重叠时,难以使用聚类处理来分离。
此外,在比较示例中,在创建图形时同时使用了“好”和“差”的指标。因此,在如图13的相关图中,当例如执行聚类处理时,“好”和“差”的指标没有分离,但是组g955和组g956将分离。图13是示出了根据比较示例的来自经过聚类处理的相关图的数据示例的图。注意,参考标记952表示“好”的指标信息,参考标记g953表示“差”的指标信息。
相反,在一个或多个实施例中,当计算相关特征值时,去除“差”的指标信息以求出近似,因此不会发生在图13中看到的不正确分组。
<修改示例>
在前述实施例中描述了一些示例,其中参数提取单元14使用相关特征值来估计影响指标的参数对,但是不限于此。
参数提取单元14可将第二学习模型用于每个参数的数据,如果一个参数影响指标,则可以提取该参数。在这种情况下,学习时的输入是每个参数的数据(生产批次信息、参数信息和指标信息),输出是具有影响力的参数。注意,可以有几个输出参数。例如,参数提取单元14可以如图11所示为每个参数创建直方图,并且基于所创建的直方图中的指标偏向来提取影响指标的一个参数。
根据一个或多个实施例,即使当分析主管没有该领域的专门知识时,也可以使用前述方法来提取相关特征值。注意,相关特征值表示相关性的分散水平。注意,分散水平是指如上所述的近似与每个数据之间的距离。根据一个或多个实施例,即使在生产批次很少或参数很多的情况下,也可以基于这些相关特征值来筛选影响指标的好/差的参数。
此外,根据一个或多个实施例,基于近似(参数之间的相关性)以及近似与参数的数据之间的距离来计算相关特征值。根据一个或多个实施例,即使在生产批次很少时难以通过仅使用参数和指标的机器学习来筛选参数的情况下,也可以基于这些相关特征值来筛选影响指标的好/差的参数。
此外,根据一个或多个实施例,相关性的分散水平可以通过使用所提取的相关特征值执行机器学习来估计是什么对指标产生了影响。例如,可能从针对每个生产批次的参数值的数据中发现,如果在增加燃料时温度有利地升高,则该指标为好;而当增加燃料时温度并未真正升高,该指标为差。
此外,根据一个或多个实施例,分析主管可以检查输出结果,并且几乎没有要检查的图形。根据一个或多个实施例,分析主管可以查看由机器学习提出的参数相关图,并检查那些参数是否真的影响指标的好/差。例如,在图8的示例中,即使输入数据中有数百个参数,通过仅使用“参数1和参数2的相关图”以及“参数3和参数4”的相关图这两者的图形显示功能,也可以毫无问题地进行检查。
此外,如上所述。根据一个或多个实施例,即使当分析主管没有该领域的专门知识时,也可以提取有效特征值。
根据一个或多个实施例,即使当生产批次很少时,也可以通过使用机器学习使用有效特征值获得准确的结果,因此可以筛选参数。
注意,在前述示例中描述了一个示例,其中在根据两个参数的二维相关图中计算了近似并且计算了近似与数据之间的距离,但是不限于此。相关图可以是例如根据三个参数的三维或更多维。维度可以对于分析主管来说是可见的,或者例如可以是五维或六维的。
此外,在前述示例中描述了一个示例,其中指标信息可以是两个(“好”或“差”)中的一个,但是指标信息可以是三个或更多。例如,当指标信息可以是三个(“好”、“中等”和“差”)中的一种时,特征值提取单元13例如可以从数据中去除“中等”和“差”并且仅使用“好”来计算近似,或者可以只去除“差”并且使用“好”和“中等”来计算近似。因此,特征值提取单元13可以从指标信息中去除一个或多个来计算近似。
可以在由计算机准备好的非暂时性计算机可读介质(非暂时性CRM)上记录用于实现根据一个或多个实施例的数据分析系统1的全部或部分功能的指令,并且可以由计算机系统读取和实现记录在该非暂时性CRM上的指令,以执行由数据分析系统1执行的全部或部分处理。注意,这里使用的“计算机系统”是指包括OS以及诸如外围设备之类的硬件的对象。此外,“计算机系统”是指包括具有主页提供环境(或显示环境)的WWW系统的对象。此外,“可以由计算机读取的记录介质”是指例如软盘、磁光盘、ROM、CD-ROM等的便携式介质或计算机系统内例如硬盘驱动器的存储设备。此外,当指令经由诸如电话线之类的通信电路或诸如互联网之类的网络传输时,“可以由计算机读取的记录介质”包括那些在客户计算机系统或服务器中将程序保留固定时间的介质,例如易失性存储器(RAM)。
此外,指令可以经由传输介质或使用传输介质中的传输波从其中在存储设备上存储有指令的计算机系统传输到另一计算机系统。这里,用于传输指令的“传输介质”是指具有用于传输信息的功能的介质,例如电话电路之类的通信电路(通信线路)或互联网之类的网络(通信网络)。此外,指令可以用于实现上述功能的一部分。此外,指令可以是能够结合已经记录在计算机系统或所谓的差异文件中的指令(差异指令)来实现上述功能的指令。
尽管本公开仅针对有限数量的实施例进行了描述,但是本领域的技术人员在受益于本公开的情况下将认识到,在不脱离本发明的范围的情况下可以设计各种其他实施例。因此,本发明的范围应该仅由所附权利要求来限定。
1 数据分析系统
11 数据获取单元
12 数据库
13 特征值提取单元
14 参数提取单元
15 分析结果生成单元
16 输出单元。

Claims (6)

1.一种数据分析系统,包括:
存储器;以及
处理器,其与所述存储器连接并获取待分析数据,该待分析数据包括:
与每个生产批次中生产的产品的生产要素有关的参数;以及
用于评估所述产品的指标,其中
所述处理器将所获取的待分析数据输出至所述存储器,
所述存储器以每个所述生产批次存储所述参数以及与所述参数相关联的所述指标,
所述处理器计算每个所述生产批次的相关特征值,该计算基于:
所述参数之间的相关性;以及
所述相关性和所述参数的数据,并且
所述处理器使显示器显示计算出的特征值。
2.根据权利要求1所述的数据分析系统,其中,所述处理器还:
从所分析的数据中选择两对或更多对所述参数,
从所选择的参数对中提取每个所述生产批次的数据,其中所提取的数据满足预先规定的标准;
使用所提取的数据来计算近似,该近似指示所选择的参数对的相关性;并且
计算每个所述生产批次的所述相关特征值,该相关特征值指示所选择的参数对的数据与所述近似之间的距离。
3.根据权利要求2所述的数据分析系统,其中,所述处理器基于计算出的相关特征值来提取影响所述指标的参数。
4.根据权利要求3所述的数据分析系统,其中,所述处理器基于所述相关特征值,经由机器学习来提取影响所述指标的参数。
5.一种数据分析方法,包括:
获取待分析数据,该待分析数据包括:
与每个生产批次中生产的产品的生产要素有关的参数;以及
用于评估所述产品的指标;并且
在内存中以每个所述生产批次存储所述参数以及与所述参数相关联的所述指标,
计算每个所述生产批次的相关特征值,该计算基于:
所述参数之间的相关性;以及
所述相关性和所述参数的数据,并且
使显示器显示计算出的特征值。
6.一种存储指令的非暂时性计算机可读介质,其中,当执行所述指令时,使处理器执行的操作包括:
获取待分析数据,该待分析数据包括:
在每个生产批次中生产的产品的生产要素的参数;以及
用于评估所述产品的指标;并且
在内存中以每个所述生产批次存储所述参数以及与所述参数相关联的所述指标,
计算每个所述生产批次的相关特征值,该计算基于:
所述参数之间的相关性;以及
所述相关性和所述参数的数据,
使显示器显示计算出的特征值。
CN202110461852.0A 2020-04-27 2021-04-27 数据分析系统、数据分析方法和非暂时性计算机可读介质 Active CN113642823B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2020-078581 2020-04-27
JP2020078581A JP7419955B2 (ja) 2020-04-27 2020-04-27 データ解析システム、データ解析方法、およびプログラム

Publications (2)

Publication Number Publication Date
CN113642823A true CN113642823A (zh) 2021-11-12
CN113642823B CN113642823B (zh) 2024-04-30

Family

ID=78222559

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110461852.0A Active CN113642823B (zh) 2020-04-27 2021-04-27 数据分析系统、数据分析方法和非暂时性计算机可读介质

Country Status (3)

Country Link
US (1) US11978194B2 (zh)
JP (1) JP7419955B2 (zh)
CN (1) CN113642823B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117522100A (zh) * 2023-11-16 2024-02-06 永久电力金具有限公司 一种电力金具生产过程的优化方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102022210783A1 (de) * 2022-10-13 2024-04-18 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren zum Bereitstellen von Kalibrierungsdaten für Antennendiagramme
CN116484269B (zh) * 2023-06-25 2023-09-01 深圳市彤兴电子有限公司 显示屏模组的参数处理方法、装置、设备及存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293658A (ja) * 2005-04-11 2006-10-26 Hitachi Ltd 複数の部品を組み合わせて形成される製品の製造方法、および部品の組合せ方法
CN102117730A (zh) * 2009-12-31 2011-07-06 中芯国际集成电路制造(上海)有限公司 半导体制造过程中的机台参数数据的处理方法和装置
CN103971196A (zh) * 2013-02-04 2014-08-06 波音公司 过程规划中的总排序
US20140258326A1 (en) * 2013-03-05 2014-09-11 Accenture Global Services Limited Manufacturing quality inspection and analytics system
US20170032281A1 (en) * 2015-07-29 2017-02-02 Illinois Tool Works Inc. System and Method to Facilitate Welding Software as a Service
CN107851097A (zh) * 2015-03-31 2018-03-27 株式会社Fronteo 数据分析系统、数据分析方法、数据分析程序及存储介质
CN109191001A (zh) * 2018-09-21 2019-01-11 常州工学院 基于主成分分析的教育质量评价方法
US20190129402A1 (en) * 2015-03-10 2019-05-02 Mitsubishi Chemical Engineering Corporation Manufacturing process analysis method
US20190325333A1 (en) * 2018-04-20 2019-10-24 H2O.Ai Inc. Model interpretation
WO2019220481A1 (ja) * 2018-05-14 2019-11-21 富士通株式会社 判定ルール取得装置、判定ルール取得方法および判定ルール取得プログラム
JP6622938B1 (ja) * 2019-03-20 2019-12-18 株式会社 日立産業制御ソリューションズ 相関性抽出方法および相関性抽出プログラム
CN110989537A (zh) * 2019-12-23 2020-04-10 杭州雷数科技有限公司 生产数据处理方法、设备、介质及系统
CN114491236A (zh) * 2021-12-29 2022-05-13 北京航天智造科技发展有限公司 一种基于知识学习的供应链智能匹配技术

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6474564B2 (ja) 2014-08-25 2019-02-27 東日本旅客鉄道株式会社 設備の劣化状態判定システムおよび設備の劣化状態判定方法
JP6716423B2 (ja) * 2016-10-26 2020-07-01 三菱ケミカルエンジニアリング株式会社 生産プロセスの解析方法
JP6481916B1 (ja) * 2018-06-26 2019-03-13 三菱ケミカルエンジニアリング株式会社 生産システム、生産方法及び制御装置

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006293658A (ja) * 2005-04-11 2006-10-26 Hitachi Ltd 複数の部品を組み合わせて形成される製品の製造方法、および部品の組合せ方法
CN102117730A (zh) * 2009-12-31 2011-07-06 中芯国际集成电路制造(上海)有限公司 半导体制造过程中的机台参数数据的处理方法和装置
CN103971196A (zh) * 2013-02-04 2014-08-06 波音公司 过程规划中的总排序
US20140258326A1 (en) * 2013-03-05 2014-09-11 Accenture Global Services Limited Manufacturing quality inspection and analytics system
US20190129402A1 (en) * 2015-03-10 2019-05-02 Mitsubishi Chemical Engineering Corporation Manufacturing process analysis method
CN107851097A (zh) * 2015-03-31 2018-03-27 株式会社Fronteo 数据分析系统、数据分析方法、数据分析程序及存储介质
CN108027911A (zh) * 2015-07-29 2018-05-11 伊利诺斯工具制品有限公司 促进焊接即服务软件的系统及方法
US20170032281A1 (en) * 2015-07-29 2017-02-02 Illinois Tool Works Inc. System and Method to Facilitate Welding Software as a Service
US20190325333A1 (en) * 2018-04-20 2019-10-24 H2O.Ai Inc. Model interpretation
WO2019220481A1 (ja) * 2018-05-14 2019-11-21 富士通株式会社 判定ルール取得装置、判定ルール取得方法および判定ルール取得プログラム
CN109191001A (zh) * 2018-09-21 2019-01-11 常州工学院 基于主成分分析的教育质量评价方法
JP6622938B1 (ja) * 2019-03-20 2019-12-18 株式会社 日立産業制御ソリューションズ 相関性抽出方法および相関性抽出プログラム
CN110989537A (zh) * 2019-12-23 2020-04-10 杭州雷数科技有限公司 生产数据处理方法、设备、介质及系统
CN114491236A (zh) * 2021-12-29 2022-05-13 北京航天智造科技发展有限公司 一种基于知识学习的供应链智能匹配技术

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117522100A (zh) * 2023-11-16 2024-02-06 永久电力金具有限公司 一种电力金具生产过程的优化方法
CN117522100B (zh) * 2023-11-16 2024-04-05 永久电力金具有限公司 一种电力金具生产过程的优化方法

Also Published As

Publication number Publication date
US11978194B2 (en) 2024-05-07
US20210334947A1 (en) 2021-10-28
JP2021174319A (ja) 2021-11-01
JP7419955B2 (ja) 2024-01-23
CN113642823B (zh) 2024-04-30

Similar Documents

Publication Publication Date Title
CN113642823B (zh) 数据分析系统、数据分析方法和非暂时性计算机可读介质
CN111444247B (zh) 一种基于kpi指标的根因定位方法、装置及存储介质
JP5141767B2 (ja) サンプルの帰属クラス予測方法、帰属クラス予測プログラムおよび帰属クラス予測装置
KR20180104542A (ko) 해석 장치, 해석 방법 및 기억 매체
JP6985856B2 (ja) 情報処理装置、情報処理装置の制御方法及びプログラム
CN111783505A (zh) 伪造人脸的识别方法、装置和计算机可读存储介质
GB2596741A (en) Method for accessing data records of a master data management system
CN112070384A (zh) 基于mi制作指示的物料匹配方法、装置、设备及存储介质
US20190220336A1 (en) Information processing device, information processing method, and recording medium
JP6879749B2 (ja) 支援装置および支援方法
JPWO2015146113A1 (ja) 識別辞書学習システム、識別辞書学習方法および識別辞書学習プログラム
US11448634B2 (en) Analysis apparatus, stratum age estimation apparatus, analysis method, stratum age estimation method, and program
CN113591601B (zh) 角膜共聚焦图像中菌丝识别方法及装置
JP2010044605A (ja) 鋼板製造実績データベース検索装置,鋼板製造実績データベース検索プログラム
JP5640796B2 (ja) 名寄せ支援処理装置、方法及びプログラム
US11803613B2 (en) Information processing device, information processing method, and recording medium
JP6929260B2 (ja) 時系列特徴抽出装置、時系列特徴抽出方法及びプログラム
CN112861689A (zh) 一种基于nas技术的坐标识别模型的搜索方法及装置
WO2024024175A1 (ja) 判定評価装置、方法、およびプログラム
CN114580982B (zh) 一种工业设备的数据质量的评估方法、装置及设备
CN114299037B (zh) 一种对象检测结果的质量评估方法、装置、电子设备及计算机可读存储介质
CN113345538B (zh) 一种基于动态选取训练集的材料性能预测方法
JP5240777B2 (ja) 文書分類装置及び文書分類方法
US20230195848A1 (en) Pattern extraction apparatus, pattern extraction method and program
KR102515081B1 (ko) 객체인식 소프트웨어 학습방법 및 학습장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20240110

Address after: Tokyo

Applicant after: Yokogawa Electric Corp.

Address before: Tokyo

Applicant before: Yokogawa Electric Corp.

Applicant before: Yokogawa solution services Co.,Ltd.

GR01 Patent grant
GR01 Patent grant