CN108694755B

CN108694755B - 模型构建系统以及模型构建方法

Info

Publication number: CN108694755B
Application number: CN201810193423.8A
Authority: CN
Inventors: 西田幸仁; 曾我朗
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 2017-03-29
Filing date: 2018-03-09
Publication date: 2021-05-28
Anticipated expiration: 2038-03-09
Also published as: US20180285495A1; CN108694755A; US10853538B2

Abstract

本发明涉及模型构建系统和模型构建方法，其能够缓和灵敏度下降的影响，且能够辨别模型是否健全。根据其实施方式，该模型构建系统具有NCLM处理部、过滤器部、模型构建部、变量筛选部、判定部和健全度计算部。上述NCLM处理部将包含多个输入变量的第1输入变量群筛选为使用最近相关鲁汶算法(Nearest Correlation Louvain Method：NCLM)选择的第2输入变量群。上述过滤器部将上述第2输入变量群筛选为满足预定条件的第3输入变量群。上述模型构建部构建表示上述第3输入变量群和输出变量的关系的模型。上述变量筛选部将上述第1输入变量群筛选为未在构建上述模型中被使用的上述输入变量。上述判定部判定所构建的上述模型的数量是否达到了规定量，在上述模型的数量未达到上述规定量时，将由上述变量筛选部筛选出的上述第1输入变量群输出至上述NCLM处理部。上述健全度计算部计算上述规定量的上述模型的总体的健全度和各个上述模型的健全度。

Description

模型构建系统以及模型构建方法

相关申请

本申请享受以日本专利申请2017-064333(申请日2017年3月29日)以及日本专利申请2017-249763(申请日2017年12月26日)为基础申请的优先权。本申请通过参照该基础申请而包含基础申请的全部内容。

技术领域

本发明的实施方式通常涉及一种模型构建系统以及模型构建方法。

背景技术

为了根据多个输入变量(说明变量)来预测某个输出变量(目标变量)，通常是构建表示输入变量和输出变量的关系的模型。作为一个例子有如下情形，即，在用制造装置进行工件加工时，将由制造装置得到的各种数据作为输入变量，构建用于预测加工后的工件的制作结果等的模型。这样的模型例如是为了在离开规定的管理范围的情况下，对该工件不合格进行检测而使用根据工件的加工中得到的数据来预测的制作结果。

通常，构建的模型随着使用期间延长而至灵敏度降低，预测值相对于实测值的误差趋于增大。在预测值相对于实测值的误差变大时，则根据模型输出的预测值在离开管理范围的情况下，难以辨别这是由于模型的灵敏度的降低引起的，还是实际工件不合格引起的。

因此，希望开发出能够缓解灵敏度降低的影响且能够辨别模型是否健全的技术。

发明内容

本发明的实施方式提供一种模型构建系统和模型构建方法，其能够能够缓和灵敏度降低的影响，且能够辨别模型是否健全。

根据本发明的实施方式，模型构建系统具有NCLM处理部、过滤器部、模型构建部、变量筛选部、判定部和健全度计算部。上述NCLM处理部将包含多个输入变量的第1输入变量群筛选为使用最近相关鲁汶算法(Nearest Correlation Louvain Method：NCLM)选择的第2输入变量群。上述过滤器部将上述第2输入变量群筛选为满足预定条件的第3输入变量群。上述模型构建部构建表示上述第3输入变量群和输出变量的关系的模型。上述变量筛选部将上述第1输入变量群筛选为未在构建上述模型中被使用过的上述输入变量。上述判定部判定所构建的模型的数量是否达到了规定量，在上述模型的数量未达到上述规定量时，将由上述变量筛选部筛选出的上述第1输入变量群输出至上述NCLM处理部。上述健全度计算部计算上述规定量的上述模型的总体的健全度和各个上述模型的健全度。

根据上述构成的模型构建系统，能够缓和灵敏度降低的影响且能够辨别模型是否健全。

附图说明

图1是表示第1实施方式涉及的模型构建系统的结构的框图。

图2是对第1实施方式涉及的模型构建系统的动作进行说明的图。

图3是表示第1实施方式涉及的模型构建方法的流程图。

图4是表示第2实施方式涉及的模型构建系统的结构的框图。

图5是对第2实施方式涉及的模型构建系统的动作进行说明的图。

图6是表示第2实施方式涉及的模型构建方法的流程图。

图7是表示第3实施方式涉及的模型构建系统的结构的框图。

图8是对第3实施方式涉及的模型构建系统的动作进行说明的图。

图9是表示第3实施方式涉及的模型构建方法的流程图。

图10是表示第4实施方式涉及的模型构建系统4的构成的框图。

图11是对第4实施方式涉及的模型构建系统4的动作进行说明的图。

图12是表示第4实施方式涉及的模型构建方法的流程图。

图13是例示第1实施例中的输出变量和输入变量的图。

图14是例示第1实施例中的输出变量和利用NCLM选择的输入变量的图。

图15是例示第1实施例中的输出变量和利用过滤选择的输入变量的图。

图16是表示第1实施例中的实测值和各模型的预测值的图表。

图17是例示第2实施例中的输出变量和输入变量的图。

图18是例示第2实施例中的输出变量和利用NCLM选择出的输入变量的图。

图19是例示第2实施例中的各模型的特性的表。

图20是表示第2实施例中的实测值和各模型的预测值的图表。

图21是例示用于实现各实施方式涉及的模型构建系统的模型构建装置的结构的框图。

附图标记的说明：

1～4 模型构建系统

5 模型构建装置

100 取得部

102 NCLM处理部

104 过滤器部

106 模型构建部

108 模型信息保存部

110 变量筛选部

112 判定部

114 健全度计算部

116 外部输出部

120 规定量(日语：規定数)数据库

122 变量数据库

具体实施方式

以下参照附图对本发明的各实施方式进行说明。

另外，在本申请说明书和各附图中，对于与已经说明的部分相同的部分添加相同的附图标记，并适当省略详细说明。

图1是表示第1实施方式涉及的模型构建系统1的结构的框图。

如图1所示，模型构建系统1具有取得部100、NCLM处理部102、过滤器部104、模型构建部106、模型信息保存部108、变量筛选部110、判定部112、健全度计算部114、外部输出部116、规定量数据库120和变量数据库122。

规定量数据库120存储规定量。规定量表示在模型构建系统1中要构建的模型的数量。规定量例如预先由用户输入。在变量数据库122中，关于输入变量和输出变量，存储有作为各个变量的实测值的变量数据。

取得部100从规定量数据库120和变量数据库122分别取得规定量和变量数据。取得部100将取得的信息输出至NCLM处理部102。

NCLM处理部102将由取得部100取得的多个输入变量筛选为使用最近相关鲁汶算法(Nearest Correlation Louvain Method：NCLM)选择的多个输入变量。NCLM是将NC(Nearest Correlation：最近相关)法和鲁汶算法(Louvain Method)组合的方法。通过使用NC法，能够从多个输入变量中，发现相关关系高、更类似的(相关关系强的)变量。另外，鲁汶算法(Louvain Method)是将带权重的图表分割为多个组的最佳方法之一。利用鲁汶算法(Louvain Method)以使组内的结合变密，而组间的结合变疏的方式使带权重的图表分割为多个组。利用NC法找出的类似变量视为被结合。由此，能够使得类似变量被分配到相同组，相关性低的变量被分配到不同组，从而实施组分割。对于分割结果，使用最小二乘法(Partial Least Square：PLS)，仅选择能够良好地对输出变量进行说明的组。而且，通过组合上述方法，对于多个输入变量能够进一步强化变量间的类似性而进行分组，并以组单位进行输入变量的选择。即，NCLM处理部102将多个输入变量筛选为最能说明输出变量的一个以上的输入变量。

而且，NCLM、NC法以及鲁汶算法(Louvain Method)在Uchimaru,T.,Hazama,K.,Fujiwara,K.,and Kano,M Nearest Correlation Louvain Method for Fast and GoodSelection of Input Variables of Statistical Model.9th International Symposiumon Advanced Control of Chemical Processes.Received November 15,2014.中已做详述。

过滤器部104对从NCLM处理部102输入的多个输入变量加以过滤。由此，筛选为满足预先设定的预定条件的上述多个输入变量的一部分。过滤器部104将上述多个输入变量的上述一部分输出至模型构建部106。

以下为了说明的简洁，称输入至NCLM处理部102并要使用NCLM进行筛选的多个输入变量的群为“第1输入变量群”。另外，称使用NCLM进行筛选后的多个输入变量的群为“第2输入变量群”。称由过滤器部104从第2输入变量群进行筛选后的输入变量的群为“第3输入变量群”。

模型构建部106构建表示从过滤器部104输入的第3输入变量群和输出变量的关系的模型。模型构建部106例如使用多次回归或最小二乘法(Partial Least Squares：PLS)来构建模型。模型构建部106将所构建出的模型信息保存至模型信息保存部108。

变量筛选部110将第1输入变量群筛选为不用于构建模型的一个以上的输入变量。即，从第1输入变量群除去未用于构建模型的输入变量。变量筛选部110将所筛选出的第1输入变量群输出至判定部112。

判定部112判定保存在模型信息保存部108中的模型信息的数量(由模型构建部106构建的模型的数量)是否达到规定量。在由判定部112判定模型信息的数量未达到规定量时，将由变量筛选部110筛选出的第1输入变量群输入至NCLM处理部102。

利用NCLM处理部102和过滤器部104再次进行向第2输入变量群和第3输入变量群的筛选。利用模型构建部106构建另一模型。此时，在输入至模型构建部106的第3输入变量群中不包含已经在构建模型中使用过的输入变量。因此，由模型构建部105构建表示未在构建模型中被使用的多个输入变量的至少一部分与输出变量的关系的另一模型。

直到所构建的模型的数量达到规定量为止，重复利用NCLM处理部102、过滤器部104、模型构建部106和变量筛选部110所做的处理。在所构建的模型的数量达到规定量时，健全度计算部114从模型信息保存部108取得模型信息，并从变量数据库122取得变量数据。健全度计算部114根据所取得的数据计算所构建的模型群的总体的健全度以及各模型的健全度。

具体而言，首先，健全度计算部114对所构建的各模型的输入变量输入变量数据，得到输出变量(预测值)。

例如，进行判定，即输出变量在规定的范围内时为良，在范围外时为不合格。此时，健全度计算部114针对各个的模型的输出结果进行该判定。而且，分别统计良的判定数量和不合格的判定数量。健全度计算部114将更多一方的判定结果作为总体的判定结果。

或者，健全度计算部114计算各模型的预测值的中央值或带权重的平均值等。健全度计算部114以所计算的值为模型群的代表值。健全度计算部114将代表值在规定的范围内的情况作为良，将在范围外的情况下作为不合格，而得到总体的判定结果。

而且，健全度计算部114对实际的输出变量(实测值)的判定结果和总体的判定结果进行比较。此时，若总体的判定结果与实际的判定结果一致，则判定所构建的模型群总体上是健全的。

或者，健全度计算部114也可以直接比较实测值和模型群的代表值。此时，可以使用均方误差(Mean Square Error：MSE)、均方根误差(Root Mean Square Error：RMSE)、决定系数(R²)或相关系数等作为健全度的指标。

接着，健全度计算部114对实测值和各模型的预测值进行比较，并对实测值的判定结果和各模型的判定结果进行比较。由此，健全度计算部114计算各模型的健全度。在对实测值的判定结果和预测值的判定结果进行比较时，作为健全度得到“健全”、“异常”这样的离散值。在对实测值和预测值进行比较时，作为健全度得到MSE、RMSE、R²或相关系数等指标。

或者，也可以将模型群的代表值或总体的判定结果作为正值。能够通过与各模型的预测值或判定结果进行比较，来计算各模型的健全度。

另外，这些健全度的计算方法可以根据模型构建系统1的应用场合适当地进行组合，并对模型群和各模型的健全度进行管理。例如，在以代替实测或消减实测的频度为目标的情况下，以模型群的代表值或其判定结果为正值，而暂定计算各模型的健全度。而且，也可以利用数量很少的实测点，通过对预测值和实测值或其判定结果彼此进行比较，来计算模型群的总体的健全度和各模型的健全度。

外部输出部116在显示器上将信息显示给用户，或者以规定的文件格式输出而输出到外部。该信息包含由健全度计算部114计算出的各模型的预测值、各模型的健全度以及总体的模型的健全度。

图2是对第1实施方式涉及的模型构建系统1的动作进行说明的图。

将多个输入变量(第1输入变量群)筛选为使用NCLM选择的多个输入变量(第2输入变量群)。对所筛选出的多个输入变量加以过滤。利用经NCLM以及过滤进一步筛选的多个输入变量(第3输入变量群)来构建第1模型。

在构建了第1模型时，对于第2以后的模型构建中要使用的多个输入变量，筛选为未在第1模型中被使用过的。该所筛选的多个输入变量在构建第2模型时，利用NCLM以及过滤进一步进行筛选。使用所筛选出的多个输入变量，构建第2模型。

以后重复相同的动作。即，在构建了第n-1模型时，对于第n以后的模型构建中要使用的多个输入变量，筛选为未在第1、2、···n-1模型中被使用过的。使用该所筛选出的多个输入变量的至少一部分来构建第n模型。

图3是表示第1实施方式涉及的模型构建方法的流程图。

取得部100从规定量数据库120和变量数据库122取得规定量和变量数据(步骤S1)。NCLM处理部102将所取得的多个输入变量筛选为使用NCLM选择的多个输入变量(步骤S2)。过滤器部104对经NCLM筛选的多个输入变量加以过滤，筛选为满足预先设定的预定条件的多个输入变量(步骤S3)。模型构建部106构建表示经NCLM和过滤而筛选出的多个输入变量和输出变量的关系的模型(步骤S4)。

模型构建部106将所构建的模型信息保存至模型信息保存部108(步骤S5)。变量筛选部110将在步骤S1中取得的多个输入变量筛选为未在步骤S4中使用的(尚未用于模型构建的)输入变量(步骤S6)。判定部112判定所构建的模型的数量是否达到规定量(步骤S7)。在模型的数量未达到规定量时，根据在步骤S6中筛选的输入变量再次执行步骤S2～S6。

在模型的数量达到规定量时，健全度计算部114从模型信息保存部108和变量数据库122取得模型信息和变量数据(步骤S8)。健全度计算部114使用所取得的变量数据和模型信息计算各模型的预测值(步骤S9)。健全度计算部114统计各模型的预测值，计算总体的健全度(步骤S10)。健全度计算部114计算各模型的健全度(步骤S11)。外部输出部116将各模型的预测值、各模型的健全度以及总体的模型的健全度输出至外部(步骤S12)。

这里对本实施方式所产生的效果进行说明。

为了缓解模型的灵敏度降低的影响，考虑使用多个模型，根据多个预测值辨别总体上模型是否健全。但是，若多个模型的举动相互相似，则使得多个模型同样地灵敏度降低，或者同样地暂时性产生较大的误差。因此，难以辨别健全度。

根据本实施方式涉及的模型构建系统1，利用NCLM处理部102对多个输入变量进行筛选。在利用NCLM处理部102筛选出的第2输入变量群中所包含的多个输入变量相互相关关系强。换言之，利用NCLM处理部102筛选出的输入变量群和未经筛选的输入变量群之间，相关关系弱。因此，使用这些输入变量群所构建的模型的举动，容易产生相互差异。

另外，在模型构建系统1中，利用过滤器部104对第2输入变量群进行筛选。因此，能够提高模型对输出变量的精度。即，根据模型构建系统1，利用NCLM处理部102、过滤器部104、模型构建部106以及变量筛选部110，能够提高各模型对输出变量的精度，并构建举动相互不同的多个模型。

而且，对于所构建的模型，利用健全度计算部114，计算各个模型的健全度以及规定量的模型的总体健全度。能够确认这些总体的健全度以及各模型的健全度。由此，即使一部分模型的输出变量脱离管理范围以外等时，也能够准确地辨别这是由模型的灵敏度降低引起的，还是实际上产生了这样的变动。

另外，本实施方式涉及的模型构建系统1将由变量筛选部110筛选出的第1输入变量群再次输入至NCLM处理部102。能够对例如利用NCLM处理部102执行的NCLM的条件与所构建的模型数量的增加相匹配地进行调整。根据上述方法，能够进一步提高各模型对输出变量的精度，并构建举动相互不同的多个模型。

(第2实施方式)

图4是表示第2实施方式涉及的模型构建系统2的结构的框图。

在第1实施方式涉及的模型构建系统1中，变量筛选部110将第1输入变量群筛选为未在模型构建中被使用过的输入变量。而且，将所筛选出的第1输入变量群输入至NCLM处理部102。

在图4所示的第2实施方式涉及的模型构建系统2中，变量筛选部110将第2输入变量群筛选为未在模型构建中被使用过的输入变量。而且，将所筛选出的第2输入变量群输入至过滤器部104。

因此，在模型构建系统2中，未被NCLM处理部102筛选的、第2输入变量群以外的第1输入变量群未使用于模型的构建。

图5是对第2实施方式涉及的模型构建系统2的动作进行说明的图。

如图5所示，第1模型与第1实施方式涉及的模型构建系统1同样地，使用利用NCLM以及过滤而筛选出的输入变量来构建。以后的模型则是使用利用NCLM筛选了，但未由过滤而筛选的输入变量来构建。

图6为表示第2实施方式涉及的模型构建方法的流程图。

分别与图3所示的流程图的步骤S1～S5同样地执行步骤S21～步骤S25。变量筛选部110将在步骤S22中筛选出的变量，筛选为未在步骤S24中被使用过的变量(步骤S26)。判定部112判定所构建的模型的数量是否达到规定量(步骤S27)。在模型的数量未达到规定量时，根据在步骤S26中筛选出的输入变量，再次执行步骤S23～S26。在模型的数量达到了规定量后，分别与图3所示流程图的步骤S8～S12同样地执行步骤S28～S32。

如第1实施方式的说明中所述，NCLM处理部102将第1输入变量群筛选为包含相关关系强、对输出变量的精度高的多个输入变量的第2输入变量群。而且，在本实施方式涉及的模型构建系统2中，根据该第2输入变量群反复进行模型的构建以及输入变量的筛选。因此，根据本实施方式涉及的模型构建系统，虽容易使所构建的模型的举动相对近似，但能够提高各模型的精度。

(第3实施方式)

图7是表示第3实施方式涉及的模型构建系统3的结构框图。

在图7所示的第3实施方式涉及的模型构建系统3中，变量筛选部110将第1输入变量群筛选为未在构建模型中被使用过的输入变量。而且，将所筛选出的第1输入变量群作为第2输入变量群输入至过滤器部104。

即，在模型构建系统1中，在构建各模型时，每次进行基于NCLM处理部102的输入变量的筛选。在模型构建系统3中仅在最初构建模型时进行基于NCLM处理部102的输入变量的筛选。

图8是对第3实施方式涉及的模型构建系统3的动作进行说明的图。

如图8所示，与第1实施方式涉及的模型构建系统1同样地，使用利用NCLM以及过滤而筛选出的输入变量来构建第1模型。并对于未利用NCLM以及过滤进行筛选的输入变量利用过滤进行筛选后，使用该输入变量来构建第2模型。并对未由过滤进行筛选的输入变量利用过滤进行筛选后，使用该输入变量来构建以后的模型。

图9是表示第3实施方式涉及的模型构建方法的流程图。

分别与图3所示的流程图的步骤S1～S5同样地执行步骤S41～步骤S45。变量筛选部110将在步骤S41中取得的多个输入变量筛选为未在步骤S44中被使用的变量(步骤S46)。判定部112判定所构建的模型的数量是否达到规定量(步骤S47)。在模型的数量未达到规定量时，根据在步骤S46中筛选的输入变量，再次执行步骤S43～S46。在模型的数量达到了规定量后，分别与图3所示的流程图的步骤S8～S12同样地执行步骤S48～S52。

如在第1实施方式的说明中所述，在利用NCLM处理部102筛选出的输入变量群和未被筛选的输入变量群之间，相关关系弱。因此，对于未被NCLM处理部102筛选的输入变量群，不反复进行利用NCLM处理部102所做的筛选，能够构建与第1模型举动不同的模型。另外，在第2以后的模型的构建中，由于利用过滤器部104对输入变量群进行筛选，因此能够提高对输出变量的精度。

因此，根据本实施方式涉及的模型构建系统3，与第1实施方式相比能够更简便地构建对各模型的输出变量的精度高、且举动相互不同的多个模型。

(第4实施方式)

图10是表示第4实施方式涉及的模型构建系统4的结构框图。

图10所示的第4实施方式涉及的模型构建系统4例如在不具有变量筛选部110这一点上，与第1～第3实施方式涉及的模型构建系统不同。在模型构建系统4中，利用NCLM处理部102生成多个输入变量的组。即，NCLM处理部102从第1输入变量群生成多个第2输入变量群。在所生成的第2输入变量群的数量比规定量多时，例如，NCLM处理部102将多个第2输入变量群筛选为能够更好地说明输出变量的规定量的第2输入变量群。

过滤器部104将多个第2输入变量群分别筛选为满足预定条件的多个第3输入变量群。模型构建部106对于各个第3输入变量群构建表示第3输入变量群和输出变量的关系的模型。健全度计算部114计算这些多个模型的总体的健全度以及各模型的健全度。

如图11所示，使用NCLM生成多个输入变量的组(多个第2输入变量群)。接着，对各个第2输入变量群加以过滤。而且，对于各个第2输入变量群构建模型。

图12是表示第4实施方式涉及的模型构建方法的流程图。

取得部100从规定量数据库120和变量数据库122取得规定量和变量数据(步骤S61)。NCLM处理部102从所取得的多个输入变量生成使用NCLM选择的多个输入变量的组(多个第2输入变量群)(步骤S62)。过滤器部104将多个第2输入变量群分别筛选为满足预定条件的多个第3输入变量群(步骤S63)。

模型构建部106构建多个模型(步骤S64)。多个模型分别表示多个第3输入变量群和输出变量的关系。模型构建部106将多个模型保存至模型信息保存部108(步骤S65)。分别与图3所示的流程图的步骤S8～S12同样地执行以后的步骤S66～S70。

(第1实施例)

图13是例示第1实施例中的输出变量和输入变量的图。

图14是例示第1实施例中的输出变量和利用NCLM选择出的输入变量的图。

图15是例示第1实施例中的输出变量和利用过滤选择出的输入变量的图。

图16是表示第1实施例中的实测值和各模型的预测值的图表。

在第1实施例中，使用第2实施方式涉及的模型构建系统2。这里如图13所示，对根据输出变量Y和34个输入变量X的变量数据构建多个模型的例子进行说明。输出变量Y是工件的品质特性。输入变量X是在各工序中加工后的工件的制作结果。制作结果基于加工后的工件的尺寸以及工件的加工率的至少任一者。

首先，将图13所示的34个的输入变量(第1输入变量群)输入至NCLM处理部102。其结果是，利用NCLM处理部102，如图14所示，筛选为15个输入变量(第2输入变量群)。接着，将该15个的输入变量输入至过滤器部104。在图15所示的例子中，过滤器部104对于各输入变量进行推断值、标准误差、t值、p值以及VIF(方差膨胀因子：Variance Inflation Factor)的计算。而且，过滤器部104例如将输入的说明变量筛选为满足p值＜0.0001的输入变量(第3输入变量群)。

在图15所示的例子中，利用过滤器部104筛选为4个输入变量。利用模型构建部106，构建表示该4个输入变量和输出变量的关系的第1模型。接着，利用变量筛选部110，将利用NCLM处理部102筛选出的15个输入变量(第2输入变量群)筛选为尚未被第1模型使用的11个输入变量。这里，模型构建部106使用上述11个输入变量(被筛选出的第2输入变量群)构建表示与输出变量的关系的第2模型。

图16是表示输出变量Y的实测值和基于第1模型以及第2模型的预测值的图表。根据图16可知，第1模型与第2模型相比能够以高精度预测实测值。另一方面，第2模型的精度虽逊于第1模型，但偏离实测值不大。进而可知，第1模型和第2模型相对于实测值的变动显示出不同举动。

即可知，根据本发明的实施方式涉及的模型构建系统，能够构建提高对输出变量的精度且举动相互不同的多个模型。另外，使用上述各模型得到的预测值，利用健全度计算部114计算模型群的总体的健全度以及各模型的健全度，由此能够更准确地辨别所构建的模型是否健全。

(第2实施例)

图17是例示第2实施例中的输出变量和输入变量的图。

图19是例示第2实施例中的各模型的特性的表。

图20是表示第2实施例中的实测值和各模型的预测值的图表。

在第2实施例中，如图17所示，对根据输出变量Y和270个输入变量X的变量数据构建多个模型的例子进行说明。输出变量Y为工件的制作结果。输入变量X为在各工序中得到的传感器的数据(加工时的温度、压力等)。制作结果基于加工后的工件的尺寸以及工件的加工率的至少任一者。在本实施例中，在模型的构建中使用第4实施方式涉及的模型构建系统4。

首先，将图17所示的270个输入变量(第1输入变量群)输入至NCLM处理部102。其结果是生成图18所示的3个输入变量的组(3个第2输入变量群)。一个第2输入变量群G1包含132个输入变量。另一个第2输入变量群G2包含62个输入变量。再一个第2输入变量群G3包含9个输入变量。

对第2输入变量群G1和G2的各个加以过滤，筛选为第3输入变量群。由于第2输入变量群G3中变量的数量已经很少，因此未对其加以过滤。在过滤器部104中，使用逐步算法(英文：Stepwise)来对输入变量进行筛选。由此，第2输入变量群G1被筛选为22个第3输入变量群G4。第2输入变量群G2被筛选为13个第3输入变量群G5。使用第3输入变量群G4、第3输入变量群G5以及第2输入变量群G3，由模型构建部106分别构建第1模型、第2模型以及第3模型。

评价第1模型～第3模型的各个的特性。图19表示第1模型和第2模型各个的特性。第3模型由于预测精度低因而舍弃。如图19所示，第1模型中R²为大致0.64，表示第1模型的精度良好。第2模型中R²为大致0.42，略低，但是为能够允许的精度。

图20是表示输出变量Y的实测值和由第1模型以及第2模型生成的预测值的图表。在图20的图表中，横轴表示时刻T。在图20的图表中示出实测值的平均值A。另外，示出下限值L1和上限值L2的一个例子。下限值L1和上限值L2分别表示在制造中能够允许的输出变量的下限和上限。

根据图20可知，第1模型与第2模型相比能够以更高精度预测实测值。另外，虽然第2模型的精度较第1模型略差，但并未偏离实测值太大。第1模型和第2模型对实测值的变动呈现不同举动。

而且，在时刻T126，实测值虽仍处于下限值L1和上限值L2之间，但第1模型的预测值已经低于下限值L1。因此，仅使用第1模型进行预测时，在时刻T126得到所预测的输出处于不允许的范围这样的错误的判定。另一方面，第2模型的预测值则处在下限值L1和上限值L2之间。因此，对于时刻T126的预测值来说，通过构建更多模型，并计算模型群的总体的健全度，才可能正确得到判定。

图21是例示用于实现各实施方式涉及的模型构建系统的模型构建装置5的结构的框图。

模型构建装置5例如具有输入装置200、输出装置202以及计算机204。计算机204例如具有ROM(只读存储器：Read Only Memory)206、RAM(随机存储器：Random AccessMemory)208、CPU(中央处理单元：Central Processing Unit)210以及存储装置HDD(硬盘驱动器：Hard Disk Drive)212。

输入装置200用于使用户向模型构建装置5输入信息。输入装置200包括键盘、触摸面板等。

输出装置202用于将由模型构建系统1得到的输出结果输出给用户。输出装置202包括显示器、打印机等。

ROM206保存用于对模型构建装置5的动作进行控制的程序。在ROM206中保存有用于使计算机204起到图1中所示取得部100、NCLM处理部102、过滤器部104、模型构建部106、模型信息保存部108、变量筛选部110、判定部112、健全度计算部114以及外部输出部116的功能所必须的程序。

RAM208起到将保存在ROM206中的程序展开的存储区域的功能。CPU210读入保存在ROM103中的控制程序，根据该控制程序对计算机204的动作进行控制。另外，CPU210将由计算机204的动作得到的各种数据展开于RAM208。

HDD212保存图1所示的规定量数据库120和变量数据库122。另外，HDD212起到保存所构建的模型及所计算的类似度的模型信息保存部108的功能。

以上，例示了本发明的几个实施方式，但这些实施方式作为例子仅是提示性的，并不构成对发明的范围的限定。能够以其他各种形态来实施新的实施方式，在不脱离本发明的思想的范围内，能够进行各种省略、置换、变更等。这些实施方式及其变形例均涵盖在本发明的范围和思想内，且也被涵盖在权利要求所记载的发明和其等同的范围内。另外，前述各实施方式可以相互组合加以实施。

Claims

1.一种模型构建系统，其特征在于，具有：

NCLM处理部，其将包含多个输入变量的第1输入变量群筛选为使用最近相关鲁汶算法(NCLM)选择的第2输入变量群；

过滤器部，其将所述第2输入变量群筛选为满足预定条件的第3输入变量群；

模型构建部，其构建表示所述第3输入变量群和输出变量的关系的模型；

变量筛选部，其将所述第1输入变量群筛选为未在构建所述模型中被使用过的一个以上所述输入变量；

判定部，其判定所构建出的所述模型的数量是否达到了规定量，在所述模型的数量未达到所述规定量时，将由所述变量筛选部筛选出的所述第1输入变量群输出至所述NCLM处理部；以及

健全度计算部，其计算所述规定量的所述模型的总体的健全度和各个所述模型的健全度。

2.如权利要求1所述的模型构建系统，其特征在于：

还具有外部输出部，其将各个所述模型的健全度，各个所述模型的输出变量以及所述总体的健全度输出到外部。

3.一种模型构建系统，其特征在于，具有：

变量筛选部，其将所述第2输入变量群筛选为未在构建所述模型中被使用的一个以上所述输入变量；

判定部，其判定所构建的所述模型的数量是否达到了规定量，在所述模型的数量未达到所述规定量时，将由所述变量筛选部筛选出的所述第2输入变量群输出至所述过滤器部；以及

4.如权利要求3所述的模型构建系统，其特征在于：

5.一种模型构建系统，其特征在于，具有：

变量筛选部，其将所述第1输入变量群筛选为未在构建所述模型中被使用的一个以上的所述输入变量；

判定部，其判定所构建的所述模型的数量是否达到了规定量，在所述模型的数量未达到所述规定量时，将由所述变量筛选部筛选出的所述第1输入变量群作为所述第2输入变量群输出至所述过滤器部；以及

6.如权利要求5所述的模型构建系统，其特征在于：

7.一种模型构建系统，其特征在于，具有：

NCLM处理部，其根据包含多个输入变量的第1输入变量群生成使用最近相关鲁汶算法(NCLM)选择的多个第2输入变量群；

过滤器部，其将所述多个第2输入变量群分别筛选为满足预定条件的多个第3输入变量群；

模型构建部，其构建表示所述多个第3输入变量群的每一个和输出变量的关系的多个模型；以及

健全度计算部，其计算所述多个模型的总体的健全度和各个所述模型的健全度。

8.如权利要求7所述的模型构建系统，其特征在于：

9.一种模型构建方法，其特征在于，包括：

第1步骤，其中将包含多个输入变量的第1输入变量群筛选为使用最近相关鲁汶算法(NCLM)选择的第2输入变量群；

第2步骤，其中将所述第2输入变量群筛选为满足预定条件的第3输入变量群；

第3步骤，其中构建表示所述第3输入变量群和输出变量的关系的模型；以及

第4步骤，其中将所述第1输入变量群筛选为未在所述第3步骤中构建所述模型时被使用的所述输入变量，

根据在所述第4步骤中所筛选出的所述第1输入变量群，反复执行所述第1步骤至所述第4步骤，直到所构建的所述模型的数量达到规定量，

还具有第5步骤，其中计算所述规定量的所述模型的总体的健全度和各个所述模型的健全度。