CN115688537A - 确定化合物配方中各成分的目标比例的方法和装置 - Google Patents

确定化合物配方中各成分的目标比例的方法和装置 Download PDF

Info

Publication number
CN115688537A
CN115688537A CN202110830859.5A CN202110830859A CN115688537A CN 115688537 A CN115688537 A CN 115688537A CN 202110830859 A CN202110830859 A CN 202110830859A CN 115688537 A CN115688537 A CN 115688537A
Authority
CN
China
Prior art keywords
product
ratio
candidate
proportion
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110830859.5A
Other languages
English (en)
Inventor
刘玮
高菡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Covestro Deutschland AG
Original Assignee
Covestro Deutschland AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Covestro Deutschland AG filed Critical Covestro Deutschland AG
Priority to CN202110830859.5A priority Critical patent/CN115688537A/zh
Priority to EP21198315.0A priority patent/EP4123524A1/en
Publication of CN115688537A publication Critical patent/CN115688537A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种确定化合物配方中各成分的目标比例的方法。该方法包括:a)对初始比例进行编码;b)通过遗传算法由经过编码的所述初始比例产生候选比例;c)使用模型来预测所述候选比例下的产物的至少一个属性,其中,所述模型为使用多组训练数据通过机器学习训练得出的,所述多组训练数据中的每组训练数据包括:所述各成分中的至少一部分的一个比例和所述比例下的产物的所述至少一个属性的实测结果;以及d)判断所述候选比例下的所述产物的所述至少一个属性的预测结果是否满足预设条件:如果满足所述预设条件,则将所述候选比例确定为所述目标比例,否则,从所述初始比例和所述候选比例中选择至少一个来更新步骤b)中用来产生所述候选比例的所述初始比例,并重复步骤a)‑d)直到所述预测结果满足所述预设条件。本发明还涉及确定化合物配方中各成分的目标比例的系统、装置以及计算机存储介质。

Description

确定化合物配方中各成分的目标比例的方法和装置
技术领域
本发明涉及化合物配方领域,具体涉及确定化合物配方中各成分的目标比例的方法、系统、装置和计算机可读存储介质。
背景技术
化合物配方中各成分的比例可能会很大程度上影响最终生成的化合物的各种属性。在实际应用中,往往需要针对已知的属性要求来寻找适当的成分比例。现有技术中一般采用人工试验的方式来寻求这样的比例。然而,对于已知的属性要求,通常需要非常大量的试验来不断调整各成分的比例,最终为各成分确定适当的比例。这往往是非常耗时并且成本高昂的,具有很大的局限性。
不仅如此,人工试验来确定成分比例在很大程度上依赖于试验人员的个体经验,通过在经验确定的样品空间中利用格点搜索来合成大量样品并从中进行筛选。这样完全依赖人工试验的方式,往往会引入人为因素的干扰,整个工作的时间和成本常常是难以事先预计和规划的。
因此,需要一种改进的方案来确定化合物配方中各成分的目标比例。
发明内容
根据本发明的一方面,提供一种确定化合物配方中各成分的目标比例的方法。该方法包括:a)对初始比例进行编码;b)通过遗传算法由经过编码的所述初始比例产生候选比例;c)使用模型来预测所述候选比例下的产物的至少一个属性,其中,所述模型为使用多组训练数据通过机器学习训练得出的,所述多组训练数据中的每组训练数据包括:所述各成分中的至少一部分的一个比例和所述比例下的产物的所述至少一个属性的实测结果;以及d)判断所述候选比例下的所述产物的所述至少一个属性的预测结果是否满足预设条件:如果满足所述预设条件,则将所述候选比例确定为所述目标比例,否则,从所述初始比例和所述候选比例中选择至少一个来更新步骤b)中用来产生所述候选比例的所述初始比例,并重复步骤b)-d)直到所述预测结果满足所述预设条件。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的方法中,还包括:e)判断所述目标比例下的所述产物的所述至少一个属性的实测结果是否满足所述预设条件:如果满足所述预设条件,则保留所述目标比例;否则,将所述目标比例和所述目标比例下的所述产物的所述至少一个属性的实测结果作为一组训练数据来继续训练所述模型。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的方法中,在步骤d)中,当所述预设条件包括对产物的多个属性的要求时,利用Pareto-Frontier帕累托最优法从所述初始比例和所述候选比例中选择至少一个来更新步骤b)中的用来产生所述候选比例的所述初始比例。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的方法中,所述产物包括分散体,优选聚氨酯分散体,其属性包括所述产物的分散体属性、膜属性和/或应用属性。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的方法中,所述产物的所述分散体属性包括所述产物的固体含量、所述产物的粒径大小、所述产物的粘度、所述产物的PH值和/或所述产物的LV10分子量;以及/或者所述产物的所述膜属性包括所述产物的膜断裂伸长率、所述产物的膜100%模量、所述产物的抗拉强度和/或所述产物的摆杆硬度;以及/或者所述产物的所述应用属性包括所述产物的色牢度、所述产物的耐水解性、所述产物的水溶胀性和/或所述产物的光泽度。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的方法中,在所述步骤a)中,所述编码为二进制编码、浮点编码和/或符号编码。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的方法中,在所述步骤b)中,所述遗传算法包括通过交叉重组和/或突变由经过编码的所述初始比例产生所述候选比例。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的方法中,在步骤b)中,对所述化合物配方中各成分的所述候选比例设置最大值和最小值。
根据本发明的另一方面,提供一种确定化合物配方中各成分的目标比例的装置,其特征在于,该装置包括:编码单元,其被配置为对初始比例进行编码;候选生成单元,其被配置为通过遗传算法由经过编码的所述初始比例产生候选比例;预测单元,其被配置为使用模型来预测所述候选比例下的产物的至少一个属性,其中,所述模型为使用多组训练数据通过机器学习训练得出的,所述多组训练数据中的每组训练数据包括:所述各成分中的至少一部分的一个比例和所述比例下的产物的所述至少一个属性的实测结果;以及第一判断单元,其被配置为判断所述候选比例下的所述产物的所述至少一个属性的预测结果是否满足预设条件:如果满足所述预设条件,则将所述候选比例确定为所述目标比例,否则,从所述初始比例和所述候选比例中选择至少一个来更新所述候选生成单元中的用来产生所述候选比例的所述初始比例,并重复上述步骤直到所述预测结果满足所述预设条件。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的装置中,还包括:第二判断单元:其被配置为判断所述目标比例下的所述产物的所述至少一个属性的实测结果是否满足所述预设条件:如果满足所述预设条件,则保留所述目标比例;否则,将所述目标比例和所述目标比例下的所述产物的所述至少一个属性的实测结果作为一组训练数据来继续训练所述模型。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的装置中,所述第一判断单元被配置为当所述预设条件包括对产物的多个属性的要求时,利用Pareto-Frontier帕累托最优法从所述初始比例和所述候选比例中选择至少一个来更新所述候选生成单元中的用来产生所述候选比例的所述初始比例。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的装置中,所述产物的属性包括所述产物的分散体属性、膜属性和/或应用属性。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的装置中,所述产物的所述分散体属性包括所述产物的固体含量、所述产物的粒径大小、所述产物的粘度、所述产物的PH值和/或所述产物的LV10分子量;以及/或者所述产物的所述膜属性包括所述产物的膜断裂伸长率、所述产物的膜100%模量、所述产物的抗拉强度和/或所述产物的摆杆硬度;以及/或者所述产物的所述应用属性包括所述产物的色牢度、所述产物的耐水解性、所述产物的水溶胀性和/或所述产物的光泽度。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的装置中,在所述编码单元中,所述编码为二进制编码、浮点编码和/或符号编码。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的装置中,在所述候选生成单元中,所述遗传算法包括通过交叉重组和/或突变由经过编码的所述初始比例产生所述候选比例。
作为上述方案的替代或补充,在根据本发明一实施例的确定化合物配方中各成分的目标比例的装置中,所述候选生成单元还被配置为对所述化合物配方中各成分的所述候选比例设置最大值和最小值。
根据本发明的再一方面,提供一种确定化合物的目标配方的系统,其包括:计算机处理器,计算机可读存储介质,存储在所述计算机可读存储介质上的程序指令,所述程序指令被所述计算机处理器执行时执行上述方法。
根据本发明的又一方面,提供一种计算机可读存储介质,其上具有指令,所述指令在被至少一个处理器执行时使所述至少一个处理器执行上述方法。
本发明的一方面通过机器学习模型与遗传算法的结合大大将降低了确定化合物配方比例所需的人力成本、时间成本。
附图说明
从结合附图的以下详细说明中,将会使本发明的上述和其他目的及优点更加完整清楚。
图1示出根据本发明的一个实施例的确定化合物配方中各成分的目标比例的方法1000的流程图。
图2示出根据本发明的一个实施例的利用Pareto-Frontier帕累托最优法在初始比例和候选比例中选择适当的比例更新初始比例。
图3示出根据本发明的一个实施例的确定化合物配方中各成分的目标比例的装置3000的方框图。
具体实施方式
需要说明的是,本文中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述对象在时间、空间、大小等方面的顺序。此外,除非另外特别指明,本文中的术语“包括”、“具备”以及类似表述意在表示不排他的包含。
首先,根据本发明的设计思想,提供了确定化合物配方中各成分的目标比例的方法。该方法包括以下步骤:a)对初始比例进行编码;b)通过遗传算法由经过编码的所述初始比例产生候选比例;c)使用模型来预测所述候选比例下的产物的至少一个属性,其中,所述模型为使用多组训练数据通过机器学习训练得出的,所述多组训练数据中的每组训练数据包括:所述各成分中的至少一部分的一个比例和所述比例下的产物的所述至少一个属性的实测结果;以及d)判断所述候选比例下的所述产物的所述至少一个属性的预测结果是否满足预设条件:如果满足所述预设条件,则将所述候选比例确定为所述目标比例,否则,从所述初始比例和所述候选比例中选择至少一个来更新步骤b)中用来产生所述候选比例的所述初始比例,并重复步骤b)-d)直到所述预测结果满足所述预设条件。
在下文中,将参考附图详细地描述根据本发明的各示例性实施例。
图1示出根据本发明的一个实施例的确定化合物配方中各成分的目标比例的方法1000的流程图。已知化合物A的配方中包括12种成分(如表1所示),通过方法1000来确定制备满足预设条件的化合物A所需的各成分的目标比例。
在步骤S110,对化合物A的配方中的12种成分的初始比例进行编码。此处,初始比例可以是随机确定的,可以是根据经验确定的,或者可以是根据其他任何适合的方式确定的。表1示出一种利用二进制编码对化合物A的12种成分的初始比例进行编码的示例。其中,在步骤S111,确定各成分在配方中的比例的最大值和最小值。以成分1为例,其最大值为85%,最小值为5%。此处,各成分的最大值和最小值可以来自历史数据、经验值、数据库等。在步骤S112,为每种成分分配合适的二进制编码长度。以成分1为示例,分配4位的长度供其进行编码。对于一种成分,分配的编码长度越长,供该成分的比例进行取值的二进制数的个数越多。也就是说,为该成分提供的编码精度越高。例如,对于成分1而言,分配4位二进制编码长度,则成分1的比例的潜在取值个数为16;形成对照,对于成分3而言,分配3位二进制编码长度,则成分3的比例的潜在取值个数为8。可选地,为最大值与最小值之间的差异相对大的成分分配相对多的编码长度,为最大值与最小值的差异相对小的成分分配相对少的编码长度。例如,成分1的最大值与最小值的差异为80%,而成分3的差异为10%,因而,为成分1分配4位二进制长度,而为成分3分配3位二进制长度。在步骤S113,将各初始成分转换为二进制形式。仍然以成分1为例,将初始比例15.7%转换为4位二进制数0010。类似地,对化合物A中其他成分的比例进行二进制编码。
需要注意的是,本发明并不旨在将对初始比例的编码限于二进制编码,而可以是任何适于后续步骤中遗传算法的编码形式,例如浮点编码、符号编码等。
表1 化合物A的成分及二进制编码
Figure 334835DEST_PATH_IMAGE002
在步骤S120,通过遗传算法由经过编码的初始比例产生化合物A配方中12种成分的候选比例。可选地,通过交叉重组、突变等操作来产生候选比例。
例如,如表2所示,初始比例1通过突变产生了候选比例1。具体而言,成分3的比例从101突变为001,成分5的比例从001突变为100。
在另外的示例中,初始比例1和2通过交叉重组产生了候选比例2和3。具体而言,初始比例1中成分1-3的值与初始比例2中成分4-12的值重组得到了候选比例2;初始比例1中成分4-12的值与初始比例2中成分1-3的值重组得到了候选比例3。
表2 化合物A的成分比例以及预测属性
Figure DEST_PATH_IMAGE004
在步骤S130,使用模型来预测候选比例(例如,候选比例1、候选比例2、候选比例3)下的产物的至少一个属性。
在本发明的上下文中,术语反应产物的“属性”可以是反应产物的分散体属性、膜属性、应用属性等任何能够体现产物特定性质的指标。其中,反应产物的分散体属性包括但不限于产物的固体含量、粒径大小、粘度、PH值、LV10分子量。反应产物的膜性能包括但不限于产物的膜断裂伸长率、膜100%模量、抗拉强度、摆杆硬度。反应产物的应用属性包括但不限于产物的色牢度、耐水解性、水溶胀性、光泽度。
在步骤S130中,预测模型是使用多组训练数据通过机器学习训练得出的。该模型可以用来模拟制备化合物的反应,从而预测给定比例下的反应产物的各种属性。其中,每组训练数据包括化合物A中12种成分的至少一部分的一个配方比例和该比例下实测的产物属性。此处的一个配方比例是经过实际人工试验的配方比例,因而其能够知晓其实测的产物属性。这样的一个配方比例可包括化合物A中所有12种成分,也可以包括化合物A中12种成分的一部分。在一个示例中,可以通过下述步骤来模拟制备化合物的反应:确定该配方中的各成分所包含的反应分子;确定与每个反应分子对应的官能团;针对每个官能团分配官能团类型;确定与各官能团类型对应的反应规则;并且,基于这些反应规则来模拟从配方中的反应分子(即,配方中的各成分)来制备化合物的反应,得到反应产物的属性。
在步骤S140,判断步骤S130中对于候选比例预测的产物属性是否满足预设条件。如果满足预设条件,则将该候选比例确定为化合物A配方中12种成分的目标比例。如果不满足预设条件,则从步骤S110中编码得到的初始比例和步骤S120中通过遗传算法得到的候选比例中选择至少一个比例来更新步骤S120中用来产生候选比例的初始比例,并重复步骤S120-S140直到预测的属性满足预设条件为止。
在本发明的上下文中,术语“预设条件”旨在表示针对反应产物的至少一个属性预先设置的条件。例如,在表2中所示的示例中,预设条件为属性1(即,粒径大小)不大于80nm,并且膜100%模量在之间。由表2可见,从初始比例1和初始比例2通过交叉重组得到的候选比例2和候选比例3均未能满足预设条件,具体而言,候选比例2和3的属性1均大于预设的最大值80nm,并且候选比例2和3的属性2均未落入预设的区间2-3Mpa。因此,需要从初始比例1和2以及候选比例2和3中选择至少一个比例来更新步骤S120中用来产生候选比例的初始比例,例如,选择对应的属性最接近预设条件的比例来更新该初始比例。最后,重复步骤S120-S140直到预测的反应产物属性满足预设条件为止。
在步骤S140中,如果预设条件包括对产物的多个属性的要求时,可以利用Pareto-Frontier帕累托最优法在初始比例和候选比例中选择适当的比例更新步骤S120中用来产生候选比例的初始比例。通过帕累托优化算法能够进一步提高确定目标配方的效率。
下面仍然以表2中的初始比例1、2以及候选比例2、3为例,参考图2来说明如何基于涉及两个属性的预设条件来从这四个比例中选择两个适当的比例来更新步骤S120中的初始比例,进而在步骤S120中通过对所选择的两个比例进行交叉重组来产生下一代候选比例。
首先,以反应产物的粒径大小(即,属性1)为横坐标,膜100%模量与预设条件中值2.5Mpa的偏差(即,属性2)为纵坐标将四个待选比例绘制在参考系中。根据预设条件(即,粒径大小≤80nm,并且膜100%模量在2-3Mpa之间),找到参考点(80,0)。由图2可见,对应于每个比例的点与参考点之间都能够形成一个矩形。从四个比例中选择最优的两个比例就是要从四个比例中选择其与参考点构成的矩形面积最小的两个比例。
在图2中,由于初始比例2位于初始比例1与参考点构成的矩形内部,因此初始比例2与参考点之间的矩形面积一定小于初始比例1与参考点之间的矩形面积。这也可以称为初始比例2主导初始比例1,即,初始比例2优于初始比例1。分别计算候选比例2、3以及初始比例2与参考点之间的矩形面积,得到:初始比例2为37.9,候选比例2为28.7,候选比例3为22.02。可见,候选比例3优于候选比例2,候选比例2初始比例2。因此,四个比例中最优的两个比例即为候选比例2和3。
虽然未在图1中示出,确定化合物配方中各成分的目标比例的方法1000还可包括步骤S150。在步骤S150中,判断步骤S140中所确定的目标比例在实际试验中得到的反应产物的实测属性是否也满足预设条件。如果实测属性也满足预设条件,则保留该目标比例,否则,将该目标比例与其属性的实测结果作为一组训练数据输入机器学习模型,继续训练模型。由此,通过实际试验来验证基于机器学习模型的预测而选择的目标比例是否实际上也符合要求。
虽然图1中示出了各个步骤以特定顺序接续执行,但是这样的顺序仅仅是示例性的,本发明并不旨在将步骤之间的顺序限制为图1所示例的那样。例如,依次示出的两个步骤实际上可以基本上同时执行,或者有些步骤有时可以按照逆序执行,这取决于步骤中所涉及的功能或操作。
图3示出根据本发明的一个实施例的确定化合物配方中各成分的目标比例的装置3000的方框图。装置3000包括编码单元310、候选生成单元320、预测单元330和第一判断单元340。
编码单元310配置为对化合物配方中各成分的初始比例进行编码。与前文类似地,此处“初始比例”可以是随机确定的,可以是根据经验确定的,或者可以是根据其他任何适合的方式确定的;此处“编码”可以是二进制编码、也可以是浮点编码、符号编码等任何适于装置3000中遗传算法的编码形式。
候选生成单元320配置为通过遗传算法由经过编码单元320编码的初始比例产生化合物配方中各成分的候选比例。例如,通过遗传算法中的交叉重组、突变等操作来产生候选比例。
预测单元330配置为使用模型来预测候选生成单元320中产生的候选比例下的产物的属性。与前文类似地,反应产物的属性可以例如是反应产物的分散体属性、膜属性、应用属性等任何能够体现产物特定性质的指标。
预测单元330中使用的模型为使用多组训练数据通过机器学习训练得出的。其中,多组训练数据中的每组训练数据包括一组成分比例和该比例下的产物的至少一个属性的实测结果。
第一判断单元340配置为判断候选比例下的产物的至少一个属性在预测单元330中的预测结果是否满足预设条件。如果满足预设条件,则将该候选比例确定为化合物配方中各成分的目标比例,否则,从初始比例和候选比例中选择至少一个比例来更新候选生成单元320中的初始比例,并重复上述步骤直到预测结果满足预设条件。如前所述,预设条件包括对反应产物的至少一个属性预先设置的条件。例如,产物的粒径大小不能超过80nm、产物的膜100%模量在2-3Mpa之间等。
装置3000还可包括第二判断单元350(虚线框示出),其配置为判断目标比例下的产物的至少一个属性的实测结果是否也满足预设条件:如果满足所述预设条件,则保留目标比例;否则,将这组目标比例和该目标比例下的反应产物的属性的实测结果作为一组训练数据来继续训练模型,从而进一步提高该模型的准确度。由此,通过实际试验来验证预测单元330中机器学习模型的预测结果是否与实测结果一致。
根据本发明的一个实施例,第一判断单元340还可配置为当预设条件包括对产物的多个属性的要求时,利用Pareto-Frontier帕累托最优法从初始比例和候选比例中选择至少一个比例来更新候选生成单元320中的初始比例。例如,参考图2,可以通过Pareto-Frontier帕累托最优法基于属性1和属性2从初始比例1和2以及候选比例2和3中选择两个最优的比例来更新候选生成单元320中的初始比例,进而在候选生成单元320中通过交叉重组产生下一代候选比例。
图2中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或者在一个或多个硬件模块或集成电路中实现这些功能实体,或者在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
应当理解,根据本发明的前述实施例的确定化合物配方中各成分的目标比例的方法能够通过计算机程序来实现。所述计算机程序可以采用存储于计算机存储介质上的指令的形式。通过示例的方式,这样的计算机存储介质能够包括RAM、ROM、EPROM、EEPROM或光盘存储设备、磁盘存储设备或其它磁存储装置或能够用于承载或存储呈机器可执行指令或数据结构的形式的期望的程序代码并且能够被处理器访问的任何其它介质。处理器能够执行存储在计算机存储介质上的指令,从而实现本发明的前述实施例的方法来确定化合物配方中各成分的目标比例。
综上所述,本发明中的技术方案,通过利用机器学习模型来模拟化合物的反应,省去了大量的人工试验,大大节省了时间、人力成本。例如,在表2的示例中,如果对成分1的16个取值进行试验,类似地,对成分2的16个取值进行试验,……对成分12的8个取值进行试验,那么使用传统人工试验的方法来寻找目标配方,需要进行16 * 16 * 8 * 4 * 8 * 8 *8 * 4* 8* 4 * 4 * 8 = 17179869184次人工试验,而利用本发明中的技术方案,仅在对预测结果进行验证时才需进行人工试验。
进一步,本发明通过遗传算法来确定候选比例,降低了需要机器学习模型预测的配方数量,使得快速确定合适的目标配方成为可能,提高了预测效率。更进一步,本发明中的技术方案还使用帕累托优化算法来平衡对多个属性的预设条件,进一步提高了预测目标配方的效率。在表2的示例中,如果对所有可能的配方进行预测,则需要利用机器学习模型进行17179869184次配方预测;然而,在本发明所提出的方案中,利用遗传算法和帕累托优化仅进行了2000次迭代(其中,利用机器学习模型进行了大约40000次配方预测)就确定了符合预设条件的目标配方。
此外,本发明中的技术方案还提出了利用人工实测数据来验证机器学习模型的预测结果,提高了最终确定的目标比例的准确性。
以上尽管只对其中一些本发明的实施方式进行了描述,但是本领域普通技术人员应当了解,本发明可以在不偏离其主旨与范围内以许多其他的形式实施。因此,所展示的例子与实施方式被视为示意性的而非限制性的,在不脱离如所附各权利要求所定义的本发明精神及范围的情况下,本发明可能涵盖各种的修改与替换。

Claims (18)

1.一种确定化合物配方中各成分的目标比例的方法,其特征在于,所述方法包括:
a)对初始比例进行编码;
b)通过遗传算法由经过编码的所述初始比例产生候选比例;
c)使用模型来预测所述候选比例下的产物的至少一个属性,
其中,所述模型为使用多组训练数据通过机器学习训练得出的,所述多组训练数据中的每组训练数据包括:所述各成分中的至少一部分的一个比例和所述比例下的产物的所述至少一个属性的实测结果;以及
d)判断所述候选比例下的所述产物的所述至少一个属性的预测结果是否满足预设条件:
如果满足所述预设条件,则将所述候选比例确定为所述目标比例,
否则,从所述初始比例和所述候选比例中选择至少一个来更新步骤b)中用来产生所述候选比例的所述初始比例,并重复步骤b)-d)直到所述预测结果满足所述预设条件。
2.根据权利要求1所述的方法,其中,还包括:
e)判断所述目标比例下的所述产物的所述至少一个属性的实测结果是否满足所述预设条件:
如果满足所述预设条件,则保留所述目标比例;
否则,将所述目标比例和所述目标比例下的所述产物的所述至少一个属性的实测结果作为一组训练数据来继续训练所述模型。
3.根据权利要求1所述的方法,其中,
在步骤d)中,当所述预设条件包括对产物的多个属性的要求时,利用Pareto-Frontier帕累托最优法从所述初始比例和所述候选比例中选择至少一个来更新步骤b)中的用来产生所述候选比例的所述初始比例。
4.根据权利要求1所述的方法,其中,
所述产物的属性包括所述产物的分散体属性、膜属性和/或应用属性。
5.根据权利要求4所述的方法,其中,
所述产物的所述分散体属性包括所述产物的固体含量、所述产物的粒径大小、所述产物的粘度、所述产物的PH值和/或所述产物的LV10分子量;以及/或者
所述产物的所述膜属性包括所述产物的膜断裂伸长率、所述产物的膜100%模量、所述产物的抗拉强度和/或所述产物的摆杆硬度;以及/或者
所述产物的所述应用属性包括所述产物的色牢度、所述产物的耐水解性、所述产物的水溶胀性和/或所述产物的光泽度。
6.根据权利要求1所述的方法,其中,
在所述步骤a)中,所述编码为二进制编码、浮点编码和/或符号编码。
7.根据权利要求1所述的方法,其中,
在所述步骤b)中,所述遗传算法包括通过交叉重组和/或突变由经过编码的所述初始比例产生所述候选比例。
8.根据权利要求1所述的方法,其特征在于,
在步骤b)中,对所述化合物配方中各成分的所述候选比例设置最大值和最小值。
9.一种确定化合物配方中各成分的目标比例的装置,其特征在于,该装置包括:
编码单元,其被配置为对初始比例进行编码;
候选生成单元,其被配置为通过遗传算法由经过编码的所述初始比例产生候选比例;
预测单元,其被配置为使用模型来预测所述候选比例下的产物的至少一个属性,
其中,所述模型为使用多组训练数据通过机器学习训练得出的,所述多组训练数据中的每组训练数据包括:所述各成分中的至少一部分的一个比例和所述比例下的产物的所述至少一个属性的实测结果;以及
第一判断单元,其被配置为判断所述候选比例下的所述产物的所述至少一个属性的预测结果是否满足预设条件:
如果满足所述预设条件,则将所述候选比例确定为所述目标比例,
否则,从所述初始比例和所述候选比例中选择至少一个来更新所述候选生成单元中的用来产生所述候选比例的所述初始比例,并重复上述步骤直到所述预测结果满足所述预设条件。
10.根据权利要求9所述的装置,其中,还包括:
第二判断单元:其被配置为判断所述目标比例下的所述产物的所述至少一个属性的实测结果是否满足所述预设条件:
如果满足所述预设条件,则保留所述目标比例;
否则,将所述目标比例和所述目标比例下的所述产物的所述至少一个属性的实测结果作为一组训练数据来继续训练所述模型。
11.根据权利要求9所述的装置,其中,
所述第一判断单元被配置为当所述预设条件包括对产物的多个属性的要求时,利用Pareto-Frontier帕累托最优法从所述初始比例和所述候选比例中选择至少一个来更新所述候选生成单元中的用来产生所述候选比例的所述初始比例。
12.根据权利要求9所述的所述的装置,其中,
所述产物的属性包括所述产物的分散体属性、膜属性和/或应用属性。
13.根据权利要求12所述的所述的装置,其中,
所述产物的所述分散体属性包括所述产物的固体含量、所述产物的粒径大小、所述产物的粘度、所述产物的PH值和/或所述产物的LV10分子量;以及/或者
所述产物的所述膜属性包括所述产物的膜断裂伸长率、所述产物的膜100%模量、所述产物的抗拉强度和/或所述产物的摆杆硬度;以及/或者
所述产物的所述应用属性包括所述产物的色牢度、所述产物的耐水解性、所述产物的水溶胀性和/或所述产物的光泽度。
14.根据权利要求9所述的装置,其中,
在所述编码单元中,所述编码为二进制编码、浮点编码和/或符号编码。
15.根据权利要求9所述的装置,其中,
在所述候选生成单元中,所述遗传算法包括通过交叉重组和/或突变由经过编码的所述初始比例产生所述候选比例。
16.根据权利要求9所述的方法,其中,
所述候选生成单元还被配置为对所述化合物配方中各成分的所述候选比例设置最大值和最小值。
17.一种确定化合物的目标配方的系统,其特征在于,包括:
计算机处理器,
计算机可读存储介质,
存储在所述计算机可读存储介质上的程序指令,所述程序指令被所述计算机处理器执行时执行根据权利要求1至8中任一项所述的方法。
18.一种计算机可读存储介质,其上具有指令,其特征在于,所述指令在被至少一个处理器执行时使所述至少一个处理器执行根据权利要求1至8中任一项所述的方法。
CN202110830859.5A 2021-07-22 2021-07-22 确定化合物配方中各成分的目标比例的方法和装置 Pending CN115688537A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202110830859.5A CN115688537A (zh) 2021-07-22 2021-07-22 确定化合物配方中各成分的目标比例的方法和装置
EP21198315.0A EP4123524A1 (en) 2021-07-22 2021-09-22 Method and device for determining target proportion of components in compound recipe

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110830859.5A CN115688537A (zh) 2021-07-22 2021-07-22 确定化合物配方中各成分的目标比例的方法和装置

Publications (1)

Publication Number Publication Date
CN115688537A true CN115688537A (zh) 2023-02-03

Family

ID=78134725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110830859.5A Pending CN115688537A (zh) 2021-07-22 2021-07-22 确定化合物配方中各成分的目标比例的方法和装置

Country Status (2)

Country Link
EP (1) EP4123524A1 (zh)
CN (1) CN115688537A (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2564570T3 (es) * 2002-03-01 2016-03-23 Codexis Mayflower Holdings, Llc Métodos, sistemas y software para la identificación de biomoléculas funcionales
US8838510B2 (en) * 2011-09-16 2014-09-16 International Business Machines Corporation Choosing pattern recognition algorithms and data features using a genetic algorithm
GB201209239D0 (en) * 2012-05-25 2012-07-04 Univ Glasgow Methods of evolutionary synthesis including embodied chemical synthesis

Also Published As

Publication number Publication date
EP4123524A1 (en) 2023-01-25

Similar Documents

Publication Publication Date Title
AU2022202698B2 (en) Systems and methods for making a product
Madandoust et al. Evolutionary design of generalized GMDH-type neural network for prediction of concrete compressive strength using UPV
CN106951736B (zh) 一种基于多重进化矩阵的蛋白质二级结构预测方法
CN111832101B (zh) 一种水泥强度预测模型的构建方法及水泥强度预测方法
JP2020030683A (ja) ゴム材料設計方法、ゴム材料設計装置、及びプログラム
CN113377964B (zh) 知识图谱链接预测方法、装置、设备及存储介质
CN115688537A (zh) 确定化合物配方中各成分的目标比例的方法和装置
US11972987B2 (en) Die level product modeling without die level input data
Papageorgaki et al. Optimal design of multipurpose batch plants. 2. A decomposition solution strategy
WO2021055398A1 (en) Method for simulating oligomer or polymer growth
CN109376865B (zh) 一种基于离散型贝叶斯网络的桁架结构安全性评估方法
Pusponegoro et al. Group Lasso for rainfall data modeling in Indramayu district, West Java, Indonesia
Castillo et al. Using genetic programming in industrial statistical model building
CN113361025B (zh) 一种基于机器学习的蠕变疲劳概率损伤评定方法
CN114169185A (zh) 基于Kriging的随机和区间不确定性混合下系统可靠性分析方法
CN113946975A (zh) 一种基于Copula的PNET桥梁体系可靠性评估方法
Scott et al. Bayesian design of experiments applied to a complex polymerization system: Nitrile Butadiene Rubber production in a train of CSTRs
EP2693388A1 (en) Risk-profile generation device
Keprate et al. Remaining Fatigue life prediction of topside piping using response surface models
TW202131240A (zh) 藉由累積預測進行的機器學習變數選定及根本原因發現
Sinuany-Stern et al. An efficient heuristic for a partially observable Markov decision process of machine replacement
CN112185466A (zh) 直接利用蛋白质多序列联配信息构建蛋白质结构的方法
Chonghyo et al. Prediction for heat deflection temperature of polypropylene composite with Catboost
CN112016243B (zh) 一种基于响应曲面的交通流量预测模型参数标定方法
CN118010614B (zh) 共混型互穿网络热塑性弹性体的耐腐蚀性检测方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication