CN114730351A

CN114730351A - 信息处理系统、信息处理方法及信息处理程序

Info

Publication number: CN114730351A
Application number: CN202080078167.3A
Authority: CN
Inventors: 花冈恭平
Original assignee: Showa Denko KK
Current assignee: Resonac Holdings Corp
Priority date: 2019-11-11
Filing date: 2020-11-10
Publication date: 2022-07-08
Also published as: EP4044063A4; WO2021095722A1; US20220392584A1; JPWO2021095722A1; EP4044063A1; KR20220092551A

Abstract

一实施方式所涉及的信息处理系统针对多个成分对象的每一个获取数值表示及复合比，通过将与多个成分对象对应的多个数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量，通过针对多个成分对象的每一个将复合比适用于第1特征矢量，计算该多个成分对象各自的第2特征矢量，通过将与多个成分对象对应的多个第2特征矢量输入到第2机器学习模型，计算表示通过使多个成分对象复合而获得的复合对象的特征的复合特征矢量。

Description

信息处理系统、信息处理方法及信息处理程序

技术领域

本发明的一方式涉及一种信息处理系统、信息处理方法及信息处理程序。

背景技术

使用利用机器学习对通过使多个成分对象复合而获得的复合对象进行分析的方法。例如，专利文献1中记载了预测生物高分子的立体结构与化合物的立体结构的键合性的方法。该方法包括：根据生物高分子的立体结构和化合物的立体结构，生成生物高分子与化合物的复合体的预测立体结构的步骤；将该预测立体结构变换为表示与相互作用模式的核对结果的预测立体结构矢量的步骤；及通过使用机器学习算法判断该预测立体结构矢量，预测生物高分子的立体结构与化合物的立体结构的键合性的步骤。

以往技术文献

专利文献

专利文献1：日本特开2019-28879号公报

发明内容

发明要解决的技术课题

在成分对象多样或存在多个的情况下，针对这些成分对象无法准备足够量的数据，其结果，复合对象的分析精度有可能无法达到所期待的水准。因此，期望一种用于即使在针对成分对象无法准备足够量的数据的情况下也提高复合对象的分析精度的结构。

用于解决技术课题的手段

本发明的一方式所涉及的信息处理系统具备至少一个处理器。至少一个处理器针对多个成分对象的每一个获取数值表示及复合比，通过将与多个成分对象对应的多个数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量，通过针对多个成分对象的每一个将复合比适用于第1特征矢量，计算该多个成分对象各自的第2特征矢量，通过将与多个成分对象对应的多个第2特征矢量输入到第2机器学习模型，计算表示通过使多个成分对象复合而获得的复合对象的特征的复合特征矢量，输出复合特征矢量。

在这样的方式中，在考虑复合比之前，构成复合对象的各成分对象的特征被明显化。因此，即使在针对成分对象无法准备足够量的数据的情况下，也能够提高复合对象的分析精度。

发明效果

根据本发明的一方式，即使在针对成分对象无法准备足够量的数据的情况下，也能够提高复合对象的分析精度。

附图说明

图1是表示构成实施方式所涉及的信息处理系统的计算机的硬件结构的一例的图。

图2是表示实施方式所涉及的信息处理系统的功能结构的一例的图。

图3是表示实施方式所涉及的信息处理系统的动作的一例的流程图。

图4是使用数据的具体例对实施方式所涉及的信息处理系统的动作进行说明的图。

具体实施方式

以下，参考附图，对本发明中的实施方式详细地进行说明。另外，在附图说明中，对于相同或等同的要件标注相同的符号，省略重复的说明。

[系统的概要]

实施方式所涉及的信息处理系统10是执行与通过以给定的复合比使多个成分对象复合而获得的复合对象有关的分析的计算机系统。成分对象是指用于生成复合对象的有体物或无体物。复合对象可以是有体物或无体物。作为有体物的例子，可举出任意物质或物体。作为无体物的例子，可举出数据及信息。“使多个成分对象复合”是指将多个成分对象作为一个对象，即复合对象的处理。复合的方法没有限定，例如可以是配合、调配、合成、结合、混合、合并、组合、化合、或合体，也可以是其他方法。与复合对象有关的分析是指用于获得表示复合对象的某些特征的数据的处理。

多个成分对象可以是任意多种材料，在该情况下，复合对象是由这些材料生成的多成分物质。材料是指用于生成多成分物质的任意构成要素。例如，多个材料可以是任意多种分子或原子，在该情况下，复合对象是通过以任意方法复合这些分子或原子而获得的多成分物质。例如，材料可以是聚合物，与此相对，多成分物质可以是聚合物合金。材料可以是单体，与此相对，多成分物质可以是聚合物。材料可以是药物，即具有药理作用的化学物质，与此相对，多成分物质可以是药剂。

信息处理系统10为了与复合对象有关的分析而执行机器学习。机器学习是指通过根据给定的信息进行学习而自主地找出定律或规则的方法。机器学习的具体的方法没有限定。例如，信息处理系统10可以使用作为包含神经网络而构成的计算模型的机器学习模型来执行机器学习。神经网络是指模拟人的脑神经系统的结构的信息处理模型。作为更具体的例子，信息处理系统10也可以使用图神经网络(GNN)、卷积神经网络(CNN)、循环神经网络(RNN)、注意力RNN(Attention RNN)及多头注意力(Multi-Head Attention)中的至少一个来执行机器学习。

[系统的结构]

信息处理系统10由1台以上的计算机构成。在使用多台计算机的情况下，这些计算机经由互联网、内部网等通信网络连接，从而逻辑上构建一个信息处理系统10。

图1是表示构成信息处理系统10的计算机100的一般硬件结构的一例的图。例如，计算机100具备执行操作系统、应用程序等的处理器(例如CPU)101、由ROM及RAM构成的主存储部102、由硬盘、闪存等构成的辅助存储部103、由网卡或无线通信模块构成的通信控制部104、键盘、鼠标等输入装置105、及监视器等输出装置106。

信息处理系统10的各功能要件通过在处理器101或主存储部102上读入预先设定的程序并使处理器101执行该程序来实现。处理器101按照该程序，使通信控制部104、输入装置105、或输出装置106动作，进行主存储部102或辅助存储部103中的数据的读出及写入。处理所需的数据或数据库存储在主存储部102或辅助存储部103内。

图2是表示信息处理系统10的功能结构的一例的图。信息处理系统10具备获取部11、第1学习部12、比率适用部13、第2学习部14及预测部15作为功能要件。

获取部11是获取与多个成分对象有关的数据的功能要件。具体而言，获取部11针对多个成分对象的每一个获取数值表示及复合比。成分对象的数值表示是指使用多个数值表示成分对象的任意属性的数据。成分对象的属性是指成分对象所具备的性质或特征。数值表示可以通过各种方法进行可视化，例如可以通过数字、英文字符、文本、分子图、矢量、图像、时序数据等方法进行可视化，也可以通过这些方法中的任意2个以上的组合可视化。构成数值表示的各个数值可以用十进制表示，也可以用二进制、十六进制等其他标记法表示。成分对象的复合比是指多个成分对象之间的比例。复合比的具体的种类、单位及表示方法没有限定，可以根据成分对象或复合对象任意设定。例如复合比可以用百分率等比率、或直方图来表示，也可以用各个成分对象的绝对量来表示。

第1学习部12是通过使用第1机器学习模型的第1机器学习，针对多个成分对象的每一个，计算作为表示该成分对象的特征的矢量的第1特征矢量的功能要件。成分对象的特征是指使该成分对象与其他对象不同的任意要素。矢量是指具有n个数值的n维的量，能够表示为1维的排列。

比率适用部13是通过针对多个成分对象的每一个将复合比适用于第1矢量来计算多个成分对象各自的第2特征矢量的功能要件。

第2学习部14是通过使用第2机器学习模型的第2机器学习来计算作为表示复合对象的特征的矢量的复合特征矢量的功能要件。复合对象的特征是指使该复合对象与其他对象不同的任意要素。

预测部15是预测复合对象的特性并输出其预测值的功能要件。复合对象的特性是指复合对象所具有的特有的性质。

在一例中，第1机器学习模型及第2机器学习模型均为期待推算精度最高的学习完毕模型，因此能够称为“最佳机器学习模型”。然而，应该注意，该学习完毕模型并不限于“现实中最佳”。通过由给定的计算机处理包含输入矢量和标签的多个组合的教师数据来生成学习完毕模型。给定的计算机通过将输入矢量输入到机器学习模型来计算输出矢量，求出从所计算的输出矢量获得的预测值与由教师数据表示的标签的误差(即，推算结果与正确答案之差)。并且，计算机根据该误差更新机器学习模型内的给定的参数。计算机通过重复这样的学习来生成学习完毕模型。生成学习完毕模型的计算机没有限定，例如可以是信息处理系统10，也可以是其他计算机系统。生成学习完毕模型的处理能够称为学习阶段，利用该学习完毕模型的处理能够称为运用阶段。

[数据]

如上所述，各个成分对象可以是材料，复合对象可以是多成分物质。在该情况下，成分对象(材料)的数值表示可以包含表示材料的化学结构的数值，也可以包含表示材料的化学结构的构成重复单元(CRU)的数值。复合比可以是配合比或混合比。复合对象(多成分物质)的特性的预测值可以表示多成分物质的玻璃化转变温度(Tg)及弹性模量中的至少一个。

[系统的动作]

参考图3及图4，对信息处理系统10的动作进行说明，并且对本实施方式所涉及的信息处理方法进行说明。图3是将信息处理系统10的动作的一例作为处理流程S1表示的流程图。图4是使用数据的具体例表示信息处理系统10的动作的图。

在步骤S11中，获取部11针对多个成分对象的每一个获取数值表示及复合比。在图4中表示两个成分对象Ea、Eb作为多个成分对象的例子。成分对象Ea的数值表示为{1，1，2，3，4，3，3，5，6，7，5，4}，成分对象Eb的数值表示为{1，1，5，6，4，3，3，5，1，7，0，0}。成分对象Ea、Eb的复合比分别为0.7、0.3，因此，这是指以7:3的比例使用成分对象Ea、Eb来获得复合对象。

获取部11可以通过任意方法获取多个成分对象各自的数据。例如，获取部11可以通过访问给定的数据库来读出数据，也可以从其他计算机或计算机系统接收数据，还可以接受由信息处理系统10的用户输入的数据。或者，获取部11也可以通过这些方法中的任意2种以上来获取数据。

在步骤S12中，第1学习部12通过第1机器学习，针对多个成分对象的每一个，根据数值表示计算第1特征矢量。具体而言，第1学习部12通过将与多个成分对象对应的多个数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量。在一例中，第1学习部12针对多个成分对象的每一个，将与该成分对象对应的数值表示输入到第1机器学习模型，由此计算该成分对象的第1特征矢量。第1机器学习模型没有限定，可以考虑成分对象及复合对象的种类等因素而以任意方针决定。例如，第1学习部12可以使用图神经网络(GNN)、卷积神经网络(CNN)或循环神经网络(RNN)来执行第1机器学习。

在图4的例子中，第1学习部12通过将成分对象Ea的数值表示{1，1，2，3，4，3，3，5，6，7，5，4}输入到第1机器学习模型，计算第1特征矢量{1，1，4，1，3，1}。并且，第1学习部12通过将成分对象Eb的数值表示{1，1，5，6，4，3，3，5，1，7，0，0}输入到第1机器学习模型，计算第1特征矢量{3，3，1，1，0，0}。

在步骤S13中，比率适用部13通过针对多个成分对象的每一个将复合比适用于第1特征矢量来计算第2特征矢量。“将复合比适用于第1特征矢量”是指根据复合比改变第1特征矢量的处理。其适用方法没有限定。例如，比率适用部13可以通过将复合比作为追加的成分与第1特征矢量连结来执行其适用。或者，比率适用部13也可以通过将复合比与第1特征矢量各自的成分相乘或相加来执行其适用。

在图4的例子中，比率适用部13将复合比作为成分与第1特征矢量连结。即，比率适用部13通过将复合比0.7与成分对象Ea的第1特征矢量{1，1，4，1，3，1}连结，计算第2特征矢量{1，1，4，1，3，1，0.7}。并且，比率适用部13通过将复合比0.3与成分对象Eb的第1特征矢量{3，3，1，1，0，0}连结，计算第2特征矢量{3，3，1，1，0，0，0.3}。

在步骤S14中，第2学习部14通过第2机器学习，根据多个第2特征矢量计算复合特征矢量。在一例中，第2学习部14通过将与多个成分对象对应的多个第2特征矢量的集合输入到第2机器学习模型来计算复合特征矢量。第2机器学习模型没有限定，可以考虑成分对象及复合对象的种类等因素而以任意方针决定。例如，第2机器学习模型可以是能够考虑集合的要素的组合的影响的学习模型，也可以是不能考虑其影响的学习模型。作为前者的例子，可举出注意力RNN(Attention RNN)及多头注意力(Multi-Head Attention)。

在图4的例子中，第2学习部14通过将成分对象Ea的第2特征矢量{1，1，4，1，3，1，0.7}和成分对象Ea的第2特征矢量{3，3，1，1，0，0，0.3}输入到第2机器学习模型，计算复合特征矢量{1，0，4，6，5，4}。

在步骤S15中，第2学习部14输出复合特征矢量。在本实施方式中，第2学习部14为了信息处理系统10中的后续处理，将复合特征矢量输出到预测部15。然而，复合特征矢量的输出方法并不限定于此，可以以任意方针设计。例如，第2学习部14可以将复合特征矢量存储在给定的数据库中，也可以发送到其他计算机或计算机系统，还可以显示在显示装置上。

在步骤S16中，预测部15根据复合特征矢量计算复合对象的特性的预测值。预测方法没有限定，可以以任意方针设计。例如，预测部15可以通过第3机器学习，根据复合特征矢量计算预测值。具体而言，预测部15通过将复合特征矢量输入到第3机器学习模型，计算预测值。第3机器学习模型没有限定，可以考虑复合对象的种类等因素而以任意方针决定。例如，预测部15也可以使用解决回归问题或分类问题的任意神经网络来执行第3机器学习。典型地，回归问题的预测值用数值表示，分类问题的预测值表示类别。预测部15也可以使用除了机器学习以外的方法来计算预测值。

在步骤S17中，预测部15输出该预测值。预测值的输出方法没有限定。例如，预测部15可以将预测值存储在给定的数据库中，也可以发送到其他计算机或计算机系统，还可以显示在显示装置上。或者，预测部15也可以为了信息处理系统10中的后续处理，将预测值输出到其他功能要件。

[程序]

用于使计算机或计算机系统作为信息处理系统10发挥功能的信息处理程序包含用于使该计算机系统作为获取部11、第1学习部12、比率适用部13、第2学习部14及预测部15发挥功能的程序代码。该信息处理程序可以在固定地记录在CD-ROM、DVD-ROM、半导体存储器等有形记录介质的基础上提供。或者，信息处理程序也可以作为叠加在载波上的数据信号而经由通信网络提供。所提供的信息处理程序例如存储在辅助存储部103中。处理器101从辅助存储部103读出并执行该信息处理程序，由此实现上述各功能要件。

[效果]

如以上说明，本发明的一方式所涉及的信息处理系统具备至少一个处理器。至少一个处理器针对多个成分对象的每一个获取数值表示及复合比，通过将与多个成分对象对应的多个数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量，通过针对多个成分对象的每一个将复合比适用于第1特征矢量，计算该多个成分对象各自的第2特征矢量，通过将与多个成分对象对应的多个第2特征矢量输入到第2机器学习模型，计算表示通过使多个成分对象复合而获得的复合对象的特征的复合特征矢量，输出复合特征矢量。

本发明的一方式所涉及的信息处理方法由具备至少一个处理器的信息处理系统执行。信息处理方法包括如下：针对多个成分对象的每一个获取数值表示及复合比的步骤；通过将与所述多个成分对象对应的多个所述数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量的步骤；通过针对所述多个成分对象的每一个将所述复合比适用于所述第1特征矢量，计算该多个成分对象各自的第2特征矢量的步骤；通过将与所述多个成分对象对应的多个所述第2特征矢量输入到第2机器学习模型，计算表示通过使所述多个成分对象复合而获得的复合对象的特征的复合特征矢量的步骤；及输出所述复合特征矢量的步骤。

本发明的一方式所涉及的信息处理程序使计算机执行如下步骤：针对多个成分对象的每一个获取数值表示及复合比的步骤；通过将与所述多个成分对象对应的多个所述数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量的步骤；通过针对所述多个成分对象的每一个将所述复合比适用于所述第1特征矢量，计算该多个成分对象各自的第2特征矢量的步骤；通过将与所述多个成分对象对应的多个所述第2特征矢量输入到第2机器学习模型，计算表示通过使所述多个成分对象复合而获得的复合对象的特征的复合特征矢量的步骤；及输出所述复合特征矢量的步骤。

在另一方式所涉及的信息处理系统中，至少一个处理器可以通过进行将复合比与第1特征矢量连结、将复合比与第1特征矢量各自的成分相乘、及将复合比与第1特征矢量各自的成分相加中的一个，将复合比适用于第1特征矢量。在该情况下，能够通过简单的运算将复合比适用于第1特征矢量。

在另一方式所涉及的信息处理系统中，至少一个处理器可以通过将复合特征矢量输入到第3机器学习模型，计算复合对象的特性的预测值，并输出预测值。通过该处理，能够高精度地计算复合对象的特性。

在另一方式所涉及的信息处理系统中，成分对象可以是材料，复合对象可以是多成分物质。在该情况下，在考虑复合比之前，构成多成分物质的各材料的特征被明显化。因此，即使在对材料无法准备足够量的数据的情况下，也能够提高多成分物质的分析精度。

在另一方式所涉及的信息处理系统中，材料可以是聚合物，多成分物质可以是聚合物合金。在该情况下，在考虑复合比之前，构成聚合物合金的各聚合物的特征被明显化。因此，即使在对聚合物无法准备足够量的数据的情况下，也能够提高聚合物合金的分析精度。聚合物合金非常多样，与此相对，聚合物的种类也庞大。对于这样的聚合物及聚合物合金，一般只能对可取的组合的一部分进行实验，因此大多数情况下无法获得足够量的数据。根据本方式，即使在这样数据不充分的情况下，也能够高精度地分析聚合物合金。

[变形例]

以上，根据其实施方式对本发明详细地进行说明。然而，本发明并不限定于上述实施方式。本发明能够在不脱离其主旨的范围内进行各种变形。

在上述实施方式中，信息处理系统10具备预测部15，但能够省略该功能要件。即，预测复合对象的特性的处理也可以由与信息处理系统不同的计算机系统执行。

由至少一个处理器执行的信息处理方法的处理顺序并不限定于上述实施方式中的例子。例如，可以省略上述步骤(处理)的一部分，也可以以其他顺序执行各步骤。并且，可以组合上述步骤中的任意2个以上的步骤，也可以修正或删除步骤的一部分。或者，除了上述各步骤以外，还可以执行其他步骤。例如也可以省略步骤S16、S17的处理。

在信息处理系统内比较两个数值的大小关系时，可以使用“以上”及“大于”这两个基准中的任一个，也可以使用“以下”及“小于”这两个基准中的任一个。这样的基准的选择不变更关于比较两个数值的大小关系的处理的技术意义。

在本发明中，“至少一个处理器执行第1处理，执行第2处理，…执行第n处理。”的表述、或与其对应的表述表示包含从第1处理到第n处理的n个处理的执行主体(即处理器)在中途改变的情况的概念。即，该表述表示包含n个处理全部由相同的处理器执行的情况和在n个处理中处理器以任意方针改变的情况这两种情况的概念。

符号说明

10-信息处理系统，11-获取部，12-第1学习部，13-比率适用部，14-第2学习部，15-预测部。

Claims

1.一种信息处理系统，其具备至少一个处理器，

所述至少一个处理器

针对多个成分对象的每一个获取数值表示及复合比，

通过将与所述多个成分对象对应的多个所述数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量，

通过针对所述多个成分对象的每一个将所述复合比适用于所述第1特征矢量，计算该多个成分对象各自的第2特征矢量，

通过将与所述多个成分对象对应的多个所述第2特征矢量输入到第2机器学习模型，计算表示通过使所述多个成分对象复合而获得的复合对象的特征的复合特征矢量，

输出所述复合特征矢量。

2.根据权利要求1所述的信息处理系统，其中，

所述至少一个处理器通过进行将所述复合比与所述第1特征矢量连结、将复合比与所述第1特征矢量各自的成分相乘、及将复合比与所述第1特征矢量各自的成分相加中的一个，将所述复合比适用于所述第1特征矢量。

3.根据权利要求1或2所述的信息处理系统，其中，

所述至少一个处理器

通过将所述复合特征矢量输入到第3机器学习模型，计算所述复合对象的特性的预测值，

输出所述预测值。

4.根据权利要求1至3中任一项所述的信息处理系统，其中，

所述成分对象是材料，所述复合对象是多成分物质。

5.根据权利要求4所述的信息处理系统，其中，

所述材料是聚合物，所述多成分物质是聚合物合金。

6.一种信息处理方法，其由具备至少一个处理器的信息处理系统执行，所述信息处理方法包括：

针对多个成分对象的每一个获取数值表示及复合比的步骤；

通过将与所述多个成分对象对应的多个所述数值表示输入到第1机器学习模型，计算该多个成分对象各自的第1特征矢量的步骤；

通过针对所述多个成分对象的每一个将所述复合比适用于所述第1特征矢量，计算该多个成分对象各自的第2特征矢量的步骤；

通过将与所述多个成分对象对应的多个所述第2特征矢量输入到第2机器学习模型，计算表示通过使所述多个成分对象复合而获得的复合对象的特征的复合特征矢量的步骤；及

输出所述复合特征矢量的步骤。

7.一种信息处理程序，其使计算机执行如下步骤：

针对多个成分对象的每一个获取数值表示及复合比的步骤；

输出所述复合特征矢量的步骤。