CN117349479A - 图结构的更新方法、装置、设备、存储介质及程序产品 - Google Patents
图结构的更新方法、装置、设备、存储介质及程序产品 Download PDFInfo
- Publication number
- CN117349479A CN117349479A CN202311315868.6A CN202311315868A CN117349479A CN 117349479 A CN117349479 A CN 117349479A CN 202311315868 A CN202311315868 A CN 202311315868A CN 117349479 A CN117349479 A CN 117349479A
- Authority
- CN
- China
- Prior art keywords
- graph structure
- attribute
- updated
- graph
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims description 143
- 239000000126 substance Substances 0.000 claims description 54
- 238000012545 processing Methods 0.000 claims description 29
- 238000000605 extraction Methods 0.000 claims description 25
- 230000015654 memory Effects 0.000 claims description 23
- 230000002776 aggregation Effects 0.000 claims description 15
- 238000004220 aggregation Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 13
- 238000010606 normalization Methods 0.000 claims description 10
- 230000000875 corresponding effect Effects 0.000 description 190
- 238000005516 engineering process Methods 0.000 description 30
- 239000003814 drug Substances 0.000 description 17
- 229940079593 drug Drugs 0.000 description 17
- 238000013473 artificial intelligence Methods 0.000 description 15
- 238000010586 diagram Methods 0.000 description 15
- 238000005457 optimization Methods 0.000 description 12
- 230000006870 function Effects 0.000 description 11
- 239000013598 vector Substances 0.000 description 11
- 230000014509 gene expression Effects 0.000 description 9
- 238000013527 convolutional neural network Methods 0.000 description 7
- 238000009509 drug development Methods 0.000 description 7
- 238000013528 artificial neural network Methods 0.000 description 6
- 238000009835 boiling Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000002596 correlated effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012827 research and development Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009510 drug design Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 230000009022 nonlinear effect Effects 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/042—Knowledge-based neural networks; Logical representations of neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Crystallography & Structural Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Pharmacology & Pharmacy (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供了一种图结构的更新方法、装置、设备、存储介质及程序产品;方法包括:获取待更新图结构,以及多个用于指示图结构的结构特性的图结构属性;基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值;获取各所述图结构属性分别对应的偏好属性分值;针对各所述图结构属性,将所述图结构属性对应的第一预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的属性偏移分值;基于所述属性偏移分值,对所述待更新图结构进行更新,得到目标图结构。通过本申请,能够有效提高图结构的更新准确度。
Description
技术领域
本申请涉及计算机技术领域,尤其涉及一种图结构的更新方法、装置、电子设备、存储介质及程序产品。
背景技术
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
相关技术中,对于图结构的更新,通常是针对图结构的单个图结构属性,对图结构进行更新,由于图结构属性的多样性,多个图结构属性之间往往会对图结构造成综合性影响,导致针对单个图结构属性对图结构进行更新,会造成更新所得到的目标图结构准确度低下。
发明内容
本申请实施例提供一种图结构的更新方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够有效提高图结构的更新准确度。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种图结构的更新方法,包括:
获取待更新图结构,以及多个用于指示图结构的结构特性的图结构属性;
基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值;
获取各所述图结构属性分别对应的偏好属性分值,所述偏好属性分值,用于指示对所述待更新图结构中相应的所述图结构属性的更新期望;
针对各所述图结构属性,将所述图结构属性对应的第一预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的属性偏移分值;
基于所述属性偏移分值,对所述待更新图结构进行更新,得到目标图结构,所述目标图结构满足各所述图结构属性的更新期望。
本申请实施例提供一种图结构的更新装置,包括:
获取模块,用于获取待更新图结构,以及多个用于指示图结构的结构特性的图结构属性;
属性预测模块,用于基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值;
期望模块,用于获取各所述图结构属性分别对应的偏好属性分值,所述偏好属性分值,用于指示对所述待更新图结构中相应的所述图结构属性的更新期望;
更新模块,用于针对各所述图结构属性,将所述图结构属性对应的第一预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的属性偏移分值;基于所述属性偏移分值,对所述待更新图结构进行更新,得到目标图结构,所述目标图结构满足各所述图结构属性的更新期望。
上述方案中,上述获取模块,还用于获取目标化学物质的分子结构,所述分子结构包括多个原子,以及用于连接所述多个原子的化学键;以所述原子作为顶点、所述化学键作为边,将所述分子结构转换为初始图结构,并对所述初始图结构中的各所述顶点分别进行顶点拓展,得到所述待更新图结构。
上述方案中,上述属性预测通过属性预测模型实现,所述属性预测模型包括特征提取层和预测层,上述属性预测模块,还用于调用所述特征提取层,对所述待更新图结构进行图特征提取,得到所述待更新图结构的图特征;针对各所述图结构属性,基于所述图特征,调用所述预测层,对所述待更新图结构进行所述图结构属性的属性预测,得到所述待更新图结构对应所述图结构属性的第一预测分值。
上述方案中,上述特征提取层包括多个特征卷积层和一个特征聚合层,上述属性预测模块,还用于调用所述多个特征卷积层,对所述待更新图结构进行特征卷积,得到各所述特征卷积层分别对应的卷积图特征;调用所述特征聚合层,对各所述卷积图特征进行特征聚合,得到所述待更新图结构的图特征。
上述方案中,上述属性预测模块,还用于调用第1特征卷积层,对所述待更新图结构进行特征卷积,得到所述第1特征卷积层对应的第1卷积图特征;遍历i执行以下处理:调用第i特征卷积层,对第i-1卷积图特征进行特征卷积,得到所述第i特征卷积层对应的第i卷积图特征;其中,1<i≤N,所述N用于指示所述特征提取层中所述特征卷积层的层数。
上述方案中,上述属性预测模块,还用于获取初始属性预测模型、图结构样本,及所述图结构样本分别对应各所述图结构属性的标签分值;调用所述初始属性预测模型,对所述图结构样本进行属性预测,得到所述图结构样本分别对应各所述图结构属性的样本预测分值;结合所述样本预测分值和所述标签分值,对所述初始属性预测模型进行训练,得到所述属性预测模型。
上述方案中,上述更新模块,还用于基于所述属性偏移分值,对所述待更新图结构进行初始更新,得到第1候选图结构;当所述第1候选图结构满足各所述图结构属性的更新期望时,将所述第1候选图结构确定为所述目标图结构;当所述第1候选图结构不满足各所述图结构属性的更新期望时,遍历j执行以下处理,直至得到所述目标图结构:对第j候选图结构进行更新,得到第j+1候选图结构,1≤j,当所述第j+1候选图结构满足各所述图结构属性的更新期望时,将所述第j+1候选图结构,确定为所述目标图结构。
上述方案中,上述更新模块,还用于获取所述待更新图结构的待更新邻接矩阵,所述待更新邻接矩阵,用于指示所述待更新图结构中顶点之间的相邻关系;基于所述属性偏移分值,确定所述待更新图结构的更新矩阵,所述更新矩阵的维度与所述待更新邻接矩阵的维度相同;将所述待更新邻接矩阵与所述更新矩阵进行相减,得到差值矩阵,并对所述差值矩阵中的各特征元素进行归一化处理,得到更新邻接矩阵;将所述更新邻接矩阵对应的图结构,确定为所述第1候选图结构。
上述方案中,上述更新模块,还用于针对各所述图结构属性,结合所述图结构属性对应的偏好属性分值和所述图结构属性对应的属性偏移分值,确定所述图结构属性的属性调整权重,并将所述图结构属性对应的属性偏移分值和所述属性调整权重的乘积,确定为参考参数值;以各所述参考参数值为特征元素的值,构建候选更新矩阵,所述候选更新矩阵中各特征元素与所述图结构属性一一对应;基于所述待更新邻接矩阵的维度,对所述候选更新矩阵进行维度调整,得到所述待更新图结构的更新矩阵。
上述方案中,上述更新模块,还用于基于所述图结构属性,对所述第1候选图结构进行属性预测,得到所述第1候选图结构分别对应各所述图结构属性的第二预测分值;针对各所述图结构属性,将所述图结构属性对应的第二预测分值与相应的所述偏好属性分值的差值,与所述图结构属性对应的差值阈值进行比较,得到比较结果,所述比较结果,用于指示所述差值是否小于所述差值阈值;其中,所述图结构属性对应的差值阈值,不大于所述图结构属性对应的属性偏移分值;基于所述比较结果,确定所述第1候选图结构的指示信息,所述指示信息,用于指示所述第1候选图结构是否满足各所述图结构属性的更新期望。
上述方案中,上述更新模块,还用于当各所述图结构属性的比较结果,均指示所述差值小于所述差值阈值时,将所述第1候选图结构的指示信息,确定为第一指示信息;当各所述图结构属性的比较结果中,存在指示所述差值大于或等于所述差值阈值的比较结果时,将所述第1候选图结构的指示信息,确定为第二指示信息;其中,所述第一指示信息,用于指示所述第1候选图结构满足各所述图结构属性的更新期望,所述第二指示信息,用于指示所述第1候选图结构不满足各所述图结构属性的更新期望。
上述方案中,上述更新模块,还用于基于所述图结构属性,对所述第j候选图结构进行属性预测,得到所述第j候选图结构分别对应各所述图结构属性的第三预测分值;针对各所述图结构属性,将所述图结构属性对应的第三预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的参考偏移分值;基于所述参考偏移分值,对所述第j候选图结构进行更新,得到所述第j+1候选图结构。
上述方案中,上述更新模块,还用于获取所述第j候选图结构的候选邻接矩阵,所述候选邻接矩阵,用于指示所述第j候选图结构中顶点之间的相邻关系;基于所述参考偏移分值,确定所述第j候选图结构的参考矩阵,所述参考矩阵的维度与所述候选邻接矩阵的维度相同;将所述候选邻接矩阵与所述参考矩阵进行相减,得到参考差值矩阵,并对所述参考差值矩阵中的各特征元素进行归一化处理,得到参考邻接矩阵;将所述参考邻接矩阵对应的图结构,确定为所述第j+1候选图结构。
本申请实施例提供一种电子设备,包括:
存储器,用于存储计算机可执行指令或者计算机程序;
处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现本申请实施例提供的图结构的更新方法。
本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,用于引起处理器执行时,实现本申请实施例提供的图结构的更新方法。
本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序或计算机可执行指令,该计算机程序或计算机可执行指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机可执行指令,处理器执行该计算机可执行指令,使得该电子设备执行本申请实施例上述的图结构的更新方法。
本申请实施例具有以下有益效果:
通过基于图结构属性,对待更新图结构进行属性预测,得到待更新图结构分别对应各图结构属性的第一预测分值,针对各图结构属性,将相应的第一预测分值和相应的偏好属性分值的差值,确定为图结构属性的属性偏移分值,基于属性偏移分值,对待更新图结构进行更新,得到满足各图结构属性的更新期望的目标图结构。如此,通过针对各图结构属性,确定相应的第一预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的属性偏移分值,从而能够准确的确定出待更新图结构较之于更新期望之间的差距,通过所得到的属性偏移分值对待更新图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
附图说明
图1是本申请实施例提供的图结构的更新系统的架构示意图;
图2是本申请实施例提供的用于更新图结构的电子设备的结构示意图;
图3至图4是本申请实施例提供的图结构的更新方法的流程示意图;
图5是本申请实施例提供的图结构的更新方法的原理示意图;
图6至图7是本申请实施例提供的图结构的更新方法的流程示意图;
图8至图10是本申请实施例提供的图结构的更新方法的原理示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
对本申请实施例进行进一步详细说明之前,对本申请实施例中涉及的名词和术语进行说明,本申请实施例中涉及的名词和术语适用于如下的解释。
1)机器学习(Machine Learning,ML):是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
2)人工智能(Artificial Intelligence,AI):是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
3)响应于:用于表示所执行的操作所依赖的条件或者状态,当满足所依赖的条件或状态时,所执行的一个或多个操作可以是实时的,也可以具有设定的延迟;在没有特别说明的情况下,所执行的多个操作不存在执行先后顺序的限制。
4)图结构:图结构是一种比树结构更复杂的非线性结构。在树形结构中,结点间具有分支层次关系,每一层上的结点只能和上一层中的至多一个结点相关,但可能和下一层的多个结点相关。而在图形结构中,任意两个结点之间都可能相关,即结点之间的邻接关系可以是任意的。图形结构被用于描述各种复杂的数据对象,在自然科学、社会科学和人文科学等许多领域有着非常广泛的应用。图形结构在计算机科学、人工智能、电子线路分析、最短路径寻找、工程计划、化学化合物分析统计力学、遗传学、控制论语言学和社会科学等方面均有不同程度的应用可以这样说,图形结构在所有数据结构中应用最为广泛。图结构是由点、边(和权)组成,点是图中的顶点;边是顶点之间连成的线段;(权是边所代表的值,当然,这个值并不是就是线段的长度)。图按方向性又可以分为有向图和无向图。应该注意的是顶点的度,顶点的度是连接一个顶点的边的数量,在有向图和无向图中顶点的度有很大的区别,在无向图中,顶点的度就是连接顶点边的数量,而在有向图中,由于线段具有方向性,顶点的度分为入度和出度,顶点的度是入度和出度的加和。
5)图卷积神经网络(Graph Convolution Neural Networks,GCN):图卷积神经网络分为两类,一类是基于谱域的图卷积神经网络和基于空域的图卷积神经网络。基于谱域的图卷积神经网络通过从图信号处理的角度引入滤波器来定义图卷积,其中图卷积操作被解释为从图信号中去除噪声。基于空域的方法将图卷积表示为聚合来自邻居的特征信息。图卷积神经网络在构建许多其他复杂的图神经网络模型中发挥着核心作用,包括基于自动编码器的模型、生成模型和时空网络。图卷积神经网络的应用场景包括引文网络场景、社交网络场景、生物图网络场景、推荐系统场景、交通预测场景等。图卷积神经网络具备以下性质:层级结构性质(特征逐层抽取,深层特征比浅层特征更抽象、更高级),非线性性质(增加图卷积神经网络的表达能力),端对端训练性质。
6)图结构属性:图结构属性,用于指示图结构的结构特性,图结构的结构特性,为图结构中各顶点之间的相互作用关系所导致的图结构的性能指标。例如,当图结构为化学分子结构对应的分子图结构时,图结构属性为化学分子结构的化学属性,例如,化学分子的熔点、化学分子的沸点、化学分子的溶解性等。
7)属性预测:属性预测是预测图结构是否具备对应的图结构属性的处理过程,属性预测,用于预测图结构对应图结构属性的预测分值。
8)特征卷积:特征卷积通过特征卷积层(Convolutional Layer)实现,特征卷积层由若干卷积单元组成,每个卷积单元的参数都是通过反向传播算法最佳化得到的。卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。
在本申请实施例的实施过程中,申请人发现相关技术存在以下问题:
相关技术中,对于图结构的更新,通常是针对图结构的单个图结构属性,对图结构进行更新,由于图结构属性的多样性,多个图结构属性之间往往会对图结构造成综合性影响,导致针对单个图结构属性对图结构进行更新,会造成更新所得到的目标图结构准确度低下。
本申请实施例提供一种图结构的更新方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够有效提高图结构的更新准确度,下面说明本申请实施例提供的图结构的更新系统的示例性应用。
参见图1,图1是本申请实施例提供的图结构的更新系统100的架构示意图,终端(示例性示出了终端400)通过网络300连接服务器200,网络300可以是广域网或者局域网,又或者是二者的组合。
终端400用于供用户使用客户端410,在图形界面410-1(示例性示出了图形界面410-1)显示目标图结构。终端400和服务器200通过有线或者无线网络相互连接。
在一些实施例中,服务器200可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content DeliveryNetwork,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端400可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能电视、智能手表、车载终端等,但并不局限于此。本申请实施例提供的电子设备可以实施为终端,也可以实施为服务器。终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,本申请实施例中不做限制。
在一些实施例中,服务器200获取待更新图结构,以及图结构属性,并基于图结构属性,确定图结构属性的属性偏移分值,基于属性偏移分值,对待更新图结构进行更新,得到目标图结构,并将目标图结构发送至终端400。
在另一些实施例中,终端400获取待更新图结构,以及图结构属性,并基于图结构属性,确定图结构属性的属性偏移分值,基于属性偏移分值,对待更新图结构进行更新,得到目标图结构,并将目标图结构发送至服务器200。
在另一些实施例中,本申请实施例可以借助于云技术(Cloud Technology)实现,云技术是指在广域网或局域网内将硬件、软件、网络等系列资源统一起来,实现数据的计算、储存、处理和共享的一种托管技术。
云技术是基于云计算商业模式应用的网络技术、信息技术、整合技术、管理平台技术、以及应用技术等的总称,可以组成资源池,按需所用,灵活便利。云计算技术将变成重要支撑。技术网络系统的后台服务需要大量的计算、存储资源。
参见图2,图2是本申请实施例提供的用于更新图结构的电子设备500的结构示意图,其中,图2所示出的电子设备500可以是图1中的服务器200或者终端400,图2所示的电子设备500包括:至少一个处理器430、存储器450、至少一个网络接口420。电子设备500中的各个组件通过总线系统440耦合在一起。可理解,总线系统440用于实现这些组件之间的连接通信。总线系统440除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但是为了清楚说明起见,在图2中将各种总线都标为总线系统440。
处理器430可以是一种集成电路芯片,具有信号的处理能力,例如通用处理器、数字信号处理器(DSP,Digital Signal Processor),或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,其中,通用处理器可以是微处理器或者任何常规的处理器等。
存储器450可以是可移除的,不可移除的或其组合。示例性的硬件设备包括固态存储器,硬盘驱动器,光盘驱动器等。存储器450可选地包括在物理位置上远离处理器430的一个或多个存储设备。
存储器450包括易失性存储器或非易失性存储器,也可包括易失性和非易失性存储器两者。非易失性存储器可以是只读存储器(ROM,Read Only Memory),易失性存储器可以是随机存取存储器(RAM,Random Access Memory)。本申请实施例描述的存储器450旨在包括任意适合类型的存储器。
在一些实施例中,存储器450能够存储数据以支持各种操作,这些数据的示例包括程序、模块和数据结构或者其子集或超集,下面示例性说明。
操作系统451,包括用于处理各种基本系统服务和执行硬件相关任务的系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务;
网络通信模块452,用于经由一个或多个(有线或无线)网络接口420到达其他电子设备,示例性的网络接口420包括:蓝牙、无线相容性认证(WiFi,Wireless Fidelity)、和通用串行总线(USB,Universal Serial Bus)等。
在一些实施例中,本申请实施例提供的图结构的更新装置可以采用软件方式实现,图2示出了存储在存储器450中的图结构的更新装置455,其可以是程序和插件等形式的软件,包括以下软件模块:获取模块4551、属性预测模块4552、期望模块4553、更新模块4554,这些模块是逻辑上的,因此根据所实现的功能可以进行任意的组合或进一步拆分。将在下文中说明各个模块的功能。
在另一些实施例中,本申请实施例提供的图结构的更新装置可以采用硬件方式实现,作为示例,本申请实施例提供的图结构的更新装置可以是采用硬件译码处理器形式的处理器,其被编程以执行本申请实施例提供的图结构的更新方法,例如,硬件译码处理器形式的处理器可以采用一个或多个应用专用集成电路(ASIC,Application SpecificIntegrated Circuit)、DSP、可编程逻辑器件(PLD,Programmable Logic Device)、复杂可编程逻辑器件(CPLD,Complex Programmable Logic Device)、现场可编程门阵列(FPGA,Field-Programmable Gate Array)或其他电子元件。
在一些实施例中,终端或服务器可以通过运行计算机程序或计算机可执行指令来实现本申请实施例提供的图结构的更新方法。举例来说,计算机程序可以是操作系统中的原生程序(例如,专用的图结构处理程序)或软件模块,例如,可以嵌入到任意程序(如即时通信客户端、相册程序、电子地图客户端、导航客户端)中的图结构处理模块;例如可以是本地(Native)应用程序(APP,Application),即需要在操作系统中安装才能运行的程序。总而言之,上述计算机程序可以是任意形式的应用程序、模块或插件。
将结合本申请实施例提供的服务器或终端的示例性应用和实施,说明本申请实施例提供的图结构的更新方法。
参见图3,图3是本申请实施例提供的图结构的更新方法的流程示意图,将结合图3示出的步骤101至步骤105进行说明,本申请实施例提供的图结构的更新方法可以由服务器或终端单独实施,或者由服务器及终端协同实施,下面将以服务器单独实施为例进行说明。
在步骤101中,获取待更新图结构,以及多个用于指示图结构的结构特性的图结构属性。
在一些实施例中,上述待更新图结构可以是用于指示化学物质的分子结构的分子图结构,也可以是用于指示多个待推荐对象之间的关联关系的推荐对象图结构,也即上述待更新图结构在不同的应用场景中所指示的含义不同。
作为示例,在药物研发的应用场景中,上述待更新图结构可以是用于指示原始药物的化学分子的分子图结构,分子图结构中的顶点用于指示组成原始药物的原子,分子图结构中的边用于指示连接不同的原子的化学键。
承接上例,在待更新图结构为原始药物的分子图结构时,获取分子图结构,以及多个用于指示分子图结构的结构特性的图结构属性、例如,原始药物的溶解性、沸点、对症疾病、治疗效果等,基于图结构属性(原始药物的溶解性、沸点、对症疾病、治疗效果等),对分子图结构进行属性预测,得到分子图结构分别对应各图结构属性的第一预测分值,针对各图结构属性,将图结构属性对应的第一预测分值与相应的偏好属性分值之间的差值,确定为图结构属性的属性偏移分值,基于属性偏移分值,对分子图结构进行更新,得到目标图结构,目标图结构满足各图结构属性的更新期望。例如,满足溶解性的更新期望、沸点的更新期望、对症疾病的更新期望、治疗效果的更新期望等。
作为示例,在创作文学作品的应用场景中,上述待更新图结构可以是用于指示原始人物关系的原始对象图结构,原始对象图结构中的顶点用于指示人物对象,原始对象图结构中的边用于指示人物对象之间的原始人物关系。
承接上例,在待更新图结构为用于指示原始人物关系的原始对象图结构时,获取原始对象图结构,以及多个用于指示原始对象图结构的结构特性的图结构属性、例如,人物剧情发展,文学作品精彩程度等,基于图结构属性(例如,人物剧情发展,文学作品精彩程度等),对原始对象图结构进行属性预测,得到原始对象图结构分别对应各图结构属性的第一预测分值,针对各图结构属性,将图结构属性对应的第一预测分值与相应的偏好属性分值之间的差值,确定为图结构属性的属性偏移分值,基于属性偏移分值,对原始对象图结构进行更新,得到目标图结构,目标图结构满足各图结构属性的更新期望。例如,满足人物剧情发展的更新期望、文学作品精彩程度的更新期望等。
作为示例,在指导建立人际关系的应用场景中,上述待更新图结构可以是用于指示目标对象的原始人际关系的人际关系图结构,人际关系图结构中包括用于指示目标对象的顶点,以及与目标对象存在关联的关联对象的顶点,例如,上述关联对象可以是目标对象在社会活动中所接触的所有接触对象,以及各接触对象在社会活动中所接触的所有旁支接触对象,原始对象图结构中的边用于指示原始对象图结构中的各顶点分别所指示的对象之间的关联关系。
承接上例,在待更新图结构为用于指示目标对象的原始人际关系的人际关系图结构时,获取人际关系图结构,以及多个用于指示人际关系图结构的结构特性的图结构属性、例如,人际关系稳定程度,人际关系与目标对象的适配度等,基于图结构属性(例如,人际关系稳定程度,人际关系与目标对象的适配度等),对人际关系图结构进行属性预测,得到人际关系图结构分别对应各图结构属性的第一预测分值,针对各图结构属性,将图结构属性对应的第一预测分值与相应的偏好属性分值之间的差值,确定为图结构属性的属性偏移分值,基于属性偏移分值,对人际关系图结构进行更新,得到目标图结构,目标图结构满足各图结构属性的更新期望。例如,满足人际关系稳定程度的更新期望、人际关系与目标对象的适配度的更新期望等。进而通过目标图结构,指导目标对象构建自身的人际关系网。
在一些实施例中,图结构属性,用于指示图结构的结构特性,图结构的结构特性,为图结构中各顶点之间的相互作用关系所导致的图结构的性能指标。例如,当图结构为化学分子结构对应的分子图结构时,图结构属性为化学分子结构的化学属性,例如,化学分子的熔点、化学分子的沸点、化学分子的溶解性等。
在一些实施例中,图3所示出的步骤101中的获取待更新图结构,可以通过如下方式实现:获取目标化学物质的分子结构,以原子作为顶点、化学键作为边,将分子结构转换为待更新图结构。
在另一些实施例中,参见图4,图4是本申请实施例提供的图结构的更新方法的流程示意图,图3所示出的步骤101中的获取待更新图结构可以通过图4所示出的步骤1011至步骤1013实现。
在步骤1011中,获取目标化学物质的分子结构。
在一些实施例中,分子结构包括多个原子,以及用于连接多个原子的化学键。
在一些实施例中,在药物研发的应用场景中,上述目标化学物质可以为原始药物的化学分子,通过获取原始药物的化学分子的分子结构,便于后续以原始药物作为药物研发基础,对原始药物进行更新改造,得到满足更新期望的目标药物的分子结构。
作为示例,参见图5,图5是本申请实施例提供的图结构的更新方法的原理示意图,如图5所示出的分子结构51,分子结构51中包括多个原子,以及用于连接多个原子的化学键。
在步骤1012中,以原子作为顶点、化学键作为边,将分子结构转换为初始图结构。
在一些实施例中,上述步骤1012可以通过如下方式实现:将分子结构中的原子作为初始图结构的顶点,分子结构中的化学键作为初始图结构的边,将分子结构转换为初始图结构。
如此,通过以原子作为顶点、化学键作为边,将分子结构转换为初始图结构,从而将目标化学物质的分子结构转换为数学语言,便于后续对分子结构进行处理,以得到满足更新期望的目标化学物质的分子结构。
在步骤1013中,对初始图结构中的各顶点分别进行顶点拓展,得到待更新图结构。
在一些实施例中,上述顶点拓展是指对图结构中的各顶点进行扩展新顶点的处理过程。
在一些实施例中,在药物研发的应用场景中,通过对初始图结构中的各顶点分别进行顶点拓展,得到待更新图结构,使得所得到的待更新图结构较之于初始图结构,具有更多的原子和化学键,使得待更新图结构能够具有更多的更新空间,从而能够更好更多的满足不同的更新期望。
在一些实施例中,上述对初始图结构中的各顶点分别进行顶点拓展,得到待更新图结构,可以通过如下方式实现:针对初始图结构中的各顶点分别执行以下处理,以得到待更新图结构:为初始图结构中的顶点拓展新的至少一个拓展连接边,以及与拓展连接边相连的至少一个拓展顶点。
作为示例,参见图9,图9是本申请实施例提供的图结构的更新方法的原理示意图,图9中所示出的支架树也即上文所描述的初始图结构,图9中所示出的可微分子架构树,也即上文所描述的待更新图结构,针对初始图结构中的顶点1,对顶点1进行顶点拓展,得到待更新图结构中的顶点1、顶点7以及连接顶点1和顶点7的边;针对初始图结构中的顶点2,对顶点2进行顶点拓展,得到待更新图结构中的顶点2、顶点8以及连接顶点2和顶点8的边。
如此,在药物研发的应用场景中,通过对初始图结构中的各顶点分别进行顶点拓展,得到待更新图结构,使得所得到的待更新图结构较之于初始图结构,具有更多的原子和化学键,使得待更新图结构能够具有更多的更新空间,从而能够更好更多的满足不同的更新期望。
在步骤102中,基于图结构属性,对待更新图结构进行属性预测,得到待更新图结构分别对应各图结构属性的第一预测分值。
在一些实施例中,上述基于图结构属性,对待更新图结构进行属性预测,得到待更新图结构分别对应各图结构属性的第一预测分值,可以通过图卷积神经网络实现,还可以通过图注意力网络(GAT)、图同构网络(GIN)等用于处理图结构的神经网络实现对待更新图结构的属性预测。
在另一些实施例中,上述属性预测通过属性预测模型实现,属性预测模型包括特征提取层和预测层。
作为示例,参见图5,属性预测通过属性预测模型53实现,属性预测模型53包括特征提取层54和预测层55。
在一些实施例中,属性预测是预测图结构是否具备对应的图结构属性的处理过程,属性预测,用于预测图结构对应图结构属性的预测分值。
在一些实施例中,上述第一预测分值的数值大小,与待更新图结构具有相应的图结构属性的可能性的数值大小正相关。
在一些实施例中,参见图6,图6是本申请实施例提供的图结构的更新方法的流程示意图,图3所示出的步骤102可以通过图4所示出的步骤1021至步骤1022实现。
在步骤1021中,调用特征提取层,对待更新图结构进行图特征提取,得到待更新图结构的图特征。
在一些实施例中,上述特征提取层,用于将图结构转换为对应的向量形式的图特征,上述待更新图结构的图特征,为待更新图结构对应的向量表示形式。
作为示例,参见图5,调用特征提取层54,对待更新图结构52进行图特征提取,得到待更新图结构52的图特征56。
在一些实施例中,上述特征提取层包括多个特征卷积层和一个特征聚合层。
在一些实施例中,上述步骤1021可以通过如下方式实现:调用多个特征卷积层,对待更新图结构进行特征卷积,得到各特征卷积层分别对应的卷积图特征;调用特征聚合层,对各卷积图特征进行特征聚合,得到待更新图结构的图特征。
在一些实施例中,上述调用多个特征卷积层,对待更新图结构进行特征卷积,得到各特征卷积层分别对应的卷积图特征,可以通过如下方式实现:并行调用各特征卷积层,分别对待更新图结构进行特征卷积,得到各特征卷积层分别对应的卷积图特征。
在另一些实施例中,上述调用多个特征卷积层,对待更新图结构进行特征卷积,得到各特征卷积层分别对应的卷积图特征,可以通过如下方式实现:调用第1特征卷积层,对待更新图结构进行特征卷积,得到第1特征卷积层对应的第1卷积图特征;遍历i执行以下处理:调用第i特征卷积层,对第i-1卷积图特征进行特征卷积,得到第i特征卷积层对应的第i卷积图特征。
在一些实施例中,1<i≤N,N用于指示特征提取层中特征卷积层的层数。
作为示例,当特征提取层中特征卷积层的层数为3层时,调用第1特征卷积层,对待更新图结构进行特征卷积,得到第1特征卷积层对应的第1卷积图特征;调用第2特征卷积层,对第1卷积图特征进行特征卷积,得到第2特征卷积层对应的第2卷积图特征;调用第3特征卷积层,对第2卷积图特征进行特征卷积,得到第3特征卷积层对应的第3卷积图特征。
作为示例,上述特征提取层的表达式可以为:
H(i)=RELU(B(l)+A(H(i-1)U(l))) (1)
其中,B(i)用于指示第i特征卷积层的偏置参数,U(i)表示用于指示第i特征卷积层的权重参数,A为邻接矩阵,H(i-1)用于指示第i-1卷积图特征,H(i)用于指示第i卷积图特征。
作为示例,上述特征聚合层的表达式可以为:
其中,用于指示特征聚合层的输出结果,也即待更新图结构的图特征,MLP用于指示特征聚合层,/>用于指示第i卷积图特征,wi用于指示第i卷积图特征的权重,N用于指示特征提取层中特征卷积层的层数。
在步骤1022中,针对各图结构属性,基于图特征,调用预测层,对待更新图结构进行图结构属性的属性预测,得到待更新图结构对应图结构属性的第一预测分值。
在一些实施例中,上述预测层,用于预测待更新图结构对应图结构属性的第一预测分值,第一预测分值的数值大小,与待更新图结构具有相应的图结构属性的可能性的数值大小正相关。
作为示例,参见图5,针对各图结构属性,基于图特征56,调用预测层55,对待更新图结构52进行图结构属性的属性预测,得到待更新图结构对应图结构属性的第一预测分值。
承接上例,针对图结构属性l1,基于图特征56,调用预测层55,对待更新图结构52进行图结构属性l1的属性预测,得到待更新图结构对应图结构属性l1的第一预测分值;针对图结构属性lm,基于图特征56,调用预测层55,对待更新图结构52进行图结构属性lm的属性预测,得到待更新图结构对应图结构属性lm的第一预测分值。
如此,基于图结构属性,对待更新图结构进行属性预测,得到待更新图结构分别对应各图结构属性的第一预测分值,由于上述第一预测分值的数值大小,与待更新图结构具有相应的图结构属性的可能性的数值大小正相关,因此,通过所得到的第一预测分值能够实现对待更新图结构的可能具有的各种图结构属性进行准确评估,为后续对待更新图结构进行更新提供了准确的数据支撑。
在一些实施例中,在上述步骤102之前,可以通过如下方式训练得到属性预测模型:获取初始属性预测模型、图结构样本,及图结构样本分别对应各图结构属性的标签分值;调用初始属性预测模型,对图结构样本进行属性预测,得到图结构样本分别对应各图结构属性的样本预测分值;结合样本预测分值和标签分值,对初始属性预测模型进行训练,得到属性预测模型。
在一些实施例中,上述初始属性预测模型和属性预测模型分别对应的模型参数不同,模型结构相同。
在一些实施例中,上述结合样本预测分值和标签分值,对初始属性预测模型进行训练,得到属性预测模型,可以通过如下方式实现:结合样本预测分值和标签分值,确定初始属性预测模型的损失值,基于损失值对初始属性预测模型进行训练,得到属性预测模型。
在一些实施例中,上述结合样本预测分值和标签分值,确定初始属性预测模型的损失值,可以通过如下方式实现:将样本预测分值和标签分值的差值,确定为初始属性预测模型的损失值,或者,将样本预测分值和标签分值的交叉熵,确定为初始属性预测模型的损失值。
如此,通过对初始属性预测模型进行有效训练,得到属性预测模型,使得所得到的属性预测模型具备准确的预测性能,使得预测所得到的第一预测分值更加准确,通过所得到的第一预测分值能够实现对待更新图结构的可能具有的各种图结构属性进行准确评估,为后续对待更新图结构进行更新提供了准确的数据支撑。
在步骤103中,获取各图结构属性分别对应的偏好属性分值。
在一些实施例中,偏好属性分值,用于指示对待更新图结构中相应的图结构属性的更新期望。
作为示例,上述各图结构属性分别对应的偏好属性分值的表达式可以为:
λ1={λ11,λ12,λ13……,λ1m} (3)
其中,λ1用于指示各图结构属性分别对应的偏好属性分值向量,λ11用于指示图结构属性1对应的偏好属性分值,λ12用于指示图结构属性2对应的偏好属性分值,λ13用于指示图结构属性3对应的偏好属性分值,λ1m用于指示图结构属性m对应的偏好属性分值。
在一些实施例中,上述偏好属性分值的分值大小,与相应的图结构属性的更新期望的期望程度正相关,也即偏好属性分值的分值越大,相应的图结构属性的更新期望的期望程度越大,偏好属性分值的分值越小,相应的图结构属性的更新期望的期望程度越小。
在步骤104中,针对各图结构属性,将图结构属性对应的第一预测分值与相应的偏好属性分值之间的差值,确定为图结构属性的属性偏移分值。
承接上例,属性偏移分值的表达式可以为:
L={l1,l2……lm}={y1-λ11,y2-λ12……{ym-λ1m} (4)
其中,L用于指示属性偏移分值,l1用于指示图结构属性1的属性偏移分值,l2用于指示图结构属性2的属性偏移分值,lm用于指示图结构属性m的属性偏移分值,λ11用于指示图结构属性1对应的偏好属性分值,λ12用于指示图结构属性2对应的偏好属性分值,λ1m用于指示图结构属性m对应的偏好属性分值,y1用于指示图结构属性1对应的第一预测分值,y2用于指示图结构属性2对应的第一预测分值,ym用于指示图结构属性m对应的第一预测分值。
如此,通过针对各图结构属性,确定相应的第一预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的属性偏移分值,从而能够准确的确定出待更新图结构较之于更新期望之间的差距,通过所得到的属性偏移分值对待更新图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
在步骤105中,基于属性偏移分值,对待更新图结构进行更新,得到目标图结构,目标图结构满足各图结构属性的更新期望。
在一些实施例中,通过针对各图结构属性,确定相应的第一预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的属性偏移分值,从而能够准确的确定出待更新图结构较之于更新期望之间的差距,通过所得到的属性偏移分值对待更新图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
在一些实施例中,参见图7,图7是本申请实施例提供的图结构的更新方法的流程示意图,图3所示出的步骤105可以通过图7所示出的步骤1051至步骤1053实现。
在步骤1051中,基于属性偏移分值,对待更新图结构进行初始更新,得到第1候选图结构。
在一些实施例中,上述步骤1051可以通过如下方式实现:获取待更新图结构的待更新邻接矩阵;基于属性偏移分值,确定待更新图结构的更新矩阵;将待更新邻接矩阵与更新矩阵进行相减,得到差值矩阵,并对差值矩阵中的各特征元素进行归一化处理,得到更新邻接矩阵;将更新邻接矩阵对应的图结构,确定为第1候选图结构。
在一些实施例中,待更新邻接矩阵,用于指示待更新图结构中顶点之间的相邻关系,更新矩阵的维度与待更新邻接矩阵的维度相同。
在一些实施例中,上述邻接矩阵(Adjacency Matrix)是表示顶点之间相邻关系的矩阵用一个一维数组存放图中所有顶点数据,用一个二维数组存放顶点间关系(边或弧)的数据,这个二维数组称为邻接矩阵,邻接矩阵又分为有向图邻接矩阵和无向图邻接矩阵。
在一些实施例中,由于差值矩阵中的各特征元素的值,是通过将待更新邻接矩阵与更新矩阵中分别对应的特征元素的值进行相减所得到的,因此,差值矩阵中的各特征元素的值存在不等于0或1的可能性,因此,可以对差值矩阵中的各特征元素的值进行归一化处理,以使得差值矩阵中的各特征元素的值等于1或0。
在一些实施例中,上述对差值矩阵中的各特征元素进行归一化处理,得到更新邻接矩阵,可以通过如下方式实现:针对差值矩阵中的各特征元素分别执行以下处理:当特征元素的值不等于0且不等于1时,将更新邻接矩阵中相应的特征元素的值确定为1,当特征元素的值等于0或1时,将更新邻接矩阵中相应的特征元素的值确定为0。
在一些实施例中,上述基于属性偏移分值,确定待更新图结构的更新矩阵,可以通过如下方式实现:针对各图结构属性,结合图结构属性对应的偏好属性分值和图结构属性对应的属性偏移分值,确定图结构属性的属性调整权重,并将图结构属性对应的属性偏移分值和属性调整权重的乘积,确定为参考参数值;以各参考参数值为特征元素的值,构建候选更新矩阵;基于待更新邻接矩阵的维度,对候选更新矩阵进行维度调整,得到待更新图结构的更新矩阵。
在一些实施例中,候选更新矩阵中各特征元素与图结构属性一一对应。
作为示例,上述图结构属性的属性调整权重的表达式可以为:
其中,β*用于指示图结构属性的属性调整权重,用于指示图结构属性的不均衡参数,a用于指示图结构属性的参考调整权重,β用于指示图结构属性的上轮属性调整权重。
作为示例,上述图结构属性的参考调整权重的表达式可以为:
a={a1,a2…aj…am} (6)
其中,a用于指示图结构属性的参考调整权重,a1用于指示图结构属性1对应的参考调整权重,a2用于指示图结构属性2对应的参考调整权重,aj用于指示图结构属性j对应的参考调整权重,am用于指示图结构属性m对应的参考调整权重。
作为示例,上述图结构属性j对应的参考调整权重aj的表达式可以为:
其中,aj用于指示图结构属性j对应的参考调整权重,λj用于指示图结构属性j对应的偏好属性分值,lj用于指示图结构属性j对应的属性偏移分值,m用于指示图结构属性的数量,用于评估图结构是否具有图结构属性的评估参数。
在一些实施例中,在上述步骤1051之后,可以通过如下方式确定第1候选图结构是否满足各图结构属性的更新期望:基于图结构属性,对第1候选图结构进行属性预测,得到第1候选图结构分别对应各图结构属性的第二预测分值;针对各图结构属性,将图结构属性对应的第二预测分值与相应的偏好属性分值的差值,与图结构属性对应的差值阈值进行比较,得到比较结果;基于比较结果,确定第1候选图结构的指示信息。
在一些实施例中,上述比较结果,用于指示差值是否小于差值阈值,图结构属性对应的差值阈值,不大于图结构属性对应的属性偏移分值,指示信息,用于指示第1候选图结构是否满足各图结构属性的更新期望。
在一些实施例中,将图结构属性对应的第二预测分值与相应的偏好属性分值的差值,与图结构属性对应的差值阈值进行比较,得到比较结果,可以通过如下方式实现:当图结构属性对应的第二预测分值与相应的偏好属性分值的差值,大于或等于图结构属性对应的差值阈值时,将比较结果确定为第一比较结果;当图结构属性对应的第二预测分值与相应的偏好属性分值的差值,小于图结构属性对应的差值阈值时,将比较结果确定为第二比较结果。
在一些实施例中,上述第一比较结果,用于指示图结构属性对应的第二预测分值与相应的偏好属性分值的差值,大于或等于图结构属性对应的差值阈值;上述第二比较结果,用于指示图结构属性对应的第二预测分值与相应的偏好属性分值的差值,小于图结构属性对应的差值阈值。
在一些实施例中,图结构属性对应的差值阈值,不大于图结构属性对应的属性偏移分值,如此,通过将图结构属性对应的差值阈值设置为不大于图结构属性对应的属性偏移分值的数值,从而使得更新过程不断的将待更新图结构朝着更新期望的方向进行改造,使得最终所得到的目标图结构能够满足相应的更新期望。
在一些实施例中,上述基于比较结果,确定第1候选图结构的指示信息,可以通过如下方式实现:当各图结构属性的比较结果,均指示差值小于差值阈值时,将第1候选图结构的指示信息,确定为第一指示信息;当各图结构属性的比较结果中,存在指示差值大于或等于差值阈值的比较结果时,将第1候选图结构的指示信息,确定为第二指示信息。
在一些实施例中,第一指示信息,用于指示第1候选图结构满足各图结构属性的更新期望,第二指示信息,用于指示第1候选图结构不满足各图结构属性的更新期望。
在一些实施例中,在各图结构属性的比较结果,均指示差值小于差值阈值时,说明第一候选图结构满足各图结构属性的更新期望,在图结构属性的比较结果中,存在指示差值大于或等于差值阈值的比较结果时,说明第一候选图结构中存在不满足更新期望的图结构属性,也即说明第1候选图结构不满足各图结构属性的更新期望。
如此,通过确定第1候选图结构是否满足各图结构属性的更新期望,在第1候选图结构满足各图结构属性的更新期望时,快速的将第1候选图结构确定为目标图结构,在第1候选图结构不满足各图结构属性的更新期望时,继续对第1候选图结构进行更新,直到更新所得到的候选图结构能够满足各图结构属性的更新期望,从而有效提高了图结构的更新准确度。
在步骤1052中,当第1候选图结构满足各图结构属性的更新期望时,将第1候选图结构确定为目标图结构。
在一些实施例中,当第1候选图结构满足各图结构属性的更新期望时,此时可以将第1候选图结构直接确定为目标图结构,从而有效节省了目标图结构的确定时长,有效提高了图结构的更新效率。
在步骤1053中,当第1候选图结构不满足各图结构属性的更新期望时,遍历j执行以下处理,直至得到目标图结构:对第j候选图结构进行更新,得到第j+1候选图结构,当第j+1候选图结构满足各图结构属性的更新期望时,将第j+1候选图结构,确定为目标图结构。
在一些实施例中,1≤j,也即j的取值范围可以为大于或等于1的正整数。
作为示例,当第1候选图结构不满足各图结构属性的更新期望时,对第1候选图结构进行更新,得到第2候选图结构,当第2候选图结构满足各图结构属性的更新期望时,将第2候选图结构,确定为目标图结构,当第2候选图结构不满足各图结构属性的更新期望时,对第2候选图结构进行更新,得到第3候选图结构,依次类推,直至找到目标图结构。
如此,通过在第1候选图结构不满足各图结构属性的更新期望,采取不断的对第1候选图结构进行更新,直至找到满足各图结构属性的更新期望的目标图结构,从而有效保证了所确定的目标图结构能够满足各图结构属性的更新期望,从而有效提高了图结构的更新准确度。
在一些实施例中,上述对第j候选图结构进行更新,得到第j+1候选图结构,可以通过如下方式实现:基于图结构属性,对第j候选图结构进行属性预测,得到第j候选图结构分别对应各图结构属性的第三预测分值;针对各图结构属性,将图结构属性对应的第三预测分值与相应的偏好属性分值之间的差值,确定为图结构属性的参考偏移分值;基于参考偏移分值,对第j候选图结构进行更新,得到第j+1候选图结构。
作为示例,上述参考偏移分值的表达式可以为:
T={T1,T2……Tm}={t1-λ11,t2-λ12……{tm-λ1m} (8)
其中,T用于指示参考偏移分值,T1用于指示图结构属性1的参考偏移分值,T2用于指示图结构属性2的参考偏移分值,Tm用于指示图结构属性m的参考偏移分值,λ11用于指示图结构属性1对应的偏好属性分值,λ12用于指示图结构属性2对应的偏好属性分值,λ1m用于指示图结构属性m对应的偏好属性分值。
如此,通过针对各图结构属性,确定相应的第二预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的参考偏移分值,从而能够准确的确定出第j候选图结构较之于更新期望之间的差距,通过所得到的参考偏移分值对第j候选图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
在一些实施例中,上述基于参考偏移分值,对第j候选图结构进行更新,得到第j+1候选图结构,可以通过如下方式实现:获取第j候选图结构的候选邻接矩阵,候选邻接矩阵,用于指示第j候选图结构中顶点之间的相邻关系;基于参考偏移分值,确定第j候选图结构的参考矩阵,参考矩阵的维度与候选邻接矩阵的维度相同;将候选邻接矩阵与参考矩阵进行相减,得到参考差值矩阵,并对参考差值矩阵中的各特征元素进行归一化处理,得到参考邻接矩阵;将参考邻接矩阵对应的图结构,确定为第j+1候选图结构。
在一些实施例中,由于参考差值矩阵中的各特征元素的值,是通过将待更新邻接矩阵与更新矩阵中分别对应的特征元素的值进行相减所得到的,因此,参考差值矩阵中的各特征元素的值存在不等于0或1的可能性,因此,可以对参考差值矩阵中的各特征元素的值进行归一化处理,以使得参考差值矩阵中的各特征元素的值等于1或0。
在一些实施例中,上述对参考差值矩阵中的各特征元素进行归一化处理,得到参考邻接矩阵,可以通过如下方式实现:针对参考差值矩阵中的各特征元素分别执行以下处理:当特征元素的值不等于0且不等于1时,将参考邻接矩阵中相应的特征元素的值确定为1,当特征元素的值等于0或1时,将参考邻接矩阵中相应的特征元素的值确定为0。
如此,通过基于图结构属性,对待更新图结构进行属性预测,得到待更新图结构分别对应各图结构属性的第一预测分值,针对各图结构属性,将相应的第一预测分值和相应的偏好属性分值的差值,确定为图结构属性的属性偏移分值,基于属性偏移分值,对待更新图结构进行更新,得到满足各图结构属性的更新期望的目标图结构。如此,通过针对各图结构属性,确定相应的第一预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的属性偏移分值,从而能够准确的确定出待更新图结构较之于更新期望之间的差距,通过所得到的属性偏移分值对待更新图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
下面,将说明本申请实施例在一个实际的药物研发的应用场景中的示例性应用。
多目标分子优化是药物发现中的一个重要研究领域。虽然目前的机器学习方法在这个领域取得了初步的成功,但由于某些属性的相互抑制或者相互促进的性质,它们仍然难以探索分子优化中多个属性之间的潜在权衡,通过本申请实施例提供的图结构的更新方法,可以生成满足不同偏好条件下帕累托最优解的候选分子,通过给定不同的权重偏好向量,本申请实施例既可以得到特定偏好的分子,又可以通过不同的偏好来全面探索属性之间的关系,从而得到平均属性较高且多样的分子。
在一些实施例中,参见图8,图8是本申请实施例提供的图结构的更新方法的原理示意图,参见图8中的子结构71,通过获取分子图,确定分子图对应的可微分子架构。并以分子架构树为输入、以分子属性分数为输出的可微的代理模型。通过整合偏好,分子架构树经过更新,可以得到偏好特定的帕累托最优解。参见图8中的子结构72,通过偏好多样化来探索帕累托前沿,从而减轻局部最优问题,并促进发现既具有高属性得分又具有显著多样性的分子。
在一些实施例中,参见图9,图9是本申请实施例提供的图结构的更新方法的原理示意图,分子的基本数学描述是分子图,其中原子作为节点,化学键作为边。然而,由于存在环、相对较大的大小和化学有效性约束,分子图不容易显式地生成为图形。为了便于计算,本申请实施例通过将分子图转换为支架树,并将支架树转换为更高级别的表示,即可微分子架构树,即亚结构的树形结构Tx,如图9所示,可微的分子树架构允许对其进行求导,对树的节点进行替换,删除,增加等操作来改变分子的结构。基本的支架树Tx可以通过添加一个扩展节点集合其中|Vexpand|=Kexpand+K,转换为一个包含Kexpand+K个节点的树。Tx包含可学习的参数,可以解释为条件概率。这个条件概率可以用于通过节点缩小、替换或扩展等过程来采样一个新的树。每个支架树对应于多个分子,因为亚结构可以以各种方式组合。
在一些实施例中,参见图8,对于可微分子属性预测模型(即上文所描述的属性预测模型),可微分子属性预测模型首先需要经过一个预训练过程。预训练的目标是让图卷积网络GCN能够学会将所有训练数据的分子骨架树转化为对应的属性分数。本申请实施例则单独预测每个分子的每个属性得分。虽然统一属性已经展现出了良好的性能,但它忽略了属性之间的潜在权衡。在本申请实施例中,本申请实施例使用多头架构来模拟预测函数,其中GC N第l层的特征向量H(l)卷积公式如下:
H(l)=RELU(B(l)+A(H(l-1)U(l))) (9)
其中,B(l)表示偏置参数,U(l)表示权重参数,A为邻接矩阵,本申请实施例利用加权平均作为最后一层节点嵌入的读出函数(也即图1中的特征图):
本申请实施例通过最小化GCN预测值和真实值之间的差异来训练GCN模型,目标函数据具体定义如下:
其中,θ表示GCN的参数,Tx表示分子架构树,L表示损失函数,例如交叉熵,MSE等。与DeepInversion一致,预训练的代理模型的参数在接下来的分子优化阶段被冻结,本申请实施例通过梯度更新分子架构树。
在一些实施例中,参见图9,为了确定一个非支配下降方向dnd=Gβ*,它与偏好向量对齐并继续朝帕累托前沿前进,本申请实施例在DeepInversion的第k次迭代中解决以下线性规划(LP)问题:
βTcj≥0,j∈J* (14)
其中,是一个指示器来表示属性的不均衡;C=GTG是一个对称的矩阵,其每一行为cj;G为损失函数的导数/>L={l1,l2……lm}={y1-λ1,y2-λ2……{ym-λm};J*表示最大的相对目标函数值的索引(指lj中最大的值对应的属性);/>表示在优化过程中梯度上升的属性的索引;IJ为一个指示器表示并不是所有的目标函数都同时上升;其中a为一个调整权重,/>其中/>为从均匀分布到损失函数的KL散度,表征了非均匀性,当生成的分子满足偏好条件时,本申请实施例有/> 用于衡量生成的分子是否满足λ所指示的偏好,偏好向量λ={λ1,λ2,……λm};否则,/>
根据上式,便可以求得帕累托非支配下降方向dnd=Gβ*。然后本申请实施例使用梯度下降法更新分子骨架树:
Tx=Tx-ηdnd (15)
在一些实施例中,参见图10,图10是本申请实施例提供的图结构的更新方法的原理示意图,针对溶解度和稳定性这两种化学属性,本申请实施例可以在偏好向量的指导下精确地探索化学空间,例如[0.3,0.7],这意味着本申请实施例更关注稳定性而不是溶解度,因为这两个属性本质上是冲突的,相比之下,相关技术1导致的解位于目标空间的中心,相关技术2通常会导致偏见的分子。两种相关技术都留下了化学空间的某些区域未被探索。而本申请实施例提供的图结构的更新方法可以在偏好向量的指导下探索整个化学空间。
本申请实施例提供的图结构的更新方法通过多样化偏好增强了化学空间的探索,从而增强了多样性高、质量优异的分子的发现。扫描偏好向量λ可以识别覆盖帕累托前沿的多样性分子集合。由于计算限制,本申请实施例进行偏好采样而不是均匀覆盖整个空间。本申请实施例利用高维高斯分布的各向同性特性来确保偏好分布均匀。具体而言,本申请实施例采样偏好λ′~N(0,I),其中I∈Rm×m表示单位矩阵。随后,本申请实施例取λ′的绝对值以获得λ′∈R+,最后将其归一化为单位偏好向量λ。假设帕累托前沿的局部连续性,本申请实施例使用线性插值来获得其他有效解。这种方法增加了发现高平均分数、具有显著多样性的分子的可能性,使其在解决权衡和简化药物设计搜索方面具有显著优势。
如此,通过本申请实施例提供的图结构的更新方法,能够在保证一个属性优化的同时,不牺牲其他属性的表现,实现多属性之间的平衡,不断从历史数据和实时数据中学习和优化,提高优化的准确性和效率,这种自我学习和优化的能力,使得本申请实施例提供的图结构的更新方法能够随着时间的推移,逐渐提高其性能,能够准确预测多个属性之间的复杂关系,以及它们如何共同影响分子的性能,极大的加速了分子优化的过程,提高了优化效率。
可以理解的是,在本申请实施例中,涉及到待更新图结构等相关的数据,当本申请实施例运用到具体产品或技术中时,需要获得用户许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
下面继续说明本申请实施例提供的图结构的更新装置455的实施为软件模块的示例性结构,在一些实施例中,如图2所示,存储在存储器450的图结构的更新装置455中的软件模块可以包括:获取模块4551,用于获取待更新图结构,以及多个用于指示图结构的结构特性的图结构属性;属性预测模块4552,用于基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值;期望模块4553,用于获取各所述图结构属性分别对应的偏好属性分值,所述偏好属性分值,用于指示对所述待更新图结构中相应的所述图结构属性的更新期望;更新模块4554,用于针对各所述图结构属性,将所述图结构属性对应的第一预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的属性偏移分值;基于所述属性偏移分值,对所述待更新图结构进行更新,得到目标图结构,所述目标图结构满足各所述图结构属性的更新期望。
在一些实施例中,上述获取模块,还用于获取目标化学物质的分子结构,所述分子结构包括多个原子,以及用于连接所述多个原子的化学键;以所述原子作为顶点、所述化学键作为边,将所述分子结构转换为初始图结构,并对所述初始图结构中的各所述顶点分别进行顶点拓展,得到所述待更新图结构。
在一些实施例中,上述属性预测通过属性预测模型实现,所述属性预测模型包括特征提取层和预测层,上述属性预测模块,还用于调用所述特征提取层,对所述待更新图结构进行图特征提取,得到所述待更新图结构的图特征;针对各所述图结构属性,基于所述图特征,调用所述预测层,对所述待更新图结构进行所述图结构属性的属性预测,得到所述待更新图结构对应所述图结构属性的第一预测分值。
在一些实施例中,上述特征提取层包括多个特征卷积层和一个特征聚合层,上述属性预测模块,还用于调用所述多个特征卷积层,对所述待更新图结构进行特征卷积,得到各所述特征卷积层分别对应的卷积图特征;调用所述特征聚合层,对各所述卷积图特征进行特征聚合,得到所述待更新图结构的图特征。
在一些实施例中,上述属性预测模块,还用于调用第1特征卷积层,对所述待更新图结构进行特征卷积,得到所述第1特征卷积层对应的第1卷积图特征;遍历i执行以下处理:调用第i特征卷积层,对第i-1卷积图特征进行特征卷积,得到所述第i特征卷积层对应的第i卷积图特征;其中,1<i≤N,所述N用于指示所述特征提取层中所述特征卷积层的层数。
在一些实施例中,上述属性预测模块,还用于获取初始属性预测模型、图结构样本,及所述图结构样本分别对应各所述图结构属性的标签分值;调用所述初始属性预测模型,对所述图结构样本进行属性预测,得到所述图结构样本分别对应各所述图结构属性的样本预测分值;结合所述样本预测分值和所述标签分值,对所述初始属性预测模型进行训练,得到所述属性预测模型。
在一些实施例中,上述更新模块,还用于基于所述属性偏移分值,对所述待更新图结构进行初始更新,得到第1候选图结构;当所述第1候选图结构满足各所述图结构属性的更新期望时,将所述第1候选图结构确定为所述目标图结构;当所述第1候选图结构不满足各所述图结构属性的更新期望时,遍历j执行以下处理,直至得到所述目标图结构:对第j候选图结构进行更新,得到第j+1候选图结构,1≤j,当所述第j+1候选图结构满足各所述图结构属性的更新期望时,将所述第j+1候选图结构,确定为所述目标图结构。
在一些实施例中,上述更新模块,还用于获取所述待更新图结构的待更新邻接矩阵,所述待更新邻接矩阵,用于指示所述待更新图结构中顶点之间的相邻关系;基于所述属性偏移分值,确定所述待更新图结构的更新矩阵,所述更新矩阵的维度与所述待更新邻接矩阵的维度相同;将所述待更新邻接矩阵与所述更新矩阵进行相减,得到差值矩阵,并对所述差值矩阵中的各特征元素进行归一化处理,得到更新邻接矩阵;将所述更新邻接矩阵对应的图结构,确定为所述第1候选图结构。
在一些实施例中,上述更新模块,还用于针对各所述图结构属性,结合所述图结构属性对应的偏好属性分值和所述图结构属性对应的属性偏移分值,确定所述图结构属性的属性调整权重,并将所述图结构属性对应的属性偏移分值和所述属性调整权重的乘积,确定为参考参数值;以各所述参考参数值为特征元素的值,构建候选更新矩阵,所述候选更新矩阵中各特征元素与所述图结构属性一一对应;基于所述待更新邻接矩阵的维度,对所述候选更新矩阵进行维度调整,得到所述待更新图结构的更新矩阵。
在一些实施例中,上述更新模块,还用于基于所述图结构属性,对所述第1候选图结构进行属性预测,得到所述第1候选图结构分别对应各所述图结构属性的第二预测分值;针对各所述图结构属性,将所述图结构属性对应的第二预测分值与相应的所述偏好属性分值的差值,与所述图结构属性对应的差值阈值进行比较,得到比较结果,所述比较结果,用于指示所述差值是否小于所述差值阈值;其中,所述图结构属性对应的差值阈值,不大于所述图结构属性对应的属性偏移分值;基于所述比较结果,确定所述第1候选图结构的指示信息,所述指示信息,用于指示所述第1候选图结构是否满足各所述图结构属性的更新期望。
在一些实施例中,上述更新模块,还用于当各所述图结构属性的比较结果,均指示所述差值小于所述差值阈值时,将所述第1候选图结构的指示信息,确定为第一指示信息;当各所述图结构属性的比较结果中,存在指示所述差值大于或等于所述差值阈值的比较结果时,将所述第1候选图结构的指示信息,确定为第二指示信息;其中,所述第一指示信息,用于指示所述第1候选图结构满足各所述图结构属性的更新期望,所述第二指示信息,用于指示所述第1候选图结构不满足各所述图结构属性的更新期望。
在一些实施例中,上述更新模块,还用于基于所述图结构属性,对所述第j候选图结构进行属性预测,得到所述第j候选图结构分别对应各所述图结构属性的第三预测分值;针对各所述图结构属性,将所述图结构属性对应的第三预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的参考偏移分值;基于所述参考偏移分值,对所述第j候选图结构进行更新,得到所述第j+1候选图结构。
在一些实施例中,上述更新模块,还用于获取所述第j候选图结构的候选邻接矩阵,所述候选邻接矩阵,用于指示所述第j候选图结构中顶点之间的相邻关系;基于所述参考偏移分值,确定所述第j候选图结构的参考矩阵,所述参考矩阵的维度与所述候选邻接矩阵的维度相同;将所述候选邻接矩阵与所述参考矩阵进行相减,得到参考差值矩阵,并对所述参考差值矩阵中的各特征元素进行归一化处理,得到参考邻接矩阵;将所述参考邻接矩阵对应的图结构,确定为所述第j+1候选图结构。
本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机程序或计算机可执行指令,该计算机程序或计算机可执行指令存储在计算机可读存储介质中。电子设备的处理器从计算机可读存储介质读取该计算机可执行指令,处理器执行该计算机可执行指令,使得该电子设备执行本申请实施例上述的图结构的更新方法。
本申请实施例提供一种存储有计算机可执行指令的计算机可读存储介质,其中存储有计算机可执行指令,当计算机可执行指令被处理器执行时,将引起处理器执行本申请实施例提供的图结构的更新方法,例如,如图3示出的图结构的更新方法。
在一些实施例中,计算机可读存储介质可以是FRAM、ROM、PROM、EPROM、EEP ROM、闪存、磁表面存储器、光盘、或CD-ROM等存储器;也可以是包括上述存储器之一或任意组合的各种电子设备。
在一些实施例中,计算机可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,计算机可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,HyperText Markup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
作为示例,计算机可执行指令可被部署为在一个电子设备上执行,或者在位于一个地点的多个电子设备上执行,又或者,在分布在多个地点且通过通信网络互连的多个电子设备上执行。
综上,本申请实施例具有如下有益效果:
(1)通过基于图结构属性,对待更新图结构进行属性预测,得到待更新图结构分别对应各图结构属性的第一预测分值,针对各图结构属性,将相应的第一预测分值和相应的偏好属性分值的差值,确定为图结构属性的属性偏移分值,基于属性偏移分值,对待更新图结构进行更新,得到满足各图结构属性的更新期望的目标图结构。如此,通过针对各图结构属性,确定相应的第一预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的属性偏移分值,从而能够准确的确定出待更新图结构较之于更新期望之间的差距,通过所得到的属性偏移分值对待更新图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
(2)通过本申请实施例提供的图结构的更新方法,能够在保证一个属性优化的同时,不牺牲其他属性的表现,实现多属性之间的平衡,不断从历史数据和实时数据中学习和优化,提高优化的准确性和效率,这种自我学习和优化的能力,使得本申请实施例提供的图结构的更新方法能够随着时间的推移,逐渐提高其性能,能够准确预测多个属性之间的复杂关系,以及它们如何共同影响分子的性能,极大的加速了分子优化的过程,提高了优化效率。
(3)在药物研发的应用场景中,通过对初始图结构中的各顶点分别进行顶点拓展,得到待更新图结构,使得所得到的待更新图结构较之于初始图结构,具有更多的原子和化学键,使得待更新图结构能够具有更多的更新空间,从而能够更好更多的满足不同的更新期望。
(4)通过以原子作为顶点、化学键作为边,将分子结构转换为初始图结构,从而将目标化学物质的分子结构转换为数学语言,便于后续对分子结构进行处理,以得到满足更新期望的目标化学物质的分子结构。
(5)药物研发的应用场景中,上述目标化学物质可以为原始药物的化学分子,通过获取原始药物的化学分子的分子结构,便于后续以原始药物作为药物研发基础,对原始药物进行更新改造,得到满足更新期望的目标药物的分子结构。
(6)基于图结构属性,对待更新图结构进行属性预测,得到待更新图结构分别对应各图结构属性的第一预测分值,由于上述第一预测分值的数值大小,与待更新图结构具有相应的图结构属性的可能性的数值大小正相关,因此,通过所得到的第一预测分值能够实现对待更新图结构的可能具有的各种图结构属性进行准确评估,为后续对待更新图结构进行更新提供了准确的数据支撑。
(7)通过对初始属性预测模型进行有效训练,得到属性预测模型,使得所得到的属性预测模型具备准确的预测性能,使得预测所得到的第一预测分值更加准确,通过所得到的第一预测分值能够实现对待更新图结构的可能具有的各种图结构属性进行准确评估,为后续对待更新图结构进行更新提供了准确的数据支撑。
(8)通过针对各图结构属性,确定相应的第一预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的属性偏移分值,从而能够准确的确定出待更新图结构较之于更新期望之间的差距,通过所得到的属性偏移分值对待更新图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
(9)图结构属性对应的差值阈值,不大于图结构属性对应的属性偏移分值,如此,通过将图结构属性对应的差值阈值设置为不大于图结构属性对应的属性偏移分值的数值,从而使得更新过程不断的将待更新图结构朝着更新期望的方向进行改造,使得最终所得到的目标图结构能够满足相应的更新期望。
(10)通过确定第1候选图结构是否满足各图结构属性的更新期望,在第1候选图结构满足各图结构属性的更新期望时,快速的将第1候选图结构确定为目标图结构,在第1候选图结构不满足各图结构属性的更新期望时,继续对第1候选图结构进行更新,直到更新所得到的候选图结构能够满足各图结构属性的更新期望,从而有效提高了图结构的更新准确度。
(11)当第1候选图结构满足各图结构属性的更新期望时,此时可以将第1候选图结构直接确定为目标图结构,从而有效节省了目标图结构的确定时长,有效提高了图结构的更新效率。
(12)通过在第1候选图结构不满足各图结构属性的更新期望,采取不断的对第1候选图结构进行更新,直至找到满足各图结构属性的更新期望的目标图结构,从而有效保证了所确定的目标图结构能够满足各图结构属性的更新期望,从而有效提高了图结构的更新准确度。
(13)通过针对各图结构属性,确定相应的第二预测分值和相应的偏好属性分值之间的差值,确定每个图结构属性的参考偏移分值,从而能够准确的确定出第j候选图结构较之于更新期望之间的差距,通过所得到的参考偏移分值对第j候选图结构进行更新,使得所得到的目标图结构能够满足各图结构属性的更新期望,综合从多个图结构属性的角度确定出准确的目标图结构,从而有效提高了图结构的更新准确度。
以上所述,仅为本申请的实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和范围之内所作的任何修改、等同替换和改进等,均包含在本申请的保护范围之内。
Claims (17)
1.一种图结构的更新方法,其特征在于,所述方法包括:
获取待更新图结构,以及多个用于指示图结构的结构特性的图结构属性;
基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值;
获取各所述图结构属性分别对应的偏好属性分值,所述偏好属性分值,用于指示对所述待更新图结构中相应的所述图结构属性的更新期望;
针对各所述图结构属性,将所述图结构属性对应的第一预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的属性偏移分值;
基于所述属性偏移分值,对所述待更新图结构进行更新,得到目标图结构,所述目标图结构满足各所述图结构属性的更新期望。
2.根据权利要求1所述的方法,其特征在于,所述获取待更新图结构,包括:
获取目标化学物质的分子结构,所述分子结构包括多个原子,以及用于连接所述多个原子的化学键;
以所述原子作为顶点、所述化学键作为边,将所述分子结构转换为初始图结构,并对所述初始图结构中的各所述顶点分别进行顶点拓展,得到所述待更新图结构。
3.根据权利要求1所述的方法,其特征在于,所述属性预测通过属性预测模型实现,所述属性预测模型包括特征提取层和预测层,所述基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值,包括:
调用所述特征提取层,对所述待更新图结构进行图特征提取,得到所述待更新图结构的图特征;
针对各所述图结构属性,基于所述图特征,调用所述预测层,对所述待更新图结构进行所述图结构属性的属性预测,得到所述待更新图结构对应所述图结构属性的第一预测分值。
4.根据权利要求3所述的方法,其特征在于,所述特征提取层包括多个特征卷积层和一个特征聚合层,所述调用所述特征提取层,对所述待更新图结构进行图特征提取,得到所述待更新图结构的图特征,包括:
调用所述多个特征卷积层,对所述待更新图结构进行特征卷积,得到各所述特征卷积层分别对应的卷积图特征;
调用所述特征聚合层,对各所述卷积图特征进行特征聚合,得到所述待更新图结构的图特征。
5.根据权利要求4所述的方法,其特征在于,所述调用所述多个特征卷积层,对所述待更新图结构进行特征卷积,得到各所述特征卷积层分别对应的卷积图特征,包括:
调用第1特征卷积层,对所述待更新图结构进行特征卷积,得到所述第1特征卷积层对应的第1卷积图特征;
遍历i执行以下处理:调用第i特征卷积层,对第i-1卷积图特征进行特征卷积,得到所述第i特征卷积层对应的第i卷积图特征;
其中,1<i≤N,所述N用于指示所述特征提取层中所述特征卷积层的层数。
6.根据权利要求3所述的方法,其特征在于,所述基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值之前,所述方法还包括:
获取初始属性预测模型、图结构样本,及所述图结构样本分别对应各所述图结构属性的标签分值;
调用所述初始属性预测模型,对所述图结构样本进行属性预测,得到所述图结构样本分别对应各所述图结构属性的样本预测分值;
结合所述样本预测分值和所述标签分值,对所述初始属性预测模型进行训练,得到所述属性预测模型。
7.根据权利要求1所述的方法,其特征在于,所述基于所述属性偏移分值,对所述待更新图结构进行更新,得到目标图结构,包括:
基于所述属性偏移分值,对所述待更新图结构进行初始更新,得到第1候选图结构;
当所述第1候选图结构满足各所述图结构属性的更新期望时,将所述第1候选图结构确定为所述目标图结构;
当所述第1候选图结构不满足各所述图结构属性的更新期望时,遍历j执行以下处理,直至得到所述目标图结构:
对第j候选图结构进行更新,得到第j+1候选图结构,1≤j,当所述第j+1候选图结构满足各所述图结构属性的更新期望时,将所述第j+1候选图结构,确定为所述目标图结构。
8.根据权利要求7所述的方法,其特征在于,所述基于所述属性偏移分值,对所述待更新图结构进行初始更新,得到第1候选图结构,包括:
获取所述待更新图结构的待更新邻接矩阵,所述待更新邻接矩阵,用于指示所述待更新图结构中顶点之间的相邻关系;
基于所述属性偏移分值,确定所述待更新图结构的更新矩阵,所述更新矩阵的维度与所述待更新邻接矩阵的维度相同;
将所述待更新邻接矩阵与所述更新矩阵进行相减,得到差值矩阵,并对所述差值矩阵中的各特征元素进行归一化处理,得到更新邻接矩阵;
将所述更新邻接矩阵对应的图结构,确定为所述第1候选图结构。
9.根据权利要求8所述的方法,其特征在于,所述基于所述属性偏移分值,确定所述待更新图结构的更新矩阵,包括:
针对各所述图结构属性,结合所述图结构属性对应的偏好属性分值和所述图结构属性对应的属性偏移分值,确定所述图结构属性的属性调整权重,并将所述图结构属性对应的属性偏移分值和所述属性调整权重的乘积,确定为参考参数值;
以各所述参考参数值为特征元素的值,构建候选更新矩阵,所述候选更新矩阵中各特征元素与所述图结构属性一一对应;
基于所述待更新邻接矩阵的维度,对所述候选更新矩阵进行维度调整,得到所述待更新图结构的更新矩阵。
10.根据权利要求7所述的方法,其特征在于,所述基于所述属性偏移分值,对所述待更新图结构进行初始更新,得到第1候选图结构之后,所述方法还包括:
基于所述图结构属性,对所述第1候选图结构进行属性预测,得到所述第1候选图结构分别对应各所述图结构属性的第二预测分值;
针对各所述图结构属性,将所述图结构属性对应的第二预测分值与相应的所述偏好属性分值的差值,与所述图结构属性对应的差值阈值进行比较,得到比较结果,所述比较结果,用于指示所述差值是否小于所述差值阈值;
其中,所述图结构属性对应的差值阈值,不大于所述图结构属性对应的属性偏移分值;
基于所述比较结果,确定所述第1候选图结构的指示信息,所述指示信息,用于指示所述第1候选图结构是否满足各所述图结构属性的更新期望。
11.根据权利要求10所述的方法,其特征在于,所述基于所述比较结果,确定所述第1候选图结构的指示信息,包括:
当各所述图结构属性的比较结果,均指示所述差值小于所述差值阈值时,将所述第1候选图结构的指示信息,确定为第一指示信息;
当各所述图结构属性的比较结果中,存在指示所述差值大于或等于所述差值阈值的比较结果时,将所述第1候选图结构的指示信息,确定为第二指示信息;
其中,所述第一指示信息,用于指示所述第1候选图结构满足各所述图结构属性的更新期望,所述第二指示信息,用于指示所述第1候选图结构不满足各所述图结构属性的更新期望。
12.根据权利要求7所述的方法,其特征在于,所述对所述第j候选图结构进行更新,得到第j+1候选图结构,包括:
基于所述图结构属性,对所述第j候选图结构进行属性预测,得到所述第j候选图结构分别对应各所述图结构属性的第三预测分值;
针对各所述图结构属性,将所述图结构属性对应的第三预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的参考偏移分值;
基于所述参考偏移分值,对所述第j候选图结构进行更新,得到所述第j+1候选图结构。
13.根据权利要求12所述的方法,其特征在于,所述基于所述参考偏移分值,对所述第j候选图结构进行更新,得到所述第j+1候选图结构,包括:
获取所述第j候选图结构的候选邻接矩阵,所述候选邻接矩阵,用于指示所述第j候选图结构中顶点之间的相邻关系;
基于所述参考偏移分值,确定所述第j候选图结构的参考矩阵,所述参考矩阵的维度与所述候选邻接矩阵的维度相同;
将所述候选邻接矩阵与所述参考矩阵进行相减,得到参考差值矩阵,并对所述参考差值矩阵中的各特征元素进行归一化处理,得到参考邻接矩阵;
将所述参考邻接矩阵对应的图结构,确定为所述第j+1候选图结构。
14.一种图结构的更新装置,其特征在于,所述装置包括:
获取模块,用于获取待更新图结构,以及多个用于指示图结构的结构特性的图结构属性;
属性预测模块,用于基于所述图结构属性,对所述待更新图结构进行属性预测,得到所述待更新图结构分别对应各所述图结构属性的第一预测分值;
期望模块,用于获取各所述图结构属性分别对应的偏好属性分值,所述偏好属性分值,用于指示对所述待更新图结构中相应的所述图结构属性的更新期望;
更新模块,用于针对各所述图结构属性,将所述图结构属性对应的第一预测分值与相应的所述偏好属性分值之间的差值,确定为所述图结构属性的属性偏移分值;基于所述属性偏移分值,对所述待更新图结构进行更新,得到目标图结构,所述目标图结构满足各所述图结构属性的更新期望。
15.一种电子设备,其特征在于,所述电子设备包括:
存储器,用于存储计算机可执行指令或者计算机程序;
处理器,用于执行所述存储器中存储的计算机可执行指令或者计算机程序时,实现权利要求1至13任一项所述的图结构的更新方法。
16.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时实现权利要求1至13任一项所述的图结构的更新方法。
17.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时实现权利要求1至13任一项所述的图结构的更新方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311315868.6A CN117349479A (zh) | 2023-10-11 | 2023-10-11 | 图结构的更新方法、装置、设备、存储介质及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311315868.6A CN117349479A (zh) | 2023-10-11 | 2023-10-11 | 图结构的更新方法、装置、设备、存储介质及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117349479A true CN117349479A (zh) | 2024-01-05 |
Family
ID=89355312
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311315868.6A Pending CN117349479A (zh) | 2023-10-11 | 2023-10-11 | 图结构的更新方法、装置、设备、存储介质及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117349479A (zh) |
-
2023
- 2023-10-11 CN CN202311315868.6A patent/CN117349479A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111406267B (zh) | 使用性能预测神经网络的神经架构搜索 | |
CN112116155B (zh) | 基于智能决策的人口流动预测方法、装置及计算机设备 | |
US20230025317A1 (en) | Text classification model training method, text classification method, apparatus, device, storage medium and computer program product | |
CN110515986B (zh) | 一种社交网络图的处理方法、装置及存储介质 | |
CN114357105B (zh) | 地理预训练模型的预训练方法及模型微调方法 | |
CN111883262B (zh) | 疫情趋势预测方法、装置、电子设备及存储介质 | |
EP4152212A1 (en) | Data processing method and device | |
Santana et al. | A reference business process for ecological niche modelling | |
CN111104599B (zh) | 用于输出信息的方法和装置 | |
CN111368973B (zh) | 用于训练超网络的方法和装置 | |
CN111914178A (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
CN113643532B (zh) | 一种区域交通的预测方法以及设备 | |
CN112561031A (zh) | 基于人工智能的模型搜索方法、装置及电子设备 | |
CN114330703A (zh) | 搜索模型的更新方法、装置、设备及计算机可读存储介质 | |
CN114357319A (zh) | 网络请求处理方法、装置、设备、存储介质及程序产品 | |
Li et al. | Graph convolution recurrent denoising diffusion model for multivariate probabilistic temporal forecasting | |
CN106600053B (zh) | 一种基于时空轨迹和社会网络的用户属性预测系统 | |
CN117035025A (zh) | 图卷积神经网络的训练方法、装置、电子设备及存储介质 | |
CN117349479A (zh) | 图结构的更新方法、装置、设备、存储介质及程序产品 | |
CN112861474B (zh) | 一种信息标注方法、装置、设备及计算机可读存储介质 | |
Lin et al. | Integrating ANFIS and Qt Framework to Develop a Mobile‐Based Typhoon Rainfall Forecasting System | |
Rahman et al. | MDLpark: available parking prediction for smart parking through mobile deep learning | |
CN113761289A (zh) | 图学习方法、框架、计算机系统及可读存储介质 | |
Fukś et al. | Local structure approximation as a predictor of second-order phase transitions in asynchronous cellular automata | |
Li et al. | Image Semantic Space Segmentation Based on Cascaded Feature Fusion and Asymmetric Convolution Module |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |