CN111899807A - 一种分子结构生成方法、系统、设备及存储介质 - Google Patents
一种分子结构生成方法、系统、设备及存储介质 Download PDFInfo
- Publication number
- CN111899807A CN111899807A CN202010533481.8A CN202010533481A CN111899807A CN 111899807 A CN111899807 A CN 111899807A CN 202010533481 A CN202010533481 A CN 202010533481A CN 111899807 A CN111899807 A CN 111899807A
- Authority
- CN
- China
- Prior art keywords
- molecular
- splicing
- preset
- group
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000002910 structure generation Methods 0.000 title claims abstract description 19
- 230000000295 complement effect Effects 0.000 claims description 33
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 239000003208 petroleum Substances 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims description 2
- 238000012512 characterization method Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 239000012634 fragment Substances 0.000 description 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical group N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical group [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 1
- 150000001335 aliphatic alkanes Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 125000003118 aryl group Chemical group 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical group [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 150000001924 cycloalkanes Chemical class 0.000 description 1
- 150000001925 cycloalkenes Chemical class 0.000 description 1
- 125000005842 heteroatom Chemical group 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Chemical group 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000010517 secondary reaction Methods 0.000 description 1
- 229910052717 sulfur Inorganic materials 0.000 description 1
- 239000011593 sulfur Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/90—Programming languages; Computing architectures; Database systems; Data warehousing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Computing Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Analytical Chemistry (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种分子结构生成方法、系统、设备及存储介质,所述方法包括以下步骤:获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量;根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。本发明可以按照预设拼接规则快速将各种基团拼接得到分子结构,提高了分子结构的生成效率,而且提高了分子结构的稳定性。
Description
技术领域
本发明涉及石油化工技术领域,尤其涉及一种分子结构生成方法、系统、设备及存储介质。
背景技术
在石油化工技术领域,将多个结构片段的向量生成分子结构时,对分子的结构具有较高的要求,例如分子结构的稳定性是否满足要求等等。
现有的分子结构的生成方法,在对多种结构片段的向量进行拼接时需要不断调整结构片段之间的拼接方式以生成满足要求的分子结构,在此拼接过程中需要反复调整拼接方式导致效率较低以及分子结构的稳定性较低。
有鉴于此,如何构建分子结构已经成为本领域技术人员亟待解决的问题之一。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本发明提供了一种分子结构生成方法、系统、设备及存储介质。
有鉴于此,第一方面,本发明提供了一种分子结构生成方法,所述方法包括以下步骤:
获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量;
根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
结合第一方面,在第一方面第一种可能的实施方式中,所述根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,包括:
将所述基团信息与预设数据库中的预设分子拼接模板信息进行匹配,其中,所述预设数据库中存储有多种预设分子拼接模板信息,每种所述预设分子拼接模板信息包括对应的预设基团的预设种类和预设数量;
如果所述预设数据库中存在任一与所述基团信息相匹配的预设分子拼接模板信息,则将与所述预设分子拼接模板信息对应的预设分子结构作为由各种所述基团拼接后的分子结构。
结合第一方面,在第一方面第二种可能的实施方式中,所述预设分子拼接模板信息的种类包括:第一分子拼接模板信息;所述方法进一步包括:
将每种所述基团的种类与所述第一分子拼接模板信息中对应的第一预设基团的第一预设种类进行匹配,得到第一匹配结果;以及,将所述基团信息中每种基团的数量与所述第一分子拼接模板信息中对应的第一预设基团的第一预设数量进行匹配,得到第二匹配结果;
若所述第一匹配结果和所述第二匹配结果均为匹配成功,则将与所述第一分子拼接模板信息对应的第一预设分子结构作为由各种所述基团拼接后的分子结构。
结合第一方面,在第一方面第三种可能的实施方式中,所述预设分子拼接模板信息的种类包括:第二分子拼接模板信息;所述第二分子拼接模板信息包括:各种第二分子拼接模板的模板种类,以及各种第二分子拼接模板中的第二预设基团的第二预设种类和第二预设数量;所述方法进一步包括:
根据所述第二分子拼接模板信息,构建第二分子拼接模板信息集合,以及,根据所述基团信息构建基团信息集合;
判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集;
如果所述第二分子拼接模板信息集合与所述基团信息集合的交集不为空集,则确定预设数据库中存在与所述基团信息相匹配的第二分子拼接模板信息。
结合第一方面,在第一方面第四种可能的实施方式中,所述方法进一步包括:
判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集;
如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集,则将与所述第二分子拼接模板信息集合中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接得到的第二预设分子结构,作为由各种所述基团拼接后的分子结构;
如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集不为空集,则将所述补集中的所述基团信息对应的分子结构与所述交集中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接,得到由各种所述基团拼接后的分子结构。
结合第一方面,在第一方面第五种可能的实施方式中,所述判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集,包括:
确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息;
根据每种第二分子拼接模板的优先级信息,将每种第二分子拼接模板中的第二预设基团依次与所述基团信息集合中对应的每种待拼接基团进行匹配;
如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则确定所述第二分子拼接模板信息集合和所述基团信息集合的交集不为空集。
结合第一方面,在第一方面第六种可能的实施方式中,所述方法还包括:
如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则执行相匹配的待拼接基团的数量减去对应的第二预设基团的第二数量的操作,以得到所述待拼接基团的剩余数量。
结合第一方面,在第一方面第七种可能的实施方式中,所述判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集,包括:
当所述第二分子拼接模板信息集合与所述基团信息集合匹配完成后,判断所述待拼接基团的剩余数量是否为零;
若所述待拼接基团的剩余数量为零,则确定所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集。
结合第一方面,在第一方面第八种可能的实施方式中,确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息,包括:
根据每种第二分子拼接模板对应的分子结构的稳定性,确定每种第二分子拼接模板的优先级信息,其中,稳定性高的第二分子拼接模板对应的优先级,大于稳定性低的第二分子拼接模板对应的优先级。
结合第一方面,在第一方面第九种可能的实施方式中,所述基团信息还包括每种基团对应的字符串,所述根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,还包括:
将各种所述基团对应的字符串按照预设拼接进行拼接,得到一个长字符串;
将拼接得到的所述长字符串转换为分子结构,所述分子结构为二维平面结构。
结合第一方面,在第一方面第十种可能的实施方式中,所述方法还包括:
将所述分子结构由二维平面结构转换为三维立体结构。
第二方面,本发明提供了一种分子结构生成系统,所述系统包括:
第一获取单元,用于获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量;
第一拼接单元,用于根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
结合第二方面,在第二方面第一种可能的实施方式中,所述第一拼接单元包括:
第一匹配子单元,用于将所述基团信息与预设数据库中的预设分子拼接模板信息进行匹配,其中,所述预设数据库中存储有多种预设分子拼接模板信息,每种所述预设分子拼接模板信息包括对应的预设基团的预设种类和预设数量;
第一确定子单元,用于如果所述预设数据库中存在任一与所述基团信息相匹配的预设分子拼接模板信息,则将与所述预设分子拼接模板信息对应的预设分子结构作为由各种所述基团拼接后的分子结构。
结合第二方面,在第二方面第二种可能的实施方式中,所述预设分子拼接模板信息的种类包括:第一分子拼接模板信息;所述系统进一步包括:
第二匹配子单元,用于将每种所述基团的种类与所述第一分子拼接模板信息中对应的第一预设基团的第一预设种类进行匹配,得到第一匹配结果;以及,将所述基团信息中每种基团的数量与所述第一分子拼接模板信息中对应的第一预设基团的第一预设数量进行匹配,得到第二匹配结果;
第二确定子单元,用于若所述第一匹配结果和所述第二匹配结果均为匹配成功,则将与所述第一分子拼接模板信息对应的第一预设分子结构作为由各种所述基团拼接后的分子结构。
结合第二方面,在第二方面第三种可能的实施方式中,所述预设分子拼接模板信息的种类包括:第二分子拼接模板信息;所述第二分子拼接模板信息包括:各种第二分子拼接模板的模板种类,以及各种第二分子拼接模板中的第二预设基团的第二预设种类和第二预设数量;所述系统进一步包括:
第一构建子单元,用于根据所述第二分子拼接模板信息,构建第二分子拼接模板信息集合,以及,根据所述基团信息构建基团信息集合;
第一判断子单元,用于判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集;
第三确定子单元,用于如果所述第二分子拼接模板信息集合与所述基团信息集合的交集不为空集,则确定预设数据库中存在与所述基团信息相匹配的第二分子拼接模板信息。
结合第二方面,在第二方面第四种可能的实施方式中,所述系统进一步包括:
第二判断子单元,用于判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集;
第四确定子单元,用于如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集,则将与所述第二分子拼接模板信息集合中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接得到的第二预设分子结构,作为由各种所述基团拼接后的分子结构;
第五确定子单元,用于如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集不为空集,则将所述补集中的所述基团信息对应的分子结构与所述交集中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接,得到由各种所述基团拼接后的分子结构。
结合第二方面,在第二方面第五种可能的实施方式中,所述第一判断子单元,包括:
第六确定子单元,用于确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息;
第三匹配子单元,用于根据每种第二分子拼接模板的优先级信息,将每种第二分子拼接模板中的第二预设基团依次与所述基团信息集合中对应的每种待拼接基团进行匹配;
第七确定子单元,用于如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则确定所述第二分子拼接模板信息集合和所述基团信息集合的交集不为空集。
结合第二方面,在第二方面第六种可能的实施方式中,所述系统还包括:
第一执行子单元,用于如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则执行相匹配的待拼接基团的数量减去对应的第二预设基团的第二数量的操作,以得到所述待拼接基团的剩余数量。
结合第二方面,在第二方面第七种可能的实施方式中,所述第二判断子单元,包括:
第三判断子单元,用于当所述第二分子拼接模板信息集合与所述基团信息集合匹配完成后,判断所述待拼接基团的剩余数量是否为零;
第八确定子单元,用于若所述待拼接基团的剩余数量为零,则确定所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集。
结合第二方面,在第二方面第八种可能的实施方式中,所述第六确定子单元,包括:
第九确定子单元,用于根据每种第二分子拼接模板对应的分子结构的稳定性,确定每种第二分子拼接模板的优先级信息,其中,稳定性高的第二分子拼接模板对应的优先级,大于稳定性低的第二分子拼接模板对应的优先级。
结合第二方面,在第二方面第九种可能的实施方式中,所述基团信息还包括每种基团对应的字符串,所述第一拼接单元,还包括:
第一拼接子单元,用于将各种所述基团对应的字符串按照预设拼接进行拼接,得到一个长字符串;
第一转换子单元,用于将拼接得到的所述长字符串转换为分子结构,所述分子结构为二维平面结构。
结合第二方面,在第二方面第十种可能的实施方式中,所述系统还包括:
第二转换子单元,用于将所述分子结构由二维平面结构转换为三维立体结构。
第三方面,本发明提供了一种分子结构生成设备,所述分子结构生成设备包括处理器、存储器;所述处理器用于执行所述存储器中存储的分子结构生成程序,以实现如第一方面所述的分子结构生成方法。
第四方面,本发明提供了一种计算机可读存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如第一方面所述的分子结构生成方法。
本发明实施例提供的上述技术方案与现有技术相比具有如下优点:
本发明实施例提供的该分子结构生成方法,获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量;根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。可以按照预设拼接规则快速将各种基团拼接得到分子结构,提高了分子结构的生成效率,而且提高了分子结构的稳定性。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种分子结构生成方法的流程示意图;
图2为本发明实施例提供的另一种分子结构生成方法的流程示意图;
图3为本发明实施例提供的一种分子结构生成系统的结构示意图;
图4为本发明实施例提供的一种分子结构生成设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
现在将参考附图描述实现本发明各个实施例的服务器。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。因此,“模块”与“部件”可以混合地使用。
在本发明中,可以利用基于SOL(Structure-Oriented Lumping,结构导向集总)的分子表征方法,来表征分子组成中的单分子。其中,基于SOL的分子表征方法,可以利用24个基团表征烃类分子的结构。
进一步地,SOL属于分子尺度上的集总,将实际体系中的分子数由上百万个减少到几千,大大降低了分子表征的复杂性。该基于SOL的分子表征方法不仅可以表示烷烃、环烷烃,一直到包含50-60个碳原子的复杂芳烃结构,还可表示作为中间产物或二次反应产物的烯烃或环烯烃,另外还考虑了含硫、氮、氧等杂原子的化合物。
本发明实施例提供了一种分子结构生成方法,如图1所示,该方法可以包括以下步骤:
S101、获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量。
在本申请实施例中,基团信息还包括每种基团对应的字符串,所述根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,还包括:将各种所述基团对应的字符串按照预设拼接进行拼接,得到一个长字符串;将拼接得到的所述长字符串转换为分子结构,所述分子结构为二维平面结构。具体地,可以将多个已拼接的基团拼接得到的字符串的结束位置作为待拼接基团的拼接位置;还可以将多个已拼接的基团对应的字符串之间的中间位置作为待拼接基团的拼接位置,本实施例对此不做限定。
在本申请另一实施例中,该方法还包括:将所述分子结构由二维平面结构转换为三维立体结构,以便更直观的观察生成的分子结构以及分子结构中各个基团的分布规律和基团信息。
S102、根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
本申请实施例可以按照预设拼接规则快速将各种基团拼接得到分子结构,提高了分子结构的生成效率,而且提高了分子结构的稳定性
其中,上述步骤S102、根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,进一步包括:
将所述基团信息与预设数据库中的预设分子拼接模板信息进行匹配,其中,所述预设数据库中存储有多种预设分子拼接模板信息,每种所述预设分子拼接模板信息包括对应的预设基团的预设种类和预设数量;
如果所述预设数据库中存在任一与所述基团信息相匹配的预设分子拼接模板信息,则将与所述预设分子拼接模板信息对应的预设分子结构作为由各种所述基团拼接后的分子结构。
可选的,预设数据库中存储的预设分子拼接模板信息的种类包括第一分子拼接模板信息和第二分子拼接模板信息,下面以这两种模板信息为例对步骤S102的将各种基团按照预设拼接规则进行拼接的拼接方式进一步说明,但是本领域技术人员应当知道的是,以下几种方式仅用于说明本实施例,而不用于限定本实施例。
第一种基团拼接方式:
当预设分子拼接模板信息为第一分子拼接模板信息时,将每种所述基团的种类与所述第一分子拼接模板信息中对应的第一预设基团的第一预设种类进行匹配,得到第一匹配结果;以及,将所述基团信息中每种基团的数量与所述第一分子拼接模板信息中对应的第一预设基团的第一预设数量进行匹配,得到第二匹配结果;若所述第一匹配结果和所述第二匹配结果均为匹配成功,则将与所述第一分子拼接模板信息对应的第一预设分子结构作为由各种所述基团拼接后的分子结构。
需要说明的是,第一预设分子结构为由多个第一预设基团拼接得到的完整的分子结构,该分子结构具有较强的稳定性。
如果第一匹配结果为匹配失败,第二匹配结果为匹配成功;或者,第一匹配结果为匹配成功,第二匹配结果为匹配失败;或者第一匹配结果和第二匹配结果均为匹配失败,则将各个基团按照优先级进行拼接得到分子结构。
在本发明另一实施例中,将第一分子拼接模板信息与基团信息匹配失败时得到的各个基团按照优先级进行拼接得到分子结构,作为新的第一分子拼接模板,并存储到预设数据库中。
其中,将各个基团按照优先级进行拼接,即采用预设数据库中的第二分子拼接模板信息与基团信息按照优先级进行匹配,预设分子拼接模板信息为第二分子拼接模板信息;所述第二分子拼接模板信息包括:各种第二分子拼接模板的模板种类,以及各种第二分子拼接模板中的第二预设基团的第二预设种类和第二预设数量;参照图2,本发明另一实施例提供了一种石油加工装置的分子结构生成方法包括以下步骤:
S201、根据所述第二分子拼接模板信息,构建第二分子拼接模板信息集合,以及,根据所述基团信息构建基团信息集合。
例如,预设数据库中的第二分子拼接模板包括四种模板,分别是模板1、模板2、模板3和模板4,其中,各个模板对应的第二分子拼接模板信息如下:
模板1:[基团A6=1,基团R=4,基团br=1,基团me=0];
模板2:[基团A6=1,基团R=5,基团br=2,基团me=1];
模板3:[基团A6=1,基团R=6,基团br=2,基团me=1];
模板4:[基团A6=1,基团R=1,基团br=0,基团me=0];
由上可知,模板1由1个基团A6,4个基团R和1个基团br拼接得到;模板2由1个基团A6,5个基团R,2个基团br和1个基团me拼接得到;模板3由1个基团A6,6个基团R,2个基团br和1个基团me拼接得到;模板4由1个基团A6和1个基团R拼接得到。其中,上述A6、R、br和me表示基团的种类。
基于模板1、模板2、模板3和模板4中全部的基团的数量和种类,构建得到第二分子拼接模板信息集合。其中,这四个模板的优先级顺序为:模板3>模板2>模板1>模板4,优先级高的模板中的基团优先与待拼接的基团进行匹配,例如,在上述四种模板中,将模板3中的基团的种类和数量与待拼接的基团的种类和数量进行匹配,若基团的种类和数量均匹配成功,则从待拼接的基团中优先消耗与模板3对应的基团。
其中,根据待拼接基团的基团信息(基团信息包括每种基团的种类和数量)构建的基团信息集合为:{A6=7,A4=1,R=33,br=6,me=7},首先,按照模板1、模板2、模板3和模板4四种模板的优先级顺序,先将模板3对应的第二分子拼接模板信息与基团信息集合进行匹配,由于单个模板3需要与基团信息集合中的1个基团A6、6个基团R、2个基团br、1个基团me匹配,根据匹配结果可知,需要从预设数据库中优先选取3个模板3,并将选取的3个模板3进行拼接,对基团信息集合中剩余的基团的种类和数量进行更新,得到新的基团信息集合为:{A6=4,A4=1,R=15,br=0,me=4};
其次,按照模板1、模板2、模板3和模板4四种模板的优先级顺序,将模板2对应的第二分子拼接模板信息与新的基团信息集合{A6=4,A4=1,R=15,br=0,me=4}进行匹配,单个模板2需要与新的基团信息集合中的1个基团A6、5个基团R、2个基团br和1个基团me匹配,由于新的基团信息集合中的基团br的数量为0,则模板2与新的基团信息集合匹配失败,新的基团信息集合{A6=4,A4=1,R=15,br=0,me=4}中的基团种类和数量不发生变化;
再次,按照模板的优先级顺序,将模板1对应的第二分子拼接模板信息与新的基团信息集合{A6=4,A4=1,R=15,br=0,me=4}进行匹配,单个模板1需要与新的基团信息集合中的1个基团A6、4个基团R和1个基团br匹配,由于新的基团信息集合中的基团br的数量为0,则模板1与新的基团信息集合匹配失败,新的基团信息集合{A6=4,A4=1,R=15,br=0,me=4}中的基团种类和数量不发生变化;
最后,按照模板的优先级顺序,将模板4对应的第二分析拼接模板信息与新的基团信息集合{A6=4,A4=1,R=15,br=0,me=4}进行匹配,单个模板4需要与新的基团信息集合中的1个基团A6和1个基团R匹配,根据匹配结果可知,需要从预设数据库中选取4个模板4,并将选取的4个模板4与上述拼接好的3个模板3进行拼接,对新的基团信息集合中剩余的基团的种类和数量进行更新,得到的基团信息集合为:{A6=0,A4=1,R=11,br=0,me=4}。
至此,预设数据库中全部的第二分子拼接模板与待拼接基团匹配结束,由于基团信息集合中还剩余匹配失败的待拼接基团,因此,将匹配失败的多个待拼接基团以字符串的形式进行拼接,也就是说,将1个基团A4、11个基团R和4个基团me对应的字符串进行拼接,再将拼接后的字符串与匹配成功的3个模板3、4个模板4对应的字符串进行拼接得到一个长字符串;将拼接得到的长字符串转换为分子结构,该分子结构即为各种待拼接基团拼接后的分子结构。
可选的,如果全部的第二分子拼接模板与待拼接基团匹配结束后,不存在匹配失败的待拼接基团,则直接将匹配成功的各个模板进行拼接得到一个长字符串;将拼接得到的长字符串转换为分子结构,得到各种待拼接基团拼接后的分子结构。
S202、判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集,如果所述第二分子拼接模板信息集合与所述基团信息集合的交集不为空集,执行步骤S203;如果所述第二分子拼接模板信息集合与所述基团信息集合的交集为空集,执行步骤S204。
在本发明实施例中,具体通过以下方式判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集:
确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息;根据每种第二分子拼接模板的优先级信息,将每种第二分子拼接模板中的第二预设基团依次与所述基团信息集合中对应的每种待拼接基团进行匹配;如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则确定所述第二分子拼接模板信息集合和所述基团信息集合的交集不为空集;同时,执行相匹配的待拼接基团的数量减去对应的第二预设基团的第二数量的操作,以得到所述待拼接基团的剩余数量。
如果所述基团信息集合中不存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则确定所述第二分子拼接模板信息集合和所述基团信息集合的交集为空集。
在本发明实施例中,确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息,包括:根据每种第二分子拼接模板对应的分子结构的稳定性,确定每种第二分子拼接模板的优先级信息,其中,稳定性高的第二分子拼接模板对应的优先级,大于稳定性低的第二分子拼接模板对应的优先级。
S203、确定预设数据库中存在与所述基团信息相匹配的第二分子拼接模板信息,执行步骤S205。
S204、确定预设数据库中不存在与所述基团信息相匹配的第二分子拼接模板信息,执行步骤S208。
S205、判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集,如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集,执行步骤S206;如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集不为空集,执行步骤S207。
在本发明实施例中,具体通过以下方式判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集:
当所述第二分子拼接模板信息集合与所述基团信息集合匹配完成后,判断所述待拼接基团的剩余数量是否为零;若所述待拼接基团的剩余数量为零,则确定所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集。当待拼接基团的剩余数量为零时,也就是表明所有的基团均与第二分子拼接模板信息匹配成功,没有剩余的未匹配或匹配失败的基团。
S206、将与所述第二分子拼接模板信息集合中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接得到的第二预设分子结构,作为由各种所述基团拼接后的分子结构。
S207、将所述补集中的所述基团信息对应的分子结构与所述交集中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接,得到由各种所述基团拼接后的分子结构。
S208、结束。
参照图3,本发明实施例还提供了一种分子结构生成系统,所述系统包括:
第一获取单元11,用于获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量;
第一拼接单元12,用于根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
在本发明另一实施例中,所述第一拼接单元12包括:
第一匹配子单元(图中未示出),用于将所述基团信息与预设数据库中的预设分子拼接模板信息进行匹配,其中,所述预设数据库中存储有多种预设分子拼接模板信息,每种所述预设分子拼接模板信息包括对应的预设基团的预设种类和预设数量;
第一确定子单元(图中未示出),用于如果所述预设数据库中存在任一与所述基团信息相匹配的预设分子拼接模板信息,则将与所述预设分子拼接模板信息对应的预设分子结构作为由各种所述基团拼接后的分子结构。
在本发明另一实施例中,所述预设分子拼接模板信息的种类包括:第一分子拼接模板信息;所述系统进一步包括:
第二匹配子单元(图中未示出),用于将每种所述基团的种类与所述第一分子拼接模板信息中对应的第一预设基团的第一预设种类进行匹配,得到第一匹配结果;以及,将所述基团信息中每种基团的数量与所述第一分子拼接模板信息中对应的第一预设基团的第一预设数量进行匹配,得到第二匹配结果;
第二确定子单元(图中未示出),用于若所述第一匹配结果和所述第二匹配结果均为匹配成功,则将与所述第一分子拼接模板信息对应的第一预设分子结构作为由各种所述基团拼接后的分子结构。
在本发明另一实施例中,所述预设分子拼接模板信息的种类包括:第二分子拼接模板信息;所述第二分子拼接模板信息包括:各种第二分子拼接模板的模板种类,以及各种第二分子拼接模板中的第二预设基团的第二预设种类和第二预设数量;所述系统进一步包括:
第一构建子单元(图中未示出),用于根据所述第二分子拼接模板信息,构建第二分子拼接模板信息集合,以及,根据所述基团信息构建基团信息集合;
第一判断子单元(图中未示出),用于判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集;
第三确定子单元,用于如果所述第二分子拼接模板信息集合与所述基团信息集合的交集不为空集,则确定预设数据库中存在与所述基团信息相匹配的第二分子拼接模板信息。
在本发明另一实施例中,所述系统进一步包括:
第二判断子单元(图中未示出),用于判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集;
第四确定子单元(图中未示出),用于如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集,则将与所述第二分子拼接模板信息集合中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接得到的第二预设分子结构,作为由各种所述基团拼接后的分子结构;
第五确定子单元(图中未示出),用于如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集不为空集,则将所述补集中的所述基团信息对应的分子结构与所述交集中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接,得到由各种所述基团拼接后的分子结构。
在本发明另一实施例中,所述第一判断子单元(图中未示出),包括:
第六确定子单元(图中未示出),用于确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息;
第三匹配子单元(图中未示出),用于根据每种第二分子拼接模板的优先级信息,将每种第二分子拼接模板中的第二预设基团依次与所述基团信息集合中对应的每种待拼接基团进行匹配;
第七确定子单元(图中未示出),用于如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则确定所述第二分子拼接模板信息集合和所述基团信息集合的交集不为空集。
在本发明另一实施例中,所述系统还包括:
第一执行子单元(图中未示出),用于如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则执行相匹配的待拼接基团的数量减去对应的第二预设基团的第二数量的操作,以得到所述待拼接基团的剩余数量。
在本发明另一实施例中,所述第二判断子单元(图中未示出),包括:
第三判断子单元(图中未示出),用于当所述第二分子拼接模板信息集合与所述基团信息集合匹配完成后,判断所述待拼接基团的剩余数量是否为零;
第八确定子单元(图中未示出),用于若所述待拼接基团的剩余数量为零,则确定所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集。
在本发明另一实施例中,所述第六确定子单元(图中未示出),包括:
第九确定子单元(图中未示出),用于根据每种第二分子拼接模板对应的分子结构的稳定性,确定每种第二分子拼接模板的优先级信息,其中,稳定性高的第二分子拼接模板对应的优先级,大于稳定性低的第二分子拼接模板对应的优先级。
在本发明另一实施例中,所述基团信息还包括每种基团对应的字符串,所述第一拼接单元12,还包括:
第一拼接子单元(图中未示出),用于将各种所述基团对应的字符串按照预设拼接进行拼接,得到一个长字符串;
第一转换子单元(图中未示出),用于将拼接得到的所述长字符串转换为分子结构,所述分子结构为二维平面结构。
在本发明另一实施例中,所述系统还包括:
第二转换子单元(图中未示出),用于将所述分子结构由二维平面结构转换为三维立体结构。
参照图4,本发明实施例还提供了一种分子结构生成设备,所述分子结构生成设备包括处理器410、存储器411;所述处理器410用于执行所述存储器中存储的分子结构生成程序,以实现各方法实施例所述的分子结构生成方法,例如包括以下步骤:
获取与石油加工装置对应的待拼接的基团信息,所述基团信息包括每种基团的种类和数量;
根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
本发明实施例还提供了一种计算机可读存储介质,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现各方法实施例所述的分子结构生成方法,例如包括以下步骤:
获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量;
根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
Claims (24)
1.一种分子结构生成方法,其特征在于,所述方法包括:
获取待拼接的基团信息,所述基团信息包括每种基团的种类和数量;
根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
2.根据权利要求1所述的方法,其特征在于,所述根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,包括:
将所述基团信息与预设数据库中的预设分子拼接模板信息进行匹配,其中,所述预设数据库中存储有多种预设分子拼接模板信息,每种所述预设分子拼接模板信息包括对应的预设基团的预设种类和预设数量;
如果所述预设数据库中存在任一与所述基团信息相匹配的预设分子拼接模板信息,则将与所述预设分子拼接模板信息对应的预设分子结构作为由各种所述基团拼接后的分子结构。
3.根据权利要求2所述的方法,其特征在于,所述预设分子拼接模板信息的种类包括:第一分子拼接模板信息;所述方法进一步包括:
将每种所述基团的种类与所述第一分子拼接模板信息中对应的第一预设基团的第一预设种类进行匹配,得到第一匹配结果;以及,将所述基团信息中每种基团的数量与所述第一分子拼接模板信息中对应的第一预设基团的第一预设数量进行匹配,得到第二匹配结果;
若所述第一匹配结果和所述第二匹配结果均为匹配成功,则将与所述第一分子拼接模板信息对应的第一预设分子结构作为由各种所述基团拼接后的分子结构。
4.根据权利要求2或3所述的方法,其特征在于,所述预设分子拼接模板信息的种类包括:第二分子拼接模板信息;所述第二分子拼接模板信息包括:各种第二分子拼接模板的模板种类,以及各种第二分子拼接模板中的第二预设基团的第二预设种类和第二预设数量;所述方法进一步包括:
根据所述第二分子拼接模板信息,构建第二分子拼接模板信息集合,以及,根据所述基团信息构建基团信息集合;
判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集;
如果所述第二分子拼接模板信息集合与所述基团信息集合的交集不为空集,则确定预设数据库中存在与所述基团信息相匹配的第二分子拼接模板信息。
5.根据权利要求4所述的方法,其特征在于,所述方法进一步包括:
判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集;
如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集,则将与所述第二分子拼接模板信息集合中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接得到的第二预设分子结构,作为由各种所述基团拼接后的分子结构;
如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集不为空集,则将所述补集中的所述基团信息对应的分子结构与所述交集中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接,得到由各种所述基团拼接后的分子结构。
6.根据权利要求5所述的方法,其特征在于,所述判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集,包括:
确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息;
根据每种第二分子拼接模板的优先级信息,将每种第二分子拼接模板中的第二预设基团依次与所述基团信息集合中对应的每种待拼接基团进行匹配;
如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则确定所述第二分子拼接模板信息集合和所述基团信息集合的交集不为空集。
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则执行相匹配的待拼接基团的数量减去对应的第二预设基团的第二数量的操作,以得到所述待拼接基团的剩余数量。
8.根据权利要求7所述的方法,其特征在于,所述判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集,包括:
当所述第二分子拼接模板信息集合与所述基团信息集合匹配完成后,判断所述待拼接基团的剩余数量是否为零;
若所述待拼接基团的剩余数量为零,则确定所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集。
9.根据权利要求6所述的方法,其特征在于,确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息,包括:
根据每种第二分子拼接模板对应的分子结构的稳定性,确定每种第二分子拼接模板的优先级信息,其中,稳定性高的第二分子拼接模板对应的优先级,大于稳定性低的第二分子拼接模板对应的优先级。
10.根据权利要求1所述的方法,其特征在于,所述基团信息还包括每种基团对应的字符串,所述根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,还包括:
将各种所述基团对应的字符串按照预设拼接进行拼接,得到一个长字符串;
将拼接得到的所述长字符串转换为分子结构,所述分子结构为二维平面结构。
11.根据权利要求10所述的方法,其特征在于,所述方法还包括:
将所述分子结构由二维平面结构转换为三维立体结构。
12.一种分子结构生成系统,其特征在于,所述系统包括:
第一获取单元,用于获取与石油加工装置对应的待拼接的基团信息,所述基团信息包括每种基团的种类和数量;
第一拼接单元,用于根据所述基团信息,将各种所述基团按照预设拼接规则进行拼接,以得到由各种所述基团拼接后的分子结构;其中,所述预设拼接规则为用于表示各种所述基团之间的拼接方式的规则。
13.根据权利要求12所述的系统,其特征在于,所述第一拼接单元包括:
第一匹配子单元,用于将所述基团信息与预设数据库中的预设分子拼接模板信息进行匹配,其中,所述预设数据库中存储有多种预设分子拼接模板信息,每种所述预设分子拼接模板信息包括对应的预设基团的预设种类和预设数量;
第一确定子单元,用于如果所述预设数据库中存在任一与所述基团信息相匹配的预设分子拼接模板信息,则将与所述预设分子拼接模板信息对应的预设分子结构作为由各种所述基团拼接后的分子结构。
14.根据权利要求13所述的系统,其特征在于,所述预设分子拼接模板信息的种类包括:第一分子拼接模板信息;所述系统进一步包括:
第二匹配子单元,用于将每种所述基团的种类与所述第一分子拼接模板信息中对应的第一预设基团的第一预设种类进行匹配,得到第一匹配结果;以及,将所述基团信息中每种基团的数量与所述第一分子拼接模板信息中对应的第一预设基团的第一预设数量进行匹配,得到第二匹配结果;
第二确定子单元,用于若所述第一匹配结果和所述第二匹配结果均为匹配成功,则将与所述第一分子拼接模板信息对应的第一预设分子结构作为由各种所述基团拼接后的分子结构。
15.根据权利要求13或14所述的系统,其特征在于,所述预设分子拼接模板信息的种类包括:第二分子拼接模板信息;所述第二分子拼接模板信息包括:各种第二分子拼接模板的模板种类,以及各种第二分子拼接模板中的第二预设基团的第二预设种类和第二预设数量;所述系统进一步包括:
第一构建子单元,用于根据所述第二分子拼接模板信息,构建第二分子拼接模板信息集合,以及,根据所述基团信息构建基团信息集合;
第一判断子单元,用于判断所述第二分子拼接模板信息集合与所述基团信息集合的交集是否为空集;
第三确定子单元,用于如果所述第二分子拼接模板信息集合与所述基团信息集合的交集不为空集,则确定预设数据库中存在与所述基团信息相匹配的第二分子拼接模板信息。
16.根据权利要求15所述的系统,其特征在于,所述系统进一步包括:
第二判断子单元,用于判断所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集是否为空集;
第四确定子单元,用于如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集,则将与所述第二分子拼接模板信息集合中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接得到的第二预设分子结构,作为由各种所述基团拼接后的分子结构;
第五确定子单元,用于如果所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集不为空集,则将所述补集中的所述基团信息对应的分子结构与所述交集中的第二分子拼接模板信息对应的各种第二分子拼接模板进行拼接,得到由各种所述基团拼接后的分子结构。
17.根据权利要求16所述的系统,其特征在于,所述第一判断子单元,包括:
第六确定子单元,用于确定所述第二分子拼接模板信息集合中每种第二分子拼接模板的优先级信息;
第三匹配子单元,用于根据每种第二分子拼接模板的优先级信息,将每种第二分子拼接模板中的第二预设基团依次与所述基团信息集合中对应的每种待拼接基团进行匹配;
第七确定子单元,用于如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则确定所述第二分子拼接模板信息集合和所述基团信息集合的交集不为空集。
18.根据权利要求17所述的系统,其特征在于,所述系统还包括:
第一执行子单元,用于如果所述基团信息集合中存在与所述第二分子拼接模板中的第二预设基团相匹配的待拼接基团,则执行相匹配的待拼接基团的数量减去对应的第二预设基团的第二数量的操作,以得到所述待拼接基团的剩余数量。
19.根据权利要求18所述的系统,其特征在于,所述第二判断子单元,包括:
第三判断子单元,用于当所述第二分子拼接模板信息集合与所述基团信息集合匹配完成后,判断所述待拼接基团的剩余数量是否为零;
第八确定子单元,用于若所述待拼接基团的剩余数量为零,则确定所述第二分子拼接模板信息集合在所述基团信息集合中的相对补集为空集。
20.根据权利要求17所述的系统,其特征在于,所述第六确定子单元,包括:
第九确定子单元,用于根据每种第二分子拼接模板对应的分子结构的稳定性,确定每种第二分子拼接模板的优先级信息,其中,稳定性高的第二分子拼接模板对应的优先级,大于稳定性低的第二分子拼接模板对应的优先级。
21.根据权利要求12所述的系统,其特征在于,所述基团信息还包括每种基团对应的字符串,所述第一拼接单元,还包括:
第一拼接子单元,用于将各种所述基团对应的字符串按照预设拼接进行拼接,得到一个长字符串;
第一转换子单元,用于将拼接得到的所述长字符串转换为分子结构,所述分子结构为二维平面结构。
22.根据权利要求21所述的系统,其特征在于,所述系统还包括:
第二转换子单元,用于将所述分子结构由二维平面结构转换为三维立体结构。
23.一种分子结构生成设备,其特征在于,所述分子结构生成设备包括处理器、存储器;所述处理器用于执行所述存储器中存储的分子结构生成程序,以实现权利要求1-11中任一项所述的分子结构生成方法。
24.一种计算机可读存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现权利要求1-11中任一项所述的分子结构生成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010533481.8A CN111899807B (zh) | 2020-06-12 | 2020-06-12 | 一种分子结构生成方法、系统、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010533481.8A CN111899807B (zh) | 2020-06-12 | 2020-06-12 | 一种分子结构生成方法、系统、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111899807A true CN111899807A (zh) | 2020-11-06 |
CN111899807B CN111899807B (zh) | 2024-05-28 |
Family
ID=73207382
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010533481.8A Active CN111899807B (zh) | 2020-06-12 | 2020-06-12 | 一种分子结构生成方法、系统、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111899807B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113140261A (zh) * | 2021-04-25 | 2021-07-20 | 清华大学 | 化学分子合成仿真方法及装置 |
CN113140262A (zh) * | 2021-04-25 | 2021-07-20 | 清华大学 | 化学分子合成仿真方法及装置 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5345516A (en) * | 1991-04-19 | 1994-09-06 | International Business Machines Corporation | Apparatus and method for parsing a chemical string |
JPH06309385A (ja) * | 1993-01-07 | 1994-11-04 | Akiko Itai | 生理活性を有するリガンドの分子構造を構築する方法 |
US5752019A (en) * | 1995-12-22 | 1998-05-12 | International Business Machines Corporation | System and method for confirmationally-flexible molecular identification |
US20020062307A1 (en) * | 2000-11-17 | 2002-05-23 | Amedis Pharmaceuticals Ltd | Method for generating a database of molecular fragments |
US20040088118A1 (en) * | 2001-03-15 | 2004-05-06 | Axel Jensen | Method for generating a hierarchical topologican tree of 2d or 3d-structural formulas of chemical compounds for property optimisation of chemical compounds |
CN101196963A (zh) * | 2007-12-26 | 2008-06-11 | 北京时代楷模科技有限公司 | 族性化学结构标引系统和标引方法 |
CN101504679A (zh) * | 2009-03-19 | 2009-08-12 | 西安近代化学研究所 | 一种含能化合物的计算机辅助设计系统 |
CN104750761A (zh) * | 2013-12-31 | 2015-07-01 | 上海致化化学科技有限公司 | 分子结构数据库的建立方法及搜索方法 |
CN107545077A (zh) * | 2016-06-23 | 2018-01-05 | 中国石油化工股份有限公司 | 判断二元液液互溶性的方法及装置 |
CN107704720A (zh) * | 2017-09-18 | 2018-02-16 | 中国石油大学(北京) | 一种石油平均分子结构模型的构建方法以及性质预测方法 |
CN108707473A (zh) * | 2018-04-25 | 2018-10-26 | 清华大学 | 一种基于结构导向集总的加氢裂化过程建模方法 |
CN108827995A (zh) * | 2018-04-02 | 2018-11-16 | 中国石油大学(北京) | 一种干酪根平均分子结构模型的构建方法 |
CN109378041A (zh) * | 2018-12-03 | 2019-02-22 | 中国石油大学(北京) | 介尺度模拟石油分子粗粒化模型及其构建方法和预测方法 |
CN110275695A (zh) * | 2019-04-25 | 2019-09-24 | 武汉众邦银行股份有限公司 | 非重复随机码生成方法、设备、存储介质及装置 |
CN110459275A (zh) * | 2019-08-13 | 2019-11-15 | 广东工业大学 | 一种基于强化学习的图模型药物生成方法、装置和介质 |
CN110600085A (zh) * | 2019-06-01 | 2019-12-20 | 重庆大学 | 一种基于Tree-LSTM的有机物物理化学性质预测方法 |
CN110728047A (zh) * | 2019-10-08 | 2020-01-24 | 中国工程物理研究院化工材料研究所 | 一种基于机器学习性能预测含能分子计算机辅助设计系统 |
CN111261235A (zh) * | 2018-12-03 | 2020-06-09 | 富士通株式会社 | 用于检索环状分子的结构的方法和装置以及记录介质 |
-
2020
- 2020-06-12 CN CN202010533481.8A patent/CN111899807B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5345516A (en) * | 1991-04-19 | 1994-09-06 | International Business Machines Corporation | Apparatus and method for parsing a chemical string |
JPH06309385A (ja) * | 1993-01-07 | 1994-11-04 | Akiko Itai | 生理活性を有するリガンドの分子構造を構築する方法 |
US5752019A (en) * | 1995-12-22 | 1998-05-12 | International Business Machines Corporation | System and method for confirmationally-flexible molecular identification |
US20020062307A1 (en) * | 2000-11-17 | 2002-05-23 | Amedis Pharmaceuticals Ltd | Method for generating a database of molecular fragments |
US20040088118A1 (en) * | 2001-03-15 | 2004-05-06 | Axel Jensen | Method for generating a hierarchical topologican tree of 2d or 3d-structural formulas of chemical compounds for property optimisation of chemical compounds |
CN101196963A (zh) * | 2007-12-26 | 2008-06-11 | 北京时代楷模科技有限公司 | 族性化学结构标引系统和标引方法 |
CN101504679A (zh) * | 2009-03-19 | 2009-08-12 | 西安近代化学研究所 | 一种含能化合物的计算机辅助设计系统 |
CN104750761A (zh) * | 2013-12-31 | 2015-07-01 | 上海致化化学科技有限公司 | 分子结构数据库的建立方法及搜索方法 |
CN107545077A (zh) * | 2016-06-23 | 2018-01-05 | 中国石油化工股份有限公司 | 判断二元液液互溶性的方法及装置 |
CN107704720A (zh) * | 2017-09-18 | 2018-02-16 | 中国石油大学(北京) | 一种石油平均分子结构模型的构建方法以及性质预测方法 |
CN108827995A (zh) * | 2018-04-02 | 2018-11-16 | 中国石油大学(北京) | 一种干酪根平均分子结构模型的构建方法 |
CN108707473A (zh) * | 2018-04-25 | 2018-10-26 | 清华大学 | 一种基于结构导向集总的加氢裂化过程建模方法 |
CN109378041A (zh) * | 2018-12-03 | 2019-02-22 | 中国石油大学(北京) | 介尺度模拟石油分子粗粒化模型及其构建方法和预测方法 |
CN111261235A (zh) * | 2018-12-03 | 2020-06-09 | 富士通株式会社 | 用于检索环状分子的结构的方法和装置以及记录介质 |
CN110275695A (zh) * | 2019-04-25 | 2019-09-24 | 武汉众邦银行股份有限公司 | 非重复随机码生成方法、设备、存储介质及装置 |
CN110600085A (zh) * | 2019-06-01 | 2019-12-20 | 重庆大学 | 一种基于Tree-LSTM的有机物物理化学性质预测方法 |
CN110459275A (zh) * | 2019-08-13 | 2019-11-15 | 广东工业大学 | 一种基于强化学习的图模型药物生成方法、装置和介质 |
CN110728047A (zh) * | 2019-10-08 | 2020-01-24 | 中国工程物理研究院化工材料研究所 | 一种基于机器学习性能预测含能分子计算机辅助设计系统 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113140261A (zh) * | 2021-04-25 | 2021-07-20 | 清华大学 | 化学分子合成仿真方法及装置 |
CN113140262A (zh) * | 2021-04-25 | 2021-07-20 | 清华大学 | 化学分子合成仿真方法及装置 |
CN113140262B (zh) * | 2021-04-25 | 2022-05-03 | 清华大学 | 化学分子合成仿真方法及装置 |
CN113140261B (zh) * | 2021-04-25 | 2022-05-06 | 清华大学 | 化学分子合成仿真方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN111899807B (zh) | 2024-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Johansen et al. | An algorithm for generating t-wise covering arrays from large feature models | |
Mauro et al. | Context aware reconfiguration in software product lines | |
KR20180041200A (ko) | 정보 처리 방법 및 장치 | |
US20070156698A1 (en) | Systems and methods for finding log files generated by a distributed computer | |
CN110489087B (zh) | 一种生成分形结构的方法、装置、介质和电子设备 | |
CN111899807A (zh) | 一种分子结构生成方法、系统、设备及存储介质 | |
CN101925899A (zh) | 对文件内容进行分布式索引 | |
CN109376153B (zh) | 一种基于NiFi的数据写入图数据库的系统及方法 | |
CN106814998B (zh) | 表单序列化方法及装置 | |
US20130275623A1 (en) | Deployment of web application archives as a preprocessing step for provisioning | |
CN111026670A (zh) | 测试用例的生成方法、测试用例的生成装置及存储介质 | |
CN112882844A (zh) | 基于网络前后端的联调方法、装置及存储介质 | |
CN111967234A (zh) | 可视化报表的生成方法、装置、终端设备和存储介质 | |
JP2018060430A (ja) | データ統合装置およびデータ統合方法 | |
Aref et al. | Bayan algorithm: Detecting communities in networks through exact and approximate optimization of modularity | |
CN114048583A (zh) | 一种基于gim模型扩展实物id的应用方法和系统 | |
JP2008181331A (ja) | 関係抽出方法、関係抽出システム | |
CN117033253A (zh) | 一种接口测试方法、装置、电子设备及存储介质 | |
Eyal-Salman et al. | Feature-to-code traceability in legacy software variants | |
CN109814911A (zh) | 用于管理脚本程序的方法、装置、计算机设备及存储介质 | |
CN105589803B (zh) | 一种测试工具的生成方法和终端设备 | |
CN108492230A (zh) | 基于分布式架构的互联网服务资源推广的系统及方法 | |
TW201423614A (zh) | 一種知識本體增補方法與其系統 | |
Heinle et al. | Symbolicdata: sdeval-benchmarking for everyone | |
Lee et al. | Entity-based MVD concept module generation for development of new BIM data exchange standards |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |