CN117409888B - 一种分子结构设计方法、装置、电子设备及存储介质 - Google Patents

一种分子结构设计方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN117409888B
CN117409888B CN202311724658.2A CN202311724658A CN117409888B CN 117409888 B CN117409888 B CN 117409888B CN 202311724658 A CN202311724658 A CN 202311724658A CN 117409888 B CN117409888 B CN 117409888B
Authority
CN
China
Prior art keywords
molecular
splicing
type
fragment
library
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311724658.2A
Other languages
English (en)
Other versions
CN117409888A (zh
Inventor
杨书文
喻泽
赵旭山
徐波
黄志涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Contemporary Amperex Technology Co Ltd
Original Assignee
Contemporary Amperex Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Contemporary Amperex Technology Co Ltd filed Critical Contemporary Amperex Technology Co Ltd
Priority to CN202311724658.2A priority Critical patent/CN117409888B/zh
Publication of CN117409888A publication Critical patent/CN117409888A/zh
Application granted granted Critical
Publication of CN117409888B publication Critical patent/CN117409888B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs

Landscapes

  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Design And Manufacture Of Integrated Circuits (AREA)

Abstract

本申请公开了一种分子结构设计方法、装置、电子设备及存储介质。该方法包括:基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,其中,所述基础分子库中包括具有共轭结构的至少两个基础分子片段;分别将各个所述Pi型分子片段与预设的D型分子片段进行拼接,得到多个D‑Pi‑D型分子。通过本申请方案,可以简化空穴传输层小分子的设计过程,提升空穴传输材料的设计效率。

Description

一种分子结构设计方法、装置、电子设备及存储介质
技术领域
本申请属于有机分子技术领域,尤其涉及一种分子结构设计方法、分子结构设计装置、电子设备及计算机可读存储介质。
背景技术
空穴传输材料基于其能够增强空穴的传输以及阻挡电子以提高器件的效率和寿命的特点,受到各领域的广泛关注。现有的空穴传输材料的设计大多依赖于实验人员的经验及化学直觉,这需要实验人员通过不断的实验试错才可得到新型材料,不仅效率低下,而且容易导致人力物力的浪费。
发明内容
本申请提供了一种分子结构设计方法、分子结构设计装置、电子设备及计算机可读存储介质,可以简化空穴传输层小分子的设计过程,提升空穴传输材料的设计效率。
第一方面,本申请提供了一种分子结构设计方法,包括:
基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,其中,基础分子库中包括具有共轭结构的至少两个基础分子片段;
分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
本申请首先以基础分子库为基础,通过迭代拼接的方式获得多个Pi型分子片段,由此得到多样的Pi型中间体分子结构;之后再以多个Pi型分子片段为基础,通过与预设的D型分子片段的拼接获得多个D-Pi-D型分子,由此得到多样的D-Pi-D型空穴传输小分子。由此,不需要实验人员进行过多干预,即可根据少量的初始分子样本(也即基础分子库)批量自动化设计出大量D-Pi-D型空穴传输小分子。
在第一方面的一种可能的实现方式中,基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,包括:
对基础分子库进行复制,得到第一分子库及第二分子库;
将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接;
对拼接的结果进行筛选;
基于筛选的结果对第一分子库进行更新,并返回执行将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接的步骤及后续步骤,直至满足预设的拼接停止条件。
在第一方面的一种可能的实现方式中,将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接,包括:
确定第一分子片段的拼接位点及第二分子片段的拼接位点,其中,第一分子片段及第二分子片段为待拼接的一对分子片段,且第一分子片段来自第一分子库,第二分子片段来自第二分子库;
基于第一分子片段的拼接位点及第二分子片段的拼接位点的所有两两组合结果,进行多次拼接。
在第一方面的一种可能的实现方式中,对拼接的结果进行筛选,包括:
计算各个拼接的结果的平面性;
根据各个拼接的结果的平面性及预设的平面性条件,对拼接的结果进行筛选。
在第一方面的一种可能的实现方式中,分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子,包括:
生成各个Pi型分子片段的邻接距离矩阵;
根据各个Pi型分子片段的邻接距离矩阵,确定各个Pi型分子片段的目标拼接位点对;
根据各个Pi型分子片段的目标拼接位点对,分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
在第一方面的一种可能的实现方式中,生成各个Pi型分子片段的邻接距离矩阵,包括:
将各个Pi型分子片段分别转换为图数据结构;
根据各个图数据结构,生成各个Pi型分子片段的邻接距离矩阵。
在第一方面的一种可能的实现方式中,根据各个Pi型分子片段的邻接距离矩阵,确定各个Pi型分子片段的目标拼接位点对,包括:
针对每个Pi型分子片段,根据Pi型分子片段的邻接距离矩阵,确定Pi型分子片段中任意两个拼接位点的拓扑距离;
将拓扑距离最大的两个拼接位点确定为Pi型分子片段的目标拼接位点对。
第二方面,本申请提供了一种分子结构设计装置,包括:
第一拼接模块,用于基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,其中,基础分子库中包括具有共轭结构的至少两个基础分子片段;
第二拼接模块,用于分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
第三方面,本申请提供了一种电子设备,上述电子设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序,上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。
第四方面,本申请提供了一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。
第五方面,本申请提供了一种计算机程序产品,上述计算机程序产品包括计算机程序,上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。
可以理解的是,上述第二方面至第五方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的分子结构设计方法的实现示意图;
图2是本申请实施例提供的甲氧基二苯胺的分子结构式的示例图;
图3是本申请实施例提供的甲氧基三苯胺的分子结构式的示例图;
图4是本申请实施例提供的拼接得到D-Pi-D型分子的示例图;
图5是本申请实施例提供的分子结构设计方法中,步骤101的具体实现流程示意图;
图6是本申请实施例提供的分子结构设计方法中,步骤102的具体实现流程示意图;
图7是本申请实施例提供的Pi型分子片段的分子结构图的示例图;
图8是本申请实施例提供的Pi型分子片段的图数据结构的示例图;
图9是本申请实施例提供的Pi型分子片段的邻接距离矩阵的示例图;
图10是本申请实施例提供的分子结构设计装置的结构示意图;
图11是本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合附图对本申请技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本申请的技术方案,因此只作为示例,而不能以此来限制本申请的保护范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。
在本申请实施例的描述中,技术术语“第一”“第二”等仅用于区别不同对象,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量、特定顺序或主次关系。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本申请实施例的描述中,术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
在本申请实施例的描述中,术语“多个”指的是两个以上(包括两个),除非另有明确具体的限定。
空穴传输材料具有独特的传输特性,可以从钙钛矿吸光层中提取出空穴,再将空穴高效传输到电极处,提高电池的性能。该材料基于其能够增强空穴的传输以及阻挡电子的特性,帮助提高器件的效率和寿命的优点,期望能够在能源及生物等各领域中得到重要应用。
当前,现有的空穴传输层材料设计大多数是基于实验人员的经验与化学直觉,通过实验试错得到新型材料。由于实验人员在实验过程中通常仅能聚焦于一种分子结构进行针对性设计及实验,这需要耗费大量人力物力才能获得可用的空穴传输层材料,从而导致设计过程繁琐,设计效率低下。
基于以上考虑,本申请实施例提出了一种分子结构设计方法,可在较短时间内生成大量理论上可行的D-Pi-D型的空穴传输分子结构,由此获得具备潜力的空穴传输材料。为了说明本申请实施例所提出的技术方案,下面通过具体实施例来进行说明。
下面对本申请实施例提供的一种分子结构设计方法进行描述。请参阅图1,本申请实施例中的分子结构设计方法包括:
步骤101,基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段。
其中,基础分子库中包括具有共轭结构的至少两个基础分子片段。可以理解,对于具有共轭结构的分子片段而言,由于pi-pi相互作用及静电相互作用等范德华力,分子之间会形成有序堆积,从而使得该分子片段表现出优异的电荷传输能力,可作为后续拼接设计的基础,因而将这类分子片段确定为基础分子片段,并以此构建基础分子库。具体地,基础分子库中的基础分子片段可包括但不限于:稠环化合物、稠环化合物的衍生物和/或杂环化合物等。
在一些示例中,基础分子库可包括如下几个基础分子片段:乙烯、苯环、萘、吡咯、呋喃、噻吩、咔唑和二苯并噻吩。当然,基础分子库所包含的基础分子片段的数量也可更多或更少,具体可由材料人员决定,此处不作限定。
电子设备可以基础分子库中的基础分子片段作为分子拼接的基础骨架,进行迭代拼接。其中,迭代拼接实际上由多轮次的拼接而实现;第1轮的待拼接对象为任意两个基础分子片段,且这任意两个基础分子片段可以相同,也可以不同;第i轮的待拼接对象为第i-1轮的任意拼接结果与任意基础分子片段,i为大于1的正整数。最终,通过迭代拼接可得到多个Pi型分子片段。可以理解,每个Pi型分子片段均由至少两个基础分子片段拼接而得,且这至少两个基础分子片段中可以存在有相同的基础分子片段。
步骤102,分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
针对通过步骤101所得的每个Pi型分子片段,电子设备可将该Pi型分子片段的两端再连接上D型分子片段,从而设计得到完整的D-Pi-D型分子结构。这类D-Pi-D型分子结构通常具有较强的分子内电荷转移特性。其中,D型分子片段指的是端基分子片段,其具体为给电子基团。
在一些示例中,该D型分子片段包括但不限于甲氧基二苯胺及甲氧基三苯胺等,此处不作赘述。请参阅图2及图3,图2给出了的甲氧基二苯胺的分子结构式的示例,图3给出了甲氧基三苯胺的分子结构式的示例。请参阅图4,图4给出了Pi型分子片段的两端均拼接甲氧基二苯胺时,所得的一个可能的D-Pi-D型分子的示例。
由上可见,本申请实施例首先以基础分子库为基础,通过迭代拼接的方式获得多个Pi型分子片段,由此得到多样的Pi型中间体分子结构;之后再以多个Pi型分子片段为基础,通过与预设的D型分子片段的拼接获得多个D-Pi-D型分子,由此得到多样的D-Pi-D型空穴传输小分子。由此,不需要实验人员进行过多干预,即可根据少量的初始分子样本(也即基础分子库)批量自动化设计出大量D-Pi-D型空穴传输小分子。
在一些实施例中,在迭代拼接的过程中,为缓解计算压力,避免计算成本过大,请参阅图5,步骤101具体可包括:
A1、对基础分子库进行复制,得到第一分子库及第二分子库。
由于基础分子库是分子拼接的基础骨架,因而电子设备可先创建第一分子库及第二分子库,其中,这两个分子库初始均由基础分子库复制而得;也即,初始状态下,第一分子库及第二分子库所包含的分子片段完全相同,均为基础分子库中的基础分子片段。在后续拼接的过程中,第二分子库将始终保持不变,第一分子库将随着迭代拼接而不断得以更新。
A2、将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接。
记第一分子库中所包含的分子片段的数量为N,第二分子库中所包含的分子片段的数量为M,则针对第一分子库中的每个分子片段,电子设备均可将该分子片段与第二分子库中的M个分子片段分别进行拼接,由此得到多个拼接结果。也即,共有N*M对待拼接的分子片段。
在一些实施例中,针对待拼接的任意一对分子片段(包括来自第一分子库的第一分子片段及来自第二分子库的第二分子片段),电子设备有必要对所有可能的拼接的结果进行全面考虑,具体为;确定第一分子片段的拼接位点及第二分子片段的拼接位点。其中,拼接位点,指的是分子片段中的氢原子在该分子片段中的位置点;可简单认为分子片段中的拼接位点与分子片段中的氢原子相等价。显然,不管是第一分子片段还是第二分子片段,均必然包括有多个氢原子,这也就导致二者均分别存在多个拼接位点。由于拼接操作可基于任意两个拼接位点完成,因而第一分子片段及第二分子片段的多个拼接位点可能导致多个不同的拼接结果。由此,电子设备可基于第一分子片段的拼接位点及第二分子片段的拼接位点的所有两两组合结果,进行多次拼接。
仅作为示例,针对待拼接的任意一对分子片段,假定第一分子片段有i个拼接位点,第二分子片段有j个拼接位点,则有如下几种拼接方式:基于第一分子片段的第1个拼接位点及第二分子片段的第1个拼接位点进行拼接,基于第一分子片段的第1个拼接位点及第二分子片段的第2个拼接位点进行拼接,……,基于第一分子片段的第1个拼接位点及第二分子片段的第j个拼接位点进行拼接,基于第一分子片段的第2个拼接位点及第二分子片段的第1个拼接位点进行拼接,……,以此类推,基于第一分子片段的第i个拼接位点及第二分子片段的第j个拼接位点进行拼接。也即,第一分子片段的拼接位点及第二分子片段的拼接位点的两两组合结果共有i*j个,分别对应i*j种拼接方式,由此可得到i*j个拼接的结果。
在一些实施例中,针对任一分子片段而言,其拼接位点可通过如下方式确定得到:电子设备可通过软件对该分子片段中的原子进行遍历,查找出其中所有的氢原子,并将各氢原子的ID编号予以记录;该分子片段中的所有氢原子的ID编号组合起来,即构成了一个序列;可以理解,该序列即表示了该分子片段中的所有拼接位点。
A3、对拼接的结果进行筛选。
从结构的角度出发,本申请实施例可将拼接的结果的平面性作为评估标准,则电子设备可先计算各个拼接的结果的平面性,并根据各个拼接的结果的平面性及预设的平面性条件,对拼接的结果进行筛选。
在一些实施例中,针对任一拼接的结果而言,具体可将其各个原子在分子三维坐标中的Z坐标的绝对值之和作为其平面性的表达参数,其中,所得结果越小,则平面性越好;所得结果越大,则平面性越差。基于此,其平面性条件可具体为:平面性小于预设的平面性阈值(也即各个原子在分子三维坐标中的Z坐标的绝对值之和小于预设的某一阈值)。
需要注意的是,随着迭代拼接的不断进行,拼接所得的分子片段也会越来越大;基于此,电子设备可针对每一轮拼接的结果分别设置对应的平面性阈值。一般而言,该平面性阈值会随着拼接轮次的增长而增长,也即,筛选第k+1轮的拼接的结果时所采用的平面性阈值大于筛选第k轮的拼接的结果时所采用的平面性阈值。
A4、基于筛选的结果对第一分子库进行更新,并返回执行步骤A2及后续步骤,直至满足预设的拼接停止条件。
电子设备可保留每轮拼接的结果中具有较好平面性的分子片段作为下一轮拼接的分子骨架;也即,电子设备可清空第一分子库中原本所存储的内容,并将保留下来的拼接的结果存入该第一分子库,实现对该第一分子库的更新。当然,也可以是将每轮拼接的结果中具有较好平面性的分子片段直接添加到该第一分子库中并进行排重处理,此处不对第一分子库的具体更新方式作出限定。以更新后的第一分子库为基础,电子设备可返回执行步骤A2及后续步骤,由此实现基于基础分子库的不断迭代拼接,直至满足预设的拼接停止条件时停止。可以理解,停止迭代拼接后所得的第一分子库(也即最后的第一分子库)所包含的分子片段即为最终所得的多个Pi型分子片段。
其中,拼接停止条件包括但不限于:拼接轮次达到预设轮次,以及,第一分子库中的分子片段的平均原子个数超过预设个数。也即,只要满足以上任一拼接停止条件,即可停止迭代拼接。可以理解,该预设轮次及该预设个数均可根据实际情况进行设置,例如,预设个数可为120或其它数值,本申请实施例对此不作限定。
在一些实施例中,通过步骤A2拼接所得的分子片段的三维结构可能并不合理,电子设备可在获得拼接的结果后,先对该拼接的结果进行结构优化,再对优化后的拼接的结果进行筛选。具体地,可通过量子化学的手段对拼接的结果进行结构优化,该量子化学的手段包括但不限于半经验量子计算方法AM1及密度泛函方法等,此处不作限定。
在一些实施例中,由于迭代拼接的轮次可能为多次,而每轮的平面性阈值都在不断增加,这可能导致最后几轮拼接所使用的平面性阈值过大。基于此,电子设备还可在基于基础分子库的迭代拼接已停止后,再对所得的第一分子库(也即最后的第一分子库)所包含的分子片段进行筛选,具体为:将平面性大于或等于预设的平面性上限值的分子片段剔除,保留平面性小于该平面性上限值的分子片段。仅作为示例,该平面性上限值可以为2Å(也即2埃,埃为十分之一纳米)。
在一些实施例中,为提升设计所得的D-Pi-D型分子的合成可能性,请参阅图6,步骤102具体可包括:
B1、生成各个Pi型分子片段的邻接距离矩阵。
其中,Pi型分子片段的邻接距离矩阵是在邻接矩阵的基础上的拓展。具体地,该邻接距离矩阵中第i行第j列的元素的值表示的是:Pi型分子片段的第i个原子与第j个原子的拓扑距离,该拓扑距离等价于该第i个原子与该第j个原子的最短键连数。
具体地,针对任一Pi型分子片段而言,电子设备可先将该Pi型分子片段转换为图数据结构,其中,图数据结构中的节点代表原子,边代表键连。请参阅图7及图8,图7给出了一Pi型分子片段的分子结构图的示例;图8给出了该Pi型分子片段的图数据结构的示例。具体地,图7中各个原子旁的数字,表示的是该原子所对应的ID编号。根据转换所得的图数据结构,电子设备即可查找出任意两个原子的最短键连数,由此可生成该Pi型分子片段的邻接距离矩阵。
为便于理解,仍以图8为例,对邻接距离矩阵的生成进行举例说明:原子0及原子1通过一个键直接连接,则原子0及原1之间的最短键连数为1,由此可在邻接距离矩阵中第0行第1列,以及,第1行第0列,写入该最短键连数“1”;原子0及原子2通过两个键间接连接(分别是原子0及原子1之间的键,以及原子1及原子2之间的键),则原子0及原子2之间的最短键连数为2,由此可在邻接距离矩阵中第0行第2列,以及,第2行第0列,写入该最短键连数“2”;原子0及原子3通过三个键间接连接(分别是原子0及原子1之间的键,原子1及原子2之间的键,以及原子2及原子3之间的键),则原子0及原子3之间的最短键连数为3,由此可在该邻接距离矩阵中第0行第3列,以及,第3行第0列,写入最短键连数“3”;以此类推,遍历Pi型分子片段的图数据结构中的任意两个原子,查找出任意两个原子的最短键连数,即可生成其邻接距离矩阵。以图8所示出的Pi型分子片段的图数据结构为例,请参阅图9,图9给出了该Pi型分子片段的邻接距离矩阵的示例。
B2、根据各个Pi型分子片段的邻接距离矩阵,确定各个Pi型分子片段的目标拼接位点对。
Pi型分子片段中,通常会存在非常多个拼接位点(也即氢原子)。如果随意选择任意两个拼接位点去拼接D型分子片段,一方面会带来很大的计算压力(因为有多种可能的结果),另一方面最后设计所得的D-Pi-D型分子能够在现实中成功合成的概率也可能较低。基于此,为提升分子合成的成功率,同时为避免过大的计算压力,电子设备可根据Pi型分子片段的邻接距离矩阵,确定出适合于该Pi型分子片段的目标拼接位点对。
具体地,针对每个Pi型分子片段,电子设备都可根据该Pi型分子片段的邻接距离矩阵,确定出该Pi型分子片段中任意两个拼接位点的拓扑距离。考虑到设计所得的D-Pi-D型分子中的两个D型分子片段距离越远,后续分子合成的成功率越高,因而电子设备可将拓扑距离最大的两个拼接位点确定为Pi型分子片段的目标拼接位点对,并对该目标拼接位点对进行标记。电子设备后续可在标记的这两个拼接位点处分别拼接D型分子片段,由此获得设计所得的完整的D-Pi-D型分子。
B3、根据各个Pi型分子片段的目标拼接位点对,分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
在存在至少两个预设的D型分子片段的情况下,Pi型分子片段的两端可分别连接不同的D型分子片段,也可连接相同的D型分子片段,此处不作限定。例如,记目标拼接位点对分别为第一目标拼接位点及第二目标拼接位点,预设的D型分子片段为甲氧基二苯胺及甲氧基三苯胺,则:在将Pi型分子片段与D型分子片段进行拼接时,可以是Pi型分子片段在第一目标拼接位点及第二目标拼接位点处均拼接甲氧基二苯胺,也可以是Pi型分子片段在第一目标拼接位点及第二目标拼接位点处均拼接甲氧基三苯胺,还可以是Pi型分子片段在第一拼接位点处拼接甲氧基二苯胺,在第二拼接位点处拼接甲氧基三苯胺,又可以是Pi型分子片段在第二拼接位点处拼接甲氧基二苯胺,在第一拼接位点处拼接甲氧基三苯胺,此处不作赘述。
在一些实施例中,通过步骤B3拼接所得的分子片段的三维结构可能并不合理,电子设备可在获得拼接的结果后,对该拼接的结果进行结构优化,并将优化后的分子结构确定为最终所得的D-Pi-D型分子。具体地,可通过量子化学的手段对拼接的结果进行结构优化,该量子化学的手段包括但不限于密度泛函方法等,此处不作限定。仅作为示例,在该密度泛函方法中,可设置B3LYP泛函和6-31g**基组,当然也可设置其它泛函和基组,此处不作限定。
应理解,实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
对应于上文所提供的分子结构设计方法,本申请实施例还提供了一种分子结构设计装置。参见图10,本申请实施例中的分子结构设计装置10包括:
第一拼接模块1001,用于基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,其中,基础分子库中包括具有共轭结构的至少两个基础分子片段;
第二拼接模块1002,用于分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
在一些实施例中,第一拼接模块1001,包括:
复制单元,用于对基础分子库进行复制,得到第一分子库及第二分子库;
第一拼接单元,用于将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接;
筛选单元,用于对拼接的结果进行筛选;
更新单元,用于基于筛选的结果对第一分子库进行更新;
其中,第一拼接单元在更新单元运行完毕后被再次触发运行,直至满足预设的拼接停止条件。
在一些实施例中,第一拼接单元,包括:
第一确定子单元,用于确定第一分子片段的拼接位点及第二分子片段的拼接位点,其中,第一分子片段及第二分子片段为待拼接一对分子片段,且第一分子片段来自第一分子库,第二分子片段来自第二分子库;
拼接子单元,用于基于第一分子片段的拼接位点及第二分子片段的拼接位点的所有两两组合结果,进行多次拼接。
在一些实施例中,筛选单元,包括:
计算子单元,用于计算各个拼接的结果的平面性;
筛选子单元,用于根据各个拼接的结果的平面性及预设的平面性条件,对拼接的结果进行筛选。
在一些实施例中,第二拼接模块1002,包括:
生成单元,用于生成各个Pi型分子片段的邻接距离矩阵;
确定单元,用于根据各个Pi型分子片段的邻接距离矩阵,确定各个Pi型分子片段的目标拼接位点对;
第二拼接子单元,用于根据各个Pi型分子片段的目标拼接位点对,分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
在一些实施例中,生成单元,包括:
转换子单元,用于将各个Pi型分子片段分别转换为图数据结构;
生成子单元,用于根据各个图数据结构,生成各个Pi型分子片段的邻接距离矩阵。
在一些实施例中,确定单元,包括:
第二确定子单元,用于针对每个Pi型分子片段,根据Pi型分子片段的邻接距离矩阵,确定Pi型分子片段中任意两个拼接位点的拓扑距离;
第三确定子单元,用于将拓扑距离最大的两个拼接位点确定为Pi型分子片段的目标拼接位点对。
由上可见,本申请实施例首先以基础分子库为基础,通过迭代拼接的方式获得多个Pi型分子片段,由此得到多样的Pi型中间体分子结构;之后再以多个Pi型分子片段为基础,通过与预设的D型分子片段的拼接获得多个D-Pi-D型分子,由此得到多样的D-Pi-D型空穴传输小分子。由此,不需要实验人员进行过多干预,即可根据少量的初始分子样本(也即基础分子库)批量自动化设计出大量D-Pi-D型空穴传输小分子。
对应于上文所提供的分子结构设计方法,本申请实施例还提供了一种电子设备。参见图11,本申请实施例中的电子设备11包括:存储器1101,一个或多个处理器1102(图11中仅示出一个)及存储在存储器1101上并可在处理器上运行的计算机程序。其中:存储器1101可用于存储软件程序以及模块,处理器1102通过运行存储在存储器1101的软件程序以及模块,从而执行电子设备的各种功能应用以及数据处理。具体地,处理器1102通过运行存储在存储器1101的计算机程序时实现以下步骤:
基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,其中,基础分子库中包括具有共轭结构的至少两个基础分子片段;
分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
假设为第一种可能的实施方式,则在第一种可能的实施方式作为基础而提供的第二种可能的实施方式中,基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,包括:
对基础分子库进行复制,得到第一分子库及第二分子库;
将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接;
对拼接的结果进行筛选;
基于筛选的结果对第一分子库进行更新,并返回执行将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接的步骤及后续步骤,直至满足预设的拼接停止条件。
在第二种可能的实施方式作为基础而提供的第三种可能的实施方式中,将第一分子库中的每个分子片段分别与第二分子库中的各个分子片段进行拼接,包括:
确定第一分子片段的拼接位点及第二分子片段的拼接位点,其中,第一分子片段及第二分子片段为待拼接一对分子片段,且第一分子片段来自第一分子库,第二分子片段来自第二分子库;
基于第一分子片段的拼接位点及第二分子片段的拼接位点的所有两两组合结果,进行多次拼接。
在第二种可能的实施方式作为基础而提供的第四种可能的实施方式中,对拼接的结果进行筛选,包括:
计算各个拼接的结果的平面性;
根据各个拼接的结果的平面性及预设的平面性条件,对拼接的结果进行筛选。
在第一种可能的实施方式作为基础而提供的第五种可能的实施方式中,分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子,包括:
生成各个Pi型分子片段的邻接距离矩阵;
根据各个Pi型分子片段的邻接距离矩阵,确定各个Pi型分子片段的目标拼接位点对;
根据各个Pi型分子片段的目标拼接位点对,分别将各个Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
在第五种可能的实施方式作为基础而提供的第六种可能的实施方式中,生成各个Pi型分子片段的邻接距离矩阵,包括:
将各个Pi型分子片段分别转换为图数据结构;
根据各个图数据结构,生成各个Pi型分子片段的邻接距离矩阵。
在第五种可能的实施方式作为基础而提供的第七种可能的实施方式中,根据各个Pi型分子片段的邻接距离矩阵,确定各个Pi型分子片段的目标拼接位点对,包括:
针对每个Pi型分子片段,根据Pi型分子片段的邻接距离矩阵,确定Pi型分子片段中任意两个拼接位点的拓扑距离;
将拓扑距离最大的两个拼接位点确定为Pi型分子片段的目标拼接位点对。
应当理解,在本申请实施例中,所称处理器1102可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其它通用处理器、数字信号处理器 (DigitalSignal Processor,DSP)、专用集成电路 (Application Specific Integrated Circuit,ASIC)、现成可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器1101可以包括只读存储器和随机存取存储器,并向处理器1102 提供指令和数据。存储器1101的一部分或全部还可以包括非易失性随机存取存储器。例如,存储器1101还可以存储设备类型的信息。
由上可见,本申请实施例首先以基础分子库为基础,通过迭代拼接的方式获得多个Pi型分子片段,由此得到多样的Pi型中间体分子结构;之后再以多个Pi型分子片段为基础,通过与预设的D型分子片段的拼接获得多个D-Pi-D型分子,由此得到多样的D-Pi-D型空穴传输小分子。由此,不需要实验人员进行过多干预,即可根据少量的初始分子样本(也即基础分子库)批量自动化设计出大量D-Pi-D型空穴传输小分子。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者外部设备软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请实现实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关联的硬件来完成,的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机可读存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括是电载波信号和电信信号。
以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (9)

1.一种分子结构设计方法,其特征在于,包括:
基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,其中,所述基础分子库中包括具有共轭结构的至少两个基础分子片段;
分别将各个所述Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子,包括:生成各个所述Pi型分子片段的邻接距离矩阵;根据各个所述Pi型分子片段的邻接距离矩阵,确定各个所述Pi型分子片段的目标拼接位点对;根据各个所述Pi型分子片段的目标拼接位点对,分别将各个所述Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
2.如权利要求1所述的分子结构设计方法,其特征在于,所述基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,包括:
对所述基础分子库进行复制,得到第一分子库及第二分子库;
将所述第一分子库中的每个分子片段分别与所述第二分子库中的各个分子片段进行拼接;
对拼接的结果进行筛选;
基于筛选的结果对所述第一分子库进行更新,并返回执行所述将所述第一分子库中的每个分子片段分别与所述第二分子库中的各个分子片段进行拼接的步骤及后续步骤,直至满足预设的拼接停止条件。
3.如权利要求2所述的分子结构设计方法,其特征在于,所述将所述第一分子库中的每个分子片段分别与所述第二分子库中的各个分子片段进行拼接,包括:
确定第一分子片段的拼接位点及第二分子片段的拼接位点,其中,所述第一分子片段及所述第二分子片段为待拼接的一对分子片段,且所述第一分子片段来自所述第一分子库,所述第二分子片段来自所述第二分子库;
基于所述第一分子片段的拼接位点及所述第二分子片段的拼接位点的所有两两组合结果,进行多次拼接。
4.如权利要求2所述的分子结构设计方法,其特征在于,所述对拼接的结果进行筛选,包括:
计算各个所述拼接的结果的平面性;
根据各个所述拼接的结果的平面性及预设的平面性条件,对所述拼接的结果进行筛选。
5.如权利要求1所述的分子结构设计方法,其特征在于,所述生成各个所述Pi型分子片段的邻接距离矩阵,包括:
将各个所述Pi型分子片段分别转换为图数据结构;
根据各个所述图数据结构,生成各个所述Pi型分子片段的邻接距离矩阵。
6.如权利要求1所述的分子结构设计方法,其特征在于,所述根据各个所述Pi型分子片段的邻接距离矩阵,确定各个所述Pi型分子片段的目标拼接位点对,包括:
针对每个所述Pi型分子片段,根据所述Pi型分子片段的邻接距离矩阵,确定所述Pi型分子片段中任意两个拼接位点的拓扑距离;
将所述拓扑距离最大的两个拼接位点确定为所述Pi型分子片段的目标拼接位点对。
7.一种分子结构设计装置,其特征在于,包括:
第一拼接模块,用于基于基础分子库进行分子片段的迭代拼接,得到多个Pi型分子片段,其中,所述基础分子库中包括具有共轭结构的至少两个基础分子片段;
第二拼接模块,用于分别将各个所述Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子;
其中,第二拼接模块,包括:
生成单元,用于生成各个所述Pi型分子片段的邻接距离矩阵;
确定单元,用于根据各个所述Pi型分子片段的邻接距离矩阵,确定各个所述Pi型分子片段的目标拼接位点对;
第二拼接单元,根据各个所述Pi型分子片段的目标拼接位点对,分别将各个所述Pi型分子片段与预设的D型分子片段进行拼接,得到多个D-Pi-D型分子。
8.一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的方法。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。
CN202311724658.2A 2023-12-15 2023-12-15 一种分子结构设计方法、装置、电子设备及存储介质 Active CN117409888B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311724658.2A CN117409888B (zh) 2023-12-15 2023-12-15 一种分子结构设计方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311724658.2A CN117409888B (zh) 2023-12-15 2023-12-15 一种分子结构设计方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN117409888A CN117409888A (zh) 2024-01-16
CN117409888B true CN117409888B (zh) 2024-04-16

Family

ID=89498404

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311724658.2A Active CN117409888B (zh) 2023-12-15 2023-12-15 一种分子结构设计方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN117409888B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114171134A (zh) * 2021-11-26 2022-03-11 北京晶泰科技有限公司 分子生成方法、装置、设备及存储介质
CN115083539A (zh) * 2021-03-10 2022-09-20 腾讯科技(深圳)有限公司 分子结构的重建方法、装置、设备及可读存储介质
CN115691704A (zh) * 2022-11-02 2023-02-03 北京晶泰科技有限公司 分子生成方法、装置、分子设计方法、装置和电子设备
WO2023029215A1 (zh) * 2021-08-30 2023-03-09 深圳晶泰科技有限公司 一种功能有机晶体材料设计方法、装置和电子设备

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0028157D0 (en) * 2000-11-17 2001-01-03 Amedis Pharm Ltd Method for predicting a biological target characteristic of a molecule
EP1895436A1 (en) * 2006-08-31 2008-03-05 Silicos NV Method for evolving molecules and computer program for implementing the same

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115083539A (zh) * 2021-03-10 2022-09-20 腾讯科技(深圳)有限公司 分子结构的重建方法、装置、设备及可读存储介质
WO2023029215A1 (zh) * 2021-08-30 2023-03-09 深圳晶泰科技有限公司 一种功能有机晶体材料设计方法、装置和电子设备
CN114171134A (zh) * 2021-11-26 2022-03-11 北京晶泰科技有限公司 分子生成方法、装置、设备及存储介质
CN115691704A (zh) * 2022-11-02 2023-02-03 北京晶泰科技有限公司 分子生成方法、装置、分子设计方法、装置和电子设备

Also Published As

Publication number Publication date
CN117409888A (zh) 2024-01-16

Similar Documents

Publication Publication Date Title
US10078552B2 (en) Hierarchic storage policy for distributed object storage systems
EP3591510A1 (en) Method and device for writing service data in block chain system
WO2020023733A1 (en) Blockchain-based cross-chain data access method and apparatus
CN108846133B (zh) 基于b-m树的区块链存储结构、b-m树建立算法及查找算法
CN110297689A (zh) 智能合约执行方法、装置、设备及介质
US9864550B2 (en) Method and apparatus of recovering and encoding for data recovery in storage system
CN105607960A (zh) 文件系统目录树修复方法和装置
CN106021267A (zh) 对数据结构的并发读取和插入而无需读取器的锁存或等待
CN101772043B (zh) 局数据核查方法和装置
CN104021123A (zh) 用于数据迁移的方法和系统
CN109447820A (zh) 数据处理方法、装置、计算机设备及存储介质
CN105357247A (zh) 基于分层云对等网络的多维属性云资源区间查找方法
CN100395712C (zh) 软件系统的资源管理方法
CN117409888B (zh) 一种分子结构设计方法、装置、电子设备及存储介质
CN110442580A (zh) 一种区块链状态数据存储方法、设备和存储介质
WO2012166190A1 (en) Compression match enumeration
JP2011215835A (ja) 全文検索機能を備えるストレージ装置
CN110780814B (zh) 一种存储数据整理方法与装置
CN115563409A (zh) 一种地址行政区划识别方法、装置、设备及介质
CN112269839B (zh) 区块链中的数据存储方法、装置、电子设备及存储介质
CN105045783A (zh) 含冗余的数据压缩与解压缩的系统和方法
CN106250499A (zh) 一种视频对挖掘方法及装置
CN115150413B (zh) 区块链数据的存储方法、装置、电子设备及存储介质
US7308448B1 (en) Method and apparatus for implementing a lock-free skip list that supports concurrent accesses
US8484614B2 (en) Fast late binding of object methods

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant