CN113850801A - 晶型预测方法、装置及电子设备 - Google Patents

晶型预测方法、装置及电子设备 Download PDF

Info

Publication number
CN113850801A
CN113850801A CN202111211742.5A CN202111211742A CN113850801A CN 113850801 A CN113850801 A CN 113850801A CN 202111211742 A CN202111211742 A CN 202111211742A CN 113850801 A CN113850801 A CN 113850801A
Authority
CN
China
Prior art keywords
crystal form
prediction
target sample
diffraction
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202111211742.5A
Other languages
English (en)
Other versions
CN113850801B (zh
Inventor
刘翔
谭璐
刘雪涛
金颖滴
孙广旭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jingtai Technology Co Ltd
Original Assignee
Shenzhen Jingtai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jingtai Technology Co Ltd filed Critical Shenzhen Jingtai Technology Co Ltd
Priority to CN202111211742.5A priority Critical patent/CN113850801B/zh
Priority to PCT/CN2021/135250 priority patent/WO2023065475A1/zh
Publication of CN113850801A publication Critical patent/CN113850801A/zh
Application granted granted Critical
Publication of CN113850801B publication Critical patent/CN113850801B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10116X-ray image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30108Industrial image inspection
    • G06T2207/30148Semiconductor; IC; Wafer

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本申请涉及一种晶型预测方法、装置及电子设备。该方法包括:获取目标样品的多个样品颗粒对应的衍射图像;根据各衍射图像中获取的参数信息,生成所述目标样品的初始晶型;根据所述目标样品的已知分子结构对初始晶型进行修正,获得修正晶型;根据修正晶型进行晶型预测,获得目标样品的预测晶型。本申请提供的方案,能够降低晶型预测难度,缩短预测时间,提高预测效率。

Description

晶型预测方法、装置及电子设备
技术领域
本申请涉及晶型预测技术领域,尤其涉及一种晶型预测方法、装置及电子设备。
背景技术
同一物质具有两种或两种以上的空间排列和晶胞参数,形成多种晶型的现象称为多晶现象。通过多年的研究发现,同一药物的不同晶型在外观、溶解度、熔点、溶出度、生物有效性等方面可能会有显著不同,从而影响了药物的稳定性、生物利用度及疗效。因此,通过实验筛选多晶型药物来获取相对稳定的药用晶型已成为标准药物研发过程中一个必不可少的环节。
随着技术的发展,为了减少人为的实验,可以通过计算机辅助发现相对理想的药用晶型。相关技术中,通过模拟对药物分子进行晶型预测(Crystal StructurePrediction,CSP),从而找到潜在的多种稳定晶型,再针对少数明确的潜在晶型进行实验确认,以获得最佳药用晶型。然而,CSP晶型预测受到分子自由度的影响,随着分子复杂度的提高,预测时间和预测难度将急剧提升,从而影响预测效率。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种晶型预测方法、装置及电子设备,能够降低晶型预测难度,缩短预测时间,提高预测效率。
本申请第一方面提供一种晶型预测方法,其包括:
获取目标样品的多个样品颗粒对应的衍射图像;
根据在各所述衍射图像中获取的参数信息,生成所述目标样品的初始晶型;
根据所述目标样品的已知分子结构对所述初始晶型进行修正,获得修正晶型;
根据所述修正晶型进行晶型预测,获得所述目标样品的预测晶型。
在一实施方式中,所述获取目标样品的多个样品颗粒对应的衍射图像,包括:
通过电子衍射分别获取目标样品的多个样品颗粒在预设温度的拍摄环境中的预设角度范围内的多个衍射图像。
在一实施方式中,所述根据在各所述衍射图像中获取的参数信息,生成所述目标样品的初始晶型,包括:
分别对各所述衍射图像进行指标化处理,获取所述样品颗粒对应的参数信息;其中,所述参数信息包括晶胞参数和衍射点的衍射强度;
将多个所述样品颗粒的参数信息进行合并,获得参数合并信息;其中,所述参数合并信息中的所述衍射点的数量不少于预设数量阈值;
根据所述参数合并信息进行解析,获得所述目标样品的初始晶型;其中,所述初始晶型的分子结构错误率小于或等于预设比例阈值。
在一实施方式中,所述根据所述目标样品的已知分子结构对所述初始晶型进行修正,获得修正晶型,包括:
根据所述目标样品的已知原子和已知基团,删除所述初始晶型中与所述已知原子相异的错误原子以及删除所述初始晶型中与所述已知基团相异的错误基团,获得对应的修正晶型。
在一实施方式中,所述方法还包括:
如果所述初始晶型的分子结构错误率大于所述预设比例阈值,则丢弃所述初始晶型,并重新获取样品颗粒进行电子衍射以生成新的初始晶型。
在一实施方式中,所述根据所述修正晶型进行晶型预测,获得所述目标样品的预测晶型,包括:
将所述修正晶型中的原子坐标作为离散点坐标,生成沃罗诺伊图;
获取所述沃罗诺伊图中的虚原子信息;
根据所述目标样品的已知分子结构和所述虚原子信息,对所述修正晶型中的缺失原子进行预测,获得基态能量符合预设规则的预测晶型。
在一实施方式中,所述对所述修正晶型中的缺失原子进行预测,获得基态能量符合预设规则的预测晶型,包括:
根据预测的缺失原子对所述修正晶型的分子结构进行补全,获得至少一个初步预测晶型;
根据所述初步预测晶型的基态能量的数值将各所述初步预测晶型进行能量排序;
选取基态能量最低的初步预测晶型作为所述预测晶型。
在一实施方式中,所述方法还包括:
对所述预测晶型进行验证;其中,当所述预测晶型的模拟结构因子与实验结构因子之间的残差因子小于或等于预设值时,确定所述预测晶型验证通过。
本申请第二方面提供一种晶型预测装置,其包括:
图像获取模块,用于获取目标样品的多个样品颗粒对应的衍射图像;
晶型生成模块,用于根据在各所述衍射图像中获取的参数信息,生成所述目标样品的初始晶型;
晶型修正模块,用于根据所述目标样品的已知分子结构对所述初始晶型进行修正,获得修正晶型;
晶型预测模块,用于根据所述修正晶型进行晶型预测,获得所述目标样品的预测晶型。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
本申请提供的技术方案可以包括以下有益效果:
本申请的技术方案,先通过获得目标样品的多个样品颗粒的衍射图像,再通过衍射图像获得所需的参数信息以获得初始晶型后,再对初始晶型进行修正以获得修正晶型,最后在修正晶型的基础上进行晶型预测以获得目标样品的预测晶型。这样的设计,相比于直接根据目标样品的已知分子结构进行晶型预测,本申请的预测方式可以预先排除部分错误晶型的干扰,从而针对性地在修正晶型的基础上进行预测,降低了预测难度,缩短了预测时间,提高晶型预测效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细地描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的晶型预测方法的流程示意图;
图2是本申请实施例示出的晶型预测方法的另一流程示意图;
图3是本申请实施例示出的晶型预测装置的结构示意图;
图4是本申请实施例示出的晶型预测装置的另一结构示意图;
图5是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
相关技术中,当采用CSP进行预测技术对分子的晶型进行预测时,如果分子复杂度较高,会导致预测时间和预测难度将急剧提升,从而影响预测效率。
针对上述问题,本申请实施例提供一种晶型预测方法,能够降低预测难度,缩短预测时间,提高预测效率。
以下结合附图详细描述本申请实施例的技术方案。
图1是本申请实施例示出的晶型预测方法的流程示意图。
参见图1,本申请一实施例的晶型预测方法,包括:
步骤S110,获取目标样品的多个样品颗粒对应的衍射图像。
其中,预先将目标样品制成粉末形态,从而获得多个样品颗粒。在一实施方式中,可以通过电子衍射获得每一样品颗粒对应的衍射图像。在一实施方式中,可以获取单个样品颗粒在不同角度进行拍摄获得的对应的衍射图像,从而获得样品颗粒在多角度下的衍射图像,以便后续步骤提取不同角度下的参数信息。
步骤S120,根据各样品颗粒的衍射图像中获取的参数信息,生成目标样品的初始晶型。
其中,参数信息包括晶胞参数和衍射点的衍射强度。根据衍射图像中的衍射花样,可以通过对衍射花样进行标定以获得对应的晶胞参数,例如,晶胞参数可以包括各相交的两个晶面的夹角和相邻两个晶面的晶面间距等。另外,通过根据相关技术测量衍射花样中的各衍射点的衍射强度。
进一步地,通过分别获取各衍射图像中的获取的参数信息并进行汇总合并,从而可以获得数量充分的参数信息,继而可以根据相关技术通过解析参数信息以获得初始晶型。可以理解,晶态物质的组成元素或基团若不相同或其结构有差异,它们的衍射图像在衍射峰数目、角度位置、相对衍射强度次序以至衍射峰的形状上就显现出差异。因此,根据相关技术,对比分析便可以完成目标样品的物相组成和结构的定性鉴定;通过对样品颗粒的各衍射点的衍射强度数据的分析计算,可以完成目标样品的物相组成的定量分析。
步骤S130,根据目标样品的已知分子结构对初始晶型进行修正,获得修正晶型。
可以理解,虽然目标样品的最佳药用晶型未知,但在目标样品的分子结构已知的前提下,根据目标样品的已知分子结构,可以确定该目标样品对应的已知原子和已知基团,从而可以将初始晶型中明显不正确的原子和基团进行删除,从而对初始晶型进行修正,即获得修正后的修正晶型。通过对初始晶型进行初步修正,以便后续步骤在修正晶型的基础上对目标样品进行晶型预测,从而缩小预测范围。
步骤S140,根据修正晶型进行晶型预测,获得目标样品的预测晶型。
其中,根据相关技术中的CSP晶型预测,通过输入修正晶型的结构,即可获得目标样品的预测晶型。
从上述实施例可知,本申请的技术方案,先通过获得目标样品的多个样品颗粒的衍射图像,再通过衍射图像获得所需的参数信息以获得初始晶型后,再对初始晶型进行修正以获得修正晶型,最后在修正晶型的基础上进行晶型预测以获得目标样品的预测晶型。这样的设计,相比于直接根据目标样品的已知分子结构进行晶型预测,本申请的预测方式可以预先排除部分错误晶型的干扰,从而针对性地在修正晶型的基础上进行预测,降低了预测难度,缩短了预测时间,提高晶型预测效率。
图2是本申请实施例示出的晶型预测方法的另一流程示意图。
参见图2,本申请的晶型预测方法,包括:
步骤S210,通过电子衍射分别获取目标样品的多个样品颗粒在预设温度的拍摄环境中的预设角度范围内的多个衍射图像。
本实施例中,通过电子衍射(MicroED)可以获得粉末状的目标样品的多个样品颗粒的衍射图像。进一步地,可以通过电子显微镜,例如透射电镜对样品颗粒进行拍摄以获得衍射图像。在一实施方式中,在拍摄前,预先对样品颗粒及拍摄环境进行冷冻处理,使样品颗粒置于冷冻的拍摄环境中进行电子衍射,以避免在拍摄过程中电子对样品颗粒的破坏,从而确保获得拍摄效果理想的衍射图像。在一实施方式中,预设温度可以是-250℃~0℃。例如-250℃~-50℃、-200℃~-50℃或-200℃~-100℃等。可以理解,在非冷冻温度下的样品颗粒会被电子破坏,获得的衍射图像的效果不佳。在一实施方式中,可以将若干粉末状的样品颗粒均匀分散在载网上,再将含有样品颗粒的载网通过液氮进行冷冻;接着将冷冻后的载网装入样品杆中,再将样品杆安装于处于冷冻模式的透射电镜,并在冷冻模式下对冷冻的样品颗粒进行拍摄。为了获得不同角度下的样品颗粒的衍射图像,在一实施方式中,将样品杆在预设角度范围内按照预设转速旋转,以获取不同的拍摄视角。例如,将样品杆沿固定轴在-60°~60°的预设角度范围内按照0.5°~1°每秒的转速进行旋转。在一实施方式中,预设角度范围还可以是-45°~45°、-30~30°或-10~10°等。
进一步地,针对样品杆中的至少部分数量的样品颗粒,采用透视电镜在冷冻模式下分别对每一样品颗粒在预设角度范围内获取不同角度下的一系列衍射图像。
需要知道的是,X射线单晶衍射需要大尺寸的质量晶体,然而对于有机分子而言,培养单晶非常困难甚至无法完成,即获得符合的样品的难度非常大。本实施例通过电子衍射作用于粉末状的目标样品,无需耗费大量人力物力培养单晶。
步骤S220,分别获取并合并多个衍射图像中获取的参数信息,获得参数合并信息。
为了获得可供解析的充分数量的参数信息,在一实施方式中,分别对各衍射图像进行指标化处理,获取样品颗粒对应的参数信息;其中,参数信息包括晶胞参数和衍射点的衍射强度;将多个样品颗粒的参数信息进行合并,获得参数合并信息;其中,参数合并信息中的衍射点的数量不少于预设数量阈值。
进一步地,在一实施方式中,针对单个样品颗粒的一系列衍射图像,可以根据相关技术中的指标化软件进行晶体衍射数据的指标化处理,例如DICVOL软件、ipmosflm软件、HKL2000软件、XDS软件等指标化软件。其中,可以在每一张衍射图像中获取对应的参数信息,参数信息包括晶胞参数和衍射点的衍射强度。具体地,参照步骤S120的阐述,于此不再赘述。
进一步地,基于粉末衍射的指标化需要更多的参数信息才能获得尽可能完整的数据,因此,将各样品颗粒的一系列衍射图像进行指标化处理,分别获得对应的每张衍射图像的参数信息后,将各参数进行合并,以获得足够数量的衍射点的衍射强度。其中,当衍射点的数量不少于预设数量阈值时,则表示该参数合并信息符合要求。否则,如果衍射点的数量不足,使得不具有充分的数据进行后续步骤中的解析,则重复步骤S210获得新的样品颗粒的衍射图像或原样品颗粒的新的衍射图像,以使本步骤可以获得充分数量的衍射点。可以理解,预设数量阈值根据不同分子结构的目标样品进行调整,分子结构越复杂的目标样品,需要的衍射点则越多,相应需要的衍射图像越多。
进一步地,在一实施方式中,可以通过相关技术的数据合并软件将各参数信息合并为一套数据,即获得合并参数信息。例如,数据合并软件可以是XSCALE软件。其中,根据数据合并软件,生成的参数合并信息包括由众多晶胞参数计算出的平均晶胞参数和众多衍射点的衍射强度合并生成的.hkl文件。
步骤S230,根据参数合并信息进行解析,获得初始晶型;其中,初始晶型的分子结构错误率小于或等于预设比例阈值。
可以理解,在获得参数合并信息后,根据参数合并信息,可以根据相关解析软件进行解析,获得初始晶型对应的结构。例如,解析软件可以是SHELXT软件。通过将上述步骤计算出的平均晶胞参数和.hkl文件作为数据源输入解析软件,即可根据该解析软件的相关操作步骤获得初始晶型的结构。
进一步地,在获得初始晶型后,还需根据目标样品的已知分子结构判定初始晶型的分子结构错误率。在一实施方式中,如果初始晶型的分子结构错误率大于预设比例阈值,则表示该初始晶型的结构与目标样品的已知分子结构偏差过大,则丢弃初始晶型,并重新获取样品颗粒进行电子衍射以生成新的初始晶型。可以理解,初始晶型的结构与目标样品的已知分子结构偏差过大时,则该初始晶型很可能为错误晶型。此时,错误晶型不适用于后续步骤的晶型预测,继而丢弃该偏差较大的初始晶型结构,并需要重复本步骤,重新进行解析,获得分子错误率小于或等于预设比例阈值的初始晶型;或者,重新执行步骤S210和/或步骤S220,以获得新的参数合并信息后,再重新对参数合并信息进行解析,以获得符合初始晶型的分子结构错误率小于预设比例阈值初始晶型。在一实施方式中,分子结构错误率可以是初始晶型中的分子结构中的错误原子和错误基团数量之和与总原子和总基团的数量之和的比值;当该比值小于或等于预设比例阈值时,则表示该初始晶型可采纳并用于预测,以助于缩小晶型预测范围。
需要理解的是,根据参数合并信息进行解析,有且获得一个符合条件的初始晶型,只需在一个初始晶型的基础上进行后续步骤,精简了计算量,提高了预测效率。
步骤S240,根据样品颗粒的已知原子和已知基团,删除初始晶型中与已知原子相异的错误原子以及删除初始晶型中与已知基团相异的错误基团,获得对应的修正晶型。
可以理解,在获得初始晶型后,还需要对初始晶型进行精修,以提高晶型的适配度。进一步地,根据目标样品的已知分子结构中的已知原子和已知基团,可以删除初始晶型中明显不同于已知分子结构的错误原子和错误基团。具体地,可以在解析软件中进行操作删除,只保留与已知分子结构完全匹配的原子和基团,从而获得对应的修正晶型。
步骤S250,根据修正晶型进行晶型预测,获得预测晶型。
在一实施方式中,将修正晶型中的原子坐标作为离散点坐标,生成沃罗诺伊图;获取沃罗诺伊图中的虚原子信息;根据目标样品的已知分子结构和虚原子信息,对修正晶型中的缺失原子进行预测,获得基态能量符合预设规则的预测晶型。
具体地,可以将修正晶型中的原子作为离散点,原子坐标作为离散点坐标,绘制沃罗诺伊图(VoronoiDiagram),从而对修正晶型的三维空间进行分割。进一步地,在沃罗诺伊图的每块区域中均包含一个离散点(即一个原子),则每块区域的边缘不会再出现另外一个离散点。因此,沃罗诺伊图中的多块区域相交的顶点及顶点周围的不包含离散点的空间即为不会出现原子的空间,这些空间可以作为虚原子产生的空间,沃罗诺伊图中的多块区域相交的部分顶点的坐标可以作为对应的虚原子中心坐标。
其中,单个虚原子信息可以是虚原子的中心坐标和半径,通过获取虚原子信息,以助于预测晶型的分子内坐标的构建。在一实施方式中,通过获取与最近离散点的直线距离大于或等于预设键长值的各顶点对应的坐标,即可获得各虚原子对应的坐标。也就是说,仅有部分符合条件的顶点的坐标可以作为虚原子的中心坐标,该顶点与其最近离散点的直线距离的一半即为对应的虚原子的半径。进一步地,在一实施方式中,根据各离散点坐标,通过相关技术计算获得各区域相交的顶点坐标;根据各顶点坐标和离散点坐标,可以计算获得每一顶点坐标与其最近的离散点坐标之间的直线距离;将各直线距离分别与预设键长值进行比较,如果直线距离小于预设键长值,则删除沃罗诺伊图中对应的顶点。即删除的顶点不用作虚原子,未删除的顶点的坐标作为虚原子的中心坐标。其中,预设键长值可以是常见化学键长的1/2。常见化学键长可以是1~1.5Angstrom。在一实施方式中,预设键长值可以是0.5~0.75Angstrom,如0.5Angstrom、0.6Angstrom、0.7Angstrom或0.75Angstrom。需要理解的是,沃罗诺伊图中的各区域未删除的相交的顶点作为虚原子,虚原子与最近的离散点,即虚原子与最近的原子之间的直线距离需要和常见化学键长的1/2近似,如果该顶点与最近的原子之间的直线距离太小,则,该顶点不利于正常的分子结构的构建,即该顶点不适合作为虚原子。因此,通过删除沃罗诺伊图中直线距离小于预设键长值的顶点,从而删除不适合的虚原子。
进一步地,在删除不适合的顶点,即删除不适合的虚原子后,在一实施方式中,将剩余顶点作为对应的虚原子的中心坐标,并将各顶点与最近原子距离的一半作为对应的虚原子半径,获得虚原子信息集合。其中,虚原子信息集合中的各虚原子将作为构建预测晶型的障碍物,即存在虚原子的位置将不会存在预测晶型的原子,从而辅助预测晶型的结构的搭建。
进一步地,在一实施方式中,根据目标样品的已知分子结构和虚原子信息,对修正晶型中的缺失原子进行预测,包括:将目标样品中的已知分子结构的原子种类和对应的原子中心坐标及将虚原子信息集合中的各虚原子的中心坐标和对应的虚原子半径作为CSP晶型预测的输入结构,从而对修正晶型中的缺失原子进行预测。通过获得缺失原子,进一步地,在一实施方式中,根据预测的缺失原子对修正晶型的分子结构进行补全,获得至少一个初步预测晶型;根据初步预测晶型的基态能量的数值将各初步预测晶型进行能量排序;选取基态能量最低的初步预测晶型作为预测晶型。可以理解,CSP晶型预测可以根据相关技术进行,于此不作赘述。
可以理解,在对修正晶型进行原子补全后,获得的初步预测晶型可能有多个。根据相关技术进行计算,可以获得每一初步预测晶型的基态能量,再根据基态能量的数值大小将各初步预测晶型按照能量大小进行排序,即可将基态能量值最低的初步预测晶型作为预测晶型。可以理解,基态能量值越低,晶型越稳定,从而可以作为理想的药用晶型。
步骤S260,对预测晶型进行验证,获得验证通过的预测晶型。
可以理解,在获得预测晶型后,为了确保预测晶型的正确性,可以对预测晶型进行验证。
在一实施方式中,对预测晶型进行验证;其中,当预测晶型的模拟结构因子与实验结构因子之间的残差因子小于或等于预设值时,确定预测晶型验证通过。在一实施方式中,预设值可以为0.3~0.4,例如0.3、0.35或0.4。
在一实施方式中,残差因子R1根据下述公式(1)计算获得:
Figure BDA0003309124490000111
其中,R1代表残差因子,Fcalc代表模拟结构因子,Fobs代表实验结构因子。
进一步地,模拟结构因子Fcalc可根据下述公式(2)计算获得:
Figure BDA0003309124490000112
其中,i表示虚数单位,j表示晶胞内第j个原子,n表示预测晶型的晶胞内的所有原子总数,x、y、z分别为预测晶型的晶胞中的原子的分数坐标,h、k、l为衍射点对应的密勒指数。
实验结构因子根据上述步骤S220中的各衍射点的衍射强度合并获得,具体可参考下述公式(3)计算获得实验结构因子。
Figure BDA0003309124490000113
其中,hkl为各衍射点对应的密勒指数,I(hkl)为衍射点的衍射强度,F(hkl)为实验结构因子。
可以理解,当预测晶型的残差因子数值小于或等于预设值时,则表示该预测晶型的结构正确,即为验证通过。验证通过的预测晶型即为理想的药用晶型。否则,如果残差因子大于预设值,则表示验证不通过。
如果验证不通过,则将步骤S250中的各初步预测晶型的基态能量排序的数值为次低的初步预测晶型作为预测晶型,进一步重复本步骤进行验证,直至验证通过,获得验证通过的预测晶型。可以理解,验证通过的预测晶型即为正确的且最稳定的晶型。
从该实施例可以看出,本申请的晶型预测方法,通过电子衍射技术获得粉末状的各样品颗粒的多个不同角度的衍射图像后,通过解析各衍射图像获得充分数量的衍射点的参数合并信息,从而根据参数合并信息获得初始晶型,且只需初始晶型的分子结构错误率小于或等于预设比例阈值即可作为后续预测的基础,有效减少了初始结构的数量,从而降低了后续预测的计算时间。这样的设计,相比于X射线单晶衍射,本申请极大地降低了对样品质量与性质的依赖,减少了培养样品的成本。另外,通过对初始晶型进行修正,获得的修正晶型即可作为CSP晶型预测的输入结构以作为实验参考,有效减少了降低了因样品分子自由度对CSP晶型预测的深度影响,降低了CSP预测难度;另外通过验证预测晶型以提高预测晶型的可信度,从而获得正确且稳定的预测晶型。本实施例的晶型预测方法,不限于样品种类,通过将电子衍射与CSP晶型预测技术结合以获得预测晶型,降低了样品培养难度及降低了CSP的晶型预测难度,且可以获得可信度高的理想晶型,具有推广价值。
与前述应用功能实现方法实施例相对应,本申请还提供了一种晶型预测装置、电子设备及相应的实施例。
图3是本申请实施例示出的晶型预测装置的结构示意图。
参见图3,本申请的晶型预测装置,包括图像获取模块310、晶型生成模块320、晶型修正模块330及晶型预测模块340,其中:
图像获取模块310用于获取目标样品的多个样品颗粒对应的衍射图像。
晶型生成模块320用于根据在各衍射图像中获取的参数信息,生成所述目标样品的初始晶型。
晶型修正模块330用于根据目标样品的已知分子结构对初始晶型进行修正,获得修正晶型。
晶型预测模块340用于根据修正晶型进行晶型预测,获得目标样品的预测晶型。
图4是本申请实施例示出的晶型预测装置的结构示意图。
参见图4,进一步地,在一实施方式中,本申请的图像获取模块310用于通过电子衍射分别获取各样品颗粒在预设温度的拍摄环境中的预设角度范围内的多个衍射图像。
进一步地,在一实施方式中,本申请的装置还包括参数处理模块350,参数处理模块350用于分别对各衍射图像进行指标化处理,获取样品颗粒对应的参数信息;将多个样品颗粒的参数信息进行合并,获得参数合并信息;其中,参数合并信息中的衍射点的数量不少于预设数量阈值。晶型生成模块320用于根据参数合并信息进行解析,获得初始晶型;其中,初始晶型的分子结构错误率小于或等于预设比例阈值。在一实施方式中,如果晶型生成模块320生成的初始晶型的分子结构错误率大于预设比例阈值,则丢弃初始晶型,并重新获取样品颗粒进行电子衍射以生成新的初始晶型。
进一步地,在一实施方式中,晶型修正模块330用于根据目标样品的已知原子和已知基团,删除初始晶型中与已知原子相异的错误原子以及删除初始晶型中与已知基团相异的错误基团,获得对应的修正晶型。
进一步地,在一实施方式中,晶型预测模块340还用于将修正晶型中的原子坐标作为离散点坐标,生成沃罗诺伊图;获取沃罗诺伊图中的虚原子信息;根据目标样品的已知分子结构和虚原子信息,对修正晶型中的缺失原子进行预测,获得基态能量符合预设规则的预测晶型。晶型预测模块340还用于根据预测的缺失原子对修正晶型的分子结构进行补全,获得至少一个初步预测晶型;根据初步预测晶型的基态能量的数值将各初步预测晶型进行能量排序;选取基态能量最低的初步预测晶型作为预测晶型。
进一步地,在一实施方式中,本申请的装置还包括晶型验证模块360,晶型验证模块360用于对预测晶型进行验证;其中,当预测晶型的模拟结构因子与实验结构因子之间的残差因子小于或等于预设值时,确定预测晶型验证通过。
从该实施例可以看出,本申请的晶型预测装置,先通过图像获取模块获得样品颗粒的衍射图像,再通过参数处理模块根据衍射图像获得所需的参数合并信息,晶型生成模块根据参数合并信获得初始晶型后,晶型修正模块再对初始晶型进行修正以获得修正晶型,最后晶型预测模块在修正晶型的基础上进行晶型预测以获得预测晶型,晶型验证模块验证预测晶型的可信度。这样的设计,相比于直接根据目标样品的已知分子结构进行晶型预测,本申请的预测方式可以预先排除部分错误晶型的干扰,从而针对性地在修正晶型的基础上进行预测,降低了预测难度,缩短了预测时间,提高晶型预测效率;另外,相比于X射线单晶衍射,本申请的装置直接利用电子衍射可以降低对样品质量的要求,降低培养样品的成本,缩短整体的晶型预测时间,提高预测效率。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
图5是本申请实施例示出的电子设备的结构示意图。
参见图5,电子设备1000包括存储器1010和处理器1020。
处理器1020可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器1010可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM)和永久存储装置。其中,ROM可以存储处理器1020或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器1010可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(例如DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器1010可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器1010上存储有可执行代码,当可执行代码被处理器1020处理时,可以使处理器1020执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质),其上存储有可执行代码(或计算机程序或计算机指令代码),当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。

Claims (11)

1.一种晶型预测方法,其特征在于,包括:
获取目标样品的多个样品颗粒对应的衍射图像;
根据在各所述衍射图像中获取的参数信息,生成所述目标样品的初始晶型;
根据所述目标样品的已知分子结构对所述初始晶型进行修正,获得修正晶型;
根据所述修正晶型进行晶型预测,获得所述目标样品的预测晶型。
2.根据权利要求1所述的方法,其特征在于,所述获取目标样品的多个样品颗粒对应的衍射图像,包括:
通过电子衍射分别获取所述目标样品的多个样品颗粒在预设温度的拍摄环境中的预设角度范围内的多个衍射图像。
3.根据权利要求1所述的方法,其特征在于,所述根据在各所述衍射图像中获取的参数信息,生成所述目标样品的初始晶型,包括:
分别对各所述衍射图像进行指标化处理,获取所述样品颗粒对应的参数信息;其中,所述参数信息包括晶胞参数和衍射点的衍射强度;
将多个所述样品颗粒的参数信息进行合并,获得参数合并信息;其中,所述参数合并信息中的所述衍射点的数量不少于预设数量阈值;
根据所述参数合并信息进行解析,获得所述目标样品的初始晶型;其中,所述初始晶型的分子结构错误率小于或等于预设比例阈值。
4.根据权利要求1所述的方法,其特征在于,所述根据所述目标样品的已知分子结构对所述初始晶型进行修正,获得修正晶型,包括:
根据所述目标样品的已知原子和已知基团,删除所述初始晶型中与所述已知原子相异的错误原子以及删除所述初始晶型中与所述已知基团相异的错误基团,获得对应的修正晶型。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
如果所述初始晶型的分子结构错误率大于所述预设比例阈值,则丢弃所述初始晶型,并重新获取样品颗粒进行电子衍射以生成新的初始晶型。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述根据所述修正晶型进行晶型预测,获得所述目标样品的预测晶型,包括:
将所述修正晶型中的原子坐标作为离散点坐标,生成沃罗诺伊图;
获取所述沃罗诺伊图中的虚原子信息;
根据所述目标样品的已知分子结构和所述虚原子信息,对所述修正晶型中的缺失原子进行预测,获得基态能量符合预设规则的预测晶型。
7.根据权利要求6所述的方法,其特征在于,所述对所述修正晶型中的缺失原子进行预测,获得基态能量符合预设规则的预测晶型,包括:
根据预测的缺失原子对所述修正晶型的分子结构进行补全,获得至少一个初步预测晶型;
根据所述初步预测晶型的基态能量的数值将各所述初步预测晶型进行能量排序;
选取基态能量最低的初步预测晶型作为所述预测晶型。
8.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
对所述预测晶型进行验证;其中,当所述预测晶型的模拟结构因子与实验结构因子之间的残差因子小于或等于预设值时,确定所述预测晶型验证通过。
9.一种晶型预测装置,其特征在于,包括:
图像获取模块,用于获取目标样品的多个样品颗粒对应的衍射图像;
晶型生成模块,用于根据在各所述衍射图像中获取的参数信息,生成所述目标样品的初始晶型;
晶型修正模块,用于根据所述目标样品的已知分子结构对所述初始晶型进行修正,获得修正晶型;
晶型预测模块,用于根据所述修正晶型进行晶型预测,获得所述目标样品的预测晶型。
10.一种电子设备,其特征在于,包括:处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1-8中任一项所述的方法。
11.一种计算机可读存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1-8中任一项所述的方法。
CN202111211742.5A 2021-10-18 2021-10-18 晶型预测方法、装置及电子设备 Active CN113850801B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111211742.5A CN113850801B (zh) 2021-10-18 2021-10-18 晶型预测方法、装置及电子设备
PCT/CN2021/135250 WO2023065475A1 (zh) 2021-10-18 2021-12-03 晶型预测方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111211742.5A CN113850801B (zh) 2021-10-18 2021-10-18 晶型预测方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN113850801A true CN113850801A (zh) 2021-12-28
CN113850801B CN113850801B (zh) 2024-09-13

Family

ID=78978722

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111211742.5A Active CN113850801B (zh) 2021-10-18 2021-10-18 晶型预测方法、装置及电子设备

Country Status (2)

Country Link
CN (1) CN113850801B (zh)
WO (1) WO2023065475A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114464264A (zh) * 2021-12-31 2022-05-10 深圳晶泰科技有限公司 基于分子动力学的晶体熔点的计算方法、装置及存储介质
CN115983738A (zh) * 2023-03-21 2023-04-18 广东仁懋电子有限公司 一种用于提升氮化镓制备效率方法和装置
WO2024012017A1 (zh) * 2022-07-14 2024-01-18 腾讯科技(深圳)有限公司 反应物分子的预测、模型的训练方法、装置、设备及介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040148149A1 (en) * 1999-06-18 2004-07-29 Mayo Foundation For Medical Education And Research, A Minnesota Corporation Molecular modeling for metalloproteins
US20100211366A1 (en) * 2007-07-31 2010-08-19 Sumitomo Heavy Industries, Ltd. Molecular simulating method, molecular simulation device, molecular simulation program, and recording medium storing the same
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法
CN103204939A (zh) * 2013-01-05 2013-07-17 陈志南 CD147-HAb18MAb复合物晶体结构及应用
CN106446602A (zh) * 2016-09-06 2017-02-22 中南大学 蛋白质分子中rna结合位点的预测方法及系统
US20210104331A1 (en) * 2019-10-03 2021-04-08 Atomwise Inc. Systems and methods for screening compounds in silico
CN113240759A (zh) * 2021-06-02 2021-08-10 上海眼控科技股份有限公司 一种基于色温的能见度确定方法、装置、设备及存储介质
CN113423336A (zh) * 2019-02-15 2021-09-21 Q生物公司 使用预测模型确定模型参数

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6883167B2 (ja) * 2016-02-29 2021-06-09 国立大学法人東北大学 非晶質合金基板を用いた微小金属粒子の結晶構造解析方法
CN106372400B (zh) * 2016-08-29 2019-06-04 深圳晶泰科技有限公司 构建极化力场的方法及应用、预测药物晶型的方法及系统
CN108229090B (zh) * 2017-12-29 2021-11-09 西北工业大学 一种晶体结构的预测方法
CN112309497B (zh) * 2020-12-28 2021-04-02 武汉金开瑞生物工程有限公司 一种基于Cycle-GAN的蛋白质结构预测方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040148149A1 (en) * 1999-06-18 2004-07-29 Mayo Foundation For Medical Education And Research, A Minnesota Corporation Molecular modeling for metalloproteins
US20100211366A1 (en) * 2007-07-31 2010-08-19 Sumitomo Heavy Industries, Ltd. Molecular simulating method, molecular simulation device, molecular simulation program, and recording medium storing the same
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法
CN103204939A (zh) * 2013-01-05 2013-07-17 陈志南 CD147-HAb18MAb复合物晶体结构及应用
CN106446602A (zh) * 2016-09-06 2017-02-22 中南大学 蛋白质分子中rna结合位点的预测方法及系统
CN113423336A (zh) * 2019-02-15 2021-09-21 Q生物公司 使用预测模型确定模型参数
US20210104331A1 (en) * 2019-10-03 2021-04-08 Atomwise Inc. Systems and methods for screening compounds in silico
CN113240759A (zh) * 2021-06-02 2021-08-10 上海眼控科技股份有限公司 一种基于色温的能见度确定方法、装置、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
廖立兵 等: "《X射线衍射方法与应用》", 31 March 2008, 《地质出版社》, pages: 184 *
袁伟 等: ""N-(1-萘基)-琥珀酰亚胺化合物晶体结构的理论预测"", 《物理化学学报》, vol. 22, no. 9, 15 September 2006 (2006-09-15), pages 1071 - 1074 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114464264A (zh) * 2021-12-31 2022-05-10 深圳晶泰科技有限公司 基于分子动力学的晶体熔点的计算方法、装置及存储介质
WO2024012017A1 (zh) * 2022-07-14 2024-01-18 腾讯科技(深圳)有限公司 反应物分子的预测、模型的训练方法、装置、设备及介质
CN115983738A (zh) * 2023-03-21 2023-04-18 广东仁懋电子有限公司 一种用于提升氮化镓制备效率方法和装置

Also Published As

Publication number Publication date
CN113850801B (zh) 2024-09-13
WO2023065475A1 (zh) 2023-04-27

Similar Documents

Publication Publication Date Title
CN113850801B (zh) 晶型预测方法、装置及电子设备
Smyth et al. x Ray crystallography
Gubins et al. SHREC 2020: Classification in cryo-electron tomograms
Zhang et al. IPET and FETR: experimental approach for studying molecular structure dynamics by cryo-electron tomography of a single-molecule structure
Higo et al. Hydration structure of human lysozyme investigated by molecular dynamics simulation and cryogenic X‐ray crystal structure analyses: on the correlation between crystal water sites, solvent density, and solvent dipole
Douangamath et al. Achieving efficient fragment screening at XChem facility at diamond light source
CN111583120B (zh) 图像拼接方法、装置、设备和存储介质
Cp van Zundert et al. Fast and sensitive rigid-body fitting into cryo-EM density maps with PowerFit
Grime et al. High-throughput PIXE as an essential quantitative assay for accurate metalloprotein structural analysis: development and application
CN114648611B (zh) 局域轨道函数的三维重构方法及装置
Cordes et al. M2aia—Interactive, fast, and memory-efficient analysis of 2D and 3D multi-modal mass spectrometry imaging data
Li et al. Accurate stochastic reconstruction of heterogeneous microstructures by limited x‐ray tomographic projections
US20210358166A1 (en) Methods, apparatuses, systems, and storage media for loading visual localization maps
CN112465886A (zh) 模型生成方法、装置、设备和可读存储介质
CN107103587B (zh) 一种生物芯片图像倾斜的校正方法及装置
Jun Virtual multi-alignment theory of parallel-beam CT image reconstruction for rigid objects
Arakelian et al. Myosin S2 origins track evolution of strong binding on actin by azimuthal rolling of motor domain
CN110288641A (zh) Pet/ct与mri脑部图像异机配准方法、装置、计算机设备及存储介质
Sanchez-Garcia et al. Cryo-EM map anisotropy can be attenuated by map post-processing and a new method for its estimation
CN114937216A (zh) 基于舰船轨迹的序列影像稳像方法、装置、设备和介质
Nasedkin et al. Atomistic molecular dynamics simulations of tubulin heterodimers explain the motion of a microtubule
CN114119963A (zh) 一种高精地图路牌的生成方法及装置
Hanot et al. Multi-scale Bayesian modeling of cryo-electron microscopy density maps
WO2017188559A1 (en) Method of image reconstruction in computed tomography
Iqbal et al. Analysis of deformable distortion in the architecture of leaf xylary vessel elements of Carthamus oxycantha caused by heavy metals stress using image registration

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant