CN111462832A - 一种无参数局域结构识别方法 - Google Patents

一种无参数局域结构识别方法 Download PDF

Info

Publication number
CN111462832A
CN111462832A CN202010261050.0A CN202010261050A CN111462832A CN 111462832 A CN111462832 A CN 111462832A CN 202010261050 A CN202010261050 A CN 202010261050A CN 111462832 A CN111462832 A CN 111462832A
Authority
CN
China
Prior art keywords
atom
atoms
neighbor
central atom
try
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010261050.0A
Other languages
English (en)
Other versions
CN111462832B (zh
Inventor
田泽安
潘佳铭
李肯立
余艾冰
董科军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN202010261050.0A priority Critical patent/CN111462832B/zh
Publication of CN111462832A publication Critical patent/CN111462832A/zh
Application granted granted Critical
Publication of CN111462832B publication Critical patent/CN111462832B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及图论领域,主要用于对物质的原子(分子)层次的微观结构分析、颗粒体系的组织结构分析和体系的基本结构单元在空间的分布特征分系,属于计算机在物质结构分析方面的应用。对于同一体系,不同的截断距离会得到不同的表征符号,导致结构分析结果的不唯一性。本发明公开了一种无参数局域结构识别方法,此方法基于拓扑判据实现无参数微观结构的分析,可以唯一确定以每个原子为中心的局域结构,以确保微观结构的表征符号与其空间构型的一一对应。本发明的分析方法可以根据物质本身的结构计算出适合该物质的截断距离,截断距离的计算不受物质类型、形态的影响。

Description

一种无参数局域结构识别方法
技术领域:
本发明涉及图论,典型应用是物质液态熔体、金属玻璃、胶体溶液、随机颗粒填充体系等复杂系统的静态微观结构分析,主要用于对物质的原子(分子)层次的微观结构分析、颗粒体系的组织结构分析或者体系的基本结构单元在空间的分布特征分析,属于计算机技术在物质结构分析领域的应用。
背景技术:
物质结构决定物质性质,对于物质结构的数学描述是研究物质性质的基础。
在群论等数学和材料理论的基础上,理想晶体材料的结构已能精确表征:3个晶族,7大晶系,14种布拉菲格子,32种点群和230空间群。但原子无规则分布的非晶态体系的结构描述一直是数学、物理学、材料科学的难题。
实验表明非晶态材料的原子并非数学上的随机分布,而是存在大量的局域有序结构。如图1所示,图中描述了三种不同的体系中以任意一个原子为中心找到其他原子的概率密度(对分布函数,PDF或g(r)),对于完全随机分布的粒子体系,g(r)函数的图像应该是一条取值为1的水平直线;对于理想晶体则是包含一些竖直线段的谱线结构。图1中的三条曲线都存在巨大的分布起伏,表明金属液体,金属玻璃和颗粒随机填充体系内,基本结构单元(原子、分子、颗粒)都不是数学上的随机分布,而是有微观结构的体系。
为了描述非晶态体系内的局域结构,人们尝试了许多方法。主要有Voronoi多面体分析法及其对偶Delaunay四面体分析法、Honeycutt和Andersen提出的键对分析法(HA-Pair)以及公用近邻分析法(common neighbors analysis,CNA)等几种方法。其中HA-Pair分析法和CNA都是以原子对及其公有近邻构成的局域结构为基础表征物质的结构特征。此类方法中,如果两个原子i和j的距离dij小于预先给定的截断距离rcut,即dij<rcut时,它们互为近邻,或它们之间成键(bond)。此类方法中的基本结构单元叫共有近邻子团簇(commonneighbor sub-cluster,CNS),如图2(a)所示,它是由图2(b)中一对称为参考原子对(reference pair,RP)的原子及图2(c)中其共有近邻(common near neighbors,CNNs)构成。此方法中使用形如“Sijk”的形式的CNS-index表征一个(种)CNS的结构,其中i表示在此CNS中CNN的数目,j表示i个CNNs之间的键的数目,k表示i个CNNs之间j根键构成的最长链的长度。例如图2(c)中5个CNN,构成3根键,其中最长的有2根键,则其结构可以用“S532”表征。但是这种方法中存在着一个问题:截断距离rcut越大,每个原子的近邻原子就越多,反之就越少;然而原子的近邻原子数目的不同,得到的局域结构就不一样。如图3所示,表征符号为S211的共有近邻子团簇只有一对参考原子对的共有近邻,但是随着rcut的增大,其共有近邻数目增加,并且共有近邻之间的连接关系也变得复杂,根据CNS-index的规定,此时该CNS的表征符号为S444(如图3(c)所示)。所以对于同一体系,使用不同的截断距离rcut会得到不同的结构及表征符号,因此导致结构分析结果依赖于预置的参数rcut的具体取值,不具备唯一性。
这种由于预置不同的截断距离rcut,导致结构分析结果的不确定性与自然科学的客观性相悖,因此版方法提出了一种不依赖任何预置参数并且能唯一确定以每个原子为中心的局域结构的分析方法。
发明内容:
为了解决由于预置不同的截断距离而导致结构分析结果不确定性的问题,本发明提出了一种唯一确定结构分析结果的分析方法——一种无参数局域结构识别方法,此方法基于欧几里得距离采用拓扑判据实现无参数微观结构的识别,可以唯一确定以每个原子为中心的局域结构,并确保微观结构的表征符号与其空间构型一一对应。通过本发明的局域结构识别方法可以对物质的结构进行唯一表征,奠定复杂无序的非晶态物质结构研究基础,解决“结构→性质”的基本科学难题,突破了物理学、材料科学等相关领域的研究瓶颈。
在本发明的分析方法中,为了确保CNS-index与拓扑构型间的一一对应,作以下规定:在共有近邻(common near neighbor,CNN)之间的连接关系中不容许出现多键点(multi-bond point,MBP)和共有近邻子环(common neighbor sub-ring,CNSR)。MBP是CNN之间连接关系(如图2(c)和图3所示)中3个或者3个以上的键汇聚的点,而CNSR是只包含部分CNN的子环,如图3(c)中的三角形。由于不包含MBP和CNSR的共有近邻子团簇(commonneighbor sub-cluster,CNS)能确保CNS-index与其拓扑构型之间的一一对应,故称这种CNS为标准CNS。以一个原子为中心,以截断距离rcut为半径,找到n个近邻,如果每个近邻与中心原子构成的CNS均为标准CNS,则这种含有中心的团簇结构称为标准团簇(standardcluster,SC),其拓扑结构可以由标准CNS的数目和类型来表征,如图4所示。图4中的标准团簇有11个近邻原子,其内有8种标准CNS,其拓扑结构可以用一个含有8个二元组的集合表征:[1-211,2-311,1-322,2-422,2-433,1-532,1-544,1-555]。
显然,以一个原子为中心可以找到多个SC。当rcut很小时,中心原子没有近邻原子,此时该团簇也满足SC的要求;当rcut增大至中心原子有1~4个近邻时,此时该团簇结构肯定是SC;但随着rcut增大,MBP和CNSR最终会出现,因此以一个原子为中心有且仅有一个最大的SC,称之为最大标准团簇(the largest standard cluster,LSC)。本发明中的分析方法对物质进行内部的结构分析时不需要预先设置一个准确的截断距离rcut,只需要设置一个试探性截断距离rtry,然后根据物质本身的结构计算出适合该物质的截断距离,截断距离的计算不受物质类型、形态的影响,该分析方法可以唯一确定以每个原子为中心的局域结构,对物质展开从短程,到中程,甚至长程结构特征的分析。
本发明的技术方案是:
一种无参数局域结构识别方法,包括以下步骤:
步骤一:计算中心原子的近邻原子,包括以下步骤:
(1)预先设置试探性截断距离rtry和有效计数器c=0;
(2)以确定的方式搜索附近原子,计算它们与当前选定的中心原子m之间的距离d,若d≤rtry,说明该原子与中心原子互为近邻,即该原子与中心原子m成键,则将该原子加入中心原子m的近邻原子列表中,否则该原子与中心原子m不为近邻原子;
(3)对中心原子的近邻原子列表中的近邻原子,按照其与中心原子之间距离的从近到远进行排序;
步骤二:确定中心原子所有近邻原子之间的成键关系,包括以下步骤:
计算中心原子m的所有近邻原子(假定有i个)之间的距离,若两近邻原子之间的距离为d’,如果d’≤rtry,说明这两个近邻原子互为近邻,即这两个共有近邻原子成键,否则这两个共有近邻原子不成键;
步骤三:构造以中心原子m为中心的最大标准团簇(the largest standardcluster,LSC),包括以下步骤:
(1)选定中心原子m的某一近邻原子,其编号为n,根据步骤二中近邻原子之间的成键关系,以原子对mn为根对原子构造其对应的共有近邻子团簇(common neighbor sub-cluster,CNS);
(2)判断以原子对mn为根对原子构造的CNS中是否有多键点(multi-bond point,MBP)和共有近邻子环(common neighbor sub-ring,CNSR);如果该CNS中包含MBP或者CNSR,则有效计数器执行增值操作c=c+1,执行步骤三(3);如果该CNS中不包含MBP和CNSR,则选择中心原子m的下一个近邻原子,返回至步骤三(1)重新执行;如果中心原子m的所有近邻原子均已被选择过,则直接执行步骤三(4);
(3)减少试探性截断距离rtry,返回至步骤一(1)开始重新执行;
(4)如果整个过程中执行步骤三(3)至少一次,即c≥1,则继续执行下一步(骤三(5));否则增大rtry,返回至步骤一(1)开始重新执行;
(5)此时的rtry即为中心原子m的临界截断距离,由此rtry确定的中心原子m及其近邻原子构成的团簇即为最大标准团簇,此团簇内的所有CNS均能赋予唯一的符号表征,该原子被赋予用高维矢量表征的多重属性。
相比于现有技术,本发明具有以下优势:
(1)本发明中的分析方法对物质进行内部的结构分析时不需要预先设置一个准确的截断距离rcut,只需要设置一个试探性截断距离rtry;以节省计算时间;分析方法根据物质本身的结构特征,计算出每个原子唯一的截断距离;
(2)本发明的分析结果赋予每个数据点丰富的属性,将每个属性看成高维矢量的一个维度,则本方法将无序数据集离散化,完成“数据点→矢量”的转化,并构建为节点具有属性的图,便于定量分析。
(3)本发明中的分析方法可以容易地扩展到其他领域,如根据收集到的人与人之间交往的数据定义好人与人之间的“距离”,即可计算第一近邻以及第一近邻之间的关系,对抽象复杂的人际关系展开定量研究。
附图说明:
图1(a)是金属液体的g(r)函数;
图1(b)是金属玻璃的g(r)函数;
图1(c)是随机填充颗粒体系的g(r)函数;
图2(a)是表征符号为S532的共有近邻子团簇;
图2(b)是S532的参考原子对;
图2(c)是S532的参考原子对的共有近邻;
图3是由于过大的截断距离rcut导致破坏的共有近邻子团簇的表征符号与拓扑构型的一一对应关系;
图4是一个以原子32323为中心的标准团簇;
图5是本发明的流程图。
具体实施方式:
下面结合附图和具体实施例对本发明进一步说明。
对于包含n个原子的体系,如果不采用任何加速方法,确定近邻关系,需要计算每个原子与所有其他原子的距离,总共计算复杂度为n(n-1)。但实际上,两个原子之间的距离只需要计算一次,便可确定这对原子互为近邻,或者互相不是近邻;则计算复杂度降低为n(n-1)/2。对于巨大的微观体系(如n为10的8次方以上),计算复杂度降低效果显著。但实施此策略时,按照某种算法,只有遍历所有原子之后才能确定每个原子的近邻列表,然后才能开始后续计算确定以每个原子为中心的局域结构,即确定所有原子的近邻是并行同步点,因此本发明的具体实施方式分成两个部分:(1)采用优化并行方法,计算每个原子的近邻列表;(2)以近邻原子列表为基础,确定以每个为中心的局域结构类型。
步骤一:计算中心原子的近邻原子,包括以下步骤:
(1)预先设置试探性截断距离rtry和有效计数器c=0;
(2)以某种搜索策略计算所有距离较近原子与当前选定的中心原子m之间的距离d,若d≤rtry,该原子与中心原子m成键,则将该原子加入中心原子m的近邻原子列表中,否则该原子与中心原子m不为近邻原子;
(3)对中心原子的近邻原子列表中的近邻原子,按照其与中心原子之间距离的远近从近到远进行排序;
步骤二:确定中心原子所有近邻原子之间的成键关系,包括以下步骤:
计算中心原子m的所有近邻原子(假定有i个)之间的距离,若两近邻原子之间的距离为d’,如果d’≤rtry,说明这两个近邻原子互为近邻,即这两个共有近邻原子成键,否则这两个共有近邻原子不成键;
步骤三:构造以中心原子m为中心的最大标准团簇(the largest standardcluster,LSC),包括以下步骤:
(1)选定中心原子m的某一近邻原子,其编号为n,根据步骤二中近邻原子之间的成键关系,以原子对mn为根对原子构造其对应的共有近邻子团簇(common neighbor sub-cluster,CNS);
(2)判断以原子对mn为根对原子构造的CNS中是否有多键点(multi-bond point,MBP)和共有近邻子环(common neighbor sub-ring,CNSR);如果该CNS中包含MBP或者CNSR,则有效计数器执行增值操作c=c+1,执行步骤三(3);如果该CNS中不包含MBP和CNSR,则选择中心原子m的下一个近邻原子,返回至步骤三(1)重新执行;如果中心原子m的所有近邻原子均已被选择过,则直接执行步骤三(4);
(3)减少试探性截断距离rtry,返回至步骤一(1)开始重新执行;
(4)如果整个过程中执行步骤三(3)至少一次,即c≥1,则继续执行下一步(骤三(5));否则增大rtry,返回至步骤一(1)开始重新执行;
(5)此时的rtry即为中心原子m的临界截断距离,由此rtry确定的中心原子m及其近邻原子构成的团簇即为最大标准团簇,此团簇内的所有CNS的表征符号均能逐一确定。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制。参照该实施例的说明,本领域的普通技术人员应该可以理解并对本发明的技术方案进行相关的修改或替换,而不脱离本发明的实质和范围。

Claims (1)

1.一种无参数局域结构识别方法,其特征在于,包含如下步骤:
(1)预先设置试探性截断距离rtry和有效计数器c=0;
(2)以确定的方式搜索附近原子,计算它们与当前选定的中心原子m之间的距离d,若d≤rtry,说明该原子与中心原子互为近邻,即该原子与中心原子m成键,则将该原子加入中心原子m的近邻原子列表中,否则该原子与中心原子m不为近邻原子;
(3)对中心原子的近邻原子列表中的近邻原子,按照其与中心原子之间距离的从近到远进行排序;
步骤二:确定中心原子所有近邻原子之间的成键关系,包括以下步骤:
计算中心原子m的所有近邻原子之间的距离,若两近邻原子之间的距离为d’,如果d’≤rtry,说明这两个近邻原子互为近邻,即这两个共有近邻原子成键,否则这两个共有近邻原子不成键;
步骤三:构造以中心原子m为中心的最大标准团簇LSC,包括以下步骤:
(1)选定中心原子m的某一近邻原子,其编号为n,根据步骤二中近邻原子之间的成键关系,以原子对mn为根对原子构造其对应的共有近邻子团簇CNS;
(2)判断以原子对mn为根对原子构造的CNS中是否有多键点MBP和共有近邻子环CNSR;如果该CNS中包含MBP或者CNSR,则有效计数器执行增值操作c=c+1,执行步骤三(3);如果该CNS中不包含MBP和CNSR,则选择中心原子m的下一个近邻原子,返回至步骤三(1)重新执行;如果中心原子m的所有近邻原子均已被选择过,则直接执行步骤三(4);
(3)减少试探性截断距离rtry,返回至步骤一(1)开始重新执行;
(4)如果整个过程中执行步骤三(3)至少一次,即c≥1,则继续执行步骤三(5);否则增大rtry,返回至步骤一(1)开始重新执行;
(5)此时的rtry即为中心原子m的临界截断距离,由此rtry确定的中心原子m及其近邻原子构成的团簇即为最大标准团簇,此团簇内的所有CNS均能赋予唯一的符号表征,该原子被赋予用高维矢量表征的多重属性。
CN202010261050.0A 2020-04-03 2020-04-03 一种无参数局域结构识别方法 Active CN111462832B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010261050.0A CN111462832B (zh) 2020-04-03 2020-04-03 一种无参数局域结构识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010261050.0A CN111462832B (zh) 2020-04-03 2020-04-03 一种无参数局域结构识别方法

Publications (2)

Publication Number Publication Date
CN111462832A true CN111462832A (zh) 2020-07-28
CN111462832B CN111462832B (zh) 2022-04-12

Family

ID=71679710

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010261050.0A Active CN111462832B (zh) 2020-04-03 2020-04-03 一种无参数局域结构识别方法

Country Status (1)

Country Link
CN (1) CN111462832B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113674808A (zh) * 2021-08-18 2021-11-19 合肥工业大学 一种超稳态玻璃结构的制备方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014033670A2 (en) * 2012-08-30 2014-03-06 Crs4 S.R.L. Method for determining values of molecular properties
CN108256288A (zh) * 2018-01-18 2018-07-06 安徽工业大学 一种识别非晶合金中局域结构的方法
CN109778084A (zh) * 2019-02-26 2019-05-21 江苏集萃安泰创明先进能源材料研究院有限公司 一种利用熔体原子团簇构型和数量调控非晶态固体合金微观结构的方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014033670A2 (en) * 2012-08-30 2014-03-06 Crs4 S.R.L. Method for determining values of molecular properties
CN108256288A (zh) * 2018-01-18 2018-07-06 安徽工业大学 一种识别非晶合金中局域结构的方法
CN109778084A (zh) * 2019-02-26 2019-05-21 江苏集萃安泰创明先进能源材料研究院有限公司 一种利用熔体原子团簇构型和数量调控非晶态固体合金微观结构的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
向美珍等: "基于原子模型的非局域连续模型", 《中国科学:物理学 力学 天文学》 *
崔向军等: "DNA局域结构参数的统计分析", 《包头钢铁学院学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113674808A (zh) * 2021-08-18 2021-11-19 合肥工业大学 一种超稳态玻璃结构的制备方法
CN113674808B (zh) * 2021-08-18 2024-03-01 合肥工业大学 一种超稳态玻璃结构的制备方法

Also Published As

Publication number Publication date
CN111462832B (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
Yu et al. Scalable distributed processing of K nearest neighbor queries over moving objects
Ma et al. A highly accurate prediction algorithm for unknown web service QoS values
CN108427891B (zh) 基于差分隐私保护的邻域推荐方法
EP3588379A1 (en) Entropic clustering of objects
WO2020190326A1 (en) Determining causal models for controlling environments
CA2436352A1 (en) Process and system for developing a predictive model
Wang Application of grey relation analysis theory to choose high reliability of the network node
CN111462832B (zh) 一种无参数局域结构识别方法
CN111966495B (zh) 数据处理方法和装置
Yang et al. Research on Short‐Term Traffic Flow Prediction Method Based on Similarity Search of Time Series
CN108804391A (zh) 一种基于b样条的插值曲线或曲面的构造方法及系统
Qian et al. Grid-based Data Stream Clustering for Intrusion Detection.
Tanhaei et al. Algorithm for solving product mix problem in two-constraint resources environment
CN112418258A (zh) 一种特征离散化方法和装置
CN114239960A (zh) 基于资源动态优化的配网工程项目群进度管理方法及系统
CN112215655A (zh) 一种客户画像的标签管理方法及系统
Choi et al. Intelligent reconfigurable method of cloud computing resources for multimedia data delivery
Namadchian et al. DSCLU: a new Data Stream CLUstring algorithm for multi density environments
Katsamaki et al. Analytic solution and estimation of parameters on a stochastic exponential model for a technological diffusion process
Peng et al. Analysis of flight punctuality rate based on complex network
CN108304449B (zh) 基于自适应数据集划分方式的大数据Top-k查询方法
Tatarnikova et al. Algorithms for placing files in tiered storage using Kohonen map
CN113903016A (zh) 分岔点检测方法、装置、计算机设备和计算机程序产品
Kang et al. An enhanced algorithm for dynamic data release based on differential privacy
CN109446294B (zh) 一种并行的相互子空间Skyline查询方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant