CN111462832B - 一种无参数局域结构识别方法 - Google Patents
一种无参数局域结构识别方法 Download PDFInfo
- Publication number
- CN111462832B CN111462832B CN202010261050.0A CN202010261050A CN111462832B CN 111462832 B CN111462832 B CN 111462832B CN 202010261050 A CN202010261050 A CN 202010261050A CN 111462832 B CN111462832 B CN 111462832B
- Authority
- CN
- China
- Prior art keywords
- atom
- atoms
- neighbor
- central atom
- try
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/20—Identification of molecular entities, parts thereof or of chemical compositions
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
Landscapes
- Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明涉及图论领域,主要用于对物质的原子(分子)层次的微观结构分析、颗粒体系的组织结构分析和体系的基本结构单元在空间的分布特征分系,属于计算机在物质结构分析方面的应用。对于同一体系,不同的截断距离会得到不同的表征符号,导致结构分析结果的不唯一性。本发明公开了一种无参数局域结构识别方法,此方法基于拓扑判据实现无参数微观结构的分析,可以唯一确定以每个原子为中心的局域结构,以确保微观结构的表征符号与其空间构型的一一对应。本发明的分析方法可以根据物质本身的结构计算出适合该物质的截断距离,截断距离的计算不受物质类型、形态的影响。
Description
技术领域:
本发明涉及图论,典型应用是物质液态熔体、金属玻璃、胶体溶液、随机颗粒填充体系等复杂系统的静态微观结构分析,主要用于对物质的原子(分子)层次的微观结构分析、颗粒体系的组织结构分析或者体系的基本结构单元在空间的分布特征分析,属于计算机技术在物质结构分析领域的应用。
背景技术:
物质结构决定物质性质,对于物质结构的数学描述是研究物质性质的基础。
在群论等数学和材料理论的基础上,理想晶体材料的结构已能精确表征:3个晶族,7大晶系,14种布拉菲格子,32种点群和230空间群。但原子无规则分布的非晶态体系的结构描述一直是数学、物理学、材料科学的难题。
实验表明非晶态材料的原子并非数学上的随机分布,而是存在大量的局域有序结构。如图1所示,图中描述了三种不同的体系中以任意一个原子为中心找到其他原子的概率密度(对分布函数,PDF或g(r)),对于完全随机分布的粒子体系,g(r)函数的图像应该是一条取值为1的水平直线;对于理想晶体则是包含一些竖直线段的谱线结构。图1中的三条曲线都存在巨大的分布起伏,表明金属液体,金属玻璃和颗粒随机填充体系内,基本结构单元(原子、分子、颗粒)都不是数学上的随机分布,而是有微观结构的体系。
为了描述非晶态体系内的局域结构,人们尝试了许多方法。主要有Voronoi多面体分析法及其对偶Delaunay四面体分析法、Honeycutt和Andersen提出的键对分析法(HA-Pair)以及公用近邻分析法(common neighbors analysis,CNA)等几种方法。其中HA-Pair分析法和CNA都是以原子对及其公有近邻构成的局域结构为基础表征物质的结构特征。此类方法中,如果两个原子i和j的距离dij小于预先给定的截断距离rcut,即dij<rcut时,它们互为近邻,或它们之间成键(bond)。此类方法中的基本结构单元叫共有近邻子团簇(commonneighbor sub-cluster,CNS),如图2(a)所示,它是由图2(b)中一对称为参考原子对(reference pair,RP)的原子及图2(c)中其共有近邻(common near neighbors,CNNs)构成。此方法中使用形如“Sijk”的形式的CNS-index表征一个(种)CNS的结构,其中i表示在此CNS中CNN的数目,j表示i个CNNs之间的键的数目,k表示i个CNNs之间j根键构成的最长链的长度。例如图2(c)中5个CNN,构成3根键,其中最长的有2根键,则其结构可以用“S532”表征。但是这种方法中存在着一个问题:截断距离rcut越大,每个原子的近邻原子就越多,反之就越少;然而原子的近邻原子数目的不同,得到的局域结构就不一样。如图3所示,表征符号为S211的共有近邻子团簇只有一对参考原子对的共有近邻,但是随着rcut的增大,其共有近邻数目增加,并且共有近邻之间的连接关系也变得复杂,根据CNS-index的规定,此时该CNS的表征符号为S444(如图3(c)所示)。所以对于同一体系,使用不同的截断距离rcut会得到不同的结构及表征符号,因此导致结构分析结果依赖于预置的参数rcut的具体取值,不具备唯一性。
这种由于预置不同的截断距离rcut,导致结构分析结果的不确定性与自然科学的客观性相悖,因此版方法提出了一种不依赖任何预置参数并且能唯一确定以每个原子为中心的局域结构的分析方法。
发明内容:
为了解决由于预置不同的截断距离而导致结构分析结果不确定性的问题,本发明提出了一种唯一确定结构分析结果的分析方法——一种无参数局域结构识别方法,此方法基于欧几里得距离采用拓扑判据实现无参数微观结构的识别,可以唯一确定以每个原子为中心的局域结构,并确保微观结构的表征符号与其空间构型一一对应。通过本发明的局域结构识别方法可以对物质的结构进行唯一表征,奠定复杂无序的非晶态物质结构研究基础,解决“结构→性质”的基本科学难题,突破了物理学、材料科学等相关领域的研究瓶颈。
在本发明的分析方法中,为了确保CNS-index与拓扑构型间的一一对应,作以下规定:在共有近邻(common near neighbor,CNN)之间的连接关系中不容许出现多键点(multi-bond point,MBP)和共有近邻子环(common neighbor sub-ring,CNSR)。MBP是CNN之间连接关系(如图2(c)和图3所示)中3个或者3个以上的键汇聚的点,而CNSR是只包含部分CNN的子环,如图3(c)中的三角形。由于不包含MBP和CNSR的共有近邻子团簇(commonneighbor sub-cluster,CNS)能确保CNS-index与其拓扑构型之间的一一对应,故称这种CNS为标准CNS。以一个原子为中心,以截断距离rcut为半径,找到n个近邻,如果每个近邻与中心原子构成的CNS均为标准CNS,则这种含有中心的团簇结构称为标准团簇(standardcluster,SC),其拓扑结构可以由标准CNS的数目和类型来表征,如图4所示。图4中的标准团簇有11个近邻原子,其内有8种标准CNS,其拓扑结构可以用一个含有8个二元组的集合表征:[1-211,2-311,1-322,2-422,2-433,1-532,1-544,1-555]。
显然,以一个原子为中心可以找到多个SC。当rcut很小时,中心原子没有近邻原子,此时该团簇也满足SC的要求;当rcut增大至中心原子有1~4个近邻时,此时该团簇结构肯定是SC;但随着rcut增大,MBP和CNSR最终会出现,因此以一个原子为中心有且仅有一个最大的SC,称之为最大标准团簇(the largest standard cluster,LSC)。本发明中的分析方法对物质进行内部的结构分析时不需要预先设置一个准确的截断距离rcut,只需要设置一个试探性截断距离rtry,然后根据物质本身的结构计算出适合该物质的截断距离,截断距离的计算不受物质类型、形态的影响,该分析方法可以唯一确定以每个原子为中心的局域结构,对物质展开从短程,到中程,甚至长程结构特征的分析。
本发明的技术方案是:
一种无参数局域结构识别方法,包括以下步骤:
步骤一:计算中心原子的近邻原子,包括以下步骤:
(1)预先设置试探性截断距离rtry和有效计数器c=0;
(2)以确定的方式搜索附近原子,计算它们与当前选定的中心原子m之间的距离d,若d≤rtry,说明该原子与中心原子互为近邻,即该原子与中心原子m成键,则将该原子加入中心原子m的近邻原子列表中,否则该原子与中心原子m不为近邻原子;
(3)对中心原子的近邻原子列表中的近邻原子,按照其与中心原子之间距离的从近到远进行排序;
步骤二:确定中心原子所有近邻原子之间的成键关系,包括以下步骤:
计算中心原子m的所有近邻原子(假定有i个)之间的距离,若两近邻原子之间的距离为d’,如果d’≤rtry,说明这两个近邻原子互为近邻,即这两个共有近邻原子成键,否则这两个共有近邻原子不成键;
步骤三:构造以中心原子m为中心的最大标准团簇(the largest standardcluster,LSC),包括以下步骤:
(1)选定中心原子m的某一近邻原子,其编号为n,根据步骤二中近邻原子之间的成键关系,以原子对mn为根对原子构造其对应的共有近邻子团簇(common neighbor sub-cluster,CNS);
(2)判断以原子对mn为根对原子构造的CNS中是否有多键点(multi-bond point,MBP)和共有近邻子环(common neighbor sub-ring,CNSR);如果该CNS中包含MBP或者CNSR,则有效计数器执行增值操作c=c+1,执行步骤三(3);如果该CNS中不包含MBP和CNSR,则选择中心原子m的下一个近邻原子,返回至步骤三(1)重新执行;如果中心原子m的所有近邻原子均已被选择过,则直接执行步骤三(4);
(3)减少试探性截断距离rtry,返回至步骤一(1)开始重新执行;
(4)如果整个过程中执行步骤三(3)至少一次,即c≥1,则继续执行下一步(骤三(5));否则增大rtry,返回至步骤一(1)开始重新执行;
(5)此时的rtry即为中心原子m的临界截断距离,由此rtry确定的中心原子m及其近邻原子构成的团簇即为最大标准团簇,此团簇内的所有CNS均能赋予唯一的符号表征,该原子被赋予用高维矢量表征的多重属性。
相比于现有技术,本发明具有以下优势:
(1)本发明中的分析方法对物质进行内部的结构分析时不需要预先设置一个准确的截断距离rcut,只需要设置一个试探性截断距离rtry;以节省计算时间;分析方法根据物质本身的结构特征,计算出每个原子唯一的截断距离;
(2)本发明的分析结果赋予每个数据点丰富的属性,将每个属性看成高维矢量的一个维度,则本方法将无序数据集离散化,完成“数据点→矢量”的转化,并构建为节点具有属性的图,便于定量分析。
(3)本发明中的分析方法可以容易地扩展到其他领域,如根据收集到的人与人之间交往的数据定义好人与人之间的“距离”,即可计算第一近邻以及第一近邻之间的关系,对抽象复杂的人际关系展开定量研究。
附图说明:
图1(a)是金属液体的g(r)函数;
图1(b)是金属玻璃的g(r)函数;
图1(c)是随机填充颗粒体系的g(r)函数;
图2(a)是表征符号为S532的共有近邻子团簇;
图2(b)是S532的参考原子对;
图2(c)是S532的参考原子对的共有近邻;
图3是由于过大的截断距离rcut导致破坏的共有近邻子团簇的表征符号与拓扑构型的一一对应关系;
图4是一个以原子32323为中心的标准团簇;
图5是本发明的流程图。
具体实施方式:
下面结合附图和具体实施例对本发明进一步说明。
对于包含n个原子的体系,如果不采用任何加速方法,确定近邻关系,需要计算每个原子与所有其他原子的距离,总共计算复杂度为n(n-1)。但实际上,两个原子之间的距离只需要计算一次,便可确定这对原子互为近邻,或者互相不是近邻;则计算复杂度降低为n(n-1)/2。对于巨大的微观体系(如n为10的8次方以上),计算复杂度降低效果显著。但实施此策略时,按照某种算法,只有遍历所有原子之后才能确定每个原子的近邻列表,然后才能开始后续计算确定以每个原子为中心的局域结构,即确定所有原子的近邻是并行同步点,因此本发明的具体实施方式分成两个部分:(1)采用优化并行方法,计算每个原子的近邻列表;(2)以近邻原子列表为基础,确定以每个为中心的局域结构类型。
步骤一:计算中心原子的近邻原子,包括以下步骤:
(1)预先设置试探性截断距离rtry和有效计数器c=0;
(2)以某种搜索策略计算所有距离较近原子与当前选定的中心原子m之间的距离d,若d≤rtry,该原子与中心原子m成键,则将该原子加入中心原子m的近邻原子列表中,否则该原子与中心原子m不为近邻原子;
(3)对中心原子的近邻原子列表中的近邻原子,按照其与中心原子之间距离的远近从近到远进行排序;
步骤二:确定中心原子所有近邻原子之间的成键关系,包括以下步骤:
计算中心原子m的所有近邻原子(假定有i个)之间的距离,若两近邻原子之间的距离为d’,如果d’≤rtry,说明这两个近邻原子互为近邻,即这两个共有近邻原子成键,否则这两个共有近邻原子不成键;
步骤三:构造以中心原子m为中心的最大标准团簇(the largest standardcluster,LSC),包括以下步骤:
(1)选定中心原子m的某一近邻原子,其编号为n,根据步骤二中近邻原子之间的成键关系,以原子对mn为根对原子构造其对应的共有近邻子团簇(common neighbor sub-cluster,CNS);
(2)判断以原子对mn为根对原子构造的CNS中是否有多键点(multi-bond point,MBP)和共有近邻子环(common neighbor sub-ring,CNSR);如果该CNS中包含MBP或者CNSR,则有效计数器执行增值操作c=c+1,执行步骤三(3);如果该CNS中不包含MBP和CNSR,则选择中心原子m的下一个近邻原子,返回至步骤三(1)重新执行;如果中心原子m的所有近邻原子均已被选择过,则直接执行步骤三(4);
(3)减少试探性截断距离rtry,返回至步骤一(1)开始重新执行;
(4)如果整个过程中执行步骤三(3)至少一次,即c≥1,则继续执行下一步(骤三(5));否则增大rtry,返回至步骤一(1)开始重新执行;
(5)此时的rtry即为中心原子m的临界截断距离,由此rtry确定的中心原子m及其近邻原子构成的团簇即为最大标准团簇,此团簇内的所有CNS的表征符号均能逐一确定。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案,而非对本发明保护范围的限制。参照该实施例的说明,本领域的普通技术人员应该可以理解并对本发明的技术方案进行相关的修改或替换,而不脱离本发明的实质和范围。
Claims (1)
1.一种无参数局域结构识别方法,其特征在于,包含如下步骤:
步骤一:计算中心原子的近邻原子,包括以下步骤:
(1)预先设置试探性截断距离rtry和有效计数器c=0;
(2)以确定的方式搜索附近原子,计算它们与当前选定的中心原子m之间的距离d,
若d≤rtry,说明该原子与中心原子互为近邻,即该原子与中心原子m成键,则将该原子加入中心原子m的近邻原子列表中,否则该原子与中心原子m不为近邻原子;
(3)对中心原子的近邻原子列表中的近邻原子,按照其与中心原子之间距离的从近到远进行排序;
步骤二:确定中心原子所有近邻原子之间的成键关系,包括以下步骤:
计算中心原子m的所有近邻原子之间的距离,若两近邻原子之间的距离为d’,如果d’≤rtry,说明这两个近邻原子互为近邻,即这两个共有近邻原子成键,否则这两个共有近邻原子不成键;
步骤三:构造以中心原子m为中心的最大标准团簇LSC,包括以下步骤:
(1)选定中心原子m的某一近邻原子,其编号为n,根据步骤二中近邻原子之间的成键关系,以原子对mn为根对原子构造其对应的共有近邻子团簇CNS;
(2)判断以原子对mn为根对原子构造的CNS中是否有多键点MBP和共有近邻子环CNSR;如果该CNS中包含MBP或者CNSR,则有效计数器执行增值操作c=c+1,执行步骤三(3);如果该CNS中不包含MBP和CNSR,则选择中心原子m的下一个近邻原子,返回至步骤三(1)重新执行;如果中心原子m的所有近邻原子均已被选择过,则直接执行步骤三(4);
(3)减少试探性截断距离rtry,返回至步骤一(1)开始重新执行;
(4)如果整个过程中执行步骤三(3)至少一次,即c≥1,则继续执行步骤三(5);否则增大rtry,返回至步骤一(1)开始重新执行;
(5)此时的rtry即为中心原子m的临界截断距离,由此rtry确定的中心原子m及其近邻原子构成的团簇即为最大标准团簇,此团簇内的所有CNS均能赋予唯一的符号表征,该原子被赋予用高维矢量表征的多重属性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010261050.0A CN111462832B (zh) | 2020-04-03 | 2020-04-03 | 一种无参数局域结构识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010261050.0A CN111462832B (zh) | 2020-04-03 | 2020-04-03 | 一种无参数局域结构识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111462832A CN111462832A (zh) | 2020-07-28 |
CN111462832B true CN111462832B (zh) | 2022-04-12 |
Family
ID=71679710
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010261050.0A Active CN111462832B (zh) | 2020-04-03 | 2020-04-03 | 一种无参数局域结构识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111462832B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113674808B (zh) * | 2021-08-18 | 2024-03-01 | 合肥工业大学 | 一种超稳态玻璃结构的制备方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ITMI20121457A1 (it) * | 2012-08-30 | 2014-03-01 | Crs4 S R L | Metodo per determinare valori di proprieta' molecolari |
CN108256288B (zh) * | 2018-01-18 | 2022-02-08 | 安徽工业大学 | 一种识别非晶合金中局域结构的方法 |
CN109778084A (zh) * | 2019-02-26 | 2019-05-21 | 江苏集萃安泰创明先进能源材料研究院有限公司 | 一种利用熔体原子团簇构型和数量调控非晶态固体合金微观结构的方法 |
-
2020
- 2020-04-03 CN CN202010261050.0A patent/CN111462832B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN111462832A (zh) | 2020-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yu et al. | Scalable distributed processing of K nearest neighbor queries over moving objects | |
EP3938969A1 (en) | Determining causal models for controlling environments | |
CA2436352A1 (en) | Process and system for developing a predictive model | |
CN111462832B (zh) | 一种无参数局域结构识别方法 | |
Wang | Application of grey relation analysis theory to choose high reliability of the network node | |
CN111966495B (zh) | 数据处理方法和装置 | |
CN112288163A (zh) | 目标对象的目标因子预测方法及相关设备 | |
WO2020188340A1 (en) | Tuning pid parameters using causal models | |
Yoo et al. | Sampling subgraphs with guaranteed treewidth for accurate and efficient graphical inference | |
Wang et al. | A density-based clustering structure mining algorithm for data streams | |
CN112418258A (zh) | 一种特征离散化方法和装置 | |
CN117556557A (zh) | 一种复杂几何体无网格自适应离散方法和系统 | |
CN112215655A (zh) | 一种客户画像的标签管理方法及系统 | |
Choi et al. | Intelligent reconfigurable method of cloud computing resources for multimedia data delivery | |
Namadchian et al. | DSCLU: a new Data Stream CLUstring algorithm for multi density environments | |
Li et al. | A weighted fuzzy c-means clustering algorithm for incomplete big sensor data | |
Peng et al. | Analysis of flight punctuality rate based on complex network | |
Tatarnikova et al. | Algorithms for placing files in tiered storage using Kohonen map | |
CN108304449B (zh) | 基于自适应数据集划分方式的大数据Top-k查询方法 | |
Kang et al. | An enhanced algorithm for dynamic data release based on differential privacy | |
Xu et al. | Reducing synchronization overhead with computation replication in parallel agent-based road traffic simulation | |
CN109446294B (zh) | 一种并行的相互子空间Skyline查询方法 | |
Watanabe et al. | A proposal on a decomposition-based evolutionary multiobjective optimization for large scale vehicle routing problems | |
Amarif et al. | The Implicit Path Cost Optimization In Dijkstra Algorithm Using Hash Map Data Structure | |
Bi et al. | Adaptive type-2 fuzzy traffic signal control with on-line optimization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |