CN109034262A - 一种x射线定向仪缺陷识别的批量处理方法 - Google Patents

一种x射线定向仪缺陷识别的批量处理方法 Download PDF

Info

Publication number
CN109034262A
CN109034262A CN201810915378.2A CN201810915378A CN109034262A CN 109034262 A CN109034262 A CN 109034262A CN 201810915378 A CN201810915378 A CN 201810915378A CN 109034262 A CN109034262 A CN 109034262A
Authority
CN
China
Prior art keywords
peak
curve
angle
data
cluster centre
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810915378.2A
Other languages
English (en)
Other versions
CN109034262B (zh
Inventor
关守平
王玉勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Northeastern University China
Original Assignee
Northeastern University China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Northeastern University China filed Critical Northeastern University China
Priority to CN201810915378.2A priority Critical patent/CN109034262B/zh
Publication of CN109034262A publication Critical patent/CN109034262A/zh
Application granted granted Critical
Publication of CN109034262B publication Critical patent/CN109034262B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N23/00Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00
    • G01N23/20Investigating or analysing materials by the use of wave or particle radiation, e.g. X-rays or neutrons, not covered by groups G01N3/00 – G01N17/00, G01N21/00 or G01N22/00 by using diffraction of the radiation by the materials, e.g. for investigating crystal structure; by using scattering of the radiation by the materials, e.g. for investigating non-crystalline materials; by using reflection of the radiation by the materials

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本发明提出一种X射线定向仪缺陷识别的批量处理方法,属于单晶材料加工领域,提出了离线批量式单晶晶体缺陷检测方法,设计了单晶晶体回摆曲线的特征向量,以抽象出曲线特征,结合粒子群优化算法,并引入基于密度函数的有效半径,改进了传统FCM算法,提升算法对于初始化聚类中心的鲁棒性,避免陷入局部极优,并很好地过滤干扰数据,从而实现对批量数据进行聚类,之后仅需对聚类中心特征向量进行缺陷检测,根据隶属度关系即可得到所有待测曲线的缺陷类型,其中包含了本发明提出的改进的模糊传递闭包聚类算法,定义模糊相似矩阵,保证了相似计算的准确性,本发明为晶体检测技术提供了全新的思路和实现方式。

Description

一种X射线定向仪缺陷识别的批量处理方法
技术领域
本发明属于单晶材料加工领域,具体涉及一种X射线定向仪缺陷识别的批量处理方法。
背景技术
在晶体生长过程中,不可避免的问题就是晶体缺陷,因其技术固有的局限性会导致存在非理想的晶体结构。工业上,高精度、高效率的X射线衍射技术是常用的晶体缺陷无损检测手段,通过单晶晶体对X射线产生衍射,接收衍射信号得到对应特征曲线,即回摆曲线,基于回摆曲线特征即可分析待测晶体的品质特征。
目前,基于上述技术用于单晶晶体缺陷检测的X射线定向仪自动化水平欠缺,质量参差不齐,呈现“一人一机一库一片”的现象。仪器需人工参与,且无法高效、准确、智能地识别单晶晶体的缺陷类型;各单晶晶体检测数据相互独立,各仪器仅为“信息孤岛”,无法相互借鉴、相互学习,不能更新、共享样本库;一次仅能进行一片单晶晶体的检测工作,无法对来自其他仪器的待识别回摆曲线数据进行识别检测,无法离线对批量回摆曲线进行快速检测。随着单晶晶体材料的发展,应用面越来越广,对于单晶晶体材料品质的高效快速的检测技术需求日益迫切。
针对上述问题,本发明提出了一种X射线定向仪缺陷识别的批量处理方法,根据已经测量得到的大量单晶材料回摆曲线,以批量的形式进行缺陷类型识别,实现了单晶材料的快速自动缺陷识别,为X射线定向仪的应用提供了新的功能。
模糊划分的概念最早由著名学者Ruspini提出,随后由Kim等学者提出基于模糊等价关系的模糊聚类方法。该方法的基本思想为:由于模糊等价矩阵R*是论域集U与自己的直积U×U上的一个模糊子集,其具有对称性和自反性,因此可以对R*进行分解,选用某一确定的阈值λ∈[0,1]作R*的截集,截得的普通子集就是U上的一个普通等价关系。目前对于模糊等价矩阵的求取,使用最广泛的方法是通过模糊相似矩阵R,并采用传递闭包方法求取模糊等价矩阵R*,其中常用的求取模糊相似矩阵R的方法有相似系数法和距离法。在本发明的应用中,传统的模糊传递闭包聚类算法不满足需要,主要体现在如下两个方面:(1)现有的模糊相似矩阵计算方法计算得到的数值与实际曲线相似度偏差较大;(2)现有的计算方法在计算相似度时,人眼直观不相似的两条曲线仍有一定的相似度。本发明将设计一种新的模糊相似矩阵的计算方法进行相应改进。
模糊聚类是一种采用模糊数学语言对事物按一定的要求进行描述和分类的数学方法。Fuzzy c-means(FCM)算法是一种基于目标函数的模糊聚类算法,其基本思想是以KCM算法为根据,并引入模糊集的理念,从硬划分转变为软划分。FCM算法根据极小值条件计算出聚类中心和隶属度矩阵的迭代公式,通过迭代计算得到使目标函数达到最小值的聚类中心和隶属度矩阵,从而得到数据集的精确分类。FCM算法存在如下两方面的不足:(1)FCM算法的初始聚类中心较差时,系统容易陷入局部最优;(2)FCM算法对所有的异常数据无能为力,所有异常数据均被分类。本发明将对传统FCM算法进行改进并应用。该方法识别效率高,识别准确,能够甄别异常数据,鲁棒性好,为批量待测单晶晶体缺陷检测的实现提供了一种有效的方法。
发明内容
本发明的目的在于针对现阶段X射线定向仪存在的不足以及市场对于离线批量检测技术的需求,提出一种X射线定向仪缺陷识别的批量处理方法,包括如下步骤:
步骤1:建立样本库,包括单晶晶体标准的和每种缺陷类型的标准回摆曲线数据样本,提取该样本中每条回摆曲线的特征向量,并保存样本每条回摆曲线的特征向量,作为样本库;
步骤2:批量选取n个待测单晶晶体回摆曲线数据,对待测单晶晶体回摆曲线数据提取特征向量,用于表述曲线特征;
步骤3:进行参数初始化,所述参数设置包括:聚类数目c及初始聚类中心V0,V0为迭代初始值,迭代停止阈值ε,最大迭代次数B,当前迭代次数b,初始化粒子位置PX0和速度PV0,设粒子的位置表示为PX=[PX1,…,PXPm]T,具体为PXp=[pxp1,…,pxpc]c×m,p∈[1,Pm],粒子的速度表示为PV=[PV1,…,PVPm]T,具体为PVp=[pvp1,…,pvpc]c×m,p∈[1,Pm],当前迭代中使得目标函数值最小时的个体最优PXpbest,群体最优PXgbest;Pm粒子群数量,m指特征向量维度;
步骤4:使用改进的FCM聚类算法对所有特征向量进行聚类,得到聚类中心,以及所有特征向量对各聚类中心的隶属度矩阵;其中,改进的FCM聚类算法引入粒子群优化算法,进行迭代,得到优化后的聚类中心,以及所有特征向量与各聚类中心的隶属度矩阵;
步骤5:计算有效半径VR=(VRk)c*1,根据数据聚类的判断准则,筛除异常数据;VRk为第k个聚类中心的有效半径,定义为如下公式:
其中,n样本总数,c为聚类数目,其数值上与样本库样本总数相等,(VRk)c×1指VRk为c×1维的向量,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离,c1表示密度影响率,c2表示对异常数据的判断的严格程度,其中,ρk为密度函数,定义第k个聚类中心Vk的密度函数ρk为如下公式:
其中,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离;uik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度,公式如下,其中,s为模糊指数,在实际应用中,其最佳取值范围为s∈(1.5,2.5),本发明取s=2;
其中,Xi第i待测单晶晶体回摆曲线数据,Vk第k个聚类中心的隶属度,t≠k,指一种特殊情况,如果一条曲线和聚类中心距离为0则隶属度为1,那么和除了这条曲线t不等于k的中心的隶属度为0;
对数据聚类的判断准则如下:
且h≠k,满足dik≤VRk且uik≥uih,k≠h时,则第i个数据归属于第k类;
满足dik≥VRk时,此时第i个数据属于异常数据;
步骤6:使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别,进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度;其中,改进的模糊传递闭包聚类算法改进了模糊相似矩阵,定义模糊相似矩阵为R=(rab),其中
其中,rab为相似度,m为特征向量维度,x0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准,即任何单晶材料曲线与其相似度均为0;xaj和xbj分别为第a个和第b个单晶晶体回摆曲线数据第j个特征,valueab为批量选取第a条单晶晶体回摆曲线数据特征向量和第b条样本的特征向量的欧氏距离,和该向量与零标准曲线的特征向量欧氏距离的相对值,β为经验参数。
步骤1和步骤2中所述回摆曲线数据提取特征为Pattern=[Pattern1;Pattern2],其中Pattern1为主峰基本模式特征向量,表示主峰的参数,体现晶体的特性及主峰形状;Pattern2为峰形基本特征向量,表示从峰的数量、位置及曲线对称性,体现整体峰形轮廓。
定义Angle为衍射角度的集合,anglei为第i个衍射角度;定义Peak为X射线衍射强度的集合,peaki为anglei所对应的X射线衍射强度,peaki*为归一化之后的衍射强度值;定义Scan为扫描范围,表示仪器在测量时扫描过的X射线衍射角度,单位为角度秒;定义Std_angle为标准衍射角度,表示理论上该晶体达到max(peaki)对应的角度;定义Main_angle为主峰角度,表示实际测量中该晶体达到max(peaki)对应的角度,其中,max(peaki)为X射线衍射强度的最大值。
所述Pattern1指代:Pattern1=[Max_peak;Main_dif;Backgr_value;FWHM],其中,Max_peak表示X射线衍射强度最大值;Main_dif表示主峰角度Main_angle与标准衍射角度Std_angle之间的差值;Backgr_value表示X射线衍射强度的背底值;FWHM表示峰形的半峰宽度。
所述Pattern2指代,Pattern2=[Slave_num;Angle_dif;Slave_peak;Sym],其中,Slave_num表示左右从峰的数量;Angle_dif表示从峰角度Slave_angle与主峰角度Main_angle之间的差值,若没有从峰则Angle_dif为零向量;Slave_peak表示各从峰峰值,分别从最左边的从峰向最右边的从峰依次排列并用逗号隔开,若没有从峰则Slave_peak为零向量;Sym为峰形对称度,表示晶体结构曲线的对称情况,公式如下:
Sym=e (6)
其中,
其中,Main_num表示最大峰值时的衍射角度的对应下标,g=min(Main_num-1,sum-Main_num)表示Main_num-1与sum-Main_num的最小值,sum为衍射曲线采样点总数。
步骤4中所述改进的FCM算法,引入粒子群优化算法,具体步骤如下:
步骤4.1:将待测单晶晶体回摆曲线数据以及按照步骤2中对每条回摆曲线提取的特征,建立原始数据矩阵;
X=[X1,X2,…,Xn]T(Xi=[xi1,…,xij,…,xim]) (8)
其中,X1,X2,…,Xn为待测单晶晶体回摆曲线数据,第i待测单晶晶体回摆曲线数据Xi又包括m个指标表示提取特征,n样本总数;
得到原始数据矩阵为:
其中,xnm表示第n个批量选择待测曲线的第m个指标的原始数据(m为特征向量维度);
步骤4.2:计算样本Xi与聚类中心Vk的欧氏距离Db=(dik)n×c,c表示聚类中心数目;其中,第一次迭代时,将V取初始聚类中心V0(即X矩阵中的任意c个向量构成V0):
步骤4.3根据FCM算法的目标函数:
步骤4.4、计算粒子群每个粒子的适应度,即每个粒子所代表的可行解对应的目标函数值,比较迭代过程中,每个粒子的在迭代过程中个体最优目标函数值对应的解和当前迭代中群体最优目标函数值对应的解即PXpbest、PXgbest,并令Vb=PXgbest并更新隶属度矩阵;
步骤4.5、计算下一代粒子的位置和速度,表示粒子p在第b次迭代过程中的速度;表示粒子p在第b次迭代过程中的位置;惯性权重ω表示粒子群优化算法的搜索能力;c1、c2分别是个体极值点和全局极值点的学习因子,r1和r2分别是0到1的随机数,i=1,2…,Pm,Pm是粒子总数:
步骤4.6:判断||Vb-Vb-1||≤ε或者是否达到最大迭代次数B,则停止迭代,记录聚类中心Vb以及隶属度矩阵Ub,否则b=b+1,转到步骤4.2。
步骤6中所述的改进的模糊传递闭包聚类算法,具体步骤包括步骤6.1~步骤6.4:
步骤6.1:由批量选取待测单晶晶体回摆曲线数据的聚类中心矩阵与知识库样本曲线模式特征组成的聚类原始数据矩阵为X=[X1,X2,…,X2*c]T,并按照下式进行归一化处理,其中,知识库样本曲线包括c种标准曲线,c为样本库样本总数(数值上也等于待测曲线数据聚类中心数目),Xi表示(i=1,2,…,2*c)第i条曲线的模式特征向量,Xi=[xi1,…,xij,…,xim],xij表示第i条曲线的第j个模式特征,对原始数据矩阵使用下式建立标准数据矩阵
步骤6.2、改进的指数距离法计算模糊相似矩阵,得到模糊相似矩阵为R=(rab)(2*c)×(2*c),如公式(4)与公式(5)所示;
步骤6.3:当前建立的相似关系不满足传递性,因而不是模糊等价关系,本发明采用平方法求传递闭包,再用传递闭包求取模糊等价矩阵R*,即
时,
式中,n’为R自积的次数,R的内积公式如下式所示:
步骤6.4:若则对应Xa,Xb归为一类;若即a=1时的实测曲线聚类中心,则认为该单晶材料属于第b类样本。
有益技术效果:
现有的技术相比,本发明提出一种X射线定向仪缺陷识别的批量处理方法,其有益技术效果为:
1,设计了单晶晶体回摆曲线的特征向量,以抽象出曲线特征,结合粒子群优化算法并引入有效半径思想改进了传统FCM算法,提升了算法对于初始化聚类中心的鲁棒性,避免陷入局部极优;
2,基于密度函数的有效半径很好地过滤干扰数据,从而实现对批量数据进行聚类;
3,仅需对聚类中心特征向量进行缺陷检测,根据隶属度关系即可得到所有待测曲线的缺陷类型,其中包含了本发明提出的改进模糊相似系数计算方法,保证了相似计算的准确性,本发明为晶体检测技术提供了全新的思路和实现方式;
4,改进的模糊传递闭包聚类算法,定义模糊相似矩阵,使其非常适用X射线定向仪缺陷识别的批量处理方法,可以对不同单晶晶体预设定不同经验参数,使其具有通用性;
5,该方法识别效率高,识别准确,能够甄别异常数据,鲁棒性好,为批量待测单晶晶体缺陷检测的实现提供了一种有效的方法。
附图说明
图1本发明实施例的X射线定向仪缺陷识别的批量处理方法整体流程图;
图2本发明实施例的改进的FCM算法流程图;
图3本发明实施例的改进的模糊传递闭包聚类算法流程图;
图4本发明实施例的标准蓝宝石晶体回摆曲线;
图5本发明实施例的蓝宝石晶体刃型位错回摆曲线;
图6本发明实施例的蓝宝石晶体螺旋位错回摆曲线;
图7本发明实施例的蓝宝石刃型位错回摆曲线特征定义示意图;
图8本发明实施例的零标准曲线数据示意图;
图9本发明实施例的标准蓝宝石晶体回摆曲线与样本库匹配结果图;
图10本发明实施例的异常测试回摆曲线与样本库匹配结果图。
具体实施方式:
结合附图详细说明一种X射线定向仪缺陷识别的批量处理方法的技术方案,具体步骤如整体流程图1所示:
步骤1:建立样本库,包括待测单晶晶体标准的和每种缺陷类型的回摆曲线数据样本,提取该样本中每条回摆曲线的特征向量,并保存样本每条回摆曲线的特征向量,作为样本库;
本申请以蓝宝石为例,给出对应标准晶体、刃型位错和螺旋位错的晶体3种样本知识库,对应图4,图5,图6所示,计算特征向量下表所示,其中特征向量变量定义如图7所示:
表1模式特征向量
步骤2:选取n=490条蓝宝石回摆曲线数据,对每条蓝宝石回摆曲线数据提取特征向量,用于表述曲线特征;
步骤3:进行参数初始化,所述参数设置包括:聚类数目c=3,即3种样本库中样本,及初始聚类中心V0取任意三个回摆曲线特征向量构成矩阵,迭代停止阈值ε=0.001,最大迭代次数B=20,当前迭代次数b=0,初始化粒子位置Xi和速度Vi,设粒子i的位置表示为PX=[PX1,…,PXPm]T,具体为PXp=[pxp1,…,pxpc]c×m,p∈[1,Pm],粒子i的速度表示为PV=[PV1,…,PVPm]T,具体为PVp=[pvp1,…,pvpc]c×m,p∈[1,Pm],个体最优Xpbest,群体最优Xgbest;设置粒子群数量Pm=30,令Vb=PXgbest
步骤4:使用改进的FCM聚类算法对所有特征向量进行聚类,如图2所示,得到聚类中心,以及所有特征向量对各聚类中心的隶属度矩阵;其中,改进的FCM聚类算法引入粒子群优化算法,并进行迭代,得到优化后的聚类中心,以及所有特征向量与各聚类中心的隶属度矩阵;
步骤4.1:将待测单晶晶体回摆曲线数据以及按照步骤2中对每条回摆曲线提取的特征,建立原始数据矩阵;
X=[X1,X2,…,Xn]T(Xi=[xi1,…,xij,…,xim]) (8)
其中,X1,X2,…,Xn为待测单晶晶体回摆曲线数据,第i待测单晶晶体回摆曲线数据Xi又包括m个指标表示提取特征,n样本总数为490;
得到原始数据矩阵为:
其中,xnm表示第n个批量选择待测曲线的第m个指标的原始数据(m为特征向量维度);
步骤4.2:计算样本Xi与聚类中心Vk的欧氏距离Db=(dik)490×3,c表示聚类中心数目:
步骤4.3:根据FCM算法的目标函数:
步骤4.4:计算粒子群每个粒子的适应度,即每个粒子所代表的可行解对应的目标函数值,比较迭代过程中每个粒子的在迭代过程中个体最优目标函数值对应的解和当前迭代中群体最优目标函数值对应的解即PXpbest、PXgbest,并令Vb=PXgbest并更新隶属度矩阵;
步骤4.5:计算下一代粒子的位置和速度,表示粒子p在第b次迭代过程中的速度;表示粒子p在第b次迭代过程中的位置;惯性权重ω表示粒子群优化算法的搜索能力;c1、c2分别是个体极值点和全局极值点的学习因子,r1和r2是0到1的随机数,i=1,2…,Pm,Pm是粒子总数:
步骤4.6:判断||Vb-Vb-1||≤ε,ε=0.001或者是否达到最大迭代次数B=20,则停止迭代,记录聚类中心Vb以及隶属度矩阵Ub,否则b=b+1,转到步骤4.2。
得到模糊隶属度矩阵U*及此时的聚类中心V*。
步骤5:计算有效半径VR=(VRk)3×1,根据数据聚类的判断准则,筛除异常数据;VRk为第k个聚类中心的有效半径,定义为如下公式:
其中,n样本总数为490,c为聚类数目为3,(VRk)3×1指VRk为c×1维的向量,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离,c1表示密度影响率,c2表示对异常数据的判断的严格程度,当c1越小,表示对密度的依赖性越大。根据实验经验一般取c2表示对异常数据的判断的严格程度。c2越小,表示对异常数据的判断越严格。根据实验经验一般取c2∈[1,5]。特殊情况,当c2=1时,有效半径rk则为dik的标准差;当c2=3时,有效半径rk则为针对dik的PauTa准则;
其中,ρk为密度函数,定义第k个聚类中心Vk的密度函数ρk为如下公式:
其中,由公式(2)可知ρk∈(0,1),dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离;uik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度,公式如下,其中,s为模糊指数,在实际应用中,其最佳取值范围为s∈(1.5,2.5),本发明取s=2;
其中,Xi第i待测单晶晶体回摆曲线数据,Vk第k个聚类中心的隶属度,t≠k,指一种特殊情况,如果一条曲线和聚类中心距离为0则隶属度为1,那么和除了这条曲线t不等于k的中心的隶属度为0;
对数据聚类的判断准则如下:
且h≠k,满足dik≤VRk且uik≥uih,k≠h时,则第i个数据归属于第k类;
满足dik≥VRk时,此时第i个数据属于异常数据;
本发明取c1=1,c2=3计算有效半径并筛选异常数据:
VR=(VRk)3×1=[0.82 0.81 0.81]
步骤6:使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别,进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度;其中,改进的模糊传递闭包聚类算法改进了模糊相似矩阵,定义模糊相似矩阵为R=(rab)6*6,其中
其中,rab为相似度,m为特征向量维度,x0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准,即任何单晶材料曲线与其相似度均为0,如图8所示;xaj和xbj分别为矩阵中第a个和第b个单晶晶体回摆曲线数据第j个特征,valueab为第a条聚类中心特征向量和第b条样本的特征向量的欧氏距离,和该向量与零标准曲线的特征向量欧氏距离的相对值,β为经验参数,根据不同晶体类型进行选择,本发明选取β=0.37。
步骤6中所述的改进的模糊传递闭包聚类算法,具体步骤包括步骤6.1~步骤6.4,如图3所示:
步骤6.1:由聚类中心曲线数据与知识库样本曲线模式特征组成的聚类原始数据矩阵为X=[X1,X2,…,X6]T,并按照下式进行归一化处理,其中,知识库样本曲线包括c种标准曲线,c为样本库样本总数为3,Xi表示(i=1,2,…,6)第i条曲线的模式特征向量,Xi=[xi1,…,xij,…,xim],xij表示第i条曲线的第j个模式特征,对原始数据矩阵使用下式建立标准数据矩阵
为聚类中心V和样本;
步骤6.2:改进的指数距离法计算模糊相似矩阵,得到模糊相似矩阵为R=(rab)6*6,如公式(4)与公式(5)所示;
步骤6.3:当前建立的相似关系不满足传递性,因而不是模糊等价关系,本发明采用平方法求传递闭包,再用传递闭包求取模糊等价矩阵R*,即:
时,
式中,n’为R自积的次数,R的内积公式如下式所示:
步骤6.4:若则对应Xa,Xb归为一类;若即a=1时的实测曲线,
本发明λ=0.5;
由模糊传递闭包聚类算法得出模糊等价矩阵:
即,属于V1聚类中心的数据属于标准蓝宝石晶体;属于V2聚类中心的数据属于蓝宝石刃型位错;属于V3聚类中心的数据属于蓝宝石螺旋位错。
取某标准蓝宝石晶体与某异常数据验证算法可靠性。图9、图10为两条测试曲线的匹配结果图,图9实线为测试曲线,为隶属于V1类的某曲线,属于标准晶体,经计算其相似度为0.78;图10实线为测试曲线,为某异常数据的曲线图,经计算其相似度为0.42,经FCM算法聚类其隶属于V1类,亦属于标准晶体,但经有效半径算法筛除后,认定其为异常数据。
从实验检测结果来看:本发明所述方法识别效率高,识别准确,能够甄别异常数据,鲁棒性好,为批量待测单晶晶体缺陷检测的实现提供了一种有效的方法。

Claims (4)

1.一种X射线定向仪缺陷识别的批量处理方法,其特征在于包括如下步骤:
步骤1:建立样本库,包括单晶晶体标准的和每种缺陷类型的标准回摆曲线数据样本,提取该样本中每条回摆曲线的特征向量,并保存样本每条回摆曲线的特征向量,作为样本库;
步骤2:批量选取n个待测单晶晶体回摆曲线数据,对待测单晶晶体回摆曲线数据提取特征向量,用于表述曲线特征;
步骤3:进行参数初始化,所述参数设置包括:聚类数目c及初始聚类中心V0,V0为迭代初始值,迭代停止阈值ε,最大迭代次数B,当前迭代次数b,初始化粒子位置PX0和速度PV0,设粒子的位置表示为PX=[PX1,…,PXPm]T,具体为PXp=[pxp1,…,pxpc]c×m,p∈[1,Pm],粒子的速度表示为PV=[PV1,…,PVPm]T,具体为PVp=[pvp1,…,pvpc]c×m,p∈[1,Pm],当前迭代中使得目标函数值最小时的个体最优PXpbest,群体最优PXgbest;Pm粒子群数量,m指特征向量维度;
步骤4:使用改进的FCM聚类算法对所有特征向量进行聚类,得到聚类中心,以及所有特征向量对各聚类中心的隶属度矩阵;其中,改进的FCM聚类算法引入粒子群优化算法,进行迭代,得到优化后的聚类中心,以及所有特征向量与各聚类中心的隶属度矩阵;
步骤5:计算有效半径VR=(VRk)c×1,根据数据聚类的判断准则,筛除异常数据;VRk为第k个聚类中心的有效半径,定义为如下公式:
其中,n样本总数,c为聚类数目,其数值上与样本库样本总数相等,(VRk)c×1指VRk为c×1维的向量,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离,c1表示密度影响率,c2表示对异常数据的判断的严格程度,其中,ρk为密度函数,定义第k个聚类中心Vk的密度函数ρk为如下公式:
其中,dik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离;uik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度,公式如下,其中,s为模糊指数;
其中,Xi第i待测单晶晶体回摆曲线数据,Vk第k个聚类中心的隶属度,t≠k,指一种特殊情况,如果一条曲线和聚类中心距离为0则隶属度为1,那么和除了这条曲线t不等于k的中心的隶属度为0;
对数据聚类的判断准则如下:
且h≠k,满足dik≤VRk且uik≥uih,k≠h时,则第i个数据归属于第k类;
满足dik≥VRk时,此时第i个数据属于异常数据;
步骤6:使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别,进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度;其中,改进的模糊传递闭包聚类算法改进了模糊相似矩阵,定义模糊相似矩阵为R=(rab),其中:
其中,rab为相似度,m为特征向量维度,x0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准,即任何单晶材料曲线与其相似度均为0;xaj和xbj分别为第a个和第b个单晶晶体回摆曲线数据第j个特征,valueab为批量选取第a条和第b条回摆曲线数据特征向量的欧氏距离,和该向量与零标准曲线的特征向量欧氏距离的相对值,β为经验参数。
2.根据权利要求1所述一种X射线定向仪缺陷识别的批量处理方法,其特征在于,步骤1和步骤2中所述回摆曲线数据提取特征为Pattern=[Pattern1;Pattern2],其中Pattern1为主峰基本模式特征向量,表示主峰的参数,体现晶体的特性及主峰形状;Pattern2为峰形基本特征向量,表示从峰的数量、位置及曲线对称性,体现整体峰形轮廓;
定义Angle为衍射角度的集合,anglei为第i个衍射角度;定义Peak为X射线衍射强度的集合,peaki为anglei所对应的X射线衍射强度,peaki*为归一化之后的衍射强度值;定义Scan为扫描范围,表示仪器在测量时扫描过的X射线衍射角度,单位为角度秒;定义Std_angle为标准衍射角度,表示理论上该晶体达到max(peaki)对应的角度;定义Main_angle为主峰角度,表示实际测量中该晶体达到max(peaki)对应的角度,其中,max(peaki)为X射线衍射强度的最大值;
所述Pattern1指代:Pattern1=[Max_peak;Main_dif;Backgr_value;FWHM],其中,Max_peak表示X射线衍射强度最大值;Main_dif表示主峰角度Main_angle与标准衍射角度Std_angle之间的差值;Backgr_value表示X射线衍射强度的背底值;FWHM表示个峰形的半峰宽度;
所述Pattern2指代,Pattern2=[Slave_num;Angle_dif;Slave_peak;Sym],其中,Slave_num表示左右从峰的数量;Angle_dif表示从峰角度Slave_angle与主峰角度Main_angle之间的差值,若没有从峰则Angle_dif为零向量;Slave_peak表示各从峰峰值,分别从最左边的从峰向最右边的从峰依次排列并用逗号隔开,若没有从峰则Slave_peak为零向量;Sym为峰形对称度,表示晶体结构曲线的对称情况,公式如下:
Sym=e (6)
其中,
其中,表示最大峰值时的衍射角度的对应下标,g=min(Main_num-1,sum-Main_num)表示Main_num-1与sum-Main_num的最小值,sum为衍射曲线采样点总数。
3.根据权利要求1所述一种X射线定向仪缺陷识别的批量处理方法,其特征在于,步骤4中所述改进的FCM算法,引入粒子群优化算法,具体步骤如下:
步骤4.1:将待测单晶晶体回摆曲线数据以及按照步骤2中对每条回摆曲线提取的特征,建立原始数据矩阵;
X=[X1,X2,…,Xn]T(Xi=[xi1,…,xij,…,xim]) (8)
其中,X1,X2,…,Xn为待测单晶晶体回摆曲线数据,第i待测单晶晶体回摆曲线数据Xi又包括m个指标表示提取特征,n样本总数;
得到原始数据矩阵为:
其中,xnm表示第n个批量选择待测曲线的第m个指标的原始数据(m为特征向量维度);
步骤4.2:计算样本Xi与聚类中心Vk的欧氏距离Db=(dik)n×c,c表示聚类中心数目;第一次迭代时,将V取初始聚类中心V0(即X矩阵中的任意c个向量构成V0):
步骤4.3:定义FCM算法的目标函数:
步骤4.4:计算粒子群每个粒子的适应度,即每个粒子所代表的可行解对应的目标函数值,比较迭代过程中,每个粒子的在迭代过程中个体最优目标函数值对应的解和当前迭代中群体最优目标函数值对应的解即PXpbest、PXgbest,并令Vb=PXgbest并更新隶属度矩阵;
步骤4.5:计算下一代粒子的位置和速度,表示粒子p在第b次迭代过程中的速度;表示粒子p在第b次迭代过程中的位置;惯性权重ω表示粒子群优化算法的搜索能力;c1、c2分别是个体极值点和全局极值点的学习因子,r1和r2分别是0到1的随机数,i=1,2…,Pm,Pm是粒子总数:
步骤4.6:判断||Vb-Vb-1||≤ε或者是否达到最大迭代次数B,则停止迭代,记录聚类中心Vb以及隶属度矩阵Ub,否则b=b+1,转到步骤4.2。
4.根据权利要求1所述一种X射线定向仪缺陷识别的批量处理方法,其特征在于,步骤6中所述的改进的模糊传递闭包聚类算法,具体步骤包括步骤6.1~步骤6.4:
步骤6.1:由批量选取待测单晶晶体回摆曲线数据的聚类中心矩阵与知识库样本曲线模式特征组成的聚类原始数据矩阵为X=[X1,X2,…,X2c]T,并按照下式进行归一化处理,其中,知识库样本曲线包括c种标准曲线,c为样本库样本总数,数值上也等于待测曲线数据聚类中心数目,Xi表示(i=1,2,…,2c)第i条曲线的模式特征向量,Xi=[xi1,…,xij,…,xim],xij表示第i条曲线的第j个模式特征,对原始数据矩阵使用下式建立标准数据矩阵
步骤6.2:改进的指数距离法计算模糊相似矩阵,得到模糊相似矩阵为R=(rab)(2c)×(2c),如公式(4)与公式(5)所示;
步骤6.3:当前建立的相似关系不满足传递性,因而不是模糊等价关系,本发明采用平方法求传递闭包,再用传递闭包求取模糊等价矩阵R*,即
式中,n’为R自积的次数,R的内积公式如下式所示:
步骤6.4:若则对应Xa,Xb归为一类;若即a=1时的实测曲线聚类中心,则认为该单晶材料属于第b类样本。
CN201810915378.2A 2018-08-13 2018-08-13 一种x射线定向仪缺陷识别的批量处理方法 Active CN109034262B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810915378.2A CN109034262B (zh) 2018-08-13 2018-08-13 一种x射线定向仪缺陷识别的批量处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810915378.2A CN109034262B (zh) 2018-08-13 2018-08-13 一种x射线定向仪缺陷识别的批量处理方法

Publications (2)

Publication Number Publication Date
CN109034262A true CN109034262A (zh) 2018-12-18
CN109034262B CN109034262B (zh) 2021-08-31

Family

ID=64632974

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810915378.2A Active CN109034262B (zh) 2018-08-13 2018-08-13 一种x射线定向仪缺陷识别的批量处理方法

Country Status (1)

Country Link
CN (1) CN109034262B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109725013A (zh) * 2018-12-20 2019-05-07 深圳晶泰科技有限公司 X射线衍射数据分析系统
CN110097261A (zh) * 2019-04-17 2019-08-06 三峡大学 一种判断用户用电异常的方法
CN112945995A (zh) * 2021-02-04 2021-06-11 哈尔滨工业大学 一种光学晶体超精密加工亚表面损伤缺陷的解析方法
CN113077462A (zh) * 2021-04-30 2021-07-06 上海众壹云计算科技有限公司 晶圆缺陷分类方法、装置、系统、电子设备和存储介质
CN114169694A (zh) * 2021-11-16 2022-03-11 北京科技大学设计研究院有限公司 一种基于大数据平台的过程能力分析方法及装置
CN116415660A (zh) * 2023-06-12 2023-07-11 合肥喆塔科技有限公司 基于晶圆缺陷知识库的构建及检索方法、设备及介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009113418A1 (ja) * 2008-03-13 2009-09-17 株式会社 日立メディコ X線診断装置
CN103064019A (zh) * 2013-01-04 2013-04-24 河海大学常州校区 基于灰色关联模糊聚类的高压断路器故障诊断方法
CN106124542A (zh) * 2016-07-22 2016-11-16 东北大学 一种多功能x射线定向仪及方法
CN106251001A (zh) * 2016-07-18 2016-12-21 南京工程学院 一种基于改进模糊聚类算法的光伏功率预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009113418A1 (ja) * 2008-03-13 2009-09-17 株式会社 日立メディコ X線診断装置
CN103064019A (zh) * 2013-01-04 2013-04-24 河海大学常州校区 基于灰色关联模糊聚类的高压断路器故障诊断方法
CN106251001A (zh) * 2016-07-18 2016-12-21 南京工程学院 一种基于改进模糊聚类算法的光伏功率预测方法
CN106124542A (zh) * 2016-07-22 2016-11-16 东北大学 一种多功能x射线定向仪及方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张臻: ""基于X射线测量的铝合金铸件微观缺陷预测及分析"", 《铸造技术》 *
李秀格等: ""求模糊相似矩阵的传递闭包的简捷算法"", 《电脑知识与技术》 *
郭瑞等: ""模糊聚类分析在色木孔洞缺陷位置声波检测中的应用"", 《西北林学院学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109725013A (zh) * 2018-12-20 2019-05-07 深圳晶泰科技有限公司 X射线衍射数据分析系统
CN110097261A (zh) * 2019-04-17 2019-08-06 三峡大学 一种判断用户用电异常的方法
CN110097261B (zh) * 2019-04-17 2022-11-18 三峡大学 一种判断用户用电异常的方法
CN112945995A (zh) * 2021-02-04 2021-06-11 哈尔滨工业大学 一种光学晶体超精密加工亚表面损伤缺陷的解析方法
CN112945995B (zh) * 2021-02-04 2023-08-01 哈尔滨工业大学 一种光学晶体超精密加工亚表面损伤缺陷的解析方法
CN113077462A (zh) * 2021-04-30 2021-07-06 上海众壹云计算科技有限公司 晶圆缺陷分类方法、装置、系统、电子设备和存储介质
CN113077462B (zh) * 2021-04-30 2024-05-10 上海众壹云计算科技有限公司 晶圆缺陷分类方法、装置、系统、电子设备和存储介质
CN114169694A (zh) * 2021-11-16 2022-03-11 北京科技大学设计研究院有限公司 一种基于大数据平台的过程能力分析方法及装置
CN116415660A (zh) * 2023-06-12 2023-07-11 合肥喆塔科技有限公司 基于晶圆缺陷知识库的构建及检索方法、设备及介质

Also Published As

Publication number Publication date
CN109034262B (zh) 2021-08-31

Similar Documents

Publication Publication Date Title
CN109034262A (zh) 一种x射线定向仪缺陷识别的批量处理方法
CN114723704B (zh) 一种基于图像处理的纺织品质量评估方法
Morala-Argüello et al. A evaluation of surface roughness classes by computer vision using wavelet transform in the frequency domain
CN109612999A (zh) 用于晶圆图分析的系统和方法
Li et al. A leaf segmentation and phenotypic feature extraction framework for multiview stereo plant point clouds
CN109318056A (zh) 一种基于多种类传感器复合信号的刀具磨损监控方法
CN105303169B (zh) 一种基于慢特征的细胞分裂识别方法及其识别装置
CN112347894B (zh) 基于迁移学习和高斯混合模型分离的单株植被提取方法
CN105843870B (zh) 重复性和再现性的分析方法及其应用
CN109003266A (zh) 一种基于模糊聚类统计图像质量主观评价结果的方法
Wang et al. 3D point cloud instance segmentation of lettuce based on PartNet
CN110632546B (zh) 基于全网域证据集的电子式互感器可信度评估方法和装置
CN110533063A (zh) 一种基于卫星影像和gmdh神经网络的云量计算方法及装置
CN106326914B (zh) 一种基于svm的珍珠多分类方法
CN112949517A (zh) 基于深度迁移学习的植物气孔密度和开度识别方法及系统
CN114757297A (zh) 一种多参数化的半导体检测方法、装置及可读存储介质
CN113155193B (zh) 一种基于云计算的晶圆片智能检测分类方法、装置和系统
CN110082106A (zh) 一种基于Yu范数的深度度量学习的轴承故障诊断方法
Ma et al. A method for calculating and simulating phenotype of soybean based on 3D reconstruction
CN107884744B (zh) 无源被动式室内定位方法及装置
Xie et al. An improved floc image segmentation algorithm based on Otsu and particle swarm optimisation
CN110414583A (zh) 一种基于可拓关联函数的改进密度峰值聚类方法
CN109726641A (zh) 一种基于训练样本自动优化的遥感影像循环分类方法
Wang et al. Automatic stack velocity picking using an unsupervised ensemble learning method
CN116401570B (zh) 一种印刷质量监测大数据智能处理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant