CN109034262A

CN109034262A - 一种x射线定向仪缺陷识别的批量处理方法

Info

Publication number: CN109034262A
Application number: CN201810915378.2A
Authority: CN
Inventors: 关守平; 王玉勇
Original assignee: Northeastern University China
Current assignee: Northeastern University China
Priority date: 2018-08-13
Filing date: 2018-08-13
Publication date: 2018-12-18
Anticipated expiration: 2038-08-13
Also published as: CN109034262B

Abstract

本发明提出一种X射线定向仪缺陷识别的批量处理方法，属于单晶材料加工领域，提出了离线批量式单晶晶体缺陷检测方法，设计了单晶晶体回摆曲线的特征向量，以抽象出曲线特征，结合粒子群优化算法，并引入基于密度函数的有效半径，改进了传统FCM算法，提升算法对于初始化聚类中心的鲁棒性，避免陷入局部极优，并很好地过滤干扰数据，从而实现对批量数据进行聚类，之后仅需对聚类中心特征向量进行缺陷检测，根据隶属度关系即可得到所有待测曲线的缺陷类型，其中包含了本发明提出的改进的模糊传递闭包聚类算法，定义模糊相似矩阵，保证了相似计算的准确性，本发明为晶体检测技术提供了全新的思路和实现方式。

Description

一种X射线定向仪缺陷识别的批量处理方法

技术领域

本发明属于单晶材料加工领域，具体涉及一种X射线定向仪缺陷识别的批量处理方法。

背景技术

在晶体生长过程中，不可避免的问题就是晶体缺陷，因其技术固有的局限性会导致存在非理想的晶体结构。工业上，高精度、高效率的X射线衍射技术是常用的晶体缺陷无损检测手段，通过单晶晶体对X射线产生衍射，接收衍射信号得到对应特征曲线，即回摆曲线，基于回摆曲线特征即可分析待测晶体的品质特征。

目前，基于上述技术用于单晶晶体缺陷检测的X射线定向仪自动化水平欠缺，质量参差不齐，呈现“一人一机一库一片”的现象。仪器需人工参与，且无法高效、准确、智能地识别单晶晶体的缺陷类型；各单晶晶体检测数据相互独立，各仪器仅为“信息孤岛”，无法相互借鉴、相互学习，不能更新、共享样本库；一次仅能进行一片单晶晶体的检测工作，无法对来自其他仪器的待识别回摆曲线数据进行识别检测，无法离线对批量回摆曲线进行快速检测。随着单晶晶体材料的发展，应用面越来越广，对于单晶晶体材料品质的高效快速的检测技术需求日益迫切。

针对上述问题，本发明提出了一种X射线定向仪缺陷识别的批量处理方法，根据已经测量得到的大量单晶材料回摆曲线，以批量的形式进行缺陷类型识别，实现了单晶材料的快速自动缺陷识别，为X射线定向仪的应用提供了新的功能。

模糊划分的概念最早由著名学者Ruspini提出，随后由Kim等学者提出基于模糊等价关系的模糊聚类方法。该方法的基本思想为：由于模糊等价矩阵R^*是论域集U与自己的直积U×U上的一个模糊子集，其具有对称性和自反性，因此可以对R^*进行分解，选用某一确定的阈值λ∈[0,1]作R^*的截集，截得的普通子集就是U上的一个普通等价关系。目前对于模糊等价矩阵的求取，使用最广泛的方法是通过模糊相似矩阵R，并采用传递闭包方法求取模糊等价矩阵R^*，其中常用的求取模糊相似矩阵R的方法有相似系数法和距离法。在本发明的应用中，传统的模糊传递闭包聚类算法不满足需要，主要体现在如下两个方面：(1)现有的模糊相似矩阵计算方法计算得到的数值与实际曲线相似度偏差较大；(2)现有的计算方法在计算相似度时，人眼直观不相似的两条曲线仍有一定的相似度。本发明将设计一种新的模糊相似矩阵的计算方法进行相应改进。

模糊聚类是一种采用模糊数学语言对事物按一定的要求进行描述和分类的数学方法。Fuzzy c-means(FCM)算法是一种基于目标函数的模糊聚类算法，其基本思想是以KCM算法为根据，并引入模糊集的理念，从硬划分转变为软划分。FCM算法根据极小值条件计算出聚类中心和隶属度矩阵的迭代公式，通过迭代计算得到使目标函数达到最小值的聚类中心和隶属度矩阵，从而得到数据集的精确分类。FCM算法存在如下两方面的不足：(1)FCM算法的初始聚类中心较差时，系统容易陷入局部最优；(2)FCM算法对所有的异常数据无能为力，所有异常数据均被分类。本发明将对传统FCM算法进行改进并应用。该方法识别效率高，识别准确，能够甄别异常数据，鲁棒性好，为批量待测单晶晶体缺陷检测的实现提供了一种有效的方法。

发明内容

本发明的目的在于针对现阶段X射线定向仪存在的不足以及市场对于离线批量检测技术的需求，提出一种X射线定向仪缺陷识别的批量处理方法，包括如下步骤：

步骤1：建立样本库，包括单晶晶体标准的和每种缺陷类型的标准回摆曲线数据样本，提取该样本中每条回摆曲线的特征向量，并保存样本每条回摆曲线的特征向量，作为样本库；

步骤2：批量选取n个待测单晶晶体回摆曲线数据，对待测单晶晶体回摆曲线数据提取特征向量，用于表述曲线特征；

步骤3：进行参数初始化，所述参数设置包括：聚类数目c及初始聚类中心V⁰，V⁰为迭代初始值，迭代停止阈值ε，最大迭代次数B，当前迭代次数b，初始化粒子位置PX⁰和速度PV⁰，设粒子的位置表示为PX＝[PX₁,…,PX_Pm]^T，具体为PX_p＝[px_p1,…,px_pc]_c×m,p∈[1,Pm]，粒子的速度表示为PV＝[PV₁,…,PV_Pm]^T，具体为PV_p＝[pv_p1,…,pv_pc]_c×m,p∈[1,Pm]，当前迭代中使得目标函数值最小时的个体最优PX_pbest，群体最优PX_gbest；Pm粒子群数量，m指特征向量维度；

步骤4：使用改进的FCM聚类算法对所有特征向量进行聚类，得到聚类中心，以及所有特征向量对各聚类中心的隶属度矩阵；其中，改进的FCM聚类算法引入粒子群优化算法，进行迭代，得到优化后的聚类中心，以及所有特征向量与各聚类中心的隶属度矩阵；

步骤5：计算有效半径VR＝(VR_k)_c*1，根据数据聚类的判断准则，筛除异常数据；VR_k为第k个聚类中心的有效半径，定义为如下公式：

其中，n样本总数，c为聚类数目，其数值上与样本库样本总数相等，(VR_k)_c×1指VR_k为c×1维的向量，d_ik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离，c₁表示密度影响率，c₂表示对异常数据的判断的严格程度，其中，ρ_k为密度函数，定义第k个聚类中心V_k的密度函数ρ_k为如下公式：

其中，d_ik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离；u_ik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度，公式如下，其中，s为模糊指数，在实际应用中，其最佳取值范围为s∈(1.5,2.5)，本发明取s＝2；

其中，X_i第i待测单晶晶体回摆曲线数据，V_k第k个聚类中心的隶属度，t≠k，指一种特殊情况，如果一条曲线和聚类中心距离为0则隶属度为1，那么和除了这条曲线t不等于k的中心的隶属度为0；

对数据聚类的判断准则如下：

若且h≠k，满足d_ik≤VR_k且u_ik≥u_ih,k≠h时，则第i个数据归属于第k类；

若满足d_ik≥VR_k时，此时第i个数据属于异常数据；

步骤6：使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别，进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度；其中，改进的模糊传递闭包聚类算法改进了模糊相似矩阵，定义模糊相似矩阵为R＝(r_ab)，其中

其中，r_ab为相似度，m为特征向量维度，x_0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准，即任何单晶材料曲线与其相似度均为0；x_aj和x_bj分别为第a个和第b个单晶晶体回摆曲线数据第j个特征，value_ab为批量选取第a条单晶晶体回摆曲线数据特征向量和第b条样本的特征向量的欧氏距离，和该向量与零标准曲线的特征向量欧氏距离的相对值，β为经验参数。

步骤1和步骤2中所述回摆曲线数据提取特征为Pattern＝[Pattern1；Pattern2]，其中Pattern1为主峰基本模式特征向量，表示主峰的参数，体现晶体的特性及主峰形状；Pattern2为峰形基本特征向量，表示从峰的数量、位置及曲线对称性，体现整体峰形轮廓。

定义Angle为衍射角度的集合，angle_i为第i个衍射角度；定义Peak为X射线衍射强度的集合，peak_i为angle_i所对应的X射线衍射强度，peak_i*为归一化之后的衍射强度值；定义Scan为扫描范围，表示仪器在测量时扫描过的X射线衍射角度，单位为角度秒；定义Std_angle为标准衍射角度，表示理论上该晶体达到max(peak_i)对应的角度；定义Main_angle为主峰角度，表示实际测量中该晶体达到max(peak_i)对应的角度，其中，max(peak_i)为X射线衍射强度的最大值。

所述Pattern1指代：Pattern1＝[Max_peak；Main_dif；Backgr_value；FWHM]，其中，Max_peak表示X射线衍射强度最大值；Main_dif表示主峰角度Main_angle与标准衍射角度Std_angle之间的差值；Backgr_value表示X射线衍射强度的背底值；FWHM表示峰形的半峰宽度。

所述Pattern2指代，Pattern2＝[Slave_num；Angle_dif；Slave_peak；Sym]，其中，Slave_num表示左右从峰的数量；Angle_dif表示从峰角度Slave_angle与主峰角度Main_angle之间的差值，若没有从峰则Angle_dif为零向量；Slave_peak表示各从峰峰值，分别从最左边的从峰向最右边的从峰依次排列并用逗号隔开，若没有从峰则Slave_peak为零向量；Sym为峰形对称度，表示晶体结构曲线的对称情况，公式如下：

Sym＝e^-δ (6)

其中，

其中，Main_num表示最大峰值时的衍射角度的对应下标，g＝min(Main_num-1,sum-Main_num)表示Main_num-1与sum-Main_num的最小值，sum为衍射曲线采样点总数。

步骤4中所述改进的FCM算法，引入粒子群优化算法，具体步骤如下：

步骤4.1：将待测单晶晶体回摆曲线数据以及按照步骤2中对每条回摆曲线提取的特征，建立原始数据矩阵；

X＝[X₁,X₂,…,X_n]^T(X_i＝[x_i1,…,x_ij,…,x_im]) (8)

其中，X₁,X₂,…,X_n为待测单晶晶体回摆曲线数据，第i待测单晶晶体回摆曲线数据X_i又包括m个指标表示提取特征，n样本总数；

得到原始数据矩阵为：

其中，x_nm表示第n个批量选择待测曲线的第m个指标的原始数据(m为特征向量维度)；

步骤4.2：计算样本X_i与聚类中心V_k的欧氏距离D^b＝(d_ik)_n×c，c表示聚类中心数目；其中，第一次迭代时，将V取初始聚类中心V⁰(即X矩阵中的任意c个向量构成V⁰)：

步骤4.3根据FCM算法的目标函数：

步骤4.4、计算粒子群每个粒子的适应度，即每个粒子所代表的可行解对应的目标函数值，比较迭代过程中，每个粒子的在迭代过程中个体最优目标函数值对应的解和当前迭代中群体最优目标函数值对应的解即PX_pbest、PX_gbest，并令V^b＝PX_gbest并更新隶属度矩阵；

步骤4.5、计算下一代粒子的位置和速度，表示粒子p在第b次迭代过程中的速度；表示粒子p在第b次迭代过程中的位置；惯性权重ω表示粒子群优化算法的搜索能力；c₁、c₂分别是个体极值点和全局极值点的学习因子，r₁和r₂分别是0到1的随机数，i＝1,2…,Pm，Pm是粒子总数：

步骤4.6：判断||V^b-V^b-¹||≤ε或者是否达到最大迭代次数B，则停止迭代，记录聚类中心V^b以及隶属度矩阵U^b，否则b＝b+1，转到步骤4.2。

步骤6中所述的改进的模糊传递闭包聚类算法，具体步骤包括步骤6.1～步骤6.4：

步骤6.1：由批量选取待测单晶晶体回摆曲线数据的聚类中心矩阵与知识库样本曲线模式特征组成的聚类原始数据矩阵为X＝[X₁,X₂,…,X_2*c]^T,并按照下式进行归一化处理，其中，知识库样本曲线包括c种标准曲线，c为样本库样本总数(数值上也等于待测曲线数据聚类中心数目)，X_i表示(i＝1,2,…,2*c)第i条曲线的模式特征向量，X_i＝[x_i1,…,x_ij,…,x_im]，x_ij表示第i条曲线的第j个模式特征，对原始数据矩阵使用下式建立标准数据矩阵

步骤6.2、改进的指数距离法计算模糊相似矩阵，得到模糊相似矩阵为R＝(r_ab)_(2*c)×(2*c),如公式(4)与公式(5)所示；

步骤6.3：当前建立的相似关系不满足传递性，因而不是模糊等价关系，本发明采用平方法求传递闭包，再用传递闭包求取模糊等价矩阵R^*，即

当时，

式中，n’为R自积的次数，R的内积公式如下式所示：

步骤6.4：若则对应X_a，X_b归为一类；若即a＝1时的实测曲线聚类中心，则认为该单晶材料属于第b类样本。

有益技术效果：

现有的技术相比，本发明提出一种X射线定向仪缺陷识别的批量处理方法，其有益技术效果为：

1，设计了单晶晶体回摆曲线的特征向量，以抽象出曲线特征，结合粒子群优化算法并引入有效半径思想改进了传统FCM算法，提升了算法对于初始化聚类中心的鲁棒性，避免陷入局部极优；

2，基于密度函数的有效半径很好地过滤干扰数据，从而实现对批量数据进行聚类；

3，仅需对聚类中心特征向量进行缺陷检测，根据隶属度关系即可得到所有待测曲线的缺陷类型，其中包含了本发明提出的改进模糊相似系数计算方法，保证了相似计算的准确性，本发明为晶体检测技术提供了全新的思路和实现方式；

4，改进的模糊传递闭包聚类算法，定义模糊相似矩阵，使其非常适用X射线定向仪缺陷识别的批量处理方法，可以对不同单晶晶体预设定不同经验参数，使其具有通用性；

5，该方法识别效率高，识别准确，能够甄别异常数据，鲁棒性好，为批量待测单晶晶体缺陷检测的实现提供了一种有效的方法。

附图说明

图1本发明实施例的X射线定向仪缺陷识别的批量处理方法整体流程图；

图2本发明实施例的改进的FCM算法流程图；

图3本发明实施例的改进的模糊传递闭包聚类算法流程图；

图4本发明实施例的标准蓝宝石晶体回摆曲线；

图5本发明实施例的蓝宝石晶体刃型位错回摆曲线；

图6本发明实施例的蓝宝石晶体螺旋位错回摆曲线；

图7本发明实施例的蓝宝石刃型位错回摆曲线特征定义示意图；

图8本发明实施例的零标准曲线数据示意图；

图9本发明实施例的标准蓝宝石晶体回摆曲线与样本库匹配结果图；

图10本发明实施例的异常测试回摆曲线与样本库匹配结果图。

具体实施方式：

结合附图详细说明一种X射线定向仪缺陷识别的批量处理方法的技术方案，具体步骤如整体流程图1所示：

步骤1：建立样本库，包括待测单晶晶体标准的和每种缺陷类型的回摆曲线数据样本，提取该样本中每条回摆曲线的特征向量，并保存样本每条回摆曲线的特征向量，作为样本库；

本申请以蓝宝石为例，给出对应标准晶体、刃型位错和螺旋位错的晶体3种样本知识库，对应图4，图5，图6所示，计算特征向量下表所示，其中特征向量变量定义如图7所示：

表1模式特征向量

步骤2：选取n＝490条蓝宝石回摆曲线数据，对每条蓝宝石回摆曲线数据提取特征向量，用于表述曲线特征；

步骤3：进行参数初始化，所述参数设置包括：聚类数目c＝3，即3种样本库中样本，及初始聚类中心V⁰取任意三个回摆曲线特征向量构成矩阵，迭代停止阈值ε＝0.001，最大迭代次数B＝20，当前迭代次数b＝0，初始化粒子位置X_i和速度V_i，设粒子i的位置表示为PX＝[PX₁,…,PX_Pm]^T，具体为PX_p＝[px_p1,…,px_pc]_c×m,p∈[1,Pm]，粒子i的速度表示为PV＝[PV₁,…,PV_Pm]^T，具体为PV_p＝[pv_p1,…,pv_pc]_c×m,p∈[1,Pm]，个体最优X_pbest，群体最优X_gbest；设置粒子群数量Pm＝30，令V^b＝PX_gbest；

步骤4：使用改进的FCM聚类算法对所有特征向量进行聚类，如图2所示，得到聚类中心，以及所有特征向量对各聚类中心的隶属度矩阵；其中，改进的FCM聚类算法引入粒子群优化算法，并进行迭代，得到优化后的聚类中心，以及所有特征向量与各聚类中心的隶属度矩阵；

X＝[X₁,X₂,…,X_n]^T(X_i＝[x_i1,…,x_ij,…,x_im]) (8)

其中，X₁,X₂,…,X_n为待测单晶晶体回摆曲线数据，第i待测单晶晶体回摆曲线数据X_i又包括m个指标表示提取特征，n样本总数为490；

得到原始数据矩阵为：

步骤4.2：计算样本X_i与聚类中心V_k的欧氏距离D^b＝(d_ik)_490×3，c表示聚类中心数目：

步骤4.3：根据FCM算法的目标函数：

步骤4.4：计算粒子群每个粒子的适应度，即每个粒子所代表的可行解对应的目标函数值，比较迭代过程中每个粒子的在迭代过程中个体最优目标函数值对应的解和当前迭代中群体最优目标函数值对应的解即PX_pbest、PX_gbest，并令V^b＝PX_gbest并更新隶属度矩阵；

步骤4.5：计算下一代粒子的位置和速度，表示粒子p在第b次迭代过程中的速度；表示粒子p在第b次迭代过程中的位置；惯性权重ω表示粒子群优化算法的搜索能力；c₁、c₂分别是个体极值点和全局极值点的学习因子，r₁和r₂是0到1的随机数，i＝1,2…,Pm，Pm是粒子总数：

步骤4.6：判断||V^b-V^b-1||≤ε，ε＝0.001或者是否达到最大迭代次数B＝20，则停止迭代，记录聚类中心V^b以及隶属度矩阵U^b，否则b＝b+1，转到步骤4.2。

得到模糊隶属度矩阵U*及此时的聚类中心V*。

步骤5：计算有效半径VR＝(VR_k)_3×1，根据数据聚类的判断准则，筛除异常数据；VR_k为第k个聚类中心的有效半径，定义为如下公式：

其中，n样本总数为490，c为聚类数目为3，(VR_k)_3×1指VR_k为c×1维的向量，d_ik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离，c₁表示密度影响率，c₂表示对异常数据的判断的严格程度，当c₁越小，表示对密度的依赖性越大。根据实验经验一般取c₂表示对异常数据的判断的严格程度。c₂越小，表示对异常数据的判断越严格。根据实验经验一般取c₂∈[1,5]。特殊情况，当c₂＝1时，有效半径r_k则为d_ik的标准差；当c₂＝3时，有效半径r_k则为针对d_ik的PauTa准则；

其中，ρ_k为密度函数，定义第k个聚类中心V_k的密度函数ρ_k为如下公式：

其中，由公式(2)可知ρ_k∈(0,1)，d_ik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离；u_ik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度，公式如下，其中，s为模糊指数，在实际应用中，其最佳取值范围为s∈(1.5,2.5)，本发明取s＝2；

对数据聚类的判断准则如下：

若满足d_ik≥VR_k时，此时第i个数据属于异常数据；

本发明取c₁＝1,c₂＝3计算有效半径并筛选异常数据：

VR＝(VR_k)_3×1＝[0.82 0.81 0.81]

步骤6：使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别，进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度；其中，改进的模糊传递闭包聚类算法改进了模糊相似矩阵，定义模糊相似矩阵为R＝(r_ab)_6*6，其中

其中，r_ab为相似度，m为特征向量维度，x_0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准，即任何单晶材料曲线与其相似度均为0，如图8所示；x_aj和x_bj分别为矩阵中第a个和第b个单晶晶体回摆曲线数据第j个特征，value_ab为第a条聚类中心特征向量和第b条样本的特征向量的欧氏距离，和该向量与零标准曲线的特征向量欧氏距离的相对值，β为经验参数，根据不同晶体类型进行选择，本发明选取β＝0.37。

步骤6中所述的改进的模糊传递闭包聚类算法，具体步骤包括步骤6.1～步骤6.4，如图3所示：

步骤6.1：由聚类中心曲线数据与知识库样本曲线模式特征组成的聚类原始数据矩阵为X＝[X₁,X₂,…,X₆]^T,并按照下式进行归一化处理，其中，知识库样本曲线包括c种标准曲线，c为样本库样本总数为3，X_i表示(i＝1,2,…,6)第i条曲线的模式特征向量，X_i＝[x_i1,…,x_ij,…,x_im]，x_ij表示第i条曲线的第j个模式特征，对原始数据矩阵使用下式建立标准数据矩阵

为聚类中心V和样本；

步骤6.2：改进的指数距离法计算模糊相似矩阵，得到模糊相似矩阵为R＝(r_ab)_6*6,如公式(4)与公式(5)所示；

步骤6.3：当前建立的相似关系不满足传递性，因而不是模糊等价关系，本发明采用平方法求传递闭包，再用传递闭包求取模糊等价矩阵R^*，即：

当时，

式中，n’为R自积的次数，R的内积公式如下式所示：

步骤6.4：若则对应X_a，X_b归为一类；若即a＝1时的实测曲线，

本发明λ＝0.5；

由模糊传递闭包聚类算法得出模糊等价矩阵：

即，属于V₁聚类中心的数据属于标准蓝宝石晶体；属于V₂聚类中心的数据属于蓝宝石刃型位错；属于V₃聚类中心的数据属于蓝宝石螺旋位错。

取某标准蓝宝石晶体与某异常数据验证算法可靠性。图9、图10为两条测试曲线的匹配结果图，图9实线为测试曲线，为隶属于V₁类的某曲线，属于标准晶体，经计算其相似度为0.78；图10实线为测试曲线，为某异常数据的曲线图，经计算其相似度为0.42，经FCM算法聚类其隶属于V₁类，亦属于标准晶体，但经有效半径算法筛除后，认定其为异常数据。

从实验检测结果来看：本发明所述方法识别效率高，识别准确，能够甄别异常数据，鲁棒性好，为批量待测单晶晶体缺陷检测的实现提供了一种有效的方法。

Claims

1.一种X射线定向仪缺陷识别的批量处理方法，其特征在于包括如下步骤：

步骤3：进行参数初始化，所述参数设置包括：聚类数目c及初始聚类中心V⁰，V⁰为迭代初始值，迭代停止阈值ε，最大迭代次数B，当前迭代次数b，初始化粒子位置PX⁰和速度PV⁰，设粒子的位置表示为PX＝[PX₁，…，PX_Pm]^T，具体为PX_p＝[px_p1,…,px_pc]_c×m,p∈[1,Pm]，粒子的速度表示为PV＝[PV₁，…，PV_Pm]^T，具体为PV_p＝[pv_p1,…,pv_pc]_c×m,p∈[1,Pm]，当前迭代中使得目标函数值最小时的个体最优PX_pbest，群体最优PX_gbest；Pm粒子群数量，m指特征向量维度；

步骤5：计算有效半径VR＝(VR_k)_c×1，根据数据聚类的判断准则，筛除异常数据；VR_k为第k个聚类中心的有效半径，定义为如下公式：

其中，d_ik表示第i个待测单晶晶体回摆曲线数据特征向量与第k个聚类中心的距离；u_ik表示第i个待测单晶晶体回摆曲线数据特征向量属于第k个聚类中心的隶属度，公式如下，其中，s为模糊指数；

对数据聚类的判断准则如下：

若满足d_ik≥VR_k时，此时第i个数据属于异常数据；

步骤6：使用改进的模糊传递闭包聚类算法对得到的聚类中心进行缺陷类型识别，进而得出所有待测单晶晶体回摆曲线对应的缺陷类型及其相似度；其中，改进的模糊传递闭包聚类算法改进了模糊相似矩阵，定义模糊相似矩阵为R＝(r_ab)，其中：

其中，r_ab为相似度，m为特征向量维度，x_0j为取峰值不变的晶体衍射曲线数据为曲线的0相似度标准，即任何单晶材料曲线与其相似度均为0；x_aj和x_bj分别为第a个和第b个单晶晶体回摆曲线数据第j个特征，value_ab为批量选取第a条和第b条回摆曲线数据特征向量的欧氏距离，和该向量与零标准曲线的特征向量欧氏距离的相对值，β为经验参数。

2.根据权利要求1所述一种X射线定向仪缺陷识别的批量处理方法，其特征在于，步骤1和步骤2中所述回摆曲线数据提取特征为Pattern＝[Pattern1；Pattern2]，其中Pattern1为主峰基本模式特征向量，表示主峰的参数，体现晶体的特性及主峰形状；Pattern2为峰形基本特征向量，表示从峰的数量、位置及曲线对称性，体现整体峰形轮廓；

定义Angle为衍射角度的集合，angle_i为第i个衍射角度；定义Peak为X射线衍射强度的集合，peak_i为angle_i所对应的X射线衍射强度，peak_i*为归一化之后的衍射强度值；定义Scan为扫描范围，表示仪器在测量时扫描过的X射线衍射角度，单位为角度秒；定义Std_angle为标准衍射角度，表示理论上该晶体达到max(peak_i)对应的角度；定义Main_angle为主峰角度，表示实际测量中该晶体达到max(peak_i)对应的角度，其中，max(peak_i)为X射线衍射强度的最大值；

所述Pattern1指代：Pattern1＝[Max_peak；Main_dif；Backgr_value；FWHM]，其中，Max_peak表示X射线衍射强度最大值；Main_dif表示主峰角度Main_angle与标准衍射角度Std_angle之间的差值；Backgr_value表示X射线衍射强度的背底值；FWHM表示个峰形的半峰宽度；

Sym＝e^-δ (6)

其中，

其中，表示最大峰值时的衍射角度的对应下标，g＝min(Main_num-1,sum-Main_num)表示Main_num-1与sum-Main_num的最小值，sum为衍射曲线采样点总数。

3.根据权利要求1所述一种X射线定向仪缺陷识别的批量处理方法，其特征在于，步骤4中所述改进的FCM算法，引入粒子群优化算法，具体步骤如下：

X＝[X₁,X₂,…,X_n]^T(X_i＝[x_i1,…,x_ij,…,x_im]) (8)

得到原始数据矩阵为：

步骤4.2：计算样本X_i与聚类中心V_k的欧氏距离D^b＝(d_ik)_n×c，c表示聚类中心数目；第一次迭代时，将V取初始聚类中心V⁰(即X矩阵中的任意c个向量构成V⁰)：

步骤4.3：定义FCM算法的目标函数：

步骤4.4：计算粒子群每个粒子的适应度，即每个粒子所代表的可行解对应的目标函数值，比较迭代过程中，每个粒子的在迭代过程中个体最优目标函数值对应的解和当前迭代中群体最优目标函数值对应的解即PX_pbest、PX_gbest，并令V^b＝PX_gbest并更新隶属度矩阵；

步骤4.5：计算下一代粒子的位置和速度，表示粒子p在第b次迭代过程中的速度；表示粒子p在第b次迭代过程中的位置；惯性权重ω表示粒子群优化算法的搜索能力；c₁、c₂分别是个体极值点和全局极值点的学习因子，r₁和r₂分别是0到1的随机数，i＝1,2…,Pm，Pm是粒子总数：

步骤4.6：判断||V^b-V^b-1||≤ε或者是否达到最大迭代次数B，则停止迭代，记录聚类中心V^b以及隶属度矩阵U^b，否则b＝b+1，转到步骤4.2。

4.根据权利要求1所述一种X射线定向仪缺陷识别的批量处理方法，其特征在于，步骤6中所述的改进的模糊传递闭包聚类算法，具体步骤包括步骤6.1～步骤6.4：

步骤6.1：由批量选取待测单晶晶体回摆曲线数据的聚类中心矩阵与知识库样本曲线模式特征组成的聚类原始数据矩阵为X＝[X₁,X₂,…,X_2c]^T,并按照下式进行归一化处理，其中，知识库样本曲线包括c种标准曲线，c为样本库样本总数，数值上也等于待测曲线数据聚类中心数目，X_i表示(i＝1,2,…,2c)第i条曲线的模式特征向量，X_i＝[x_i1,…,x_ij,…,x_im]，x_ij表示第i条曲线的第j个模式特征，对原始数据矩阵使用下式建立标准数据矩阵

步骤6.2：改进的指数距离法计算模糊相似矩阵，得到模糊相似矩阵为R＝(r_ab)_(2c)×(2c)，如公式(4)与公式(5)所示；

式中，n’为R自积的次数，R的内积公式如下式所示：