CN116777915A - 一种海蓝宝石的子类识别方法、装置及存储介质 - Google Patents

一种海蓝宝石的子类识别方法、装置及存储介质 Download PDF

Info

Publication number
CN116777915A
CN116777915A CN202311062239.7A CN202311062239A CN116777915A CN 116777915 A CN116777915 A CN 116777915A CN 202311062239 A CN202311062239 A CN 202311062239A CN 116777915 A CN116777915 A CN 116777915A
Authority
CN
China
Prior art keywords
content information
training data
identified
cluster
chromaticity coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311062239.7A
Other languages
English (en)
Inventor
张天阳
杨清波
吴金林
丁汀
黎辉煌
张权
蒙彩珍
唐娜
宁珮莹
马瑛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guo Jian Center Shenzhen Jewelry Inspection Laboratory Co ltd
Original Assignee
Guo Jian Center Shenzhen Jewelry Inspection Laboratory Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guo Jian Center Shenzhen Jewelry Inspection Laboratory Co ltd filed Critical Guo Jian Center Shenzhen Jewelry Inspection Laboratory Co ltd
Priority to CN202311062239.7A priority Critical patent/CN116777915A/zh
Publication of CN116777915A publication Critical patent/CN116777915A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/762Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Multimedia (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

本发明公开了一种海蓝宝石的子类识别方法、装置及存储介质,方法包括:根据待识别宝石的色度坐标信息和致色元素含量信息,计算待识别宝石与两个聚类簇的簇中心的距离;每个聚类簇根据若干个训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来;若两个距离的差值小于第一阈值,则获取待识别宝石的微量元素含量信息;将待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果;单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来,以实现提高对海蓝宝石“圣玛利亚”及“超级圣玛利亚”两种细分子类的识别的精度和效率。

Description

一种海蓝宝石的子类识别方法、装置及存储介质
技术领域
本发明涉及宝石鉴定技术领域,尤其涉及一种海蓝宝石的子类识别方法、装置及存储介质。
背景技术
海蓝宝石具有美丽、稀少、价值高的特点,其具有“圣玛利亚”及“超级圣玛利亚”两种细分子类,分别具有不同的色度值及微量元素含量。同样品质的“圣玛利亚”及“超级圣玛利亚”的两种海蓝宝石价值和价格存在差距。因此,对海蓝宝石中“圣玛利亚”及“超级圣玛利亚”子类的细分鉴定具有重要价值。
现有对海蓝宝石“圣玛利亚”及“超级圣玛利亚”两种细分子类的识别方法主要是基于海蓝宝石的外观特征对其子类属性进行判断。基于外观的识别依据不是必然存在,可能完全不存在,这时检测人员可能根据一项或两项的不明显的特征进行综合的经验性判定。整体来说整个鉴定过程缺乏系统性、检测过程复杂冗长、费时费力,同时具有一定的主观经验判定成分,导致对海蓝宝石子类的识别的精度低,鉴定效率差。
发明内容
本发明提供了一种海蓝宝石的子类识别方法、装置及存储介质,以实现提高对海蓝宝石“圣玛利亚”及“超级圣玛利亚”两种细分子类的识别的精度和效率。
本发明提供了一种海蓝宝石的子类识别方法,包括:根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离;每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来;所述第一训练数据样本包括第一子类和第二子类的海蓝宝石;
若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息;将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果;所述单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来。
进一步地,根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离,具体为:
根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石的在多维空间中与每个簇的簇中心的之间的第一距离;其中,每个所述多维空间的维度为所述色度坐标信息和所述致色元素含量信息的特征的数量。
进一步地,每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来,具体为:
根据若干个所述第一训练数据样本各自的标签,在第一训练数据样本中随机选取其中两个训练数据样本分别作为两个初始簇的簇中心;其中,所述标签的内容为对应的第一训练数据样本的子类信息;两个所述第一训练数据样本的标签内容分别为第一子类和第二子类;
计算每个所述第一训练数据样本与两个所述初始簇的簇中心在多维空间中的第二距离,将每个第一训练数据样本分别分配到所述第二距离更小的对应的初始簇中,以更新两个所述初始簇;所述第二距离根据每个第一训练数据样本与初始簇的簇中心的色度坐标信息和致色元素含量信息计算而来;
根据两个更新后的初始簇各自的簇中心与每个第一训练数据样本在多维空间中的距离,重新对每个第一训练数据样本进行分配,直到达到预设条件,以完成两个初始簇的迭代训练,得到两个聚类簇;所述预设条件包括:连续若干个同一子类的簇中心的变化值小于第二阈值或者达到预设的迭代次数。
进一步地,第一距离或者第二距离的表达式为:
式中,求和符号的范围为多维空间中的所有维度;当d为第一距离时,为待识别宝石在第i维的坐标值,/>为聚类簇的簇中心在第i维的坐标值;当d为第二距离时,/>为第一训练数据样本在第i维的坐标值,/>为初始簇的簇中心在第i维的坐标值。
进一步地,将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果,具体为:
将待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,并输入到单层神经网络的优化模型中:
推导函数的表达式为:
Label = softmax();
式中,Label为推导函数;softmax为归一化指数函数;为待识别宝石的第i个特征值;/>为sigmoid函数;/>和/>分别为所述单层神经网络的优化模型的第一参数和第二参数;其中,所述第一参数为不同特征对应的权值矩阵,所述第二参数为截距向量,表示与特征值无关的偏差值;
根据所述推导函数的结果,确定所述待识别宝石的子类类别,并作为子类识别结果。
进一步地,单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来,具体为:
建立初始单层神经网络,将第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,生成训练数据集;
将所述训练数据集输入到所述初始单层神经网络的优化模型中,并对训练数据集中的每个第二训练数据样本分别建立损失函数;
以所有所述损失函数的整体最小化为目标,对所述初始单层神经网络进行迭代训练,同时迭代更新初始单层神经网络的优化模型中的第一参数和第二参数,达到迭代结束条件后,得到单层神经网络。
进一步地,若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息,还包括:
若两个所述第一距离的差值不小于第一阈值,将所述第一距离更小的对应的聚类簇的子类类别作为所述待识别宝石的子类类别,生成所述待识别宝石的识别结果。
作为优选方案,本发明对海蓝宝石的子类识别的依据分为两部分:宝石的基础参数(包括宝石CIE均匀色度坐标)和宝石特征化学元素(包括主量化学成分含量、微量元素及含量)。同时,本发明根据两部分识别依据的权重占比进行综合分析,分别用了不同的识别方法进行分类组合运算。
首先,本发明利用聚类算法对历史宝石的色度坐标和主量化学成分含量,进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,尝试确定待识别宝石的子类类型。
若利用该方法确定待识别宝石与两种子类的历史宝石的特征的对比结果比较相似,则利用待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息,进行进一步子类识别。本发明利用单层神经网络对历史宝石的微量元素含量信息、色度坐标信息和致色元素含量进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,可以确定与两种子类的历史宝石的特征比较相似的待识别宝石的子类类型。
由此,本发明通过获取宝石的基础参数和特征化学元素,运用历史宝石基础参数训练数据库和特征化学元素训练数据库进行分析,实现对海蓝宝石的子类类型的自动识别,同时,通过聚类算法或者单层神经网络对历史宝石的特征变量进行分类组合运算,提高对海蓝宝石“圣玛利亚”及“超级圣玛利亚”两种细分子类的识别的精度和效率。
相应地,本发明还提供一种海蓝宝石的子类识别装置,包括:聚类识别模块和神经网络识别模块;
其中,聚类识别模块用于根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离;每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来;所述第一训练数据样本包括第一子类和第二子类的海蓝宝石;
神经网络识别模块用于若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息;将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果;所述单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来。
作为优选方案,本发明装置的聚类识别模块利用聚类算法对历史宝石的色度坐标和主量化学成分含量,进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,尝试确定待识别宝石的子类类型。
若利用该装置确定待识别宝石与两种子类的历史宝石的特征的对比结果比较相似,则利用待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息,进行进一步子类识别。本发明神经网络识别模块利用单层神经网络对历史宝石的微量元素含量信息、色度坐标信息和致色元素含量进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,可以确定与两种子类的历史宝石的特征比较相似的待识别宝石的子类类型。
由此,本发明通过获取宝石的基础参数和特征化学元素,运用历史宝石基础参数训练数据库和特征化学元素训练数据库进行分析,实现对海蓝宝石的子类类型的自动识别,同时,通过聚类算法或者单层神经网络对历史宝石的特征变量进行分类组合运算,提高对海蓝宝石“圣玛利亚”及“超级圣玛利亚”两种细分子类的识别的精度和效率。
相应地,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如本发明内容所述的一种海蓝宝石的子类识别方法。
附图说明
图1是本发明提供的海蓝宝石的子类识别方法的一种实施例的流程示意图;
图2是本发明提供的海蓝宝石的子类识别装置的一种实施例的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
请参照图1,为本发明实施例提供的一种海蓝宝石的子类识别方法,包括步骤S101-S102:
步骤S101:根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离;每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来;所述第一训练数据样本包括第一子类和第二子类的海蓝宝石;
在本实施例中,待识别宝石为海蓝宝石,色度坐标信息包括CIE色度坐标,使用颜色测试对样品的CIE色度坐标进行确定。海蓝宝石的致色元素以Fe为主,通过对样品进行化学成分测试,获取致色元素Fe的含量信息。
在本实施例中,第一训练数据样本为包括第一子类和第二子类的海蓝宝石,第一子类和第二子类分别代表“圣玛利亚”和“超级圣玛利亚”。
进一步地,根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离,具体为:
根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石的在多维空间中与每个簇的簇中心的之间的第一距离;其中,每个所述多维空间的维度为所述色度坐标信息和所述致色元素含量信息的特征的数量。
示例性地,当样本的致色元素只有Fe一种时,色度坐标信息和致色元素含量信息的特征的数量为3,即致色元素Fe含量值,色度坐标的横坐标值和纵坐标值3个特征,则要将样本的3个特征转换为三维空间上的点,其中x轴表示色度坐标的横坐标值,y轴表示色度坐标的纵坐标值。这样,每个样本就对应一个平面上的点。同时将Fe含量值作为z轴。
在本实施例中,选择一个合适的聚类方法,例如K-means算法,来将样本点分为两个簇(聚类簇),分别代表“圣玛利亚”和“超级圣玛利亚”。
进一步地,每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来,具体为:
根据若干个所述第一训练数据样本各自的标签,在第一训练数据样本中随机选取其中两个训练数据样本分别作为两个初始簇的簇中心;其中,所述标签的内容为对应的第一训练数据样本的子类信息;两个所述第一训练数据样本的标签内容分别为第一子类和第二子类;
计算每个所述第一训练数据样本与两个所述初始簇的簇中心在多维空间中的第二距离,将每个第一训练数据样本分别分配到所述第二距离更小的对应的初始簇中,以更新两个所述初始簇;所述第二距离根据每个第一训练数据样本与初始簇的簇中心的色度坐标信息和致色元素含量信息计算而来;
根据两个更新后的初始簇各自的簇中心与每个第一训练数据样本在多维空间中的距离,重新对每个第一训练数据样本进行分配,直到达到预设条件,以完成两个初始簇的迭代训练,得到两个聚类簇;所述预设条件包括:连续若干个同一子类的簇中心的变化值小于第二阈值或者达到预设的迭代次数。
进一步地,第一距离或者第二距离的表达式为:
式中,求和符号的范围为多维空间中的所有维度;当d为第一距离时,为待识别宝石在第i维的坐标值,/>为聚类簇的簇中心在第i维的坐标值;当d为第二距离时,/>为第一训练数据样本在第i维的坐标值,/>为初始簇的簇中心在第i维的坐标值。
步骤S102:若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息;将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果;所述单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来。
进一步地,若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息,还包括:
若两个所述第一距离的差值不小于第一阈值,将所述第一距离更小的对应的聚类簇的子类类别作为所述待识别宝石的子类类别,生成所述待识别宝石的识别结果。
在本实施例中,若待识别宝石与第一聚类簇的簇中心的距离为L1,待识别宝石与第二聚类簇的簇中心的距离为L2;若两个第一距离,即L1和L2相差超过10%,则选择距离更近的簇对应的标签,作为最终的判定指标。若两个距离相差不超过10%,即样本的CIE色度坐标和致色元素含量相近时,则使用下面介绍的单层神经网络进行进一步判定。
在本实施例中,获取所述待识别宝石的微量元素含量信息,具体为:对样品进行化学成分测试,以确定其化学成分包括:主量化学成分及含量和微量元素及含量,这些化学成分以致色元素Fe为主,同时可能包括Na2O, MgO, Sc, V, Cr, Ga, Rb, Cs和Be3Al2Si6O18等其他元素或化合物。
进一步地,所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果,具体为:
将待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,并输入到单层神经网络的优化模型中:
推导函数的表达式为:
Label = softmax();
式中,Label为推导函数;softmax为归一化指数函数;为待识别宝石的第i个特征值;/>为sigmoid函数;/>和/>分别为所述单层神经网络的优化模型的第一参数和第二参数;其中,所述第一参数为不同特征对应的权值矩阵,所述第二参数为截距向量,表示与特征值无关的偏差值;
根据所述推导函数的结果,确定所述待识别宝石的子类类别,并作为子类识别结果。
进一步地,单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来,具体为:
建立初始单层神经网络,将第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,生成训练数据集;
将所述训练数据集输入到所述初始单层神经网络的优化模型中,并对训练数据集中的每个第二训练数据样本分别建立损失函数;
以所有所述损失函数的整体最小化为目标,对所述初始单层神经网络进行迭代训练,同时迭代更新初始单层神经网络的优化模型中的第一参数和第二参数,达到迭代结束条件后,得到单层神经网络。
在本实施例中,训练数据集为,/>为1代表第一子类,/>为0代表第二子类;
训练数据集中的数据分为两部分:第一部分为训练样本的特征值,以表示;特别的:/>表示第i个样本的所有特征值,/>表示第i个样本的第j个特征值。训练数据集的第二个部分为训练样本的子类标记,以/>表示;特别的:/>表示第i个样本的子类标记。
将所述训练数据集输入到所述初始单层神经网络的优化模型中,并对训练数据集中的每个第二训练数据样本分别建立损失函数;
所述损失函数的表达式为:
式中,为第i个第二训练数据样本的损失函数;w和b为初始单层神经网络的优化模型的第一参数和第二参数;
以所述损失函数的整体最小化为目标,即,使用正向传播和反向传播对所述初始单层神经网络进行迭代训练,同时迭代更新初始单层神经网络的优化模型中的第一参数和第二参数,达到迭代结束条件后,得到单层神经网络。
其中,在单次迭代中,对w和b的更新为:
式中,和/>分别为上一次迭代的优化模型中的第一参数和第二参数;/>和/>分别为当前迭代的优化模型中的第一参数和第二参数;x为训练数据样本的特征;y为对应的子类类别;/>为固定步长。迭代过程将不断重复直至收敛,得到最终的单层神经网络的优化模型中的第一参数和第二参数/>和/>
为了更好说明本实施例,以下提供一个具体的工作流程:
1、使用图形化界面输入历史宝石样本的特征数据,建立历史数据库;
2、根据随机种子,将数据划分为训练数据和验证数据;
3、读取训练数据内容,包括训练数据的微量元素含量(浮点类型)、致色元素Fe含量(浮点数类型)CIE色度坐标和期望标签(+1/-1);
4、打包上述训练数据到csv文件,其中每个csv文件代表一个样本;
5、使用随机数初始化两个聚类簇的中心参数;
6、根据训练数据坐标点与聚类簇中心的距离进行聚类;
7、根据聚类结果重新计算聚类簇中心;
8、重复6-7直至聚类簇中心不再变化,或重复次数已进行100次;
9、保存两个聚类簇的中心参数;
10、计算待测数据与两个聚类簇分别的距离d1和d2;
11、若d1和d2差距较大,则输出更小的距离对应的海蓝宝石种类;若d1和d2差距较小,则进一步利用SVM对宝石进行鉴定;
12、根据识别的样本和对应的输出作为鉴定结果写入固定的文本文件。
进一步地,利用SVM对宝石进行鉴定具体如下:
读取训练集样本的数据,包括微量元素含量(浮点类型)、致色元素Fe含量(浮点数类型)CIE色度坐标和期望标签(1/0);
设定惩罚参数集合,使用/>分别训练出若干单层神经网络,从中选取分类效果最好的单层神经网络模型,保存最终的参数:/>
根据推导函数Label = softmax()对宝石进行“圣玛利亚”和“超级圣玛利亚”的鉴定;将推导函数的输出1和0分别映射到“圣玛利亚”和“超级圣玛利亚”。
实施本发明实施例,具有如下效果:
本发明对海蓝宝石的子类识别的依据分为两部分:宝石的基础参数(包括宝石CIE均匀色度坐标)和宝石特征化学元素(包括主量化学成分含量、微量元素及含量)。同时,本发明根据两部分识别依据的权重占比进行综合分析,分别用了不同的识别方法进行分类组合运算。
首先,本发明利用聚类算法对历史宝石的色度坐标和主量化学成分含量,进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,尝试确定待识别宝石的子类类型。
若利用该方法确定待识别宝石与两种子类的历史宝石的特征的对比结果比较相似,则利用待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息,进行进一步子类识别。本发明利用单层神经网络对历史宝石的微量元素含量信息、色度坐标信息和致色元素含量进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,可以确定与两种子类的历史宝石的特征比较相似的待识别宝石的子类类型。
由此,本发明通过获取宝石的基础参数和特征化学元素,运用历史宝石基础参数训练数据库和特征化学元素训练数据库进行分析,实现对海蓝宝石的子类类型的自动识别,同时,通过聚类算法或者单层神经网络对历史宝石的特征变量进行分类组合运算,提高对海蓝宝石“圣玛利亚”及“超级圣玛利亚”两种细分子类的识别的精度和效率。
实施例二
请参照图2,为本发明实施例提供的一种海蓝宝石的子类识别装置,包括: 聚类识别模块201和神经网络识别模块202;
其中,聚类识别模块201用于根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离;每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来;所述第一训练数据样本包括第一子类和第二子类的海蓝宝石;
神经网络识别模块202用于若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息;将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果;所述单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来。
聚类识别模块201包括:计算单元、聚类训练单元和判断单元;
计算单元用于根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离,具体为:
根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石的在多维空间中与每个簇的簇中心的之间的第一距离;其中,每个所述多维空间的维度为所述色度坐标信息和所述致色元素含量信息的特征的数量。
聚类训练单元用于根据若干个所述第一训练数据样本各自的标签,在第一训练数据样本中随机选取其中两个训练数据样本分别作为两个初始簇的簇中心;其中,所述标签的内容为对应的第一训练数据样本的子类信息;两个所述第一训练数据样本的标签内容分别为第一子类和第二子类;
计算每个所述第一训练数据样本与两个所述初始簇的簇中心在多维空间中的第二距离,将每个第一训练数据样本分别分配到所述第二距离更小的对应的初始簇中,以更新两个所述初始簇;所述第二距离根据每个第一训练数据样本与初始簇的簇中心的色度坐标信息和致色元素含量信息计算而来;
根据两个更新后的初始簇各自的簇中心与每个第一训练数据样本在多维空间中的距离,重新对每个第一训练数据样本进行分配,直到达到预设条件,以完成两个初始簇的迭代训练,得到两个聚类簇;所述预设条件包括:连续若干个同一子类的簇中心的变化值小于第二阈值或者达到预设的迭代次数。
第一距离或者第二距离的表达式为:
式中,求和符号的范围为多维空间中的所有维度;当d为第一距离时,为待识别宝石在第i维的坐标值,/>为聚类簇的簇中心在第i维的坐标值;当d为第二距离时,/>为第一训练数据样本在第i维的坐标值,/>为初始簇的簇中心在第i维的坐标值。
判断单元用于若两个所述第一距离的差值不小于第一阈值,将所述第一距离更小的对应的聚类簇的子类类别作为所述待识别宝石的子类类别,生成所述待识别宝石的识别结果。
神经网络识别模块202包括:识别单元和神经网络训练单元;
识别单元用于将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果,具体为:
将待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,并输入到单层神经网络的优化模型中:
推导函数的表达式为:
Label = softmax();
式中,Label为推导函数;softmax为归一化指数函数;为待识别宝石的第i个特征值;/>为sigmoid函数;/>和/>分别为所述单层神经网络的优化模型的第一参数和第二参数;其中,所述第一参数为不同特征对应的权值矩阵,所述第二参数为截距向量,表示与特征值无关的偏差值;
根据所述推导函数的结果,确定所述待识别宝石的子类类别,并作为子类识别结果。
神经网络训练单元用于建立初始单层神经网络,将第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,生成训练数据集;
将所述训练数据集输入到所述初始单层神经网络的优化模型中,并对训练数据集中的每个第二训练数据样本分别建立损失函数;
以所有所述损失函数的整体最小化为目标,对所述初始单层神经网络进行迭代训练,同时迭代更新初始单层神经网络的优化模型中的第一参数和第二参数,达到迭代结束条件后,得到单层神经网络。
上述的海蓝宝石的子类识别装置可实施上述方法实施例的海蓝宝石的子类识别方法。上述方法实施例中的可选项也适用于本实施例,这里不再详述。本申请实施例的其余内容可参照上述方法实施例的内容,在本实施例中,不再进行赘述。
实施本发明实施例,具有如下效果:
本发明装置的聚类识别模块利用聚类算法对历史宝石的色度坐标和主量化学成分含量,进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,尝试确定待识别宝石的子类类型。
若利用该装置确定待识别宝石与两种子类的历史宝石的特征的对比结果比较相似,则利用待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息,进行进一步子类识别。本发明神经网络识别模块利用单层神经网络对历史宝石的微量元素含量信息、色度坐标信息和致色元素含量进行分类组合运算,结合待识别宝石的色度坐标信息和致色元素含量信息进行对比,可以确定与两种子类的历史宝石的特征比较相似的待识别宝石的子类类型。
由此,本发明通过获取宝石的基础参数和特征化学元素,运用历史宝石基础参数训练数据库和特征化学元素训练数据库进行分析,实现对海蓝宝石的子类类型的自动识别,同时,通过聚类算法或者单层神经网络对历史宝石的特征变量进行分类组合运算,提高对海蓝宝石“圣玛利亚”及“超级圣玛利亚”两种细分子类的识别的精度和效率。
实施例三
相应地,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如上任意一项实施例所述的海蓝宝石的子类识别方法。
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
所述终端设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器、存储器。
所称处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器 (Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列 (Field-Programmable Gate Array,FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接整个终端设备的各个部分。
所述存储器可用于存储所述计算机程序和/或模块,所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块,以及调用存储在存储器内的数据,实现终端设备的各种功能。所述存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据移动终端的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card, SMC),安全数字(SecureDigital, SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
其中,所述终端设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种海蓝宝石的子类识别方法,其特征在于,包括:
根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离;每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来;所述第一训练数据样本包括第一子类和第二子类的海蓝宝石;
若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息;将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果;所述单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来。
2.如权利要求1所述的一种海蓝宝石的子类识别方法,其特征在于,所述根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离,具体为:
根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石的在多维空间中与每个簇的簇中心的之间的第一距离;其中,每个所述多维空间的维度为所述色度坐标信息和所述致色元素含量信息的特征的数量。
3.如权利要求2所述的一种海蓝宝石的子类识别方法,其特征在于,所述每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来,具体为:
根据若干个所述第一训练数据样本各自的标签,在第一训练数据样本中随机选取其中两个训练数据样本分别作为两个初始簇的簇中心;其中,所述标签的内容为对应的第一训练数据样本的子类信息;两个所述第一训练数据样本的标签内容分别为第一子类和第二子类;
计算每个所述第一训练数据样本与两个所述初始簇的簇中心在多维空间中的第二距离,将每个第一训练数据样本分别分配到所述第二距离更小的对应的初始簇中,以更新两个所述初始簇;所述第二距离根据每个第一训练数据样本与初始簇的簇中心的色度坐标信息和致色元素含量信息计算而来;
根据两个更新后的初始簇各自的簇中心与每个第一训练数据样本在多维空间中的距离,重新对每个第一训练数据样本进行分配,直到达到预设条件,以完成两个初始簇的迭代训练,得到两个聚类簇;所述预设条件包括:连续若干个同一子类的簇中心的变化值小于第二阈值或者达到预设的迭代次数。
4.如权利要求3所述的一种海蓝宝石的子类识别方法,其特征在于,所述第一距离或者第二距离的表达式为:
式中,求和符号的范围为多维空间中的所有维度;当d为第一距离时,为待识别宝石在第i维的坐标值,/>为聚类簇的簇中心在第i维的坐标值;当d为第二距离时,/>为第一训练数据样本在第i维的坐标值,/>为初始簇的簇中心在第i维的坐标值。
5.如权利要求1所述的一种海蓝宝石的子类识别方法,其特征在于,所述将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果,具体为:
将待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,并输入到单层神经网络的优化模型中:
推导函数的表达式为:
Label = softmax();
式中,Label为推导函数;softmax为归一化指数函数;为待识别宝石的第i个特征值;为sigmoid函数;/>和/>分别为所述单层神经网络的优化模型的第一参数和第二参数;其中,所述第一参数为不同特征对应的权值矩阵,所述第二参数为截距向量,表示与特征值无关的偏差值;
根据所述推导函数的结果,确定所述待识别宝石的子类类别,并作为子类识别结果。
6.如权利要求5所述的一种海蓝宝石的子类识别方法,其特征在于,所述单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来,具体为:
建立初始单层神经网络,将第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息转化为对应的特征值,生成训练数据集;
将所述训练数据集输入到所述初始单层神经网络的优化模型中,并对训练数据集中的每个第二训练数据样本分别建立损失函数;
以所有所述损失函数的整体最小化为目标,对所述初始单层神经网络进行迭代训练,同时迭代更新初始单层神经网络的优化模型中的第一参数和第二参数,达到迭代结束条件后,得到单层神经网络。
7.如权利要求1所述的一种海蓝宝石的子类识别方法,其特征在于,所述若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息,还包括:
若两个所述第一距离的差值不小于第一阈值,将所述第一距离更小的对应的聚类簇的子类类别作为所述待识别宝石的子类类别,生成所述待识别宝石的识别结果。
8.一种海蓝宝石的子类识别装置,其特征在于,包括:聚类识别模块和神经网络识别模块;
其中,聚类识别模块用于根据待识别宝石的色度坐标信息和致色元素含量信息,计算所述待识别宝石与两个聚类簇的簇中心的第一距离;每个所述聚类簇根据若干个第一训练数据样本的色度坐标信息和致色元素含量信息迭代训练而来;所述第一训练数据样本包括第一子类和第二子类的海蓝宝石;
神经网络识别模块用于若两个所述第一距离的差值小于第一阈值,则获取所述待识别宝石的微量元素含量信息;将所述待识别宝石的微量元素含量信息、色度坐标信息和致色元素含量信息输入到单层神经网络,生成子类识别结果;所述单层神经网络根据不同子类的第二训练数据样本的微量元素含量信息、色度坐标信息和致色元素含量信息训练而来。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如权利要求1至7中任意一项所述的一种海蓝宝石的子类识别方法。
CN202311062239.7A 2023-08-23 2023-08-23 一种海蓝宝石的子类识别方法、装置及存储介质 Pending CN116777915A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311062239.7A CN116777915A (zh) 2023-08-23 2023-08-23 一种海蓝宝石的子类识别方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311062239.7A CN116777915A (zh) 2023-08-23 2023-08-23 一种海蓝宝石的子类识别方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN116777915A true CN116777915A (zh) 2023-09-19

Family

ID=88006700

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311062239.7A Pending CN116777915A (zh) 2023-08-23 2023-08-23 一种海蓝宝石的子类识别方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN116777915A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100142189A1 (en) * 2008-02-07 2010-06-10 Mitsubishi Chemical Corporation Semiconductor light emitting device, backlight, color image display device and phosphor to be used for them
CN105825480A (zh) * 2016-03-09 2016-08-03 西安电子科技大学 一种基于蓝宝石表面缺损自动化检测的图像去模糊方法
WO2017063174A1 (zh) * 2015-10-13 2017-04-20 中国地质大学(武汉) 一种定量判别软玉产地的方法
CN115618282A (zh) * 2022-12-16 2023-01-17 国检中心深圳珠宝检验实验室有限公司 一种合成宝石的鉴定方法、装置及存储介质
CN116150678A (zh) * 2023-01-18 2023-05-23 广州番禺职业技术学院 一种基于色度坐标的黄玉颜色分类分级方法及装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100142189A1 (en) * 2008-02-07 2010-06-10 Mitsubishi Chemical Corporation Semiconductor light emitting device, backlight, color image display device and phosphor to be used for them
WO2017063174A1 (zh) * 2015-10-13 2017-04-20 中国地质大学(武汉) 一种定量判别软玉产地的方法
CN105825480A (zh) * 2016-03-09 2016-08-03 西安电子科技大学 一种基于蓝宝石表面缺损自动化检测的图像去模糊方法
CN115618282A (zh) * 2022-12-16 2023-01-17 国检中心深圳珠宝检验实验室有限公司 一种合成宝石的鉴定方法、装置及存储介质
CN116150678A (zh) * 2023-01-18 2023-05-23 广州番禺职业技术学院 一种基于色度坐标的黄玉颜色分类分级方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
黄旭: "基于SVM的均匀色空间中宝石绿色分类预测", 《中国优秀硕士学位论文全文数据库基础科学辑》, no. 10, pages 011 - 76 *

Similar Documents

Publication Publication Date Title
Wu et al. Visualizing and interpreting single-cell gene expression datasets with similarity weighted nonnegative embedding
Kuo et al. A hybrid metaheuristic and kernel intuitionistic fuzzy c-means algorithm for cluster analysis
Kraus et al. Classifying and segmenting microscopy images with deep multiple instance learning
CN110263821B (zh) 交易特征生成模型的训练、交易特征的生成方法和装置
Zhao et al. Deep image clustering with category-style representation
Yan et al. Unsupervised and semi‐supervised learning: The next frontier in machine learning for plant systems biology
Wagner et al. Accurate denoising of single-cell RNA-Seq data using unbiased principal component analysis
CN112395487B (zh) 信息推荐方法、装置、计算机可读存储介质及电子设备
CN109726391B (zh) 对文本进行情感分类的方法、装置及终端
CN108334951A (zh) 针对决策树的节点的数据的预统计
US20210166058A1 (en) Image generation method and computing device
CN111061933A (zh) 图片样本库构建方法、装置、可读存储介质及终端设备
Chew et al. Large-scale 3D point-cloud semantic segmentation of urban and rural scenes using data volume decomposition coupled with pipeline parallelism
He et al. Pointinst3d: Segmenting 3d instances by points
Ma et al. A spectral method for assessing and combining multiple data visualizations
CN113128565B (zh) 面向预训练标注数据不可知的图像自动标注系统和装置
WO2015087148A1 (en) Classifying test data based on a maximum margin classifier
CN116777915A (zh) 一种海蓝宝石的子类识别方法、装置及存储介质
CN111259806B (zh) 一种人脸区域识别方法、装置及存储介质
CN113408665A (zh) 对象识别方法、装置、设备及介质
CN112818067A (zh) 结合大数据和多维特征的数据溯源方法及大数据云服务器
Yuan et al. Dappfc: density-based affinity propagation for parameter free clustering
US20230146635A1 (en) Method and Systems for Conditioning Data Sets for Efficient Computational Processing
US8738303B2 (en) Identifying outliers among chemical assays
US20240169688A1 (en) Image texture manipulation for machine learning data augmentation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination