CN105548066A - 一种胶体种类区分方法及系统 - Google Patents
一种胶体种类区分方法及系统 Download PDFInfo
- Publication number
- CN105548066A CN105548066A CN201510917094.3A CN201510917094A CN105548066A CN 105548066 A CN105548066 A CN 105548066A CN 201510917094 A CN201510917094 A CN 201510917094A CN 105548066 A CN105548066 A CN 105548066A
- Authority
- CN
- China
- Prior art keywords
- colloid
- measured
- sample
- isolated point
- clustering algorithm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000084 colloidal system Substances 0.000 title claims abstract description 175
- 238000000034 method Methods 0.000 title claims abstract description 58
- 238000003064 k means clustering Methods 0.000 claims abstract description 28
- 238000001228 spectrum Methods 0.000 claims description 32
- 238000000513 principal component analysis Methods 0.000 claims description 23
- 230000003595 spectral effect Effects 0.000 claims description 16
- 230000005856 abnormality Effects 0.000 claims description 7
- 238000009499 grossing Methods 0.000 claims description 6
- 238000011946 reduction process Methods 0.000 claims description 6
- 238000013459 approach Methods 0.000 claims description 5
- 238000010183 spectrum analysis Methods 0.000 abstract description 7
- 238000004451 qualitative analysis Methods 0.000 abstract description 6
- 239000003153 chemical reaction reagent Substances 0.000 abstract description 5
- 239000002245 particle Substances 0.000 abstract description 4
- 239000011159 matrix material Substances 0.000 description 19
- 241000894007 species Species 0.000 description 13
- 239000002775 capsule Substances 0.000 description 10
- 238000005516 engineering process Methods 0.000 description 10
- 229920000159 gelatin Polymers 0.000 description 10
- 108010010803 Gelatin Proteins 0.000 description 9
- 239000008273 gelatin Substances 0.000 description 9
- 235000019322 gelatine Nutrition 0.000 description 9
- 235000011852 gelatine desserts Nutrition 0.000 description 9
- 239000003292 glue Substances 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000002329 infrared spectrum Methods 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 5
- 235000019504 cigarettes Nutrition 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- IXPNQXFRVYWDDI-UHFFFAOYSA-N 1-methyl-2,4-dioxo-1,3-diazinane-5-carboximidamide Chemical compound CN1CC(C(N)=N)C(=O)NC1=O IXPNQXFRVYWDDI-UHFFFAOYSA-N 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 235000010413 sodium alginate Nutrition 0.000 description 4
- 239000000661 sodium alginate Substances 0.000 description 4
- 229940005550 sodium alginate Drugs 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 3
- 238000000113 differential scanning calorimetry Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 239000011257 shell material Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 241000208125 Nicotiana Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 238000000862 absorption spectrum Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000002994 raw material Substances 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000002235 transmission spectroscopy Methods 0.000 description 2
- HRPVXLWXLXDGHG-UHFFFAOYSA-N Acrylamide Chemical compound NC(=O)C=C HRPVXLWXLXDGHG-UHFFFAOYSA-N 0.000 description 1
- 229920002148 Gellan gum Polymers 0.000 description 1
- 229920000161 Locust bean gum Polymers 0.000 description 1
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 1
- 229920001938 Vegetable gum Polymers 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000001354 calcination Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 238000003795 desorption Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 235000013373 food additive Nutrition 0.000 description 1
- 239000002778 food additive Substances 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 235000010492 gellan gum Nutrition 0.000 description 1
- 239000000216 gellan gum Substances 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000010985 leather Substances 0.000 description 1
- 235000010420 locust bean gum Nutrition 0.000 description 1
- 239000000711 locust bean gum Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- FEMOMIGRRWSMCU-UHFFFAOYSA-N ninhydrin Chemical compound C1=CC=C2C(=O)C(O)(O)C(=O)C2=C1 FEMOMIGRRWSMCU-UHFFFAOYSA-N 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 108010048734 sclerotin Proteins 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000001931 thermography Methods 0.000 description 1
- 235000019505 tobacco product Nutrition 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- YNJBWRMUSHSURL-UHFFFAOYSA-N trichloroacetic acid Chemical compound OC(=O)C(Cl)(Cl)Cl YNJBWRMUSHSURL-UHFFFAOYSA-N 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/35—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
- G01N21/359—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
Landscapes
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Analytical Chemistry (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明涉及一种胶体种类区分方法及系统。该方法包括:采集待测胶体中每个样本的近红外光谱信息;根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心并利用k-均值聚类算法将所述待测胶体分类。本发明利用近红外光谱分析技术定性分析胶体种类,只需将胶体打磨成一定粒径样品后,利用近红外光谱仪采集样品的近红外光谱信息,根据胶体样品的近红外光谱信息,运用k-均值聚类算法快速判别胶体种类,无需对胶体样本进行繁琐的预处理,无需使用化学试剂,操作简单,胶体种类区分速度快。
Description
技术领域
本发明涉及胶体种类鉴别领域,尤其涉及一种胶体种类区分方法及系统。
背景技术
在利用胶体制作产品的过程中,需要区分胶体种类以提升产品的品质。在烟草加工过程中,烟用胶囊可以改善烟草的品质,增强卷烟的香味特征,提升烟草制品的感官品质。烟用胶囊的胶囊壳材料主要是由各种动植物胶制成的,需要对胶体种类进行区分,以保证原料的稳定性和品质质量。
不同胶体有不同的检测指标,按照企标《QB2354-2005药用明胶》可以通过检测明胶凝冻强度、勃氏黏度、灰分等指标来区分骨质明胶和皮制明胶;按照国标《GB1976-2008食品添加剂褐藻酸钠》可以通过检测海藻酸钠的黏度来判断海藻酸钠是低黏度、中黏度或高黏度产品;可以采用氨基酸分析法,通过测定氨基酸组成比来鉴定胶体种类;可以采用差示扫描量热法(differentialscanningcalorimetry,DSC),通过扫描胶体的热谱,对比样品热焓值的大小来鉴别胶体种类;可以采用聚丙烯酰胺凝胶电泳法(PAGE),通过凝胶制备——加样——电泳——染色,根据胶类的电泳谱带数目、分布区域以及着色程度来鉴别胶体种类。这些胶体分类方法需要对样品进行相应的前处理,步骤繁杂、耗时耗力,如在测定明胶凝冻强度时,需要胶体溶液在10±0.1℃低温槽内冷冻16h~18h;测定明胶灰分时,需要将明胶置于600±10℃的高温炉中灼烧至留下白色或淡黄色灰分为止;差示扫描量热法需要将胶体加热或冷却,使其发生溶解、凝固、分解、化合、吸附、脱附、晶型转变等化学或物理变化。有些方法还需要使用化学试剂,对环境造成污染,如氨基酸分析法需要使用柠檬酸三钠、茚三酮,聚丙烯酰胺凝胶电泳法需要使用丙烯酰胺、四甲基乙二胺、三氯醋酸等。
近红外(NearInfrared,NIR)光是指波长介于可见光区与中红外区之间的电磁波,按照ASTM定义是指波长在780nm~2526nm范围的电磁波。近红外光谱根据检测对象的不同,可以分为近红外反射光谱和近红外透射光谱。近红外反射光谱是根据反射与入射光强的比例关系来获得物质在近红外光谱区的吸收光谱,一般用于测量固体和粉末类样品;近红外透射光谱是根据透射与入射光强的比例关系来获得物质在近红外光谱区的吸收光谱,一般用于均匀透明的溶液或固体样品。
发明内容
本发明所要解决的技术问题是:现有的胶体种类区分方法操作繁琐、检测时间长、化学试剂用量多的问题。
为解决上述技术问题,本发明一方面提出了一种胶体种类区分方法,该方法包括:
采集待测胶体中每个样本的近红外光谱信息;
根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心;利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类。
可选地,在根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数之前,还包括:
利用求导、平滑方法对所述近红外光谱信息进行降噪处理;
基于主成分分析的马氏距离法剔除异常的光谱信息。
可选地,在所述根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数之前,还包括:
根据所述待测胶体的主成分分布信息获取所述待测胶体的胶体种类数。
可选地,在所述确定k-均值聚类算法的聚类簇数之前,还包括:
根据所述待测胶体中各个样本之间的欧式距离,获取所述待测胶体中的欧式距离大于预定阈值的样本孤立点;
相应地,在所述利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类之后,还包括:
根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类。
可选地,所述根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类,包括:
获取样本孤立点与各个聚类中心的距离,选择与所述距离最小的聚类中心所属的胶体种类为所述样本孤立点的胶体种类。
可选地,所述获取初始聚类中心,包括:
利用随机法、最大最小距离法或点密度法获取初始聚类中心。
另一方面,本发明还提出了一种胶体种类区分系统,该系统包括:
光谱信息采集单元,用于采集待测胶体中每个样本的近红外光谱信息;
胶体分类单元,用于根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心;利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类。
可选地,该系统还包括:
光谱信息校正单元,用于利用求导、平滑方法对所述近红外光谱信息进行降噪处理;基于主成分分析的马氏距离法剔除异常的光谱信息。
可选地,该系统还包括:
胶体种类数获取单元,用于根据所述待测胶体的主成分分布信息获取所述待测胶体的胶体种类数。
可选地,该系统还包括:
样本孤立点胶体种类确定单元,用于根据所述待测胶体中各个样本之间的欧式距离,获取所述待测胶体中的欧式距离大于预定阈值的样本孤立点,根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类。
本发明利用近红外光谱分析技术定性分析胶体种类,只需将胶体打磨成一定粒径样品后,利用近红外光谱仪采集样品的近红外光谱信息,根据胶体样品的近红外光谱信息,运用k-均值聚类算法快速判别胶体种类,无需对胶体样本进行繁琐的预处理,无需使用化学试剂,操作简单,胶体种类区分速度快。
附图说明
通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
图1示出了本发明一个实施例的胶体种类区分方法的示意图;
图2示出了本发明另一个实施例的胶体种类区分方法的示意图;
图3示出了本发明一个实施例的待测胶体的近红外光谱图;
图4示出了本发明一个实施例的待测胶体的主成分分布情况图;
图5示出了本发明一个实施例的待测胶体的分类结果示意图;
图6示出了本发明一个实施例的胶体种类区分系统的结构示意图。
具体实施方式
下面将结合附图对本发明的实施例进行详细描述。
图1示出了本发明一个实施例的胶体种类区分方法的示意图。如图1所示,本实施例的胶体种类区分方法包括:
S1:采集待测胶体中每个样本的近红外光谱信息;
S2:根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心;利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类。
近红外光谱分析技术被誉为“多快好省的绿色分析技术”,是最符合目前工业生产需求的一种分析技术。近红外光谱分析技术主要具有以下优势:①样品无需预处理,不破坏原样品;②检测便捷、快速,检测效率高,检测成分低;③对检测人员无专业化要求;④检测过程无污染;⑤能够实现在线检测分析;⑥既可用于样品的定性检测,也可用于高精度要求的定量检测。
利用近红外光谱分析技术,定性分析胶体种类,只需要采集不同种类胶体样品的近红外光谱,根据胶体样品的近红外光谱信息,即可以反映出真实样品的组成和结构信息。
本实施例适用于各种胶体种类的区分,特别适用于制备烟用胶囊的胶体种类的区分。为了解决胶囊生产过程中原料的品质,特别是胶囊囊壳胶体材料中是否掺有其他杂质,以确保制备胶囊所用原料的纯净和稳定性,保证成品胶囊的品质质量。烟用胶囊的胶囊壳材料主要是由各种动植物胶制成的,这些胶体含有-CH、-NH和-OH等含氢基团,会在近红外光谱区产生吸收峰,因此可以运用近红外定性分析来区分不同品牌的动植物胶。
本实施例利用近红外光谱分析技术定性分析胶体种类,只需将胶体打磨成一定粒径样品后,利用近红外光谱仪采集样品的近红外光谱信息,根据胶体样品的近红外光谱信息,运用k-均值聚类算法快速判别胶体种类,无需对胶体样本进行繁琐的预处理,无需使用化学试剂,操作简单,胶体种类区分速度快。
图2示出了本发明另一个实施例的胶体种类区分方法的示意图。如图2所示,本实施例的胶体种类区分方法包括:
S21:采集待测胶体中每个样本的近红外光谱信息;
S22:利用求导、平滑方法对所述近红外光谱信息进行降噪处理;基于主成分分析的马氏距离法剔除异常的光谱信息;
S23:根据所述待测胶体的主成分分布信息获取所述待测胶体的胶体种类数;
S24:根据所述待测胶体中各个样本之间的欧式距离,获取所述待测胶体中的欧式距离大于预定阈值的样本孤立点;
S25:根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心;利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类;
S26:根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类。
在一种可选的实施方式中,所述根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类,包括:
获取样本孤立点与各个聚类中心的距离,选择与所述距离最小的聚类中心所属的胶体种类为所述样本孤立点的胶体种类。
进一步地,所述获取初始聚类中心,包括:
利用随机法、最大最小距离法或点密度法获取初始聚类中心。
利用原有各个特征去构造一批新特征。每个新特征都是原有各特征的函数,但是新特征的总数应该少于原有各特征的总数,这样,新特征集合既保留了原有各特征的主要信息,又达到了减少特征个数,即降低空间维数的目的,这一类方法可以通称为降维映射方法。主成分分析就是从这一观点出发的特征选择方法。
具体地,基于主成分分析的马氏距离法剔除异常的光谱信息的过程为:
主成分分析方法的具体过程为:
(1)原始矩阵标准化后,求其协方差矩阵,即原始样品矩阵的相关矩阵(将变量标准化后再计算其协方差矩阵,就是直接计算原变量的相关矩阵);
其中,Xij为原样品矩阵;为原样品矩阵的均值矩阵;Sj为原矩阵的标准偏差矩阵;V为标准化样品矩阵;i为试样数,j为变量数;
(2)计算相关矩阵的特征值(λ1,λ2,…,λn)和特征向量A1,A2,...,An;
(3)计算第i个主成分的贡献率;
λi/(λ1+λ2+…+λn)
(4)选择主成分;
(5)计算主成分载荷Lik
(5)计算主成分得分sco
马氏距离的计算过程如下:
其中,ti为校正集i样本光谱的得分;T为校正集所有样本的得分矩阵;为T的平均得分向量;Tcen为T的均值中心化矩阵,即MDi为校正集i样本的马氏距离。
剔除马氏距离大于2f/n的校正样本,其中f为PCA所用的主因子数,n为校正集样本数。
运用马氏距离计算样品间距离时,需要计算样本光谱信息矩阵的协方差矩阵,要求总样本数大于样本的维数,因此要先对样本光谱信息矩阵进行主成分分析,降低样本的维数。
k-均值聚类(K-mean)算法的具体分析方法如下:
(1)从数据集中剔除光谱异常值;
(2)从数据集中挑出孤立点(依据欧氏距离);
孤立点即少量数据点远离数据密集区的情况,是数据集中到第k个最近邻居的距离最大的n个对象。K-mean算法中,每次的聚类计算是将聚类均值点(类中所有数据的平均值)作为新的聚类中心再进行下一轮的聚类计算。若样本开始聚类计算时未除去孤立点,计算得到的聚类均值点会有误差,新的聚类中心可能偏离真正的数据密集区,导致聚类结果出现偏差。因此,在运用K-mean算法时,要先将孤立点从样本集中取出。挑出孤立点方法:先计算数据集中两两样本之间的距离,再计算每个样本与其它样本的距离和,最后按照距离和从大到小依次挑选M个样本。
(3)根据样品集的主成分分布情况,确定聚类簇数k;
(4)确定初始聚类中心;
(5)处理孤立样本点,即将数据集分为k类后,计算每一类样本的中心(均值),判断孤立点与每类样本中心的距离,根据同类间距离小的原则,将孤立点划分到不同的样本集中。
设定初始聚类中心的方法:
(1)随机法
从数据集中随机选出k个样本作为初始聚类中心。
(2)最大最小距离法
最大最小距离法尽可能选取离得远的样本作为聚类中心,避免选取的初始聚类中心过于邻近,使样本集的划分更加有效。在聚类数k一定的情况下,运用最大最小距离法选择初始聚类中心的步骤为:
①根据数据集Xn{x1,x2,…,xn}的特征,选择离原始数据集中心(均值)距离最小的样本,作为第一个初始聚类中心z1;
②若样本的聚类数定为2,则从其余样本中选出离z1距离最大的样本,作为第二个初始聚类中心z2;
③若样本的聚类数定为3,计算z1、z2与未分类样本之间的距离,求出距离中的最小值di,根据Dt=max{di},选择样本xt作为第三个初始聚类中心z3;
④若样本的聚类数定为k,计算z1,z2,…,zk-1与未作为聚类中心的各样本之间的距离dij,根据Dr=max{min(di1,di2,…,di(k-1))},选择样本xr作为第k个初始聚类中心zk。
⑤将剩余各样本按照最小距离的原则分到各类。
(3)点密度法
对于原始数据集,样本分布不均匀,每个类的中心点密度一般要大于类内其它点的密度,因此,可以根据样本点的密度来选择数据集的初始聚类中心,以使初始聚类中心分布较广,减少各类间样本的相似度,增加各类内样本的相似度。
对于数据集X中的样本点xi,以xi为球心,以ε为半径的球体内所包含样本的个数,称为该点的密度,记作Density(xi)。点密度的定义式为:
Density(xi)=|{x∈X|dist(xi,x)≤ε}|
其中,dist(·)两点之间的距离;ε代表半径。
半径ε的计算方法:
其中,mean(X)表示全部样本间距离的平均值;coefε是邻域半径调节系数,一般0<coefε<1;在coefε=0.13时,K-mean算法能够获得最好的聚类效果。
在聚类数k一定的情况下,运用点密度法选择初始聚类中心的步骤为:
①计算数据集X中两两样本之间距离,作为矩阵D;
②根据点密度的计算公式,计算每一个样本的密度Density(xi),i=1,2,…,N。在计算所有样本的密度平均值将密度大于平均密度值的样本放在集合S中;
③选取集合S中密度最大的样本作为第一个初始聚类中心点c1,即Density(c1)=Max{Density(xi)|x∈S),并将c1放于集合C中;
④在S中搜索其它初始聚类中心点cj:
dist(xi)=Min{dist(xi,c)|c∈C,xi∈S\C}
cj∈S\C
dist(cj)=Max{dist(xi)|xi∈S\C};
⑤将cj点加入初始聚类中心点集合M中;
⑥重复步骤④和⑤,直到找出k个初始聚类中心。
在一个胶体种类区分方法的应用中,具体过程为:
(1)选取五种不同种类的胶体,其中A、B为动物胶(明胶A购自河北成大明胶有限公司,明胶B购自蚌埠丰原明胶有限公司),C(刺槐豆胶)、D(海藻酸钠)、E(结冷胶)为植物胶,每种胶体各取5份样品;
(2)将所有样品在室温条件下打磨后过40目筛;
(3)在4000~10000cm-1范围内,采集胶体末样品的离线近红外光谱(见图3);
(4)对样品进行主成分分析(见图4),由动植物胶的第一、第二主成分分析可知:样品集可以分成五类,k=5;
(5)从A、B、C、D、E三种品牌的动植物胶样品中各选取1个样品作为孤立点样品集,运用K-mean算法将剩余的20个样品分类;
(6)从20个样品集中,运用点密度法选出5个样品作为初始聚类中心;
(7)根据孤立点样品集中各样品到每一类样品中心的距离,识别孤立样品属于哪一类动植物胶;
(8)25份胶体样品被分成五类(见图5),与已知样品所属类别信息完全一致。
图6示出了本发明一个实施例的胶体种类区分系统的结构示意图。如图6所示,该系统包括:
光谱信息采集单元61,用于采集待测胶体中每个样本的近红外光谱信息;
胶体分类单元62,用于根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心;利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类。
在一种可选的实施方式中,该系统还包括:
光谱信息校正单元,用于利用求导、平滑方法对所述近红外光谱信息进行降噪处理;基于主成分分析的马氏距离法剔除异常的光谱信息。
进一步地,该系统还包括:
胶体种类数获取单元,用于根据所述待测胶体的主成分分布信息获取所述待测胶体的胶体种类数。
进一步地,该系统还包括:
样本孤立点胶体种类确定单元,用于根据所述待测胶体中各个样本之间的欧式距离,获取所述待测胶体中的欧式距离大于预定阈值的样本孤立点,根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类。
本实施例所述的胶体种类区分系统可以用于执行上述方法实施例,其原理和技术效果类似,此处不再赘述。
本发明利用近红外光谱分析技术定性分析胶体种类,只需将胶体打磨成一定粒径样品后,利用近红外光谱仪采集样品的近红外光谱信息,根据胶体样品的近红外光谱信息,运用k-均值聚类算法快速判别胶体种类,无需对胶体样本进行繁琐的预处理,无需使用化学试剂,操作简单,胶体种类区分速度快。
虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在不脱离本发明的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内。
Claims (10)
1.一种胶体种类区分方法,其特征在于,包括:
采集待测胶体中每个样本的近红外光谱信息;
根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心;
利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类。
2.根据权利要求1所述的胶体种类区分方法,其特征在于,在所述根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数之前,还包括:
利用求导、平滑方法对所述近红外光谱信息进行降噪处理;
基于主成分分析的马氏距离法剔除异常的光谱信息。
3.根据权利要求2所述的胶体种类区分方法,其特征在于,在所述根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数之前,还包括:
根据所述待测胶体的主成分分布信息获取所述待测胶体的胶体种类数。
4.根据权利要求1所述的胶体种类区分方法,其特征在于,在所述确定k-均值聚类算法的聚类簇数之前,还包括:
根据所述待测胶体中各个样本之间的欧式距离,获取所述待测胶体中的欧式距离大于预定阈值的样本孤立点;
相应地,在所述利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类之后,还包括:
根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类。
5.根据权利要求4所述的胶体种类区分方法,其特征在于,根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类,包括:
获取样本孤立点与各个聚类中心的距离,选择与所述距离最小的聚类中心所属的胶体种类为所述样本孤立点的胶体种类。
6.根据权利要求1所述的胶体种类区分方法,其特征在于,所述获取初始聚类中心,包括:
利用随机法、最大最小距离法或点密度法获取初始聚类中心。
7.一种胶体种类区分系统,其特征在于,包括:
光谱信息采集单元,用于采集待测胶体中每个样本的近红外光谱信息;
胶体分类单元,用于根据所述待测胶体的胶体种类数确定k-均值聚类算法的聚类簇数,获取初始聚类中心;利用k-均值聚类算法分析所述待测胶体的近红外光谱信息,将所述待测胶体分类。
8.根据权利要求7所述的胶体种类区分系统,其特征在于,还包括:
光谱信息校正单元,用于利用求导、平滑方法对所述近红外光谱信息进行降噪处理;基于主成分分析的马氏距离法剔除异常的光谱信息。
9.根据权利要求8所述的胶体种类区分系统,其特征在于,还包括:
胶体种类数获取单元,用于根据所述待测胶体的主成分分布信息获取所述待测胶体的胶体种类数。
10.根据权利要求7所述的胶体种类区分系统,其特征在于,还包括:
样本孤立点胶体种类确定单元,用于根据所述待测胶体中各个样本之间的欧式距离,获取所述待测胶体中的欧式距离大于预定阈值的样本孤立点,根据所述样本孤立点与各个聚类中心的距离确定所述样本孤立点的胶体种类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510917094.3A CN105548066A (zh) | 2015-12-11 | 2015-12-11 | 一种胶体种类区分方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510917094.3A CN105548066A (zh) | 2015-12-11 | 2015-12-11 | 一种胶体种类区分方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105548066A true CN105548066A (zh) | 2016-05-04 |
Family
ID=55827407
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510917094.3A Pending CN105548066A (zh) | 2015-12-11 | 2015-12-11 | 一种胶体种类区分方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105548066A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107486410A (zh) * | 2017-08-03 | 2017-12-19 | 国际竹藤中心 | 一种圆竹分级方法 |
CN110334754A (zh) * | 2019-06-26 | 2019-10-15 | 太原科技大学 | 一种将恒星光谱数据快速分类的方法 |
CN110837873A (zh) * | 2019-11-18 | 2020-02-25 | 上海吉七物联网科技有限公司 | 一种三维点云聚类的算法 |
CN111126496A (zh) * | 2019-12-25 | 2020-05-08 | 深圳供电局有限公司 | 变压器固体绝缘材料类型确定方法 |
CN112345486A (zh) * | 2019-08-08 | 2021-02-09 | 湖南中烟工业有限责任公司 | 一种基于近红外光谱技术的单体香原料溶液所用溶剂的判定方法 |
CN113297685A (zh) * | 2021-07-27 | 2021-08-24 | 中汽研(天津)汽车工程研究院有限公司 | 一种车辆运行工况模式识别方法 |
CN113390824A (zh) * | 2021-07-09 | 2021-09-14 | 河北建筑工程学院 | 基于近红外光谱的物质类别识别方法及终端设备 |
CN116994675A (zh) * | 2023-09-28 | 2023-11-03 | 佳木斯大学 | 基于近红外数据的锦灯笼宿萼表皮检测方法 |
-
2015
- 2015-12-11 CN CN201510917094.3A patent/CN105548066A/zh active Pending
Non-Patent Citations (3)
Title |
---|
严衍禄 等编著: "《近红外光谱分析的原理、技术与应用》", 31 January 2013 * |
周爱武 等: "K - Means 算法的研究与改进", 《计算机技术与发展》 * |
蔡勤东: "《大数据时代 企业借助互联网成功转型升级》", 31 July 2015 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107486410B (zh) * | 2017-08-03 | 2019-04-30 | 国际竹藤中心 | 一种圆竹分级方法 |
CN107486410A (zh) * | 2017-08-03 | 2017-12-19 | 国际竹藤中心 | 一种圆竹分级方法 |
CN110334754A (zh) * | 2019-06-26 | 2019-10-15 | 太原科技大学 | 一种将恒星光谱数据快速分类的方法 |
CN112345486B (zh) * | 2019-08-08 | 2022-06-14 | 湖南中烟工业有限责任公司 | 一种基于近红外光谱技术的单体香原料溶液所用溶剂的判定方法 |
CN112345486A (zh) * | 2019-08-08 | 2021-02-09 | 湖南中烟工业有限责任公司 | 一种基于近红外光谱技术的单体香原料溶液所用溶剂的判定方法 |
CN110837873A (zh) * | 2019-11-18 | 2020-02-25 | 上海吉七物联网科技有限公司 | 一种三维点云聚类的算法 |
CN111126496A (zh) * | 2019-12-25 | 2020-05-08 | 深圳供电局有限公司 | 变压器固体绝缘材料类型确定方法 |
CN111126496B (zh) * | 2019-12-25 | 2023-09-08 | 深圳供电局有限公司 | 变压器固体绝缘材料类型确定方法 |
CN113390824B (zh) * | 2021-07-09 | 2022-09-27 | 河北建筑工程学院 | 基于近红外光谱的物质类别识别方法及终端设备 |
CN113390824A (zh) * | 2021-07-09 | 2021-09-14 | 河北建筑工程学院 | 基于近红外光谱的物质类别识别方法及终端设备 |
CN113297685A (zh) * | 2021-07-27 | 2021-08-24 | 中汽研(天津)汽车工程研究院有限公司 | 一种车辆运行工况模式识别方法 |
CN116994675A (zh) * | 2023-09-28 | 2023-11-03 | 佳木斯大学 | 基于近红外数据的锦灯笼宿萼表皮检测方法 |
CN116994675B (zh) * | 2023-09-28 | 2023-12-01 | 佳木斯大学 | 基于近红外数据的锦灯笼宿萼表皮检测方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105548066A (zh) | 一种胶体种类区分方法及系统 | |
CN102564993B (zh) | 一种利用傅里叶变换红外光谱识别大米品种方法及其应用 | |
CN103048273B (zh) | 基于模糊聚类的水果近红外光谱分类方法 | |
CN110243806B (zh) | 拉曼光谱下基于相似度的混合物组分识别方法 | |
CN105044198B (zh) | 一种基于矿质元素指纹鉴别葡萄酒原产地的方法 | |
CN104990892A (zh) | 种子的光谱图像无损鉴别模型建立方法及种子鉴别方法 | |
CN104964950A (zh) | 基于多元素波峰的激光诱导击穿光谱岩屑类型识别方法 | |
CN102183500B (zh) | 基于荧光特征参量欧氏距离的白酒鉴别方法 | |
CN108844941B (zh) | 一种基于拉曼光谱和pca-hca的不同品位磷矿的鉴别和分类方法 | |
CN104376325A (zh) | 一种近红外定性分析模型的建立方法 | |
US20220390374A1 (en) | Method for extracting raman characteristic peaks employing improved principal component analysis | |
CN105181650A (zh) | 一种使用近红外光谱技术快速鉴别茶叶品种的方法 | |
CN115905881B (zh) | 黄珍珠分类的方法以及装置、电子设备、存储介质 | |
CN111783837A (zh) | 一种基于多核学习的特征融合方法 | |
CN103278467A (zh) | 一种植物叶片氮素丰缺快速无损高准确率的鉴别方法 | |
CN104820840A (zh) | 基于字典和波段重组的最近邻高光谱图像分类方法 | |
CN108344701A (zh) | 基于高光谱技术的石蜡等级定性分类与定量回归方法 | |
Wu et al. | Variety identification of Chinese cabbage seeds using visible and near-infrared spectroscopy | |
CN106940292A (zh) | 基于多光谱成像技术的虫蛀巴旦木原料快速无损鉴别方法 | |
CN104933410B (zh) | 一种高光谱图像光谱域与空间域联合分类方法 | |
CN113310934A (zh) | 骆驼奶中掺加奶牛奶及其掺加比例的快速鉴定方法 | |
CN113408616A (zh) | 基于pca-uve-elm的光谱分类方法 | |
CN109886296A (zh) | 一种鉴别信息提取式噪声聚类的茶叶品种分类方法 | |
CN112782148B (zh) | 阿拉比卡和罗伯斯塔两种咖啡豆的快速鉴别方法 | |
CN104297205A (zh) | 一种快速、无损的食用油鉴别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20160504 |