CN115564743B - 纸张典型光谱提取方法、装置及相关设备 - Google Patents
纸张典型光谱提取方法、装置及相关设备 Download PDFInfo
- Publication number
- CN115564743B CN115564743B CN202211275829.3A CN202211275829A CN115564743B CN 115564743 B CN115564743 B CN 115564743B CN 202211275829 A CN202211275829 A CN 202211275829A CN 115564743 B CN115564743 B CN 115564743B
- Authority
- CN
- China
- Prior art keywords
- spectrum
- pixel
- remote sensing
- paper
- cluster
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001228 spectrum Methods 0.000 title claims abstract description 382
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000000605 extraction Methods 0.000 claims abstract description 37
- 238000001914 filtration Methods 0.000 claims abstract description 37
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 20
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000007621 cluster analysis Methods 0.000 claims abstract description 14
- 238000012216 screening Methods 0.000 claims abstract description 14
- 238000004590 computer program Methods 0.000 claims description 12
- 238000009499 grossing Methods 0.000 claims description 10
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 14
- 238000011156 evaluation Methods 0.000 abstract description 8
- 239000000463 material Substances 0.000 abstract description 7
- 230000002159 abnormal effect Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000037303 wrinkles Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000010183 spectrum analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/762—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using clustering, e.g. of similar faces in social networks
- G06V10/763—Non-hierarchical techniques, e.g. based on statistics of modelling distributions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10032—Satellite or aerial image; Remote sensing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10048—Infrared image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20024—Filtering details
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
- G06T2207/30124—Fabrics; Textile; Paper
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Multimedia (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明提供一种纸张典型光谱提取方法、装置及相关设备,通过获取纸张的第一光谱遥感影像;对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇;根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据,通过过滤操作去除干扰数据,有效提高高光谱遥感技术在纸张参量分析、评估结果的准确性以及可靠性;通过聚类算法获取表征纸张材质整体特征的典型光谱,节约提取成本,并且不易受人为主观因素干扰,有利于纸张光谱技术的普及应用。
Description
技术领域
本发明涉及纸张光谱提取技术领域,尤其涉及一种纸张典型光谱提取方法、装置及相关设备。
背景技术
纸张作为信息载体在文化传播、交流中占据相当大的比例,借助高光谱遥感影像技术有效提取纸张中的特征参数对于纸张材质的评测、保护、修复具有重大意义。随着高光谱遥感影像技术的发展与普及,该技术在纸张研究分析当中具有高效、无接触、高精度、图谱合一的信息提取特点,与传统化学法的纸张信息提取技术相比,基于高光谱遥感影像技术的纸张信息提取无需取样,没有对纸张本身的二次损害。因此在获取纸张的高光谱遥感影像后,提取能够表征当前纸张样本整体特性的典型光谱数据,与表征纸张整体特性的属性参数例如粘度、白度、结晶度等进行匹配,可实现纸张参量的评估与监测。
传统提取纸张典型光谱方法包括两种方式,第一种是计算影像中所有像元光谱的均值,该方法计算速度较快,但该方法未能有效考虑到纸张表面异常因素对均值光谱的误差影响,如纸面的污染、劣化、纸张纤维褶皱等都会影响光谱提取结果,因此这种方式提取出的典型光谱未能有效表征纸张整体的物质属性,对后续基于该典型光谱的纸张参量分析存在较大干扰。第二种则是通过人工对纸张表面异常区域进行标注,再将标注后的纸张影像中所有异常区域进行识别、剔除,计算剩余部分的像元光谱均值,但是这种方式提取出的光谱易受人为主观因素干扰,且花费成本大,不利于纸张光谱技术的普及应用。
发明内容
本发明提供一种纸张典型光谱提取方法、装置及相关设备,用以解决现有技术中纸张典型光谱提取方法存在提取结果不能有效表征纸张整体的物质属性,或提取结果易受人为主观因素干扰的缺陷,以实现纸张典型光谱准确、快速提取。
本发明提供一种纸张典型光谱提取方法,包括:
获取纸张的第一光谱遥感影像;
对所述第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;
将所述第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量;
根据所述每个类簇中的像元光谱数量筛选出正常类簇,将所述正常类簇中所有像元光谱的均值作为所述纸张的典型光谱数据。
根据本发明提供的一种纸张典型光谱提取方法,所述对所述第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像,包括:
去除所述第一光谱遥感影像中仪器噪声干扰波段对应的影像数据,得到第三光谱遥感影像;
对所述第三光谱遥感影像的像元光谱基于Savitzky-Golay滤波算法进行滤波处理得到第二光谱遥感影像。
根据本发明提供的一种纸张典型光谱提取方法,所述仪器噪声干扰波段包括350~425nm波段,和/或,977~1200nm波段。
根据本发明提供的一种纸张典型光谱提取方法,所述对所述第三光谱遥感影像的像元光谱基于Savitzky-Golay滤波算法进行滤波处理得到第二光谱遥感影像,包括:
对所述第三光谱遥感影像中像元光谱的光谱波段按照移动滑窗去噪公式进行去噪处理得到各个像元的遥感影像平滑光谱子数据;
将各个像元的遥感影像平滑光谱子数据进行组合得到第二光谱遥感影像;
移动滑窗去噪公式为:
w=(W-1)/2
其中,Yi,l表示所述第三光谱遥感影像的第i条像元光谱中第l波段处的遥感影像平滑光谱,Xi,l+w表示所述第三光谱遥感影像第i条像元光谱中第l+w波段处光谱的原始值,Pi,w为第i条像元光谱的平滑窗口中第w个位置数据点对应的平滑系数,W为滑动窗口的宽度;
平滑系数Pi,w的计算公式为:
Pi,w=Zi,l+w/Xi,l+w
其中,Zi,l+w表示所述第三光谱遥感影像中第i条像元光谱中第l+w波段处光谱在窗口范围内通过最小二乘法建立K阶拟合式的拟合值。
根据本发明提供的一种纸张典型光谱提取方法,所述将所述第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量,包括:
从所述第二光谱遥感影像中随机选取一个像元光谱样本作为初始聚类中心;
计算每个像元光谱与当前已有的各个聚类中心之间的第一距离;
根据每个像元光谱第一距离中的最小值来计算各个像元被选择为下一个聚类中心的概率;
选取所述概率最大值对应的像元光谱作为下一个聚类中心,直到选择出预设数量聚类中心;
计算每个像元光谱与各个聚类中心的第二距离,将每个像元光谱分发到所述第二距离最小值对应的聚类中心所属类簇中,并同时计算每个类簇下所有像元光谱的均值作为对应类簇新的聚类中心;
计算每个像元光谱与各个类簇新的聚类中心的距离,直到每个像元光谱到其所属类簇的聚类中心的距离小于等于其到其它类簇聚类中心的距离,得到多个类簇及每个类簇中的像元光谱数量。
根据本发明提供的一种纸张典型光谱提取方法,根据所述每个类簇中的像元光谱数量筛选出正常类簇,将所述正常类簇中所有像元光谱的均值作为所述纸张的典型光谱数据,包括:
根据所述每个类簇中的像元光谱数量对类簇进行排序;
从排序结果中剔除像元光谱数量最少的预设数量类簇,得到正常类簇;
计算所述正常类簇中所有像元光谱的均值,将所述均值作为纸张的典型光谱数据。
本发明还提供一种纸张典型光谱提取装置,包括:
获取模块,用于获取纸张的第一光谱遥感影像;
过滤模块,用于对所述第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;
聚类模块,用于将所述第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量;
筛选模块,根据所述每个类簇中的像元光谱数量筛选出正常类簇,将所述正常类簇中所有像元光谱的均值作为所述纸张的典型光谱数据。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述的纸张典型光谱提取方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的纸张典型光谱提取方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的纸张典型光谱提取方法。
本发明提供的纸张典型光谱提取方法、装置及相关设备,通过获取纸张的第一光谱遥感影像;对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量;根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据,通过过滤操作去除干扰数据,有效提高高光谱遥感技术在纸张参量分析、评估结果的准确性以及可靠性;通过聚类算法获取表征纸张材质整体特征的典型光谱,节约提取成本,并且不易受人为主观因素干扰,有利于纸张光谱技术的普及应用。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的纸张典型光谱提取方法的流程示意图之一;
图2是本发明提供的纸张典型光谱提取方法的流程示意图之二;
图3是本发明提供的纸张典型光谱提取方法的流程示意图之三;
图4是本发明提供的近红外高光谱遥感原始影像的示意图;
图5是本发明提供的纸张典型光谱提取装置的结构示意图;
图6是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的纸张典型光谱提取方法的流程图,如图1所示,本发明实施例提供的纸张典型光谱提取方法包括:
步骤101、获取纸张的第一光谱遥感影像;
在本发明实施例中,第一光谱遥感影像例如为近红外高光谱原始影像,可通过近红外高光谱遥感图像采集设备获取。
步骤102、对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;
在本发明实施例中,通过过滤操作可以增强遥感影像中各个像元光谱的有效信息量,提高光谱数据的准确性和可靠性。
步骤103、将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量;
在本发明实施例中,聚类算法例如为Kmeans++算法,通过对各个像元光谱进行聚类分析,快速实现各个象元光谱的类别划分,实现纸张异常部分的有效识别。
步骤104、根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据。
在本发明实施例中,通过筛选操作可以剔除纸面的污染、劣化、纸张纤维褶皱等异常区域的干扰光谱,从而提高基于高光谱遥感技术的纸张参量分析评估结果的准确性以及可靠性。
在本发明实施例中,根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据,包括:
步骤1041、根据每个类簇中的像元光谱数量对类簇进行排序;
步骤1042、从排序结果中剔除像元光谱数量最少的预设数量类簇,得到正常类簇;
在本发明实施例中,剔除类簇的数量根据预设的类簇总数量确定,预设的类簇总数量与预设聚类中心的数量对应。
例如,预设聚类中心的数量为5,则类簇总数量设置为5,剔除类簇的数量可以设置为2。
步骤1043、计算正常类簇中所有像元光谱的均值,将均值作为纸张的典型光谱数据。
在本发明实施例中,通过在聚类算法中计算各个样本与其最近聚类中心的最大距离选择为下一个类簇中心使得划分类别中心之间相互距离最大,使得像元光谱类别划分结果稳定牢固,通过限定类簇的总数量降低时间运算成本,避免了传统聚类算法中聚类结果随机、时间成本高的缺点。并且,将结果中各类像元按照数量排序,剔除像元数量较少的一个或多个异常类簇,筛选出正常类簇,再计算正常类簇中像元光谱的均值以作为纸张影像的典型光谱,可以有效消除纸面异常区域对高光谱遥感影像典型光谱的干扰,提高了典型光谱的真实性。
本发明实施例提供的纸张典型光谱提取方法通过获取纸张的第一光谱遥感影像;对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇;根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据,其中,过滤操作去除干扰数据可以有效提高高光谱遥感技术在纸张参量分析、评估中的准确性以及可靠性;通过聚类算法实现了纸张影像象元的光谱类别自动划分,节约提取成本,并且不易受人为主观因素干扰,有利于纸张光谱技术的普及应用。
基于上述任一实施例,如图2所示,对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像,具体包括:
步骤201:去除第一光谱遥感影像中仪器噪声干扰波段对应的影像数据,得到第三光谱遥感影像;
在本发明一些实施例中,仪器噪声干扰波段包括但不限于350~425nm波段和977~1200nm波段等。
通过剔除仪器噪声波段对应光谱数据,可以消除仪器噪声对遥感影像光谱信号的干扰,增强了遥感影像中的有效信息量。
步骤202:对第三光谱遥感影像基于Savitzky-Golay滤波算法进行滤波得到第二光谱遥感影像。
具体的说,包括以下步骤:
步骤2021:对第三光谱遥感影像中像元光谱的光谱波段按照移动滑窗去噪公式进行去噪处理得到每个像元遥感影像平滑光谱子数据Yi,l;
移动滑窗去噪公式为:
w=(W-1)/2
其中,Yi,l表示第三光谱遥感影像的第i条像元光谱中第l波段处的遥感影像平滑光谱值,Xi,l+w表示第三光谱遥感影像第i条像元光谱中第l+w波段处光谱的原始值,Pi,w为第i条像元光谱的平滑窗口中第w个位置数据点对应的平滑系数,W为滑动窗口的宽度;
平滑系数Pi,w的计算公式为:
Pi,w=Zi,l+w/Xi,l+w
其中,Zi,l+w表示第三光谱遥感影像中第i条像元光谱中第l+w波段处光谱在窗口范围内通过最小二乘法建立K阶拟合式的拟合值。
步骤2022:将每个像元的遥感影像平滑光谱子数据进行组合得到第二光谱遥感影像。
在本发明实施例中,通过Savitzky-Golay滤波算法消除了环境噪声对遥感影像光谱信号的干扰,进一步增强了遥感影像中的有效信息量。
基于上述任一实施例,如图3所示,将第二光谱遥感影像中各个像元光谱进行自动聚类分析得到多个类簇及每个类簇中的像元光谱数量,具体包括:
步骤301:从第二光谱遥感影像中随机选取一个像元光谱样本作为初始聚类中心;
步骤302:计算每个像元光谱与当前已有的各个聚类中心之间的第一距离;
例如,从第二光谱遥感影像中随机选取一个像元光谱样本a作为初始聚类中心Ca,第二光谱遥感影像包括I条像元光谱,每条光谱包含L个波段;
计算每个像元光谱与初始聚类中心Ca之间的最短距离Di,Ca作为第一距离,最短距离Di,Ca计算公式:
其中,Yi表示第三光谱遥感影像的第i条像元光谱,i∈(1,2,3,…,I),Yi,l表示第三光谱遥感影像的第i条像元光谱中第l波段处的去噪后的遥感影像平滑光谱值,l∈(1,2,3,…,L);
步骤303、根据每个像元光谱第一距离中的最小值来计算各个像元被选择为下一个聚类中心的概率;
例如,统计第二光谱遥感影像中各个像元光谱与当前已有的各个聚类中心的第一距离的最小值,得到各个像元光谱及其对应的最近聚类中心,即minn∈N(Di,C n),其中n∈(1,2,…,N),N为聚类中心的数量,以此计算各个像元被选择为下一个聚类中心的概率Pi,计算公式为:
步骤304:选取概率最大值对应的像元光谱作为下一个聚类中心,直到选择出预设数量聚类中心;
例如,计算第二光谱遥感影像中各个像元光谱被选为下一个聚类中心的概率Pi,根据概率最大值max(Pi)选择对应像元为下一个聚类中心,直到选择出全部的聚类中心;
在本发明实施例中,通过预设聚类中心数量,可以限定聚类算法中得到类簇的总数量,并且,聚类算法在随机选择一个像元光谱作为初始聚类中心后,通过统计各个像元光谱与当前距离最近的一个聚类中心之间的最短距离来计算各个像元被选为下一个聚类中心的选择概率,选取当前选择概率最大的的像元光谱样本作为下一个聚类中心,直至选择出预设数量的聚类中心。以此限定初始类簇中心在所有像元光谱中的空间分布,并且,通过选取概率最大值对应的像元光谱作为下一个聚类中心,使得各个类簇的聚类中心之间的距离最大,从而提高类簇的稳定性,降低时间运算成本。
步骤305:计算每个像元光谱与各个聚类中心的第二距离,将每个像元光谱分发到第二距离最小值对应的聚类中心所属类簇中,并同时计算该类簇下所有像元光谱的均值作为该类簇新的聚类中心;
步骤306:计算每个像元光谱与各个类簇新的聚类中心的距离,直到每个像元光谱到其所属类簇的聚类中心的距离小于等于其到其它类簇聚类中心的距离,得到多个类簇及每个类簇中的像元光谱数量。
在本发明实施例中,聚类中心Cn为各个当前划分类簇下所有像元光谱的均值,其中,Mn表示第n个类簇中当前所有像元光谱的数量;
若像元光谱i与其对应的聚类中心Ci之间的距离小于等于该像元光谱i与各个类簇中心之间的距离/>即/>则聚类分析结束,得到分类结果;
若不满足上述条件,则将不满足条件的像元光谱重新划分到其它类簇中,直到满足上述条件,聚类分析终止,得到多个类簇及每个类簇中的像元光谱数量。
下面对纸张典型光谱提取方法进行举例描述。
步骤一,通过近红外高光谱遥感图像采集设备获取纸张纸面的近红外高光谱遥感原始影像S1,如图4所示,其中纸面异常包括褶皱、和污染;
步骤二,去除影像S1中易受仪器本身设计干扰的波段350~425nm和977~1200nm对应数据,保留剩余波段数据得到纸张近红外高光谱影像S2;
步骤三,基于Savitzky-Golay滤波算法去除影像S2中各个像元光谱中的背景噪声(环境噪声)干扰,得到Savitzky-Golay滤波去噪后影像S3,其中Savitzky-Golay滤波算法中窗口宽度W设置为7,多项式拟合阶数K设置为3;
步骤四,将影像S3基于Kmeans++算法将影像中各个像元光谱进行自动聚类,并设置聚类中心数量为5,得到当前纸张影像中各个类别像元的分布,例如,聚类分析得到类簇以及类簇包含像元光谱数量百分比分别为:类簇1(29.28%)、类簇2(14.86%)、类簇3(29.38%)、类簇4(19.13%)和类簇5(7.35%),;
步骤五,将上述聚类结果中按照像元光谱数量对各个类簇进行排序,并设置剔除类簇数量为2,即剔除像元光谱数量最少的两个类簇,即类簇2(14.86%)和类簇5(7.35%),并将剩余类簇1(29.28%)、类簇3(29.38%)和类簇4(19.13%)中所有像元光谱求均值,即可得到可表征输入纸张近红外高光谱影像整体特征的典型光谱数据。
在本发明实施例中,像元光谱数量最少的两个类簇包含纸张异常部分区域对应光谱,提取这两个类簇可避免纸面异常部分区域对典型光谱提取结果的影响,剩余像元光谱所得均值符合纸张整体材质特征,可用于纸张参量的分析和评估,并可以使分析评估结果真实可靠。
在本发明实施例中,通过过滤操作减弱了采集影像中噪声光谱的干扰,增强了纸张影像的有效信息,且Savitzky-Golay滤波算法成熟、便捷。针对纸张材质总体分布均匀的特点,将去噪后的影像通过Kmeans++聚类算法进行纸张影像异常部分像元剔除,可极大程度上消除纸面异常部分像元光谱对影像整体光谱的干扰,计算剩余像元光谱的均值即可提取出表征输入纸张近红外高光谱影像整体特征的典型光谱,耗时短、成本低,可应用于大部分的纸张光谱分析领域。
下面对本发明提供的纸张典型光谱提取装置进行描述,下文描述的纸张典型光谱提取装置与上文描述的纸张典型光谱提取方法可相互对应参照。
图5为本发明实施例提供的纸张典型光谱提取装置的示意图,如图5所示,本发明实施例提供的纸张典型光谱提取装置包括:
获取模块501,用于获取纸张的第一光谱遥感影像;
过滤模块502,用于对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;
聚类模块503,用于将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量;
筛选模块504,根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据。
本发明实施例提供的纸张典型光谱提取装置通过获取纸张的第一光谱遥感影像;对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇;根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据,可以有效提高高光谱遥感技术在纸张参量分析、评估结果的准确性以及可靠性,并且减少计算量,节约提取成本,不易受人为主观因素干扰,有利于纸张光谱技术的普及应用。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(CommunicationsInterface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行纸张典型光谱提取方法,该方法包括:获取纸张的第一光谱遥感影像;对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇;根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,RandomAccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的纸张典型光谱提取方法,该方法包括:获取纸张的第一光谱遥感影像;对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇;根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据。
又一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的纸张典型光谱提取方法,该方法包括:获取纸张的第一光谱遥感影像;对第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;将第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇;根据每个类簇中的像元光谱数量筛选出正常类簇,将正常类簇中所有像元光谱的均值作为纸张的典型光谱数据。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
Claims (8)
1.一种纸张典型光谱提取方法,其特征在于,包括:
获取纸张的第一光谱遥感影像;
对所述第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;
将所述第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量;
根据所述每个类簇中的像元光谱数量筛选出正常类簇,将所述正常类簇中所有像元光谱的均值作为所述纸张的典型光谱数据;
所述将所述第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量,包括:
从所述第二光谱遥感影像中随机选取一个像元光谱样本作为初始聚类中心;
计算每个像元光谱与当前已有的各个聚类中心之间的第一距离;
根据每个像元光谱第一距离中的最小值来计算各个像元被选择为下一个聚类中心的概率;
选取所述概率最大值对应的像元光谱作为下一个聚类中心,直到选择出预设数量聚类中心;
计算每个像元光谱与各个聚类中心的第二距离,将每个像元光谱分发到所述第二距离最小值对应的聚类中心所属类簇中,并同时计算每个类簇下所有像元光谱的均值作为对应类簇新的聚类中心;
计算每个像元光谱与各个类簇新的聚类中心的距离,直到每个像元光谱到其所属类簇的聚类中心的距离小于等于其到其它类簇聚类中心的距离,得到多个类簇及每个类簇中的像元光谱数量。
2.根据权利要求1所述的纸张典型光谱提取方法,其特征在于,所述对所述第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像,包括:
去除所述第一光谱遥感影像中仪器噪声干扰波段对应的影像数据,得到第三光谱遥感影像;
对所述第三光谱遥感影像的像元光谱基于Savitzky-Golay滤波算法进行滤波处理得到第二光谱遥感影像。
3.根据权利要求2所述的纸张典型光谱提取方法,其特征在于,所述仪器噪声干扰波段包括350~425nm波段,和/或,977~1200nm波段。
4.根据权利要求2所述的纸张典型光谱提取方法,其特征在于,所述对所述第三光谱遥感影像的像元光谱基于Savitzky-Golay滤波算法进行滤波处理得到第二光谱遥感影像,包括:
对所述第三光谱遥感影像中各个像元光谱的光谱波段按照移动滑窗去噪公式进行去噪处理得到各个像元的遥感影像平滑光谱子数据;
将各个像元的遥感影像平滑光谱子数据进行组合得到第二光谱遥感影像;
所述移动滑窗去噪公式为:
其中,Yi,l表示所述第三光谱遥感影像的第i条像元光谱中第l波段处的遥感影像平滑光谱,Xi,l+w表示所述第三光谱遥感影像第i条像元光谱中第l+w波段处光谱的原始值,Pi,w为第i条像元光谱的平滑窗口中第w个位置数据点对应的平滑系数,W为滑动窗口的宽度;
平滑系数Pi,w的计算公式为:
Pi,w=Zi,l+w/Xi,l+w
其中,Zi,l+w表示所述第三光谱遥感影像中第i条像元光谱中第l+w波段处光谱在窗口范围内通过最小二乘法建立K阶拟合式的拟合值。
5.根据权利要求1所述的纸张典型光谱提取方法,其特征在于,根据所述每个类簇中的像元光谱数量筛选出正常类簇,将所述正常类簇中所有像元光谱的均值作为所述纸张的典型光谱数据,包括:
根据所述每个类簇中的像元光谱数量对类簇进行排序;
从排序结果中剔除像元光谱数量最少的预设数量类簇,得到正常类簇;
计算所述正常类簇中所有像元光谱的均值,将所述均值作为纸张的典型光谱数据。
6.一种纸张典型光谱提取装置,其特征在于,包括:
获取模块,用于获取纸张的第一光谱遥感影像;
过滤模块,用于对所述第一光谱遥感影像进行过滤,得到纸张的第二光谱遥感影像;
聚类模块,用于将所述第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量;
所述将所述第二光谱遥感影像中各个像元光谱进行聚类分析得到多个类簇及每个类簇中的像元光谱数量,包括:
从所述第二光谱遥感影像中随机选取一个像元光谱样本作为初始聚类中心;
计算每个像元光谱与当前已有的各个聚类中心之间的第一距离;
根据每个像元光谱第一距离中的最小值来计算各个像元被选择为下一个聚类中心的概率;
选取所述概率最大值对应的像元光谱作为下一个聚类中心,直到选择出预设数量聚类中心;
计算每个像元光谱与各个聚类中心的第二距离,将每个像元光谱分发到所述第二距离最小值对应的聚类中心所属类簇中,并同时计算每个类簇下所有像元光谱的均值作为对应类簇新的聚类中心;
计算每个像元光谱与各个类簇新的聚类中心的距离,直到每个像元光谱到其所属类簇的聚类中心的距离小于等于其到其它类簇聚类中心的距离,得到多个类簇及每个类簇中的像元光谱数量;
筛选模块,根据所述每个类簇中的像元光谱数量筛选出正常类簇,将所述正常类簇中所有像元光谱的均值作为所述纸张的典型光谱数据。
7.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述的纸张典型光谱提取方法。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述的纸张典型光谱提取方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211275829.3A CN115564743B (zh) | 2022-10-18 | 2022-10-18 | 纸张典型光谱提取方法、装置及相关设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211275829.3A CN115564743B (zh) | 2022-10-18 | 2022-10-18 | 纸张典型光谱提取方法、装置及相关设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115564743A CN115564743A (zh) | 2023-01-03 |
CN115564743B true CN115564743B (zh) | 2023-11-03 |
Family
ID=84747358
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211275829.3A Active CN115564743B (zh) | 2022-10-18 | 2022-10-18 | 纸张典型光谱提取方法、装置及相关设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115564743B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102855609A (zh) * | 2012-07-30 | 2013-01-02 | 南京大学 | 集成高光谱数据和稀疏声纳数据的浅水水下地形构建方法 |
CN102903114A (zh) * | 2012-10-09 | 2013-01-30 | 河海大学 | 一种基于改进型层次聚类的高光谱遥感数据降维方法 |
JP2013038624A (ja) * | 2011-08-09 | 2013-02-21 | Kyocera Document Solutions Inc | 画像処理方法及び画像処理プログラム |
CN108491888A (zh) * | 2018-04-02 | 2018-09-04 | 安徽大学 | 基于形态学分析的环境监测高光谱数据谱段选择方法 |
CN110619263A (zh) * | 2019-06-12 | 2019-12-27 | 河海大学 | 低秩联合协同表示的高光谱遥感影像异常探测方法 |
CN111999261A (zh) * | 2020-09-30 | 2020-11-27 | 海南电网有限责任公司电力科学研究院 | 一种用于绝缘纸老化评估的近红外光谱噪声数据处理方法 |
CN113887543A (zh) * | 2021-12-07 | 2022-01-04 | 深圳市海谱纳米光学科技有限公司 | 一种基于高光谱特征的箱包鉴伪方法与光谱采集装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10902581B2 (en) * | 2017-06-19 | 2021-01-26 | Apeel Technology, Inc. | System and method for hyperspectral image processing to identify foreign object |
US10902577B2 (en) * | 2017-06-19 | 2021-01-26 | Apeel Technology, Inc. | System and method for hyperspectral image processing to identify object |
-
2022
- 2022-10-18 CN CN202211275829.3A patent/CN115564743B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013038624A (ja) * | 2011-08-09 | 2013-02-21 | Kyocera Document Solutions Inc | 画像処理方法及び画像処理プログラム |
CN102855609A (zh) * | 2012-07-30 | 2013-01-02 | 南京大学 | 集成高光谱数据和稀疏声纳数据的浅水水下地形构建方法 |
CN102903114A (zh) * | 2012-10-09 | 2013-01-30 | 河海大学 | 一种基于改进型层次聚类的高光谱遥感数据降维方法 |
CN108491888A (zh) * | 2018-04-02 | 2018-09-04 | 安徽大学 | 基于形态学分析的环境监测高光谱数据谱段选择方法 |
CN110619263A (zh) * | 2019-06-12 | 2019-12-27 | 河海大学 | 低秩联合协同表示的高光谱遥感影像异常探测方法 |
CN111999261A (zh) * | 2020-09-30 | 2020-11-27 | 海南电网有限责任公司电力科学研究院 | 一种用于绝缘纸老化评估的近红外光谱噪声数据处理方法 |
CN113887543A (zh) * | 2021-12-07 | 2022-01-04 | 深圳市海谱纳米光学科技有限公司 | 一种基于高光谱特征的箱包鉴伪方法与光谱采集装置 |
Non-Patent Citations (1)
Title |
---|
基于高光谱成像的纸质文物 " 狐斑 " 检测方法研究;戴若辰 等;《光谱学与光谱分析》;第42卷(第05期);第1567-1571页 * |
Also Published As
Publication number | Publication date |
---|---|
CN115564743A (zh) | 2023-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114549522B (zh) | 基于目标检测的纺织品质量检测方法 | |
CN110717368A (zh) | 一种纺织品定性分类方法 | |
CN114757900A (zh) | 基于人工智能的纺织品缺陷类型识别方法 | |
CN113554649B (zh) | 一种缺陷检测方法、装置、计算机设备及存储介质 | |
US10546213B2 (en) | Method for evaluating the authenticity of a painting as well as a corresponding use | |
CN111507426A (zh) | 基于视觉融合特征的无参考图像质量分级评价方法及装置 | |
CN115100206A (zh) | 用于具有周期图案纺织物的印花缺陷识别方法 | |
CN111353992B (zh) | 一种基于纹理特征的农产品缺陷检测方法及系统 | |
CN115994907A (zh) | 用于食品检测机构综合信息的智能处理系统及方法 | |
CN105445222A (zh) | 一种利用近红外高光谱图像识别涂料的方法 | |
CN114965316A (zh) | 一种基于高光谱多参数的水质监测方法、计算机程序产品 | |
CN115564743B (zh) | 纸张典型光谱提取方法、装置及相关设备 | |
CN112974303A (zh) | 一种基于高光谱的果品品质检测方法、设备及介质 | |
CN110188222B (zh) | 基于局部语义滤波器和桥接相似度的鞋印检索方法 | |
CN109612961B (zh) | 海岸环境微塑料的开集识别方法 | |
CN114186596B (zh) | 一种谱图峰的多窗口识别方法、装置以及电子设备 | |
CN116071565A (zh) | 一种基于高光谱成像的苹果霉心病识别方法及系统 | |
CN115656063A (zh) | 基于高光谱数据的目标污染物含量分析方法及装置 | |
CN114943720A (zh) | 一种电力图像处理方法及装置 | |
CN111259914B (zh) | 一种茶树叶特征信息高光谱提取方法 | |
US7769547B2 (en) | Karyometry-based method for prediction of cancer event recurrence | |
CN110647915A (zh) | 一种用于高维数据一致性分析的动态模式判断方法 | |
DE102018222797A1 (de) | Informationsverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Aufzeichnungsmedium, auf dem das Bildverarbeitungsprogramm gespeichert ist | |
CN111507258B (zh) | 聚焦关键样本的基于集成学习的道路区域检测方法、系统 | |
CN114937038B (zh) | 面向可用性的遥感影像质量评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |