CN113970528B - 基于完全约束最小二乘法的纺织品成分解混方法 - Google Patents

基于完全约束最小二乘法的纺织品成分解混方法 Download PDF

Info

Publication number
CN113970528B
CN113970528B CN202111039378.9A CN202111039378A CN113970528B CN 113970528 B CN113970528 B CN 113970528B CN 202111039378 A CN202111039378 A CN 202111039378A CN 113970528 B CN113970528 B CN 113970528B
Authority
CN
China
Prior art keywords
data
textile
information
constraint
spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111039378.9A
Other languages
English (en)
Other versions
CN113970528A (zh
Inventor
池明旻
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202111039378.9A priority Critical patent/CN113970528B/zh
Publication of CN113970528A publication Critical patent/CN113970528A/zh
Application granted granted Critical
Publication of CN113970528B publication Critical patent/CN113970528B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/3563Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light for analysing solids; Preparation of samples therefor
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N21/00Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
    • G01N21/17Systems in which incident light is modified in accordance with the properties of the material investigated
    • G01N21/25Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
    • G01N21/31Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
    • G01N21/35Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light
    • G01N21/359Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using infrared light using near infrared light
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Analytical Chemistry (AREA)
  • Biochemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Investigating Or Analysing Materials By Optical Means (AREA)

Abstract

本发明提供了无损清洁的近红外纺织品含量预测新方法以及模型,首次将光谱解混理论引入到纺织品成分定性定量分析中,提出基于近红外光谱数据的纺织品纤维成分解混方法,即基于完全约束的最小二乘(Fully Constrained LeastSquares,FCLS)线性成分解混方法。近红外纺织品含量预测方法包括数据标记模块、基于近红外光谱数据预处理模型、纺织品定性分析模块、基于FCLS成分解混核心模块以及定量结果的误差分析模块。实现了基于完全约束的最小二乘算法(FCLS)的线性成分解混方法,来实现多种纺织纤维纯材质和混纺纺织品的纤维单组分和多组分的成分预测;以提高模型成分分析预测的准确性;此方法实现了对纺织品成分的快速、无损、清洁检测,且准确率高,容易操作。

Description

基于完全约束最小二乘法的纺织品成分解混方法
技术领域
本发明属于纺织品成分分析领域,尤其涉及一种用成分解混方法解决近红外纺织纤维成分无损清洁的定性和定量分析方法。
背景技术
近年来,随着人民生活水平的提高,对纺织品质量的要求也不断提升。市场上大量存在的有关纺织品成分标注不清、质量良莠不齐等现象,引发了对纺织品成分分析的高度需求。目前纺织品纤维成分分析方法在传统上主要采用化学溶解法法和物理分析法。
化学溶解法的局限性很大,不适用于物化结构类似的纤维的定性定量分析,不能完全满足于某种新开发的纤维,再生纤维或物理化学法改良的纤维。尤其化学法需要将待检纺织品送至相关检测机构进行检测,使用化学试剂辅助进行检测的方法不仅会对纺织品造成损耗,而且操作复杂、检测周期长,影响相关纺织品企业的正常经营流程。物理分析方法最初多采用显微投影法,定量分析的准确度很大程度决定于分析员识别各种纤维的能力。这种方法繁杂枯燥,一般只用于分析那些不能用机械分离法或化学分析法处理的混合物如毛发与羊毛、棉、亚麻、大麻和/或苎麻的混合物。
由于纤维种类复杂多样,并且新型纺织纤维不断应用于纺织品领域,现有方法难以同时提取各纤维足够多的特征物化信息,导致无法进行准确、可靠的成分分析工作。2019年7月1日,《FZ/T01144-2018纺织品纤维定量分析近红外光谱法》正式实施,这标志着基于近红外光谱的纺织品成分分析方法由研究领域进入应用阶段。使用近红外光谱法分析纺织品纤维成分的优点是快速和无损伤,通过前期制备标样,建立检测模型,能够实现对不同种类的纤维鉴别准确。近红外光谱法分析纺织品纤维成分主要覆盖两个任务:定性分析和定量分析,定性分析指确定目标织物的组成成分类型,定量分析指确定混合材料各组成材质的混合比例。
在光谱分析中,解混是非常重要的一个研究方向。混合信号解混的目的是获得所包含物质的纯净光谱(即端元提取)及其对应的含量(即端元丰度估计)。在确定好近红外光谱信号作为研究对象后,考虑到纺织品的定性定量分析的本质是求解面料中所包含的纯材质(光谱端元)以及对应的比率(丰度值)的问题,故本专利创新性地将光谱解混应用于纺织品成分分析,设计了基于成分解混的完全约束的最小二乘法的纺织品成分分析方法,针对传统检测方法的缺陷以及技术难点,提出一种创新性解决方案。据调查,尚未有一种发明专利用成分解混方法解决纺织品成分分析中的定性和定量,本专利的创新性可由此体现。该方法无损,清洁,高效、快速、成本低,可用于实验室分析、现场分析等。
发明内容
为了克服现有技术中目前检测算法存在的缺陷和不足,本发明结合光谱的线性解混理论,提供了基于完全约束的最小二乘法的纺织纤维成分分析方法,其方法涉及到了近红外光谱数据采集设备及多个光谱分析模块。光谱分析模块包括数据标记模块、基于近红外光谱数据的多种预处理方式选择模块、纺织品定性分析模块、基于完全约束的最小二乘法算法模块、全局数据字典模块、指定材质的部分数据字典模块以及定量结果的误差分析模块。所述近红外设备,用于采集当前纺织品的光谱信息;所述数据标记,是指根据现有文字标记,使用脚本将其转化为所需的数据信息及数据标签;所述光谱数据预处理方法,包括标准化处理,光谱数据去噪,傅里叶变换,消除基线平移处理,基于采样方法的数据增强,基于插值方法的数据增强,基于光谱特性的数据增强等,可自主选择和组合预处理方式;所述纺织品定性分析,是使用机器学习或深度学习的相关方法,提前得到纺织品数据的Mask结果;所述基于完全约束的最小二乘法,是结合光谱的线性解混技术,应用于纺织品成分分析模块。应用于光谱解混的完全约束的最小二乘法通过两个限制条件,限制一个像元内每种端元的丰度值范围在0~1之间,并且和为1。在本专利中,对完全约束的最小二乘法进行改进后,对纺织品成分规格进行限制,限制其纺织品成分含量范围在0~1之间,并且和为1;所述的全局数据字典和指定材质的部分数据字典隶属于核心算法模块,是基于完全约束的最小二乘法生成的数据字典;所述定量结果的误差分析模块,是衡量其定量结果的一种方式。
该方法的核心功能在于用成分解混方法解决成分分析中的定性和定量,能够对纺织品进行高精确率的定量工作。用户可以提供纺织品,无需化学试剂,无需毁坏样品,就可以对纺织品的类型和含量进行测试。使用采集和标记好的数据基于完全约束的最小二乘法生成核心的数据字典信息。首先,大规模采集数据,对数据进行平滑和衍生等预处理相关工作,然后将数据放入基于完全约束的最小二乘法的算法中,分别生成全数据和不同类别的数据库字典,生成的数据库字典会根据不同的纺织品的光谱信息组成不同的数据核心信息;进入测试环节,可以将测试数据的光谱信息作为目标进行测试,也可重新采集光谱数据,进行预处理,增加Mask,然后选择性与全数据字典信息或指定数据字典信息进行对比,得到定量分析结果。
基于成分解混的完全约束的最小二乘算法对纺织品成分进行定性定量分析,能够无损快速地解决定性定量,现有方法难以同时提取各纤维足够多的特征物化信息,导致无法进行准确、可靠定性定量分析。基于线性解混的完全约束的最小二乘法的纺织品成分分析能有效检测不同规格的纺织品含量。通过对棉,麻,人棉(人丝),聚酯纤维,尼龙,羊毛,羊绒,氨纶,天丝,丝绸等十二种纯材质和混合材质的含量预测评估,可认定为定量效果最佳。该方法的定性分析和定量分析包括以下步骤:
S1:采集纺织品纤维成分的近红外光谱特征。使用近红外光谱设备,要求采集环境统一,没有过多的光照等等外部环境干涉。随机选取每匹布的数个特征点,录入每匹布的光谱数据特征。
S2:自定义光谱信息与材质类型和含量的对应关系,并建立纺织品纤维成分的光谱信息库。设定该纺织品的类型,类型分为棉、麻、涤纶、尼龙、丝绸、人造棉等;设置纺织品不同材质的含量,含量包括棉麻混合、棉尼龙混合、棉人造棉混合、丝绸与棉混合等;针对纺织品不同的混合类型,设置材质的含量标签;
S3:将数据通过预处理后投入算法,得到对应纺织品纤维成分的数据库;对数据进行以下预处理:数据规范化处理,去噪处理,序列傅里叶变换处理,消除基线平移处理,扩充数据维度处理,仿光谱特征的数据增强处理等。在该纺织品成分解混方法中,可以自行选择和组合数据预处理的方式;将处理后的数据投入算法模块,得到对应的数据库信息并存储。
S4:采集新的布匹,调用所述纺织品含量预测算法模块,确定纺织品的含量,并输出定性定量后的结果;采集当前用户所需确定的纺织品的光谱数据信息,然后调用纺织品含量预测算法模块,对该纺织品的类型含量进行判断,并输出结果;通过计算其与真实纺织品含量的误差百分比来分析算法性能。
所述纺织品纤维成分分析方法步骤S23中数据标注方法的进一步说明包括:S231:拟解决市面上广泛存在的十三种纺织品成分分析,分别为棉,莫代尔,氨纶,麻,人棉,涤纶(聚酯纤维),天丝,腈纶,尼龙,羊毛,丝绸,羊绒,其中,人丝因其材质特征与人棉相似,已将两种材质合并。工厂数据给出了类型标签以及对应的含量标签,需要根据其类型含量设置为对应数据标签;S232: 采用的数据标注方法是使用python脚本,读取数据标注的json文件,json文件中包含了纺织品在近红外光照下的吸收率特征、反射率特征以及光照强度特征,以此特征作为数据定性和定量的依据;json数据还包含了对应的纺织品类别和含量标签,同样适用python脚本读取成指定格式,该基于完全约束的最小二乘法的纺织品成分解混方法是一种非监督的学习方式,只需要在验证该方法的有效性的时候读取其类别和含量标签。
所述纺织品纤维成分分析方法步骤S232中纺织品成分含量预测方法的进一步说明包括:S321:根据成分解混方案,生成两种数据字典信息,一种是在不知道其类别特性的前提下,针对全数据进行生成数据字典信息;另一种是知道其纺织品类别特性,为全数据增加Mask信息,针对特定类型的纺织品生成数据字典信息;分别对两种数据,进行完全约束的最小二乘法约束;S322:生成全局数据信息。对现存的所有纺织品数据,经过预处理,生成全数据的数据字典信息,该数据字典考虑到了全局特征,生成一个完整的特征空间;S323:按类别生成字典信息。对现存的所有纺织品数据,经过预处理,根据其类别的不同,生成对应类别的数据字典信息。该数据字典考虑到了局部特征,是对全局特征的细化和补充。S324:根据成分解混核心算法,即完全约束的最小二乘法,分别对全局数据以及按类别生成的数据进行约束,约束主要包含有两个:一个是非负约束,考虑到真实的纺织品定量分析结果是一个非负值;另一个是和为1约束,考虑到混纺材质的纺织品,不同纺织品组合相加成为混纺,其含量组合不可能是一个大于1或者小于1的值,其值只能是1。
所述纺织品纤维成分分析方法步骤S42中纺织品成分含量预测方法的进一步说明包括:S421:将待测纺织品与全数据字典库进行对照,得到其类别和含量信息;S422:将待测纺织品经过Mask,得到其添加了Mask的结果,然后与对应类别的数据库信息对比,得到其含量信息。Mask模块在本方法中具有一定的自主性,可选择使用深度神经网络,如当前常用的深度神经网络ResNet,VggNet, Transformer等,也可以简单地使用SVM、决策树、随机森林等,前者的准确性更高,且数据量充足,故多优先使用前者作为本发明的Mask算法;S423:权衡以上两种方案的结果,对两种结果进行投票。如果Mask添加准确,则选定指定类别的纯材质或混合材质数据字典,使用基于成分解混的完全约束的最小二乘法,得到定量分析结果;若Mask模块的性能较差,则选择全局特征,在完整的特征空间内,应用完全约束的最小二乘法,无损清洁地得到其纺织品的预测含量。
本发明创新性地讲光谱解混与纺织品定性定量分析相结合,解决了目前纺织行业结构类似、化学溶解性能相似的混纺产品的混纺比的测定难题、难溶解纤维与易溶解纤维混纺产品的混纺比测定中要使用大量有机溶剂和酸碱试剂的污染问题以及纺织品成分检验数字化和智能化的问题,提供了一种无损清洁的纺织品成分分析方法。使用近红外光谱数据,结合光谱线性解混技术FCLS,即完全约束的最小二乘法,通过含量和为一约束以及含量非负约束,实现对部分纺织品成分的无损快速检测。
附图说明
图1为本发明涉及到的近红外光谱分析法的光谱区域和数据特征;
图2为本发明涉及到的近红外光谱分析法的一般流程;
图3为本发明提供的纺织品成分分析流程图;
图4为本发明的技术框架图。
具体实施方式
下面结合附图详细说明本发明的具体实施例。然而,应当将本发明理解成并不局限于以下描述的这种实施方式,并且本发明的技术理念可以与其他公知技术或功能与那些公知技术相同的其他技术组合实施。
在以下具体实施例的说明中,为了清楚展示本发明的结构及工作方式,将借助诸多方向性词语进行描述,但是应当将“前”、“后”、“左”、“右”、“外”、“内”、“向外”、“向内”、“轴向”、“径向”等词语理解为方便用语,而不应当理解为限定性词语。
相关术语解释如下:
数据清洗:对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。
光谱解混:光谱解混(Spectral unmixing)目的是获得混合像元或信号所包含的端元成分及其含量,即端元提取和端元丰度估计。一般地,解混模型的工作原理可以定义为:
其中,为重构的信号或者像元,η∈Rd为噪声,在像元解混中表示一个像素点的在d个通道上的光谱值,在信号中表示一个长度为d的序列数据信号;为M个端元/> a=(a1,a2,...,aM)T为各端元的丰度,一般地,/>且每项为非负。
非负约束:对于X=[x1,x2,...,xn]T被称为非负约束。
和一约束:对于X=[x1,x2,...,xn]T被称为和1约束。
最小二乘法:最小二乘法(又称最小平方法)是一种数学优化技术。它通过最小化误差的平方和寻找数据的最佳函数匹配。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。其基本思路是:令
其中,是事先选定的一组线性无关的函数,ak是待定系数,拟合准则是使yi(i=1,2,...,n)与f(xi)的距离的平方和最小,称为最小二乘准则。
下面结合附图详细说明本发明的具体实施例。
参照图1,对近红外光谱分析法的光谱区域和数据特征以及其原理的解释如下:
电磁波谱按波长不同可分为几个波谱区,近红外波长为780~2526nm,该区域的波长能够记录C-O,O-H和N-H等化学键振动的倍频和合频吸收信息,可以作为获取信息有效载体对含氢基团有机物的理化性质的测量。由于物质中的原子或分子振动所具有的非谐振性,使得原子或分子出现振动、伸缩、摆动和弯曲等状态,振动状态变化出现了能量跃迁,也就是原子或分子从低能级(基态) 跃迁到较高的能级(激发态);如果分子或原子从基态向激发态跃迁时,若恰好等于NIRS区域某波长光子的能量,则会产生近红外光谱吸收。从量子力学的角度解释此过程为,红外光照射分子时,分子跃迁需要吸收能量,计算过程如式
其中,V为振动量子数,v为振动频率,h为普朗克常量。用波尔频率方程表示为:
ΔE=Eend-Ebegin=hv
其中为Ebegin初始能级,Eend表示终止能级,ΔE代表初始能级与终止能级的差值。据此可知分子吸收红外光的能量与分子能级差ΔE相等,分子由基态跃迁到第一激发态所对应的振动频率为:
其中为v0→1基频,k为力常数,μ为折合质量。
利用实验样本对不同频率光吸收的差异性,将连续改变频率的近红外光对实验样本进行照射,通过此方法可以使得不同频率的红外光强度、吸收率以及反射率信息。然后用仪器记录信息,就得到实验样本的近红外光谱信息图。根据不同物质在近红外区域吸收光谱各自固有的特征,从而实现基于近红外光光谱的定性定量检测分析。不同物质有不同的近红外光谱图,将近红外光谱所反映的实验样本信息与所测得物质的含量值数据投入定量分析模型,然后采集样本光谱数据输入到分析模型,将已知纺织品纤维的近红外光谱图和被测纤维谱图做比较,从而快速、准确的预测纺织品纤维样本的组成和性质。
图2是近红外光谱分析法的一般流程流程。近红外光谱分析法在样本的光谱数据和样本目标值数据之间建立预测模型,通过获取未知样本的光谱数据,根据建立的预测模型,可以准确预测出物质含量。预测模型不仅依赖于严格的数据处理和表达能力强的模型算法,还依赖于获取的样本本身的特性,比如样本数据的精准性、数据特征能否反映样本本身的属性等。通常,开发基于近红外光谱的物质含量预测模型主要包括:1.实验数据获取;2.异常样本识别和剔除;3.样本集划分为训练集和测试集;4.光谱数据预处理;5.特征波长提取;6.借助于机器学习算法建立物质目标含量的预测模型。本方法借鉴了近红外光谱分析法的一般流程,并基于线性光谱解混方法进行改进,开发了一款稳健和高精度的纺织品成分分析模型。
图3为本发明提供的纺织品检测流程图,其中详细描述了纺织品的定量分析流程。
本发明的算法准备工作按以下步骤进行:
步骤1:采集纺织品纤维成分的近红外光谱特征并进行数据清洗;
步骤2:对原始采集数据进行预处理,去噪和维度扩充
步骤3:自定义光谱信息与材质类型和含量的对应关系,并建立纺织品纤维成分的光谱信息库,包括全品类数据库和指定材质数据库;
步骤4:将数据投入算法,生成数据库字典;
其中,步骤一中的数据清洗工作,使用到了信号的分段Savitzky-Golay算法,以及信号的信息标准差特征。信号的分段Savitzky-Golay算法是基于最小二乘原理的多项式平滑算法,也称卷积平滑。原理是把光谱一段区间的等波长间隔的5 个点记为X集合,多项式平滑就是利用在波长点为m点左二,m点左一,m点, m点右一,m点右二点的数据的多项式拟合值来取代m点,,然后依次移动,直到把光谱信号遍历完。通过计算整体信号的曲线平滑度和信息标准差,来清洗噪声数据。
其中,步骤二中的数据预处理工作,包括数据的标准化处理,傅里叶变换,消除基线平移的多元散射校正算法,维纳滤波降噪,数据增强中的差值增强、采样增强、生成对抗网络增强等。使用这些数据预处理和数据增强方法能够根据近红外光谱数据实际情况进行针对去噪,实现数据平滑。在使用过程中,可根据数据特征,自行选择和组合数据降噪和数据增强算法,来实现最佳预测效果。
其中,步骤三中自定义光谱信息与材质类型和含量的对应关系,现有数据格式为json格式,内容包含了所需的光谱吸收率、反射率、光强特征,以及对应的性质和含量标签,需要根据其类型含量设置为对应数据标签,一元组数据算法标定,如含“棉”材质的比例为1,用1表示其含量,此为一元组纯材质;S233: 二元组数据算法标定,如含“棉”、“麻”材质比例为棉0.55,麻0.45,用[0.55,0.45] 表示其含量,此为混合材质二元组数据;三元组数据算法标定,如含“棉”“尼龙”“氨纶”材质的比例为棉0.60,尼龙0.35,氨纶0.05,用[0.60,0.05,0.35]表示其含量,纯材质为三元组数据,以此类推。
其中,步骤四中的生成数据库字典的方式,是一种无监督的方式。基于完全约束的最小二乘算法会首先对数据进行非0约束和和一约束,然后将数据集分为n个簇,每个簇使用簇内所有样本均值来表示。其步骤包括:1.从样本中随机选择n个点作为初始质心2.计算每个样本到各个质心的距离,将样本划分到距离最近的质心所对应的簇中3.计算每个簇内所有样本的均值,并使用该均值更新簇的质心4.重复步骤2与3,直到达到以下条件之一:质心的位置变化小于指定的阈值或者达到最大迭代次数。将处理好的中心数据,分别持久化到两个数据字典中,一个是全数据的中心数据持久化,另一个是指定类中心数据字典持久化。
本发明的用户测试工作按以下步骤进行:
步骤1:采集纺织品纤维成分的近红外光谱特征;
步骤2:对原始采集数据进行预处理,去噪和维度扩充
步骤3:基于线性光谱解混理论,对数据进行非负约束和和一约束,使用完全约束的最小二乘法进行计算;
步骤4:分别与全品数据库作对比以及经过深度神经网络得到定性结果后与指定数据库做对比,经过投票权衡,得到纺织品的定性定量分析结果;
其中,步骤三中的基于成分解混方法,根据端元是否已知,通常将解混模型分为已知解混、盲解混(端元未知,个数也未知)和半盲解混(部分端元已知)。已知解混模型直接能够获取或从已知数据中推导出端元,例如获取所有数据的数据空间基向量作为端元E;盲解混指未知端元条件下的解混,主要方法是每个端元由对应的光谱模型生成,即em=g(zm),而/>为每个光谱模型的q个参数,而在解混模型的训练过程中将对g(已知光学参数或端元部分特征)或者zm(已知端元生成函数)进行估计,获得适配该数据集的端元生成模型;半盲解混则指部分端元已知而其他端元未知,即端元E= [E1,E2]=(e1,...,em,g(zm+1),...,g(zM)),其中有m个已知端元,M-m个未知端元。
解混算法的训练过程主要是通过对重构信号与实际值x的差异函数的建模优化,推测出丰度a,即:
s.t.||f(E,a)||1=1,a≥0.
根据解混函数的特点,可以将其分为线性解混和非线性解混,而非线性解混的实现方式可以分为基于深度学习和传统非线性解混。本专利采用线性解混方法作为成分解混方式,线性解混模型可表示为:
本专利使用基于成分解混,即光谱线性解混的完全约束的最小二乘算法,是对无约束的最小二乘问题的改进。无约束的最小二乘问题是指:
其中,r(x)=(r1(x),r2(x),...,rm(x))T,m≥n是x的函数,当r(x)是x的线性函数时,即为线性最小二乘问题,当r(x)是x的非线性函数时,即为非线性最小二乘问题。通常线性最小二乘问题用下述的矩阵向量表示为:
其中A∈Rm×n,b∈Rm。然而在我们的实际纺织品成分分析问题中,目标函数f(x)中的自变量的各个分量之间可能不完全独立,它们的数值要收到某种物理或者数学条件的约束,形成具有约束条件的最小二乘问题。在本专利中,主要用到了自变量的两个约束条件,一个是非负约束,一个是和一约束。
加入非负约束后,原来的最小二乘问题变为非负最小二乘问题,即:
s.t.x≥0
其中,r(x)=(r1(x),r2(x),...,rm(x))T,m≥n
加入和一约束后,原来的最小二乘问题变为完全约束的最小二乘问题,即:
s.t.x≥0
对于完全约束的最小二乘问题的求解,本专利使用Lagrange乘子法,将约束问题转化为非约束问题进行求解。Lagrange乘子法设给定二元函数z=f(x,y) 和附加条件为寻找z=f(x,y)在附加条件下的极值点,先做拉格朗日函数,其中λ为参数。
令F(x,y,λ)对x和y和λ的一阶偏导数等于零,即
由上述方程组解出x,y及λ,如此求得的(x,y),就是函数z=f(x,y)在附加条件下的可能极值点。若这样的点只有一个,可直接确定此即所求的点。
步骤四中的增加Mask的方式可选择当前常用的深度神经网络ResNet, VggNet,Transformer等,也可以简单地使用SVM、决策树、随机森林等,前者的添加Mask的准确性更高,且数据量充足,故多优先使用前者作为本发明的增加Mask的算法。根据添加Mask的准确性来选择指定数据库进行最终的纺织品含量预测。

Claims (1)

1.基于完全约束最小二乘法的纺织品成分解混方法,其特征在于,所述解混方法包括以下步骤:
S1:采集纺织品纤维成分的近红外光谱特征数据;
S2:定义光谱信息与纺织品成分的对应关系,建立纺织品纤维成分的光谱信息数据库;
S3:近红外光谱数据的清洗和预处理;
S4:基于完全约束最小二乘法,生成纺织品纤维成分的数据字典信息;
S5:基于完全约束最小二乘法,确定纺织品性质,输出成分解混结果,
所述步骤S2进一步包括:
S21:基于光谱解混理论,定义光谱信息与纺织品成分的对应关系,光谱解混目的是获得混合像元或信号所包含的端元成分及其含量,即端元提取和端元丰度估计,解混模型的工作原理为:
其中,为重构的信号或者像元,η∈Rd为噪声,在像元解混中表示一个像素点的在d个通道上的光谱值,在信号中表示一个长度为d的序列数据信号;
为M个端元a=(a1,a2,...,aM)T为各端元的丰度,/>且每项为非负;
建立纺织品纤维成分的光谱信息数据库时,纺织品的类别信息可视为光谱解混中的端元em,纺织品的含量信息为各端元的丰度,二者的连接点在于纺织品纤维成分的近红外光谱信息为光谱解混中的近红外光谱信息,
所述步骤S3进一步包括:
S31:对采集、标注后的数据进行以下预处理:数据规范化处理,数据去噪处理,序列傅里叶变换处理,消除基线平移、漂移处理,扩充数据维度处理,仿光谱特征的数据增强处理,
所述步骤S4进一步包括:
S41:生成两种数据字典信息,一种为未知其类别性质,针对全数据进行生成数据字典信息;一种针对已知类型的纺织品,增加Mask,生成数据字典信息;分别对两种数据,进行完全约束的最小二乘法约束;
S42:生成全局数据信息,对现存的所有纺织品数据,经过预处理,生成全数据的数据字典信息,该数据字典考虑到了全局特征,生成一个完整的特征空间;
S43:按纺织品类别生成字典信息,对现存的所有纺织品数据,经过预处理,根据其类别的不同,生成对应类别的数据字典信息,该数据字典信息考虑到了局部特征,是对全局特征的细化和补充;
S44:根据基于完全约束最小二乘法的纺织品成分解混方法,分别对全局数据以及按类别生成的数据进行约束,约束主要包含有非负约束与和为1约束,考虑到真实的纺织品定量分析结果为和为一的非负值;
非负约束具体表现为,对于
和一约束具体表现为,对于X=[x1,x2,...,xn]T所述基于成分解混的纺织品成分含量预测方法步骤S5进一步包括:
S51:将待测纺织品与全数字典库进行对照,得到其类别和含量信息;
S52:将待测纺织品经过Mask模块,得到其类别结果,与对应类别的数据字典信息对比,得到其含量信息,Mask模块包括深度神经网络;
S53:权衡步骤S51和步骤S52的两种结果,对两种结果进行投票,若Mask添加准确,则选定指定类别的纯材质或混合材质数据字典,使用基于成分解混的完全约束的最小二乘法,得到定量分析结果;若Mask模块的性能较差,则选择全局特征,在完整的特征空间内,应用完全约束的最小二乘法,无损清洁地得到其纺织品的预测含量。
CN202111039378.9A 2021-09-06 2021-09-06 基于完全约束最小二乘法的纺织品成分解混方法 Active CN113970528B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111039378.9A CN113970528B (zh) 2021-09-06 2021-09-06 基于完全约束最小二乘法的纺织品成分解混方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111039378.9A CN113970528B (zh) 2021-09-06 2021-09-06 基于完全约束最小二乘法的纺织品成分解混方法

Publications (2)

Publication Number Publication Date
CN113970528A CN113970528A (zh) 2022-01-25
CN113970528B true CN113970528B (zh) 2024-04-23

Family

ID=79586743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111039378.9A Active CN113970528B (zh) 2021-09-06 2021-09-06 基于完全约束最小二乘法的纺织品成分解混方法

Country Status (1)

Country Link
CN (1) CN113970528B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115394381B (zh) * 2022-08-24 2023-08-22 哈尔滨理工大学 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944144A (zh) * 2010-08-30 2011-01-12 陈玉君 一种基于无网格的布类仿真方法
CN103472028A (zh) * 2013-09-22 2013-12-25 广西科技大学 一种混纺纤维中组分含量的测定方法
CN107219188A (zh) * 2017-06-02 2017-09-29 中国计量大学 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
CN108267414A (zh) * 2017-12-26 2018-07-10 中山出入境检验检疫局检验检疫技术中心 纺织品纤维含量的近红外光谱分析方法
CN110428454A (zh) * 2019-08-13 2019-11-08 电子科技大学中山学院 一种高光谱解混方法、装置、电子设备及存储介质
CN111766146A (zh) * 2020-07-03 2020-10-13 浙江大学 一种固化土材料收缩开裂性能的测试评价方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050096950A1 (en) * 2003-10-29 2005-05-05 Caplan Scott M. Method and apparatus for creating and evaluating strategies

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101944144A (zh) * 2010-08-30 2011-01-12 陈玉君 一种基于无网格的布类仿真方法
CN103472028A (zh) * 2013-09-22 2013-12-25 广西科技大学 一种混纺纤维中组分含量的测定方法
CN107219188A (zh) * 2017-06-02 2017-09-29 中国计量大学 一种基于改进dbn的近红外光谱分析纺织品棉含量的方法
CN108267414A (zh) * 2017-12-26 2018-07-10 中山出入境检验检疫局检验检疫技术中心 纺织品纤维含量的近红外光谱分析方法
CN110428454A (zh) * 2019-08-13 2019-11-08 电子科技大学中山学院 一种高光谱解混方法、装置、电子设备及存储介质
CN111766146A (zh) * 2020-07-03 2020-10-13 浙江大学 一种固化土材料收缩开裂性能的测试评价方法及装置

Also Published As

Publication number Publication date
CN113970528A (zh) 2022-01-25

Similar Documents

Publication Publication Date Title
JP6089345B2 (ja) 時および/または空間系列ファイルの多成分回帰/多成分分析
CN103983595B (zh) 一种基于紫外-可见光谱处理的水质浊度解算方法
CN101915744A (zh) 物质成分含量的近红外光谱无损检测方法及装置
CN104568778A (zh) 一种基于高光谱成像的纺织品成分鉴别方法
CN112712108B (zh) 一种拉曼光谱多元数据分析方法
CN109738413A (zh) 基于稀疏非负最小二乘的混合物拉曼光谱定性分析方法
CN111487213A (zh) 多光谱融合的化学需氧量测试方法及装置
CN113970528B (zh) 基于完全约束最小二乘法的纺织品成分解混方法
Gorshkova et al. Investigation of the new possibility of mathematical processing of Raman spectra for dating documents
CN109187443A (zh) 基于多波长透射光谱的水体细菌微生物准确识别方法
Zeng et al. Mixture analysis using non‐negative elastic net for Raman spectroscopy
CN115236045A (zh) 一种利用荧光光谱法测定水中化学需氧量的方法、装置及存储介质
CN114112982A (zh) 基于k-Shape的织物纤维成分定性方法
Chen et al. Authentication and inference of seal stamps on Chinese traditional painting by using multivariate classification and near-infrared spectroscopy
CN108489928B (zh) 一种短波红外消光光谱纺织品纤维成分检测方法
CN116399836A (zh) 基于交替梯度下降算法的串扰荧光光谱分解方法
Matinrad et al. Systematic investigation of the measurement error structure in a smartphone-based spectrophotometer
CN114088657B (zh) 基于深度编解码器的纺织纤维成分分析方法
Boseley et al. Leaving a mark on forensic science: how spectroscopic techniques have revealed new insights in fingerprint chemistry
CN113076812A (zh) 光谱的量子化指纹图谱的处理方法、系统、介质及应用
Yang et al. The characterization of plant species using first‐derivative fluorescence spectra
CN114136914B (zh) 一种基于双线性解混的织物纤维成分无损清洁分析方法
Celani et al. Exploring elucidation of red dye mixtures on woolen historical textiles via non-destructive spectroscopic analysis and multivariate cluster analysis
CN109270005A (zh) 一种提高壁画颜料光谱匹配精度的散射噪声消除方法
Broggio RamApp: a modern toolbox for the processing and analysis of hyperspectral imaging data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant