CN116183535A - 分析高分子溶液陈化过程光谱的方法、系统、设备及介质 - Google Patents
分析高分子溶液陈化过程光谱的方法、系统、设备及介质 Download PDFInfo
- Publication number
- CN116183535A CN116183535A CN202310439724.5A CN202310439724A CN116183535A CN 116183535 A CN116183535 A CN 116183535A CN 202310439724 A CN202310439724 A CN 202310439724A CN 116183535 A CN116183535 A CN 116183535A
- Authority
- CN
- China
- Prior art keywords
- solution
- visible absorption
- machine learning
- picture
- learning model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000032683 aging Effects 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000001228 spectrum Methods 0.000 title claims abstract description 37
- 238000000862 absorption spectrum Methods 0.000 claims abstract description 53
- 238000010801 machine learning Methods 0.000 claims abstract description 52
- 238000012549 training Methods 0.000 claims abstract description 21
- 239000000243 solution Substances 0.000 claims description 148
- 229920000642 polymer Polymers 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000003066 decision tree Methods 0.000 claims description 12
- 238000001816 cooling Methods 0.000 claims description 9
- 238000012545 processing Methods 0.000 claims description 9
- 238000002835 absorbance Methods 0.000 claims description 8
- 238000012935 Averaging Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 claims description 5
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000007865 diluting Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010183 spectrum analysis Methods 0.000 claims description 3
- 238000010790 dilution Methods 0.000 claims description 2
- 239000012895 dilution Substances 0.000 claims description 2
- 238000007789 sealing Methods 0.000 claims description 2
- 230000000694 effects Effects 0.000 abstract description 7
- 230000000007 visual effect Effects 0.000 abstract description 6
- 230000008901 benefit Effects 0.000 abstract description 5
- 230000008859 change Effects 0.000 abstract description 4
- 238000004140 cleaning Methods 0.000 abstract description 2
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000006243 chemical reaction Methods 0.000 description 5
- 229920000301 poly(3-hexylthiophene-2,5-diyl) polymer Polymers 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 239000002861 polymer material Substances 0.000 description 3
- YLQBMQCUIZJEEH-UHFFFAOYSA-N tetrahydrofuran Natural products C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 3
- 238000010521 absorption reaction Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 238000007637 random forest analysis Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000002787 reinforcement Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- -1 carrier Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000000306 component Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000009472 formulation Methods 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 239000012535 impurity Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000178 monomer Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000704 physical effect Effects 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 239000010453 quartz Substances 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N silicon dioxide Inorganic materials O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 238000004611 spectroscopical analysis Methods 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012706 support-vector machine Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000002371 ultraviolet--visible spectrum Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
- G01N21/33—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry using ultraviolet light
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/17—Systems in which incident light is modified in accordance with the properties of the material investigated
- G01N21/25—Colour; Spectral properties, i.e. comparison of effect of material on the light at two or more different wavelengths or wavelength bands
- G01N21/31—Investigating relative effect of material at wavelengths characteristic of specific elements or molecules, e.g. atomic absorption spectrometry
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C60/00—Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computing Systems (AREA)
- Analytical Chemistry (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biochemistry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Investigating Or Analysing Materials By Optical Means (AREA)
Abstract
本发明公开了一种分析高分子溶液陈化过程光谱的方法、系统、设备及介质,它们是一一对应的方案,方案中:通过捕捉陈化过程中相应的视觉变化图像,将其与精确测量的紫外可见吸收谱一一对应,得到大量的样本数据;经过数据清洗以及特征描述符选择之后,对机器学习模型进行训练;最终训练后的机器学习模型的光谱预测效果与实验数据能很好的吻合。本发明既达到了实验光谱仪所测的准确度,又兼具高效率、低成本的优势。
Description
技术领域
本发明涉及高分子溶液光谱分析技术领域,尤其涉及一种分析高分子溶液陈化过程光谱的方法、系统、设备及介质。
背景技术
现实中,高分子材料会随着放置时间的增加,在光线、空气、盐类pH、絮凝剂、射线等共同作用下,自发地聚集而沉淀。这种现象被称为陈化现象。目前陈化现象可以通过光谱或视觉上的色度、黏度变化来识别。光谱测量的好处非常明显,其结果可以十分准确地反映出高分子材料的许多的物理特性,可以非常详细地描绘出其陈化过程。但是其缺点也是致命的,那就是无法快速批量进行样品的分析,同时光谱仪的价格也十分高昂,这使得工业上无法使用此方法。而视觉观察虽然简单,但是其判断过于主观,十分依赖观测人的经验,同时容易受到环境等多方面的影响,从而很难获得准确的结果。因此,如何既简单又准确地描述出大量高分子材料的陈化过程是一个非常重要的研究课题。
机器学习本质就是解决问题的某种方法,如何从样本数据寻求某种规律,并利用这种规律对未知数据进行预测。其方法主要可以分为三类:监督学习、无监督学习和强化学习。监督学习是指创建一个以标记数据为输入的函数来判断未知样本数据,包括分类和回归。无监督学习是指使用未标记的数据进行输入并产生推理的功能,主要包括聚类和降维。强化学习为人工智能和自主系统学习决策提供了一个强大的范例,核心思想是最佳的行为是由积极的反馈来强化的。
机器学习中涉及到的算法很多,具体选择何种方法是根据需要解决的问题而定的。通常当数据量及复杂度较小时,可以优先考虑传统机器学习算法,如随机森林、支持向量机、极端梯度提升(XGBoost)等。当数据量和复杂度较大,通常尝试深度学习算法,如深度神经网络(DNN)、卷积神经网络(CNN)、生成式对抗网络(GAN)等。
目前,机器学习技术在光谱领域中的应用已经变得越来越广泛了。例如,利用机器学习来揭示光谱和表面分子吸附的内在关联;通过核磁共振(NMR)谱学特征的图神经网络来预测化学反应路径等。然而,还未曾发现利用机器学习来研究高分子溶液陈化过程的光谱情况。有鉴于此,特提出本发明。
发明内容
本发明的目的是提供一种分析高分子溶液陈化过程光谱的方法、系统、设备及介质,既达到了实验光谱仪所测的准确度,又兼具高效率、低成本的优势。
本发明的目的是通过以下技术方案实现的:
一种分析高分子溶液陈化过程光谱的方法,包括:
对配制好的溶液进行不同浓度的稀释,对于每一浓度的稀释溶液,均分别采集溶液图片与对应的紫外可见吸收谱,并放置于固定温度下冷却陈化,再结合稀释溶液的浓度按照设定时间间隔采集溶液图片与对应的紫外可见吸收谱,直至稀释溶液的颜色不再变化;
对采集到的所有溶液图片与对应的紫外可见吸收谱均分别进行预处理,从每一溶液图片与对应的紫外可见吸收谱中选出多个特征描述符与对应标签信息,构建数据集;
利用数据集训练机器学习模型,将多个特征描述符输入至机器学习模型,然后将机器学习模型的预测结果与对应的标签信息进行对比,优化所述机器学习模型;
利用训练后的机器学习模型预测溶液陈化过程的光谱数据。
一种分析高分子溶液陈化过程光谱的系统,该系统包括:
溶液图片与紫外可见吸收谱采集单元,用于对配制好的溶液进行不同浓度的稀释,对于每一浓度的稀释溶液,均分别采集溶液图片与对应的紫外可见吸收谱,并放置于固定温度下冷却陈化,再结合稀释溶液的浓度按照设定时间间隔采集溶液图片与对应的紫外可见吸收谱,直至稀释溶液的颜色不再变化;
数据预处理与数据集构建单元,用于对采集到的所有溶液图片与对应的紫外可见吸收谱均分别进行预处理,从每一溶液图片与对应的紫外可见吸收谱中选出多个特征描述符与对应标签信息,构建数据集;
模型训练单元,用于利用数据集训练机器学习模型,将多个特征描述符输入至机器学习模型,然后将机器学习模型的预测结果与对应的标签信息进行对比,优化所述机器学习模型;
光谱数据预测单元,用于利用训练后的机器学习模型,预测溶液陈化过程的光谱数据。
一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。
一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。
由上述本发明提供的技术方案可以看出,通过捕捉陈化过程中相应的视觉变化图像,将其与精确测量的紫外可见吸收谱一一对应,得到大量的样本数据,经过数据清洗以及特征描述符选择之后,对机器学习模型进行训练,最终训练后的机器学习模型的的光谱预测效果与实验数据能很好的吻合。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种分析高分子溶液陈化过程光谱方法的流程图;
图2为本发明实施例提供的一种紫外可见光谱仪工作原理示意图;
图3为本发明实施例提供的极端随机树的原理模型示意图;
图4为本发明实施例提供的利用机器学习预测高分子溶液光谱的流程示意图;
图5为本发明实施例提供的一种分析高分子溶液陈化过程光谱的系统示意图;
图6为本发明实施例提供的一种处理设备的示意图。
具体实施方式
下面结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明的保护范围。
首先对本文中可能使用的术语进行如下说明:
术语“包括”、“包含”、“含有”、“具有”或其它类似语义的描述,应被解释为非排它性的包括。例如:包括某技术特征要素(如原料、组分、成分、载体、剂型、材料、尺寸、零件、部件、机构、装置、步骤、工序、方法、反应条件、加工条件、参数、算法、信号、数据、产品或制品等),应被解释为不仅包括明确列出的某技术特征要素,还可以包括未明确列出的本领域公知的其它技术特征要素。
术语“由……组成”表示排除任何未明确列出的技术特征要素。若将该术语用于权利要求中,则该术语将使权利要求成为封闭式,使其不包含除明确列出的技术特征要素以外的技术特征要素,但与其相关的常规杂质除外。如果该术语只是出现在权利要求的某子句中,那么其仅限定在该子句中明确列出的要素,其他子句中所记载的要素并不被排除在整体权利要求之外。
下面对本发明所提供的一种分析高分子溶液陈化过程光谱的方法、系统、设备及介质进行详细描述。本发明实施例中未作详细描述的内容属于本领域专业技术人员公知的现有技术。本发明实施例中未注明具体条件者,按照本领域常规条件或制造商建议的条件进行。本发明实施例中所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
实施例一
通过研究发现,利用机器学习可以高效而又准确地实现高分子溶液陈化过程光谱的分析,为此本发明实施例提供一种分析高分子溶液陈化过程光谱的方法,它基于机器学习的方式实现高分子溶液陈化过程光谱的分析,既达到了实验光谱仪所测的准确度,又兼具高效率、低成本的优势;如图1所示,其主要包括如下步骤:
步骤1、配制溶液并进行稀释后采集溶液图片与对应的紫外可见吸收谱。
本发明实施例中,对配制好的溶液进行不同浓度的稀释,对于每一浓度的稀释溶液,均分别采集溶液图片与对应的紫外可见吸收谱,并放置于固定温度下冷却陈化,再结合稀释溶液的浓度按照设定时间间隔采集溶液图片与对应的紫外可见吸收谱,直至稀释溶液的颜色不再变化。
步骤2、数据预处理与数据集的构建。
本发明实施例中,对采集到的所有溶液图片与对应的紫外可见吸收谱均分别进行预处理,从每一溶液图片与对应的紫外可见吸收谱中选出多个特征描述符与对应标签信息,构建数据集。
步骤3、利用数据集训练机器学习模型。
本发明实施例中,在训练时,将多个特征描述符输入至机器学习模型,将机器学习模型预测结果(预测的吸光度信息)与对应的标签信息进行对比后,优化所述机器学习模型。
具体而言,数据集将被划分为训练集与测试集,训练集用于机器学习模型的训练,测试集则用于验证训练后的机器学习模型的效果。
步骤4、利用训练后的机器学习模型,预测新溶液陈化过程的光谱数据。
本发明实施例中,在训练完毕并进行验证后,可以利用训练后的机器学习模型根据新溶液的图片进行光谱预测,从而获取新溶液陈化过程中的吸光度信息。
为了更加清晰地展现出本发明所提供的技术方案及所产生的技术效果,下面以具体实施例对本发明实施例所提供的上述方法进行详细描述。
一、紫外可见光谱仪原理。
本发明实施例中,通过紫外可见光谱仪对高分子溶液扫描获取紫外可见吸收谱,如图2所示。启动紫外可见光谱仪后,点亮光源,产生不同波长的光。当光束穿过单色仪的第一个狭缝,保证所有光子都平行通过,这样当它们击中棱镜时,会被折射出彩虹的颜色,那么每一个波长的光都移动到了不同位置。在这种情况下,只有一个波长的光能穿过单色仪的第二个狭缝,然后射入分光镜,变成两束强度相等的光束。从不同的通路穿越各自的吸收池,一个是参比池,一个是样品池(即溶液所在的比色皿)。当光束离开吸收池击中探测器时,会将接受到的光子转换为电流,通过计算机获取光谱信息。
二、采集溶液图片与紫外可见吸收谱的方式。
1、配制设定浓度的P3HT(聚3-己基噻吩)样品的THF(四氢呋喃)溶液。水浴加热溶解P3HT样品于THF溶液中。P3HT是由单体分子之间的共轭相互作用形成一个长的分子链之间的共轭相互作用导致的,在温度升高时聚合物分子链间的共轭相互作用被破坏,使得聚合物向单分子链转变。此处是以P3HT及相应的THF溶液为例进行介绍,在实际应用中,用户可根据实际需要选择其他类型的高分子材料与相应的溶液,以配制出相应的高分子溶液。
2、将THF溶液热浴至亮橙色,并快速分别稀释到不同的浓度,然后使用移液器将每一浓度的稀释溶液快速转移到相应的石英比色皿中并快速进行封口处理。
示例性的,此阶段可以根据需要稀释到六种不同的浓度,浓度较高与较低可以通过设定阈值来界定,具体的浓度值与阈值可以根据实际情况进行设定。
3、将封口后的比色皿在设定时间内固定在支架上进行拍摄,获得溶液图片;并且,使用紫外可见光谱仪扫描出稀释溶液的紫外可见吸收谱。具体的:
将封口后的装有稀释溶液的比色皿在一分钟内于固定的支架上完成拍照,并用紫外可见光谱仪扫描溶液的紫外可见吸收谱。然后放入固定温度的冰箱中冷却陈化,溶液的颜色随着时间逐渐从亮橙色变深。示例性的,固定温度可以为7℃。之后,再结合稀释溶液的浓度按照设定间隔采集溶液图片与对应的紫外可见吸收谱,直至稀释溶液的颜色不再变化。
不同浓度的稀释溶液陈化过程颜色的变化速度不同,浓度越高,陈化刚开始的转变速率越快。随着陈化的单链分子共轭聚合接近化学平衡,反应变慢。因此对于浓度较低的稀释溶液的陈化颜色转变速度较慢,在冰箱中冷却约1小时颜色才会发生视觉可分辨的颜色变化。对于较低浓度的稀释溶液,每间隔1小时左右拍照并扫描紫外可见吸收谱。对于浓度较高的稀释溶液,溶液前期颜色转变的速率相对较快,前期需要10-20分钟左右采集一次照片和紫外可见吸收谱的数据。比色皿在每次冷却过程中取出采集溶液图片和紫外可见吸收谱时,需要擦净表面的冷凝水汽。后期随着聚合物和单分子链反应逐渐接近化学平衡会减少采集照片和吸收谱的频率到1小时/次。当紫外可见吸收谱上在525 nm附近的吸收峰完全呈现时,稀释溶液的颜色将不会再有明显的改变时,停止采用相应稀释溶液的溶液图片与对应的紫外可见吸收谱。
三、数据预处理与数据集构建。
获取的溶液图片和对应紫外可见吸收谱需要做进一步处理。由于整个高分子溶液是均匀的,可对溶液图片进行预处理,获取相应的RGB值来代替溶液图片信息,具体实现方式为:选择溶液图片中全部为溶液的颜色区域,对其RGB三个通道分别取平均值,作为第一组RGB平均值;选择溶液图片中背景底色的颜色区域,对其RGB三个通道分别取平均值,作为第二组RGB平均值;对两组RGB平均值按通道做差值,获得相应的RGB值(共三个值)。
在紫外可见吸收谱中,主要是获取波长(Wavelength)和吸光度信息(Abs)。最终选取了4个特征描述符:波长和像素点值(即RGB值),标签信息为吸光度信息。
本发明实施例中,溶液图片和对应紫外可见吸收谱是成对的数据,因此构建数据集时,以成对数据中的4个特征描述符与标签信息作为一组数据,最终综合采集到的所有溶液图片和紫外可见吸收谱的4个特征描述符与标签信息构建数据集。
四、模型训练。
本发明实施例中,尝试GBDT(梯度提升决策树)、ExtraTree(极端随机树)、XGBoost(极端梯度提升)、LightGBM(轻量级梯度提升机)等多种经典机器学习算法。经过对比后,发现极端随机树算法的效果最佳,其预测的光谱数据与实验数据非常接近。此极端随机树算法和随机森林非常相似,都是由许多决策树组成,属于集成学习模型,如图3所示。极端随机树算法中,各决策树分别进行预测,对所有决策树预测结果取平均值作为极端随机树算法的预测结果。图3中M为决策树数目,M为正整数,可根据实际情况或者经验设置具体数值。极端随机树算法流程可参照常规技术实现,此处不做赘述。
极端随机树算法根据经典的自顶向下过程构建一个未修剪的决策树或回归树的集合。它与其他基于树的集成方法的两个主要区别是:(1)使用整个学习样本而不是随机抽取样本(bootstrap抽样)来生长树。(2)通过完全随机地选择切点来分割节点。可以看出此算法的随机性很强,这利于模型的训练效果。
极端随机树分裂过程中有两个参数:K是每个节点随机选择的属性个数,nmin是分裂一个节点的最小样本大小。多次与完整的学习样本一起用于生成集成模型,用M表示决策树的数量。在分类问题中通过多数投票,在回归问题中通过算术平均,将树的预测集合起来,得到最终的预测结果。
从偏差-方差的角度来看,极端随机树方法背后的基本原理同其他方法使用的较弱随机化方案相比,与整体平均相结合的切点和属性的显式随机化应该能够更有效地减少方差。使用完整的学习样本而不是bootstrap抽样是为了最小化偏差。从计算的角度来看,假设决策树是平衡的,那么决策树生长过程的复杂性就像大多数其他树生长过程一样,其复杂度为NlogN的量级。然而,考虑到节点分割过程的简单性,期望常数因子比其他基于集成的局部优化切点的方法小得多。
参数K、nmin和M具有不同的效果:K决定属性选择过程的强度,nmin决定输出噪声平均的强度,M决定集成模型聚合方差降低的强度。在这里,选取的是Scikit-learn(Python编程语言的免费软件机器学习库)中ExtraTreesRegressor方法,即极端随机回归树模型。
图4展示了模型训练与训练后的应用过程。通过溶液图片信息和光谱信息,对极端随机树算法进行训练。训练时,将多个特征描述符输入至机器学习模型,然后将机器学习模型的预测结果(即预测的吸光度信息)与对应的标签信息进行对比,优化所述机器学习模型,此处所述的溶液图片信息和光谱信息是指前述预处理获得的RGB值与波长。将训练好的机器学习模型根据新溶液的图片(同样采用前文数据预处理方式获得相应的RGB值)来预测新溶液的光谱信息,即陈化过程中的吸光度信息。最后通过光谱解析获取所需要的溶液物理量。实验结果发现,本发明既达到了实验光谱仪所测的准确度,又兼具高效率、低成本的优势。
通过以上实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例可以通过软件实现,也可以借助软件加必要的通用硬件平台的方式来实现。基于这样的理解,上述实施例的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM、U盘、移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、网络设备等)执行本发明各个实施例所述的方法。
实施例二
本发明还提供一种分析高分子溶液陈化过程光谱的系统,其主要基于前述实施例提供的方法实现,如图5所示,该系统主要包括:
溶液图片与紫外可见吸收谱采集单元,用于对配制好的溶液进行不同浓度的稀释。对于每一浓度的稀释溶液,均分别采集溶液图片与对应的紫外可见吸收谱,并放置于固定温度下冷却陈化,再结合稀释溶液的浓度按照设定时间间隔采集溶液图片与对应的紫外可见吸收谱,直至稀释溶液的颜色不再变化;
数据预处理与数据集构建单元,用于对采集到的所有溶液图片与对应的紫外可见吸收谱均分别进行预处理。从每一溶液图片与对应的紫外可见吸收谱中选出多个特征描述符与对应标签信息,构建数据集;
模型训练单元,用于利用数据集训练机器学习模型。训练时,将多个特征描述符输入至机器学习模型,然后将机器学习模型的预测结果与对应的标签信息进行对比,优化所述机器学习模型;
光谱数据预测单元,用于利用训练后的机器学习模型,预测新溶液陈化过程的光谱数据。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明。实际应用中,可以根据需要而将上述功能分配至不同的功能模块完成,即将系统的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。
实施例三
本发明还提供一种处理设备,如图6所示,其主要包括:一个或多个处理器;存储器,用于存储一个或多个程序。其中,当所述一个或多个程序被所述一个或多个处理器执行时,可实现前述实施例提供的方法。
进一步的,所述处理设备还包括至少一个输入设备与至少一个输出设备;在所述处理设备中,处理器、存储器、输入设备、输出设备之间通过总线连接。
本发明实施例中,所述存储器、输入设备与输出设备的具体类型不做限定,例如:
输入设备可以为触摸屏、图像采集设备、物理按键或者鼠标等;
输出设备可以为显示终端;
存储器可以为随机存取存储器(Random Access Memory,RAM),也可为非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。
实施例四
本发明还提供一种可读存储介质,用于存储计算机程序,当计算机程序被处理器执行时实现前述实施例提供的方法。
本发明实施例中可读存储介质可以设置于前述处理设备中,例如作为处理设备中的存储器。此外,所述可读存储介质也可以是U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、磁带或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明披露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书的保护范围为准。
Claims (9)
1.一种分析高分子溶液陈化过程光谱的方法,其特征在于,包括:
对配制好的溶液进行不同浓度的稀释,对于每一浓度的稀释溶液,均分别采集溶液图片与对应的紫外可见吸收谱,并放置于固定温度下冷却陈化,再结合稀释溶液的浓度按照设定时间间隔采集溶液图片与对应的紫外可见吸收谱,直至稀释溶液的颜色不再变化;
对采集到的所有溶液图片与对应的紫外可见吸收谱均分别进行预处理,从每一溶液图片与对应的紫外可见吸收谱中选出多个特征描述符与对应标签信息,构建数据集;
利用数据集训练机器学习模型,将多个特征描述符输入至机器学习模型,然后将机器学习模型的预测结果与对应的标签信息进行对比,优化所述机器学习模型;
利用训练后的机器学习模型预测新溶液陈化过程的光谱数据。
2.根据权利要求1所述的一种分析高分子溶液陈化过程光谱的方法,其特征在于,所述每一浓度的稀释溶液,均分别采集溶液图片与对应的紫外可见吸收谱包括:
将每一浓度的稀释溶液转移至比色皿中并进行封口处理;
对于每一浓度的稀释溶液,将封口后的比色皿在设定时间内固定在支架上进行拍摄,获得溶液图片;并且,使用紫外可见光谱仪扫描出稀释溶液的紫外可见吸收谱。
3.根据权利要求1所述的一种分析高分子溶液陈化过程光谱的方法,其特征在于,所述对采集到的所有溶液图片与对应的紫外可见吸收谱均分别进行预处理,从每一溶液图片与对应的紫外可见吸收谱中选出多个特征描述符与对应标签信息包括:
对溶液图片进行预处理,获取相应的RGB值;以及从紫外可见吸收谱中提取波长信息与吸光度信息;其中,RGB表示红色绿色与蓝色三个通道;
将RGB值与波长信息作为特征描述符,将吸光度信息作为对应标签信息。
4.根据权利要求3所述的一种分析高分子溶液陈化过程光谱的方法,其特征在于,所述对溶液图片进行预处理,获取相应的RGB值包括:
选择溶液图片中全部为溶液的颜色区域,对其RGB三个通道分别取平均值,作为第一组RGB平均值;选择溶液图片中背景底色的颜色区域,对其RGB三个通道分别取平均值,作为第二组RGB平均值;对两组RGB平均值按通道做差值,获得相应的RGB值。
5.根据权利要求1所述的一种分析高分子溶液陈化过程光谱的方法,其特征在于,所述机器学习模型通过极端随机树算法实现,所述极端随机树算法由多个决策树组成,各决策树分别进行预测,对所有决策树预测结果取平均值作为极端随机树算法的预测结果。
6.根据权利要求1所述的一种分析高分子溶液陈化过程光谱的方法,其特征在于,该方法还包括:预测新溶液陈化过程的光谱数据后,通过光谱解析获取溶液中的物理量。
7.一种分析高分子溶液陈化过程光谱的系统,其特征在于,基于权利要求1~6任一项所述的方法实现,该系统包括:
溶液图片与紫外可见吸收谱采集单元,用于对配制好的溶液进行不同浓度的稀释,对于每一浓度的稀释溶液,均分别采集溶液图片与对应的紫外可见吸收谱,并放置于固定温度下冷却陈化,再结合稀释溶液的浓度按照设定时间间隔采集溶液图片与对应的紫外可见吸收谱,直至稀释溶液的颜色不再变化;
数据预处理与数据集构建单元,用于对采集到的所有溶液图片与对应的紫外可见吸收谱均分别进行预处理,从每一溶液图片与对应的紫外可见吸收谱中选出多个特征描述符与对应标签信息,构建数据集;
模型训练单元,用于利用数据集训练机器学习模型,将多个特征描述符输入至机器学习模型,然后将机器学习模型的预测结果与对应的标签信息进行对比,优化所述机器学习模型;
光谱数据预测单元,用于利用训练后的机器学习模型,预测新溶液陈化过程的光谱数据。
8.一种处理设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1~6任一项所述的方法。
9.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310439724.5A CN116183535B (zh) | 2023-04-23 | 2023-04-23 | 分析高分子溶液陈化过程光谱的方法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310439724.5A CN116183535B (zh) | 2023-04-23 | 2023-04-23 | 分析高分子溶液陈化过程光谱的方法、系统、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116183535A true CN116183535A (zh) | 2023-05-30 |
CN116183535B CN116183535B (zh) | 2023-08-29 |
Family
ID=86440640
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310439724.5A Active CN116183535B (zh) | 2023-04-23 | 2023-04-23 | 分析高分子溶液陈化过程光谱的方法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116183535B (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101130883A (zh) * | 2006-08-22 | 2008-02-27 | 国家纳米科学中心 | 一种长方形金核/钯壳双金属纳米棒及其制备方法 |
US20160310913A1 (en) * | 2015-04-23 | 2016-10-27 | Lixin Wu | Flexible two-dimensional single-layer supramolecualr polymer toward precise nano-size separation |
CN108022239A (zh) * | 2017-12-05 | 2018-05-11 | 郑州轻工业学院 | 一种基于机器视觉的起泡葡萄酒褐变过程检测装置及方法 |
CN108140555A (zh) * | 2015-10-22 | 2018-06-08 | 应用材料公司 | 沉积包含SiO及SiN 的可流动薄膜的方法 |
CN109738400A (zh) * | 2018-12-12 | 2019-05-10 | 中南民族大学 | 一种基于纳米卟啉荧光纸传感可视化检测咖啡因的方法 |
CN110161013A (zh) * | 2019-05-14 | 2019-08-23 | 上海交通大学 | 基于机器学习的激光诱导击穿光谱数据处理方法和系统 |
CN110887798A (zh) * | 2019-11-27 | 2020-03-17 | 中国科学院西安光学精密机械研究所 | 基于极端随机树的非线性全光谱水体浊度定量分析方法 |
CN112504983A (zh) * | 2020-12-11 | 2021-03-16 | 中国科学院西安光学精密机械研究所 | 一种基于浊度色度补偿的硝酸盐浓度预测方法 |
CN113030079A (zh) * | 2021-04-23 | 2021-06-25 | 中南民族大学 | 基于纳米金蚀刻检测农药甲萘威的方法 |
WO2022031316A1 (en) * | 2020-08-07 | 2022-02-10 | Battelle Energy Alliance, Llc | Machine learned spectrum analysis |
WO2022155597A2 (en) * | 2021-01-18 | 2022-07-21 | Collaborations Pharmaceuticals, Inc. | Uv-vis spectra prediction |
-
2023
- 2023-04-23 CN CN202310439724.5A patent/CN116183535B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101130883A (zh) * | 2006-08-22 | 2008-02-27 | 国家纳米科学中心 | 一种长方形金核/钯壳双金属纳米棒及其制备方法 |
US20160310913A1 (en) * | 2015-04-23 | 2016-10-27 | Lixin Wu | Flexible two-dimensional single-layer supramolecualr polymer toward precise nano-size separation |
CN108140555A (zh) * | 2015-10-22 | 2018-06-08 | 应用材料公司 | 沉积包含SiO及SiN 的可流动薄膜的方法 |
CN108022239A (zh) * | 2017-12-05 | 2018-05-11 | 郑州轻工业学院 | 一种基于机器视觉的起泡葡萄酒褐变过程检测装置及方法 |
CN109738400A (zh) * | 2018-12-12 | 2019-05-10 | 中南民族大学 | 一种基于纳米卟啉荧光纸传感可视化检测咖啡因的方法 |
CN110161013A (zh) * | 2019-05-14 | 2019-08-23 | 上海交通大学 | 基于机器学习的激光诱导击穿光谱数据处理方法和系统 |
CN110887798A (zh) * | 2019-11-27 | 2020-03-17 | 中国科学院西安光学精密机械研究所 | 基于极端随机树的非线性全光谱水体浊度定量分析方法 |
WO2022031316A1 (en) * | 2020-08-07 | 2022-02-10 | Battelle Energy Alliance, Llc | Machine learned spectrum analysis |
CN112504983A (zh) * | 2020-12-11 | 2021-03-16 | 中国科学院西安光学精密机械研究所 | 一种基于浊度色度补偿的硝酸盐浓度预测方法 |
WO2022155597A2 (en) * | 2021-01-18 | 2022-07-21 | Collaborations Pharmaceuticals, Inc. | Uv-vis spectra prediction |
CN113030079A (zh) * | 2021-04-23 | 2021-06-25 | 中南民族大学 | 基于纳米金蚀刻检测农药甲萘威的方法 |
Non-Patent Citations (4)
Title |
---|
ANAIS GÓMEZ等: "Electronic Eye Based on RGB Analysis for the Identification of Tequilas", 《BIOSENSORS》, pages 1 - 15 * |
C. V. OSSIA等: "Novel Chromatic Technique Based on Optical Absorbance in Characterizing Mineral Hydraulic Oil Degradation", 《ADVANCES IN TRIBOLOGY》, pages 1 - 6 * |
买巍;赵晓明;张健飞;徐志伟;李政;: "紫外可见光谱结合多元分析法在线检测混合染料溶液化学需氧量", 光谱学与光谱分析, no. 07 * |
陈滇宝, 孔宪思, 刘莉, 唐学明: "四氯化钼催化丁二烯1, 2-聚合体系的紫外可见光谱研究", 高等学校化学学报, no. 02 * |
Also Published As
Publication number | Publication date |
---|---|
CN116183535B (zh) | 2023-08-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Deng et al. | Field detection and classification of citrus Huanglongbing based on hyperspectral reflectance | |
Brescia et al. | Automated physical classification in the SDSS DR10. A catalogue of candidate quasars | |
Wetterich et al. | Detection of Huanglongbing in Florida using fluorescence imaging spectroscopy and machine-learning methods | |
US20130026391A1 (en) | Information processing apparatus, information processing method, program, and method of correcting intensity of fluorescence spectrum | |
EP1992939A1 (en) | A kernel-based method and apparatus for classifying materials or chemicals and for quantifying the properties of materials or chemicals in mixtures using spectroscopic data. | |
Jiang et al. | mRMR-based feature selection for classification of cotton foreign matter using hyperspectral imaging | |
WO2019039313A1 (ja) | スペクトルの高速分類を利用したリアルタイムスペクトル解析 | |
Men et al. | A residual network with attention module for hyperspectral information of recognition to trace the origin of rice | |
Hu et al. | PCANet: A common solution for laser-induced fluorescence spectral classification | |
Shen et al. | Single convolutional neural network model for multiple preprocessing of Raman spectra | |
Qi et al. | SAM-GAN: An improved DCGAN for rice seed viability determination using near-infrared hyperspectral imaging | |
CN116183535B (zh) | 分析高分子溶液陈化过程光谱的方法、系统、设备及介质 | |
Mozaffari et al. | Convolutional Neural Networks for Raman spectral analysis of chemical mixtures | |
CN113408616B (zh) | 基于pca-uve-elm的光谱分类方法 | |
Burlacu et al. | Convolutional Neural Network detecting synthetic cannabinoids | |
JP2023521757A (ja) | ラマンスペクトルに基づいて試料の特質を識別するためのモデルを決定するための遺伝的アルゴリズムの使用 | |
Raulf et al. | A representation learning approach for recovering scatter‐corrected spectra from Fourier‐transform infrared spectra of tissue samples | |
Tian et al. | Analysis of Gas Mixtures with Broadband Dual Frequency Comb Spectroscopy and Unsupervised Learning Neural Network | |
CN114364971B (zh) | 用于确定样品中存在的组分的光谱装置和方法 | |
CN114092784A (zh) | 基于长短期记忆神经网络的混合染液浓度光谱检测方法 | |
Borraz‐Martínez et al. | Combining computer vision and deep learning to classify varieties of Prunus dulcis for the nursery plant industry | |
Negoiţă et al. | Logistic regression classification model identifying drugs of abuse based on their ATR-FTIR spectra: Case study on LASSO and Ridge regularization methods | |
CN112326574A (zh) | 一种基于贝叶斯分类的光谱波长选择方法 | |
Zhu et al. | Fabric defect detection using ACS-based thresholding and GA-based optimal Gabor filter | |
CN117388198B (zh) | 一种基于多源光谱融合的水质cod检测方法及检测设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |