CN113670894B

CN113670894B - 拉曼光谱定量监测物质含量的方法

Info

Publication number: CN113670894B
Application number: CN202111229972.4A
Authority: CN
Inventors: 丁贤根; 黄世回; 嵇旭辉; 丁远彤
Original assignee: Harbour Star Health Biology Shenzhen Co ltd
Current assignee: Harbour Star Health Biology Shenzhen Co ltd
Priority date: 2021-10-22
Filing date: 2021-10-22
Publication date: 2022-02-11
Anticipated expiration: 2041-10-22
Also published as: CN113670894A

Abstract

拉曼光谱定量监测物质含量的方法，对多种浓度的监测物质，建立欧氏几何和黎曼几何的监测函数，分别计算相应的拉曼数据，采用统计法或查询法标记拉曼谱线特征峰；对同一种浓度的监测物质的多个拉曼数据设定的特征峰形状及种类等特征种类，通过Z检验算法等算法计算特征分数，基于统计学原理，筛选出高概率的拉曼数据作为最终筛选数据；用平均值法计算筛选数据的均值，建立均值与浓度的定量对应表，通过查询定量对应表获取未知浓度的物质的浓度和误差；或采用拟合法对对应表已知物质浓度的值所对应的拉曼数据为拟合点，进行可控误差的曲线拟合，获取拟合方程，实现对未知浓度监测物质的更加精确的浓度值计算，此外还提供了云计算的工作步骤。

Description

拉曼光谱定量监测物质含量的方法

技术领域

本发明涉及工业技术领域和生物医学领域，具体涉及医学数据和工业数据的拉曼光谱大数据分析方法，尤其是对于医学领域的拉曼测试，通过建立监测物质拉曼光谱大数据，实施拉曼光谱定量监测物质含量的方法。

背景技术

早在1928年，印度科学家C.V.拉曼发现了拉曼散射现象，即当用光束照射到某些物质上后，其散射光会发生频率变化，这种特点的散射光形成的光谱后来被人们按照发现人的姓氏称之为拉曼光谱。不同物质都对应一张特有的光谱，具有极强的分辨率，这种特点使得拉曼光谱作为一种物质结构的分析测试手段而被应用成为可能。虽然C.V.拉曼于1930年因为这项发现与研究获得当年诺贝尔奖，但是由于产生拉曼散射光的光源技术、散射光传导以及收集等技术很长时间没有突破性发展，客观上限制了拉曼光谱技术应用。直到上个世纪60年代，激光技术的突破性发展，使得能产生散射光的高强度光源的激光光源发生器或设备成为现实。

依据发明人检索发现，近几年，拉曼光谱在对特定物质的定性监测方面研究非常多，基本上比较成熟。拉曼光谱在物质成分定量分析方面，目前可检索的对比文件，特点都是针对具体的特定的物质，在对单个拉曼谱线的信号处理上的方法比较多，还没涉及到大数据的方法。例如公布号：CN102495042 A，发明名称为：一种粉末混合物的拉曼光谱准确定量分析方法，其主要依据拉曼光谱特征峰强度与物质成分之间建立模型关系，通过双校准模型来加强定量分析的准确度。公布号：CN112304922 A，发明名称为：一种基于偏最小二乘法的拉曼光谱定量分析原油的方法，其主要限定在对原油的定性定量分析方法，其大篇幅阐述了对原油的单根拉曼光谱的预处理，然后基于已知浓度预处理的光谱强度利用偏最小二乘法建模，实现对应的“真实浓度值”分别进行计算预估。公布号：CN108802000 A，发明名称为：一种基于拉曼全谱分析的无损快速胆维丁含量定量方法，其主要限定在胆维丁含量定量的拉曼全谱分析，侧重点在于解决胆维丁样品拉曼谱峰偏移对定量测量精度的影响，主要方法是利用一根拉曼光谱全谱数据而不是个别特征峰数据进行分析。公布号：CN108593628 A，发明名称为：一种定量分析青蒿素含量的激光拉曼检测方法，主要针对小麦粉中青蒿素含量分析，利用拉曼光谱的特征峰的面积比作为特征参数，建立以青蒿素/小麦面粉混合物中的青蒿素质量分数与特征峰的面积比的对应关系，进行二次函数关系拟合建立数学模型来做定量分析。公布号：CN110455769 A，发明名称为：壳为内标的核壳纳米粒子表面增强拉曼光谱定量分析方法，则主要是通过物理方法，即通过制备核壳结构纳米粒子来实现表面增强拉曼光谱的信噪比，然后还是通过提取表面增强拉曼散射（SERS：Surface-Enhanced Raman Scattering）信号相对强度与标准溶液浓度的关系绘制标准曲线实现定量分析。

依据发明人的研究发现，涉及到拉曼光谱分析以及大数据在工业、医疗方面的，其现有主要技术如下。

一、拉曼光谱在物质定性分析中应用。

激光拉曼光谱。

目前拉曼光谱技术无论是在医学医药领域、工业领域、生命科学领域、农业以及食品领域、甚至刑侦等领域，被用来做对被监测物质的定性分析有着广泛应用。特别随着激光技术发展，以及拉曼光谱采集设备或者拉曼光谱测试设备等技术的成熟，客观上有力地推动了拉曼光谱分析在上述医学医药领域、工业领域、生命科学领域或者刑侦等领域快速应用与发展，特别作为物质定性分析。

拉曼特征峰。

对被监测物质实施激光拉曼光谱的分析，根据不同物质对应特有的拉曼位移特征峰这个特点，可以识别物质的振动转动能级情况，分析物质的性质，从而可以鉴别被检测的物质为何种物质或者含有何种物质，即对被监测物质做物质鉴定的定性分析。

混合物成分鉴别。

当对多种物质混合物作拉曼光谱分析，可以鉴别出混合物的组成成分，这也属于比较流行的利用拉曼光谱做混合物成分的定性分析。

表面增强拉曼散射和针尖增强拉曼光谱依据发明人的检索发现，在拉曼光谱分析的灵敏度与准确度方面，随着现代纳米技术的发展，促使了表面增强拉曼散射（SERS：Surface-Enhanced Raman Scattering）和针尖增强拉曼光谱（TERS：Tip-Enhanced RamanSpectroscopy）技术的诞生，提高了被监测物质拉曼散射光的强度，提高了信噪比，在超高灵敏度检测方面取得了巨大的进步，这也开拓了拉曼激光检测技术在对物质成分定量分析方面，也提供了一种可行的技术方向。

二、拉曼光谱在物质定量分析中技术应用。

溶液物质浓度的定量分析。

随着拉曼光谱技术发展，人们不但需要对被测试物质进行定性分析，更多应用领域，对被检测的未知物质含量或者浓度，或者已知性质的物质在物质的固体混合物或物质的溶液中的含量或者浓度的定量分析的需求越来越迫切。例如，在工业领域，利用拉曼光谱，对混合液中酒精含量的浓度分析，在医疗领域，利用拉曼激光光谱分析仪，对病人的采样血液样本，用拉曼光谱做血糖浓度的分析。目前基于拉曼光谱的定量分析，一般都是在专有的实验室，通过复杂的样本取样监测，样本特征识别复杂、数据处理分析大量依赖专业的分析人员、分析时间长，处理效率低，测试结果误差也较大等因素都会极大影响该技术在实际中的应用。

拉曼光谱定量分析的基本计算。

拉曼光谱在定量分析应用，首先处理荧光等干扰问题，同时对硬件设备噪声要求也非常高，一般情况只能专业的实验室来对被监测物质进行测试，基本技术流程如下：

建立某纯物质溶液已知不同浓度与拉曼特峰强度之间的对应关系，这种关系可以是表格形式，也可以是拟合的曲线方程形式，形成一种参照对比标准。

用拉曼光谱设备对未知浓度被监测物质的溶液进行监测，获得拉曼特征峰谱线。

读取被监测物质溶液的拉曼谱线特征峰的强度数值，对照已知的该物质各浓度与拉曼特峰强度之间的对应关系表，人工分析或者设备的内嵌软件依据对应关系表或拟合的曲线方程分析被测物质的浓度。

无创拉曼血糖分析。

当前又有学者提出，通过拉曼激光照射人体特定组织部位产生的拉曼光谱，实现无创的血糖浓度分析。然而无论是工业领域直接对被监测物质进行拉曼定量分析，还是医学领域无创血糖拉曼分析，设备本身系统噪声，荧光成分的干扰，人体组织蛋白质等物质拉曼光的干扰，以及测量误差造成拉曼谱线的特征峰不明显甚至被淹没，对被测物质含量或者浓度做的定量测试效果非常不乐观，仅存在于条件要求非常苛刻的实验室能实现，以至于影响相关设备研发进度，十分不利于相关拉曼测试产品的市场推广。

三、大数据技术在医疗领域中应用。

随着信息技术与计算机技术发展，人们迎来了“大数据与云”的时代，以往传统嵌入式设备或者本地系统由于本身硬件条件或者数据处理运算的局限性而没法实现的具有人工智能（AI）功能的定性、定量的研判、预估、诊断、规划等复杂算法，现在通过云服务器、大数据技术，逐一可以得到实现。

大数据技术的核心本质上是对海的量数据进行各种复杂而又高效的数据运算，特别是建立在统计学理论基础上的运算算法。例如当前在医疗领域的流行病的大数据分析，远程自助模式的医疗诊断专家系统等都是“互联网+大数据+人工智能”的典型应用。

如果将大数据技术应用到拉曼光谱分析中去，无疑可以推动当前拉曼光谱监测在定量监测应用方面的大步发展，可突破传统硬件设备做复杂人工智能算法运算能力的局限，特别在医疗领域的血糖监测分析中，将一些传统的、昂贵的固定在实验室的诸如拉曼血糖分析设备，逐步走出专业的实验室，实现小型化，便携化，甚至是可穿戴的无创伤产品，推广到广大用户特别是糖尿病用户的日常血糖监测与管理中去。

现有技术方法不足。

依据上述分析，发明人认为，现有拉曼光谱技术在对被监测物质定量分析的技术或者方法存在以下不足。

1、一次性的拉曼谱线在噪声背景下，特征量不明显，无法做出精准的定量分析结果。

2、设备的系统误差以及测量误差无法规避。

3、即使人工多次测量做定量分析，寻找拉曼光谱特征峰值规律十分费时费力，且误差较大。

4、相关设备基本上在专业实验室使用，而且价格昂贵，例如拉曼血糖分析设备，不利于向大众推广普及。

5、在对单一物质在相应溶解剂中的浓度分析，能有可控误差范围的结果，但是在多物质混合溶液或者生物体组织中，做某一种物质的定量分析，现有技术无法规避不确定因素的干扰，很难得出能接受的误差条件下的定量分析结果，例如在无创拉曼血糖分析中，现有技术无法规避噪声以及人体组织其他成分的干扰，从而不能准确获得血糖浓度。

发明内容

在工业特别是医疗领域，利用拉曼激光法，对人体组织进行无创血糖分析，在现有拉曼光谱仪的硬件条件下，由于荧光背景干扰，其它非被监测物质拉曼光谱干扰，系统误差、测量误差的客观存在，人体皮肤组织的干扰，以及激光束照射角度的波动，都会带来拉曼谱线的变化以及测量重复性的问题，因此想通过人工操作利用一次性测量获得的单根拉曼光谱线或者多次测量多根拉曼谱线做平均运算，来做无创模式下血糖浓度参数的做定量分析，得出在设定误差范围内的准确浓度数据是极端困难的。本发明依据一种以上浓度的监测物质做校准样本，进行大量样本数据采集，形成被监测物质的拉曼光谱大数据，再通过基于概率统计学理论的等算法的计算，对拉曼大数据进行分析筛选，最终获得在置信区间内的拉曼谱线集，做谱线集拟合后得到一根包络线，并对所述包络线做运算，建立与被监测物质浓度在可控的允许误差范围内的更加精确的定量分析。

针对在工业领域特别是医疗领域，以现有拉曼光谱仪的硬件条件下，由于荧光以及其他非被监测物质拉曼光谱干扰，以及系统的误差、测量误差的存在，人工通过一次性单根拉曼光谱线或者多次测量得到多根拉曼谱线做平均运算，对被监测物质诸如浓度参数的做定量分析，得出在设定误差范围内的准确浓度数据困难问题，本发明依据一种以上浓度的监测物质，用以下方法进行大量样本数据采集，以及数据计算，形成被监测物质的拉曼光谱大数据，再通过基于概率统计学理论的算法，对拉曼大数据进行分析筛选，最终获得被监测物质浓度在可控的允许误差范围内的更加精确的定量分析。

本发明的目的和意图是采用如下技术方案的工作步骤实现的。

1、基础方案步骤。

本发明作为拉曼光谱定量监测物质含量的方法，包括以下基础步骤。

S2000步骤：依据一种以上已知浓度的监测物质，采用监测函数，分别计算一个以上的拉曼数据。

S3000步骤：依据所述拉曼数据，采用统计法或查询法标记特征峰。

S4000步骤：对于同一种所述已知浓度的所述监测物质的一个以上所述拉曼数据，依据所述特征峰设定拉曼位移区间，依据所述特征峰的包括但不限于形状、位置设定特征种类，计算所述特征种类所对应的特征分数。

S5000步骤：设定特征分数阈值，依据所述特征种类和所述特征分数，筛选出概率大于特定概率的所述拉曼数据作为最终筛选数据。

S6000步骤：采用平均值法，计算所述最终筛选数据的均值，并计算所述均值与所述已知浓度的定量对应表。

S7000步骤：通过查询法查询所述定量对应表获取未知浓度的所述监测物质的浓度和误差，或采用拟合法计算所述未知浓度的所述监测物质的所述浓度和误差。

这里需要说明的是，所述S2000步骤中，所述一种以上浓度至少是监测物质的溶液样本覆盖0%到100%全区间范围内的等间距至少20个以上的浓度样本，不同浓度的样本总数越多越好，有利于精确度的提高。所述一个以上的拉曼数据是指对于一个所述的已知浓度的监测物质样品，经过同一台拉曼光谱设备在相同条件下进行一次以上的多次监测获得一簇拉曼谱线集，采用所述监测函数，分别计算得到，即每一种所述的已知浓度的监测物质有所述的一个以上的拉曼数据构成的拉曼数据集。

对于所述已知浓度的监测物质，利用所述S2000步骤、S3000步骤、S4000步骤、S5000步骤、S6000步骤、以及S7000步骤中所述的拟合算法等大数据的训练方法，得出的拉曼数据与监测物质的数学模型，成为标准的对比模型。进一步地说，所述拟合法是将所述的已知浓度的定量对应表里所述均值与所述的已知浓度通过曲线拟合，得到两者的关系函数。进一步的，所述的关系函数的自变量为均值，因变量为浓度值。

对于相同物质的所述未知浓度的监测物质，利用所述S2000步骤、S3000步骤、S4000步骤、S5000步骤、S6000步骤中的所述均值计算等大数据运算方法，得出所述的均值，通过所述S7000步骤，与所述已知浓度的定量对应表进行对比查询，获取未知浓度的所述监测物质的浓度和误差，或，通过所述的关系函数，获取未知浓度的所述监测物质的浓度。

2、拉曼数据监测函数。

在前述基础方案的基础上，本发明在包括但不限于计算所述监测物质的拉曼数据方面，具体可以采用如下列的一种或者多种组合的计算步骤或方法。

所述S2000步骤具体包括但不限于。

进一步的，S2010步骤，基于设定的平面坐标系，按照包括但不限于公式2.1建立欧氏几何的所述监测函数，计算获取所述拉曼数据，按照包括但不限于公式2.3计算获取拉曼谱线。

进一步的，S2020步骤，基于设定的曲面坐标系，按照包括但不限于公式2.2建立黎曼几何的所述监测函数，计算获取所述拉曼数据，按照包括但不限于公式2.3计算获取所述拉曼谱线。

需要说明的是，欧氏几何也就是欧几里得几何，相较黎曼几何而言，欧氏几何的特点是坐标轴为直线，两点之间的距离是直线段的长度。而黎曼几何坐标轴支持曲线，在该坐标系中，两点之间的距离是沿曲线坐标轴的曲线长度。黎曼几何的这一特点以及黎曼几何成体系的计算方法，对于拉曼谱线上的计算，带来了特别的便利。例如，物质浓度、含量和拉曼谱线之间的函数关系，可依照黎曼几何算法求解。

如图1所示，是基于拉曼谱线在黎曼坐标系的一种描述，X轴表示拉曼位移，Y轴表示拉曼特征峰编号，Z轴表示拉曼光谱特征峰Z分数，超平面为设置Z分数阈值在全域范围内构成的阈值曲面，超平面以上的数据为符合要求的筛选数据，超平面以下的数据为不符合要求丢弃的数据，图中5个拉曼波峰在筛选算法中，就可以采用一个超平面来截取拉曼波峰，以选中拉曼数据。

优选的，S2030步骤，对于不同浓度的所述监测物质，在监测范围之内，采用监测次数超过特定次数，按照公式2.1、公式2.2和公式2.3，监测和计算获取所述拉曼数据和所述拉曼谱线，构成拉曼大数据。

需要说明的是，公式2.1、公式2.2和公式2.3均为概念描述形式，在具体计算设计方法中，包括依据本行业公知共用的知识列写，还包括采用一些算法软件中提供的计算函数。

需要说明的是，所述监测物质，包括但不限于纯物质、纯物质溶液和混合成分物质，其形态包括但不限于固体、液体和气体，所述监测范围包括但不限于浓度范围、监测序号范围和拉曼位移编号范围。

需要说明的是，所述公式包括但不限于：

其中：f _2.1为采用拉曼光谱测量设备测量所述监测物质产生所述拉曼数据过程的所述监测函数的所述欧氏几何表述，R_2.2 ³为采用拉曼光谱测量设备测量所述监测物质产生所述拉曼数据过程的所述监测函数的所述黎曼几何表述，C为所述监测物质的所述浓度，S为获取所述拉曼数据次数的监测序号，W为所述拉曼光谱的位移值，所述R_2.2 ³中标号3表示包括为C、S、W的3个维度，f _2.2 ^C为维度C的实函数，f _2.2 ^S为维度S的实函数，f _2.2 ^W为维度W的实函数，LM为所述拉曼数据，LMS为所述拉曼谱线，α为浓度编号，β为监测序号，γ为拉曼位移编号，γ取值范围1≤γ≤p，p为拉曼位移编号最大值，所述拉曼谱线为一次测量中产生的全部所述拉曼数据所构成的拉曼光谱的谱线。

进一步的细节包括公式2.4至公式2.8，具体如下：

其中：公式2.4为所述浓度的集合描述，公式2.5为所述浓度函数，C _α为浓度编号为α的所述浓度，Δ _d为所述浓度的变化步长，n为所述浓度的最大编号。进一步的，对于已知浓度样本来说，所述的C为所述监测物质的所述的一种以上浓度集合，例如1%，2% 或者5%等，具体取值根据实际的所述的监测物质常规的浓度范围来决定，所述浓度的最大编号n，须满足至少n=20，优选的大于20以上的等间距浓度值。

公式2.6为所述监测序号的集合描述，S _β为所述监测序号为β的监测序号， m为所述监测序号的最大编号，1≤β≤m。

公式2.7为所述拉曼位移的集合描述，W _γ为编号为γ的所述拉曼位移，p为拉曼位移拉曼的最大编号。

公式2.8为所述拉曼位移的函数，γ为所述拉曼位移的编号，W _γ为编号为γ的峰值拉曼位移，Δ _b为所述拉曼位移的变化步长，σ _γ为编号为γ的拉曼位移W _γ与编号为 1的拉曼位移W ₁之间若干间隔步长。

需要说明的是，所述拉曼谱线包括但不限于由p个所述拉曼峰数据排列构成，如公式2.3所示，其中，浓度编号和监测序号分别为α和β，拉曼位移编号从1到p。

需要说明的是，所述监测范围包括但不限于：

1≤α≤n、1≤γ≤p、1≤β≤m。

优选地，所述特定次数包括但不限于30。

3、拉曼数据监测函数扩展。

在前述技术方案的基础上，本发明在包括但不限于拉曼数据、拉曼谱线和监测函数方面，在S2000步骤方面，具体还可以采用如下列的一种或者多种组合的局部改进的措施。

进一步的，S2040步骤，采用所述监测物质的纯物质，直接获取所述纯物质的一条以上所述拉曼谱线。

优选的，S2050步骤，采用所述监测物质的由溶解剂溶解产生的混合溶液，分别获取所述混合溶液和所述溶解剂纯物质的一条以上所述拉曼谱线，采用包括但不限于公式3.1或公式3.2的差分计算方法，计算获取所述监测物质的所述拉曼谱线。

需要说明的是，所述公式包括但不限于：

其中：LM ₁为所述混合溶液的所述拉曼数据，LM ₂为所述溶解剂的所述拉曼数据，k为加权系数，k_γ为拉曼位移编号为γ的拉曼峰统一加权系数，γ取值范围1≤γ≤p，p为拉曼位移编号最大值。

需要补充说明的是，在一些应用中，例如对于超低浓度的监测物质的监测时，或者不易提纯的监测物质时，或者未知物质的监测时，可以采用通过公式3.1和公式3.2做机器学习和迭代，进一步完成这些应用。

4、拉曼谱线特征峰的标记。

在前述技术方案的基础上，本发明在包括但不限于拉曼谱线特征峰标记方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤。

所述S3000步骤具体包括但不限于。

进一步的，S3010步骤，依据所述拉曼谱线，寻找并标记波峰，计算所述波峰的宽度和相对高度。

进一步的，S3020步骤，所述统计法包括但不限于依据一条以上所述拉曼谱线，以所述拉曼谱线数为统计样本，采用包括但不限于正态分布、T检验、Z检验、Bayes概率、SVM支持向量机、CNN卷积神经网络的计算方法，计算置信度包括但不限于大于50%的并且所述波峰相对高度包括但不限于大于20%的所述波峰，标记该所述波峰为所述特征峰。

进一步的，S3030步骤，所述查询法包括但不限于查询由所述统计法计算的所述监测物质的特征峰对应表或可信的所述监测物质的特征峰对应表，标记所述特征峰。

需要说明的是，所述特征峰为在所述拉曼谱线上的所述拉曼位移位置，所述特征峰的宽度为在所述拉曼谱线上的最大宽度值。

进一步的，所述一条以上所述拉曼谱线，其特点是，一个所述的已知浓度的监测物质样品，经过同一台拉曼光谱设备在相同条件下进行m次监测获得一簇拉曼谱线集，即m为所述监测序号的最大编号。

需要补充说明的是，上述置信度阈值大于50%和波峰相对高度的大于20%以内的数值描述，只是针对特定应用而确定的，在一些其他应用中，这些数值讲座相应的修改，例如，对于一些概率要求更高的统计中，上述置信度阈值可设定为大于95%或更低，上述波峰相对高度范围也可以设定为大于5%或者50%。

另外，监测物质的特征峰往往很多，在实际应用中，需要根据监测精度来进行取舍，通常是在很多特征峰中，选择若干个最具典型特征的特征峰，或者便于跟混合成分物质中的其他物质具有明显区别的特征峰，而并不需要把全部特征峰都纳入计算，以减轻计算压力。

5、特征和统计。

在前述技术方案的基础上，本发明在包括但不限于特征和统计计算方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤。

所述S4000步骤具体包括但不限于。

进一步的，S4010步骤，以每个所述特征峰的峰值所在的所述拉曼位移为中心点，依据所述特征峰的宽度，设定所述拉曼位移区间为2倍以上所述特征峰的宽度。

进一步的，S4020步骤，在所述拉曼位移区间内，按照所述特征种类，计算所述特征分数。

进一步的，S4030步骤，所述计算所述特征分数，包括但不限于所述统计法，其中包括但不限于所述Z检验、T检验、Bayes概率、SVM支持向量机、CNN卷积神经网络的计算方法，具体包括但不限于S4031步骤至S4033步骤，具体是。

优选的，S4031步骤，取所述特定次数大于30以上所述拉曼谱线作为所述统计样本，在每个所述统计样本的所述特征峰的所述拉曼位移区间内，以所述拉曼数据作为所述特征种类的样本值，计算样本均值、样本方差和样本标准差。

需要说明的是，之所以设定特定次数大于30，是便于采用Z检验算法的特征统计筛选，如果是采用T检验算法，则特定次数需要小于30。如果采用其他的检验算法，这里的特定次数，需要根据检验算法的需要而设定。

优选地，取同一浓度的所述监测物质m根所述拉曼谱线作为所述统计样本，在每个所述统计样本的所述特征峰的所述拉曼位移区间内，以所述拉曼数据作为所述特征种类的样本值，计算样本均值、样本方差和样本标准差。

优选的，S4032步骤，按照计算方法包括但不限于公式5.1计算所述特征分数，

5.1

其中，γ为所述拉曼谱线的编号，p为所选取的所述拉曼谱线的最大编号，Z _γ为所述特征分数，x _γ为所述拉曼谱线的编号的所述样本值，

为所述样本均值，s为所述标准差。

优选的，S4033步骤，所述特征种类具体包括但不限于所述拉曼谱线的最大值、最小值、所述特征峰的峰值、所述特征峰的前后谷值、所述特征峰的波峰面积值、所述特征峰的的位置、所述特征峰的的峰角。

6、拉曼数据筛选。

在前述技术方案的基础上，本发明在包括但不限于拉曼数据筛选方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤。

所述S5000步骤具体包括但不限于。

进一步的，S5010步骤，对于所述特征种类，基于设定的所述特征分数阈值，标记所述特征分数大于所述特征分数阈值的所述拉曼数据为淘汰数据，标记留下的所述拉曼数据为选中数据。

优选地，在Z检验算法的情况下，例如对于特征种类为特征峰面积的特征分数，选择特征分数阈值为2.58，则，特征分数大于2.58时，表示符合统计概率在99.74%即3σ之外，标记为异常值，该拉曼谱线判断为淘汰。设定阈值为1.96时，特征分数小于1.96时，表示符合统计概率在95.44%即2σ之内，标记为正常值，该拉曼谱线判断为选中数据，依此类推。

进一步的，S5020步骤，检查所述选中数据的筛选结果，如果所述筛选结果达标，则赋值所述选中数据为该种所述特征种类的种类备选数据，如果所述筛选结果未达标，则调整所述特征分数阈值，重新标记所述特征分数大于调整后的所述特征分数阈值的所述拉曼数据为淘汰数据，重新标记留下的所述拉曼数据为选中数据，直到所述筛选结果达标，则赋值达标后的所述选中数据为该种所述特征种类的种类备选数据，所述筛选结果的达标与否的判据包括但不限于置信度、置信区间、特定概率和人工判断。

进一步的，S5030步骤，针对全部所述特征种类，计算全部相应的所述种类备选数据。

优选的，S5040步骤，采用组合逻辑计算全部种类的所述种类备选数据为全体筛选数据。

所述组合逻辑的选用，以及究竟采用哪些特征种类，可在具体的应用中酌情选中。例如，在人体血糖体外监测的例子中，我们选择特征种类包括拉曼区间最大值、最小值、波峰个数、波峰位置、波谷个数、波谷位置、波峰面积、波峰高度、波峰角度等特征。在组合逻辑中，选择上述特征的判断之间为逻辑“与”的关系，在前期监测中，选择纯葡萄糖粉末，做3000次监测，对于这些结果做筛选，以成功筛选出葡萄糖的若干特征峰，其中发现在拉曼位移1096、1125处，具有明显的特征，于是我们选择拉曼位移1096、1125处为葡萄糖的主要特征峰。

优选的，S5050步骤，依据所述种类备选数据、所述全体筛选数据和所述拉曼数据的比较的结果，调整所述特征分数阈值和所述组合逻辑，筛选出概率大于特定概率的所述拉曼数据作为最终筛选数据。

7、建立定量对应表。

在前述技术方案的基础上，本发明在包括但不限于平均值法、定量对应表建立方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤：

所述S6000步骤具体包括但不限于：

进一步的，S6010步骤，以所述最终筛选数据所对应的所述拉曼谱线为数据集，计算包络线，所述包络线的上边的计算方法包括但不限于公式7.1，所述包络线的下边的计算方法包括但不限于公式7.2，

所述MAX(LM _η)为在1≤η≤q范围内，取最大值的函数，所述MIN(LM _η)为在1≤η≤q范围内，取最小值的函数，η为最终筛选数据编号，q为总数。

优选的，S6020步骤，依据所述包络线，计算算术平均值和算术平均误差，并计算所述浓度与所述拉曼数据的所述定量对应表，所述算术平均值的计算方法包括但不限于公式7.3，所述算术平均误差的计算方法包括但不限于公式7.4，

所述LMS _av1为所述包络线的算术平均值，所述LMS _er1为所述算术平均误差。

优选的，S6030步骤，依据所述包络线，计算中位数和中位误差，并计算所述浓度与所述拉曼数据的所述定量对应表，所述中位数的计算方法包括但不限于公式7.5，所述中位误差的计算方法包括但不限于公式7.6，

所述LMS _av2为所述包络线的所述中位数，所述LMS _er2为所述中位误差。

所述平均值法包括但不限于所述算术平均值和所述中位数，所述均值包括但不限于所述算术平均值、所述算术平均误差，或，所述中位数、所述中位误差，所述误差包括但不限于所述算术平均误差或所述中位误差，所述定量对应表为所述均值与所述浓度之间的一一对应的表格。

需要说明的是，在实际应用中，包络线的上下边线的纵轴范围，对于系统测量精度而言，应该越小越好，这一点，可在机器学习中逐渐迭代，最终使得包络线的上下边线的纵轴范围，在满足监测系统误差要求为止。

8、查询和拟合。

在前述技术方案的基础上，本发明在包括但不限于监测物质的浓度查询法、拟合法计算步骤方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤：

所述S7000步骤具体包括但不限于。

进一步的，S7010步骤，所述查询法包括但不限于对于所述未知浓度的所述监测物质，获取其所述拉曼谱线，依据所述拉曼谱线，查询所述定量对应表获取所述监测物质的浓度和误差。

优选的，S7020步骤，所述拟合法包括但不限于在所述定量对应表中，依据已知浓度所对应的所述拉曼数据为拟合点，通过对相邻的所述拟合点进行拟合计算，建立拟合方程，所述拟合方程包括但不限于点对点拟合方程、直线拟合回归方程、二次多项式拟合回归方程、三次多项式拟合回归方程、四参数拟合回归方程。

优选的，S7030步骤，对于所述未知浓度的所述监测物质，计算获取所述拉曼谱线，依据所述拟合方程计算获取所述监测物质的浓度和误差。

需要说明的是，在实际应用中，依据监测系统的精确度和准确度，在前期基础性监测训练中，对于拟合点密度的选择，应该越密越好，例如，在人体血糖体外监测的例子中，我们对于前期训练，选择葡萄糖溶液的浓度间隔为0.5mmol/L，并且通过直线回归拟合，插值成为浓度间隔为0.1mmol/L。可见，拟合的方式，至少可以减少前期基础数据获得方面的成本，因为，浓度间隔为0.1mmol/L的葡萄糖溶液，不仅配制困难，有的情况还无法实现，而且成本较高。

9、获取未知浓度物质拉曼数据。

在前述技术方案的基础上，本发明在包括但不限于未知浓度物质的拉曼数据获取步骤方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤。

进一步的，S8010步骤，对于所述未知浓度的所述监测物质，按照所述S2000步骤获得一个以上的拉曼数据。

需要说明的是，这一步骤实际上就是包括：1、对于一个未知浓度的物质，例如人体血液中的葡萄糖，做前期按照不同浓度做监测，以获得前期的基础数据，便于机器学习和训练。2、直接监测未知浓度的拉曼数据，与前期训练成功的定量对应表进行比对。

进一步的，S8020步骤，依据所述S8010步骤获取的所述拉曼数据，按照所述S3000、S4000、S5000、S6000步骤中所描述或包括但不限于的具体步骤，获取所述未知浓度的所述监测物质拉曼谱线，并计算其浓度和误差。

需要说明的是，这一步骤实际上就是基于机器学习的大数据训练的方式，进行人工智能统计分析，最终通过与前期训练成功的定量对应表进行比对，以获得未知浓度物质的浓度机器可能的误差。

10、混合成分物质监测。

在前述技术方案的基础上，本发明在包括但不限于混合成分物质监测方面，具体可以采用如下列的一种或者多种组合的局部改进的措施步骤。

包括但不限于对于所述混合成分物质的所述监测物质的一种以上单一成分物质的检测，具体包括但不限于。

进一步的，S9010步骤，针对所述单一成分物质的所述监测物质中所述单一成分物质的纯物质，监测获取所述拉曼数据、所述拉曼谱线、所述特征峰和所述定量对应表，并监测获取所述一种以上单一成分物质的全部纯物质的各自的所述拉曼数据、所述拉曼谱线、所述特征峰和所述定量对应表。

进一步的，S9020步骤，监测获取所述混合成分的所述监测物质的所述拉曼数据和所述拉曼谱线，标记所述特征峰。

优选的，S9030步骤：采用包括Bayes概率、SVM支持向量机、CNN卷积神经网络的计算方法，在所述混合成分的所述监测物质的所述拉曼数据和所述拉曼谱线，标记所述特征峰数据中，计算所述单一成分物质的所述拉曼数据、所述拉曼谱线、所述特征峰和所述定量对应表数据在所述混合成分的所述监测物质中的所述浓度和所述误差，包括全部所述一种以上单一成分物质在所述混合成分的所述监测物质中的所述浓度和所述误差。

需要说明的是，通过收集相关物质的前期基础数据，通过人工智能的机器学习和训练，随着这些大数据的积累，混合成分的分类测量将变得越来越可行、越来越准确。

11、云模式。

在前述技术方案的基础上，本发明在包括但不限于采用SA000步骤云模式工作，具体可以采用如下列的一种或者多种组合的局部改进的措施步骤。

SA010步骤：建立云数据中心，使得数据监测点与所述云数据中心之间通过网络，实现包括但不限于云通信、云数据库存储和云计算。

进一步的，SA020步骤，所述数据监测点获得的所述拉曼数据，即时或分时，由所述网络，传送到所述云数据库中存储。

优选的，SA030步骤，由所述云数据中心执行包括但不限于所述S2000步骤、所述S3000步骤、所述S4000步骤、所述S5000步骤、所述S6000步骤、所述S7000步骤、所述S8000步骤、所述S9000步骤中任一步骤或者所述步骤的组合，以及云管理步骤，完成云计算。

优选的，SA040步骤，所述数据监测点通过所述云通信，让所述云数据中心执行所述云计算，并将云计算的结果传送回所述数据监测点。

优选的，SA050步骤，所述云数据中心对于所述云数据库中的所述拉曼数据，执行机器学习，产生包括所述定量对应表、混合成分物质经验概率表。

需要说明的是，云模式的采用，将极大地提升本发明的优势，由于基础数据存储在云数据库，不仅减少了单个数据监测点的重复劳动，而且还提升了数据资源的共享，更进一步改善了功能提升的基础。

12、发明目的和意图。

发明人通过长期的观察、实验和研究，提出拉曼光谱定量监测物质含量的方法，本发明的目的和意图在于：构建一套完整的采用拉曼光谱来实现物质含量定量监测的方法，具体包括。

1、采用监测函数，分别计算一个以上的拉曼数据形成数据集。

2、对拉曼数据，采用统计法或查询法标记拉曼谱线特征峰。

3、对拉曼数据，依据设定的拉曼位移区间和特征种类，通过Z函数计算所述特征种类所对应的特征分数，利用概率统计法筛选出高概率拉曼数据作为最终筛选数据，优化误差。

4、采用平均值法计算筛选数据的均值，建立与已知浓度的定量对应表，获取未知浓度的所述监测物质的浓度和误差。

5、对定量对应表进行最小误差曲线拟合，获取最小可控误差范围内的拟合方程，最终达到更加精确的被测物质定量分析值。

6、引入了云大数据和人工智能模式，解决现有拉曼光谱定量监测技术的不足。

此外，本发明还详细给出了数据集合表达，拉曼数据的构成，实现了拉曼数据的数学模型建模。建立了多维的数据格局，提供具体的拉曼光谱大数据产生方法，包括但不限于拉曼数据计算方法、拉曼特征峰对应表的建立方法、拉曼特征分数计算方法，拉曼数据的筛选方法、拉曼数据定量表的建立方法，实现了大数据分析。

基于拉曼大数据，给出了Z分数计算方法，利用概率统计数学原理，计算拉曼谱线特征种类的集合，实现多维度对拉曼谱线的量化标定，进一步提高拉曼定量分析精确度。

充分考虑系统误差，测量误差等分布规律，设定相应阈值，用平均值法以及Z检验算法，计算以及筛选有用拉曼谱线，规避系统误差、测量误差对测量结果的影响，有效提高不同测试环境下定量分析结果的准确度。

提供具体定量对应表和浓度拟合方法，实现被监测物质浓度的定量计算。

特别适合医疗领域利用拉曼激光光谱做活体组织无创血糖浓度的监测分析。

13、发明的有益效果。

1、能够实现特定物质含量的定量监测，保证测量精度。

2、具备学习功能，能够识别物质种类。

3、通过云模式选项的支撑，能够实现对于混合成分物质的成分分析，实现成分定量监测。

4、实现人工智能功能，系统将越来越聪明。

5、充分实现了发明目的和意图。

附图说明

附图清单。

图1：拉曼光谱大数据定量监测超平面截集图。

图2：拉曼光谱大数据定量监测方法流程图。

图3：浓度C ₁的葡萄糖溶液的拉曼光谱图。

图4：特征峰特征种类图。

图5：拉曼谱线某特征峰未经过Z分数计算的原始样本特征峰集。

图6：约束条件2σ经过Z分数计算后的拉曼特征峰集。

图7：约束条件σ经过Z分数计算后的拉曼特征峰集。

附图详细说明。

图1是本发明内容提供的拉曼光谱大数据定量监测超平面截集图，图中X轴表示拉曼位移，Y轴表示拉曼特征峰编号，Z轴表示拉曼光谱特征峰Z分数，超平面为设置Z分数阈值在全域范围内构成的阈值曲面，超平面以上的数据为符合要求的筛选数据，超平面以下的数据为不符合要求丢弃的数据。

图2是本发明实施例提供的拉曼光谱大数据定量监测方法流程图。

图3是本发明实施例提供的浓度C ₁的葡萄糖溶液的拉曼光谱图，浓度C ₁的葡萄糖溶液的拉曼光谱数据序号S ₅₀=50，列出了5个拉曼峰作为葡萄糖拉曼特征峰。

图4是本发明实施例提供的特征峰统计种类图，统计种类包括所述拉曼谱线的最大值、最小值、所述特征峰的峰值、所述特征峰的前后谷值、所述特征峰的波峰面积值、所述特征峰的位置、所述特征峰的峰角。

图5是本发明实施例提供的拉曼谱线某特征峰未经过Z分数计算的原始样本特征峰集，对同一个浓度的葡萄糖溶液1000次测量获得原始特征峰谱线集，5001是典型不合格的葡萄糖拉曼特征峰。

图6是本发明实施例提供的约束条件2σ经过Z分数计算后的拉曼特征峰集，在约束条件2σ该浓度葡萄糖溶液经过Z分数计算、筛选的拉曼特征峰集，6001为包络线的上边线，6002为包络线的下边沿线。

图7是本发明实施例提供的约束条件σ经过Z分数计算后的拉曼特征峰集，在更加苛刻的约束条件σ下，该浓度葡萄糖溶液经过Z分数计算、筛选的拉曼特征峰集。

具体实施方式

本发明的目的和意图是采用如下3个实施例的设计方法实现的，这里需要特别说明的是，由于每个具体的实施例都有具体的用途和工业实用性。所以，以下实施例中的任何一个，并不能包括本发明的所有特征和步骤，本发明权利要求书的描述，才是对于发明的总结。

本发明的具体实施方式如举例下。

实施例一：体外血糖拉曼光谱定量监测方法。

这个例子是本发明的拉曼光谱定量监测物质含量的方法的通用示例，以葡萄糖作为监测实验对象，利用拉曼光谱测量设备采集光谱。其中，葡萄糖物质由纯葡萄糖粉、不同浓度配比的葡萄糖水溶液，通过拉曼光谱测量设备的光信号采集，获得相应的拉曼数据及拉曼谱线，然后利用本发明的方法进行拉曼特征峰的提取分析，以及大数据定量分析，建立拉曼特征峰与葡萄糖浓度之间对应关系，即建立定量对应表、拟合曲线。需要申明的是，本实施例不是对于本发明的限定，而只是本发明工业应用的实施例之一。

1、示图说明。

本实施例内容主要包括但不限于由以下附图构成，它们是：图2、图3、图4、图5、图6、图7。其中图5、图6、图7 是本实施例的一个应用实例。

2、实施步骤说明。

本实施例的方法步骤主要包括步骤1至步骤11。其中，除非特别说明，否则这11个部分的步骤编号并不是具有先后顺序，也并不是任何实施例都需要这11个部分的组合。另外，这11个部分的每一个部分，都包括若干子步骤，除非特别说明，否则这些子步骤并不是完全需要的，其先后顺序也不是必须的，而是根据一些具体任务的需求，由专利实施者做出选择。

具体工作步骤说明如下。

2.1、基础方案步骤说明。

本发明作为体外血糖拉曼光谱定量监测方法，包括以下基础步骤。

如图2所示，方案流程图，分这里需要说明的是，所述S2000步骤中，所述一种以上浓度至少是监测物质的溶液样本覆盖0%到100%全区间范围内的等间距至少20个以上的浓度样本，不同浓度的样本总数越多越好，有利于精确度的提高。所述一个以上的拉曼数据是指对于一个所述的已知浓度的监测物质样品，经过同一台拉曼光谱设备在相同条件下进行一次以上的多次监测获得一簇拉曼谱线集，采用所述监测函数，分别计算得到，即每一种所述的已知浓度的监测物质有所述的一个以上的拉曼数据构成的拉曼数据集。

这里需要说明的是，本实施例中需要添加针对性的一些可选的算法项目，例如增加S8000步骤、S9000步骤、SA000步骤，以便使得本实施例的算法项目更加符合实际应用的要求。

这里还特别指出的是，所述监测物质包括葡萄糖、激素、酮类、皮肤以及皮肤角质类、血液成分等，还包括药物成本等。

2.2、拉曼数据监测函数步骤说明。

所述S2000步骤具体包括但不限于。

图1是基于拉曼谱线在黎曼坐标系的一种描述，其中，5个拉曼波峰在筛选算法中，就可以采用一个超平面来截取拉曼波峰，以选中拉曼数据。

需要说明的是，所述公式包括但不限于：

进一步的细节包括公式2.4至公式2.8，具体如下：

公式2.6为所述监测序号的集合描述，S _β为所述监测序号为β的监测序号， m为所述监测序号的最大编号，1≤β≤m。。

公式2.8为所述拉曼位移的函数，γ为所述拉曼位移的编号，W _γ为编号为γ的峰值拉曼位移，Δ _b为所述拉曼位移的变化步长，σ _γ为编号为γ的拉曼位移Wγ与编号为 1的拉曼位移W ₁之间若干间隔步长。

需要说明的是，所述监测范围包括但不限于：

1≤α≤n、1≤γ≤p、1≤β≤m。

优选地，所述特定次数包括但不限于30。

在本实施例中，以葡萄糖作为监测物质，用拉曼光谱测量设备分别对纯葡萄糖粉、葡萄糖粉配比的不同浓度的葡萄糖溶液进行原始测量，来阐述具体葡萄糖分子拉曼光谱大数据定量监测实施步骤。

葡萄糖浓度集C的获取。

用纯葡萄糖粉跟蒸馏水配成100份不同浓度的葡萄糖溶液，对这100份不同浓度的葡萄糖溶液按照浓度从小到顺序从序号1开始排序，那么浓度最大编号n=100, 如果规定编号α=1的葡萄糖浓度C ₁=2.2mmol/L，葡萄糖浓度的变化步长Δ _d=0.1，当 1≤α≤100，按照公式2.5配比的葡萄糖溶液浓度：

例如，样本最大葡萄糖浓度序号α=100对应的浓度值为C ₁₀₀=12.2mmol/L。这样，葡萄糖溶液样本浓度集C={C ₁,C ₂ ,C ₃…C ₁₀₀}={2.2 ,2.3,2.5,…12.1}。

进一步，获取葡萄糖拉曼数据编号集S。

用拉曼光谱测量设备测量对浓度编号为α的所述浓度C _α的葡萄糖溶液进行拉曼光谱测试，

例如，对浓度编号为1，浓度为C ₁的葡萄糖溶液，进行100次测试，每次测量时长为5秒。按照测试顺序，对每一次测试进行编号，监测序号S _β的最大值m为100，例如，S ₅₀为第50次测试得到的拉曼光谱数据序号，S ₅₀=50，这样，得到浓度为C ₁的葡萄糖溶液的拉曼数据编号集S={S ₁,S ₂,S ₃ ,--- S ₁₀₀}。

进一步，获取葡萄糖拉曼光谱中拉曼峰的拉曼位移的集W。

例如，对于浓度为C ₁的葡萄糖溶液的拉曼数据编号为S ₅₀的拉曼光谱数据，节选数据长度为2048个的拉曼位移数据，将数据范围内的所有拉曼峰识别出来，并按拉曼位移从小到大的顺序γ编号为W _γ，拉曼峰的总数为p个，第一个拉曼峰位移W ₁，例如W ₁=300cm-1，顺序对光谱数据的拉曼位移进行编号，拉曼光谱测量设备本身技术水平决定了拉曼位移的变化步Δ _b的大小，例如Δ _b=3cm-1。σ _γ为编号为γ的拉曼位移W _γ与编号为1的拉曼位移W ₁之间所述拉曼位移的变，步长的间隔数，按照公式2.8，获得经过编号的拉曼光谱的位移值集：

获得拉曼位移集合W={W ₁，W ₂，W _3,…W _p}={ 303，500，800，…，1125}。

C、S、W集合在公式2.1、公式2.2监测函数结构里，可以计算获取所述拉曼数据LM，进一步，根据公式2.3可以得到一个拉曼谱线的数据集LMS，即上述浓度编号为1到100的葡萄糖溶液，每个浓度的葡萄溶液有监测序号从S ₁到S ₁₀₀的100条拉曼谱线，每条拉曼谱线有1到p个拉曼峰位移序列，形成一个样本拉曼谱线集LMS。至此由LM以及LMS构成所述的拉曼大数据。

尤其针对葡萄糖物质，理论上其特征峰的拉曼位移值在400cm^-1、500cm^-1、850cm^-1、900cm^-1、1125cm^-1处的5个拉曼特征峰。

2.3、拉曼数据监测函数扩展步骤说明。

在前述技术方案的基础上，本发明在包括但不限于拉曼数据、拉曼谱线和监测函数方面，在S2000步骤方面，具体可以采用如下列的一种或者多种组合的局部改进的措施。

需要说明的是，所述公式包括但不限于：

其中：

LM ₁为所述混合溶液的所述拉曼数据，LM ₂为所述溶解剂的所述拉曼数据，k为加权系数，k_γ为拉曼位移编号为γ的拉曼峰统一加权系数，γ取值范围1≤γ≤p，p为拉曼位移编号最大值。

需要补充说明的是，在一些应用中，例如对于超低浓度的监测物质的监测时，或者不易提纯的监测物质时，或者未知物质的监测时，可以采用通过公式2.4和公式2.5做机器学习和迭代，进一步完成这些应用。

另外，对于单一物质的溶液，在一些情况下，权系数k是在浓度方向上全程一致的，因此就采用公式3.1进行计算。而在另外一些情况下，权系数k是在浓度方向上未必全程一致，因此，可以根据不同的浓度分段，采用不同的权系数，这时，就需要采用公式3.2进行计算。

2.4、拉曼谱线特征峰标记步骤说明。

在前述技术方案的基础上，本发明在包括但不限于拉曼谱线特征峰标记方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤：

所述S3000步骤具体包括但不限于。

进一步的，所述一条以上所述拉曼谱线，其特点是，一个所述的已知浓度的监测物质样品，经过同一台拉曼光谱设备在相同条件下进行m次监测获得一簇拉曼谱线集，即为所述监测序号的最大编号。

另外，监测物质的特征峰往往很多，在实际应用中，需要根据监测精度来进行取舍，通常是在很多特征峰中，选择若干个最具典型特征的特征峰，或者便于跟混合成分物质中其他物质具有明显区别的特征峰，而并不需要把全部特征峰都纳入计算，以减轻计算压力。

这里所需要说明的是，如图3所示，为浓度C ₁的葡萄糖溶液的拉曼光谱数据序号S ₅₀=50的葡萄糖溶液的拉曼谱线，拉曼谱线有12个拉曼峰，但是根据葡萄的谱线特征，最后选取作为葡萄糖拉曼特征峰的为5个拉曼峰，特征峰峰值位移最大编号为p=5，其中3001为拉曼峰位移编号为1的特征峰，峰值拉曼位移为405cm^-1，3002为拉曼峰位移编号为2的特征峰，峰值拉曼位移为501cm^-1，3003为拉曼峰位移编号为3的特征峰，峰值拉曼位移为850cm^-1，3004为拉曼峰位移编号为4的特征峰，峰值拉曼位移为912cm^-1，3005为拉曼峰位移编号为5的特征峰，峰值拉曼位移为1127cm^-1。拉曼峰位移最大编号为p=5。

由于拉曼光谱谱线LMS为离散数值，并非是连续值，再加上一些各类噪声的影响，谱线呈现轻微的波动，在寻找波峰运算中，必须排除这些波动，因此，需要设定一个参考幅度，只有在待确定的峰值的前后呈现连续下降，并且下降大于这个参考幅度的前提下，才能判定为这是一个峰值。计算过程如下。

在拉曼光谱线上，针对X轴的n区间，依次取连续σ个点l_m(x,y)，其中，σ为奇数，例如σ=7，建立循环，遍历整个n区间，当

同时成立时，标记点l _{m(x+σ/2，y)}为峰值，需要注意的是，这个峰值有可能不存在，也有可能不止一个，记录峰值的个数和位置x _mn-top，点l _mn-top为峰值。

需要进一步说明的是，峰值点横坐标跟拉曼位移序列号γ对应关系为：

拉曼波峰一定处于两个波谷之间，两个波谷之间的横坐标间隔，即为波峰的宽度，波峰的纵坐标值y_mn-top为波峰的相对高度，波谷的判断依据与波峰类似，需要设定一个参考幅度，只有在待确定的谷值的前后呈现连续上升，并且上升大于这个参考幅度的前提下，才能判定为这是一个谷值，这里对波谷判断不再赘述。

拉曼大数据里面所有拉曼谱线，按照上述S3020步骤获得波峰数据的样本，进一步按照S3030步骤所述的拉曼谱线数为统计样本，采用且不局限于正态分布、T检验、Z检验、Bayes概率、SVM支持向量机的计算方法，计算置信度大于50%的并且所述波峰相对高度大于20%的所述波峰，标记该所述波峰为拉曼谱线的特征峰，即其在拉曼谱线上拉曼位移位置，然后建立特征峰对应表，以便于使用S3040步骤所述查询法对特征峰对应表进行特征峰的查询与标定。

2.5、特征和统计步骤说明。

在前述技术方案的基础上，本发明在包括但不限于特征和统计计算方面，引入了包括Z检验方法，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤。

所述S4000步骤具体包括但不限于。

进一步的，S4030步骤，所述计算所述特征分数，包括但不限于所述统计法，其中包括但不限于所述Z检验、T检验、Bayes概率、SVM支持向量机、CNN卷积神经网络的计算方法，具体包括但不限于S4031步骤至S4033步骤，具体是：

5.1

其中，

γ为所述拉曼谱线的编号，p为所选取的所述拉曼谱线的最大编号，Z _γ为所述特征分数，x _γ为所述拉曼谱线的编号γ的所述样本值，

为所述样本均值，s为所述标准差。

这里所需要说明的是，如图4所示，为葡萄糖拉曼谱线中，列出特征峰的前后谷值、特征峰的波峰面积、特征峰的位置、征峰的峰角的示意图，4001为所述特征峰的波峰点，波峰拉曼位移为1125cm^-1，4002为所述特征峰的前波谷点，拉曼位移为1098cm^-1，4003为所述特征峰的后波谷点，拉曼位移为1160cm^-1，所述特征峰的峰角，其特点是，以波峰值所在的A点为顶点，以前波谷所在的B点和后波谷的横坐标与前波谷的纵坐标构成的C点构成特征峰三角形，计算特征峰三角形ABC的顶角∠A即为峰角θ _mn，从4002或B点开始，沿着拉曼谱线到4001或A点，到4003，到C点围城的封闭区域的面积为特征峰的波峰面积。

对浓度编号为C ₁的葡萄糖溶液的100根拉曼谱线做做Z检验，首先统计该组100根葡萄糖拉曼谱线的样本值，计算其样本均值、样本方差和样本标准差。

进一步计算特征分数，这里拉曼谱线的编号γ取值1到100，拉曼谱线的最大编号p=100，因此，计算特征分数的公式为：

需要说明的是，Z _γ为编号为C ₁的葡萄糖溶液100根拉曼谱线特征分数，x _γ为拉曼谱线的编号γ的所述样本值，

为100根谱线的样本均值，S为样本标准差。

2.6、拉曼数据筛选步骤说明。

所述S5000步骤具体包括但不限于。

优选地，在Z检验算法的情况下，例如对于特征种类为特征峰面积的特征分数，选择特征分数阈值为2.58，则，特征分数大于2.58时，表示符合统计概率在99.74%即3σ之外，标记为异常值，该拉曼谱线判断为淘汰。设定阈值为1.96时，特征分数小于1.96时，表示符合统计概率95.44%即2σ之内，属于正常值，该拉曼谱线判断为选中数据，依此类推。关于置信区间、Z分数和σ标准差之间的对应关系，发明人推荐优选项如表1所示。

表1

置信区间	68%	80%	85%	90%	95%	99%	99.5%	99.9%
									Z分数	1.282	1.440	1.645	1.960	2.576	2.807	3.291
<i>σ</i>标准差	1				2	3

这里所要说明的是，首先按照S5010 步骤，对所要筛选的葡萄糖溶液的一组拉曼数据，人为设置一个葡萄糖特征分数阈值a, 当计算的特征分数大于a时候，将这些葡萄糖拉曼数据标记为淘汰数据，在阈值a以内的葡萄糖拉曼数据标记为选中数据。

进一步的，按照S5020步骤，按照设定的置信度或者人工目测作为筛选标准，对S5010 步骤获得葡萄糖单词筛选数据进行筛选结果的检查，这里人工目测不做描述，因人而异。实际中，通过软件处理，需要通过输入设定的置信度，来判断。例如设定置信度为95.5%，选中数据的特征分数落在置信区间，选中数据达标，则将葡萄糖拉曼选中数据标记为该浓度葡萄糖的种类备选数据。相反，本次筛选不达标，重新调整S5010步骤中的葡萄糖特征分数阈值，可以是小于a的一个值或者大于a，重新进行步骤S5010、S5020筛选，直到达标为止。

进一步的，对于所有浓度葡萄糖溶液的全部特征种类的拉曼数据，按照S5010步骤、S5020步骤，获得全体筛选数据。并用组合逻辑的方法，对全体筛选数据进行计算，得到葡萄糖样本的全体筛选数据。

进一步的，多次调整所述特征分数阈值和所述组合逻辑，对种葡萄糖类筛选数据、全体筛选数据和葡萄糖拉曼数据比较，将出现概率最高的拉曼数据作为该葡萄糖溶液最终筛选数据。如图5所示，是对同一个浓度的葡萄糖溶液1000次测量未经过Z分数计算、筛选的原始特征峰谱线集，该特征峰区域的谱线由于系统误差、测量误差，激光束角度等客观存在干扰，重复测量出现拉曼特征峰位置出现偏移，特征峰峰值幅度也有波动，5001是典型不合格的葡萄糖拉曼特征峰。如图6所示，为图5中原始特征峰谱线集在筛选条件2σ下经过Z分数计算、筛选的拉曼特征峰集，图5中的原始特征峰谱线集的拉曼特征峰多次调整所述特征分数阈值和所述组合逻辑，将符合概率的拉曼数据作为该葡萄糖溶液最终筛选数据，依据最终筛选数据留下的特征峰集。如图7所示，为图5中原始特征峰谱线集在更加严酷的筛选条件σ下，经过Z分数计算、筛选的拉曼特征峰集。

2.7、建立定量对应表步骤说明。

在前述技术方案的基础上，本发明在包括但不限于平均值法、定量对应表建立方面，具体可以采用如下列的一种或者多种组合的局部改进的措施和步骤。

所述S6000步骤具体包括但不限于。

需要说明的是,所述MAX(LMη)为在1≤η≤q范围内，取最大值的函数，所述MIN(LM η)为在1≤η≤q范围内，取最小值的函数，η为最终筛选数据编号，q为总数。

需要说明的是，所述LMS _av1为所述包络线的算术平均值，所述LMS _er1为所述算术平均误差。

需要说明的是，所述LMS _av2为所述包络线的所述中位数，所述LMS _er2为所述中位误差。

需要说明的是，如图6所示，6001为包络线的上边线，6002为包络线的下边沿线，在实际应用中，包络线的上下边线的纵轴范围，对于系统测量精度而言，应该越小越好，这一点，可在机器学习中逐渐迭代，最终使得包络线的上下边线的纵轴范围，在满足监测系统误差要求为止。

这里所要说明的是，以上述葡萄糖溶液为例，对于浓度编号为C ₁的葡萄糖溶液的100根拉曼谱线进行拉曼数据筛选，最终获得的该浓度葡萄糖溶液的最终筛选数据，最终筛选数据对应的是该浓度葡萄糖拉曼谱线的数据集，可以理解为一簇拉曼谱线，如图7所示。按照S6010步骤的公式7.1，计算出一根包络线，进一步按照S6020步骤，根据计算的包络线，依据公式7.2计算出包络线的算术平均值，依据公式7.3计算包络线的算术平均误差，建立C ₁浓度与包络线拉曼数据的定量对应表。

或，按照S6030步骤，根据计算的包络线，依据公式7.4计算出包络线的中位数，依据公式7.5计算包络线的中位误差，建立C ₁浓度与包络线拉曼数据的定量对应表。S6020步骤和S6030步骤的顺序不做限定，所述算术平均值和所述中位数统称平均值法。

以此类推，对C={C ₁,C ₂ ,C ₃…C ₁₀₀}集合内所有浓度的葡萄糖溶液，建立相应的浓度与拉曼数据对一个关系，形成一个可查询的定量对应表。

2.8、查询和拟合步骤说明。

所述S7000步骤具体包括但不限于。

优选的，S7020步骤，所述拟合法包括但不限于在所述定量对应表中，依据已知浓度所对应的所述拉曼数据为拟合点，通过对相邻的所述拟合点进行拟合计算，建立拟合方程，所述拟合方程包括但不限于点对点拟合方程、直线拟合回归方程、二次多项式拟合回归方程、三次多项式拟合回归方程、三次多项式拟合回归方程、四参数拟合回归方程。

对所述未知浓度的葡萄糖液，利用光谱设备进行多次测量获得一个以上的拉曼谱线集，利用所述S2000步骤、S3000步骤、S4000步骤、S5000步骤、S6000步骤中的所述均值计算等大数据运算方法，最终获得一条拉曼谱线包络线，计算未知浓度葡萄糖溶液的所述拉曼谱线包络线的均值，通过所述S7010步骤，与所述已知葡萄糖浓度的定量对应表进行对比查询，获取未知浓度的被监测葡萄糖溶液的浓度和误差，或，通过所述S7020、S7030步骤获得关系函数，获取未知浓度的被监测葡萄糖溶液的浓度。

2.9、获取未知浓度物质拉曼数据步骤说明。

需要说明的是，这一步骤实际上就是包括。

1、对于一个未知浓度的物质，例如人体血液中的葡萄糖，做前期按照不同浓度做监测，以获得前期的基础数据，便于机器学习和训练。

2、直接监测未知浓度的拉曼数据，与前期训练成功的定量对应表进行比对。

进一步的，S8020步骤，依据所述S8010步骤获取的所述拉曼数据，按照所述步骤S3000来标记未知浓度拉曼特征峰，按照S4000步骤，对未知浓度的一个以上所述拉曼数据，依据所述特征峰设定拉曼位移区间，计算所述特征种类所对应的特征分数；按照S5000步骤，设定特征分数阈值，依据所述特征种类和所述特征分数，筛选出概率大于特定概率的未知浓度的拉曼数据作为最终筛选数据；按照S6000步骤中所描述或包括但不限于的具体步骤，计算未知浓度的最终筛选数据的均值，按照S7000步骤计算计算其浓度和误差。

需要说明的是，这一步骤实际上就是基于机器学习的大数据训练的方式，进行人工智能统计分析，最终通过与前期训练成功的定量对应表进行比对，以获得未知浓度物质的浓度机器可能的误差，以误差最小为基准，则匹配度最高，最终得到浓度值的最优估计。

2.10、混合成分监测步骤说明。

包括但不限于对于混合成分的所述监测物质的一种以上单一成分物质的检测，具体包括但不限于。

优选的，S9030步骤：采用包括但不限于Bayes概率、SVM支持向量机、CNN卷积神经网络的计算方法，在所述混合成分物质的所述拉曼数据和所述拉曼谱线，标记所述特征峰数据中，计算所述单一成分物质的所述拉曼数据、所述拉曼谱线、所述特征峰和所述定量对应表数据在所述混合成分物质中的所述浓度和所述误差，包括但不限于全部所述一种以上单一成分物质在所述混合成分物质中的所述浓度和所述误差。

以混合成分葡萄糖溶液为例，所述单一物质指纯葡糖粉，纯葡萄糖粉溶于纯净水形成一定浓度的纯葡萄糖溶液，如果纯葡萄糖粉溶于含有氯化钠的成分水中，那么对于葡萄糖来说，含有氯化钠的葡萄糖溶液就是所述的混合成分物质，所述混合成分物质成分不仅仅局限于相对于被监测物质的一种物质，但是混合物其他成分不能过多，最好不超多3到4种。

2.11、云模式步骤说明。

2.12、优选步骤说明。

作为一项实际产业化应用的产品，发明人认为，根据目前IT业发展，一些公知共用的方法和应用可以纳入到本发明中来，并且，发明人还认为，这些方法和应用的纳入不应该构成对于本发明的另外约束，包括但不限于一下举例。

1、增加基于地理位置信息（北斗、GPS、伽利略、格洛纳斯等），以利于糖尿病患者的区域调查分析。

2、糖尿病辅助管理和治疗。

3、人体其他物质（例如激素、酮类、血氧、血氧其他成分）监测和分析。

4、基于云大数据的区域糖尿病分析。

5、将本发明提供的计算方法，改写成集成电路的硬件形式提供应用。例如SoC（System-on-a-Chip，片上系统）、FPGA（Field－Programmable Gate Array，现场可编程门阵列）、ASIC（Application Specific Integrated Circuit，专用集成电路）等，这些都属于本发明的保护范围。

6、取消云模式的非网络版应用系统。

7、提供医疗机构设备通信接口和个人手机接口以及手机APP版本。

实施例二：混合成分物质拉曼光谱定量监测方法。

1、基础方案说明。

为了更加全面阐述本发明的应用范围，发明人提供一种混合成分物质拉曼光谱定量监测方法的实施例，目的在于阐述本发明除了在如实施例一中所阐述的用于体外血糖拉曼光谱定量监测方面，还可以在混合成分物质拉曼光谱定量监测方面，本实施列所述的混合成分物质是指由一种以上的不同物质按照随机比例组成的混合成分物质。最优的组成混合成分物质的种类不超过4种以上，这是因为，固定强度与波长条件下，激光束照射到某单一物质上，物质分子特定的化学键结构会让激光束产生非弹性的散射，并且形成特定拉曼位移的特征峰，对于单一物质，无疑拉曼特征信号最强，当由一种以上不同物质混合在一起，随着物质成分增多，不同物质之间的分子的化学键产生散射光相互干扰就越强烈，形成的拉曼谱线含有的特征峰就越加被削弱甚至被掩盖，因此无法在做特征数据的筛选。

进一步的，所述的混合成分物质可以是液体形态的混合成分物质，气体形态混合成分物质，也可以是包括固体、粉末等形态的混合成分物质。

2、差异化说明。

基于实施例一，在某些应用场景，需要针对一些特定组成的混合成分物质来做拉曼光谱定量分析。这里所说的混合成分物质不局限于一种以上的不同物质按照随机比例组成的液体混合成分物质、气体混合成分物质，固体混合成分物质等，但是最优的，组成混合成分物质的单一物质种类数最好不超过4种以上。在所述混合物中，定量分析不仅包括浓度分析，还包括物质成分在混合物中所占比例的分析。因此，发明人提供一种混合成分物质拉曼光谱定量监测方法，具体参照实施例一，相同之处不予复述，不同之处在于以下几点。

1、增加多种已知成分单一物质的拉曼数据提取步骤，即将S2000步骤描述的“依据一种以上已知浓度的监测物质”扩展成多种已知成分的纯物质，采用监测函数，分别计算对应的拉曼数据。本步骤可以为混合物成分组成的定性分析提供校正依据，例如对于纯葡萄糖粉与纯氯化钠粉的组成的混合成分物质，首先分别对纯葡萄糖粉以及纯氯化钠粉做拉曼数据获取。

2、增加混合成分物质样本制作步骤，即已知不同成分以及已知各成分不同含量或者占比的混合成分物质样本的制作。例如纯葡萄糖粉与纯氯化钠粉的混合成分物质，可以在单位体积条件下，按照已知占有比例进行样本制作，如表2所示。

表2

葡萄糖粉	10%	20%	30%	40%	50%	60%	70%	80%	90%
										氯化钠粉	90%	80%	70%	60%	50%	40%	30%	20%	10%

3、增加混合成分物质校正样本拉曼数据训练步骤，在单位体积下，按照表2 的样本，对9种不同成分配比的葡萄糖氯化钠混合成分物质样本，进行拉曼数据获取，基于混合成分物质的拉曼谱线，分别计算葡萄糖特征种类，氯化钠特征种类。

4、增加混合成分物质校正样本定量对应表步骤，例如依据所计算的葡萄糖特征种类，氯化钠特征种类，将不同物质的相同特征种类项目进行求比值运算，将运算结果与已知样本的成分占比之间建立对应的定量对应表。

5、增加待测混合成分物质的混合物成分定量监测步骤，首先获取特测葡萄糖氯化钠混合成分物质的拉曼谱线，然后对比单一物质谱线特征值，做成分定性分析，再分别计算葡萄糖特征种类，氯化钠特征种类，并计算相同特征种类项目比值。按照查询步骤4所述定量对应表获取监测的葡萄糖氯化钠混合成分物质成分组成的定量值。

实施例三：单机版特定物质拉曼光谱定量监测方法。

1、差异化说明。

基于实施例一和实施例二均为云模式版，而在一些应用场景中，需要尽可能简化，并且还不具备广域网应用条件，例如缉毒工作、市场监督工作、远洋勘探工作、野外考察工作等场景，这些应用场景往往需要监测的只是品种已知的物质，只需要在存储中预设这些特定的物质。因此，发明人提供一种可用在便携设备上的单机版的特定物质拉曼光谱的监测方法，具体参照实施例一和实施例二，相同之处不予复述，不同之处在于以下几点。

1、取消云模式工作步骤，即无需SA000步骤，将算法中的全部数据和软件均存储在本地系统中。

2、增加显示步骤，将监测到的物质信息显示到显示器上。

3、增加报警步骤，将监测到的需要报警的信息，通过显示及音响提示给用户。

4、增加数据下载步骤，将一段时间内监测的数据，以可使用的格式下载到其他设备上，以增加系统的灵活性。

Claims

1.拉曼光谱定量监测物质含量的方法，包括：

S2000步骤：依据一种以上已知浓度的监测物质，采用监测函数，分别计算一个以上的拉曼数据；

S3000步骤：依据所述拉曼数据，采用统计法或查询法标记特征峰；

S4000步骤：对于同一种所述已知浓度的所述监测物质的一个以上所述拉曼数据，依据所述特征峰设定拉曼位移区间，依据所述特征峰的形状、位置设定和特征种类，计算所述特征种类所对应的特征分数；

S5000步骤：设定特征分数阈值，依据所述特征种类和所述特征分数，筛选出概率大于特定概率的所述拉曼数据作为最终筛选数据；

S6000步骤：采用平均值法计算所述最终筛选数据的均值，并计算所述均值与所述已知浓度的定量对应表；

S7000步骤：通过查询法查询所述定量对应表获取未知浓度的所述监测物质的浓度和误差，或采用拟合法计算所述未知浓度的所述监测物质的所述浓度和误差；

其中，所述S2000步骤具体包括：

S2010步骤：基于设定的平面坐标系，按照公式2.1建立欧氏几何的所述监测函数，计算获取所述拉曼数据，按照公式2.3计算获取拉曼谱线；或，

S2020步骤：基于设定的曲面坐标系，按照公式2.2建立黎曼几何的所述监测函数，计算获取所述拉曼数据，按照公式2.3计算获取所述拉曼谱线；

S2030步骤：对于不同浓度的所述监测物质，在监测范围之内，采用监测次数超过特定次数，分别按照公式2.1和公式2.3的组合或公式2.2和公式2.3的组合，监测和计算获取所述拉曼数据和所述拉曼谱线，构成拉曼大数据；

所述监测物质为纯物质、溶解剂和混合成分物质，其形态为固体、液体或气体，所述监测范围为浓度范围、监测序号范围和拉曼位移编号范围；

上述公式为：

LM＝f_2.1(C，S，W) 2.1

LMS＝{LM|α，β，γ} 2.3

其中：

f_2.1为采用拉曼光谱测量设备测量所述监测物质产生所述拉曼数据过程的所述监测函数的所述欧氏几何表述，R_2.2 ³为采用拉曼光谱测量设备测量所述监测物质产生所述拉曼数据过程的所述监测函数的所述黎曼几何表述，C为所述监测物质的所述浓度，S为获取所述拉曼数据次数的监测序号，W为所述拉曼光谱的位移值，所述R_2.2 ³中标号3表示为C、S、W的3个维度，f_2.2 ^C为维度C的实函数，f_2.2 ^S为维度S的实函数，f_2.2 ^W为维度W的实函数，LM为所述拉曼数据，LMS为所述拉曼谱线，α为浓度编号，β为监测序号，γ为拉曼位移编号，γ取值范围1≤γ≤p，p为拉曼位移编号最大值，所述拉曼谱线为一次测量中产生的全部所述拉曼数据所构成的拉曼光谱的谱线。

2.根据权利要求1所述的方法，其特征在于，所述S2000步骤具体还包括：

S2040步骤：采用所述监测物质的纯物质，直接获取所述纯物质的一条以上所述拉曼谱线；和/或，

S2050步骤：采用所述监测物质的由溶解剂溶解产生的混合溶液，分别获取所述混合溶液和所述溶解剂的一条以上所述拉曼谱线，采用公式3.1或公式3.2的差分计算方法，计算获取所述监测物质的所述拉曼谱线；

LMS＝{LM|LM₁-kLM₂} 3.1

LMS＝{LM|LM₁-k_γLM₂，γ} 3.2

其中：

LM₁为所述混合溶液的所述拉曼数据，LM₂为所述溶解剂的所述拉曼数据，k为加权系数，k_γ为拉曼位移编号为γ的拉曼峰统一加权系数，γ取值范围1≤γ≤p，p为拉曼位移编号最大值。

3.根据权利要求1或2所述的方法，其特征在于，所述S3000步骤具体包括：

S3010步骤：依据所述拉曼谱线，寻找并标记波峰，计算所述波峰的宽度和相对高度；

S3020步骤：所述统计法为依据一条以上所述拉曼谱线，以所述拉曼谱线数为统计样本，采用正态分布、T检验、Z检验、Bayes概率、SVM支持向量机或CNN卷积神经网络的计算方法，计算置信度大于50％的并且所述波峰相对高度大于20％的所述波峰，标记该所述波峰为所述特征峰；

S3030步骤：所述查询法为查询由所述统计法计算的所述监测物质的特征峰对应表或可信的所述监测物质的特征峰对应表，标记所述特征峰；

所述特征峰为在所述拉曼谱线上的所述拉曼位移位置，所述特征峰的宽度为在所述拉曼谱线上的最大宽度值。

4.根据权利要求3所述的方法，其特征在于，所述S4000步骤具体包括：

S4010步骤：以每个所述特征峰的峰值所在的所述拉曼位移为中心点，依据所述特征峰的宽度，设定所述拉曼位移区间为2倍以上所述特征峰的宽度；

S4020步骤：在所述拉曼位移区间内，按照所述特征种类，计算所述特征分数；

S4030步骤：采用统计法计算所述特征分数，包括Z检验、T检验、Bayes概率、SVM支持向量机或CNN卷积神经网络的计算方法，具体包括S4031步骤至S4033步骤，具体是：

S4031步骤：取所述特定次数大于30所述拉曼谱线作为所述统计样本，在每个所述统计样本的所述特征峰的所述拉曼位移区间内，以所述拉曼数据作为所述特征种类的样本值，计算样本均值、样本方差和样本标准差；

S4032步骤：按照公式5.1计算所述特征分数，

其中，γ为所述拉曼谱线的编号，p为所选取的所述拉曼谱线的最大编号，Z_γ为所述特征分数，x_γ为所述拉曼谱线的编号的所述样本值，

为所述样本均值，s为所述标准差；

S4033步骤：所述特征种类具体包括所述拉曼谱线的最大值、最小值、所述特征峰的峰值、所述特征峰的前后谷值、所述特征峰的波峰面积值、所述特征峰的位置和所述特征峰的峰角。

5.根据权利要求4所述的方法，其特征在于，所述S5000步骤具体包括：

S5010步骤：对于所述特征种类，基于设定的所述特征分数阈值，标记所述特征分数大于所述特征分数阈值的所述拉曼数据为淘汰数据，标记留下的所述拉曼数据为选中数据；

S5020步骤：检查所述选中数据的筛选结果，如果所述筛选结果达标，则赋值所述选中数据为所述特征种类的种类备选数据，如果所述筛选结果未达标，则调整所述特征分数阈值，重新标记所述特征分数大于调整后的所述特征分数阈值的所述拉曼数据为淘汰数据，重新标记留下的所述拉曼数据为选中数据，直到所述筛选结果达标，则赋值达标后的所述选中数据为所述特征种类的种类备选数据，所述筛选结果的达标与否的判据为置信度、置信区间、特定概率和人工判断；

S5030步骤：针对全部所述特征种类，计算全部相应的所述种类备选数据；

S5040步骤：采用组合逻辑计算全部种类的所述种类备选数据为全体筛选数据；和/或，

S5050步骤：依据所述种类备选数据、所述全体筛选数据和所述拉曼数据的比较的结果，调整所述特征分数阈值和所述组合逻辑，筛选出概率大于特定概率的所述拉曼数据作为最终筛选数据。

6.根据权利要求5所述的方法，其特征在于，所述S6000步骤具体包括：

S6010步骤：以所述最终筛选数据所对应的所述拉曼谱线为数据集，计算包络线，所述包络线的上边的计算方法为公式7.1，所述包络线的下边的计算方法为公式7.2，

LMS_max＝{LM|MAX(LM_η)，η，q} 7.1

LMS_min＝{LM|MIN(LM_η)，η，q} 7.2

所述MAX(LM_η)为在1≤η≤q范围内，取最大值的函数，所述MIN(LM_η)为在1≤η≤q范围内，取最小值的函数，η为最终筛选数据编号，q为总数；

S6020步骤：依据所述包络线，计算算术平均值和算术平均误差，并计算所述浓度与所述拉曼数据的所述定量对应表，所述算术平均值的计算方法为公式7.3，所述算术平均误差的计算方法为公式7.4，

LMS_er1＝{LM|MAX(LMS_av1-LMS_max，LMS_av1-LMS_min)，1≤η≤q} 7.4

所述LMS_av1为所述包络线的算术平均值，所述LMS_er1为所述算术平均误差；

S6030步骤：依据所述包络线，计算中位数和中位误差，并计算所述浓度与所述拉曼数据的所述定量对应表，所述中位数的计算方法为公式7.5，所述中位误差的计算方法为公式7.6，

所述LMS_av2为所述包络线的所述中位数，所述LMS_er2为所述中位误差。

7.根据权利要求6所述的方法，其特征在于，所述S7000步骤具体包括：

S7010步骤：所述查询法为对于所述未知浓度的所述监测物质，获取其所述拉曼谱线，依据所述拉曼谱线，查询所述定量对应表获取所述监测物质的浓度和误差；

S7020步骤：所述拟合法为在所述定量对应表中，依据已知浓度所对应的所述拉曼数据为拟合点，通过对相邻的所述拟合点进行拟合计算，建立拟合方程，所述拟合方程为点对点拟合方程、直线拟合回归方程、二次多项式拟合回归方程、三次多项式拟合回归方程或四参数拟合回归方程；

S7030步骤：对于所述未知浓度的所述监测物质，计算获取所述拉曼谱线，依据所述拟合方程计算获取所述监测物质的浓度和误差。

8.根据权利要求7所述的方法，其特征在于，所述未知浓度的所述监测物质的所述拉曼谱线的计算获取，具体还包括步骤S8000：

S8010步骤：对于所述未知浓度的所述监测物质，按照所述S2000步骤获得一个以上的拉曼数据；

S8020步骤：依据所述S8010步骤获取的所述拉曼数据，按照所述S3000、S4000、S5000、S6000步骤，获取所述未知浓度的所述监测物质拉曼谱线，并计算其浓度和误差。

9.根据权利要求8所述的方法，其特征在于，包括对于混合成分物质的所述监测物质的一种以上单一成分物质的检测，具体还包括步骤S9000：

S9010步骤：针对所述单一成分物质的所述监测物质中所述单一成分物质的纯物质，监测获取所述拉曼数据、所述拉曼谱线、所述特征峰和所述定量对应表，并监测获取所述一种以上单一成分物质的全部纯物质的各自的所述拉曼数据、所述拉曼谱线、所述特征峰和所述定量对应表；

S9020步骤：监测获取所述混合成分物质的所述监测物质的所述拉曼数据和所述拉曼谱线，标记所述特征峰；

S9030步骤：采用Bayes概率、SVM支持向量机或CNN卷积神经网络的计算方法，在所述混合成分物质的所述监测物质的所述拉曼数据和所述拉曼谱线，标记所述特征峰数据中，计算所述单一成分物质的所述拉曼数据、所述拉曼谱线、所述特征峰和所述定量对应表数据在所述混合成分物质的所述监测物质中的所述浓度和所述误差，包括全部所述一种以上单一成分物质在所述混合成分物质的所述监测物质中的所述浓度和所述误差。

10.根据权利要求9所述的方法，其特征在于，包括SA000步骤，具体包括：

SA010步骤：建立云数据中心，使得数据监测点与所述云数据中心之间通过网络，实现云通信、云数据库存储和云计算；

SA020步骤：所述数据监测点获得的所述拉曼数据，即时或分时，由所述网络，传送到所述云数据库中存储；

SA030步骤：由所述云数据中心执行所述S2000步骤、所述S3000步骤、所述S4000步骤、所述S5000步骤、所述S6000步骤、所述S7000步骤、所述S8000步骤和所述S9000步骤，以及云管理步骤，完成云计算；

SA040步骤：所述数据监测点通过所述云通信，让所述云数据中心执行所述云计算，并将云计算的结果传送回所述数据监测点；

SA050步骤：所述云数据中心对所述云数据库中的所述拉曼数据，执行机器学习，产生所述定量对应表。