CN115855133A - 传感器的校准方法、装置、计算机设备和可读存储介质 - Google Patents

传感器的校准方法、装置、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN115855133A
CN115855133A CN202211591397.7A CN202211591397A CN115855133A CN 115855133 A CN115855133 A CN 115855133A CN 202211591397 A CN202211591397 A CN 202211591397A CN 115855133 A CN115855133 A CN 115855133A
Authority
CN
China
Prior art keywords
calibration
data
calibrated
normalized
sensor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211591397.7A
Other languages
English (en)
Inventor
刘心宇
刘斯桀
陈鑫磊
黄绍伦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen International Graduate School of Tsinghua University
Original Assignee
Shenzhen International Graduate School of Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen International Graduate School of Tsinghua University filed Critical Shenzhen International Graduate School of Tsinghua University
Priority to CN202211591397.7A priority Critical patent/CN115855133A/zh
Publication of CN115855133A publication Critical patent/CN115855133A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Indication And Recording Devices For Special Purposes And Tariff Metering Devices (AREA)

Abstract

本申请公开了一种传感器的校准方法、装置、计算机设备和可读存储介质,涉及传感器技术领域。该传感器的校准方法包括获取待校准数据;对所述待校准数据进行数据预处理,得到与所述待校准数据对应的规范化数据;获取预设的校准模型,所述校准模型包括多个校准聚类类别和各个所述校准聚类类别对应的线性回归校准模块;在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,以得到所述待校准数据对应的目标校准值。本申请实施例能够大幅度提升传感器的测量准确性。

Description

传感器的校准方法、装置、计算机设备和可读存储介质
技术领域
本申请涉及传感器技术领域,特别涉及一种传感器的校准方法、装置、计算机设备和可读存储介质。
背景技术
目前针对空气污染监测,传感器监测方法已经成为传统精密仪器监测方法的重要补充,其低廉的成本能够支持传感器的大规模部署,从而获得时空分辨率更高的空气污染信息。然而受器件原理和结构的限制,针对空气污染组分的各类传感器,在实际测量中均会不可避免受到湿度、温度等环境因素以及非目标组分交叉干扰的影响。面向空气污染监测的传感器校准,通常分为在部署前校准和部署后校准。其部署前校准通常在实验室条件下进行,在可提供准确测量值的校准设备帮助下,通过设计不同的环境条件获取传感器测量数据,建立校准回归模型。由于其构造受控的实验条件(例如指定温度、湿度、目标组分浓度、干扰组分浓度等)对于设备的要求较高,尤其是面对多种类型的传感器以及同种传感器存在较大的个体差异时,校准模型结构不通用,实施效率较低。于是,部署后校准因其高效便捷得到了广泛应用。部署后校准是在传感器实际工况下进行,以相同环境中的标准化设备测量结果作为参照,对比传感器原始输出和其他参与校准的输入变量,进行函数拟合缩小测量误差。然而,对于传感器的部署后校准方法而言,全局多元线性回归模型对于环境因素和干扰组分的非线性影响刻画不足,将导致传感器的测量准确性较低,无法满足长期稳定的监测需求。因此,有效解决多变量影响下传感器的部署后校准问题,对于提升传感器在空气污染监测中的准确性有重大意义,将使得传感器监测方法发挥更大作用。
发明内容
本申请的旨在至少一定程度解决现有技术的问题,提供一种传感器的校准方法、装置、计算机设备和可读存储介质,能够大幅度提升传感器的测量准确性,满足长期稳定的监测需求。
本申请实施例的技术方案如下:
第一方面,本申请提供了一种传感器的校准方法,所述方法包括:
获取待校准数据;
对所述待校准数据进行数据预处理,得到与所述待校准数据对应的规范化数据;
获取预设的校准模型,所述校准模型包括多个校准聚类类别和各个所述校准聚类类别对应的线性回归校准模块;
在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,以得到所述待校准数据对应的目标校准值。
根据本申请的一些实施例,所述对所述待校准数据进行数据预处理,得到与所述待校准数据对应的规范化数据,包括:
对所述待校准数据进行归一化处理,得到归一化数据;
对所述归一化数据进行状态构造处理,得到所述规范化数据。
根据本申请的一些实施例,所述对所述归一化数据进行状态构造处理,得到所述规范化数据,包括:按照预设的元组规则对所述归一化数据进行状态构造处理,得到所述规范化数据。
根据本申请的一些实施例,所述校准模型通过以下步骤得到:
获取校准数据集,所述校准数据集包括多个待校准样本和各个所述待校准样本对应的测量值;
对各个所述待校准样本进行预处理操作,得到与各个所述待校准样本对应的规范化样本;
对各个所述规范化样本进行聚类处理,得到多个所述校准聚类类别;
在各个所述校准聚类类别中,根据所述测量值和所述规范化样本,得到各个所述校准聚类类别对应的所述线性回归校准模块;
所述校准聚类类别和所述线性回归校准模块组成所述校准模型。
根据本申请的一些实施例,所述在各个所述校准聚类类别中,根据所述测量值和所述规范化样本,得到各个所述校准聚类类别对应的所述线性回归校准模块,包括:
在各个所述校准聚类类别中,对所述测量值和各个规范化样本进行回归计算,得到回归系数;
根据所述回归系数构建得到各个所述校准聚类类别对应的所述线性回归校准模块。
根据本申请的一些实施例,所述在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,以得到所述待校准数据对应的目标校准值,包括:
在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,得到初始校准值;
将所述规范化数据与各个所述校准聚类类别的中心值进行计算处理,得到多个距离值,其中,所述中心值通过对所述校准聚类类别进行算术计算得到;
将最小的所述距离值对应的所述初始校准值确定为所述目标校准值。
根据本申请的一些实施例,所述对所述待校准数据进行归一化处理,得到归一化数据,包括:
获取预设的传感器的量程上限和预设的传感器的量程下限;
将所述待校准数据与所述量程下限进行差值计算,得到第一差值;
将所述量程上限与所述量程下限进行差值计算,得到第二差值;
将所述第一差值与所述第二差值的比值作为所述归一化数据。
第二方面,本申请提供了一种传感器的校准装置,所述装置包括:
数据获取模块,用于获取待校准数据;
预处理模块,用于对所述待校准数据进行数据预处理,得到与所述待校准数据对应的规范化数据;
模型获取模块,用于获取预设的校准模型,所述校准模型包括多个校准聚类类别和各个所述校准聚类类别对应的线性回归校准模块;
校准处理模块,用于在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,以得到所述待校准数据对应的目标校准值。
第三方面,本申请提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行如上第一方面描述的任一项所述方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质,所述存储介质可被处理器读写,所述存储介质存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如上第一方面描述的任一项所述方法的步骤。
本申请实施例所提供的技术方案具有如下的有益效果:
本申请实施例提出一种传感器的校准方法、装置、计算机设备和可读存储介质,该传感器的校准方法首先获取待校准数据;然后对待校准数据进行数据预处理,得到与待校准数据对应的规范化数据,能够降低不同输入变量数值尺度差异的影响;获取预设的校准模型,校准模型包括多个校准聚类类别和各个校准聚类类别对应的线性回归校准模块;在各个校准聚类类别中,将规范化数据输入线性回归校准模块,以得到待校准数据对应的目标校准值,校准模型能够对非线性干扰因素进行补偿,从而提高测量性能。与现有技术单纯线性模型对于干扰因素的非线性影响刻画不足,导致传感器的测量准确性较低相比,本申请实施例通过对待校准数据进行预处理,利用校准模型对处理得到的规范化数据进行拟合,能够大幅度改善传感器的测量性能。
本申请的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是本申请一个实施例提供的传感器的校准方法的流程示意图;
图2是图1中步骤S120的一个子步骤流程示意图;
图3是本申请另一个实施例提供的传感器的校准方法的流程示意图;
图4是图3中步骤S240的一个子步骤流程示意图;
图5是图1中步骤S140的一个子步骤流程示意图;
图6是图2中步骤S121的一个子步骤流程示意图;
图7是本申请一个实施例提供的传感器的校准方法的应用场景示意图;
图8是本申请一个实施例提供的传感器的校准方法的校准模型构建示意图;
图9是本申请一个实施例提供的传感器的校准方法的整体校准流程示意图;
图10是本申请一个实施例提供的传感器的校准方法的校准聚类类别可视化示意图;
图11是本申请一个实施例提供的传感器的校准方法的在PM2.5指标的比较结果示意图;
图12是本申请一个实施例提供的传感器的校准方法的在PM10指标的比较结果示意图;
图13是本申请一个实施例提供的传感器的校准方法的不同数据量比例比较结果示意图;
图14是本申请一个实施例提供的传感器的校准方法的校准聚类类别数量比较结果示意图;
图15是本申请一个实施例提供的传感器的校准装置的结构示意图;
图16是本申请实施例提供的计算机设备的结构示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
需要说明的是,除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
相关技术中,校准的基本原理是建立从原始读数即待校准数据向参考数据逼近的函数关系,原始读数以及类似湿度等干扰项作为函数的自变量,最终目标是使得校准模型的输出结果尽可能逼近环境真实值。但是,由于在实际工况下湿度的变化对传感器输出的影响,简单的非线性模型先验假设存在较多未知特性,可解释性差;而类似神经网络等机器学习类的非线性模型,对于训练数据量有较高的要求,否则收敛性能和泛化能力难以保证。
基于此,本申请实施例提出一种传感器的校准方法、装置、计算机设备和可读存储介质,该传感器的校准方法首先获取待校准数据;然后对待校准数据进行数据预处理,得到与待校准数据对应的规范化数据,能够降低不同输入变量数值尺度差异的影响;获取预设的校准模型,校准模型包括多个校准聚类类别和各个校准聚类类别对应的线性回归校准模块;在各个校准聚类类别中,将规范化数据输入线性回归校准模块,以得到待校准数据对应的目标校准值,校准模型能够对非线性干扰因素进行补偿,从而提高测量性能。与现有技术单纯线性模型对于干扰因素的非线性影响刻画不足,导致传感器的测量准确性较低相比,本申请实施例通过对待校准数据进行预处理,利用校准模型对处理得到的规范化数据进行拟合,能够大幅度改善传感器的测量性能,并且具有较好的泛化性,应用较广泛,以支持大气环境监测的传感系统的有效覆盖监测;并且可对聚类结果进行可视化,提高模型的可解释性。
在一实施例中,传感器的校准方法可以应用于颗粒物污染检测设备,对颗粒物传感器的测量数据进行校准,使得输出较为准确的测量值,也可以对其他传感器的测量数据进行校准,应用范围广。如图7所示,该颗粒物污染检测设备集成了颗粒物传感器、温湿度传感器和运算模块等,提供秒级或分钟级数据,同时还检测标准化空气污染监测站的数据,具备无线联网能力,可以发送、接收数据,并支持远程部署程序。该传感器的校准方法可以在服务器端计算实现,之后通过无线网络,将相关模型和参数部署到监测设备;也可以在监测设备本地完成模型的计算和应用。
下面参照附图,对本申请实施例提供的传感器的校准方法、装置、计算机设备和可读存储介质,进行说明。
参见图1,图1示出了本申请实施例提供的传感器的校准方法的流程示意图。该传感器的校准方法包括但不限于有步骤S110、步骤S120、步骤S130和步骤S140。
步骤S110,获取待校准数据。
在一实施例中,目前,颗粒物传感器作为PM2.5或PM10污染监测的重要补充手段,在大气环境监测的传感系统中得到广泛应用。待校准数据可以包括颗粒物传感器的浓度数据P(PM2.5或PM10浓度)、温湿度传感器的温度T和相对湿度数据H,还可以为其他大气检测的数据,这里不作赘述。通过记录颗粒物传感器、温度传感器、湿度传感器的测量数据,在预设的时间段[T1,T2]内,传感器(颗粒物,温度,湿度)的秒级或分钟级数据求小时平均,得到测量数据,其中,时间段可以是1-3周,也可以是4-8周,还可以为2-3月,能够进行自定义,为长段连续时间段即可,这里不作赘述。在上述时间段中,按照小时求取平均值,得到该时间段中的待校准数据。然后利用预设的数据读取接口读取记录的数据,从而获得待校准数据;或者,直接将颗粒物传感器、温度传感器、湿度传感器的测量数据利用网络传输至检测设备,从而获得待校准数据。通过获取待校准数据,有利于后续对待校准数据去除干扰因素,输出较为准确的测量值。待校准数据可以为一个,也可以为多个,在为多个待校准数据的情况下,可以批次量输入进行校准处理,也可以为一个个依次输入进行校准处理。
步骤S120,对待校准数据进行数据预处理,得到与待校准数据对应的规范化数据。
如图2所示,对待校准数据进行数据预处理,得到与待校准数据对应的规范化数据,包括但不限于有以下步骤:
步骤S121,对待校准数据进行归一化处理,得到归一化数据。
在一实施例中,首先对待校准数据进行归一化处理,得到归一化数据,归一化处理能够降低不同输入变量数值尺度差异的影响,还有利于后续进行聚类计算,增加模型的泛化性。
如图6所示,对待校准数据进行归一化处理,得到归一化数据,包括但不限于有以下步骤:
步骤S1211,获取预设的传感器的量程上限和预设的传感器的量程下限。
在一实施例中,预设的传感器的量程上限和预设的传感器的量程下限为传感器出厂时的额定最大值和最小值,还可以根据需求人工对传感器的量程进行调节,以满足实际应用。通过直接读取传感器数据的方式得到量程上限和量程下限即可,根据量程上限和量程下限有利于后续对待校准数据进行归一化处理。
步骤S1212,将待校准数据与量程下限进行差值计算,得到第一差值。
在一实施例中,根据步骤S1211得到的传感器的量程下限,利用待校准数据减去传感器的量程下限,得到第一差值;或者,利用传感器的量程下限减去待校准数据,然后再求绝对值,得到第一差值,有利于后续利用第一差值得到归一化数据。示例性地,将待校准数据表示为x,量程下限表示为min,则第一差值表示为c1=x-min;或者c1=|min-x|。
步骤S1213,将量程上限与量程下限进行差值计算,得到第二差值。
在一实施例中,根据步骤S1211得到的传感器的量程上限,利用传感器的量程下限减去传感器的量程上限,然后再求绝对值,得到第二差值;或者,利用传感器的量程上限减去传感器的量程下限,得到第二差值,有利于后续利用第二差值得到归一化数据。示例性地,量程下限表示为min,量程上限表示为max,则第二差值表示为c2=max-min;或者c2=|min-max|。
步骤S1214,将第一差值与第二差值的比值作为归一化数据。
在一实施例中,根据步骤S1212得到的第一差值和步骤S1213得到的第二差值,将第一差值除以第二差值,得到归一化数据;或者将第二差值除以第一差值,再求倒数,得到归一化数据。归一化数据对不同输入变量数值尺度差异无影响,还有利于后续进行聚类计算,增加模型的泛化性。示例性地,归一化数据表示为x1,x1=c1/c2=(x-min)/(max-min)。
在一实施例中,本申请实施例可以采用步骤S1211至步骤S1214的步骤进行归一化处理,也可以利用Z-score标准化处理方法,还可以利用sigmoid函数处理方法,这里不作赘述。
步骤S122,对归一化数据进行状态构造处理,得到规范化数据。
在一实施例中,按照预设的元组规则对归一化数据进行状态构造处理,即是说,状态构造形式通过元组的形式表示,构造一阶时延项或者更高阶时延项,得到规范化数据。示例性地,对归一化后的浓度P、温度T和相对湿度H构造状态三元组,表示形式可以为:Xn=(P(n),T(n),H(n)),n表示时刻,构造的一阶时延项或者更高阶时延项可以表示为:Xn=((P(n),P(n-1),T(n),T(n-2),H(n),H(n-1))。随着检测时间的推移,规范化数据不会因数据变化产生影响,也不会影响后续的校准计算处理。
步骤S130,获取预设的校准模型,校准模型包括多个校准聚类类别和各个校准聚类类别对应的线性回归校准模块;
如图3和图8所示,校准模型通过以下步骤得到:
步骤S210,获取校准数据集,校准数据集包括多个待校准样本和各个待校准样本对应的测量值。
在一实施例中,获取校准数据集,校准数据集包括多个待校准样本和各个待校准样本对应的测量值,测量值为传感器部署附近地区监测站的颗粒物浓度数据Y(PM2.5或PM10浓度)。每一个待校准样本可以包括颗粒物传感器的浓度数据P(PM2.5或PM10浓度)、温湿度传感器的温度T和相对湿度数据H,还可以为其他大气检测的数据,这里不作赘述。通过记录颗粒物传感器、温度传感器、湿度传感器的测量数据,在预设的时间段[T1,T2]内,传感器(颗粒物,温度,湿度)的秒级或分钟级数据求小时平均,得到测量数据,其中,时间段可以是1-3周,也可以是4-8周,还可以为2-3月,能够进行自定义,为长段连续时间段即可,这里不作赘述。在上述时间段中,按照小时求取平均值,得到该时间段中的待校准样本。然后利用预设的数据读取接口读取记录的数据,从而获得待校准样本;或者,直接将颗粒物传感器、温度传感器、湿度传感器的测量数据利用网络传输至检测设备,从而获得待校准样本。通过获取待校准样本,有利于后续对待校准样本去除干扰因素,使得模型能够输出较为准确的测量值。
步骤S220,对各个待校准样本进行预处理操作,得到与各个待校准样本对应的规范化样本。
在一实施例中,首先对待校准样本进行归一化处理,得到归一化数据,归一化处理能够降低不同输入变量数值尺度差异的影响,还有利于后续进行聚类计算,增加模型的泛化性。在进行归一化处理过程中,先获取预设的传感器的量程上限和预设的传感器的量程下限,利用待校准样本减去传感器的量程下限,得到第一差值;或者,利用传感器的量程下限减去待校准样本,然后再求绝对值,得到第一差值,有利于后续利用第一差值得到归一化数据。再利用传感器的量程下限减去传感器的量程上限,然后再求绝对值,得到第二差值;或者,利用传感器的量程上限减去传感器的量程下限,得到第二差值,有利于后续利用第二差值得到归一化数据。最后将第一差值除以第二差值,得到归一化数据;或者将第二差值除以第一差值,再求倒数,得到归一化数据。归一化数据对不同输入变量数值尺度差异无影响,还有利于后续进行聚类计算,增加模型的泛化性。也可以利用Z-score标准化处理方法,还可以利用sigmoid函数处理方法,这里不作赘述。按照预设的元组规则对归一化数据进行状态构造处理,即是说,状态构造形式通过元组的形式表示,构造一阶时延项或者更高阶时延项,得到规范化样本。随着检测时间的推移,规范化样本不会因数据变化产生影响,也不会影响后续的校准计算处理。通过得到与各个待校准样本对应的规范化样本能够降低不同输入变量数值尺度差异的影响,还有利于后续进行聚类计算,增加模型的泛化性。
步骤S230,对各个规范化样本进行聚类处理,得到多个校准聚类类别。
在一实施例中,在得到规范化样本后,可以采用K-means聚类算法对各个规范化样本进行聚类处理,得到多个校准聚类类别;也可以采用层次聚类算法对对各个规范化样本进行聚类处理,得到多个校准聚类类别;还可以采用DB-scan聚类算法、Fuzzy c-means聚类算法、Mean-shift聚类算法进行聚类处理,这里不作赘述。通过聚类处理能够有效地提高校准的准确率,从而提升测量准确性。在同一个校准聚类类别中,规范化样本具有高度相似性;在不同的校准聚类类别中,规范化样本不同。示例性地,采用K-means聚类算法对各个规范化样本进行聚类处理,具有N个样本总数,N可能是成百上千个,得到K个类别,K一般不超过10,一个样本有且只有一个类别与之对应,选用较小的聚类数便可达到较好的效果,不仅可以减少计算量,而且对计算开销也有较好的限制。由于K-means聚类算法生成的类别更加均衡,不易出现尺度大小悬殊的类别,降低了误差,本申请实施例采用K-means聚类算法进行聚类处理。
示例性地,利用K-means聚类算法对各个规范化样本进行聚类处理,得到多个校准聚类类别,并将多个校准聚类类别结果进行可视化,对PM2.5检测的可视化结果,可视化结果如图10所示,有6个校准聚类类别,增加了模型的可解释性。
步骤S240,在各个校准聚类类别中,根据测量值和规范化样本,得到各个校准聚类类别对应的线性回归校准模块。
如图4所示,在各个校准聚类类别中,根据测量值和规范化样本,得到各个校准聚类类别对应的线性回归校准模块,包括:
步骤S241,在各个校准聚类类别中,对测量值和各个规范化样本进行回归计算,得到回归系数。
在一实施例中,根据步骤S230得到多个校准聚类类别,在每一个校准聚类类别中,通过测量值和各个规范化样本计算线性回归校准函数的系数,可以利用最小二乘法对对测量值和各个规范化样本进行回归计算,得到回归系数,从而有利于后续利用回归系数构建得到线性回归校准模块。
步骤S242,根据回归系数构建得到各个校准聚类类别对应的线性回归校准模块。
在一实施例中,根据步骤S241得到的回归系数,构建回归函数,从而得到线性回归校准模块,以对输入数据进行校准处理,得到真实准确的测量值。示例性地,在每一个校准聚类类别中,规范化样本表示为:Xn=(P(n),T(n),H(n)),测量值表示为Yn,将各个Xn=(P(n),T(n),H(n))与Yn做多元线性回归,校准输出结果形式表示为:
Rn=a1*P(n)+a2*T(n)+a3*H(n)+a4
多个类别输出结果形式可以表示为:
Rn,1=a1,1*P(n)+a2,1*T(n)+a3,1*H(n)+a4,1
Rn,2=a1,2*P(n)+a2,2*T(n)+a3,2*H(n)+a4,2
Rn,k=a1,k*P(n)+a2,k*T(n)+a3,k*H(n)+a4,k
其中,a1、a2、a3和a4为回归系数,Rn为输出值。模型建立完成,共K个类别,每个类别对应一个多元线性函数,函数的自变量由Xn的形式决定。由于不同校准聚类类别中的规范化样本具有较大的差异,而构建线性回归校准模块时,不同规范化样本可能得到不同的回归系数,因此,每一个校准聚类类别对应一个线性回归校准模块。
步骤S250,校准聚类类别和线性回归校准模块组成校准模型。
在一实施例中,根据上述得到的校准聚类类别和线性回归校准模块组成校准模型,能够利用校准模型对输入数据进行校准,得到较为准确的测量值。
步骤S140,在各个校准聚类类别中,将规范化数据输入线性回归校准模块,以得到待校准数据对应的目标校准值。
如图5所示,在各个校准聚类类别中,将规范化数据输入线性回归校准模块,以得到待校准数据对应的目标校准值,包括:
步骤S141,在各个校准聚类类别中,将规范化数据输入线性回归校准模块,得到初始校准值。
在一实施例中,根据构建的线性回归校准模块,每一个校准聚类类别中对应一个线性回归校准模块,对于不同的校准聚类类别,线性回归校准模块可能是不同的形式。在各个校准聚类类别中,将将规范化数据输入线性回归校准模块,输出初始校准值。通过得到初始校准值,有利于后续计算得到目标校准值。规范化数据为构造的一阶时延项,示例性地,若Xn=(P(n),T(n-1),H(n)),则规范化数据表示为Xt=(P(t),T(t-1),H(t)),初始校准值表示为Rt,k,利用线性回归校准模块输出结果表示为:Rt,k=a1,k*P(t)+a2,k*T(t-1)+a3,k*H(t)+a4,k,其中,a1、a2、a3和a4为回归系数。
将上述规范化数据输入不同校准聚类类别对应的线性回归校准模块,线性回归校准模块表示为:
Rn,1=a1,1*P(n)+a2,1*T(n-1)+a3,1*H(n)+a4,1
Rn,2=a1,2*P(n)+a2,2*T(n-1)+a3,2*H(n)+a4,2
Rn,k=a1,k*P(n)+a2,k*T(n-1)+a3,k*H(n)+a4,k
步骤S142,将规范化数据与各个校准聚类类别的中心值进行计算处理,得到多个距离值,其中,中心值通过对校准聚类类别进行算术计算得到。
在一实施例中,对于每一个校准聚类类别而言,可以通过对校准聚类类别中的所有规范化样本求平均值得到中心值;也可以对校准聚类类别中的所有规范化样本求众数得到中心值;还可以对校准聚类类别中的所有规范化样本求中间值得到中心值,在求中间值的过程中,先对所述规范化样本进行排序处理,可以为升序排序,也可以为降序排序,在规范化样本为奇数时,直接取中间数值为中心值,在规范化样本为偶数时,取中间两位数值的平均值作为中心值。然后将规范化数据与各个校准聚类类别的中心值进行计算处理,得到多个距离值,根据距离值有利于后续计算得到最佳输出校准值。其中,可以采用欧式距离对规范化数据与各个校准聚类类别的中心值进行距离计算,得到距离值;也可以采用曼哈顿距离对规范化数据与各个校准聚类类别的中心值进行距离计算,得到距离值;还可以利用其他距离函数,这里不作赘述。
步骤S143,将最小的距离值对应的初始校准值确定为目标校准值。
在一实施例中,根据步骤S142得到的多个距离值,选取最小的距离值,根据该最小的距离值对应的校准聚类类别,从而得到在校准聚类类别中线性回归校准模块输出的初始校准值,将该初始校准值作为目标校准值,最终输出目标校准值。根据上述步骤得到目标校准值,能够得到更为真实的校准值,从而提高了传感器的测量性能。
其中,最小的距离值表示为:k=arg min dist(Xt,Centerk),k=1,2,.....K
目标校准值表示为:Rt=Rt,k
Centerk为中心值,Xt为规范化数据,dist()表示欧式距离函数。
如图9所示,本申请实施例获取待校准数据,待校准数据可以包括颗粒物传感器的浓度数据P(PM2.5或PM10浓度)、温湿度传感器的温度T和相对湿度数据H,在预设的时间段[T1,T2]内,传感器(颗粒物,温度,湿度)的秒级或分钟级数据求小时平均,得到测量数据,在上述时间段中,按照小时求取平均值,得到该时间段中的待校准数据。通过获取待校准数据,有利于后续对待校准数据去除干扰因素,输出较为准确的测量值。然后对待校准数据进行归一化处理,具体表示为(x-min)/(max-min),得到归一化数据,对归一化数据进行状态构造处理,得到规范化数据。在各个校准聚类类别中,将规范化数据输入线性回归校准模块,得到初始校准值;对于每一个校准聚类类别而言,通过对校准聚类类别中的所有规范化样本求平均值得到中心值,然后采用欧式距离对规范化与各个校准聚类类别的中心值进行距离计算,得到多个距离值;从多个距离值中选取最小的距离值,根据该最小的距离值对应的校准聚类类别,从而得到在校准聚类类别中线性回归校准模块输出的初始校准值,将该初始校准值作为目标校准值,最终输出目标校准值。本申请实施例考虑了多源影响因素下形成的函数特性,对于温湿度等因素对颗粒物传感器的非线性影响有更好的拟合效果,在实际工况下,数据获取便捷,不受部署前实验室校准所需的精密仪器限制,并且选择距离最近的类别进行校准,具有清晰的可解释性。
如图11所示,以均方根误差(Root Mean Square Error,RMSE)作为误差评价指标,对于不同水平初始偏差的颗粒物传感器,在PM2.5和PM10指标上的校准效果均优于全局多元线性回归方法。在不同误差水平的测试组,对于PM2.5校准效果提升有16.9%-20.4%。如图12所示,对于PM10校准效果提升大约有9.7%-14.2%。其中,每一组中,从左至右依次为校准前、全局多元线性回归方法的校准和本申请实施例提供的传感器的校准方法。
如图13所示,在不同误差水平的测试组里,对于增大建模训练集/测试集的比重对于改善校准性能并不敏感,因此以较小的训练样本运行能够减少计算开销。如图14所示,在不同误差水平的测试组里,增加聚类数对于校准性能的改善不显著,因此,在应用时可以选用较小的聚类数,便可达到不错的效果,可以减少计算量,对计算开销有较好的限制。
在一实施例中,对于稳定性而言,在不同误差水平的测试组里,无论是PM2.5还是PM10指标,相比于全局多元线性回归,具有更小的校准误差和更好的稳定性(多次随机实验中的误差波动更小),这也说明对不同状态类别赋予各自的回归模型,在拟合细节的刻画上有更好的表现,也降低了采样随机性的影响。在拟合度指标决定系数上,相比于全局多元线性回归,具有15.6%(PM2.5)和5.7%(PM10)的提升。
如图15所示,本申请实施例提供了传感器的校准装置100,该传感器的校准装置100集成于颗粒物污染检测设备中,传感器的校准装置100首先通过数据获取模块110获取待校准数据;然后利用预处理模块120对待校准数据进行数据预处理,得到与待校准数据对应的规范化数据,能够降低不同输入变量数值尺度差异的影响;随后通过模型获取模块130获取预设的校准模型,校准模型包括多个校准聚类类别和各个校准聚类类别对应的线性回归校准模块;最后采用校准处理模块140在各个校准聚类类别中,将规范化数据输入线性回归校准模块,以得到待校准数据对应的目标校准值,校准模型能够对非线性干扰因素进行补偿,从而提高测量性能。
需要说明的是,数据获取模块110与预处理模块120连接,预处理模块120与模型获取模块130连接,模型获取模块130与校准处理模块140连接。上述传感器的校准方法作用于传感器的校准装置100,该传感器的校准装置100通过对待校准数据进行预处理,利用校准模型对处理得到的规范化数据进行拟合,能够大幅度改善传感器的测量性能,并且具有较好的泛化性,应用较广泛,以支持大气环境监测的传感系统的有效覆盖监测;并且可对聚类结果进行可视化,提高模型的可解释性。
本申请实施例描述的实施例是为了更加清楚的说明本申请实施例的技术方案,并不构成对于本申请实施例提供的技术方案的限定,本领域技术人员可知,随着技术的演变和新应用场景的出现,本申请实施例提供的技术方案对于类似的技术问题,同样适用。
图16示出了本申请实施例提供的计算机设备500。该计算机设备500可以为基站或者终端,该计算机设备500的内部结构包括但不限于:
存储器510,用于存储程序;
处理器520,用于执行存储器510存储的程序,当处理器520执行存储器510存储的程序时,处理器520用于执行上述的传感器的校准方法。
处理器520和存储器510可以通过总线或者其他方式连接。
存储器510作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序,如本申请任意实施例描述的传感器的校准方法。处理器520通过运行存储在存储器510中的非暂态软件程序以及指令,从而实现上述的传感器的校准方法。
存储器510可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储执行上述的传感器的校准方法。此外,存储器510可以包括高速随机存取存储器,还可以包括非暂态存储器,比如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器510可选包括相对于处理器520远程设置的存储器,这些远程存储器可以通过网络连接至该处理器520。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
实现上述的传感器的校准方法所需的非暂态软件程序以及指令存储在存储器510中,当被一个或者多个处理器520执行时,执行本申请任意实施例提供的传感器的校准方法。
本申请实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,计算机可执行指令用于执行上述的传感器的校准方法。
在一实施例中,该存储介质存储有计算机可执行指令,该计算机可执行指令被一个或多个控制处理器520执行,比如,被上述计算机设备500中的一个处理器520执行,可使得上述一个或多个处理器520执行本申请任意实施例提供的传感器的校准方法。
以上所描述的实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
应当理解,在本申请中,“至少一个(项)”是指一个或者多个,“多个”是指两个或两个以上。“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系,例如,“A和/或B”可以表示:只存在A,只存在B以及同时存在A和B三种情况,其中A,B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达,是指这些项中的任意组合,包括单项(个)或复数项(个)的任意组合。例如,a,b或c中的至少一项(个),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是单个,也可以是多个。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本申请的较佳实施进行了具体说明,但本申请并不局限于上述实施方式,熟悉本领域的技术人员在不违背本申请精神的。共享条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本申请权利要求所限定的范围内。

Claims (10)

1.一种传感器的校准方法,其特征在于,所述方法包括:
获取待校准数据;
对所述待校准数据进行数据预处理,得到与所述待校准数据对应的规范化数据;
获取预设的校准模型,所述校准模型包括多个校准聚类类别和各个所述校准聚类类别对应的线性回归校准模块;
在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,以得到所述待校准数据对应的目标校准值。
2.根据权利要求1所述的传感器的校准方法,其特征在于,所述对所述待校准数据进行数据预处理,得到与所述待校准数据对应的规范化数据,包括:
对所述待校准数据进行归一化处理,得到归一化数据;
对所述归一化数据进行状态构造处理,得到所述规范化数据。
3.根据权利要求2所述的传感器的校准方法,其特征在于,所述对所述归一化数据进行状态构造处理,得到所述规范化数据,包括:按照预设的元组规则对所述归一化数据进行状态构造处理,得到所述规范化数据。
4.根据权利要求1所述的传感器的校准方法,其特征在于,所述校准模型通过以下步骤得到:
获取校准数据集,所述校准数据集包括多个待校准样本和各个所述待校准样本对应的测量值;
对各个所述待校准样本进行预处理操作,得到与各个所述待校准样本对应的规范化样本;
对各个所述规范化样本进行聚类处理,得到多个所述校准聚类类别;
在各个所述校准聚类类别中,根据所述测量值和所述规范化样本,得到各个所述校准聚类类别对应的所述线性回归校准模块;
所述校准聚类类别和所述线性回归校准模块组成所述校准模型。
5.根据权利要求4所述的传感器的校准方法,其特征在于,所述在各个所述校准聚类类别中,根据所述测量值和所述规范化样本,得到各个所述校准聚类类别对应的所述线性回归校准模块,包括:
在各个所述校准聚类类别中,对所述测量值和各个规范化样本进行回归计算,得到回归系数;
根据所述回归系数构建得到各个所述校准聚类类别对应的所述线性回归校准模块。
6.根据权利要求1所述的传感器的校准方法,其特征在于,所述在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,以得到所述待校准数据对应的目标校准值,包括:
在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,得到初始校准值;
将所述规范化数据与各个所述校准聚类类别的中心值进行计算处理,得到多个距离值,其中,所述中心值通过对所述校准聚类类别进行算术计算得到;
将最小的所述距离值对应的所述初始校准值确定为所述目标校准值。
7.根据权利要求2所述的传感器的校准方法,其特征在于,所述对所述待校准数据进行归一化处理,得到归一化数据,包括:
获取预设的传感器的量程上限和预设的传感器的量程下限;
将所述待校准数据与所述量程下限进行差值计算,得到第一差值;
将所述量程上限与所述量程下限进行差值计算,得到第二差值;
将所述第一差值与所述第二差值的比值作为所述归一化数据。
8.一种传感器的校准装置,其特征在于,所述装置包括:
数据获取模块,用于获取待校准数据;
预处理模块,用于对所述待校准数据进行数据预处理,得到与所述待校准数据对应的规范化数据;
模型获取模块,用于获取预设的校准模型,所述校准模型包括多个校准聚类类别和各个所述校准聚类类别对应的线性回归校准模块;
校准处理模块,用于在各个所述校准聚类类别中,将所述规范化数据输入所述线性回归校准模块,以得到所述待校准数据对应的目标校准值。
9.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被一个或多个所述处理器执行时,使得一个或多个所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述存储介质可被处理器读写,所述存储介质存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行如权利要求1至7中任一项所述方法的步骤。
CN202211591397.7A 2022-12-12 2022-12-12 传感器的校准方法、装置、计算机设备和可读存储介质 Pending CN115855133A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211591397.7A CN115855133A (zh) 2022-12-12 2022-12-12 传感器的校准方法、装置、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211591397.7A CN115855133A (zh) 2022-12-12 2022-12-12 传感器的校准方法、装置、计算机设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN115855133A true CN115855133A (zh) 2023-03-28

Family

ID=85672195

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211591397.7A Pending CN115855133A (zh) 2022-12-12 2022-12-12 传感器的校准方法、装置、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN115855133A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116389183A (zh) * 2023-06-07 2023-07-04 深圳市华翌科技有限公司 一种基于物联网的智能家居交互数据处理方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116389183A (zh) * 2023-06-07 2023-07-04 深圳市华翌科技有限公司 一种基于物联网的智能家居交互数据处理方法
CN116389183B (zh) * 2023-06-07 2023-08-29 深圳市华翌科技有限公司 一种基于物联网的智能家居交互数据处理方法

Similar Documents

Publication Publication Date Title
CN108734355B (zh) 一种应用于电能质量综合治理场景的短期电力负荷并行预测方法及系统
EP3769047B1 (en) Sensor calibration
CN111723929A (zh) 一种基于神经网络的数值预报产品订正方法、装置和系统
CN117196353B (zh) 基于大数据的环境污染评估与监测方法及系统
CN111414977A (zh) 机床主轴热误差建模的加权集成温度敏感点组合选取方法
CN111931806A (zh) 一种多传感器数据融合的设备故障诊断方法及装置
CN114088890B (zh) 基于深度bp神经网络的自适应温湿度补偿方法及系统
CN115855133A (zh) 传感器的校准方法、装置、计算机设备和可读存储介质
CN108846200B (zh) 一种基于迭代法的准静态桥梁影响线识别方法
CN117390591B (zh) 基于电参量分析的输煤皮带采样机运行监测方法及系统
CN112070103B (zh) 通过微波链路网格化自适应可变尺度反演大气能见度的方法
CN114329347B (zh) 一种电能表计量误差预测方法、装置及存储介质
CN113703506B (zh) 一种建筑材料生产车间环境控制调节方法及系统
CN117278150B (zh) 一种室内无线网络信号测量计算方法、设备和介质
CN117055005A (zh) 一种基于深度主动学习的雷达目标识别方法及雷达系统
CN114485800B (zh) 适用于气体多参数移动监测仪的远程质控方法
CN112747773B (zh) 基于Allan方差和随机多项式提高陀螺仪精度的方法
CN115618190A (zh) 基于传感器数据的环境颗粒物浓度估计方法、系统及终端
CN112184037B (zh) 一种基于加权svdd的多模态过程故障检测方法
CN112528566A (zh) 基于AdaBoost训练模型的空气质量数据实时校准方法及系统
CN113804833A (zh) 基于凸集投影和极限学习机的电子鼻漂移通用校准方法
CN114519262A (zh) 基于改进gm(1,1)模型的空中目标威胁预测方法
CN107506824B (zh) 一种配电网的不良观测数据检测方法及装置
CN114742108B (zh) 一种数控机床轴承故障检测方法及系统
CN115952402B (zh) 基于二进制蜻蜓算法的近红外模型传递标样集挑选方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination