CN115309957A - 一种试验测试数据质量监测方法 - Google Patents

一种试验测试数据质量监测方法 Download PDF

Info

Publication number
CN115309957A
CN115309957A CN202210762688.1A CN202210762688A CN115309957A CN 115309957 A CN115309957 A CN 115309957A CN 202210762688 A CN202210762688 A CN 202210762688A CN 115309957 A CN115309957 A CN 115309957A
Authority
CN
China
Prior art keywords
data
quality
determining
test
test data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210762688.1A
Other languages
English (en)
Inventor
张志宏
石小江
刘盾盾
袁世辉
宋子军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AECC Sichuan Gas Turbine Research Institute
Original Assignee
AECC Sichuan Gas Turbine Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AECC Sichuan Gas Turbine Research Institute filed Critical AECC Sichuan Gas Turbine Research Institute
Priority to CN202210762688.1A priority Critical patent/CN115309957A/zh
Publication of CN115309957A publication Critical patent/CN115309957A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9035Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/904Browsing; Visualisation therefor

Abstract

本发明公开了一种试验测试数据质量监测方法。其中,方法包括:根据用户预先设定的分析特性结果以及业务逻辑确定测试数据的质量状态数据,其中质量状态数据包括低质量数据以及有效数据;根据低质量数据的类型,确定优化方法,并通过优化方法对低质量数据进行优化,确定有效测试数据,其中有效测试数据包括有效数据以及优化后的低质量数据;将有效测试数据以及测试数据传输至终端显示设备,终端显示设备用于显示有效测试数据以及测试数据的评价分析图。

Description

一种试验测试数据质量监测方法
技术领域
本发明涉及数据处理技术领域,并且更具体地,涉及一种试验测试数据质量监测方法。
背景技术
目前随着试验设备的逐步增加,试验系统的测试数据也越来越多。通过对试验测试数据的分析以及计算可以得到实验结果。但是目前由于测试数据存在低质量数据,存在影响试验结果的问题。并且试验种类繁多,实验数据多种多样,低质量数据类型也越来越多,目前无法解决多种试验测试数据的低质量数据的处理的问题。
发明内容
针对现有技术的不足,本发明提供一种试验测试数据质量监测方法。
根据本发明的一个方面,提供了一种试验测试数据质量监测方法,包括:根据用户预先设定的分析特性结果以及业务逻辑确定测试数据的质量状态数据,其中质量状态数据包括低质量数据以及有效数据;根据低质量数据的类型,确定优化方法,并通过优化方法对低质量数据进行优化,确定有效测试数据,其中有效测试数据包括有效数据以及优化后的低质量数据;将有效测试数据以及测试数据传输至终端显示设备,终端显示设备用于显示有效测试数据以及测试数据的评价分析图。
可选地,低质量数据包括缺失数据、异常数据、突变数据以及不规范数据,该方法还包括:对不同类型的质量状态数据进行打分,确定不同类型质量状态数据的评分,其中评分用于指示质量状态数据的等级,并且对不同类型的质量状态数据进行打分,确定不同类型质量状态数据的评分的操作,包括:根据有效数据在测试数据中的占比,确定有效数据的第一评分;根据缺失数据在测试数据中的占比,确定缺失数据的第二评分;根据异常数据在测试数据中的占比,确定异常数据的第三评分;根据突变数据在测试数据中的占比,确定突变数据的第四评分;根据不规范数据在测试数据中的占比,确定不规范数据的第五评分。
可选地,该方法还包括:通过预先设置的门限检验法/特征对比算法对测试数据进行检测,确定异常数据的数据量。
可选地,该方法还包括:通过预先设定的静态突变检测法/动态突变检测法对测试数据进行检测,确定突变数据的数据量。
可选地,该方法还包括:根据预先设定的判定逻辑,对低质量数据进行警报提示,确定警报提示信息,其中警报提示信息包括预警值和报警值,并且判定逻辑包括大于预警上限、大于预警下限、大于报警上限、大于报警下限、大于预警上限并且下雨报警上限、大于预警下限并且小于报警下限、大于预警上限并且大于预警下限、大于报警上限并且大于报警下限、大于预警上限并且小于报警上限并且大于预警下限并且小于报警下限、大于预警上限并且大于报警上限并且大于预警下限并且大于报警下限。
可选地,该方法还包括:通过预先设定的单通道判定方法/多通道判定方法/嵌入算法判定方法/触发判定方法,对测试数据进行判定,确定测试数据中的数据是否为低质量数据。
可选地,根据低质量数据的类型,确定优化方法的操作,包括:确定低质量数据的参数类型,其中参数类型包括计算参数以及测量参数;确定参数类型的低质量数据类型,并根据低质量数据类型,确定优化方法,其中优化方法包括试前零位优化法、试后零位优化法、差值优化法、线性优化法、试后斜率优化法、插值算法、数据对齐、试验中数据补点。
可选地,评价分析图包括数据质量概要评价图、数据质量概要评价表以及数据质量详细评价图。
根据本发明的另一个方面,提供了一种试验测试数据质量监测装置,包括:
第一确定模块,用于根据用户预先设定的分析特性结果以及业务逻辑确定测试数据的质量状态数据,其中质量状态数据包括低质量数据以及有效数据;
第二确定模块,用于根据低质量数据的类型,确定优化方法,并通过优化方法对低质量数据进行优化,确定有效测试数据,其中有效测试数据包括有效数据以及优化后的低质量数据;
传输模块,用于将有效测试数据以及测试数据传输至终端显示设备,终端显示设备用于显示有效测试数据以及测试数据的评价分析图。
根据本发明的又一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本发明上述任一方面所述的方法。
根据本发明的又一个方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本发明上述任一方面所述的方法。
从而,本发明通过数据质量对比智能分析,实现对同一组传感器中数据质量相对较差个体的筛选;试验测试数据优化,实现数据处理软件中对被过滤的低质量或错误关键数据的自动化优化或替换;复杂试验系统测试数据质量监测可视化,实现对数据质量总体状况、数据问题汇总情况和问题数据情况的可视化展示。
附图说明
通过参考下面的附图,可以更为完整地理解本发明的示例性实施方式:
图1是本发明一示例性实施例提供的试验测试数据质量监测方法的流程示意图;
图2是本发明一示例性实施例提供的异常数据判读流程示意图;
图3a是本发明一示例性实施例提供的门限检验法显示图;
图3b是本发明一示例性实施例提供的特征对比分析法显示图;
图4a是本发明一示例性实施例提供的数据优化流程示意图;
图4b是本发明一示例性实施例提供的AIP测量截面5点稳态总压梳测点布局图;
图5是本发明一示例性实施例提供的数据质量概要评价示意图;
图6是本发明一示例性实施例提供的数据质量概要评价表;
图7是本发明一示例性实施例提供的数据质量详细评价示意图;
图8是本发明一示例性实施例提供的数据质量详细评价的另一示意图;
图9是本发明一示例性实施例提供的试验测试数据质量监测装置的结构示意图;
图10是本发明一示例性实施例提供的电子设备的结构。
具体实施方式
下面,将参考附图详细地描述根据本发明的示例实施例。显然,所描述的实施例仅仅是本发明的一部分实施例,而不是本发明的全部实施例,应理解,本发明不受这里描述的示例实施例的限制。
应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
本领域技术人员可以理解,本发明实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等,既不代表任何特定技术含义,也不表示它们之间的必然逻辑顺序。
还应理解,在本发明实施例中,“多个”可以指两个或两个以上,“至少一个”可以指一个、两个或两个以上。
还应理解,对于本发明实施例中提及的任一部件、数据或结构,在没有明确限定或者在前后文给出相反启示的情况下,一般可以理解为一个或多个。
另外,本发明中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本发明中字符“/”,一般表示前后关联对象是一种“或”的关系。
还应理解,本发明对各个实施例的描述着重强调各个实施例之间的不同之处,其相同或相似之处可以相互参考,为了简洁,不再一一赘述。
同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
本发明实施例可以应用于终端设备、计算机系统、服务器等电子设备,其可与众多其它通用或专用计算系统环境或配置一起操作。适于与终端设备、计算机系统、服务器等电子设备一起使用的众所周知的终端设备、计算系统、环境和/或配置的例子包括但不限于:个人计算机系统、服务器计算机系统、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的系统、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机系统﹑大型计算机系统和包括上述任何系统的分布式云计算技术环境,等等。
终端设备、计算机系统、服务器等电子设备可以在由计算机系统执行的计算机系统可执行指令(诸如程序模块)的一般语境下描述。通常,程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等,它们执行特定的任务或者实现特定的抽象数据类型。计算机系统/服务器可以在分布式云计算环境中实施,分布式云计算环境中,任务是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中,程序模块可以位于包括存储设备的本地或远程计算系统存储介质上。
示例性方法
图1是本发明一示例性实施例提供的试验测试数据质量监测方法的流程示意图。本实施例可应用在电子设备上,如图1所示,试验测试数据质量监测方法100包括以下步骤:
步骤101,根据用户预先设定的分析特性结果以及业务逻辑确定测试数据的质量状态数据,其中质量状态数据包括低质量数据以及有效数据。
其中,分析特征结果例如:可以是传感器测试数据中,根据传感器测试数据中的平均值、最大值、最小值等特征进行数据质量状态的确定。
业务逻辑例如传感器的测试数据的取值范围在1~2,那么就可以根据是否超出该取值范围的业务逻辑进行数据质量状态的确定。
具体地,测试数据评价指标参照表1所示,从而根据数据质量状态可以将数据质量分为以下八个评价指标。
表1
Figure BDA0003721467650000061
Figure BDA0003721467650000071
从而通过上述数据质量对比智能分析,可以实现对同一组传感器中数据质量相对较差个体的筛选。
可选地,低质量数据包括缺失数据、异常数据、突变数据以及不规范数据,该方法还包括:对不同类型的质量状态数据进行打分,确定不同类型质量状态数据的评分,其中评分用于指示质量状态数据的等级,并且对不同类型的质量状态数据进行打分,确定不同类型质量状态数据的评分的操作,包括:根据有效数据在测试数据中的占比,确定有效数据的第一评分;根据缺失数据在测试数据中的占比,确定缺失数据的第二评分;根据异常数据在测试数据中的占比,确定异常数据的第三评分;根据突变数据在测试数据中的占比,确定突变数据的第四评分;根据不规范数据在测试数据中的占比,确定不规范数据的第五评分。
具体地,有效数据量打分标准:仅对数据中的有效数据量进行数据质量评测标准。数据总数取决于用户所选取的数据范围(用户可选同组传感器、同状态同截面数据、同类型参数、某列参数数据、某段时间内同类型参数等)所读数据为数据总数;有效数据量指,在所选数据范围内,除去不规范数据量、缺失数据量、异常数据量、突变数据量后剩下的即为有效数据量。按照表2计算方法,对所选范围内数据中的有效数据量,按其占数据总数的百分比进行打分。
注:实时分析的数据总数大约在1s-2s之间,用户可自行设定时间范围。
表2
Figure BDA0003721467650000081
数据缺失量打分标准:仅对数据中的数据缺失量进行数据质量评测标准。数据总数取决于用户所选取的数据范围(用户可选同组传感器、同状态同截面数据、同类型参数、某列参数数据、某段时间内同类型参数等)所读数据为数据总数,并按照表3计算方法,对所选范围内数据中的缺失量,按其占数据总数的百分比进行打分。
注:实时分析的数据总数大约在1s-2s之间,用户可自行设定时间范围。
表3
Figure BDA0003721467650000082
Figure BDA0003721467650000091
异常数据量(数据质量对比智能分析)打分标准:异常数据判定方法即为数据质量对比智能分析法,分为门限检验和特征对比分析算法。用户可任选其一,对同一组传感器数据进行质量评价,筛选出不符合判定逻辑的异常数据个数,实现对同一组传感器中数据质量相对较差个体的筛选。数据质量智能对比分析支持同组传感器参数比对分析的最大个数不低于50个,按照表4的方法进行异常数据量打分。
注:实时分析的数据总数大约在1s-2s之间,用户可自行设定时间范围。
表4
Figure BDA0003721467650000092
突变数据量打分标准:仅对数据中的突变数据量进行数据质量评测标准。数据总数取决于用户所选取的数据范围(用户可选同组传感器、同状态同截面数据、同类型参数、某列参数数据、某段时间内同类型参数等)所读数据为数据总数,并按照表5计算方法,对所选范围内数据中的突变量,按其占数据总数的百分比进行打分。
注:实时分析的数据总数大约在1s-2s之间,用户可自行设定时间范围。
表5
Figure BDA0003721467650000093
Figure BDA0003721467650000101
不规范数据量打分标准:仅对数据中的不规范数据进行数据质量评测标准。数据总数取决于用户所选取的数据范围(用户可选同组传感器、同状态同截面数据、同类型参数、某列参数数据、某段时间内同类型参数等)所读数据为数据总数,并按照表6计算方法,对所选范围内数据中的不规范数据量,按其占数据总数的百分比进行打分。
注:实时分析的数据总数大约在1s-2s之间,用户可自行设定时间范围。
表6
Figure BDA0003721467650000102
可选地,该方法还包括:通过预先设置的门限检验法/特征对比算法对测试数据进行检测,确定异常数据的数据量。
具体地,此外,异常数据的判读流程如下(如图2所示):
1.量程判定:优先判读数据是否超传感器量程
2.门限检验法或特征对比算法:根据用户所选的判读方法,对异常数据进行判定
3.对异常数据进行标定,并计算异常数据量。
例如调取(测试链路智能匹配技术与验证平台)传感器库中传感器的量程数据,并以此作为传感器量程的上下限判定,对于超出传感器上下限的数据,标记为异常数据。
1.门限检验法
按照同组传感器变化数据进行质量对比分析。依照历史数据或用户自定义的此截面传感器数据的上限和下限,来确立超阈值的数据为异常数据。可用于实时采集数据或历史数据分析判读。
门限检验分为:预警值判定和报警值判定,预警值和报警值均为双曲线,其中预警值双曲被包含在报警值双曲线中,即为包络曲线。用户根据对数据和业务的综合考虑,设定好相应数据的预警值与报警值。门限检验法中,默认所有超出报警值上下限的数据为异常数据。
图3a即为门限检验法可视化图表呈现样例。用户可在右侧手动输入预警值和报警值,根据用户输入所显示的包络曲线与数据一同显示在左侧。相关数据特征显示于右下方。
所有超出报警值的数据均判定为异常值。其显示列表形式如下表7:
表7
Figure BDA0003721467650000111
2.特征对比分析法
按照同组传感器变化数据进行质量对比分析,根据所选历史数据在相同状态下各个特征的最大值和最小值(如:均值、方差、标准差、偏度、峰度等),与当前数据特征进行比对,如果发现超过其历史特征的最大值和最小值便报警,并判定为异常数据。
特征对比分析法即需要用户选取适当的、最具代表性的特征(1个或多个)为判据,用户根据已有判据选择报警的特征。计算判定同组传感器中不符合业务逻辑的数据。仅可用于对历史数据分析判读。如下图,用户选择判据为历史数据的“极值”和“均值”,即生成相应历史数据的最大最大值、最小最小值、最大均值、最小均值的包络曲线。同时设定报警值为“极值”,即超出最大最大值和最小最小值的数据,标定为异常数据。
图3b即为特征对比分析法可视化图表呈现样例。用户可在右侧手动选择判据为(历史数据)均值、极值(最大最小值)、中位数、标准差、方差等特征值,同时设定报警依据(为判据中哪一特征的上下限)。依据用户所选判据生成相应包络曲线与数据显示在右侧。相关数据特征显示在右下方。
所有超出用户所选报警值的数据均判定为异常值。其显示列表形式如下表8:
表8
Figure BDA0003721467650000121
最终,判读特征的选取是否适宜或阈值确立是否正确,将直接影响综合评价的准确性。进行评价指标的构建应广泛涉猎与该评价指标装置行业资料和数据特性。通过正确合规的定性分析和定量分析对数据质量进行评估。
为了方便数据质量评价,评价结果分为“异常”和“正常”两种情况。当数据质量不符合算法逻辑和业务规则时,以标红警报方式向用户突出显示异常数据。
无论哪一种判定规则,装置会自动计算当前“异常”数据个数,并以异常数据量(对比智能分析)结果展示给用户。
可选地,该方法还包括:通过预先设定的静态突变检测法/动态突变检测法对测试数据进行检测,确定突变数据的数据量。
具体地,例如对同一组传感器中数据质量衰减速度相对较快个体的监测,利用数据突变检测算法,得到数据质量衰减速度相对较快个体。现有的突变检测算法根据其对突变的定义可分为两类:静态突变检测法和动态突变检测法。
1.静态突变检测方法:根据历史数据或用户自定义阈值,判断数据是否符合限定阈值,来确立超阈值的数据为低质量数据。可用于实时数据采集和历史数据集。所有超出用户设定阈值的数值即判定为突变数据(如表8所示)。
表8
Figure BDA0003721467650000131
2.动态突变检测方法:即突跳算法。利用自适应的突变阈值进行数据流的检测,克服了第一类方法的分不足。能同时检测上升和下降两种趋势的突变,且能排除颠簸对突变检测的干扰。
按照某单只/同组传感器分类,分别将其随时间变化数据进行质量突变分析。使用突跳算法,对数据进行计算,将偏差大于指标要求N次的数据记录为突跳异常。算法会自动计算突跳次数,并将突跳次数大于0的数据记录为低质量数据,将突跳次数等于0的数据记录为正常数据(如表9所示)。
表9
Figure BDA0003721467650000132
其中,算法参数(指标和N)选取是否适宜或阈值确立是否正确,将直接影响综合评价的准确性。进行评价指标的构建应广泛涉猎与该评价指标装置行业资料和算法特性。通过正确合规的定性分析和定量分析对数据质量进行评估。
为了方便数据质量评价,评价结果分为“突变”和“正常”两种情况。当数据质量不符合算法逻辑和业务规则时,以标红警报方式向用户突出显示突变数据。
从而通过数据质量突变智能分析,实现对同一组传感器中数据质量衰减速度相对较快个体的监测。
可选地,该方法还包括:根据预先设定的判定逻辑,对低质量数据进行警报提示,确定警报提示信息,其中警报提示信息包括预警值和报警值,并且判定逻辑包括大于预警上限、大于预警下限、大于报警上限、大于报警下限、大于预警上限并且下雨报警上限、大于预警下限并且小于报警下限、大于预警上限并且大于预警下限、大于报警上限并且大于报警下限、大于预警上限并且小于报警上限并且大于预警下限并且小于报警下限、大于预警上限并且大于报警上限并且大于预警下限并且大于报警下限。
具体地,试验测试数据过滤,实现对低质量或错误数据的自动化判定标识、过滤及处理,以便后续的数据优化。数据过滤装置最多能同时对200个参数进行过滤。
数据过滤判定警报提示逻辑按照预警值与报警值分为两类。预警值与报警值分别为两条包络曲线,预警值的上下限在报警值上下限内。若数据在预警值上下限范围内视为正常数据,如果数据超出预警值的上下限范围却未达到报警值上下限范围,数据质量判读平台会对数据做出“预警”提示;若数据不但超出预警值,也超出报警值上下限,则判定为“报警”提示。用户可通过下拉框,根据业务数据状态及逻辑,单独选择某一类报警提示方式,也可同时选择两类报警方式。
1)>预警上限
2)>预警下限
3)>报警上限
4)>报警下限
5)>预警上限&<报警上限
6)>预警下限&<报警下限
7)>预警上限&>预警下限
8)>报警上限&>报警下限
9)>预警上限&<报警上限&>预警下限&<报警下限
10)>预警上限&>报警上限&>预警下限&>报警下限
其中,数据既可以是通道中的实时数据、历史数据、特征数据,也可以是表达式。
从而通过上传判定逻辑实现低质量数据的警报提示信息,进而便于后期数据的优化。并且试验测试数据过滤,实现对低质量或错误数据的自动化标识、过滤及处理
可选地,该方法还包括:通过预先设定的单通道判定方法/多通道判定方法/嵌入算法判定方法/触发判定方法,对测试数据进行判定,确定测试数据中的数据是否为低质量数据。
具体地,对于低质量或错误数据的判定方式有:单通道判定、多通道判定、嵌入算法判定和触发判定。
其中,单通道判定:用一个通道的值是否是野值,判断该数据是否合格;不合格的无效数据,不能输出(包括不能输出到界面上显示,也不能输出到结果文件中保存),但是仍旧要记录到原始数据中;每组数据只能配置一个单通道判定规则;单通道判定规则可以和多通道判定规则、嵌入算法判定规则共同作用。
多通道判定:在单通道判定不满足需求的情况下,需要进行多通道判定;根据多个通道判断;根据多个通道构成的逻辑表达式判断帧是否有效;选择多个通道,以多个通道为变量X1、X2、X3...,然后编辑表达式;表达式可以使用到的操作符包括+、-、*、/、%、^、()等,使用到的函数包括:求和(sum)、平均(avg)、乘方(pow)方差(Var)、绝对值(Abs)等。
嵌入算法判定:当简单的函数无法满足判定要求,可以使用用户提供的判定算法进行判定。数据中是否有低质量或错误数值,根据多个通道判断,通道数据不定;判断算法由用户的算法插件提供;用户算法是简单C函数,由动态库DLL提供;自动加载用户的C函数进行判断;用哪个算法插件,预先在数据解析协议的配置界面上进行配置。
触发判定:在指定的通道满足条件之前,所有的数据都判断为不合格;触发条件满足之后,该判定规则所有的数据都判断为合格。注:即使条件重新又不满足了,仍然判断为合格,因为已经触发过了;在本规则判断为合格,不影响其他判断规则,比如单通道判定、多通道判定、嵌入算法判定这几种,如果不合格,该数据仍然为不合格。
步骤S102,根据低质量数据的类型,确定优化方法,并通过优化方法对低质量数据进行优化,确定有效测试数据,其中有效测试数据包括有效数据以及优化后的低质量数据。
从而,通过试验测试数据优化,实现数据处理软件中对被过滤的低质量或错误关键数据的自动化优化或替换。
可选地,参考图4a所示,根据低质量数据的类型,确定优化方法的操作,包括:确定低质量数据的参数类型,其中参数类型包括计算参数以及测量参数;确定参数类型的低质量数据类型,并根据低质量数据类型,确定优化方法,其中优化方法包括试前零位优化法、试后零位优化法、差值优化法、线性优化法、试后斜率优化法、插值算法、数据对齐、试验中数据补点。
具体地,装置能够通过对过滤出的试验数据进行优化,实现数据处理装置对被过滤的低质量或错误关键数据的自动化优化或替换。
数据优化方法包括:
1)试前零位优化法:针对推理、压力数据,能够在试前进行优化,条件时测试零位变化相对稳定;
2)试后零位优化法:针对推理、压力数据,能够在试后进行优化,条件时测试零位变化相对稳定;
3)差值优化法:仅用于入口压力、喷前压力,用于试后优化,优化条件时存在固定压力差值;
4)线性优化法:针对推力、压力数据,适合试后优化,优化条件时测量零位随试验时间变化;
5)试后斜率优化法:针对推力、流量、压力数据,用于试后优化,优化条件时测量传感器输出线性失真,严重偏离正常值。
6)插值算法:根据所筛选出的低质量数据的特征,进行插值算法的选择,得到插值后的新数据。
a)线性插值
b)双线性插值
7)数据对齐:调整数据表结构,使其规整,方便于进一步分析。
8)截取:截取所需数据表或数据列,形成新的有效数据。
9)试验中数据补点策略:补点策略1和补点策略2。参考图4b所示,其中
补点策略1
Pt1-2、Pt1-3、Pt1-4、Pt1-8、Pt1-7、Pt1-6出现坏点:
1)采用与坏点对称位置的测点进行替代。例如Pt1-2-1损坏,用Pt1-8-1进行替代;
2)若坏点的对称位置测点也损坏:
若坏点位于02~04径向区域,则用坏点周围相邻的4个测点的算术平均值进行替代;若4个相邻点又有1个坏点,则用周向或径向两个好的相邻点的算术平均值进行替代;若坏点周围连续3个坏点,则应更换测量探针。
若坏点位于01或05径向区域,则用周向相邻的2个测点的算术平均值进行替代;若周向相邻两个点之一也是坏点,则用同支探针上相邻的1点进行替代;若上述替代的点也是坏点,即连续3个坏点,则应更换测量探针。
补点策略2
Pt1-1、Pt1-5出现坏点:
1)若坏点位于02~04径向区域,则用坏点周围相邻的4个测点的算术平均值进行替代;若4个相邻点又有1个坏点,则用周向或径向两个好的相邻点的算术平均值进行替代;若坏点周围连续3个坏点,则应更换测量探针;
2)若坏点位于01或05径向区域,则用周向相邻的2个测点的算术平均值进行替代;若周向相邻两个点之一也是坏点,则用同支探针上相邻的1点进行替代;若上述替代的点也是坏点,即连续3个坏点,则应更换测量探针。
3)若采用上述策略后,坏点的数据已补齐,但其数值低于平均静压,则按照出现回流区的策略(平均静压进行替代)开展稳态畸变指数的计算。
若AIP测量截面测点未出现坏点,只因回流区导致某些测点值低于平均静压值,则用平均静压值替代测点值进行处理。
针对需要进行优化或替换的数据。根据数据质量智能分析、低质量数据过滤以及业务逻辑筛查出的低质量数据,用户可根据低质量数据类型(详见4.9.2数据质量分析)和数据的业务特性(如,同截面同状态数据组、同组传感器数据等)选择相应的优化算法,对低质量数据进行优化。
判读数据质量后,装置会按照参数类型对低质量数据进行计算参数和测量参数的分组,而后用户可根据低质量数据类型选择相应的优化算法,并选择可替换的优化结果。其中优化方法和低质量数据类型的对应关系如下表10所示。
表10
Figure BDA0003721467650000181
步骤S103,将有效测试数据以及测试数据传输至终端显示设备,终端显示设备用于显示有效测试数据以及测试数据的评价分析图。
从而,通过试验测试数据质量监测可视化,实现对数据质量总体状况、数据问题汇总情况和问题数据情况的可视化展示。
可选地,评价分析图包括数据质量概要评价图、数据质量概要评价表以及数据质量详细评价图。
具体地,数据质量在线监测验证可视化分为两个维度。第一维度为概要评价,对实时采集数据或事后数据的数据质量进行综合、直观的评估。用户可以通过“概要评价图”清楚观测到所选数据的数据分布图,并根据数据质量的评价指标对应显示其基本信息,包括指标名称、指标的数量、百分比(符合指标或不符合指标的数据占总数的百分比)和指标评定的结果等级(优、良、中、差)。用户也可通过“概要评价表”清楚了解所选数据中数据的序号、通道编号、参数类型、参数符号、原始值、物理单位、工程值、工程单位、(衡量数据质量所用)表达式以及数据质量评估的结果(优、良、中、差)。
注:试验进行时,仅显示实时采集数据传入1s到10s内数据的数据质量,用户可自行设定显示传入数据的时间范围(10s以内)。对事后历史数据可展示全部数据的数据质量情况。
数据质量概要评价图,如图5。左侧为数据分布图,右侧显示所选数据的基本信息。数据质量概要评价表,如图6。
第二维度为详细评价,包含概要评价的“概要评价图”和“概要评价表”,另可向用户展示其所选数据的数据特征以及变化趋势图,用户可根据业务需求结合数据特点选择相应的可视化图形。
数据质量详细评价图,如图7:数据折线图显示的是0-0截面总压1(PT_01_1)的数据趋势(折线图)。左侧列出数据总数为513个,包含全部数据(包含了不符合数据质量计算判定逻辑的数据)的数据特征,用户可选特征有平均值、最大值、最小值、中位数、众数、标准差、方差。
另一数据质量详细评价图,如图8:数据折线图显示的是0-0截面总压1(PT_01_1)的数据趋势(折线图)及数据分布情况(柱状图)。左侧列出数据总数为426个,仅计算有效数据(不包含不符合数据质量计算判定逻辑的数据)的数据特征,用户可选特征有平均值、最大值、最小值、中位数、众数、标准差、方差。
从而,本发明通过数据质量对比智能分析,实现对同一组传感器中数据质量相对较差个体的筛选;数据质量突变智能分析,实现对同一组传感器中数据质量衰减速度相对较快个体的监测;试验测试数据过滤,实现对低质量或错误数据的自动化标识、过滤及处理;试验测试数据优化,实现数据处理软件中对被过滤的低质量或错误关键数据的自动化优化或替换;试验测试数据质量监测可视化,实现对数据质量总体状况、数据问题汇总情况和问题数据情况的可视化展示。
示例性装置
图9是本发明一示例性实施例提供的试验测试数据质量监测装置的结构示意图。如图9所示,装置900包括:
第一确定模块910,用于根据用户预先设定的分析特性结果以及业务逻辑确定测试数据的质量状态数据,其中质量状态数据包括低质量数据以及有效数据;
第二确定模块920,用于根据低质量数据的类型,确定优化方法,并通过优化方法对低质量数据进行优化,确定有效测试数据,其中有效测试数据包括有效数据以及优化后的低质量数据;
传输模块930,用于将有效测试数据以及测试数据传输至终端显示设备,终端显示设备用于显示有效测试数据以及测试数据的评价分析图。可选地,低质量数据包括缺失数据、异常数据、突变数据以及不规范数据,装置900还包括:打分模块,用于对不同类型的质量状态数据进行打分,确定不同类型质量状态数据的评分,其中评分用于指示质量状态数据的等级,并且打分模块,包括:第一确定子模块,用于根据有效数据在测试数据中的占比,确定有效数据的第一评分;第二确定子模块,用于根据缺失数据在测试数据中的占比,确定缺失数据的第二评分;第三确定子模块,用于根据异常数据在测试数据中的占比,确定异常数据的第三评分;第四确定子模块,用于根据突变数据在测试数据中的占比,确定突变数据的第四评分;第五确定子模块,用于根据不规范数据在测试数据中的占比,确定不规范数据的第五评分。
可选地,装置900还包括:第三确定模块,用于通过预先设置的门限检验法/特征对比算法对测试数据进行检测,确定异常数据的数据量。
可选地,装置900还包括:第四确定模块,用于通过预先设定的静态突变检测法/动态突变检测法对测试数据进行检测,确定突变数据的数据量。
可选地,装置900还包括:第五确定模块,用于根据预先设定的判定逻辑,对低质量数据进行警报提示,确定警报提示信息,其中警报提示信息包括预警值和报警值,并且判定逻辑包括大于预警上限、大于预警下限、大于报警上限、大于报警下限、大于预警上限并且下雨报警上限、大于预警下限并且小于报警下限、大于预警上限并且大于预警下限、大于报警上限并且大于报警下限、大于预警上限并且小于报警上限并且大于预警下限并且小于报警下限、大于预警上限并且大于报警上限并且大于预警下限并且大于报警下限。
可选地,装置900还包括:判定模块,用于通过预先设定的单通道判定方法/多通道判定方法/嵌入算法判定方法/触发判定方法,对测试数据进行判定,确定测试数据中的数据是否为低质量数据。
可选地,第二确定模块920,包括:第六确定子模块,用于确定低质量数据的参数类型,其中参数类型包括计算参数以及测量参数;第七确定子模块,用于确定参数类型的低质量数据类型,并根据低质量数据类型,确定优化方法,其中优化方法包括试前零位优化法、试后零位优化法、差值优化法、线性优化法、试后斜率优化法、插值算法、数据对齐、试验中数据补点。
可选地,评价分析图包括数据质量概要评价图、数据质量概要评价表以及数据质量详细评价图。
示例性电子设备
图10是本发明一示例性实施例提供的电子设备的结构。该电子设备可以是第一设备和第二设备中的任一个或两者、或与它们独立的单机设备,该单机设备可以与第一设备和第二设备进行通信,以从它们接收所采集到的输入信号。图10图示了根据本发明实施例的电子设备的框图。如图10所示,电子设备100包括一个或多个处理器101和存储器102。
处理器101可以是中央处理单元(CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备中的其他组件以执行期望的功能。
存储器102可以包括一个或多个计算机程序产品,所述计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。所述易失性存储器例如可以包括随机存取存储器(RAM)和/或高速缓冲存储器(cache)等。所述非易失性存储器例如可以包括只读存储器(ROM)、硬盘、闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器101可以运行所述程序指令,以实现上文所述的本发明的各个实施例的软件程序的对历史变更记录进行信息挖掘的方法以及/或者其他期望的功能。在一个示例中,电子设备还可以包括:输入装置103和输出装置104,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。
此外,该输入装置103还可以包括例如键盘、鼠标等等。
该输出装置104可以向外部输出各种信息。该输出装置104可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。
当然,为了简化,图10中仅示出了该电子设备中与本发明有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备还可以包括任何其他适当的组件。
示例性计算机程序产品和计算机可读存储介质
除了上述方法和设备以外,本发明的实施例还可以是计算机程序产品,其包括计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的对历史变更记录进行信息挖掘的方法中的步骤。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本发明实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
此外,本发明的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种实施例的对历史变更记录进行信息挖掘的方法中的步骤。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、系统或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本发明的基本原理,但是,需要指出的是,在本发明中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本发明的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本发明为必须采用上述具体的细节来实现。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明中涉及的器件、系统、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、系统、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
可能以许多方式来实现本发明的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本发明的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本发明的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本发明实施为记录在记录介质中的程序,这些程序包括用于实现根据本发明的方法的机器可读指令。因而,本发明还覆盖存储用于执行根据本发明的方法的程序的记录介质。
还需要指出的是,在本发明的系统、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本发明的等效方案。提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本发明。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本发明的范围。因此,本发明不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本发明的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (11)

1.一种试验测试数据质量监测方法,其特征在于,包括:
根据用户预先设定的分析特性结果以及业务逻辑确定测试数据的质量状态数据,其中所述质量状态数据包括低质量数据以及有效数据;
根据所述低质量数据的类型,确定优化方法,并通过所述优化方法对所述低质量数据进行优化,确定有效测试数据,其中所述有效测试数据包括所述有效数据以及优化后的所述低质量数据;
将所述有效测试数据以及所述测试数据传输至终端显示设备,所述终端显示设备用于显示所述有效测试数据以及所述测试数据的评价分析图。
2.根据权利要求1所述的方法,其特征在于,所述低质量数据包括缺失数据、异常数据、突变数据以及不规范数据,该方法还包括:
对所述不同类型的所述质量状态数据进行打分,确定不同类型所述质量状态数据的评分,其中所述评分用于指示所述质量状态数据的等级,并且
对所述不同类型的所述质量状态数据进行打分,确定不同类型所述质量状态数据的评分的操作,包括:
根据所述有效数据在所述测试数据中的占比,确定所述有效数据的第一评分;
根据所述缺失数据在所述测试数据中的占比,确定所述缺失数据的第二评分;
根据所述异常数据在所述测试数据中的占比,确定所述异常数据的第三评分;
根据所述突变数据在所述测试数据中的占比,确定所述突变数据的第四评分;
根据所述不规范数据在所述测试数据中的占比,确定所述不规范数据的第五评分。
3.根据权利要求2所述的方法,其特征在于,该方法还包括:
通过预先设置的门限检验法/特征对比算法对所述测试数据进行检测,确定所述异常数据的数据量。
4.根据权利要求2所述的方法,其特征在于,该方法还包括:
通过预先设定的静态突变检测法/动态突变检测法对所述测试数据进行检测,确定所述突变数据的数据量。
5.根据权利要求1所述的方法,其特征在于,该方法还包括:
根据预先设定的判定逻辑,对所述低质量数据进行警报提示,确定警报提示信息,其中所述警报提示信息包括预警值和报警值,并且所述判定逻辑包括大于预警上限、大于预警下限、大于报警上限、大于报警下限、大于预警上限并且下雨报警上限、大于预警下限并且小于报警下限、大于预警上限并且大于预警下限、大于报警上限并且大于报警下限、大于预警上限并且小于报警上限并且大于预警下限并且小于报警下限、大于预警上限并且大于报警上限并且大于预警下限并且大于报警下限。
6.根据权利要求1所述的方法,其特征在于,该方法还包括:
通过预先设定的单通道判定方法/多通道判定方法/嵌入算法判定方法/触发判定方法,对所述测试数据进行判定,确定所述测试数据中的数据是否为所述低质量数据。
7.根据权利要求1所述的方法,其特征在于,根据所述低质量数据的类型,确定优化方法的操作,包括:
确定所述低质量数据的参数类型,其中所述参数类型包括计算参数以及测量参数;
确定所述参数类型的低质量数据类型,并根据所述低质量数据类型,确定所述优化方法,其中所述优化方法包括试前零位优化法、试后零位优化法、差值优化法、线性优化法、试后斜率优化法、插值算法、数据对齐、试验中数据补点。
8.根据权利要求1所述的方法,其特征在于,所述评价分析图包括数据质量概要评价图、数据质量概要评价表以及数据质量详细评价图。
9.一种试验测试数据质量监测装置,其特征在于,包括:
第一确定模块,用于根据用户预先设定的分析特性结果以及业务逻辑确定测试数据的质量状态数据,其中所述质量状态数据包括低质量数据以及有效数据;
第二确定模块,用于根据所述低质量数据的类型,确定优化方法,并通过所述优化方法对所述低质量数据进行优化,确定有效测试数据,其中所述有效测试数据包括所述有效数据以及优化后的所述低质量数据;
传输模块,用于将所述有效测试数据以及所述测试数据传输至终端显示设备,所述终端显示设备用于显示所述有效测试数据以及所述测试数据的评价分析图。
10.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-8任一所述的方法。
11.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述权利要求1-8任一所述的方法。
CN202210762688.1A 2022-06-29 2022-06-29 一种试验测试数据质量监测方法 Pending CN115309957A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210762688.1A CN115309957A (zh) 2022-06-29 2022-06-29 一种试验测试数据质量监测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210762688.1A CN115309957A (zh) 2022-06-29 2022-06-29 一种试验测试数据质量监测方法

Publications (1)

Publication Number Publication Date
CN115309957A true CN115309957A (zh) 2022-11-08

Family

ID=83854508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210762688.1A Pending CN115309957A (zh) 2022-06-29 2022-06-29 一种试验测试数据质量监测方法

Country Status (1)

Country Link
CN (1) CN115309957A (zh)

Similar Documents

Publication Publication Date Title
CN108829535A (zh) 数据处理方法、终端及计算机可读存储介质
US20100076724A1 (en) Method for capturing and analyzing test result data
CN110059293B (zh) 基金估值数据的数据质量的确定方法、装置和服务器
CN114166988B (zh) 一种色谱仪集群故障检测方法及装置
KR102470763B1 (ko) 데이터 이상치 탐색 장치 및 방법
CN111860698B (zh) 确定学习模型的稳定性的方法和装置
US20170356889A1 (en) Three-dimensional spectral data processing device and processing method
CN108399115B (zh) 一种运维操作检测方法、装置及电子设备
Wu et al. A control chart for monitoring process mean based on attribute inspection
KR101281460B1 (ko) 통계적 공정 관리도를 이용하여 이상증후를 탐지하는 방법
EP3093770A2 (en) System and method for the creation and detection of process fingerprints for monitoring in a process plant
CN115309957A (zh) 一种试验测试数据质量监测方法
CN116611898B (zh) 一种基于电商平台的线上支付优化系统及方法
JP4500876B1 (ja) 生産管理システム
CN115378928B (zh) 基于云服务的监控方法及系统
US20140257752A1 (en) Analyzing measurement sensors based on self-generated calibration reports
CN116337135A (zh) 一种仪表故障诊断方法、系统、电子设备及可读存储介质
CN116127270A (zh) 异常检测方法、装置、设备、介质及产品
CN111401794A (zh) 一种基于近红外光谱的饲料品质控制方法
CN110226160B (zh) 状态分析装置、状态分析方法、以及存储介质
WO2003056300A2 (en) Systems and methods for automated quantitative analyses of digitized spectra
TW202230169A (zh) 異常診斷模型的建構方法、異常診斷方法、異常診斷模型的建構裝置及異常診斷裝置
CN108803467B (zh) 立式分离器运行状态的实时监测方法及系统
CN111767938A (zh) 一种异常数据检测方法、装置及电子设备
JP2007226639A (ja) 多変量データ判別装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination