CN117827947B - 采用可信边缘通道的工业设备语义数据分级管理存储方法 - Google Patents
采用可信边缘通道的工业设备语义数据分级管理存储方法 Download PDFInfo
- Publication number
- CN117827947B CN117827947B CN202311822335.7A CN202311822335A CN117827947B CN 117827947 B CN117827947 B CN 117827947B CN 202311822335 A CN202311822335 A CN 202311822335A CN 117827947 B CN117827947 B CN 117827947B
- Authority
- CN
- China
- Prior art keywords
- data
- equipment
- processing
- value
- principal component
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000003860 storage Methods 0.000 title claims abstract description 17
- 238000012545 processing Methods 0.000 claims abstract description 52
- 230000036541 health Effects 0.000 claims description 20
- 230000008569 process Effects 0.000 claims description 18
- 238000000586 desensitisation Methods 0.000 claims description 16
- 230000008859 change Effects 0.000 claims description 11
- 238000012847 principal component analysis method Methods 0.000 claims description 11
- 238000013507 mapping Methods 0.000 claims description 10
- 238000000547 structure data Methods 0.000 claims description 9
- 238000004140 cleaning Methods 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 5
- 238000000513 principal component analysis Methods 0.000 claims description 5
- 238000003745 diagnosis Methods 0.000 claims description 4
- 238000005538 encapsulation Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 description 15
- 238000007726 management method Methods 0.000 description 9
- 230000001133 acceleration Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 8
- 230000004044 response Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000012546 transfer Methods 0.000 description 5
- 230000003595 spectral effect Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- OWNRRUFOJXFKCU-UHFFFAOYSA-N Bromadiolone Chemical compound C=1C=C(C=2C=CC(Br)=CC=2)C=CC=1C(O)CC(C=1C(OC2=CC=CC=C2C=1O)=O)C1=CC=CC=C1 OWNRRUFOJXFKCU-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000005452 bending Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- NJPPVKZQTLUDBO-UHFFFAOYSA-N novaluron Chemical compound C1=C(Cl)C(OC(F)(F)C(OC(F)(F)F)F)=CC=C1NC(=O)NC(=O)C1=C(F)C=CC=C1F NJPPVKZQTLUDBO-UHFFFAOYSA-N 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004901 spalling Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Abstract
本发明公开了一种可信边缘通道的工业设备语义数据分级管理存储方法,属于多源异构数据处理技术领域。本发明通过设备数据进行语义结构的定义,在数据传输时,将携带具有语义结构的文件,接受者在收到数据后,根据语义文件能够快速的了解数据含义,加快工作效率,而且基于该存储方法,设计了一种可信资源的数据访问策略,保证数据所有者对共享数据的主权。
Description
技术领域
本发明涉及采用可信边缘通道的工业设备语义数据分级管理存储方法,属于多源异构数据处理技术领域。
背景技术
工业设备数据包括分布在工厂各个位置的控制设备、仪器仪表、传感器等设备的数据,这些数据可能属于设计、制造和管理等不同阶段,不同阶段的数据往往具有不同的含义和格式,形成异构数据源,通常这些异构数据之间存在着对应关系,这些异构数据在企业不同部门,企业与企业之间流通时,由于所需的经验知识不一样,工作人员往往无法快速理解数据含义,导致工作效率降低,甚至因为对数据的理解出错而导致生产事故。
另外,工业设备数据在企业不同部门,企业与企业之间流通时,存在安全威胁,如隐私泄露,数据篡改等问题,且现有的数据共享方案不能保证数据所有者的数据主权,当数据被发送出去时,就失去了对数据的物理控制权。
发明内容
为了解决目前工业设备数据存储流通过程中存在的问题,本发明提供了一种采用可信边缘通道的工业设备语义数据分级管理存储方法,该方法包括:
步骤1,实时采集设备运行状态数据x(ti),并设定对应的经验阈值;
步骤2,采用边缘计算系统对ti时刻传入的设备运行状态数据x(ti)构建语义结构数据,进而获得语义编码后的传感信号X(ti);
步骤3,边缘计算系统对X(ti)执行核心加密算法处理,生成设备核心数据Y(ti),并将Y(ti)存入原始数据库DB1;
步骤4,边缘计算系统对采集到的设备运行状态数据x(ti)执行运算处理,提取对应的统计特征值T(ti),并对统计特征值T(ti)进行主成分分析得到相应的健康指标值,将健康指标值与预先设定的经验阈值进行比较诊断,当健康指标值高于阈值时,边缘计算系统对X(ti)执行重要加密算法处理,生成设备重要数据G(ti),并将G(ti)存入故障数据库DB2;
步骤5,边缘计算系统对t1至tm时刻的设备运行状态数据x(ti)分别计算对应的统计特征值,构建设备生命周期序列TS={T(t1),T(t2),T(t3),……T(tm)},接着对TS对应的语义编码后的传感信号X(ti)进行数据清洗处理,以及脱敏处理得到脱敏数据Qs,对Qs采用一般加密算法处理,生成设备一般数据Ms,并将Ms存入脱敏数据库DB3,以便将设备一般数据Ms与外部企业进行数据交易。
可选的,所述步骤2包括:
步骤2.1,构建工业概念本体,并设计原始数据库;所述概念本体包括设备,人员,零件工具四类,每个本体包括若干实体,每个实体具有对象属性和数据属性;所述对象属性是指其与其他实体的关系,所述数据属性是指实体本身具有的特征;所述原始数据库中存储有每个实体对应的对象属性以及数据属性;
步骤2.2,确定工业概念本体与原始数据库的映射关系;
步骤2.3,根据映射关系为ti时刻的设备运行状态数据x(ti)构建语义结构数据,并进行json封装,定义为语义编码后的传感信号X(ti)。
可选的,所述方法在将设备一般数据Ms与外部企业进行数据交易时,包括:
步骤S1,将脱敏数据Qs创建为可信资源,为脱敏数据Qs创建resource offer作为数据载体,并为resource offer分配唯一的id;
步骤S2,创建数据访问策略,所述数据访问策略包括使用次数,使用时间,是否收费;
步骤S3,建立每个resource offer的id和数据访问策略的对应关系;
步骤S4,根据所述id,依照对应的数据访问策略访问resource offer中的数据。
可选的,所述步骤1中设定对应的经验阈值,包括:
设定数据处理周期Δt;
提取一个数据处理周期Δt内的设备运行状态数据x(ti)对应的统计特征值T(ti)={T1(ti),T2(ti),…,Tm(ti)},m为统计特征的种类数;
采用主成分分析方法对T(ti)进行分析以获取能够表征故障变化特征的q个统计特征作为主元特征,并设定对应的权重,q个主元特征记为Tp(ti),对应的权重记为ap,p=1,2,…,q;
根据下式计算数据处理周期Δt内设备运行状态数据序列对应的健康指标值HIt;
其中,Yp(ti)为采用采用主成分分析方法获取的能够表征故障变化特征的主元特征Tp(ti)对应的转换后的特征。
采用3σ原则确定各个经验阈值:
(|HIt-μ|>4a)&(|HIt-1-μ|>3σ)&(|HIt-2-μ|>3σ)
其中,
μ——0~t-3段设备运行状态数据序列的健康指标平均值;
σ——0~t-3段设备运行状态数据序列的健康指标标准偏差值。
可选的,所述步骤5中对TS进行数据清洗处理包括选择子集、列名重命名、删除重复值、缺失值处理、一致化处理、数据排序处理和异常值处理。
可选的,所述步骤5中一般加密算法为Base64算法。
可选的,所述步骤3中核心加密算法为非对称加密算法RSA。
可选的,所述步骤4中对X(ti)执行运算处理,提取对应的统计特征值T(ti),包括:
步骤4.1,获取数据处理周期Δt内采集到的设备运行状态数据x(ti);
步骤4.2,根据各统计特征公式,计算对应的统计特征值;
步骤4.3,存储计算得到的统计特征值T(ti)。
可选的,所述步骤4中重要加密算法为DES算法。
本申请还提供一种异构数据的分级管理存储方法,所述方法采用上述方法进行管理存储。
本发明有益效果是:
通过对工业设备数据进行语义结构的定义,在数据传输时,将携带具有语义结构的文件,接受者在收到数据后,根据语义文件能够快速的了解数据含义,加快工作效率,而且基于该存储方法,设计了一种可信资源的数据访问策略,保证数据所有者对共享数据的主权,进一步的,本申请给出了一种设定经验阈值的方法,针对不同的设备运行状态数据,采用主成分分析方法确定最能够反应故障特征的统计特征,从而获得更加准确的故障数据。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是采用边缘计算的工业设备语义数据分级管理存储模式的示意图。
图2是轴承运维数据本体模型图。
图3是工业设备数据的对象属性和数据属性示例图。
图4是轴承实例数据属性示例图。
图5是映射原理图。
图6A是RSA算法加密流程图。
图6B是RSA算法解密流程图。
图7是DES加密流程图。
图8是DES加密算法密钥迭代过程示意图。
图9是可信资源框架示意图。
图10是系统显示创建成功的资源载体offer响应示例图。
图11是系统显示创建成功的资源使用策略policy响应示例图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一:
本实施例提供一种采用可信边缘通道的工业设备语义数据分级管理存储方法,包括:
步骤1,实时采集设备运行状态数据x(ti),并设定对应的经验阈值;
设定对应的经验阈值时,首先设定数据处理周期Δt;
提取一个数据处理周期Δt内的设备运行状态数据x(ti)对应的统计特征值T(ti)={T1(ti),T2(ti),…,Tm(ti)},m为统计特征的种类数;
采用主成分分析方法对T(ti)进行分析以获取能够表征故障变化特征的q个统计特征作为主元特征,并设定对应的权重,q个主元特征记为Tp(ti),对应的权重记为ap,p=1,2,……,q;
根据下式计算数据处理周期Δt内设备运行状态数据序列对应的健康指标值HIt;
其中,Yp(ti)为采用采用主成分分析方法获取的能够表征故障变化特征的主元特征Tp(ti)对应的转换后的特征。
采用3σ原则确定各个经验阈值:
(|HIt-μ|>4σ)&(|HIt-1-μ|>3σ)&(|HIt-2-μ|>3σ)
其中,
μ——0~t-3段设备运行状态数据序列的健康指标平均值;
σ-0~t-3段设备运行状态数据序列的健康指标标准偏差值。
步骤2,采用边缘计算系统对ti时刻传入的设备运行状态数据x(ti)构建语义结构数据,进而获得语义编码后的传感信号X(ti),将语义编码后的传感信号X(ti)作为原始数据;
原始数据通常以键值对的形式保存。例如:
{
编号:GDZC_0001_202312150805
采集时间:2023-12-15 08:05
采集数据:x(ti)
采集设备:ZJJ_A001
}
步骤3,边缘计算系统对X(ti)执行核心加密算法处理,生成设备核心数据Y(ti),并将Y(ti)存入原始数据库DB1;
步骤4,边缘计算系统对采集到的设备运行状态数据x(ti)执行运算处理,提取对应的统计特征值T(ti),并对统计特征值T(ti)进行主成分分析得到相应的健康指标值,将健康指标值与预先设定的经验阈值进行比较诊断,当健康指标值高于阈值时,边缘计算系统对X(ti)执行重要加密算法处理,生成设备重要数据G(ti),并将G(ti)存入故障数据库DB2;
对X(ti)执行运算处理,提取对应的统计特征值T(ti)包括:
获取数据处理周期Δt内采集到的设备运行状态数据x(ti);
根据各统计特征公式,计算对应的统计特征值;
存储计算得到的统计特征值T(ti)。
本申请中所涉及的统计特征包括时域特征和频域特征,其中时域内的统计特征及对应的计算公式如下:
1、绝对均值(AM)
2、均方根(RMS)
3、方根幅值(SMR)
4、峰值(Peak)
Peak=max|xi|
5、偏斜度(Skewness)
6、峭度(Kurtosis)
7、方差(Var)
8、峭度指标(Kf)
9、峰值指标(C)
10、脉冲指标(If)
11、波形指标(Sf)
时域信号虽然能表现正常运行状态的总体趋势,但缺少细节信息,存在无法判断正常的故障类型,精密度低的问题。频域分析能够获取更详细的故障信息,信号经过傅里叶变换后,得到频谱中的频率组成以及各个频率的幅值大小。傅里叶变换的公式如公式所示。
假设轴承的原始振动信号为xi(i=1,2,……N),经过FFT变换后转换为频谱信号yk(k=1,2,…,M),M表示频谱信号的长度,rk为频率幅值,fk代表频率值。
频域内的统计特征包括:
1、频谱均值
2、频谱均方根(Rrms)
3、频谱值偏度(Fl)
4、频谱最大值(Rmax)
Rmax=max{r(t))
5、频谱最小值(Rmin)
Rmin=min{r(t)}
6、谱频率均方根(F3)
7、频谱值方差(σ2)
8、谱幅值方根幅值
步骤5,边缘计算系统对t1至tm时刻的设备运行状态数据x(ti)分别计算对应的统计特征值,构建设备生命周期序列TS={T(t1),T(t2),T(t3),……T(tm)},接着对TS对应的语义编码后的传感信号X(ti)进行数据清洗处理,以及脱敏处理得到脱敏数据Qs,对Qs采用一般加密算法处理,生成设备一般数据Ms,并将Ms存入脱敏数据库DB3,以便将设备一般数据Ms与外部企业进行数据交易。
实施例二:
本实施例提供一种采用可信边缘通道的工业设备语义数据分级管理存储方法,参见图1,所述方法包括:
步骤1,实时采集设备运行状态数据x(ti),并设定对应的经验阈值;
针对企业不同车间、不同型号工业设备的易损易耗故障部位,安装相应的传感器,实时采集设备运行状态数据x(ti),将ti时刻感知到的设备运行状态数据x(ti)传入边缘计算系统;x(ti)即表示ti时刻的设备运行状态数据。
部分传感器安装信息举例如下:
1)轴承座设备:安装加速度传感器,设定加速度经验阈值Zl;
2)齿轮箱设备:安装加速度传感器,设定加速度经验阈值Cl;
3)流量泵设备,安装流量传感器,设定流量经验阈值L1;
4)锅炉设备,安装温度传感器,设定温度经验阈值T1;
各个经验阈值设置包括:
设定数据处理周期Δt;
提取一个数据处理周期Δt内的设备运行状态数据x(ti)对应的统计特征值T(ti)={T1(ti),T2(ti),…,Tm(ti)},m为统计特征的种类数;统计特征时域特征和频域特征,其中时域内的统计特征包括:绝对均值(AM),均方根(RMS),方根幅值(SMR),峰值(Peak),偏斜度(Skewness),峭度(Kurtosis),方差(Var),峭度指标(Kf),峰值指标(C),波形指标(Sf)。
以上指标中,峭度指标,峰值指标,脉冲指标,波形指标表示无量纲指标,绝对均值,均方根,方根幅值,峰值,偏斜度,峭度等为有量纲指标。
频域内的统计特征包括:频谱均值频谱均方根(Rrms),频谱值偏度(Fl),频谱最大值(Rmax),频谱最小值(Rmin),谱频率均方根(F3),频谱值方差(σ2)和谱幅值方根幅值。
对所提特征进行分析,发现有若干特征并不能较好表达出设备的退化信息,且由于特征数量较多,造成数据冗余,故采用主成分分析法对特征进行降维,获取最能表达退化规律的主元特征作为健康指标HI。
采用主成分分析方法对上述时域特征和频域特征进行分析,获取能够表征故障变化特征的q个统计特征作为主元特征,设定对应的权重,q个作为主元特征记为Tp(ti),对应的权重记为ap,p=1,2,……,q;
具体的,主成分分析目的是把多个变量压缩为少数几个综合指标(称为主成分),使得综合指标能够包含原来的多个变量的主要的信息。主成分分析获取主元特征过程如下所示:
输入特征数据T={T1,T2,…,Tm}
1)去平均值,每一种输入的特征减去各自的平均值;
2)计算协方差
3)利用特征值分解方法求协方差的特征值和特征向量;
4)对协方差的特征值从大到小排序,选择其中最大的q个作为主元特征。然后将其对应的特征向量作为行向组成特征向量矩阵P;
5)将特征数据转换到q个特征向量构建的新空间中,得到转换后的特征向量,即Y=PT。
根据经验为转换到新空间中后的q个主元特征向量Yp(ti)设定相应的权重ap。
针对不同的数据,能够表征其故障变化特征的统计特征并不相同,比如均方根RMS可以衡量振动的强度,因此对轴承的表面裂纹较为敏感,能够反映轴承总体退化趋势。Peak可以较好反映轴承信号的冲击特征,对早期表面剥落较为敏感。Skewness用来衡量概率密度函数的对称度。Kurtosis可以描述轴承的故障程度,当Kurtosis=3时,轴承处于健康状态。当Kurtosis>3时,轴承发生故障。其余指标均能从不同方面表现正常的运行状态。
因此本申请采用主成分分析方法对上述统计特征进行分析以获取能够表征故障变化特征的q个统计特征,并根据经验设定对应的权重,q取值可由技术人员设定。
根据下式计算数据处理周期Δt内设备运行状态数据序列对应的健康指标值HIt;
其中,Yp(ti)为采用采用主成分分析方法获取的能够表征故障变化特征的主元特征Tp(ti)对应的转换后的特征。
采用3σ原则确定各个经验阈值:
(|HIt-μ|>4σ)&(|HIt-1-μ|>3σ)&(|HIt-2-μ|>3σ)
其中,
μ——0~t-3段设备运行状态数据序列的健康指标平均值;
σ-0~t-3段设备运行状态数据序列的健康指标标准偏差值。
步骤2,采用边缘计算系统对ti时刻传入的传感信号x(ti)构建语义结构数据,进而获得语义编码后的传感信号X(ti)。
由于接入边缘计算系统的数据源是多样的,采集到的数据可能包括振动信号,温度信号,流量信号等,这些信号数据的单位,结构都不一样,且来自不同地采集点。通常在边缘计算系统的数据还要包括通道类,数据源信息等,这些信息过于繁杂,通常需要专业人员来解释。
为了解决这一问题,本发明采用基于边缘计算技术对采集到的数据,以及这些数据所涉及到的领域知识进行分析,提取其概念,属性以及概念之间的关系,对该数据相关的资源进行集成描述,为数据的规则存储提供依据。本体是构建工业数据知识库的基础,能够以不同的方式存储不同的数据。本体之间的概念联系可以表示出数据相关领域之间的语义关系,通过对该语义的管理实现对企业数据领域知识的高效应用。
本发明基于边缘计算系统需预先构建概念本体和设计原始数据库,并建立二者的映射关系。以轴承座数据为例,提取的轴承振动数据相关的资源本体模型如图2所示。
如图2所示,将工业涉及到的资源抽象为设备,人员,零件,工具四个大类,每个大类列出了若干子类。每个本体包含若干个实体,如图2中前三列方块所示。对应得实体中存在许多实例,为节约空间,仅列出少许实例,如图2中最后一列方块所示。每个实体拥有对象属性和数据属性。对象属性是指它与其他实体的关系,比如图2中轴承所代表的实体的对象属性包括:被传感器监测,被安装在折弯机上等等。数据属性是指实体本身具有的特征,如名称,尺寸等信息。具体如图3所示,比如图2中的轴承的数据属性包括:转速,温度,尺寸,寿命等。
以轴承实体为例,在本体模型中,其中一个实例的数据属性如图4所示,数据属性包括了id为ZC_20231129,尺寸为20mm,材料为Q238,制造商为江南轴承制造厂,寿命为80,温度为40摄氏度等基本信息,对象属性包括该轴承所对应的加速度传感器是fz加速度传感器001,也即fz加速度传感器001所采集的数据为该轴承对应的加速度信息;还包括了其所在设备包括总装机等。
首先,为了方便保存,并在后续流程中再次使用,定义的本体模型将以OWL(OWL是用来描述资源描述框架RDF数据的,本质上是一些预定义词汇vocabulary构成的集合,用于对RDF进行类似的类定义及其属性的定义)或者XML的形式保存为只读文件,文件中每种类型的本体元素都有一个特定的URI用于标识;在轴承本体中,实体本体和操作本体具有不相交的关系,而诊断属于操作本体,轴承属于实体本体。
其次,进行原始数据库设计,利用D2RQ工具,方便地将原始数据库表映射为本体概念,映射规则为每个表对应一个实体,列名映射为实体属性,表数据对应一个实例。具体映射原理如图5所示。例如:轴承表对应轴承实体,轴承表中的字段名称:尺寸、温度、重量等对应轴承实体的数据属性,轴承表与设备表之间的关系对应实体之间的关系。
当ti时刻的传感信号x(ti)被采集进入边缘计算系统事件发生时,本发明的边缘计算系统中的概念本体与原始数据库的映射关系激活,进而在边缘计算系统中自动构建语义结构数据,并将语义结构数据进行json封装,定义为语义编码后的传感信号X(ti)。
以轴承实体数据为例,封装的规则如下:
步骤3:边缘计算系统对X(ti)执行核心加密算法处理,生成设备核心数据Y(ti),并将Y(ti)存入原始数据库DB1,由企业数据责任人进行数据库监管。当Y(ti)被企业数据责任人进行监管时,需要在接收方部署本体相关配置以及解密程序。
本发明采用图6A和图6B所示的RSA算法加解密流程来对设备核心数据进行加密。
RSA算法的步骤如下:
Step1产生密钥
选取两个大的素数p和q,p≠q。计算乘积
N=p×q
得到欧拉函数
选择随机整数e,使得且
计算
d为e的关于模的乘法逆元,满足
公钥为(e,n),私钥为(d,n)。
Step2加密信息
发送者通过下式来加密信息X(ti):
Y(ti)=X(ti)eMod(n)
其中Y(ti)是加密后产生的密文。
Step3解密信息
接收者通过下式来解密密文Y(ti):
X(ti)=Y(ti)dMod(n)
其中X(ti)是加密前的信息。
RSA算法的步骤中涉及到的符号和变量定义如下:
(1)模运算Mod
对于任意正整数n和整数x,存在整数r和t,使得x=tn+r,以模运算的形式呈现就是r=x Mod n。举个例子:假设x=15,n=7,根据x=tn+r,则15=2*7+1,所以t=2,r=1,又r=x Mod n,所以模运算的形式为15Mod 7=1。
(2)互素数GCD
假设t是两个整数n和x的公因数,存在表达式GCD(n,x)=t,表达式的含义是n和x的任意一个公因数一定是t的因数,如果GCD(n,x)=1,即t=1时,整数n和x称作互素数。
(3)欧拉函数
欧拉函数定义在正整数的范围内,函数的值等于0至n-1中与n互为素数的数的个数,称这一系列的正整数的个数为n的欧拉函数,记作欧拉定理:对于正整数n和x,有GCD(n,x)=1,即n和x的最大公约数是1,n和x为互素数,一定存在mod x,这里的称为欧拉函数,它是小于x并且与x互素数的个数,欧拉函数的另外一个等价公式为:
步骤4:边缘计算系统对采集到的设备运行状态数据x(ti)执行运算处理,提取对应的统计特征值T(ti),并将统计特征值T(ti)与对应的经验阈值进行比较诊断,当统计特征值T(ti)高于阈值时,边缘计算系统对设备运行状态数据x(ti)对应的X(ti)执行重要加密算法处理,生成设备重要数据G(ti),并将G(ti)存入故障数据库DB2,然后结合区块链技术自动将链上存证信息发布至企业共享云。设备所属的部门数据责任人通过企业共享云访问故障数据库DB2,当人工确诊tm=ti时刻故障时,将tm时刻故障标签计入原始数据库,当人工确诊ti时刻为伪故障时,则删除企业共享云中ti时刻对应的链上存证信息,并删除故障数据库中对应的加密数据G(ti)。
本发明采用图7所示的DES加密流程来对设备重要数据进行加密。DES算法的入口参数有三个:Key,Data,Mode。其中Key为8个字节共64位,是DES算法的工作密钥,其中有8位作为校验位,因此实际密钥位56位;Data也为8个字节,是要被加密或解密的数据;Mode为DES的工作方式,加密或解密。在通信网络的两端,双方约定一致的Key,在源点用DES加密,然后以密文的形式到达通信终点,再用Key对密文进行解密。
DES算法的步骤如下:
Step1子密钥的产生
将64位密钥进行密钥置换,不考虑每个字节的第8位,DES密钥由64位减到56位,56位密钥被分为两部分,前28位C0=K57K49………K52K44K36,后28位D0=K63K55……K20K12K4。接着,根据轮数i(取值为[1,16]整数),Ci和Di分别经历LSi循环左移1位或2位,按照表1中的左移动规则,共经历16次循环移动。经过循环左移得到的Ci和Di经过压缩置换后得到子密钥Ki。
表1左移动规则
Step2迭代过程
迭代过程将前一步得到的结果分为Li和Ri,设每轮加密密钥位Ki迭代过程如图8所示。其中,轮密钥Ki为48bit,轮输入为Ri-1为32bit,Ri-1首先被扩展为48bit,其中Ri-1的16bit各重复一次。扩展后的48bit再与子密钥Ki执行异或运算,然后通过一个加密函数F处理(功能是将6bit的数据变为4bit数据),产生一个32bit的输出。
Step3逆置换
经过16次迭代运算后,得到L16和R16,将此作为输入,进行逆置换,得到密文输出M。M表达式如下:
M=D1D2…………………D63D64
Step4解密处理
解密过程就是加密过程的逆过程,把初始换位表和最终换位表互换位置:第1次用子密钥K16,第2次用K15,以此类推,即可完成密文的解密。
步骤5:边缘计算系统对t1至tm时刻的设备运行状态数据x(ti)分别计算对应的统计特征值,构建设备生命周期序列TS={T(t1),T(t2),T(t3),……T(tm)},接着对TS完成7个步骤(选择子集、列名重命名、删除重复值、缺失值处理、一致化处理、数据排序处理和异常值处理)的数据清洗处理,以及进行去除敏感信息的脱敏处理得到数据Qs,再对Qs采用一般加密算法处理,生成设备一般数据Ms,并将Ms存入脱敏数据库DB3,最后,数据交易所对Ms进行资产确权后,上传至平台交易云,实现与外部企业的对接和数据交易。
根据设备运行状态数据x(ti)分别计算对应的统计特征值T(ti),具体的,根据上述时域特征和频域特征计算公式计算得到对应的统计特征值T(ti),进而构建得到设备生命周期序列TS={T(t1),T(t2),T(t3),……T(tm)},对TS完成7个步骤的数据清洗处理后,进行去除敏感信息的脱敏处理得到数据Qs,对Qs采用一般加密算法处理,生成设备一般数据Ms,并将Ms存入脱敏数据库DB3。
本发明采用一般加密算法Base64对清洗和脱敏后的设备一般数据进行加密。该算法属于比较简单的加密算法,适合保密强度不高的情况。
Base64算法的步骤如下:
Step1将给定的数据Qs以字符为单位,转换为对应的字符编码(ASCII);
Step2将获得的字符编码转换为二进制码;
Step3对获得的二进制编码做分组操作,每3个8位二进制码为一组,转换为每4个6位二进制码为一组(不足6位时低位补0);
Step4对获得的4-6二进制码补位,向6位二进制码添加2位高位0,组成4个8位二进制码;
Step5将获得的4-8二进制码转换为十进制码;
Step6将获得的十进制码转换为Base64字符表中对应字符的数据Ms;
Step7将加密之后的数据Ms存入脱敏数据库DB3,方便之后的交易传输。
在交易前,数据将会被创建为可信资源,以可信资源的方式共享的数据能够保证数据所有者的数据主权,其创建及交易过程如图9所示。
Step1创建resource offer作为数据的载体,创建的offer会有唯一的href id,例如:
在创建轴承所对应的资源载体后,在系统中会给出创建成功的响应,响应具体如图10所示。从图10可知,响应带有资源载体的基本属性,例如创建时间creationDate,标题title,描述description,等等,其中最重要的是该资源载体的唯一id,其存放在:
"_links":{
"self":{
"href":"https://localhost:8080/api/offers/619266ed-11b7-46b9-8033-4396f6a7b2e9"
},中,通过该id。可以在资源系统中搜索到该资源载体以获取对应的数据。
创建offer后,为了方便检索资源,创建catalog,并与offer建立链接。
Step2创建资源的contract
首先创建policy,policy是数据访问策略,包括使用次数,使用时间,是否收费等,通过不同的字符串来选择不同的使用规则。具体如下所示:
[CONNECTOR_RESTRICTED_USAGE,DURATION_USAGE,N_TIMES_USAGE,PROHIBIT_ACCESS,PROVIDE_ACCESS,PatternDesc,
SECURITY_PROFILE_RESTRICTED_USAGE,USAGE_DURING_INTERVAL,USAGE_LOGGING,USAGE_NOTIFICATION,USAGE_UNTIL_DELETION];
例如,在创建policy时选择"type":"N_TIMES_USAGE","value":"5",给出的响应如图11所示,"ids:constraint”给出了该policy所规定的使用限制策略,其rightPerand为5,代表该policy规定只能访问该资源5次。
创建contract,contrac是指在获取数据时需要通过协商该合同,双方达成一致后,才能获取到数据。Contract将与policy之后再将contract和对应的offer链接到一起。还有许多其他类型的限制,如使用时长限制:"type":"USAGE_DURING_INTERVAL","start":"2020-07-11T00:00:00Z","end":"2020-07-11T00:00:00Z"等。
Step3添加数据以及数据描述
Step2将offer和contract链接到一起后,就形成了一个完整的offer,但这个offer没有绑定任何数据,需要将我们需要交易的数据添加到offer中。
首先创建artifact,artifact中可以绑定所交易的数据,该数据可以是指定的value值,可以是url资源,也可是是数据库中的地址(需要指定sql访问语句)。
Artifact创建完成后,通过查找offer的href就能找到对应的数据了。
完成所有步骤后,在系统中更新offer,就能将offer共享至数据池中,接受者通过协商合同即可获取该offer中携带的数据。
本发明实施例中的部分步骤,可以利用软件实现,相应的软件程序可以存储在可读取的存储介质中,如光盘或硬盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种采用可信边缘通道的工业设备语义数据分级管理存储方法,其特征在于,所述方法包括:
步骤1,实时采集设备运行状态数据x(ti),并设定对应的经验阈值;
步骤2,采用边缘计算系统对ti时刻传入的设备运行状态数据x(ti)构建语义结构数据,进而获得语义编码后的传感信号X(ti);
步骤3,边缘计算系统对X(ti)执行核心加密算法处理,生成设备核心数据Y(ti),并将Y(ti)存入原始数据库DB1;
步骤4,边缘计算系统对采集到的设备运行状态数据x(ti)执行运算处理,提取对应的统计特征值T(ti),并对统计特征值T(ti)进行主成分分析得到相应的健康指标值,将健康指标值与预先设定的经验阈值进行比较诊断,当健康指标值高于阈值时,边缘计算系统对X(ti)执行重要加密算法处理,生成设备重要数据G(ti),并将G(ti)存入故障数据库DB2;
步骤5,边缘计算系统对t1至tm时刻的设备运行状态数据x(ti)分别计算对应的统计特征值,构建设备生命周期序列TS={T(t1),T(t2),T(t3),……T(tm)},接着对TS对应的语义编码后的传感信号X(ti)进行数据清洗处理,以及脱敏处理得到脱敏数据Qs,对Qs采用一般加密算法处理,生成设备一般数据Ms,并将Ms存入脱敏数据库DB3,以便将设备一般数据Ms与外部企业进行数据交易;
所述步骤1中设定对应的经验阈值,包括:
设定数据处理周期Δt;
提取一个数据处理周期Δt内的设备运行状态数据x(ti)对应的统计特征值T(ti)={T1(ti),T2(ti),…,Tm(ti)},m为统计特征的种类数;
采用主成分分析方法对T(ti)进行分析以获取能够表征故障变化特征的q个统计特征作为主元特征,并设定对应的权重,q个主元特征记为Tp(ti),对应的权重记为ap,p=1,2,…,q;
根据下式计算数据处理周期Δt内设备运行状态数据序列对应的健康指标值HIt;
其中,Yp(ti)为采用主成分分析方法获取的能够表征故障变化特征的主元特征Tp(ti)对应的转换后的特征;
采用3σ原则确定各个经验阈值:
(|HIt-μ|>4σ)&(|HIt-1-μ|>3σ)&(|HIt-2-μ|>3σ)
其中,
μ——0~t-3段设备运行状态数据序列的健康指标平均值;
σ——0~t-3段设备运行状态数据序列的健康指标标准偏差值。
2.根据权利要求1所述的方法,其特征在于,所述步骤2包括:
步骤2.1,构建工业概念本体,并设计原始数据库;所述概念本体包括设备,人员,零件工具四类,每个本体包括若干实体,每个实体具有对象属性和数据属性;所述对象属性是指其与其他实体的关系,所述数据属性是指实体本身具有的特征;所述原始数据库中存储有每个实体对应的对象属性以及数据属性;
步骤2.2,确定工业概念本体与原始数据库的映射关系;
步骤2.3,根据映射关系为ti时刻的设备运行状态数据x(ti)构建语义结构数据,并进行json封装,定义为语义编码后的传感信号X(ti)。
3.根据权利要求1所述的方法,其特征在于,所述方法在将设备一般数据Ms与外部企业进行数据交易时,包括:
步骤S1,将脱敏数据Qs创建为可信资源,为脱敏数据Qs创建resource offer作为数据载体,并为resource offer分配唯一的id;
步骤S2,创建数据访问策略,所述数据访问策略包括使用次数,使用时间,是否收费;
步骤S3,建立每个resource offer的id和数据访问策略的对应关系;
步骤S4,根据所述id,依照对应的数据访问策略访问resource offer中的数据。
4.根据权利要求1所述的方法,其特征在于,所述步骤5中对TS进行数据清洗处理包括选择子集、列名重命名、删除重复值、缺失值处理、一致化处理、数据排序处理和异常值处理。
5.根据权利要求1所述的方法,其特征在于,所述步骤5中一般加密算法为Base64算法。
6.根据权利要求1所述的方法,其特征在于,所述步骤3中核心加密算法为非对称加密算法RSA。
7.根据权利要求1所述的方法,其特征在于,所述步骤4中对X(ti)执行运算处理,提取对应的统计特征值T(ti),包括:
步骤4.1,获取数据处理周期Δt内采集到的设备运行状态数据x(ti);
步骤4.2,根据各统计特征公式,计算对应的统计特征值;
步骤4.3,存储计算得到的统计特征值T(ti)。
8.根据权利要求1所述的方法,其特征在于,所述步骤4中重要加密算法为DES算法。
9.一种异构数据的分级管理存储方法,其特征在于,所述方法采用权利要求1-8任一所述的方法进行管理存储。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311822335.7A CN117827947B (zh) | 2023-12-27 | 采用可信边缘通道的工业设备语义数据分级管理存储方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311822335.7A CN117827947B (zh) | 2023-12-27 | 采用可信边缘通道的工业设备语义数据分级管理存储方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117827947A CN117827947A (zh) | 2024-04-05 |
CN117827947B true CN117827947B (zh) | 2024-07-02 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178603A (zh) * | 2019-12-19 | 2020-05-19 | 重庆邮电大学 | 一种基于语义的工业生产设备预测性维护系统 |
CN114911870A (zh) * | 2022-05-26 | 2022-08-16 | 沈阳建筑大学 | 一种面向多源异构工业数据的融合管理架构 |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178603A (zh) * | 2019-12-19 | 2020-05-19 | 重庆邮电大学 | 一种基于语义的工业生产设备预测性维护系统 |
CN114911870A (zh) * | 2022-05-26 | 2022-08-16 | 沈阳建筑大学 | 一种面向多源异构工业数据的融合管理架构 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hussein et al. | A medical records managing and securing blockchain based system supported by a genetic algorithm and discrete wavelet transform | |
TWI719635B (zh) | 安全的特徵工程方法和裝置 | |
CN105122721B (zh) | 用于管理针对加密数据的托管安全计算的方法和系统 | |
KR101873946B1 (ko) | 난독 데이터 생성 | |
Ibaida et al. | Wavelet-based ECG steganography for protecting patient confidential information in point-of-care systems | |
Persohn et al. | Analyzing logistic map pseudorandom number generators for periodicity induced by finite precision floating-point representation | |
US8938067B2 (en) | Format preserving encryption methods for data strings with constraints | |
CN101436208B (zh) | 一种密文数据库隐私保护查询方法 | |
US20150288665A1 (en) | Secure Linkage Of Databases | |
Gupta et al. | An intelligent session key-based hybrid lightweight image encryption algorithm using logistic-tent map and crossover operator for internet of multimedia things | |
Fei et al. | {SEAL}: Storage-efficient causality analysis on enterprise logs with query-friendly compression | |
WO2016168027A1 (en) | Customized trusted computer for secure data processing and storage | |
Burattin et al. | Toward an anonymous process mining | |
CN115065555A (zh) | 一种信息安全处理方法、系统 | |
US10831919B2 (en) | Method for confidentially querying an encrypted database | |
CN110457929A (zh) | 异构his大数据实时加解密压缩上链的共享方法及系统 | |
Bhattacharjee et al. | Unified GPU technique to boost confidentiality, integrity and trim data loss in big data transmission | |
CN117827947B (zh) | 采用可信边缘通道的工业设备语义数据分级管理存储方法 | |
JP5228019B2 (ja) | 評価装置 | |
JP6266181B1 (ja) | 検索装置、監視システム、監視方法および検索プログラム | |
CN117827947A (zh) | 采用可信边缘通道的工业设备语义数据分级管理存储方法 | |
Sekar et al. | Secure IoT-enabled sharing of digital medical records: An integrated approach with reversible data hiding, symmetric cryptosystem, and IPFS | |
JP5415569B2 (ja) | 評価ユニット、評価方法、評価プログラム、及び記録媒体 | |
CN115580484A (zh) | 适用能耗数据的安全联合计算方法、系统及存储介质 | |
Huang et al. | Performance of finite precision on discrete Chaotic map based on a feedback shift register |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |