CN114021191B - 一种安全生产信息化敏感数据管理方法及系统 - Google Patents

一种安全生产信息化敏感数据管理方法及系统 Download PDF

Info

Publication number
CN114021191B
CN114021191B CN202111305339.9A CN202111305339A CN114021191B CN 114021191 B CN114021191 B CN 114021191B CN 202111305339 A CN202111305339 A CN 202111305339A CN 114021191 B CN114021191 B CN 114021191B
Authority
CN
China
Prior art keywords
track
production
sensitive
sales
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202111305339.9A
Other languages
English (en)
Other versions
CN114021191A (zh
Inventor
周晏平
尹俊
华国忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Antai Information Technology Development Co ltd
Original Assignee
Jiangsu Antai Information Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Antai Information Technology Development Co ltd filed Critical Jiangsu Antai Information Technology Development Co ltd
Priority to CN202111305339.9A priority Critical patent/CN114021191B/zh
Publication of CN114021191A publication Critical patent/CN114021191A/zh
Application granted granted Critical
Publication of CN114021191B publication Critical patent/CN114021191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种数据管理技术领域,公开了一种安全生产信息化敏感数据管理方法,包括:采集企业生产销售过程中的轨迹数据,并对所采集的轨迹敏感数据进行预处理;构建基于预处理后的轨迹敏感数据的轨迹知识图谱;依据所构建的轨迹知识图谱,自动识别生产销售轨迹中的敏感位置;对识别出的敏感位置进行自适用匿名处理。本发明通过建立企业生产销售的轨迹知识图谱,利用敏感位置识别算法识别轨迹知识图谱中的敏感位置,并利用自适用匿名处理方法为不同企业生产产品实现不同程度的隐私保护。本发明还提出一种安全生产信息化敏感数据管理系统。

Description

一种安全生产信息化敏感数据管理方法及系统
技术领域
本发明涉及数据管理的技术领域,尤其涉及一种安全生产信息化敏感数据管理方法及系统。
背景技术
随着智能定位系统诸如RFID,条形码,二维码之类的位置获取技术的日益普及,使得移动对象轨迹数据收集成为可能,轨迹数据挖掘也成为了数据挖掘领域中的一大分支。但基于企业生产的轨迹数据,攻击者能够根据企业生产的部分位置进行时空关联推测出企业的其他敏感位置信息,导致企业隐私的泄露。
传统轨迹数据的隐私保护方法要么将所有的位置信息都视为敏感信息,要么只单从位置标签或访问频率进行敏感位置的区分,以提高数据的效用性。然而,不同的位置对于不同的企业产品而言是具有不同敏感度的,若只考虑位置标签或访问频率,就会存在过保护和保护力度不够等情况。
鉴于此,如何对不同企业生产产品实现不同程度的隐私保护,成为本领域技术人员亟待解决的问题。
发明内容
本发明提供一种安全生产信息化敏感数据管理方法,目的在于(1)识别企业生产销售轨迹中的敏感位置;(2)为不同企业生产产品实现不同程度的隐私保护。
实现上述目的,本发明提供的一种安全生产信息化敏感数据管理方法,包括以下步骤:
S1:采集企业生产销售过程中的轨迹数据,并对所采集的轨迹敏感数据进行预处理;
S2:构建基于预处理后的轨迹敏感数据的轨迹知识图谱;
S3:依据所构建的轨迹知识图谱,自动识别生产销售轨迹中的敏感位置;
S4:对识别出的敏感位置进行自适用匿名处理。
作为本发明的进一步改进方法:
所述S1步骤中将企业的生产销售过程作为生产销售轨迹,包括:
将企业产品生产的生产销售过程作为产品的生产销售轨迹,所述生产销售轨迹中的轨迹点Pi={Ci,Mi,ti}表示产品在生产销售过程中的生产销售信息,其中Ci表示产品在时刻ti时的产品生产销售人员信息,Mi表示产品在时刻ti时的生产设备信息;所述生产销售轨迹中的轨迹片段为Pij={Cij,Mij,ti,tj},表示产品生产销售过程中的第ij个生产销售阶段,轨迹片段包含若干轨迹点,其中轨迹片段的轨迹始点为Pi,轨迹终点为Pj,Cij=(Ci,…,Cj)表示轨迹片段中不同轨迹点所对应时刻的产品生产销售人员信息,Mij=(Mi,…,Mj)表示轨迹片段中不同轨迹点所对应时刻的生产设备信息,ti表示轨迹片段的轨迹始点时刻,tj表示轨迹片段的轨迹终点时刻;
将连续的轨迹片段拼接为轨迹序列,所拼接得到的轨迹序列即为企业产品生产的生产销售轨迹。
所述S1步骤中采集企业生产销售轨迹中的轨迹敏感数据,包括:
根据所确定的不同产品的生产销售轨迹集合Lo={L1,L2,…,Li,…,LN},其中Li表示产品i的生产销售轨迹,N表示产品的总数,对于任意产品i,其生产销售轨迹序列为:
Figure BDA0003340000530000011
其中:
Li表示产品i的生产销售轨迹序列,由若干连续的轨迹片段组成,其中
Figure BDA0003340000530000012
表示以时刻
Figure BDA0003340000530000013
为起始点,时刻
Figure BDA0003340000530000014
为终点的轨迹片段;
Figure BDA0003340000530000015
表示轨迹片段中不同时刻所对应的产品生产销售人员信息;
Figure BDA0003340000530000021
表示轨迹片段中不同时刻所对应的生产设备信息;
根据生产销售轨迹集合Lo,获取不同产品生产销售轨迹中的轨迹敏感数据,所述轨迹敏感数据分为产品生产销售人员信息中的轨迹敏感数据以及生产设备信息中的轨迹敏感数据;所述产品生产销售人员信息包括产品生产销售人员的工号ID、职业、位置、执行生产销售流程的次数以及时间列表,其中产品生产销售人员信息中的轨迹敏感数据包括产品生产销售人员的工号ID、敏感位置、执行生产销售流程的次数以及时间列表;所述生产设备信息包括生产设备的型号、设备ID、位置、执行生产流程的次数以及时间列表,其中生产设备信息中的轨迹敏感数据包括生产设备的设备ID、执行生产流程的次数以及时间列表;
对于生产销售轨迹集合Lo中任意产品i的生产销售轨迹Li的轨迹敏感数据集合为:
Figure BDA0003340000530000022
Figure BDA0003340000530000023
其中:
Ci表示产品i的生产销售轨迹Li的产品生产销售人员轨迹敏感数据集合;
Mi表示产品i的生产销售轨迹Li的生产设备轨迹敏感数据集合;
Figure BDA0003340000530000024
表示生产销售轨迹中在ip时刻的第q种产品生产销售人员轨迹敏感数据值,q表示产品生产销售人员轨迹敏感数据的类别总数;
Figure BDA0003340000530000025
表示生产销售轨迹中在ip时刻的第w种生产设备轨迹敏感数据值,w表示生产设备轨迹敏感数据的类别总数。
所述S1步骤中对所采集的轨迹敏感数据进行预处理,包括:
根据所采集的轨迹敏感数据集合,对轨迹敏感数据集合进行预处理,所述预处理流程为:
使用SQL语句对所有轨迹敏感数据记录的主要字段进行查询,若存在空值,则使用手工方法对缺失数据进行填充;
采用统计的方法对轨迹敏感数据记录的关键字段排序,并采用相似度匹配算法对轨迹敏感数据记录进行检测,如果相邻轨迹敏感数据记录相似度大于所给定的阈值,即可认为此次记录重复,保留一条轨迹敏感数据记录,删除多余记录。
所述S2步骤中根据预处理后的轨迹敏感数据,构建轨迹知识图谱,包括:
根据预处理后的轨迹敏感数据,构建企业生产的生产销售轨迹知识图谱,所述生产销售轨迹知识图谱的构建流程为:
1)根据地图提供的API接口,将预处理后的轨迹敏感数据集中的每条轨迹映射到真实地图中;
2)从预处理后的轨迹敏感数据集中提取轨迹片段始点和终点数据,包括生产销售人员数据信息以及生产设备数据信息,所述生产销售人员数据信息包括生产销售人员的工号ID,工号ID与位置之间的关系,执行生产销售流程的次数以及对应的时间、位置信息,所述生产设备数据信息包括生产设备的设备ID,型号,设备ID与位置之间的关系,执行生产流程的次数以及对应的时间、位置信息;
在本发明一个具体实施例中,位置信息包括生产销售人员或生产销售设备的经纬度坐标以及位置在生产销售流程中被访问的次数;生产销售人员或生产销售设备与位置的关系标记为访问关系,即在生产销售流程中,生产销售人员或生产销售设备访问该位置的时间以及次数信息数据;
3)将所提取的轨迹片段始点和终点数据标记在映射地图中的轨迹片段始点和终点位置。
所述S3步骤中对于任意产品的生产销售轨迹,依据所构建的轨迹知识图谱,自动识别生产销售轨迹中的敏感位置,包括:
依据所构建的轨迹知识图谱,利用敏感位置识别算法识别出轨迹知识图谱的敏感位置,所述敏感位置识别算法为:
将时间段划分为常规时间段以及敏感时间段,其中敏感时间段为24:00-5:00,常规时间段为除敏感时间段的其余时间段,生产销售人员在敏感时间段内访问的生产设备位置即为敏感位置;
当生产销售人员在敏感时间段内访问的生产设备位置所对应的生产设备不为该生产销售人员所负责的生产设备时,所访问的生产设备位置即为敏感位置;
计算生产销售人员在常规时间访问位置x的次数n1以及该位置被访问的平均次数n2,若n1=2n2,则将位置x作为敏感位置;
生产销售人员的敏感位置信息即为轨迹知识图谱中的敏感位置,所述生产销售人员的敏感位置信息包括重要生产工厂、重要产品销售点。
所述S4步骤中对识别出的生产销售轨迹中的敏感位置进行自适用匿名处理,并将自适用匿名处理后的生产销售轨迹数据存储到生产信息管理数据库中,包括:
对于所识别得到的生产销售轨迹中的敏感位置,利用自适用匿名处理方法对敏感位置进行匿名处理,所述自适用匿名处理方法流程为:
1)将轨迹知识图谱中的部分真实位置信息作为背景信息e,其中部分真实位置信息为轨迹知识图谱中除敏感位置之外的β个位置信息,β<U/3,U表示轨迹知识图谱中的位置总数;
2)计算基于背景信息e估计出敏感位置的概率:
Figure BDA0003340000530000031
其中:
Q(e,Lo)表示生产销售轨迹集合Lo中包含背景信息e的轨迹数目;
Q(e→loci,h,e,Lo)表示生产销售轨迹集合Lo中包含背景信息e和敏感位置loci,h的轨迹数目;
loci,h表示产品i对应的第h个敏感位置的位置信息;
3)比较P(e→loci,h)与产品i的隐私容忍度ri的大小关系,若P(e→loci,h)>ri,则将产品i的敏感位置loci,h放置在候选匿名处理列表中;
4)对于候选匿名处理列表中的每个敏感位置loci,h,若生产销售轨迹集合Lo中包含该敏感位置的轨迹只有一条时,则直接在该轨迹中删除当前敏感位置,否则利用下式计算需要删除的敏感位置数目:
Figure BDA0003340000530000032
其中:
Q(e→loci,h)表示需要删除的敏感位置loci,h的数目;
loci,h表示产品i的敏感位置;
|Q(e∪e→loci,h,Lo)|表示生产销售轨迹集合Lo中包含当前背景信息e和敏感位置loci,h的轨迹数目;
Q(e,Lo)表示生产销售轨迹集合中包含背景信息e的轨迹数目;
ri表示产品i的隐私容忍度;
5)从生产销售轨迹集合Lo中选择包含敏感位置loci,h的Q(e→loci,h)条轨迹,并从所选择的Q(e→loci,h)条轨迹中删除敏感位置loci,h,直到P(e→loci,h)<ri
6)重复上述步骤,直到遍历完所有轨迹的敏感位置,并将自适用匿名处理后的生产销售轨迹数据存储到生产信息管理数据库中。
本发明还提出一种安全生产信息化敏感数据管理系统,其特征在于,所述系统包括:
敏感轨迹数据获取装置,用于采集企业生产销售过程中的轨迹数据;
数据处理器,用于对所采集的轨迹敏感数据进行预处理,并构建基于预处理后的轨迹敏感数据的轨迹知识图谱;
敏感数据匿名处理装置,用于基于所构建的轨迹知识图谱自动识别生产销售轨迹中的敏感位置,并对识别出的敏感位置进行自适用匿名处理。
相对于现有技术,本发明提出一种安全生产信息化敏感数据管理方法,该技术具有以下优势:
首先,本方案根据企业产品生产过程中的的轨迹敏感数据,构建企业生产的生产销售轨迹知识图谱,所述生产销售轨迹知识图谱的构建流程为:根据地图提供的API接口,将预处理后的轨迹敏感数据集中的每条轨迹映射到真实地图中;从预处理后的轨迹敏感数据集中提取轨迹片段始点和终点数据,包括生产销售人员数据信息以及生产设备数据信息,所述生产销售人员数据信息包括生产销售人员的工号ID,工号ID与位置之间的关系,执行生产销售流程的次数以及对应的时间、位置信息,所述生产设备数据信息包括生产设备的设备ID,型号,设备ID与位置之间的关系,执行生产流程的次数以及对应的时间、位置信息;将所提取的轨迹片段始点和终点数据标记在映射地图中的轨迹片段始点和终点位置。依据所构建的轨迹知识图谱,本方案利用敏感位置识别算法识别出轨迹知识图谱的敏感位置,所述敏感位置识别算法为:将时间段划分为常规时间段以及敏感时间段,其中敏感时间段为24:00-5:00,常规时间段为除敏感时间段的其余时间段,生产销售人员在敏感时间段内访问的生产设备位置即为敏感位置;当生产销售人员在敏感时间段内访问的生产设备位置所对应的生产设备不为该生产销售人员所负责的生产设备时,所访问的生产设备位置即为敏感位置;计算生产销售人员在常规时间访问位置x的次数n1以及该位置被访问的平均次数n2,若n1=2n2,则将位置x作为敏感位置;生产销售人员的敏感位置信息即为轨迹知识图谱中的敏感位置,所述生产销售人员的敏感位置信息包括重要生产工厂、重要产品销售点。相较于传统方法,本方案依据生产销售人员与生产设备的位置信息构建生产销售轨迹的知识图谱,并根据所构建的知识图谱确定企业生产销售轨迹中的敏感位置,实现敏感位置的识别。
同时,本方案提出一种自适用匿名处理方法,对所识别得到的生产销售轨迹中的敏感位置进行匿名处理,所述自适用匿名处理方法流程为:将轨迹知识图谱中的部分真实位置信息作为背景信息e,其中部分真实位置信息为轨迹知识图谱中除敏感位置之外的β个位置信息,β<U/3,U表示轨迹知识图谱中的位置总数;计算基于背景信息e估计出敏感位置的概率:
Figure BDA0003340000530000041
其中:Q(e,Lo)表示生产销售轨迹集合Lo中包含背景信息e的轨迹数目,Q(e→loci,h,e,Lo)表示生产销售轨迹集合Lo中包含背景信息e和敏感位置loci,h的轨迹数目,loci,h表示产品i对应的第h个敏感位置的位置信息;比较P(e→loci,h)与产品i的隐私容忍度ri的大小关系,若P(e→loci,h)>ri,则将产品i的敏感位置loci,h放置在候选匿名处理列表中,由于不同产品具有不同的隐私容忍度值,使得不同企业生产产品具有不同程度的隐私保护;对于候选匿名处理列表中的每个敏感位置loci,h,若生产销售轨迹集合Lo中包含该敏感位置的轨迹只有一条时,则直接在该轨迹中删除当前敏感位置,否则利用下式计算需要删除的敏感位置数目:
Figure BDA0003340000530000042
其中:Q(e→loci,h)表示需要删除的敏感位置loci,h的数目,loci,h表示产品i的敏感位置,|Q(e∪e→loci,h,Lo)|表示生产销售轨迹集合Lo中包含当前背景信息e和敏感位置loci,h的轨迹数目,Q(e,Lo)表示生产销售轨迹集合中包含背景信息e的轨迹数目,ri表示产品i的隐私容忍度;从生产销售轨迹集合Lo中选择包含敏感位置loci,h的Q(e→loci,h)条轨迹,并从所选择的Q(e→loci,h)条轨迹中删除敏感位置loci,h,直到P(e→loci,h)<ri;重复上述步骤,直到遍历完所有轨迹的敏感位置,并将自适用匿名处理后的生产销售轨迹数据存储到生产信息管理数据库中。本方案通过基于背景信息估计出敏感位置的概率,若该概率高于每个产品的隐私容忍度,则说明了解到部分位置信息有较大概率推测出企业产品生产销售轨迹中的敏感位置,从而对所构建的轨迹知识图谱中的敏感位置进行删除处理,且不同产品具有不同的隐私容忍度值,使得不同企业生产产品具有不同程度的隐私保护。
附图说明
图1为本发明一实施例提供的一种安全生产信息化敏感数据管理方法的流程示意图;
图2为本发明一实施例提供的一种安全生产信息化敏感数据管理系统的结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
S1:采集企业生产销售过程中的轨迹数据,并对所采集的轨迹敏感数据进行预处理。
所述S1步骤中将企业的生产销售过程作为生产销售轨迹,包括:
将企业产品生产的生产销售过程作为产品的生产销售轨迹,所述生产销售轨迹中的轨迹点Pi={Ci,Mi,ti}表示产品在生产销售过程中的生产销售信息,其中Ci表示产品在时刻ti时的产品生产销售人员信息,Mi表示产品在时刻ti时的生产设备信息;所述生产销售轨迹中的轨迹片段为Pij={Cij,Mij,ti,tj},表示产品生产销售过程中的第ij个生产销售阶段,轨迹片段包含若干轨迹点,其中轨迹片段的轨迹始点为Pi,轨迹终点为Pj,Cij=(Ci,…,Cj)表示轨迹片段中不同轨迹点所对应时刻的产品生产销售人员信息,Mij=(Mi,…,Mj)表示轨迹片段中不同轨迹点所对应时刻的生产设备信息,ti表示轨迹片段的轨迹始点时刻,tj表示轨迹片段的轨迹终点时刻;
将连续的轨迹片段拼接为轨迹序列,所拼接得到的轨迹序列即为企业产品生产的生产销售轨迹。
所述S1步骤中采集企业生产销售轨迹中的轨迹敏感数据,包括:
根据所确定的不同产品的生产销售轨迹集合Lo={L1,L2,…,Li,…,LN},其中Li表示产品i的生产销售轨迹,N表示产品的总数,对于任意产品i,其生产销售轨迹序列为:
Figure BDA0003340000530000051
其中:
Li表示产品i的生产销售轨迹序列,由若干连续的轨迹片段组成,其中
Figure BDA0003340000530000052
表示以时刻
Figure BDA0003340000530000053
为起始点,时刻
Figure BDA0003340000530000054
为终点的轨迹片段;
Figure BDA0003340000530000055
表示轨迹片段中不同时刻所对应的产品生产销售人员信息;
Figure BDA0003340000530000056
表示轨迹片段中不同时刻所对应的生产设备信息;
根据生产销售轨迹集合Lo,获取不同产品生产销售轨迹中的轨迹敏感数据,所述轨迹敏感数据分为产品生产销售人员信息中的轨迹敏感数据以及生产设备信息中的轨迹敏感数据;所述产品生产销售人员信息包括产品生产销售人员的工号ID、职业、位置、执行生产销售流程的次数以及时间列表,其中产品生产销售人员信息中的轨迹敏感数据包括产品生产销售人员的工号ID、敏感位置、执行生产销售流程的次数以及时间列表;所述生产设备信息包括生产设备的型号、设备ID、位置、执行生产流程的次数以及时间列表,其中生产设备信息中的轨迹敏感数据包括生产设备的设备ID、执行生产流程的次数以及时间列表;
对于生产销售轨迹集合Lo中任意产品i的生产销售轨迹Li的轨迹敏感数据集合为:
Figure BDA0003340000530000057
Figure BDA0003340000530000058
其中:
Ci表示产品i的生产销售轨迹Li的产品生产销售人员轨迹敏感数据集合;
Mi表示产品i的生产销售轨迹Li的生产设备轨迹敏感数据集合;
Figure BDA0003340000530000061
表示生产销售轨迹中在ip时刻的第q种产品生产销售人员轨迹敏感数据值,q表示产品生产销售人员轨迹敏感数据的类别总数;
Figure BDA0003340000530000062
表示生产销售轨迹中在ip时刻的第w种生产设备轨迹敏感数据值,w表示生产设备轨迹敏感数据的类别总数。
所述S1步骤中对所采集的轨迹敏感数据进行预处理,包括:
根据所采集的轨迹敏感数据集合,对轨迹敏感数据集合进行预处理,所述预处理流程为:
使用SQL语句对所有轨迹敏感数据记录的主要字段进行查询,若存在空值,则使用手工方法对缺失数据进行填充;
采用统计的方法对轨迹敏感数据记录的关键字段排序,并采用相似度匹配算法对轨迹敏感数据记录进行检测,如果相邻轨迹敏感数据记录相似度大于所给定的阈值,即可认为此次记录重复,保留一条轨迹敏感数据记录,删除多余记录。
S2:构建基于预处理后的轨迹敏感数据的轨迹知识图谱。
所述S2步骤中根据预处理后的轨迹敏感数据,构建轨迹知识图谱,包括:
根据预处理后的轨迹敏感数据,构建企业生产的生产销售轨迹知识图谱,所述生产销售轨迹知识图谱的构建流程为:
1)根据地图提供的API接口,将预处理后的轨迹敏感数据集中的每条轨迹映射到真实地图中;
2)从预处理后的轨迹敏感数据集中提取轨迹片段始点和终点数据,包括生产销售人员数据信息以及生产设备数据信息,所述生产销售人员数据信息包括生产销售人员的工号ID,工号ID与位置之间的关系,执行生产销售流程的次数以及对应的时间、位置信息,所述生产设备数据信息包括生产设备的设备ID,型号,设备ID与位置之间的关系,执行生产流程的次数以及对应的时间、位置信息;
在本发明一个具体实施例中,位置信息包括生产销售人员或生产销售设备的经纬度坐标以及位置在生产销售流程中被访问的次数;生产销售人员或生产销售设备与位置的关系标记为访问关系,即在生产销售流程中,生产销售人员或生产销售设备访问该位置的时间以及次数信息数据;
3)将所提取的轨迹片段始点和终点数据标记在映射地图中的轨迹片段始点和终点位置。
S3:依据所构建的轨迹知识图谱,自动识别生产销售轨迹中的敏感位置。
所述S3步骤中对于任意产品的生产销售轨迹,依据所构建的轨迹知识图谱,自动识别生产销售轨迹中的敏感位置,包括:
依据所构建的轨迹知识图谱,利用敏感位置识别算法识别出轨迹知识图谱的敏感位置,所述敏感位置识别算法为:
将时间段划分为常规时间段以及敏感时间段,其中敏感时间段为24:00-5:00,常规时间段为除敏感时间段的其余时间段,生产销售人员在敏感时间段内访问的生产设备位置即为敏感位置;
当生产销售人员在敏感时间段内访问的生产设备位置所对应的生产设备不为该生产销售人员所负责的生产设备时,所访问的生产设备位置即为敏感位置;
计算生产销售人员在常规时间访问位置x的次数n1以及该位置被访问的平均次数n2,若n1=2n2,则将位置x作为敏感位置;
生产销售人员的敏感位置信息即为轨迹知识图谱中的敏感位置,所述生产销售人员的敏感位置信息包括重要生产工厂、重要产品销售点。
S4:对识别出的敏感位置进行自适用匿名处理。
所述S4步骤中对识别出的生产销售轨迹中的敏感位置进行自适用匿名处理,并将自适用匿名处理后的生产销售轨迹数据存储到生产信息管理数据库中,包括:
对于所识别得到的生产销售轨迹中的敏感位置,利用自适用匿名处理方法对敏感位置进行匿名处理,所述自适用匿名处理方法流程为:
1)将轨迹知识图谱中的部分真实位置信息作为背景信息e,其中部分真实位置信息为轨迹知识图谱中除敏感位置之外的β个位置信息,β<U/3,U表示轨迹知识图谱中的位置总数;
2)计算基于背景信息e估计出敏感位置的概率:
Figure BDA0003340000530000071
其中:
Q(e,Lo)表示生产销售轨迹集合Lo中包含背景信息e的轨迹数目;
Q(e→loci,h,e,Lo)表示生产销售轨迹集合Lo中包含背景信息e和敏感位置loci,h的轨迹数目;
loci,h表示产品i对应的第h个敏感位置的位置信息;
3)比较P(e→loci,h)与产品i的隐私容忍度ri的大小关系,若P(e→loci,h)>ri,则将产品i的敏感位置loci,h放置在候选匿名处理列表中;
4)对于候选匿名处理列表中的每个敏感位置loci,h,若生产销售轨迹集合Lo中包含该敏感位置的轨迹只有一条时,则直接在该轨迹中删除当前敏感位置,否则利用下式计算需要删除的敏感位置数目:
Figure BDA0003340000530000072
其中:
Q(e→loci,h)表示需要删除的敏感位置loci,h的数目;
loci,h表示产品i的敏感位置;
|Q(e∪e→loci,h,Lo)|表示生产销售轨迹集合Lo中包含当前背景信息e和敏感位置loci,h的轨迹数目;
Q(e,Lo)表示生产销售轨迹集合中包含背景信息e的轨迹数目;
ri表示产品i的隐私容忍度;
5)从生产销售轨迹集合Lo中选择包含敏感位置loci,h的Q(e→loci,h)条轨迹,并从所选择的Q(e→loci,h)条轨迹中删除敏感位置loci,h,直到P(e→loci,h)<ri
6)重复上述步骤,直到遍历完所有轨迹的敏感位置,并将自适用匿名处理后的生产销售轨迹数据存储到生产信息管理数据库中。
发明还提供一种安全生产信息化敏感数据管理系统。参照图2所示,为本发明一实施例提供的安全生产信息化敏感数据管理系统的内部结构示意图。
在本实施例中,所述安全生产信息化敏感数据管理系统1至少包括敏感轨迹数据获取装置11、数据处理器12、敏感数据匿名处理装置13,通信总线14,以及网络接口15。
其中,敏感轨迹数据获取装置11可以是PC(Personal Computer,个人电脑),或者是智能手机、平板电脑、便携计算机等终端设备。
数据处理器12至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、磁性存储器、磁盘、光盘等。数据处理器12在一些实施例中可以是安全生产信息化敏感数据管理系统1的内部存储单元,例如该安全生产信息化敏感数据管理系统1的硬盘。数据处理器12在另一些实施例中也可以是安全生产信息化敏感数据管理系统1的外部存储设备,例如安全生产信息化敏感数据管理系统1上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,数据处理器12还可以既包括安全生产信息化敏感数据管理系统1的内部存储单元也包括外部存储设备。数据处理器12不仅可以用于存储安装于安全生产信息化敏感数据管理系统1的应用软件及各类数据,还可以用于暂时地存储已经输出或者将要输出的数据。
敏感数据匿名处理装置13在一些实施例中可以是一中央处理器(CentralProcessing Unit,CPU)、控制器、微控制器、微处理器或其他数据处理芯片,包括监控单元,用于运行数据处理器12中存储的程序代码或处理数据。
通信总线14用于实现这些组件之间的连接通信。
网络接口15可选的可以包括标准的有线接口、无线接口(如WI-FI接口),通常用于在该系统1与其他电子设备之间建立通信连接。
可选地,安全生产信息化敏感数据管理系统1还可以包括用户接口,用户接口可以包括显示器(Display)、输入单元比如键盘(Keyboard),可选的用户接口还可以包括标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在安全生产信息化敏感数据管理系统1中处理的信息以及用于显示可视化的用户界面。
图2仅示出了具有组件11-15以及安全生产信息化敏感数据管理系统1,本领域技术人员可以理解的是,图2示出的结构并不构成对安全生产信息化敏感数据管理系统1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
需要说明的是,上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。并且本文中的术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (6)

1.一种安全生产信息化敏感数据管理方法,其特征在于,所述方法包括:
S1:采集企业生产销售过程中的轨迹数据,并对所采集的轨迹敏感数据进行预处理;
S2:构建基于预处理后的轨迹敏感数据的轨迹知识图谱;
S3:依据所构建的轨迹知识图谱,自动识别生产销售轨迹中的敏感位置,其中所述依据所构建的轨迹知识图谱,自动识别生产销售轨迹中的敏感位置,包括:
依据所构建的轨迹知识图谱,利用敏感位置识别算法识别出轨迹知识图谱的敏感位置,所述敏感位置识别算法为:
将时间段划分为常规时间段以及敏感时间段,其中敏感时间段为24:00-5:00,常规时间段为除敏感时间段的其余时间段,生产销售人员在敏感时间段内访问的生产设备位置即为敏感位置;
当生产销售人员在敏感时间段内访问的生产设备位置所对应的生产设备不为该生产销售人员所负责的生产设备时,所访问的生产设备位置即为敏感位置;
计算生产销售人员在常规时间访问位置x的次数n1以及该位置被访问的平均次数n2,若n1=2n2,则将位置x作为敏感位置;
生产销售人员的敏感位置信息即为轨迹知识图谱中的敏感位置,所述生产销售人员的敏感位置信息包括重要生产工厂、重要产品销售点;
S4:对识别出的敏感位置进行自适用匿名处理。
2.如权利要求1所述的一种安全生产信息化敏感数据管理方法,其特征在于,所述S1步骤中企业生产销售过程中的轨迹数据,包括:
将企业生产销售过程中的轨迹数据作为产品的生产销售轨迹,所述生产销售轨迹中的轨迹点Pi={Ci,Mi,ti}表示产品在生产销售过程中的生产销售信息,其中Ci表示产品在时刻ti时的产品生产销售人员信息,Mi表示产品在时刻ti时的生产设备信息;所述生产销售轨迹中的轨迹片段为Pij={Cij,Mij,ti,tj},表示产品生产销售过程中的第ij个生产销售阶段,轨迹片段包含若干轨迹点,其中轨迹片段的轨迹始点为Pi,轨迹终点为Pj,Cij=(Ci,…,Cj)表示轨迹片段中不同轨迹点所对应时刻的产品生产销售人员信息,Mij=(Mi,…,Mj)表示轨迹片段中不同轨迹点所对应时刻的生产设备信息,ti表示轨迹片段的轨迹始点时刻,tj表示轨迹片段的轨迹终点时刻;
将连续的轨迹片段拼接为轨迹序列,所拼接得到的轨迹序列即为企业产品生产的生产销售轨迹。
3.如权利要求2所述的一种安全生产信息化敏感数据管理方法,其特征在于,所述S1步骤中采集企业生产销售轨迹中的轨迹敏感数据,包括:
根据所确定的不同产品的生产销售轨迹集合Lo={L1,L2,…,Li,…,LN},其中Li表示产品i的生产销售轨迹,N表示产品的总数,对于任意产品i,其生产销售轨迹序列为:
Figure FDA0003660684760000011
其中:
Li表示产品i的生产销售轨迹序列,由若干连续的轨迹片段组成,其中
Figure FDA0003660684760000012
表示以时刻
Figure FDA0003660684760000013
为起始点,时刻
Figure FDA0003660684760000014
为终点的轨迹片段;
Figure FDA0003660684760000015
表示轨迹片段中不同时刻所对应的产品生产销售人员信息;
Figure FDA0003660684760000016
表示轨迹片段中不同时刻所对应的生产设备信息;
根据生产销售轨迹集合Lo,获取不同产品生产销售轨迹中的轨迹敏感数据,所述轨迹敏感数据分为产品生产销售人员信息中的轨迹敏感数据以及生产设备信息中的轨迹敏感数据;
对于生产销售轨迹集合Lo中任意产品i的生产销售轨迹Li的轨迹敏感数据集合为:
Figure FDA0003660684760000021
Figure FDA0003660684760000022
其中:
Ci表示产品i的生产销售轨迹Li的产品生产销售人员轨迹敏感数据集合;
Mi表示产品i的生产销售轨迹Li的生产设备轨迹敏感数据集合;
Figure FDA0003660684760000023
表示生产销售轨迹中在ip时刻的第q种产品生产销售人员轨迹敏感数据值,q表示产品生产销售人员轨迹敏感数据的类别总数;
Figure FDA0003660684760000024
表示生产销售轨迹中在ip时刻的第w种生产设备轨迹敏感数据值,w表示生产设备轨迹敏感数据的类别总数。
4.如权利要求3所述的一种安全生产信息化敏感数据管理方法,其特征在于,所述S1步骤中对所采集的轨迹敏感数据进行预处理,包括:
根据所采集的轨迹敏感数据集合,对轨迹敏感数据集合进行预处理,所述预处理流程为:
使用SQL语句对所有轨迹敏感数据记录的主要字段进行查询,若存在空值,则使用手工方法对缺失数据进行填充;
采用统计的方法对轨迹敏感数据记录的关键字段排序,并采用相似度匹配算法对轨迹敏感数据记录进行检测,如果相邻轨迹敏感数据记录相似度大于所给定的阈值,即可认为此次记录重复,保留一条轨迹敏感数据记录,删除多余记录。
5.如权利要求4所述的一种安全生产信息化敏感数据管理方法,其特征在于,所述S2步骤中根据预处理后的轨迹敏感数据,构建轨迹知识图谱,包括:
根据预处理后的轨迹敏感数据,构建企业生产的生产销售轨迹知识图谱,所述生产销售轨迹知识图谱的构建流程为:
1)根据谷歌地图提供的API接口,将预处理后的轨迹敏感数据集中的每条轨迹映射到真实地图中;
2)从预处理后的轨迹敏感数据集中提取轨迹片段始点和终点数据,包括生产销售人员数据信息以及生产设备数据信息,所述生产销售人员数据信息包括生产销售人员的工号ID,工号ID与位置之间的关系,执行生产销售流程的次数以及对应的时间、位置信息,所述生产设备数据信息包括生产设备的设备ID,型号,设备ID与位置之间的关系,执行生产流程的次数以及对应的时间、位置信息;
3)将所提取的轨迹片段始点和终点数据标记在映射地图中的轨迹片段始点和终点位置。
6.如权利要求1所述的一种安全生产信息化敏感数据管理方法,其特征在于,所述S4步骤中对识别出的生产销售轨迹中的敏感位置进行自适用匿名处理,并将自适用匿名处理后的生产销售轨迹数据存储到生产信息管理数据库中,包括:
对于所识别得到的生产销售轨迹中的敏感位置,利用自适用匿名处理方法对敏感位置进行匿名处理,所述自适用匿名处理方法流程为:
1)将轨迹知识图谱中的部分真实位置信息作为背景信息e,其中部分真实位置信息为轨迹知识图谱中除敏感位置之外的β个位置信息,β<U/3,U表示轨迹知识图谱中的位置总数;
2)计算基于背景信息e估计出敏感位置的概率:
Figure FDA0003660684760000025
其中:
Q(e,Lo)表示生产销售轨迹集合Lo中包含背景信息e的轨迹数目;
Q(e→loci,h,e,Lo)表示生产销售轨迹集合Lo中包含背景信息e和敏感位置loci,h的轨迹数目;
loci,h表示产品i对应的第h个敏感位置的位置信息;
3)比较P(e→loci,h)与产品i的隐私容忍度ri的大小关系,若P(e→loci,h)>ri,则将产品i的敏感位置loci,h放置在候选匿名处理列表中;
4)对于候选匿名处理列表中的每个敏感位置loci,h,若生产销售轨迹集合Lo中包含该敏感位置的轨迹只有一条时,则直接在该轨迹中删除当前敏感位置,否则利用下式计算需要删除的敏感位置数目:
Figure FDA0003660684760000031
其中:
Q(e→loci,h)表示需要删除的敏感位置loci,h的数目;
loci,h表示产品i的敏感位置;
|Q(e∪e→loci,h,Lo)|表示生产销售轨迹集合Lo中包含当前背景信息e和敏感位置loci,h的轨迹数目;
Q(e,Lo)表示生产销售轨迹集合中包含背景信息e的轨迹数目;
ri表示产品i的隐私容忍度;
5)从生产销售轨迹集合Lo中选择包含敏感位置loci,h的Q(e→loci,h)条轨迹,并从所选择的Q(e→loci,h)条轨迹中删除敏感位置loci,h,直到P(e→loci,h)<ri
6)重复上述步骤,直到遍历完所有轨迹的敏感位置,并将自适用匿名处理后的生产销售轨迹数据存储到生产信息管理数据库中。
CN202111305339.9A 2021-11-05 2021-11-05 一种安全生产信息化敏感数据管理方法及系统 Active CN114021191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111305339.9A CN114021191B (zh) 2021-11-05 2021-11-05 一种安全生产信息化敏感数据管理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111305339.9A CN114021191B (zh) 2021-11-05 2021-11-05 一种安全生产信息化敏感数据管理方法及系统

Publications (2)

Publication Number Publication Date
CN114021191A CN114021191A (zh) 2022-02-08
CN114021191B true CN114021191B (zh) 2022-07-01

Family

ID=80061326

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111305339.9A Active CN114021191B (zh) 2021-11-05 2021-11-05 一种安全生产信息化敏感数据管理方法及系统

Country Status (1)

Country Link
CN (1) CN114021191B (zh)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015152820A1 (en) * 2014-03-31 2015-10-08 Agency For Science, Technology And Research Identification devices and identification methods
CN105760780B (zh) * 2016-02-29 2018-06-08 福建师范大学 基于路网的轨迹数据隐私保护方法
CN106940777B (zh) * 2017-02-16 2020-12-15 湖南宸瀚信息科技有限责任公司 一种基于敏感信息度量的身份信息隐私保护方法
CN108491731A (zh) * 2018-03-11 2018-09-04 海南大学 面向类型化资源的IoT环境下信息隐私保护方法
CN109165527B (zh) * 2018-08-28 2021-07-20 东北大学 支持个性化隐私的轨迹敏感数据保护方法
CN111353173B (zh) * 2020-03-11 2022-09-20 大连理工大学 一种使用图差分隐私模型的敏感标签轨迹数据发布方法
CN112163160B (zh) * 2020-10-12 2023-08-08 广西师范大学 基于知识图谱的敏感识别方法
CN113392227B (zh) * 2021-05-31 2024-04-19 交控科技股份有限公司 面向轨道交通领域的元数据知识图谱引擎系统

Also Published As

Publication number Publication date
CN114021191A (zh) 2022-02-08

Similar Documents

Publication Publication Date Title
CN110033018B (zh) 图形相似度判断方法、装置及计算机可读存储介质
US8645359B2 (en) Providing associations between objects and individuals associated with relevant media items
WO2019061994A1 (zh) 电子装置、保险产品推荐方法、系统及计算机可读存储介质
WO2019169768A1 (zh) 保险保单集中核单方法、电子装置及可读存储介质
US10489637B2 (en) Method and device for obtaining similar face images and face image information
CN114462412B (zh) 实体识别方法、装置、电子设备及存储介质
WO2021218312A1 (zh) 业务欺诈识别数据库的构建方法、装置和计算机设备
CN111428826A (zh) 资产防丢失防被盗监测管理方法、装置、设备及存储介质
CN111612610A (zh) 风险预警方法及系统、电子设备及存储介质
CN112581061A (zh) 一种基于人工智能的立体仓储管理方法及装置
CN113837030A (zh) 用于疫情防控的人员智能管控方法、系统及计算机设备
CN114550076A (zh) 区域异常行为监控方法、装置、设备及存储介质
CN114756669A (zh) 问题意图的智能分析方法、装置、电子设备及存储介质
CN114021191B (zh) 一种安全生产信息化敏感数据管理方法及系统
CN113128218A (zh) 一种关于招标信息的关键字段提取方法及装置
CN112560711A (zh) 非机动车交通违法判定方法、系统、装置及存储介质
Leema et al. Proposed prediction algorithms based on hybrid approach to deal with anomalies of RFID data in healthcare
CN113850260B (zh) 关键信息抽取方法、装置、电子设备及可读存储介质
CN113468948B (zh) 基于视图数据的治安防控方法、模块、设备及存储介质
CN114840660A (zh) 业务推荐模型训练方法、装置、设备及存储介质
CN114996386A (zh) 业务角色识别方法、装置、设备及存储介质
CN113285913A (zh) 基于智能锁的数据获取方法、系统、电子设备及存储介质
CN208110672U (zh) 图书馆借阅系统
CN110634044A (zh) 园区用户行为分析方法、装置、计算机设备以及存储介质
CN114201533B (zh) 车辆涉水深度检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant