CN114372098A - 基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法 - Google Patents

基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法 Download PDF

Info

Publication number
CN114372098A
CN114372098A CN202210007400.XA CN202210007400A CN114372098A CN 114372098 A CN114372098 A CN 114372098A CN 202210007400 A CN202210007400 A CN 202210007400A CN 114372098 A CN114372098 A CN 114372098A
Authority
CN
China
Prior art keywords
data
module
user
subsystem
management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210007400.XA
Other languages
English (en)
Inventor
王晋
刘畅
田里
周亮
王捷
徐江珮
喻潇
龙凤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Hubei Electric Power Co Ltd
Original Assignee
State Grid Corp of China SGCC
Electric Power Research Institute of State Grid Hubei Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Corp of China SGCC, Electric Power Research Institute of State Grid Hubei Electric Power Co Ltd filed Critical State Grid Corp of China SGCC
Priority to CN202210007400.XA priority Critical patent/CN114372098A/zh
Publication of CN114372098A publication Critical patent/CN114372098A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/64Protecting data integrity, e.g. using checksums, certificates or signatures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Databases & Information Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Security & Cryptography (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Bioethics (AREA)
  • Primary Health Care (AREA)
  • Water Supply & Treatment (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Public Health (AREA)
  • Computer Hardware Design (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Storage Device Security (AREA)

Abstract

本申请涉及一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法,该平台包括特权账号管理子系统、调试环境工作台、运行环境工作台、敏感数据发现与可视化分析子系统和数据安全管控与审计子系统,调试环境工作台与特权账号管理子系统连接,调试环境工作台、运行环境工作台、敏感数据发现与可视化分析子系统、第一数据安全管控与审计子系统和调试环境工作台依次连接,运行环境工作台和第二数据安全管控与审计子系统连接。运用该平台可在保证不降低电力数据中台数据挖掘价值的情况下,充分保护电力数据中台隐私数据,从而实现电力数据中台数据共享,具有极高的应用价值且可有效防止由特权账号导致的敏感数据泄露。

Description

基于特权账号管理对电力数据中台隐私数据保护与数据挖掘 平台及方法
技术领域
本申请涉及隐私数据保护与数据挖掘技术领域,具体涉及一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法。
背景技术
目前数据隐私保护和数据挖掘效用存在巨大矛盾:前者着眼数据脱敏,以防止隐私泄露和二次分发;后者着眼全面开放共享,以充分挖掘数据价值。该矛盾严重制约了大数据产业的发展。
随着大数据和人工智能产业的发展,数据泄露事件层出不穷。2018年3月,剑桥分析公司通过一个应用程序非法收集和分析8700万Facebook用户数据,进而影响了美国政局的走向。今年9月,厄瓜多尔数据泄露事件总共包含大约2080万个用户记录,几乎涵盖该国家总人口数。面对频发的严重数据泄露事件,各国都逐步推出了严厉的数据安全和隐私保护法律法规。以欧盟在2018年5月25日开始实施的《通用数据保护条例》(General DataProtection Regulation,GDPR)为例,GDPR旨在保护用户的个人隐私和数据安全,它要求经营者用清晰、明确的语言来表述自己的用户协议,并且允许用户执行数据被遗忘的权利,即用户可以要求经营者删除其个人数据并且停止利用其数据进行建模,而违背该条例的企业将会面临巨额罚款。
针对数据安全问题,诸多学者进行了深入研究并提出了多种解决方案:(1)匿名算法:数据发布匿名是匿名技术在数据发布中的应用,在确保所发布的信息数据公开可用的前提下,隐藏公开数据记录与特定个人之间的对应联系,从而保护个人隐私。常见的匿名算法有K匿名、l-多样性、t-closeness等。然而匿名算法存在的最大问题是安全性不足,通过关联多种数据可推测出原始数据信息。例如2006年,美国最大的影视公司之一Netflix举办了一个预测算法的比赛,比赛要求在公开数据上推测用户的电影评分。但是在2007年,来自The University of Texas at Austin的两位研究人员表示通过关联Netflix公开的数据和IMDb(互联网电影数据库)网站上公开的纪录就能够识别出匿名后用户的身份。(2)同态加密:Rivest R L等学者提出的同态加密算法可以允许人们对密文进行特定的运算,而其运算结果解密后与用明文进行相同运算所得的结果一致。然而,全同态加密难以实现,导致复杂算法(神经网络等)难以应用同态加密。更重要的是,同态加密带来了巨大的计算开销,其性能瓶颈使得无法实际应用。尽管它的性能还在不断改善,但相较于业务可接受的标准来说,当前的处理速度很难满足实际业务需求。(3)联邦学习:联邦学习最开始是由Google在2017年提出,用于解决保护隐私数据下的机器学习问题。联邦学习体系架构中数据不流出本地,而是将本地计算的模型参数上传。联邦学习中,每一个数据节点(Data Shards)维护一个模型的复制,整体的模型在参数服务器(Parameter Server)上;数据节点利用各自数据训练模型,得到参数的更新值Δw,并将Δw上传到参数服务器。参数服务器综合所有的Δw运算出新的梯度w'并下发给所有的数据节点。但联邦学习需要各个数据节点提供相当的算力以分别训练模型,且如何根据各个节点上传的参数更新模型尚需要进一步深入研究。
电力数据中台定位于为电力各专业、各单位提供数据共享服务。以需求为导向,以电力全业务统一数据中心为基础,根据分析应用需求,有针对性的开展数据接入与整合,逐步实现电网、产业、金融、国际化等各板块数据融通,实现人员、组织、客户、供应商等企业级主数据共建共享,有效支撑各类分析应用场景构建,沉淀形成高价值的数据服务。在电力数据中台数据对外共享时,存在特权账号导致的敏感数据泄露、隐私数据保护与数据挖掘工作矛盾等问题。
因此,亟需一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法。
发明内容
本申请实施例的目的在于提供一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法,为解决电力数据中台隐私数据保护与数据挖掘价值无法兼顾,以及特权账号导致敏感数据泄露的问题。
为实现上述目的,本申请提供如下技术方案:
第一方面,本申请实施例提供一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,所述基于特权账号管理的隐私数据保护与数据挖掘平台包括特权账号管理子系统、调试环境工作台、运行环境工作台、敏感数据发现与可视化分析子系统、第一数据安全管控与审计子系统以及第二数据安全管控与审计子系统;
所述调试环境工作台与所述特权账号管理子系统连接,以用于验证使用者身份,所述调试环境工作台、所述运行环境工作台、所述敏感数据发现与可视化分析子系统、第一数据安全管控与审计子系统和所述调试环境工作台依次连接,以用于所述调试环境工作台获取样本数据进行数据挖掘;
所述运行环境工作台和第二数据安全管控与审计子系统连接,以用于对输出结果或模型进行安全管控和审计;
其中,所述特权账号管理子系统包括:身份认证管理模块,用于验证使用者的身份;
数据资源管理模块,用于以IP为唯一标识符,对数据共享中的数据资源、数据库进行管理;
账号统一管理模块,用于在账号的全生命周期管理中,对账号进行统建、统删、统验和统改;
安全扫描模块,用于一键扫描风险账号,并根据扫描结果自动生成风险趋势图;
特权账号流程审批模块,以用于对所有特权账号的操作进行审核。
所述身份认证模块验证使用者身份的方式包括:静态口令、动态口令、LDAP、AD域认证、密码强度、密码有效期、口令尝试死锁、用户激活、电力统一权限管理系统和特权数据访问用户分组管理;
所述数据资源管理模块对数据管理的方式包括:分类统计和分组管理;
所述账号统一管理模块对账号管理的方式包括:快速查询机制、账号定位、密码自动修改、密码策略自定义、账号操作记录、密码历史版本保留和一次性密码策略;
所述特权账号流程审批模块对特权账号的管理方式包括:集中审批和审批状态分类。
述调试环境工作台设置在数据使用方,所述运行环境工作台设置在电力数据中台,以用于保护隐私数据及数据安全。
所述电力数据中台拥有的数据库不少于两个,所述运行环境工作台包括多方安全计算模块,以用于对不同的数据库进行融合;
其中,所述多方安全计算模块包括隐私保护机制和预处理机制,所述隐私保护机制用于保护融合数据,所述预处理机制用于剔除异常数据。
所述敏感数据发现与可视化分析子系统包括:
数据资产发现模块,用于自动发现数据库的分布位置以及数据库中的数据资产,并基于端口扫描和登录扫描的方式完成对数据库基本属性、数据库数据结构、敏感数据的存储分布状况的信息采集;
数据资产管理模块,用于管理所述数据资产发现模块发现的数据;
智能敏感数据识别模块,用于对所述数据资产发现模块发现的数据进行自动的分类分级;
敏感数据地图构建与可视化模块,用于使敏感数据分布可视化,并形成敏感数据地图。
所述智能敏感数据识别模块识别所述数据资产发现模块发现的数据的模式包括预定义模式、专家自定义模式和相似数据发现模式。
所述智能敏感数据识别模块识别的敏感数据包括姓名、电话号码、邮箱,身份证号码、银行卡号和住址。
所述第一数据安全管控与审计子系统和第二数据安全管控与审计子系统均包括:
数据置换模块,用于对结构化数据库和非结构化数据库进行数据置换;
数据访问控制模块,用于管控用户的数据访问权限;
操作留痕审计模块,用于对所有的用户数据进行全生命周期的日志记录,并针对用户行为记录进行风险分析与识别;
结果申报审核模块,用于审核所有流出的结果/模型。
所述数据置换模块对结构化数据库和非结构化数据库进行数据置换的策略包括保留原始数据的数据项和表结构、保留原始数据的数据属性和关联关系,以用于在不丧失数据挖掘价值的基础上,保护隐私数据及数据安全。
另一方面,本申请实施例提供一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘方法,该方法采用如上所述的基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台实施,该方法包括:
数据使用方用户登录所述特权账号管理子系统;
所述特权账号管理子系统对用户身份进行验证,验证成功后,进入所述调试环境工作台准备进行数据挖掘;
根据用户数据挖掘需要,从所述运行环境工作台的全量数据中抽取样本数据,接着样本数据依次经所述敏感数据发现与可视化分析子系统和第一数据安全管控与审计子系统处理后,发送至所述调试环境工作台存储;
用户根据样本数据编写并调试程序/代码,调试完成后将程序/代码发送至所述运行环境工作台对全量数据进行挖掘,并生成结果/模型;
当用户不需要带走生成的结果/模型时,数据挖掘完成;
当用户需要带走生成的结果/模型时,生成的结果/模型经第二数据安全管控与审计子系统处理后,发送至数据使用方用户,数据挖掘完成。
与现有技术相比,本发明的有益效果是:
根据上述技术方案,基于该基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法,在实际应用过程中,数据使用方用户登录特权账号管理子系统,特权账号管理子系统通过多种验证方式对用户身份进行验证,验证成功后,进入调试环境工作台准备进行数据挖掘,根据用户的挖掘任务需要,从运行环境工作台的全量数据中抽取样本数据,接着样本数据依次经所述敏感数据发现与可视化分析子系统和第一数据安全管控与审计子系统处理后,发送至调试环境工作台存储,用户根据样本数据编写并调试程序/代码,在调试完成后将程序/代码发送至运行环境工作台对全量数据进行挖掘,并生成结果/模型,若用户需要结果/模型,则生成的结果/模型经第二数据安全管控与审计子系统处理后,发送至数据使用方用户,数据挖掘完成。可在保证不降低数据挖掘价值的情况下,充分保护隐私数据,从而实现数据共享,具有极高的应用价值,且可以有效避免外部攻击者及内部恶意破坏者利用泄露的特权账号对敏感数据进行窃取。
同时,通过特权账号管理子系统的身份认证管理模块,验证使用者身份;数据资源管理模块,对数据共享中的数据资源、数据库进行管理;账号统一管理模块,在账号的全生命周期管理中,对账号进行统建、统删、统验和统改;安全扫描模块,一键扫描风险账号,并根据扫描结果自动生成风险趋势图;特权账号流程审批模块,对所有特权账号的操作进行审核;有效防止了外部攻击者及内部恶意破坏者利用泄露的特权账号对敏感数据进行窃取。
通过调试环境工作台设置在数据使用方,运行环境工作台设置在数据拥有方(电力数据中台),数据使用方只获取样本数据,避免了现有技术中采用数据脱敏、匿名算法、差分隐私、同态加密等技术对全量数据进行处理后,发送至数据使用方,导致数据分析价值降低及数据隐私泄露。
通过运行环境工作台包括多方安全计算模块,可对不同数据库进行融合,极大的提高了数据挖掘的范围,再通过多方安全计算模块包括预处理机制,以用于剔除异常数据,极大的提高了数据挖掘的准确性。
通过数据置换模块对结构化数据库和非结构化数据库进行数据置换的策略包括:保留原始数据的数据项和表结构、保留原始数据的数据属性和关联关系,使数据在不丧失挖掘价值的基础上,保护了隐私数据及数据安全。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台的示意图;
图2是基于特权账号管理对电力数据中台隐私数据保护与数据挖掘方法的流程图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
术语“第一”、“第二”等仅用于将一个实体或者操作与另一个实体或操作区分开来,而不能理解为指示或暗示相对重要性,也不能理解为要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
本发明第一方面提供了一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,如图1所示,该基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台包括特权账号管理子系统、调试环境工作台、运行环境工作台、敏感数据发现与可视化分析子系统、第一数据安全管控与审计子系统以及第二数据安全管控与审计子系统;
所述调试环境工作台与所述特权账号管理子系统连接,以用于验证使用者身份,所述调试环境工作台、所述运行环境工作台、所述敏感数据发现与可视化分析子系统、第一数据安全管控与审计子系统和所述调试环境工作台依次连接,以用于所述调试环境工作台获取样本数据进行数据挖掘;
所述运行环境工作台和第二数据安全管控与审计子系统连接,以用于对输出结果或模型进行安全管控和审计;
其中,所述特权账号管理子系统包括:身份认证管理模块,用于验证使用者的身份;
数据资源管理模块,用于以IP为唯一标识符,对数据共享中的数据资源、数据库进行管理;
账号统一管理模块,用于在账号的全生命周期管理中,对账号进行统建、统删、统验和统改;
安全扫描模块,用于一键扫描风险账号,并根据扫描结果自动生成风险趋势图;
特权账号流程审批模块,以用于对所有特权账号的操作进行审核。
根据上述技术方案,基于该基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,在实际应用过程中,数据使用方用户登录特权账号管理子系统,特权账号管理子系统通过多种方式对用户身份进行验证,验证成功后,进入调试环境工作台准备进行数据挖掘,根据用户的挖掘任务需要,从运行环境工作台的全量数据中抽取样本数据,接着样本数据依次经所述敏感数据发现与可视化分析子系统和第一数据安全管控与审计子系统处理后,发送至调试环境工作台存储,用户根据样本数据编写并调试程序/代码,在调试完成后将程序/代码发送至运行环境工作台对全量数据进行挖掘,并生成结果/模型,若用户需要结果/模型,则生成的结果/模型经第二数据安全管控与审计子系统处理后,发送至数据使用方用户,数据挖掘完成。可在保证不降低电力数据中台数据挖掘价值的情况下,充分保护电力数据中台隐私数据,从而实现数据共享,具有极高的应用价值,且可以有效避免外部攻击者及内部恶意破坏者利用泄露的特权账号对敏感数据进行窃取。
根据一种优选的实施方式,所述身份认证模块验证使用者身份的方式包括:静态口令、动态口令、LDAP、AD域认证、密码强度、密码有效期、口令尝试死锁、用户激活和特权数据访问用户分组管理;
所述数据资源管理模块对数据管理的方式包括:分类统计和分组管理;
所述账号统一管理模块对账号管理的方式包括:快速查询机制、账号定位、密码自动修改、密码策略自定义、账号操作记录、密码历史版本保留和一次性密码策略;
所述特权账号流程审批模块对特权账号的管理方式包括:集中审批和审批状态分类。
在本发明实施例中,所述身份认证管理模块的主要作用为:确保只有合法数据需求方才能访问其拥有权限的数据源,从而解决系统中普遍存在的数据交叉访问而无法定位到具体人的问题,具体验证使用者身份的措施包括:静态口令、动态口令、LDAP、AD域认证方式、密码强度、密码有效期、口令尝试死锁、用户激活和特权数据访问用户分组管理。
所述数据资源管理模块的主要作用为:以IP作为唯一标识符,对数据共享中的数据资源、数据库等进行统一集中化的管理,具体包括:分类统计,对数据资产有总体的概念;灵活的分组管理,提高管理的效率。
所述账号统一管理模块的主要作用为:提供账号的直观视角,通过账号的关键属性以及账号类型进行分类管理,实现简化的、统一的操作。集中的账号统建、统删、统验、统改等全生命周期管理操作,让账号管理工作变得简单高效。全局账号管理的理念,方便账号管理员梳理同名账号设备的关联情况。其中,对账号管理的具体措施包括:灵活快速查询机制,精确的定位被管理账号;密码自动修改,以任务的形式进行驱动,节省人力成本;密码策略可手动定义,符合监管要求;账号操作历史记录,为账号全生命周期管理提供重要依据;密码历史版本保留;一次性密码策略,降低账号密码泄露的风险。
所述特权账号流程审批模块的主要作用为:对目标设备上账号的操作,均需要通过审核才能执行,控制权限集中的管理风险,具体措施包括:集中式的审批管理,让所述运行环境工作台的管理员的审批操作变得高效;审批状态分类,高效查阅;审批记录,可追溯。
其中,所述安全扫描模块的主要作用为:实现账号管理的可视化,可一键扫描发现僵尸账号、幽灵账号、弱口令等风险账号,一键修复并自动生成风险趋势图,可视化展现IT环境的安全曲线,为账号管理提供重要依据。
根据一种优选的实施方式,所述调试环境工作台设置在数据使用方,所述运行环境工作台设置在数据拥有方(电力数据中台),以用于保护电力隐私数据及数据安全。
进一步地,数据拥有方(电力数据中台)拥有的数据库不少于两个,所述运行环境工作台包括多方安全计算模块,以用于对不同的数据库进行融合;
其中,所述多方安全计算模块包括隐私保护机制和预处理机制,所述隐私保护机制用于保护融合数据,所述预处理机制用于剔除异常数据。
在本发明实施例中,基于联邦学习将所述调试环境工作台设置在数据使用方,将运行环境工作台设置在数据拥有方,并进一步基于多方安全计算模块融合多个数据库的数据,具体地,数据库类型包括CSV、XLS等离线数据文件,以及MySQL、Oracle等各种主流数据库,消除了数据壁垒,为数据使用方提供了集数据预处理、特征选择、模型训练、模型预测与评估为一体的调试环境工作台,同时,调试环境工作台支持SQL语句和Python等编程语言,提供TensorFlow、Pytorch等机器学习框架,内置常用机器学习算法组件,大大降低了机器学习门槛,让更多用户能够聚焦数据的挖掘,最大程度地开发数据价值。
其中,本发明利用所述多方安全计算模块解决隐私保护下的机器学习问题的关键技术创新点在于:a)设计隐私保护算法(同态加密、数据脱敏等)支持机器学习中常见的向量运算和矩阵运算,尽可能降低性能开销和对准确率的影响;b)改良隐私保护机制,尽可能减小使用习惯的概念,降低数据使用者的学习代价,改变原有的机器学习算法;c)数据的融合分析联合的来自多个数据源的数据,其中某些数据可能会对机器学习造成不良影响(异常数据),本发明引入预处理机制,剔除异常数据,保障机器学习质量。
根据一种优选的实施方式,所述敏感数据发现与可视化分析子系统包括:
数据资产发现模块,用于自动发现数据库的分布位置以及数据库中的数据资产,并基于端口扫描和登录扫描的方式完成对数据库基本属性、数据库数据结构、敏感数据的存储分布状况的信息采集;
数据资产管理模块,用于管理所述数据资产发现模块发现的数据;
智能敏感数据识别模块,用于对所述数据资产发现模块发现的数据进行自动的分类分级;
敏感数据地图构建与可视化模块,用于使敏感数据分布可视化,并形成敏感数据地图。
进一步地,所述智能敏感数据识别模块识别所述数据资产发现模块发现的数据的模式包括预定义模式、专家自定义模式和相似数据发现模式。
进一步地,所述智能敏感数据识别模块识别的敏感数据包括姓名、电话号码、邮箱,身份证号码、银行卡号和住址。
在本发明实施例中,所述数据资产发现模块的主要作用为:实现数据资产的梳理和数据资产识别,自动发现数据库服务的分布以及数据库中的数据资产,并基于端口扫描和登录扫描的方式完成对数据库基本属性、数据库数据结构、敏感数据的存储分布状况的信息采集。具体包括:对于提供数据库服务的服务器进行自动化定期发现;对于不同类型数据库进行自动扫描,对于结构化数据进行发现;获取网络内的数据库列表,所分布的IP;根据数据特征,发现系统内不同类别和级别的数据如何分布;获取数据库的账号和权限信息,特别是敏感信息标的账号和权限信息;获取数据库的安全配置状况;对于数据分布识别功能,平台应支持定位生产环境、测试环境中存储的结构化数据,展现出结构化数据的具体分布位置。
所述数据资产管理模块的主要作用为:对已经发现的数据资源进行管理,具体包括:数据资产注册管理,对新数据资产进入系统时进行注册管理,获取数据责任人、数据保护措施需求等信息;数据责任人管理,每个数据源都必须具备相应的责任人,用于数据变更时的通知,其他方获取数据的授权,并能自动化管理,如责任人离职后的新责任人的递归与通知,确保相关策略的执行;数据来源去向管理,追踪所有数据的来源并能区分不同来源的数据,在数据定级时如果需要,不同的来源可以分成不同的级别。
所述敏感数据地图构建与可视化模块的主要作用包括:数据资产标签管理,对各类敏感数据标记不同属性的标签,并具备标签管理的功能,便于敏感数据资产检索和管理,标签会随敏感数据的变化增量更新,系统的使用人员也可以对敏感数据标签进行相应管理;数据血缘关系构建,建立数据表和数据字段之间血缘关系构建引擎,该引擎对数据的生成日志进行自动分析,构建数据资产之间的血缘关系,通过数据血缘关系可以清晰数据的源头和下游使用方;数据分布可视,呈现敏感数据资产分布大图的能力,对所有敏感数据资产进行交互式、可视化的大图展示,提供一个针对大数据平台内部敏感数据资产分布情况的全面、直观的管理视角。实现以数据库为视角,展示该数据库中时序数据、敏感时序数据的分布情况;以数据为视角,展示时序数据、敏感时序数据在不同数据库的分布情况;以用户为视角,展示该用户对时序数据、敏感时序数据的访问情况;通过对比分析,发现时序数据、敏感时序数据的变化情况;数据流转可视,基于对网络流量的扫描,实现对系统中的敏感数据的访问状况的梳理,包括敏感数据的系统访问状况、敏感数据的批量访问状况、敏感数据的访问风险等,实现对用户、接口、应用、数据等关键要素的全方位审计,通过丰富的统计报表,使管理者能够从全局视角掌握应用敏感数据的访问和使用情况。提供可交互可钻取的深度审计能力,支持对单一应用、接口或用户实体的精准画像,描述该对象具体的敏感数据访问和使用情况;数据变更影响分析,支持数据变更自动下游影响分析和通知的功能,发生数据变更时可以根据数据血缘关系对数据变更的影响情况进行自动分析,并对造成的影响及时通知到受到影响的数据使用方。其中,通过所述敏感数据发现与可视化分析子系统深度分析开放数据,并自动化定位敏感信息,呈现“敏感数据地图”,从而实现了数据的可视化分析。
根据一种优选的实施方式,第一数据安全管控与审计子系统和第二数据安全管控与审计子系统均包括:
数据置换模块,用于对结构化数据库和非结构化数据库进行数据置换;
数据访问控制模块,用于管控用户的数据访问权限;
操作留痕审计模块,用于对所有的用户数据进行全生命周期的日志记录,并针对用户行为记录进行风险分析与识别;
结果申报审核模块,用于审核所有流出的结果/模型。
进一步地,所述数据置换模块对结构化数据库和非结构化数据库进行数据置换的策略包括保留原始数据的数据项和表结构、保留原始数据的数据属性和关联关系,以用于在不丧失数据挖掘价值的基础上,保护隐私数据及数据安全。
在本发明实施例中,所述数据置换模块的主要作用为:对结构化和非结构化等数据库进行数据置换,具体基于NLP技术和OCR技术进行敏感数据识别,在去除数据敏感性的同时,保留原始数据的数据项和表结构、保留原始数据的数据属性和关联关系,以保证经置换后的数据具有完整的数据分析价值和数据计算价值,且经数据置换形成的非敏感数据集无法被碰撞还原,从而实现数据隐私保护。所述数据访问控制模块的主要作用为:基于最小权限原则,对数据的访问权限进行严格化管控,通过用户管理和数据访问控制策略,针对不同用户的业务情况,管理员分配不同的数据使用权限,实现细粒度的认证授权机制,最大程度地降低越权操作的可能,保证数据、用户权限的隔离和管控。所述操作留痕审计模块的主要作用为:对所有的用户数据操作进行全生命周期的日志记录,实现所有数据操作可追溯、可审计、可定责。同时,针对用户行为的日志记录进行风险分析与识别,严格保障数据安全。所述结果申报审核模块的主要作用为:对数据分析得到的最终结果的流出严格把控,基于智能反隐私隐藏技术的深度内容审核,智能识别敏感数据,结合基于白名单机制的人工审核方式,双管齐下,防止攻击者从流出结果中夹带敏感数据,充分保障数据安全。
本发明第二方面提供了一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘方法,该方法采用上述基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台实施,如图2所示,该方法包括:
S1、数据使用方用户登录所述特权账号管理子系统;
S2、所述特权账号管理子系统对用户身份进行验证,验证成功后,进入所述调试环境工作台准备进行数据挖掘;
具体地,步骤S2中对用户身份进行验证的方式包括通过所述特权账号管理子系统的身份认证管理模块,验证使用者身份;数据资源管理模块,对数据共享中的数据资源、数据库进行管理;账号统一管理模块,在账号的全生命周期管理中,对账号进行统建、统删、统验和统改;安全扫描模块,一键扫描风险账号,并根据扫描结果自动生成风险趋势图;特权账号流程审批模块,对所有特权账号的操作进行审核;从而防止外部攻击者及内部恶意破坏者利用泄露的特权账号对敏感数据进行窃取。
S3、根据用户数据挖掘需要,从所述运行环境工作台的全量数据中抽取样本数据,接着样本数据依次经所述敏感数据发现与可视化分析子系统和第一数据安全管控与审计子系统处理后,发送至所述调试环境工作台存储;
具体地,步骤S3中样本数据的抽取由所述运行环境工作台的管理员根据用户数据挖掘需要控制完成,在不降低数据挖掘价值的基础上,严格对发送至数据使用方的样本数据进行审核,以保护隐私数据。
S4、用户根据样本数据编写并调试程序/代码,调试完成后将程序/代码发送至所述运行环境工作台对全量数据进行挖掘,并生成结果/模型;
S5、当用户不需要带走生成的结果/模型时,数据挖掘完成,当用户需要带走生成的结果/模型时,生成的结果/模型经第二数据安全管控与审计子系统处理后,发送至数据使用方用户,数据挖掘完成。
具体地,步骤S5中,当用户需要带走结果/模型时,需向所述运行环境工作台管理员申请,并由管理员操作第二数据安全管控与审计子系统进行审核,以确保发送给用户的结晶/模型,在不降低其分析价值的基础上,保护数据隐私。
在本发明实施例中,通过所述运行环境工作台管理员严格把控数据的流出,有效解决了数据隐私保护的问题,避免了由于数据共享造成的数据隐私泄露。
本发明提供的基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法,在保证不丧失电力数据使用价值的基础上,充分保护电力数据隐私,具有极高的应用价值,且可以有效避免外部攻击者及内部恶意破坏者利用泄露的特权账号对电力敏感数据进行窃取。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述基于特权账号管理的隐私数据保护与数据挖掘平台包括特权账号管理子系统、调试环境工作台、运行环境工作台、敏感数据发现与可视化分析子系统、第一数据安全管控与审计子系统以及第二数据安全管控与审计子系统;
所述调试环境工作台与所述特权账号管理子系统连接,以用于验证使用者身份,所述调试环境工作台、所述运行环境工作台、所述敏感数据发现与可视化分析子系统、第一数据安全管控与审计子系统和所述调试环境工作台依次连接,以用于所述调试环境工作台获取样本数据进行数据挖掘;
所述运行环境工作台和第二数据安全管控与审计子系统连接,以用于对输出结果或模型进行安全管控和审计;
其中,所述特权账号管理子系统包括:身份认证管理模块,用于验证使用者的身份;
数据资源管理模块,用于以IP为唯一标识符,对数据共享中的数据资源、数据库进行管理;
账号统一管理模块,用于在账号的全生命周期管理中,对账号进行统建、统删、统验和统改;
安全扫描模块,用于一键扫描风险账号,并根据扫描结果自动生成风险趋势图;
特权账号流程审批模块,以用于对所有特权账号的操作进行审核。
2.根据权利要求1所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述身份认证模块验证使用者身份的方式包括:静态口令、动态口令、LDAP、AD域认证、密码强度、密码有效期、口令尝试死锁、用户激活、电力统一权限管理系统和特权数据访问用户分组管理;
所述数据资源管理模块对数据管理的方式包括:分类统计和分组管理;
所述账号统一管理模块对账号管理的方式包括:快速查询机制、账号定位、密码自动修改、密码策略自定义、账号操作记录、密码历史版本保留和一次性密码策略;
所述特权账号流程审批模块对特权账号的管理方式包括:集中审批和审批状态分类。
3.根据权利要求1所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述调试环境工作台设置在数据使用方,所述运行环境工作台设置在电力数据中台,以用于保护隐私数据及数据安全。
4.根据权利要求1所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述电力数据中台拥有的数据库不少于两个,所述运行环境工作台包括多方安全计算模块,以用于对不同的数据库进行融合;
其中,所述多方安全计算模块包括隐私保护机制和预处理机制,所述隐私保护机制用于保护融合数据,所述预处理机制用于剔除异常数据。
5.根据权利要求1所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述敏感数据发现与可视化分析子系统包括:
数据资产发现模块,用于自动发现数据库的分布位置以及数据库中的数据资产,并基于端口扫描和登录扫描的方式完成对数据库基本属性、数据库数据结构、敏感数据的存储分布状况的信息采集;
数据资产管理模块,用于管理所述数据资产发现模块发现的数据;
智能敏感数据识别模块,用于对所述数据资产发现模块发现的数据进行自动的分类分级;
敏感数据地图构建与可视化模块,用于使敏感数据分布可视化,并形成敏感数据地图。
6.根据权利要求5所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述智能敏感数据识别模块识别所述数据资产发现模块发现的数据的模式包括预定义模式、专家自定义模式和相似数据发现模式。
7.根据权利要求6所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述智能敏感数据识别模块识别的敏感数据包括姓名、电话号码、邮箱,身份证号码、银行卡号和住址。
8.根据权利要求1所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述第一数据安全管控与审计子系统和第二数据安全管控与审计子系统均包括:
数据置换模块,用于对结构化数据库和非结构化数据库进行数据置换;
数据访问控制模块,用于管控用户的数据访问权限;
操作留痕审计模块,用于对所有的用户数据进行全生命周期的日志记录,并针对用户行为记录进行风险分析与识别;
结果申报审核模块,用于审核所有流出的结果/模型。
9.根据权利要求8所述的一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台,其特征在于,所述数据置换模块对结构化数据库和非结构化数据库进行数据置换的策略包括保留原始数据的数据项和表结构、保留原始数据的数据属性和关联关系,以用于在不丧失数据挖掘价值的基础上,保护隐私数据及数据安全。
10.一种基于特权账号管理对电力数据中台隐私数据保护与数据挖掘方法,该方法采用权利要求1至9任意一项所述的基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台实施,其特征在于,该方法包括:
数据使用方用户登录所述特权账号管理子系统;
所述特权账号管理子系统对用户身份进行验证,验证成功后,进入所述调试环境工作台准备进行数据挖掘;
根据用户数据挖掘需要,从所述运行环境工作台的全量数据中抽取样本数据,接着样本数据依次经所述敏感数据发现与可视化分析子系统和第一数据安全管控与审计子系统处理后,发送至所述调试环境工作台存储;
用户根据样本数据编写并调试程序/代码,调试完成后将程序/代码发送至所述运行环境工作台对全量数据进行挖掘,并生成结果/模型;
当用户不需要带走生成的结果/模型时,数据挖掘完成;
当用户需要带走生成的结果/模型时,生成的结果/模型经第二数据安全管控与审计子系统处理后,发送至数据使用方用户,数据挖掘完成。
CN202210007400.XA 2022-01-05 2022-01-05 基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法 Pending CN114372098A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210007400.XA CN114372098A (zh) 2022-01-05 2022-01-05 基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210007400.XA CN114372098A (zh) 2022-01-05 2022-01-05 基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法

Publications (1)

Publication Number Publication Date
CN114372098A true CN114372098A (zh) 2022-04-19

Family

ID=81141978

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210007400.XA Pending CN114372098A (zh) 2022-01-05 2022-01-05 基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法

Country Status (1)

Country Link
CN (1) CN114372098A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114553610A (zh) * 2022-04-27 2022-05-27 国网山东省电力公司潍坊市寒亭区供电公司 一种用于隐私数据的电力数据分析系统及方法
CN117390659A (zh) * 2023-12-13 2024-01-12 江苏量界数据科技有限公司 一种基于分布式数据计算的权限控制方法
CN117574424A (zh) * 2023-11-09 2024-02-20 湖北清江水电开发有限责任公司 一种基于大数据的电力数据智能推送管理系统及方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114553610A (zh) * 2022-04-27 2022-05-27 国网山东省电力公司潍坊市寒亭区供电公司 一种用于隐私数据的电力数据分析系统及方法
CN114553610B (zh) * 2022-04-27 2022-07-29 国网山东省电力公司潍坊市寒亭区供电公司 一种用于隐私数据的电力数据分析系统及方法
CN117574424A (zh) * 2023-11-09 2024-02-20 湖北清江水电开发有限责任公司 一种基于大数据的电力数据智能推送管理系统及方法
CN117390659A (zh) * 2023-12-13 2024-01-12 江苏量界数据科技有限公司 一种基于分布式数据计算的权限控制方法
CN117390659B (zh) * 2023-12-13 2024-04-02 江苏量界数据科技有限公司 一种基于分布式数据计算的权限控制方法

Similar Documents

Publication Publication Date Title
CN115733681A (zh) 一种防止数据丢失的数据安全管理平台
CN111726353A (zh) 基于数控系统的敏感数据分级保护方法及分级保护系统
CN111639914A (zh) 区块链案件信息管理方法、装置、电子设备和存储介质
Hajli et al. Towards an understanding of privacy management architecture in big data: an experimental research
CN110020687B (zh) 基于操作人员态势感知画像的异常行为分析方法及装置
CN111598574A (zh) 面向智能服务交易的监管方法及监管接口
CN114372098A (zh) 基于特权账号管理对电力数据中台隐私数据保护与数据挖掘平台及方法
CN117769706A (zh) 在网络中自动检测和解析网络安全的网络风险治理系统及方法
Schweizerische Information technology-Security techniques-Information security management systems-Requirements
CN109388949B (zh) 一种数据安全集中管控方法和系统
Manikandakumar et al. Security and Privacy Challenges in Big Data Environment
CN114218194A (zh) 数据银行安全系统
Buehler et al. Getting to know—and manage—your biggest AI risks
Dehling et al. Security of critical information infrastructures
Beres et al. On identity assurance in the presence of federated identity management systems
Lu et al. Research on the whole process security system framework of network collaborative manufacture
Palko et al. Determining Key Risks for Modern Distributed Information Systems.
Kelemen Systematic review on process mining and security
Schumacher et al. Data mining in vulnerability databases
Kersten et al. 'Give Me Structure': Synthesis and Evaluation of a (Network) Threat Analysis Process Supporting Tier 1 Investigations in a Security Operation Center
Accorsi et al. Preventive inference control in data-centric business models
Howes et al. Enabling trustworthy spaces via orchestrated analytical security
Handoko et al. The utilization of blockchain technology on remote audit to ensure audit data integrity in detecting potential fraudulent financial reporting
CN116208429B (zh) 零信任体系架构的安全能力评价方法及装置
Kubigenova et al. Prospects for Information Security in Big Data Technology

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination