CN111832068A - 一种保证数据隐私和业务保密性的分析方法 - Google Patents

一种保证数据隐私和业务保密性的分析方法 Download PDF

Info

Publication number
CN111832068A
CN111832068A CN202010496233.0A CN202010496233A CN111832068A CN 111832068 A CN111832068 A CN 111832068A CN 202010496233 A CN202010496233 A CN 202010496233A CN 111832068 A CN111832068 A CN 111832068A
Authority
CN
China
Prior art keywords
data
graph
analysis
dimensional table
ensuring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010496233.0A
Other languages
English (en)
Inventor
陈亮
王亚亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Yuanqi Rongan Technology Co ltd
Original Assignee
Beijing Yuanqi Rongan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Yuanqi Rongan Technology Co ltd filed Critical Beijing Yuanqi Rongan Technology Co ltd
Priority to CN202010496233.0A priority Critical patent/CN111832068A/zh
Publication of CN111832068A publication Critical patent/CN111832068A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Storage Device Security (AREA)

Abstract

本发明涉及客户关联关系分析技术领域,且公开了一种保证数据隐私和业务保密性的分析方法,包括如下步骤:S1、将需要分析的数据抽取出来,放置在一张二维表内,所述二维表定义了若干字段;S2、利用哈希算法针对此二维表内全部数据进行加密;S3、将加密的二维表内的数据进行拆分,利用数据关联关系进行建图制成数据关联关系图;利用图计算算法分析数据关联关系图,计算分析出结果;S4、对步骤S3中计算分析出的结果进行解密,得出最终分析结果明文;在保证数据安全的前提之下,可以实现技术提供方在远程帮助数据拥有方进行数据关联关系方面的分析,降低大数据分析的成本并提升了数据隐私和业务保密性。

Description

一种保证数据隐私和业务保密性的分析方法
技术领域
本发明涉及客户关联关系分析的技术领域,具体为一种保证数据隐私和业务保密性的分析方法。
背景技术
金融机构在进行客户数据大数据分析过程中,常常需要分析数据间的关联关系。比如,某人A是B的好友,B是C的好友,如果A与C不认识的话,那么A与C之间是两度的好友关联关系。在研究客户的风险时,我们可能需要找到A的全部一度和两度的好友,这就涉及到客户数据间关联关系的一些分析方法,我们可以通过对数据建图(Graph)并进行图计算(Graph Computing)来实现。而在客户数据分析的实际应用中,金融机构往往需要科技公司对于机构所提供的数据保密。由于传统的数据分析都是针对明文数据的,所以科技公司必须派出技术团队,在金融机构中驻场完成分析任务。但是很多情况下,科技公司可能和金融机构不在同一个城市,需要人员出差驻场,造成了大数据分析成本高昂等问题。不但如此,尽管客户数据分析的过程是在金融机构内部完成的,由于科技公司接触到的是明文客户数据,又了解了金融机构希望解决的具体业务问题,所以驻场式的大数据分析不能完全保证金融机构客户的数据隐私和数据安全(比如技术人员可能对电脑屏幕显示的数据进行拍照,然后将照片传出)。
发明内容
本发明为了解决现有技术的问题,提供了一种保证数据隐私和业务保密性的分析方法,在保证数据安全的前提之下,可以实现技术提供方在远程帮助数据拥有方进行数据关联关系方面的分析,降低大数据分析的成本并提升了数据隐私和业务保密性。
为解决上述技术问题,本发明的技术方案是:一种保证数据隐私和业务保密性的分析方法,包括如下步骤:
S1、将需要分析的数据抽取出来,放置在一张二维表内,所述二维表定义了若干字段,所述字段至少包含每条数据的唯一标识符ID以及该条数据的若干相关属性;
S2、利用哈希算法针对此二维表内全部数据进行加密;
S3、将加密的二维表内的数据进行拆分,利用数据关联关系进行建图制成数据关联关系图;利用图计算算法分析数据关联关系图,计算分析出结果;
S4、对步骤S3中计算分析出的结果进行解密,得出最终分析结果明文。
进一步,所述步骤S2中,对于数据安全要求较低的,保留字段明文,不进行加密处理。
进一步,所述步骤S4中,图计算算法分析数据关联关系图的分析类型包括深度优先、广度优先、最短路径或聚类。
进一步,所述图计算算法分析的分析类型均针对数据关联关系图的拓扑结构。
与现有技术相比,有益效果为:
1、在整个客户关联关系的分析过程中,技术提供方接触的完全是加密数据,包括全部的数据库字段(如果数据安全要求较低,也可以使用数据库字段的明文),所以对于数据拥有者来说,本方法既保证了数据的算法安全性又保证了业务上的保密性。
2、技术提供方可以将整个算法过程,包括建图以及图计算算法分析的相关算法放到公有云上,数据拥有方在针对数据进行加密后,将加密数据上传至自己在该公有云的存储空间,调用技术提供方提供的算法进行分析即可,这样可以大大提升大数据分析的效率。
附图说明
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
图1为本发明中保密数据的数据表;
图2为本发明中不同客户之间的关联关系拓扑图。
具体实施方式
以下将结合实施例对本发明涉及的一种保证数据隐私和业务保密性的分析方法技术方案进一步详细说明。
一种保证数据隐私和业务保密性的分析方法,包括如下步骤:
S1、将需要分析的数据抽取出来,放置在一张二维表内,所述二维表定义了若干字段,所述字段至少包含每条数据的唯一标识符ID以及该条数据的若干相关属性;
其中,数据的唯一标识符ID可以为身份证这类唯一的标识符,相关属性可为地址、电话等信息,此实施例以身份证、地址、电话作为例子进行说明;
S2、利用哈希算法针对此二维表内全部数据进行加密;
哈希算法是把任意长度的输入通过散列算法变换成固定长度的输出,其特点是可以针对任何明文生成等长度的密文;对于数据安全要求较低的,保留字段明文,不进行加密处理。
S3、将加密的二维表内的数据进行拆分,利用数据关联关系进行建图制成数据关联关系图;利用图计算算法分析数据关联关系图,计算分析出结果;
详细过程如下:
每个成员的身份证号码具有唯一性,将每个身份证号码构成散列地址,例如a的客户有b和c,b的客户有c、d和e,c的客户有d和e;
如图1所示,a的身份证号码为123456789012345618、地址为XX市XX区、 a的电话为345678901234、客户b电话为12345678901、客户c电话为 23456789012;b的身份证号码为234567890123456729、地址为YY市YY 区、b的电话为12345678912、客户c电话为23456789012、客户d电话为 45678901234、客户e电话为56789012345,c的身份证号码为345678901234567810、地址为ZZ市ZZ区、c的电话为23456789012、客户d 的电话为45678901234、客户e的电话为56789012345;d的身份证号码是 456789012345678910、地址是XX实XX区,e的身份证号码是 567890123456789021、地址是YY市YY区;
其中,身份证18位数分别代表12(省份代码)34(城市代码)56(区县代码)78901234(出生年月日)56(同一地址辖区内的,以及同年同月同日出生人的顺序码)1(性别)8(校验码),因此,可以提取区县代码和顺序码组合在一起,然后通过哈希算法,得到一个哈希字符串,用这个哈希字符串作为唯一标识密文来确定身份信息,相应的,其他属性(地址、电话)也做加密处理;为了更好的说明,此实施例通过客户及电话的字段密文来确定a 的客户关联关系;
利用哈希算法的过程中,相同的明文一定会生成相同的密文,而不同的明文一定会生成不同的密文,因此,相同的电话字段密文会将两个唯一标识密文 (身份信息)连接起来,即相同电话23456789012(客户c),会将唯一标识密文(b和c)连接起来,重复上述操作,直至生产如图2所示的关联关系拓扑图。
针对图2的拓扑图结构分析,图计算算法分析类型可采用深度优先、广度优先、最短路径或聚类,所以即使步骤2中对于数据安全要求低不进行加密处理的明文也可分析。
S4、对步骤S3中计算分析出的结果进行解密,得出最终分析结果明文。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

Claims (4)

1.一种保证数据隐私和业务保密性的分析方法,其特征在于,包括如下步骤:
S1、将需要分析的数据抽取出来,放置在一张二维表内,所述二维表定义了若干字段,所述字段至少包含每条数据的唯一标识符ID以及该条数据的若干相关属性;
S2、利用哈希算法针对此二维表内全部数据进行加密;
S3、将加密的二维表内的数据进行拆分,利用数据关联关系进行建图制成数据关联关系图;利用图计算算法分析数据关联关系图,计算分析出结果;
S4、对步骤S3中计算分析出的结果进行解密,得出最终分析结果明文。
2.根据权利要求1所述的一种保证数据隐私和业务保密性的分析方法,其特征在于:所述步骤S2中,对于数据安全要求较低的,保留字段明文,不进行加密处理。
3.根据权利要求2所述的一种保证数据隐私和业务保密性的分析方法,其特征在于:所述步骤S3中,图计算算法分析数据关联关系图的分析类型包括深度优先、广度优先、最短路径或聚类。
4.根据权利要求3所述的一种保证数据隐私和业务保密性的分析方法,其特征在于:所述图计算算法分析的分析类型均针对数据关联关系图的拓扑结构。
CN202010496233.0A 2020-06-03 2020-06-03 一种保证数据隐私和业务保密性的分析方法 Pending CN111832068A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010496233.0A CN111832068A (zh) 2020-06-03 2020-06-03 一种保证数据隐私和业务保密性的分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010496233.0A CN111832068A (zh) 2020-06-03 2020-06-03 一种保证数据隐私和业务保密性的分析方法

Publications (1)

Publication Number Publication Date
CN111832068A true CN111832068A (zh) 2020-10-27

Family

ID=72897571

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010496233.0A Pending CN111832068A (zh) 2020-06-03 2020-06-03 一种保证数据隐私和业务保密性的分析方法

Country Status (1)

Country Link
CN (1) CN111832068A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256753A (zh) * 2020-10-13 2021-01-22 山东三木众合信息科技股份有限公司 一种数据的加密安全传输方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956016A (zh) * 2016-04-21 2016-09-21 成都数联铭品科技有限公司 关联信息可视化处理系统
WO2017061950A1 (en) * 2015-10-09 2017-04-13 Singapore Management University Data security system and method for operation thereof
CN108171076A (zh) * 2017-12-22 2018-06-15 湖北工业大学 保护电子交易中消费者隐私的大数据相关性分析方法及系统
CN108183791A (zh) * 2017-12-11 2018-06-19 北京航空航天大学 应用于云环境下的智能终端数据安全处理方法及系统
CN109768987A (zh) * 2019-02-26 2019-05-17 重庆邮电大学 一种基于区块链的数据文件安全隐私存储和分享方法
CN110691057A (zh) * 2018-07-04 2020-01-14 中国移动通信有限公司研究院 一种隐式认证方法、装置和计算机可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017061950A1 (en) * 2015-10-09 2017-04-13 Singapore Management University Data security system and method for operation thereof
CN105956016A (zh) * 2016-04-21 2016-09-21 成都数联铭品科技有限公司 关联信息可视化处理系统
CN108183791A (zh) * 2017-12-11 2018-06-19 北京航空航天大学 应用于云环境下的智能终端数据安全处理方法及系统
CN108171076A (zh) * 2017-12-22 2018-06-15 湖北工业大学 保护电子交易中消费者隐私的大数据相关性分析方法及系统
CN110691057A (zh) * 2018-07-04 2020-01-14 中国移动通信有限公司研究院 一种隐式认证方法、装置和计算机可读存储介质
CN109768987A (zh) * 2019-02-26 2019-05-17 重庆邮电大学 一种基于区块链的数据文件安全隐私存储和分享方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112256753A (zh) * 2020-10-13 2021-01-22 山东三木众合信息科技股份有限公司 一种数据的加密安全传输方法
CN112256753B (zh) * 2020-10-13 2021-05-18 山东三木众合信息科技股份有限公司 一种数据的加密安全传输方法

Similar Documents

Publication Publication Date Title
US10693657B2 (en) Method and apparatus for verifying processed data
CN107301521A (zh) 一种基于区块链的仓单系统中加强仓单交易安全性的方法
CN111079197B (zh) 审计结果数据存储方法、装置、电子设备及介质
CN107851111A (zh) 使用区块链的身份管理服务
CN111800252A (zh) 基于区块链的信息审核方法、装置和计算机设备
CN107196840B (zh) 数据处理方法、装置及设备
CN106934624A (zh) 在输入前端采用见证式指纹的区块链的方法
CN115242371B (zh) 差分隐私保护的集合交集及其基数计算方法、装置及系统
WO2020233014A1 (zh) 消息发送方法、装置、计算机设备和存储介质
Jia et al. Enabling efficient and secure outsourcing of large matrix multiplications
US20230006819A1 (en) Systems and methods for homomorphic encryption-based triggering
KR101877850B1 (ko) 블록체인을 이용한 옐로우 페이지 기반 통화 서비스 제공 방법
CN111832068A (zh) 一种保证数据隐私和业务保密性的分析方法
Daniel Police and user-led investigations on social media
CN116957112A (zh) 联合模型的训练方法、装置、设备及存储介质
US10901970B2 (en) One-way hashing methodology for database records
Bertino Security with Privacy--Opportunities and Challenges: Panel Position Paper
Ajlouni et al. A survey of artificial intelligence driven blockchain technology: blockchain intelligence
Dongre et al. An IOT based private blockchain framework for attendance management using QR code
Xu et al. Blockchain-based solutions for IoT: A tertiary study
Alarabi et al. Two Level Based Privacy Protection Approach for Internet of Things Users in Cloud Computing
Toapanta et al. Evaluation of algorithms and security protocols to mitigate the risks in commercial transactions carried out by public companies
US20220374872A1 (en) Platform for building decentralized applications
SIVASANKARI IMPLEMENTATION OF NETWORK SECURITY AND INTRUSION DETECTION SYSTEM USING DATA MINING TECHNIQUES
Ramadhani et al. A Study on the Conceptual Model of an E-Voting System based on Blockchain

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20201027