CN108090371B - 一种数据的处理方法、追踪方法、处理装置及追踪装置 - Google Patents

一种数据的处理方法、追踪方法、处理装置及追踪装置 Download PDF

Info

Publication number
CN108090371B
CN108090371B CN201611027882.6A CN201611027882A CN108090371B CN 108090371 B CN108090371 B CN 108090371B CN 201611027882 A CN201611027882 A CN 201611027882A CN 108090371 B CN108090371 B CN 108090371B
Authority
CN
China
Prior art keywords
data
identification information
access user
tracking
owner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201611027882.6A
Other languages
English (en)
Other versions
CN108090371A (zh
Inventor
杨亭亭
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Communications Ltd Research Institute
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Communications Ltd Research Institute filed Critical China Mobile Communications Group Co Ltd
Priority to CN201611027882.6A priority Critical patent/CN108090371B/zh
Publication of CN108090371A publication Critical patent/CN108090371A/zh
Application granted granted Critical
Publication of CN108090371B publication Critical patent/CN108090371B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6227Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/16Program or content traceability, e.g. by watermarking

Abstract

本发明公开了一种数据的处理方法、追踪方法、处理装置及追踪装置,该追踪方法根据大数据平台外泄露的数据携带的数据标识信息,在预先存储的数据标识信息和数据拥有者对应的标识信息的对应关系中,确定出拥有者标识信息,再根据拥有者标识信息和泄露的数据携带的数据追踪标识,确定出泄露数据的访问用户在访问数据时对应的标识信息,最终根据访问用户标识信息,在预先存储的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定出泄露数据的访问用户。由于通过大数据平台外部泄露的数据携带的数据追踪标识和数据标识信息,可确定出泄露数据的访问用户,因此,实现了对大数据平台出口数据的追踪,从而定位出了泄露数据的访问用户。

Description

一种数据的处理方法、追踪方法、处理装置及追踪装置
技术领域
本发明涉及数据安全技术领域,尤其涉及一种数据的处理方法、追踪方法、处理装置及追踪装置。
背景技术
大数据,指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。随着大数据技术的逐渐发展成熟,各类大数据应用逐步开展,大数据的共享场景越来越多,访问用户可能来自各个领域,大数据的安全问题也将面临越来越大的挑战。
目前对于大数据的追踪主要是使用数据溯源技术完成,数据溯源技术记录原始数据在从产生、传播到消亡整个生命周期内的演变信息和演变处理内容。当在大数据平台内部发生数据泄露时,根据追踪路径重现数据的历史状态和演变过程,可以找到发生泄露的环节。但当数据离开大数据平台后,用户在对数据没有发布、转售的权限的情况下,公开或转售数据,造成数据泄露时,使用数据溯源技术难以定位到泄露方,无法找到相应的责任人。并且,目前对大数据平台用户数据转售等权限的限制只能通过协议约定的方式进行,但大数据平台的审计机制难以对外部用户的使用行为进行审计。若数据在离开平台之后发生了越权使用造成数据泄露,无法找到泄露源头,不能通过技术手段定位出是哪个用户对数据进行了非法使用或遭到攻击造成了数据泄露。
因此,如何实现对大数据平台出口数据进行追踪,从而定位出泄露数据的访问用户是目前亟需解决的技术问题。
发明内容
本发明实施例提供一种数据的处理方法、追踪方法、处理装置及追踪装置,用以解决现有技术中存在的如何实现对大数据平台出口数据进行追踪,从而定位出泄露数据的访问用户的问题。
因此,本发明实施例提供了一种数据的处理方法,包括:
在接收到访问用户发送的数据访问请求时,在大数据平台查找所述数据访问请求中请求访问的数据;
根据记录的所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息,按照预设规则生成所述数据的数据追踪标识;
将所述数据追踪标识携带在所述数据中,并发送至所述访问用户。
在一种可能的实现方式中,在本发明实施例提供的上述处理方法中,所述数据的拥有者对应的标识信息包括:所述拥有者的身份标识信息和所述数据对应的随机数;所述访问用户访问所述数据时对应的标识信息包括:所述访问用户的身份标识信息和在访问所述数据时对应的随机数;
所述根据记录的所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息,按照预设规则生成所述数据的数据追踪标识,具体包括:
将所述拥有者的身份标识信息和所述数据对应的随机数,以及所述访问用户的身份标识信息和在访问所述数据时对应的随机数,按照预设的双线性对规则进行处理,生成所述数据的数据追踪标识。
在一种可能的实现方式中,在本发明实施例提供的上述处理方法中,在接收到访问用户发送的数据访问请求时,还包括:
在确定所述访问用户首次请求访问所述数据时,为所述访问用户分配一个在访问所述数据时对应的随机数。
在一种可能的实现方式中,在本发明实施例提供的上述处理方法中,所述将所述数据追踪标识携带在所述数据中,具体包括:
将所述数据追踪标识携带在所述数据的头部信息中。
本发明实施例还提供了一种数据的追踪方法,包括:
获取在大数据平台外部泄露的数据,并在所述数据中提取所述数据中携带的数据追踪标识以及数据标识信息;
根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者标识信息;
根据所述数据追踪标识以及确定出的所述数据对应的拥有者标识信息,确定泄露所述数据的访问用户在访问所述数据时对应的标识信息;
根据泄露所述数据的访问用户在访问所述数据时对应的标识信息,在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定泄露所述数据的访问用户。
在一种可能的实现方式中,在本发明实施例提供的上述追踪方法中,所述根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者标识信息,具体包括:
根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者的身份标识信息和所述数据对应的随机数。
在一种可能的实现方式中,在本发明实施例提供的上述追踪方法中,所述根据所述数据追踪标识以及确定出的所述数据对应的拥有者标识信息,确定泄露所述数据的访问用户在访问所述数据时对应的标识信息,具体包括:
根据所述数据追踪标识以及所述数据对应的拥有者的身份标识信息和所述数据对应的随机数,按照预设的双线性对规则进行处理,得到泄露所述数据的访问用户的身份标识信息和在访问所述数据时对应的随机数。
在一种可能的实现方式中,在本发明实施例提供的上述追踪方法中,所述根据泄露所述数据的访问用户在访问所述数据时对应的标识信息,在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定泄露所述数据的访问用户,具体包括:
在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定与泄露所述数据的访问用户在访问所述数据时对应的标识信息一致的标识信息对应的访问用户为泄露所述数据的访问用户。
在一种可能的实现方式中,在本发明实施例提供的上述追踪方法中,在所述数据中提取所述数据中携带的数据追踪标识,具体包括:
在所述数据的头部信息中提取所述数据中携带的数据追踪标识。
本发明实施例还提供了一种数据的处理装置,包括:
查找模块,用于在接收到访问用户发送的数据访问请求时,在大数据平台查找所述数据访问请求中请求访问的数据;
处理模块,用于根据记录的所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息,按照预设规则生成所述数据的数据追踪标识;
发送模块,用于将所述数据追踪标识携带在所述数据中,并发送至所述访问用户。
在一种可能的实现方式中,在本发明实施例提供的上述处理装置中,还包括:存储模块,用于存储所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息;其中,所述数据的拥有者对应的标识信息包括:所述拥有者的身份标识信息和所述数据对应的随机数;所述访问用户访问所述数据时对应的标识信息包括:所述访问用户的身份标识信息和在访问所述数据时对应的随机数;
所述处理模块,具体用于将所述拥有者的身份标识信息和所述数据对应的随机数,以及所述访问用户的身份标识信息和在访问所述数据时对应的随机数,按照预设的双线性对规则进行处理,生成所述数据的数据追踪标识。
在一种可能的实现方式中,在本发明实施例提供的上述处理装置中,还包括:
配置模块,用于在接收到访问用户发送的数据访问请求时,在确定所述访问用户首次请求访问所述数据时,为所述访问用户分配一个在访问所述数据时对应的随机数。
在一种可能的实现方式中,在本发明实施例提供的上述处理装置中,所述发送模块,具体用于将所述数据追踪标识携带在所述数据的头部信息中。
本发明实施例还提供了一种数据的追踪装置,包括:
读取模块,用于获取在大数据平台外部泄露的数据,并在所述数据中提取所述数据中携带的数据追踪标识以及数据标识信息;
第一确定模块,用于根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者标识信息;
第二确定模块,用于根据所述数据追踪标识以及确定出的所述数据对应的拥有者标识信息,确定泄露所述数据的访问用户在访问所述数据时对应的标识信息;
第三确定模块,用于根据泄露所述数据的访问用户在访问所述数据时对应的标识信息,在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定泄露所述数据的访问用户。
在一种可能的实现方式中,在本发明实施例提供的上述追踪装置中,所述第一确定模块,具体用于根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者的身份标识信息和所述数据对应的随机数。
在一种可能的实现方式中,在本发明实施例提供的上述追踪装置中,所述第二确定模块,具体用于根据所述数据追踪标识以及所述数据对应的拥有者的身份标识信息和所述数据对应的随机数,按照预设的双线性对规则进行处理,得到泄露所述数据的访问用户的身份标识信息和在访问所述数据时对应的随机数。
在一种可能的实现方式中,在本发明实施例提供的上述追踪装置中,所述第三确定模块,具体用于在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定与泄露所述数据的访问用户在访问所述数据时对应的标识信息一致的标识信息对应的访问用户为泄露所述数据的访问用户。
在一种可能的实现方式中,在本发明实施例提供的上述追踪装置中,所述读取模块,具体用于在所述数据的头部信息中提取所述数据中携带的数据追踪标识。
本发明有益效果如下:
本发明实施例提供的一种数据的处理方法、追踪方法、处理装置及追踪装置,通过根据大数据平台外部泄露的数据中携带的数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定出数据对应的拥有者标识信息后,再根据拥有者标识信息以及泄露的数据中携带的数据追踪标识,确定出泄露数据的访问用户在访问数据时对应的标识信息,最终根据泄露数据的访问用户在访问数据时对应的标识信息,在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定出泄露数据的访问用户。由于在大数据平台外部泄露的数据中携带了数据追踪标识以及数据标识信息,通过预先存储的数据标识信息,可以确定出数据对应的拥有者标识信息,再通过数据追踪标识与拥有者标识信息,可以确定出泄露数据的访问用户,因此,实现了对大数据平台出口数据的追踪,从而定位出了泄露数据的访问用户。
附图说明
图1为本发明实施例提供的数据的处理方法的流程图;
图2为本发明实施例提供的数据的处理装置的结构示意图;
图3为本发明实施例提供的数据的追踪方法的流程图;
图4为本发明实施例提供的数据的追踪装置的结构示意图;
图5为包括本发明实施例提供的数据的处理装置和追踪装置的系统的结构示意图;
图6为包括本发明实施例提供的数据的处理装置和追踪装置的系统处理追踪数据的流程图。
具体实施方式
下面结合附图,对本发明实施例提供的一种数据的处理方法、追踪方法、处理装置及追踪装置的具体实施方式进行详细地说明。
如图1所示,本发明实施例提供了一种数据的处理方法,包括以下步骤:
S101、在接收到访问用户发送的数据访问请求时,在大数据平台查找数据访问请求中请求访问的数据;
S102、根据记录的数据的拥有者对应的标识信息和访问用户访问数据时对应的标识信息,按照预设规则生成数据的数据追踪标识;
S103、将数据追踪标识携带在数据中,并发送至访问用户。
在具体实施时,为了实现对数据的追踪,在本发明实施例提供的处理方法中的步骤S102中数据的拥有者对应的标识信息包括:拥有者的身份标识信息和数据对应的随机数;访问用户访问数据时对应的标识信息包括:访问用户的身份标识信息和在访问数据时对应的随机数;
具体地,在本发明实施例提供的处理方法中的步骤S102根据记录的数据的拥有者对应的标识信息和访问用户访问数据时对应的标识信息,按照预设规则生成数据的数据追踪标识,具体可以通过以下方式实现:
将拥有者的身份标识信息和数据对应的随机数,以及访问用户的身份标识信息和在访问数据时对应的随机数,按照预设的双线性对规则进行处理,生成数据的数据追踪标识。
进一步地,在本发明实施例提供的处理方法的步骤S102的具体实施方式中按照预设的双线性对规则进行处理,所用参数如表1所示。
表1双线性对规则参数表
Figure BDA0001158036880000081
其中,Owner表示数据的拥有者,User表示数据的访问用户,idox表示拥有者的身份标识信息,αx表示与身份标识信息为idox的拥有者拥有的数据对应的随机数,x为自然数;idun表示访问用户的身份标识信息,βn表示与身份标识信息为idun的访问用户在访问数据时对应的随机数,n为自然数。
需要说明的是,当身份标识信息为idox的拥有者可能拥有多个数据时,与身份标识信息为idox的拥有者拥有的数据对应的随机数αx有多个,且每个随机数αx与身份标识信息为idox的拥有者拥有的不同数据一一对应。当身份标识信息为idun的访问用户可能访问多个数据时,与身份标识信息为idun的访问用户访问的数据对应的随机数βn有多个,且每个随机数βn与身份标识信息为idun的访问用户访问的不同数据一一对应。其中,随机数αx和随机数βn可以相同,也可以不相同,在此不做限定。
具体地,在本发明实施例提供的处理方法中的步骤S102的具体实施方式中按照预设的双线性对规则对拥有者的身份标识信息和数据对应的随机数,以及访问用户的身份标识信息和在访问数据时对应的随机数进行处理的过程如下:
Figure BDA0001158036880000091
Figure BDA0001158036880000092
Figure BDA0001158036880000093
其中,e(g,g)是循环群,g是循环群e(g,g)的生成元。为便于描述,此处将参数的编号用1表示,实际使用时应为变量。
在具体实施时,为了便于在本发明实施例提供的处理方法中的步骤S102中为访问用户请求访问的数据添加数据追踪标识,在本发明实施例提供的处理方法中的步骤S101中在接收到访问用户发送的数据访问请求时,还可以执行如下步骤:
在确定访问用户首次请求访问数据时,为访问用户分配一个在访问数据时对应的随机数。
在具体实施时,在本发明实施例提供的处理方法中的步骤S103中将数据追踪标识携带在数据中,具体可以通过以下方式实现:
将数据追踪标识携带在数据的头部信息中。
具体地,如表2所示,将上述在本发明实施例提供的处理方法中的步骤S102中通过双线性对规则处理得到的数据追踪标识
Figure BDA0001158036880000094
添加至数据data的头部信息header中,并为携带数据追踪标识
Figure BDA0001158036880000095
的数据data记录一个数据标识file1。为便于描述,此处将数据、参数的编号均用1表示,实际使用时应为变量。
表2数据追踪标识和数据标识
Figure BDA0001158036880000096
基于同一发明构思,本发明实施例还提供了一种数据的处理装置,由于该数据的处理装置解决问题的原理与上述数据的处理方法相似,因此,该数据的处理装置的实施可以参见数据的处理方法的实施,重复之处不再赘述。
本发明实施例提供的一种数据的处理装置,如图2所示,包括:
查找模块201,用于在接收到访问用户发送的数据访问请求时,在大数据平台查找数据访问请求中请求访问的数据;
处理模块202,用于根据记录的数据的拥有者对应的标识信息和访问用户访问数据时对应的标识信息,按照预设规则生成数据的数据追踪标识;
发送模块203,用于将数据追踪标识携带在数据中,并发送至访问用户。
在具体实施时,在本发明实施例提供的处理装置中,还可以包括:存储模块204,用于存储数据的拥有者对应的标识信息和访问用户访问数据时对应的标识信息;其中,数据的拥有者对应的标识信息包括:拥有者的身份标识信息和数据对应的随机数;访问用户访问数据时对应的标识信息包括:访问用户的身份标识信息和在访问数据时对应的随机数;
处理模块202,具体用于将拥有者的身份标识信息和数据对应的随机数,以及访问用户的身份标识信息和在访问数据时对应的随机数,按照预设的双线性对规则进行处理,生成数据的数据追踪标识。
在具体实施时,在本发明实施例提供的处理装置中,还可以包括:
配置模块205,用于在接收到访问用户发送的数据访问请求时,在确定访问用户首次请求访问数据时,为访问用户分配一个在访问数据时对应的随机数。
在具体实施时,在本发明实施例提供的处理装置中,发送模块203,具体用于将数据追踪标识携带在数据的头部信息中。
相应地,本发明实施例还提供了一种数据的追踪方法,如图3所示,包括以下步骤:
S301、获取在大数据平台外部泄露的数据,并在数据中提取数据中携带的数据追踪标识以及数据标识信息;
S302、根据数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定数据对应的拥有者标识信息;
S303、根据数据追踪标识以及确定出的数据对应的拥有者标识信息,确定泄露数据的访问用户在访问数据时对应的标识信息;
S304、根据泄露数据的访问用户在访问数据时对应的标识信息,在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定泄露数据的访问用户。
具体地,在本发明实施例提供的上述追踪方法中,由于在大数据平台外部泄露的数据中携带了数据追踪标识以及数据标识信息,通过预先存储的数据标识信息,可以确定出数据对应的拥有者标识信息,再通过数据追踪标识与拥有者标识信息,可以确定出泄露数据的访问用户,因此,实现了对大数据平台出口数据的追踪,从而定位出了泄露数据的访问用户。
具体地,在本发明实施例提供的数据的追踪方法中,例如以泄露数据标识信息为file1,数据追踪标识信息为
Figure BDA0001158036880000111
的数据data为例进行说明。在获取在大数据平台外部泄露的数据data后,在数据data中提取数据中携带的数据追踪标识
Figure BDA0001158036880000112
以及数据标识信息file1;将数据标识信息file1与表1中所示各数据标识信息进行对比,确定数据data对应的拥有者Owner标识信息ido1和α1;根据数据追踪标识
Figure BDA0001158036880000113
以及确定出的数据data对应的拥有者Owner标识信息ido1和α1,确定泄露数据data的访问用户在访问数据data时对应的标识信息idu1和β1;将泄露数据data的访问用户在访问数据data时对应的标识信息idu1和β1与表1中所示访问数据data的各访问用户信息对比,确定泄露数据data的访问用户User。
在具体实施时,在本发明实施例提供的追踪方法中的步骤S302根据数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定数据对应的拥有者标识信息,具体可以通过以下方式实现:
根据数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定数据对应的拥有者的身份标识信息和数据对应的随机数。即将数据标识信息file1与表1中所示各数据标识信息进行对比,确定与数据标识信息file1对应的拥有者Owner为数据data的拥有者,提取对应的拥有者Owner的身份标识信息ido1和数据data对应的随机数α1
在具体实施时,在本发明实施例提供的追踪方法中的步骤S303根据数据追踪标识以及确定出的数据对应的拥有者标识信息,确定泄露数据的访问用户在访问数据时对应的标识信息,具体可以通过以下方式实现:
根据数据追踪标识以及数据对应的拥有者的身份标识信息和数据对应的随机数,按照预设的双线性对规则进行处理,得到泄露数据的访问用户的身份标识信息和在访问数据时对应的随机数。
具体地,在本发明实施例提供的追踪方法中的步骤S303的具体实施方式中可以对数据追踪标识
Figure BDA0001158036880000121
以及拥有者Owner的身份标识信息ido1和数据data对应的随机数α1按双线性规则进行以下处理:
Figure BDA0001158036880000122
Figure BDA0001158036880000123
Figure BDA0001158036880000124
从而确定泄露数据data的访问用户的身份标识信息idu1和在访问数据data时对应的随机数β1
在具体实施时,在本发明实施例提供的追踪方法中的步骤S304根据泄露数据的访问用户在访问数据时对应的标识信息,在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定泄露数据的访问用户,具体可以通过以下方式实现:
在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定与泄露数据的访问用户在访问数据时对应的标识信息一致的标识信息对应的访问用户为泄露数据的访问用户。即将泄露数据data的访问用户的身份标识信息idu1和在访问数据data时对应的随机数β1与表1中所示所有访问数据data的访问用户信息对比,确定与idu1和β1一致的标识信息对应的访问用户为泄露数据data的访问用户User。
具体地,在本发明实施例提供的追踪方法中的步骤S304根据泄露数据的访问用户在访问数据时对应的标识信息,在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定泄露数据的访问用户,还可以有其他实现方式,例如,在本发明实施例提供的追踪方法中的步骤S302中确定出数据data的拥有者Owner的身份标识信息ido1和数据data对应的随机数α1后,可将拥有者Owner拥有的数据data对应的各访问用户的身份标识信息idu1、idu2……,分别与各访问用户在访问数据data时对应的随机数β1、β2……,按照双线性对规则进行处理,得到对应的
Figure BDA0001158036880000131
Figure BDA0001158036880000132
分别与本发明实施例提供的追踪方法中的步骤S303得到的
Figure BDA0001158036880000133
进行比较,与
Figure BDA0001158036880000134
一致的访问用户即为泄露数据data的访问用户User。
在具体实施时,在本发明实施例提供的追踪方法中的步骤S301中的在数据中提取数据中携带的数据追踪标识,具体可以通过以下方式实现:
在数据的头部信息中提取数据中携带的数据追踪标识。即在数据data的头部信息header中提取数据data中携带的数据追踪标识
Figure BDA0001158036880000135
基于同一发明构思,本发明实施例还提供了一种数据的追踪装置,由于该数据的追踪装置解决问题的原理与上述数据的追踪方法相似,因此,该数据的追踪装置的实施可以参见数据的追踪方法的实施,重复之处不再赘述。
本发明实施例提供的追踪装置,如图4所示,包括:
读取模块401,用于获取在大数据平台外部泄露的数据,并在数据中提取数据中携带的数据追踪标识以及数据标识信息;
第一确定模块402,用于根据数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定数据对应的拥有者标识信息;
第二确定模块403,用于根据数据追踪标识以及确定出的数据对应的拥有者标识信息,确定泄露数据的访问用户在访问数据时对应的标识信息;
第三确定模块404,用于根据泄露数据的访问用户在访问数据时对应的标识信息,在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定泄露数据的访问用户。
在具体实施时,在本发明实施例提供的追踪装置中,第一确定模块402,具体用于根据数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定数据对应的拥有者的身份标识信息和数据对应的随机数。
在具体实施时,在本发明实施例提供的追踪装置中,第二确定模块403,具体用于根据数据追踪标识以及数据对应的拥有者的身份标识信息和数据对应的随机数,按照预设的双线性对规则进行处理,得到泄露数据的访问用户的身份标识信息和在访问数据时对应的随机数。
在具体实施时,在本发明实施例提供的追踪装置中,第三确定模块404,具体用于在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定与泄露数据的访问用户在访问数据时对应的标识信息一致的标识信息对应的访问用户为泄露数据的访问用户。
在具体实施时,在本发明实施例提供的追踪装置中,读取模块401,具体用于在数据的头部信息中提取数据中携带的数据追踪标识。
需要说明的是,可以将本发明实施例提供的上述处理装置和上述追踪装置组成一个服务器,设置在大数据平台的出口网关处,作为大数据平台的数据追踪服务器,用于完成数据离开大数据平台前的数据追踪标记和日后的追踪印证操作;或者,可以将本发明实施例提供的上述处理装置和上述追踪装置部署在已有的网关服务器中,即将双线性对规则追踪算法部署在已有的网关服务器中;或者,可以将本发明实施例提供的上述处理装置和上述追踪装置作为两个独立的服务器,在此不做限定。
为了更好地理解本发明的技术方案,本发明实施例还提供了包括本发明实施例提供的上述数据的处理装置和追踪装置的系统的结构示意图,如图5所示。本发明实施例提供的上述处理装置和上述追踪装置作为两个独立的服务器,完成数据离开大数据平台前的数据追踪标记和日后的追踪印证操作。
具体地,在本发明实施例提供的包括上述数据的处理装置和追踪装置的系统中,处理装置为数据拥有者上传并存储至大数据平台的数据按照双线性对规则添加数据追踪标识信息;设置在大数据平台的出口网关处的追踪装置,用于在大数据平台出口的数据遭到泄露时,定位出泄露数据的访问用户。
进一步地,本发明实施例还提供了包括本发明实施例提供的上述数据的处理装置和追踪装置的系统处理追踪数据的流程图,如图6所示,包括以下步骤:
S601、通过处理装置的存储模块204为大数据平台存储的数据的拥有者记录一个身份标识信息idox,并为拥有者的每一个数据对应记录一个随机数αx;为每个访问用户记录一个身份标识信息idun,并在访问用户访问数据时记录一个随机数βn,其中,每一个数据对应的随机数αx与在访问用户访问该数据时的随机数βn可以相同,也可以不相同,在此不做限定;此外,存储模块204还会为每个数据对应记录一个数据标识信息filex;为便于描述,以下数据、参数的编号均用1表示,实际应用时应为变量;
S602、访问用户向大数据平台提出数据访问申请时,处理装置的查找模块201完成数据data的查询;查询内容具体包括,访问用户申请访问的数据data、步骤S601中记录的数据data的拥有者Owner的身份标识信息ido1、数据data对应的随机数α1、访问用户的身份标识信息idu1、访问用户User访问数据data时的随机数β1、以及数据data的数据标识信息file1;
S603、处理装置的处理模块202按照双线性对规则处理步骤S602中查询到的数据data的拥有者的身份标识信息ido1、数据data对应的随机数α1和访问用户的身份标识信息idu1、访问用户访问数据data时的随机数β1,得到
Figure BDA0001158036880000151
发送模块203将
Figure BDA0001158036880000152
作为数据追踪标识,添加至数据data的头部信息header中,并将处理后的数据data反馈给访问用户User;
S604、当步骤S603中的头部信息header携带数据追踪标识信息
Figure BDA0001158036880000161
的数据data离开大数据平台之后由于非法使用或遭到攻击而产生泄露时,例如,发现未授权公开的数据data被公开,追踪装置的读取模块401,首先获取泄露的数据data,并提取数据data的头部信息header中携带的数据追踪标识
Figure BDA0001158036880000162
以及数据data的数据标识信息file1;
S605、对步骤S604中提取的泄露数据data携带的数据追踪标识
Figure BDA0001158036880000163
以及数据data的数据标识信息file1进行分析。具体地,追踪装置的第一确定模块402,将数据标识信息file1与表1中所示各数据标识信息进行对比,确定与数据标识信息file1一致的数据data对应的拥有者Owner的身份标识信息ido1和数据data对应的随机数α1;然后,追踪装置的第二确定模块403,对数据追踪标识
Figure BDA0001158036880000164
以及拥有者Owner的身份标识信息ido1和数据data对应的随机数α1,按照双线性规则进行以下处理:
Figure BDA0001158036880000165
Figure BDA0001158036880000166
从而确定泄露数据data的访问用户在访问数据data时对应的按照双线性对规则处理的标识信息
Figure BDA0001158036880000167
并将身份标识信息ido1对应的拥有者Owner的随机数为α1的数据data对应的各访问用户的身份标识信息idu1、idu2……,分别与各访问用户在访问数据data时对应的随机数β1、β2……,按照双线性对规则进行处理,得到各访问用户对应的
Figure BDA0001158036880000168
S606、锁定泄露数据的访问用户,追踪装置的第三确定模块404,将步骤S605中计算得到的
Figure BDA0001158036880000169
分别与通过数据追踪标识
Figure BDA00011580368800001610
以及拥有者Owner的身份标识信息ido1和数据data对应的随机数α1得到的
Figure BDA00011580368800001611
进行比较,与
Figure BDA00011580368800001612
一致的访问用户即为泄露数据data的访问用户User。
本发明实施例提供的上述数据的处理方法、追踪方法、处理装置及追踪装置,通过根据大数据平台外部泄露的数据中携带的数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定出数据对应的拥有者标识信息后,再根据拥有者标识信息以及泄露的数据中携带的数据追踪标识,确定出泄露数据的访问用户在访问数据时对应的标识信息,最终根据泄露数据的访问用户在访问数据时对应的标识信息,在预先存储的数据的数据标识信息和各访问用户访问数据时对应的标识信息的对应关系中,确定出泄露数据的访问用户。由于在大数据平台外部泄露的数据中携带了数据追踪标识以及数据标识信息,通过预先存储的数据标识信息,可以确定出数据对应的拥有者标识信息,再通过数据追踪标识与拥有者标识信息,可以确定出泄露数据的访问用户,因此,实现了对大数据平台出口数据的追踪,从而定位出了泄露数据的访问用户。
此外,本发明实施例提供的上述数据的处理方法、追踪方法、处理装置及追踪装置中双线性对规则中计算操作少,计算开销小,对大数据平台的响应时间影响较小。适用于大数据对合作方访问用户的审计追责,可用于指导大数据平台下一步对用户访问控制策略的设定。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (18)

1.一种数据的处理方法,其特征在于,包括:
在接收到访问用户发送的数据访问请求时,在大数据平台查找所述数据访问请求中请求访问的数据;
根据记录的所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息,按照预设规则生成所述数据的数据追踪标识;
将所述数据追踪标识携带在所述数据中,并发送至所述访问用户;
其中,所述数据的拥有者对应的标识信息包括:所述拥有者的身份标识信息和所述数据对应的随机数;所述访问用户访问所述数据时对应的标识信息包括:所述访问用户的身份标识信息和在访问所述数据时对应的随机数。
2.如权利要求1所述的处理方法,其特征在于,所述根据记录的所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息,按照预设规则生成所述数据的数据追踪标识,具体包括:
将所述拥有者的身份标识信息和所述数据对应的随机数,以及所述访问用户的身份标识信息和在访问所述数据时对应的随机数,按照预设的双线性对规则进行处理,生成所述数据的数据追踪标识。
3.如权利要求2所述的处理方法,其特征在于,在接收到访问用户发送的数据访问请求时,还包括:
在确定所述访问用户首次请求访问所述数据时,为所述访问用户分配一个在访问所述数据时对应的随机数。
4.如权利要求1-3任一项所述的处理方法,其特征在于,所述将所述数据追踪标识携带在所述数据中,具体包括:
将所述数据追踪标识携带在所述数据的头部信息中。
5.一种数据的追踪方法,其特征在于,包括:
获取在大数据平台外部泄露的数据,并在所述数据中提取所述数据中携带的数据追踪标识以及数据标识信息;
根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者标识信息;
根据所述数据追踪标识以及确定出的所述数据对应的拥有者标识信息,确定泄露所述数据的访问用户在访问所述数据时对应的标识信息;
根据泄露所述数据的访问用户在访问所述数据时对应的标识信息,在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定泄露所述数据的访问用户。
6.如权利要求5所述的追踪方法,其特征在于,所述根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者标识信息,具体包括:
根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者的身份标识信息和所述数据对应的随机数。
7.如权利要求6所述的追踪方法,其特征在于,所述根据所述数据追踪标识以及确定出的所述数据对应的拥有者标识信息,确定泄露所述数据的访问用户在访问所述数据时对应的标识信息,具体包括:
根据所述数据追踪标识以及所述数据对应的拥有者的身份标识信息和所述数据对应的随机数,按照预设的双线性对规则进行处理,得到泄露所述数据的访问用户的身份标识信息和在访问所述数据时对应的随机数。
8.如权利要求7所述的追踪方法,其特征在于,所述根据泄露所述数据的访问用户在访问所述数据时对应的标识信息,在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定泄露所述数据的访问用户,具体包括:
在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定与泄露所述数据的访问用户在访问所述数据时对应的标识信息一致的标识信息对应的访问用户为泄露所述数据的访问用户。
9.如权利要求5-8任一项所述的追踪方法,其特征在于,在所述数据中提取所述数据中携带的数据追踪标识,具体包括:
在所述数据的头部信息中提取所述数据中携带的数据追踪标识。
10.一种数据的处理装置,其特征在于,包括:
查找模块,用于在接收到访问用户发送的数据访问请求时,在大数据平台查找所述数据访问请求中请求访问的数据;
处理模块,用于根据记录的所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息,按照预设规则生成所述数据的数据追踪标识;
发送模块,用于将所述数据追踪标识携带在所述数据中,并发送至所述访问用户;
其中,所述数据的拥有者对应的标识信息包括:所述拥有者的身份标识信息和所述数据对应的随机数;所述访问用户访问所述数据时对应的标识信息包括:所述访问用户的身份标识信息和在访问所述数据时对应的随机数。
11.如权利要求10所述的处理装置,其特征在于,还包括:存储模块,用于存储所述数据的拥有者对应的标识信息和所述访问用户访问所述数据时对应的标识信息;
所述处理模块,具体用于将所述拥有者的身份标识信息和所述数据对应的随机数,以及所述访问用户的身份标识信息和在访问所述数据时对应的随机数,按照预设的双线性对规则进行处理,生成所述数据的数据追踪标识。
12.如权利要求11所述的处理装置,其特征在于,还包括:
配置模块,用于在接收到访问用户发送的数据访问请求时,在确定所述访问用户首次请求访问所述数据时,为所述访问用户分配一个在访问所述数据时对应的随机数。
13.如权利要求10-12任一项所述的处理装置,其特征在于,所述发送模块,具体用于将所述数据追踪标识携带在所述数据的头部信息中。
14.一种数据的追踪装置,其特征在于,包括:
读取模块,用于获取在大数据平台外部泄露的数据,并在所述数据中提取所述数据中携带的数据追踪标识以及数据标识信息;
第一确定模块,用于根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者标识信息;
第二确定模块,用于根据所述数据追踪标识以及确定出的所述数据对应的拥有者标识信息,确定泄露所述数据的访问用户在访问所述数据时对应的标识信息;
第三确定模块,用于根据泄露所述数据的访问用户在访问所述数据时对应的标识信息,在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定泄露所述数据的访问用户。
15.如权利要求14所述的追踪装置,其特征在于:所述第一确定模块,具体用于根据所述数据标识信息,在预先存储的数据标识信息和数据的拥有者对应的标识信息的对应关系中,确定所述数据对应的拥有者的身份标识信息和所述数据对应的随机数。
16.如权利要求15所述的追踪装置,其特征在于:所述第二确定模块,具体用于根据所述数据追踪标识以及所述数据对应的拥有者的身份标识信息和所述数据对应的随机数,按照预设的双线性对规则进行处理,得到泄露所述数据的访问用户的身份标识信息和在访问所述数据时对应的随机数。
17.如权利要求16所述的追踪装置,其特征在于:所述第三确定模块,具体用于在预先存储的所述数据的数据标识信息和各访问用户访问所述数据时对应的标识信息的对应关系中,确定与泄露所述数据的访问用户在访问所述数据时对应的标识信息一致的标识信息对应的访问用户为泄露所述数据的访问用户。
18.如权利要求14-17任一项所述的追踪装置,其特征在于,所述读取模块,具体用于在所述数据的头部信息中提取所述数据中携带的数据追踪标识。
CN201611027882.6A 2016-11-21 2016-11-21 一种数据的处理方法、追踪方法、处理装置及追踪装置 Active CN108090371B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611027882.6A CN108090371B (zh) 2016-11-21 2016-11-21 一种数据的处理方法、追踪方法、处理装置及追踪装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611027882.6A CN108090371B (zh) 2016-11-21 2016-11-21 一种数据的处理方法、追踪方法、处理装置及追踪装置

Publications (2)

Publication Number Publication Date
CN108090371A CN108090371A (zh) 2018-05-29
CN108090371B true CN108090371B (zh) 2020-05-26

Family

ID=62168458

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611027882.6A Active CN108090371B (zh) 2016-11-21 2016-11-21 一种数据的处理方法、追踪方法、处理装置及追踪装置

Country Status (1)

Country Link
CN (1) CN108090371B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109800596B (zh) * 2018-12-27 2023-01-31 余炀 一种个人数据安全管理系统
CN109739889B (zh) * 2018-12-27 2020-12-08 北京三未信安科技发展有限公司 一种基于数据映射的数据泄漏溯源判定方法及系统
CN111159704B (zh) * 2019-12-31 2022-09-09 奇安信科技集团股份有限公司 虚拟内存数据泄露检测方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102761563A (zh) * 2011-04-25 2012-10-31 中国移动通信集团山东有限公司 一种传输数据方法、装置及系统
CN103379101A (zh) * 2012-04-20 2013-10-30 腾讯科技(深圳)有限公司 一种水印生成方法、客户端及服务器
CN104504014A (zh) * 2014-12-10 2015-04-08 无锡城市云计算中心有限公司 基于大数据平台的数据处理方法和装置
CN104809225A (zh) * 2015-05-06 2015-07-29 泰康人寿保险股份有限公司 链式信息传播追踪管理系统及方法
CN105681295A (zh) * 2016-01-11 2016-06-15 清华大学 关联大数据共享方法及装置
CN105897829A (zh) * 2015-11-30 2016-08-24 乐视网信息技术(北京)股份有限公司 信息共享、信息推送的方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102761563A (zh) * 2011-04-25 2012-10-31 中国移动通信集团山东有限公司 一种传输数据方法、装置及系统
CN103379101A (zh) * 2012-04-20 2013-10-30 腾讯科技(深圳)有限公司 一种水印生成方法、客户端及服务器
CN104504014A (zh) * 2014-12-10 2015-04-08 无锡城市云计算中心有限公司 基于大数据平台的数据处理方法和装置
CN104809225A (zh) * 2015-05-06 2015-07-29 泰康人寿保险股份有限公司 链式信息传播追踪管理系统及方法
CN105897829A (zh) * 2015-11-30 2016-08-24 乐视网信息技术(北京)股份有限公司 信息共享、信息推送的方法及装置
CN105681295A (zh) * 2016-01-11 2016-06-15 清华大学 关联大数据共享方法及装置

Also Published As

Publication number Publication date
CN108090371A (zh) 2018-05-29

Similar Documents

Publication Publication Date Title
CN106503574B (zh) 区块链安全存储方法
CN106031086B (zh) 用于生成设备证书和检验设备证书的有效性的方法和系统
US20190312877A1 (en) Block chain mining method, device, and node apparatus
CN110060162A (zh) 基于区块链的数据授权、查询方法和装置
CN109450638A (zh) 基于区块链的电子元器件数据管理系统及方法
CN107967416A (zh) 版权维权检测的方法、装置和系统
CN107959567A (zh) 数据存储方法、数据获取方法、装置及系统
CN109040026A (zh) 一种数字资产的授权方法、装置、设备及介质
CN106778343A (zh) 一种基于区块链的涉及隐私数据的数据共享方法
CN107579958A (zh) 数据管理方法、装置及系统
CN104216907A (zh) 一种用于提供数据库访问控制的方法、装置与系统
CN111753014B (zh) 基于区块链的身份认证方法及装置
CN101868800A (zh) 有利于利用数字音乐认证令牌进行认证的设备和相关方法
US10949556B2 (en) Method for encrypting data and a method for decrypting data
CN108140152A (zh) 计算机实现的追踪机制及数据管理
CN108090371B (zh) 一种数据的处理方法、追踪方法、处理装置及追踪装置
CN113221191B (zh) 基于区块链的数据存证方法、装置、设备和存储介质
CN110932859A (zh) 用户信息的处理方法、装置、设备及可读存储介质
CN112434334A (zh) 数据处理方法、装置、设备及存储介质
CN109040134A (zh) 一种信息加密的设计方法及相关装置
CN111460400A (zh) 一种数据处理方法、装置及计算机可读存储介质
CN108121904B (zh) 解锁方法、装置、电子设备及服务器
CN109903046A (zh) 基于区块链的用户数据管理方法及装置
CN111931230A (zh) 数据授权方法和装置、存储介质和电子装置
CN109981650B (zh) 区块链中通证的转移方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 100053 53a, xibianmennei street, Xuanwu District, Beijing

Patentee after: CHINA MOBILE COMMUNICATION LTD., Research Institute

Patentee after: CHINA MOBILE COMMUNICATIONS GROUP Co.,Ltd.

Address before: 100053 53a, xibianmennei street, Xuanwu District, Beijing

Patentee before: CHINA MOBILE COMMUNICATION LTD., Research Institute

Patentee before: CHINA MOBILE COMMUNICATIONS Corp.

CP01 Change in the name or title of a patent holder