CN116070278A - 基于大数据的信息匿名方法及服务器 - Google Patents

基于大数据的信息匿名方法及服务器 Download PDF

Info

Publication number
CN116070278A
CN116070278A CN202310217648.3A CN202310217648A CN116070278A CN 116070278 A CN116070278 A CN 116070278A CN 202310217648 A CN202310217648 A CN 202310217648A CN 116070278 A CN116070278 A CN 116070278A
Authority
CN
China
Prior art keywords
user activity
service user
activity information
information
group service
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310217648.3A
Other languages
English (en)
Inventor
戴丽
杨永华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202310217648.3A priority Critical patent/CN116070278A/zh
Publication of CN116070278A publication Critical patent/CN116070278A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Hardware Design (AREA)
  • Databases & Information Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种基于大数据的信息匿名方法及服务器,能够基于隐私信息块分割出群体画像隐私块(也即匿名防护之后的数据),这样可以利用隐私信息块和群体画像隐私块进行综合的隐私窃取模拟,从而获得精准可信的隐私暴露指数,然后可以利用隐私暴露指数对应的数值匹配以高效、精准确定出隐私窃取模拟结果。

Description

基于大数据的信息匿名方法及服务器
本发明是申请号为“2022111183744”、申请日为“20220914”、申请名称为“一种基于互联网和数字技术的信息优化处理方法及服务器”的分案申请
技术领域
本发明涉及数据处理技术领域,尤其涉及一种基于大数据的信息匿名方法及服务器。
背景技术
数字技术(Digital Technology),是一项与电子计算机相伴相生的科学技术,它是指借助一定的设备将各种信息,包括:图、文、声、像等,转化为电子计算机能识别的二进制数字“0”和“1”后进行运算、加工、存储、传送、传播、还原的技术。随着互联网的不断发展,数字技术和互联网的深度融合给各类在线业务带来了质的改变,但随着来的还有用户信息的安全问题。现如今,用户隐私的“大数据透明”现象不容忽视,亟需一种技术手段来实现用户隐私的保护。
发明内容
本发明提供一种基于大数据的信息匿名方法及服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种基于大数据的信息匿名方法,应用于信息优化服务器,该方法包括:
基于在线用户交互记录中业务用户活动信息的不同敏感信息描述字段确定隐私匿名指示字段;
利用所述隐私匿名指示字段对所述业务用户活动信息进行隐私匿名处理。
可选的,所述基于在线用户交互记录中业务用户活动信息的不同敏感信息描述字段确定隐私匿名指示字段,包括:采集在线用户交互记录中第x组业务用户活动信息的敏感信息描述字段Backward Feature及第v组业务用户活动信息的敏感信息描述字段ForwardFeature中的最少一类,且在线用户交互记录包括T组业务用户活动信息,T≥3,v=w-1,x=w+1,T和w都为整数;通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段ForwardFeature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段;其中,所述第w组业务用户活动信息的隐私匿名指示字段为所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,或所述第w组业务用户活动信息的敏感信息描述字段BackwardFeature;
所述利用所述隐私匿名指示字段对所述业务用户活动信息进行隐私匿名处理,包括:依据所述第w组业务用户活动信息的隐私匿名指示字段对第w组业务用户活动信息进行隐私匿名,获得与第w组业务用户活动信息对应的匿名化用户活动信息,且所述匿名化用户活动信息的隐私防窃取指数大于所述第w组业务用户活动信息的隐私防窃取指数。
可选的,w大于1且小于T,所述通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:依据所述第w组业务用户活动信息、所述第x组业务用户活动信息及所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息、所述第v组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段ForwardFeature及所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段;
其中,所述依据所述第w组业务用户活动信息、第x组业务用户活动信息及所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,包括:依据所述第w组业务用户活动信息及所述第x组业务用户活动信息,获得第一个体隐私更新轨迹;依据所述第一个体隐私更新轨迹对所述第x组业务用户活动信息的敏感信息描述字段Backward Feature进行更新,获得完成更新的敏感信息描述字段Backward Feature;依据所述完成更新的敏感信息描述字段Backward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;
其中,所述依据所述第w组业务用户活动信息、所述第v组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature、及所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,包括:依据所述第w组业务用户活动信息及所述第v组业务用户活动信息,获得第二个体隐私更新轨迹;依据所述第二个体隐私更新轨迹对所述第v组业务用户活动信息的敏感信息描述字段Forward Feature进行更新,获得完成更新的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息的敏感信息描述字段Backward Feature、所述完成更新的敏感信息描述字段Forward Feature、及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段ForwardFeature。
可选的,w大于1且小于T,所述通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:依据所述第w组业务用户活动信息、所述第v组业务用户活动信息及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息、所述第x组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段BackwardFeature及所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段;
其中,所述依据所述第w组业务用户活动信息、所述第v组业务用户活动信息、及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,包括:依据所述第w组业务用户活动信息及所述第v组业务用户活动信息,获得第二个体隐私更新轨迹;依据所述第二个体隐私更新轨迹对所述第v组业务用户活动信息的敏感信息描述字段Forward Feature进行更新,获得完成更新的敏感信息描述字段Forward Feature;依据所述完成更新的敏感信息描述字段Forward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;
其中,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature、及所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,包括:依据所述第w组业务用户活动信息及所述第x组业务用户活动信息,获得第一个体隐私更新轨迹;依据所述第一个体隐私更新轨迹对所述第x组业务用户活动信息的敏感信息描述字段Backward Feature进行更新,获得完成更新的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息的敏感信息描述字段Forward Feature、所述完成更新的敏感信息描述字段Backward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature。
可选的,w为1,所述通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对所述第w组业务用户活动信息进行描述字段提炼,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;
将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
可选的,w=T,通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对所述第w组业务用户活动信息进行描述字段提炼,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;
将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
可选的,w为1,通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对于第w组业务用户活动信息,采集第x组业务用户活动信息的敏感信息描述字段Backward Feature;
依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,获得所述第w组业务用户活动信息的敏感信息描述字段ForwardFeature;
将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
可选的,w=T,通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对于第w组业务用户活动信息,采集第v组业务用户活动信息的敏感信息描述字段Forward Feature;
依据所述第w组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,获得所述第w组业务用户活动信息的敏感信息描述字段BackwardFeature;
将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
可选的,所述方法还包括:确定在线用户活动报告中的不少于两组初始用户活动信息;依据所述初始用户活动信息将所述在线用户活动报告分割成不少于一组在线用户交互记录。
第二方面是一种信息优化服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述信息优化服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
可见,基于在线用户交互记录中业务用户活动信息的不同敏感信息描述字段确定隐私匿名指示字段;利用所述隐私匿名指示字段对所述业务用户活动信息进行隐私匿名处理。如此,基于不同敏感信息描述字段之间的特征传递能够准确定位隐私匿名指示字段,无需对在线用户交互记录进行地毯式的特征分析提取,这样能够提高隐私匿名处理的效率和精度。
就本申请实施例而言,可以采集在线用户交互记录中第x组业务用户活动信息的敏感信息描述字段Backward Feature及第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,进而可基于所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature、及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,继而可基于所述第w组业务用户活动信息的隐私匿名指示字段对第w组业务用户活动信息进行隐私匿名,获得与第w组业务用户活动信息对应的匿名化用户活动信息,所述匿名化用户活动信息的隐私防窃取指数大于所述第w组业务用户活动信息的隐私防窃取指数。
通过本申请实施例提供的基于大数据的信息匿名方法及服务器,不必反复进行描述字段提炼和信息匿名操作,从而保障了匿名化用户活动信息的匿名处理速度,提高了匿名处理的智能化程度,同时引入对用户活动的持续性考虑,随机的一组业务用户活动信息的隐私匿名指示字段都基于之前的一组业务用户活动信息及之后的一组业务用户活动信息贡献的敏感信息描述字段来确定,这样可基于关联的业务用户活动信息中的敏感信息描述字段,可以跳过对整体在线用户交互记录的描述字段提炼,以便明显减少描述字段提炼和匿名处理的多项开销,保障业务用户活动信息的匿名防护的针对性和灵活性,进而确保相关用户活动信息的隐私安全性。
附图说明
图1为本发明实施例提供的基于大数据的信息匿名方法的流程示意图。
图2为本发明实施例提供的基于互联网和数字技术的信息优化处理装置的模块框图。
实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
本发明实施例提供的技术方案的整体设计思路为:基于在线用户交互记录中业务用户活动信息的不同敏感信息描述字段确定隐私匿名指示字段;利用所述隐私匿名指示字段对所述业务用户活动信息进行隐私匿名处理。如此,基于不同敏感信息描述字段之间的特征传递能够准确定位隐私匿名指示字段,无需对在线用户交互记录进行地毯式的特征分析提取,这样能够提高隐私匿名处理的效率和精度。
图1示出了本发明实施例提供的基于大数据的信息匿名方法的流程示意图,基于大数据的信息匿名方法可以通过信息优化服务器实现,信息优化服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述信息优化服务器通过图1所示的PROCESS11-PROCESS13实现上述的整体设计思路的介绍。
PROCESS11:采集在线用户交互记录中第x组业务用户活动信息的敏感信息描述字段Backward Feature和第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类。
就本申请实施例而言,在线用户交互记录包括T组业务用户活动信息,T≥3且T为整数,v=w-1,x=w+1,w为整数。以一些示例性的思路来看待,可将一个备用的在线用户活动报告作为一个在线用户交互记录,也可将一个备用的在线用户活动报告分割成多个在线用户交互记录,各个在线用户交互记录互相之间不存在重叠。
其中,业务用户活动信息包括用户的一些列会话操作行为,在线用户交互记录可以是电子商务场景下的用户交互记录、远程办公场景下的用户交互记录、数字政企场景下的用户交互记录等。
基于此,第x组业务用户活动信息是第w组业务用户活动信息的下一组业务用户活动信息,因此第x组业务用户活动信息的敏感信息描述字段Backward Feature可以理解为由后向前的且存在一定联系的隐私特征信息,敏感信息描述字段可以反映上述各类用户个体隐私或者个体敏感数据的细节数据。第v组业务用户活动信息是第w组业务用户活动信息的上一组业务用户活动信息,因此第v组业务用户活动信息的敏感信息描述字段ForwardFeature可以理解为由前向后的且存在一定联系的隐私特征信息。
对于一些独立实施例中,该技术方案还可以包括:确定所述在线用户活动报告中的不少于两组初始用户活动信息;依据所述初始用户活动信息将所述在线用户活动报告分割成不少于一组在线用户交互记录。
以一些示例性的思路来看待,可将在线用户活动报告中的首组和末组作为初始用户活动信息,将在线用户活动报告作为一个在线用户交互记录;或者,可以按照预设步长,确定在线用户活动报告中的不少于两组初始用户活动信息,比如:将在线用户活动报告中的第一组作为初始用户活动信息,在线用户活动报告中关联的两个初始用户活动信息之间相差预设步长,通过每两个关联的初始用户活动信息将在线用户活动报告分割成多个在线用户交互记录;或者,将在线用户活动报告中的第一组作为初始用户活动信息,对于第T个初始用户活动信息,确定第T个初始用户活动信息之后的任意一组与第T个初始用户活动信息的个体隐私更新系数,若个体隐私更新系数的平均更新系数大于阈值,则将该组作为第T+1个初始用户活动信息,通过每两个关联的初始用户活动信息将在线用户活动报告分割成多个在线用户交互记录,这样能够确保相同的在线用户交互记录中业务用户活动信息之间的隐私信息联系。
在处理在线用户交互记录中第w组业务用户活动信息的匿名化用户活动信息时,可以采集在线用户交互记录中第x组业务用户活动信息的敏感信息描述字段BackwardFeature,和/或采集在线用户交互记录中第v组业务用户活动信息的敏感信息描述字段Forward Feature。在在线用户交互记录中,除第一组业务用户活动信息以外,剩余的业务用户活动信息(业务用户活动信息NO_2、业务用户活动信息NO_3、等等、业务用户活动信息NO_T-1)的敏感信息描述字段Backward Feature都可以通过当前业务用户活动信息的下一组业务用户活动信息的敏感信息描述字段Backward Feature来确定,并在确定敏感信息描述字段Backward Feature后,可将敏感信息描述字段Backward Feature贡献给(比如可以理解为特征传递)上一组业务用户活动信息,以使得通过当前业务用户活动信息的敏感信息描述字段Backward Feature确定上一组业务用户活动信息的敏感信息描述字段Backward Feature;除第T组业务用户活动信息以外,剩余的业务用户活动信息的敏感信息描述字段Forward Feature都可以通过当前业务用户活动信息的上一组业务用户活动信息的敏感信息描述字段Forward Feature来确定,在确定敏感信息描述字段Forward Feature后,可将敏感信息描述字段Forward Feature贡献给下一组业务用户活动信息,以使得可以通过当前业务用户活动信息的敏感信息描述字段Forward Feature确定下一组业务用户活动信息的敏感信息描述字段Forward Feature。
PROCESS12、依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段。
以一些示例性的思路来看待,在获得第x组业务用户活动信息的敏感信息描述字段Backward Feature、和/或所述第v组业务用户活动信息的敏感信息描述字段ForwardFeature后,可以通过第w组业务用户活动信息、第x组业务用户活动信息的敏感信息描述字段Backward Feature、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类进行描述字段提炼,获得第w组业务用户活动信息的隐私匿名指示字段,比如:w大于1且小于T,依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括如下内容:依据所述第w组业务用户活动信息、所述第x组业务用户活动信息及所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息、所述第v组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段ForwardFeature及所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
又比如,w大于1且小于T,依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括如下内容:依据所述第w组业务用户活动信息、所述第v组业务用户活动信息及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息、所述第x组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature及所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
PROCESS13:依据所述第w组业务用户活动信息的隐私匿名指示字段对第w组业务用户活动信息进行隐私匿名,获得与第w组业务用户活动信息对应的匿名化用户活动信息,所述匿名化用户活动信息的隐私防窃取指数大于所述第w组业务用户活动信息的隐私防窃取指数。
以一些示例性的思路来看待,可以通过特征滤波(卷积)和联合注意力(多维度)的融合对第w组业务用户活动信息的隐私匿名指示字段进行处理,获得高隐私防窃取指数的隐私匿名指示字段。并对第w组业务用户活动信息进行K匿名操作,获得K匿名处理结果,将高隐私防窃取指数的隐私匿名指示字段及K匿名处理结果进行求和,获得与第w组业务用户活动信息对应的匿名化用户活动信息,该匿名化用户活动信息的隐私防窃取指数大于所述第w组业务用户活动信息的隐私防窃取指数,即匿名化用户活动信息为第w组业务用户活动信息的匿名化用户活动信息。
以一些示例性的思路来看待,用于进行数据匿名防护的匿名处理算法的示例性说明为:通过特征滤波节点node22对第w组业务用户活动信息aw的隐私匿名指示字段field21进行特征滤波后,获得特征滤波结果。再通过数据融合节点node23对特征滤波结果进行处理,获得输出数据data1,将输出数据data1继续通过特征滤波节点node24及数据融合节点node25进行处理,获得输出数据data2,将获得的输出数据data2经过特征滤波节点node26和特征滤波节点node27进行两轮特征滤波后,可以获得处理后的隐私匿名指示字段。对第w组业务用户活动信息aw进行K匿名后,将K匿名处理结果与处理后的隐私匿名指示字段进行求和,获得与第w组业务用户活动信息对应的匿名化用户活动信息anonymous28。
如此设计,可以采集在线用户交互记录中第x组业务用户活动信息的敏感信息描述字段Backward Feature及第v组业务用户活动信息的敏感信息描述字段ForwardFeature中的最少一类,进而可基于所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature、及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,继而可基于所述第w组业务用户活动信息的隐私匿名指示字段对第w组业务用户活动信息进行隐私匿名,获得与第w组业务用户活动信息对应的匿名化用户活动信息,所述匿名化用户活动信息的隐私防窃取指数大于所述第w组业务用户活动信息的隐私防窃取指数。通过本申请实施例提供的基于大数据的信息匿名方法,不必反复进行描述字段提炼和信息匿名操作,从而保障了匿名化用户活动信息的匿名处理速度,提高了匿名处理的智能化程度,同时引入对用户活动的持续性考虑,随机的一组业务用户活动信息的隐私匿名指示字段都基于之前的一组业务用户活动信息及之后的一组业务用户活动信息贡献的敏感信息描述字段来确定,这样可基于关联的业务用户活动信息中的敏感信息描述字段,可以跳过对整体在线用户交互记录的描述字段提炼,以便明显减少描述字段提炼和匿名处理的多项开销,保障业务用户活动信息的匿名防护的针对性和灵活性,进而确保相关用户活动信息的隐私安全性。
对于一些独立实施例中,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括:依据所述第w组业务用户活动信息、第x组业务用户活动信息及所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息、第v组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段ForwardFeature、及所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
以一些示例性的思路来看待,可以通过第w组业务用户活动信息及第x组业务用户活动信息对第x组业务用户活动信息的敏感信息描述字段Backward Feature进行更新,以实现描述字段匹配(特征配对),获得第w组业务用户活动信息的敏感信息描述字段Backward Feature。
对于一些独立实施例中,所述依据所述第w组业务用户活动信息、第x组业务用户活动信息及所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,可以包括:依据所述第w组业务用户活动信息及第x组业务用户活动信息,获得第一个体隐私更新轨迹;依据所述第一个体隐私更新轨迹对所述第x组业务用户活动信息的敏感信息描述字段BackwardFeature进行更新,获得完成更新的敏感信息描述字段Backward Feature;依据所述完成更新的敏感信息描述字段Backward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature。
其中,个体隐私更新轨迹可以反映业务用户活动信息的隐私描述字段的更新变化,从而为隐私匿名处理提供参考。
以一些示例性的思路来看待,可以通过第w组业务用户活动信息aw及第x组业务用户活动信息ax预估第w组业务用户活动信息与第x组业务用户活动信息之间的第一个体隐私更新轨迹trail_w+,并通过第一个体隐私更新轨迹trail_w+对第x组业务用户活动信息的敏感信息描述字段Backward Feature_mx与第w组业务用户活动信息进行描述字段匹配,获得完成更新的敏感信息描述字段Backward Feature。继而通过完成更新的敏感信息描述字段Backward Feature及第w组业务用户活动信息,可以获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature_mw。
举例而言,可以通过用于确定敏感信息描述字段Backward Feature的匿名处理算法(包括特征滤波节点node41和深度学习节点node42)确定第w组业务用户活动信息aw的敏感信息描述字段Backward Feature。首先利用第w组业务用户活动信息与第x组业务用户活动信息ax之间的第一个体隐私更新轨迹对第x组业务用户活动信息的敏感信息描述字段Backward Feature_px进行更新,创建第w组业务用户活动信息与第x组业务用户活动信息的敏感信息描述字段Backward Feature_px之间的映射关系(对应关系),获得完成更新的敏感信息描述字段Backward Feature,进而对完成更新的敏感信息描述字段BackwardFeature及第w组业务用户活动信息进行多轮特征滤波后,将特征滤波结果作为深度学习节点node42的输入信息,以获得第w组业务用户活动信息的敏感信息描述字段BackwardFeaturegw。获得第w组业务用户活动信息的敏感信息描述字段Backward Feature后,可以通过第w组业务用户活动信息的敏感信息描述字段Backward Feature确定第w组业务用户活动信息的敏感信息描述字段Forward Feature。
对于一些独立实施例中,所述依据所述第w组业务用户活动信息、第v组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature、及所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,可以包括:依据所述第w组业务用户活动信息及第v组业务用户活动信息,获得第二个体隐私更新轨迹;依据所述第二个体隐私更新轨迹对所述第v组业务用户活动信息的敏感信息描述字段Forward Feature进行更新,获得完成更新的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息的敏感信息描述字段Backward Feature、所述完成更新的敏感信息描述字段Forward Feature、及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature。
以一些示例性的思路来看待,可以通过第w组业务用户活动信息aw及第v组业务用户活动信息av预估第w组业务用户活动信息与第v组业务用户活动信息之间的第二个体隐私更新轨迹trail_w-,并通过第二个体隐私更新轨迹trail_w-对第v组业务用户活动信息的敏感信息描述字段Forward Feature_uv与第w组业务用户活动信息进行描述字段匹配,获得完成更新的敏感信息描述字段Forward Feature。继而通过完成更新的敏感信息描述字段Forward Feature、第w组业务用户活动信息的敏感信息描述字段Backward Feature及第w组业务用户活动信息,可以获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature_uw。
举例而言,可以通过用于确定敏感信息描述字段Forward Feature的匿名处理算法(包括特征滤波节点node61和深度学习节点node62)确定第w组业务用户活动信息的敏感信息描述字段Forward Feature。首先利用第w组业务用户活动信息与第v组业务用户活动信息之间的第二个体隐私更新轨迹对第v组业务用户活动信息的敏感信息描述字段Forward Featureyv进行更新,创建第w组业务用户活动信息与第v组业务用户活动信息的敏感信息描述字段Forward Featureyv之间的映射关系,获得完成更新的敏感信息描述字段Forward Feature,进而对完成更新的敏感信息描述字段Forward Feature、第w组业务用户活动信息的敏感信息描述字段Backward Feature及第w组业务用户活动信息进行多轮特征滤波后,将特征滤波结果通作为深度学习节点node42的输入,以获得第w组业务用户活动信息的敏感信息描述字段Forward Feature_uv。
对于一些独立实施例中,w为1,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括:对所述第w组业务用户活动信息进行描述字段提炼,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
以一些示例性的思路来看待,可以对业务用户活动信息NO_1和可选择的连续业务用户活动信息(业务用户活动信息NO_1存在顺序关联的一定组数的业务用户活动信息)进行描述字段提炼,并将提炼出的隐私表达描述字段作为业务用户活动信息NO_1的敏感信息描述字段Forward Feature贡献给业务用户活动信息NO_2,以使得可以依据业务用户活动信息NO_1的敏感信息描述字段Forward Feature预估业务用户活动信息NO_2的敏感信息描述字段Forward Feature,并贡献给业务用户活动信息NO_3,...,直到通过业务用户活动信息NO_T-2的敏感信息描述字段Forward Feature预估业务用户活动信息NO_T-1的敏感信息描述字段Forward Feature。其中,本申请实施例的描述字段提炼可通过相关技术获得。
在提炼出业务用户活动信息NO_1的敏感信息描述字段Forward Feature后,可将业务用户活动信息NO_1的敏感信息描述字段Forward Feature作为业务用户活动信息NO_1的隐私匿名指示字段,进而通过业务用户活动信息NO_1的隐私匿名指示字段对业务用户活动信息NO_1进行精准高效的匿名防护,以获得业务用户活动信息NO_1对应的匿名化用户活动信息,该匿名化用户活动信息可以理解为业务用户活动信息NO_1的匿名防护结果,其中,本申请实施例不对进行对业务用户活动信息NO_1进行隐私匿名的思路进行限定,比如可以基于现有的K匿名化处理。
对于一些独立实施例中,w为T,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括:对所述第w组业务用户活动信息进行描述字段提炼,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
以一些示例性的思路来看待,可以对第T组业务用户活动信息和可选择的连续业务用户活动信息(第T组业务用户活动信息存在顺序关联的一定组数的业务用户活动信息)进行描述字段提炼,并将提炼出的隐私表达描述字段作为第T组业务用户活动信息的敏感信息描述字段Backward Feature贡献给业务用户活动信息NO_T-1,以使得可以依据第T组业务用户活动信息的敏感信息描述字段Forward Feature预估业务用户活动信息NO_T-1的敏感信息描述字段Backward Feature,并贡献给业务用户活动信息NO_T-2,...,直到通过业务用户活动信息NO_3的敏感信息描述字段Backward Feature预估业务用户活动信息NO_2的敏感信息描述字段Backward Feature。
其中,在提炼出第T组业务用户活动信息的敏感信息描述字段Forward Feature后,可将所述第T组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第T组业务用户活动信息的隐私匿名指示字段,进而通过第T组业务用户活动信息的隐私匿名指示字段对第T组业务用户活动信息进行精准高效的匿名防护,以获得第T组业务用户活动信息对应的匿名化用户活动信息,该匿名化用户活动信息可以理解为第T组业务用户活动信息的匿名防护结果。
本申请实施例仅对业务用户活动信息NO_1及第T组业务用户活动信息进行描述字段提炼便能够实现在线用户交互记录内所有业务用户活动信息的信息匿名防护可以提高匿名化用户活动信息的匿名处理速度。
对于一些独立实施例中,w为1,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括:对于第w组业务用户活动信息,采集第x组业务用户活动信息的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
以一些示例性的思路来看待,可以通过用于确定敏感信息描述字段BackwardFeature的匿名处理算法确定业务用户活动信息NO_2的敏感信息描述字段BackwardFeature。首先可以采集业务用户活动信息NO_2的敏感信息描述字段Backward Feature,并可基于业务用户活动信息NO_1与业务用户活动信息NO_2之间的个体隐私更新轨迹对业务用户活动信息NO_2的敏感信息描述字段Backward Feature进行更新,创建业务用户活动信息NO_1与业务用户活动信息NO_2的敏感信息描述字段Backward Feature之间的映射关系,获得完成更新的敏感信息描述字段Backward Feature,进而对完成更新的敏感信息描述字段Backward Feature及业务用户活动信息NO_1进行多轮特征滤波后,将特征滤波结果通作为过深度学习节点node42的输入,以获得业务用户活动信息NO_1的敏感信息描述字段Forward Feature,将该敏感信息描述字段Forward Feature视作业务用户活动信息NO_1的隐私匿名指示字段,并将该敏感信息描述字段Forward Feature贡献给业务用户活动信息NO_2,以通过该业务用户活动信息NO_1的敏感信息描述字段Forward Feature预估业务用户活动信息NO_2的敏感信息描述字段Forward Feature,并贡献给业务用户活动信息NO_3,...,直到通过业务用户活动信息NO_T-1的敏感信息描述字段Forward Feature预估第T组业务用户活动信息的敏感信息描述字段Backward Feature。
进一步地,在确定业务用户活动信息NO_1的隐私匿名指示字段后,可以通过上述的匿名处理算法确定业务用户活动信息NO_1的匿名化用户活动信息。
对于一些独立实施例中,w为T,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括:对于第w组业务用户活动信息,采集第v组业务用户活动信息的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
以一些示例性的思路来看待,首先可以采集业务用户活动信息NO_T-1的敏感信息描述字段Forward Feature,并可基于第T组业务用户活动信息与业务用户活动信息NO_T-1之间的个体隐私更新轨迹对业务用户活动信息NO_T-1的敏感信息描述字段ForwardFeature进行更新,创建第T组业务用户活动信息与业务用户活动信息NO_T-1的敏感信息描述字段Forward Feature之间的映射关系,获得完成更新的敏感信息描述字段ForwardFeature,进而对完成更新的敏感信息描述字段Forward Feature及第T组业务用户活动信息进行多轮特征滤波后,将特征滤波结果作为过深度学习节点node42的原料,以获得第T组业务用户活动信息的敏感信息描述字段Backward Feature,将该敏感信息描述字段Backward Feature视作第T组业务用户活动信息的隐私匿名指示字段,并将该敏感信息描述字段Backward Feature贡献给业务用户活动信息NO_T-1,以通过该第T组业务用户活动信息的敏感信息描述字段Backward Feature预估业务用户活动信息NO_T-1的敏感信息描述字段Backward Feature,并贡献给业务用户活动信息NO_T-2,...,直到通过业务用户活动信息NO_2的敏感信息描述字段Backward Feature预估业务用户活动信息NO_1的敏感信息描述字段Forward Feature。
进一步地,在确定业务用户活动信息NO_1的隐私匿名指示字段后,可以通过上述的匿名处理算法确定业务用户活动信息NO_1的匿名化用户活动信息。
如此一来,本申请实施例不必对随机的一组业务用户活动信息进行描述字段提炼便能够实现在线用户交互记录内所有业务用户活动信息的数据匿名防护,可以提高匿名化用户活动信息的匿名处理速度。
对于在线用户交互记录record1,对第T组业务用户活动信息进行描述字段提炼,获得第T组业务用户活动信息的敏感信息描述字段Backward Feature,通过该敏感信息描述字段Backward Feature确定第T组业务用户活动信息的匿名化用户活动信息,并将该敏感信息描述字段Backward Feature贡献给业务用户活动信息NO_T-1,以使得通过该第T组业务用户活动信息的敏感信息描述字段Backward Feature预估业务用户活动信息NO_T-1的敏感信息描述字段Backward Feature,并将业务用户活动信息NO_T-1的敏感信息描述字段Backward Feature贡献给业务用户活动信息NO_T-2,...,直到通过业务用户活动信息NO_3的敏感信息描述字段Backward Feature预估业务用户活动信息NO_2的敏感信息描述字段Backward Feature,即在线用户交互记录record2内的每一业务用户活动信息都可以通过下一组的敏感信息描述字段Backward Feature,预估对应的敏感信息描述字段Backward Feature。
进一步地,对业务用户活动信息NO_1进行描述字段提炼,获得业务用户活动信息NO_1的敏感信息描述字段Forward Feature,通过该敏感信息描述字段Forward Feature确定业务用户活动信息NO_1的匿名化用户活动信息,获得与业务用户活动信息NO_1对应的匿名化用户活动信息。同时将该业务用户活动信息NO_1的敏感信息描述字段ForwardFeature贡献给业务用户活动信息NO_2,以使得通过该业务用户活动信息NO_2的敏感信息描述字段Backward Feature及第1业务用户活动信息的敏感信息描述字段ForwardFeature预估业务用户活动信息NO_2的敏感信息描述字段Forward Feature,将业务用户活动信息NO_2的敏感信息描述字段Forward Feature作为隐私匿名指示字段,对业务用户活动信息NO_2进行隐私匿名,获得与业务用户活动信息NO_2对应的匿名化用户活动信息,同时将业务用户活动信息NO_2的敏感信息描述字段Forward Feature贡献给业务用户活动信息NO_3,...,直到通过业务用户活动信息NO_T-2的敏感信息描述字段Forward Feature预估业务用户活动信息NO_T-1的敏感信息描述字段Forward Feature,将业务用户活动信息NO_T-1的敏感信息描述字段Forward Feature作为隐私匿名指示字段,对业务用户活动信息NO_T-1进行隐私匿名,获得与业务用户活动信息NO_T-1对应的匿名化用户活动信息,便能够以在线用户交互记录record2内的每一业务用户活动信息都可以通过上一组的敏感信息描述字段Forward Feature,预估对应的敏感信息描述字段Forward Feature,并通过敏感信息描述字段Forward Feature确定获得对应的匿名化用户活动信息。
对于一些独立实施例中,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,可以包括,包括:依据所述第w组业务用户活动信息、第v组业务用户活动信息、及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息、第x组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段BackwardFeature、及所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
以一些示例性的思路来看待,可以通过第w组业务用户活动信息及第v组业务用户活动信息对第v组业务用户活动信息的敏感信息描述字段Forward Feature进行更新,以实现描述字段匹配,获得第w组业务用户活动信息的敏感信息描述字段Backward Feature。
对于一些独立实施例中,所述依据所述第w组业务用户活动信息、第v组业务用户活动信息、及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,包括:依据所述第w组业务用户活动信息及第v组业务用户活动信息,获得第二个体隐私更新轨迹;依据所述第二个体隐私更新轨迹对所述第v组业务用户活动信息的敏感信息描述字段Forward Feature进行更新,获得完成更新的敏感信息描述字段Forward Feature;依据所述完成更新的敏感信息描述字段Forward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature。
以一些示例性的思路来看待,可以通过第w组业务用户活动信息及第v组业务用户活动信息预估第w组业务用户活动信息与第v组业务用户活动信息之间的第二个体隐私更新轨迹,并通过第二个体隐私更新轨迹对第v组业务用户活动信息的敏感信息描述字段Forward Feature与第w组业务用户活动信息进行描述字段匹配,创建第w组业务用户活动信息与第v组业务用户活动信息的敏感信息描述字段Forward Feature之间的映射关系,获得完成更新的敏感信息描述字段Forward Feature。继而通过完成更新的敏感信息描述字段Forward Feature及第w组业务用户活动信息,可以获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature。可以对完成更新的敏感信息描述字段ForwardFeature及第w组业务用户活动信息进行多轮特征滤波后,将特征滤波结果通作为过深度学习节点node42的输入,以获得第w组业务用户活动信息的敏感信息描述字段ForwardFeature。
在获得第w组业务用户活动信息的敏感信息描述字段Forward Feature后,可以通过第w组业务用户活动信息的敏感信息描述字段Forward Feature确定第w组业务用户活动信息的敏感信息描述字段Backward Feature。
对于一些独立实施例中,所述依据所述第w组业务用户活动信息、第x组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature、及所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,包括:依据所述第w组业务用户活动信息及第x组业务用户活动信息,获得第一个体隐私更新轨迹;依据所述第一个体隐私更新轨迹对所述第x组业务用户活动信息的敏感信息描述字段Backward Feature进行更新,获得完成更新的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息的敏感信息描述字段Forward Feature、所述完成更新的敏感信息描述字段Backward Feature、及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature。
以一些示例性的思路来看待,可以通过第w组业务用户活动信息及第x组业务用户活动信息预估第w组业务用户活动信息与第x组业务用户活动信息之间的第一个体隐私更新轨迹,并通过第二个体隐私更新轨迹对第x组业务用户活动信息的敏感信息描述字段Backward Feature与第w组业务用户活动信息进行描述字段匹配,创建第w组业务用户活动信息与第x组业务用户活动信息的敏感信息描述字段Backward Feature之间的映射关系,获得完成更新的敏感信息描述字段Forward Feature。继而通过完成更新的敏感信息描述字段Backward Feature、第w组业务用户活动信息的敏感信息描述字段Forward Feature及第w组业务用户活动信息,可以获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature。举例来说,可以对完成更新的敏感信息描述字段Backward Feature、第w组业务用户活动信息的敏感信息描述字段Forward Feature及第w组业务用户活动信息进行多轮特征滤波后,将特征滤波结果通作为过深度学习节点node42的原料,以获得第w组业务用户活动信息的敏感信息描述字段Backward Feature。
进一步地,对于在线用户交互记录record1,对业务用户活动信息NO_1进行描述字段提炼,获得业务用户活动信息NO_1的敏感信息描述字段Forward Feature,通过该敏感信息描述字段Forward Feature确定业务用户活动信息NO_1的匿名化用户活动信息,并将该敏感信息描述字段Forward Feature贡献给业务用户活动信息NO_2,以使得通过该业务用户活动信息NO_1的敏感信息描述字段Forward Feature预估业务用户活动信息NO_2的敏感信息描述字段Forward Feature,并将业务用户活动信息NO_2的敏感信息描述字段ForwardFeature贡献给业务用户活动信息NO_3,...,直到通过业务用户活动信息NO_T-2的敏感信息描述字段Forward Feature预估业务用户活动信息NO_T-1的敏感信息描述字段ForwardFeature,即在线用户交互记录record2内的每一业务用户活动信息都可以通过上一组的敏感信息描述字段Forward Feature,预估对应的敏感信息描述字段Forward Feature。
进一步地,对第T组业务用户活动信息进行描述字段提炼,获得第T组业务用户活动信息的敏感信息描述字段Backward Feature,通过该敏感信息描述字段BackwardFeature确定第T组业务用户活动信息的匿名化用户活动信息,获得与第T组业务用户活动信息对应的匿名化用户活动信息。同时将该第T组业务用户活动信息的敏感信息描述字段Backward Feature贡献给业务用户活动信息NO_T-1,以使得通过该业务用户活动信息NO_T-1的敏感信息描述字段Forward Feature及第T业务用户活动信息的敏感信息描述字段Backward Feature预估业务用户活动信息NO_T-1的敏感信息描述字段Backward Feature,将业务用户活动信息NO_T-1的敏感信息描述字段Backward Feature作为隐私匿名指示字段,对业务用户活动信息NO_T-1进行隐私匿名,获得与业务用户活动信息NO_T-1对应的匿名化用户活动信息,同时将业务用户活动信息NO_T-1的敏感信息描述字段BackwardFeature贡献给业务用户活动信息NO_T-2,...,直到通过业务用户活动信息NO_3的敏感信息描述字段Backward Feature预估业务用户活动信息NO_2的敏感信息描述字段BackwardFeature,将业务用户活动信息NO_2的敏感信息描述字段Backward Feature作为隐私匿名指示字段,对业务用户活动信息NO_2进行隐私匿名,获得与业务用户活动信息NO_2对应的匿名化用户活动信息,即在线用户交互记录record2内的每一业务用户活动信息都可以通过下一组的敏感信息描述字段Backward Feature,预估对应的敏感信息描述字段BackwardFeature,并通过敏感信息描述字段Backward Feature确定获得对应的匿名化用户活动信息。
可选的,在获得获得与第w组业务用户活动信息对应的匿名化用户活动信息之后,该方法还可以包括如下内容:根据与第w组业务用户活动信息对应的匿名化用户活动信息进行隐私窃取模拟,获得隐私窃取模拟结果。
可选的,根据与第w组业务用户活动信息对应的匿名化用户活动信息进行隐私窃取模拟,获得隐私窃取模拟结果,可以包括如下内容:依据所述匿名化用户活动信息确定隐私信息块集合,其中,所述隐私信息块集合包括不间断的Q组隐私信息块,所述Q为不小于1的整数;根据所述隐私信息块集合获取群体画像隐私块集合,其中,所述群体画像隐私块集合包括不间断的Q组群体画像隐私块;基于所述隐私信息块集合,通过隐私窃取模拟网络所包括的第一隐私窃取处理单元获取个体隐私窃取结果集合,其中,所述个体隐私窃取结果集合包括Q个个体隐私窃取结果;基于所述群体画像隐私块集合,通过所述隐私窃取模拟网络所包括的第二隐私窃取处理单元获取已匿名隐私窃取结果集合,其中,所述已匿名隐私窃取结果集合包括Q个已匿名隐私窃取结果;基于所述个体隐私窃取结果集合以及所述已匿名隐私窃取结果集合,通过所述隐私窃取模拟网络所包括的特征整合单元获取所述隐私信息块所对应的隐私暴露指数;根据所述隐私暴露指数确定所述隐私信息块集合的隐私窃取模拟结果。如此一来,能够基于隐私信息块分割出群体画像隐私块(也即匿名防护之后的数据),这样可以利用隐私信息块和群体画像隐私块进行综合的隐私窃取模拟,从而获得精准可信的隐私暴露指数,然后可以利用隐私暴露指数对应的数值匹配以高效、精准确定出隐私窃取模拟结果。
可选的,所述基于所述个体隐私窃取结果集合以及所述已匿名隐私窃取结果集合,通过所述隐私窃取模拟网络所包括的特征整合单元获取所述隐私信息块集合所对应的隐私暴露指数,包括:基于所述个体隐私窃取结果集合,通过所述隐私窃取模拟网络所包括的第一深度学习子模型获取Q个第一多维数组,其中,每个第一多维数组对应于一个个体隐私窃取结果;基于所述已匿名隐私窃取结果集合,通过所述隐私窃取模拟网络所包括的第二深度学习子模型获取Q个第二多维数组,其中,每个第二多维数组对应于一个已匿名隐私窃取结果;对所述Q个第一多维数组以及所述Q个第二多维数组进行融合,获得Q个目标多维数组,其中,每个目标多维数组包括一个第一多维数组以及一个第二多维数组;基于所述Q个目标多维数组,通过所述隐私窃取模拟网络所包括的所述特征整合单元获取所述隐私信息块集合所对应的隐私暴露指数。如此设计,可以基于多维数组的确定,获得精准可靠的隐私暴露指数。
应当理解,上述的隐私窃取模拟网络只作为分析隐私窃取模拟结果用,且上述进行隐私窃取模拟的过程是经过相关用户的授权的。在实际应用时,可以基于隐私窃取模拟结果判断上述的匿名防护质量,如果隐私窃取模拟结果无法精准定向个体用户的隐私,只能大范围地定向群体用户的隐私,则表明上述的隐私防护质量是过关的,否则表明上述的隐私防护质量不过关,基于此,本领域技术人员可以根据实际情况进行隐私匿名防护的优化和更新,在此不作赘述。
基于同样的发明构思,图2示出了本发明实施例提供的基于互联网和数字技术的信息优化处理装置的模块框图,基于互联网和数字技术的信息优化处理装置可以包括实施图1所示的相关方法步骤的匿名指示确定模块21,用于基于在线用户交互记录中业务用户活动信息的不同敏感信息描述字段确定隐私匿名指示字段;隐私匿名处理模块22,用于利用所述隐私匿名指示字段对所述业务用户活动信息进行隐私匿名处理。
以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种基于大数据的信息匿名方法,其特征在于,应用于信息优化服务器,该方法包括:
依据匿名化用户活动信息确定隐私信息块集合,其中,所述隐私信息块集合包括不间断的Q组隐私信息块,所述Q为不小于1的整数;
根据所述隐私信息块集合获取群体画像隐私块集合,其中,所述群体画像隐私块集合包括不间断的Q组群体画像隐私块;
基于所述隐私信息块集合,通过隐私窃取模拟网络所包括的第一隐私窃取处理单元获取个体隐私窃取结果集合,其中,所述个体隐私窃取结果集合包括Q个个体隐私窃取结果;
基于所述群体画像隐私块集合,通过所述隐私窃取模拟网络所包括的第二隐私窃取处理单元获取已匿名隐私窃取结果集合,其中,所述已匿名隐私窃取结果集合包括Q个已匿名隐私窃取结果;
基于所述个体隐私窃取结果集合以及所述已匿名隐私窃取结果集合,通过所述隐私窃取模拟网络所包括的特征整合单元获取所述隐私信息块所对应的隐私暴露指数;
根据所述隐私暴露指数确定所述隐私信息块集合的隐私窃取模拟结果。
2.根据权利要求1所述的方法,其特征在于,所述匿名化用户活动信息的确定方式包括:
采集在线用户交互记录中第x组业务用户活动信息的敏感信息描述字段BackwardFeature及第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,且在线用户交互记录包括T组业务用户活动信息,T≥3,v=w-1,x=w+1,T和w都为整数;通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段BackwardFeature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段;其中,所述第w组业务用户活动信息的隐私匿名指示字段为所述第w组业务用户活动信息的敏感信息描述字段ForwardFeature,或所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;
依据所述第w组业务用户活动信息的隐私匿名指示字段对第w组业务用户活动信息进行隐私匿名,获得与第w组业务用户活动信息对应的匿名化用户活动信息,且所述匿名化用户活动信息的隐私防窃取指数大于所述第w组业务用户活动信息的隐私防窃取指数。
3.根据权利要求2所述的方法,其特征在于,w大于1且小于T,所述通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:依据所述第w组业务用户活动信息、所述第x组业务用户活动信息及所述第x组业务用户活动信息的敏感信息描述字段BackwardFeature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息、所述第v组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature及所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段ForwardFeature;将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段;
其中,所述依据所述第w组业务用户活动信息、第x组业务用户活动信息及所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,包括:依据所述第w组业务用户活动信息及所述第x组业务用户活动信息,获得第一个体隐私更新轨迹;依据所述第一个体隐私更新轨迹对所述第x组业务用户活动信息的敏感信息描述字段Backward Feature进行更新,获得完成更新的敏感信息描述字段Backward Feature;依据所述完成更新的敏感信息描述字段Backward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;
其中,所述依据所述第w组业务用户活动信息、所述第v组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature、及所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,包括:依据所述第w组业务用户活动信息及所述第v组业务用户活动信息,获得第二个体隐私更新轨迹;依据所述第二个体隐私更新轨迹对所述第v组业务用户活动信息的敏感信息描述字段Forward Feature进行更新,获得完成更新的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息的敏感信息描述字段Backward Feature、所述完成更新的敏感信息描述字段Forward Feature、及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段ForwardFeature。
4.根据权利要求2所述的方法,其特征在于,w大于1且小于T,所述通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:依据所述第w组业务用户活动信息、所述第v组业务用户活动信息及所述第v组业务用户活动信息的敏感信息描述字段ForwardFeature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;依据所述第w组业务用户活动信息、所述第x组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature及所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段BackwardFeature;将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段;
其中,所述依据所述第w组业务用户活动信息、所述第v组业务用户活动信息、及所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,包括:依据所述第w组业务用户活动信息及所述第v组业务用户活动信息,获得第二个体隐私更新轨迹;依据所述第二个体隐私更新轨迹对所述第v组业务用户活动信息的敏感信息描述字段Forward Feature进行更新,获得完成更新的敏感信息描述字段Forward Feature;依据所述完成更新的敏感信息描述字段Forward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;
其中,所述依据所述第w组业务用户活动信息、所述第x组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature、及所述第w组业务用户活动信息的敏感信息描述字段Forward Feature,确定所述第w组业务用户活动信息的敏感信息描述字段Backward Feature,包括:依据所述第w组业务用户活动信息及所述第x组业务用户活动信息,获得第一个体隐私更新轨迹;依据所述第一个体隐私更新轨迹对所述第x组业务用户活动信息的敏感信息描述字段Backward Feature进行更新,获得完成更新的敏感信息描述字段Backward Feature;依据所述第w组业务用户活动信息的敏感信息描述字段Forward Feature、所述完成更新的敏感信息描述字段Backward Feature及所述第w组业务用户活动信息,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature。
5.根据权利要求2所述的方法,其特征在于,w为1,所述通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对所述第w组业务用户活动信息进行描述字段提炼,获得所述第w组业务用户活动信息的敏感信息描述字段Forward Feature;
将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
6.根据权利要求2所述的方法,其特征在于,w=T,通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对所述第w组业务用户活动信息进行描述字段提炼,获得所述第w组业务用户活动信息的敏感信息描述字段Backward Feature;
将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
7.根据权利要求2所述的方法,其特征在于,w为1,通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对于第w组业务用户活动信息,采集第x组业务用户活动信息的敏感信息描述字段Backward Feature;
依据所述第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature,获得所述第w组业务用户活动信息的敏感信息描述字段ForwardFeature;
将所述第w组业务用户活动信息的敏感信息描述字段Forward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
8.根据权利要求2所述的方法,其特征在于,w=T,通过第w组业务用户活动信息、所述第x组业务用户活动信息的敏感信息描述字段Backward Feature和所述第v组业务用户活动信息的敏感信息描述字段Forward Feature中的最少一类,获得所述第w组业务用户活动信息的隐私匿名指示字段,包括:
对于第w组业务用户活动信息,采集第v组业务用户活动信息的敏感信息描述字段Forward Feature;
依据所述第w组业务用户活动信息、所述第v组业务用户活动信息的敏感信息描述字段Forward Feature,获得所述第w组业务用户活动信息的敏感信息描述字段BackwardFeature;
将所述第w组业务用户活动信息的敏感信息描述字段Backward Feature作为所述第w组业务用户活动信息的隐私匿名指示字段。
9.根据权利要求2所述的方法,其特征在于,所述方法还包括:确定在线用户活动报告中的不少于两组初始用户活动信息;依据所述初始用户活动信息将所述在线用户活动报告分割成不少于一组在线用户交互记录。
10.一种信息优化服务器,其特征在于,包括:存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述信息优化服务器执行如权利要求1-9中任意一项所述的方法。
CN202310217648.3A 2022-09-14 2022-09-14 基于大数据的信息匿名方法及服务器 Pending CN116070278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310217648.3A CN116070278A (zh) 2022-09-14 2022-09-14 基于大数据的信息匿名方法及服务器

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202310217648.3A CN116070278A (zh) 2022-09-14 2022-09-14 基于大数据的信息匿名方法及服务器
CN202211118374.4A CN115422593B (zh) 2022-09-14 2022-09-14 基于互联网和数字技术的信息优化处理方法及服务器

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN202211118374.4A Division CN115422593B (zh) 2022-09-14 2022-09-14 基于互联网和数字技术的信息优化处理方法及服务器

Publications (1)

Publication Number Publication Date
CN116070278A true CN116070278A (zh) 2023-05-05

Family

ID=84201958

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202310217648.3A Pending CN116070278A (zh) 2022-09-14 2022-09-14 基于大数据的信息匿名方法及服务器
CN202211118374.4A Active CN115422593B (zh) 2022-09-14 2022-09-14 基于互联网和数字技术的信息优化处理方法及服务器

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN202211118374.4A Active CN115422593B (zh) 2022-09-14 2022-09-14 基于互联网和数字技术的信息优化处理方法及服务器

Country Status (1)

Country Link
CN (2) CN116070278A (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114610773A (zh) * 2021-01-26 2022-06-10 龚世燕 基于大数据的数据应用场景识别方法及云计算服务器
CN114564749B (zh) * 2022-03-04 2022-12-23 厦门熙重电子科技有限公司 一种针对智慧云服务的用户信息保护方法及服务器
CN114880709B (zh) * 2022-05-23 2023-04-07 上海焱祺华伟信息系统技术有限公司 一种应用人工智能的电商数据防护方法及服务器

Also Published As

Publication number Publication date
CN115422593B (zh) 2023-06-30
CN115422593A (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
CN111669366B (zh) 一种本地化差分隐私数据交换方法及存储介质
CN109118155B (zh) 一种生成操作模型的方法及装置
CN113377797B (zh) 联合更新模型的方法、装置及系统
Guo et al. Enabling secure cross-modal retrieval over encrypted heterogeneous IoT databases with collective matrix factorization
CN111506820A (zh) 推荐模型、方法、装置、设备及存储介质
CN106227881B (zh) 一种信息处理方法及服务器
CN111506821A (zh) 推荐模型、方法、装置、设备及存储介质
CN114676838A (zh) 联合更新模型的方法及装置
CN106250499B (zh) 一种视频对挖掘方法及装置
CN115422593B (zh) 基于互联网和数字技术的信息优化处理方法及服务器
CN112163929B (zh) 业务推荐方法、装置、计算机设备和存储介质
CN112131274A (zh) 时间序列异常点的检测方法、装置、设备及可读存储介质
Cardell et al. Recovering decimation-based cryptographic sequences by means of linear CAs
CN114564749A (zh) 一种针对智慧云服务的用户信息保护方法及服务器
CN112381163A (zh) 一种用户聚类方法、装置及设备
CN115098793B (zh) 基于大数据的用户画像分析方法及系统
Hashemi et al. Private data leakage via exploiting access patterns of sparse features in deep learning-based recommendation systems
Mozeika et al. How to generate a fault-resilient network at a lower cost
CN113067888B (zh) 一种家庭用户信息推送方法、系统及存储介质
CN111882429B (zh) 一种银行系统字段长度分段方法和装置
Melis Building and evaluating privacy-preserving data processing systems
CN117201465A (zh) 金融业务音频的上传方法、装置、设备及可读存储介质
CN116340968A (zh) 一种隐私预算的确定方法
CN114741502A (zh) 资源确定的方法和装置、电子设备和存储介质
CN114722274A (zh) 用于信息推荐的方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination