CN116226915A - 大数据匿名迁移处理方法及匿名迁移处理服务器 - Google Patents
大数据匿名迁移处理方法及匿名迁移处理服务器 Download PDFInfo
- Publication number
- CN116226915A CN116226915A CN202310135747.7A CN202310135747A CN116226915A CN 116226915 A CN116226915 A CN 116226915A CN 202310135747 A CN202310135747 A CN 202310135747A CN 116226915 A CN116226915 A CN 116226915A
- Authority
- CN
- China
- Prior art keywords
- anonymous
- data
- migration
- service data
- sensitive
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013508 migration Methods 0.000 title claims abstract description 635
- 230000005012 migration Effects 0.000 title claims abstract description 635
- 238000012545 processing Methods 0.000 title claims abstract description 200
- 238000003672 processing method Methods 0.000 title claims abstract description 10
- 239000013598 vector Substances 0.000 claims abstract description 264
- 238000000586 desensitisation Methods 0.000 claims abstract description 76
- 238000013519 translation Methods 0.000 claims abstract description 21
- 238000011156 evaluation Methods 0.000 claims description 108
- 238000000605 extraction Methods 0.000 claims description 98
- 238000012546 transfer Methods 0.000 claims description 80
- 230000003993 interaction Effects 0.000 claims description 72
- 238000005457 optimization Methods 0.000 claims description 47
- 238000000034 method Methods 0.000 claims description 43
- 238000004458 analytical method Methods 0.000 claims description 35
- 238000013139 quantization Methods 0.000 claims description 34
- 238000007418 data mining Methods 0.000 claims description 14
- 238000005259 measurement Methods 0.000 claims description 9
- 230000000007 visual effect Effects 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 238000013507 mapping Methods 0.000 claims description 4
- 230000006399 behavior Effects 0.000 description 44
- 230000002159 abnormal effect Effects 0.000 description 11
- 206010000117 Abnormal behaviour Diseases 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 5
- 238000012544 monitoring process Methods 0.000 description 5
- 238000013461 design Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 101100452593 Caenorhabditis elegans ina-1 gene Proteins 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种大数据匿名迁移处理方法及匿名迁移处理服务器,在优化数据匿名迁移算法时,不仅迁移标的脱敏业务数据与待匿名敏感业务数据自身的匿名迁移要素向量会用于数据翻译从而得到已匿名业务数据,迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,也会用于数据翻译从而得到已匿名业务数据,使得所确定的已匿名业务数据不仅可以基于迁移标的脱敏业务数据的原始泛化信息进行选择性匿名处理,还可以基于待匿名敏感业务数据的敏感信息进行精准化匿名,换言之,在参考了迁移标的脱敏业务数据的整体的数据匿名逻辑的情况下,还可以自适应地基于待匿名敏感业务数据的敏感信息进行匿名处理微调。
Description
技术领域
本发明涉及大数据匿名技术领域,尤其涉及一种大数据匿名迁移处理方法及匿名迁移处理服务器。
背景技术
相比直接删除敏感/隐私数据,数据匿名化处理可以保留相关信息供其他功能应用,也即可以让数据的非敏感部分仍然能得到较为广泛的利用。进一步地,数据匿名化还可以避免数据滥用和隐私数据泄露,增强信息安全性。此外,数据匿名化可以强化数据管理和一致性,在保证准确的数据能够支持应用程序和服务的同时,还能够保护大数据分析和隐私。因此,数据匿名处理在数字业务和云业务大环境下扮演了重要的角色。当下,随着数据规模和数据类型的激增,传统的数据匿名技术存在效率低下的问题,为改善该问题,一些技术尝试利用已匿名数据作为模板来进行其他数据的匿名处理(也可以称为数据匿名迁移),但是这类技术在实施过程中,匿名迁移处理的精度和可信度难以得到保障。
发明内容
本发明提供一种大数据匿名迁移处理方法及匿名迁移处理服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种大数据匿名迁移处理方法,应用于匿名迁移处理服务器,所述方法包括:
获得匿名迁移数据集,所述匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据;
依据所述迁移标的脱敏业务数据的原始泛化信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量;
调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,并依据整理所述匿名迁移要素向量与所述匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,得到已匿名业务数据;
调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,所述数据类别包括敏感类别和泛化类别;
利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层。
在一些可独立的实施例中,所述获得匿名迁移数据集,包括:
获得第一在线业务交互数据与第二在线业务交互数据,所述第一在线业务交互数据与第二在线业务交互数据对应相同的敏感要素主题,且对应不同的原始泛化要素主题;
获得第三在线业务交互数据,所述第三在线业务交互数据与所述第一在线业务交互数据对应不同的敏感要素主题;
基于针对所述第二在线业务交互数据和所述第三在线业务交互数据的敏感数据匿名迁移,得到第四在线业务交互数据;
将所述第一在线业务交互数据作为待匿名敏感业务数据、所述第四在线业务交互数据作为迁移标的脱敏业务数据、所述第二在线业务交互数据作为匿名迁移辅助决策数据,以获得一个匿名迁移数据集。
在一些可独立的实施例中,所述方法还包括:
调用所述数据匿名迁移算法的泛化知识抽取层,对所述迁移标的脱敏业务数据进行知识抽取,得到所述迁移标的脱敏业务数据的原始泛化信息描述向量;
调用所述数据匿名迁移算法的敏感知识抽取层,对所述待匿名敏感业务数据进行知识抽取,得到所述待匿名敏感业务数据的敏感信息描述向量;
其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。
在一些可独立的实施例中,所述调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,包括:
将所述待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据;
将所述混合业务数据加载到所述数据匿名迁移算法;调用所述数据匿名迁移算法的匿名迁移处理层,对所述混合业务数据进行数据挖掘,得到对所述迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量。
在一些可独立的实施例中,所述方法还包括:
分别确定所述匿名迁移要素向量、所述匿名跳转联动向量的第一量化指标与第二量化指标;
结合所述匿名迁移要素向量的第一量化指标与第二量化指标,对所述匿名迁移要素向量进行标准化处理,得到标准化后的匿名迁移要素向量;
结合所述匿名跳转联动向量的第一量化指标与第二量化指标,将所述匿名跳转联动向量的匿名推演特征映射到所述标准化后的匿名迁移要素向量,得到所述数据匿名输出向量。
在一些可独立的实施例中,所述调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,包括:
将所述已匿名业务数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述已匿名业务数据属于泛化类别的第一可能性;
将所述匿名迁移辅助决策数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述匿名迁移辅助决策数据属于泛化类别的第二可能性。
在一些可独立的实施例中,在得到已匿名业务数据之后,所述方法还包括:
调用所述数据匿名迁移算法的泛化知识抽取层,对所述已匿名业务数据进行知识抽取,得到所述已匿名业务数据的原始泛化信息描述向量;
调用所述数据匿名迁移算法的敏感知识抽取层,对所述已匿名业务数据进行知识抽取,得到所述已匿名业务数据的敏感信息描述向量;
其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。
在一些可独立的实施例中,所述利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层,包括:
在锁定所述匿名迁移处理层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性与所述匿名迁移辅助决策数据属于泛化类别的第二可能性,生成针对所述匿名迁移评估层的评估代价,利用所述评估代价改进所述匿名迁移评估层的算法变量;
在锁定所述匿名迁移评估层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移处理层的匿名迁移代价,结合所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果,生成泛化识别代价,结合所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果,生成敏感识别代价,结合所述匿名迁移代价、泛化识别代价与所述敏感识别代价,生成针对所述匿名迁移处理层的全局代价,利用所述全局代价改进所述匿名迁移处理层的算法变量;
直到符合优化终止要求时完成优化,得到完成优化的匿名迁移评估层与匿名迁移处理层;
其中,在所述匿名迁移处理层的算法变量处于锁定状态时,所述匿名迁移评估层的算法变量处于非锁定状态;在所述匿名迁移评估层的算法变量处于锁定状态时,所述匿名迁移处理层的算法变量处于非锁定状态。
在一些可独立的实施例中,所述方法还包括:
通过事先完成优化的匿名区块分析算法,分别对所述迁移标的脱敏业务数据与所述已匿名业务数据进行匿名区块捕捉,得到各自对应的匿名区块信息;
结合所述迁移标的脱敏业务数据与所述已匿名业务数据各自对应的匿名区块信息之间的比较结果,生成匿名区块匹配代价;所述匿名区块匹配代价用于辅助所述数据匿名迁移算法的匿名迁移处理层的优化。
在一些可独立的实施例中,所述方法还包括:
通过事先完成优化的知识抽取算法,分别对所述已匿名业务数据与所述匿名迁移辅助决策数据进行业务数据知识抽取,得到各自对应的业务数据视觉知识;
结合所述已匿名业务数据与所述匿名迁移辅助决策数据各自对应的业务数据视觉知识之间的比较结果,生成共性度量代价;
所述共性度量代价用于辅助所述数据匿名迁移算法的匿名迁移处理层的优化。
在一些可独立的实施例中,所述方法还包括:结合所述已匿名业务数据与所述匿名迁移辅助决策数据之间的字段级比较结果,生成业务数据调整代价;其中,所述业务数据调整代价用于辅助所述数据匿名迁移算法的匿名迁移处理层的优化。
在一些可独立的实施例中,所述方法还包括:
获得迁移标的脱敏数据流与包含目标敏感信息的待匿名敏感业务数据;
对于所述迁移标的脱敏数据流的每一个迁移标的脱敏数据,获得所述迁移标的脱敏数据的原始泛化信息描述向量;
获得所述包含目标敏感信息的待匿名敏感业务数据的敏感信息描述向量;
整合所述原始泛化信息描述向量与所述敏感信息描述向量,得到匿名跳转联动向量;
通过完成优化的所述数据匿名迁移算法的匿名迁移处理层,结合所述包含目标敏感信息的待匿名敏感业务数据与所述迁移标的脱敏数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,依据整理所述匿名迁移要素向量与所述匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,获得依据所述迁移标的脱敏数据的数据匿名规则对所述目标敏感信息进行匿名迁移处理的匿名化业务数据流。
第二方面是一种匿名迁移处理服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述匿名迁移处理服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
根据本发明的一个实施例,在优化数据匿名迁移算法时,不仅迁移标的脱敏业务数据与待匿名敏感业务数据自身的匿名迁移要素向量会用于数据翻译从而得到已匿名业务数据,迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,也会用于数据翻译从而得到已匿名业务数据,使得所确定的已匿名业务数据不仅可以基于迁移标的脱敏业务数据的原始泛化信息进行选择性匿名处理,还可以基于待匿名敏感业务数据的敏感信息进行精准化匿名,换言之,在参考了迁移标的脱敏业务数据的整体的数据匿名逻辑的情况下,还可以自适应地基于待匿名敏感业务数据的敏感信息进行匿名处理微调。另外,通过迁移标的脱敏业务数据的原始泛化信息描述向量与已匿名业务数据的原始泛化信息描述向量之间的比较结果,待匿名敏感业务数据的敏感信息描述向量与已匿名业务数据的敏感信息描述向量之间的比较结果,来改进数据匿名迁移算法,迁移标的脱敏业务数据的原始泛化信息描述向量与已匿名业务数据的原始泛化信息描述向量之间的比较结果能够指导已匿名业务数据与迁移标的脱敏业务数据之间的原始泛化信息的匹配,待匿名敏感业务数据的敏感信息描述向量与已匿名业务数据的敏感信息描述向量之间的比较结果能够指导已匿名业务数据与待匿名敏感业务数据之间的敏感信息的匹配,如此,就算迁移标的脱敏业务数据的原始泛化信息较为繁杂,生成的已匿名业务数据依然可以沿用迁移标的脱敏业务数据的数据匿名逻辑,保障数据匿名迁移处理的精度和可信度。而且,改进数据匿名迁移算法的匿名迁移处理层与匿名迁移评估层的算法变量时,还会依据匿名迁移评估层对已匿名业务数据与匿名迁移辅助决策数据评估的数据类别评估报告,实现匿名迁移处理层与匿名迁移评估层的鲁棒性针对优化,确保数据匿名迁移算法生成的已匿名业务数据的匿名精度和可信度。
附图说明
图1为本发明实施例提供的大数据匿名迁移处理方法的流程示意图。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的大数据匿名迁移处理方法的流程示意图,大数据匿名迁移处理方法可以通过匿名迁移处理服务器实现,匿名迁移处理服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述匿名迁移处理服务器执行S302-S310。
S302,获得匿名迁移数据集,匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据。
本发明实施例中,匿名迁移处理服务器可以获得多个匿名迁移数据集,用于优化数据匿名迁移算法。每个匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据。其中,待匿名敏感业务数据为携带敏感信息的业务数据,迁移标的脱敏业务数据是用于为数据匿名/脱敏迁移处理提供指导的已匿名业务数据/已脱敏业务数据。利用此,数据匿名/脱敏迁移处理可以理解为依据迁移标的脱敏业务数据的数据匿名方式对待匿名敏感业务数据所携带的敏感信息进行匿名/脱敏处理,同时可以结合迁移标的脱敏业务数据中未脱敏的业务数据(比如一些原始泛化数据)的确定逻辑对待匿名敏感业务数据进行类似处理。匿名迁移辅助决策数据可以理解为优化数据匿名迁移算法所需要的先验数据。鉴于采用各个匿名迁移数据集(或多个匿名迁移数据集)对数据匿名迁移算法进行优化的思路相同,本发明实施例通过一个匿名迁移数据集优化数据匿名迁移算法的方案进行介绍。
可以理解,利用数据匿名迁移的思路,对于每个匿名迁移数据集而言,用于提供算法优化所需先验数据(监督信息)的匿名迁移辅助决策数据,与待匿名敏感业务数据具有相同的敏感要素主题,且与迁移标的脱敏业务数据具有相同的原始泛化要素主题。另外,为了提高匿名迁移的精度,待匿名敏感业务数据应当与迁移标的脱敏业务数据具有不同的敏感要素主题。敏感要素主题可以理解为业务数据中敏感数据的类别,具有相同的敏感要素主题是指业务数据中存在相同类别的敏感数据。原始泛化要素主题是指业务数据中具有群体特征的数据信息,这类数据信息难以反映出个体特征,因而具有泛化性。
比如,在数据匿名迁移任务下,待匿名敏感业务数据中的敏感信息与匿名迁移辅助决策数据中的敏感信息是相同(类型)的敏感信息,但是二者的敏感信息对应的原始泛化信息不同。待匿名敏感业务数据中的敏感信息与迁移标的脱敏业务数据中的敏感信息,是不同的两个人的敏感信息。又比如,待匿名敏感业务数据和匿名迁移辅助决策数据也可以匹配相同的业务数据A,待匿名敏感业务数据是没有进行匿名处理的业务数据A,匿名迁移辅助决策数据是完成了匿名处理的业务数据A。
对于一些可能的示例而言,匿名迁移数据集可基于如下思路确定:获得第一在线业务交互数据与第二在线业务交互数据,第一在线业务交互数据与第二在线业务交互数据对应相同的敏感要素主题,且对应不同的原始泛化要素主题;获得第三在线业务交互数据,第三在线业务交互数据与第一在线业务交互数据对应不同的敏感要素主题;基于针对第二在线业务交互数据和第三在线业务交互数据的敏感数据匿名迁移,得到第四在线业务交互数据;将第一在线业务交互数据作为待匿名敏感业务数据、第四在线业务交互数据作为迁移标的脱敏业务数据、第二在线业务交互数据作为匿名迁移辅助决策数据,以获得一个匿名迁移数据集。
示例性地,匿名迁移处理服务器可以任意获得第一在线业务交互数据,确定第一在线业务交互数据中敏感信息对应的敏感要素,再获得与该敏感要素对应的另一个在线业务交互数据,作为第二在线业务交互数据,从而,第一在线业务交互数据与第二在线业务交互数据具有相同的敏感信息,换言之具有相同的敏感要素主题。然后,匿名迁移处理服务器可以任意获得第三在线业务交互数据,第三在线业务交互数据与第一在线业务交互数据对应不同的敏感要素主题,即第三在线业务交互数据中的敏感信息与第一在线业务交互数据中的敏感信息并非相同类型的敏感信息。匿名迁移处理服务器可以将第二在线业务交互数据与第三在线业务交互数据加载到数据匿名迁移算法,调用数据匿名迁移算法的匿名迁移处理单元,实现第二在线业务交互数据和第三在线业务交互数据之间的数据匿名迁移,得到第四在线业务交互数据,且第四在线业务交互数据依据第二在线业务交互数据的敏感-泛化逻辑进行选择性匿名处理。
比如,第一在线业务交互数据中包含在线电商用户信息A的敏感信息,且第一在线业务交互数据的原始泛化信息为inA1。第二在线业务交互数据中包含在线电商用户信息A的敏感信息,且第二在线业务交互数据的原始泛化信息为inA2。第三在线业务交互数据中包含智慧政企办理记录B的敏感信息,且第三在线业务交互数据的原始泛化信息为inB。可见,在线电商用户信息A的敏感信息与智慧政企办理记录B的敏感信息不同,换言之,第三在线业务交互数据与第一在线业务交互数据、第二在线业务交互数据均具有不同的敏感信息。匿名迁移处理服务器基于智慧政企办理记录B的敏感信息对第二在线业务交互数据中在线电商用户信息A的敏感信息进行匿名处理,得到第四在线业务交互数据。从而,将第一在线业务交互数据作为待匿名敏感业务数据,即提供在线电商用户信息A的敏感信息、inA1;将第四在线业务交互数据作为迁移标的脱敏业务数据,提供智慧政企办理记录B的敏感信息、inA2;将第二在线业务交互数据作为匿名迁移辅助决策数据,提供在线电商用户信息A的敏感信息、inA2,从而生成匿名迁移数据集。因此,匿名迁移辅助决策数据是泛化类别,而不是敏感类别。
在本发明实施例中,作为匿名迁移辅助决策数据的第二在线业务交互数据,是泛化类别,而不是敏感类别,以该匿名迁移辅助决策数据作为参考,使得匿名迁移处理单元输出的已匿名业务数据的匿名处理逻辑尽可能与匿名迁移辅助决策数据匹配,从而提高数据匿名迁移处理的精度和可信度。
对于一些可能的示例而言,匿名迁移处理服务器获得到以上的匿名迁移数据集之后,可加载到数据匿名迁移算法中,对数据匿名迁移算法进行算法优化。
对于一些可能的示例而言,匿名迁移处理服务器获得到以上的匿名迁移数据集之后,先对匿名迁移数据集中三种数据分别进行数据预处理,使用预处理所得的业务数据,对数据匿名迁移算法进行优化。
示例性的,数据预处理包括但不限于:(1)匿名迁移处理服务器对业务数据进行敏感信息捕捉,获得敏感信息集。敏感信息捕捉所对应的敏感信息捕捉模型,可采用事先完成优化的人工智能算法;(2)、匿名区块捕捉,在敏感信息集内进行匿名区块捕捉,获得敏感信息的匿名区块,比如认证密码、联系方式、项目方案细则的匿名区块;(3)敏感信息核对,根据识别出的匿名区块,对敏感信息进行核对和校正,敏感信息核对后拆分出敏感信息集。
匿名迁移处理服务器可以通过以上预处理,获得完成拆分的待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据,将完成拆分的图像加载到数据匿名迁移算法,数据匿名迁移算法输出的已匿名业务数据仅包含敏感信息,再基于该输出的已匿名业务数据和迁移标的脱敏业务数据进行数据匿名迁移处理,从而得到最后输出的已匿名业务数据。如此,可以保障数据匿名迁移算法的优化效果。
S304,依据迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量。
其中,业务数据的原始泛化信息描述向量,能够反映业务数据所对应的非隐私/非敏感信息的特征,业务数据的敏感信息描述向量,能够反映业务数据所对应的隐私/敏感信息的特征。进一步地,通过整合迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量这两类描述向量,所得的匿名跳转联动向量能够实现对原始泛化信息和敏感信息的全局化分析,从而深入剖析原始泛化信息和敏感信息之间的区分逻辑和分布联系。
对于一些可能的示例而言,匿名迁移处理服务器可以调用数据匿名迁移算法的泛化知识抽取层,对迁移标的脱敏业务数据进行知识抽取,得到迁移标的脱敏业务数据的原始泛化信息描述向量;调用数据匿名迁移算法的敏感知识抽取层,对待匿名敏感业务数据进行知识抽取,得到待匿名敏感业务数据的敏感信息描述向量。
在本发明实施例中,数据匿名迁移算法除了包括匿名迁移处理层与匿名迁移评估层,还包括已经事先完成优化的泛化知识抽取层与敏感知识抽取层,泛化知识抽取层与敏感知识抽取层,皆是事先完成优化的人工智能算法。
泛化知识抽取层可利用RNN(循环神经网络)进行部署。泛化知识抽取层可通过若干业务数据样本和对应的泛化知识真值来优化,完成优化的泛化知识抽取层可用于挖掘业务数据的原始泛化信息描述向量,原始泛化信息描述向量在本发明实施例中可用来指示泛化信息的一致性,即指示已匿名业务数据与迁移标的脱敏业务数据之间的原始泛化信息的匹配。匿名迁移处理服务器可以通过泛化知识抽取层直接对迁移标的脱敏业务数据进行知识抽取,得到相应的原始泛化信息描述向量。匿名迁移处理服务器还可以通过泛化知识抽取层对迁移标的脱敏业务数据进行敏感信息捕捉,根据捕捉结果确定迁移标的脱敏业务数据中的敏感信息集,再对敏感信息集进行知识抽取,得到相应的原始泛化信息描述向量。
敏感知识抽取层可利用RNN(循环神经网络)进行部署。敏感知识抽取层可通过若干业务数据样本和对应的敏感知识真值来优化,完成优化的敏感知识抽取层可用于挖掘业务数据的敏感信息描述向量,敏感信息描述向量在本发明实施例中可用来指示敏感信息的一致性,即指示已匿名业务数据与待匿名敏感业务数据之间的敏感信息的匹配。匿名迁移处理服务器可以通过敏感知识抽取层直接对待匿名敏感业务数据进行知识抽取,得到相应的敏感信息描述向量。匿名迁移处理服务器还可以通过敏感知识抽取层对迁移标的脱敏业务数据进行敏感信息捕捉,根据捕捉结果确定待匿名敏感业务数据中的敏感信息集,再对敏感信息集进行知识抽取,得到相应的敏感信息描述向量。
匿名跳转联动向量,是匿名迁移处理服务器将迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量整合所得的特征向量。
匿名迁移处理服务器所得的匿名跳转联动向量,可在后续与匿名迁移所对应的匿名迁移要素向量一并用于数据翻译,输出已匿名业务数据。换言之,本发明实施例中,在优化数据匿名迁移算法时,不仅迁移标的脱敏业务数据与待匿名敏感业务数据自身的匿名迁移要素向量会用于数据翻译从而得到已匿名业务数据,迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,也会用于数据翻译从而得到已匿名业务数据,使得所确定的已匿名业务数据不仅可以基于迁移标的脱敏业务数据的原始泛化信息进行选择性匿名处理,还可以基于待匿名敏感业务数据的敏感信息进行精准化匿名,换言之,在参考了迁移标的脱敏业务数据的整体的数据匿名逻辑的情况下,还可以自适应地基于待匿名敏感业务数据的敏感信息进行匿名处理微调。
S306,调用数据匿名迁移算法的匿名迁移处理层,根据待匿名敏感业务数据与迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,并依据整理匿名迁移要素向量与匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,得到已匿名业务数据。
在一些示例下,数据匿名迁移算法包括敏感知识抽取层、泛化知识抽取层、匿名迁移处理层与匿名迁移评估层。
本发明实施例中,数据匿名迁移算法通过匿名迁移处理层(生成模型)与匿名迁移评估层(鉴别模型)形成的生成对抗模型进行优化。
对于一些可能的示例而言,匿名迁移处理层包括特征提取核(编码器)和特征翻译核(解码器),特征提取核(编码器)和特征翻译核(解码器)分别用于特征提取和特征翻译,也即,基于特征提取核,可以实现业务数据→描述向量的处理,基于特征翻译核,可以实现描述向量→业务数据的处理。
对于一些可能的示例而言,调用数据匿名迁移算法的匿名迁移处理层,根据待匿名敏感业务数据与迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,包括:将待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据;将混合业务数据加载到数据匿名迁移算法;调用数据匿名迁移算法的匿名迁移处理层,对混合业务数据进行数据挖掘,得到对迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量。
示例性地,匿名迁移处理服务器可以将待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,整合后所得的混合业务数据,被加载到匿名迁移处理层的特征提取核中,通过该特征提取核,对混合业务数据逐步特征提取,得到匿名迁移要素向量,该匿名迁移要素向量同样携带了待匿名敏感业务数据的细节特征与迁移标的脱敏业务数据的细节特征。
进一步地,匿名迁移处理服务器可以将匿名迁移要素向量与以上的匿名跳转联动向量进行拼接,得到数据匿名输出向量,该数据匿名输出向量携带了匿名迁移要素向量的内容与匿名跳转联动向量的匿名推演特征(匿名处理的风格)。
对于一些可能的示例而言,匿名迁移处理服务器可以分别确定匿名迁移要素向量、匿名跳转联动向量的第一量化指标(均值)与第二量化指标(标准差);根据匿名迁移要素向量的第一量化指标与第二量化指标,对匿名迁移要素向量进行标准化处理(归一化操作),得到标准化后的匿名迁移要素向量;根据匿名跳转联动向量的第一量化指标与第二量化指标,将匿名跳转联动向量的匿名推演特征映射到标准化后的匿名迁移要素向量,得到数据匿名输出向量。
示例性地,匿名迁移处理服务器可以将匿名迁移要素向量与匿名跳转联动向量进行融合,得到数据匿名输出向量。首先,匿名迁移处理服务器利用匿名迁移要素向量的第一量化指标与第二量化指标,对匿名迁移要素向量进行标准化处理,换言之,将匿名迁移要素向量减去匿名迁移要素向量的第一量化指标后除以匿名迁移要素向量的第二量化指标,就可以得到标准化后的匿名迁移要素向量,匿名迁移要素向量通过标准化处理,标准化处理后的向量的第一量化指标为0,第二量化指标为1,从而过滤了匿名迁移要素向量原本的匿名推演特征,存留了匿名迁移要素向量自身的细节信息。然后,利用匿名跳转联动向量的第一量化指标与第二量化指标,将匿名跳转联动向量的匿名推演特征映射到标准化后的匿名迁移要素向量,换言之,将标准化后的匿名迁移要素向量乘以匿名跳转联动向量的第二量化指标再加上匿名跳转联动向量的第一量化指标,得到数据匿名输出向量,如此,使所得的数据匿名输出向量存留了匿名迁移要素向量的细节信息而兼顾匿名跳转联动向量的匿名推演特征。
可以理解,匿名迁移要素向量同时携带待匿名敏感业务数据的细节特征与迁移标的脱敏业务数据的细节特征,匿名跳转联动向量同时携带数据匿名迁移所对应的原始泛化信息描述向量与敏感信息描述向量,进而,通过这种方式整合匿名迁移要素向量与匿名跳转联动向量,所得的数据匿名输出向量,能够特征翻译过程中尽可能匹配之前的匿名处理逻辑,从而准确可靠地实现数据匿名迁移处理。
S308,调用数据匿名迁移算法的匿名迁移评估层,根据已匿名业务数据与匿名迁移辅助决策数据,得到相应的数据类别评估报告,数据类别包括敏感类别和泛化类别。
可以理解,数据匿名迁移算法还包括匿名迁移评估层,匿名迁移评估层用于鉴别输入的业务数据是敏感类别还是泛化类别。在通过匿名迁移处理单元输出已匿名业务数据后,匿名迁移处理服务器将该已匿名业务数据输入匿名迁移评估层,通过匿名迁移评估层对于输入的已匿名业务数据进行知识抽取得到鉴别特征,利用鉴别特征进行数据类别的二元回归,得到相应的数据类别评估报告。本发明实施例中,匿名迁移评估层的二元回归是关于数据类别的分类处理,即鉴别业务数据为敏感类别或是泛化类别。敏感类别可以理解为匿名迁移不满足要求的业务数据类别,泛化类别可以理解为匿名迁移满足要求的业务数据类别。可见,如果匿名迁移不满足要求,则业务数据中还存在部分敏感/隐私信息,因此可赋予敏感类别的标签,如果匿名迁移满足要求,则业务数据中不存在部分敏感/隐私信息,仅存在泛化数据信息,因此可赋予泛化类别的标签。
另外,匿名迁移处理服务器还会将匿名迁移数据集中的匿名迁移辅助决策数据输入匿名迁移评估层,通过匿名迁移评估层对于输入的匿名迁移辅助决策数据进行知识抽取得到鉴别特征,利用提取的鉴别进行数据类别的二元回归,得到相应的数据类别评估报告。
对于一些可能的示例而言,调用数据匿名迁移算法的匿名迁移评估层,根据已匿名业务数据与匿名迁移辅助决策数据,得到相应的数据类别评估报告,包括:将已匿名业务数据输入数据匿名迁移算法的匿名迁移评估层,得到已匿名业务数据属于泛化类别的第一可能性;将匿名迁移辅助决策数据输入数据匿名迁移算法的匿名迁移评估层,得到匿名迁移辅助决策数据属于泛化类别的第二可能性。
S310,利用已匿名业务数据的原始泛化信息描述向量与迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、已匿名业务数据的敏感信息描述向量与待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及数据类别评估报告,改进匿名迁移处理层与匿名迁移评估层。
本发明实施例中,数据匿名迁移算法包括匿名迁移处理层与匿名迁移评估层,匿名迁移处理层与匿名迁移评估层利用匿名迁移评估层对匿名迁移处理达标的业务数据与匿名迁移处理未达标的业务数据的数据类别评估报告进行对抗优化。另外,本发明实施例中,为了使输出的已匿名业务数据尽可能与迁移标的脱敏业务数据的数据匿名逻辑匹配,在优化过程中,匿名迁移处理服务器还会根据已匿名业务数据的原始泛化信息描述向量与迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、已匿名业务数据的敏感信息描述向量与待匿名敏感业务数据的敏感信息描述向量之间的比较结果,改进匿名迁移处理层与匿名迁移评估层的算法变量。已匿名业务数据的原始泛化信息描述向量可通过以上的泛化知识抽取层进行业务数据知识抽取得到,已匿名业务数据的敏感信息描述向量可通过以上的敏感知识抽取层进行业务数据知识抽取得到。
对于一些可能的示例而言,匿名迁移处理服务器轮流地,在锁定匿名迁移处理层的算法变量的基础上,根据已匿名业务数据属于泛化类别的第一可能性与匿名迁移辅助决策数据属于泛化类别的第二可能性,生成关于匿名迁移评估层的评估代价,利用评估代价改进匿名迁移评估层的算法变量;在锁定匿名迁移评估层的算法变量的基础上,根据已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移处理层的匿名迁移代价,根据已匿名业务数据的原始泛化信息描述向量与迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果,生成泛化识别代价,根据已匿名业务数据的敏感信息描述向量与待匿名敏感业务数据的敏感信息描述向量之间的比较结果,生成敏感识别代价,根据匿名迁移代价、泛化识别代价与敏感识别代价,生成关于匿名迁移处理层的全局代价,利用全局代价改进匿名迁移处理层的算法变量;直到符合优化终止要求时完成优化,得到完成优化的匿名迁移评估层与匿名迁移处理层。
在本发明实施例中,数据匿名迁移算法的优化包括两个轮流进行的环节,第一环节是优化匿名迁移评估层,第二环节是优化匿名迁移处理层。可以理解,在所述匿名迁移处理层的算法变量处于锁定状态时,所述匿名迁移评估层的算法变量处于非锁定状态;在所述匿名迁移评估层的算法变量处于锁定状态时,所述匿名迁移处理层的算法变量处于非锁定状态。
第一环节的优化目标是使匿名迁移评估层尽可能将已匿名业务数据鉴别为敏感类别,且使匿名迁移评估层尽可能将匿名迁移辅助决策数据鉴别为泛化类别,因此,在第一环节,锁定匿名迁移处理层的算法变量,将匿名迁移数据集输入数据匿名迁移算法,输出已匿名业务数据后,匿名迁移处理服务器根据匿名迁移评估层分别评估的关于已匿名业务数据与匿名迁移辅助决策数据的数据类别评估报告,对匿名迁移评估层的算法变量进行改进。换言之,匿名迁移处理服务器在锁定匿名迁移处理层的算法变量的基础上,根据已匿名业务数据属于泛化类别的第一可能性与匿名迁移辅助决策数据属于泛化类别的第二可能性,生成关于匿名迁移评估层的评估代价,利用评估代价改进匿名迁移评估层的算法变量。
第二环节的优化目标是使匿名迁移处理层输出的已匿名业务数据尽可能“干扰”匿名迁移评估层,被匿名迁移评估层评估成泛化类别,因此,在第二环节,锁定匿名迁移评估层的算法变量,将同一批匿名迁移数据集,输入数据匿名迁移算法,通过匿名迁移处理层输出已匿名业务数据后,根据匿名迁移评估层分别评估的关于已匿名业务数据与匿名迁移辅助决策数据的数据类别评估报告,生成用于优化匿名迁移处理层的代价函数,根据该代价函数对匿名迁移处理层的算法变量进行改进。
在第二环节中,用于优化匿名迁移处理层的代价函数中,除了匿名迁移处理层的匿名迁移代价,匿名迁移处理服务器还会引入泛化识别代价与敏感识别代价。示例性的,匿名迁移处理服务器调用数据匿名迁移算法的泛化知识抽取层,对已匿名业务数据进行知识抽取,得到已匿名业务数据的原始泛化信息描述向量;调用数据匿名迁移算法的敏感知识抽取层,对已匿名业务数据进行知识抽取,得到已匿名业务数据的敏感信息描述向量;其中,泛化知识抽取层与敏感知识抽取层,皆是事先完成优化的人工智能算法。
从而,在第二环节,匿名迁移处理服务器可以根据已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移处理层的匿名迁移代价,根据已匿名业务数据的原始泛化信息描述向量与迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果,生成泛化识别代价,根据已匿名业务数据的敏感信息描述向量与待匿名敏感业务数据的敏感信息描述向量之间的比较结果,生成敏感识别代价,根据匿名迁移代价、泛化识别代价与敏感识别代价,生成关于匿名迁移处理层的全局代价,利用全局代价改进匿名迁移处理层的算法变量。
其中,匿名迁移代价、泛化识别代价与敏感识别代价可以分别理解为匿名迁移处理的损失函数,泛化信息识别的损失函数以及敏感信息识别的损失函数,全局代价则可以理解为对匿名迁移代价、泛化识别代价与敏感识别代价进行加权之后的整体损失函数。
在另一些可能的设计思路下,大数据匿名迁移处理方法包括以下步骤。
S502,获得匿名迁移数据集,匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据。
S504,调用数据匿名迁移算法的泛化知识抽取层,对迁移标的脱敏业务数据进行知识抽取,得到迁移标的脱敏业务数据的原始泛化信息描述向量。
S506,调用数据匿名迁移算法的敏感知识抽取层,对待匿名敏感业务数据进行知识抽取,得到待匿名敏感业务数据的敏感信息描述向量。
S508,依据迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量。
S510,将待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据,将混合业务数据加载到数据匿名迁移算法,调用数据匿名迁移算法的匿名迁移处理层,对混合业务数据进行数据挖掘,得到对迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量。
S512,分别确定匿名迁移要素向量、匿名跳转联动向量的第一量化指标与第二量化指标,根据匿名迁移要素向量的第一量化指标与第二量化指标,对匿名迁移要素向量进行标准化处理,得到标准化后的匿名迁移要素向量,根据匿名跳转联动向量的第一量化指标与第二量化指标,将匿名跳转联动向量的匿名推演特征映射到标准化后的匿名迁移要素向量,得到数据匿名输出向量。
S514,调用数据匿名迁移算法的匿名迁移处理层,对数据匿名输出向量进行数据翻译,得到已匿名业务数据。
S516,将已匿名业务数据输入数据匿名迁移算法的匿名迁移评估层,得到已匿名业务数据属于泛化类别的第一可能性。
S518,将匿名迁移辅助决策数据输入数据匿名迁移算法的匿名迁移评估层,得到匿名迁移辅助决策数据属于泛化类别的第二可能性。
S520,在锁定匿名迁移处理层的算法变量的基础上,根据已匿名业务数据属于泛化类别的第一可能性与匿名迁移辅助决策数据属于泛化类别的第二可能性,生成关于匿名迁移评估层的评估代价,利用评估代价改进匿名迁移评估层的算法变量。
S522,在锁定匿名迁移评估层的算法变量的基础上,调用数据匿名迁移算法的泛化知识抽取层,对已匿名业务数据进行知识抽取,得到已匿名业务数据的原始泛化信息描述向量;调用数据匿名迁移算法的敏感知识抽取层,对已匿名业务数据进行知识抽取,得到已匿名业务数据的敏感信息描述向量;以及根据已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移处理层的匿名迁移代价,根据已匿名业务数据的原始泛化信息描述向量与迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果,生成泛化识别代价,根据已匿名业务数据的敏感信息描述向量与待匿名敏感业务数据的敏感信息描述向量之间的比较结果,生成敏感识别代价,根据匿名迁移代价、泛化识别代价与敏感识别代价,生成关于匿名迁移处理层的全局代价,利用全局代价改进匿名迁移处理层的算法变量。
以上大数据匿名迁移处理方法中,在优化数据匿名迁移算法时,不仅迁移标的脱敏业务数据与待匿名敏感业务数据自身的匿名迁移要素向量会用于数据翻译从而得到已匿名业务数据,迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,也会用于数据翻译从而得到已匿名业务数据,使得所确定的已匿名业务数据不仅可以基于迁移标的脱敏业务数据的原始泛化信息进行选择性匿名处理,还可以基于待匿名敏感业务数据的敏感信息进行精准化匿名,换言之,在参考了迁移标的脱敏业务数据的整体的数据匿名逻辑的情况下,还可以自适应地基于待匿名敏感业务数据的敏感信息进行匿名处理微调。
另外,通过迁移标的脱敏业务数据的原始泛化信息描述向量与已匿名业务数据的原始泛化信息描述向量之间的比较结果,待匿名敏感业务数据的敏感信息描述向量与已匿名业务数据的敏感信息描述向量之间的比较结果,来改进数据匿名迁移算法,迁移标的脱敏业务数据的原始泛化信息描述向量与已匿名业务数据的原始泛化信息描述向量之间的比较结果能够指导已匿名业务数据与迁移标的脱敏业务数据之间的原始泛化信息的匹配,待匿名敏感业务数据的敏感信息描述向量与已匿名业务数据的敏感信息描述向量之间的比较结果能够指导已匿名业务数据与待匿名敏感业务数据之间的敏感信息的匹配,如此,就算迁移标的脱敏业务数据的原始泛化信息较为繁杂,生成的已匿名业务数据依然可以沿用迁移标的脱敏业务数据的数据匿名逻辑,保障数据匿名迁移处理的精度和可信度。而且,改进数据匿名迁移算法的匿名迁移处理层与匿名迁移评估层的算法变量时,还会依据匿名迁移评估层对已匿名业务数据与匿名迁移辅助决策数据评估的数据类别评估报告,实现匿名迁移处理层与匿名迁移评估层的鲁棒性针对优化,确保数据匿名迁移算法生成的已匿名业务数据的匿名精度和可信度。
对于一些可能的示例而言,本发明在优化数据匿名迁移算法时,还考虑了事先完成优化的匿名区块分析算法,根据迁移标的脱敏业务数据与已匿名业务数据各自对应的匿名区块信息之间的比较结果,优化数据匿名迁移算法的匿名迁移处理层。示例性地,以上方法还可以包括:通过事先完成优化的匿名区块分析算法,分别对迁移标的脱敏业务数据与已匿名业务数据进行匿名区块捕捉,得到各自对应的匿名区块信息;根据迁移标的脱敏业务数据与已匿名业务数据各自对应的匿名区块信息之间的比较结果,生成匿名区块匹配代价;匿名区块匹配代价用于辅助数据匿名迁移算法的匿名迁移处理层的优化。
为了更好的实现数据匿名迁移处理的精度,本发明实施例中在优化数据匿名迁移算法时,还考虑了匿名区块分析算法。匿名区块分析算法可以确定出业务数据中匿名区块的分布标签(位置情况),从而根据迁移标的脱敏业务数据与已匿名业务数据各自对应的匿名区块信息之间的比较结果,生成匿名区块匹配代价,参与匿名迁移处理层的优化,可保证迁移标的脱敏业务数据与已匿名业务数据的数据匿名逻辑的匹配度。其中,匿名区块可以理解为需进行匿名处理的信息片段、数据片段等。
对于一些可能的示例而言,匿名迁移处理服务器通过匿名区块分析算法分别确定出已匿名业务数据与迁移标的脱敏业务数据的匿名区块,对于部分或所有的匿名区块,根据已匿名业务数据与迁移标的脱敏业务数据对应同一匿名区块的描述值,计算描述值比较结果的平方,再进行求和,记为匿名区块匹配代价。在优化时,匿名区块匹配代价越小越好。比如,对于匿名区块block3,根据已匿名业务数据的原始泛化信息描述向量与迁移标的脱敏业务数据的原始泛化信息描述向量各自对应匿名区块block3的描述值,对比较结果(差值)取平方,按照这样的方式对匿名区块求和,便可以得到匿名区块匹配代价。
在本发明实施例中,通过在优化数据匿名迁移算法时,考虑了匿名区块分析算法与匿名区块匹配代价,可以使完成优化的数据匿名迁移算法的匿名迁移处理层输出原始泛化信息尽可能丰富的已匿名业务数据,在保障已匿名业务数据的匿名迁移处理精度的前提下,提高已匿名业务数据的数据可用性。
对于一些可能的示例而言,本发明在优化数据匿名迁移算法时,还考虑了事先完成优化的知识抽取算法,根据迁移标的脱敏业务数据与已匿名业务数据各自对应的业务数据视觉知识之间的比较结果,优化数据匿名迁移算法的匿名迁移处理层。示例性地,以上方法还可以包括:通过事先完成优化的知识抽取算法,分别对已匿名业务数据与匿名迁移辅助决策数据进行业务数据知识抽取,得到各自对应的业务数据视觉知识;根据已匿名业务数据与匿名迁移辅助决策数据各自对应的业务数据视觉知识之间的比较结果,生成共性度量代价;共性度量代价用于辅助数据匿名迁移算法的匿名迁移处理层的优化。
在本发明实施例中,为了权衡已匿名业务数据与匿名迁移辅助决策数据在特征层面上的比较结果,期望生成的已匿名业务数据与匿名迁移辅助决策数据的特征尽可能类似,在优化数据匿名迁移算法时,还考虑了共性度量代价,共性度量代价比如可以是余弦相似度。预完成优化的知识抽取算法,用于分别提取已匿名业务数据与匿名迁移辅助决策数据在不同阶段的特征,比较已匿名业务数据与匿名迁移辅助决策数据在对应同一阶段的特征比较结果,生成共性度量代价。优化时,期望已匿名业务数据与匿名迁移辅助决策数据的特征比较结果越小越好。
在本发明实施例中,通过在优化数据匿名迁移算法时,根据已匿名业务数据与匿名迁移辅助决策数据的特征向量之间的相似性,生成共性度量代价,参与数据匿名迁移算法的匿名迁移处理层的优化,能够使完成优化的数据匿名迁移算法的匿名迁移处理层可生成匿名迁移处理精度较高的已匿名业务数据。
对于一些可能的示例而言,本发明在优化数据匿名迁移算法时,还考虑了业务数据调整代价,根据匿名迁移辅助决策数据与已匿名业务数据之间的字段级比较结果,生成业务数据调整代价,优化数据匿名迁移算法的匿名迁移处理层。示例性地,以上方法还可以包括:根据已匿名业务数据与匿名迁移辅助决策数据之间的字段级比较结果,生成业务数据调整代价;其中,业务数据调整代价用于辅助数据匿名迁移算法的匿名迁移处理层的优化。在优化时,期望已匿名业务数据和匿名迁移辅助决策数据之间的字段级比较结果越小越好。
可以理解的是,在优化数据匿名迁移算法时,在匿名迁移处理层的优化环节,可同时引入以上的匿名迁移代价、泛化识别代价、敏感识别代价、匿名区块匹配代价、共性度量代价与业务数据调整代价,生成匿名迁移处理层整体的全局代价,以实现高质量的数据匿名迁移处理,提高数据匿名处理的效率。
在一些示例下,优化数据匿名迁移算法时引入的模型层包括:匿名迁移处理层、匿名迁移评估层、泛化知识抽取层、敏感知识抽取层、匿名区块分析算法、知识抽取算法。
进一步地,对数据匿名迁移算法的优化过程包括如下内容。
【1】、匿名迁移处理服务器获得算法优化依据(训练示例),算法优化依据包括多个匿名迁移数据集,匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据。
【2】、匿名迁移处理服务器通过事先完成优化的泛化知识抽取层,对迁移标的脱敏业务数据进行知识抽取,得到迁移标的脱敏业务数据的原始泛化信息描述向量。通过事先完成优化的敏感知识抽取层,对待匿名敏感业务数据进行知识抽取,得到待匿名敏感业务数据的敏感信息描述向量,依据迁移标的脱敏业务数据的原始泛化信息描述向量与待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量。
【3】、匿名迁移处理服务器还将待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据,将混合业务数据加载到数据匿名迁移算法,调用数据匿名迁移算法的匿名迁移处理层,对混合业务数据进行数据挖掘,得到对迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量。
【4】、匿名迁移处理服务器融合匿名迁移要素向量与匿名跳转联动向量,得到数据匿名输出向量,并调用数据匿名迁移算法的匿名迁移处理层,依据数据匿名输出向量进行数据翻译,得到已匿名业务数据。
【5】、匿名迁移处理服务器调用数据匿名迁移算法的匿名迁移评估层,将已匿名业务数据输入数据匿名迁移算法的匿名迁移评估层,得到已匿名业务数据属于泛化类别的第一可能性,将匿名迁移辅助决策数据输入数据匿名迁移算法的匿名迁移评估层,得到匿名迁移辅助决策数据属于泛化类别的第二可能性。
【6】、在锁定匿名迁移处理层的算法变量的基础上,根据已匿名业务数据属于泛化类别的第一可能性与匿名迁移辅助决策数据属于泛化类别的第二可能性,生成关于匿名迁移评估层的评估代价,利用评估代价改进匿名迁移评估层的算法变量。
【7】、在锁定匿名迁移评估层的算法变量的基础上,匿名迁移处理服务器重新将已匿名业务数据输入改进后的匿名迁移评估层,得到已匿名业务数据属于泛化类别的第一可能性,根据已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移处理层的匿名迁移代价。调用数据匿名迁移算法的泛化知识抽取层,对已匿名业务数据进行知识抽取,得到已匿名业务数据的原始泛化信息描述向量,根据已匿名业务数据的原始泛化信息描述向量与迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果,生成泛化识别代价。调用数据匿名迁移算法的敏感知识抽取层,对已匿名业务数据进行知识抽取,得到已匿名业务数据的敏感信息描述向量,根据已匿名业务数据的敏感信息描述向量与待匿名敏感业务数据的敏感信息描述向量之间的比较结果,生成敏感识别代价。通过事先完成优化的匿名区块分析算法,分别对迁移标的脱敏业务数据与已匿名业务数据进行匿名区块捕捉,得到各自对应的匿名区块信息,根据迁移标的脱敏业务数据与已匿名业务数据各自对应的匿名区块信息之间的比较结果,生成匿名区块匹配代价。通过事先完成优化的知识抽取算法,分别对已匿名业务数据与匿名迁移辅助决策数据进行业务数据知识抽取,得到各自对应的业务数据视觉知识,根据已匿名业务数据与匿名迁移辅助决策数据各自对应的业务数据视觉知识之间的比较结果,生成共性度量代价。根据已匿名业务数据与匿名迁移辅助决策数据之间的字段级比较结果,生成业务数据调整代价。最后,根据匿名迁移代价、泛化识别代价、敏感识别代价、匿名区块匹配代价、共性度量代价、业务数据调整代价,生成关于匿名迁移处理层的全局代价,利用全局代价改进匿名迁移处理层的算法变量。
基于上述轮流的优化方式,在符合优化终止要求时,就可以得到完成优化的数据匿名迁移算法。
对于一些可能的示例而言,在得到完成优化的数据匿名迁移算法之后,匿名迁移处理服务器可以利用完成优化的数据匿名迁移算法中的匿名迁移处理层、事先完成优化的泛化知识抽取层与敏感知识抽取层,对待进行匿名处理的业务数据进行匿名迁移处理,得到已匿名业务数据。
在一些示例下,该方法还可以包括如下内容。
S1102,获得迁移标的脱敏数据流与包含目标敏感信息的待匿名敏感业务数据。
其中,待匿名敏感业务数据可以是包含敏感信息的初始业务数据。
S1104,对于迁移标的脱敏数据流的每一个迁移标的脱敏数据,通过完成优化的泛化知识抽取层,对迁移标的脱敏数据进行知识抽取,得到迁移标的脱敏数据的原始泛化信息描述向量。
其中,匿名迁移处理服务器可对迁移标的脱敏数据进行后续的处理。
S1106,通过完成优化的敏感知识抽取层,对待匿名敏感业务数据进行知识抽取,得到待匿名敏感业务数据的敏感信息描述向量。
S1108,整合原始泛化信息描述向量与敏感信息描述向量,得到匿名跳转联动向量。
S1110,通过完成优化的数据匿名迁移算法的匿名迁移处理层,根据包含目标敏感信息的待匿名敏感业务数据与迁移标的脱敏数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量。
S1112,融合匿名迁移要素向量与匿名跳转联动向量,得到数据匿名输出向量。
S1114,通过完成优化的数据匿名迁移算法的匿名迁移处理层,依据数据匿名输出向量进行数据翻译,获得依据迁移标的脱敏数据的数据匿名规则对目标敏感信息进行匿名迁移处理的匿名化业务数据流。
在一些可独立实施的设计思路下,在获得依据所述迁移标的脱敏数据的数据匿名规则对所述目标敏感信息进行匿名迁移处理的匿名化业务数据流之后,该方法还可以包括如下内容:响应于目标业务推送分析系统针对所述匿名化业务数据流的调用请求,将所述匿名化业务数据流下发至所述目标业务推送分析系统并对所述目标业务推送分析系统进行实时监听处理;依据对所述目标业务推送分析系统进行实时监听处理得到的针对所述匿名化业务数据流的数据使用日志,进行关于所述目标业务推送分析系统的异常数据使用行为分析,得到异常数据使用行为分析结果;基于所述异常数据使用行为分析结果调整所述目标业务推送分析系统的数据使用权限。
可以理解,在完成匿名迁移处理获得匿名化业务数据流之后,匿名化业务数据流可以作为共享的数据流提供给第三方,在此基础上,可以依据调用请求进行匿名化业务数据流的下发,并通过针对目标业务推送分析系统的实时监听处理进行后续的异常数据使用行为分析,从而通过目标业务推送分析系统的数据使用权限调整以最大限度保障匿名化业务数据流的数据安全性,换言之,在保障了用户隐私信息安全的前提下,通过对数据使用进行实时监听处理、异常数据使用行为分析以及数据使用权限调整,能够进一步保障匿名化业务数据流的使用安全性。
在一些可独立实施的设计思路下,所述依据对所述目标业务推送分析系统进行实时监听处理得到的针对所述匿名化业务数据流的数据使用日志,进行关于所述目标业务推送分析系统的异常数据使用行为分析,包括:获取所述数据使用日志对应的待分析使用行为事件描述,并从云端数据库中调取目标使用行为事件描述;分别提取所述待分析使用行为事件描述和所述目标使用行为事件描述的数据加工逻辑知识和异常行为倾向检测知识,并根据所述待分析使用行为事件描述和所述目标使用行为事件描述的数据加工逻辑知识,确定所述待分析使用行为事件描述和所述目标使用行为事件描述之间的异常分析联动知识;根据所述待分析使用行为事件描述和所述目标使用行为事件描述之间的异常分析联动知识和所述异常行为倾向检测知识,确定所述待分析使用行为事件描述和所述目标使用行为事件描述的一致性评分;根据所述一致性评分,确定所述待分析使用行为事件描述和所述目标使用行为事件描述的配对信息;在所述配对信息表征所述待分析使用行为事件描述和所述目标使用行为事件描述配对成功的前提下,将所述目标使用行为事件描述的异常行为标签作为所述待分析使用行为事件描述的异常行为标签。
在本发明实施例中,在对目标业务推送分析系统进行异常数据使用行为分析时,能够从云端数据库中调取目标使用行为事件描述作为参考,并综合数据加工逻辑知识(数据使用过程中的加工逻辑特征)和异常行为倾向检测知识(数据使用过程中的行为偏好特征)确定待分析使用行为事件描述(待分析使用行为事件特征)和所述目标使用行为事件描述(目标使用行为事件特征)的一致性评分(相似性),这样可以基于一致性评分确定出的配对信息快速、准确地获得待分析使用行为事件描述的异常行为标签。
在本发明实施例中,可以根据不同的异常行为标签进行不同数据的使用权限调整,也可以根据不同的异常行为标签对目标业务推送分析系统的安全验证方式进行调整。
在一些可独立实施的设计思路下,基于已完成调试的事件描述分析网络,以所述待分析使用行为事件描述和所述目标使用行为事件描述为输入,分别挖掘所述待分析使用行为事件描述和所述目标使用行为事件描述的数据加工逻辑知识和异常行为倾向检测知识,并根据所述待分析使用行为事件描述和所述目标使用行为事件描述的数据加工逻辑知识,确定所述待分析使用行为事件描述和所述目标使用行为事件描述之间的异常分析联动知识;根据所述待分析使用行为事件描述和所述目标使用行为事件描述之间的异常分析联动知识和所述异常行为倾向检测知识,确定所述待分析使用行为事件描述和所述目标使用行为事件描述的一致性评分。
以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种大数据匿名迁移处理方法,其特征在于,应用于匿名迁移处理服务器,所述方法包括:
获得匿名迁移数据集,所述匿名迁移数据集包括待匿名敏感业务数据、迁移标的脱敏业务数据与匿名迁移辅助决策数据;
依据所述迁移标的脱敏业务数据的原始泛化信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量,得到匿名跳转联动向量;
调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,并依据整理所述匿名迁移要素向量与所述匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,得到已匿名业务数据;
调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,所述数据类别包括敏感类别和泛化类别;
利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层。
2.根据权利要求1所述的方法,其特征在于,所述获得匿名迁移数据集,包括:
获得第一在线业务交互数据与第二在线业务交互数据,所述第一在线业务交互数据与第二在线业务交互数据对应相同的敏感要素主题,且对应不同的原始泛化要素主题;
获得第三在线业务交互数据,所述第三在线业务交互数据与所述第一在线业务交互数据对应不同的敏感要素主题;
基于针对所述第二在线业务交互数据和所述第三在线业务交互数据的敏感数据匿名迁移,得到第四在线业务交互数据;
将所述第一在线业务交互数据作为待匿名敏感业务数据、所述第四在线业务交互数据作为迁移标的脱敏业务数据、所述第二在线业务交互数据作为匿名迁移辅助决策数据,以获得一个匿名迁移数据集。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
调用所述数据匿名迁移算法的泛化知识抽取层,对所述迁移标的脱敏业务数据进行知识抽取,得到所述迁移标的脱敏业务数据的原始泛化信息描述向量;
调用所述数据匿名迁移算法的敏感知识抽取层,对所述待匿名敏感业务数据进行知识抽取,得到所述待匿名敏感业务数据的敏感信息描述向量;
其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。
4.根据权利要求1所述的方法,其特征在于,所述调用所述数据匿名迁移算法的匿名迁移处理层,结合所述待匿名敏感业务数据与所述迁移标的脱敏业务数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,包括:将所述待匿名敏感业务数据与迁移标的脱敏业务数据进行整合,得到混合业务数据;将所述混合业务数据加载到所述数据匿名迁移算法;调用所述数据匿名迁移算法的匿名迁移处理层,对所述混合业务数据进行数据挖掘,得到对所述迁移标的脱敏业务数据进行匿名迁移所对应的匿名迁移要素向量;
其中,所述调用所述数据匿名迁移算法的匿名迁移评估层,结合所述已匿名业务数据与所述匿名迁移辅助决策数据,得到相应的数据类别评估报告,包括:将所述已匿名业务数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述已匿名业务数据属于泛化类别的第一可能性;将所述匿名迁移辅助决策数据加载到所述数据匿名迁移算法的匿名迁移评估层,得到所述匿名迁移辅助决策数据属于泛化类别的第二可能性;
其中,所述利用所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果、所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果、以及所述数据类别评估报告,改进所述匿名迁移处理层与所述匿名迁移评估层,包括:在锁定所述匿名迁移处理层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性与所述匿名迁移辅助决策数据属于泛化类别的第二可能性,生成针对所述匿名迁移评估层的评估代价,利用所述评估代价改进所述匿名迁移评估层的算法变量;在锁定所述匿名迁移评估层的算法变量的基础上,结合所述已匿名业务数据属于泛化类别的第一可能性,生成匿名迁移处理层的匿名迁移代价,结合所述已匿名业务数据的原始泛化信息描述向量与所述迁移标的脱敏业务数据的原始泛化信息描述向量之间的比较结果,生成泛化识别代价,结合所述已匿名业务数据的敏感信息描述向量与所述待匿名敏感业务数据的敏感信息描述向量之间的比较结果,生成敏感识别代价,结合所述匿名迁移代价、泛化识别代价与所述敏感识别代价,生成针对所述匿名迁移处理层的全局代价,利用所述全局代价改进所述匿名迁移处理层的算法变量;直到符合优化终止要求时完成优化,得到完成优化的匿名迁移评估层与匿名迁移处理层;其中,在所述匿名迁移处理层的算法变量处于锁定状态时,所述匿名迁移评估层的算法变量处于非锁定状态;在所述匿名迁移评估层的算法变量处于锁定状态时,所述匿名迁移处理层的算法变量处于非锁定状态;
其中,所述方法还包括:获得迁移标的脱敏数据流与包含目标敏感信息的待匿名敏感业务数据;对于所述迁移标的脱敏数据流的每一个迁移标的脱敏数据,获得所述迁移标的脱敏数据的原始泛化信息描述向量;获得所述包含目标敏感信息的待匿名敏感业务数据的敏感信息描述向量;整合所述原始泛化信息描述向量与所述敏感信息描述向量,得到匿名跳转联动向量;通过完成优化的所述数据匿名迁移算法的匿名迁移处理层,结合所述包含目标敏感信息的待匿名敏感业务数据与所述迁移标的脱敏数据进行数据挖掘,得到匿名迁移所对应的匿名迁移要素向量,依据整理所述匿名迁移要素向量与所述匿名跳转联动向量所得的数据匿名输出向量进行数据翻译,获得依据所述迁移标的脱敏数据的数据匿名规则对所述目标敏感信息进行匿名迁移处理的匿名化业务数据流。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
分别确定所述匿名迁移要素向量、所述匿名跳转联动向量的第一量化指标与第二量化指标;
结合所述匿名迁移要素向量的第一量化指标与第二量化指标,对所述匿名迁移要素向量进行标准化处理,得到标准化后的匿名迁移要素向量;
结合所述匿名跳转联动向量的第一量化指标与第二量化指标,将所述匿名跳转联动向量的匿名推演特征映射到所述标准化后的匿名迁移要素向量,得到所述数据匿名输出向量。
6.根据权利要求1所述的方法,其特征在于,在得到已匿名业务数据之后,所述方法还包括:
调用所述数据匿名迁移算法的泛化知识抽取层,对所述已匿名业务数据进行知识抽取,得到所述已匿名业务数据的原始泛化信息描述向量;
调用所述数据匿名迁移算法的敏感知识抽取层,对所述已匿名业务数据进行知识抽取,得到所述已匿名业务数据的敏感信息描述向量;
其中,所述泛化知识抽取层与所述敏感知识抽取层,皆是事先完成优化的人工智能算法。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过事先完成优化的匿名区块分析算法,分别对所述迁移标的脱敏业务数据与所述已匿名业务数据进行匿名区块捕捉,得到各自对应的匿名区块信息;
结合所述迁移标的脱敏业务数据与所述已匿名业务数据各自对应的匿名区块信息之间的比较结果,生成匿名区块匹配代价;所述匿名区块匹配代价用于辅助所述数据匿名迁移算法的匿名迁移处理层的优化。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过事先完成优化的知识抽取算法,分别对所述已匿名业务数据与所述匿名迁移辅助决策数据进行业务数据知识抽取,得到各自对应的业务数据视觉知识;
结合所述已匿名业务数据与所述匿名迁移辅助决策数据各自对应的业务数据视觉知识之间的比较结果,生成共性度量代价;
所述共性度量代价用于辅助所述数据匿名迁移算法的匿名迁移处理层的优化。
9.根据权利要求1所述的方法,其特征在于,所述方法还包括:结合所述已匿名业务数据与所述匿名迁移辅助决策数据之间的字段级比较结果,生成业务数据调整代价;其中,所述业务数据调整代价用于辅助所述数据匿名迁移算法的匿名迁移处理层的优化。
10.一种匿名迁移处理服务器,其特征在于,包括:存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述匿名迁移处理服务器执行如权利要求1-9中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310135747.7A CN116226915A (zh) | 2023-02-20 | 2023-02-20 | 大数据匿名迁移处理方法及匿名迁移处理服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310135747.7A CN116226915A (zh) | 2023-02-20 | 2023-02-20 | 大数据匿名迁移处理方法及匿名迁移处理服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116226915A true CN116226915A (zh) | 2023-06-06 |
Family
ID=86569045
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310135747.7A Pending CN116226915A (zh) | 2023-02-20 | 2023-02-20 | 大数据匿名迁移处理方法及匿名迁移处理服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116226915A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116522401A (zh) * | 2023-07-04 | 2023-08-01 | 成都乐超人科技有限公司 | 基于云数据安全的信息去标识化处理方法及系统 |
-
2023
- 2023-02-20 CN CN202310135747.7A patent/CN116226915A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116522401A (zh) * | 2023-07-04 | 2023-08-01 | 成都乐超人科技有限公司 | 基于云数据安全的信息去标识化处理方法及系统 |
CN116522401B (zh) * | 2023-07-04 | 2023-08-29 | 成都乐超人科技有限公司 | 基于云数据安全的信息去标识化处理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112837069B (zh) | 基于区块链与大数据的安全支付方法及云平台系统 | |
CN111861240A (zh) | 可疑用户识别方法、装置、设备及可读存储介质 | |
CN116226915A (zh) | 大数据匿名迁移处理方法及匿名迁移处理服务器 | |
CN113918621A (zh) | 一种基于互联网金融的大数据防护处理方法及服务器 | |
CN116150349A (zh) | 一种数据产品安全合规性检查方法、装置及服务器 | |
CN112818316A (zh) | 基于声纹的身份识别及应用方法、装置与设备 | |
CN114417405B (zh) | 一种基于人工智能的隐私业务数据分析方法及服务器 | |
CN112632248A (zh) | 问答方法、装置、计算机设备和存储介质 | |
CN110442582B (zh) | 场景检测方法、装置、设备和介质 | |
CN116823428A (zh) | 一种反欺诈检测方法、装置、设备及存储介质 | |
CN110223075B (zh) | 身份认证方法、装置、计算机设备和存储介质 | |
CN111914859A (zh) | 一种服务复用方法、计算设备及计算机可读存储介质 | |
CN111711523B (zh) | 事项办理权限授权方法、装置、计算机设备及存储介质 | |
CN115314268B (zh) | 基于流量指纹和行为的恶意加密流量检测方法和系统 | |
CN112016057A (zh) | 代码文件的隐私保护方法、评估方法及装置及电子设备 | |
CN116484368A (zh) | 基于数字视觉智能的云业务操作风险识别方法及软件产品 | |
CN110928656A (zh) | 一种业务处理方法、装置、计算机设备和存储介质 | |
CN113076533A (zh) | 一种业务处理方法及装置 | |
CN115731583A (zh) | 基于指静脉的手指识别方法和装置、电子设备和存储介质 | |
CN112232443B (zh) | 身份认证方法、装置、设备及存储介质 | |
CN114944950B (zh) | 实名认证方法以及装置 | |
CN113946819A (zh) | 一种基于云计算的在线支付信息入侵检测方法及服务器 | |
CN112671774A (zh) | 基于云计算和区块链的大数据分析方法及数字金融系统 | |
CN112733134A (zh) | 基于大数据和区块链的信息安全防护方法及数字金融平台 | |
CN116049893B (zh) | 一种应对云服务的敏感软件大数据处理方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20230606 |
|
WD01 | Invention patent application deemed withdrawn after publication |