CN113918993A - 一种基于人工智能的用户隐私保护方法及系统 - Google Patents

一种基于人工智能的用户隐私保护方法及系统 Download PDF

Info

Publication number
CN113918993A
CN113918993A CN202111222574.XA CN202111222574A CN113918993A CN 113918993 A CN113918993 A CN 113918993A CN 202111222574 A CN202111222574 A CN 202111222574A CN 113918993 A CN113918993 A CN 113918993A
Authority
CN
China
Prior art keywords
description
privacy information
session log
significant
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111222574.XA
Other languages
English (en)
Inventor
张丽艳
张仕融
张士光
张洪艳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Xingsheng Communication Technology Co ltd
Original Assignee
Guangzhou Xingsheng Communication Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Xingsheng Communication Technology Co ltd filed Critical Guangzhou Xingsheng Communication Technology Co ltd
Priority to CN202111222574.XA priority Critical patent/CN113918993A/zh
Publication of CN113918993A publication Critical patent/CN113918993A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Medical Informatics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及人工智能和用户隐私保护技术领域,具体而言,涉及一种基于人工智能的用户隐私保护方法及系统,仅需对待标记业务会话日志进行隐私信息约束标签的标记操作,这样不仅能够减小业务会话日志处理的计算负荷,还能够确保需分析的业务会话日志标签(隐私信息约束标签)的准确性,可以理解,在精简需分析的关键业务会话日志的基础上,精简了标记过程中的资源浪费量,提高局部用户隐私信息标记效率和标记准确度。由于仅需对待标记业务会话日志的关键业务会话日志进行处理,因此有助于提高用户隐私信息标记的标记准确度以获得更加全面地用户隐私信息标记情况。

Description

一种基于人工智能的用户隐私保护方法及系统
技术领域
本申请实施例涉及人工智能和用户隐私保护技术领域,具体涉及一种基于人工智能的用户隐私保护方法及系统。
背景技术
人工智能作为当下最热的科研领域之一,其理论和技术日益成熟,应用领域也不断扩大,已涉及机器人、语言识别、图像识别、自然语言处理和专家系统等,而这些研究领域都存在各样的隐私保护问题。现目前,随着人工智能、大数据、云计算、移动互联网快速发展和广泛应用,隐私保护面临新的挑战,传统的被动式隐私保护技术,数据生成者并没有主动参与隐私保护,仅仅依靠数据收集者的隐私保护技术是不完整的。因此,主动性的隐私保护非常重要,主动性的隐私保护关键是需要确定出对应的用户隐私。然而经发明人研究和分析发现,相关技术在定位用户隐私时难以保障定位精度和全面性。
发明内容
有鉴于此,本申请实施例提供了一种基于人工智能的用户隐私保护方法及系统。
第一方面,本申请实施例提供了一种基于人工智能的用户隐私保护方法,包括:确定待进行匿名化分析的用户活动事件的待定核心隐私信息集;将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与所述待定核心隐私信息集进行绑定,确定所述待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集;基于所述用户隐私信息显著描述集对所述目标业务会话日志进行局部化处理以获得待进行隐私信息标记的目标会话日志;借助已经完成调试的AI模型,对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得所述目标业务会话日志相关的用户隐私信息标记情况。
如此设计,通过将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与待定核心隐私信息集进行绑定,能够实现对待定核心隐私信息集相关的待进行匿名化分析的用户活动事件的匿名化分析,同时结合绑定结果,能够精准地从待绑定用户活动事件中确定出待进行匿名化分析的用户活动事件以及待进行匿名化分析的用户活动事件对应在目标业务会话日志中的用户隐私信息显著描述集。再基于用户隐私信息显著描述集对目标业务会话日志进行局部化处理,能够精准地得到用户隐私信息显著描述集相关的用户隐私信息的待标记业务会话日志。进而仅需对待标记业务会话日志进行隐私信息约束标签的标记操作,这样不仅能够减小业务会话日志处理的计算负荷,还能够确保需分析的业务会话日志标签(隐私信息约束标签)的准确性,可以理解,在精简需分析的关键业务会话日志的基础上,精简了标记过程中的资源浪费量,提高局部用户隐私信息标记效率和标记准确度。由于仅需对待标记业务会话日志的关键业务会话日志进行处理,因此有助于提高用户隐私信息标记的标记准确度以获得更加全面地用户隐私信息标记情况。
对于一些可独立实施的设计思路而言,所述显著描述集涵盖第一显著描述集;所述待绑定用户活动事件涵盖第一待绑定用户活动事件;所述方法还包括:确定所述目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集的步骤:对所述目标业务会话日志进行用户隐私信息的显著描述挖掘,确定所述目标业务会话日志中的不少于一个第一待绑定用户活动事件中的每个第一待绑定用户活动事件的第一显著描述集;所述将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与所述待定核心隐私信息集进行绑定,确定所述待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集,包括:对于每个所述第一待绑定用户活动事件,结合所述第一待绑定用户活动事件的用户隐私信息相关的第一显著描述集,确定所述第一待绑定用户活动事件相关的第一显著描述内容;确定待进行匿名化分析的用户活动事件相关的第二显著描述内容;其中,所述第二显著描述内容为所述待进行匿名化分析的用户活动事件的待定核心隐私信息集相关的显著描述内容;将与所述第二显著描述内容相绑定的第一显著描述内容相关的第一待绑定用户活动事件确定为所述待进行匿名化分析的用户活动事件,并将所述待进行匿名化分析的用户活动事件的第一显著描述集确定为所述目标业务会话日志中的所述用户隐私信息显著描述集。
可以理解,同一用户活动事件的用户隐私信息在不同的业务会话日志中的用户隐私信息显著描述集相关的显著描述内容一定是绑定的。因此,结合每个第一待绑定用户活动事件的用户隐私信息相关的第一显著描述集,首先能够精准地确定出每个一待绑定用户活动事件的第一显著描述内容,其次通过将第一显著描述内容和待进行匿名化分析的用户活动事件相关的显著描述内容进行绑定,能够精准地挑选出与待进行匿名化分析的用户活动事件相关的显著描述内容相绑定的第一显著描述内容,这样可以精准地确定出与待进行匿名化分析的用户活动事件相绑定的待绑定用户活动事件,同时精准地确定出待进行匿名化分析的用户活动事件对应在目标业务会话日志中的用户隐私信息显著描述集。
对于一些可独立实施的设计思路而言,所述显著描述集包括第二显著描述集;所述待绑定用户活动事件包括第二待绑定用户活动事件;所述方法还包括:确定所述目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集的步骤:对所述目标业务会话日志进行用户隐私信息的显著描述挖掘,确定所述目标业务会话日志中的不少于一个第二待绑定用户活动事件中的每个第二待绑定用户活动事件的第二显著描述集;所述将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与所述待定核心隐私信息集进行绑定,确定所述待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集,包括:基于每个所述第二待绑定用户活动事件的第二显著描述集,分别确定每个所述第二待绑定用户活动事件相关的第一隐私会话描述;确定待进行匿名化分析的用户活动事件相关的第二隐私会话描述;将与所述第二隐私会话描述相绑定的第一隐私会话描述相关的第二待绑定用户活动事件确定为所述待进行匿名化分析的用户活动事件,并将所述待进行匿名化分析的用户活动事件的第二显著描述集确定为所述目标业务会话日志中的用户隐私信息显著描述集。
可以理解,用户隐私信息显著描述集相关的业务会话日志标签信息的业务会话日志内容能够表征该用户隐私信息显著描述集相关的用户隐私信息的隐私会话描述,隐私会话描述能够反映用户隐私信息在业务会话日志中的内容,同一用户活动事件的用户隐私信息在不同业务会话日志中的内容一定是绑定的。因此,结合确定的每个第二待绑定用户活动事件的第二显著描述集,能够确定出每个第二待绑定用户活动事件相关的第一隐私会话描述,通过将第一隐私会话描述和待进行匿名化分析的用户活动事件相关的第二隐私会话描述相绑定,能够精准地从第二待绑定用户活动事件中挑选出与待进行匿名化分析的用户活动事件相绑定的第二待绑定用户活动事件,进而可以精准地确定出待进行匿名化分析的用户活动事件对应在目标业务会话日志中的用户隐私信息显著描述集。
对于一些可独立实施的设计思路而言,所述确定待进行匿名化分析的用户活动事件的待定核心隐私信息集,包括:确定存在持续性分析需求的业务会话日志;对所述存在持续性分析需求的业务会话日志进行用户隐私信息的显著描述挖掘,确定所述存在持续性分析需求的业务会话日志中的不少于一个基础用户活动事件相关的基础显著描述集;结合所述不少于一个基础用户活动事件中每个基础用户活动事件相关的基础显著描述集的可信系数,从所述基础用户活动事件中确定所述待进行匿名化分析的用户活动事件,并将所述待进行匿名化分析的用户活动事件相关的基础显著描述集确定为所述待定核心隐私信息集;在所述确定待进行匿名化分析的用户活动事件相关的第二显著描述内容之前,所述方法还包括:基于所述待定核心隐私信息集,确定所述待进行匿名化分析的用户活动事件相关的所述第二显著描述内容。
可以理解,显著描述的可信系数越高,则表明确定的显著描述越准确,进而结合每个基础用户活动事件相关的基础显著描述集的可信系数,能够挑选出显著描述可信系数最高的基础显著描述集,进而将可信系数最高的基础显著描述集相关的基础用户活动事件确定为待进行匿名化分析的用户活动事件,不仅有助于提高确定的待进行匿名化分析的用户活动事件的准确性,而且可以预防确定出的准确性和稳定性相对较低的待进行匿名化分析的用户活动事件为风险的用户活动事件,从而导致后续对该待进行匿名化分析的用户活动事件进行匿名化分析时,难以高效的匿名化分析到该待进行匿名化分析的用户活动事件,导致匿名化分析异常。因此,将可信系数最高的基础显著描述集相关的基础用户活动事件确定为待进行匿名化分析的用户活动事件,还能够有效提高有效匿名化分析的可能性。
对于一些可独立实施的设计思路而言,所述方法还包括:在结合所述第一显著描述内容和所述第二显著描述内容没有挖掘到目标业务会话日志中的用户隐私信息显著描述集的前提下,确定每个所述第一显著描述集的可信系数;将存在最高的可信系数的第一显著描述集确定为所述目标业务会话日志中的用户隐私信息显著描述集,并将所述存在最高的可信系数的第一显著描述集相关的第一待绑定用户活动事件确定为当前的待进行匿名化分析的用户活动事件。
可以理解,将存在最高的可信系数的第一显著描述集相关的第一待绑定用户活动事件确定为当前的待进行匿名化分析的用户活动事件,能够提高确定的当前的待进行匿名化分析的用户活动事件的准确性,进而有助于提高对当前的待进行匿名化分析的用户活动事件有效匿名化分析的可能性。进一步地,结合当前的待进行匿名化分析的用户活动事件进行继续匿名化分析和标记,确保用户活动事件的不间断隐私防护。
对于一些可独立实施的设计思路而言,所述借助已经完成调试的AI模型,对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得所述目标业务会话日志相关的用户隐私信息标记情况,包括:借助已经完成调试的所述AI模型,挖掘所述待进行隐私信息标记的目标会话日志的业务会话日志显著表达和全局关联表达;挖掘所述待进行隐私信息标记的目标会话日志中与存在差异的描述层面分别相关的业务会话日志显著表达;其中,多个描述层面中涵盖存在上下游关系的第一描述层面和第二描述层面,所述第一描述层面的优先级低于所述第二描述层面;所述第一描述层面相关的业务会话日志显著表达为结合所述第二描述层面相关的业务会话日志显著表达以及第二描述层面相关的业务会话日志显著表达的全局关联表达确定的;所述第二描述层面相关的业务会话日志显著表达的全局关联表达为借助已经完成调试的所述AI模型挖掘得到的;结合存在差异的描述层面分别相关的业务会话日志显著表达对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得所述目标业务会话日志相关的用户隐私信息标记情况。
可以理解,优选级相对较小的描述层面能够反映待进行隐私信息标记的目标会话日志的全局会话事项的深层次描述内容,优选级相对较大的描述层面能够反映待进行隐私信息标记的目标会话日志的局部会话事项的深层次描述内容,因此,借助存在差异的描述层面的业务会话日志显著表达,能够完整、精准地反映待进行隐私信息标记的目标会话日志整体的深层次描述内容,进而结合存在差异的描述层面的业务会话日志显著表达进行隐私信息约束标签的标记操作,能够提高标记的质量,以及能够得到精准地用户隐私信息标记情况。
对于一些可独立实施的设计思路而言,所述结合存在差异的描述层面分别相关的业务会话日志显著表达对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作,包括:对于所述存在差异的描述层面中的每个描述层面,结合该描述层面相关的业务会话日志显著表达,确定所述待进行隐私信息标记的目标会话日志在该描述层面下的第一主题识别情况;结合所述待进行隐私信息标记的目标会话日志在每个描述层面下的第一主题识别情况,确定所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性;结合所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性和设定标记指标,对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作。
可以理解,第一主题识别情况用于表征每个会话消息为用户隐私信息相关的会话消息的可能性,借助设定标记指标能够挑选出可能性较小的会话消息,保留了可能性较大的会话消息,借助会话消息相关的多个层面的可能性和设定标记指标进行隐私信息约束标签的标记操作,有助于提高隐私信息约束标签的标记的质量。
对于一些可独立实施的设计思路而言,所述结合所述待进行隐私信息标记的目标会话日志在每个描述层面下的第一主题识别情况,确定所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性,包括:基于所述存在差异的描述层面升序的规则执行若干轮整理操作之后以获得所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性;其中,所述若干轮整理操作中第i轮整理操作包括:确定所述第一描述层面下的第一主题识别情况的主题可信系数信息;借助所述第一描述层面下的第一主题识别情况的主题可信系数信息,对所述第一描述层面下的第一主题识别情况和所述第二描述层面下的第一主题识别情况进行全局处理以获得所述第二描述层面下的目标主题识别情况;将所述目标主题识别情况调整为第i+1轮全局处理操作中第一描述层面的第一主题识别情况。
可以理解,主题可信系数信息能够反映第一主题识别情况的准确性,基于存在差异的描述层面升序的规则执行若干轮整理操作,最终得到全局处理各个第一主题识别情况的目标主题识别情况,可以使AI模型能够对多个描述层面的第一主题识别情况生成不同的聚焦式识别内容,进而提高AI模型的准确性和稳定性。
对于一些可独立实施的设计思路而言,所述对于所述存在差异的描述层面中的每个描述层面,结合该描述层面相关的业务会话日志显著表达,确定所述待进行隐私信息标记的目标会话日志在该描述层面下的第一主题识别情况,包括:对于目标描述层面,结合所述目标描述层面相关的业务会话日志显著表达,确定所述待进行隐私信息标记的目标会话日志在所述目标描述层面下的第一主题识别情况;对于除目标描述层面外的每个所述第二描述层面,结合该第二描述层面相关的业务会话日志显著表达和所述待进行隐私信息标记的目标会话日志在所述第一描述层面下的第一主题识别情况,确定所述待进行隐私信息标记的目标会话日志在该第二描述层面下的第一主题识别情况。
可以理解,通过第一描述层面的第一主题识别情况以及当前描述层面相关的业务会话日志显著表达确定当前描述层面的第一主题识别情况,使得第一主题识别情况携带各个描述层面的描述内容,进而提高AI模型的准确性和稳定性。
对于一些可独立实施的设计思路而言,在所述获得目标业务会话日志相关的用户隐私信息标记情况之后,还包括:结合所述用户隐私信息标记情况,将所述目标业务会话日志中的隐私信息约束标签相关的会话消息的区分度配置为第一量化值;将所述目标业务会话日志中的除所述隐私信息约束标签之外的会话消息的区分度配置为第二量化值。如此,能够在目标业务会话日志中完整地输出标记出的用户隐私信息。
对于一些可独立实施的设计思路而言,在所述获得目标业务会话日志相关的用户隐私信息标记情况之后,还包括:确定对于所述目标业务会话日志的匿名保护策略;结合所述用户隐私信息标记情况和所述匿名保护策略,对所述目标业务会话日志中的隐私信息约束标签和/或非隐私信息约束标签进行匿名保护操作。如此,能够实现对目标业务会话日志的匿名保护操作以获得带有不同标签的目标业务会话日志。
第二方面,本申请实施例还提供了一种用户隐私保护系统,包括处理器、网络模块和存储器;所述处理器和所述存储器通过所述网络模块通信,所述处理器从所述存储器中读取计算机程序并运行,以执行上述的方法。
第三方面,本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。
相较于现有技术,本申请实施例提供的一种基于人工智能的用户隐私保护方法及系统具有以下技术效果:通过将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与待定核心隐私信息集进行绑定,能够实现对待定核心隐私信息集相关的待进行匿名化分析的用户活动事件的匿名化分析,同时结合绑定结果,能够精准地从待绑定用户活动事件中确定出待进行匿名化分析的用户活动事件以及待进行匿名化分析的用户活动事件对应在目标业务会话日志中的用户隐私信息显著描述集。再基于用户隐私信息显著描述集对目标业务会话日志进行局部化处理,能够精准地得到用户隐私信息显著描述集相关的用户隐私信息的待标记业务会话日志。进而仅需对待标记业务会话日志进行隐私信息约束标签的标记操作,这样不仅能够减小业务会话日志处理的计算负荷,还能够确保需分析的业务会话日志标签(隐私信息约束标签)的准确性,可以理解,在精简需分析的关键业务会话日志的基础上,精简了标记过程中的资源浪费量,提高局部用户隐私信息标记效率和标记准确度。由于仅需对待标记业务会话日志的关键业务会话日志进行处理,因此有助于提高用户隐私信息标记的标记准确度以获得更加全面地用户隐私信息标记情况。
在后面的描述中,将部分地陈述其他的特征。在检查后面内容和附图时,本领域的技术人员将部分地发现这些特征,或者可以通过生产或运用了解到这些特征。通过实践或使用后面所述详细示例中列出的方法、工具和组合的各个方面,当前申请中的特征可以被实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种用户隐私保护系统的方框示意图。
图2为本申请实施例所提供的一种基于人工智能的用户隐私保护方法的流程图。
图3为本申请实施例所提供的一种基于人工智能的用户隐私保护装置的框图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
图1示出了本申请实施例所提供的一种用户隐私保护系统10的方框示意图。本申请实施例中的用户隐私保护系统10可以为具有数据存储、传输、处理功能的服务端,如图1所示,用户隐私保护系统10包括:存储器11、处理器12、网络模块13和基于人工智能的新媒体资源处理装置20。
存储器11、处理器12和网络模块13之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条通讯总线或信号线实现电性连接。存储器11中存储有基于人工智能的新媒体资源处理装置20,所述基于人工智能的新媒体资源处理装置20包括至少一个可以软件或固件(firmware)的形式储存于所述存储器11中的软件功能模块,所述处理器12通过运行存储在存储器11内的软件程序以及模块,例如本申请实施例中的基于人工智能的新媒体资源处理装置20,从而执行各种功能应用以及数据处理,即实现本申请实施例中的基于人工智能的用户隐私保护方法。
其中,所述存储器11可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-OnlyMemory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器11用于存储程序,所述处理器12在接收到执行指令后,执行所述程序。
所述处理器12可能是一种集成电路芯片,具有数据的处理能力。上述的处理器12可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等。可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
网络模块13用于通过网络建立用户隐私保护系统10与其他通信终端设备之间的通信连接,实现网络信号及数据的收发操作。上述网络信号可包括无线信号或者有线信号。
可以理解,图1所示的结构仅为示意,用户隐私保护系统10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。图1中所示的各组件可以采用硬件、软件或其组合实现。
本申请实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序在运行时实现上述的方法。
图2示出了本申请实施例所提供的一种基于人工智能的用户隐私保护方法的流程图。所述方法有关的流程所定义的方法步骤应用于用户隐私保护系统10,可以由所述处理器12实现,所述方法包括以下步骤101-步骤104所记录的技术方案。
步骤101、确定待进行匿名化分析的用户活动事件的待定核心隐私信息集。
在本申请实施例中,待进行匿名化分析的用户活动事件可以理解为需要进行匿名化分析的用户活动事件。例如,待进行匿名化分析的用户活动事件可以是在在线支付过程中的用户活动事件。示例性地,待进行匿名化分析的用户活动事件可以理解为任意支付环境相关的部分业务会话日志中的用户活动事件。待定核心隐私信息集为事先确定并记录的待进行匿名化分析的用户活动事件的用户隐私信息显著描述集,由待进行匿名化分析的用户活动事件的隐私信息约束标签相关的多个用户隐私信息显著描述集组合形成。在实际应用过程中,当确定需要对下述目标业务会话日志进行匿名化分析的前提下,可以从信息列表中确定事先记录的待进行匿名化分析的用户活动事件的待定核心隐私信息集。
步骤102、将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与待定核心隐私信息集进行绑定,确定待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集。
在本申请实施例中,目标业务会话日志可以理解为待进行匿名化分析的用户活动事件相关的支付业务列表中的其中一项业务会话日志,其中可以包括不少于一个待绑定用户活动事件。待绑定用户活动事件为出现在目标业务会话日志中并且需要与待进行匿名化分析的用户活动事件进行绑定的用户活动事件,通过绑定操作,与待进行匿名化分析的用户活动事件绑定的待绑定用户活动事件,即为待进行匿名化分析的用户活动事件。
示例性地,待绑定用户活动事件可以是目标业务会话日志中出现的各个操作行为事件。目标业务会话日志可以是在确定到待进行匿名化分析的用户活动事件相关的支付业务列表之后,正在处理的当前组业务会话日志,也可以是预先选定的业务会话日志。
在实际应用过程中,对于目标业务会话日志,可以对目标业务会话日志进行业务会话日志解析操作,确定目标业务会话日志包括的不少于一个待绑定用户活动事件,以及不少于一个待绑定用户活动事件中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集。然后可以将每个待绑定用户活动事件的用户隐私信息相关的显著描述集与确定的待进行匿名化分析的用户活动事件的待定核心隐私信息集进行绑定,确定是否存在与待定核心隐私信息集相绑定的显著描述集。若是,则可以将该与待定核心隐私信息集相绑定的显著描述集相关的待绑定用户活动事件确定为待进行匿名化分析的用户活动事件,将该显著描述集确定为待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集。
如此一来,通过将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与待定核心隐私信息集进行绑定,能够实现对待定核心隐私信息集相关的待进行匿名化分析的用户活动事件的匿名化分析,同时结合绑定结果,能够精准地从待绑定用户活动事件中确定出待进行匿名化分析的用户活动事件以及待进行匿名化分析的用户活动事件对应在目标业务会话日志中的用户隐私信息显著描述集。
步骤103、基于用户隐私信息显著描述集对目标业务会话日志进行局部化处理以获得待进行隐私信息标记的目标会话日志。
在本申请实施例中,待进行隐私信息标记的目标会话日志为待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息相关的业务会话日志,包括待进行匿名化分析的用户活动事件在目标业务会话日志中相关的全局性会话信息的局部用户隐私信息(用户隐私信息)。
进一步地,在确定待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集之后,可以基于用户隐私信息显著描述集,确定待进行匿名化分析的用户活动事件的用户隐私信息在目标业务会话日志中所相关的隐私信息约束标签。之后,可以基于该隐私信息约束标签,对目标业务会话日志进行局部化处理,从目标业务会话日志中得到待进行匿名化分析的用户活动事件的用户隐私信息相关的待进行隐私信息标记的目标会话日志。
比如,在确定待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集之后,可以基于用户隐私信息显著描述集,确定由用户隐私信息显著描述集决定的动态标签,然后可以将该动态标签确定为待进行匿名化分析的用户活动事件的用户隐私信息在目标业务会话日志中所相关的隐私信息约束标签。然后,可以基于该隐私信息约束标签,对目标业务会话日志进行局部化处理以获得待进行隐私信息标记的目标会话日志。
步骤104、借助已经完成调试的AI模型,对待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得目标业务会话日志相关的用户隐私信息标记情况。
在本申请实施例中,已经完成调试的AI模型可以是用户隐私信息标记AI模型。在实际应用过程中,对于确定的待进行隐私信息标记的目标会话日志,可以借助该用户隐私信息标记模型对待进行隐私信息标记的目标会话日志进行主题标记,确定待进行隐私信息标记的目标会话日志中的每个会话消息的为用户隐私信息相关的会话消息的可能性,然后可以结合确定的可能性(概率),从待进行隐私信息标记的目标会话日志中的每个会话消息中挑选出用户隐私信息相关的会话消息。可以结合挑选出的用户隐私信息相关的会话消息,对待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作,从而以获得待进行隐私信息标记的目标会话日志相关的用户隐私信息标记情况。其中,待进行隐私信息标记的目标会话日志相关的用户隐私信息标记情况可以在待标记业务会话日志上进行输出。
进一步的,可以基于待进行隐私信息标记的目标会话日志相关的用户隐私信息标记情况,确定目标业务会话日志相关的用户隐私信息标记情况。在实际应用过程中,可以结合待进行隐私信息标记的目标会话日志和目标业务会话日志之间的业务会话日志关联情况,将包含用户隐私信息标记情况的待进行隐私信息标记的目标会话日志关联至目标业务会话日志,从而以获得目标业务会话日志相关的用户隐私信息标记情况。
或者,对于进一步地可能的设计思路而言,由于待标记业务会话日志为从目标业务会话日志中标记出的部分业务会话日志,因此,在得到待进行隐私信息标记的目标会话日志相关的用户隐私信息标记情况之后,可以直接将待进行隐私信息标记的目标会话日志相关的用户隐私信息标记情况确定为目标业务会话日志相关的用户隐私信息标记情况。
在一种可示性实施例中,显著描述集涵盖第一显著描述集;待绑定用户活动事件涵盖第一待绑定用户活动事件。在该实施例对应的实施方式中,第一待绑定用户活动事件为出现在目标业务会话日志中的并且需要与待进行匿名化分析的用户活动事件进行绑定的用户活动事件,绑定完成的第一待绑定用户活动事件即为待进行匿名化分析的用户活动事件。
对于步骤102,在确定用户隐私信息显著描述集之前,还需要确定目标业务会话日志中的每个第一待绑定用户活动事件的用户隐私信息相关的显著描述集。示例性地,可以在确定目标业务会话日志之后,对目标业务会话日志进行用户隐私信息的显著描述挖掘,结合挖掘结果,确定目标业务会话日志中的不少于一个第一待绑定用户活动事件中的每个第一待绑定用户活动事件的第一显著描述集。
在实际应用过程中,可以借助用户隐私信息显著描述挖掘模型对目标业务会话日志进行用户隐私信息的显著描述挖掘。例如,可以将目标业务会话日志导入至已经完成调试的用户隐私信息显著描述挖掘模型,借助用户隐私信息显著描述挖掘模型对目标业务会话日志进行处理,确定目标业务会话日志中的所有用户隐私信息显著描述。然后,可以基于每个用户隐私信息显著描述之间的关联情况,确定指向相同第一待绑定用户活动事件的用户隐私信息的用户隐私信息显著描述,并将指向相同第一待绑定用户活动事件的用户隐私信息显著描述确定为该第一待绑定用户活动事件的第一显著描述集。进而,可以确定出目标业务会话日志中的不少于一个第一待绑定用户活动事件中的每个第一待绑定用户活动事件的第一显著描述集。
对于步骤102,可以基于以下步骤,确定待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集,具体可以包括以下步骤301-步骤303所记录的内容。
步骤301、对于每个第一待绑定用户活动事件,结合第一待绑定用户活动事件的用户隐私信息相关的第一显著描述集,确定第一待绑定用户活动事件相关的第一显著描述内容。
在本申请实施例中,显著描述内容可以理解为显著描述集相关的描述内容,能够表征显著描述集相关的待绑定用户活动事件的用户隐私信息的用户隐私信息描述。示例性地,显著描述内容可以理解为显著描述集相关的身份描述、事项描述、第一显著描述集中的用户隐私信息显著描述之间的知识图谱传递情况等。
在本申请实施例中,在确定每个第一待绑定用户活动事件的第一显著描述集之后,对于每个第一待绑定用户活动事件,可以结合该第一待绑定用户活动事件相关的第一显著描述集中的每个用户隐私信息显著描述相关的关键内容,确定第一显著描述集相关的第一显著描述内容,然后将该第一显著描述内容确定为该第一显著描述集相关的第一待绑定用户活动事件所相关的第一显著描述内容。其中,关键内容可以理解为第一显著描述的身份描述、事项描述等。
在实际应用过程中,对于该第一显著描述集,可以直接将该第一显著描述集中的每个用户隐私信息显著描述相关的关键内容直接确定为该第一显著描述集相关的第一显著描述内容,换言之,可以直接将上述每个用户隐私信息显著描述相关的关键内容确定为第一待绑定用户活动事件相关的第一显著描述内容。
步骤302、确定待进行匿名化分析的用户活动事件相关的第二显著描述内容。其中,第二显著描述内容为待进行匿名化分析的用户活动事件的待定核心隐私信息集相关的显著描述内容。
在实际应用过程中,待进行匿名化分析的用户活动事件相关的第二显著描述内容可以是事先记录的,可以在确定待进行匿名化分析的用户活动事件的待定核心隐私信息集的同时确定,也可以在需要进行显著描述内容的比较时确定,在本申请实施例中不作过多限制。或者,第二显著描述内容还可以是在确定待定核心隐私信息集之后,结合待定核心隐私信息集中的每个目标用户隐私信息显著描述的目标用户隐私信息显著描述内容确定的。比如,在确定待定核心隐私信息集之后,可以直接将每个目标用户隐私信息显著描述的目标用户隐私信息显著描述内容确定为待进行匿名化分析的用户活动事件相关的第二显著描述内容。
步骤303、将与第二显著描述内容相绑定的第一显著描述内容相关的第一待绑定用户活动事件确定为待进行匿名化分析的用户活动事件,并将待进行匿名化分析的用户活动事件的第一显著描述集确定为目标业务会话日志中的用户隐私信息显著描述集。
在本申请实施例中,可以将确定的每个第一显著描述内容与第二显著描述内容进行绑定,确定第一显著描述内容中是否存在与第二显著描述内容相绑定的第一显著描述内容。例如,可以确定是否存在与第二显著描述内容相同的第一显著描述内容。若是,则可以直接将与第二显著描述内容相绑定的第一显著描述内容相关的第一待绑定用户活动事件确定为待进行匿名化分析的用户活动事件,并将该第一显著描述内容相关的第一显著描述集确定为目标业务会话日志中的用户隐私信息显著描述集。进一步地,若是直接将第一显著描述集中的用户隐私信息显著描述的关键内容确定为第一待绑定用户活动事件的第一显著描述内容,以及直接将目标用户隐私信息显著描述的目标用户隐私信息显著描述内容确定为待进行匿名化分析的用户活动事件相关的第二显著描述内容,对于每个第一显著描述内容,可以直接将该第一显著描述内容相关的每个下游描述内容逐一和第二显著描述内容相关的每个目标用户隐私信息显著描述内容进行共性指数绑定,确定每个下游描述内容和每个目标用户隐私信息显著描述内容之间的共性指数。
继而确定大于设定的共性指数判定值的共性指数的数目,在确定该数目大于设定数目的前提下,确定该第一显著描述内容与第二显著描述内容相绑定,进而,可以将该第一显著描述内容相关的第一待绑定用户活动事件确定为待进行匿名化分析的用户活动事件,并将该第一显著描述内容相关的第一显著描述集确定为目标业务会话日志中的用户隐私信息显著描述集。对于进一步地可能的设计思路而言,显著描述集包括第二显著描述集;待绑定用户活动事件包括第二待绑定用户活动事件。
在本申请实施例中,对于一些可能的设计思路而言,第二待绑定用户活动事件为出现在目标业务会话日志中的并且需要与待进行匿名化分析的用户活动事件进行绑定的用户活动事件,绑定成功的第二待绑定用户活动事件即为待进行匿名化分析的用户活动事件。
对于步骤102,在确定用户隐私信息显著描述集之前,还需要确定目标业务会话日志中的每个第二待绑定用户活动事件的用户隐私信息相关的显著描述集。示例性地,可以在确定目标业务会话日志之后,对目标业务会话日志进行用户隐私信息的显著描述挖掘,结合挖掘结果,确定目标业务会话日志中的不少于一个第二待绑定用户活动事件中的每个第二待绑定用户活动事件的第二显著描述集。
在实际应用过程中,可以借助用户隐私信息显著描述挖掘模型对目标业务会话日志进行用户隐私信息的显著描述挖掘,结合确定的目标业务会话日志中的所有的用户隐私信息显著描述,确定每个第二待绑定用户活动事件的第二显著描述集。关于确定每个第二待绑定用户活动事件的第二显著描述集的相关实施内容,可以结合上述实施例中确定每个第一待绑定用户活动事件的第一显著描述集的说明。
可以理解的是,对于步骤102,确定待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集,具体可以包括以下步骤401-步骤403所记录的内容。
步骤401、基于每个第二待绑定用户活动事件的第二显著描述集,分别确定每个第二待绑定用户活动事件相关的第一隐私会话描述。
在本申请实施例中,隐私会话描述为用户隐私信息相关的业务会话日志标签的业务会话日志描述内容,能够反映用户隐私信息在业务会话日志中的描述内容。其中,业务会话日志描述内容可以包括业务会话日志标签相关的身份描述,事项描述等。用户隐私信息显著描述集相关的业务会话日志标签的业务会话日志描述内容能够决定该用户隐私信息显著描述集相关的用户隐私信息的隐私会话描述。
在实际应用过程中,对于每个第二待绑定用户活动事件,可以结合该第二待绑定用户活动事件的第二显著描述集,确定该第二显著描述集相关的业务会话日志标签。例如,可以将第二显著描述集中的每个用户隐私信息显著描述所组成的标签确定为该第二显著描述集相关的业务会话日志标签,或者,可以将第二显著描述集相关的动态标签确定为第二显著描述集相关的业务会话日志标签。
基于此,可以挖掘业务会话日志标签相关的业务会话日志的显著表达,将挖掘的显著表达确定为业务会话日志标签相关的业务会话日志描述内容,也可以理解是的,挖掘的显著表达确定为待绑定用户活动事件相关的第一隐私会话描述。结合上述步骤,可以确定个第二待绑定用户活动事件相关的第一隐私会话描述。
步骤402、确定待进行匿名化分析的用户活动事件相关的第二隐私会话描述。其中,第二隐私会话描述可以是事先记录的。在实际应用过程中,可以直接在信息列表中确定事先记录的第二隐私会话描述。
步骤403、将与第二隐私会话描述相绑定的第一隐私会话描述相关的第二待绑定用户活动事件确定为待进行匿名化分析的用户活动事件,并将待进行匿名化分析的用户活动事件的第二显著描述集确定为目标业务会话日志中的用户隐私信息显著描述集。
在本申请实施例中,可以将每个第一隐私会话描述与确定的第二隐私会话描述进行比较,分别确定每个第一隐私会话描述与第二隐私会话描述之间的业务会话日志描述内容共性指数。
进而,可以确定是否存在大于设定的特征共性指数判定值的业务会话日志描述内容共性指数,若是,则可以将该业务会话日志描述内容共性指数相关的第一隐私会话描述确定为与第二隐私会话描述相绑定的用户隐私信息描述,进而,将该业务会话日志描述内容共性指数相关的第二待绑定用户活动事件确定为待进行匿名化分析的用户活动事件,并将业务会话日志描述内容共性指数相关的第二显著描述集确定为目标业务会话日志中的用户隐私信息显著描述集。
在一种可示性实施例中,对于步骤101,可以基于以下步骤确定待进行匿名化分析的用户活动事件的待定核心隐私信息集,具体可以包括以下步骤501-步骤503所记录的内容。
步骤501、确定存在持续性分析需求的业务会话日志。
在本申请实施例中,存在持续性分析需求的业务会话日志为包括待进行匿名化分析的用户活动事件的业务会话日志。其中,存在持续性分析需求的业务会话日志可以是支付业务列表中目标业务会话日志相关的上下文业务会话日志,也可以是支付业务列表中目标业务会话日志相关的非上下文业务会话日志,在本申请实施例中不作过多限制。比如,存在持续性分析需求的业务会话日志可以理解为待进行匿名化分析的用户活动事件首次激活的业务会话日志。
步骤502、对存在持续性分析需求的业务会话日志进行用户隐私信息的显著描述挖掘,确定存在持续性分析需求的业务会话日志中的不少于一个基础用户活动事件相关的基础显著描述集。
在本申请实施例中,基础用户活动事件为存在持续性分析需求的业务会话日志中包括的用户活动事件,基础显著描述集为基础用户活动事件的用户隐私信息相关的显著描述集,其中,可信系数最高的基础显著描述集相关的基础用户活动事件可以确定为待进行匿名化分析的用户活动事件。
在本申请实施例中,在确定到存在持续性分析需求的业务会话日志之后,可以借助已经完成调试的用户隐私信息显著描述挖掘模型对存在持续性分析需求的业务会话日志进行用户隐私信息的显著描述挖掘,确定存在持续性分析需求的业务会话日志中包括的不少于一个基础用户活动事件中的每个基础用户活动事件的用户隐私信息相关的基础显著描述集。并且,用户隐私信息显著描述挖掘模型在确定每个基础用户活动事件的用户隐私信息相关的用户隐私信息显著描述的同时,还可以确定出每个用户隐私信息显著描述的显著描述可信系数信息。
步骤503、结合不少于一个基础用户活动事件中每个基础用户活动事件相关的基础显著描述集的可信系数,从基础用户活动事件中确定待进行匿名化分析的用户活动事件,并将待进行匿名化分析的用户活动事件相关的基础显著描述集确定为待定核心隐私信息集。
在本申请实施例中,可以结合每个基础用户活动事件相关的用户隐私信息显著描述的显著描述可信系数信息相关的可信系数,确定该基础用户活动事件的基础显著描述集的可信系数。
在实际应用过程中,可以基于该基础用户活动事件的基础显著描述集中的每个用户隐私信息显著描述的可信系数,确定出该基础显著描述集的可信系数的统计值,然后将确定出的统计值确定为该基础显著描述集的可信系数。或者,可以基于基础显著描述集中的每个用户隐私信息显著描述的可信系数以及显著描述的数目,确定基础显著描述集相关的可信系数离散评价,并将该可信系数离散评价确定为基础显著描述集的可信系数。此外,也可以基于基础显著描述集中的每个用户隐私信息显著描述的权重,对每个用户隐私信息显著描述的可信系数进行全局处理,然后对全局处理的结果统计以获得统计结果,进而,可以将该统计结果确定为基础显著描述集的可信系数。进一步地,对于一些可独立实施的技术方案而言,用户隐私信息显著描述挖掘模型可以直接输出每个基础显著描述集的可信系数。关于确定基础显著描述集的可信系数的确定方式,可以根据实际情况进行灵活选择。
可以理解,在确定不少于一个基础用户活动事件中每个基础用户活动事件相关的基础显著描述集的可信系数之后,可以确定出可信系数最高的基础显著描述集,进而,可以将可信系数最高的基础显著描述集相关的基础用户活动事件中确定为待进行匿名化分析的用户活动事件,并将该基础显著描述集确定为待进行匿名化分析的用户活动事件相关的待定核心隐私信息集。进一步的,可以基于确定的待定核心隐私信息集,确定待进行匿名化分析的用户活动事件相关的第二显著描述内容。
在实际应用过程中,可以直接将该待定核心隐私信息集中的每个目标用户隐私信息显著描述的目标用户隐私信息显著描述内容确定为待进行匿名化分析的用户活动事件相关的第二显著描述内容,并将第二显著描述内容进行记录。或者,基于确定的待定核心隐私信息集,可以确定待定核心隐私信息集在存在持续性分析需求的业务会话日志中相关的业务会话日志标签,之后,可以挖掘该业务会话日志标签相关的业务会话日志描述内容,并将该业务会话日志描述内容确定为待进行匿名化分析的用户活动事件的第二隐私会话描述。可以将第二隐私会话描述进行记录,例如,记录在信息列表中。
对于进一步地可能的设计思路而言,在确定存在持续性分析需求的业务会话日志之后,还可以确定用户在存在持续性分析需求的业务会话日志指定的匿名化分析标签,然后可以直接对指定的匿名化分析标签进行用户隐私信息显著描述挖掘,确定该标签的基础用户活动事件,并将该基础用户活动事件确定为待进行匿名化分析的用户活动事件。以此类推,对于目标业务会话日志,也可以确定是否存在事先选定的匿名化分析标签,若是,则可以直接将该标签相关的待绑定用户活动事件确定为待进行匿名化分析的用户活动事件。
在一种可示性实施例中,在结合第一显著描述内容和第二显著描述内容没有挖掘到目标业务会话日志中的用户隐私信息显著描述集的前提下,换言之,在不存在与第二显著描述内容相绑定的第一显著描述内容的前提下,确定每个第一显著描述内容相关的第一显著描述集的可信系数。关于确定第一显著描述集的可信系数的具体说明,可以结合上述实施例中确定基础显著描述集的可信系数的说明,在本申请实施例中不再赘述。进而,在确定每个第一显著描述集的可信系数之后,可以挑选出存在最高的可信系数的第一显著描述集,之后,可以将该第一显著描述集确定为目标业务会话日志中的用户隐私信息显著描述集,并将该第一显著描述集相关的第一待绑定用户活动事件确定为当前的待进行匿名化分析的用户活动事件。以此类推,在结合第二隐私会话描述和第一隐私会话描述没有挖掘到目标业务会话日志中的用户隐私信息显著描述集的前提下,也可以结合每个第一显著描述集的可信系数,确定当前的待进行匿名化分析的用户活动事件。具体确定的当前的待进行匿名化分析的用户活动事件的步骤,可以结合上述实施例。
在一种可示性实施例中,对于步骤104,可以基于如下步骤对待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得目标业务会话日志相关的用户隐私信息标记情况,具体可以包括以下步骤601-步骤603所记录的内容。
步骤601、借助已经完成调试的AI模型,挖掘待进行隐私信息标记的目标会话日志的业务会话日志显著表达和全局关联表达。
在本申请实施例中,业务会话日志显著表达可以包括颜色显著表达、关键事项、全局关联表达等,其中,关键事项可以基于待进行隐私信息标记的目标会话日志中的会话消息确定,与待进行隐私信息标记的目标会话日志中的会话消息存在对应关系。在实际应用过程中,可以将待进行隐私信息标记的目标会话日志导入至已经完成调试的AI模型,进一步地,该AI模型可以挖掘出待进行隐私信息标记的目标会话日志的业务会话日志显著表达,同时,也可以挖掘出待进行隐私信息标记的目标会话日志的全局关联表达。
步骤602、挖掘待进行隐私信息标记的目标会话日志中与存在差异的描述层面分别相关的业务会话日志显著表达。其中,多个描述层面中涵盖存在上下游关系的第一描述层面和第二描述层面,第一描述层面低于第二描述层面。第一描述层面相关的业务会话日志显著表达为结合第二描述层面相关的业务会话日志显著表达以及第二描述层面相关的业务会话日志显著表达的全局关联表达确定的。第二描述层面相关的业务会话日志显著表达的全局关联表达为借助已经完成调试的AI模型挖掘得到的。
在本申请实施例中,已经完成调试的AI模型包括分别与多个描述层面相关的内容挖掘单元;每个内容挖掘单元可以挖掘其相关的描述层面下的业务会话日志显著表达。结合多个内容挖掘单元,可以分别挖掘出待进行隐私信息标记的目标会话日志中与存在差异的描述层面分别相关的业务会话日志显著表达。例如,已经完成调试的AI模型可以包括8个内容挖掘单元,能够提出8个描述层面下的业务会话日志显著表达。其中,描述层面可以理解为业务会话日志识别度,且待进行隐私信息标记的目标会话日志存在基础业务会话日志识别度。示例性地,基础业务会话日志识别度也可以理解为目标业务会话日志存在的业务会话日志识别度。
在实际应用过程中,首先可以借助已经完成调试的AI模型挖掘出与待进行隐私信息标记的目标会话日志的基础业务会话日志区分相关的业务会话日志显著表达和全局关联表达。然后将该基础业务会话日志识别度确定为第二描述层面,结合该第二描述层面相关的业务会话日志显著表达和全局关联表达,确定与第一描述层面相关的业务会话日志显著表达。并且,在确定与第一描述层面相关的业务会话日志显著表达的同时,还可以确定该业务会话日志显著表达的全局关联表达。
在上述内容的基础上,可以将该第一描述层面确定为当前的第二描述层面,确定低于该当前的第二描述层面的、下一个第一描述层面相关的业务会话日志显著表达和全局关联表达。从而,可以实现分别挖掘出待进行隐私信息标记的目标会话日志中与存在差异的描述层面分别相关的业务会话日志显著表达以及业务会话日志显著表达中的全局关联表达。其中,基础业务会话日志识别度相关的描述层面为最高的描述层面。
步骤603、结合存在差异的描述层面分别相关的业务会话日志显著表达对待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得目标业务会话日志相关的用户隐私信息标记情况。
可以理解,优选级相对较大的描述层面下的业务会话日志显著表达能够反映待进行隐私信息标记的目标会话日志的局部会话事项的深层次描述内容,优选级相对较小的描述层面下的业务会话日志显著表达能够反映待进行隐私信息标记的目标会话日志的全局会话事项的深层次描述内容。
在实际应用过程中,结合存在差异的描述层面分别相关的业务会话日志显著表达,可以确定待进行隐私信息标记的目标会话日志中指向用户隐私信息的热门标签和冷门标签,进而,可以确定待进行隐私信息标记的目标会话日志中的用户隐私信息相关的标签。
进一步的,结合确定的用户隐私信息相关的标签,能够完成对待进行隐私信息标记的目标会话日志的隐私信息约束标签的标记操作以获得目标业务会话日志相关的用户隐私信息标记情况。
在一种可示性实施例中,第二描述层面相关的业务会话日志显著表达的全局关联表达包括第二描述层面相关的业务会话日志显著表达中的第一关键事项之间的关联情况。关于确定第一描述层面相关的业务会话日志显著表达的步骤,可以根据如下step1-step4所记录的内容进行实施。
step1、对于第一描述层面中的每个第二关键事项,结合该第二关键事项的关联内容,从第二描述层面相关的第一关键事项中挑选与该第二关键事项相关的第一目标关键事项。
在本申请实施例中,每个描述层面相关的业务会话日志显著表达包括不同数目的关键事项,第一描述层面相关的业务会话日志显著表达中的第二关键事项的数目小于第二描述层面相关的业务会话日志显著表达中的第一关键事项的数目。换言之,低业务会话日志识别度相关的关键事项的数目小于高业务会话日志识别度相关的关键事项的数目。第一描述层面相关的每个第二关键事项,在第二描述层面中都存在一个与该第二关键事项相关的第一关键事项。
在本申请实施例中,对于第一描述层面中的每个第二关键事项,可以确定该第二关键事项的关联内容,对于第二描述层面中的每个第一关键事项,也可以确定该第一关键事项的关联内容。之后,结合第一描述层面中每个第二关键事项的关联内容和第二描述层面中的每个第一关键事项的关联内容,可以分别在第一描述层面中和第二描述层面中确定状态相同的第一关键事项和第二关键事项,并将上述第二关键事项确定为挑选出的与上述第一关键事项相关的第一目标关键事项。换言之,可以从第二描述层面相关的第一关键事项中,确定与第一描述层面中的每个第二关键事项相关的第一目标关键事项。
step2、结合第一描述层面和第二描述层面,确定第一描述层面中的一个第二关键事项对应于第二描述层面中的第一关键事项的目标数目。
在本申请实施例中,第一描述层面中的一个第二关键事项的业务会话日志显著表达可以基于第二描述层面中的多个第一关键事项的业务会话日志显著表达确定。
在实际应用过程中,可以结合第一描述层面和第二描述层面之间的调整情况,确定第一描述层面中一个第二关键事项对应于第二描述层面中的第一关键事项的目标数目。例如,一个第一描述层面中第二关键事项可以对应于20个第二描述层面中的第二关键事项。
step3、结合第一关键事项之间的关联情况以及第一目标关键事项的关联内容,从第二描述层面相关的第一关键事项中挑选目标数目的第二目标关键事项。
在本申请实施例中,结合第二描述层面相关的全局关联表达,可以确定第二描述层面中的第一关键事项之间的关联情况,然后,对于确定的每个第一目标关键事项,可以基于该第一目标关键事项的关联内容和第一关键事项之间的关联情况,从第二描述层面相关的第一关键事项中挑选出目标数目的第一关键事项,确定为第二目标关键事项。
在实际应用过程中,可以基于该第一目标关键事项的关联内容和第一关键事项之间的关联情况,从第二描述层面相关的第一关键事项中挑选出与第一目标关键事项存在设定量化差异的、目标数目的第一关键事项确定为第二目标关键事项。
step4、结合第二目标关键事项的业务会话日志显著表达,确定该第二关键事项的业务会话日志显著表达,并结合确定的第一描述层面中的每个第二关键事项的业务会话日志显著表达,确定第一描述层面相关的业务会话日志显著表达。
在本申请实施例中,基于确定的目标数目的第二目标关键事项中每个第二目标关键事项的业务会话日志显著表达,可以确定第二目标关键事项相关的第一描述层面中的第二关键事项的业务会话日志显著表达。
可以理解,结合上述步骤,可以确定第一描述层面中的每个第二关键事项的业务会话日志显著表达,结合每个第二关键事项的业务会话日志显著表达,可以确定第一描述层面相关的业务会话日志显著表达。如此,能够分别挖掘出待进行隐私信息标记的目标会话日志中与存在差异的描述层面分别相关的业务会话日志显著表达。
在实际应用过程中,对于第二描述层面相关的业务会话日志显著表达,第一描述层面相关的内容挖掘单元可以借助特征精简的策略,对第二描述层面相关的业务会话日志显著表达进行特征精简以确定第一描述层面相关的业务会话日志显著表达。
进一步的,在得到存在差异的描述层面分别相关的业务会话日志显著表达之后,可以基于以下操作步骤对待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记,具体可以包括以下步骤701-步骤703所记录的内容。
步骤701、对于存在差异的描述层面中的每个描述层面,结合该描述层面相关的业务会话日志显著表达,确定待进行隐私信息标记的目标会话日志在该描述层面下的第一主题识别情况。
在本申请实施例中,第一主题识别情况用于表征待进行隐私信息标记的目标会话日志中的会话消息为用户隐私信息相关的会话消息的可能性。
在实际应用过程中,对于每个描述层面,AI模型中与该描述层面相关的内容挖掘单元在确定该描述层面相关的业务会话日志显著表达之后,与该描述层面相关的信息划分单元可以基于该描述层面相关的业务会话日志显著表达,确定待进行隐私信息标记的目标会话日志在该描述层面下的第一主题识别情况。进一步地,结合AI模型中的每个信息划分单元,可以确定待进行隐私信息标记的目标会话日志在存在差异的描述层面下的第一主题识别情况。
对于一些可独立实施的技术方案而言,对于步骤701,可以基于以下步骤确定待进行隐私信息标记的目标会话日志在每个描述层面下的第一主题识别情况。
step1、对于目标描述层面,结合目标描述层面相关的业务会话日志显著表达,确定待进行隐私信息标记的目标会话日志在所述目标描述层面下的第一主题识别情况。
在得到每个描述层面相关的业务会话日志显著表达之后,对于目标描述层面,该目标描述层面相关的信息划分单元,可以基于该目标描述层面相关的业务会话日志显著表达,输出待进行隐私信息标记的目标会话日志在目标描述层面下的第一主题识别情况。
step2、对于除目标描述层面外的每个第二描述层面,结合该第二描述层面相关的业务会话日志显著表达和待进行隐私信息标记的目标会话日志在第一描述层面下的第一主题识别情况,确定待进行隐私信息标记的目标会话日志在该第二描述层面下的第一主题识别情况。
在本申请实施例中,由于第一描述层面低于第二描述层面,所以目标描述层面一定是一个第一描述层面。在目标描述层面相关的信息划分单元确定该目标描述层面下的第一主题识别情况之后,该目标描述层面相关的第二描述层面所相关的信息划分单元,可以结合目标描述层面下的第一主题识别情况和该第二描述层面下的业务会话日志显著表达,确定待进行隐私信息标记的目标会话日志在该第二描述层面的下的第一主题识别情况。进而,每个第二描述层面相关的信息划分单元,可以结合第一描述层面下的第一主题识别情况和该第二描述层面下的业务会话日志显著表达,确定该第二描述层面下的第一主题识别情况。
在实际应用过程中,存在差异的描述层面相关的信息划分单元可以借助特征扩展的策略,对优选级相对较小的描述层面相关的第一主题识别情况和第二描述层面的业务会话日志显著表达进行特征扩展处理,确定该第二描述层面的第一主题识别情况。
步骤702、结合待进行隐私信息标记的目标会话日志在每个描述层面下的第一主题识别情况,确定待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性。
在本申请实施例中,在得到每个描述层面下的第一主题识别情况之后,可以基于存在差异的描述层面升序的规则执行若干轮整理操作,之后,可以得到待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性。
步骤703、结合待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性和设定标记指标,对待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作。
在实际应用过程中,可以将待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性与设定标记指标比较,在确定上述可能性大于设定标记指标的前提下,将该会话消息确定为隐私信息约束标签相关的会话消息,在确定上述可能性不大于设定标记指标的前提下,确定该会话消息不是隐私信息约束标签相关的会话消息。
进而,可以确定待进行隐私信息标记的目标会话日志中指向隐私信息约束标签的会话消息和非隐私信息约束标签的会话消息,并结合确定的结果,完成对待进行隐私信息标记的目标会话日志的标记操作以获得目标业务会话日志相关的用户隐私信息标记情况。在实际应用过程中,用户隐私信息标记情况可以是隐私信息约束标签相关的用户隐私信息标记业务会话日志。
在一种可示性实施例中,对于若干轮整理操作中第i轮整理操作,可以基于以下整理操作过程进行整理操作,具体可以包括以下步骤801-步骤803所记录的内容。
步骤801、确定第一描述层面下的第一主题识别情况的主题可信系数。在本申请实施例中,第一描述层面为目标描述层面,其中,目标描述层面可以理解为优先级相对较低地描述层面。
在实际应用过程中,可以先确定与该第一描述层面相关的第二描述层面,并确定与该第二描述层面相关的全局处理指示。之后,该第二描述层面相关的全局处理指示,可以基于其中的触发算法,确定第一描述层面下的第一主题识别情况的主题可信系数以获得主题可信系数信息。
步骤802、借助第一描述层面下的第一主题识别情况的主题可信系数信息,对第一描述层面下的第一主题识别情况和第二描述层面下的第一主题识别情况进行全局处理以获得第二描述层面下的目标主题识别情况。
在本申请实施例中,在得到第一描述层面下的第一主题识别情况的主题可信系数信息之后,全局处理指示可以结合该主题可信系数信息,对第一描述层面下的第一主题识别情况和第二描述层面下的第一主题识别情况进行全局处理以获得第二描述层面下的目标主题识别情况。
在实际应用过程中,基于每个会话消息的第一主题识别情况的主题可信系数信息,确定每个会话消息的第一主题识别情况的主题可信系数,将每个会话消息的第一主题识别情况的主题可信系数与设定的可信系数判定值进行比较,在确定主题可信系数不小于设定的可信系数判定值的前提下,将该主题可信系数相关的会话消息的第一主题识别情况确定为第二描述层面下的第一主题识别情况。在确定主题可信系数小于设定的可信系数判定值的前提下,将该主题可信系数相关的会话消息在第二描述层面下的第一主题识别情况确定为目标主题识别情况。
步骤803、将目标主题识别情况调整为第i+1轮全局处理操作中第一描述层面的第一主题识别情况。
在实际应用过程中,可以将上述第二描述层面确定为当前的第一描述层面,将上述第二描述层面下的目标主题识别情况调整为第i+1轮全局处理操作中的当前的第一描述层面第一主题识别情况。
结合上述步骤,可以确定最优选级相对较大的描述层面下的目标主题识别情况,其中,目标主题识别情况也用于表征待进行隐私信息标记的目标会话日志中每个会话消息为隐私信息约束标签相关的会话消息的可能性。
如此,结合优选级相对较大的描述层面下的目标主题识别情况,可以确定待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性。
在一种可示性实施例中,可以根据如下实施一种AI模型对待进行隐私信息标记的目标会话日志进行标记操作的过程,其中,内容挖掘单元unit_a,内容挖掘单元unit_b,内容挖掘单元unit_c和内容挖掘单元unit_d为存在差异的描述层面相关的内容挖掘单元,能够挖掘待进行隐私信息标记的目标会话日志中与存在差异的描述层面相关的业务会话日志显著表达。其中,内容挖掘单元unit_a能够挖掘描述层面P1相关的业务会话日志显著表达、内容挖掘单元unit_b能够挖掘描述层面P2相关的业务会话日志显著表达、内容挖掘单元unit_c能够挖掘描述层面P3相关的业务会话日志显著表达、内容挖掘单元unit_d能够挖掘描述层面P4相关的业务会话日志显著表达,其中,P1大于P2大于P3大于P4。信息划分单元part_a,信息划分单元part_b,信息划分单元part_c,信息划分单元part_d为存在差异的描述层面相关的信息划分单元,信息划分单元part_d可以结合描述层面P4相关的业务会话日志显著表达,确定描述层面P4下的第一主题识别情况,信息划分单元part_c可以结合描述层面P4下的第一主题识别情况和描述层面P3相关的业务会话日志显著表达,确定描述层面P3下的第一主题识别情况,信息划分单元part_b可以结合描述层面P3下的第一主题识别情况和描述层面P2相关的业务会话日志显著表达,确定描述层面P2下的第一主题识别情况,信息划分单元part_a以结合描述层面P2下的第一主题识别情况和描述层面P1相关的业务会话日志显著表达,确定描述层面P1下的第一主题识别情况。全局处理指示in_c可以结合信息划分单元part_d输出的第一主题识别情况和信息划分单元part_c输出的第一主题识别情况,确定与信息划分单元part_c相关的描述层面P3下的目标主题识别情况,全局处理指示in_b可以结合全局处理指示in_c输出的目标主题识别情况和信息划分单元part_b输出的第一主题识别情况,确定与信息划分单元part_b相关的描述层面P2下的目标主题识别情况,全局处理指示in_a可以结合全局处理指示in_b输出的目标主题识别情况和信息划分单元part_a输出的第一主题识别情况,确定与信息划分单元part_a相关的描述层面P1下的目标主题识别情况,之后,AI模型可以结合信息划分单元part_a相关的描述层面P1下的目标主题识别情况,完成对待进行隐私信息标记的目标会话日志的标记操作以获得用户隐私信息标记业务会话日志。
在一种可示性实施例中,在得到目标业务会话日志相关的用户隐私信息标记情况之后,还可以结合确定的用户隐私信息标记情况,将目标业务会话日志中的隐私信息约束标签相关的会话消息的区分度配置为第一量化值。并且将目标业务会话日志中的除隐私信息约束标签之外的会话消息的区分度配置为第二量化值。
在实际应用过程中,在得到用户隐私信息标记情况之后,可以先将目标业务会话日志中的每个会话消息的区分度统一配置为第二量化值。进一步地,可以结合待进行隐私信息标记的目标会话日志中指向隐私信息约束标签的每个会话消息的状态和目标业务会话日志中每个会话消息的状态,确定目标业务会话日志中的指向隐私信息约束标签的会话消息,将上述会话消息的区分度配置为第一量化值。如此一来,可以得到目标业务会话日志相关的用户隐私信息标记业务会话日志。
在一种可示性实施例中,完成调试的AI模型可以直接输出目标业务会话日志相关的用户隐私信息标记业务会话日志。
在一种可示性实施例中,在得到目标业务会话日志相关的用户隐私信息标记情况之后,还可以确定对于目标业务会话日志的匿名保护策略。
在本申请实施例中,对于目标业务会话日志的匿名保护策略可以是用户提交的对目标业务会话日志进行匿名保护操作的信息。其中,匿名保护策略可以包括对目标业务会话日志中的隐私信息约束标签进行匿名保护操作的信息和/或对目标业务会话日志中的非隐私信息约束标签进行匿名保护操作的信息。进一步地,可以结合用户隐私信息标记情况和匿名保护策略,对目标业务会话日志中的隐私信息约束标签和/或非隐私信息约束标签进行匿名保护操作。
在实际应用过程中,在结合用户隐私信息标记情况,确定目标业务会话日志中的隐私信息约束标签的细节分布之后,可以结合匿名保护策略,对隐私信息约束标签相关的每个会话消息进行匿名保护操作,进而,可以完成对目标业务会话日志中的隐私信息约束标签的匿名保护操作。同样,也可以结合匿名保护策略,对非隐私信息约束标签相关的每个会话消息进行匿名保护操作,以完成对目标业务会话日志的匿名保护操作。
选择性地,在一些可独立实施的设计思路下,该方法还可以包括以下内容:通过用户隐私信息标记情况对所述待进行匿名化分析的用户活动事件进行隐私匿名处理得到已匿名用户活动事件;将所述已匿名用户活动事件进行发布。
在本申请实施例中,可以将已匿名用户活动事件进发布到对应的服务平台或者业务平台,这样一来,能够在不影响用户隐私的前提下尽可能公开较多的用户活动信息以供相关服务商进行用户行为大数据分析。
选择性地,在一些可独立实施的设计思路下,通过用户隐私信息标记情况对所述待进行匿名化分析的用户活动事件进行隐私匿名处理得到已匿名用户活动事件,可以包括以下内容:通过所述用户隐私信息标记情况确定指向目标活动事件主题的隐私画像表达组,所述隐私画像表达组涵盖不少于两个隐私画像表达;确定所述隐私画像表达组中的各个隐私画像表达与所述目标活动事件主题之间的匹配指数;结合所述各个隐私画像表达对应的匹配指数,以及所述各个隐私画像表达的潜在安全描述,对所述各个隐私画像表达进行整理,得到相应的隐私画像表达整理结果;依据所述隐私画像表达整理结果获得指向所述目标活动事件主题的目标匿名等级整理结果,所述目标匿名等级整理结果包括至少两个目标匿名等级标签;依次对每个所述目标匿名等级标签对应的隐私画像表达进行匿名处理。如此设计,通过确定不同隐私画像表达的目标匿名等级标签,能够实现隐私画像表达的差异化匿名处理,从而提高匿名处理的灵活性和针对性。
选择性地,在一些可独立实施的设计思路下,所述结合所述各个隐私画像表达对应的匹配指数,以及所述各个隐私画像表达的潜在安全描述,对所述各个隐私画像表达进行整理,得到相应的隐私画像表达整理结果,包括:结合所述各个隐私画像表达对应的匹配指数,以及所述各个隐私画像表达的潜在安全描述,对所述各个隐私画像表达进行拆解,得到至少两个局部隐私表达集;对各个局部隐私表达集进行整理,并分别对所述各个局部隐私表达集中的各个隐私画像表达进行整理,得到所述隐私画像表达整理结果。如此设计,可以完整地确定出隐私画像表达整理结果。
基于上述同样的发明构思,还提供了一种基于人工智能的用户隐私保护装置20,应用于用户隐私保护系统10,所述装置包括:
信息确定模块21,用于确定待进行匿名化分析的用户活动事件的待定核心隐私信息集;
信息绑定模块22,用于将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与所述待定核心隐私信息集进行绑定,确定所述待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集;
日志获取模块23,用于基于所述用户隐私信息显著描述集对所述目标业务会话日志进行局部化处理以获得待进行隐私信息标记的目标会话日志;
信息标记模块24,用于借助已经完成调试的AI模型,对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得所述目标业务会话日志相关的用户隐私信息标记情况。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,用户隐私保护系统10,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于人工智能的用户隐私保护方法,其特征在于,包括:
确定待进行匿名化分析的用户活动事件的待定核心隐私信息集;将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与所述待定核心隐私信息集进行绑定,确定所述待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集;
基于所述用户隐私信息显著描述集对所述目标业务会话日志进行局部化处理以获得待进行隐私信息标记的目标会话日志;借助已经完成调试的AI模型,对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得所述目标业务会话日志相关的用户隐私信息标记情况。
2.如权利要求1所述的方法,其特征在于,所述显著描述集涵盖第一显著描述集;所述待绑定用户活动事件涵盖第一待绑定用户活动事件;所述方法还包括:确定所述目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集的步骤:对所述目标业务会话日志进行用户隐私信息的显著描述挖掘,确定所述目标业务会话日志中的不少于一个第一待绑定用户活动事件中的每个第一待绑定用户活动事件的第一显著描述集;
所述将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与所述待定核心隐私信息集进行绑定,确定所述待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集,包括:对于每个所述第一待绑定用户活动事件,结合所述第一待绑定用户活动事件的用户隐私信息相关的第一显著描述集,确定所述第一待绑定用户活动事件相关的第一显著描述内容;确定待进行匿名化分析的用户活动事件相关的第二显著描述内容;其中,所述第二显著描述内容为所述待进行匿名化分析的用户活动事件的待定核心隐私信息集相关的显著描述内容;将与所述第二显著描述内容相绑定的第一显著描述内容相关的第一待绑定用户活动事件确定为所述待进行匿名化分析的用户活动事件,并将所述待进行匿名化分析的用户活动事件的第一显著描述集确定为所述目标业务会话日志中的所述用户隐私信息显著描述集。
3.如权利要求1所述的方法,其特征在于,所述显著描述集包括第二显著描述集;所述待绑定用户活动事件包括第二待绑定用户活动事件;所述方法还包括:确定所述目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集的步骤:对所述目标业务会话日志进行用户隐私信息的显著描述挖掘,确定所述目标业务会话日志中的不少于一个第二待绑定用户活动事件中的每个第二待绑定用户活动事件的第二显著描述集;
所述将目标业务会话日志中的每个待绑定用户活动事件的用户隐私信息相关的显著描述集与所述待定核心隐私信息集进行绑定,确定所述待进行匿名化分析的用户活动事件在目标业务会话日志中的用户隐私信息显著描述集,包括:
基于每个所述第二待绑定用户活动事件的第二显著描述集,分别确定每个所述第二待绑定用户活动事件相关的第一隐私会话描述;确定待进行匿名化分析的用户活动事件相关的第二隐私会话描述;将与所述第二隐私会话描述相绑定的第一隐私会话描述相关的第二待绑定用户活动事件确定为所述待进行匿名化分析的用户活动事件,并将所述待进行匿名化分析的用户活动事件的第二显著描述集确定为所述目标业务会话日志中的用户隐私信息显著描述集。
4.如权利要求2所述的方法,其特征在于,所述确定待进行匿名化分析的用户活动事件的待定核心隐私信息集,包括:确定存在持续性分析需求的业务会话日志;对所述存在持续性分析需求的业务会话日志进行用户隐私信息的显著描述挖掘,确定所述存在持续性分析需求的业务会话日志中的不少于一个基础用户活动事件相关的基础显著描述集;结合所述不少于一个基础用户活动事件中每个基础用户活动事件相关的基础显著描述集的可信系数,从所述基础用户活动事件中确定所述待进行匿名化分析的用户活动事件,并将所述待进行匿名化分析的用户活动事件相关的基础显著描述集确定为所述待定核心隐私信息集;
在所述确定待进行匿名化分析的用户活动事件相关的第二显著描述内容之前,所述方法还包括:基于所述待定核心隐私信息集,确定所述待进行匿名化分析的用户活动事件相关的所述第二显著描述内容。
5.如权利要求2所述的方法,其特征在于,所述方法还包括:
在结合所述第一显著描述内容和所述第二显著描述内容没有挖掘到目标业务会话日志中的用户隐私信息显著描述集的前提下,确定每个所述第一显著描述集的可信系数;
将存在最高的可信系数的第一显著描述集确定为所述目标业务会话日志中的用户隐私信息显著描述集,并将所述存在最高的可信系数的第一显著描述集相关的第一待绑定用户活动事件确定为当前的待进行匿名化分析的用户活动事件。
6.如权利要求1-5任一项所述的方法,其特征在于,所述借助已经完成调试的AI模型,对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得所述目标业务会话日志相关的用户隐私信息标记情况,包括:
借助已经完成调试的所述AI模型,挖掘所述待进行隐私信息标记的目标会话日志的业务会话日志显著表达和全局关联表达;
挖掘所述待进行隐私信息标记的目标会话日志中与存在差异的描述层面分别相关的业务会话日志显著表达;其中,多个描述层面中涵盖存在上下游关系的第一描述层面和第二描述层面,所述第一描述层面的优先级低于所述第二描述层面;所述第一描述层面相关的业务会话日志显著表达为结合所述第二描述层面相关的业务会话日志显著表达以及第二描述层面相关的业务会话日志显著表达的全局关联表达确定的;所述第二描述层面相关的业务会话日志显著表达的全局关联表达为借助已经完成调试的所述AI模型挖掘得到的;
结合存在差异的描述层面分别相关的业务会话日志显著表达对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作以获得所述目标业务会话日志相关的用户隐私信息标记情况;
相应地,所述结合存在差异的描述层面分别相关的业务会话日志显著表达对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作,包括:
对于所述存在差异的描述层面中的每个描述层面,结合该描述层面相关的业务会话日志显著表达,确定所述待进行隐私信息标记的目标会话日志在该描述层面下的第一主题识别情况;
结合所述待进行隐私信息标记的目标会话日志在每个描述层面下的第一主题识别情况,确定所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性;
结合所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性和设定标记指标,对所述待进行隐私信息标记的目标会话日志进行隐私信息约束标签的标记操作。
7.如权利要求6所述的方法,其特征在于,所述结合所述待进行隐私信息标记的目标会话日志在每个描述层面下的第一主题识别情况,确定所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性,包括:基于所述存在差异的描述层面升序的规则执行若干轮整理操作之后以获得所述待进行隐私信息标记的目标会话日志中各个会话消息为隐私信息约束标签相关的会话消息的可能性;
其中,所述若干轮整理操作中第i轮整理操作包括:确定所述第一描述层面下的第一主题识别情况的主题可信系数信息;借助所述第一描述层面下的第一主题识别情况的主题可信系数信息,对所述第一描述层面下的第一主题识别情况和所述第二描述层面下的第一主题识别情况进行全局处理以获得所述第二描述层面下的目标主题识别情况;将所述目标主题识别情况调整为第i+1轮全局处理操作中第一描述层面的第一主题识别情况。
8.如权利要求7所述的方法,其特征在于,所述对于所述存在差异的描述层面中的每个描述层面,结合该描述层面相关的业务会话日志显著表达,确定所述待进行隐私信息标记的目标会话日志在该描述层面下的第一主题识别情况,包括:
对于目标描述层面,结合所述目标描述层面相关的业务会话日志显著表达,确定所述待进行隐私信息标记的目标会话日志在所述目标描述层面下的第一主题识别情况;
对于除目标描述层面外的每个所述第二描述层面,结合该第二描述层面相关的业务会话日志显著表达和所述待进行隐私信息标记的目标会话日志在所述第一描述层面下的第一主题识别情况,确定所述待进行隐私信息标记的目标会话日志在该第二描述层面下的第一主题识别情况。
9.如权利要求1所述的方法,其特征在于,在所述获得目标业务会话日志相关的用户隐私信息标记情况之后,还包括:结合所述用户隐私信息标记情况,将所述目标业务会话日志中的隐私信息约束标签相关的会话消息的区分度配置为第一量化值;将所述目标业务会话日志中的除所述隐私信息约束标签之外的会话消息的区分度配置为第二量化值;
相应地,在所述获得目标业务会话日志相关的用户隐私信息标记情况之后,该方法还包括:确定对于所述目标业务会话日志的匿名保护策略;结合所述用户隐私信息标记情况和所述匿名保护策略,对所述目标业务会话日志中的隐私信息约束标签和/或非隐私信息约束标签进行匿名保护操作。
10.一种用户隐私保护系统,其特征在于,包括处理器、网络模块和存储器;所述处理器和所述存储器通过所述网络模块通信,所述处理器从所述存储器中读取计算机程序并运行,以执行权利要求1-8任一项所述的方法。
CN202111222574.XA 2021-10-20 2021-10-20 一种基于人工智能的用户隐私保护方法及系统 Pending CN113918993A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111222574.XA CN113918993A (zh) 2021-10-20 2021-10-20 一种基于人工智能的用户隐私保护方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111222574.XA CN113918993A (zh) 2021-10-20 2021-10-20 一种基于人工智能的用户隐私保护方法及系统

Publications (1)

Publication Number Publication Date
CN113918993A true CN113918993A (zh) 2022-01-11

Family

ID=79241531

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111222574.XA Pending CN113918993A (zh) 2021-10-20 2021-10-20 一种基于人工智能的用户隐私保护方法及系统

Country Status (1)

Country Link
CN (1) CN113918993A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139213A (zh) * 2022-02-07 2022-03-04 广州海洁尔医疗设备有限公司 一种icu病房监控数据处理方法及系统
CN114564749A (zh) * 2022-03-04 2022-05-31 聊城保磊计算机科技有限公司 一种针对智慧云服务的用户信息保护方法及服务器
CN114662153A (zh) * 2022-04-13 2022-06-24 大庆迅亦捷科技有限公司 一种结合人工智能的共享数据隐私处理方法及服务器
CN116522401A (zh) * 2023-07-04 2023-08-01 成都乐超人科技有限公司 基于云数据安全的信息去标识化处理方法及系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139213A (zh) * 2022-02-07 2022-03-04 广州海洁尔医疗设备有限公司 一种icu病房监控数据处理方法及系统
CN114139213B (zh) * 2022-02-07 2022-05-17 广州海洁尔医疗设备有限公司 一种icu病房监控数据处理方法及系统
CN114564749A (zh) * 2022-03-04 2022-05-31 聊城保磊计算机科技有限公司 一种针对智慧云服务的用户信息保护方法及服务器
CN114564749B (zh) * 2022-03-04 2022-12-23 厦门熙重电子科技有限公司 一种针对智慧云服务的用户信息保护方法及服务器
CN114662153A (zh) * 2022-04-13 2022-06-24 大庆迅亦捷科技有限公司 一种结合人工智能的共享数据隐私处理方法及服务器
CN114662153B (zh) * 2022-04-13 2022-11-29 福建实达集团股份有限公司 一种结合人工智能的共享数据隐私处理方法及服务器
CN116522401A (zh) * 2023-07-04 2023-08-01 成都乐超人科技有限公司 基于云数据安全的信息去标识化处理方法及系统
CN116522401B (zh) * 2023-07-04 2023-08-29 成都乐超人科技有限公司 基于云数据安全的信息去标识化处理方法及系统

Similar Documents

Publication Publication Date Title
CN113918993A (zh) 一种基于人工智能的用户隐私保护方法及系统
US9910913B2 (en) Ingestion planning for complex tables
CN112165462A (zh) 基于画像的攻击预测方法、装置、电子设备及存储介质
CN113901089A (zh) 一种应用于大数据防护的威胁行为识别方法及系统
CN113918621A (zh) 一种基于互联网金融的大数据防护处理方法及服务器
CN114138872A (zh) 一种应用于数字金融的大数据入侵分析方法及存储介质
CN113691556A (zh) 一种应用于信息防护检测的大数据处理方法及服务器
CN105989457A (zh) 一种信息查询方法及装置
CN114244611B (zh) 异常攻击检测方法、装置、设备及存储介质
CN114417405A (zh) 一种基于人工智能的隐私业务数据分析方法及服务器
CN116992052B (zh) 用于威胁情报领域的长文本摘要方法、装置和电子设备
CN113434857A (zh) 一种应用深度学习的用户行为安全解析方法及系统
CN110489416B (zh) 一种基于数据处理的信息存储方法及相关设备
CN114329454B (zh) 一种基于应用软件大数据的威胁分析方法及系统
CN113656466B (zh) 保单数据查询方法、装置、设备及存储介质
CN113704624B (zh) 基于用户分流的策略推荐方法、装置、设备及介质
CN116127154A (zh) 知识标签推荐方法、装置、电子设备及存储介质
CN117009832A (zh) 异常命令的检测方法、装置、电子设备及存储介质
CN114186272A (zh) 一种基于数字办公的大数据威胁防护方法及系统
CN113992371A (zh) 一种流量日志的威胁标签生成方法、装置及电子设备
CN115174633B (zh) 工业互联网业务数据处理方法、系统及云平台
Sokolov Applied Machine Learning for Cybersecurity in Spam Filtering and Malware Detection
CN115174226B (zh) 基于人工智能和大数据的用户行为预测方法、设备、介质及产品
CN113627938B (zh) 一种区块链的数据删除方法、装置、设备及存储介质
CN112070500B (zh) 基于数字金融服务的区块链支付处理方法及云计算中心

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20220111

WD01 Invention patent application deemed withdrawn after publication