发明内容
本发明提供一种应对云服务的敏感软件大数据处理方法及服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种应对云服务的敏感软件大数据处理方法,应用于软件大数据服务器,所述方法包括:
获取第一敏感软件操作数据与第一软件服务应答信息;
获取所述第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量;将所述至少两个标签的用户操作行为属性向量融合,得到所述第一敏感软件操作数据对应的第一标签联动表征知识;获取所述第一软件服务应答信息对应的至少两个标签的服务应答隐私推演字段;将所述至少两个标签的服务应答隐私推演字段融合,得到所述第一软件服务应答信息对应的第二标签联动表征知识;
依据所述第一敏感软件操作数据对应的第一标签联动表征知识,以及所述第一软件服务应答信息对应的第二标签联动表征知识,获取所述第一敏感软件操作数据与所述第一软件服务应答信息的操作应答关联评价;依据所述操作应答关联评价,确定所述第一敏感软件操作数据与所述第一软件服务应答信息的绑定分析结果。
在一些可独立实施的实施例中,所述将所述至少两个标签的用户操作行为属性向量融合,得到所述第一敏感软件操作数据对应的第一标签联动表征知识,包括:将所述至少两个标签的用户操作行为属性向量加载至操作-应答联合分析算法中的第一知识加权子网,获取所述第一敏感软件操作数据对应的第一标签联动表征知识;
所述将所述至少两个标签的服务应答隐私推演字段融合,得到所述第一软件服务应答信息对应的第二标签联动表征知识,包括:将所述至少两个标签的服务应答隐私推演字段加载至操作-应答联合分析算法中的第二标签知识加权子网,获取所述第一软件服务应答信息对应的第二标签联动表征知识。
在一些可独立实施的实施例中,所述第一知识加权子网为特征整合单元或残差神经网络;或者,所述第二标签知识加权子网为所述特征整合单元或所述残差神经网络。
在一些可独立实施的实施例中,所述获取所述第一软件服务应答信息对应的至少两个标签的服务应答隐私推演字段,包括:将所述第一软件服务应答信息加载至操作-应答联合分析算法中的应答隐私推演决策子网,获得所述第一软件服务应答信息对应的至少两个标签的服务应答隐私推演字段。
在一些可独立实施的实施例中,所述至少两个标签的服务应答隐私推演字段包括场景化服务应答隐私推演字段以及至少一种标签的阶段化服务应答隐私推演字段;所述应答隐私推演决策子网包括场景化隐私推演处理单元与至少一个阶段化隐私推演处理单元;所述场景化隐私推演处理单元包含至少两个隐私推演字段提炼节点;所述阶段化隐私推演处理单元包含至少一个隐私推演字段提炼节点;所述隐私推演字段提炼节点用于提取服务应答隐私推演字段;
所述将所述第一软件服务应答信息加载至操作-应答联合分析算法中的应答隐私推演决策子网,获得所述第一软件服务应答信息对应的至少两个不同标签的服务应答隐私推演字段,包括:
依据所述第一软件服务应答信息,以及所述应答隐私推演决策子网中的场景化隐私推演处理单元,获取所述第一软件服务应答信息对应的场景化服务应答隐私推演字段;
依据所述第一软件服务应答信息与所述应答隐私推演决策子网中的至少一个阶段化隐私推演处理单元,获取所述第一软件服务应答信息对应的至少一种标签的阶段化服务应答隐私推演字段。
在一些可独立实施的实施例中,所述依据所述第一软件服务应答信息与所述应答隐私推演决策子网中的至少一个阶段化隐私推演处理单元,获取所述第一软件服务应答信息对应的至少一个不同标签的阶段化服务应答隐私推演字段,包括:
依据所述场景化隐私推演处理单元中第一设定数目的隐私推演字段提炼节点,对所述第一软件服务应答信息进行隐私推演分析,获取所述第一软件服务应答信息对应的第一级初始应答隐私推演字段;
将所述第一级初始应答隐私推演字段进行拆解,获得所述第一级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段;
将所述第一级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段组合,获得所述第一级初始隐私推演组合字段;所述第一级初始隐私推演组合字段是与所述第一级初始应答隐私推演字段不同的服务应答隐私推演字段;所述第一级初始隐私推演组合字段与所述第一级初始应答隐私推演字段的特征规模相同;
依据所述第一级初始隐私推演组合字段,以及所述应答隐私推演决策子网中的至少一个阶段化隐私推演处理单元,获取所述第一软件服务应答信息对应的至少一种标签的阶段化服务应答隐私推演字段。
在一些可独立实施的实施例中,所述应答隐私推演决策子网包括X个阶段化隐私推演处理单元;所述依据所述第一级初始应答隐私推演字段,以及所述应答隐私推演决策子网中的至少一个阶段化隐私推演处理单元,获取所述第一软件服务应答信息对应的至少一个标签的阶段化服务应答隐私推演字段,包括:
依据所述第一级初始应答隐私推演字段,以及所述应答隐私推演决策子网中的第一个阶段化隐私推演处理单元,获取所述第一软件服务应答信息对应的第一种标签的阶段化服务应答隐私推演字段;
依据第u-1个阶段化隐私推演处理单元中第二设定数目的隐私推演字段提炼节点,对所述第u-1级初始隐私推演组合字段进行隐私推演分析,获得第u级初始应答隐私推演字段;
将所述第u级初始应答隐私推演字段进行拆解,获得所述第u级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段;
将所述第u级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段组合,获得所述第u级初始隐私推演组合字段;所述第u级初始隐私推演组合字段是与所述第u级初始应答隐私推演字段不同的服务应答隐私推演字段;所述第u级初始隐私推演组合字段与所述第u级初始应答隐私推演字段的特征规模相同;
依据所述第u级初始隐私推演组合字段,以及所述应答隐私推演决策子网中的第u个阶段化隐私推演处理单元,获取所述第一软件服务应答信息对应的第u种标签的阶段化服务应答隐私推演字段;其中,u大于等于2且小于等于X,且u与X为整数。
在一些可独立实施的实施例中,所述获取所述第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量,包括:将所述第一敏感软件操作数据加载至所述操作-应答联合分析算法中的操作行为属性挖掘子网,获得所述第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量;所述操作行为属性挖掘子网为用于挖掘用户操作行为属性向量的AI机器学习算法。
在一些可独立实施的实施例中,所述将所述第一敏感软件操作数据加载至所述操作-应答联合分析算法中的操作行为属性挖掘子网,获得所述第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量,包括:
获取所述第一敏感软件操作数据的至少两个标签的敏感软件操作项信息;所述至少两个标签的敏感软件操作项信息包括敏感软件全流程操作信息与至少一种标签的敏感软件操作环节信息;所述敏感软件全流程操作信息的标签等级大于所述敏感软件操作环节信息的标签;
将所述第一敏感软件操作数据的至少两个标签的敏感软件操作项信息加载至敏感软件操作数据与软件服务应答信息模型中的操作行为属性挖掘子网,获得所述第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量。
在一些可独立实施的实施例中,所述方法还包括:
获取算法调试依据,所述算法调试依据中包含已认证敏感软件操作数据,以及与所述已认证敏感软件操作数据匹配的第一已认证软件服务应答信息;
将所述已认证敏感软件操作数据加载至所述操作-应答联合分析算法中的操作行为属性挖掘子网,获取所述已认证敏感软件操作数据对应的至少两个标签的用户操作行为属性向量;
将所述第一已认证软件服务应答信息加载至所述操作-应答联合分析算法中的应答隐私推演决策子网,获取所述第一已认证软件服务应答信息对应的至少两个标签的服务应答隐私推演字段;
将所述已认证敏感软件操作数据对应的至少两个标签的用户操作行为属性向量融合,得到所述已认证敏感软件操作数据对应的第一标签联动表征知识;
将所述第一已认证软件服务应答信息对应的至少两个标签的服务应答隐私推演字段融合,得到所述第一已认证软件服务应答信息对应的第二标签联动表征知识;
将所述已认证敏感软件操作数据对应的第一标签联动表征知识与所述第一已认证软件服务应答信息对应的第二标签联动表征知识加载至算法优劣检测任务中,获取所述已认证敏感软件操作数据对应的算法优劣评价变量;
依据所述已认证敏感软件操作数据对应的算法优劣评价变量,调试所述操作-应答联合分析算法。
第二方面是一种软件大数据服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述软件大数据服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
根据本发明的一个实施例,获取第一敏感软件操作数据与第一软件服务应答信息各自对应的至少两个标签的细节描述,将至少两个标签的用户操作行为属性向量整合成第一标签联动表征知识,将至少两个标签的服务应答隐私推演字段整合成第二标签联动表征知识,并根据第一标签联动表征知识与第二标签联动表征知识之间的操作应答关联评价确定该第一敏感软件操作数据与第一软件服务应答信息之间的绑定分析结果。如此,通过敏感软件操作数据与软件服务应答信息之间的多种标签的联动表征知识之间的操作应答关联评价确定敏感软件操作数据与软件服务应答信息的绑定分析结果,还关注了不同层级标签之间的敏感软件操作数据与软件服务应答信息的关联性,提高了敏感软件操作数据与软件服务应答信息之间的绑定分析精度,为之后的数据脱敏和隐私防护提供尽可能完整丰富的指导依据。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的应对云服务的敏感软件大数据处理方法的流程示意图,应对云服务的敏感软件大数据处理方法可以通过软件大数据服务器实现,软件大数据服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述软件大数据服务器执行STEP101-STEP107所描述的技术方案。
STEP101,获取第一敏感软件操作数据与第一软件服务应答信息。
举例而言,该第一敏感软件操作数据是包含对某一APP操作行为的描述的敏感软件操作数据,该第一软件服务应答信息是对应于第一敏感软件操作数据的备选软件服务应答信息库中的其中一个软件服务应答信息。其中,该第一敏感软件操作数据的备选软件服务应答信息库可以包含至少两个备选软件服务应答信息,该第一软件服务应答信息是该至少两个备选软件服务应答信息中的任意一个。
举例而言,该第一软件服务应答信息可以是预存于软件大数据服务器中的软件服务应答信息。
举例而言,该第一软件服务应答信息可以是响应于获取到该第一敏感软件操作数据,获取的第一软件服务应答信息。
比如,该第一软件服务应答信息可以是预存于软件大数据服务器中的软件服务应答信息,也可以是与该第一敏感软件操作数据同时加载的软件服务应答信息。
此外,敏感软件操作数据反映用户针对APP的一些列操作行为,软件服务应答信息反映APP基于相关的敏感软件操作数据输出的应答反馈,比如敏感软件操作数据为调取业务咨询记录,则软件服务应答信息可以包含与业务咨询记录相关的数据信息(这些数据信息可能携带一些较为隐私的内容)。
STEP102,获取该第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量。
其中,不同标签的用户操作行为属性向量中包含从不同层级的用户操作行为属性向量中提取出的敏感软件操作数据对应的要素特征。上述层级可以是全流程操作轨迹、部分操作轨迹、操作事件、会话交互行为中的任意一者,即不同标签的用户操作行为属性向量可以是全流程操作轨迹对应的用户操作行为属性向量、部分操作轨迹对应的用户操作行为属性向量、操作事件对应的用户操作行为属性向量或会话交互行为对应的用户操作行为属性向量。
举例而言,该用户操作行为属性向量可以是通过全卷积模型对该第一敏感软件操作数据提取出的用户操作行为属性向量。
此时用户操作行为属性向量的标签可以代表该全卷积模型对该第一敏感软件操作数据进行属性挖掘时对应的数据规模。比如,通过全卷积模型将全流程操作轨迹作为加载至进行隐私推演分析时,提取出的用户操作行为属性向量即为全流程操作轨迹标签的用户操作行为属性向量,该全流程操作轨迹标签的用户操作行为属性向量在提取时考虑了整个全流程操作轨迹中部分操作轨迹、操作事件、会话交互行为各自的要素特征以及部分操作轨迹、操作事件、会话交互行为互相作用的要素特征,因此全流程操作轨迹标签是最大的用户操作行为属性向量标签;通过全卷积模型将会话交互行为作为加载至进行隐私推演分析时,提取出的用户操作行为属性向量为会话交互行为标签的用户操作行为属性向量,该会话交互行为标签在进行隐私推演分析时仅考虑到该会话交互行为本身的用户操作行为属性向量,因此会话交互行为特征为最小标签的用户操作行为属性向量。
STEP103,将该至少两个标签的用户操作行为属性向量融合,得到该第一敏感软件操作数据对应的第一标签联动表征知识。
其中,鉴于该第一标签联动表征知识是根据第一敏感软件操作数据的至少两个标签的用户操作行为属性向量融合得到的,因此第一标签联动表征知识中同时包含了第一敏感软件操作数据的至少两个标签的用户操作行为属性向量的细节,第一标签联动表征知识可以理解为第一融合特征。
举例而言,每种标签的用户操作行为属性向量中可以包含一个或多个标签相同但细节存在差异的用户操作行为属性向量。
STEP104,获取该第一软件服务应答信息对应的至少两个标签的服务应答隐私推演字段。
举例而言,当该第一软件服务应答信息是预存于软件大数据服务器中的软件服务应答信息时,该第一软件服务应答信息对应的第二标签联动表征知识是预存于软件大数据服务器中,即软件大数据服务器在第一敏感软件操作数据加载至之前已经对该第一软件服务应答信息预执行了服务应答隐私推演字段挖掘处理,提取出了第一软件服务应答信息的至少两个标签的服务应答隐私推演字段。服务应答隐私推演字段可以理解为第一软件服务应答信息的隐私推演特征,也即,隐私推演特征能够表征可以通过第一软件服务应答信息的内容进行隐私推导和分析。比如敏感软件操作数据为调取业务咨询记录,则软件服务应答信息可以包含与业务咨询记录相关的数据信息,服务应答隐私推演字段可以表征能够通过与业务咨询记录相关的数据信息推导出相关的较为隐私的内容。
在其他的示例性实施例中,当该第一软件服务应答信息是响应于获取到该第一敏感软件操作数据,获取的第一软件服务应答信息,则该第一软件服务应答信息是与该第一敏感软件操作数据同时加载至软件大数据服务器的软件服务应答信息,此时通过软件大数据服务器对该第一软件服务应答信息进行服务应答隐私推演字段提取,获取该第一软件服务应答信息对应的至少两个标签的服务应答隐私推演字段。
STEP105,将该至少两个标签的服务应答隐私推演字段融合,得到该第一软件服务应答信息对应的第二标签联动表征知识。
举例而言,不同标签服务应答隐私推演字段是从不同规模的软件服务应答信息中挖掘得到的细节向量,其中软件服务应答信息的规模可以指软件服务应答信息的信息密度。对于不同信息密度的软件服务应答信息,其软件服务应答信息中包含的数据量大小也不同,通常信息密度越大的软件服务应答信息包含的数据量越多,因此从信息密度更大的软件服务应答信息中,获取的服务应答隐私推演字段的标签(尺寸/维度)也越多/大。
STEP106,依据该第一敏感软件操作数据对应的第一标签联动表征知识,以及该第一软件服务应答信息对应的第二标签联动表征知识,获取该第一敏感软件操作数据与该第一软件服务应答信息的操作应答关联评价。
其中,该第一敏感软件操作数据与该第一软件服务应答信息的操作应答关联评价,用于指示该第一敏感软件操作数据表征的内容与该第一软件服务应答信息表征的内容的关联性。
STEP107,依据该操作应答关联评价,确定该第一敏感软件操作数据与该第一软件服务应答信息的绑定分析结果。
举例而言,依据该操作应答关联评价与关联评价限定值的比较结果,确定该第一敏感软件操作数据与该第一软件服务应答信息的绑定分析结果。
当确定该第一敏感软件操作数据与该第一软件服务应答信息的操作应答关联评价后,可以根据操作应答关联评价与关联评价限定值进行比较,当该操作应答关联评价高于关联评价限定值时,则可以认为该第一敏感软件操作数据与该第一软件服务应答信息具有绑定关系;当该操作应答关联评价不高于关联评价限定值时,则认为该第一敏感软件操作数据与该第一软件服务应答信息不具有绑定关系。
举例而言,该第一敏感软件操作数据与该第一软件服务应答信息的绑定分析结果是该第一敏感软件操作数据与该第一软件服务应答信息的配对置信因子,该配对置信因子用于指示该第一敏感软件操作数据与该第一软件服务应答信息为相互配对的概率高低。
举例而言,第一敏感软件操作数据的至少两个标签的用户操作行为属性向量中包含场景化用户操作行为属性向量(全局用户操作行为属性向量)与至少一个阶段化用户操作行为属性向量(局部用户操作行为属性向量),将该第一敏感软件操作数据的场景化用户操作行为属性向量与阶段化用户操作行为属性向量进行融合,得到的第一敏感软件操作数据的操作行为联动表征知识(即第一标签联动表征知识)同时具有第一敏感软件操作数据的整体细节与部分细节,该第一软件服务应答信息的至少两个标签的服务应答隐私推演字段中也包含场景化服务应答隐私推演字段(全局服务应答隐私推演字段)与至少一个阶段化服务应答隐私推演字段(局部服务应答隐私推演字段),将该第一软件服务应答信息的场景化服务应答隐私推演字段与阶段化服务应答隐私推演字段进行融合,得到的各个第一软件服务应答信息的软件服务应答信息联动表征知识(第二标签联动表征知识)也同时具有第一软件服务应答信息的整体细节与部分细节;此时根据该第一敏感软件操作数据的操作行为联动表征知识与第一软件服务应答信息的软件服务应答信息联动表征知识确定第一敏感软件操作数据与第一软件服务应答信息的绑定分析结果,可以同时考虑到软件服务应答信息与敏感软件操作数据的部分细节和整体细节,当第一软件服务应答信息既与敏感软件操作数据的部分内容关联,也与敏感软件操作数据的全局内容关联时,将该第一软件服务应答信息作为与第一敏感软件操作数据匹配的目标软件服务应答信息,提高了敏感软件操作数据与服务应答隐私推演字段的绑定分析精度,为之后的数据脱敏和隐私防护提供尽可能完整丰富的指导依据。
比如,如果确定第一软件服务应答信息与第一敏感软件操作数据匹配绑定,则表明APP在响应第一敏感软件操作数据时可能会输出携带隐私内容的第一软件服务应答信息,在此基础上,可以进行针对性的隐私匿名处理,比如在之后响应第一敏感软件操作数据时,提前对需要输出的第一软件服务应答信息中的隐私信息进行匿名或者数据脱敏,然后再进行输出,这样可以避免相关隐私数据被意外泄露。
举例而言,该第一软件服务应答信息是备选软件服务应答信息库中各个备选软件服务应答信息中的其中一个,可以根据该第一敏感软件操作数据的操作行为联动表征知识与该各个备选软件服务应答信息的软件服务应答信息联动表征知识之间的操作应答关联评价,对该各个备选软件服务应答信息进行整理,将操作应答关联评价最高的获取为目标软件服务应答信息;或者,将该各个备选软件服务应答信息中,对应的操作应答关联评价最高的选定数目的备选软件服务应答信息获取为目标软件服务应答信息。
举例而言,将大于关联评价限定值的操作应答关联评价对应的备选软件服务应答信息获取为目标软件服务应答信息。
即操作应答关联评价大于关联评价限定值的备选软件服务应答信息,都有可能是与第一敏感软件操作数据对应的目标软件服务应答信息,此时将所有操作应答关联评价大于关联评价限定值的备选软件服务应答信息,作为第一敏感软件操作数据对应的目标软件服务应答信息,提高了获取第一敏感软件操作数据匹配的软件服务应答信息的精度。
本发明实施例的设计思路的示例性应用包括不限于如下三类。
第一类、根据敏感软件操作数据获取与敏感软件操作数据匹配的软件服务应答信息。
在多个软件服务应答信息中选取与敏感软件操作数据匹配的软件服务应答信息时,该多个软件服务应答信息可以是软件大数据服务器中预存的软件服务应答信息,此时软件大数据服务器已经对该多个软件服务应答信息挖掘过各个软件服务应答信息对应的多个标签的服务应答隐私推演字段,并整合成了各个软件服务应答信息对应的第二标签联动表征知识;此时软件大数据服务器只需要对该敏感软件操作数据进行多标签的用户操作行为属性向量挖掘,并对该多个标签的用户操作行为属性向量进行整合;再通过整合后的第一标签联动表征知识与各个软件服务应答信息对应的第二标签联动表征知识进行操作应答关联评价比较,以确定各个软件服务应答信息中与该敏感软件操作数据匹配的软件服务应答信息。
第二类、根据软件服务应答信息获取与软件服务应答信息匹配的敏感软件操作数据。
在多个敏感软件操作数据中选取与软件服务应答信息匹配的敏感软件操作数据时,该多个敏感软件操作数据可以是软件大数据服务器中预存的敏感软件操作数据,此时软件大数据服务器已经对该多个敏感软件操作数据挖掘过各个敏感软件操作数据对应的多个标签的用户操作行为属性向量,并组合成了各个敏感软件操作数据对应的第一标签联动表征知识;此时软件大数据服务器只需要对该软件服务应答信息进行多标签的服务应答隐私推演字段挖掘,并对该多个标签的服务应答隐私推演字段进行组合;再通过组合后的第二标签联动表征知识与各个敏感软件操作数据对应的第一标签联动表征知识进行操作应答关联评价比较,以确定各个敏感软件操作数据中与该软件服务应答信息匹配的敏感软件操作数据。
第三类、确定敏感软件操作数据与软件服务应答信息的配对程度。
在确定软件服务应答信息与敏感软件操作数据的绑定分析结果时,可以同时将敏感软件操作数据与软件服务应答信息加载至软件大数据服务器,此时软件大数据服务器对该敏感软件操作数据挖掘多个标签的用户操作行为属性向量,并整合成第一标签联动表征知识;软件大数据服务器对该软件服务应答信息挖掘多个标签的服务应答隐私推演字段,并整合成第二标签联动表征知识;此时敏感软件操作数据匹配设备再将该第一标签联动表征知识与第二标签联动表征知识进行操作应答关联评价比较,以确定该敏感软件操作数据与软件服务应答信息的配对程度。
可见,获取第一敏感软件操作数据与第一软件服务应答信息各自对应的至少两个标签的细节描述,将至少两个标签的用户操作行为属性向量整合成第一标签联动表征知识,将至少两个标签的服务应答隐私推演字段整合成第二标签联动表征知识,并根据第一标签联动表征知识与第二标签联动表征知识之间的操作应答关联评价确定该第一敏感软件操作数据与第一软件服务应答信息之间的绑定分析结果。如此,通过敏感软件操作数据与软件服务应答信息之间的多种标签的联动表征知识之间的操作应答关联评价确定敏感软件操作数据与软件服务应答信息的绑定分析结果,还关注了不同层级标签之间的敏感软件操作数据与软件服务应答信息的关联性,提高了敏感软件操作数据与软件服务应答信息之间的绑定分析精度,为之后的数据脱敏和隐私防护提供尽可能完整丰富的指导依据。
进一步地,一种针对敏感软件操作数据和软件服务应答信息绑定分析思路可以如下:将第一敏感软件操作数据data1以及第一敏感软件操作数据对应的备选软件服务应答信息库information set中的各个备选软件服务应答信息作为第一软件服务应答信息加载至操作-应答联合分析算法FCN,操作-应答联合分析算法FCN将加载的第一敏感软件操作数据以及第一软件服务应答信息进行敏感软件操作数据与软件服务应答信息匹配,当该第一敏感软件操作数据与第一软件服务应答信息的操作应答关联评价满足绑定分析结果,即该第一软件服务应答信息与该第一敏感软件操作数据是相互匹配的软件服务应答信息与敏感软件操作数据时,在备选软件服务应答信息库information set中确定与第一敏感软件操作数据data1匹配的备选软件服务应答信息作为目标软件服务应答信息targetinformation并输出。
其中,在操作-应答联合分析算法FCN中,将备选软件服务应答信息库informationset中的各个备选软件服务应答信息作为第一软件服务应答信息加载至应答隐私推演决策子网M1,应答隐私推演决策子网M1对第一软件服务应答信息进行服务应答隐私推演字段提取,获得该第一软件服务应答信息对应的服务应答隐私推演字段deduction,第一软件服务应答信息对应的服务应答隐私推演字段deduction中都包含各备选软件服务应答信息对应的第一软件服务应答信息的软件服务应答信息整体细节以及至少一个软件服务应答信息部分细节。
第一敏感软件操作数据data1加载至操作-应答联合分析算法FCN中的操作行为属性挖掘子网M2,操作行为属性挖掘子网M2对第一敏感软件操作数据进行用户操作行为属性向量提取,获得该第一敏感软件操作数据对应的第一用户操作行为属性向量attributevector,第一用户操作行为属性向量attribute vector中包含第一敏感软件操作数据对应的敏感软件操作数据整体细节以及至少一个敏感软件操作数据部分细节。
根据第一敏感软件操作数据data1对应的第一用户操作行为属性向量attributevector进行组合得到操作行为联动表征知识,以及备选软件服务应答信息库informationset中的第一软件服务应答信息对应的服务应答隐私推演字段deduction进行组合得到软件服务应答信息联动表征知识,确定得到操作行为联动表征知识与第一软件服务应答信息对应的软件服务应答信息联动表征知识之间的操作应答关联评价correlation value,并根据操作应答关联评价的大小在第一软件服务应答信息对应的各个备选软件服务应答信息中选择目标软件服务应答信息target information并输出。
在一些可独立实施的设计思路下,该操作-应答联合分析算法的调试步骤可以包括如下相关内容。
STEP201,获取算法调试依据,该算法调试依据中包含已认证敏感软件操作数据,以及与该已认证敏感软件操作数据匹配的第一已认证软件服务应答信息。
举例而言,该已认证敏感软件操作数据是包含对某一APP操作行为的描述的敏感软件操作数据,该已认证软件服务应答信息是与该已认证敏感软件操作数据匹配的软件服务应答信息。其中,该已认证软件服务应答信息与该已认证敏感软件操作数据匹配是指该已认证软件服务应答信息中包含该已认证敏感软件操作数据表征的操作相应-隐私推演细节,即已认证敏感软件操作数据表征的操作相应-隐私推演细节都可以从已认证软件服务应答信息中找到对应的服务应答隐私推演字段。进一步地,已认证的数据信息可以理解为用于算法调试训练的样本数据信息。
STEP202,将该已认证敏感软件操作数据加载至操作-应答联合分析算法中的操作行为属性挖掘子网,获取该已认证敏感软件操作数据对应的至少两个标签的用户操作行为属性向量。
其中,已认证敏感软件操作数据对应的不同标签的用户操作行为属性向量中包含从不同层级的用户操作行为属性向量中提取的敏感软件操作数据对应的要素特征。上述层级可以是全流程操作轨迹、部分操作轨迹、操作事件、会话交互行为中的任意一者,即不同标签的用户操作行为属性向量可以是全流程操作轨迹标签的用户操作行为属性向量、部分操作轨迹标签的用户操作行为属性向量、操作事件标签的用户操作行为属性向量、或会话交互行为标签的用户操作行为属性向量。
举例而言,该操作行为属性挖掘子网可以是AI机器学习算法(比如DNN)。此时用户操作行为属性向量的标签可以代表全卷积模型对该已认证敏感软件操作数据进行属性挖掘时对应的数据规模。比如,通过全卷积模型对全流程操作轨迹级别的已认证敏感软件操作数据作为加载至进行隐私推演分析时,提取出的用户操作行为属性向量即为全流程操作轨迹标签的用户操作行为属性向量,该全流程操作轨迹标签的已认证敏感软件操作数据在提取全流程操作轨迹标签的用户操作行为属性向量时时考虑了整个全流程操作轨迹中部分操作轨迹、操作事件、会话交互行为各自的要素特征以及部分操作轨迹、操作事件、会话交互行为互相作用的要素特征,因此该已认证敏感软件操作数据的最大用户操作行为属性向量标签为全流程操作轨迹标签;而通过全卷积模型将已认证敏感软件操作数据中的会话交互行为作为加载至进行隐私推演分析时,提取出的用户操作行为属性向量为会话交互行为标签的用户操作行为属性向量,且该已认证敏感软件操作数据中的会话交互行为在进行隐私推演分析时仅考虑到了该会话交互行为本身的用户操作行为属性向量,因此会话交互行为特征是该已认证敏感软件操作数据最小标签的用户操作行为属性向量。
STEP203,将该第一已认证软件服务应答信息加载至该操作-应答联合分析算法中的应答隐私推演决策子网,获取该第一已认证软件服务应答信息对应的至少两个标签的服务应答隐私推演字段。
其中,至少两个标签的服务应答隐私推演字段是从不同标签的第一已认证软件服务应答信息中挖掘得到的细节向量,其中软件服务应答信息的不同标签可以指第一已认证软件服务应答信息的信息密度不同。对于不同信息密度的第一已认证软件服务应答信息,其软件服务应答信息中包含的数据量也不同,通常信息密度越大的软件服务应答信息包含的数据量越多,从信息密度更大的软件服务应答信息进行隐私推演分析,考虑到的软件服务应答信息数据量也越多,因此获取的服务应答隐私推演字段的标签/维度也越大/高。
STEP204,将该已认证敏感软件操作数据对应的至少两个标签的用户操作行为属性向量融合,得到该已认证敏感软件操作数据对应的第一标签联动表征知识。
其中,鉴于该第一标签联动表征知识是根据已认证敏感软件操作数据的至少两个标签的用户操作行为属性向量融合得到的,因此第一标签联动表征知识中同时包含了已认证敏感软件操作数据的至少两个标签的用户操作行为属性向量的细节。
举例而言,每种标签的用户操作行为属性向量中可以包含一个或多个标签相同但细节存在差异的用户操作行为属性向量。
STEP205,将该第一已认证软件服务应答信息对应的至少两个标签的服务应答隐私推演字段融合,得到该第一已认证软件服务应答信息对应的第二标签联动表征知识。
其中,鉴于该第二标签联动表征知识是根据第一已认证软件服务应答信息的至少两个标签的服务应答隐私推演字段融合得到的,因此第二标签联动表征知识中同时包含了第一已认证软件服务应答信息的至少两个标签的服务应答隐私推演字段的细节。
STEP206,将该已认证敏感软件操作数据对应的第一标签联动表征知识与该第一已认证软件服务应答信息对应的第二标签联动表征知识加载至算法优劣检测任务中,获取该已认证敏感软件操作数据对应的算法优劣评价变量。
举例而言,该算法优劣检测任务是依据该第一标签联动表征知识与该第二标签联动表征知识的操作应答关联评价生成的算法优劣检测任务(算法损失函数)。该算法优劣检测任务根据该第一标签联动表征知识与该第二标签联动表征知识的操作应答关联评价获取算法优劣评价变量(损失函数值)。
STEP207,依据该已认证敏感软件操作数据对应的算法优劣评价变量,调试该操作-应答联合分析算法。
其中,该操作-应答联合分析算法是依据该算法优劣评价变量,通过反馈训练进行调试的。
举例而言,依据该算法优劣评价变量,通过反馈训练,对该操作-应答联合分析算法的操作行为属性挖掘子网与应答隐私推演决策子网同时进行调试。
可见,获取第一敏感软件操作数据与第一软件服务应答信息各自对应的至少两个标签的细节描述,将至少两个标签的用户操作行为属性向量整合成第一标签联动表征知识,将至少两个标签的服务应答隐私推演字段整合成第二标签联动表征知识,并根据第一标签联动表征知识与第二标签联动表征知识之间的操作应答关联评价确定该第一敏感软件操作数据与第一软件服务应答信息之间的绑定分析结果上述方案,通过敏感软件操作数据与软件服务应答信息之间的多种标签的联动表征知识之间的操作应答关联评价确定敏感软件操作数据与软件服务应答信息的绑定分析结果,还关注了不同层级标签之间的敏感软件操作数据与软件服务应答信息的关联性,提高了敏感软件操作数据与软件服务应答信息之间的绑定分析精度,为之后的数据脱敏和隐私防护提供尽可能完整丰富的指导依据。
在另一些可能的实施例下,还示出例一种局部细节/特征向量的拆解整合思路。比如,初始应答隐私推演字段mid vector,是根据选定数目的隐私推演字段提炼节点对软件服务应答信息进行隐私推演分析获得的向量分布形式的服务应答隐私推演字段。初始应答隐私推演字段mid vector可以通过沿横向均匀拆解,获取第一初始阶段化隐私推演字段part mid vector2与第二初始阶段化隐私推演字段part mid vector3,再将该第一初始阶段化隐私推演字段part mid vector2与该第二初始阶段化隐私推演字段part midvector3通过随机整合生成初始隐私推演组合字段mix mid vector4,该初始隐私推演组合字段mix mid vector4与初始应答隐私推演字段mid vector是存在差异的隐私推演向量,且该初始隐私推演组合字段mix mid vector4的特征规模与该初始应答隐私推演字段midvector相同,即该第一初始阶段化隐私推演字段part mid vector2与该第二初始阶段化隐私推演字段part mid vector3是按照与拆解前不同的相对关系进行整理的。
如此,将初始阶段化隐私推演字段进行相对关系层面的拆解整理,此时通过隐私推演字段提炼节点对服务应答隐私推演字段进行提取时,不同的子网的相对位置对服务应答隐私推演字段产生的干扰可以得到抑制,隐私推演字段提炼节点能够侧重于局部/阶段化的细节,实现了在保证向量分布特征规模不变的基础上,通过调整向量分布的相对位置,减小相对位置特征在部分细节特征挖掘过程中的干扰,提高了对部分细节/阶段化特征向量挖掘的精度。
举例而言,该第一部分细节包括第一分支化细节向量与第二分支化细节向量。举例而言,依据该第一级初始应答隐私推演字段对应的初始隐私推演组合字段,以及该应答隐私推演决策子网的第一个阶段化隐私推演处理单元,获得该第一已认证软件服务应答信息的第一分支化待拆解向量;根据该第一已认证软件服务应答信息的第一分支化待拆解向量,根据相对位置关系信息进行均匀拆解,获得该第一已认证软件服务应答信息的第一分支化细节向量与第二分支化细节向量。
其中,该第一已认证软件服务应答信息的第一分支化待拆解向量,可以是通过第一阶段化隐私推演处理单元中的隐私推演字段提炼节点对初始隐私推演组合字段挖掘得到的,而初始隐私推演组合字段是通过第一初始阶段化隐私推演字段与该第二初始阶段化隐私推演字段随机组合得到的,其仍然具有已认证软件服务应答信息中各个信息块挖掘得到的细节向量,因此该第一分支化待拆解向量仍然是已认证软件服务应答信息的全部信息块对应的要素特征。
将该第一分支化待拆解向量根据相对位置进行均匀拆解后得到的第一部分细节(第一分支化细节向量与第二分支化细节向量),具有的是已认证软件服务应答信息的部分细节/局部特征/阶段化隐私推演字段/阶段化隐私推演向量。
举例而言,依据该第u-1个阶段化隐私推演处理单元(局部知识提炼层)中第二设定数目的隐私推演字段提炼节点,对该第u-1个阶段化隐私推演处理单元对应的初始隐私推演组合字段进行隐私推演分析,获得第u级初始应答隐私推演字段;将该第u级初始应答隐私推演字段进行拆解,获取该第u级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段;依据该第u级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段,获取该第u级初始应答隐私推演字段对应的初始隐私推演组合字段;依据第u级初始应答隐私推演字段对应的初始隐私推演组合字段,以及该第u个阶段化隐私推演处理单元的各个隐私推演字段提炼节点,获得该第一已认证软件服务应答信息的第u种标签的阶段化服务应答隐私推演字段;其中,u大于等于2且小于等于X,且u与X为整数。
当该应答隐私推演决策子网中包含至少两个阶段化隐私推演处理单元时,较低阶的阶段化隐私推演处理单元(即除第一个阶段化隐私推演处理单元之外的阶段化隐私推演处理单元),可以将该阶段化隐私推演处理单元对应的初始应答隐私推演字段加载至该阶段化隐私推演处理单元,获得该阶段化隐私推演处理单元对应的分支化待拆解向量,通过对该阶段化隐私推演处理单元对应的分支化待拆解向量进行拆解,获得该阶段化隐私推演处理单元对应的部分细节。
其中,该阶段化隐私推演处理单元对应的初始应答隐私推演字段,是通过前一个阶段化隐私推演处理单元中设定数目的隐私推演字段提炼节点,对前一个阶段化隐私推演处理单元对应的初始隐私推演组合字段进行隐私推演分析获得的。其中,阶段化隐私推演处理单元对应的初始隐私推演组合字段,可以根据该层的初始应答隐私推演字段,拆解后得到至少两个初始阶段化隐私推演字段,再将初始阶段化隐私推演字段拼接所得。
举例而言,该第二设定数目是根据该阶段化隐私推演处理单元的等级确定的。比如每一级的阶段化隐私推演处理单元对应的第二设定数目可以不同。
举例而言,该阶段化隐私推演处理单元的隐私推演字段提炼节点数目与该阶段化隐私推演处理单元的等级成负相关。
当该阶段化隐私推演处理单元等级越大,其对应的初始应答隐私推演字段被隐私推演字段提炼节点进行服务应答隐私推演字段提取过的轮数也越多,因此其软件服务应答信息信息密度也越小,此时将该初始应答隐私推演字段提取出部分细节所需要的隐私推演字段提炼节点也越少。
在一些示例下,以具有场景化隐私推演处理单元与两个阶段化隐私推演处理单元的模型为例为例,已认证软件服务应答信息eg_1加载至该应答信息识别模型M4,并通过场景化隐私推演处理单元,即第一级残差块构成的隐私推演字段提炼节点,提取该已认证软件服务应答信息eg_1的特征(该特征规模为软件服务应答层级的特征分布)并进行整体下采样得到场景化服务应答隐私推演字段whole vector(即第一级的服务应答隐私推演字段)。
已认证软件服务应答信息eg_1再通过场景化隐私推演处理单元中的选定数目的残差块,生成该已认证软件服务应答信息对应的初始应答隐私推演字段,即场景化隐私推演处理单元只通过部分残差块对该已认证软件服务应答信息进行隐私推演分析,生成的初始应答隐私推演字段传输至第一个阶段化隐私推演处理单元,并对该初始应答隐私推演字段均匀拆解后整理,获得该第一阶段化隐私推演处理单元对应的初始隐私推演组合字段mix feature。
其中,第一个阶段化隐私推演处理单元对应的初始隐私推演组合字段mixfeature通过该第一个阶段化隐私推演处理单元的残差块继续进行隐私推演分析,得到该第一个阶段化隐私推演处理单元的分支化待拆解向量,该分支化待拆解向量是软件服务应答层级的特征分布,并将该分支化待拆解向量均匀拆解后的分支化细节向量进行整体下采样,得到该第一个阶段化隐私推演处理单元对应的第一部分细节part feature1(第二标签的服务应答隐私推演字段)。
该第一个阶段化隐私推演处理单元对应的初始隐私推演组合字段mix feature,通过该第一个阶段化隐私推演处理单元中选定数目的残差块进行隐私推演分析后,再通过均匀拆解成三种字段,将该三种字段进行随机处理,生成第二个阶段化隐私推演处理单元对应的初始隐私推演组合字段random feature,该初始隐私推演组合字段random feature通过第二个阶段化隐私推演处理单元的残差块继续进行隐私推演分析,得到该第二个阶段化隐私推演处理单元的分支化待拆解向量,该分支化待拆解向量是软件服务应答层级的特征分布,并将该分支化待拆解向量均匀拆解成三部分的分支化细节向量进行整体下采样,得到该第二个阶段化隐私推演处理单元对应的第二部分细节part feature2(第三标签的服务应答隐私推演字段)。
可以理解,场景化服务应答隐私推演字段whole vector、第一部分细节partfeature1、第二部分细节part feature2构成了该已认证软件服务应答信息对应的样本服务应答隐私推演字段。
当获取已认证敏感软件操作数据的整体细节与部分细节,以及第一已认证软件服务应答信息的整体细节与部分细节后,需要将该已认证敏感软件操作数据的整体细节与部分细节进行组合得到第一标签联动表征知识,以及将该第一已认证软件服务应答信息的整体细节与部分细节进行组合得到第二标签联动表征知识,以便通过将第一标签联动表征知识与第一已认证软件服务应答信息的第二标签联动表征知识进行操作应答关联评价对比,确定该已认证敏感软件操作数据与该第一已认证软件服务应答信息之间的匹配程度。
其中,第一标签联动表征知识与第二标签联动表征知识是通过整体细节与部分细节整合所得的内容,因此第一标签联动表征知识与第二标签联动表征知识同时具有整体细节与部分细节两种标签的细节描述,通过该第一标签联动表征知识与该第一已认证软件服务应答信息的第二标签联动表征知识进行配对,可以同时考虑敏感软件操作数据与软件服务应答信息的局部的操作应答关联评价与整体的操作应答关联评价,提高了敏感软件操作数据与软件服务应答信息配对的准确性。
可见,通过算法优劣评价变量,同时对该操作行为属性挖掘子网与该应答隐私推演决策子网进行调试,且该算法优劣评价变量是根据该已认证敏感软件操作数据的第一标签联动表征知识与该第一已认证软件服务应答信息的第二标签联动表征知识之间的操作应答关联评价获取的,即该算法优劣评价变量具有该已认证敏感软件操作数据的多种标签的细节描述,以及该第一已认证软件服务应答信息的多种标签的细节描述,换言之,操作行为属性挖掘子网与该应答隐私推演决策子网在根据该算法优劣检测任务进行调试时,同时考虑到了已认证敏感软件操作数据的多种标签的细节描述,以及第一已认证软件服务应答信息的多种标签的细节描述,以及已认证敏感软件操作数据与第一已认证软件服务应答信息之间的操作应答关联评价,调试后的操作-应答联合分析算法中的应答隐私推演决策子网,可以更加关注敏感软件操作数据的不同标签的细节描述,操作-应答联合分析算法中的操作行为属性挖掘子网,也可以更加关注软件服务应答信息的不同标签的细节描述,因此调试之后的操作-应答联合分析算法能够保障敏感软件操作数据与软件服务应答信息的绑定分析精度,为之后的数据脱敏和隐私防护提供尽可能完整丰富的指导依据较高。
举例而言,将该第二已认证软件服务应答信息(与第一已认证软件服务应答信息的输出方式不同)加载至该操作-应答联合分析算法中的应答隐私推演决策子网,获得第二已认证软件服务应答信息对应的至少两个标签的服务应答隐私推演字段;将该第二已认证软件服务应答信息对应的至少两个标签的服务应答隐私推演字段融合,得到第二已认证软件服务应答信息对应的第二标签联动表征知识;将该已认证敏感软件操作数据对应的第一标签联动表征知识、第一已认证软件服务应答信息对应的第二标签联动表征知识以及第二已认证软件服务应答信息对应的第二标签联动表征知识加载至算法优劣检测任务中,获取该已认证敏感软件操作数据对应的算法优劣评价变量;依据该算法优劣评价变量,对该操作行为属性挖掘子网与该应答隐私推演决策子网进行调试。
其中,该操作-应答联合分析算法对应的算法优劣检测任务还可以是三元组损失。
在另外的一些设计思路下,该方法还可以包括如下相关内容。
STEP308,获取第一敏感软件操作数据与第一软件服务应答信息。
举例而言,该第一敏感软件操作数据与已认证敏感软件操作数据是相同类别的敏感软件操作数据。即该第一敏感软件操作数据与已认证敏感软件操作数据是同语言的敏感软件操作数据,并且该第一敏感软件操作数据与已认证敏感软件操作数据描述的内容可以是相同类别的操作行为。
STEP309,将该第一敏感软件操作数据加载至该操作-应答联合分析算法中的操作行为属性挖掘子网,获得该第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量。
其中该操作行为属性挖掘子网为用于挖掘用户操作行为属性向量的AI机器学习算法。
举例而言,获取该第一敏感软件操作数据的至少两个标签的敏感软件操作项信息;该至少两个标签的敏感软件操作项信息包括敏感软件全流程操作信息与至少一种标签的敏感软件操作环节信息;该敏感软件全流程操作信息的标签等级大于该敏感软件操作环节信息的标签;将该第一敏感软件操作数据的至少两个标签的敏感软件操作项信息加载至敏感软件操作数据与软件服务应答信息模型中的操作行为属性挖掘子网,获得该第一敏感软件操作数据对应的至少两个标签的用户操作行为属性向量。
其中,敏感软件全流程操作信息包含该第一敏感软件操作数据的全部敏感软件操作数据内容,敏感软件操作环节信息包含的敏感软件操作数据内容少于敏感软件全流程操作信息。将该敏感软件全流程操作信息以及至少一种标签的敏感软件操作环节信息加载至操作行为属性挖掘子网,获得至少两个标签的用户操作行为属性向量,即该至少两个标签的用户操作行为属性向量包括场景化用户操作行为属性向量以及至少一种阶段化用户操作行为属性向量。
STEP310,将该至少两个标签的用户操作行为属性向量加载至操作-应答联合分析算法中的第一知识加权子网,获取该第一敏感软件操作数据对应的第一标签联动表征知识。
举例而言,该第一知识加权子网为特征整合单元或残差神经网络。
举例而言,依据该第一敏感软件操作数据的至少两个标签的用户操作行为属性向量,通过特征整合单元获取该第一敏感软件操作数据的即第一标签联动表征知识。
其中,特征整合单元在AI算法中可以作为多元回归分析单元,在将整体细节与部分细节直接连接后,通过特征整合单元将整体细节与部分细节相应的维度进行整理,获得整体细节与部分细节对应的联动表征知识。
在其他的示例性实施例中,将该第一敏感软件操作数据的至少两个标签的用户操作行为属性向量,加载至依据残差神经网络生成的第一知识加权子网,获取该第一敏感软件操作数据的即第一标签联动表征知识。其中,该第一知识加权子网可以是通过预调试获取的,可以直接使用的特征加权模型;或者该第一知识加权子网需要通过该第一敏感软件操作数据以及该第一已认证软件服务应答信息进行调试。
STEP311,将该第一软件服务应答信息加载至操作-应答联合分析算法中的应答隐私推演决策子网,获得该第一软件服务应答信息对应的至少两个标签的服务应答隐私推演字段。
举例而言,该至少两个标签的服务应答隐私推演字段包括场景化服务应答隐私推演字段以及至少一种标签的阶段化服务应答隐私推演字段;该应答隐私推演决策子网包括场景化隐私推演处理单元与至少一个阶段化隐私推演处理单元;该场景化隐私推演处理单元包含至少两个隐私推演字段提炼节点;该阶段化隐私推演处理单元包含至少一个隐私推演字段提炼节点;该隐私推演字段提炼节点用于提取服务应答隐私推演字段;依据该第一软件服务应答信息,以及该应答隐私推演决策子网中的场景化隐私推演处理单元,获取该第一软件服务应答信息对应的场景化服务应答隐私推演字段;依据该第一软件服务应答信息与该应答隐私推演决策子网中的至少一个阶段化隐私推演处理单元,获取该第一软件服务应答信息对应的至少一种标签的阶段化服务应答隐私推演字段。
举例而言,该场景化隐私推演处理单元获取该第一软件服务应答信息,通过该场景化隐私推演处理单元中的第一个隐私推演字段提炼节点,提取该第一软件服务应答信息的服务应答隐私推演字段,作为该第一软件服务应答信息的向量分布(特征分布),并将该向量分布传递至下一个隐私推演字段提炼节点,以便该下一个隐私推演字段提炼节点对该向量分布进行细节属性的挖掘,反复实施上述内容,直到该场景化隐私推演处理单元的最后一个隐私推演字段提炼节点对前一个隐私推演字段提炼节点挖掘得到的细节向量分布进行隐私推演分析,得出该已认证软件服务应答信息对应的整体细节。
举例而言,举例而言,该应答隐私推演决策子网可以是用于软件服务应答信息识别的残差模型,其中,该各个隐私推演字段提炼节点为该残差模型的残差块,残差块用于通过对软件服务应答信息进行服务应答隐私推演字段的有序挖掘。
举例而言,当该应答隐私推演决策子网是残差模型时,可以根据第一软件服务应答信息的软件服务应答信息变量(比如信息密度)预先设定该软件服务应答信息分支模型中,场景化隐私推演处理单元的残差块数目,以及每一级的滑动滤波算子数目、滑动滤波算子特征规模、周期等超变量,以提高对该第一软件服务应答信息的知识提炼性能。
比如,当该已认证软件服务应答信息的信息密度较大时,可以通过提高周期、增大滑动滤波算子的数目的思路,在保证场景化隐私推演处理单元的残差块数目不变的基础上,提高周期以降低第一软件服务应答信息的信息密度,并同时提高滑动滤波算子卷积得到的变量数目保证提取足够多的服务应答隐私推演字段,以提高对第一软件服务应答信息的挖掘性能。
举例而言,依据该场景化隐私推演处理单元中第一设定数目的隐私推演字段提炼节点,对该第一软件服务应答信息进行隐私推演分析,获取该第一软件服务应答信息对应的第一级初始应答隐私推演字段;将该第一级初始应答隐私推演字段进行拆解,获得该第一级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段;将该第一级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段组合,获得该第一级初始隐私推演组合字段;该第一级初始隐私推演组合字段是与该第一级初始应答隐私推演字段不同的服务应答隐私推演字段;该第一级初始隐私推演组合字段与该第一级初始应答隐私推演字段的特征规模相同;依据该第一级初始隐私推演组合字段,以及该应答隐私推演决策子网中的至少一个阶段化隐私推演处理单元,获取该第一软件服务应答信息对应的至少一种标签的阶段化服务应答隐私推演字段。
其中,第一设定数目可以是预设的,即当通过场景化隐私推演处理单元的设定数量的隐私推演字段提炼节点,对该第一软件服务应答信息进行隐私推演分析,可以获得该第一软件服务应答信息的第一级初始应答隐私推演字段,并将其共享给阶段化隐私推演处理单元;该第一设定数目小于该场景化隐私推演处理单元中的隐私推演字段提炼节点数目。
通过第一设定数目的隐私推演字段提炼节点对该第一软件服务应答信息进行隐私推演分析后,再共享给阶段化隐私推演处理单元,可以使得阶段化隐私推演处理单元得出的部分细节,与整体细节具有一定的关联度,其部分细节与整体细节更能表征第一软件服务应答信息的服务应答隐私推演字段。
该第一级初始隐私推演组合字段是通过第一级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段组合而成的,且该第一级初始隐私推演组合字段与该第一级初始应答隐私推演字段是不同的服务应答隐私推演字段,即该第一级初始应答隐私推演字段拆解为两个初始阶段化隐私推演字段后,该至少两个初始阶段化隐私推演字段调整相对位置后进行组合,得到与该第一级初始应答隐私推演字段特征规模相同但细节存在差异的第一级初始隐私推演组合字段。
举例而言,将该第一级初始应答隐私推演字段,根据相对位置进行均匀拆解,获取该第一级初始应答隐私推演字段对应的第一初始阶段化隐私推演字段与第二初始阶段化隐私推演字段,其中,第一初始阶段化隐私推演字段的尺度大于第二初始阶段化隐私推演字段。
举例而言,将该第一初始阶段化隐私推演字段与该第二初始阶段化隐私推演字段进行随机组合,获取该第一级初始应答隐私推演字段对应的初始隐私推演组合字段。
当第一级初始应答隐私推演字段根据尺度进行均匀拆解后,获取第一初始阶段化隐私推演字段与该第二初始阶段化隐私推演字段,该第一初始阶段化隐私推演字段与该第二初始阶段化隐私推演字段再根据尺度进行随机整合,获取与该第一级初始应答隐私推演字段对应的初始隐私推演组合字段,其中该初始隐私推演组合字段的特征规模与该第一级初始应答隐私推演字段的特征规模相同。
即第一软件服务应答信息对应的初始应答隐私推演字段的拆解后随机整合的过程可以是:将初始阶段化隐私推演字段进行相对关系层面的拆解整理,此时通过隐私推演字段提炼节点对服务应答隐私推演字段进行挖掘时,不同的子网的相对位置对服务应答隐私推演字段产生的干扰可以得到抑制,隐私推演字段提炼节点能够侧重于局部/阶段化的细节,实现了在保证向量分布特征规模不变的基础上,通过调整向量分布的相对位置,规避提取部分细节过程中受到的干扰。
举例而言,依据该第一级初始应答隐私推演字段,以及该应答隐私推演决策子网中的第一个阶段化隐私推演处理单元,获取该第一软件服务应答信息对应的第一种标签的阶段化服务应答隐私推演字段。
举例而言,依据该第u-1个阶段化隐私推演处理单元中第二设定数目的隐私推演字段提炼节点,对该第u-1级初始隐私推演组合字段进行隐私推演分析,获得第u级初始应答隐私推演字段;将该第u级初始应答隐私推演字段进行拆解,获得该第u级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段;将该第u级初始应答隐私推演字段对应的至少两个初始阶段化隐私推演字段组合,获得该第u级初始隐私推演组合字段;该第u级初始隐私推演组合字段是与该第u级初始应答隐私推演字段不同的服务应答隐私推演字段;该第u级初始隐私推演组合字段与该第u级初始应答隐私推演字段的特征规模相同;依据该第u级初始隐私推演组合字段,以及该应答隐私推演决策子网中的第u个阶段化隐私推演处理单元,获取该第一软件服务应答信息对应的第u种标签的阶段化服务应答隐私推演字段;其中,u大于等于2且小于等于X,且u与X为整数。
当该应答隐私推演决策子网中包含至少两个阶段化隐私推演处理单元时,较低阶的阶段化隐私推演处理单元(即除第一个阶段化隐私推演处理单元之外的阶段化隐私推演处理单元),可以将该阶段化隐私推演处理单元对应的初始应答隐私推演字段加载至该阶段化隐私推演处理单元,获得该阶段化隐私推演处理单元对应的分支化待拆解向量,通过对该阶段化隐私推演处理单元对应的分支化待拆解向量进行拆解,获得该阶段化隐私推演处理单元对应的部分细节。
其中,该阶段化隐私推演处理单元对应的初始应答隐私推演字段,是通过前一个阶段化隐私推演处理单元中设定数目的隐私推演字段提炼节点,对前一个阶段化隐私推演处理单元对应的初始隐私推演组合字段进行隐私推演分析获得的。其中,阶段化隐私推演处理单元对应的初始隐私推演组合字段,可以根据该级的初始应答隐私推演字段,拆解后得到至少两个初始阶段化隐私推演字段,再将初始阶段化隐私推演字段整合得到。
举例而言,该第二设定数目是根据该阶段化隐私推演处理单元的等级确定的。即每一级的阶段化隐私推演处理单元对应的第二设定数目可以不同。
举例而言,该阶段化隐私推演处理单元的隐私推演字段提炼节点数目与该阶段化隐私推演处理单元的等级成负相关。当该阶段化隐私推演处理单元等级越大,其对应的初始应答隐私推演字段被隐私推演字段提炼节点进行服务应答隐私推演字段提取过的轮数也越多,因此其软件服务应答信息信息密度也越小,此时将该初始应答隐私推演字段提取出部分细节所需要的隐私推演字段提炼节点也越少。
STEP312,将该至少两个标签的服务应答隐私推演字段加载至操作-应答联合分析算法中的第二标签知识加权子网,获取该第一软件服务应答信息对应的第二标签联动表征知识。
举例而言,该第二标签知识加权子网为特征整合单元或残差神经网络。
举例而言,该第一知识加权子网与该第二标签知识加权子网可以同时是相同架构的标签知识加权子网,也可以是不同架构的标签知识加权子网。比如,第一知识加权子网是特征整合单元且该第二标签知识加权子网是残差神经网络;或者该第一知识加权子网是残差神经网络且该第二标签知识加权子网是特征整合单元;或者该第一知识加权子网都为特征整合单元或残差神经网络。
STEP313,依据该第一敏感软件操作数据对应的第一标签联动表征知识,以及该第一软件服务应答信息对应的第二标签联动表征知识,获取该第一敏感软件操作数据与该第一软件服务应答信息的操作应答关联评价。
举例而言,获取该第一标签联动表征知识与该第二标签联动表征知识对应的余弦相似度,将该余弦相似度作为该第一标签联动表征知识与该第二标签联动表征知识的操作应答关联评价。
在其他的示例性实施例中,获取该第一标签联动表征知识与该第二标签联动表征知识对应的欧几里得度量,将该欧几里得度量作为该第一标签联动表征知识与该第二标签联动表征知识的操作应答关联评价。
第一敏感软件操作数据对应的第一标签联动表征知识适应性地存留了第一敏感软件操作数据的不同标签的用户操作行为属性向量,第一软件服务应答信息对应的第二标签联动表征知识也适应性地存留了第一软件服务应答信息的不同标签的服务应答隐私推演字段,因此通过第一标签联动表征知识与第二标签联动表征知识得到的第一敏感软件操作数据与第一软件服务应答信息的操作应答关联评价,是受各个不同标签的服务应答隐私推演字段与各个不同标签的用户操作行为属性向量之间的关联情况分析得出的第一敏感软件操作数据与第一软件服务应答信息的操作应答关联评价,该操作应答关联评价同时包含同样标签的用户操作行为属性向量与服务应答隐私推演字段之间的关联性、不同标签的用户操作行为属性向量与服务应答隐私推演字段之间的关联性、以及各个不同标签的用户操作行为属性向量互相整合作用以及各个不同标签的服务应答隐私推演字段互相融合作用后的关联性,因此该操作应答关联评价较佳地输出该第一敏感软件操作数据与第一软件服务应答信息之间的相似情况。
STEP314,依据该操作应答关联评价,确定该第一敏感软件操作数据与该第一软件服务应答信息的绑定分析结果。
举例而言,将该备选软件服务应答信息库中的所有备选软件服务应答信息加载至该应答隐私推演决策子网,获取所有备选软件服务应答信息对应的备选服务应答隐私推演字段,并根据各个备选软件服务应答信息的备选服务应答隐私推演字段与目标用户操作行为属性向量的操作应答关联评价,根据该操作应答关联评价对服务应答隐私推演字段进行整理,将最高的操作应答关联评价对应的备选软件服务应答信息获取为与第一敏感软件操作数据匹配的目标软件服务应答信息。
本发明实施例涉及的一种操作-应答联合分析算法调试思路还可以包括:第一已认证软件服务应答信息加载至操作-应答联合分析算法中的应答隐私推演决策子网,获取该第一已认证软件服务应答信息对应的样本服务应答隐私推演字段;已认证敏感软件操作数据加载至操作-应答联合分析算法中的操作行为属性挖掘子网,加载至已认证敏感软件操作数据对应的样本用户操作行为属性向量,再将样本服务应答隐私推演字段通过特征整合单元融合后的软件服务应答信息联动表征知识,与样本用户操作行为属性向量通过特征整合单元融合后操作行为联动表征知识,加载至算法优劣检测任务中,并根据算法优劣评价变量通过反馈训练对操作行为属性挖掘子网与应答隐私推演决策子网进行反馈调试。
在一些可独立的设计思路下,在确定所述第一敏感软件操作数据与所述第一软件服务应答信息的绑定分析结果之后,该方法还可以包括如下内容:在所述绑定分析结果表征所述第一敏感软件操作数据与所述第一软件服务应答信息配对成功的基础上,对所述第一软件服务应答信息进行隐私特征识别处理,得到所述第一软件服务应答信息对应的隐私特征分布;基于所述隐私特征分布对所述第一软件服务应答信息进行数据脱敏处理,得到已脱敏软件服务应答信息;重新建立所述已脱敏软件服务应答信息与所述第一敏感软件操作数据之间的绑定关系。
可以理解,通过进行隐私特征识别,能够得到第一软件服务应答信息中蕴含的隐私特征分布,从而基于隐私特征分布实现第一软件服务应答信息的隐私匿名和数据脱敏处理,这样在得到已脱敏软件服务应答信息之后,重新建立已脱敏软件服务应答信息与第一敏感软件操作数据之间的绑定关系。如此,在后期响应第一敏感软件操作数据时,输出的信息为已脱敏软件服务应答信息而非第一软件服务应答信息,这样可以确保相关隐私信息的安全性,避免隐私信息的意外泄露。然而,若需要针对性获取隐私信息,则需要额外的认证权限,本发明实施例在此不作更多说明。
在一些可独立的设计思路下,对所述第一软件服务应答信息进行隐私要素向量识别处理,得到所述第一软件服务应答信息对应的隐私要素向量分布,包括:获取第一软件服务应答日志中每个应答消息对应的第一隐私要素向量和所述第一软件服务应答日志对应的第二隐私要素向量,其中,所述应答消息对应的第一隐私要素向量表示在所述第一软件服务应答日志中所述应答消息的隐私特征,所述第二隐私要素向量是基于每个所述应答消息对应的第一隐私要素向量确定的;调用隐私要素向量挖掘网络,分别对每个所述第一隐私要素向量和所述第二隐私要素向量进行下采样,得到每个所述第一隐私要素向量对应的第一下采样隐私要素向量和所述第二隐私要素向量对应的第二下采样隐私要素向量;基于每个所述第一下采样隐私要素向量与所述第二下采样隐私要素向量之间的第一上下游隐私要素向量,配置所述隐私要素向量挖掘网络,所述第一上下游隐私要素向量表示所述第一下采样隐私要素向量与所述第二下采样隐私要素向量之间的上下游联系度;调用配置后的隐私要素向量挖掘网络,对所述第一软件服务应答信息的隐私要素向量进行下采样,得到所述第一软件服务应答信息的隐私要素向量分布。
其中,第一软件服务应答日志可以理解为第一样本。可以理解,通过上述内容,能够结合第一软件服务应答日志以及应答消息各自的隐私要素向量进行网络配置,从而提高隐私要素向量挖掘/下采样的精度和效率,从而在保障隐私要素向量分布的内容丰富程度的前提下可以尽可能减少隐私要素向量分布的维度规模,从而减少运算开销。
在一些可独立的设计思路下,所述基于每个所述第一下采样隐私要素向量与所述第二下采样隐私要素向量之间的第一上下游隐私要素向量,配置所述隐私要素向量挖掘网络,包括:基于每个所述第一下采样隐私要素向量对应的第一上下游隐私要素向量,确定代价变量,所述代价变量与所述第一上下游隐私要素向量呈负相关;基于所述代价变量,配置所述隐私要素向量挖掘网络。
在一些可独立的设计思路下,所述基于每个所述第一下采样隐私要素向量与所述第二下采样隐私要素向量之间的第一上下游隐私要素向量,配置所述隐私要素向量挖掘网络之前,所述方法还包括:调用分类网络,对所述第一下采样隐私要素向量和所述第二下采样隐私要素向量进行分类,得到分类结果,所述分类结果表示所述第一下采样隐私要素向量对应的应答消息属于所述第二下采样隐私要素向量对应的软件服务应答日志的概率;将所述分类结果确定为所述第一下采样隐私要素向量对应的第一上下游隐私要素向量。
在一些可独立的设计思路下,基于所述隐私特征分布对所述第一软件服务应答信息进行数据脱敏处理,得到已脱敏软件服务应答信息,可以包括如下内容:对所述隐私特征分布中的个体隐私向量进行K匿名化处理,得到已脱敏软件服务应答信息。如此,能够针对性地进行个体隐私防护,从而尽最大可能保障已脱敏软件服务应答信息的隐私保护和数据可用的兼容。
可见,获取第一敏感软件操作数据与第一软件服务应答信息各自对应的至少两个标签的细节描述,将至少两个标签的用户操作行为属性向量整合成第一标签联动表征知识,将至少两个标签的服务应答隐私推演字段整合成第二标签联动表征知识,并根据第一标签联动表征知识与第二标签联动表征知识之间的操作应答关联评价确定该第一敏感软件操作数据与第一软件服务应答信息之间的绑定分析结果。如此,通过敏感软件操作数据与软件服务应答信息之间的多种标签的联动表征知识之间的操作应答关联评价确定敏感软件操作数据与软件服务应答信息的绑定分析结果,还关注了不同层级标签之间的敏感软件操作数据与软件服务应答信息的关联性,提高了敏感软件操作数据与软件服务应答信息之间的绑定分析精度,为之后的数据脱敏和隐私防护提供尽可能完整丰富的指导依据。
以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。