CN115455484B - 一种针对云计算空间的数据泄露应对方法及服务器 - Google Patents
一种针对云计算空间的数据泄露应对方法及服务器 Download PDFInfo
- Publication number
- CN115455484B CN115455484B CN202211158483.9A CN202211158483A CN115455484B CN 115455484 B CN115455484 B CN 115455484B CN 202211158483 A CN202211158483 A CN 202211158483A CN 115455484 B CN115455484 B CN 115455484B
- Authority
- CN
- China
- Prior art keywords
- storage information
- cloud space
- information
- space storage
- privacy
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6263—Protecting personal data, e.g. for financial or medical purposes during internet communication, e.g. revealing personal data from cookies
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
- G06N5/043—Distributed expert systems; Blackboards
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Computer Security & Cryptography (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Computer Hardware Design (AREA)
- Molecular Biology (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种针对云计算空间的数据泄露应对方法及服务器,能够结合数据防泄露处理指令获取存在数据防泄露需求的云空间存储信息,进而结合专家决策系统模型进行个体隐私决策分析,也即隐私信息挖掘和识别,从而得到待处理个体隐私信息的隐私关键词和可视化隐私决策窗口,以结合隐私关键词和可视化隐私决策窗口对待处理个体隐私信息进行隐私匿名化处理。鉴于专家决策系统模型中的多层感知机具有较强的泛化能力,因而可以灵活、准确地进行隐私关键词和可视化隐私决策窗口识别,从而确保后续隐私匿名化处理的准确性和可靠性,提高待处理个体隐私信息的防泄露能力。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种针对云计算空间的数据泄露应对方法及服务器。
背景技术
数据泄露指将机密信息、私人信息或其他敏感信息发布到不安全的环境中。数据泄露可能由意外引起,也可能是蓄意攻击的结果。近年来,各类数据泄露事件频发,给企业和个人带来了不同程度的损失。由于数据泄露有多种形式,几乎没有单一的解决方案可以完全阻止数据泄露。基于此,相关技术着眼于各类数据泄露的应对处理,但应对效果仍然难以令人满意。
发明内容
本发明提供一种针对云计算空间的数据泄露应对方法及服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种针对云计算空间的数据泄露应对方法,所述方法通过云计算服务器实现,所述方法包括:
在接收到数据防泄露处理指令时,基于所述数据防泄露处理指令获取存在数据防泄露需求的云空间存储信息;
经由专家决策系统模型对存在数据防泄露需求的云空间存储信息进行个体隐私决策分析,确定出所述存在数据防泄露需求的云空间存储信息中的待处理个体隐私信息的隐私关键词和可视化隐私决策窗口;所述专家决策系统模型中包括基于设定配置规则所配置的多层感知机;
结合所述隐私关键词以及所述可视化隐私决策窗口,对所述待处理个体隐私信息进行隐私匿名化处理。
在一些可选的实施例中,所述多层感知机通过如下思路配置得到:
获得多个云空间存储信息块;其中,每个云空间存储信息块中携带一类隐私关键词的个体隐私信息,每个云空间存储信息块基于对云空间存储信息示例进行抽取所得;
从所述多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息;其中,K为大于0的整数;
经由所述完成组合的新存储信息配置所述多层感知机。
在一些可选的实施例中,所述获得多个云空间存储信息块,包括:
获得多个云空间存储信息示例;
每一云空间存储信息示例中包括对应于设定隐私关键词的不少于一个个体隐私信息识别单元;
基于每一云空间存储信息示例中的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块。
在一些可选的实施例中,所述基于每一云空间存储信息示例中的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块,包括:更新云空间存储信息示例中的个体隐私信息识别单元,基于更新后的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块。
在一些可选的实施例中,所述从所述多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息,包括:
获得信息块组合特征,所述信息块组合特征中包括K个用于进行组合决策的窗口化引导内容;
依据每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果从所述多个云空间存储信息块中分别挑选与每一用于进行组合决策的窗口化引导内容对应云空间存储信息块,并依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征将挑选的K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息。
在一些可选的实施例中,所述依据每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果从所述多个云空间存储信息块中分别挑选与每一用于进行组合决策的窗口化引导内容对应云空间存储信息块,包括:
分别确定每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果,基于所述设定运算结果分别确定每一用于进行组合决策的窗口化引导内容的语义向量;所述语义向量为第一语义向量、第二语义向量或第三语义向量;所述第一语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值不小于第一判定变量不大于第二判定变量;所述第二语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值大于所述第二判定变量;所述第三语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值小于所述第一判定变量;
将所述多个云空间存储信息块依据所述第一语义向量、所述第二语义向量和所述第三语义向量进行归纳处理,获得各自匹配于所述第一语义向量、所述第二语义向量和所述第三语义向量的云空间存储信息块集合;
分别基于每一用于进行组合决策的窗口化引导内容的语义向量、从与所述语义向量对应的云空间存储信息块集合中挑选云空间存储信息块。
在一些可选的实施例中,所述依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征将挑选的K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息,包括:
依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征确定每一云空间存储信息块的分布标签;
将存在关联的两个云空间存储信息块之间的目标窗口化引导内容进行调整,得到完成组合的新存储信息。
在一些可选的实施例中,所述经由所述完成组合的新存储信息配置所述多层感知机,包括:
基于所述多层感知机对所述完成组合的新存储信息进行处理,获得所述完成组合的新存储信息对应的个体信息知识分布,以及基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块对应的第一专家决策特征;其中,一个云空间存储信息块对应的第一专家决策特征表征所述云空间存储信息块中包含的个体隐私信息分别属于多个设定隐私关键词的回归分析命中值;
将所述个体信息知识分布通过所述多层感知机进行设定操作,获得设定操作结果;
基于所述设定操作结果得到所述完成组合的新存储信息中的每一云空间存储信息块对应的第一字符串;其中,一个云空间存储信息块对应的第一字符串表征所述云空间存储信息块中包含的个体隐私信息属于每一备选隐私关键词的可信指数,其中,所述备选隐私关键词为所述完成组合的新存储信息中的K个云空间存储信息块中的个体隐私信息所属隐私关键词;
基于所述第一专家决策特征和所述第一字符串改进所述多层感知机的配置变量。
在一些可选的实施例中,所述将所述个体信息知识分布通过所述多层感知机进行设定操作,获得设定操作结果,包括:分别将所述个体信息知识分布中的每一个体信息知识元素的知识变量设置为预设变量,得到每一目标信息知识分布;将每一目标信息知识分布分别通过所述多层感知机进行设定操作,获得所述设定操作结果;所述设定操作结果表征所述完成组合的新存储信息中的每一个体信息知识元素的知识变量;
所述基于所述设定操作结果得到所述完成组合的新存储信息中的每一云空间存储信息块对应的第一字符串,包括:基于每一云空间存储信息块中的每一个体信息知识元素的知识变量得到每一个体信息知识元素对应的区分向量;其中,每个个体信息知识元素对应的区分向量表征所述个体信息知识元素属于每一备选隐私关键词的可信指数;基于每一云空间存储信息块中的每一个体信息知识元素对应的区分向量确定每一云空间存储信息块对应的第一字符串。
在一些可选的实施例中,所述基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块对应的第一专家决策特征,包括:基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块中的每一个体信息知识元素对应的偏置特征;其中,每个个体信息知识元素对应的偏置特征表征所述个体信息知识元素属于多个设定隐私关键词的回归分析命中值;基于每一云空间存储信息块中的每一个体信息知识元素对应的偏置特征获得每一云空间存储信息块对应的第一专家决策特征;
所述基于所述第一专家决策特征和所述第一字符串改进所述多层感知机的配置变量,包括:基于每一云空间存储信息块中的每一个体信息知识元素对应的所述偏置特征和所述区分向量确定第一性能评价指标,将每一云空间存储信息块中的每一个体信息知识元素对应的所述第一性能评价指标进行运算,得到每一云空间存储信息块对应的第一全局性能评价指标;将所述完成组合的新存储信息中的每一云空间存储信息块对应的所述第一全局性能评价指标进行运算,得到第二全局性能评价指标;基于所述第二全局性能评价指标改进所述多层感知机的配置变量。
第二方面是一种云计算服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述云计算服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
本发明实施例提供的一项技术方案,能够结合数据防泄露处理指令获取存在数据防泄露需求的云空间存储信息,进而结合专家决策系统模型进行个体隐私决策分析,也即隐私信息挖掘和识别,从而得到待处理个体隐私信息的隐私关键词和可视化隐私决策窗口,以结合隐私关键词和可视化隐私决策窗口对待处理个体隐私信息进行隐私匿名化处理。鉴于专家决策系统模型中的多层感知机具有较强的泛化能力,因而可以灵活、准确地进行隐私关键词和可视化隐私决策窗口识别,从而确保后续隐私匿名化处理的准确性和可靠性,提高待处理个体隐私信息的防泄露能力。
本发明实施例提供的另一项技术方案,能够实现对多层感知机的配置处理以提高其泛化能力,该方案包括:获得多个云空间存储信息块,每个云空间存储信息块中携带一类隐私关键词的个体隐私信息;每个云空间存储信息块基于对云空间存储信息示例进行抽取所得;从所述多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息;K为大于0的整数;经由所述完成组合的新存储信息配置所述多层感知机。
结合上述的多层感知机配置方案,通过对云空间存储信息示例中的存储信息进行抽取,将完成抽取的K个云空间存储信息块进行二次组合作为完成组合的新存储信息,将完成组合的新存储信息作为配置多层感知机的配置依据,与传统的采用大量配置依据进行配置的思路相比,该技术方案不仅可以减少对海量配置依据的依赖,还可以提高多层感知机的配置多样性,从而提升多层感知机的泛化能力,确保多层感知机可以快速准确地进行个体隐私的识别处理和解析处理,为隐私防护和数据防泄露快速地提供准确可信的处理依据。
附图说明
图1为本发明实施例提供的针对云计算空间的数据泄露应对方法的流程示意图。
图2为本发明实施例提供的针对云计算空间的数据泄露应对装置的模块框图。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的针对云计算空间的数据泄露应对方法的流程示意图,针对云计算空间的数据泄露应对方法可以通过云计算服务器实现,云计算服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述云计算服务器执行如下步骤所描述的技术方案。
NODE1、在接收到数据防泄露处理指令时,基于所述数据防泄露处理指令获取存在数据防泄露需求的云空间存储信息。
在本发明实施例中,数据防泄露处理指令可以是大数据用户端上传的,用于请求云计算服务器进行隐私保护和数据防泄漏处理。基于此,云计算服务器可以对应获取存在数据防泄露需求的云空间存储信息,该存在数据防泄露需求的云空间存储信息可以与数据防泄露处理指令对应的大数据用户端匹配,存在数据防泄露需求的云空间存储信息中携带了大数据用户端的相关隐私信息,这些隐私信息需要进行保护处理,为此,可以通过NODE2进行隐私信息的定位识别。
NODE2、经由专家决策系统模型对存在数据防泄露需求的云空间存储信息进行个体隐私决策分析,确定出所述存在数据防泄露需求的云空间存储信息中的待处理个体隐私信息的隐私关键词和可视化隐私决策窗口。
在本发明实施例中,所述专家决策系统模型(可以理解为AI专家系统)中包括基于设定配置规则所配置的多层感知机。其中,设定配置规则侧重于提高多层感知机的泛化能力,从而确保多层感知机可以准确、可靠地进行个体隐私决策分析(也即隐私信息挖掘和定位),从而得到待处理个体隐私信息的隐私关键词(隐私类别,比如行为隐私、身份隐私、资金隐私等)和可视化隐私决策窗口(待处理个体隐私信息对应的数据集或者信息集合,以窗口化的形式围合确定)。
NODE3、结合所述隐私关键词以及所述可视化隐私决策窗口,对所述待处理个体隐私信息进行隐私匿名化处理。
在本发明实施例中,可以结合隐私关键词以及可视化隐私决策窗口进行针对性的隐私匿名化处理,一方面可以提高隐私匿名化处理的准确性,另一方面避免对过多的云空间存储信息进行匿名化处理,从而提高匿名化处理的效率,减少云计算服务器的处理压力。
在一些可能的示例中,隐私匿名化处理可以基于传统技术实现,比如K匿名化处理,在此不作赘述。
可以理解的是,通过上述NODE1-NODE3,能够结合数据防泄露处理指令获取存在数据防泄露需求的云空间存储信息,进而结合专家决策系统模型进行个体隐私决策分析,也即隐私信息挖掘和识别,从而得到待处理个体隐私信息的隐私关键词和可视化隐私决策窗口,以结合隐私关键词和可视化隐私决策窗口对待处理个体隐私信息进行隐私匿名化处理。鉴于专家决策系统模型中的多层感知机具有较强的泛化能力,因而可以灵活、准确地进行隐私关键词和可视化隐私决策窗口识别,从而确保后续隐私匿名化处理的准确性和可靠性,提高待处理个体隐私信息的防泄露能力。
可见,上述隐私防护处理的关键在于多层感知机的隐私决策性能,鉴于此,本发明实施例还提供了针对多层感知机的配置思路,该配置思路可以通过如下技术方案实现。
步骤S11、获得多个云空间存储信息块,每个云空间存储信息块中携带一类隐私关键词的个体隐私信息。
其中,每个云空间存储信息块基于对云空间存储信息示例进行抽取所得,比如可以对云空间存储信息示例进行分治处理或者碎片化处理,以得到多个云空间存储信息块,也即局部存储信息。
步骤S12、从所述多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息。
其中,K为大于0的整数。
步骤S13、经由所述完成组合的新存储信息配置所述多层感知机。
对于本发明实施例而言,可事先设置设定数目的隐私关键词,比如可事先设置20个隐私关键词,隐私关键词比如行为隐私、身份隐私、资金隐私等。进一步从多个云空间存储信息示例中抽取出符合上述分类的隐私关键词的云空间存储信息块,使得每个云空间存储信息块中携带一类隐私关键词的个体隐私信息。
对于另一些实施例而言,所述获得多个云空间存储信息块,包括:获得多个云空间存储信息示例;每一云空间存储信息示例中包括对应于设定隐私关键词的不少于一个个体隐私信息识别单元;基于每一云空间存储信息示例中的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块。
对于本发明实施例而言,每一云空间存储信息示例中包括对应于设定隐私关键词的不少于一个个体隐私信息识别单元。其中,个体隐私信息识别单元可以理解为个体隐私信息识别窗口,其形状不限。
在另一些示例下,每一云空间存储信息示例中包括的个体隐私信息识别单元可通过预先进行配置。可以理解,可对云空间存储信息示例中的个体隐私信息进行挑选,在确定云空间存储信息示例中的个体隐私信息的隐私关键词为事先设置的隐私关键词后,则可在云空间存储信息示例中增设个体隐私信息识别单元,使得个体隐私信息识别单元中仅包括该个体隐私信息,比如可通过一规则窗口注释(标注)该个体隐私信息。
在又一些示例下,也可通过AI模型对各云空间存储信息示例进行处理,得到包含有对应于设定隐私关键词的不少于一个个体隐私信息识别单元的云空间存储信息示例。其中,以个体隐私信息识别单元为规则窗口(圆形窗口、梯形窗口、三角形窗口等)为例,该规则窗口可以是能够将个体隐私信息覆盖的最小区域的规则窗口。
可以理解的是,本发明实施例中的个体隐私信息识别单元内的个体隐私信息,可以是云空间存储信息示例中的共享信息集中的个体隐私信息,也可以是云空间存储信息示例中的非共享信息集中的个体隐私信息。
对于另一些实施例而言,所述基于每一云空间存储信息示例中的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块,包括:更新云空间存储信息示例中的个体隐私信息识别单元,基于更新后的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块。
对于本发明实施例而言,可对每一个体隐私信息识别单元进行膨胀操作,从而使得获得的云空间存储信息块中能够包含个体隐私信息的关联信息。以个体隐私信息识别单元为规则窗口为例,个体隐私信息识别单元的文本内容行约束值和文本内容列约束值可通过V和U表示,则可以依据比值对文本内容行约束值和/或文本内容列约束值进行膨胀操作,比如将文本内容列约束值增大U/2,使得膨胀操作后的文本内容列约束值为3U/2;又比如将文本内容行约束值增大V/2,使得膨胀操作后的文本内容列约束值为3V/2。其中,膨胀操作可针对文本内容列约束值和/或文本内容行约束值进行膨胀操作。
这样一来,通过对个体隐私信息识别单元的膨胀更新处理,使个体隐私信息识别单元内包含了尽可能丰富的关联信息,也即使云空间存储信息块中除了包含个体隐私信息以外也包含了尽可能丰富的关联信息,从而提高配置后的多层感知机的泛化能力。
可以理解的是,通过步骤S11的处理,云空间存储信息示例的数目在一定程度上相对较多,并且应用环境比较多样化,则可获得满足事先设置的隐私关键词的云空间存储信息块。在云空间存储信息示例的信息窗口规模一致的基础上,可得到具有各种信息窗口规模的云空间存储信息块,且云空间存储信息块的信息窗口规模一般小于云空间存储信息示例的信息窗口规模。其中,每一云空间存储信息块中可具有一种隐私关键词的全局个体隐私信息或局部个体隐私信息;在云空间存储信息块中包括一种隐私关键词的局部个体隐私信息的基础上,该个体隐私信息可能被隐藏从而变成局部个体隐私信息;或者,该个体隐私信息的关注度较低,这样可能导致获得的云空间存储信息块为局部个体隐私信息。
对于本发明实施例而言,从获得的多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,生成完成组合的新存储信息。其中,K个云空间存储信息块之间按照设定规则进行排布,任意两个云空间存储信息块之间不出现交叉。其中,完成组合的新存储信息的信息窗口规模为事先设置的信息窗口规模,比如,完成组合的新存储信息的信息窗口规模为8乘以8。则在事先设置的信息窗口规模的区域内,将挑选的K个云空间存储信息块依据设定规则排布,使得形成一个完成组合的新存储信息。可以理解的是,完成组合的新存储信息作为用于配置多层感知机的配置依据。本发明实施例中对完成组合的新存储信息的信息窗口规模不进行限定。
对于本发明实施例而言,可以通过设定的思路从多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合。可以理解的是,挑选的K个云空间存储信息块中包含的个体隐私信息所属的隐私关键词可以全部保持一致、可以部分保持一致或者也可以不一致。
对于另一些实施例而言,所述从所述多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息,可以包括如下内容:获得信息块组合特征,所述信息块组合特征中包括K个用于进行组合决策的窗口化引导内容;依据每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果从所述多个云空间存储信息块中分别挑选与每一用于进行组合决策的窗口化引导内容对应云空间存储信息块,并依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征将挑选的K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息。
对于本发明实施例而言,可以事先配置一个或多个信息块组合特征,进一步地,信息块组合特征中可事先拆解K个用于进行组合决策的窗口化引导内容,可依据每一用于进行组合决策的窗口化引导内容的围合区域从多个云空间存储信息块中挑选云空间存储信息块,以得到完成组合的新存储信息。为了确保完成组合的新存储信息中的用于进行组合决策的窗口化引导内容不出现不必要的消耗,每一用于进行组合决策的窗口化引导内容的围合区域可与云空间存储信息块的围合区域匹配一致。举例而言,一般情况下,云空间存储信息块为辐射状区域,则每一用于进行组合决策的窗口化引导内容的围合区域也可以为辐射状区域。
对于另一些实施例而言,所述依据每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果从所述多个云空间存储信息块中分别挑选与每一用于进行组合决策的窗口化引导内容对应云空间存储信息块,可以通过如下步骤实现。
步骤21、分别确定每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果,基于所述设定运算结果分别确定每一用于进行组合决策的窗口化引导内容的语义向量。
进一步地,所述语义向量为第一语义向量、第二语义向量或第三语义向量;所述第一语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值不小于第一判定变量不大于第二判定变量;所述第二语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值大于所述第二判定变量;所述第三语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值小于所述第一判定变量。进一步地,语义向量可以理解为分类向量或者类型标签,文本内容行约束值和文本内容列约束值可以理解为文本窗口或者数据窗口的窗口长度、窗口宽度。
步骤22、将所述多个云空间存储信息块依据所述第一语义向量、所述第二语义向量和所述第三语义向量进行归纳处理,获得各自匹配于所述第一语义向量、所述第二语义向量和所述第三语义向量的云空间存储信息块集合。
步骤23、分别基于每一用于进行组合决策的窗口化引导内容的语义向量、从与所述语义向量对应的云空间存储信息块集合中挑选云空间存储信息块。
在一些示例中,所述第一判定变量可以是0.5,所述第二判定变量可以是1.5。举例而言,所述第一语义向量表征的文本内容行约束值和文本内容列约束值的比值可以是1,换言之,第一语义向量的用于进行组合决策的窗口化引导内容呈椭圆形,或者在另一些示例中,第一语义向量的用于进行组合决策的窗口化引导内容趋近于椭圆形。
对于本发明实施例而言,可基于文本内容行约束值和文本内容列约束值的比值不同分为三种语义向量:第一语义向量是文本内容行约束值和文本内容列约束值接近的辐射状区域(比如类似于椭圆形),第二语义向量是文本内容行约束值大于文本内容列约束值的辐射状区域,第三语义向量是文本内容行约束值小于文本内容列约束值的辐射状区域。本发明实施例中,可针对多个云空间存储信息块依据以上第一语义向量、第二语义向量和第三语义向量进行归纳处理,挑选出符合第一语义向量(比如类似椭圆形)的多个云空间存储信息块,形成第一语义向量的云空间存储信息块集合,挑选出符合第二语义向量的多个云空间存储信息块,形成第二语义向量的云空间存储信息块集合,挑选出符合第三语义向量的多个云空间存储信息块,形成第三语义向量的云空间存储信息块集合。若信息块组合特征中包括符合以上第一语义向量、第二语义向量和第三语义向量中的至少一种语义向量的用于进行组合决策的窗口化引导内容,则从对应语义向量的云空间存储信息块集合中选择云空间存储信息块,将选择出的云空间存储信息块上设置在对应语义向量的用于进行组合决策的窗口化引导内容中。
举例而言,如果信息块组合特征的围合区域为椭圆形,信息块组合特征中拆解为四个用于进行组合决策的窗口化引导内容,每个用于进行组合决策的窗口化引导内容均是第一语义向量的用于进行组合决策的窗口化引导内容,即每个用于进行组合决策的窗口化引导内容均是类似椭圆形。则从第一语义向量的云空间存储信息块集合中挑选四个云空间存储信息块,分别将每个云空间存储信息块设置在每一用于进行组合决策的窗口化引导内容中,生成完成组合的新存储信息,
举例而言,如果信息块组合特征的围合区域为椭圆形,信息块组合特征中拆解为四个用于进行组合决策的窗口化引导内容,分别记为用于进行组合决策的窗口化引导内容window1、用于进行组合决策的窗口化引导内容window2、用于进行组合决策的窗口化引导内容window3和用于进行组合决策的窗口化引导内容window4,可以理解,用于进行组合决策的窗口化引导内容window1和用于进行组合决策的窗口化引导内容window4为第一语义向量的用于进行组合决策的窗口化引导内容,用于进行组合决策的窗口化引导内容window2为第二语义向量的用于进行组合决策的窗口化引导内容,用于进行组合决策的窗口化引导内容window3为第三语义向量的用于进行组合决策的窗口化引导内容。则从第一语义向量的云空间存储信息块集合中挑选两个云空间存储信息块,分别将挑选的两个云空间存储信息块设置在用于进行组合决策的窗口化引导内容window1和用于进行组合决策的窗口化引导内容window4;将从第二语义向量的云空间存储信息块集合中挑选一个云空间存储信息块,将挑选的云空间存储信息块设置在用于进行组合决策的窗口化引导内容window2;将从第三语义向量的云空间存储信息块集合中挑选一个云空间存储信息块,将挑选的云空间存储信息块设置在用于进行组合决策的窗口化引导内容window3。
进一步地,由于云空间存储信息块的信息窗口规模存在差异,则在一种实施方式中,可对云空间存储信息块的信息窗口规模进行归一化操作。举例而言,依据信息块组合特征中每一用于进行组合决策的窗口化引导内容的信息窗口规模对每一云空间存储信息块的信息窗口规模进行归一化操作。比如,针对第一语义向量的用于进行组合决策的窗口化引导内容,可依据用于进行组合决策的窗口化引导内容window1和用于进行组合决策的窗口化引导内容window4的信息窗口规模对第一语义向量的云空间存储信息块的信息窗口规模进行精简操作或膨胀操作,使精简操作或膨胀操作后的第一语义向量的云空间存储信息块设置在用于进行组合决策的窗口化引导内容window1或用于进行组合决策的窗口化引导内容window4后,第一语义向量的云空间存储信息块完全包括在用于进行组合决策的窗口化引导内容window1或用于进行组合决策的窗口化引导内容window4的区域内,不会超过用于进行组合决策的窗口化引导内容window1或用于进行组合决策的窗口化引导内容window4的区域。同理,针对第二语义向量的用于进行组合决策的窗口化引导内容,可依据用于进行组合决策的窗口化引导内容window2的文本内容行约束值和文本内容列约束值的比值以及用于进行组合决策的窗口化引导内容window2的信息窗口规模,对第二语义向量的云空间存储信息块的信息窗口规模进行精简操作或膨胀操作,使精简操作或膨胀操作后的第二语义向量的云空间存储信息块设置在用于进行组合决策的窗口化引导内容window2后,第二语义向量的云空间存储信息块完全包括在用于进行组合决策的窗口化引导内容window2内,不会超过用于进行组合决策的窗口化引导内容window2的区域;针对第三语义向量的用于进行组合决策的窗口化引导内容,可依据用于进行组合决策的窗口化引导内容window3的文本内容行约束值和文本内容列约束值的比值以及用于进行组合决策的窗口化引导内容window3的信息窗口规模,对第三语义向量的云空间存储信息块的信息窗口规模进行精简操作或膨胀操作,使精简操作或膨胀操作后的第三语义向量的云空间存储信息块设置在用于进行组合决策的窗口化引导内容window3后,第三语义向量的云空间存储信息块完全包括在用于进行组合决策的窗口化引导内容window3内,不会超过用于进行组合决策的窗口化引导内容window3的区域。
可以理解的是,对云空间存储信息块的信息窗口规模进行精简操作或膨胀操作,是在不更新云空间存储信息块的文本内容行约束值和文本内容列约束值的比值的基础上进行精简操作或膨胀操作,即对云空间存储信息块的精简操作不会对云空间存储信息块的内容造成干扰。
对于另一些实施例而言,在从多个云空间存储信息块中挑选云空间存储信息块的过程中,不仅可基于每一用于进行组合决策的窗口化引导内容的语义向量、从与所述语义向量对应的云空间存储信息块集合中挑选云空间存储信息块,还可基于每一用于进行组合决策的窗口化引导内容的信息窗口规模,从与所述语义向量对应的云空间存储信息块集合中挑选云空间存储信息块中选择与该用于进行组合决策的窗口化引导内容的信息窗口规模最类似的数据信息。
对于另一些实施例而言,所述依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征将挑选的K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息,可以包括如下内容:依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征确定每一云空间存储信息块的分布标签;将存在关联的两个云空间存储信息块之间的目标窗口化引导内容进行调整,得到完成组合的新存储信息。
对于本发明实施例而言,由于云空间存储信息块的文本内容行约束值和文本内容列约束值的比值可能会与信息块组合特征中的用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值不完全一致,由此即使将云空间存储信息块的信息窗口规模进行精简操作或膨胀操作、并将云空间存储信息块设置在对应的用于进行组合决策的窗口化引导内容内后,云空间存储信息块在一定程度上可能无法全部包围对应用于进行组合决策的窗口化引导内容,使得用于进行组合决策的窗口化引导内容内存在一定的目标窗口化引导内容。鉴于此,倘若不进行对应的操作,则会使完成组合的新存储信息中存在一定的目标窗口化引导内容。基于此,本发明实施例中通过对存在关联的两个云空间存储信息块之间的目标窗口化引导内容进行调整,比如可通过设定特征值补全目标窗口化引导内容,得到完成组合的新存储信息。在一些示例中,可在目标窗口化引导内容中进行特征值补全,得到完成组合的新存储信息。
对于本发明实施例而言,将完成组合的新存储信息作为多层感知机的配置依据,以配置所述多层感知机。
对于另一些实施例而言,所述经由所述完成组合的新存储信息配置所述多层感知机,可以包括如下步骤41-步骤44所记录的内容。
步骤41、基于所述多层感知机对所述完成组合的新存储信息进行处理,获得所述完成组合的新存储信息对应的个体信息知识分布,以及基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块对应的第一专家决策特征。
进一步地,一个云空间存储信息块对应的第一专家决策特征表征所述云空间存储信息块中包含的个体隐私信息分别属于多个设定隐私关键词的回归分析命中值(可以理解为预测概率值)。
步骤42、将所述个体信息知识分布通过所述多层感知机进行设定操作,获得设定操作结果。
进一步地,设定操作可以是反向传播操作。
步骤43、基于所述设定操作结果得到所述完成组合的新存储信息中的每一云空间存储信息块对应的第一字符串。
进一步地,一个云空间存储信息块对应的第一字符串(标签)表征所述云空间存储信息块中包含的个体隐私信息属于每一备选隐私关键词的可信指数,其中,所述备选隐私关键词(可以理解为设定隐私类别)为所述完成组合的新存储信息中的K个云空间存储信息块中的个体隐私信息所属隐私关键词。
步骤44、基于所述第一专家决策特征和所述第一字符串改进所述多层感知机的配置变量。
一般而言,通过多层感知机对云空间存储信息进行处理,得到云空间存储信息中的个体隐私信息对应的区分向量,该区分向量表明个体隐私信息属于哪种类别。对于本发明实施例而言,通过将完成组合的新存储信息加载至多层感知机,输出对应于完成组合的新存储信息中每一云空间存储信息块对应的第一专家决策特征;所述第一专家决策特征中包括云空间存储信息块中包含的个体隐私信息分别属于多个设定隐私关键词的回归分析命中值。
对于本发明实施例而言,加载至多层感知机的完成组合的新存储信息中包括四个云空间存储信息块,每一云空间存储信息块中包含的个体隐私信息依次是隐私A、隐私B、隐私C和隐私D,则通过多层感知机生成的第一专家决策特征表示每个云空间存储信息块中的个体隐私信息属于多个设定隐私关键词的回归分析命中值。在具体实施时,如果以设定隐私关键词的数目为20为例,则针对每个云空间存储信息块,都生成一个20关注层面(比如20维)的第一专家决策特征(标签向量),其中,第一专家决策特征中对应于每一设定隐私关键词的回归分析命中值的加权值为1。
对于另一些实施例而言,所述基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块对应的第一专家决策特征,可以包括如下内容:基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块中的每一个体信息知识元素对应的偏置特征。
进一步地,每个个体信息知识元素对应的偏置特征表征所述个体信息知识元素属于多个设定隐私关键词的回归分析命中值;基于每一云空间存储信息块中的每一个体信息知识元素对应的偏置特征获得每一云空间存储信息块对应的第一专家决策特征。
对于本发明实施例而言,多层感知机中至少包括滑动滤波单元(卷积层),通过滑动滤波单元对完成组合的新存储信息进行滑动滤波操作,得到完成组合的新存储信息对应的个体信息知识分布;再通过多层感知机中的其他处理单元对个体信息知识分布进行处理,得到个体信息知识分布中每一个体信息知识元素对应的偏置特征,基于每一个体信息知识元素对应的偏置特征得到每一云空间存储信息块对应的第一专家决策特征。
其中,偏置特征中的关注层面数目与事先设置的隐私关键词数目相同。比如,事先设置了20个隐私关键词,则偏置特征中可包括20个关注层面,每个关注层面对应一个隐私关键词。则每一个体信息知识元素对应的偏置特征中各关注层面的数据累计值为1。进一步基于每一云空间存储信息块中包含的个体信息知识元素对应的偏置特征确定每一云空间存储信息块对应的第一专家决策特征。举例而言,可对云空间存储信息块中包含的个体信息知识元素对应的偏置特征进行拓展操作(比如:最大池化)或者均匀化拓展操作(平均池化处理),得到云空间存储信息块对应的第一专家决策特征。
进一步地,多层感知机中用于进行关键内容挖掘的滑动滤波单元的数目可以是若干个,则以上个体信息知识分布可以是基于多个滑动滤波单元得到的多个个体信息知识分布中的末尾一个个体信息知识分布;可以理解通过多层感知机中的其他处理单元对上述末尾一个个体信息知识分布进行处理,进而得到每一云空间存储信息块对应的第一专家决策特征。
对于另一些实施例而言,所述将所述个体信息知识分布通过所述多层感知机进行设定操作,获得设定操作结果,可以包括如下内容:分别将所述个体信息知识分布中的每一个体信息知识元素的知识变量设置为预设变量,得到每一目标信息知识分布;将每一目标信息知识分布分别通过所述多层感知机进行设定操作,获得所述设定操作结果。
进一步地,所述设定操作结果表征所述完成组合的新存储信息中的每一个体信息知识元素的知识变量。
所述基于所述设定操作结果得到所述完成组合的新存储信息中的每一云空间存储信息块对应的第一字符串,可以包括如下内容:基于每一云空间存储信息块中的每一个体信息知识元素的知识变量得到每一个体信息知识元素对应的区分向量。
进一步地,每个个体信息知识元素对应的区分向量表征所述个体信息知识元素属于每一备选隐私关键词的可信指数;基于每一云空间存储信息块中的每一个体信息知识元素对应的区分向量确定每一云空间存储信息块对应的第一字符串。
本发明实施例中通过设定操作思路,将个体信息知识分布(比如以上末尾一个个体信息知识分布)通过多层感知机进行设定操作,基于设定操作结果得到每一云空间存储信息块对应的第一字符串。其中,所述第一字符串可以理解为通过设定操作思路得到的所述云空间存储信息块中包含的个体隐私信息属于每一备选隐私关键词的可信指数,其中,备选隐私关键词可以为所述完成组合的新存储信息中的K个云空间存储信息块中的个体隐私信息所属隐私关键词。
在实际应用时,个体信息知识分布的信息窗口规模与完成组合的新存储信息的信息窗口规模存在差异。比如,个体信息知识分布的信息窗口规模为3*3,完成组合的新存储信息的信息窗口规模8*8;则将3*3的个体信息知识分布通过设定操作思路得到作为云空间存储信息示例的完成组合的新存储信息的过程中,相当于个体信息知识分布中的1个个体信息知识元素对应于完成组合的新存储信息中的16个个体信息知识元素,也即通过设定操作思路得到的设定操作结果能够反映出个体信息知识分布中的每一个体信息知识元素对云空间存储信息示例上的16个个体信息知识元素的影响因子,从而可基于完成组合的新存储信息中的各云空间存储信息块所在用于进行组合决策的窗口化引导内容中的每一个体信息知识元素对应于个体信息知识分布中为其提供帮助的个体信息知识元素,得到每一云空间存储信息块对应的第一字符串。
在本发明实施例中,个体信息知识分布中的一个个体信息知识元素投影至完成组合的新存储信息的16个个体信息知识元素,可分布在完成组合的新存储信息的每一云空间存储信息块所对应的用于进行组合决策的窗口化引导内容;基于此,针对完成组合的新存储信息中的云空间存储信息块中的全部个体信息知识元素,为其提供帮助的个体信息知识分布中的个体信息知识元素可能源于个体信息知识分布中与各云空间存储信息块对应的每一用于进行组合决策的窗口化引导内容。基于此,针对完成组合的新存储信息中每一云空间存储信息块,可确定与云空间存储信息块中的每一个体信息知识元素存在对应关系的个体信息知识分布中的个体信息知识元素,计算云空间存储信息块中对应于个体信息知识分布中属于同一用于进行组合决策的窗口化引导内容的个体信息知识元素的数目,其中,每一用于进行组合决策的窗口化引导内容内的个体隐私信息实际为一种隐私关键词的个体隐私信息;基于分别属于同一用于进行组合决策的窗口化引导内容的个体信息知识元素的数目和所属云空间存储信息块中的个体信息知识元素的总数目确定第一字符串。
比如,以信息块组合特征为例,以抽取用于进行组合决策的窗口化引导内容为window1用于进行组合决策的窗口化引导内容为例,云空间存储信息块的个体信息知识元素数目比如为16*16,其中,倘若N1个个体信息知识元素投影至个体信息知识分布中的对应于window1所在用于进行组合决策的窗口化引导内容,N2个个体信息知识元素投影至个体信息知识分布中的对应于window2所在用于进行组合决策的窗口化引导内容,N3个个体信息知识元素投影至个体信息知识分布中的对应于window3所在用于进行组合决策的窗口化引导内容,N3个个体信息知识元素投影至个体信息知识分布中的对应于window4所在用于进行组合决策的窗口化引导内容,则上述云空间存储信息块中的个体隐私信息属于window1所在用于进行组合决策的窗口化引导内容中的个体隐私信息所属隐私关键词的可信指数可以是N4;同理,上述云空间存储信息块中的个体隐私信息属于window2所在用于进行组合决策的窗口化引导内容中的个体隐私信息所属隐私关键词的可信指数可以是N5,上述云空间存储信息块中的个体隐私信息属于window3所在用于进行组合决策的窗口化引导内容中的个体隐私信息所属隐私关键词的可信指数可以是N6,上述云空间存储信息块中的个体隐私信息属于window4所在用于进行组合决策的窗口化引导内容中的个体隐私信息所属隐私关键词的可信指数可以是N6。其中,本领域技术人员可以基于实际情况自行配置N1~N6的取值。
对于本发明实施例而言,依次将个体信息知识分布中的每个个体信息知识元素的知识变量设置为预设变量,所述预设变量比如为1,得到目标信息知识分布;将每一目标信息知识分布分别通过多层感知机进行设定操作。比如,将个体信息知识分布中位于第一区域的个体信息知识元素的知识变量设置为预设变量,其他个体信息知识元素的知识变量不变或者置为0,将目标信息知识分布通过多层感知机进行设定操作,得到与完成组合的新存储信息的信息窗口规模一致的指定云空间存储信息;再将指定云空间存储信息中的位于第二区域的个体信息知识元素的知识变量设置为预设变量,其他个体信息知识元素的知识变量不变或者置为0,将目标信息知识分布通过多层感知机进行设定操作,得到与完成组合的新存储信息的信息窗口规模一致的指定云空间存储信息;逐一推算,将上述得到的每一指定云空间存储信息进行累计,即将每一指定云空间存储信息中对应于相同个体信息知识元素的数值进行累计,累计的结果表征完成组合的新存储信息的每一个体信息知识元素的变化因子(或梯度值);进一步地,基于表征完成组合的新存储信息的每一个体信息知识元素的变化因子(或梯度值)得到云空间存储信息块对应的第一字符串。
对于本发明实施例而言,可基于通过多层感知机生成的第一专家决策特征以及通过多层感知机的设定操作(比如:反向传播)得到第一字符串确定性能评价指标(可以理解为损失值),基于性能评价指标改进所述多层感知机的配置变量。可选地,可基于第一专家决策特征和第一字符串确定铰链评价指标值,将确定的铰链评价指标值(铰链损失)作为性能评价指标。
对于另一些实施例而言,所述基于所述第一专家决策特征和所述第一字符串确定性能评价指标,可以包括如下内容:基于每一云空间存储信息块中的每一个体信息知识元素对应的所述偏置特征和所述区分向量确定第一性能评价指标,将每一云空间存储信息块中的每一个体信息知识元素对应的所述第一性能评价指标进行运算,得到每一云空间存储信息块对应的第一全局性能评价指标;将所述完成组合的新存储信息中的每一云空间存储信息块对应的所述第一全局性能评价指标进行运算,得到第二全局性能评价指标;基于所述第二全局性能评价指标改进所述多层感知机的配置变量。
对于本发明实施例而言,针对完成组合的新存储信息中的每个个体信息知识元素,均可基于得到的第一专家决策特征和第一字符串确定第一性能评价指标。举例而言,对于每个个体信息知识元素,可基于得到的第一专家决策特征和第一字符串确定铰链评价指标值,作为以上第一性能评价指标。则针对一个云空间存储信息块,将该云空间存储信息块中的全部个体信息知识元素的第一性能评价指标进行运算处理,得到第一全局性能评价指标;再对完成组合的新存储信息中的每一云空间存储信息块对应的第一全局性能评价指标进行运算处理,得到第二全局性能评价指标,最后基于上述第二全局性能评价指标改进所述多层感知机的配置变量。
应用本发明实施例,一方面,通过对云空间存储信息示例中的存储信息进行抽取,将完成抽取的K个云空间存储信息块进行二次组合作为完成组合的新存储信息,将完成组合的新存储信息作为配置多层感知机的配置依据,与传统的采用大量配置依据进行配置的思路相比,该技术方案不仅可以减少对海量配置依据的依赖,还可以提高多层感知机的配置多样性,从而提升多层感知机的泛化能力,确保多层感知机可以快速准确地进行个体隐私的识别处理和解析处理,为隐私防护和数据防泄露快速地提供准确可信的处理依据;另一方面,通过本发明实施例中的第一专家决策特征表示个体隐私信息所属隐私关键词,即生成云空间存储信息块中包含的个体隐私信息分别属于多个设定隐私关键词的回归分析命中值,实现了精细化、智能化的归纳处理,从而保障多层感知机的分类质量。
本发明实施例还提供了一种针对云计算空间的数据泄露应对方法。所述方法还可以包括如下内容:经由专家决策系统模型对存在数据防泄露需求的云空间存储信息进行个体隐私决策分析,确定出所述存在数据防泄露需求的云空间存储信息中的待处理个体隐私信息的隐私关键词和可视化隐私决策窗口。
进一步地,所述专家决策系统模型中包括采用本发明上述实施例所述方法所配置的多层感知机。
对于本发明实施例而言,可将完成配置的多层感知机应用于专家决策系统模型中。进一步地,在应用专家决策系统模型进行个体隐私决策分析过程中,专家决策系统模型可包括多层感知机(比如分类网络)和决策层(比如检测网络);可将待处理的云空间存储信息先通过多层感知机进行处理,得到待处理的云空间存储信息中的个体隐私信息对应的第一专家决策特征,将第一专家决策特征作为决策层基础指标;进一步再通过决策层对待处理的云空间存储信息进行个体隐私决策分析。相较于传统的涵盖的事先配置网络(多层感知机/分类器)的专家决策系统模型,本发明实施例中一方面通过完成组合的新存储信息作为用于配置多层感知机的配置依据,并且通过第一专家决策特征表示云空间存储信息块中的个体隐私信息分别属于多个设定隐私关键词的可信指数,这种预配置思路相较于传统的事先配置网络(多层感知机)的配置思路能够显著降低运算复杂度。
在一些可独立实施的实施例中,结合所述隐私关键词以及所述可视化隐私决策窗口,对所述待处理个体隐私信息进行隐私匿名化处理可以包括如下内容:基于所述隐私关键词对所述可视化隐私决策窗口中的隐私向量进行提取,得到目标隐私向量;利用K匿名化处理算法对所述目标隐私向量进行K匿名化处理。
在一些可独立实施的实施例中,基于所述隐私关键词对所述可视化隐私决策窗口中的隐私向量进行提取,得到目标隐私向量,可以包括如下内容:获取可视化隐私决策窗口对应的第一个体隐私字段和第二个体隐私字段,所述第一个体隐私字段包括所述可视化隐私决策窗口中不携带群体隐私画像的隐私字段集,所述第二个体隐私字段包括所述可视化隐私决策窗口中携带群体隐私画像的隐私字段集;对所述第一个体隐私字段进行向量挖掘操作,得到所述第一个体隐私字段对应的个性化隐私向量;对所述第二个体隐私字段进行向量挖掘操作,得到所述第二个体隐私字段对应的群体隐私向量;对所述群体隐私向量和所述个性化隐私向量进行加权,得到所述可视化隐私决策窗口对应的混合隐私向量;对所述混合隐私向量进行决策分析,得到所述可视化隐私决策窗口对应的决策标签;在所述决策标签属于设定标签簇的基础上,依据多分类策略对所述可视化隐私决策窗口进行隐私向量提取,得到目标隐私向量;其中,所述目标隐私向量包括全部个性化隐私向量以及部分群体隐私向量。
可以理解的是,考虑到群体隐私向量在一定程度上可能会暴露个性化隐私向量的部分细节,因此在进行目标隐私向量提取时,不能完全忽视群体隐私向量,因而通过上述的混合特征向量进行基于专家系统的决策分析,能够得到对应的决策标签(也即决策分),从而基于该决策分确定对应的多分类策略,这样能够针对性地进行映射向量提取。
在一些可独立实施的实施例中,所述获取可视化隐私决策窗口对应的第一个体隐私字段和第二个体隐私字段,包括:对所述可视化隐私决策窗口进行字段识别,得到所述可视化隐私决策窗口中不携带群体隐私画像的第一隐私字段集,将所述可视化隐私决策窗口中的所述第一隐私字段集进行拆分处理,视为所述第一个体隐私字段;根据所述第一隐私字段集,获取所述可视化隐私决策窗口中携带群体隐私画像的第二隐私字段集,将所述可视化隐私决策窗口中的所述第二隐私字段集进行拆分处理,视为所述第二个体隐私字段。
基于同样的发明构思,图2示出了本发明实施例提供的针对云计算空间的数据泄露应对装置的模块框图,针对云计算空间的数据泄露应对装置可以包括实施图1所示的相关方法步骤的数据获取模块21,用于在接收到数据防泄露处理指令时,基于所述数据防泄露处理指令获取存在数据防泄露需求的云空间存储信息;隐私决策模块22,用于经由专家决策系统模型对存在数据防泄露需求的云空间存储信息进行个体隐私决策分析,确定出所述存在数据防泄露需求的云空间存储信息中的待处理个体隐私信息的隐私关键词和可视化隐私决策窗口;所述专家决策系统模型中包括基于设定配置规则所配置的多层感知机;隐私匿名模块23,用于结合所述隐私关键词以及所述可视化隐私决策窗口,对所述待处理个体隐私信息进行隐私匿名化处理。以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。
Claims (9)
1.一种针对云计算空间的数据泄露应对方法,其特征在于,所述方法通过云计算服务器实现,所述方法包括:
在接收到数据防泄露处理指令时,基于所述数据防泄露处理指令获取存在数据防泄露需求的云空间存储信息;
经由专家决策系统模型对存在数据防泄露需求的云空间存储信息进行个体隐私决策分析,确定出所述存在数据防泄露需求的云空间存储信息中的待处理个体隐私信息的隐私关键词和可视化隐私决策窗口;所述专家决策系统模型中包括基于设定配置规则所配置的多层感知机;
结合所述隐私关键词以及所述可视化隐私决策窗口,对所述待处理个体隐私信息进行隐私匿名化处理;
所述多层感知机通过如下思路配置得到:
获得多个云空间存储信息块;其中,每个云空间存储信息块中携带一类隐私关键词的个体隐私信息,每个云空间存储信息块基于对云空间存储信息示例进行抽取所得;
从所述多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息;其中,K为大于0的整数;
经由所述完成组合的新存储信息配置所述多层感知机。
2.根据权利要求1所述的方法,其特征在于,所述获得多个云空间存储信息块,包括:
获得多个云空间存储信息示例;
每一云空间存储信息示例中包括对应于设定隐私关键词的不少于一个个体隐私信息识别单元;
基于每一云空间存储信息示例中的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块。
3.根据权利要求2所述的方法,其特征在于,所述基于每一云空间存储信息示例中的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块,包括:更新云空间存储信息示例中的个体隐私信息识别单元,基于更新后的个体隐私信息识别单元进行信息块抽取,得到云空间存储信息块。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述从所述多个云空间存储信息块中挑选K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息,包括:
获得信息块组合特征,所述信息块组合特征中包括K个用于进行组合决策的窗口化引导内容;
依据每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果从所述多个云空间存储信息块中分别挑选与每一用于进行组合决策的窗口化引导内容对应云空间存储信息块,并依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征将挑选的K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息。
5.根据权利要求4所述的方法,其特征在于,所述依据每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果从所述多个云空间存储信息块中分别挑选与每一用于进行组合决策的窗口化引导内容对应云空间存储信息块,包括:
分别确定每一用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的设定运算结果,基于所述设定运算结果分别确定每一用于进行组合决策的窗口化引导内容的语义向量;所述语义向量为第一语义向量、第二语义向量或第三语义向量;所述第一语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值不小于第一判定变量不大于第二判定变量;所述第二语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值大于所述第二判定变量;所述第三语义向量表征用于进行组合决策的窗口化引导内容的文本内容行约束值和文本内容列约束值的比值小于所述第一判定变量;
将所述多个云空间存储信息块依据所述第一语义向量、所述第二语义向量和所述第三语义向量进行归纳处理,获得各自匹配于所述第一语义向量、所述第二语义向量和所述第三语义向量的云空间存储信息块集合;
分别基于每一用于进行组合决策的窗口化引导内容的语义向量、从与所述语义向量对应的云空间存储信息块集合中挑选云空间存储信息块。
6.根据权利要求4所述的方法,其特征在于,所述依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征将挑选的K个云空间存储信息块进行信息块组合,得到完成组合的新存储信息,包括:
依据所述信息块组合特征中所述K个用于进行组合决策的窗口化引导内容的分布特征确定每一云空间存储信息块的分布标签;
将存在关联的两个云空间存储信息块之间的目标窗口化引导内容进行调整,得到完成组合的新存储信息。
7.根据权利要求6所述的方法,其特征在于,所述经由所述完成组合的新存储信息配置所述多层感知机,包括:
基于所述多层感知机对所述完成组合的新存储信息进行处理,获得所述完成组合的新存储信息对应的个体信息知识分布,以及基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块对应的第一专家决策特征;其中,一个云空间存储信息块对应的第一专家决策特征表征所述云空间存储信息块中包含的个体隐私信息分别属于多个设定隐私关键词的回归分析命中值;
将所述个体信息知识分布通过所述多层感知机进行设定操作,获得设定操作结果;
基于所述设定操作结果得到所述完成组合的新存储信息中的每一云空间存储信息块对应的第一字符串;其中,一个云空间存储信息块对应的第一字符串表征所述云空间存储信息块中包含的个体隐私信息属于每一备选隐私关键词的可信指数,其中,所述备选隐私关键词为所述完成组合的新存储信息中的K个云空间存储信息块中的个体隐私信息所属隐私关键词;
基于所述第一专家决策特征和所述第一字符串改进所述多层感知机的配置变量。
8.根据权利要求7所述的方法,其特征在于,所述将所述个体信息知识分布通过所述多层感知机进行设定操作,获得设定操作结果,包括:分别将所述个体信息知识分布中的每一个体信息知识元素的知识变量设置为预设变量,得到每一目标信息知识分布;将每一目标信息知识分布分别通过所述多层感知机进行设定操作,获得所述设定操作结果;所述设定操作结果表征所述完成组合的新存储信息中的每一个体信息知识元素的知识变量;
所述基于所述设定操作结果得到所述完成组合的新存储信息中的每一云空间存储信息块对应的第一字符串,包括:基于每一云空间存储信息块中的每一个体信息知识元素的知识变量得到每一个体信息知识元素对应的区分向量;其中,每个个体信息知识元素对应的区分向量表征所述个体信息知识元素属于每一备选隐私关键词的可信指数;基于每一云空间存储信息块中的每一个体信息知识元素对应的区分向量确定每一云空间存储信息块对应的第一字符串;
其中,所述基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块对应的第一专家决策特征,包括:基于所述个体信息知识分布获得所述完成组合的新存储信息中的每一云空间存储信息块中的每一个体信息知识元素对应的偏置特征;其中,每个个体信息知识元素对应的偏置特征表征所述个体信息知识元素属于多个设定隐私关键词的回归分析命中值;基于每一云空间存储信息块中的每一个体信息知识元素对应的偏置特征获得每一云空间存储信息块对应的第一专家决策特征;
所述基于所述第一专家决策特征和所述第一字符串改进所述多层感知机的配置变量,包括:基于每一云空间存储信息块中的每一个体信息知识元素对应的所述偏置特征和所述区分向量确定第一性能评价指标,将每一云空间存储信息块中的每一个体信息知识元素对应的所述第一性能评价指标进行运算,得到每一云空间存储信息块对应的第一全局性能评价指标;将所述完成组合的新存储信息中的每一云空间存储信息块对应的所述第一全局性能评价指标进行运算,得到第二全局性能评价指标;基于所述第二全局性能评价指标改进所述多层感知机的配置变量。
9.一种云计算服务器,其特征在于,包括:存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述云计算服务器执行如权利要求1-8中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211158483.9A CN115455484B (zh) | 2022-09-22 | 2022-09-22 | 一种针对云计算空间的数据泄露应对方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211158483.9A CN115455484B (zh) | 2022-09-22 | 2022-09-22 | 一种针对云计算空间的数据泄露应对方法及服务器 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115455484A CN115455484A (zh) | 2022-12-09 |
CN115455484B true CN115455484B (zh) | 2023-04-18 |
Family
ID=84306536
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211158483.9A Active CN115455484B (zh) | 2022-09-22 | 2022-09-22 | 一种针对云计算空间的数据泄露应对方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115455484B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114004210A (zh) * | 2021-11-03 | 2022-02-01 | 昭通亮风台信息科技有限公司 | 基于神经网络的应急预案生成方法、系统、设备及介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6883101B1 (en) * | 2000-02-08 | 2005-04-19 | Harris Corporation | System and method for assessing the security posture of a network using goal oriented fuzzy logic decision rules |
US20180247078A1 (en) * | 2017-02-28 | 2018-08-30 | Gould & Ratner LLP | System for anonymization and filtering of data |
BR112021010468A2 (pt) * | 2018-12-31 | 2021-08-24 | Intel Corporation | Sistemas de segurança que empregam inteligência artificial |
CN111694961A (zh) * | 2020-06-23 | 2020-09-22 | 上海观安信息技术股份有限公司 | 一种用于敏感数据泄露检测的关键词语义分类方法与系统 |
CN112765659B (zh) * | 2021-01-20 | 2021-09-21 | 曙光星云信息技术(北京)有限公司 | 针对大数据云服务的数据泄露防护方法及大数据服务器 |
CN112732431B (zh) * | 2021-01-26 | 2023-10-27 | 海南职业技术学院 | 一种基于云计算的人工智能系统 |
CN114662153B (zh) * | 2022-04-13 | 2022-11-29 | 福建实达集团股份有限公司 | 一种结合人工智能的共享数据隐私处理方法及服务器 |
-
2022
- 2022-09-22 CN CN202211158483.9A patent/CN115455484B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114004210A (zh) * | 2021-11-03 | 2022-02-01 | 昭通亮风台信息科技有限公司 | 基于神经网络的应急预案生成方法、系统、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
CN115455484A (zh) | 2022-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11748501B2 (en) | Tagging documents with security policies | |
CN108804641B (zh) | 一种文本相似度的计算方法、装置、设备和存储介质 | |
US10726208B2 (en) | Consumer insights analysis using word embeddings | |
KR101778679B1 (ko) | 딥러닝을 이용하여 텍스트 단어 및 기호 시퀀스를 값으로 하는 복수 개의 인자들로 표현된 데이터를 자동으로 분류하는 방법 및 시스템 | |
CN108804633B (zh) | 基于行为语义知识网络的内容推荐方法 | |
CN106255968B (zh) | 自然语言图像搜索 | |
CN109614238B (zh) | 一种目标对象识别方法、装置、系统及可读存储介质 | |
US11182806B1 (en) | Consumer insights analysis by identifying a similarity in public sentiments for a pair of entities | |
US10685183B1 (en) | Consumer insights analysis using word embeddings | |
US20040049499A1 (en) | Document retrieval system and question answering system | |
US10838985B2 (en) | Item recommendation method, device, and system | |
US10558759B1 (en) | Consumer insights analysis using word embeddings | |
US10509863B1 (en) | Consumer insights analysis using word embeddings | |
CN111783126B (zh) | 一种隐私数据识别方法、装置、设备和可读介质 | |
AU2018201681B2 (en) | Systems and methods for authenticating drivers based on gps data | |
CN112784054A (zh) | 概念图处理装置、概念图处理方法和计算机可读介质 | |
KR102215082B1 (ko) | Cnn 기반 이미지 검색 방법 및 장치 | |
CN114706985A (zh) | 文本分类方法、装置、电子设备及存储介质 | |
CN115222443A (zh) | 客户群体划分方法、装置、设备及存储介质 | |
CN114329022A (zh) | 一种色情分类模型的训练、图像检测方法及相关装置 | |
US10685184B1 (en) | Consumer insights analysis using entity and attribute word embeddings | |
US11030539B1 (en) | Consumer insights analysis using word embeddings | |
CN109660621A (zh) | 一种内容推送方法及服务设备 | |
US11367311B2 (en) | Face recognition method and apparatus, server, and storage medium | |
CN115455484B (zh) | 一种针对云计算空间的数据泄露应对方法及服务器 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20230317 Address after: 402160 No. 799 Heshun Avenue, Zhongshan Road Street, Chongqing (3rd Floor, Building 3, Zone B, Yongchuan District Big Data Industrial Park) Applicant after: Chongqing Lanshu Software Co.,Ltd. Address before: No. 252, Tuodong Road, Panlong District, Kunming, Yunnan 650051 Applicant before: Bao Zhouyan |
|
GR01 | Patent grant | ||
GR01 | Patent grant |