CN113869803A - 企业敏感信息风险评估方法、系统和存储介质 - Google Patents
企业敏感信息风险评估方法、系统和存储介质 Download PDFInfo
- Publication number
- CN113869803A CN113869803A CN202111454837.XA CN202111454837A CN113869803A CN 113869803 A CN113869803 A CN 113869803A CN 202111454837 A CN202111454837 A CN 202111454837A CN 113869803 A CN113869803 A CN 113869803A
- Authority
- CN
- China
- Prior art keywords
- risk
- information
- target
- risk assessment
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
Landscapes
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种企业敏感信息风险评估方法、系统和存储介质,属于互联网领域。本申请提供的企业敏感信息风险评估方法:根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面;根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息;对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果;对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果;结合多信息渠道,精确实现对目标企业的敏感信息风险评估。
Description
技术领域
本申请涉及互联网领域,尤其涉及一种企业敏感信息风险评估方法、系统和存储介质。
背景技术
随着互联网的快速发展,当前各类企业鱼龙混杂,为了确保用户、消费者的使用体验、以及避免诈骗、钓鱼等安全风险,针对各类企业的风险评估对于社会治理来说变得十分必要。
目前的风险评估系统、方法等,多为仅针对单独的某个网页、app进行敏感风险评估,通常只通过单一的图像识别、文字识别的方式来直接输出敏感风险评估、评估结果;由于网站页面、应用界面的复杂性、交互丰富性,导致获取有效的页面要素的难度提高,极大的影响了风险评估的准确性。并且需要进行风险评估的网页数量庞大,采取人工审核也会耗费极大的人力资源。
并且,这种评估方法没有将一个企业的关联网站、旗下的所有app都纳入评估范围,这对某个企业的风险无法形成有效的评估,用户难以全面的认知某些存在风险的企业。
发明内容
本申请提出了一种企业敏感信息风险评估方法、系统和存储介质,以解决现有技术存在的问题。
为了实现上述目的,本申请采用了如下方案:
一方面,本申请实施例提供了一种企业敏感信息风险评估方法,包括:
根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面;
根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息;
对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果;
对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果。
可选的,所述待识别数据包括每个渠道的图像集和文本集;
所述图像集中包括若干待评估图像;
所述文本集中包括若干待评估语句块。
可选的,所述对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果包括:
根据目标渠道的图像集,对所述目标渠道进行图像风险评估与文本风险评估;根据目标渠道的文本集,对所述目标渠道进行文本风险评估;
所述图像风险评估包括:对每个所述待评估图像进行图像敏感元素检测,获取图像检测结果;根据所述图像检测结果对每个所述待评估图像进行图像风险评估,获取所述目标渠道的图像风险评估结果;
所述文本风险评估包括:对每个所述待评估语句块进行文字敏感元素检测获取文字检测结果,根据所述文字检测结果,对所述每个所述待评估语句块进行文本风险评估,获取所述目标渠道的文本风险评估结果;
将所述目标渠道的图像风险评估结果与文本风险评估结果融合,获取所述目标渠道的敏感信息风险评估结果。
可选的,所述将所述目标渠道的图像风险评估结果与文本风险评估结果融合,获取所述目标渠道的敏感信息风险评估结果包括:
根据所述目标渠道的图像集中的所有待评估图像的风险等级中的最大值,确定所述目标渠道的图像风险等级;
根据目标渠道的图像集中的所有待评估语句块的文本风险等级中的最大值,确定所述目标渠道的文本风险等级;
所述目标渠道的敏感信息风险评估结果根据所述目标渠道的图像风险等级和所述目标渠道的文本风险等级加权融合获得。
可选的,所述图像风险评估还包括确定每个所述待评估图像的图像风险等级:
根据以下公式确定目标待评估图像的风险评估得分:
Scorem= Scorem-1+α[i]*(T1 - Scorem-1) ;
Simage=γScorem ;
其中,所述目标待评估图像中所述图像敏感元素数量为m,所述目标待评估图像属于元素数量阶梯i,基础风险分数为Score0,图像高风险阈值为T1,敏感风险权重为γ,元素数量阶梯i的风险增长速率为α[i],所述目标待评估图像的敏感信息风险等级为Scorem,所述目标待评估图像的风险评估得分为Simage;
通过所述目标待评估图像的风险评估得分Simage,确定所述待评估图像的风险等级。
可选的,所述文本风险评估还包括确定每个所述待评估语句的文本风险等级包括:
根据目标待评估语句块中的有效语句数量,确定所述目标待评估语句块属于语句数量阶梯r,语句数量第r阶梯的文本风险阈值为T2,语句数量第r阶梯的下降速率为β[r],
所述目标待评估语句块的文本风险评估得分为Socr,根据以下公式确定所述目标待评估语句块的文本风险评估得分:
Socr’ = Socr –β[r]*( Socr-(1/T2)) ;
通过所述目标待评估语句块的文本风险评估得分Socr,确定所述待评估语句的文本风险等级。
可选的,所述对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果,包括:
将所有渠道的敏感信息风险评估结果按敏感信息风险等级分为j类,根据所述风险等级类别构建风险识别框架θ,所述识别框架θ上存在有N个质量函数m1,m2,……,mN,其中,N为渠道的数量,每个质量函数对应的值分别为每个信息来源渠道的风险等级评估结果;
基于Dempster-Shafer证据合成规则,根据所述敏感信息风险等级和所述质量函数,计算每个所述敏感信息风险等级的组合质量函数;
根据每个所述敏感信息风险等级的组合质量函数,获取所述目标企业的敏感信息风险评估结果。
可选的,当j=3,将所述敏感信息风险等级分为高风险HD、中风险MD、低风险LD三类;
θ={HD,MD,LD};
高风险HD的组合质量函数为:
中风险MD的组合质量函数为:
低风险LD的组合质量函数为:
其中,归一化常数Q通过以下公式计算获得:
可选的,所述根据每个所述敏感信息风险等级的组合质量函数,获取所述目标企业的敏感信息风险评估结果包括:
将敏感信息风险等级的组合质量函数中的最大值对应的风险等级,作为所述目标企业的敏感信息风险等级。
可选的,所述企业敏感信息风险评估方法还包括以下至少之一:
基于用户的第一输入,展示所述目标企业的敏感信息风险评估进度;
基于用户的第二输入,展示所述目标企业的敏感信息风险评估结果;
基于用户的第三输入,展示所述目标企业的各个渠道的风险评估结果。
另一方面,本申请实施例提供了一种企业敏感信息风险评估系统,包括:
信息获取模块,用于根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面;
待识别数据生成模块,用于根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息;
风险评估模块,用于对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果;
多源融合评估模块,用于对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果。
另一方面,本申请实施例提供了一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如本申请实施例提供的任一项所述的企业敏感信息风险评估方法的步骤。
另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如本申请实施例提供的任一项所述的企业敏感信息风险评估方法的步骤。
本申请实施例提供的技术方案带来的有益效果至少包括:
提供了一种企业敏感信息风险评估方法,包括:根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面;根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息;对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果;对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果;结合多信息渠道,精确实现对目标企业的敏感信息风险评估。
附图说明
图1 为本申请实施例提供的一种企业敏感信息风险评估方法流程图;
图2 为本申请实施例提供的一种企业敏感信息风险评估方法示意图;
图3 为本申请实施例提供的一种企业敏感信息风险评估系统示意图;
图4 为本申请实施例提供的一种企业敏感信息风险评估模块的示意图;
图5 为本申请实施例提供的一种电子设备结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例的附图,对本申请实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请的保护范围。
本申请的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
值得注意的是,本申请说明书、权利要求中出现的公式中的“*”代表乘,“/”代表除以。
此外,下面所描述的本申请不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。
下面结合附图,通过具体的实施例及其应用场景对本申请实施例提供的企业敏感信息风险评估方法进行详细地说明。
参考图1示出了本申请实施例提供的企业敏感信息风险评估方法的流程图示意,所述方法包括:
步骤101,根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面。
具体的,对于待评估的目标企业,我们以企业名称作为检索的关键词,通过预设的信息渠道,如在多个平台上对与其相关的舆情信息进行检索。示例性的,检索涉及对该企业官方网站、旗下各类软件应用、各类资讯内容平台(如微博、微信、今日头条等),在多个渠道中,获取所述目标企业相关的舆情信息。
步骤102,根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息。
具体的,可通过现有爬虫技术,对上述涉及目标企业舆情的多源信息渠道分别进行图像与文本数据的爬取;对于从N个不同的信息渠道中获取的图像、文本等多模态数据,将分别存储在N个不同的数据库中。最后可将N个数据库中的多模态信息分别送入到N个不同的多模态敏感风险评估模块中,进行风险评估,获取每个渠道的敏感风险评估结果。
步骤103,对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果。
具体的,对于每一个信息渠道中获取到的多模态信息(图像与文本),我们都要进行敏感风险评估,从而获取每个渠道的敏感信息风险评估结果。
具体的,由于涉及对目标企业官方网站、旗下各类软件应用、各类资讯内容平台(微博、微信、今日头条等)等多源信息渠道进行处理,因此,需要对每个信息渠道都会给出相应敏感信息风险评估结果,如每个渠道的风险等级。
步骤104,对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果。
具体的,获得每个渠道的风险评估结果后,综合这些多渠道的多源信息的敏感风险评估结果,对目标企业的敏感信息风险进行评估,基于多源多模态信息融合,获取目标企业的敏感信息风险评估结果,如,基于Dempster-Shafer证据理论(或其衍生改进方法)来进行多源多模态信息融合,最终得到待评估的目标企业的风险评估结果。
可选的,所述待识别数据包括每个渠道的图像集和文本集;
所述图像集中包括若干待评估图像;
所述文本集中包括若干待评估语句块。
示例性的,参考图2,如有n个渠道,从n个渠道中分别提取待识别数据,生成n个图像集,n个文本集,分别对应于n个渠道。每个文本集中包括了它对应的渠道的若干个待评估语句块,每个图像集中包括了它对应的渠道的若干个待评估图像。
可选的,所述对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果包括:
根据目标渠道的图像集,对所述目标渠道进行图像风险评估与文本风险评估;根据目标渠道的文本集,对所述目标渠道进行文本风险评估;
所述图像风险评估包括:对每个所述待评估图像进行图像敏感元素检测,获取图像检测结果;根据所述图像检测结果对每个所述待评估图像进行图像风险评估,获取所述目标渠道的图像风险评估结果;
所述文本风险评估包括:对每个所述待评估语句块进行文字敏感元素检测获取文字检测结果,根据所述文字检测结果,对所述每个所述待评估语句块进行文本风险评估,获取所述目标渠道的文本风险评估结果;
将所述目标渠道图像的图像风险评估结果与文本风险评估结果融合,获取所述目标渠道的敏感信息风险评估结果。
具体的,本申请对每个渠道分别进行图像风险评估和文本风险评估,将获取的所述目标渠道图像的图像风险评估结果与文本风险评估结果融合,得到目标渠道的敏感信息风险评估结果。
示例性的,针对图像集进行图像风险评估,可通过图像检测模型检测图片集中各个图片中的风险元素,并根据检测到的风险元素的类型与数量来识别出风险评估结果。
示例性的,文字集中的语句块生成包含两部分,一方面是直接爬取的文本数据,另一方面是从渠道中的图片中提取到的文本信息。通过对这些语句块进行风险元素识别,来获取目标渠道文本风险评估结果。
可选的,所述将所述目标渠道图像的图像风险评估结果与文本风险评估结果融合,获取所述目标渠道的敏感信息风险评估结果包括:
根据所述目标渠道的图像集中的所有待评估图像的风险等级中的最大值,确定所述目标渠道的图像风险等级;
根据目标渠道的图像集中的所有待评估语句块的文本风险等级中的最大值,确定所述目标渠道的文本风险等级;
所述目标渠道的敏感信息风险评估结果根据所述目标渠道的图像风险等级和所述目标渠道的文本风险等级加权融合获得。
具体的,如目标渠道的图像风险等级为D1,D1 = max{ Dimage },目标渠道的文本风险等级为D2,D2 = max{ Docr },其中,{ Dimage }是目标渠道图像集中所有图像的风险等级,{ Docr }是目标渠道文本集中所有文本的风险等级。具体的,目标渠道的敏感风险等级由目标渠道的图像风险等级和文本风险等级融合或者,示例性的以两者的最大值作为标渠道的敏感风险等级D3。如,D3 = max{ D1,D2}。
可选的,所述图像风险评估还包括确定每个所述待评估图像的图像风险等级:
根据以下公式确定所述目标待评估图像的风险评估得分:
Scorem= Scorem-1+α[i]*(T1 - Scorem-1) ;
Simage=γScorem ;
其中,目标待评估图像中所述图像敏感元素数量为m,所述目标待评估图像属于元素数量阶梯i,基础风险分数为Score0,图像高风险阈值为T1,敏感风险权重为γ,元素数量阶梯i的风险增长速率为α[i],所述目标待评估图像的敏感信息风险等级为Scorem,所述目标待评估图像的风险评估得分为Simage;通过所述目标待评估图像的风险评估得分Simage,确定所述待评估图像的风险等级。
具体的,在进行图像风险评估时,本申请将M种典型敏感元素视为待检测图像敏感元素目标,将目标渠道的图像集作为图像检测模型的训练集。其中任何一种先进的目标检测模型均可以实现检测的功能。通过图像检测,输出检测到的敏感目标的位置和类别。
根据上述方法,可以依据图像检测的结果,对待评估图像的敏感风险得分与风险等级进行计算与评估,供用户做出进一步选择。
示例性的,首先,设定一张图像的高和宽为h、w,其面积为S,其中检测到的第j个图像敏感元素目标的的高与宽为hj、wj,其面积为sj,记s为这一张图中所有检测到的图像敏感元素目标的面积之和。同时,设定单张目标图片中敏感风险权重γ:
γ= s /(S* threshold_img);
其中,threshold_img为我们设定的图像风险尺寸基础阈值。如,当S=100,s =10,threshold_img=0.1,则γ=10 / (100*0.1)=1。
对于目标待评估图像的风险等级得分计算方法如下:
Scorem= Scorem-1+α[i]*(T1 - Scorem-1) 。
对于单张目标图片的风险等级得分计算来说,首先只要检测到图像敏感元素,就存在一个基础风险分数Score0,设置高风险程度阈值T1,根据检测到的图像敏感元素的数量设置若干个阶梯,其中对于第i个阶梯,α[i]代表该阶梯范围内的风险增长速率。每当待评估图像中检测到一个图像敏感元素,就应用一次该公式进行计算,风险分数就会相应增加。通过该公式可以根据当前检测到的图像敏感元素数量来动态调整待评估图像的风险等级得分。上述内容通过下面公式进行:
Scorem= Scorem-1+α[i]*(T1 - Scorem-1)。
对于待评估图像的最终风险得分,引入图片敏感风险权重γ,我们将使用以下公式实现:
Simage=γScorem ;
对于目标渠道的图像风险得分,直接选择目标渠道图像集中所有图像得分最高的Simage作为所述目标渠道的图像风险得分S1,并据此判断依据图像集的风险等级D1,即目标渠道的图像风险等级D1。
示例性的,待评估图像的风险等级Dimage与目标渠道的图像风险等级D1、包括三个等级:高风险、中风险、低风险,根据预设的高风险程度阈值T1以及风险得分Simage 、S1来确定待评估图像、目标渠道的图像风险等级。
可选的,所述文本风险评估还包括确定每个所述待评估语句的文本风险等级包括:
根据目标待评估语句块中的有效语句数量,确定所述目标待评估语句块属于语句数量阶梯r,语句数量第r阶梯的文本风险阈值为T2,语句数量第r阶梯的下降速率为β[r],所述目标待评估语句块的文本风险评估得分为Socr,根据以下公式确定所述目标待评估语句块的文本风险评估得分:
Socr’ = Socr –β[r]*( Socr-(1/T2)) ;
通过所述目标待评估语句块的文本风险评估得分Socr,确定所述待评估语句的文本风险等级。
具体的,有效语句根据语句块的风险阈值来判断,采用文本处理算法来检测识别出每个语句块其包含的风险词汇,根据风险词汇数量来确定风险阈值确定和筛选有效语句。
设定风险语句数量阶梯,根据目标待评估语句块中的有效语句数量,确定所述目标待评估语句块属于语句数量阶梯r,语句数量第r阶梯的文本风险阈值为T2,语句数量第r阶梯的下降速率为β[r],所述目标待评估语句块的文本风险评估得分为Socr,根据以下公式确定所述目标待评估语句块的文本风险评估得分:
Socr’ = Socr –β[r]*( Socr-(1/T2))。
具体的,Socr有一个基础值,根据目标待评估语句块的检测结果,每有一个语句不符合文本风险阈值T2,就会让Socr减少,𝛽[𝑟]是其下降速率,对于当前目标语句中有效语句数量会动态调整。
具体的,通过上述关于Socr的公式,对Socr进行赋值,等式左边的Socr’为迭代后的Socr’,通过等式右边迭代前的Socr根据公式计算获得。
例如,当识别12个有效的语句块,假设其中2个为含有风险词汇的语句块,10个为无风险语句块,那么就用十次文本风险评估得分公式,前5次下降速率为β[r]是0.08,5到10次下降速率为β[r]是0.045。
对于目标渠道的文本风险得分,直接选择目标渠道文本集中所有文本风险得分最高的Socr作为所述目标渠道的文本风险得分S2,并据此判断依据目标渠道的文本风险等级D2。
示例性的,待评估文本的风险等级Docr与目标渠道的风险等级D2、包括三个等级:高风险、中风险、低风险,根据预设的文本高风险程度阈值P以及风险得分Socr 、S2来确定待评估文本、目标渠道的文本风险等级。
可选的,所述对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果,包括:
将所有渠道的敏感信息风险评估结果按敏感信息风险等级分为j类,根据所述风险等级类别构建风险识别框架θ,所述识别框架θ上存在有N个质量函数m1,m2,……,mN,其中,N为渠道的数量,每个质量函数对应的值分别为每个信息来源渠道的风险等级评估结果;
基于Dempster-Shafer证据合成规则,根据所述敏感信息风险等级和所述质量函数,计算每个所述敏感信息风险等级的组合质量函数;
根据每个所述敏感信息风险等级的组合质量函数,获取所述目标企业的敏感信息风险评估结果。
可选的, 当j=3,将所述敏感信息风险等级分为高风险HD、中风险MD、低风险LD三类;
θ={HD,MD,LD};
高风险HD的组合质量函数为:
中风险MD的组合质量函数为:
低风险LD的组合质量函数为:
其中,归一化常数Q通过以下公式计算获得:
可选的,所述根据每个所述敏感信息风险等级的组合质量函数,获取所述目标企业的敏感信息风险评估结果包括:
将敏感信息风险等级的组合质量函数中的最大值对应的风险等级,作为所述目标企业的敏感信息风险等级。
具体的,本申请提供的企业敏感信息风险评估方法存在N个不同来源渠道的敏感风险评估结果,评估结果以风险等级的形式呈现,等级数量和级别由预设决定。
示例性的,以风险危险等级为3个等级为例,如j=3,包括高风险,中风险,低风险分别简记为HD、MD、LD。设定识别框架为θ={HD,MD,LD},定义识别框架θ上存在有限个质量函数m1,m2,……, mN,N为信息来源的渠道总数,这些质量函数对应的值分别为每个信息来源渠道中对于危险等级的预测结果。
在综合了这N个信息来源渠道的判断后,得到了上述的对于三种可能的危险等级的组合质量函数,高风险HD的组合质量函数、中风险MD的组合质量函数、低风险LD的组合质量函数,以及归一化常数Q的计算公式;对三个组合质量函数的结果进行计算,对这三个组合质量函数的结果比较大小,三个结果中的最大值对应的危险等级即为该企业最终的敏感风险危险等级。
可选的,所述企业敏感信息风险评估方法还包括以下至少之一:
基于用户的第一输入,展示所述目标企业的敏感信息风险评估进度;
基于用户的第二输入,展示所述目标企业的敏感信息风险评估结果;
基于用户的第三输入,展示所述目标企业的各个渠道的风险评估结果。
具体的,本申请实施例提供的企业敏感信息风险评估方法还包含了提供网页服务,网页服务主要基于上述企业敏感信息风险评估方法提供的各个渠道、各阶段的评估结果、结合图形、表格、文字等,对所监测的目标企业的风险状况数据及风险评估结果按需进行多样化的展现,利用人机交互界面,实现便捷的控制、监测数据立体查询和在线分析结果的查看。
示例性的,本申请实施例提供的企业敏感信息风险评估方法可提供对应的操作界面,以便于用户进行交互操作,如在操作界面上,根据用户执行不同的输入操作,向用户展示不同阶段的评估进度和/或结果;如,用户执行了第一输入,向用户展示所述目标企业的敏感信息风险评估进度,用户执行了第二输入,向用户展示所述目标企业的敏感信息风险评估结果;用户执行了第三输入,向用户展示所述目标企业的各个渠道的风险评估结果。
示例性的,网页服务以Web应用的形式进行部署。Web应用有三大部分:企业搜索模块、各渠道多模态的敏感风险评估结果展示模块、融合后的企业敏感风险评估结果展示模块。其中融合后的企业敏感风险评估结果展示模块是综合了所有渠道的评估结果生成的最终结果,包含目标企业的风险等级评估结果。上述,为本申请提供的企业敏感风险评估方法的设计。
综上所述,本申请实施例提供的企业敏感信息风险评估方法综合考虑了目标企业多渠道、多模态的信息,对目标企业首先在每个渠道获取多模态信息,对每个模态的信息进行风险评估后融合成每个渠道的风险评估结果,之后基于DS证据理论,根据每个渠道的风险评估结果,构建质量函数,对目标企业的敏感信息风险进行评估,获取最终结果,能够提供更为精准的风险评估结果。
参考图3,本申请实施例提供了一种企业敏感信息风险评估系统30,包括:
信息获取模块31,用于根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面;
待识别数据生成模块32,用于根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息;
风险评估模块33,用于对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果;
多源融合评估模块34,用于对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果。
可选的,所述待识别数据包括每个渠道的图像集和文本集;
所述图像集中包括若干待评估图像;
所述文本集中包括若干待评估语句块。
可选的,所述风险评估模块33包括:
图像风险评估模块331,用于根据目标渠道的图像集,对所述目标渠道进行图像风险评估与文本风险评估;
文本风险评估模块332,用于根据目标渠道的文本集,对所述目标渠道进行文本风险评估;
所述图像风险评估包括:对每个所述待评估图像进行图像敏感元素检测,获取图像检测结果;根据所述图像检测结果对每个所述待评估图像进行图像风险评估,获取所述目标渠道的图像风险评估结果;
所述文本风险评估包括:对每个所述待评估语句块进行文字敏感元素检测获取文字检测结果,根据所述文字检测结果,对所述每个所述待评估语句块进行文本风险评估,获取所述目标渠道的文本风险评估结果;
单渠道风险评估融合模块333,用于将所述目标渠道图像的图像风险评估结果与文本风险评估结果融合,获取所述目标渠道的敏感信息风险评估结果。
可选的,所述单渠道风险评估融合模块333还用于:
根据所述目标渠道的图像集中的所有待评估图像的风险等级中的最大值,确定所述目标渠道的图像风险等级;
根据目标渠道的图像集中的所有待评估语句块的文本风险等级中的最大值,确定所述目标渠道的文本风险等级;
所述目标渠道的敏感信息风险评估结果根据所述目标渠道的图像风险等级和所述目标渠道的文本风险等级加权融合获得。
可选的,所述图像风险评估模块331,还用于确定每个所述待评估图像的图像风险等级:
根据以下公式确定所述目标待评估图像的风险评估得分:
Scorem= Scorem-1+α[i]*(T1 - Scorem-1) ;
Simage=γScorem ;
其中,目标待评估图像中所述图像敏感元素数量为m,所述目标待评估图像属于元素数量阶梯i,基础风险分数为Score0,图像高风险阈值为T1,敏感风险权重为γ,元素数量阶梯i的风险增长速率为α[i],所述目标待评估图像的敏感信息风险等级为Scorem,所述目标待评估图像的风险评估得分为Simage;
通过所述目标待评估图像的风险评估得分Simage,确定所述待评估图像的风险等级。
可选的,文本风险评估模块332,还用于确定每个所述待评估语句的文本风险等级包括:
根据目标待评估语句块中的有效语句数量,确定所述目标待评估语句块属于语句数量阶梯r,语句数量第r阶梯的文本风险阈值为T2,语句数量第r阶梯的下降速率为β[r],所述目标待评估语句块的文本风险评估得分为Socr,根据以下公式确定所述目标待评估语句块的文本风险评估得分:
Socr’ = Socr –β[r]*( Socr-(1/T2)) ;
通过所述目标待评估语句块的文本风险评估得分Socr,确定所述待评估语句的文本风险等级。
可选的,所述多源融合评估模块34,还用于:
将所有渠道的敏感信息风险评估结果按敏感信息风险等级分为j类,根据所述风险等级类别构建风险识别框架θ,所述识别框架θ上存在有N个质量函数m1,m2,……,mN,其中,N为渠道的数量,每个质量函数对应的值分别为每个信息来源渠道的风险等级评估结果;
基于Dempster-Shafer证据合成规则,根据所述敏感信息风险等级和所述质量函数,计算每个所述敏感信息风险等级的组合质量函数;
根据每个所述敏感信息风险等级的组合质量函数,获取所述目标企业的敏感信息风险评估结果。
可选的,当j=3,将所述敏感信息风险等级分为高风险HD、中风险MD、低风险LD三类;
θ={HD,MD,LD};
高风险HD的组合质量函数为:
中风险MD的组合质量函数为:
低风险LD的组合质量函数为:
其中,归一化常数Q通过以下公式计算获得:
可选的,所述多源融合评估模块34,还用于:
将敏感信息风险等级的组合质量函数中的最大值对应的风险等级,作为所述目标企业的敏感信息风险等级。
可选的,所述企业敏感信息风险评估系统还包括交互模块35,用于:
基于用户的第一输入,展示所述目标企业的敏感信息风险评估进度;
基于用户的第二输入,展示所述目标企业的敏感信息风险评估结果;
基于用户的第三输入,展示所述目标企业的各个渠道的风险评估结果。
本申请实施例提供的企业敏感信息风险评估系统起到的技术效果与本申请实施例提供的企业敏感信息风险评估方法相同,此处不再赘述。
请参考图5,本发明实施例还提供一种电子设备50,包括处理器51,存储器52,存储在存储器52上并可在所述处理器51上运行的计算机程序,该计算机程序被处理器51执行时实现上述企业敏感信息风险评估方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现上述企业敏感信息风险评估方法的实施例的各个过程,且能达到相同的技术效果,为避免重复,这里不再赘述。其中,所述的计算机可读存储介质,如只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁碟或者光盘等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本申请创造的保护范围之中。
Claims (13)
1.一种企业敏感信息风险评估方法,其特征在于,包括:
根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面;
根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息;
对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果;
对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果。
2.根据权利要求1所述的企业敏感信息风险评估方法,其特征在于,所述待识别数据包括每个渠道的图像集和文本集;
所述图像集中包括若干待评估图像;
所述文本集中包括若干待评估语句块。
3.根据权利要求2所述的企业敏感信息风险评估方法,其特征在于,所述对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果包括:
根据目标渠道的图像集,对所述目标渠道进行图像风险评估与文本风险评估;根据目标渠道的文本集,对所述目标渠道进行文本风险评估;
所述图像风险评估包括:对每个所述待评估图像进行图像敏感元素检测,获取图像检测结果;根据所述图像检测结果对每个所述待评估图像进行图像风险评估,获取所述目标渠道的图像风险评估结果;
所述文本风险评估包括:对每个所述待评估语句块进行文字敏感元素检测获取文字检测结果,根据所述文字检测结果,对所述每个所述待评估语句块进行文本风险评估,获取所述目标渠道的文本风险评估结果;
将所述目标渠道的图像风险评估结果与文本风险评估结果融合,获取所述目标渠道的敏感信息风险评估结果。
4.根据权利要求3所述的企业敏感信息风险评估方法,其特征在于,所述将所述目标渠道的图像风险评估结果与文本风险评估结果融合,获取所述目标渠道的敏感信息风险评估结果包括:
根据所述目标渠道的图像集中的所有待评估图像的风险等级中的最大值,确定所述目标渠道的图像风险等级;
根据目标渠道的图像集中的所有待评估语句块的文本风险等级中的最大值,确定所述目标渠道的文本风险等级;
所述目标渠道的敏感信息风险评估结果根据所述目标渠道的图像风险等级和所述目标渠道的文本风险等级加权融合获得。
5.根据权利要求4所述的企业敏感信息风险评估方法,其特征在于,所述图像风险评估还包括确定每个所述待评估图像的图像风险等级:
根据以下公式确定目标待评估图像的风险评估得分:
Scorem= Scorem-1+α[i]*(T1 - Scorem-1) ;
Simage =γScorem ;
其中,所述目标待评估图像中所述图像敏感元素数量为m,所述目标待评估图像属于元素数量阶梯i,基础风险分数为score0,图像高风险阈值为T1,敏感风险权重为γ,元素数量阶梯i的风险增长速率为α[i],所述目标待评估图像的敏感信息风险等级为Scorem,所述目标待评估图像的风险评估得分为Simage;
通过所述目标待评估图像的风险评估得分Simage,确定所述待评估图像的风险等级。
6.根据权利要求4所述的企业敏感信息风险评估方法,其特征在于,所述文本风险评估还包括确定每个所述待评估语句的文本风险等级包括:
根据目标待评估语句块中的有效语句数量,确定所述目标待评估语句块属于语句数量阶梯r,语句数量第r阶梯的文本风险阈值为T2,语句数量第r阶梯的下降速率为β[r],
所述目标待评估语句块的文本风险评估得分为Socr,根据以下公式确定所述目标待评估语句块的文本风险评估得分:
Socr’=Socr–β[r]*(Socr-(1/T2)) ;
通过所述目标待评估语句块的文本风险评估得分Socr,确定所述待评估语句的文本风险等级。
7.根据权利要求4所述的企业敏感信息风险评估方法,其特征在于,所述对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果,包括:
将所有渠道的敏感信息风险评估结果按敏感信息风险等级分为j类,根据所述风险等级类别构建风险识别框架θ,所述识别框架θ上存在有N个质量函数m1,m2,……,mN,其中,N为渠道的数量,每个质量函数对应的值分别为每个信息来源渠道的风险等级评估结果;
基于Dempster-Shafer证据合成规则,根据所述敏感信息风险等级和所述质量函数,计算每个所述敏感信息风险等级的组合质量函数;
根据每个所述敏感信息风险等级的组合质量函数,获取所述目标企业的敏感信息风险评估结果。
9.根据权利要求7所述的企业敏感信息风险评估方法,其特征在于,所述根据每个所述敏感信息风险等级的组合质量函数,获取所述目标企业的敏感信息风险评估结果包括:
将敏感信息风险等级的组合质量函数中的最大值对应的风险等级,作为所述目标企业的敏感信息风险等级。
10.根据权利要求1所述的企业敏感信息风险评估方法,其特征在于,所述企业敏感信息风险评估方法还包括以下至少之一:
基于用户的第一输入,展示所述目标企业的敏感信息风险评估进度;
基于用户的第二输入,展示所述目标企业的敏感信息风险评估结果;
基于用户的第三输入,展示所述目标企业的各个渠道的风险评估结果。
11.一种企业敏感信息风险评估系统,其特征在于,包括:
信息获取模块,用于根据目标企业的名称,在预设信息渠道中检索与所述目标企业相关的舆情信息;其中,所述信息渠道包括:软件应用和/或网页页面;
待识别数据生成模块,用于根据所述舆情信息,获取所述目标企业在每个信息渠道的多模态信息,根据所述多模态信息生成所述每个信息渠道的待识别数据;所述多模态信息至少包括图片信息和文字信息;
风险评估模块,用于对所述每个渠道的待识别数据进行风险评估,获取每个渠道的敏感信息风险评估结果;
多源融合评估模块,用于对所有渠道的敏感信息风险评估结果进行融合,获取所述目标企业的敏感信息风险评估结果。
12.一种电子设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至10中任一项所述的企业敏感信息风险评估方法的步骤。
13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至10中任一项所述的企业敏感信息风险评估方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111454837.XA CN113869803A (zh) | 2021-12-02 | 2021-12-02 | 企业敏感信息风险评估方法、系统和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111454837.XA CN113869803A (zh) | 2021-12-02 | 2021-12-02 | 企业敏感信息风险评估方法、系统和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113869803A true CN113869803A (zh) | 2021-12-31 |
Family
ID=78985487
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111454837.XA Pending CN113869803A (zh) | 2021-12-02 | 2021-12-02 | 企业敏感信息风险评估方法、系统和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113869803A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033918A (zh) * | 2022-06-09 | 2022-09-09 | 易顺云(深圳)科技有限公司 | 企业一体化信息管理方法及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101281521A (zh) * | 2007-04-05 | 2008-10-08 | 中国科学院自动化研究所 | 一种基于多分类器融合的敏感网页过滤方法及系统 |
CN110458399A (zh) * | 2019-07-05 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 风险信息生成方法、装置、计算机设备和存储介质 |
CN111581945A (zh) * | 2020-04-09 | 2020-08-25 | 上海淇毓信息科技有限公司 | 一种基于舆情分析的数据分析方法、装置和系统 |
WO2021142417A2 (en) * | 2020-01-10 | 2021-07-15 | Bisquertt Alejandro | Systems for detecting alzheimer's disease |
-
2021
- 2021-12-02 CN CN202111454837.XA patent/CN113869803A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101281521A (zh) * | 2007-04-05 | 2008-10-08 | 中国科学院自动化研究所 | 一种基于多分类器融合的敏感网页过滤方法及系统 |
CN110458399A (zh) * | 2019-07-05 | 2019-11-15 | 深圳壹账通智能科技有限公司 | 风险信息生成方法、装置、计算机设备和存储介质 |
WO2021142417A2 (en) * | 2020-01-10 | 2021-07-15 | Bisquertt Alejandro | Systems for detecting alzheimer's disease |
CN111581945A (zh) * | 2020-04-09 | 2020-08-25 | 上海淇毓信息科技有限公司 | 一种基于舆情分析的数据分析方法、装置和系统 |
Non-Patent Citations (1)
Title |
---|
吴天水等: "基于网络分析与D-S证据理论的信息安全风险评估", 《计算机与数字工程》 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115033918A (zh) * | 2022-06-09 | 2022-09-09 | 易顺云(深圳)科技有限公司 | 企业一体化信息管理方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11182564B2 (en) | Text recommendation method and apparatus, and electronic device | |
US11403680B2 (en) | Method, apparatus for evaluating review, device and storage medium | |
US20240078386A1 (en) | Methods and systems for language-agnostic machine learning in natural language processing using feature extraction | |
CN109145216B (zh) | 网络舆情监控方法、装置及存储介质 | |
CN107491534B (zh) | 信息处理方法和装置 | |
CN110175325B (zh) | 基于词向量和句法特征的评论分析方法及可视化交互界面 | |
US8374983B1 (en) | Distributed object classification | |
CN107256267A (zh) | 查询方法和装置 | |
CN109508373B (zh) | 企业舆情指数的计算方法、设备及计算机可读存储介质 | |
US20200192921A1 (en) | Suggesting text in an electronic document | |
US11651015B2 (en) | Method and apparatus for presenting information | |
CN113688310B (zh) | 一种内容推荐方法、装置、设备及存储介质 | |
CN112926308B (zh) | 匹配正文的方法、装置、设备、存储介质以及程序产品 | |
CN111930792B (zh) | 数据资源的标注方法、装置、存储介质及电子设备 | |
US11182540B2 (en) | Passively suggesting text in an electronic document | |
US20190311415A1 (en) | Adaptive Multi-Perceptual Similarity Detection and Resolution | |
CN112765974B (zh) | 一种业务辅助方法、电子设备及可读存储介质 | |
US20220121668A1 (en) | Method for recommending document, electronic device and storage medium | |
CN107291774B (zh) | 错误样本识别方法和装置 | |
CN112307336A (zh) | 热点资讯挖掘与预览方法、装置、计算机设备及存储介质 | |
CN111737961A (zh) | 一种故事生成的方法、装置、计算机设备和介质 | |
US20150046270A1 (en) | System and Method of Using Artificial Intelligence to Valuate Advertisements Embedded Within Images | |
CN113869803A (zh) | 企业敏感信息风险评估方法、系统和存储介质 | |
CN111460224B (zh) | 评论数据的质量标注方法、装置、设备及存储介质 | |
CN115248890A (zh) | 用户兴趣画像的生成方法、装置、电子设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |