CN116451144A - 一种风险预测方法及装置、计算机可读存储介质 - Google Patents
一种风险预测方法及装置、计算机可读存储介质 Download PDFInfo
- Publication number
- CN116451144A CN116451144A CN202210011361.0A CN202210011361A CN116451144A CN 116451144 A CN116451144 A CN 116451144A CN 202210011361 A CN202210011361 A CN 202210011361A CN 116451144 A CN116451144 A CN 116451144A
- Authority
- CN
- China
- Prior art keywords
- prediction
- data
- preset
- probability
- risk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 60
- 238000003860 storage Methods 0.000 title claims abstract description 12
- 238000012545 processing Methods 0.000 claims abstract description 41
- 238000004458 analytical method Methods 0.000 claims abstract description 13
- 230000002159 abnormal effect Effects 0.000 claims description 117
- 238000012549 training Methods 0.000 claims description 32
- 238000007781 pre-processing Methods 0.000 claims description 12
- 238000007405 data analysis Methods 0.000 claims description 11
- 238000011160 research Methods 0.000 claims description 10
- 238000000227 grinding Methods 0.000 claims description 5
- 238000010586 diagram Methods 0.000 description 12
- 230000005856 abnormality Effects 0.000 description 9
- 238000012360 testing method Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 4
- 239000004973 liquid crystal related substance Substances 0.000 description 4
- NAWXUBYGYWOOIX-SFHVURJKSA-N (2s)-2-[[4-[2-(2,4-diaminoquinazolin-6-yl)ethyl]benzoyl]amino]-4-methylidenepentanedioic acid Chemical compound C1=CC2=NC(N)=NC(N)=C2C=C1CCC1=CC=C(C(=O)N[C@@H](CC(=C)C(O)=O)C(O)=O)C=C1 NAWXUBYGYWOOIX-SFHVURJKSA-N 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 206010000117 Abnormal behaviour Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 208000006011 Stroke Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Data Mining & Analysis (AREA)
- Operations Research (AREA)
- Mathematical Optimization (AREA)
- Tourism & Hospitality (AREA)
- Mathematical Physics (AREA)
- General Business, Economics & Management (AREA)
- Quality & Reliability (AREA)
- Development Economics (AREA)
- Pure & Applied Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Marketing (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Life Sciences & Earth Sciences (AREA)
- Algebra (AREA)
- Educational Administration (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供了一种风险预测方法及装置、计算机可读存储介质,该方法包括:获得登录数据;基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率;基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度;基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度;基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度。上述方案,通过多个预设概率模型对登录数据进行预测,得到预测概率;通过预设第一风险预测准则和预设第二风险预测准则,确定最终风险程度,提高了风险预测的准确度。
Description
技术领域
本发明涉及数据信息处理领域,尤其涉及一种风险预测方法及装置、计算机可读存储介质。
背景技术
随着计算机互联网的快速发展,对于用户的登录信息的异常登录风险预测显得尤为重要。现有的风险预测方法是直接采用专家特征的方法,根据用户自定义的范围,局限于某些限定的异常登录形式。对于潜在的异常登录行为或者未预料到的行为模式,后续的分析成本较高,难以对其他的一些异常行为进行捕捉。目前涉及朴素贝叶斯的场景,由于不同朴素贝叶斯模型差异过大,使得数据在处理过程中会丢失一部分特征信息,导致最后的预测产生错误,准确度低。
发明内容
本发明实施例提供一种风险预测方法及装置、计算机可读存储介质,能够解决预测准确度低的问题。
本发明的技术方案是这样实现的:
本发明实施例提供了一种风险预测方法,所述方法包括:
获得登录数据;
基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率;
基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度;
基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度;
基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度。
上述方案中,所述多个预设概率预测模型包括预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型;所述登录数据包括伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据;
所述基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率,包括:
基于所述预设伯努利预测模型,对所述伯努利型数据进行预测,得到所述伯努利型数据的预测概率;
基于所述预设高斯预测模型,对所述高斯型数据进行预测,得到所述高斯型数据的预测概率;
基于所述预设类贝叶斯预测模型,对所述类贝叶斯型数据进行预测,得到所述类贝叶斯型数据的预测概率;
基于所述预设多项式预测模型,对所述多项式型数据进行预测,得到所述多项式型数据的预测概率。
上述方案中,所述基于多个预设概率预测模型,对登录数据进行预测,得到多个预设概率预测模型下的预测概率之前,所述方法还包括:
获取历史初始登录数据;
基于所述历史初始登录数据,进行数据类型分类处理和异常研判分类处理,得到历史登录数据;其中,所述历史登录数据包括历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据;
基于所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据,对初始伯努利预测模型、初始高斯预测模型、初始类贝叶斯预测模型和初始多项式预测模型进行训练,确定预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型;
将所述预设伯努利预测模型、所述预设高斯预测模型、所述预设类贝叶斯预测模型和所述预设多项式预测模型作为所述多个预设概率预测模型。
上述方案中,所述基于所述历史初始登录数据,进行数据类型分类处理和异常研判分类处理,得到历史登录数据,包括:
基于所述历史初始登录数据,进行数据类型分类处理,得到历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据;
基于所述历史初始登录数据,进行异常研判分类处理,得到所述历史初始登录数据的分类结果;
基于所述历史初始登录数据的分类结果,通过与所述历史初始伯努利型数据、所述历史初始高斯型数据、所述历史初始类贝叶斯型数据和所述历史初始多项式型数据进行匹配,得到历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据;
将所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据作为所述历史登录数据。
上述方案中,所述基于所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据,对初始伯努利预测模型、初始高斯预测模型、初始类贝叶斯预测模型和初始多项式预测模型进行训练,确定预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型,包括:
基于所述历史伯努利型数据,对所述初始伯努利预测模型进行训练,确定所述预设伯努利预测模型;
基于所述历史高斯型数据,对所述初始高斯预测模型进行训练,确定所述预设高斯预测模型;
基于所述历史类贝叶斯型数据,对所述初始类贝叶斯预测模型进行训练,确定所述预设类贝叶斯预测模型;
基于所述历史多项式型数据,对所述初始多项式预测模型进行训练,确定所述预设多项式预测模型。
上述方案中,所述基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度,包括:
获取所述多个预设概率预测模型各自对应的风险概率、后验概率;
基于所述预设第一风险预测准则,将所述多个预设概率预测模型各自对应的风险概率、后验概率,进行乘运算与和运算,得到所述多个预设概率预测模型各自对应的第一异常值;
基于所述预设第一风险预测准则,将所述多个预设概率预测模型下的预测概率,分别与所述第一异常值进行商运算,得到所述多个预设概率预测模型各自对应的异常值;
基于所述异常值,通过数据分析,确定所述第一风险程度。
上述方案中,所述多个预设概率预测模型下的预测概率包括伯努利型数据的预测概率、高斯型数据的预测概率、类贝叶斯型数据的预测概率和多项式型数据的预测概率;
所述将所述多个预设概率预测模型下的预测概率,分别与所述第一异常值进行商运算,得到所述多个预设概率预测模型各自对应的异常值,包括:
基于所述伯努利型数据的预测概率,与所述第一异常值进行商运算,确定伯努利型数据的异常值;
基于所述高斯型数据的预测概率,与所述第一异常值进行商运算,确定高斯型数据的异常值;
基于所述类贝叶斯型数据的预测概率,与所述第一异常值进行商运算,确定类贝叶斯型数据的异常值;
基于所述多项式型数据的预测概率,与所述第一异常值进行商运算,确定多项式型数据的异常值。
上述方案中,所述基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度,包括:
获取所述多个预设概率预测模型各自对应的综合概率、后验概率;
基于所述预设第二风险预测准则,将所述多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到所述多个预设概率预测模型各自对应的第二异常值
基于所述预设第二风险预测准则,对所述多个预设概率预测模型的预测概率,进行乘运算,得到第三异常值;
基于所述预设第二风险预测准则,基于所述第三异常值和所述第二异常值,进行商运算,得到综合异常值;
基于所述综合异常值,进行数据分析,确定所述第二风险程度。
上述方案中,所述基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度,包括:
若所述第一风险程度高于所述第二风险程度,将所述第一风险程度作为所述最终风险程度;
若所述第一风险程度小于所述第二风险程度,将所述第二风险程度作为所述最终风险程度。
上述方案中,所述获得登录数据,包括:
获取初始登录数据;
基于所述初始登录数据,进行数据预处理,获得所述伯努利型数据、所述高斯型数据、所述类贝叶斯型数据和所述多项式型数据;
将所述伯努利型数据、所述高斯型数据、所述类贝叶斯型数据和所述多项式型数据作为所述登录数据。
本发明实施例提供了一种风险预测装置,其特征在于,包括获取单元和确定单元;其中,
所述获取单元,用于获得登录数据;基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率;
所述确定单元,用于基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度;基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度;基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度。
本发明实施例提供了一种风险预测装置,其特征在于,包括:
存储器,用于存储可执行指令;
处理器,用于执行所述存储器中存储的可执行指令,当所述可执行指令被执行时,所述处理器执行所述的风险预测方法。
本发明实施例提供了一种计算机可读存储介质,其特征在于,所述存储介质存储有可执行指令,当所述可执行指令被执行被一个或多个处理器执行时,所述处理器执行所述的风险预测方法。
本发明实施例提供了一种风险预测方法及装置、计算机可读存储介质,该方法包括:获得登录数据;基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率;基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度;基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度;基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度。采用上述方案,通过多个预设概率模型对登录数据进行预测,得到多个预设概率预测模型的预测概率;通过预设第一风险预测准则和预设第二风险预测准则,确定最终风险程度,提高了风险预测的准确度。
附图说明
图1为本发明实施例提供的一种风险预测方法的一个可选的流程示意图一;
图2为本发明实施例提供的一种风险预测方法的一个可选的流程示意图二;
图3为本发明实施例提供的一种风险预测方法的一个可选的流程示意图三;
图4为本发明实施例提供的一种风险预测方法的一个可选的流程示意图四;
图5为本发明实施例提供的一种风险预测方法的一个可选的流程示意图五;
图6为本发明实施例提供的一种风险预测装置的结构示意图一;
图7为本发明实施例提供的一种风险预测装置的结构示意图一。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部实施例。基于本发明的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本发明保护范围。
为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。图1是本发明实施例提供的一种风险预测方法的一个可选的流程示意图一,将结合图1示出的步骤进行说明。
S101、获得登录数据。
在本发明的一些实施例中,登录数据包括伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据。
在本发明的一些实施例中,终端可以获取初始登录数据,对初始数据进行数据预处理,获得伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据,将伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据作为登录数据。
在本发明的一些实施例中,S101可以通过S1011、S1012和S1013实现,如下:
S1011、获取初始登录数据。
在本发明的一些实施例中,初始登录数据包括ip登录异常、登录时间、登录区域、登录账号类型、登录主机数量和时间段内主机登录的次数。
在本发明的一些实施例中,终端可以通过日志文件获取初始登录数据。
S1012、基于初始登录数据,进行数据预处理,获得伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据。
在本发明的一些实施例中,数据预处理是指对初始登录数据进行分类处理。
在本发明的一些实施例中,终端可以对初始登录数据进行分类处理,得到伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据。
示例性的,初始登录数据包括ip登录异常、登录时间、登录区域、登录账号类型、登录主机数量和时间段内主机登录的次数,对其进行分类处理,得到伯努利型数据:ip登录异常;高斯型数据:登录时间;类贝叶斯型数据:登录区域和登录账号类型;多项式型数据:登录主机数量和时间段内主机登录的次数。
示例性的,登录区域可以表示为:华东:0,华北:1,西南:2,西北:3,东北:4,华中:5,华南:6;登录账号类型可以表示为:基础:0,高级:1,企业:2,本发明不限于此。
S1013、将伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据作为登录数据。
在本发明的一些实施例中,终端可以将伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据作为登录数据。
可以理解的是,在本发明的一些实施例中,终端可以获取初始登录数据,对初始数据进行数据预处理,获得伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据,将伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据作为登录数据,为后续进行预测提供数据。
S102、基于多个预设概率预测模型,对登录数据分别进行预测,得到多个预设概率预测模型下的预测概率。
在本发明的一些实施例中,多个预设概率预测模型包括预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型;多个预设概率预测模型的预测概率包括伯努利型数据的预测概率、高斯型数据的预测概率、类贝叶斯型数据的预测概率和多项式型数据的预测概率。
在本发明的一些实施例中,终端可以通过预设伯努利预测模型,对伯努利型数据进行预测,得到伯努利型数据的预测概率;通过预设高斯预测模型,对高斯型数据进行预测,得到高斯型数据的预测概率;通过预设类贝叶斯预测模型,对类贝叶斯型数据进行预测,得到类贝叶斯型数据的预测概率;通过预设多项式预测模型,对多项式型数据进行预测,得到多项式型数据的预测概率。
示例性的,多个预设概率预测模型的核心算法可以通过以下公式(1)得到。
其中,p(y|x1,x2,...,xn)是特征向量为[x1,x2,...,xn]则在特征向量下y类的条件概率;p(y)是y类的先验概率;p(x1,x2,...,xn|y)是后验概率;p(x1,x2,...,xn)是全概率。
在工程上每个特征是独立的,因此p(x1,x2,...,xn|y)可以改为公式(2)。
p(xi|y,x1,x2,...,xi-1,xi+1,...,xn)=p(xi|y) (2)
其中,p(xi|y)是后验概率;p(xi|y,x1,x2,...,xi-1,xi+1,...,xn)也是后验概率。
因此,公式(1)可以改为公式(3)。
其中,p(y|x1,x2,...,xn)是特征向量为[x1,x2,...,xn]则在特征向量下y类的条件概率;p(y)是y类的先验概率;p(xi|y)是后验概率;p(x1,x2,...,xn)是全概率。
由于p(x1,x2,...,xn)每个类预测时都会给出,因此可以通过公式(4)对数据进行预测分类,得到类别的概率:
其中,p(xi|y)是后验概率;p(y)是y类的先验概率;是类别/>的概率。
多个预设预测概率模型的区别在于后验概率的计算方式不同。
在本发明的一些实施例中,S102可以通过S1021、S1022、S1023和S1024实现,如下:
S1021、基于预设伯努利预测模型,对伯努利型数据进行预测,得到伯努利型数据的预测概率。
在本发明的一些实施例中,终端可以通过预设伯努利预测模型,对伯努利型数据进行预测,得到伯努利型数据的预测概率。
示例性的,预设伯努利预测模型的后验概率可以通过以下公式(5)得到。
p(xi|y)=p(i|y)xi+(1-p(i|y))(1-xi) (5)
其中,p(xi|y)是后验概率;p(i|y)是条件概率;xi遵循的是0-1分布,取值不是0就是1。
示例性的,表1是多个预设预测概率模型的先验概率;表2是预设伯努利预测模型条件概率。
表1预设预测概率模型的先验概率
状态 | 正常 | 异常 |
先验概率 | 0.725 | 0.275 |
从表1可以看出,预设预设预测概率模型的先验概率分为正常和异常;正常的概率为0.725,异常的概率为0.275。
表2预设伯努利预测模型条件概率
从表2可以看出,预设伯努利预测模型条件概率的对象为IP异常,也分为正常和异常;正常的概率为0.323,异常的概率为0.923。
S1022、基于预设高斯预测模型,对高斯型数据进行预测,得到高斯型数据的预测概率。
在本发明的一些实施例中,终端可以通过预设高斯预测模型,对高斯型数据进行预测,得到高斯型数据的预测概率。
示例性的,预设高斯预测模型的后验概率可以通过以下公式(6)得到。
其中,p(xi|y)是后验概率;σy和uy是通过最大似然估计建立的方差和均值。
示例性的,表3是预设高斯预测模型条件概率。
表3预设高斯预测模型条件概率
从表3可以看出,预设高斯预测模型条件概率的对象有方差和均值,也分为正常和异常;方差正常的概率为27.579,方差异常的概率为39.785;均值正常的概率为11.279,均值异常的概率为15.818。
S1023、基于预设类贝叶斯预测模型,对类贝叶斯型数据进行预测,得到类贝叶斯型数据的预测概率。
在本发明的一些实施例中,终端可以通过预设类贝叶斯预测模型,对类贝叶斯型数据进行预测,得到类贝叶斯型数据的预测概率。
示例性的,预设类贝叶斯预测模型的后验概率可以通过以下公式(7)得到。
其中,c表示类别,a是平滑参数,nTic表示c类中特征i类别T出现的总次数,Nc表示c类的样本个数和Ni表示特征i的可用个数。
示例性的,表4是预设类贝叶斯预测模型条件概率。
表4预设类贝叶斯预测模型条件概率
从表4可以看出,预设类贝叶斯模型条件概率的对象有地区和版本,也分为正常和异常;地区分为华东、华北、西南、西北、东北、华中和华南;版本分为基础版、高级版和企业版。华东正常的概率为0.194,异常的概率为0.167;华北正常的概率为0.139,异常的概率为0.111;西南正常的概率为0.111,异常的概率为0.167;西北正常的概率为0.167,异常的概率为0.167;东北正常的概率为0.111,异常的概率为0.111;华中正常的概率为0.083,异常的概率为0.111;华南正常的概率为0.194,异常的概率为0.167;基础版正常的概率为0.4375,异常的概率为0.143;高级版正常的概率为0.3125,异常的概率为0.429;企业版正常的概率为0.250,异常的概率为0.429。
S1024、基于预设多项式预测模型,对多项式型数据进行预测,得到多项式型数据的预测概率。
在本发明的一些实施例中,终端可以通过预设多项式预测模型,对多项式型数据进行预测,得到多项式型数据的预测概率。
示例性的,预设多项式预测模型的后验概率可以通过以下公式(8)得到。
其中,Ny表示该类y下各个特征出现频率的总个数综合;nyi表示该类下i特征出现频率的总个数;a是拉普拉斯平滑,假定为1,N表示该类下出现不同特征的个数;θyi表示第i个特征的p(xi|y);类下不同特征值出现的类条件概率用θy=(θy1,θy2,...,θyn),n表示第n个条件。
示例性的,表5是预设多项式预测模型条件概率。
表5预设多项式预测模型条件概率
从表5可以看出,预设多项式预测模型条件概率的对象为登录主机数量和时间段内主机登录的次数,登录主机数量正常的概率为0.472,异常的概率为0.314;时间段内主机登录的次数正常的概率为0.528,异常的概率为0.686。
可以理解的是,在本发明的一些实施例中,终端可以通过多个不同的预设概率预测模型对不同类型数据进行预测,得到不同类型数据的预测概率,便于后续计算不同类型数据的异常值,采用多种对应的模型处理对应的数据,适配性更强,可靠性更高。
S103、基于多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度。
在本发明的一些实施例中,终端可以获取多个预设概率预测模型各自对应的风险概率、后验概率;通过预设第一风险预测准则,将多个预设概率预测模型各自对应的风险概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第一异常值;将多个预设概率预测模型下的预测概率,分别与第一异常值进行商运算,得到多个预设概率预测模型各自对应的异常值;通过数据分析,确定所述第一风险程度。
示例性的,预设第一风险预测准则可以通过以下公式(9)得到。
其中,p(y1)是有风险预测概率;p(xi|yj)是后验概率。
在本发明的一些实施例中,S103可以通过S1031、S1032、S1033和S1034实现,如下:
S1031、获取多个预设概率预测模型各自对应的风险概率、后验概率。
在本发明的一些实施例中,终端可以获取多个预设概率预测模型各自对应的风险概率、后验概率。
S1032、基于预设第一风险预测准则,将多个预设概率预测模型各自对应的风险概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第一异常值。
在本发明的一些实施例中,终端可以根据预设第一风险预测准则,将多个预设概率预测模型各自对应的风险概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第一异常值。
S1033、基于预设第一风险预测准则,将多个预设概率预测模型下的预测概率,分别与第一异常值进行商运算,得到多个预设概率预测模型各自对应的异常值。
在本发明的一些实施例中,终端可以通过伯努利型数据的预测概率,与第一异常值进行商运算,确定伯努利型数据的异常值;通过高斯型数据的预测概率,与第一异常值进行商运算,确定高斯型数据的异常值;通过类贝叶斯型数据的预测概率,与第一异常值进行商运算,确定类贝叶斯型数据的异常值;通过多项式型数据的预测概率,与第一异常值进行商运算,确定多项式型数据的异常值。
在本发明的一些实施例中,终端可以通过公式(9)对伯努利型数据的预测概率与第一异常值,进行商运算,得到伯努利型数据的异常值;可以通过公式(9)对高斯型数据的预测概率与第一异常值,进行商运算,得到高斯型数据的异常值;可以通过公式(9)对类贝叶斯型数据的预测概率与第一异常值,进行商运算,得到类贝叶斯型数据的异常值;可以通过公式(9)对多项式型数据的预测概率与第一异常值,进行商运算,得到多项式型数据的异常值。
S1034、基于异常值,通过数据分析,确定第一风险程度。
在本发明的一些实施例中,终端可以对伯努利型数据的异常值、高斯型数据的异常值、类贝叶斯型数据的异常值和多项式型数据的异常值,进行数据分析,确定第一风险程度。
示例性的,如表6所示,包括不同风险异常次数出现,从而确定第一风险程度。
表6不同风险异常次数出现第一风险程度
四种类型的异常次数 | 第一风险程度 |
0 | 无风险 |
1 | 低风险 |
2 | 中风险 |
3 | 高风险 |
4 | 高风险 |
从表6可以看出,当四种预设概率预测模型的预测结果异常次数为0,第一风险程度为无风险;当四种预设概率预测模型的预测结果异常次数为1,第一风险程度为低风险;当四种预设概率预测模型的预测结果异常次数为2,第一风险程度为中风险;当四种预设概率预测模型的预测结果异常次数为3,第一风险程度为高风险;当四种预设概率预测模型的预测结果异常次数为4,第一风险程度为高风险。
可以理解的是,在本发明的一些实施例中,终端可以通过不同类型数据的预测概率,利用预设第一风险预测准则进行运算,分别得到不同类型数据各自对应的异常值;通过对异常值进行分析,得到第一风险程度,为后续确定最终风险程度做铺垫。
S104、基于多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度。
在本发明的一些实施例中,终端可以通过获取多个预设概率预测模型各自对应的综合概率、后验概率;基于预设第二风险预测准则,将多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第二异常值;对多个预设概率预测模型下的预测概率进行乘运算,得到第三异常值;对第三异常值和第二异常值进行商运算,得到综合异常值;基于综合异常值,进行数据分析,确定第二风险程度。
示例性的,预设第二风险预测准则可以通过以下公式(10)得到。
其中,x∈(a,b,c,d),分别对应于预设伯努利预测模型,预设高斯预测模型,预设多项式预测模型和预设类贝叶斯预测模型,p(Yk)是对应k类的综合概率。
在本发明的一些实施例中,S104可以通过S1041、S1042、S1043、S1044和S1045实现,如下:
S1041、获取多个预设概率预测模型各自对应的综合概率、后验概率。
在本发明的一些实施例中,终端获取多个预设概率预测模型各自对应的综合概率、后验概率。
S1042、基于预设第二风险预测准则,将多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第二异常值。
在本发明的一些实施例中,终端可以通过预设第二风险预测准则,将多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第二异常值。
S1043、基于预设第二风险预测准则,对多个预设概率预测模型下的预测概率进行乘运算,得到第三异常值。
在本发明的一些实施例中,终端可以通过预设第二风险预测准则,对多个预设概率预测模型下的预测概率进行乘运算,得到第三异常值。
示例性的,终端可以通过公式(10),将多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第二异常值;对多个预设概率预测模型下的预测概率进行乘运算,得到第三异常值;对第三异常值和第二异常值进行商运算,得到综合异常值。
S1044、基于预设第二风险预测准则,对第三异常值和第二异常值进行商运算,得到综合异常值。
在本发明的一些实施例中,终端可以通过预设第二风险预测准则,对第三异常值和第二异常值进行商运算,得到综合异常值。
示例性的,终端可以通过公式(10),将多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到多个预设概率预测模型各自对应的第二异常值;对多个预设概率预测模型下的预测概率进行乘运算,得到第三异常值;对第三异常值和第二异常值进行商运算,得到综合异常值。
S1045、基于综合异常值,进行数据分析,确定第二风险程度。
在本发明的一些实施例中,终端可以通过综合异常值的大小,判断其对应的风险程度,从而确定第二风险程度。
示例性的,表7是根据综合异常值确定第二风险程度。
综合异常值 | 第二风险程度 |
<=50% | 无风险 |
50%-70% | 低风险 |
70%-85% | 中风险 |
85%-100% | 高风险 |
从表7可以看出,当综合异常值小于50%或者等于50%,第二风险程度为无风险;当综合异常值大于50%且小于70%,或者综合异常值等于70%,第二风险程度为低风险;当综合异常值大于70%且小于85%,或者综合异常值等于85%,第二风险程度为中风险;当综合异常值大于85%且小于100%,或者综合异常值等于100%,第二风险程度为高风险。
可以理解的是,在本发明的一些实施例中,终端可以通过不同类型数据的预测概率,利用预设第二风险预测准则进行运算,得到综合异常值;通过对综合异常值进行分析,得到第二风险程度,为后续确定最终风险程度做铺垫。
S105、基于第一风险程度和第二风险程度,进行综合分析处理,确定最终风险程度。
在本发明的一些实施例中,终端可以将第一风险程度和第二风险程度进行对比;如果第一风险程度高于第二风险程度,将第一风险程度作为最终风险程度;如果第一风险程度小于第二风险程度,将第二风险程度作为最终风险程度。
可以理解的是,在本发明的一些实施例中,终端可以通过获得登录数据;通过多个预设概率模型对登录数据进行预测,得到多个预设概率预测模型的预测概率;通过预设第一风险预测准则和预设第二风险预测准则,确定最终风险程度,提高了风险预测的准确度。
在本发明的一些实施例中,S105可以通过S1051和S1052实现,如下:
S1051、若第一风险程度高于第二风险程度,将第一风险程度作为最终风险程度。
在本发明的一些实施例中,终端可以将第一风险程度和第二风险程度进行对比,如果第一风险程度高于第二风险程度,将第一风险程度作为最终风险程度。
S1052、若第一风险程度小于第二风险程度,将第二风险程度作为最终风险程度。
在本发明的一些实施例中,终端可以将第一风险程度和第二风险程度进行对比,如果第一风险程度小于第二风险程度,将第二风险程度作为最终风险程度。
示例性的,表8是测试样例的预测结果。
表8,测试样例预测结果
根据表1-6中的先验概率和条件概率,通过公式(9)和公式(10)计算得到表8中的数据。从表8中可以看出,模型一预测为通过预设第一风险预测准则进行预测,模型二预测为通过预设第二风险预测准则进行预测。测试样例的数据包括IP、登录时间、登录区域、登录类型、登录主机和登录次数。如样例一,根据预测,模型一的方式有两个单独的模型预测是异常,所以是中凤险。但综合预测是无风险,本着不漏掉一个重要风险的原则,会给用户提示中风险。如样例二,模型一预测是低风险,而综合预测是高风险,将会给用户提示高风险。利用两者模型互相验证的方式,有效果地避免了模型因为某些数据偏差,导致局部预测失衡(模型一),或者综合预测偏颇(模型二)。这种采用局部和全局综合考虑地方式有效地避免了风险的漏报和报告等级的偏差。
可以理解的是,在本发明的一些实施例中,终端可以通过基于第一风险程度和第二风险程度,进行综合分析处理,确定最终风险程度,可以避免使用单一模型造成误差,提高了风险预测的准确度。
在本发明的一些实施例中,图2是本发明实施例提供的一种风险预测方法的一个可选的流程示意图二,在S102之前还执行S106-S109,如下:
S106、获取历史初始登录数据。
在本发明的一些实施例中,终端可以通过日志文件获取历史初始登录数据。
S107、基于历史初始登录数据,进行数据类型分类处理和异常研判分类处理,得到历史登录数据。
在本发明的一些实施例中,历史登录数据包括历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据。
在本发明的一些实施例中,终端可以通过历史初始登录数据,进行数据类型分类处理,得到历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据;通过历史初始登录数据,进行异常研判分类处理,得到历史初始登录数据的分类结果;通过历史初始登录数据的分类结果,对历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据进行匹配,得到历史登录数据。
在本发明的一些实施例中,S107可以通过S1071、S1072、S1073和S1074实现,如下:
S1071、基于历史初始登录数据,进行数据类型分类处理,得到历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据。
在本发明的一些实施例中,终端可以对历史初始登录数据,进行数据类型分类处理,得到历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据。
S1072、基于历史初始登录数据,进行异常研判分类处理,得到历史初始登录数据的分类结果。
在本发明的一些实施例中,终端可以对历史初始登录数据,进行异常研判分类处理,得到历史初始登录数据的分类结果。
S1073、基于历史初始登录数据的分类结果,通过历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据进行匹配,得到历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据。
在本发明的一些实施例中,终端可以通过历史初始登录数据的分类结果,对历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据进行匹配,得到历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据。
S1074、将历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据作为历史登录数据。
在本发明的一些实施例中,终端可以将历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据作为历史登录数据。
可以理解的是,在本发明的一些实施例中,终端可以对历史初始登录数据,进行数据类型分类处理,得到历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据;对历史初始登录数据,进行异常研判分类处理,得到历史初始登录数据的分类结果;对历史初始登录数据的分类结果,通过历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据进行匹配,得到历史登录数据,为后续进行模型训练提供样本数据。
S108、基于历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据,对初始伯努利预测模型、初始高斯预测模型、初始类贝叶斯预测模型和初始多项式预测模型进行训练,确定预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型。
在本发明的一些实施例中,终端可以通过历史伯努利型数据,对初始伯努利预测模型进行训练,确定预设伯努利预测模型;通过历史高斯型数据,对初始高斯预测模型进行训练,确定预设高斯预测模型;通过历史类贝叶斯型数据,对初始类贝叶斯预测模型进行训练,确定预设类贝叶斯预测模型;通过历史多项式型数据,对初始多项式预测模型进行训练,确定预设多项式预测模型。
在本发明的一些实施例中,S108可以通过S1081、S1082、S1083和S1084实现,如下:
S1081、基于历史伯努利型数据,对初始伯努利预测模型进行训练,确定预设伯努利预测模型。
在本发明的一些实施例中,终端可以通过初始伯努利预测模型,利用历史伯努利型数据对其进行训练,直到达到预期指标,停止训练,保存模型,得到预设伯努利预测模型。
S1082、基于历史高斯型数据,对初始高斯预测模型进行训练,确定预设高斯预测模型。
在本发明的一些实施例中,终端可以通过初始高斯预测模型,利用历史高斯型数据对其进行训练,直到达到预期指标,停止训练,保存模型,得到预设高斯预测模型。
S1083、基于历史类贝叶斯型数据,对初始类贝叶斯预测模型进行训练,确定预设类贝叶斯预测模型。
在本发明的一些实施例中,终端可以通过初始类贝叶斯预测模型,利用历史类贝叶斯型数据对其进行训练,直到达到预期指标,停止训练,保存模型,得到预设类贝叶斯预测模型。
S1084、基于历史多项式型数据,对初始多项式预测模型进行训练,确定预设多项式预测模型。
在本发明的一些实施例中,终端可以通过初始多项式预测模型,利用历史多项式型数据对其进行训练,直到达到预期指标,停止训练,保存模型,得到预设多项式预测模型。
可以理解的是,在本发明的一些实施例中,终端可以通过历史登录数据对多个不同初始预测模型进行训练,确定多个预设概率预测模型,为后续进行不同类型数据的概率预测提供依据。
S109、将预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型作为多个预设概率预测模型。
在本发明的一些实施例中,终端可以将预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型作为多个预设概率预测模型。
可以理解的是,在本发明的一些实施例中,终端可以通过获取历史初始登录数据;通过历史初始登录数据,进行数据类型分类处理和异常研判分类处理,得到历史登录数据;通过历史登录数据对多个不同初始预测模型进行训练,确定多个预设概率预测模型,为后续进行不同类型数据的概率预测提供依据。
下面,将说明本发明实施例在一个实际的应用场景中的示例性应用。
在本发明的一些实施例中,图3是本发明实施例提供的一种风险预测方法的一个可选的流程示意图三,如图3所示,分为系统初始化和运行系统两部分,系统初始化阶段:终端首先对加载数据(相当于历史登录数据)进行训练,保存模型(相当于多个预设概率预测模型)。运行系统阶段:加载不同模型(相当于多个预设概率预测模型)对测试数据(相当于登录数据)进行预测,最后进入分类预测模块(相当于预设第一风险准则),综合概率模块(相当于预设第二风险准则)进行预测,确定最终风险程度,抛出异常。
在本发明的一些实施例中,图4是本发明实施例提供的一种风险预测方法的一个可选的流程示意图四,图3中系统初始化部分可以通过图4所示的流程步骤实现。图3中的加载数据包括了图4中开始测试数据、合并预处理数据后输出的数据;图3中的训练模型包括了图4中初始伯努利预测模型、初始高斯预测模型、初始多项式预测模型和初始类贝叶斯预测模型进行训练的过程。如图4所示,终端开始测试数据;将云客户端登录数据(相当于历史初始登录数据)通过专家分类标记(相当于异常研判分类处理)和数据类型分类(相当于数据类型分类处理)进行数据预处理;将数据预处理后的数据进行合并,输入至初始伯努利预测模型、初始高斯预测模型、初始多项式预测模型和初始类贝叶斯预测模型中进行训练;将训练好的模型,进行保存,结束模型训练。
在本发明的一些实施例中,图5是本发明实施例提供的一种风险预测方法的一个可选的流程示意图五,图3中运行系统部分可以通过图5所示的流程步骤实现。图3中的加载模型包括了图5中模型数据、预设伯努利预测模型、预设高斯预测模型、预设多项式预测模型和预设类贝叶斯预测模型。如图5所示,终端开始测试数据;将测试数据(相当于登录数据)进行数据预处理;将数据预处理后的数据和模型数据输入至预设伯努利预测模型、预设高斯预测模型、预设多项式预测模型和预设类贝叶斯预测模型进行预测;将预测结果进行综合概率分析并进行分类,得到最终风险程度,结束预测。
可以理解的是,在本发明的一些实施例中,终端可以直接对登录数据进行分类并进行训练,保留了登录数据的全部特征,并运用多个不同预设概率预测模型对相应类型的数据进行预测,从而提高了准确度。
基于上述实施例的风险预测方法,本发明实施例还提供了一种风险预测装置,如图6所述,图6为本发明实施例提供的一种风险预测装置的结构示意图一,该装置包括:获取单元601和确定单元602;其中,
所述获取单元601,用于获得登录数据;基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率;
所述确定单元602,用于基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度;基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度;基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度。
在本发明的一些实施例中,所述多个预设概率预测模型包括预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型;所述登录数据包括伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据;所述获取单元601,用于基于所述预设伯努利预测模型,对所述伯努利型数据进行预测,得到所述伯努利型数据的预测概率;基于所述预设高斯预测模型,对所述高斯型数据进行预测,得到所述高斯型数据的预测概率;基于所述预设类贝叶斯预测模型,对所述类贝叶斯型数据进行预测,得到所述类贝叶斯型数据的预测概率;基于所述预设多项式预测模型,对所述多项式型数据进行预测,得到所述多项式型数据的预测概率。
在本发明的一些实施例中,所述获取单元601,用于获取历史初始登录数据;基于所述历史初始登录数据,进行数据类型分类处理和异常研判分类处理,得到历史登录数据;其中,所述历史登录数据包括历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据;
所述确定单元602,用于基于所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据,对初始伯努利预测模型、初始高斯预测模型、初始类贝叶斯预测模型和初始多项式预测模型进行训练,确定预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型;将所述预设伯努利预测模型、所述预设高斯预测模型、所述预设类贝叶斯预测模型和所述预设多项式预测模型作为所述多个预设概率预测模型。
在本发明的一些实施例中,所述获取单元601,用于基于所述历史初始登录数据,进行数据类型分类处理,得到历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据;基于所述历史初始登录数据,进行异常研判分类处理,得到所述历史初始登录数据的分类结果;基于所述历史初始登录数据的分类结果,通过与所述历史初始伯努利型数据、所述历史初始高斯型数据、所述历史初始类贝叶斯型数据和所述历史初始多项式型数据进行匹配,得到历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据;将所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据作为所述历史登录数据。
在本发明的一些实施例中,所述确定单元602,用于基于所述历史伯努利型数据,对所述初始伯努利预测模型进行训练,确定所述预设伯努利预测模型;基于所述历史高斯型数据,对所述初始高斯预测模型进行训练,确定所述预设高斯预测模型;基于所述历史类贝叶斯型数据,对所述初始类贝叶斯预测模型进行训练,确定所述预设类贝叶斯预测模型;基于所述历史多项式型数据,对所述初始多项式预测模型进行训练,确定所述预设多项式预测模型。
在本发明的一些实施例中,所述获取单元601,用于获取所述多个预设概率预测模型各自对应的风险概率、后验概率;基于所述预设第一风险预测准则,将所述多个预设概率预测模型各自对应的风险概率、后验概率,进行乘运算与和运算,得到所述多个预设概率预测模型各自对应的第一异常值;基于所述预设第一风险预测准则,将所述多个预设概率预测模型下的预测概率,分别与所述第一异常值进行商运算,得到所述多个预设概率预测模型各自对应的异常值;
所述确定单元602,用于基于所述异常值,通过数据分析,确定所述第一风险程度。
在本发明的一些实施例中,所述多个预设概率预测模型下的预测概率包括伯努利型数据的预测概率、高斯型数据的预测概率、类贝叶斯型数据的预测概率和多项式型数据的预测概率;所述确定单元602,用于基于所述伯努利型数据的预测概率,与所述第一异常值进行商运算,确定伯努利型数据的异常值;基于所述高斯型数据的预测概率,与所述第一异常值进行商运算,确定高斯型数据的异常值;基于所述类贝叶斯型数据的预测概率,与所述第一异常值进行商运算,确定类贝叶斯型数据的异常值;基于所述多项式型数据的预测概率,与所述第一异常值进行商运算,确定多项式型数据的异常值。
在本发明的一些实施例中,所述获取单元601,用于获取所述多个预设概率预测模型各自对应的综合概率、后验概率;
基于所述预设第二风险预测准则,将所述多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到所述多个预设概率预测模型各自对应的第二异常值;基于所述预设第二风险预测准则,对所述多个预设概率预测模型下的预测概率进行乘运算,得到第三异常值;基于所述预设第二风险预测准则,对所述第三异常值和所述第二异常值进行商运算,得到综合异常值;
所述确定单元602,用于基于所述综合异常值,进行数据分析,确定所述第二风险程度。
在本发明的一些实施例中,所述确定单元602,用于若所述第一风险程度高于所述第二风险程度,将所述第一风险程度作为所述最终风险程度;若所述第一风险程度小于所述第二风险程度,将所述第二风险程度作为所述最终风险程度。
在本发明的一些实施例中,所述获取单元601,用于获取初始登录数据;基于所述初始登录数据,进行数据预处理,获得所述伯努利型数据、所述高斯型数据、所述类贝叶斯型数据和所述多项式型数据;
所述确定单元602,用于将所述伯努利型数据、所述高斯型数据、所述类贝叶斯型数据和所述多项式型数据作为所述登录数据。
需要说明的是,上述实施例提供的风险预测装置应用于终端,在进行风险预测时,仅以上述各程序模块的划分进行举例说明,实际应用中,可以根据需要而将上述处理分配由不同的程序模块完成,即将装置的内部结构划分成不同的程序模块,以完成以上描述的全部或者部分处理。另外,上述实施例提供的风险预测装置与风险预测方法实施例属于同一构思,其具体实现过程及有益效果详见方法实施例,这里不再赘述。对于本装置实施例中未披露的技术细节,请参照本发明方法实施例的描述而理解。
基于上述实施例的风险预测方法,本发明实施例还提供一种风险预测装置,如图7所示,图7为本发明实施例提供的一种风险预测装置的结构示意图二,该装置包括:处理器701和存储器702;存储器702存储处理器可执行的一个或者多个程序,当一个或者多个程序被执行时,通过处理器701执行如前所述实施例的任意一种风险预测方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用硬件实施例、软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。
Claims (13)
1.一种风险预测方法,其特征在于,包括:
获得登录数据;
基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率;
基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度;
基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度;
基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度。
2.根据权利要求1所述的方法,其特征在于,所述多个预设概率预测模型包括预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型;所述登录数据包括伯努利型数据、高斯型数据、类贝叶斯型数据和多项式型数据;
所述基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率,包括:
基于所述预设伯努利预测模型,对所述伯努利型数据进行预测,得到所述伯努利型数据的预测概率;
基于所述预设高斯预测模型,对所述高斯型数据进行预测,得到所述高斯型数据的预测概率;
基于所述预设类贝叶斯预测模型,对所述类贝叶斯型数据进行预测,得到所述类贝叶斯型数据的预测概率;
基于所述预设多项式预测模型,对所述多项式型数据进行预测,得到所述多项式型数据的预测概率。
3.根据权利要求1或2所述的方法,其特征在于,所述基于多个预设概率预测模型,对登录数据进行预测,得到多个预设概率预测模型下的预测概率之前,所述方法还包括:
获取历史初始登录数据;
基于所述历史初始登录数据,进行数据类型分类处理和异常研判分类处理,得到历史登录数据;其中,所述历史登录数据包括历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据;
基于所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据,对初始伯努利预测模型、初始高斯预测模型、初始类贝叶斯预测模型和初始多项式预测模型进行训练,确定预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型;
将所述预设伯努利预测模型、所述预设高斯预测模型、所述预设类贝叶斯预测模型和所述预设多项式预测模型作为所述多个预设概率预测模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述历史初始登录数据,进行数据类型分类处理和异常研判分类处理,得到历史登录数据,包括:
基于所述历史初始登录数据,进行数据类型分类处理,得到历史初始伯努利型数据、历史初始高斯型数据、历史初始类贝叶斯型数据和历史初始多项式型数据;
基于所述历史初始登录数据,进行异常研判分类处理,得到所述历史初始登录数据的分类结果;
基于所述历史初始登录数据的分类结果,通过与所述历史初始伯努利型数据、所述历史初始高斯型数据、所述历史初始类贝叶斯型数据和所述历史初始多项式型数据进行匹配,得到历史伯努利型数据、历史高斯型数据、历史类贝叶斯型数据和历史多项式型数据;
将所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据作为所述历史登录数据。
5.根据权利要求3所述的方法,其特征在于,所述基于所述历史伯努利型数据、所述历史高斯型数据、所述历史类贝叶斯型数据和所述历史多项式型数据,对初始伯努利预测模型、初始高斯预测模型、初始类贝叶斯预测模型和初始多项式预测模型进行训练,确定预设伯努利预测模型、预设高斯预测模型、预设类贝叶斯预测模型和预设多项式预测模型,包括:
基于所述历史伯努利型数据,对所述初始伯努利预测模型进行训练,确定所述预设伯努利预测模型;
基于所述历史高斯型数据,对所述初始高斯预测模型进行训练,确定所述预设高斯预测模型;
基于所述历史类贝叶斯型数据,对所述初始类贝叶斯预测模型进行训练,确定所述预设类贝叶斯预测模型;
基于所述历史多项式型数据,对所述初始多项式预测模型进行训练,确定所述预设多项式预测模型。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度,包括:
获取所述多个预设概率预测模型各自对应的风险概率、后验概率;
基于所述预设第一风险预测准则,将所述多个预设概率预测模型各自对应的风险概率、后验概率,进行乘运算与和运算,得到所述多个预设概率预测模型各自对应的第一异常值;
基于所述预设第一风险预测准则,将所述多个预设概率预测模型下的预测概率,分别与所述第一异常值进行商运算,得到所述多个预设概率预测模型各自对应的异常值;
基于所述异常值,通过数据分析,确定所述第一风险程度。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述多个预设概率预测模型下的预测概率包括伯努利型数据的预测概率、高斯型数据的预测概率、类贝叶斯型数据的预测概率和多项式型数据的预测概率;
所述将所述多个预设概率预测模型下的预测概率,分别与所述第一异常值进行商运算,得到所述多个预设概率预测模型各自对应的异常值,包括:
基于所述伯努利型数据的预测概率,与所述第一异常值进行商运算,确定伯努利型数据的异常值;
基于所述高斯型数据的预测概率,与所述第一异常值进行商运算,确定高斯型数据的异常值;
基于所述类贝叶斯型数据的预测概率,与所述第一异常值进行商运算,确定类贝叶斯型数据的异常值;
基于所述多项式型数据的预测概率,与所述第一异常值进行商运算,确定多项式型数据的异常值。
8.根据权利要求1-5任一项所述的方法,其特征在于,所述基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度,包括:
获取所述多个预设概率预测模型各自对应的综合概率、后验概率;
基于所述预设第二风险预测准则,将所述多个预设概率预测模型各自对应的综合概率、后验概率,进行乘运算与和运算,得到所述多个预设概率预测模型各自对应的第二异常值;
基于所述预设第二风险预测准则,对所述多个预设概率预测模型下的预测概率进行乘运算,得到第三异常值;
基于所述预设第二风险预测准则,对所述第三异常值和所述第二异常值进行商运算,得到综合异常值;
基于所述综合异常值,进行数据分析,确定所述第二风险程度。
9.根据权利要求1所述的方法,其特征在于,所述基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度,包括:
若所述第一风险程度高于所述第二风险程度,将所述第一风险程度作为所述最终风险程度;
若所述第一风险程度小于所述第二风险程度,将所述第二风险程度作为所述最终风险程度。
10.根据权利要求1所述的方法,其特征在于,所述获得登录数据,包括:
获取初始登录数据;
基于所述初始登录数据,进行数据预处理,获得所述伯努利型数据、所述高斯型数据、所述类贝叶斯型数据和所述多项式型数据;
将所述伯努利型数据、所述高斯型数据、所述类贝叶斯型数据和所述多项式型数据作为所述登录数据。
11.一种风险预测装置,其特征在于,包括:获取单元和确定单元,其中,
所述获取单元,用于获得登录数据;基于多个预设概率预测模型,对所述登录数据分别进行预测,得到多个预设概率预测模型下的预测概率;
所述确定单元,用于基于所述多个预设概率预测模型下的预测概率,通过预设第一风险预测准则进行运算,确定第一风险程度;基于所述多个预设概率预测模型下的预测概率,通过预设第二风险预测准则进行运算,确定第二风险程度;基于所述第一风险程度和所述第二风险程度,进行综合分析处理,确定最终风险程度。
12.一种风险预测装置,其特征在于,包括:
存储器,用于存储可执行数据指令;
处理器,用于执行所述存储器中存储的可执行指令时,实现权利要求1至10任一项所述的风险预测方法。
13.一种计算机可读存储介质,其特征在于,存储有可执行指令,用于引起处理器执行时,实现权利要求1至10任一项所述的风险预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210011361.0A CN116451144A (zh) | 2022-01-06 | 2022-01-06 | 一种风险预测方法及装置、计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210011361.0A CN116451144A (zh) | 2022-01-06 | 2022-01-06 | 一种风险预测方法及装置、计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116451144A true CN116451144A (zh) | 2023-07-18 |
Family
ID=87132520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210011361.0A Pending CN116451144A (zh) | 2022-01-06 | 2022-01-06 | 一种风险预测方法及装置、计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116451144A (zh) |
-
2022
- 2022-01-06 CN CN202210011361.0A patent/CN116451144A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108182515B (zh) | 智能规则引擎规则输出方法、设备及计算机可读存储介质 | |
US9542255B2 (en) | Troubleshooting based on log similarity | |
CN107644194B (zh) | 提供监控数据的系统和方法 | |
JP4627674B2 (ja) | データ処理方法及びプログラム | |
CN113899577A (zh) | 异常声音探测装置、异常声音生成装置及异常声音生成方法 | |
US11030246B2 (en) | Fast and accurate graphlet estimation | |
US10002204B2 (en) | Automated enterprise dynamics system | |
KR102359090B1 (ko) | 실시간 기업정보시스템 이상행위 탐지 서비스를 제공하는 방법과 시스템 | |
Ni et al. | Variable selection for case-cohort studies with failure time outcome | |
CN116304909A (zh) | 一种异常检测模型训练方法、故障场景定位方法及装置 | |
CN114978956A (zh) | 智慧城市网络设备性能异常突变点检测方法及装置 | |
CN112950908B (zh) | 一种数据监测预警方法、系统、介质及电子终端 | |
CN114169460A (zh) | 样本筛选方法、装置、计算机设备和存储介质 | |
Chen et al. | Data-driven safe controller synthesis for deterministic systems: A posteriori method with validation tests | |
Lando | Testing departures from the increasing hazard rate property | |
CN116166967B (zh) | 基于元学习与残差网络的数据处理方法、设备和存储介质 | |
CN113205230A (zh) | 基于模型集合的数据预测方法、装置、设备及存储介质 | |
JP5745561B2 (ja) | 予測誤差評価装置及び方法 | |
CN116451144A (zh) | 一种风险预测方法及装置、计算机可读存储介质 | |
CN113434823B (zh) | 数据采集任务异常预警方法、装置、计算机设备和介质 | |
CN114358581A (zh) | 性能指标的异常阈值确定方法和装置、设备、存储介质 | |
McKeague et al. | Significance testing for canonical correlation analysis in high dimensions | |
CN114398228A (zh) | 一种设备资源使用情况的预测方法、装置及电子设备 | |
CN109491844B (zh) | 一种识别异常信息的计算机系统 | |
CN112528500A (zh) | 一种场景图构造模型的评估方法及评估设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |