CN114693052A - 风险预测模型的训练方法、装置、计算设备和介质 - Google Patents

风险预测模型的训练方法、装置、计算设备和介质 Download PDF

Info

Publication number
CN114693052A
CN114693052A CN202011644258.7A CN202011644258A CN114693052A CN 114693052 A CN114693052 A CN 114693052A CN 202011644258 A CN202011644258 A CN 202011644258A CN 114693052 A CN114693052 A CN 114693052A
Authority
CN
China
Prior art keywords
asset data
model
data
clustering
risk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011644258.7A
Other languages
English (en)
Inventor
史国军
武浩
齐向东
吴云坤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qianxin Technology Group Co Ltd
Secworld Information Technology Beijing Co Ltd
Original Assignee
Qianxin Technology Group Co Ltd
Secworld Information Technology Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qianxin Technology Group Co Ltd, Secworld Information Technology Beijing Co Ltd filed Critical Qianxin Technology Group Co Ltd
Priority to CN202011644258.7A priority Critical patent/CN114693052A/zh
Publication of CN114693052A publication Critical patent/CN114693052A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Biology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种风险预测模型的训练方法,包括:获取多个资产数据,其中,每个资产数据包括运行数据和属性数据中的至少一个;利用聚类模型对多个资产数据进行聚类,得到聚类结果;基于聚类结果,确定每个资产数据的标签,其中,标签表征资产数据对应的风险等级;利用每个资产数据和对应的标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。本公开还提供了一种风险预测方法、装置、计算设备、计算机可读存储介质以及计算机程序产品。

Description

风险预测模型的训练方法、装置、计算设备和介质
技术领域
本公开涉及计算机技术领域,更具体地,涉及一种风险预测模型的训练方法、风险预测方法、风险预测模型的训练装置、风险预测装置、计算设备、计算机可读存储介质以及程序产品。
背景技术
网络资产在运行过程中经常会存在资产风险,相关技术通常在发生资产风险之后才采取补救措施,导致难以及时挽回损失。另外,相关技术对资产风险分析不够准确,难以分析得到潜在的资产风险,导致无法提前采取有效措施来降低损失。
发明内容
有鉴于此,本公开提供了一种优化的风险预测模型的训练方法、风险预测方法、风险预测模型的训练装置、风险预测装置、计算设备、计算机可读存储介质以及程序产品。
本公开的一个方面提供了一种风险预测模型的训练方法,包括:获取多个资产数据,其中,每个资产数据包括运行数据和属性数据中的至少一个;利用聚类模型对多个资产数据进行聚类,得到聚类结果;基于所述聚类结果,确定每个所述资产数据的标签,其中,所述标签表征所述资产数据对应的风险等级;以及,利用每个所述资产数据和标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。
根据本公开的实施例,上述聚类结果包括每个资产数据所属的簇;所述基于所述聚类结果,确定每个所述资产数据的标签包括:确定每个簇所对应的风险等级,并为所述簇设置相应的标签,所述标签为第一标签或第二标签中的一种;将每个簇所对应的标签,确定为归属于该簇的每个资产数据的标签;其中,所述第一标签表征所述资产数据对应的风险等级为第一风险等级,所述第二标签表征所述资产数据对应的风险等级为第二风险等级,所述第一风险等级高于所述第二风险等级。
根据本公开的实施例,上述聚类模型包括第一聚类模型,所述第一聚类模型包括多个簇;所述利用聚类模型对多个资产数据进行聚类,得到聚类结果包括:针对每个资产数据,计算所述资产数据属于每个簇的概率,得到与所述多个簇一一对应的多个概率;从所述多个概率中确定出最大的概率作为目标概率,将所述资产数据划分到与所述目标概率对应的簇中,以得到所述聚类结果。
根据本公开的实施例,上述聚类模型包括第二聚类模型;所述利用聚类模型对多个资产数据进行聚类,得到聚类结果包括:确定每个所述资产数据所属的当前簇,以得到针对所述多个资产数据的多个当前簇;计算所述多个当前簇相互之间的距离;基于所述距离,对所述多个当前簇进行合并,直到合并后的簇的数量为预设数量,以得到所述聚类结果。
根据本公开的实施例,所述第一聚类模型包括高斯混合模型,所述第二聚类模型包括凝聚层次聚类模型。
根据本公开的实施例,上述待训练风险预测模型包括神经网络模型和决策树模型;所述利用每个所述资产数据和对应的标签,对待训练风险预测模型进行训练包括:利用所述神经网络模型对每个所述资产数据进行处理,得到每个所述资产数据的特征数据;利用决策树模型对所述特征数据进行预测,得到预测结果;基于所述预测结果和所述标签,调整所述待训练风险预测模型的参数,以得到经训练风险预测模型。
根据本公开的实施例,上述决策树模型包括多个节点,所述多个节点包括第一节点和第二节点,每个第一节点对应一个神经网络模型,所述第一节点具有下一级节点,所述第二节点不具有下一级节点;其中,所述利用所述神经网络模型对每个所述资产数据进行处理得到每个所述资产数据的特征数据包括:针对当前的第一节点,利用与当前的第一节点对应的神经网络模型对属于当前的第一节点的资产数据进行处理,得到资产数据的特征数据;其中,所述利用决策树模型对所述特征数据进行预测得到预测结果包括:针对当前的第一节点,基于所述特征数据将所述资产数据划分至当前的第一节点的下一级节点,并以该下一级节点作为当前的第一节点继续进行资产数据的划分,直到将所述资产数据划分至所述第二节点;以及将所述第二节点所对应的风险等级确定为所述预测结果。
本公开的另一个方面提供了一种风险预测方法,包括:获取待预测资产数据,其中,所述待预测资产数据包括运行数据和属性数据中的至少一个;利用风险预测模型处理所述待预测资产数据,得到针对所述待预测资产数据的预测结果,其中,所述针对所述待预测资产数据的预测结果表征所述资产数据对应的风险等级;其中,所述风险预测方法还包括利用上述训练方法来训练待训练风险预测模型,以获得所述风险预测模型。
根据本公开的实施例,上述风险预测模型包括神经网络模型和决策树模型,所述决策树模型包括第一节点和第二节点,每个第一节点对应一个神经网络模型,所述第一节点具有下一级节点,所述第二节点不具有下一级节点;其中,所述利用风险预测模型处理所述待预测资产数据,得到针对所述待预测资产数据的预测结果包括:针对当前的第一节点,利用所述神经网络模型对属于当前的第一节点的资产数据进行处理,得到资产数据的特征数据;基于所述特征数据,将所述资产数据划分至当前的第一节点的下一级节点,并以该下一级节点作为当前的第一节点继续进行资产数据的划分,直到将所述资产数据划分至所述第二节点;以及,将所述第二节点所对应的风险等级确定为所述预测结果。
本公开的另一个方面提供了一种风险预测模型的训练装置,包括:第一获取模块、聚类模块、确定模块以及第一训练模块。其中,第一获取模块用于获取多个资产数据,其中,每个资产数据包括运行数据和属性数据中的至少一个;聚类模块用于利用聚类模型对多个资产数据进行聚类,得到聚类结果;确定模块用于基于所述聚类结果,确定每个所述资产数据的标签,其中,所述标签表征所述资产数据对应的风险等级;第一训练模块用于利用每个所述资产数据和标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。
本公开的另一个方面提供了一种风险预测装置,包括:第二获取模块、处理模块以及第二训练模块。其中,第二获取模块用于获取待预测资产数据,其中,所述待预测资产数据包括运行数据和属性数据中的至少一个;处理模块用于利用风险预测模型处理所述待预测资产数据,得到针对所述待预测资产数据的预测结果,其中,所述针对所述待预测资产数据的预测结果表征所述资产数据对应的风险等级;其中,所述第二训练模块用于利用上述训练方法来训练待训练风险预测模型,以获得所述风险预测模型。
本公开的另一方面提供了一种计算设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的训练方法。
本公开的另一方面提供了一种计算设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行如上所述的风险预测方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的训练方法。
本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令,所述指令在被执行时用于实现如上所述的风险预测方法。
本公开的另一方面提供了一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现如上所述的训练方法。
本公开的另一方面提供了一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现如上所述的风险预测方法。
根据本公开的实施例,利用上述风险预测模型的训练方法和风险预测方法可以至少部分地解决相关技术中对资产风险分析不够准确,难以分析得到潜在的资产风险的问题,并因此可以实现提高资产风险预测准确性的技术效果。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的风险预测模型的训练方法和风险预测方法的应用场景;
图2示意性示出了根据本公开实施例的风险预测模型的训练方法和风险预测方法的原理图;
图3示意性示出了根据本公开实施例的风险预测模型的训练方法的流程图;
图4示意性示出了根据本公开一实施例的聚类模型的示意图;
图5示意性示出了根据本公开一实施例的聚类模型的示意图;
图6示意性示出了根据本公开一实施例的风险预测模型的示意图;
图7示意性示出了根据本公开另一实施例的风险预测模型的示意图;
图8示意性示出了根据本公开实施例的风险预测方法的流程图;
图9示意性示出了根据本公开实施例的风险预测模型的训练装置的框图;
图10示意性示出了根据本公开实施例的风险预测装置的框图;以及
图11示意性示出了根据本公开实施例的适于训练风险预测模型或预测风险的计算设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的系统”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的系统等)。
本公开的实施例提供了一种风险预测模型的训练方法,包括:获取多个资产数据,每个资产数据包括运行数据和属性数据中的至少一个。然后,利用聚类模型对多个资产数据进行聚类,得到聚类结果,并基于聚类结果,确定每个资产数据的标签,标签表征资产数据对应的风险等级。接下来,利用每个资产数据和对应的标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。
本公开的实施例还提供了一种风险预测方法,包括:获取待预测资产数据,待预测资产数据包括运行数据和属性数据中的至少一个。然后,利用风险预测模型处理待预测资产数据,得到针对待预测资产数据的预测结果,针对待预测资产数据的预测结果表征资产数据对应的风险等级。其中该风险预测方法还包括利用训练方法来训练待训练风险预测模型,以获得风险预测模型。
图1示意性示出了根据本公开实施例的风险预测模型的训练方法和风险预测方法的应用场景。
如图1所示,根据该实施例的应用场景100可以包括多个电子设备110、计算设备120和网络130。其中,多个电子设备110例如包括电子设备111、电子设备112、电子设备113、电子设备114。电子设备可以是服务器、计算机、手机、路由器、交换机等等。
在本公开实施例中,计算设备120包括但不仅限于服务器、服务器集群、计算机等等。计算设备120可以和多个电子设备110之间可以通过网络130进行数据通信。即,网络130用以在多个电子设备110和计算设备120之间提供通信链路的介质。网络130可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
需要说明的是,本公开实施例所提供的风险预测模型的训练方法和风险预测方法一般可以由计算设备120执行。相应地,本公开实施例所提供的风险预测模型的训练装置和风险预测装置一般可以设置于计算设备120中。
例如,计算设备120通过网络130获取电子设备的资产数据121,该资产数据121例如包括电子设备的运行数据和属性数据。计算设备120中包括风险预测模型122,该风险预测模型122例如可以是神经网络模型、决策树模型等等。通过该风险预测模型122处理资产数据121,从而预测电子设备是否存在资产风险。
在一示例中,计算设备120可以利用已知是否存在风险的资产数据作为训练样本来训练风险预测模型122,还可以利用经训练的风险预测模型对待预测资产数据进行预测。
应该理解,图1中的电子设备、网络和计算设备的数目仅仅是示意性的。根据实现需要,可以具有任意数目的电子设备、网络和计算设备。
图2示意性示出了根据本公开实施例的风险预测模型的训练方法和风险预测方法的原理图。
如图2所示,获取多个资产数据210,每个资产数据例如包括一个电子设备或软件的运行数据和属性数据。运行数据例如包括进程数据、服务数据等等。属性数据例如包括电子设备版本内核数据、网络配置数据、端口数据等等。
通过将多个资产数据210输入至聚类模型220中进行聚类,得到聚类结果。聚类结果例如包括多个簇,例如包括簇221、簇222、簇223。其中,每个簇包括至少一个资产数据。然后,基于聚类结果确定每个资产数据的标签,标签例如包括“高风险”和“低风险”。可以将每个簇中的所有资产数据设置为相同的标签。例如,簇221中资产数据的标签均为“高风险”,簇222中资产数据的标签均为“低风险”,簇223中资产数据的标签均为“高风险”。
在得到每个资产数据的标签之后,将具有标签的资产数据输入至待训练风险预测模型230中进行训练,以得到经训练风险预测模型240。
接下来,对于不包含标签的待预测资产数据250,将该待预测资产数据250输入至经训练风险预测模型240中,经训练风险预测模型240对待预测资产数据250进行处理,得到针对待预测资产数据250的预测结果260,该预测结果260例如表征了待预测资产数据250所对应的资产是否存在资产风险。
以下结合图2的原理图来描述本公开实施例的风险预测模型的训练方法和风险预测方法。
图3示意性示出了根据本公开实施例的风险预测模型的训练方法的流程图。
如图3所示,该方法例如可以包括以下操作S310~操作S340。
在操作S310,获取多个资产数据,其中,每个资产数据包括运行数据和属性数据中的至少一个。
在操作S320,利用聚类模型对多个资产数据进行聚类,得到聚类结果。
在操作S330,基于聚类结果,确定每个资产数据的标签,其中,标签表征资产数据对应的风险等级。
在操作S340,利用每个资产数据和标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。
在本公开的实施例中,资产数据例如为电子设备或软件的资产数据,标签例如表征与资产数据对应的资产的风险等级。例如将多个资产数据作为训练数据,在对多个资产数据进行聚类处理之前,可以对每个资产数据进行预处理。其中,预处理可以包括将每个资产数据与标准库数据进行比对以对资产数据进行清洗和去噪,以去除资产数据中的脏数据。预处理还可以包括通过预设的匹配规则处理资产数据,以得到标准的资产数据。示例性地,资产数据例如包括软件版本号:2.0.0,通过预设的匹配规则处理2.0.0,得到标准的数据为2.0。
接下来,可以利用聚类模型对预处理后的多个资产数据进行聚类,得到聚类结果,然后基于聚类结果确定每个资产数据的标签。聚类结果包括每个资产数据所属的簇,即聚类结果包括多个簇,每个簇包括至少一个资产数据,每个簇中的资产数据的标签相同。
具体地,确定每个簇所对应的风险等级,并为每个簇设置相应的标签,每个簇的标签为第一标签或第二标签。然后将每个簇所对应的标签,确定为归属于该簇的每个资产数据的标签。其中,第一标签表征资产数据对应的风险等级为第一风险等级,第二标签表征资产数据对应的风险等级为第二风险等级,第一风险等级高于第二风险等级。
针对每个簇,确定每个簇中的每个资产数据的标签均为第一标签或者均为第二标签。第一标签例如表征与资产数据对应的电子设备或软件等资产存在高风险,第二标签例如表征与资产数据对应的电子设备或软件等资产存在低风险。换言之,第一标签可以是“高风险”,第二标签可以是“低风险”。
在得到每个资产数据的标签之后,可以利用具有标签的资产数据对待训练风险预测模型进行训练。待训练风险预测模型例如包括神经网络模型和决策树模型。利用待训练风险预测模型处理每个资产数据,得到针对该资产数据的预测结果,预测结果例如包括高风险或低风险。然后将预测结果和标签进行对比,以便调节待训练风险预测模型的参数,使得待训练风险预测模型在之后对资产数据进行预测得到的预测结果尽量与该资产数据的标签一致。
在训练得到经训练风险预测模型之后,可以利用经训练风险预测模型来对未知风险的资产数据进行预测,从而实现针对电子设备的资产风险预测。
根据本公开实施例,通过聚类模型对作为训练样本的资产数据进行聚类,并根据聚类结果来确定资产数据的标签,以便利用具有标签的资产数据来训练风险预测模型。通过聚类处理来确定资产数据的标签,可以提高标签的准确性,进而实现了利用具有标签的资产数据来训练风险预测模型可以得到准确性较高的风险预测模型。
图4示意性示出了根据本公开一实施例的聚类模型的示意图。
如图4所示,在本公开实施例中,聚类模型包括第一聚类模型,第一聚类模型包括多个簇;利用聚类模型对多个资产数据进行聚类得到聚类结果包括:针对每个资产数据,计算资产数据属于每个簇的概率,得到与所述多个簇一一对应的多个概率。然后从多个概率中确定出最大的概率作为目标概率,并将该资产数据划分到与目标概率对应的簇中,以得到聚类结果。
具体地,第一聚类模型例如包括多个子模型,每个子模型对应一个簇。例如,第一聚类模型可以是高斯混合模型。图4示出了高斯混合模型的示意图。高斯混合模型可以包括多个子模型,子模型可以是高斯分布的概率密度模型。
在本公开的实施例中,利用高斯混合模型对多个资产数据进行聚类包括以下过程。
针对每个资产数据,计算资产数据属于每个子模型的概率,得到与多个子模型一一对应的多个概率。然后,从多个概率中确定出最大的概率作为目标概率。接下来,确定与目标概率对应的子模型,将资产数据划分到与子模型对应的簇中,得到聚类结果。
具体地,高斯混合模型包括由如下公式(1)所示的概率分布模型:
Figure BDA0002880511490000111
其中,αk≥0,且∑αk=1,αk是每一个高斯分布的权重。
Figure BDA0002880511490000112
是第k个高斯分布的概率密度,也被称为第k个子模型,第k个子模型的参数为θk=(μk,σk 2),μk是均值,σ是标准差。其中,概率密度可以表示为公式(2):
Figure BDA0002880511490000113
其中,高斯混合模型包括K个高斯分布的线性组合,其假设所有的样本(资产数据)可以分为K类(簇),每一类的样本服从一个高斯分布。因此,高斯混合模型的学习过程就是估计K个高斯分布的概率密度
Figure BDA0002880511490000114
以及每个高斯分布的权重αk。每个样本出现的概率就表示为K个高斯分布概率的加权。
在本公开的实施例中,聚类例如指对于多个样本(资产数据)中的某个样本yj,将该样本代入到K个高斯分布中计算出样本yj属于每个类别(簇)的概率,概率如公式(3)所示。
Figure BDA0002880511490000115
针对样本yj,选择概率值最高的类别(簇)作为样本yj最终所属的簇。类似地,将所有的样本分别归入K个类(簇)中,即可完成聚类的过程。在得到聚类结果之后,即可根据聚类结果确定每个样本(资产数据)的标签。
在本公开实施例中,对于高斯混合模型,可以假设数据点符合高斯分布,因此,可以通过两个参数来描述聚类的形状,两个参数例如包括平均值和标准差。以二维数据为例,对于二维数据的聚类可以采用任何形式的椭圆形状(因为在x和y方向上都有标准差)进行聚类。因此,每个高斯分布可归属于一个单独的类。
图5示意性示出了根据本公开一实施例的聚类模型的示意图。
如图5所示,在本公开实施例中,聚类模型包括第二聚类模型,第二聚类模型例如包括凝聚层次聚类模型。图5示出了凝聚层次聚类模型的示意图。
其中,利用聚类模型对多个资产数据进行聚类例如包括确定每个资产数据所属的当前簇,以得到针对多个资产数据的多个当前簇,然后计算多个当前簇相互之间的距离,并基于距离对多个当前簇进行合并直到合并后的簇的数量为预设数量,确定资产数据所归属的预设数量个簇为聚类结果。
凝聚层次聚类算法分为两类:自上而下的和自下而上。本公开实施例采用自下而上的凝聚层次聚类(HAC)。HAC首先将每个样本视为一个单一的簇,然后计算所有簇之间的距离来合并簇,直到所有的簇聚合成为一个簇为止。
具体地,首先将多个资产数据中的每一个作为一个簇,得到与多个资产数据一一对应的多个初始的簇,然后计算多个初始的簇彼此之间的距离,并将距离近的簇合并为一个簇,从而得到多个簇,再基于该多个簇之间的距离再一次进行簇的合并,以此执行多次合并直到所有的簇合成一个簇为止,然后可以从多次合并所生成的簇中确定预设数量个簇作为聚类结果。
其中,每一次合并操作后,簇的数量逐渐变少,每一次合并操作后得到的簇可以作为当前簇。其中,凝聚层次聚类算法不需要预先指定簇的数目,而是可以根据需求选择所需的簇的数目。另外,凝聚层次聚类算法对于距离度量的选择也并不敏感。
如图5左图所示,以多个资产数据c2、p3、c4为例,c2、p3、c4中的每个作为一个簇,然后计算c2、p3、c4彼此之间的距离,将距离近的c2、p3合并成一个簇。
如图5右图所示,以多个资产数据p0-p6为例,p0-p6中的每个作为一个簇,然后计算p0-p6彼此之间的距离,将距离近的p1和p2合并成一个簇,将p5和p6合并成一个簇,从而得到5个簇:簇(p0)、簇(p1和p2)、簇(p3)、簇(p4)、簇(p5和p6)。然后继续基于5个簇的距离进行合并,将簇(p0)和簇(p1和p2)进行合并,将簇(p4)和簇(p5和p6)进行合并,以此类推直到所有的簇合成一个簇为止。然后,可以确定预设数量个簇作为聚类结果,以预设数量为3为例,聚类结果例如包括3个簇:簇(p0、p1、p2)、簇(p3)、簇(p4、p5、p6)。
在一示例中,可以利用高斯混合模型对多个资产数据进行聚类得到第一聚类结果,还可以利用凝聚层次聚类模型来对多个资产数据进行聚类得到第二聚类结果。然后可以基于第一聚类结果和第二聚类结果来确定每个资产数据的标签。例如,以一个资产数据为例,当利用高斯混合模型进行聚类确定该资产数据为第一标签,利用凝聚层次聚类模型进行聚类确定该资产数据为第二标签时,可以综合高斯混合模型和凝聚层次聚类模型的结果来确定该资产数据的标签。例如,在一些情况下,高斯混合模型和凝聚层次聚类模型具有不同的优先级,当基于两种模型得到一个资产数据的标签不一致时,可以基于优先级高的聚类模型所得到的聚类结果来确定资产数据的标签。
根据本公开的实施例,待训练风险预测模型包括一个或多个神经网络模型和决策树模型。利用神经网络模型对每个资产数据进行处理,得到每个资产数据的特征数据,然后利用决策树模型对特征数据进行预测得到预测结果。接下来,基于预测结果和标签,调整待训练风险预测模型的参数,以得到经训练风险预测模型。
在一示例中,以待训练风险预测模型包括一个神经网络模型和决策树模型为例进行训练来进行说明,具体参加图6所示。
图6示意性示出了根据本公开一实施例的风险预测模型的示意图。
如图6所示,将每个资产数据611和其对应的标签612输入至待训练风险预测模型620中,待训练风险预测模型620包括一个神经网络模型621和决策树模型622。由神经网络模型621处理每个资产数据611得到资产数据的特征数据,然后将特征数据输入至决策树模型622中进行训练,并由决策树模型622输出风险预测结果630。然后基于风险预测结果630和标签612调整待训练风险预测模型620的参数,例如调整神经网络模型621和决策树模型622的参数。其中,神经网络模型621可以是卷积神经网络模型。
在另一示例中,以待训练风险预测模型包括多个神经网络模型和决策树模型为例进行训练来进行说明,具体参加图7所示。
图7示意性示出了根据本公开另一实施例的风险预测模型的示意图。
如图7所示,决策树模型例如包括多个节点710~770,多个节点包括多个第一节点和多个第二节点。多个第一节点例如包括节点710~730,多个第二节点例如包括节点740~770。每个第一节点例如具有下一级节点,例如节点710具有的下一级节点为节点720和节点730,节点720具有的下一级节点为节点740和节点750。每个第二节点例如不具有下一级节点,例如节点740不具有下一级节点。
在本公开的实施例中,每个第一节点对应一个神经网络模型。例如节点710对应神经网络模型710’,节点720对应神经网络模型720’,节点730对应经网络模型730’,即待训练风险预测模型包括与多个第一节点710~730一一对应的多个神经网络模型710’~730’。对于多个神经网络模型710’~730’中的任意两个神经网络模型,该任意两个神经网络模型可以是相同的模型,也可以是不同模型。
将多个第一节点710~730中的任意一个作为当前的第一节点,利用与当前的第一节点对应的神经网络模型对属于当前的第一节点的资产数据进行处理得到资产数据的特征数据,然后基于特征数据将资产数据划分至当前的第一节点的下一级节点,并以该下一级节点作为当前的第一节点继续进行资产数据的划分,直到将资产数据划分至某一个第二节点,并将第二节点所对应的风险等级确定为预测结果,从而实现待训练风险预测模型的训练。例如,以当前的第一节点为节点710为例,通过神经网络模型710’获取资产数据的第一特征数据,然后节点710基于第一特征数据将该资产数据划分至下一级节点720或节点730,以划分至下一级节点720为例,然后将该下一级节点720继续作为当前的第一节点,通过神经网络模型720’获取资产数据的第二特征数据,第二特征数据与第一特征数据可以不同,然后节点720基于第二特征数据将该资产数据划分至下一级节点740或节点750,由此完成了将资产数据划分至某一个第二节点。
在将所有的资产数据划分至第二节点之后,针对每个第二节点,基于该第二节点中所有历史资产数据的标签确定针对该第二节点的风险等级,由于历史资产数据具有相应的风险等级标签,根据归属于第二节点的资产数据的标签,可以确定第二节点所对应的风险等级。例如,以第二节点740为例,该第二节点740中例如包括100个历史资产数据,其中60个历史资产数据的标签为“高风险”,40个历史资产数据的标签为“低风险”,由于第二节点740中具有标签为“高风险”的历史资产数据的比例较多,例如比例为60%,因此可以将“高风险”作为该第二节点740的风险等级。类似地,可以得到所有第二节点的风险等级作为预测结果。然后针对每个第二节点中标签与该第二节点的风险等级不一致的历史资产数据,可以基于不一致的标签和风险等级来对神经网络模型和决策树模型的参数进行调整,便于基于调整参数后的模型对资产数据的分类更加准确。例如基于调整参数后的模型将多个资产数据划分至第二节点时,每个第二节点中所具有的资产数据的分类准确性较高,以第二节点740为例,例如该第二节点中标签为“高风险”的资产数据的比例提高,例如由原来的60%提升为80%。
在本公开的实施例中,通过利用神经网络模型和决策树模型结合作为待训练风险预测模型,从而提高待训练风险预测模型的风险预测精度。
图8示意性示出了根据本公开实施例的风险预测方法的流程图。
如图8所示,该方法例如可以包括以下操作S810~操作S830。
在操作S810,训练待训练风险预测模型,以获得风险预测模型。例如,利用上文提及的训练方法来训练待训练风险预测模型,以获得风险预测模型。
在操作S820,获取待预测资产数据,其中,待预测资产数据包括运行数据和属性数据中的至少一个。其中,待预测资产数据例如不包括标签。
在操作S830,利用风险预测模型处理待预测资产数据,得到针对待预测资产数据的预测结果,针对待预测资产数据的预测结果表征资产数据对应的风险等级。
在本公开的实施例中,风险预测模型例如包括神经网络模型和决策树模型,决策树模型包括第一节点和第二节点,每个第一节点对应一个神经网络模型,第一节点具有下一级节点,第二节点不具有下一级节点。
其中,利用风险预测模型处理待预测资产数据,得到针对待预测资产数据的预测结果包括:针对当前的第一节点,利用神经网络模型对属于当前的第一节点的资产数据进行处理,得到资产数据的特征数据。然后,基于特征数据将资产数据划分至当前的第一节点的下一级节点,并以该下一级节点作为当前的第一节点继续进行资产数据的划分,直到将资产数据划分至第二节点。最后将第二节点所对应的风险等级确定为预测结果,其中,每个第二节点所对应的风险等级例如是在模型训练过程中确定的,即每个第二节点所对应的风险等级的确定过程可以参考图7所示的过程,在此不再赘述。
在本公开的实施例中,在预测得到存在风险的电子设备之后,可以将存在风险的电子设备的资产数据以列表、图表的方式进行多维度展示,从而为用户直观地展示设备的画像数据,以便用户基于画像数据对电子设备的资产风险进行分析或采取有效措施来防止风险的出现。
图9示意性示出了根据本公开实施例的风险预测模型的训练装置的框图。
如图9所示,风险预测模型的训练装置900可以包括第一获取模块910、聚类模块920、确定模块930以及第一训练模块940。
第一获取模块910可以用于获取多个资产数据,其中,每个资产数据包括运行数据和属性数据中的至少一个。根据本公开实施例,第一获取模块910例如可以执行上文参考图3描述的操作S310,在此不再赘述。
聚类模块920可以用于利用聚类模型对多个资产数据进行聚类,得到聚类结果。根据本公开实施例,聚类模块920例如可以执行上文参考图3描述的操作S320,在此不再赘述。
确定模块930可以用于基于聚类结果,确定每个资产数据的标签,其中,标签表征资产数据对应的风险等级。根据本公开实施例,确定模块930例如可以执行上文参考图3描述的操作S330,在此不再赘述。
第一训练模块940可以用于利用每个资产数据和对应的标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。根据本公开实施例,第一训练模块940例如可以执行上文参考图3描述的操作S340,在此不再赘述。
图10示意性示出了根据本公开实施例的风险预测装置的框图。
如图10所示,风险预测装置1000可以包括第二训练模块1010、第二获取模块1020以及处理模块1030。
第二训练模块1010可以用于训练待训练风险预测模型,以获得风险预测模型。根据本公开实施例,第二训练模块1010例如可以执行上文参考图8描述的操作S810,在此不再赘述。
第二获取模块1020可以用于获取待预测资产数据,其中,待预测资产数据包括运行数据和属性数据中的至少一个。根据本公开实施例,第二获取模块1020例如可以执行上文参考图8描述的操作S820,在此不再赘述。
处理模块1030可以用于利用风险预测模型处理待预测资产数据,得到针对待预测资产数据的预测结果,其中,针对待预测资产数据的预测结果表征资产数据对应的风险等级。根据本公开实施例,处理模块1030例如可以执行上文参考图8描述的操作S830,在此不再赘述。
根据本公开的实施例的模块、子模块、单元、子单元中的任意多个、或其中任意多个的至少部分功能可以在一个模块中实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以被拆分成多个模块来实现。根据本公开实施例的模块、子模块、单元、子单元中的任意一个或多个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式的硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,根据本公开实施例的模块、子模块、单元、子单元中的一个或多个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图11示意性示出了根据本公开实施例的适于训练风险预测模型或预测风险的计算设备的方框图。图11示出的计算设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图11所示,根据本公开实施例的计算设备1100包括处理器1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。处理器1101例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC)),等等。处理器1101还可以包括用于缓存用途的板载存储器。处理器1101可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 1103中,存储有计算设备1100操作所需的各种程序和数据。处理器1101、ROM 1102以及RAM 1103通过总线1104彼此相连。处理器1101通过执行ROM 1102和/或RAM1103中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,程序也可以存储在除ROM 1102和RAM 1103以外的一个或多个存储器中。处理器1101也可以通过执行存储在一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,计算设备1100还可以包括输入/输出(I/O)接口1105,输入/输出(I/O)接口1105也连接至总线1104。计算设备1100还可以包括连接至I/O接口1105的以下部件中的一项或多项:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
根据本公开的实施例,根据本公开实施例的方法流程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读存储介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。具体地,计算机程序在被处理器1101执行时实现上述的方法在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被处理器1101执行时,执行本公开实施例的计算设备中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/系统中所包含的;也可以是单独存在,而未装配入该设备/装置/系统中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的方法。
根据本公开的实施例,计算机可读存储介质可以是计算机非易失性的计算机可读存储介质,例如可以可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 1102和/或RAM 1103和/或ROM 1102和RAM 1103以外的一个或多个存储器。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。电要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (17)

1.一种风险预测模型的训练方法,包括:
获取多个资产数据,其中,每个资产数据包括运行数据和属性数据中的至少一个;
利用聚类模型对多个资产数据进行聚类,得到聚类结果;
基于所述聚类结果,确定每个所述资产数据的标签,其中,所述标签表征所述资产数据对应的风险等级;以及
利用每个所述资产数据和对应的标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。
2.根据权利要求1所述的方法,其中,所述聚类结果包括每个资产数据所属的簇;所述基于所述聚类结果,确定每个所述资产数据的标签包括:
确定每个簇所对应的风险等级,并为所述簇设置相应的标签,所述标签为第一标签或第二标签中的一种;
将每个簇所对应的标签,确定为归属于该簇的每个资产数据的标签;
其中,所述第一标签表征所述资产数据对应的风险等级为第一风险等级,所述第二标签表征所述资产数据对应的风险等级为第二风险等级,所述第一风险等级高于所述第二风险等级。
3.根据权利要求1所述的方法,其中,所述聚类模型包括第一聚类模型,所述第一聚类模型包括多个簇;所述利用聚类模型对多个资产数据进行聚类,得到聚类结果包括:
针对每个资产数据,计算所述资产数据属于每个簇的概率,得到与所述多个簇一一对应的多个概率;
从所述多个概率中确定出最大的概率作为目标概率;以及
将所述资产数据划分到与所述目标概率对应的簇中,以得到所述聚类结果。
4.根据权利要求1所述的方法,其中,所述聚类模型包括第二聚类模型;所述利用聚类模型对多个资产数据进行聚类,得到聚类结果包括:
确定每个所述资产数据所属的当前簇,以得到针对所述多个资产数据的多个当前簇;
计算所述多个当前簇相互之间的距离;
基于所述距离,对所述多个当前簇进行合并,直到合并后的簇的数量为预设数量,以得到所述聚类结果。
5.根据权利要求1-4中任意一项所述的方法,其中,所述第一聚类模型包括高斯混合模型,所述第二聚类模型包括凝聚层次聚类模型。
6.根据权利要求1-4中任意一项所述的方法,其中,所述待训练风险预测模型包括神经网络模型和决策树模型;所述利用每个所述资产数据和对应的标签,对待训练风险预测模型进行训练包括:
利用所述神经网络模型对每个所述资产数据进行处理,得到每个所述资产数据的特征数据;
利用决策树模型对所述特征数据进行预测,得到预测结果;以及
基于所述预测结果和所述标签,调整所述待训练风险预测模型的参数,以得到经训练风险预测模型。
7.根据权利要求6所述的方法,其中,所述决策树模型包括多个节点,所述多个节点包括第一节点和第二节点,每个第一节点对应一个神经网络模型,所述第一节点具有下一级节点,所述第二节点不具有下一级节点;
其中,所述利用所述神经网络模型对每个所述资产数据进行处理得到每个所述资产数据的特征数据包括:针对当前的第一节点,利用与当前的第一节点对应的神经网络模型对属于当前的第一节点的资产数据进行处理,得到资产数据的特征数据;
其中,所述利用决策树模型对所述特征数据进行预测得到预测结果包括:针对当前的第一节点,基于所述特征数据将所述资产数据划分至当前的第一节点的下一级节点,并以该下一级节点作为当前的第一节点继续进行资产数据的划分,直到将所述资产数据划分至所述第二节点;以及将所述第二节点所对应的风险等级确定为所述预测结果。
8.一种风险预测方法,包括:
获取待预测资产数据,其中,所述待预测资产数据包括运行数据和属性数据中的至少一个;
利用风险预测模型处理所述待预测资产数据,得到针对所述待预测资产数据的预测结果,其中,所述针对所述待预测资产数据的预测结果表征所述资产数据对应的风险等级;
其中,所述风险预测模型通过所述权利要求1至7任一项所述的方法训练得到。
9.根据权利要求8所述的方法,其中,所述风险预测模型包括神经网络模型和决策树模型,所述决策树模型包括第一节点和第二节点,每个第一节点对应一个神经网络模型,所述第一节点具有下一级节点,所述第二节点不具有下一级节点;
其中,所述利用风险预测模型处理所述待预测资产数据,得到针对所述待预测资产数据的预测结果包括:
针对当前的第一节点,利用所述神经网络模型对属于当前的第一节点的资产数据进行处理,得到资产数据的特征数据;
基于所述特征数据,将所述资产数据划分至当前的第一节点的下一级节点,并以该下一级节点作为当前的第一节点继续进行资产数据的划分,直到将所述资产数据划分至所述第二节点;以及
将所述第二节点所对应的风险等级确定为所述预测结果。
10.一种风险预测模型的训练装置,包括:
第一获取模块,用于获取多个资产数据,其中,每个资产数据包括运行数据和属性数据中的至少一个;
聚类模块,用于利用聚类模型对多个资产数据进行聚类,得到聚类结果;
确定模块,用于基于所述聚类结果,确定每个所述资产数据的标签,其中,所述标签表征所述资产数据对应的风险等级;以及
第一训练模块,用于利用每个所述资产数据和标签,对待训练风险预测模型进行训练,以得到经训练风险预测模型。
11.一种风险预测装置,包括:
第二获取模块,用于获取待预测资产数据,其中,所述待预测资产数据包括运行数据和属性数据中的至少一个;
处理模块,用于利用风险预测模型处理所述待预测资产数据,得到针对所述待预测资产数据的预测结果,其中,所述针对所述待预测资产数据的预测结果表征所述资产数据对应的风险等级;
其中,所述风险预测装置还包括第二训练模块,所述第二训练模块用于利用根据权利要求1-7中任意一项所述的训练方法来训练待训练风险预测模型,以获得所述风险预测模型。
12.一种计算设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求1-7中任一项所述的方法。
13.一种计算设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器执行根据权利要求8-9中任一项所述的方法。
14.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1-7中任一项所述的方法。
15.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求8-9中任一项所述的方法。
16.一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现根据权利要求1-7中任一项所述的方法。
17.一种计算机程序产品,所述计算机程序产品包括计算机可执行指令,所述指令在被执行时用于实现根据权利要求8-9中任一项所述的方法。
CN202011644258.7A 2020-12-31 2020-12-31 风险预测模型的训练方法、装置、计算设备和介质 Pending CN114693052A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011644258.7A CN114693052A (zh) 2020-12-31 2020-12-31 风险预测模型的训练方法、装置、计算设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011644258.7A CN114693052A (zh) 2020-12-31 2020-12-31 风险预测模型的训练方法、装置、计算设备和介质

Publications (1)

Publication Number Publication Date
CN114693052A true CN114693052A (zh) 2022-07-01

Family

ID=82135603

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011644258.7A Pending CN114693052A (zh) 2020-12-31 2020-12-31 风险预测模型的训练方法、装置、计算设备和介质

Country Status (1)

Country Link
CN (1) CN114693052A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115659197A (zh) * 2022-12-28 2023-01-31 湖南财政经济学院 数据安全监测模型训练方法及应用方法、装置和存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115659197A (zh) * 2022-12-28 2023-01-31 湖南财政经济学院 数据安全监测模型训练方法及应用方法、装置和存储介质

Similar Documents

Publication Publication Date Title
US10565442B2 (en) Picture recognition method and apparatus, computer device and computer- readable medium
US20180260531A1 (en) Training random decision trees for sensor data processing
US10095981B1 (en) Multi-state quantum optimization engine
CN108280477B (zh) 用于聚类图像的方法和装置
WO2018157752A1 (en) Approximate random number generator by empirical cumulative distribution function
CN111340233B (zh) 机器学习模型的训练方法及装置、样本处理方法及装置
CN113313053B (zh) 图像处理方法、装置、设备、介质及程序产品
CN108681751B (zh) 确定事件影响因素的方法及终端设备
US20210312290A1 (en) Method for recommending object, computing device and computer-readable storage medium
CN113420804A (zh) 数据处理方法、装置、网络设备及存储介质
CN111611390B (zh) 一种数据处理方法及装置
CN113657483A (zh) 模型训练方法、目标检测方法、装置、设备以及存储介质
CN111582488A (zh) 一种事件推演方法及装置
US10339471B2 (en) Ensemble based labeling
CN112613617A (zh) 基于回归模型的不确定性估计方法和装置
CN114693052A (zh) 风险预测模型的训练方法、装置、计算设备和介质
CN113986674A (zh) 时序数据的异常检测方法、装置和电子设备
CN112783508A (zh) 文件的编译方法、装置、设备以及存储介质
Lim et al. More powerful selective kernel tests for feature selection
CN109145207B (zh) 一种基于分类指标预测的信息个性化推荐方法及装置
CN111046892A (zh) 异常识别方法和装置
CN114898184A (zh) 模型训练方法、数据处理方法、装置及电子设备
CN114882315A (zh) 样本生成方法、模型训练方法、装置、设备及介质
CN110705695B (zh) 搜索模型结构的方法、装置、设备和存储介质
CN114067415A (zh) 回归模型的训练方法、对象评估方法、装置、设备和介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination