CN112465411A - 一种风险预测方法、装置及设备 - Google Patents

一种风险预测方法、装置及设备 Download PDF

Info

Publication number
CN112465411A
CN112465411A CN202110111444.2A CN202110111444A CN112465411A CN 112465411 A CN112465411 A CN 112465411A CN 202110111444 A CN202110111444 A CN 202110111444A CN 112465411 A CN112465411 A CN 112465411A
Authority
CN
China
Prior art keywords
risk
enterprise
prediction
predicted
hidden markov
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110111444.2A
Other languages
English (en)
Other versions
CN112465411B (zh
Inventor
孙宝林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Hangzhou Information Technology Co Ltd
Ant Blockchain Technology Shanghai Co Ltd
Original Assignee
Alipay Hangzhou Information Technology Co Ltd
Ant Blockchain Technology Shanghai Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Hangzhou Information Technology Co Ltd, Ant Blockchain Technology Shanghai Co Ltd filed Critical Alipay Hangzhou Information Technology Co Ltd
Priority to CN202110111444.2A priority Critical patent/CN112465411B/zh
Publication of CN112465411A publication Critical patent/CN112465411A/zh
Application granted granted Critical
Publication of CN112465411B publication Critical patent/CN112465411B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Pure & Applied Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Probability & Statistics with Applications (AREA)
  • Artificial Intelligence (AREA)
  • Algebra (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本说明书实施例公开了一种风险预测方法、装置及设备,所述方法包括:通过从区块链系统中获取待预测企业的具有时间顺序的风险标签序列,将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;预测结果中包括每个风险对应的预测概率,将预测概率达到预设阈值的风险作为所述待预测企业的预测风险,将预测得到的预测风险发送给相关用户。

Description

一种风险预测方法、装置及设备
技术领域
本申请涉及计算机技术领域,尤其涉及一种风险预测方法、装置及设备。
背景技术
区块链(Blockchain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链系统中按照时间顺序将数据区块以顺序相连的方式组合成链式数据结构,并以密码学方式保证的不可篡改和不可伪造的分布式账本。由于区块链具有去中心化、信息不可篡改、自治性等特性,区块链也受到人们越来越多的重视和应用。
风险预测是指在工作之前对工作过程中以及工作结果可能出现的事物异常进行预测制订对策从而预防事故发生的一种措施。风险预测是风险管理的重要组成部分,它是风险规避即控制的基础。
发明内容
本说明书实施例提供一种风险预测方法、装置及设备,以提前预测企业风险,提高链上风控能力。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种风险预测方法,所述方法应用于区块链系统,所述方法包括:
获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
本说明书实施例提供的一种风险预测装置,包括:
风险标签序列获取模块,用于获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
预测模块,用于将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
预测风险确定模块,用于将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
本说明书实施例提供的一种风险预测设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
本说明书实施例提供的一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现一种风险预测方法。
本说明书一个实施例实现了能够达到以下有益效果:通过获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。上述方法,基于HMM模型,根据从区块链上获取的风险标签序列,可准确预估待预测企业的风险后续发展,然后对企业风险进行综合评估,提高链上风控能力,及早预警企业风险,从而有效预防企业的后续风险发展。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本说明书实施例提供的一种风险预测方法的系统架构图;
图2是本说明书实施例提供的一种风险预测方法的流程示意图;
图3是本说明书实施例提供的一种风险预测方法的泳道示意图;
图4是本说明书实施例提供的一种风险预测装置的结构示意图;
图5是本说明书实施例提供的一种风险预测设备的结构示意图。
具体实施方式
为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
链上风控,指在区块链上提供企业风控监测。
现有技术中,提前预测重大风险,提高链上风控的核心能力。现有的链下风控场景中,风控系统需要从各个企业中拿取数据,然后综合训练风控模型。然而,在实际应用中,出于数据隐私保护,想要拿到各个企业在多个主体存在的数据是比较困难的,因此,现有方案中,链下风控模型的数据覆盖率比较低,风控能力比较弱。而链上风控场景中,一般采用分类模型,通过历史事件进行分类汇总,链上风控的关键,是尽可能早的发现监控企业风险。但风险存在一定延迟,传统链上风控,仅针对风控企业,监测企业风险,极其依赖事件的时效性,无法对后续事件发展(态势)进行预估。这就会导致风控仅能针对当前链上企业的风险 ,给出风险等级的判断,未能捕捉企业事件发展的趋势。
为了解决现有技术中的缺陷,本说明书实施例中提供的风险预测方案中,基于HMM极大似然估计,学习链上事件链条通用分布,统计出企业事件演变的内在规律,提前预测重大风险,提高链上风控的核心能力。
图1是本说明书实施例提供的一种风险预测方法的系统架构图。如图1所示,本说明书实施例提供的一种风险预测方法实施例,可以包括图1中的角色:区块链系统101、各个用户103,用户可以包括企业、机构或个人,机构如监管机构。区块链系统101可以直接获取区块链系统中其他节点对应的风险标签,从而基于这些风险标签完成一定的处理工作,如完成企业即将发生的风险预测。各个用户103可以入驻到区块链系统101中,通过调用区块链系统101中的智能合约,可以在可信的安全计算环境中执行预定的规则,从而完成例如预测企业风险的操作。
接下来,将针对说明书实施例提供的一种风险预测方法结合附图进行具体说明:
图2是本说明书实施例提供的一种风险预测方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。在本说明书实施例中,执行主体可以是风险预测系统、风险监管平台,也可以是区块链系统中的任意一个节点。即具有风险预测功能设备或者应用服务端都可以作为本说明书实施例的执行主体。在后续步骤中,为了描述方便,将执行主体用“系统”代替。
如图2所示,该流程可以包括以下步骤:
步骤202:获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态。
风险标签序列可以是风险标签集合。其中,风险标签可以指的是待预测企业对应的风险打标,例如:风险标签可以用于表示待预测企业已产生的经营状态。企业的经营状态可以包括:股市带帽、经营停产、资金紧张、经营风险、涉嫌违法以及经营停产等。企业在发生风险时,风险系统可以对该企业打上相应的风险标签,并将这些风险标签上传到区块链系统中进行存储。
在获取风险标签时,可以直接从区块链系统中获取,此时,可能获取到企业在不同的主体对应的风险数据,从而提高数据的覆盖率,以提高训练得到的风险预测模型的预测精度。
另外,风险标签序列中的风险标签按照时间顺序进行排列的。以便于了解待预测企业的风险发展态势。从风险标签序列中,了解待预测企业按照时间顺序,已产生的风险。
在实际应用场景中,对于每个企业,都可以通过检测企业各维度信息的风险标签,精准绘制企业的风险画像,从而对企业的风险进行评估。其中,企业的风险画像可以理解为将企业对应的每个风险抽象成标签,利用这些标签对企业的风险情况进行描述,以便整体了解具体企业的风险情况,有效评估企业的风险,展现业务风险全貌。例如:在本方案中,可以从工商、司法、舆情等多个维度,以“事件”形式,进行企业风险画像刻画,例如“经营停产”、“资金紧张”、“股市带帽”等。对应生成企业的风险标签。
步骤204:将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;所述风险表示所述待预测企业后续可能产生的风险。
隐马尔可夫模型(Hidden Markov Model,简称HMM),是一种统计模型,可以用来描述一个含有隐含未知参数的马尔可夫过程。从可观察的参数中确定该过程的隐含参数。然后利用这些参数进行进一步的分析,例如模式识别。在HMM中观察到的事件是状态的随机函数,因此该模型是一个双重随机过程,即一个观察状态,一个隐藏状态。可以应用于模式识别、词性标注和信息提取方面。
在本方案中,将风险标签序列输入训练完成的隐马尔可夫模型中,可以得到待预测企业的经营状态的预测结果。其中,这里的预测结果可以表示的是待预测企业按照之前的风险标签,接下来待预测企业可能会发生的各种风险对应的概率值。例如:预测结果中包括:经营停产0.99、股市利空0.97、涉嫌违法0.94。
例如:可以输入 “经营不善、资金紧张、股市带帽、涉嫌违法”的风险标签序列,然后进行编码,例如01234,代入HMM模型(ABπ)求序列的概率,得到各种风险的预测概率。
步骤206:将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
在预测时,不同预测风险的预测概率可能相同,也可能不同,在实际应用场景中,可以将预测概率大于预测阈值的风险作为待预测企业的预测风险,从而发送给需要该风险预测结果的设备。
实际应用中,如果某企业所有风险的预测概率均未达到预设阈值时,可以认为该被预测企业未预测到风险。
在一种实施方式中,当所述预测概率达到预设阈值的风险有多种时,可以将预测概率最大的风险确定为所述待预测企业的风险。
或者,可以将达到预设阈值的多个风险都确定为待预测企业的预测风险,将这些风险都推送给查询方或者退给被预测企业,以提示被预测企业及时关注企业的自身风险,规避预测风险的发生。
在另一种实施方式中,当预测概率达到预设阈值的风险只有一种时,将该风险确定为待预测企业的预测风险。
应当理解,本说明书一个或多个实施例所述的方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。
图2中的方法,通过获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。上述方法,基于HMM模型,根据从区块链上获取的风险标签序列,可准确预估待预测企业的风险后续发展,然后对企业风险进行综合评估,提高链上风控能力,及早预警企业风险,从而有效预防企业的后续风险发展。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
可选的,所述获取待预测企业的风险标签序列,具体可以包括:
获取待预测企业的标识信息;
基于所述标识信息,从所述区块链系统中获取所述标识信息对应的风险标签集合;所述标识信息与风险标签之间的映射关系信息存储在所述区块链系统中;
按照所述风险标签的时间戳将对所述风险标签集合中的风险标签进行排序,得到所述风险标签序列。
需要说明的是,区块链是一个通过去中心化和去信任的方式集体维护一个可靠数据库的技术方案,其具有去中心化、分布式存储、加密及可回溯的特性。由于使用分布式核算和存储,不存在中心化的硬件或管理机构,任意节点的权利和义务都是均等的,系统中的数据块由整个系统中具有维护功能的节点来共同维护。能安全地存储数字货币交易或其他数据,信息不可伪造和篡改,区块链上的交易确认由区块链上的所有节点共同完成。
区块链技术主要具有去中心化、不可篡改性、公开透明与可溯源性、集体维护性。基于区块链的去中心化、不可篡改性和公开透明与可溯源性的特性,可以将各个企业的风险标签按照时间顺序存储在区块链中,即可以将各个企业的风险标签序列存储在区块链系统中。每个企业的风险标签信息在区块链系统中进行存储时,可以按照企业的标识信息进行存储。因此,可以预先建立企业标识与风险标签之间的映射关系,将企业标识与风险标签之间的映射关系存储在区块链系统中。
映射关系可以表示各个企业对应的多个风险标签。每个企业都对应有标识信息。该标识信息可以唯一识别各个企业,每个企业对应的风险标签,可以与对应的企业标识建立映射关系,并将映射关系信息存储在第一区块链系统中,以方便查询。需要说明的是,本方案中,在将风险标签与对应的企业标识的映射关系进行存储时,每个风险标签还可以带有时间戳,以便于获取风险标签序列时,对每个风险标签按照时间先后进行排序。
在对待预测企业进行风险预测时,可以先确定待预测企业的标识信息,然后根据标识信息从区块链系统中,确定该标识信息对应的该企业的风险标签集合,该风险标签集合中的所有风险标签都对应的是该企业已经发生过的风险。由于每个风险标签都携带有时间戳,因此,可以按照时间戳对每个风险标签进行排序。
在实际应用中,预测企业风险的操作可以主动执行,也可以接收到查询请求后执行,具体可以采用以下两种方式实现:
方式一、根据查询请求进行查询。
在获取待预测企业的风险标签序列之前,还可以包括:
获取风险查询请求;
基于所述查询请求确定待预测企业的标识信息;
基于所述标识信息,从区块链系统中获取所述标识信息对应的风险标签序列。
在此种方式中,需要说明的是,风险查询请求可以是监管机构发送的,也可以是任何一家企业发送的,还可以是个人发送的,在说明书中对此不作具体限定。在本说明书实施例中,每家机构可以入驻到区块链系统中,成为区块链系统中的一个节点,此时,区块链系统中的任意一个节点都可以发起查询请求。
区块链技术从以太坊开始支持用户在区块链网络中创建并调用一些复杂的逻辑,这是以太坊相对于比特币技术的最大进步之一。以太坊作为一个可编程区块链的核心是以太坊虚拟机(EVM),每个以太坊节点都可以运行EVM。EVM是一个图灵完备的虚拟机,这意味着可以通过它实现各种复杂的逻辑。用户在以太坊中部署和调用智能合约可以通过EVM执行。在部署阶段,用户可以将一个包含创建智能合约的交易发送至以太坊网络,该交易的data字段可以包含智能合约的代码(如字节码),该交易的to字段为空。经过交易的扩散和共识后,以太坊网络中的各个节点可以分别通过EVM执行这个交易,并生成对应的合约实例,从而完成智能合约部署。这时,区块链上可以具有一个与该智能合约对应的合约账户,该合约账户拥有一个特定的合约地址。在调用阶段,用户(可以与部署智能合约的用户相同或不同)将一个用于调用智能合约的交易发送到以太坊网络,该交易的from字段是该用户对应的外部账户的地址,to字段是所需调用的智能合约的合约地址,data字段包含调用智能合约的方法和参数。在节点间通过共识机制达成一致后,上述交易声明调用的智能合约以规定的方式在以太坊网络的每个节点上独立执行,所有执行记录和数据都保存在区块链上,所以当交易完成后,区块链上就保存了无法篡改、不会丢失的交易凭证。随着区块链技术的发展,除了EVM,还产生了很多其他类型的虚拟机,比如WASM(WebAssembly)虚拟机。
每个区块链节点都可以通过虚拟机执行智能合约的创建和调用。包含智能合约的交易和交易的执行结果都存储在区块链账本上,或者是区块链中每个全量节点存储全部账本的方式,对于隐私保护来说是一个挑战。隐私保护可以通过多种技术来实现,例如密码学技术(如同态加密Homomorphic encryption,或零知识证明Zero-knowledge proof),再如硬件隐私技术和网络隔离技术等。其中硬件隐私保护技术典型的包括可信执行环境(Trusted Execution Environment, TEE)。
例如,区块链节点均可以通过TEE实现区块链交易的安全执行环境。TEE是基于CPU硬件的安全扩展,且与外部完全隔离的可信执行环境。目前工业界十分关注TEE的方案,几乎所有主流的芯片和软件联盟都有自己的TEE解决方案,比如软件方面的TPM(TrustedPlatform Module,可信赖平台模块)以及硬件方面的Intel SGX(Software GuardExtensions, 软件保护扩展)、ARM Trustzone(信任区)和AMD PSP(Platform SecurityProcessor,平台安全处理器)等。TEE可以起到硬件黑箱作用,在TEE中执行的代码和数据即便是操作系统层都无法偷窥,只有通过代码中预先定义的接口才能对其进行操作。在效率方面,由于TEE的黑箱性质,在TEE中进行运算的是明文数据,而不是同态加密中复杂的密码学运算,计算过程效率几乎没有损失。因此,通过在区块链节点上部署TEE环境,可以在性能损失相对较小的前提下很大程度上满足区块链场景下的隐私需求。
以Intel SGX(以下简称SGX)技术为例。区块链节点可以基于SGX技术创建enclave(围圈或飞地),以作为用于执行区块链交易的TEE。其中,区块链节点利用CPU中新增的处理器指令,在内存中可以分配一部分区域 EPC(Enclave Page Cache,围圈页面缓存或飞地页面缓存),以用于驻留上述的enclave。上述EPC对应的内存区域被CPU内部的内存加密引擎MEE(Memory Encryption Engine)加密,该内存区域中的内容(enclave中的代码和数据)只有在CPU内核中才能够被解密,且用于加解密的密钥只有在EPC启动时生成并存储在CPU中。可见,enclave的安全边界只包含其自身和CPU,无论是特权或非特权软件都无法访问enclave,即便是操作系统管理员和VMM(Virtual Machine Monitor,虚拟机监视器;或称为Hypervisor)也无法影响enclave中的代码和数据,因而具有极高的安全性,并且在上述安全性保障的前提下,CPU能够在enclave中对明文形式的区块链交易进行处理,具有极高的运算效率,从而兼顾了数据安全性和计算效率。而对于进、出TEE的数据,可以是加密的,从而保障数据的隐私。
本申请实施例中,每一家企业或者其他机构都可以入驻区块链系统中,每个区块链节点可以发起查询请求,然后训练风险预测模型的过程以及采用训练完成的预测模型预测企业风险的过程都可以在区块链系统中完成,具体地,可以在区块链中的可信执行环境(TEE)中完成。可以创建链上TEE,基于CPU硬件实现的与外部完全隔离的可信执行环境。
该方式中,在接收查询请求之后进行企业的风险预测,预测结果可以推送给发出查询请求的用户。这里所指的用户可以是个人、也可以是企业或机构等。以便于向查询方推送更为准确的风险预测结果。对于区块链中的节点来说,可以将预测结果推送给区块链中的节点,可以有助于链上客户,减少投资这些可能存在风险的企业,避免资金损失。
方式二、主动预测企业风险,主动推送给相关用户。
需要说明的是,这一方式中的相关用户可以指的是被预测企业,即系统在主动预测企业即将发生的风险时,可以将预测结果发送给被预测的企业,以提示后续可能存在风险的企业根据预测结果,尽早发现自身企业即将发生的风险,针对性进行整改,规避预测风险的发生。
这一方式中,系统可以自动预测企业风险,预测的时机可以根据实际情况进行设定,例如:可以根据时间设定预测每家企业的风险的时间周期。还可以按照其他维度设置预测企业风险的时机。
所述将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险之后,还可以包括:
确定所述风险的风险等级;
根据所述风险等级生成与所述风险等级相对应的提示信息。
可选的,所述根据所述风险等级生成与所述风险等级相对应的提示信息,具体可以包括:
当所述风险等级属于低风险时,向所述待预测企业发送第一提示信息;所述第一提示信息用于提示所述待预测企业确定自身风险,并进行相应调整。
可选的,所述根据所述风险等级生成与所述风险等级相对应的提示信息,具体包括:
当所述风险等级属于高风险时,生成第二提示信息;所述第二提示信息为报警信息;
将所述报警信息发送给所述待预测企业的相关企业;
或,当所述风险等级属于高风险时,生成高危风险标签,对所述待预测企业进行标识。
其中,高危风险标签可以标识该企业存在高危风险,以便其他用户能够看到该企业的风险程度。
需要说明的是,可以根据风险等级的高低来选择预警的方式。例如:当风险等级为高风险时,向监管部门发送风险排查邮件,也可以通过其他方式(信息通知、区块链内广播)发送报警信息;当风险级别为低风险时,向待预测企业自身发送提示信息。
本实施例中,可以预先设置预测风险的风险等级,例如,第一等级,第二等级。或者高风险、中风险、低风险等。当然在其他实施例中,还可以设置更多的风险等级。不同等级的风险类别代表风险对被预测企业或其他企业造成的影响程度不同,其中,第一等级的风险或高风险造成的影响程度可以高于其他等级的风险造成的影响程度。例如:风险等级为高风险时,表明待预测企业存在较为异常的经营状态,需要发送风险告警,以通知监管部门对所述进行人工排查,并将高风险通知其他企业,以确保区块链上的其他企业了解该企业的风险情况,有助于链上客户,减少投资这些企业,避免资金损失,确保不会造成更严重的金融风险。当风险等级为低风险时,可以向待预测企业发送提示信息,以通知待预测企业进行自我排查并确认风险因素,进行自我调整。
通过上述方法,可以根据预测风险的不同等级,向用户或区块链系统中的其他节点发送对应的提示信息。给予待预测企业综合风险描述,提高链上风控能力,有助于链上客户,减少投资高风险企业,避免资金损失;同时,还可以提早发现企业的风险,提前向风险企业发送提示信息,以便风险企业提前得知自身风险,做好提前预警,规避预测风险的发生。
可选的,本说明书实施例中,在采用预测完成的风险预测模型预测待预测企业的风险时之前,需要对风险预测模型进行训练。在本说明书实施例中,风险预测模型为隐马尔可夫模型(HMM)。
HMM用于处理时间序列数据,即样本之间有时间序列关系的数据,根据给出的观测变量序列,估计对应的隐藏变量序列是什么,并对未来的观测变量做预测。
本说明书实施例通过HMM极大似然估计,准确预估事件后续发展,然后通过后续事件发展进行综合风险评估,可以及早预警企业风险。
其中,用最大似然法求解HMM参数学习问题时,由于有隐变量的存在,无法直接求得参数的解析解,必须采用EM(Expectation Maximization)算法,逐步迭代直至收敛从而求得模型参数。
为更清楚描述,可以将HMM以5元祖的形式进行表示,如<N,M,π,A,B>,其中N为模型中的状态数,状态集可表示为S={S 1,...,SN};M为观测符号数,观测结果集可以表示为O={O1,...,OM},观测结果表示每个状态可能输出的结果数目;π代表初始分布状态;A为状态转移概率矩阵,即A=(aij),其中A中的aij表示t时刻由状态Si转移到状态Sj的概率;B代表输出概率矩阵,即B={bj(Ok)},bj(Ok)=P(Ok|Sj)表示t时刻状态Sj输出观测值Ok的概率。如下为<N,M,π,A,B>的公式表示:
其中,π代表初始分布状态:
Figure DEST_PATH_IMAGE001
A为状态转移概率矩阵,即
Figure DEST_PATH_IMAGE002
B为观察向量的概率矩阵,即B=(bij)N×M(1≤j≤N,1≤k≤M);
bjk表示在状态j的情况下观察状态k出现的概率,即:
bjk=p(Vk|aj),1≤j≤N,1≤k≤M
式中,Vk表示观察状态k,aj表示j状态的转移概率,p(·)表示某状态出现的概率。
在建立HMM模型时,可以从转移概率和观测概率角度进行分析:首先,转移概率可以指用户给出先前查询数据序列后,再经过若干时间后得到用户的另一查询数据的条件概率,如相连的两节点q1,q2之间存在着一个转移概率P(q1→q2)。由于在连续查询场景下,查询数据可区分的风险取决于用户之前的查询数据,如果考虑同一主题中的先前数据,则该数据的信息增益会变高。设Xt为HMM中的风险信息,则Xt节点之间的转移概率为p(Xt|X t-1),可以对节点之间已发生的转换次数进行加权计算,即:
Figure 970837DEST_PATH_IMAGE003
。然后根据加权转移概率的方法计算用户查询中的隐私风险,即α*p(Xt|Xt-1)。
观测概率,可以指某个节点可能发生的查询行为,如用户ui经过q查询了e的概率为P(e|q)。该值基于用户的历史查询数据进行分析和计算获得,每个节点包含一组具有观测概率的观测值,将这些观测概率建模为不同用户在先前数据(p(ui|Xt))中找到的给定数据Xt的概率。用户查询特定主题的数据越多,则对用户兴趣数据的推断精确度越高,该查询风险越高。同理,采用加权计数的方式确定查询风险,即
Figure DEST_PATH_IMAGE004
。因为用户越均匀,查询隐私风险就越高,即β*p(ui|Xt)。
在建立隐马尔可夫模型时,可以先确定用户查询时的可见状态;然后建立隐马尔可夫五元组参数模型,包括状态转移概率矩阵、观测向量的概率矩阵、最初状态概率分布矢量、状态数和观测符号数。通过维特比算法(Viterbi),给定模型λ=(A,B,π)和观测序列Q ={q1,q2,...,qT},求给定观测序列条件概率P(I|Q,λ)最大的状态序列I。例如:在历史全量3000万家企业状态变化中,学习企业风险的分布规律,统计出企业的风险演变的内在规律,训练出合适的HMM表达参数。具体可以采用以下步骤实现:
所述将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果之前,还可以包括:
从区块链系统中获取多家企业的风险标签序列训练样本;
根据初始概率,初始化隐马尔可夫模型的参数;
将所述风险标签序列训练样本输入所述隐马尔可夫模型中进行训练,得到训练后的隐马尔可夫模型;
根据所述训练后的隐马尔可夫模型输出的风险与真实风险之间的差异调整所述训练后的隐马尔可夫模型的模型参数,得到训练完成的隐马尔可夫模型。
需要说明的是,训练隐马尔可夫模型的过程可以在区块链系统中完成,具体地,可以在可信执行环境(TEE)中完成。另外,训练隐马尔可夫模型的步骤可以通过调用智能合约的方式来执行。智能合约可以部署在区块链系统中,在调用阶段,用户可以将一个用于调用智能合约的交易发送到以太坊网络,该交易的from字段是该用户对应的外部账户的地址,to字段是所需调用的智能合约的合约地址,data字段包含调用智能合约的方法和参数。在节点间通过共识机制达成一致后,上述交易声明调用的智能合约以规定的方式在以太坊网络的每个节点上独立执行,所有执行记录和数据都保存在区块链上。此时,调用智能合约训练隐马尔可夫模型的过程以及训练结果都可以保存在区块链系统中,以便于后续追溯查询。
通过上述方式,训练模型的过程在区块链系统中执行,可以保证训练隐马尔可夫模型的过程安全可信。
可选的,所述将所述风险标签序列训练样本输入隐马尔可夫模型中进行训练,具体可以包括:
通过维特比算法,根据所述风险标签序列训练样本,计算状态转移概率矩阵、观测向量的概率矩阵、状态数以及观测符号数,以确定不同风险标签之间的关系分布。
其中,维特比算法(Viterbi algorithm)是一种动态规划算法。它用于寻找最有可能产生观测事件序列的维特比路径-隐含状态序列,就是求所有观测序列中的最优。
可选的,所述方法还可以包括:
生成用于证明所述风险标签序列训练样本的可信性的可验证声明,并将所述可验证声明发送至所述区块链系统中进行存储。
可选的,所述根据所述训练后的隐马尔可夫模型输出的风险与真实风险之间的差异调整所述训练后的隐马尔可夫模型的模型参数,得到训练完成的隐马尔可夫模型之后,还可以包括:
将所述训练完成的隐马尔可夫模型存储在所述区块链系统中。
需要说明的是,本说明书实施例中,训练模型时采用的样本数据、以及预测时,获取的待预测企业的风险标签序列,都可以是从区块链系统中获取的。包括训练得到的隐马尔可夫模型以及最后采用训练完成的隐马尔可夫模型预测得到的预测结果,也都可以存储在区块链系统中。
在训练模型时,获取到的训练模型需要的样本数据的可信性需要得到保证,才能确保训练得到的隐马尔可夫模型的性能。在预测过程中,输入训练完成的隐马尔可夫模型中的待预测企业的风险标签序列的可信性需要得到保证,才能确保预测得到的结果的准确性。
因此,训练隐马尔可夫模型过程中,将所述风险标签序列样本输入所述隐马尔可夫模型中进行训练之前,可以先验证风险标签序列样本的可信性。
在预测待预测企业的风险过程中,将所述风险标签序列输入训练完成的隐马尔可夫模型中进行预测之前,可以先验证待预测企业的风险标签序列的可信性。
在验证可信性时,可以确定待验证的数据中所携带的证明,该证明可以包括可验证声明(Verifiable Claim,VC)。VC也是DID中的一项重要应用。所述VC可以存储于区块链平台。
在本说明书实施例中,各个企业以及一些监管机构等,可以各自在区块链中创建一对公钥和私钥,私钥保密存储,并可以创建一个分布式数字身份(也称为去中心化标识符,Decentralized Identitfiers,DID)。可以由用户自己创建DID,也可以请求分布式身份服务(Decentralized Identity Service,DIS)系统来创建DID。DIS是一种基于区块链的身份管理方案,可以提供数字身份的创建、验证和管理等功能,从而实现规范化地管理和保护实体数据,同时保证信息流转的真实性和效率,并可以解决跨机构的身份认证和数据合作等难题。DIS系统可以与区块链平台相连。通过DIS系统可以为用户创建一个DID,并将该DID和所述公钥发送至区块链平台保存,还将该创建的DID返回给该用户。所述公钥可以包含到DIDdoc中,所述DIDdoc可以存储于区块链平台中。DIS为用户创建DID,可以基于该用户发来的公钥创建,例如采用Hash函数对该用户的公钥进行计算后创建,也可以根据该用户的其它信息(可以包括所述公钥或不包括所述公钥)创建。后者可能需要用户提供一些公钥之外的信息。
在本说明书实施例中,可以通过区块链来验证对应的VC。具体的,系统可以从区块链上获取所述DIDdoc中的公钥,验证VC的签名,从而确认所述VC是由该用户的,且是完整的,即没有经过篡改。
通过上述方法,可以将训练模型的数据样本、训练模型的过程、训练结果、待预测企业的风险标签序列以及预测结果都存储在区块链中,并且可以保证其获取到的数据的可信性,从而保证训练得到的隐马尔可夫模型的性能,以及进一步保证预测企业风险的准确性。以确保能够提前发现企业风险,并提前预警。
在将预测结果存储在区块链系统中时,可以对预测结果进行加密后再存储。即将所述待预测企业的预测风险进行加密,存储到区块链系统中;所述区块链系统中还存储有所述待预测企业的标识信息与所述风险之间的映射关系。
如果系统是主动预测企业风险时,可以向用户主动推送预测结果,也可以在预测得到企业风险之后,可以先将预测结果进行存储,在接收到用户查询请求之后再推送。具体可以包括以下步骤:
接收风险查询请求;所述查询请求中包括需查询企业的标识信息;
基于所述映射关系,从区块链系统中确定所述标识信息对应的加密后的风险;
对所述加密后的风险进行解密,得到解密后的预测风险;
将所述解密后的预测风险推送给所述查询请求的发送方。
上述实施例可以结合图3进行说明:
图3是本说明书实施例提供的一种风险预测方法的泳道示意图。
如图3所示,涉及的阶段为模型训练阶段、风险预测阶段以及预警阶段。涉及的交互方有风险预测单元、区块链系统。其中,风险预测单元可以属于区块链系统。
该图中的实现过程以系统主动预测企业风险,再推送给用户为例进行说明:
在模型训练阶段:风险预测单元从区块链系统中获取多家企业的风险标签序列训练样本,基于训练样本训练得到隐马尔可夫模型。
风险预测阶段:系统获取待预测企业的企业标识;根据企业标识确定待预测企业的具有时间顺序的风险标签序列;
将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的每个风险对应的预测概率;
将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
预警阶段:确定预测风险的风险等级,低风险时,向待预测企业发送第一提示信息;以提示待预测企业确定自身风险,并进行相应调整。高风险时,生成报警信息,发送给所述待预测企业的相关企业;或,生成高危风险标签,对所述待预测企业进行标识。
上述实施例中,可以实现以下技术效果:
1)通过HMM最大似然估计 ,计算企业后续可能发生的风险,根据历史事件,对后续风险进行演变推测,计算后续风险的极大似然概率,提前评估后续事件发展,如果属于高危事件,则会处罚报警与风险评分的紧急调整,相关同学会进行处理,严重时通知各个相关客户群体,在第一时间处理,减少资金损失。同时,可以给予待预测企业进行综合风险描述,从而有助于区块链上的客户,减少投资高危风险企业,避免资金损失。
2)将训练模型的数据样本、训练模型的过程、训练结果、待预测企业的风险标签序列以及预测结果都存储在区块链中,并且可以保证其获取到的数据的可信性,从而保证训练得到的隐马尔可夫模型的性能,以及进一步保证预测企业风险的准确性。以确保能够提前发现企业风险,并提前预警。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图4是本说明书实施例提供的一种风险预测装置的结构示意图。如图4所示,该装置可以包括:
风险标签序列获取模块402,用于获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
预测模块404,用于将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
预测风险确定模块406,用于将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
基于图4的装置,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
可选的,所述风险标签序列获取模块402,具体可以包括:
企业标识信息获取单元,用于获取待预测企业的标识信息;
风险标签集合获取单元,用于基于所述标识信息,根据所述标识信息与风险标签之间的映射关系,从所述区块链系统中获取所述标识信息对应的风险标签集合;所述标识信息与风险标签之间的映射关系信息存储在所述区块链系统中;
风险标签序列确定单元,用于按照所述风险标签的时间戳对所述风险标签集合中的风险标签进行排序,得到所述风险标签序列。
可选的,所述装置还可以用于:
当所述预测概率达到预设阈值的风险有多种时,将所述预测概率最大的风险确定为所述待预测企业的预测风险。
可选的,所述装置,还可以包括:
风险等级确定模块,用于确定所述风险的风险等级;
提示信息生成模块,用于根据所述风险等级生成与所述风险等级相对应的提示信息。
可选的,所述提示信息生成模块,具体可以包括:
第一提示信息生成单元,用于当所述风险等级属于低风险时,向所述待预测企业发送第一提示信息;所述第一提示信息用于提示所述待预测企业确定自身风险,并进行相应调整。
可选的,所述提示信息生成模块,具体可以包括:
第二提示信息生成单元,用于当所述风险等级属于高风险时,生成第二提示信息;所述第二提示信息为报警信息;
将所述报警信息发送给所述待预测企业的相关企业;
或,高危风险标签生成单元,用于当所述风险等级属于高风险时,生成高危风险标签,对所述待预测企业进行标识。
可选的,所述装置,还可以包括:
训练样本获取模块,用于从区块链系统中获取多家企业的风险标签序列训练样本;
参数初始化模块,用于根据初始概率,初始化隐马尔可夫模型的参数;
模型训练模块,用于将所述风险标签序列训练样本输入所述隐马尔可夫模型中进行训练,得到训练后的隐马尔可夫模型;
参数优化模块,用于根据所述训练后的隐马尔可夫模型输出的风险与真实风险之间的差异调整所述训练后的隐马尔可夫模型的模型参数,得到训练完成的隐马尔可夫模型。
可选的,所述模型训练模块,具体可以用于:
通过维特比算法,根据所述风险标签序列训练样本,计算状态转移概率矩阵、观测向量的概率矩阵、状态数以及观测符号数,以确定不同风险标签之间的关系分布。
可选的,所述区块链系统中可以部署有智能合约,所述智能合约可以用于执行训练所述隐马尔可夫模型的步骤。
可选的,所述装置还可以包括:
可验证声明生成模块,用于生成用于证明所述风险标签序列训练样本的可信性的可验证声明,并将所述可验证声明发送至所述区块链系统中进行存储。
可选的,所述装置,还可以包括:
模型存储模块,用于将所述训练完成的隐马尔可夫模型存储在所述区块链系统中。
可选的,所述装置,还可以包括:
预测结果加密存储模块,用于将所述待预测企业的预测风险进行加密,存储到区块链系统中;所述区块链系统中还存储有所述待预测企业的标识信息与所述风险之间的映射关系。
可选的,所述装置还可以包括:
风险查询请求接收模块,用于接收风险查询请求;所述查询请求中包括需查询企业的标识信息;
风险确定模块,用于基于所述映射关系,从区块链系统中确定所述标识信息对应的加密后的风险;
解密模块,用于对所述加密后的风险进行解密,得到解密后的预测风险;
结果发送模块,用于将所述解密后的预测风险推送给所述查询请求的发送方。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。
图5是本说明书实施例提供的一种风险预测设备的结构示意图。如图5所示,设备500可以包括:
至少一个处理器510;以及,
与所述至少一个处理器通信连接的存储器530;其中,
所述存储器530存储有可被所述至少一个处理器510执行的指令520,所述指令被所述至少一个处理器510执行,以使所述至少一个处理器510能够:
获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
基于同样的思路,本说明书实施例还提供了上述方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现以下方法:
获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device, PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字符系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20 以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字符助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字符多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
以上所述仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (28)

1.一种风险预测方法,所述方法包括:
获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
2.根据权利要求1所述的方法,所述获取待预测企业的风险标签序列,具体包括:
获取待预测企业的标识信息;
基于所述标识信息,根据所述标识信息与风险标签之间的映射关系,从所述区块链系统中获取所述标识信息对应的风险标签集合;所述标识信息与风险标签之间的映射关系信息存储在所述区块链系统中;
按照所述风险标签的时间戳对所述风险标签集合中的风险标签进行排序,得到所述风险标签序列。
3.根据权利要求1所述的方法,还包括:
当所述预测概率达到预设阈值的风险有多种时,将所述预测概率最大的风险确定为所述待预测企业的预测风险。
4.根据权利要求1所述的方法,所述将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险之后,还包括:
确定所述风险的风险等级;
根据所述风险等级生成与所述风险等级相对应的提示信息。
5.根据权利要求4所述的方法,所述根据所述风险等级生成与所述风险等级相对应的提示信息,具体包括:
当所述风险等级属于低风险时,向所述待预测企业发送第一提示信息;所述第一提示信息用于提示所述待预测企业确定自身风险,并进行相应调整。
6.根据权利要求4所述的方法,所述根据所述风险等级生成与所述风险等级相对应的提示信息,具体包括:
当所述风险等级属于高风险时,生成第二提示信息;所述第二提示信息为报警信息;
将所述报警信息发送给所述待预测企业的相关企业;
或,当所述风险等级属于高风险时,生成高危风险标签,对所述待预测企业进行标识。
7.根据权利要求1所述的方法,所述将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果之前,还包括:
从区块链系统中获取多家企业的风险标签序列训练样本;
根据初始概率,初始化隐马尔可夫模型的参数;
将所述风险标签序列训练样本输入所述隐马尔可夫模型中进行训练,得到训练后的隐马尔可夫模型;
根据所述训练后的隐马尔可夫模型输出的风险与真实风险之间的差异调整所述训练后的隐马尔可夫模型的模型参数,得到训练完成的隐马尔可夫模型。
8.根据权利要求7所述的方法,所述将所述风险标签序列训练样本输入隐马尔可夫模型中进行训练,具体包括:
通过维特比算法,根据所述风险标签序列训练样本,计算状态转移概率矩阵、观测向量的概率矩阵、状态数以及观测符号数,以确定不同风险标签之间的关系分布。
9.根据权利要求7所述的方法,所述区块链系统中部署有智能合约,所述智能合约用于执行训练所述隐马尔可夫模型的步骤。
10.根据权利要求7所述的方法,所述方法还包括:
生成用于证明所述风险标签序列训练样本的可信性的可验证声明,并将所述可验证声明发送至所述区块链系统中进行存储。
11.根据权利要求7所述的方法,所述根据所述训练后的隐马尔可夫模型输出的风险与真实风险之间的差异调整所述训练后的隐马尔可夫模型的模型参数,得到训练完成的隐马尔可夫模型之后,还包括:
将所述训练完成的隐马尔可夫模型存储在所述区块链系统中。
12.根据权利要求1所述的方法,所述将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险之后,还包括:
将所述待预测企业的预测风险进行加密,存储到区块链系统中;所述区块链系统中还存储有所述待预测企业的标识信息与所述风险之间的映射关系。
13.根据权利要求12所述的方法,还包括:
接收风险查询请求;所述查询请求中包括需查询企业的标识信息;
基于所述映射关系,从区块链系统中确定所述标识信息对应的加密后的风险;
对所述加密后的风险进行解密,得到解密后的预测风险;
将所述解密后的预测风险推送给所述查询请求的发送方。
14.一种风险预测装置,包括:
风险标签序列获取模块,用于获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
预测模块,用于将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
预测风险确定模块,用于将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
15.根据权利要求14所述的装置,所述风险标签序列获取模块,具体包括:
企业标识信息获取单元,用于获取待预测企业的标识信息;
风险标签集合获取单元,用于基于所述标识信息,根据所述标识信息与风险标签之间的映射关系,从所述区块链系统中获取所述标识信息对应的风险标签集合;所述标识信息与风险标签之间的映射关系信息存储在所述区块链系统中;
风险标签序列确定单元,用于按照所述风险标签的时间戳对所述风险标签集合中的风险标签进行排序,得到所述风险标签序列。
16.根据权利要求14所述的装置,还用于:
当所述预测概率达到预设阈值的风险有多种时,将所述预测概率最大的风险确定为所述待预测企业的预测风险。
17.根据权利要求14所述的装置,所述装置,还包括:
风险等级确定模块,用于确定所述风险的风险等级;
提示信息生成模块,用于根据所述风险等级生成与所述风险等级相对应的提示信息。
18.根据权利要求17所述的装置,所述提示信息生成模块,具体包括:
第一提示信息生成单元,用于当所述风险等级属于低风险时,向所述待预测企业发送第一提示信息;所述第一提示信息用于提示所述待预测企业确定自身风险,并进行相应调整。
19.根据权利要求17所述的装置,所述提示信息生成模块,具体包括:
第二提示信息生成单元,用于当所述风险等级属于高风险时,生成第二提示信息;所述第二提示信息为报警信息;
将所述报警信息发送给所述待预测企业的相关企业;
或,高危风险标签生成单元,用于当所述风险等级属于高风险时,生成高危风险标签,对所述待预测企业进行标识。
20.根据权利要求14所述的装置,所述装置,还包括:
训练样本获取模块,用于从区块链系统中获取多家企业的风险标签序列训练样本;
参数初始化模块,用于根据初始概率,初始化隐马尔可夫模型的参数;
模型训练模块,用于将所述风险标签序列训练样本输入所述隐马尔可夫模型中进行训练,得到训练后的隐马尔可夫模型;
参数优化模块,用于根据所述训练后的隐马尔可夫模型输出的风险与真实风险之间的差异调整所述训练后的隐马尔可夫模型的模型参数,得到训练完成的隐马尔可夫模型。
21.根据权利要求20所述的装置,所述模型训练模块,具体用于:
通过维特比算法,根据所述风险标签序列训练样本,计算状态转移概率矩阵、观测向量的概率矩阵、状态数以及观测符号数,以确定不同风险标签之间的关系分布。
22.根据权利要求20所述的装置,所述区块链系统中部署有智能合约,所述智能合约用于执行训练所述隐马尔可夫模型的步骤。
23.根据权利要求20所述的装置,所述装置还包括:
可验证声明生成模块,用于生成用于证明所述风险标签序列训练样本的可信性的可验证声明,并将所述可验证声明发送至所述区块链系统中进行存储。
24.根据权利要求20所述的装置,所述装置,还包括:
模型存储模块,用于将所述训练完成的隐马尔可夫模型存储在所述区块链系统中。
25.根据权利要求14所述的装置,所述装置,还包括:
预测结果加密存储模块,用于将所述待预测企业的预测风险进行加密,存储到区块链系统中;所述区块链系统中还存储有所述待预测企业的标识信息与所述风险之间的映射关系。
26.根据权利要求25所述的装置,还包括:
风险查询请求接收模块,用于接收风险查询请求;所述查询请求中包括需查询企业的标识信息;
风险确定模块,用于基于所述映射关系,从区块链系统中确定所述标识信息对应的加密后的风险;
解密模块,用于对所述加密后的风险进行解密,得到解密后的预测风险;
结果发送模块,用于将所述解密后的预测风险推送给所述查询请求的发送方。
27.一种风险预测设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待预测企业的风险标签序列;所述风险标签序列中包括具有时间顺序的风险标签;所述风险标签序列存储在区块链系统中;所述风险标签用于表示所述待预测企业已产生的经营状态;
将所述风险标签序列输入训练完成的隐马尔可夫模型中,得到对于所述待预测企业的经营状态的预测结果;所述预测结果中包括每个风险对应的预测概率;
将所述预测概率达到预设阈值的风险作为所述待预测企业的预测风险。
28.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现权利要求1至13中任一项所述的风险预测方法。
CN202110111444.2A 2021-01-27 2021-01-27 一种风险预测方法、装置及设备 Active CN112465411B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110111444.2A CN112465411B (zh) 2021-01-27 2021-01-27 一种风险预测方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110111444.2A CN112465411B (zh) 2021-01-27 2021-01-27 一种风险预测方法、装置及设备

Publications (2)

Publication Number Publication Date
CN112465411A true CN112465411A (zh) 2021-03-09
CN112465411B CN112465411B (zh) 2021-06-04

Family

ID=74802431

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110111444.2A Active CN112465411B (zh) 2021-01-27 2021-01-27 一种风险预测方法、装置及设备

Country Status (1)

Country Link
CN (1) CN112465411B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113127542A (zh) * 2021-05-06 2021-07-16 郑州航空工业管理学院 一种数据异常分析方法和装置
CN113177361A (zh) * 2021-05-14 2021-07-27 中国电建集团成都勘测设计研究院有限公司 基于不确定性分析的动态机械故障预测及风险评估方法
CN113361962A (zh) * 2021-06-30 2021-09-07 支付宝(杭州)信息技术有限公司 基于区块链网络识别企业风险性的方法及装置
CN113436006A (zh) * 2021-07-07 2021-09-24 中国银行股份有限公司 基于区块链的贷款风险预测方法及装置
CN113569263A (zh) * 2021-07-30 2021-10-29 拉扎斯网络科技(上海)有限公司 跨私域数据的安全处理方法、装置及电子设备
CN113592287A (zh) * 2021-07-27 2021-11-02 支付宝(杭州)信息技术有限公司 风险评估方法和装置
US11223644B2 (en) * 2017-12-15 2022-01-11 Advanced New Technologies Co., Ltd. Graphical structure model-based prevention and control of abnormal accounts
CN114118526A (zh) * 2021-10-29 2022-03-01 中国建设银行股份有限公司 一种企业风险预测方法、装置、设备及存储介质
CN114239732A (zh) * 2021-12-21 2022-03-25 深圳前海微众银行股份有限公司 有序分类标签确定方法、装置、电子设备及存储介质
CN114553516A (zh) * 2022-02-18 2022-05-27 支付宝(杭州)信息技术有限公司 一种数据的处理方法、装置及设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及系统
CN109523117A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 风险预测方法、装置、计算机设备和存储介质
CN109523116A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 企业风险分析方法、装置、计算机设备和存储介质
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN110633919A (zh) * 2019-09-27 2019-12-31 支付宝(杭州)信息技术有限公司 经营实体的评估方法及其装置
CN112150013A (zh) * 2020-09-27 2020-12-29 平安资产管理有限责任公司 一种企业风险预警方法、装置、设备及可读存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及系统
CN109523117A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 风险预测方法、装置、计算机设备和存储介质
CN109523116A (zh) * 2018-10-11 2019-03-26 平安科技(深圳)有限公司 企业风险分析方法、装置、计算机设备和存储介质
CN109657837A (zh) * 2018-11-19 2019-04-19 平安科技(深圳)有限公司 违约概率预测方法、装置、计算机设备和存储介质
CN110633919A (zh) * 2019-09-27 2019-12-31 支付宝(杭州)信息技术有限公司 经营实体的评估方法及其装置
CN112150013A (zh) * 2020-09-27 2020-12-29 平安资产管理有限责任公司 一种企业风险预警方法、装置、设备及可读存储介质

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11223644B2 (en) * 2017-12-15 2022-01-11 Advanced New Technologies Co., Ltd. Graphical structure model-based prevention and control of abnormal accounts
CN113127542A (zh) * 2021-05-06 2021-07-16 郑州航空工业管理学院 一种数据异常分析方法和装置
CN113177361A (zh) * 2021-05-14 2021-07-27 中国电建集团成都勘测设计研究院有限公司 基于不确定性分析的动态机械故障预测及风险评估方法
CN113177361B (zh) * 2021-05-14 2022-04-29 中国电建集团成都勘测设计研究院有限公司 基于不确定性分析的动态机械故障预测及风险评估方法
CN113361962A (zh) * 2021-06-30 2021-09-07 支付宝(杭州)信息技术有限公司 基于区块链网络识别企业风险性的方法及装置
CN113436006A (zh) * 2021-07-07 2021-09-24 中国银行股份有限公司 基于区块链的贷款风险预测方法及装置
CN113592287A (zh) * 2021-07-27 2021-11-02 支付宝(杭州)信息技术有限公司 风险评估方法和装置
CN113569263A (zh) * 2021-07-30 2021-10-29 拉扎斯网络科技(上海)有限公司 跨私域数据的安全处理方法、装置及电子设备
CN114118526A (zh) * 2021-10-29 2022-03-01 中国建设银行股份有限公司 一种企业风险预测方法、装置、设备及存储介质
CN114239732A (zh) * 2021-12-21 2022-03-25 深圳前海微众银行股份有限公司 有序分类标签确定方法、装置、电子设备及存储介质
CN114553516A (zh) * 2022-02-18 2022-05-27 支付宝(杭州)信息技术有限公司 一种数据的处理方法、装置及设备

Also Published As

Publication number Publication date
CN112465411B (zh) 2021-06-04

Similar Documents

Publication Publication Date Title
CN112465411B (zh) 一种风险预测方法、装置及设备
EP3884411B1 (en) Cryptocurrency based malware and ransomware detection systems and methods
Huong et al. Federated learning-based explainable anomaly detection for industrial control systems
US11516240B2 (en) Detection of anomalies associated with fraudulent access to a service platform
US20190340615A1 (en) Cognitive methodology for sequence of events patterns in fraud detection using event sequence vector clustering
US20190340614A1 (en) Cognitive methodology for sequence of events patterns in fraud detection using petri-net models
US11424993B1 (en) Artificial intelligence system for network traffic flow based detection of service usage policy violations
US11663329B2 (en) Similarity analysis for automated disposition of security alerts
CN111814193B (zh) 一种信息共享方法、装置及设备
Rouzbahani et al. A snapshot ensemble deep neural network model for attack detection in industrial internet of things
CN111818186A (zh) 一种信息共享方法和系统
US20200082104A1 (en) Protecting data security with hierarchical authorization analysis
Widder et al. Identification of suspicious, unknown event patterns in an event cloud
CN118132650A (zh) 一种基于食品的检验数据共享方法及系统
CN111797942A (zh) 用户信息的分类方法及装置、计算机设备、存储介质
Kanhere et al. A survey on outlier detection in financial transactions
CN113672654B (zh) 数据查询方法、装置、计算机设备和存储介质
US20220222683A1 (en) Labeling optimization through image clustering
US20240073229A1 (en) Real time behavioral alert processing in computing environments
Kumar et al. Trust Evaluation-based Machine Learning for WSNs
Liu et al. Network anomaly detection system with optimized DS evidence theory
Zhang et al. GAN-based abnormal transaction detection in Bitcoin
Padmanaban et al. Security analytics for heterogeneous Web
Reddy et al. Utilization of AI for Streamlining and Optimizing Credit Decision Process and Security in Banking Sector
Mall et al. Comparative Analysis of Anomaly-Based Intrusion Detection System on Artificial Intelligence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40047461

Country of ref document: HK