CN111932268A - 企业风险识别方法及装置 - Google Patents

企业风险识别方法及装置 Download PDF

Info

Publication number
CN111932268A
CN111932268A CN202010766421.0A CN202010766421A CN111932268A CN 111932268 A CN111932268 A CN 111932268A CN 202010766421 A CN202010766421 A CN 202010766421A CN 111932268 A CN111932268 A CN 111932268A
Authority
CN
China
Prior art keywords
deviation
index
enterprise
data
target enterprise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010766421.0A
Other languages
English (en)
Other versions
CN111932268B (zh
Inventor
范奇峰
卢健
章涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010766421.0A priority Critical patent/CN111932268B/zh
Publication of CN111932268A publication Critical patent/CN111932268A/zh
Application granted granted Critical
Publication of CN111932268B publication Critical patent/CN111932268B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q20/00Payment architectures, schemes or protocols
    • G06Q20/38Payment protocols; Details thereof
    • G06Q20/40Authorisation, e.g. identification of payer or payee, verification of customer or shop credentials; Review and approval of payers, e.g. check credit lines or negative lists
    • G06Q20/401Transaction verification
    • G06Q20/4016Transaction verification involving fraud or risk level assessment in transaction processing

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Computer Security & Cryptography (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本申请实施例提供一种企业风险识别方法及装置,可用于人工智能技术领域,方法包括:自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据;基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值;根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。本申请能够有效提高企业金融服务风险识别的效率、全面性及准确性,能够有效提高金融机构对存在金融服务风险的企业的风险控制的及时性及有效性。

Description

企业风险识别方法及装置
技术领域
本申请涉及数据处理技术领域,特别涉及人工智能技术领域,具体涉及企业风险识别方法及装置。
背景技术
为顺应互联网金融时代商业银行的业务运营变化,强化业务运营风险的实质有效控制,如商业银行等金融机构需要通过建立自动风险识别方式,来替代对法人用户风险信息的传统识别模式,提升风险识别的精准性。
目前,金融机构自动对企业进行风险识别的方式通常有两种方式,其一为基于企业用户在金融机构的交易信息进行风险识别,然而该方式由于单角度及单环节的识别过程,存在识别规则固化、过分关注操作失误以及核查难度高等问题;无法全面、及时地识别到企业用户的金融服务风险;其二为针对各项企业运营信息应用同一种风险预测模型进行金融服务风险识别,然而,由于应用模型的形式单一,无法有针对性地对各项企业运营信息进行区分识别,因此,已造成风险识别过程的针对性差、效率低及准确性差的问题。
也就是说,现有的企业风险识别方式无法同时满足企业用户的金融服务风险识别的全面性、效率及准确性。
发明内容
针对现有技术中的问题,本申请提供一种企业风险识别方法及装置,能够有效提高企业金融服务风险识别的效率、全面性及准确性,能够有效提高金融机构对存在金融服务风险的企业的风险控制的及时性及有效性。
为解决上述技术问题,本申请提供以下技术方案:
第一方面,本申请提供一种企业风险识别方法,包括:
自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据;
基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值;
根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
进一步地,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;
相对应的,所述基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值,包括:
选取预设的正态分布算法确定样本数据大于或等于样本阈值的金额偏离指标的偏离值;
选取预设的近似正态分布算法确定样本数据小于样本阈值的金额偏离指标的偏离值;
以及,选取预设的经验概率分布算法确定所述非金额偏离指标的偏离值。
进一步地,所述根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理,包括:
根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分;
基于所述偏离汇总得分判断所述目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
进一步地,所述根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分,包括:
根据预获取的所述目标企业的上下游数据中的交易双方账户名称的余弦相似度确定所述目标企业的上下游合理性偏移值;
以及,根据预获取的所述目标企业的现金单笔支取数据,确定对应的现金类偏移值;
对各个所述运营指标的偏离值、上下游合理性偏移值和现金类偏移值进行汇总处理,获取该目标企业的偏离汇总得分。
进一步地,在所述自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据之前,还包括:
根据预存储的业务源数据分别生成对应的明细层基础数据和属性层基础数据;
基于预设的业务场景需求信息、明细层基础数据和属性层基础数据,生成并存储各个所述运营指标,其中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
进一步地,所述自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据,包括:
获取目标企业的用户数据;
自所述目标企业的用户数据中删除由金融机构主动发起的交易数据,以得到所述目标企业的运营样本数据,其中,该运营样本数据包括:企业经营数据和由目标用户主动发起的交易数据;
在所述目标企业的企业经营数据和由目标用户主动发起的交易数据中选取与预设的各个运营指标分别对应的样本数据。
第二方面,本申请提供一种企业风险识别装置,包括:
样本获取模块,用于自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据;
指标计算模块,用于基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值;
风险识别模块,用于根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
进一步地,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;
相对应的,所述指标计算模块包括:
正态分布计算单元,用于选取预设的正态分布算法确定样本数据大于或等于样本阈值的金额偏离指标的偏离值;
近似正态分布计算单元,用于选取预设的近似正态分布算法确定样本数据小于样本阈值的金额偏离指标的偏离值;
经验概率分布计算单元,用于选取预设的经验概率分布算法确定所述非金额偏离指标的偏离值。
进一步地,所述风险识别模块包括:
汇总得分单元,用于根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分;
事后风控单元,用于基于所述偏离汇总得分判断所述目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
进一步地,所述汇总得分单元用于执行下述内容:
根据预获取的所述目标企业的上下游数据中的交易双方账户名称的余弦相似度确定所述目标企业的上下游合理性偏移值;
以及,根据预获取的所述目标企业的现金单笔支取数据,确定对应的现金类偏移值;
对各个所述运营指标的偏离值、上下游合理性偏移值和现金类偏移值进行汇总处理,获取该目标企业的偏离汇总得分。
进一步地,还包括:指标设置模块,用于执行下述内容:
根据预存储的业务源数据分别生成对应的明细层基础数据和属性层基础数据;
基于预设的业务场景需求信息、明细层基础数据和属性层基础数据,生成并存储各个所述运营指标,其中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
进一步地,所述样本获取模块用于执行下述内容:
获取目标企业的用户数据;
自所述目标企业的用户数据中删除由金融机构主动发起的交易数据,以得到所述目标企业的运营样本数据,其中,该运营样本数据包括:企业经营数据和由目标用户主动发起的交易数据;
在所述目标企业的企业经营数据和由目标用户主动发起的交易数据中选取与预设的各个运营指标分别对应的样本数据。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的企业风险识别方法。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的企业风险识别方法。
由上述技术方案可知,本申请提供的一种企业风险识别方法及装置,方法包括:自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据;基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值;根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理;通过预先设立运营指标,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性;通过基于不同类型的运营指标,选取不同的偏离单体指标获取方式进行运营指标的偏离值获取,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率;通过若根据各个运营指标的偏离值确定目标企业存在运营风险,则对该目标企业进行金融服务的事后风险控制处理,能够有效提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性,并能够有效提高金融企业的客户体验,使得金融企业能够以企业客户为中心,提供一种多维度、连续性及全面性的法人客户运营风险识别模式,能够在覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提升风险识别的精准性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例中的企业风险识别方法的流程示意图。
图2是本申请实施例中的包含有步骤210至步骤230的企业风险识别方法的流程示意图。
图3是本申请实施例中的包含有步骤310和步骤320的企业风险识别方法的流程示意图。
图4是本申请实施例中的包含有步骤311至步骤313的企业风险识别方法的流程示意图。
图5是本申请实施例中的包含有步骤010和步骤020的企业风险识别方法的流程示意图。
图6是本申请实施例中的包含有步骤110至步骤130的企业风险识别方法的流程示意图。
图7是本申请实施例中的企业风险识别装置的第一种结构示意图。
图8是本申请实施例中的企业风险识别装置中指标计算模块的具体结构示意图。
图9是本申请实施例中的企业风险识别装置中风险识别模块的具体结构示意图。
图10是本申请实施例中的企业风险识别装置的第二种结构示意图。
图11是本申请应用实例提供的对法人客户进行风险识别的逻辑示意图。
图12是本申请应用实例提供的法人客户交易行为偏离自身模型计算流程示意图。
图13是本申请应用实例提供的利用正态分布结合应用场景进行异常检测的曲线示例图。
图14是本申请应用实例提供的利用Z-score分值衡量客户交易行为偏离情况,并进行异常监测的结果示例图。
图15是本申请应用实例提供的法人客户交易行为偏离自身单体指标的计算方法示意图。
图16是本申请应用实例提供的指标适用算法的公式、场景,以及异常刻度值的对比表示意图。
图17是本申请应用实例提供的根据模型计算结果部署事后风控策略的得分流程示意图。
图18是本申请应用实例提供的运算结果分析的显示示例图。
图19是本申请实施例中的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请公开的企业风险识别方法和装置可用于人工智能技术领域,也可用于除人工智能技术领域之外的任意领域,本申请公开的企业风险识别方法和装置的应用领域不做限定。
如商业银行等金融机构拟建立多维度、多模型组的智能风险识别体系,覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提升风险识别的精准性。通过构建智能化的运营风险识别与量化评分体系,按客户全运营风险预测概率,创建运营风险交易行为评分模型。
商业银行的历史经验表明,不管是客户蓄意欺诈银行还是客户资金被挪盗用等,多数涉案的企业客户的经验数据较自身习惯出现了重大偏离,属于敏感性较强的运营风险关键特征,通过运营数据偏离分析,有助于对当前尚无法明确界定、针对性建模的客户不良行为、内外部欺诈等风险进行覆盖。
本申请在创建对公客户行为偏离模型:对客户历史习惯、个体行为偏离进行分析,通过创建偏离指标计算命中指标得分。由于客户风险指标数据类型多样,存在部分客户的样本数量少、部分指标非数值型等技术特征,对于样本少的客户,以及非数值型指标,由于这些特征在对公客户风险识别中有同样的权重,故本系统需要结合近似正态分布算法、经验分布概率算法,来进行拟合处理,从而实现对公客户行为偏离程度标准化的技术效果。例如对于样本数小于15的金额类指标,以及交易对手行业偏离、交易时间偏离、交易渠道偏离、交易凭证偏离的非金额类指标,即分别采用了近似正态分布以及经验概率分布的计算方法。同时,结合上下游交易对手等历史习惯数据的动态分析,建立对公客户行为偏离指标体系,应用技术手段量化对公客户交易行为偏离程度,实现异常交易行为的有效识别,提升运营风险管控效果。
基于上述内容,本申请还提供一种用于实现企业风险识别方法中内容的企业风险识别系统,该企业风险识别系统可以分别与客户端设备和银行业务系统之间通信连接,客户端设备可以包含有用户可以访问的网银系统及移动客户终端,企业风险识别系统与银行业务系统之间具体可以通过各自的应用服务器互相访问。
其中,企业风险识别系统经客户端设备或银行业务系统接收针对目标企业客户的金融服务风险识别请求,而后自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据;基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值;根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理,通过预先设立运营指标,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性;通过基于不同类型的运营指标,选取不同的偏离单体指标获取方式进行运营指标的偏离值获取,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率;通过若根据各个运营指标的偏离值确定目标企业存在运营风险,则对该目标企业进行金融服务的事后风险控制处理,能够有效提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性,并能够有效提高金融企业的客户体验,使得金融企业能够以企业客户为中心,提供一种多维度、连续性及全面性的法人客户运营风险识别模式,能够在覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提升风险识别的精准性。
可以理解的是,所述客户端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在一种实际应用情形中,前述的企业风险识别系统和银行业务系统也可以集成为同一服务器,也就是说,该服务器即可以直接获取用户的访问请求,也可以进行企业风险识别处理,具体可以根据实际应用情形设置,本申请对此不作限定。
在另一实际应用情形中,进行企业风险识别的部分可以在如上述内容所述的企业风险识别系统执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器,用于进行企业风险识别的具体处理。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。通信单元还可以接收服务器返回的识别结果。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
上述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
本申请提供的企业风险识别方法、企业风险识别装置、电子设备和计算机可读存储介质,通过改变现有运营风险识别中基于交易,单角度、单环节的风险识别理念,解决传统识别体系中,识别规则固化、过分关注操作失误、核查难度高等问题,通过建立以客户为中心,覆盖其交易习惯、风险行为等方面多维度、连续性、全面性的法人客户运营风险识别模式,从而提升运营风险识别的前瞻性和覆盖面。
具体通过下述多个实施例进行详细说明。
为了现有的企业解决现有的风险识别方式无法同时满足企业用户的金融服务风险识别的全面性、效率及准确性的问题,本申请提供一种企业风险识别方法的实施例,参见图1,所述企业风险识别方法具体包含有如下内容:
步骤100:自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据。
在步骤100中,可以预先利用大数据技术,每日更新并整合业务源数据,形成明细层和属性层基础数据,并根据业务场景需要生成各项指标,存储至运营指标层,为风险模型计算做数据准备。
可以理解的是,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
其中,所述金额偏离指标包括:转账单笔借方金额偏离指标、同行业对手转账单笔借方金额偏离指标、同交易对手转账单笔借方金额偏离指标和转账单笔借方交易对手贷方金额偏离指标。
所述对手偏离指标包括:转账单笔借方交易对手偏离指标。
所述时间偏离指标包括:转账单笔借方交易时间偏离指标。
所述渠道偏离指标包括:转账单笔借方交易渠道偏离指标。
所述凭证偏离指标包括:转账单笔借方交易凭证偏离指标。
步骤200:基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值。
在步骤200中,在生成运营指标的基础上,结合风险控制场景的应用特征,本申请实施例对Z-Score统计学方法创建了异常检验的衍生应用,以此来量化对公客户行为偏离程度,进行行为异常检测。
步骤300:根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
在步骤300中,通过对企业运行状态偏离运算结果进行归一化处理,形成可量化的运营风险评价分值。并根据模型的评分结果建设事后风控策略。
从上述描述可知,本申请实施例提供的企业风险识别方法,通过预先设立运营指标,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性;通过基于不同类型的运营指标,选取不同的偏离单体指标获取方式进行运营指标的偏离值获取,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率;通过若根据各个运营指标的偏离值确定目标企业存在运营风险,则对该目标企业进行金融服务的事后风险控制处理,能够有效提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性,并能够有效提高金融企业的客户体验,使得金融企业能够以企业客户为中心,提供一种多维度、连续性及全面性的法人客户运营风险识别模式,能够在覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提升风险识别的精准性。
为了提供一种偏离单体指标获取的优选方式,在本申请提供的企业风险识别方法的一个实施例中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;参见图2,所述企业风险识别方法中的步骤200具体包含有如下内容:
步骤210:选取预设的正态分布算法确定样本数据大于或等于样本阈值的金额偏离指标的偏离值。
可以理解的是,样本数大于15的金额类指标,采用正态分布算法计算指标偏离值。其中,正态分布算法公式如下:
Figure BDA0002614794800000111
步骤220:选取预设的近似正态分布算法确定样本数据小于样本阈值的金额偏离指标的偏离值。
可以理解的是,样本数小于15的金额类指标,采用近似正态分布算法计算指标偏离值。其中,近似正态分布算法公式如下:
Figure BDA0002614794800000112
步骤230:选取预设的经验概率分布算法确定所述非金额偏离指标的偏离值。
可以理解的是,非金额类指标(如交易对手行业、交易时间、交易渠道、交易凭证这种分类型的指标)采用经验分布概率(相对频率)来近似描述。
经验概率分布(Empirical probability),也称为相对频率(Relativefrequency),是指特定的事件发生的次数占总体实验样本的比率,经验概率是从实验和实际观测中估算的概率。其中,经验概率分布公式如下:
Figure BDA0002614794800000113
从上述描述可知,本申请实施例提供的企业风险识别方法,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率。
为了提供一种结合上下游数据和现金数据进行分值汇总的方式,在本申请提供的企业风险识别方法的一个实施例中,参见图3,所述企业风险识别方法中的步骤300具体包含有如下内容:
步骤310:根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分。
可以理解的是,计算转账类指标,包括金额偏离指标、对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标,并按偏离值分段取不同得分。
步骤320:基于所述偏离汇总得分判断所述目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
从上述描述可知,本申请实施例提供的企业风险识别方法,能够有效提高企业金融服务风险识别的全面性、准确性及可靠性。
为了提供一种获取偏离汇总得分的优选方式,在本申请提供的企业风险识别方法的一个实施例中,参见图4,所述企业风险识别方法中的步骤310具体包含有如下内容:
步骤311:根据预获取的所述目标企业的上下游数据中的交易双方账户名称的余弦相似度确定所述目标企业的上下游合理性偏移值。
可以理解的是,在步骤311中可以进行上下游合理性判断,判断依据为基于交易本对方户名COS相似度分值,将将判断结果的概率值分段取不同得分。
步骤312:根据预获取的所述目标企业的现金单笔支取数据,确定对应的现金类偏移值。
可以理解的是,在步骤312中可以计算现金类指标,即现金单笔支取偏离指标,并按偏离值分段取不同得分。
步骤313:对各个所述运营指标的偏离值、上下游合理性偏移值和现金类偏移值进行汇总处理,获取该目标企业的偏离汇总得分。
可以理解的是,在步骤313中,可以将步骤200、步骤311和步骤312的计算结果进行汇总处理,得到法人客户交易行为偏离自身汇总得分,具体的交易行为偏离自身金额类指标命中得分规则如下表1所示:
表1
Figure BDA0002614794800000121
Figure BDA0002614794800000131
其中,转账类的对手行业偏离、时间偏离、渠道偏离、凭证偏离各指标,命中得3分。转账交易以金额偏离指标为主指标,仅当金额偏离指标命中时,累加各指标得分即为该笔交易的汇总得分。
从上述描述可知,本申请实施例提供的企业风险识别方法,能够以客户为中心,覆盖其交易习惯、风险行为等方面,形成一种多维度、连续性、全面性的企业金融服务风险识别模式,进一步提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性。
为了提供一种运营指标设置的优选方式,在本申请提供的企业风险识别方法的一个实施例中,参见图5,所述企业风险识别方法中的步骤100之前还具体包含有如下内容:
步骤010:根据预存储的业务源数据分别生成对应的明细层基础数据和属性层基础数据。
步骤020:基于预设的业务场景需求信息、明细层基础数据和属性层基础数据,生成并存储各个所述运营指标,其中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
从上述描述可知,本申请实施例提供的企业风险识别方法,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性。
为了提供一种运营样本数据筛选的优选方式,在本申请提供的企业风险识别方法的一个实施例中,参见图6,所述企业风险识别方法中的步骤100具体包含有如下内容:
步骤110:获取目标企业的用户数据。
步骤120:自所述目标企业的用户数据中删除由金融机构主动发起的交易数据,以得到所述目标企业的运营样本数据,其中,该运营样本数据包括:企业经营数据和由目标用户主动发起的交易数据。
步骤130:在所述目标企业的企业经营数据和由目标用户主动发起的交易数据中选取与预设的各个运营指标分别对应的样本数据。
从上述描述可知,本申请实施例提供的企业风险识别方法,能够有效异常数据对企业运营数据的影响,进而能够有效提高金融机构对存在金融服务风险的企业的风险控制的准确性。
从软件层面来说,本申请还提供一种用于实现所述企业风险识别方法中全部或部分内容的企业风险识别装置的实施例,参见图7,所述企业风险识别装置具体包含有如下内容:
样本获取模块10,用于自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据。
可以理解的是,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
指标计算模块20,用于基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值。
风险识别模块30,用于根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
从上述描述可知,本申请实施例提供的企业风险识别装置,通过预先设立运营指标,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性;通过基于不同类型的运营指标,选取不同的偏离单体指标获取方式进行运营指标的偏离值获取,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率;通过若根据各个运营指标的偏离值确定目标企业存在运营风险,则对该目标企业进行金融服务的事后风险控制处理,能够有效提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性,并能够有效提高金融企业的客户体验,使得金融企业能够以企业客户为中心,提供一种多维度、连续性及全面性的法人客户运营风险识别模式,能够在覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提升风险识别的精准性。
为了提供一种偏离单体指标获取的优选方式,在本申请提供的企业风险识别装置的一个实施例中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;参见图8,所述企业风险识别装置中的指标计算模块20具体包含有如下内容:
正态分布计算单元21,用于选取预设的正态分布算法确定样本数据大于或等于样本阈值的金额偏离指标的偏离值。
近似正态分布计算单元22,用于选取预设的近似正态分布算法确定样本数据小于样本阈值的金额偏离指标的偏离值。
经验概率分布计算单元23,用于选取预设的经验概率分布算法确定所述非金额偏离指标的偏离值。
从上述描述可知,本申请实施例提供的企业风险识别装置,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率。
为了提供一种结合上下游数据和现金数据进行分值汇总的方式,在本申请提供的企业风险识别装置的一个实施例中,参见图9,所述企业风险识别装置中的风险识别模块30具体包含有如下内容:
汇总得分单元31,用于根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分;
事后风控单元32,用于基于所述偏离汇总得分判断所述目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
从上述描述可知,本申请实施例提供的企业风险识别装置,能够有效提高企业金融服务风险识别的全面性、准确性及可靠性。
为了提供一种获取偏离汇总得分的优选方式,在本申请提供的企业风险识别装置的一个实施例中,所述企业风险识别装置中的汇总得分单元31具体用于执行下述内容:
步骤311:根据预获取的所述目标企业的上下游数据中的交易双方账户名称的余弦相似度确定所述目标企业的上下游合理性偏移值。
步骤312:根据预获取的所述目标企业的现金单笔支取数据,确定对应的现金类偏移值。
步骤313:对各个所述运营指标的偏离值、上下游合理性偏移值和现金类偏移值进行汇总处理,获取该目标企业的偏离汇总得分。
从上述描述可知,本申请实施例提供的企业风险识别装置,能够以客户为中心,覆盖其交易习惯、风险行为等方面,形成一种多维度、连续性、全面性的企业金融服务风险识别模式,进一步提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性。
为了提供一种运营指标设置的优选方式,在本申请提供的企业风险识别装置的一个实施例中,参见图10,所述企业风险识别装置中还具体包含有如下内容:
指标设置模块01,用于执行下述内容:
步骤010:根据预存储的业务源数据分别生成对应的明细层基础数据和属性层基础数据。
步骤020:基于预设的业务场景需求信息、明细层基础数据和属性层基础数据,生成并存储各个所述运营指标,其中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
从上述描述可知,本申请实施例提供的企业风险识别装置,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性。
为了提供一种运营样本数据筛选的优选方式,在本申请提供的企业风险识别装置的一个实施例中,所述企业风险识别装置中的样本获取模块10具体用于执行下述内容:
步骤100:获取目标企业的用户数据。
步骤200:自所述目标企业的用户数据中删除由金融机构主动发起的交易数据,以得到所述目标企业的运营样本数据,其中,该运营样本数据包括:企业经营数据和由目标用户主动发起的交易数据。
步骤300:在所述目标企业的企业经营数据和由目标用户主动发起的交易数据中选取与预设的各个运营指标分别对应的样本数据。
从上述描述可知,本申请实施例提供的企业风险识别装置,能够有效异常数据对企业运营数据的影响,进而能够有效提高金融机构对存在金融服务风险的企业的风险控制的准确性。
为了进一步说明书本方案,本申请还提供一种企业风险识别方法的具体应用实例,本申请应用实例改变现有运营风险识别中基于交易,单角度、单环节的风险识别理念,其中的企业是指金融机构的法人客户,也即,本应用实例提出一种对法人客户运营风险识别的全新方式。本申请应用实例旨在建立以客户为中心,覆盖其交易习惯、风险行为等方面多维度、连续性、全面性的法人客户运营风险识别模式。目的是解决传统识别体系中,识别规则固化、过分关注操作失误、核查难度高等问题,从而提升运营风险识别的前瞻性和覆盖面。
(一)参见图11,本申请应用实例提供的法人客户风险识别方法的过程如下:
步骤11-1:创建对公客户行为偏离指标体系。利用大数据技术,每日更新并整合业务源数据,形成明细层和属性层基础数据,并根据业务场景需要生成各项指标,存储至运营指标层,为风险模型计算做数据准备。
步骤11-2:风险模型运算。在生成运营指标的基础上,结合风险控制场景的应用特征,本申请应用实例对Z-Score统计学方法创建了异常检验的衍生应用,以此来量化对公客户行为偏离程度,进行行为异常检测。
步骤11-3:模型量化评分和事后风控策略建设。通过对法人客户行为偏离模型运算结果进行归一化处理,形成可量化的运营风险评价分值。并根据模型的评分结果建设事后风控策略。
(二)参见图12,交易行为偏离自身模型运算过程包括取数范围运算、偏离指标运算、上下游行业合理性运算、汇总得分运算四个步骤。
步骤12-1:取数范围运算。为减少异常数据对客户行为习惯数据的影响,将银行端主动发起业务、客户税款、协议资金对转等14类交易进行剔除处理,仅保留与客户经营相关或由客户主动发起的交易。
步骤12-2:偏离指标运算。根据业务场景的应用特征,本申请应用实例将指标计算方法划分为正态分布算法、近似正态分布算法和经验概率分布算法三种。
步骤12-3:上下游行业合理性运算,通过本对方户名的相似度进行判定。
由CBOW模型或者skip-gram等语言模型训练出的词的COS相似度可以表示两个词的近义距离。因为如果两个词在训练集中有着相同的上下文,那么经过CBOW模型等模型映射后输出的最后一隐含层的向量大概率下会指向同一个下文,则他们的方向就会很接近,反映出的COS夹角就会很小。
步骤12-4:汇总得分运算。根据单体指标采用的不同算法判断命中情况。
(三)参见图13,本申请应用实例中的利用正态分布结合应用场景进行异常检测的具体过程如下:
步骤13-1:统计学原理
Z-Score方法是统计学中计算当前指标的值与团体的平均数之差除以标准差所得的商数,描述当前指标偏离团体平均水平多少倍的标准差。用公式可以表示为:
Figure BDA0002614794800000181
步骤13-2:统计原理和应用场景的结合
大部分个体的行为数据是服从正态分布的。如在一段时间内,个体的行为是发生在平均水平的一定范围之内的,如果超出这个范围,被认为是极少出现的情况,也就是图13中两端0.3%的发生概率。结合法人客户交易行为的特征,Z-score分值的异常处理,可以用来作为一种法人客户行为风险检测的方法,即应用Z-Score分值的衍生应用来量化对公客户行为偏离程度。
步骤13-3:风险检测应用
一段时间内,一个对公客户的大多数交易流水发生金额是在一定范围之内(99.73%),计算Z-score分值,如果超出范围,被认为是极少出现的情况,也就是图13中两端0.3%的发生概率,即可认为是异常值。
(四)本申请应用实例中的利用Z-score分值衡量客户交易行为偏离情况,并进行异常监测的具体过程如下:
步骤14-1:根据Z-score分值计算结果,当Z>3.5时,认为该点为序列中的异常值。为方便起见将其转化为[0,100]之间的一个分数,并认为超过50分时为异常值。
归一化转化公式如下:
Figure BDA0002614794800000182
步骤14-2:抽取某地区2017年11月到2018年5月份之间的一部分对公客户的交易明细数据。
步骤14-3:对计算结果进行归一化后,可以得出某企业在这段时期的发生额曲线和每天的得分情况及异常值情况,如图14所示。
(五)参见图15,本申请应用实例中的法人客户交易行为偏离自身单体指标的计算的具体过程如下:
根据指标和样本的应用特征,本申请应用实例对于风险评分的计算应用三种指标计算方法,分别为正态分布算法、近似正态分布算法和经验概率分布算法。其中后两种计算方法是根据法人客户风险识别场景实际情况首创的异常指标计算方法。
步骤15-1:样本数大于15的金额类指标,采用正态分布算法计算指标偏离值。
其中,正态分布算法公式如下:
Figure BDA0002614794800000191
步骤15-2:样本数小于15的金额类指标,采用近似正态分布算法计算指标偏离值。
其中,近似正态分布算法公式如下:
Figure BDA0002614794800000192
步骤15-3:非金额类指标(如交易对手行业、交易时间、交易渠道、交易凭证这种分类型的指标)采用经验分布概率(相对频率)来近似描述。
经验概率分布(Empirical probability),也称为相对频率(Relativefrequency),是指特定的事件发生的次数占总体实验样本的比率,经验概率是从实验和实际观测中估算的概率。
其中,经验概率分布公式如下:
Figure BDA0002614794800000193
指标适用算法的公式、场景,以及异常刻度值如图16所示。
参见图17,本申请应用实例提供的根据模型计算结果部署事后风控策略的得分流程如下:
步骤17-1:计算转账类指标,包括金额偏离指标、对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标,并按偏离值分段取不同得分。
步骤17-2:进行上下游合理性判断,判断依据为基于交易本对方户名COS相似度分值,将将判断结果的概率值分段取不同得分。
步骤17-3:计算现金类指标,即现金单笔支取偏离指标,并按偏离值分段取不同得分。
步骤17-4:将步骤1-步骤3的计算结果进行汇总处理,得到法人客户交易行为偏离自身汇总得分,具体规则如前述表1所示。转账类的对手行业偏离、时间偏离、渠道偏离、凭证偏离各指标,命中得3分。转账交易以金额偏离指标为主指标,仅当金额偏离指标命中时,累加各指标得分即为该笔交易的汇总得分。
应用模型的评分结果进行风控,实际应用效果的案例如图18所示。
本申请应用实例优化了法人客户运营风险识别的方法,充分运用统计学原理、大数据技术,以及机器学习技术,并结合业务场景系统化设计了对公客户行为偏离指标,构建了智能化的运营风险识别与量化评分体系。技术效果上,新模型相比对标老系统模型的触发量下降40%,识别准确率提升33%,在可疑识别效果上提升较明显。在覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提高法人风险控制的有效性或智能化程度。进一步地,基于业务场景和指标体系的调整,本申请应用实例同时支持拓展到对个人客户运营风险的识别,从而进一步丰富运营风险的识别领域。
从硬件层面来说,为了现有的企业解决现有的风险识别方式无法同时满足企业用户的金融服务风险识别的全面性、效率及准确性的问题,本申请提供一种用于实现所述企业风险识别方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
图19为本申请实施例的电子设备9600的系统构成的示意框图。如图19所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图19是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
在一实施例中,企业风险识别功能可以被集成到中央处理器中。其中,中央处理器可以被配置为进行如下控制:
步骤100:自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据。
在步骤100中,可以预先利用大数据技术,每日更新并整合业务源数据,形成明细层和属性层基础数据,并根据业务场景需要生成各项指标,存储至运营指标层,为风险模型计算做数据准备。
可以理解的是,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
步骤200:基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值。
在步骤200中,在生成运营指标的基础上,结合风险控制场景的应用特征,本申请实施例对Z-Score统计学方法创建了异常检验的衍生应用,以此来量化对公客户行为偏离程度,进行行为异常检测。
步骤300:根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
在步骤300中,通过对企业运行状态偏离运算结果进行归一化处理,形成可量化的运营风险评价分值。并根据模型的评分结果建设事后风控策略。
从上述描述可知,本申请实施例提供的电子设备,通过预先设立运营指标,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性;通过基于不同类型的运营指标,选取不同的偏离单体指标获取方式进行运营指标的偏离值获取,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率;通过若根据各个运营指标的偏离值确定目标企业存在运营风险,则对该目标企业进行金融服务的事后风险控制处理,能够有效提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性,并能够有效提高金融企业的客户体验,使得金融企业能够以企业客户为中心,提供一种多维度、连续性及全面性的法人客户运营风险识别模式,能够在覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提升风险识别的精准性。
在另一个实施方式中,企业风险识别装置可以与中央处理器9100分开配置,例如可以将企业风险识别装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现企业风险识别功能。
如图19所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图19中所示的所有部件;此外,电子设备9600还可以包括图19中没有示出的部件,可以参考现有技术。
如图19所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的企业风险识别方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的企业风险识别方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤100:自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据。
在步骤100中,可以预先利用大数据技术,每日更新并整合业务源数据,形成明细层和属性层基础数据,并根据业务场景需要生成各项指标,存储至运营指标层,为风险模型计算做数据准备。
可以理解的是,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
步骤200:基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值。
在步骤200中,在生成运营指标的基础上,结合风险控制场景的应用特征,本申请实施例对Z-Score统计学方法创建了异常检验的衍生应用,以此来量化对公客户行为偏离程度,进行行为异常检测。
步骤300:根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
在步骤300中,通过对企业运行状态偏离运算结果进行归一化处理,形成可量化的运营风险评价分值。并根据模型的评分结果建设事后风控策略。
从上述描述可知,本申请实施例提供的计算机可读存储介质,通过预先设立运营指标,能够提供为企业进行金融服务风险识别的基础数据的效率、全面性及可靠性,进而提高企业金融服务风险识别的效率、准确性及可靠性;通过基于不同类型的运营指标,选取不同的偏离单体指标获取方式进行运营指标的偏离值获取,能够针对不同类型的指标进行有针对性的分值获取,进而能够有效提高企业金融服务风险识别的针对性及准确性,同时能够进一步提高企业金融服务风险识别的效率;通过若根据各个运营指标的偏离值确定目标企业存在运营风险,则对该目标企业进行金融服务的事后风险控制处理,能够有效提高对存在金融服务风险的企业的风险控制的及时性及有效性,以有效提高金融企业的运行安全性及可靠性,并能够有效提高金融企业的客户体验,使得金融企业能够以企业客户为中心,提供一种多维度、连续性及全面性的法人客户运营风险识别模式,能够在覆盖已知风险的同时挖掘未知风险,改变对法人客户风险信息的传统识别模式,提升风险识别的精准性。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (14)

1.一种企业风险识别方法,其特征在于,包括:
自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据;
基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值;
根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
2.根据权利要求1所述的企业风险识别方法,其特征在于,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;
相对应的,所述基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值,包括:
选取预设的正态分布算法确定样本数据大于或等于样本阈值的金额偏离指标的偏离值;
选取预设的近似正态分布算法确定样本数据小于样本阈值的金额偏离指标的偏离值;
以及,选取预设的经验概率分布算法确定所述非金额偏离指标的偏离值。
3.根据权利要求1所述的企业风险识别方法,其特征在于,所述根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理,包括:
根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分;
基于所述偏离汇总得分判断所述目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
4.根据权利要求3所述的企业风险识别方法,其特征在于,所述根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分,包括:
根据预获取的所述目标企业的上下游数据中的交易双方账户名称的余弦相似度确定所述目标企业的上下游合理性偏移值;
以及,根据预获取的所述目标企业的现金单笔支取数据,确定对应的现金类偏移值;
对各个所述运营指标的偏离值、上下游合理性偏移值和现金类偏移值进行汇总处理,获取该目标企业的偏离汇总得分。
5.根据权利要求1所述的企业风险识别方法,其特征在于,在所述自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据之前,还包括:
根据预存储的业务源数据分别生成对应的明细层基础数据和属性层基础数据;
基于预设的业务场景需求信息、明细层基础数据和属性层基础数据,生成并存储各个所述运营指标,其中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
6.根据权利要求1所述的企业风险识别方法,其特征在于,所述自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据,包括:
获取目标企业的用户数据;
自所述目标企业的用户数据中删除由金融机构主动发起的交易数据,以得到所述目标企业的运营样本数据,其中,该运营样本数据包括:企业经营数据和由目标用户主动发起的交易数据;
在所述目标企业的企业经营数据和由目标用户主动发起的交易数据中选取与预设的各个运营指标分别对应的样本数据。
7.一种企业风险识别装置,其特征在于,包括:
样本获取模块,用于自目标企业的运营样本数据中选取与预设的各个运营指标分别对应的样本数据;
指标计算模块,用于基于各个所述运营指标的类型以及对应的样本数据,分别选取各个所述运营指标各自对应的偏离单体指标获取方式,以分别确定各个所述运营指标的偏离值;
风险识别模块,用于根据各个所述运营指标的偏离值确定该目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
8.根据权利要求7所述的企业风险识别装置,其特征在于,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;
相对应的,所述指标计算模块包括:
正态分布计算单元,用于选取预设的正态分布算法确定样本数据大于或等于样本阈值的金额偏离指标的偏离值;
近似正态分布计算单元,用于选取预设的近似正态分布算法确定样本数据小于样本阈值的金额偏离指标的偏离值;
经验概率分布计算单元,用于选取预设的经验概率分布算法确定所述非金额偏离指标的偏离值。
9.根据权利要求7所述的企业风险识别装置,其特征在于,所述风险识别模块包括:
汇总得分单元,用于根据各个所述运营指标的偏离值、预获取的所述目标企业的上下游合理性偏移值和现金类偏移值,获取该目标企业的偏离汇总得分;
事后风控单元,用于基于所述偏离汇总得分判断所述目标企业是否存在运营风险,若是,则对该目标企业进行金融服务的事后风险控制处理。
10.根据权利要求9所述的企业风险识别装置,其特征在于,所述汇总得分单元用于执行下述内容:
根据预获取的所述目标企业的上下游数据中的交易双方账户名称的余弦相似度确定所述目标企业的上下游合理性偏移值;
以及,根据预获取的所述目标企业的现金单笔支取数据,确定对应的现金类偏移值;
对各个所述运营指标的偏离值、上下游合理性偏移值和现金类偏移值进行汇总处理,获取该目标企业的偏离汇总得分。
11.根据权利要求7所述的企业风险识别装置,其特征在于,还包括:指标设置模块,用于执行下述内容:
根据预存储的业务源数据分别生成对应的明细层基础数据和属性层基础数据;
基于预设的业务场景需求信息、明细层基础数据和属性层基础数据,生成并存储各个所述运营指标,其中,所述运营指标为转账类指标,其中,该转账类指标包括:金额偏离指标和非金额偏离指标;所述非金额偏离指标包括:对手偏离指标、时间偏离指标、渠道偏离指标和凭证偏离指标。
12.根据权利要求7所述的企业风险识别装置,其特征在于,所述样本获取模块用于执行下述内容:
获取目标企业的用户数据;
自所述目标企业的用户数据中删除由金融机构主动发起的交易数据,以得到所述目标企业的运营样本数据,其中,该运营样本数据包括:企业经营数据和由目标用户主动发起的交易数据;
在所述目标企业的企业经营数据和由目标用户主动发起的交易数据中选取与预设的各个运营指标分别对应的样本数据。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至6任一项所述的企业风险识别方法。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6任一项所述的企业风险识别方法。
CN202010766421.0A 2020-08-03 2020-08-03 企业风险识别方法及装置 Active CN111932268B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010766421.0A CN111932268B (zh) 2020-08-03 2020-08-03 企业风险识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010766421.0A CN111932268B (zh) 2020-08-03 2020-08-03 企业风险识别方法及装置

Publications (2)

Publication Number Publication Date
CN111932268A true CN111932268A (zh) 2020-11-13
CN111932268B CN111932268B (zh) 2024-01-26

Family

ID=73308210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010766421.0A Active CN111932268B (zh) 2020-08-03 2020-08-03 企业风险识别方法及装置

Country Status (1)

Country Link
CN (1) CN111932268B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465388A (zh) * 2020-12-11 2021-03-09 广东电网有限责任公司 一种基于标准分的评标专家打分偏离度评价方法、装置
CN112711577A (zh) * 2020-12-17 2021-04-27 航天信息股份有限公司 一种异常交易企业识别方法及装置
CN113723775A (zh) * 2021-08-16 2021-11-30 国网上海市电力公司 一种基于电力大数据的企业及行业运营风险的评估方法
CN113962614A (zh) * 2021-12-21 2022-01-21 深圳市迪博企业风险管理技术有限公司 一种上市公司经营异常智能审查方法及装置
CN116226213A (zh) * 2023-02-22 2023-06-06 广州集联信息技术有限公司 一种基于大数据的信息推荐系统及方法
CN116757838A (zh) * 2023-08-24 2023-09-15 中国标准化研究院 一种企业信用评价风险模型的建模方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109377050A (zh) * 2018-10-24 2019-02-22 江苏税软软件科技有限公司 一种基于风险分析及ai人工智能模型风险分析方法
CN110033171A (zh) * 2019-03-19 2019-07-19 阿里巴巴集团控股有限公司 一种识别金融企业风险的方法、系统平台和介质
CN110322089A (zh) * 2018-03-30 2019-10-11 宗略投资(上海)有限公司 企业信用风险评估方法及其系统
CN110458426A (zh) * 2019-07-26 2019-11-15 中国建设银行股份有限公司 供应商风险识别方法、装置及电子设备
CN111178704A (zh) * 2019-12-17 2020-05-19 东方微银科技(北京)有限公司 一种风险目标识别方法及设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110322089A (zh) * 2018-03-30 2019-10-11 宗略投资(上海)有限公司 企业信用风险评估方法及其系统
CN109377050A (zh) * 2018-10-24 2019-02-22 江苏税软软件科技有限公司 一种基于风险分析及ai人工智能模型风险分析方法
CN110033171A (zh) * 2019-03-19 2019-07-19 阿里巴巴集团控股有限公司 一种识别金融企业风险的方法、系统平台和介质
CN110458426A (zh) * 2019-07-26 2019-11-15 中国建设银行股份有限公司 供应商风险识别方法、装置及电子设备
CN111178704A (zh) * 2019-12-17 2020-05-19 东方微银科技(北京)有限公司 一种风险目标识别方法及设备

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112465388A (zh) * 2020-12-11 2021-03-09 广东电网有限责任公司 一种基于标准分的评标专家打分偏离度评价方法、装置
CN112711577A (zh) * 2020-12-17 2021-04-27 航天信息股份有限公司 一种异常交易企业识别方法及装置
CN113723775A (zh) * 2021-08-16 2021-11-30 国网上海市电力公司 一种基于电力大数据的企业及行业运营风险的评估方法
CN113723775B (zh) * 2021-08-16 2023-09-12 国网上海市电力公司 一种基于电力大数据的企业及行业运营风险的评估方法
CN113962614A (zh) * 2021-12-21 2022-01-21 深圳市迪博企业风险管理技术有限公司 一种上市公司经营异常智能审查方法及装置
CN116226213A (zh) * 2023-02-22 2023-06-06 广州集联信息技术有限公司 一种基于大数据的信息推荐系统及方法
CN116226213B (zh) * 2023-02-22 2023-11-10 广州集联信息技术有限公司 一种基于大数据的信息推荐系统及方法
CN116757838A (zh) * 2023-08-24 2023-09-15 中国标准化研究院 一种企业信用评价风险模型的建模方法

Also Published As

Publication number Publication date
CN111932268B (zh) 2024-01-26

Similar Documents

Publication Publication Date Title
CN111932268B (zh) 企业风险识别方法及装置
US11037229B2 (en) Fraud detection system for the faster payments system
US11809577B2 (en) Application of trained artificial intelligence processes to encrypted data within a distributed computing environment
US20150073977A1 (en) Merchant tracking and analysis tool
CN108876133A (zh) 基于业务信息的风险评估处理方法、装置、服务器和介质
US20190188579A1 (en) Self learning data loading optimization for a rule engine
CN112785086A (zh) 信贷逾期风险预测方法及装置
CN112232947B (zh) 贷中风险预测方法及装置
US20220327625A1 (en) Predicting occurrences of targeted attrition events using trained artificial-intelligence processes
CN112950357B (zh) 交易异常团伙识别方法及装置
US20220207295A1 (en) Predicting occurrences of temporally separated events using adaptively trained artificial intelligence processes
US20210110359A1 (en) Dynamic virtual resource management system
US20140172551A1 (en) Using Transaction Data and Platform for Mobile Devices
CN112801775A (zh) 客户信用评价方法及装置
CN112232950A (zh) 针对借贷风险的评估方法及装置、设备、计算机可读存储介质
US20220318573A1 (en) Predicting targeted, agency-specific recovery events using trained artificial intelligence processes
US20220277323A1 (en) Predicting future occurrences of targeted events using trained artificial-intelligence processes
US20220207606A1 (en) Prediction of future occurrences of events using adaptively trained artificial-intelligence processes
CN109711984B (zh) 一种基于催收的贷前风险监控方法及装置
US10979572B1 (en) Directed customer support
CN112162762A (zh) 灰度发布方法、灰度发布装置和电子设备
CN107516213B (zh) 风险识别方法及装置
CN114781368A (zh) 业务需求安全处理方法及装置
US11947643B2 (en) Fraud detection system, fraud detection method, and program
CN112101950A (zh) 可疑交易监测模型特征提取方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant