CN114495224A - 一种信贷风险确定方法及装置 - Google Patents
一种信贷风险确定方法及装置 Download PDFInfo
- Publication number
- CN114495224A CN114495224A CN202210077755.6A CN202210077755A CN114495224A CN 114495224 A CN114495224 A CN 114495224A CN 202210077755 A CN202210077755 A CN 202210077755A CN 114495224 A CN114495224 A CN 114495224A
- Authority
- CN
- China
- Prior art keywords
- credit
- risk
- text
- client
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Engineering & Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明提供一种信贷风险确定方法及装置,可用于金融领域、信贷风险确定领域或其他技术领域。所述方法包括:根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。所述装置用于执行上述方法。本发明实施例提供的信贷风险确定方法及装置,相比于人工进行信息审核能够减少审核失误、且可以规避审核人员的主观错误,提高了信贷风险评估的准确度;且相比于传统的信贷审查,能够进一步提升信贷风险评估效果。
Description
技术领域
本发明涉及计算机技术领域,具体涉及一种信贷风险确定方法及装置。
背景技术
目前,银行客户进行信贷业务办理时,通常直接到银行网点柜台办理。传统的信贷审查主要进行单纯的人工材料审查,然而人工审查的方式易出现审核失误,且信贷材料的分析与审核判定结果易受审核人员的主观因素影响,从而导致银行方面对客户信贷风险的评估结果不准确的情况。
发明内容
针对现有技术中的问题,本发明实施例提供一种信贷风险确定方法及装置,能够至少部分地解决现有技术中存在的问题。
一方面,本发明提出一种信贷风险确定方法,包括:
根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;
根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。
可选的,所述根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息包括:
根据目标客户办理信贷业务时采集的所述目标客户的图像数据,对所述目标客户进行表情识别、眼球追踪和/或动作识别,得到所述目标客户的神态信息。
可选的,所述根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值包括:
根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值;
将所述目标客户的信贷材料的文本信息输入调整分类阈值后的所述文本风险点抽取模型,以使所述文本风险点抽取模型输出所述文本信息中的风险点;
根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值。
可选的,所述神态信息包括异常神态,所述异常神态包括以下至少一种:恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置;
所述根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值包括:
根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值。
可选的,在根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值之前,所述方法还包括:
将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
可选的,所述将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型包括:
对所述第一训练集中每个信贷材料的文本信息中的每个词进行向量编码,得到每个词所对应的词向量;
对于所述文本信息中的每个词,将与该词相邻的前N个词和后N个词所对应的词向量进行组合,生成组合向量;
将所述组合向量作为输入、将该词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
可选的,所述根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值包括:
根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷材料中的风险点的个数;
将所述目标客户的信贷材料中的风险点的个数、所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的属性信息输入预先训练好的风险评估模型,以使所述风险评估模型输出所述目标客户的信贷风险值。
可选的,所述方法还包括:
将第二训练集中每个客户办理所述信贷业务时的神态信息、所述客户的属性信息以及所述客户的信贷材料中目标风险类型的风险点的个数作为输入、将所述客户的信贷风险值作为标签,对第二算法模型进行训练,得到所述风险评估模型,其中,所述客户的信贷风险值是根据所述客户的信用信息确定的。
另一方面,本发明提出一种信贷风险确定装置,包括:
获取模块,用于根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;
确定模块,用于根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。
可选的,所述获取模块具体用于:
根据目标客户办理信贷业务时采集的所述目标客户的图像数据,对所述目标客户进行表情识别、眼球追踪和/或动作识别,得到所述目标客户的神态信息。
可选的,所述确定模块包括:
调整单元,用于根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值;
输入单元,用于将所述目标客户的信贷材料的文本信息输入调整分类阈值后的所述文本风险点抽取模型,以使所述文本风险点抽取模型输出所述文本信息中的风险点;
确定单元,用于根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值。
可选的,所述神态信息包括异常神态,所述异常神态包括以下至少一种:恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置;
所述调整单元具体用于:
根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值。
可选的,所述确定模块还包括:
第一训练单元,用于将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
可选的,所述第一训练单元用于:
对所述第一训练集中每个信贷材料的文本信息中的每个词进行向量编码,得到每个词所对应的词向量;
对于所述文本信息中的每个词,将与该词相邻的前N个词和后N个词所对应的词向量进行组合,生成组合向量;
将所述组合向量作为输入、将该词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
可选的,所述确定单元具体用于:
根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷材料中的风险点的个数;
将所述目标客户的信贷材料中的风险点的个数、所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的属性信息输入预先训练好的风险评估模型,以使所述风险评估模型输出所述目标客户的信贷风险值。
可选的,所述确定模块还包括:
第二训练单元,用于将第二训练集中每个客户办理所述信贷业务时的神态信息、所述客户的属性信息以及所述客户的信贷材料中目标风险类型的风险点的个数作为输入、将所述客户的信贷风险值作为标签,对第二算法模型进行训练,得到所述风险评估模型,其中,所述客户的信贷风险值是根据所述客户的信用信息确定的。
又一方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一实施例所述的信贷风险确定方法的步骤。
再一方面,本发明提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述任一实施例所述的信贷风险确定方法的步骤。
本发明实施例提供的信贷风险确定方法及装置,能够利用计算机技术自动识别目标客户的信贷材料中的文本信息,并结合所述文本信息以及所述目标客户在办理所述信贷业务时的神态信息,自动确定所述目标客户的信贷风险值。这样,相比于人工进行信息审核能够减少审核失误、且可以规避审核人员的主观错误,提高了信贷风险评估的准确度;且相比于传统的信贷审查,还利用了客户提交信贷材料与等待初步审核过程中的神态信息,从而能够进一步提升信贷风险评估效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明一实施例提供的信贷风险确定方法的流程示意图。
图2是本发明一实施例提供的信贷风险确定方法的部分流程示意图。
图3是本发明一实施例提供的信贷风险确定方法的部分流程示意图。
图4是本发明一实施例提供的信贷风险确定方法的部分流程示意图。
图5是本发明一实施例提供的信贷风险确定方法的部分流程示意图。
图6是本发明一实施例提供的信贷风险确定装置的结构示意图。
图7是本发明一实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
本发明实施例提供的信贷风险确定方法的执行主体包括但不限于计算机。本申请技术方案中对数据的获取、存储、使用、处理等均符合国家法律法规的相关规定。
图1是本发明一实施例提供的信贷风险确定方法的流程示意图,如图1所示,本发明实施例提供的信贷风险确定方法,包括:
S101、根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;
本步骤,在所述目标客户在网点柜台办理信贷业务(包括提交信贷材料和/或等待初步审核等过程)时,可通过网点的视频采集设备采集所述目标客户神态动作视频流,并通过神态分析系统将目标客户的视频流信息转换为一系列可识别的图像数据;具体的视频采集设备可以为网点的监控摄像头、或高拍仪摄像机等,所述神态分析系统对目标客户的图像数据进行分析识别,得到目标客户的神态信息。
在网点的视频采集设备采集所述目标客户神态动作视频流之后,可将客户的视频流先存储于数据库,这样在交易高峰期神态分析系统无需实时地进行数据分析,数据分析可延迟进行,甚至可将分析时间延后到网点营业时间外进行,降低神态分析系统的分析实时性要求,使实际使用中可采用更复杂耗时的数据分析模型。
S102、根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。
本步骤,所述目标客户的信贷材料可包括户口本、婚姻证明、工作证明、房产证、租赁合同、征信报告、营业执照和/或保单贷的保单等;信贷人员接收目标客户提交的信贷材料后,可通过网点设置的图像采集设备取得信贷材料图像信息,并将信贷材料的图像信息预存到数据库,具体的图像采集设备可为高拍仪等设备。
可由深度文本分析系统将信贷材料从图像信息转换为文字信息,所述深度文本分析系统可由文字识别、图像分类、风险点深度文本分析等文本分析流程组成。深度文本分析系统对信贷材料的图像信息的处理流程可以如下:文本信息提取,将信贷材料从图像信息转换为文字信息。具体可分为两个步骤。第一、利用图像分类模型将不同类型的信贷材料进行归类。其中,可选择AlexNet、VGGNet等成熟图像分类框架,通过数据标注、模型训练获得该步骤的图像分类模型。第二、根据每类信贷材料相对应的专用文字识别OCR模型,提取出该类信贷材料的文本信息。其中,OCR模型为现有技术,对于不同类型信贷材料的文字识别,具有专用的文字识别优化整合方法;以常见的身份证文字识别模型为例,通过对材料各个文字区域的预先认识,将通过不同优化整合方法提高识别效果,如日期区域的识别结果若为“I”将最终调整为数字“1”。使用深度文本分析系统提取信贷风险点、辅助信贷审核人员审核材料,降低了审核人员工作量。
所述深度文本分析系统进行风险点深度文本分析时,可根据所述目标客户办理所述信贷业务时的神态信息,调整对所述目标客户的信贷材料的文本信息审核的严格程度,按照调整后的审核严格程度对所述目标客户的信贷材料的文本信息进行审核,得到所述目标客户的信贷风险值。
本发明实施例提供的信贷风险确定方法,能够利用计算机技术自动识别目标客户的信贷材料中的文本信息,并结合所述文本信息以及所述目标客户在办理所述信贷业务时的神态信息,自动确定所述目标客户的信贷风险值。这样,相比于人工进行信息审核能够减少审核失误、且可以规避审核人员的主观错误,提高了信贷风险评估的准确度;且相比于传统的信贷审查,还利用了客户提交信贷材料与等待初步审核过程中的神态信息,从而能够进一步提升信贷风险评估效果。
可选的,所述根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息包括:根据目标客户办理信贷业务时采集的所述目标客户的图像数据,对所述目标客户进行表情识别、眼球追踪和/或动作识别,得到所述目标客户的神态信息。
本实施例,所述目标客户办理信贷业务时采集的所述目标客户的图像数据可以是由神态分析系统按照一定规则对所述目标客户的视频流进行采样后得到的,如300ms采集一张静态图像等方案,将连续的视频流采样为图像序列,作为神态分析系统进行表情识别、眼球追踪、动作识别的基础数据处理。
所述对所述目标客户进行表情识别、眼球追踪和/或动作识别,得到所述目标客户的神态信息的步骤也可以由所述神态分析系统执行,所述神态分析系统可以由表情识别、眼球追踪、动作识别三种识别模型组成,表情识别、眼球追踪、动作识别皆可采用通用识别模型。可预先使用大量的分类好的表情、动作照片等,通过神经网络的分类训练方法训练得到上述三种识别模型,再使用模型识别目标客户的视频流中每一帧或每隔几帧图像中的人脸表情与人物动作等。
具体的,表情识别模型可将目标客户的表情分类为愤怒、高兴、悲伤、惊讶、厌恶、恐惧等表情中一种或多种,持续抓取客户的表情信息;眼球追踪模型抓取目标客户眼睛注视点位置或相对头部的运动轨迹,可确定目标客户是否眼神飘忽,心神不定等;动作识别模型可抓取目标客户的动作,包括但不限于抖腿、擦汗、手部更换摆放位置等。上述识别模型可以在网点内进行数据分析,减少数据传输导致的时间消耗,提高了数据分析的效率。
本实施例提供的信贷风险确定方法,充分利用目标客户办理信贷业务时的神态动作,在原有信贷审核基础上增加表情识别、眼球追踪、动作识别功能,从而提升信贷风险评估效果。
如图2所示,可选的,所述根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值包括:
S1021、根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值;
本步骤,所述预先训练好的文本风险点抽取模型用于自动化分析信贷材料文本信息,提取所述信贷材料文本信息中的风险点;在所述文本风险点抽取模型为二分类模型时,分类阈值越大,所述文本风险点抽取模型对风险点的评估更加严格。
所述根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值可以包括:在所述目标客户办理所述信贷业务时出现恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置等异常神态时,调大所述预先训练好的文本风险点抽取模型的分类阈值,以使所述预先训练好的文本风险点抽取模型对风险点的评估更加严格。
S1022、将所述目标客户的信贷材料的文本信息输入调整分类阈值后的所述文本风险点抽取模型,以使所述文本风险点抽取模型输出所述文本信息中的风险点;
本步骤,所述风险点抽取模型是以客户的信贷材料的文本信息为输入、以所述文本信息中的风险点的标签为输出训练得到的;故在使用所述预先训练好的文本风险点抽取模型时,将所述目标客户的信贷材料的文本信息输入调整分类阈值后的所述文本风险点抽取模型,所述文本风险点抽取模型即能够输出所述文本信息中的风险点。
S1023、根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值。
本步骤,可以根据所述风险点的个数、和/或所述风险点的风险类型,确定所述目标客户的信贷风险值。
可选的,在上述实施例中,所述神态信息可以包括异常神态,所述异常神态包括以下至少一种:恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置;所述根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值可以包括:根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值。
本实施例,在所述客户出现上述异常神态时,则说明所述目标客户的信贷风险可能较高,故在神态分析系统分析得到所述目标客户办理所述信贷业务时不同时刻的神态信息之后,可对所述目标客户办理所述信贷业务时出现所述异常神态(恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置等)的次数进行统计。并根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值。
所述根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值具体可以包括:若所述目标客户办理所述信贷业务时未出现所述异常神态,则不对所述预先训练好的文本风险点抽取模型的分类阈值进行调整;若所述目标客户办理所述信贷业务时出现所述异常神态的次数在第一数值范围内,则按照第一放大系数调大所述预先训练好的文本风险点抽取模型的分类阈值;若所述目标客户办理所述信贷业务时出现所述异常神态的次数在第二数值范围内,则按照第二放大系数调大所述预先训练好的文本风险点抽取模型的分类阈值。
举例而言,在目标客户出现异常神态的次数为1-2次(第一数值范围)时,则确定所述目标客户为中风险客户,并以1.05作为所述第一放大系数放大所述分类阈值(分类阈值乘以1.05);在目标客户出现异常神态的次数为大于或等于3次(第二数值范围)时,则确定所述目标客户为高风险客户,并以1.10作为所述第二放大系数放大所述分类阈值(分类阈值乘以1.10)。
如图3所示,可选的,在根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值之前,所述方法还包括:
S1020、将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
本实施例,在进行模型训练之前,可先对第一训练集中的每个信贷材料的文本信息进行预处理,处理原始文档数据成适合模型输入的格式。预处理方法可采用序列标注处理方式对文本中的每一个词进行标注,也即标注每个词的风险类型。举例而言,可将与风险点无关的词标注为O,将信贷材料文本信息中的每个风险点文本(风险点文本可以为文本信息中的一句话)的第一个词标注为B,将该风险点文本的最后一个词标注为E,B与E中间的词标注为I。信贷材料的文本信息中可能会涉及到很多种的风险点,包括但不限于疑似虚假描述、含糊不清等风险点。对于不同的风险点,可为风险点文本标注不同的标签。如疑似虚假描述风险点(用“虚假”的拼音首字母XJ表示)文本的开头、中间、结尾的词可分别标注为B_XJ、I_XJ、E_XJ。含糊不清风险点(用“不清”的拼音首字母BC表示)则标注为B_BC、I_BC、E_BC。
在对信贷材料的文本信息进行上述预处理之后,再将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。所述第一算法模型可以为双向LSTM、CRF、HMM或SLE等。
在所述文本中的风险点有多种类型时,对于每一类风险点,可专门训练针对该类风险点的文本风险点抽取模型,训练得到的该文本风险点模型也只用于抽取该类风险点。
如图4所示,可选的,所述将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型可以包括:
S10201、对所述第一训练集中每个信贷材料的文本信息中的每个词进行向量编码,得到每个词所对应的词向量;
本步骤,编码技术可选择但不限于使用word2vec、BERT、Bi-LSTM或其他神经网络算法,其中,使用神经网络算法时需要与风险点抽取模型所使用的神经网络算法进行联合训练,而word2vec、BERT算法这类预训练模型,已在一个大数据集上预先训练好,以至于使用word2vec、BERT算法进行向量编码后得到的词向量可以直接使用,无需进行联合训练。
S10202、对于所述文本信息中的每个词,将与该词相邻的前N个词和后N个词所对应的词向量进行组合,生成组合向量;
本步骤,当前词的前N个词、以及当前词的后N个词,共计k个词,k是模型的超参数,将根据实际训练效果进行调优。
可采用向量拼接的方法对上述k个词的词向量(按照在文本中的顺序)进行组合,k个长度为x的向量将直接组合成一个长度为k*x的组合向量作为模型的输入。举例而言,对于ABCDEFGHIJKL这句话,在模型判断E是否是疑似虚假描述风险点文本的一部分(B_XJ、I_XJ、E_XJ)时,将给模型输入BCDFGH,模型将根据词语E的前后词句,判断该词语的标签。
S10203、将所述组合向量作为输入、将该词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
本步骤,文本风险点抽取模型以k个词语向量拼接而成的组合向量作为输入,以该组合向量的核心词预先标注的风险类型作为标签。其中,在疑似虚假描述风险点抽取模型中,含糊不清风险点的风险类型标签将被看作是O。同理,在含糊不清风险点抽取模型中,疑似虚假描述风险点的风险类型标签将被看作是O。每类风险点抽取模型将针对该类风险点进行专门的训练。
按上述数据格式构造的数据作为模型的训练数据,模型训练中采用交叉熵作为效果评估,最终将得到较优的风险点抽取模型。
在使用所述训练好的风险点抽取模型时抽取信贷材料文本信息中的风险点时,先对文本信息做与上述训练中一致的向量编码,再分别调用每一类风险点抽取模型进行文本风险点抽取。
如图5所示,可选的,所述根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值包括:
S10231、根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷材料中的风险点的个数;
本步骤,在所述文本风险点抽取模型输出信贷材料中的风险点之后,可对所述信贷材料中的风险点的个数进行统计。
S10232、将所述目标客户的信贷材料中的风险点的个数、所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的属性信息输入预先训练好的风险评估模型,以使所述风险评估模型输出所述目标客户的信贷风险值。
本步骤,所述目标客户的属性信息可以包括性别、年龄、职业、收入等信息;所述风险评估模型是以客户的信贷材料中的风险点的个数、所述客户办理所述信贷业务时的神态信息以及所述客户的属性信息作为输入、以所述客户的信贷风险值作为输出训练得到的。在将目标客户的信贷材料中的风险点的个数、所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的属性信息输入预先训练好的风险评估模型之后,所述风险评估模型即可输出所述目标客户的信贷风险值。
可选的,在上述步骤S10232之前,所述方法还可以包括:将第二训练集中每个客户办理所述信贷业务时的神态信息、所述客户的属性信息以及所述客户的信贷材料中目标风险类型的风险点的个数作为输入、将所述客户的信贷风险值作为标签,对第二算法模型进行训练,得到所述风险评估模型,其中,所述客户的信贷风险值可以是根据所述客户的信用信息确定的,客户的信用值越高,其所对应的信贷风险值越低。
本实施例,可以以客户的神态分析结果(眼神飘忽、手足无措、恐惧、惊慌等表现)、客户的属性(性别、年龄、职业、收入等信息,可由文本提取模型提取)、风险点抽取模型结果(风险点个数)为特征,以历史信贷守信、失信记录确定的信贷风险值作为标签,基于候选算法SVM算法、KNN算法、随机森林算法、GBDT算法、xgboost算法、LSTM算法进行模型训练,使用均方根误差RMSE作为模型调优指标。最终为获取更为鲁棒的预测,选取预测效果最佳的3个模型预测的信贷风险值的均值作为最终的信贷风险值。
图6是本发明一实施例提供的信贷风险确定装置的结构示意图,如图6所示,本发明实施例提供的信贷风险确定装置包括:
获取模块21,用于根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;
确定模块22,用于根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。
本发明实施例提供的信贷风险确定装置,能够利用计算机技术自动识别目标客户的信贷材料中的文本信息,并结合所述文本信息以及所述目标客户在办理所述信贷业务时的神态信息,自动确定所述目标客户的信贷风险值。这样,相比于人工进行信息审核能够减少审核失误、且可以规避审核人员的主观错误,提高了信贷风险评估的准确度;且相比于传统的信贷审查,还利用了客户提交信贷材料与等待初步审核过程中的神态信息,从而能够进一步提升信贷风险评估效果。
可选的,所述获取模块具体用于:
根据目标客户办理信贷业务时采集的所述目标客户的图像数据,对所述目标客户进行表情识别、眼球追踪和/或动作识别,得到所述目标客户的神态信息。
可选的,所述确定模块包括:
调整单元,用于根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值;
输入单元,用于将所述目标客户的信贷材料的文本信息输入调整分类阈值后的所述文本风险点抽取模型,以使所述文本风险点抽取模型输出所述文本信息中的风险点;
确定单元,用于根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值。
可选的,所述神态信息包括异常神态,所述异常神态包括以下至少一种:恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置;
所述调整单元具体用于:
根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值。
可选的,所述确定模块还包括:
第一训练单元,用于将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
可选的,所述第一训练单元用于:
对所述第一训练集中每个信贷材料的文本信息中的每个词进行向量编码,得到每个词所对应的词向量;
对于所述文本信息中的每个词,将与该词相邻的前N个词和后N个词所对应的词向量进行组合,生成组合向量;
将所述组合向量作为输入、将该词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
可选的,所述确定单元具体用于:
根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷材料中的风险点的个数;
将所述目标客户的信贷材料中的风险点的个数、所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的属性信息输入预先训练好的风险评估模型,以使所述风险评估模型输出所述目标客户的信贷风险值。
可选的,所述确定模块还包括:
第二训练单元,用于将第二训练集中每个客户办理所述信贷业务时的神态信息、所述客户的属性信息以及所述客户的信贷材料中目标风险类型的风险点的个数作为输入、将所述客户的信贷风险值作为标签,对第二算法模型进行训练,得到所述风险评估模型,其中,所述客户的信贷风险值是根据所述客户的信用信息确定的。
本发明实施例提供的装置的实施例具体可以用于执行上述方法实施例的处理流程,其功能在此不再赘述,可以参照上述方法实施例的详细描述。
需要说明的是,本发明实施例提供的信贷风险确定方法及装置可用于金融领域或信息安全领域,也可用于除金融领域之外的任意技术领域,本发明实施例对信贷风险确定方法及装置的应用领域不做限定。
图7为本发明一实施例提供的电子设备的实体结构示意图,如图7所示,该电子设备可以包括:处理器(processor)701、通信接口(Communications Interface)702、存储器(memory)703和通信总线704,其中,处理器701,通信接口702,存储器703通过通信总线704完成相互间的通信。处理器701可以调用存储器703中的逻辑指令,以执行上述任一实施例所述的方法,例如包括:根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。
此外,上述的存储器703中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法。
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行上述各方法实施例所提供的方法。
本申请实施例中的用户信息均是通过合法合规途径获得,并且对用户信息的获取、存储、使用、处理等经过客户授权同意的。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在本说明书的描述中,参考术语“一个实施例”、“一个具体实施例”、“一些实施例”、“例如”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (18)
1.一种信贷风险确定方法,其特征在于,包括:
根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;
根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。
2.根据权利要求1所述的方法,其特征在于,所述根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息包括:
根据目标客户办理信贷业务时采集的所述目标客户的图像数据,对所述目标客户进行表情识别、眼球追踪和/或动作识别,得到所述目标客户的神态信息。
3.根据权利要求1所述的方法,其特征在于,所述根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值包括:
根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值;
将所述目标客户的信贷材料的文本信息输入调整分类阈值后的所述文本风险点抽取模型,以使所述文本风险点抽取模型输出所述文本信息中的风险点;
根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值。
4.根据权利要求3所述的方法,其特征在于,所述神态信息包括异常神态,所述异常神态包括以下至少一种:恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置;
所述根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值包括:
根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值。
5.根据权利要求3所述的方法,其特征在于,在根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值之前,所述方法还包括:
将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
6.根据权利要求5所述的方法,其特征在于,所述将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型包括:
对所述第一训练集中每个信贷材料的文本信息中的每个词进行向量编码,得到每个词所对应的词向量;
对于所述文本信息中的每个词,将与该词相邻的前N个词和后N个词所对应的词向量进行组合,生成组合向量;
将所述组合向量作为输入、将该词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
7.根据权利要求3至6任一项所述的方法,其特征在于,所述根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值包括:
根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷材料中的风险点的个数;
将所述目标客户的信贷材料中的风险点的个数、所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的属性信息输入预先训练好的风险评估模型,以使所述风险评估模型输出所述目标客户的信贷风险值。
8.根据权利要求7所述的方法,其特征在于,所述方法还包括:
将第二训练集中每个客户办理所述信贷业务时的神态信息、所述客户的属性信息以及所述客户的信贷材料中目标风险类型的风险点的个数作为输入,将所述客户的信贷风险值作为标签、对第二算法模型进行训练,得到所述风险评估模型,其中,所述客户的信贷风险值是根据所述客户的信用信息确定的。
9.一种信贷风险确定装置,其特征在于,包括:
获取模块,用于根据目标客户办理信贷业务时采集的所述目标客户的图像数据,获取所述目标客户办理所述信贷业务时的神态信息;
确定模块,用于根据所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的信贷材料的文本信息,确定所述目标客户的信贷风险值。
10.根据权利要求9所述的装置,其特征在于,所述获取模块具体用于:
根据目标客户办理信贷业务时采集的所述目标客户的图像数据,对所述目标客户进行表情识别、眼球追踪和/或动作识别,得到所述目标客户的神态信息。
11.根据权利要求9所述的装置,其特征在于,所述确定模块包括:
调整单元,用于根据所述目标客户办理所述信贷业务时的神态信息,调整预先训练好的文本风险点抽取模型的分类阈值;
输入单元,用于将所述目标客户的信贷材料的文本信息输入调整分类阈值后的所述文本风险点抽取模型,以使所述文本风险点抽取模型输出所述文本信息中的风险点;
确定单元,用于根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷风险值。
12.根据权利要求11所述的装置,其特征在于,所述神态信息包括异常神态,所述异常神态包括以下至少一种:恐惧、惊慌、眼神飘忽、抖腿、擦汗、手部更换摆放位置;
所述调整单元具体用于:
根据所述目标客户办理所述信贷业务时出现异常神态的次数,调整预先训练好的文本风险点抽取模型的分类阈值。
13.根据权利要求11所述的装置,其特征在于,所述确定模块还包括:
第一训练单元,用于将第一训练集中的每个信贷材料的文本信息作为输入、将所述文本信息中每个词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
14.根据权利要求13所述的装置,其特征在于,所述第一训练单元用于:
对所述第一训练集中每个信贷材料的文本信息中的每个词进行向量编码,得到每个词所对应的词向量;
对于所述文本信息中的每个词,将与该词相邻的前N个词和后N个词所对应的词向量进行组合,生成组合向量;
将所述组合向量作为输入、将该词所对应的风险类型作为标签,对第一算法模型进行训练,得到所述文本风险点抽取模型。
15.根据权利要求11至14任一项所述的装置,其特征在于,所述确定单元具体用于:
根据所述文本风险点抽取模型输出的风险点,确定所述目标客户的信贷材料中的风险点的个数;
将所述目标客户的信贷材料中的风险点的个数、所述目标客户办理所述信贷业务时的神态信息以及所述目标客户的属性信息输入预先训练好的风险评估模型,以使所述风险评估模型输出所述目标客户的信贷风险值。
16.根据权利要求15所述的装置,其特征在于,所述确定模块还包括:
第二训练单元,用于将第二训练集中每个客户办理所述信贷业务时的神态信息、所述客户的属性信息以及所述客户的信贷材料中目标风险类型的风险点的个数作为输入、将所述客户的信贷风险值作为标签,对第二算法模型进行训练,得到所述风险评估模型,其中,所述客户的信贷风险值是根据所述客户的信用信息确定的。
17.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8任一项所述方法的步骤。
18.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210077755.6A CN114495224A (zh) | 2022-01-24 | 2022-01-24 | 一种信贷风险确定方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210077755.6A CN114495224A (zh) | 2022-01-24 | 2022-01-24 | 一种信贷风险确定方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114495224A true CN114495224A (zh) | 2022-05-13 |
Family
ID=81473584
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210077755.6A Pending CN114495224A (zh) | 2022-01-24 | 2022-01-24 | 一种信贷风险确定方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114495224A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116308754A (zh) * | 2023-03-22 | 2023-06-23 | 广州信瑞泰信息科技有限公司 | 一种银行信贷风险预警系统及其方法 |
-
2022
- 2022-01-24 CN CN202210077755.6A patent/CN114495224A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116308754A (zh) * | 2023-03-22 | 2023-06-23 | 广州信瑞泰信息科技有限公司 | 一种银行信贷风险预警系统及其方法 |
CN116308754B (zh) * | 2023-03-22 | 2024-02-13 | 广州信瑞泰信息科技有限公司 | 一种银行信贷风险预警系统及其方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110147726B (zh) | 业务质检方法和装置、存储介质及电子装置 | |
CN110597964B (zh) | 一种双录质检语义分析方法、装置及双录质检系统 | |
CN109685056B (zh) | 获取文档信息的方法及装置 | |
CN109829629B (zh) | 风险分析报告的生成方法、装置、计算机设备和存储介质 | |
CN109408824B (zh) | 用于生成信息的方法和装置 | |
Li et al. | Publication date estimation for printed historical documents using convolutional neural networks | |
CN112287672A (zh) | 文本意图识别方法及装置、电子设备、存储介质 | |
CN114612251A (zh) | 风险评估方法、装置、设备及存储介质 | |
CN110750978A (zh) | 情感倾向分析方法、装置、电子设备及存储介质 | |
CN111462752A (zh) | 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法 | |
CN114997169A (zh) | 一种实体词识别方法、装置、电子设备及可读存储介质 | |
CN112765354B (zh) | 模型训练方法、模型训练装置、计算机设备和存储介质 | |
CN114495224A (zh) | 一种信贷风险确定方法及装置 | |
CN117114705A (zh) | 一种基于持续学习的电商欺诈识别方法与系统 | |
CN111898378A (zh) | 政企客户的行业分类方法和装置、电子设备、存储介质 | |
CN110543910A (zh) | 信用状态监测系统和监测方法 | |
JP6026036B1 (ja) | データ分析システム、その制御方法、プログラム、及び、記録媒体 | |
CN112732908B (zh) | 试题新颖度评估方法、装置、电子设备和存储介质 | |
US11880394B2 (en) | System and method for machine learning architecture for interdependence detection | |
US12033415B2 (en) | Systems and methods for generating document numerical representations | |
US11694463B2 (en) | Systems and methods for generating document numerical representations | |
CN118171645B (zh) | 一种基于文本分类的商业信息分析方法及系统 | |
CN116304058B (zh) | 企业负面信息的识别方法、装置、电子设备及存储介质 | |
CN112115705B (zh) | 一种电子简历的筛选方法及装置 | |
CN116521878A (zh) | 工单分类方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |