CN112669142B - 高维行为数据的建模方法、装置、设备及可读存储介质 - Google Patents

高维行为数据的建模方法、装置、设备及可读存储介质 Download PDF

Info

Publication number
CN112669142B
CN112669142B CN202110022447.9A CN202110022447A CN112669142B CN 112669142 B CN112669142 B CN 112669142B CN 202110022447 A CN202110022447 A CN 202110022447A CN 112669142 B CN112669142 B CN 112669142B
Authority
CN
China
Prior art keywords
neural network
credit
data
action
convolutional neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110022447.9A
Other languages
English (en)
Other versions
CN112669142A (zh
Inventor
张鹏
陈婷
吴三平
庄伟亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202110022447.9A priority Critical patent/CN112669142B/zh
Publication of CN112669142A publication Critical patent/CN112669142A/zh
Application granted granted Critical
Publication of CN112669142B publication Critical patent/CN112669142B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种高维行为数据的建模方法、装置、设备及可读存储介质,该方法包括:获取客户的高维行为数据;基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。本发明解决了由于样本数据中包含不同动作、不同月份及不同时段对应的样本数据,导致根据不同动作、不同月份及不同时段对应的样本数据进行建模的过程非常困难的技术问题。

Description

高维行为数据的建模方法、装置、设备及可读存储介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种高维行为数据的建模方法、装置、设备及可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。
现有的信贷风险建模的过程主要是首先对于单个的信用行为动作在不同月份数和不同时段,根据业务经验进行变量设计和实现,以筛选该动作在特定月份和特定时段的样本,之后再根据该动作在特定月份和特定时段的样本进行建模,例如,对于信用行为动作a,枚举出在最近3个月在时段0-3的所有变量后进行筛选并进行建模。
但是,由于在信贷风险建模时,由于样本数据中包含不同动作、不同月份及不同时段对应的样本数据,而动作、时段、月份对应的三种类型信息的交叉会使得样本数据的数量快速爆炸,导致根据不同动作、不同月份及不同时段对应的样本数据进行建模的过程非常困难。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种高维行为数据的建模方法、装置、设备及可读存储介质,旨在解决由于样本数据中包含不同动作、不同月份及不同时段对应的样本数据,导致根据不同动作、不同月份及不同时段对应的样本数据进行建模的过程非常困难的技术问题。
为实现上述目的,本发明提供一种高维行为数据的建模方法,所述高维行为数据的建模方法包括以下步骤:
获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;
基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;
将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
可选地,所述基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据的步骤包括:
按照所述信用行为动作对应的动作类型,对所述高维行为数据进行分类,将所述高维行为数据处理成按照所述动作类型分类的第二中间数据;
按照月份顺序和一天内对应的时间顺序,对所述第二中间数据的动作次数进行排序,以将所述第二中间数据处理成按照所述月份顺序和所述时间顺序排序的第一中间数据,其中,所述第一中间数据为以所述月份顺序为第一标签和以所述时间顺序为第二标签的二维矩阵。
可选地,所述将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
将所述第一中间数据输入至预设的卷积神经网络,其中,所述卷积神经网络包括卷积层和池化层;
基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
可选地,所述基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
基于所述卷积层,对所述第一中间数据执行卷积操作,以提取所述第一中间数据中包含的信用行为动作的动作行为模式;
基于所述池化层,对所述第一中间数据执行降维操作,以对所述第一中间数据的第一标签和第二标签进行降维;
在对所述第一中间数据执行卷积操作和降维操作后,对所述卷积神经网络执行更新操作,在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
可选地,所述在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
获取所述卷积神经网络的训练次数以及网络误差;
若所述训练次数大于最大训练次数或者所述网络误差小于预设阈值,则所述卷积神经网络满足训练停止条件,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
可选地,所述将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤之后,还包括:
获取待预测客户的信用行为数据;
将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,以基于所述信贷风险预测模型确定所述待预测客户的信用风险预测结果。
可选地,所述信用风险预测结果包括所述待预测客户的动作行为模式,所述将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,以基于所述信贷风险预测模型确定所述待预测客户的信用风险预测结果的步骤包括:
将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,确定所述待预测客户的动作行为模式,所述待预测客户的动作行为模式包括预测信用行为动作、所述预测信用行为动作对应的预测月份以及所述预测信用行为动作对应的预测时段。
此外,为实现上述目的,本发明还提供一种高维行为数据的建模装置,所述高维行为数据的建模装置包括:
获取模块,用于获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;
数据处理模块,用于基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;
训练模块,用于将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
此外,为实现上述目的,本发明还提供一种高维行为数据的建模设备,所述高维行为数据的建模设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的高维行为数据的建模程序,所述高维行为数据的建模程序被所述处理器执行时实现如上述的高维行为数据的建模方法的步骤。
此外,为实现上述目的,本发明还提供一种可读存储介质,所述可读存储介质上存储有高维行为数据的建模程序,所述高维行为数据的建模程序被处理器执行时实现如上述的高维行为数据的建模方法的步骤。
本发明通过获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。在本实施例中,按照信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将高维行为数据处理成按照动作类型、月份顺序以及时间顺序分类的第一中间数据,将高维复杂行为数据看作是类似视频的立方体数据,将高维行为数据处理成三维的第一中间数据,从而可以利用卷积神经网络算法进行建模,解决由于样本数据中包含不同动作、不同月份及不同时段对应的样本数据,导致根据不同动作、不同月份及不同时段对应的样本数据进行建模的过程非常困难的技术问题,并且利用卷积神经网络对高维行为数据进行建模不仅可以充分捕捉高维行为数据中包含的关键信息,而且某些操作在业务经验上可以有对应解释。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的高维行为数据的建模设备结构示意图;
图2为本发明高维行为数据的建模方法第一实施例的流程示意图;
图3为本发明高维行为数据的建模方法第二实施例的流程示意图;
图4为本发明高维行为数据的建模方法中高维行为数据对应的第一中间数据对应的数据结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,图1是本发明实施例方案涉及的硬件运行环境的高维行为数据的建模设备结构示意图。
本发明实施例高维行为数据的建模设备可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)播放器、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。
如图1所示,该高维行为数据的建模设备可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
可选地,高维行为数据的建模设备还可以包括摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。其中,传感器比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示屏的亮度,接近传感器可在高维行为数据的建模设备移动到耳边时,关闭显示屏和/或背光。作为运动传感器的一种,重力加速度传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别高维行为数据的建模设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;当然,高维行为数据的建模设备还可配置陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。
本领域技术人员可以理解,图1中示出的高维行为数据的建模设备结构并不构成对高维行为数据的建模设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及高维行为数据的建模程序。
在图1所示的高维行为数据的建模设备中,网络接口1004主要用于连接后台服务器,与后台服务器进行数据通信;用户接口1003主要用于连接客户端(用户端),与客户端进行数据通信;而处理器1001可以用于调用存储器1005中存储的高维行为数据的建模程序。
在本实施例中,高维行为数据的建模设备包括:存储器1005、处理器1001及存储在所述存储器1005上并可在所述处理器1001上运行的高维行为数据的建模程序,其中,处理器1001调用存储器1005中存储的高维行为数据的建模程序时,并执行以下操作:
获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;
基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;
将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,处理器1001可以调用存储器1005中存储的高维行为数据的建模程序,还执行以下操作:
按照所述信用行为动作对应的动作类型,对所述高维行为数据进行分类,将所述高维行为数据处理成按照所述动作类型分类的第二中间数据;
按照月份顺序和一天内对应的时间顺序,对所述第二中间数据的动作次数进行排序,以将所述第二中间数据处理成按照所述月份顺序和所述时间顺序排序的第一中间数据,其中,所述第一中间数据为以所述月份顺序为第一标签和以所述时间顺序为第二标签的二维矩阵。
进一步地,处理器1001可以调用存储器1005中存储的高维行为数据的建模程序,还执行以下操作:
将所述第一中间数据输入至预设的卷积神经网络,其中,所述卷积神经网络包括卷积层和池化层;
基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,处理器1001可以调用存储器1005中存储的高维行为数据的建模程序,还执行以下操作:
基于所述卷积层,对所述第一中间数据执行卷积操作,以提取所述第一中间数据中包含的信用行为动作的动作行为模式;
基于所述池化层,对所述第一中间数据执行降维操作,以对所述第一中间数据的第一标签和第二标签进行降维;
在对所述第一中间数据执行卷积操作和降维操作后,对所述卷积神经网络执行更新操作,在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,处理器1001可以调用存储器1005中存储的高维行为数据的建模程序,还执行以下操作:
获取所述卷积神经网络的训练次数以及网络误差;
若所述训练次数大于最大训练次数或者所述网络误差小于预设阈值,则所述卷积神经网络满足训练停止条件,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,处理器1001可以调用存储器1005中存储的高维行为数据的建模程序,还执行以下操作:
获取待预测客户的信用行为数据;
将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,以基于所述信贷风险预测模型确定所述待预测客户的信用风险预测结果。
进一步地,处理器1001可以调用存储器1005中存储的高维行为数据的建模程序,还执行以下操作:
将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,确定所述待预测客户的动作行为模式,所述待预测客户的动作行为模式包括预测信用行为动作、所述预测信用行为动作对应的预测月份以及所述预测信用行为动作对应的预测时段。
本发明还提供一种高维行为数据的建模方法,参照图2,图2为本发明高维行为数据的建模方法第一实施例的流程示意图。
在本实施例中,该高维行为数据的建模包括以下步骤:
步骤S10,获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;
在本实施例中,在基于高维行为数据进行建模之前,首先获取客户的信用行为对应的高维行为数据。高维行为数据实质上属于一种客户的信用行为数据,高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,客户的信用行为动作包括客户的信用历史记录和业务表现记录,其中,可以通过客户在人民银行所记录到的个人征信记录或者该客户在该贷款机构关于贷款业务的行为表现的记录数据获取客户的高维行为数据,高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数。
例如,下表为一种高维行为数据对应的表格,参照下表:
客户ID 动作ID 月份 时段 次数
A ACT1 1901 3 40
A ACT1 1901 7 12
A ACT2 1902 2 55
B ACT8 1903 0 120
步骤S20,基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;
在本实施例中,在获取客户的信用行为数据对应的高维行为数据后,按照信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将高维行为数据处理成按照动作类型、月份顺序以及时间顺序排序的第一中间数据。其中,第一中间数据用于构建信贷风险预测模型,或者说,第一中间数据为建模所用的入模数据。其中,动作类型包括信用行为动作对应的多种不同动作类型,月份顺序为一年中按照时间顺序排序的月份顺序,一天内对应的时间顺序的各个时段按照24小时中时间顺序进行排序,其中,各个时段的时长在本实施例中不做限定。
本实施例中对高维行为数据的处理顺序不作限定,可以是先根据信用行为动作对应的动作类型先对高维行为数据进行处理,再根据月份顺序对处理后的高维行为数据进行处理,最后根据时间顺序对处理后的高维行为数据进行处理;也可以是,先根据月份顺序先对高维行为数据进行处理,再根据时间顺序对处理后的高维行为数据进行处理,最后根据信用行为动作对应的动作类型对处理后的高维行为数据进行处理等等。
例如,将高维行为数据处理成按照不同动作类型排序的高维行为数据,例如,若基于信用动作行为的动作类型筛选到的信用动作行为包括信用动作1、信用动作2、...、信用动作n,则可以将高维行为数据分成信用动作1对应的第一高维行为数据、信用动作2对应的第二高维行为数据、...、第n高维行为数据;一年中包括12个月份,那么按照月份顺序,可以将高维行为数据分成与12个月份相对应的高维行为数据;按照时间顺序,将24小时分成按照时间顺序进行排序对应的时段,之后,再将高维行为数据分成各个不同时段对应的高维行为数据。
步骤S30,将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
在本实施例中,得到用于建模的第一中间数据时,将第一中间数据输入至预设的卷积神经网络模型中,以对该卷积神经网络进行训练;在训练完成该卷积神经网络之后,得到训练完成该卷积神经网络后对应的信贷风险预测模型。其中,在训练卷积神经网络时,若检测到该卷积神经网络满足训练停止条件,则停止训练该卷积神经网络,该卷积神经网络训练完成,从而得到构建完成的信贷风险预测模型。
进一步地,所述将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤之后,还包括:
步骤S40,获取待预测客户的信用行为数据;
步骤S50,将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,确定所述待预测客户的动作行为模式,所述待预测客户的动作行为模式包括预测信用行为动作、所述预测信用行为动作对应的预测月份以及所述预测信用行为动作对应的预测时段。
在本实施例中,将待预测客户的信用行为数据输入至信贷风险预测模型,输出待预测客户的动作行为模式,待预测客户的动作行为模式包括预测信用行为动作、预测信用行为动作对应的预测月份以及预测信用行为动作对应的预测时段三种信息,即信贷风险预测模型输出的结果包括预测信用行为动作、预测信用行为动作对应的预测月份以及预测信用行为动作对应的预测时段三种信息,因此,该动作行为模式为待预测客户的预测信用行为动作在预测月份的预测时段中的动作次数。
本实施例提出的高维行为数据的建模方法,通过获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。在本实施例中,按照信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将高维行为数据处理成按照动作类型、月份顺序以及时间顺序分类的第一中间数据,将高维复杂行为数据看作是类似视频的立方体数据,将高维行为数据处理成三维的第一中间数据,从而可以利用卷积神经网络算法进行建模,解决由于样本数据中包含不同动作、不同月份及不同时段对应的样本数据,导致根据不同动作、不同月份及不同时段对应的样本数据进行建模的过程非常困难的技术问题,并且利用卷积神经网络对高维行为数据进行建模不仅可以充分捕捉高维行为数据中包含的关键信息,而且某些操作在业务经验上可以有对应解释。
基于第一实施例,提出本发明高维行为数据的建模方法的第二实施例,参照图3,在本实施例中,步骤S20包括:
步骤S21,按照所述信用行为动作对应的动作类型,对所述高维行为数据进行分类,将所述高维行为数据处理成按照所述动作类型分类的第二中间数据;
步骤S22,按照月份顺序和一天内对应的时间顺序,对所述第二中间数据的动作次数进行排序,以将所述第二中间数据处理成按照所述月份顺序和所述时间顺序排序的第一中间数据,其中,所述第一中间数据为以所述月份顺序为第一标签和以所述时间顺序为第二标签的二维矩阵。
在本实施例中,在获取客户的信用行为数据对应的高维行为数据后,按照信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将高维行为数据处理成按照动作类型、月份顺序以及时间顺序排序的第一中间数据。具体地,参考图4,图4为高维行为数据对应的第一中间数据对应的数据结构示意图,按照信用行为动作对应的动作类型,对高维行为数据进行分类,先将高维行为数据处理成按照不同的动作类型分类的第二中间数据。
将一个月作为第一时间间隔,根据第一时间间隔,将高维行为数据对应的时间分成按照年月份顺序排序的月份分段;将一个小时作为第二时间间隔,根据第二时间间隔将一天内的时间分成按照时间排序的时段分段。得到第二中间数据后,将月份分段作为第一标签以及将时段分段作为第二标签,根据第一标签和第二标签,将第二中间数据处理成按照第一标签和第二标签分类的第一中间数据,该第一中间数据为三维空间数据。
进一步地,所述将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
步骤S31,将所述第一中间数据输入至预设的卷积神经网络,其中,所述卷积神经网络包括卷积层和池化层;
步骤S32,基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
在本实施例中,得到用于建模的第一中间数据时,将第一中间数据输入至预设的卷积神经网络中,以对该卷积神经网络进行训练,其中,该卷积神经网络包括卷积层和池化层。在基于第一中间数据对卷积神经网络进行训练的过程中,将第一中间数据输入至卷积神经网络,以使卷积神经网络中的卷积层对第一中间数据执行卷积操作以及池化层对第一中间数据执行池化操作,从而对卷积神经网络进行训练。在训练完成该卷积神经网络之后,得到训练完成该卷积神经网络后对应的信贷风险预测模型。
进一步地,所述基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
步骤S321,基于所述卷积层,对所述第一中间数据执行卷积操作,以提取所述第一中间数据中包含的信用行为动作的动作行为模式;
步骤S322,基于所述池化层,对所述第一中间数据执行降维操作,以对所述第一中间数据的第一标签和第二标签进行降维;
步骤S323,在对所述第一中间数据执行卷积操作和降维操作后,对所述卷积神经网络执行更新操作,在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
在本实施例中,卷积神经网络包括卷积层和池化层。在基于第一中间数据对卷积神经网络进行训练的过程中,将第一中间数据输入至卷积神经网络,以使卷积神经网络中的卷积层对第一中间数据执行卷积操作,以提取第一中间数据中包含的信用行为动作的动作行为模式;以及,卷积神经网络中的池化层对卷积处理后的第一中间数据执行降维操作,以对第一中间数据的第一标签和第二标签进行降维。在对第一中间数据执行卷积操作和降维操作后,对卷积神经网络执行更新操作,并在卷积神经网络满足训练停止条件时得到训练完成卷积神经网络后对应的信贷风险预测模型。
进一步地,所述在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
步骤S3231,获取所述卷积神经网络的训练次数以及网络误差;
步骤S3232,若所述训练次数大于最大训练次数或者所述网络误差小于预设阈值,则所述卷积神经网络满足训练停止条件,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
在本实施例中,在训练卷积神经网络时,获取卷积神经网络的训练次数以及网络误差,并检测卷积神经网络的训练次数是否大于最大训练次数或者卷积神经网络的网络误差是否小于预设阈值;若检测到训练次数大于最大训练次数或者网络误差小于预设阈值,则判定该卷积神经网络满足训练停止条件,则停止训练该卷积神经网络,该卷积神经网络训练完成,从而得到构建完成的信贷风险预测模型。
本实施例提出的高维行为数据的建模方法,通过按照所述信用行为动作对应的动作类型,对所述高维行为数据进行分类,将所述高维行为数据处理成按照所述动作类型分类的第二中间数据;按照月份顺序和一天内对应的时间顺序,对所述第二中间数据的动作次数进行排序,以将所述第二中间数据处理成按照所述月份顺序和所述时间顺序排序的第一中间数据,其中,所述第一中间数据为以所述月份顺序为第一标签和以所述时间顺序为第二标签的二维矩阵。本实施例将高维复杂行为数据看作是类似视频的立方体数据,将高维行为数据处理成三维的第一中间数据,从而可以利用卷积神经网络算法进行建模,解决由于样本数据中包含不同动作、不同月份及不同时段对应的样本数据,导致根据不同动作、不同月份及不同时段对应的样本数据进行建模的过程非常困难的技术问题,并且利用卷积神经网络对高维行为数据进行建模不仅可以充分捕捉高维行为数据中包含的关键信息,而且某些操作在业务经验上可以有对应解释。
此外,本发明实施例还提出一种高维行为数据的建模装置,所述高维行为数据的建模装置包括:
获取模块,用于获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;
数据处理模块,用于基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;
训练模块,用于将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,所述数据处理模块,还用于:
按照所述信用行为动作对应的动作类型,对所述高维行为数据进行分类,将所述高维行为数据处理成按照所述动作类型分类的第二中间数据;
按照月份顺序和一天内对应的时间顺序,对所述第二中间数据的动作次数进行排序,以将所述第二中间数据处理成按照所述月份顺序和所述时间顺序排序的第一中间数据,其中,所述第一中间数据为以所述月份顺序为第一标签和以所述时间顺序为第二标签的二维矩阵。
进一步地,所述训练模块,还用于:
将所述第一中间数据输入至预设的卷积神经网络,其中,所述卷积神经网络包括卷积层和池化层;
基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,所述训练模块,还用于:
基于所述卷积层,对所述第一中间数据执行卷积操作,以提取所述第一中间数据中包含的信用行为动作的动作行为模式;
基于所述池化层,对所述第一中间数据执行降维操作,以对所述第一中间数据的第一标签和第二标签进行降维;
在对所述第一中间数据执行卷积操作和降维操作后,对所述卷积神经网络执行更新操作,在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,所述训练模块,还用于:
获取所述卷积神经网络的训练次数以及网络误差;
若所述训练次数大于最大训练次数或者所述网络误差小于预设阈值,则所述卷积神经网络满足训练停止条件,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
进一步地,所述训练模块,还用于:
获取待预测客户的信用行为数据;
将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,以基于所述信贷风险预测模型确定所述待预测客户的信用风险预测结果。
此外,本发明实施例还提出一种可读存储介质,所述可读存储介质上存储有高维行为数据的建模程序,所述高维行为数据的建模程序被处理器执行时实现如上述中任一项所述的高维行为数据的建模方法的步骤。
本发明可读存储介质具体实施例与上述高维行为数据的建模方法的各实施例基本相同,在此不再详细赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (9)

1.一种高维行为数据的建模方法,其特征在于,所述高维行为数据的建模方法包括以下步骤:
获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;
基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;
所述基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据的步骤包括:
按照所述信用行为动作对应的动作类型,对所述高维行为数据进行分类,将所述高维行为数据处理成按照所述动作类型分类的第二中间数据;按照月份顺序和一天内对应的时间顺序,对所述第二中间数据的动作次数进行排序,以将所述第二中间数据处理成按照所述月份顺序和所述时间顺序排序的第一中间数据,其中,所述第一中间数据为以所述月份顺序为第一标签和以所述时间顺序为第二标签的二维矩阵;
将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
2.如权利要求1所述的高维行为数据的建模方法,其特征在于,所述将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
将所述第一中间数据输入至预设的卷积神经网络,其中,所述卷积神经网络包括卷积层和池化层;
基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
3.如权利要求2所述的高维行为数据的建模方法,其特征在于,所述基于所述卷积层和池化层,对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
基于所述卷积层,对所述第一中间数据执行卷积操作,以提取所述第一中间数据中包含的信用行为动作的动作行为模式;
基于所述池化层,对所述第一中间数据执行降维操作,以对所述第一中间数据的第一标签和第二标签进行降维;
在对所述第一中间数据执行卷积操作和降维操作后,对所述卷积神经网络执行更新操作,在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
4.如权利要求3所述的高维行为数据的建模方法,其特征在于,所述在所述卷积神经网络满足训练停止条件时得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤包括:
获取所述卷积神经网络的训练次数以及网络误差;
若所述训练次数大于最大训练次数或者所述网络误差小于预设阈值,则所述卷积神经网络满足训练停止条件,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
5.如权利要求1至4任一项所述的高维行为数据的建模方法,其特征在于,所述将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型的步骤之后,还包括:
获取待预测客户的信用行为数据;
将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,以基于所述信贷风险预测模型确定所述待预测客户的信用风险预测结果。
6.如权利要求5所述的高维行为数据的建模方法,其特征在于,所述信用风险预测结果包括所述待预测客户的动作行为模式,所述将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,以基于所述信贷风险预测模型确定所述待预测客户的信用风险预测结果的步骤包括:
将所述待预测客户的信用行为数据输入至所述信贷风险预测模型,确定所述待预测客户的动作行为模式,所述待预测客户的动作行为模式包括预测信用行为动作、所述预测信用行为动作对应的预测月份以及所述预测信用行为动作对应的预测时段。
7.一种高维行为数据的建模装置,其特征在于,所述高维行为数据的建模装置包括:
获取模块,用于获取客户的高维行为数据,其中,所述高维行为数据为客户的信用行为动作在每个月不同时段对应的动作次数,所述高维行为数据包括信用行为动作、时段信息、月份信息和信用行为动作对应的动作次数;
数据处理模块,用于基于所述信用行为动作对应的动作类型、月份顺序和一天内对应的时间顺序,将所述高维行为数据处理成按照所述动作类型、所述月份顺序以及所述时间顺序排序的第一中间数据;
所述数据处理模块,还用于,按照所述信用行为动作对应的动作类型,对所述高维行为数据进行分类,将所述高维行为数据处理成按照所述动作类型分类的第二中间数据;按照月份顺序和一天内对应的时间顺序,对所述第二中间数据的动作次数进行排序,以将所述第二中间数据处理成按照所述月份顺序和所述时间顺序排序的第一中间数据,其中,所述第一中间数据为以所述月份顺序为第一标签和以所述时间顺序为第二标签的二维矩阵;
训练模块,用于将所述第一中间数据输入至预设的卷积神经网络,以对所述卷积神经网络进行训练,得到训练完成所述卷积神经网络后对应的信贷风险预测模型。
8.一种高维行为数据的建模设备,其特征在于,所述高维行为数据的建模设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的高维行为数据的建模程序,所述高维行为数据的建模程序被所述处理器执行时实现如权利要求1至6中任一项所述的高维行为数据的建模方法的步骤。
9.一种可读存储介质,其特征在于,所述可读存储介质上存储有高维行为数据的建模程序,所述高维行为数据的建模程序被处理器执行时实现如权利要求1至6中任一项所述的高维行为数据的建模方法的步骤。
CN202110022447.9A 2021-01-05 2021-01-05 高维行为数据的建模方法、装置、设备及可读存储介质 Active CN112669142B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110022447.9A CN112669142B (zh) 2021-01-05 2021-01-05 高维行为数据的建模方法、装置、设备及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110022447.9A CN112669142B (zh) 2021-01-05 2021-01-05 高维行为数据的建模方法、装置、设备及可读存储介质

Publications (2)

Publication Number Publication Date
CN112669142A CN112669142A (zh) 2021-04-16
CN112669142B true CN112669142B (zh) 2024-02-20

Family

ID=75413707

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110022447.9A Active CN112669142B (zh) 2021-01-05 2021-01-05 高维行为数据的建模方法、装置、设备及可读存储介质

Country Status (1)

Country Link
CN (1) CN112669142B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2622929A1 (en) * 2007-02-27 2008-08-27 Transunion Interactive, Inc. A Delaware Corporation Credit report-based predictive models
CN108491886A (zh) * 2018-03-29 2018-09-04 重庆大学 一种基于卷积神经网络的多元时序数据的分类方法
CN109409504A (zh) * 2018-10-10 2019-03-01 深圳乐信软件技术有限公司 一种数据处理方法、装置、计算机及存储介质
CN110427896A (zh) * 2019-08-07 2019-11-08 成都理工大学 一种基于卷积神经网络的垃圾分类智能系统
CN111598682A (zh) * 2020-05-11 2020-08-28 上海企腾投资咨询有限公司 一种针对企业的信用风险评估方法及系统
CN111652627A (zh) * 2020-07-07 2020-09-11 中国银行股份有限公司 风险评估方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112041880A (zh) * 2018-04-11 2020-12-04 金融及风险组织有限公司 用于评估信用风险的深度学习方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2622929A1 (en) * 2007-02-27 2008-08-27 Transunion Interactive, Inc. A Delaware Corporation Credit report-based predictive models
CN108491886A (zh) * 2018-03-29 2018-09-04 重庆大学 一种基于卷积神经网络的多元时序数据的分类方法
CN109409504A (zh) * 2018-10-10 2019-03-01 深圳乐信软件技术有限公司 一种数据处理方法、装置、计算机及存储介质
CN110427896A (zh) * 2019-08-07 2019-11-08 成都理工大学 一种基于卷积神经网络的垃圾分类智能系统
CN111598682A (zh) * 2020-05-11 2020-08-28 上海企腾投资咨询有限公司 一种针对企业的信用风险评估方法及系统
CN111652627A (zh) * 2020-07-07 2020-09-11 中国银行股份有限公司 风险评估方法及装置

Also Published As

Publication number Publication date
CN112669142A (zh) 2021-04-16

Similar Documents

Publication Publication Date Title
CN109961009B (zh) 基于深度学习的行人检测方法、系统、装置及存储介质
CN109298840A (zh) 基于数据湖的数据集成方法、服务器及存储介质
CN113159147A (zh) 基于神经网络的图像识别方法、装置、电子设备
US20200380310A1 (en) Method and System of Performing Data Imbalance Detection and Correction in Training a Machine-Learning Model
CN111813532A (zh) 一种基于多任务机器学习模型的图像管理方法及装置
CN110264093B (zh) 信用模型的建立方法、装置、设备及可读存储介质
CN112419202B (zh) 基于大数据及深度学习的野生动物图像自动识别系统
US10733481B2 (en) Cloud device, terminal device, and method for classifying images
CN111652869A (zh) 基于深度学习的板坯空洞识别方法、系统、介质及终端
CN112149570B (zh) 多人活体检测方法、装置、电子设备及存储介质
CN111898675B (zh) 信贷风控模型生成方法、装置、评分卡生成方法、机器可读介质及设备
CN111797870A (zh) 算法模型的优化方法、装置、存储介质及电子设备
CN112258238A (zh) 用户生命价值周期检测方法、装置和计算机设备
CN110717407A (zh) 基于唇语密码的人脸识别方法、装置及存储介质
CN112995414B (zh) 基于语音通话的行为质检方法、装置、设备及存储介质
CN111476144B (zh) 行人属性识别模型确定方法、装置及计算机可读存储介质
CN112669142B (zh) 高维行为数据的建模方法、装置、设备及可读存储介质
CN110222576B (zh) 拳击动作识别方法、装置和电子设备
CN116029760A (zh) 消息推送方法、装置、计算机设备和存储介质
CN111797862A (zh) 任务处理方法、装置、存储介质和电子设备
CN111797856A (zh) 建模方法、装置、存储介质及电子设备
CN112749576B (zh) 图像识别方法和装置、计算设备以及计算机存储介质
CN112529699A (zh) 企业授信模型的构建方法、装置、设备及可读存储介质
CN112906772A (zh) 样本处理方法、装置、设备及计算机可读存储介质
CN110807452A (zh) 预测模型构建方法、装置、系统及银行卡卡号识别方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant