CN113724017A - 基于神经网络的定价方法、装置、电子设备和存储介质 - Google Patents
基于神经网络的定价方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN113724017A CN113724017A CN202111058594.8A CN202111058594A CN113724017A CN 113724017 A CN113724017 A CN 113724017A CN 202111058594 A CN202111058594 A CN 202111058594A CN 113724017 A CN113724017 A CN 113724017A
- Authority
- CN
- China
- Prior art keywords
- sample
- training
- determining
- resource
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 53
- 238000012549 training Methods 0.000 claims abstract description 110
- 230000015654 memory Effects 0.000 claims abstract description 43
- 238000007781 pre-processing Methods 0.000 claims abstract description 20
- 238000004064 recycling Methods 0.000 claims abstract description 12
- 238000012216 screening Methods 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 15
- 238000004590 computer program Methods 0.000 claims description 14
- 238000004891 communication Methods 0.000 claims description 12
- 238000013473 artificial intelligence Methods 0.000 abstract description 8
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000003287 optical effect Effects 0.000 description 7
- 238000012546 transfer Methods 0.000 description 6
- 230000009469 supplementation Effects 0.000 description 5
- 210000004027 cell Anatomy 0.000 description 4
- 239000006185 dispersion Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 125000004122 cyclic group Chemical group 0.000 description 3
- 238000011084 recovery Methods 0.000 description 3
- 230000000306 recurrent effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 238000002591 computed tomography Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 230000003902 lesion Effects 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000002595 magnetic resonance imaging Methods 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 206010000060 Abdominal distension Diseases 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- 210000001015 abdomen Anatomy 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 208000024330 bloating Diseases 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000004806 packaging method and process Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0283—Price estimation or determination
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/03—Credit; Loans; Processing thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Strategic Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- General Business, Economics & Management (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Technology Law (AREA)
- Bioinformatics & Computational Biology (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请涉及人工智能技术领域,具体公开了一种基于神经网络的定价方法、装置、电子设备和存储介质,其中,定价方法包括:对初始样本集进行预处理,得到训练样本集,所述初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集;根据所述训练样本集,确定模型训练参数;将所述训练样本集和所述模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型;获取待定价资产的历史资源归还数据和基本信息;根据所述基本信息,确定预测时长;将历史资源归还数据、基本信息和所述预测时长输入所述回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值;将第一数值作为待定价资产的参考价格。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于神经网络的定价方法、装置、电子设备和存储介质。
背景技术
近年来,随着零售银行业务的大发展,消费贷、个人信用卡透支规模快速增长,导致个人不良贷款规模也随之攀升。特别是在新冠肺炎疫情的冲击下,信用卡逾期、个人消费不良贷款的数量激增。基于此,加速对个人不良贷款的处置也迫在眉睫。
目前,银行对于个人不良资产处置渠道较为单一,只能进行清收或核销,或者将个人不良贷款资产证券化。但是,个人不良贷款资产证券化的门槛较高,综合成本也比较高,在实际应用中,发行成功的并不多。在2020年下半年,发布了个人不良贷款支持批量债转的试点通知,受到许多大型国有控股和股份制银行的极大关注,该政策能有效拓宽个人不良贷款的处置路径,加快不良资产的处置效率,是目前较为优秀的个人不良资产处置方式。
简单而言,该方式通过将一些个人不良资产进行打包形成组包资产,再将组包资产交易给第三方机构的方式对个人不良资产进行处置。基于此,如何针对组包资产进行合理定价是个人不良贷款批量转让在实际处置中面临的重要困难之一,也是不良资产债转交易成功的关键。因此,目前亟需一种对个人不良资产进行评估,继而自动生成参考价格的方法。
发明内容
为了解决现有技术中存在的上述问题,本申请实施方式提供了一种基于神经网络的定价方法、装置、电子设备和存储介质,可以自动对个人不良资产进行评估,并生成参考价格。
第一方面,本申请的实施方式提供了一种基于神经网络的定价方法,包括:
对初始样本集进行预处理,得到训练样本集,其中,初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集;
根据训练样本集,确定模型训练参数;
将训练样本集和模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型;
获取待定价资产的历史资源归还数据和基本信息;
根据基本信息,确定预测时长;
将历史资源归还数据、基本信息和预测时长输入回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值;
将第一数值作为待定价资产的参考价格。
第二方面,本申请的实施方式提供了一种基于神经网络的定价装置,包括:
预处理模块,用于对初始样本集进行预处理,得到训练样本集,其中,初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集;
参数确定模块,用于根据训练样本集,确定模型训练参数;
训练模块,用于将训练样本集和模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型;
数据获取模块,用于获取待定价资产的历史资源归还数据和基本信息;
参数确定模块,还用于根据基本信息,确定预测时长;
预测模块,用于将历史资源归还数据、基本信息和预测时长输入回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值,并将第一数值作为待定价资产的参考价格。
第三方面,本申请实施方式提供一种电子设备,包括:处理器,处理器与存储器相连,存储器用于存储计算机程序,处理器用于执行存储器中存储的计算机程序,以使得电子设备执行如第一方面的方法。
第四方面,本申请实施方式提供一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序使得计算机执行如第一方面的方法。
第五方面,本申请实施方式提供一种计算机程序产品,计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,计算机可操作来使计算机执行如第一方面的方法。
实施本申请实施方式,具有如下有益效果:
在本申请实施方式中,收集标识用户归还资源能力和归还资源意愿的历史数据,形成初始样本集,继而对初始样本集进行预处理,对初始样本集中的数据进行补全和清洗,得到训练样本集。然后,根据训练样本集,确定模型训练参数,并将训练样本集和模型训练参数,输入长短记忆(Long short-term memory,LSTM)神经网络进行训练,得到回收资源预测模型。最后,获取待定价资产的历史资源归还数据和基本信息,并根据该基本信息,确定预测时长。继而将历史资源归还数据、基本信息和预测时长输入回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值作为待定价资产的参考价格。由此,实现了自动对个人不良资产进行评估,并生成相应的参考价格,解决了现有个人不良资产转让过程中定价难的问题。
附图说明
为了更清楚地说明本申请实施方式中的技术方案,下面将对实施方式描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施方式提供的一种基于神经网络的定价装置的硬件结构示意图;
图2为本申请实施方式提供的一种基于神经网络的定价方法的流程示意图;
图3为本申请实施方式提供的一种对初始样本集进行预处理,得到训练样本集的方法的流程示意图;
图4为本申请实施方式提供的一种根据标准样本对初始样本集进行筛选,得到至少一个第一候选样本的方法的流程示意图;
图5为本申请实施方式提供的一种根据预设的筛选规则,在至少一个第二候选样本中筛选至少一个第三候选样本作为训练样本集的方法的流程示意图;
图6为本申请实施方式提供的一种LSTM的单一节点的结构的示意图;
图7为本申请实施方式提供的一种LSTM神经网络的计算图;
图8为本申请实施方式提供的一种根据所述基本信息,确定预测时长的方法的流程示意图;
图9为本申请实施方式提供的一种基于神经网络的定价装置的功能模块组成框图;
图10为本申请实施方式提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施方式中的附图,对本申请实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本申请一部分实施方式,而不是全部的实施方式。基于本申请中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本申请保护的范围。
本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施方式”意味着,结合实施方式描述的特定特征、结果或特性可以包含在本申请的至少一个实施方式中。在说明书中的各个位置出现该短语并不一定均是指相同的实施方式,也不是与其它实施方式互斥的独立的或备选的实施方式。本领域技术人员显式地和隐式地理解的是,本文所描述的实施方式可以与其它实施方式相结合。
首先,参阅图1,图1为本申请实施方式提供的一种基于神经网络的定价装置的硬件结构示意图。该基于神经网络的定价装置100包括至少一个处理器101,通信线路102,存储器103以及至少一个通信接口104。
在本实施方式中,处理器101,可以是一个通用中央处理器(central processingunit,CPU),微处理器,特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本申请方案程序执行的集成电路。
通信线路102,可以包括一通路,在上述组件之间传送信息。
通信接口104,可以是任何收发器一类的装置(如天线等),用于与其他设备或通信网络通信,例如以太网,RAN,无线局域网(wireless local area networks,WLAN)等。
存储器103,可以是只读存储器(read-only memory,ROM)或可存储静态信息和指令的其他类型的静态存储设备,随机存取存储器(random access memory,RAM)或者可存储信息和指令的其他类型的动态存储设备,也可以是电可擦可编程只读存储器(electrically erasable programmable read-only memory,EEPROM)、只读光盘(compactdisc read-only memory,CD-ROM)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
在本实施方式中,存储器103可以独立存在,通过通信线路102与处理器101相连接。存储器103也可以和处理器101集成在一起。本申请实施方式提供的存储器103通常可以具有非易失性。其中,存储器103用于存储执行本申请方案的计算机执行指令,并由处理器101来控制执行。处理器101用于执行存储器103中存储的计算机执行指令,从而实现本申请下述实施方式中提供的方法。
在可选的实施方式中,计算机执行指令也可以称之为应用程序代码,本申请对此不作具体限定。
在可选的实施方式中,处理器101可以包括一个或多个CPU,例如图1中的CPU0和CPU1。
在可选的实施方式中,该基于神经网络的自动定价装置100可以包括多个处理器,例如图1中的处理器101和处理器107。这些处理器中的每一个可以是一个单核(single-CPU)处理器,也可以是一个多核(multi-CPU)处理器。这里的处理器可以指一个或多个设备、电路、和/或用于处理数据(例如计算机程序指令)的处理核。
在可选的实施方式中,若基于神经网络的自动定价装置100为服务器,例如,可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。则基于神经网络的自动定价装置100还可以包括输出设备105和输入设备106。输出设备105和处理器101通信,可以以多种方式来显示信息。例如,输出设备105可以是液晶显示器(liquid crystal display,LCD),发光二级管(light emitting diode,LED)显示设备,阴极射线管(cathode ray tube,CRT)显示设备,或投影仪(projector)等。输入设备106和处理器101通信,可以以多种方式接收用户的输入。例如,输入设备106可以是鼠标、键盘、触摸屏设备或传感设备等。
上述的基于神经网络的自动定价装置100可以是一个通用设备或者是一个专用设备。本申请实施方式不限定基于神经网络的自动定价装置100的类型。
其次,需要说明的是,本申请所公开的实施方式可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
此外,本申请所公开的实施方式也能够应用于医学应用场景。具体而言,在医学应用场景中,输入样本可以为医学影像,输入样本包含的对象所属类型为病灶,即机体上发生病变的部分。医学影像是指为了医疗或医学研究,以非侵入方式取得的内部组织,例如,胃部、腹部、心脏、膝盖、脑部的影像,比如,CT(Computed Tomography,电子计算机断层扫描)、MRI(Magnetic Resonance Imaging,磁共振成像)、US(ultrasonic,超声)、X光图像、脑电图以及光学摄影灯由医学仪器生成的图像。
在一种可能的实施方式中,输入数据可以是医疗数据,如个人健康档案、处方、检查报告等数据。在另一种可能的实施方式中,输入文本可以为医疗文本,该医疗文本可以是医疗电子记录(Electronic Healthcare Record),电子化的个人健康记录,包括病历、心电图、医学影像等一系列具备保存备查价值的电子化记录。
在本实施方式中,上述各个输入样本可以通过信息查询进行快速获取。例如,在医疗领域中,当需要病例数据作为输入数据时,可以基于人工智能模型从海量的电子病历中查询用户所需的病历信息。
以下,将对本申请所公开的基于神经网络的定价方法进行说明:
参阅图2,图2为本申请实施方式提供的一种基于神经网络的定价方法的流程示意图。该基于神经网络的定价方法包括以下步骤:
201:对初始样本集进行预处理,得到训练样本集。
在本实施方式中,所述初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集。示例性的,本实施方式中的资源可以指借贷的资金、货物等,以下将以资金为例对本申请所提出的方法进行说明。具体而言,该初始样本集可以包括资产在每月回收情况及资产信息大宽表,可以包含时间(细粒度到月份)、历时每月还款金额、资产基本信息、负债情况等描述客户还款能力及还款意愿的指标数据,其中,底层数据可以来源于特管AIMS系统、第三方征信及上游信贷系统。
在本实施方式中,由于各个数据的来源不同,同时,各类系统中也可能存在数据缺失等情况,造成数据格式不统一,以及部分数据缺少等情况。因此,在获取到初始样本集后,需要对初始样本集中的数据进行预处理,例如:数据清洗、数据补充等。
在本实施方式中,提供了一种对初始样本集进行预处理,得到训练样本集的方法,如图3所示,该方法包括:
301:根据标准样本对初始样本集进行筛选,得到至少一个第一候选样本。
在本实施方式中,标准样本指用于标识输入长短记忆神经网络进行训练的样本的数据结构,即和标准样本数据结构一致的样本可以直接作为长短记忆神经网络的输入。若结构不一致,则需要根据缺失率判定是否要进行缺失值补充,或者直接将缺失率过高的样本丢弃。
示例性的,缺失率是指初始样本集中的某个样本的数据结构中的指标个数,相对于标准样本的数据结构中的指标个数,缺失的指标的个数占标准样本的数据结构中的指标个数的比例。其中,缺失的指标指标准样本中有,而初始样本集中的某个样本中没有的指标。
具体而言,初始样本集中的某个样本的数据结构为【指标1;指标2;指标5;指标8】,标准样本的数据结构为【指标1;指标2;指标3;指标5;指标6;指标8】。则相对于标准样本,该初始样本集中的某个样本的缺失指标为【指标3】和【指标6】,个数为2,同时标准样本中的指标个数为6,则该初始样本集中的某个样本的缺失率为:2/6=33%。
基于此,在本实施方式中,提供了一种根据标准样本对初始样本集进行筛选,得到至少一个第一候选样本的方法,如图4所示,该方法包括:
401:根据标准样本确定初始样本集中每个初始样本的缺失率。
在本实施方式中,缺失率的确定方式如步骤301中所述,在此不再赘述。
402:根据初始样本集中每个初始样本的缺失率,在初始样本中确定至少一个第四候选样本。
在本实施方式中,至少一个第四候选样本中的每个第四候选样本对应的缺失率小于第一阈值。简单而言,某个初始样本的缺失率超出第一阈值,则说明该样本的数据缺失严重,即便对其缺失值进行技术补全,也会由于基础数据的不足导致补全的数据的精准度不够,最终形成垃圾数据,影响模型的训练。因此,对于缺失率超出第一阈值的初始样本,可以直接进行丢弃,以提升处理效率。具体而言,第一阈值可以是30%。
403:确定每个第四候选样本的样本类型。
在本实施方式中,由于初始样本中包含各类不同的数据,而这些类型各异的数据的数据特性也不尽相同,因此,对于不同数据类型的样本,将采用不同的补全方法。
404:获取与样本类型对应的补全方法对每个第四候选样本进行补全,得到至少一个第一候选样本。
具体而言,补全方法可以包括邻值补充、中值补充和均值补充。
302:对至少一个第一候选样本中的每个第一候选样本中的标签进行编码,得到至少一个第二候选样本。
在本实施方式中,至少一个第二候选样本与至少一个第一候选样本一一对应。同时,本实施方式采用独热编码的方式,对每个第一候选样本中的标签进行编码。
303:根据预设的筛选规则,在至少一个第二候选样本中筛选至少一个第三候选样本作为训练样本集。
在本实施方式中,经过步骤301和步骤302后,将缺失率过高的样本淘汰的同时,对样本的格式进行了统一。但是,剩余的样本中依然存在数据质量差的样本。这些样本在进行训练时,不但不会提升模型的精准度,反而会降低模型的精准度和训练效率。因此,需要通过筛选规则将这类样本筛除。
示例性的,本申请提供了一种根据预设的筛选规则,在至少一个第二候选样本中筛选至少一个第三候选样本作为训练样本集的方法,如图5所示,该方法包括:
501:确定至少一个第二候选样本中的每个第二候选样本的乱码率。
在本实施方式中,可以根据每个样本的样本类型获取该样本类型的字符集,继而确定该样本中存在的不属于该字符集中的字符的个数,将该样本中存在的不属于该字符集中的字符的个数与该样本的总字符数的比值,作为该样本的乱码率。
502:对每个第二候选样本进行离散处理,确定每个第二候选样本在离散后得到的码值的数量。
503:根据每个第二候选样本的乱码率,以及每个第二候选样本在离散后得到的码值的数量,在至少一个第二候选样本中确定至少一个第三候选样本。
在本实施方式中,至少一个第三候选样本中的每个第三候选样本对应的乱码率大于第二阈值,或每个第三候选样本在离散后得到的码值的数量大于第三阈值。示例性的,简单而言,某个第二候选样本的乱码率超出第二阈值,则说明该样本的数据乱码严重,即便对其乱码进行恢复补全,也会由于基础数据的不足导致补全的数据的精准度不够,最终形成质量差的数据,影响模型的训练。同样的,某个第二候选样本在离散后得到的码值的数量大于第三阈值,说明该样本包括的标签点很多,数据离散严重,无法提取到高质量的数据特征,同样会影响模型的训练。因此,对于乱码率超出第二阈值,或离散后得到的码值的数量大于第三阈值的第二候选样本,可以直接进行丢弃,以提升处理效率。具体而言,第二阈值可以是30%,第三阈值可以是500。
在可选的实施方式中,还可以对至少一个第三候选样本进行进一步筛选。具体而言,经过上述筛选,筛除了缺失严重、低质量的样本,但是,剩余的样本中依旧可能存在与业务领域相关性低的样本。这些样本由于与待定价的业务领域的相关性低,其呈现出的数据特征可能并不符合当前业务领域中的某些规律。即,这些样本同样会对模型的训练产生影响,以影响模型的精准性。
基于此,在本实施方式中,可以对每个第三候选样本进行关键词提取,继而对提取出的关键词进行语义提取,得到对应的语义向量。将该语义向量与业务领域的领域向量进行相关性的计算,当相关系数大于第四阈值时,即可确定该第三候选样本与待定价的业务领域之间的相关性强。具体而言,相关性系数可以为0.8。
202:根据训练样本集,确定模型训练参数。
在本实施方式中,模型训练参数可以包括input_size和hidden_layer_size等参数。其中,input_size指输入中的要素数量,可以通过训练样本集中包含的训练样本的数量来确定。简而言之,可以将训练样本集中包含的训练样本的数量,作为该input_size参数的值。hidden_layer_size指隐藏层的数量以及每层中神经元的数量,可以根据待定价的业务领域来确定。
203:将训练样本集和模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型。
在本实施方式中,长短记忆(Long short-term memory,LSTM)神经网络,可以解决长序列训练过程中的梯度消失和梯度爆炸问题,也就是说,相比普通的循环神经网络(Recurrent Neural Network,RNN),LSTM能够在更长的序列中有更好的表现。
通常而言,RNN包含如下三个特性:
(1)循环神经网络能够在每个时间节点产生一个输出,且隐单元间的连接是循环的;
(2)循环神经网络能够在每个时间节点产生一个输出,且该时间节点上的输出仅与下一时间节点的隐单元有循环连接;
(3)循环神经网络包含带有循环连接的隐单元,且能够处理序列数据并输出单一的预测。
然而,RNN在处理长期依赖(时间序列上距离较远的节点)性质的数据时,会遇到巨大的困难。因为,计算距离较远的节点之间的联系时会涉及雅可比矩阵的多次相乘,这会带来梯度消失(经常发生)或者梯度膨胀(较少发生)的问题。而LSTM中有漏单元通过设计连接间的权重系数,从而允许LSTM累积距离较远节点间的长期联系。具体而言,LSTM的单一节点的结构如图6所示,LSTM通过在单一节点中增加输入门限,遗忘门限和输出门限,使得自循环的权重是变化的,这样一来在模型参数固定的情况下,不同时刻的积分尺度可以动态改变,从而避免了梯度消失或者梯度膨胀的问题。
根据LSTM网络的结构,每个LSTM单元的计算率可以通过公式①-⑥表示:
ft=σ(Wf×[ht-1,xt]+bf).........①
其中,ft表示遗忘门限,σ代表sigmod函数,Wf代表遗忘门限sigmoid函数的参数,bf代表遗忘门限sigmoid函数的常数项,xt代表输入的时点数据,ht-1表示前一时刻单元的输出。
it=σ(Wi×[ht-1,xt]+bi).........②
其中,it表示输入门限,Wi代表遗忘门限sigmoid函数的参数,bi代表遗忘门限sigmoid函数的常数项。
其中,Ct表示当前时刻cell状态。
ot=σ(Wo×[ht-1,xt]+bo).........⑤
其中,Ot表示输出门限,Wo代表遗忘门限sigmoid函数的参数,bo代表遗忘门限sigmoid函数的常数项。
ht=ot×tanh(Ct).........⑥
其中,ht表示当前单元的输出。
同时,在本实施方式中,提供了上述LSTM神经网络的计算图,如图7所示。从计算图上面可以清晰地看出LSTM的forward propagation和back propagation过程。Ht-1的误差由ht决定,且要对所有的gate layer传播回来的梯度求和;同时,Ct-1由Ct决定,而Ct的误差由两部分,一部分是ht,另一部分是Ct+1。所以在计算Ct反向传播误差的时候,需要传入ht和Ct+1,而ht在更新的时候需要加上ht+1。这样就可以从时刻t向后计算任一时刻的梯度,利用随机梯度下降完成权重系数的更新。
204:获取待定价资产的历史资源归还数据和基本信息。
在本实施方式中,历史资源归还数据可以包括历时每月还款金额;基本信息可以包括:待定价资产的剩余待还资源和剩余归还时长。
205:根据基本信息,确定预测时长。
在本实施方式中,提供了一种根据所述基本信息,确定预测时长的方法,如图8所示,该方法包括:
801:根据预设的规则和剩余待还资源,确定第一资源量。
在本实施方式中,可以根据历史数据和专家经验,制定一个模糊资源量确定策略,即取剩余待还资源的一部分,例如50%,作为模糊参考资源量,或者说最低可接受资源量。
802:获取与待定价资产同类型的资产的平均归还资源量。
在本实施方式中,与待定价资产同类型的资产可以理解为:借贷领域相似、借贷时长相似、借贷规模相似、以及借款人特征相似的资产。平均归还资源量可以理解为这些同类型的资产的还款人的平均还款金额。
803:根据第一资源量和平均归还资源量确定第一时长。
在本实施方式中,可以将第一资源量和平均归还资源量的商,作为第一时长。该第一时长用于标识在该待定价资产的拥有人正常进行资源归还的情况下,收回最低可接受资源量所需的时长。
804:根据第一时长和剩余还款时长,确定预测时长。
具体而言,可以根据预设的规则和剩余归还时长,确定第二时长。从而将第一时长的时间跨度和第二时长的时间跨度进行比较,确定第一时长和第二时长中时间跨度短的时长作为预测时长。
206:将历史资源归还数据、基本信息和预测时长输入回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值。
在本实施方式中,回收资源预测模型的最终输出的结果是该待定价资产的持有人在未来预测时长内每月的预测回收资源量。由此,可以针对该待定价资产的每月的预测回收资源量进行汇总,输出该待定价资产的最低债转底价。
207:将第一数值作为待定价资产的参考价格。
综上所述,本发明所提供的基于神经网络的自动定价方法中,收集标识用户归还资源能力和归还资源意愿的历史数据,形成初始样本集,继而对初始样本集进行预处理,对初始样本集中的数据进行补全和清洗,得到训练样本集。然后,根据训练样本集,确定模型训练参数,并将训练样本集和模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型。最后,获取待定价资产的历史资源归还数据和基本信息,并根据该基本信息,确定预测时长。继而将历史资源归还数据、基本信息和预测时长输入回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值作为待定价资产的参考价格。由此,实现了自动对个人不良资产进行评估,并生成相应的参考价格,解决了现有个人不良资产转让过程中定价难的问题。
参阅图9,图9为本申请实施方式提供的一种基于神经网络的定价装置的功能模块组成框图。如图9所示,该基于神经网络的定价装置900包括:
预处理模块901,用于对初始样本集进行预处理,得到训练样本集,其中,初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集;
参数确定模块902,用于根据训练样本集,确定模型训练参数;
训练模块903,用于将训练样本集和模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型;
数据获取模块904,用于获取待定价资产的历史资源归还数据和基本信息;
参数确定模块902,还用于根据基本信息,确定预测时长;
预测模块905,用于将历史资源归还数据、基本信息和预测时长输入回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值,并将第一数值作为待定价资产的参考价格。
在本发明的实施方式中,在对初始样本集进行预处理,得到训练样本集方面,预处理模块901,具体用于:
根据标准样本对初始样本集进行筛选,得到至少一个第一候选样本,其中,标准样本用于标识输入长短记忆神经网络进行训练的样本的数据结构;
对至少一个第一候选样本中的每个第一候选样本中的标签进行编码,得到至少一个第二候选样本,其中,至少一个第二候选样本与至少一个第一候选样本一一对应;
根据预设的筛选规则,在至少一个第二候选样本中筛选至少一个第三候选样本作为训练样本集。
在本发明的实施方式中,在根据标准样本对初始样本集进行筛选,得到至少一个第一候选样本方面,预处理模块901,具体用于:
根据标准样本确定初始样本集中每个初始样本的缺失率;
根据初始样本集中每个初始样本的缺失率,在初始样本集中确定至少一个第四候选样本,其中,至少一个第四候选样本中的每个第四候选样本对应的缺失率小于第一阈值;
确定每个第四候选样本的样本类型;
获取与样本类型对应的补全方法对每个第四候选样本进行补全,得到至少一个第一候选样本。
在本发明的实施方式中,在根据预设的筛选规则,在至少一个第二候选样本中筛选至少一个第三候选样本作为训练样本集方面,预处理模块901,具体用于:
确定至少一个第二候选样本中的每个第二候选样本的乱码率;
对每个第二候选样本进行离散处理,确定每个第二候选样本在离散后得到的码值的数量;
根据每个第二候选样本的乱码率,以及每个第二候选样本在离散后得到的码值的数量,在至少一个第二候选样本中确定至少一个第三候选样本,其中,至少一个第三候选样本中的每个第三候选样本对应的乱码率大于第二阈值,或每个第三候选样本在离散后得到的码值的数量大于第三阈值。
在本发明的实施方式中,在根据训练样本集,确定模型训练参数方面,参数确定模块902,具体用于:
确定训练样本集中包含的训练样本的数量;
将训练样本的数量,作为模型训练参数。
在本发明的实施方式中,基本信息包括:待定价资产的剩余待还资源和剩余归还时长;
基于此,在根据基本信息,确定预测时长方面,参数确定模块902,具体用于:
根据预设的规则和剩余待还资源,确定第一资源量;
获取与待定价资产同类型的资产的平均归还资源量;
根据第一资源量和平均归还资源量确定第一时长;
根据第一时长和剩余归还时长,确定预测时长。
在本发明的实施方式中,在根据拼音文本,在根据第一时长和剩余归还时长,确定预测时长方面,参数确定模块902,具体用于:
根据预设的规则和剩余归还时长,确定第二时长;
将第一时长的时间跨度和第二时长的时间跨度进行比较,确定第一时长和第二时长中时间跨度短的时长作为预测时长。
参阅图10,图10为本申请实施方式提供的一种电子设备的结构示意图。如图10所示,电子设备1000包括收发器1001、处理器1002和存储器1003。它们之间通过总线1004连接。存储器1003用于存储计算机程序和数据,并可以将存储器1003存储的数据传输给处理器1002。
处理器1002用于读取存储器1003中的计算机程序执行以下操作:
对初始样本集进行预处理,得到训练样本集,其中,初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集;
根据训练样本集,确定模型训练参数;
将训练样本集和模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型;
获取待定价资产的历史资源归还数据和基本信息;
根据基本信息,确定预测时长;
将历史资源归还数据、基本信息和预测时长输入回收资源预测模型,得到在预测时长所确定的时间段内,待定价资产的持有人归还资源的第一数值;
将第一数值作为待定价资产的参考价格。
在本发明的实施方式中,在对初始样本集进行预处理,得到训练样本集方面,处理器1002,具体用于执行以下操作:
根据标准样本对初始样本集进行筛选,得到至少一个第一候选样本,其中,标准样本用于标识输入长短记忆神经网络进行训练的样本的数据结构;
对至少一个第一候选样本中的每个第一候选样本中的标签进行编码,得到至少一个第二候选样本,其中,至少一个第二候选样本与至少一个第一候选样本一一对应;
根据预设的筛选规则,在至少一个第二候选样本中筛选至少一个第三候选样本作为训练样本集。
在本发明的实施方式中,在根据标准样本对初始样本集进行筛选,得到至少一个第一候选样本方面,处理器1002,具体用于执行以下操作:
根据标准样本确定初始样本集中每个初始样本的缺失率;
根据初始样本集中每个初始样本的缺失率,在初始样本集中确定至少一个第四候选样本,其中,至少一个第四候选样本中的每个第四候选样本对应的缺失率小于第一阈值;
确定每个第四候选样本的样本类型;
获取与样本类型对应的补全方法对每个第四候选样本进行补全,得到至少一个第一候选样本。
在本发明的实施方式中,在根据预设的筛选规则,在至少一个第二候选样本中筛选至少一个第三候选样本作为训练样本集方面,处理器1002,具体用于执行以下操作:
确定至少一个第二候选样本中的每个第二候选样本的乱码率;
对每个第二候选样本进行离散处理,确定每个第二候选样本在离散后得到的码值的数量;
根据每个第二候选样本的乱码率,以及每个第二候选样本在离散后得到的码值的数量,在至少一个第二候选样本中确定至少一个第三候选样本,其中,至少一个第三候选样本中的每个第三候选样本对应的乱码率大于第二阈值,或每个第三候选样本在离散后得到的码值的数量大于第三阈值。
在本发明的实施方式中,在根据训练样本集,确定模型训练参数方面,处理器1002,具体用于执行以下操作:
确定训练样本集中包含的训练样本的数量;
将训练样本的数量,作为模型训练参数。
在本发明的实施方式中,基本信息包括:待定价资产的剩余待还资源和剩余归还时长;
基于此,在根据基本信息,确定预测时长方面,处理器1002,具体用于执行以下操作:
根据预设的规则和剩余待还资源,确定第一资源量;
获取与待定价资产同类型的资产的平均归还资源量;
根据第一资源量和平均归还资源量确定第一时长;
根据第一时长和剩余归还时长,确定预测时长。
在本发明的实施方式中,在根据拼音文本,在根据第一时长和剩余归还时长,确定预测时长方面,处理器1002,具体用于执行以下操作:
根据预设的规则和剩余归还时长,确定第二时长;
将第一时长的时间跨度和第二时长的时间跨度进行比较,确定第一时长和第二时长中时间跨度短的时长作为预测时长。
应理解,本申请中的基于神经网络的定价装置可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(Mobile Internet Devices,简称:MID)、机器人或穿戴式设备等。上述基于神经网络的定价装置仅是举例,而非穷举,包含但不限于上述基于神经网络的定价装置。在实际应用中,上述基于神经网络的定价装置还可以包括:智能车载终端、计算机设备等等。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施方式或者实施方式的某些部分所述的方法。
因此,本申请实施方式还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如上述方法实施方式中记载的任何一种基于神经网络的定价方法的部分或全部步骤。例如,所述存储介质可以包括硬盘、软盘、光盘、磁带、磁盘、优盘、闪存等。
本申请实施方式还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,所述计算机程序可操作来使计算机执行如上述方法实施方式中记载的任何一种基于神经网络的定价方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施方式,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施方式均属于可选的实施方式,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施方式中,对各个实施方式的描述都各有侧重,某个实施方式中没有详述的部分,可以参见其他实施方式的相关描述。
在本申请所提供的几个实施方式中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
另外,在本申请各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施方式所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施方式的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施方式进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施方式的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于神经网络的定价方法,其特征在于,所述方法包括:
对初始样本集进行预处理,得到训练样本集,其中,所述初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集;
根据所述训练样本集,确定模型训练参数;
将所述训练样本集和所述模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型;
获取待定价资产的历史资源归还数据和基本信息;
根据所述基本信息,确定预测时长;
将所述历史资源归还数据、所述基本信息和所述预测时长输入所述回收资源预测模型,得到在所述预测时长所确定的时间段内,所述待定价资产的持有人归还资源的第一数值;
将所述第一数值作为所述待定价资产的参考价格。
2.根据权利要求1所述的方法,其特征在于,所述对初始样本集进行预处理,得到训练样本集,包括:
根据标准样本对所述初始样本集进行筛选,得到至少一个第一候选样本,其中,所述标准样本用于标识输入所述长短记忆神经网络进行训练的样本的数据结构;
对所述至少一个第一候选样本中的每个第一候选样本中的标签进行编码,得到至少一个第二候选样本,其中,所述至少一个第二候选样本与所述至少一个第一候选样本一一对应;
根据预设的筛选规则,在所述至少一个第二候选样本中筛选至少一个第三候选样本作为所述训练样本集。
3.根据权利要求2所述的方法,其特征在于,所述根据标准样本对所述初始样本集进行筛选,得到至少一个第一候选样本,包括:
根据所述标准样本确定所述初始样本集中每个初始样本的缺失率;
根据所述初始样本集中每个初始样本的缺失率,在所述初始样本集中确定至少一个第四候选样本,其中,所述至少一个第四候选样本中的每个第四候选样本对应的缺失率小于第一阈值;
确定所述每个第四候选样本的样本类型;
获取与所述样本类型对应的补全方法,并通过所述补全方法对所述每个第四候选样本进行补全,得到所述至少一个第一候选样本。
4.根据权利要求2所述的方法,其特征在于,所述根据预设的筛选规则,在所述至少一个第二候选样本中筛选至少一个第三候选样本作为所述训练样本集,包括:
确定所述至少一个第二候选样本中的每个第二候选样本的乱码率;
对所述每个第二候选样本进行离散处理,确定所述每个第二候选样本在离散后得到的码值的数量;
根据所述每个第二候选样本的乱码率,以及所述每个第二候选样本在离散后得到的码值的数量,在所述至少一个第二候选样本中确定所述至少一个第三候选样本,其中,所述至少一个第三候选样本中的每个第三候选样本对应的乱码率大于第二阈值,或所述每个第三候选样本在离散后得到的码值的数量大于第三阈值。
5.根据权利要求1所述的方法,其特征在于,所述根据所述训练样本集,确定模型训练参数,包括:
确定所述训练样本集中包含的训练样本的数量;
将所述训练样本的数量,作为所述模型训练参数。
6.根据权利要求1所述的方法,其特征在于,
所述基本信息包括:所述待定价资产的剩余待还资源和剩余归还时长;
所述根据所述基本信息,确定预测时长,包括
根据预设的规则和所述剩余待还资源,确定第一资源量;
获取与所述待定价资产同类型的资产的平均归还资源量;
根据所述第一资源量和所述平均归还资源量确定第一时长;
根据所述第一时长和所述剩余归还时长,确定所述预测时长。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第一时长和所述剩余归还时长,确定所述预测时长,包括:
根据所述预设的规则和所述剩余归还时长,确定第二时长;
将所述第一时长的时间跨度和所述第二时长的时间跨度进行比较,确定所述第一时长和所述第二时长中时间跨度短的时长作为所述预测时长。
8.一种基于神经网络的定价装置,其特征在于,所述装置包括:
预处理模块,用于对初始样本集进行预处理,得到训练样本集,其中,所述初始样本集为包括标识用户归还资源能力和归还资源意愿的数据集;
参数确定模块,用于根据所述训练样本集,确定模型训练参数;
训练模块,用于将所述训练样本集和所述模型训练参数,输入长短记忆神经网络进行训练,得到回收资源预测模型;
数据获取模块,用于获取待定价资产的历史资源归还数据和基本信息;
所述参数确定模块,还用于根据所述基本信息,确定预测时长;
预测模块,用于将所述历史还款数据、所述基本信息和所述预测时长输入所述回收资源预测模型,得到在所述预测时长所确定的时间段内,所述待定价资产的持有人归还资源的第一数值,并将所述第一数值作为所述待定价资产的参考价格。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述一个或多个程序包括用于执行权利要求1-7任一项方法中的步骤的指令。
10.一种可读计算机存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111058594.8A CN113724017A (zh) | 2021-09-09 | 2021-09-09 | 基于神经网络的定价方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111058594.8A CN113724017A (zh) | 2021-09-09 | 2021-09-09 | 基于神经网络的定价方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113724017A true CN113724017A (zh) | 2021-11-30 |
Family
ID=78683063
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111058594.8A Pending CN113724017A (zh) | 2021-09-09 | 2021-09-09 | 基于神经网络的定价方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113724017A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115841346A (zh) * | 2023-02-23 | 2023-03-24 | 杭银消费金融股份有限公司 | 用于经营决策的资产减值预测方法和系统 |
-
2021
- 2021-09-09 CN CN202111058594.8A patent/CN113724017A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115841346A (zh) * | 2023-02-23 | 2023-03-24 | 杭银消费金融股份有限公司 | 用于经营决策的资产减值预测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113822494B (zh) | 风险预测方法、装置、设备及存储介质 | |
CN113508378B (zh) | 推荐模型的训练方法、推荐方法、装置及计算机可读介质 | |
US20190325514A1 (en) | Credit risk prediction method and device based on lstm model | |
CN108197532A (zh) | 人脸识别的方法、装置及计算机装置 | |
CN111814910B (zh) | 异常检测方法、装置、电子设备及存储介质 | |
CN112990294B (zh) | 行为判别模型的训练方法、装置、电子设备及存储介质 | |
CN111340506A (zh) | 交易行为的风险识别方法、装置、存储介质和计算机设备 | |
CN108804564A (zh) | 金融产品的组合推荐方法及终端设备 | |
CN114511387A (zh) | 产品推荐方法、装置、电子设备及存储介质 | |
CN114841161A (zh) | 事件要素抽取方法、装置、设备、存储介质和程序产品 | |
CN117557331A (zh) | 一种产品推荐方法、装置、计算机设备及存储介质 | |
CN116681082A (zh) | 离散文本语义分段方法、装置、设备及存储介质 | |
CN113705698B (zh) | 基于点击行为预测的信息推送方法及装置 | |
CN113724017A (zh) | 基于神经网络的定价方法、装置、电子设备和存储介质 | |
CN114118526A (zh) | 一种企业风险预测方法、装置、设备及存储介质 | |
Hsieh et al. | MDF-Net for abnormality detection by fusing X-rays with clinical data | |
CN110851600A (zh) | 基于深度学习的文本数据处理方法及装置 | |
CN113806641A (zh) | 基于深度学习的推荐方法、装置、电子设备和存储介质 | |
CN113590845B (zh) | 基于知识图谱的文献检索方法、装置、电子设备及介质 | |
CN115860802A (zh) | 产品价值预测方法、装置、计算机设备和存储介质 | |
CN115758271A (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN109886299A (zh) | 一种用户画像方法、装置、可读存储介质及终端设备 | |
CN114022270A (zh) | 资产数据处理方法、相关设备及介质 | |
CN114461085A (zh) | 医疗输入推荐方法、装置、设备及存储介质 | |
CN114581250A (zh) | 一种医保欺诈的识别方法、装置、设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |