CN114219307A - 产品确定方法、装置、设备及计算机存储介质 - Google Patents
产品确定方法、装置、设备及计算机存储介质 Download PDFInfo
- Publication number
- CN114219307A CN114219307A CN202111546709.8A CN202111546709A CN114219307A CN 114219307 A CN114219307 A CN 114219307A CN 202111546709 A CN202111546709 A CN 202111546709A CN 114219307 A CN114219307 A CN 114219307A
- Authority
- CN
- China
- Prior art keywords
- product
- target
- data
- model
- training
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 239000000047 product Substances 0.000 claims description 378
- 238000012549 training Methods 0.000 claims description 113
- 238000012795 verification Methods 0.000 claims description 46
- 238000013528 artificial neural network Methods 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 36
- 238000004590 computer program Methods 0.000 claims description 21
- 238000012216 screening Methods 0.000 claims description 11
- 238000010606 normalization Methods 0.000 claims description 9
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 239000006227 byproduct Substances 0.000 claims description 5
- 239000000126 substance Substances 0.000 claims description 5
- 238000011156 evaluation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 4
- 238000007726 management method Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- MJEREOGWNZGKRN-UHFFFAOYSA-N 1-(4-aminophenyl)-8-[4-(4-fluorophenyl)-4-oxobutyl]-1,3,8-triazaspiro[4.5]decan-4-one Chemical compound C1=CC(N)=CC=C1N1C2(CCN(CCCC(=O)C=3C=CC(F)=CC=3)CC2)C(=O)NC1 MJEREOGWNZGKRN-UHFFFAOYSA-N 0.000 description 2
- 238000012821 model calculation Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000007792 addition Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000002790 cross-validation Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Development Economics (AREA)
- Educational Administration (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Strategic Management (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本申请实施例提供了一种产品确定方法、装置、设备及计算机存储介质。其中方法包括:获取目标产品数据,基于目标产品数据和训练好的退出模型进行计算,得到目标产品的得分,将得分大于第一预设阈值的目标产品作为退出产品。根据本申请实施例的产品退出方法,能够准确确定出需要退出的产品且消耗时间短。
Description
技术领域
本申请属于大数据领域,尤其涉及一种产品确定方法、装置、设备及计算机存储介质。
背景技术
随着经济的快速发展,为了获得产品的投放成效,需要对成效较差的产品进行退出处理,保留成效更好的产品。基于上述目的,行业对产品退出机制的业务需求越来越旺盛。目前,在现有的产品中确定需要退出的成效差的产品的方式主要依赖于相关技术人员,相关技术人员根据获取的产品的数据进行分析,确定其中成效较差的产品,并对其进行退出操作,耗时长且准确度较低。
发明内容
本申请实施例提供一种产品确定方法、装置、设备、计算机存储介质及计算机程序产品,能够更快速、精准的确定需要退出的产品。
第一方面,本申请实施例提供一种产品确定方法,方法包括:
获取目标产品数据,目标产品数据包括目标产品特征类型和目标产品特征类型对应的产品特征数据;
基于退出模型和目标产品数据计算得到目标产品的目标得分,退出模型由产品数据训练得到,产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据,退出模型根据目标产品特征类型对应的产品特征数据计算目标得分;
当目标产品的目标得分大于第一预设阈值时,确定目标产品为退出产品。
根据本申请的一个方面,基于退出模型和目标产品数据计算得到目标产品的目标得分之前,方法还包括:
获取产品数据;
基于产品数据训练神经网络得到第一模型;
将产品数据输入第一模型得到产品特征类型的重要性得分;
选择重要性得分大于预设阈值的产品特征类型作为目标特征类型;
筛选产品数据,得到目标特征类型对应的产品特征数据;
基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型。
根据本申请的一个方面,基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型,包括:
根据变权公式确定目标特征的目标权重系数,变权公式为
基于目标特征的目标权重系数,对目标产品特征数据进行计算得到目标产品的目标得分。
根据本申请的一个方面,基于产品数据训练神经网络得到第一模型,包括:
将产品数据均匀划分为k组,其中1组作为测试样本,k-1组作为训练样本,其中k大于等于2;
基于训练样本对神经网络进行训练,得到初始模型;
基于验证样本对初始模型进行验证,得到第一模型。
根据本申请的一个方面,基于训练样本对神经网络进行训练,得到初始模型;基于验证样本对初始模型进行验证,得到第一模型,包括:
对训练样本数据和验证样本数据进行归一化处理;
对训练样本数据和验证样本数据进行离散化处理;
基于处理后的训练样本数据对神经网络进行训练,得到初始模型;
基于处理后的验证样本数据对初始模型进行验证,得到第一模型。
根据本申请的一个方面,产品特征类型包括绩效、客群、市场、管理属性、风险数据和产品属性数据中的至少一项。
根据本申请的一个方面,基于处理后的训练样本数据对神经网络进行训练,得到初始模型之前,方法还包括:
基于平均值填充法对样本数据和验证数据进行空值处理。
第二方面,本申请实施例提供了一种产品确定装置,装置包括:
获取模块,用于获取目标产品数据,目标产品数据包括目标产品特征类型和目标产品特征类型对应的产品特征数据;
计算模块,用于基于退出模型和目标产品数据计算得到目标产品的目标得分,退出模型由产品数据训练得到,产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据,退出模型根据目标产品特征类型对应的产品特征数据计算目标得分;
确定模块,用于当目标产品的目标得分大于第一预设阈值时,确定目标产品为退出产品。
根据本申请的一个方面,装置还包括:
获取模块,还用于获取产品数据;
训练模块,用于基于产品数据训练神经网络得到第一模型;
输入模块,用于将产品数据输入第一模型得到产品特征类型的重要性得分;
选择模块,用于选择重要性得分大于预设阈值的产品特征类型作为目标特征类型;
筛选模块,用于筛选产品数据,得到目标特征类型对应的产品特征数据;
训练模块,还用于基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型。
根据本申请的一个方面,训练模块,还用于基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型,包括:
确定模块,还用于根据变权公式确定目标特征的目标权重系数,变权公式为
训练模块,还用于基于目标特征的目标权重系数,对目标产品特征数据进行计算得到目标产品的目标得分。
根据本申请的一个方面,训练模块,用于基于产品数据训练神经网络得到第一模型,包括:
划分模块,用于将产品数据均匀划分为k组,其中1组作为测试样本,k-1组作为训练样本,其中k大于等于2;
训练模块,用于基于训练样本对神经网络进行训练,得到初始模型;
验证模块,用于基于验证样本对初始模型进行验证,得到第一模型。
根据本申请的一个方面,训练模块,用于基于训练样本对神经网络进行训练,得到初始模型;验证模块,用于基于验证样本对初始模型进行验证,得到第一模型,包括:
处理模块,用于对训练样本数据和验证样本数据进行归一化处理;
处理模块,还用于对训练样本数据和验证样本数据进行离散化处理;
训练模块,用于基于处理后的训练样本数据对神经网络进行训练,得到初始模型;
验证模块,用于基于处理后的验证样本数据对初始模型进行验证,得到第一模型。
根据本申请的一个方面,产品特征类型包括绩效,客群、市场、管理属性、风险数据和产品属性数据中的至少一项。
根据本申请的一个方面,装置还包括:
处理模块,还用于基于平均值填充法对样本数据和验证数据进行空值处理。
第三方面,本申请实施例提供了一种产品确定设备,设备包括:
处理器,以及存储有计算机程序指令的存储器;
处理器读取并执行计算机程序指令,以实现第一方面的产品确定方法。
第四方面,本申请实施例提供了一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现第一方面的产品确定方法。
第五方面,本申请实施例提供了一种计算机程序产品,其特征在于,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行第一方面的产品确定方法。
本申请实施例的产品确定方法、装置、设备及计算机存储介质,获取目标产品数据,基于目标产品数据和神经网络对产品特征重要性进行计算,并进一步确定重要特征,基于重要特征对应的目标产品数据对神经网络进行训练得到退出模型,利用训练好的退出模型对产品得分进行计算,将得分大于第一预设阈值的目标产品作为退出产品,准确确定出需要退出的产品且消耗时间短。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单的介绍,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种产品确定方法的流程示意图;
图2是本申请实施例提供的一种产品确定装置的结构示意图;
图3是本申请实施例提供的一种产品确定设备的结构示意图。
具体实施方式
下面将详细描述本申请的各个方面的特征和示例性实施例,为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及具体实施例,对本申请进行进一步详细描述。应理解,此处所描述的具体实施例仅意在解释本申请,而不是限定本申请。对于本领域技术人员来说,本申请可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本申请的示例来提供对本申请更好的理解。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
目前对于金融产品的退出,需要通过相关技术人员根据获取的产品数据进行分析,并确定需要退出的产品,耗时长且精准度较低。
为了解决现有技术问题,本申请实施例提供了一种产品确定方法、装置、设备及计算机存储介质。下面首先对本申请实施例所提供的产品确定方法进行介绍。
图1示出了本申请一个实施例提供的产品确定方法的流程示意图。如图1所示,该方法可以包括以下步骤:
S110、获取目标产品数据,目标产品数据包括目标产品特征类型和目标产品特征类型对应的产品特征数据。
获取的目标产品为金融产品,例如贷记卡产品等。
在一些实施例中,获取目标产品的特征类型,其中,目标产品特征类型可以包括产品的属性信息、绩效、客群、市场、管理属性、风险数据等;获取目标产品特征类型对应的产品特征数据如表1所示,例如包括产品标识(ASPD_ID)、产品销售开始时间(Strt_Sale_Dt)、产品销售结束时间(End_Sale_Dt)等,当获取到的目标产品数量为473个时,获取的对应的产品特征数据数量也为473个。
表1
在一些实施例中,基于上述目标产品特征类型和目标产品特征类型对应的产品特征数据的映射关系,建立特征体系库。例如:ASPD_ID对应产品的属性信息等。
S120、基于退出模型和目标产品数据计算得到目标产品的目标得分,退出模型由产品数据训练得到,产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据,退出模型根据目标产品特征类型对应的产品特征数据计算目标得分。
将目标产品数据输入训练好的退出模型,得到输出目标产品的得分,其中,退出模型是利用产品数据进行训练的,产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据,产品退出数据用于表示产品是否为退出产品。退出模型根据输入的目标产品特征类型对应的产品特征数据进行计算,输出目标产品的得分。利用训练好的退出模型,将获取的目标产品数据输入模型,得到输出的目标产品的得分,该得分用于判断目标产品是否需要退出。
S130、当目标产品的目标得分大于第一预设阈值时,确定目标产品为退出产品。
比较目标产品的目标得分,当目标产品的目标得分大于第一预设阈值时确定该产品为退出产品,即需要进行退出处理。其中第一预设阈值可以根据需求设定,对此不作限制。
在一种示例中,第一预设阈值可以为0.90,产品的目标得分为0.86,此时,确定该产品为退出产品。
本申请实施例提供的产品确定方法,能够基于目标产品数据和退出模型对目标产品得分进行计算,将得到的目标产品得分与第一预设阈值进行比较,确定出退出产品,提高了退出产品的准确性,减少了确定退出产品的耗时。
在一些实施例中,在基于退出模型和目标产品数据计算得到目标产品的目标得分之前,方法还包括:获取产品数据;基于产品数据训练神经网络得到第一模型;将产品数据输入第一模型得到产品特征类型的重要性得分;选择重要性得分大于预设阈值的产品特征类型作为目标特征类型;筛选产品数据,得到目标特征类型对应的产品特征数据;基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型。获取产品数据,产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据。利用产品数据训练基于XGBoost分类器的神经网络,得到第一模型。将产品数据输出第一模型,输出为产品特征分类类别树,根据得到产品特征分类类别树计算产品特征类型的重要性得分。将产品特征类型的重要性得分大于预设阈值的产品特征类型作为目标特征类型,对产品数据进行筛选,将目标特征类型以外的产品特征类型及对应的产品特征数据删除,利用筛选后的产品数据对第一模型进行训练得到退出模型。其中重要性得分的计算公式如下:
xi为特征,wq(x)为叶子节点q的得分,f(x)为其中一棵回归树,R为所有树,T为叶子节点个数,w是叶子节点的权重。
在一种示例中,特征重要性得分结果如表2所示,idcst_num得分0.62;actv_cst_num得分0.24,com_rel_cst_num_new_rto_qtr得分0.05。
表2
本申请实施例提供的产品确定方法,能够利用已经确定退出数据的产品数据进行模型训练,根据模型计算得到的产品特征重要性进行数据筛选,并利用重要性较高的特征进一步训练模型,使模型输出的产品得分更准确,使确定退出产品的准确性更高。
在一些实施例中,基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型包括:根据变权公式确定目标特征的权重系数;基于目标特征对应的产品特征数据、产品退出数据和目标特征的权重系数训练第一模型得到退出模型。对于确定的目标特征,利用变权公式:
其中,为第i个目标特征的目标权重系数;xi为第i个目标特征的评估值;n为目标特征的数量;i=1,2,...,n;wi为退出模型中第i个目标特征的权重系数。基于目标特征的目标权重系数,对目标产品特征数据进行计算得到目标产品的目标得分。
在一些实施例中,基于产品数据训练神经网络得到第一模型,包括:将产品数据均匀划分为k组,其中1组作为测试样本,k-1组作为训练样本,其中k大于等于2;基于训练样本对神经网络进行训练,得到初始模型;基于验证样本对初始模型进行验证,得到第一模型。基于k折交叉验证,将产品数据划分为k组,1组作为测试样本,k-1组作为训练样本。
在一些实施例中,基于训练样本对神经网络进行训练,得到初始模型;基于验证样本对初始模型进行验证,得到第一模型,包括:对训练样本数据和验证样本数据进行归一化处理;对训练样本数据和验证样本数据进行离散化处理;基于处理后的训练样本数据对神经网络进行训练,得到初始模型;基于处理后的验证样本数据对初始模型进行验证,得到第一模型。对数据进行归一化处理,处理后数据Sij的计算公式如下:
其中,xij是归一化之前样本,Sij是归一化后样本,min(xj)是原始样本最小值,max(xj)是原始样本最大值。
对数据机型离散化处理,处理后数据zij的计算公式如下:
其中,zij为离散化后样本,min(sj)为离散化后样本最小值,max(sj)为离散化后样本最大值,Q为步长,计算公式如下:
在一种示例中,处理后的结果如表3所示,每一列为一个特征数据,每一行包括总数(count)、均值(mean)、标准差(std)、最小值(min)、第25个百分位数(25%)、第50个百分位数(50%)、第75个百分位数(75)和最大值(max):
表3
本申请实施例提供的产品确定方法,通过对产品数据的分组、归一化处理和离散化处理,能够进一步提高模型输出的产品得分的准确度,使确定退出产品的准确性更高。
在一些实施例中,基于处理后的训练样本数据对神经网络进行训练,得到初始模型之前,方法还包括:基于平均值填充法对样本数据和验证数据进行空值处理。利用平均值填充法,对样本数据和验证数据的空值进行填充,例如,填充结果如表4所示,在产品数量为473时,填充后的每个特征数据例如ASP_ID中均无空值:
表4
在本申请实施例提供的产品确定方法,通过对空值进行填充,能够有效减少误差,提高确定退出产品的准确性。
在一些实施例中,训练模型的过程中,从详细精度、混淆矩阵和节点错误率三个方面,检验贷记卡产品退出标志预测模型准确性。采用网格搜索(GridSearchCV)方法对最佳参数进行模型调参。调参结果如表5所示:
表5
参数 | 参数值 |
learning_rate | 0.5 |
max_depth | 2 |
n_estimators | 100 |
min_child_weight | 5 |
seed | 0 |
subsample | 0.5 |
colsample_bytree | 1 |
gamma | 0.04 |
reg_alpha | 0.1 |
reg_lambda | 1 |
其中,详细精度包括:真正元比率(TP rate)、假正元比率(FP rate)、精准度(Precision)、查全率(Recall)、查全率和查全率的调和平均数(F-measure)。
在一种实施例中,未进行变权的退出模型的输出结果如表6所示,编号00000336的产品目标得分为0.982,编号00000281的产品目标得分为0.973,编号00000359的产品目标得分为0.961:
表6
产品编号 | 得分 |
00000336 | 0.982 |
00000281 | 0.973 |
00000359 | 0.961 |
… | … |
经过变权的退出模型的输出结果如表7所示,编号00000336的产品目标得分为89.12151,编号00000281的产品目标得分为34.18247:
表7
产品编号 | 得分 |
00000336 | 89.12151 |
00000281 | 34.18247 |
… | … |
本申请实施例提供的产品确定方法,能够获取目标产品数据,基于目标产品数据和训练好的退出模型进行计算,得到目标产品的得分,将得分大于第一预设阈值的目标产品作为退出产品,准确确定出需要退出的产品且消耗时间短。
图2是本申请实施例提供的一种产品确定装置结构示意图。如图2所示,该装置200可以包括获取模块210,计算模块220和确定模块230。
获取模块210,用于获取目标产品数据,目标产品数据包括目标产品特征类型和目标产品特征类型对应的产品特征数据。
计算模块220,用于基于退出模型和目标产品数据计算得到目标产品的目标得分,退出模型由产品数据训练得到,产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据,退出模型根据目标产品特征类型对应的产品特征数据计算目标得分。
确定模块230,用于当目标产品的目标得分大于第一预设阈值时,确定目标产品为退出产品。
本申请实施例提供的产品确定装置,能够基于目标产品数据和退出模型对目标产品得分进行计算,将得到的目标产品得分与第一预设阈值进行比较,确定出退出产品,提高了退出产品的准确性,减少了确定退出产品的耗时。
在一些实施例中,装置还包括:获取模块210,还用于获取产品数据;训练模块240,用于基于产品数据训练神经网络得到第一模型;输入模块250,用于将产品数据输入第一模型得到产品特征类型的重要性得分;选择模块260,用于选择重要性得分大于预设阈值的产品特征类型作为目标特征类型;筛选模块270,用于筛选产品数据,得到目标特征类型对应的产品特征数据;训练模块240,还用于基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型。
本申请实施例提供的产品确定装置,能够利用已经确定退出数据的产品数据进行模型训练,根据模型计算得到的产品特征重要性进行数据筛选,并利用重要性较高的特征进一步训练模型,使模型输出的产品得分更准确,使确定退出产品的准确性更高。
在一些实施例中,训练模块,还用于基于目标特征对应的产品特征数据和产品退出数据训练第一模型得到退出模型,包括:确定模块,还用于根据变权公式确定目标特征的目标权重系数,变权公式为
其中,wi为退出模型中目标特征的权重系数,为目标特征的目标权重系数,n为目标特征的数量,i=1,2,...,n;训练模块,还用于基于目标特征的目标权重系数,对目标产品特征数据进行计算得到目标产品的目标得分。
在一些实施例中,训练模块240,用于基于产品数据训练神经网络得到第一模型,包括:划分模块280,用于将产品数据均匀划分为k组,其中1组作为测试样本,k-1组作为训练样本,其中k大于等于2;训练模块240,用于基于训练样本对神经网络进行训练,得到初始模型;验证模块290,用于基于验证样本对初始模型进行验证,得到第一模型。
在一些实施例中,训练模块240,用于基于训练样本对神经网络进行训练,得到初始模型;验证模块290,用于基于验证样本对初始模型进行验证,得到第一模型,包括:处理模块201,用于对训练样本数据和验证样本数据进行归一化处理;处理模块201,还用于对训练样本数据和验证样本数据进行离散化处理;训练模块240,用于基于处理后的训练样本数据对神经网络进行训练,得到初始模型;验证模块290,用于基于处理后的验证样本数据对初始模型进行验证,得到第一模型。
在一些实施例中,产品特征类型包括绩效,客群、市场、管理属性、风险数据和产品属性数据中的至少一项。
本申请实施例提供的产品确定装置,通过对产品数据的分组、归一化处理和离散化处理,能够进一步提高模型输出的产品得分的准确度,使确定退出产品的准确性更高。
在一些实施例中,装置还包括:处理模块201,还用于基于平均值填充法对样本数据和验证数据进行空值处理。
本申请实施例提供的产品确定装置,能够获取目标产品数据,基于目标产品数据和训练好的退出模型进行计算,得到目标产品的得分,将得分大于第一预设阈值的目标产品作为退出产品,准确确定出需要退出的产品且消耗时间短。
图2所示装置中的各个模块具有实现图1中产品确定设备所执行的各个步骤的功能,并能达到其相应的技术效果,为简洁描述,在此不再赘述。
图3示出了本申请实施例提供的产品确定的硬件结构示意图。
在产品确定设备可以包括处理器301以及存储有计算机程序指令的存储器302。
具体地,上述处理器301可以包括中央处理器(Central Processing Unit,CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器302可以包括用于数据或指令的大容量存储器。举例来说而非限制,存储器302可包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个或更多个以上这些的组合。在一个实例中,存储器302可以包括可移除或不可移除(或固定)的介质,或者存储器302是非易失性固态存储器。存储器302可在综合网关容灾设备的内部或外部。
在一个实例中,存储器302可包括只读存储器(ROM),随机存取存储器(RAM),磁盘存储介质设备,光存储介质设备,闪存设备,电气、光学或其他物理/有形的存储器存储设备。因此,通常,存储器302包括一个或多个编码有包括计算机可执行指令的软件的有形(非暂态)计算机可读存储介质(例如,存储器设备),并且当该软件被执行(例如,由一个或多个处理器)时,其可操作来执行参考根据本申请的一方面的方法所描述的操作。
处理器301通过读取并执行存储器302中存储的计算机程序指令,以实现图1所示实施例中的方法/步骤S110至S130,并达到图1所示实例执行其方法/步骤达到的相应技术效果,为简洁描述在此不再赘述。
在一个示例中,产品确定设备还可包括通信接口303和总线310。其中,如图3所示,处理器301、存储器302、通信接口303通过总线310连接并完成相互间的通信。
通信接口303,主要用于实现本申请实施例中各模块、装置、单元和/或设备之间的通信。
总线310包括硬件、软件或两者,将产品确定设备的部件彼此耦接在一起。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(Extended Industry Standard Architecture,EISA)总线、前端总线(Front Side Bus,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(IndustryStandard Architecture,ISA)总线、无限带宽互连、低引脚数(LPC)总线、存储器总线、微信道架构(MCA)总线、外围组件互连(PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(SATA)总线、视频电子标准协会局部(VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线310可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
该产品确定设备可以基于产品数据和退出模型执行本申请实施例中的产品确定方法,从而实现结合图1描述的产品确定方法。
另外,结合上述实施例中的产品确定方法,本申请实施例可提供一种计算机存储介质来实现。该计算机存储介质上存储有计算机程序指令;该计算机程序指令被处理器执行时实现上述实施例中的任意一种产品确定方法。
本申请实施例提供了一种计算机程序产品,计算机程序产品中的指令由电子设备的处理器执行时,使得电子设备执行上述产品确定方法。
需要明确的是,本申请并不局限于上文所描述并在图中示出的特定配置和处理。为了简明起见,这里省略了对已知方法的详细描述。在上述实施例中,描述和示出了若干具体的步骤作为示例。但是,本申请的方法过程并不限于所描述和示出的具体步骤,本领域的技术人员可以在领会本申请的精神后,作出各种改变、修改和添加,或者改变步骤之间的顺序。
以上所述的结构框图中所示的功能块可以实现为硬件、软件、固件或者它们的组合。当以硬件方式实现时,其可以例如是电子电路、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、适当的固件、插件、功能卡等等。当以软件方式实现时,本申请的元素是被用于执行所需任务的程序或者代码段。程序或者代码段可以存储在机器可读介质中,或者通过载波中携带的数据信号在传输介质或者通信链路上传送。“机器可读介质”可以包括能够存储或传输信息的任何介质。机器可读介质的例子包括电子电路、半导体存储器设备、ROM、闪存、可擦除ROM(EROM)、软盘、CD-ROM、光盘、硬盘、光纤介质、射频(RadioFrequency,RF)链路,等等。代码段可以经由诸如因特网、内联网等的计算机网络被下载。
还需要说明的是,本申请中提及的示例性实施例,基于一系列的步骤或者装置描述一些方法或系统。但是,本申请不局限于上述步骤的顺序,也就是说,可以按照实施例中提及的顺序执行步骤,也可以不同于实施例中的顺序,或者若干步骤同时执行。
上面参考根据本申请的实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本申请的各方面。应当理解,流程图和/或框图中的每个方框以及流程图和/或框图中各方框的组合可以由计算机程序指令实现。这些计算机程序指令可被提供给通用计算机、专用计算机、或其它可编程数据处理装置的处理器,以产生一种机器,使得经由计算机或其它可编程数据处理装置的处理器执行的这些指令使能对流程图和/或框图的一个或多个方框中指定的功能/动作的实现。这种处理器可以是但不限于是通用处理器、专用处理器、特殊应用处理器或者现场可编程逻辑电路。还可理解,框图和/或流程图中的每个方框以及框图和/或流程图中的方框的组合,也可以由执行指定的功能或动作的专用硬件来实现,或可由专用硬件和计算机指令的组合来实现。
以上所述,仅为本申请的具体实施方式,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。应理解,本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本申请的保护范围之内。
Claims (17)
1.一种产品确定方法,其特征在于,包括:
获取目标产品数据,所述目标产品数据包括目标产品特征类型和目标产品特征类型对应的产品特征数据;
基于退出模型和所述目标产品数据计算得到所述目标产品的目标得分,所述退出模型由产品数据训练得到,所述产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据,所述退出模型根据目标产品特征类型对应的产品特征数据计算目标得分;
当所述目标产品的目标得分大于第一预设阈值时,确定所述目标产品为退出产品。
2.根据权利要求1所述的方法,其特征在于,在基于退出模型和所述目标产品数据计算得到所述目标产品的目标得分之前,所述方法还包括:
获取产品数据;
基于所述产品数据训练神经网络得到第一模型;
将所述产品数据输入所述第一模型得到所述产品特征类型的重要性得分;
选择所述重要性得分大于预设阈值的产品特征类型作为目标特征类型;
筛选所述产品数据,得到所述目标特征类型对应的产品特征数据;
基于所述目标特征对应的产品特征数据和产品退出数据训练所述第一模型得到退出模型。
4.根据权利要求2或3所述的方法,其特征在于,所述基于所述产品数据训练神经网络得到第一模型,包括:
将所述产品数据均匀划分为k组,其中1组作为测试样本,k-1组作为训练样本,其中k大于等于2;
基于所述训练样本对神经网络进行训练,得到初始模型;
基于所述验证样本对所述初始模型进行验证,得到第一模型。
5.根据权利要求4所述的方法,其特征在于,所述基于所述训练样本对神经网络进行训练,得到初始模型;基于所述验证样本对所述初始模型进行验证,得到第一模型,包括:
对所述训练样本数据和所述验证样本数据进行归一化处理;
对所述训练样本数据和所述验证样本数据进行离散化处理;
基于处理后的训练样本数据对神经网络进行训练,得到初始模型;
基于处理后的验证样本数据对所述初始模型进行验证,得到第一模型。
6.根据权利要求1所述的方法,其特征在于,所述产品特征类型包括绩效、客群、市场、管理属性、风险数据和产品属性数据中的至少一项。
7.根据权利要求5所述的方法,其特征在于,所述基于处理后的训练样本数据对神经网络进行训练,得到初始模型之前,所述方法还包括:
基于平均值填充法对所述样本数据和验证数据进行空值处理。
8.一种产品确定装置,其特征在于,所述装置包括:
获取模块,用于获取目标产品数据,所述目标产品数据包括目标产品特征类型和目标产品特征类型对应的产品特征数据;
计算模块,用于基于退出模型和所述目标产品数据计算得到所述目标产品的目标得分,所述退出模型由产品数据训练得到,所述产品数据包括产品特征类型、产品特征数据类型对应的数据和产品退出数据,所述退出模型根据目标产品特征类型对应的产品特征数据计算目标得分;
确定模块,用于当所述目标产品的目标得分大于第一预设阈值时,确定所述目标产品为退出产品。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
所述获取模块,还用于获取产品数据;
训练模块,用于基于所述产品数据训练神经网络得到第一模型;
输入模块,用于将所述产品数据输入所述第一模型得到所述产品特征类型的重要性得分;
选择模块,用于选择所述重要性得分大于预设阈值的产品特征类型作为目标特征类型;
筛选模块,用于筛选所述产品数据,得到所述目标特征类型对应的产品特征数据;
所述训练模块,还用于基于所述目标特征对应的产品特征数据和产品退出数据训练所述第一模型得到退出模型。
11.根据权利要求9或10所述的装置,其特征在于,所述训练模块,用于基于所述产品数据训练神经网络得到第一模型,包括:
划分模块,用于将所述产品数据均匀划分为k组,其中1组作为测试样本,k-1组作为训练样本,其中k大于等于2;
所述训练模块,用于基于所述训练样本对神经网络进行训练,得到初始模型;
验证模块,用于基于所述验证样本对所述初始模型进行验证,得到第一模型。
12.根据权利要求11所述的装置,其特征在于,所述训练模块,用于基于所述训练样本对神经网络进行训练,得到初始模型;所述验证模块,用于基于所述验证样本对所述初始模型进行验证,得到第一模型,包括:
处理模块,用于对所述训练样本数据和所述验证样本数据进行归一化处理;
所述处理模块,还用于对所述训练样本数据和所述验证样本数据进行离散化处理;
所述训练模块,用于基于处理后的训练样本数据对神经网络进行训练,得到初始模型;
所述验证模块,用于基于处理后的验证样本数据对所述初始模型进行验证,得到第一模型。
13.根据权利要求8所述的装置,其特征在于,所述产品特征类型包括绩效,客群、市场、管理属性、风险数据和产品属性数据中的至少一项。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括:
所述处理模块,还用于基于平均值填充法对所述样本数据和验证数据进行空值处理。
15.一种产品确定设备,其特征在于,所述产品确定设备包括:处理器,以及存储有计算机程序指令的存储器;
所述处理器读取并执行所述计算机程序指令,以实现如权利要求1-7任意一项所述的产品确定方法。
16.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的产品确定方法。
17.一种计算机程序产品,其特征在于,所述计算机程序产品中的指令由电子设备的处理器执行时,使得所述电子设备执行如权利要求1-7任意一项所述的产品确定方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111546709.8A CN114219307A (zh) | 2021-12-16 | 2021-12-16 | 产品确定方法、装置、设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111546709.8A CN114219307A (zh) | 2021-12-16 | 2021-12-16 | 产品确定方法、装置、设备及计算机存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114219307A true CN114219307A (zh) | 2022-03-22 |
Family
ID=80703275
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111546709.8A Pending CN114219307A (zh) | 2021-12-16 | 2021-12-16 | 产品确定方法、装置、设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114219307A (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103576050A (zh) * | 2013-11-21 | 2014-02-12 | 贵阳供电局 | 一种电容式电压互感器的运行状态评估方法 |
CN109191326A (zh) * | 2018-08-23 | 2019-01-11 | 东北大学 | 基于攻击方视角的配电网cps相依存系统网络攻击风险评估方法 |
CN110458637A (zh) * | 2019-06-19 | 2019-11-15 | 中国平安财产保险股份有限公司 | 基于神经网络的产品推送方法、及其相关设备 |
CN110544155A (zh) * | 2019-09-02 | 2019-12-06 | 中诚信征信有限公司 | 用户信用评分的获取方法、获取装置、服务器及存储介质 |
CN110738527A (zh) * | 2019-10-17 | 2020-01-31 | 中国建设银行股份有限公司 | 一种特征重要性排序方法、装置、设备和存储介质 |
CN111460727A (zh) * | 2020-03-05 | 2020-07-28 | 国网浙江省电力有限公司湖州供电公司 | 一种利用多参量的变压器寿命预测方法 |
CN111861569A (zh) * | 2020-07-23 | 2020-10-30 | 中国工商银行股份有限公司 | 产品信息推荐方法及装置 |
CN113159634A (zh) * | 2021-05-14 | 2021-07-23 | 中国建设银行股份有限公司 | 一种金融产品管理方法、装置及电子设备 |
CN113723837A (zh) * | 2021-09-02 | 2021-11-30 | 中国建设银行股份有限公司 | 银行产品的管理方法、装置、服务器及计算机存储介质 |
-
2021
- 2021-12-16 CN CN202111546709.8A patent/CN114219307A/zh active Pending
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103576050A (zh) * | 2013-11-21 | 2014-02-12 | 贵阳供电局 | 一种电容式电压互感器的运行状态评估方法 |
CN109191326A (zh) * | 2018-08-23 | 2019-01-11 | 东北大学 | 基于攻击方视角的配电网cps相依存系统网络攻击风险评估方法 |
CN110458637A (zh) * | 2019-06-19 | 2019-11-15 | 中国平安财产保险股份有限公司 | 基于神经网络的产品推送方法、及其相关设备 |
CN110544155A (zh) * | 2019-09-02 | 2019-12-06 | 中诚信征信有限公司 | 用户信用评分的获取方法、获取装置、服务器及存储介质 |
CN110738527A (zh) * | 2019-10-17 | 2020-01-31 | 中国建设银行股份有限公司 | 一种特征重要性排序方法、装置、设备和存储介质 |
CN111460727A (zh) * | 2020-03-05 | 2020-07-28 | 国网浙江省电力有限公司湖州供电公司 | 一种利用多参量的变压器寿命预测方法 |
CN111861569A (zh) * | 2020-07-23 | 2020-10-30 | 中国工商银行股份有限公司 | 产品信息推荐方法及装置 |
CN113159634A (zh) * | 2021-05-14 | 2021-07-23 | 中国建设银行股份有限公司 | 一种金融产品管理方法、装置及电子设备 |
CN113723837A (zh) * | 2021-09-02 | 2021-11-30 | 中国建设银行股份有限公司 | 银行产品的管理方法、装置、服务器及计算机存储介质 |
Non-Patent Citations (2)
Title |
---|
何龙: "《深入理解XGBoost 高效机器学习算法与进阶》", vol. 1, 31 May 2020, 机械工业出版社, pages: 138 - 142 * |
徐克虎: "《陆战目标威胁评估方法及其应用》", vol. 1, 30 November 2020, 北京理工大学出版社, pages: 51 - 54 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110222170B (zh) | 一种识别敏感数据的方法、装置、存储介质及计算机设备 | |
CN109922032B (zh) | 用于确定登录账户的风险的方法、装置、设备及存储介质 | |
CN107025596B (zh) | 一种风险评估方法和系统 | |
CN115982765A (zh) | 数据脱敏方法、装置、设备及计算机可读存储介质 | |
CN106485528A (zh) | 检测数据的方法和装置 | |
CN108764375A (zh) | 高速公路货运车辆跨省匹配方法及装置 | |
CN110413596A (zh) | 字段处理方法及装置、存储介质、电子装置 | |
CN110737650A (zh) | 数据质量检测方法及装置 | |
CN114139931A (zh) | 企业数据评估方法、装置、计算机设备及存储介质 | |
CN116107842A (zh) | 列头柜功耗的检测方法、装置、设备及存储介质 | |
CN114219307A (zh) | 产品确定方法、装置、设备及计算机存储介质 | |
CN113656354A (zh) | 日志分类方法、系统、计算机设备和可读存储介质 | |
CN115203556A (zh) | 一种评分预测模型训练方法、装置、电子设备及存储介质 | |
CN113239075A (zh) | 一种施工数据自检方法及系统 | |
CN114090643A (zh) | 招聘信息推荐方法、装置、设备及存储介质 | |
CN110298690B (zh) | 对象类目的周期判断方法、装置、服务器及可读存储介质 | |
CN114066619A (zh) | 担保圈风险确定方法、装置、电子设备和存储介质 | |
CN112749998A (zh) | 收入信息输出方法、装置、电子设备及计算机存储介质 | |
CN112700270A (zh) | 评分数据处理方法、装置、设备及存储介质 | |
CN114547101B (zh) | 数据中台的数据质量评估方法、装置、设备及存储介质 | |
CN114765624B (zh) | 信息推荐方法、装置、服务器及存储介质 | |
CN113569482B (zh) | 隧道服役性能的评估方法、装置、终端及存储介质 | |
CN117571321B (zh) | 轴承故障检测方法、装置、设备及存储介质 | |
CN116307734A (zh) | 项目的风险等级的确定方法、装置、设备及可读存储介质 | |
CN110245302B (zh) | 用于识别欺诈案件的策略生成方法及装置和电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |