CN113656692B - 基于知识迁移算法的产品推荐方法、装置、设备及介质 - Google Patents

基于知识迁移算法的产品推荐方法、装置、设备及介质 Download PDF

Info

Publication number
CN113656692B
CN113656692B CN202110944299.6A CN202110944299A CN113656692B CN 113656692 B CN113656692 B CN 113656692B CN 202110944299 A CN202110944299 A CN 202110944299A CN 113656692 B CN113656692 B CN 113656692B
Authority
CN
China
Prior art keywords
feature set
training
neural network
model
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110944299.6A
Other languages
English (en)
Other versions
CN113656692A (zh
Inventor
严杨扬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN202110944299.6A priority Critical patent/CN113656692B/zh
Publication of CN113656692A publication Critical patent/CN113656692A/zh
Application granted granted Critical
Publication of CN113656692B publication Critical patent/CN113656692B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/211Selection of the most significant subset of features
    • G06F18/2113Selection of the most significant subset of features by ranking or filtering the set of features, e.g. using a measure of variance or of feature cross-correlation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/08Insurance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • General Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Strategic Management (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及人工智能技术,揭露了一种基于知识迁移算法的产品推荐方法,包括:获取多个产品的历史用户特征集合,对历史用户特征集合进行特征筛选,得到关键特征集合,利用关键特征集合训练预构建的第一神经网络,得到原始推荐模型,对原始产品模型进行参数迁移,得到第二神经网络,利用实时用户特征集合训练第二神经网络,得到标准推荐模型,利用标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。此外,本发明还涉及区块链技术,所述历史用户特征集合可从区块链的节点中获取。本发明还提出一种基于知识迁移算法的产品推荐方法装置、电子设备以及计算机可读存储介质。本发明可以解决对新用户进行产品推荐准确率较低的问题。

Description

基于知识迁移算法的产品推荐方法、装置、设备及介质
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于知识迁移算法的产品推荐方法、装置、电子设备及计算机可读存储介质。
背景技术
随着深度学习的发展,各领域广泛使用深度学习模型对各类产品进行推荐。例如,在保险领域,通过用户的特征数据训练深度神经网络来对新用户进行保险推荐。
现有技术中,由于新用户的数据量不足,往往采用老用户的数据特征来进行模型训练,然而在实际使用中,对于不同的新老用户,收集到的特征往往是差异巨大的,通过老用户的特征数据训练出来的模型对新用户进行产品推荐时,会造成产品推荐不准确的问题。
发明内容
本发明提供一种基于知识迁移算法的产品推荐方法、装置、设备及存储介质,其主要目的在于解决对新用户进行产品推荐准确率较低的问题。
为实现上述目的,本发明提供的一种基于知识迁移算法的产品推荐方法,包括:
获取多个产品的历史用户特征集合;
利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合;
利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型;
对所述原始产品模型进行参数迁移,得到第二神经网络;
获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型;
利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。
可选地,所述利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型,包括:
利用预设的数据标准化公式对所述关键特征集合进行归一化处理,得到标准特征集合;
基于交叉验证法,利用所述标准特征集合对所述第一神经网络进行训练,得到所述原始推荐模型。
可选地,所述基于交叉验证法,利用所述标准特征集合对所述第一神经网络进行训练,得到所述原始推荐模型,包括:
将所述标准特征集合划分成预设个数的训练特征集;
随机选取一个训练特征集作为验证特征集,利用未被选取到的训练特征集训练所述第一神经网络,并计算所述第一神经网络的损失值,在所述损失值小于等于预设的损失阈值时,得到推荐模型;
利用所述验证特征集对所述推荐模型进行验证,得到验证参数;
返回所述随机选取一个训练特征集作为验证特征集的步骤,直至所有的训练特征集均被选取为验证特征集,得到多个推荐模型及多个验证参数;
计算所述多个验证参数的平均值,得到平均验证参数;
选取所述多个推荐模型中模型参数最接近所述平均验证参数的推荐模型为所述原始推荐模型。
可选地,所述计算所述第一神经网络的损失值,包括:
利用下述预测公式计算所述第一神经网络输出的所述训练特征集中特征的预测值:
Figure BDA0003216093430000021
利用所述第一神经网络中预设的损失函数计算所述预测值的损失值:
Loss=lilog(1-predi)+(1-li)log(predi)
其中,li为标签,predi为预测值,Dense表示第一神经网络的输出层,zi(old-train)为训练特征集的特征,activation=’sigmod’表示输出层的激活函数为sigmod函数,
Figure BDA0003216093430000022
为模型参数。
可选地,所述利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型,包括:
依次选取所述第二神经网络中的一层作为训练层,并冻结所述第二神经网络未被选中的神经网络;
利用所述实时用户特征集合训练所述训练层,直至所述训练层的参数收敛,得到优化训练层;
汇总所有收敛的优化训练层,得到所述标准推荐模型。
可选地,利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合,包括:
提取历史数据集中的已成交产品作为样本集;
从所述样本集中随机选取子样本集,以及从所述历史用户特征集合中随机选取子特征集;
利用所述子样本集及所述子特征集构建随机森林;
根据所述随机森林输出的特征权重,选取预设个数的用户特征作为所述关键特征集合。
可选地,所述利用所述子样本集及所述子特征集构建随机森林,包括:
依次选取所述子特征集中的特征作为根节点,并利用根节点中的特征依次对所述子样本集进行划分,得到多个叶节点;
确定所述根节点及所述根节点的多个叶节点构成决策树;
汇总得到的所述决策树,得到所述随机森林。
为了解决上述问题,本发明还提供一种基于知识迁移算法的产品推荐方法装置,所述装置包括:
特征筛选模块,用于获取多个产品的历史用户特征集合,利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合;
原始模型训练模块,用于利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型;
参数迁移模块,用于对所述原始产品模型进行参数迁移,得到第二神经网络;
标准模型训练模块,用于获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型;
产品推荐模块,用于利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述所述的基于知识迁移算法的产品推荐方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的基于知识迁移算法的产品推荐方法。
本发明通过随机森林算法对历史用户特征集合进行特征筛选,可以得到对产品推荐更加重要的用户特征,提高产品的准确性。并且利用关键特征集合训练得到原始推荐模型,对原始产品模型进行参数迁移,得到第二神经网络,充分利用了海量的历史用户数据,提高数据的使用效率。同时由于实时用户特征集合中数据的实时性更强,更能反映最新用户的属性特征,因此利用实时用户特征集合训练所述第二神经网络,可以得到更加符合新用户特征的标准推荐模型,从而提高了对新用户进行产品推荐的准确率。因此本发明提出的基于知识迁移算法的产品推荐方法、装置、电子设备及计算机可读存储介质,可以解决对新用户进行产品推荐准确率较低的问题。
附图说明
图1为本发明一实施例提供的基于知识迁移算法的产品推荐方法的流程示意图;
图2为本发明一实施例提供的基于知识迁移算法的产品推荐装置的功能模块图;
图3为本发明一实施例提供的实现所述基于知识迁移算法的产品推荐方法的电子设备的结构示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于知识迁移算法的产品推荐方法。所述基于知识迁移算法的产品推荐方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于知识迁移算法的产品推荐方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(ContentDelivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
参照图1所示,为本发明一实施例提供的基于知识迁移算法的产品推荐方法的流程示意图。在本实施例中,所述基于知识迁移算法的产品推荐方法包括:
S1、获取多个产品的历史用户特征集合。
本发明实施例中,所述历史用户特征集合是指预设时间段内浏览或购买过产品的用户属性特征集合。具体的,历史用户特征集合可以为上一年浏览过保险产品的用户特征,这些特征集合反映了过去一段时间内浏览用户的属性,数据量大,能够提高模型训练的效率。
比如,在保险领域中,A险种的所述历史用户特征集合是从保险公司的历史服务销售数据中取得的用户本身登记的属性特征集合,包括但不限于:用户性别、年龄、职业、城市、区域编号、客户编号、任务编号、机构代码、保额、保费,保险编号等。
本发明一可选实施例中,将用户购买过的产品进行标签处理,购买过即为1,反之即为0,通过收集不同产品尽可能多的用户特征,来提高模型训练的准确性。
S2、利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合。
本发明实施例中,所述随机森林算法(Random Forest,简称RF)是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树。以分类问题为例,每棵决策树都是一个分类器,那么对于一个输入样本,N棵树会有N个分类结果,而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出,从而获得最优的类别。
具体地,所述利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合,包括:
提取历史数据集中的已成交产品作为样本集;
从所述样本集中随机选取子样本集,以及从所述历史用户特征集合中随机选取子特征集;
利用所述子样本集及所述子特征集构建随机森林;
根据所述随机森林输出的特征权重,选取预设个数的用户特征作为所述关键特征集合。
本发明实施例中,所述随机选取是指有放回的选取,即不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复。
详细地,所述利用所述子样本集及所述子特征集构建随机森林,包括:
依次选取所述子特征集中的特征作为根节点,并利用根节点中的特征依次对所述子样本集进行划分,得到多个叶节点;
确定所述根节点及所述根节点的多个叶节点构成决策树;
汇总得到的所述决策树,得到所述随机森林。
本发明一可选实施例中,所述特征权重可以通过下述公式计算;
Figure BDA0003216093430000061
其中,D为任一子样本集,a为子特征集中任一特征,Ent(D)为子样本集的信息熵,V为叶节点的个数,Dv为第v个叶节点包含了a特征的样本总数。
本发明实施例中,通过使用随机森林算法对历史用户特征集合进行特征筛选,可以更加聚焦每个特征在产品中的重要性,提高产品推荐的准确性。
S3、利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型。
本发明一可选实施例中,所述第一神经网络可以包括三层深度神经网络及一层输出层。其中,前三层所采用的神经单元个数分别为[128,64,16],并采用relu函数作为激活函数,所述输出层为Dense层,采用sigmod函数作为激活函数。整个第一神经网络可以使用交叉熵损失函数计算损失值。
详细地,所述利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型,包括:
利用预设的数据标准化公式对所述关键特征集合进行归一化处理,得到标准特征集合;
基于交叉验证法,利用所述标准特征集合对所述第一神经网络进行训练,得到所述原始推荐模型。
本发明实施例中,所述预设的数据标准化公式可以为Z-score标准化公式:
Figure BDA0003216093430000071
其中,μ为所述关键特征集合的均值,δ为所述关键特征集合的标准差,xi为所述关键特征集合中的特征,zj为通过标准化得到的特征。
具体地,所述基于交叉验证法,利用所述标准特征集合对所述第一神经网络进行训练,得到所述原始推荐模型,包括:
将所述标准特征集合划分成预设个数的训练特征集;
随机选取一个训练特征集作为验证特征集,利用未被选取到的训练特征集训练所述第一神经网络,并计算所述第一神经网络的损失值,在所述损失值小于等于预设的损失阈值时,得到推荐模型;
利用所述验证特征集对所述推荐模型进行验证,得到验证参数;
返回所述随机选取一个训练特征集作为验证特征集的步骤,直至所有的训练特征集均被选取为验证特征集,得到多个推荐模型及多个验证参数;
计算所述多个验证参数的平均值,得到平均验证参数;
选取所述多个推荐模型中模型参数最接近所述平均验证参数的推荐模型为所述原始推荐模型。
可选的,所述计算所述第一神经网络的损失值,包括:
利用下述预测公式计算所述第一神经网络输出的所述训练特征集中特征的预测值:
Figure BDA0003216093430000072
利用所述第一神经网络中预设的损失函数计算所述预测值的损失值:
Loss=lilog(1-predi)+(1-li)log(predi)
其中,li为标签,predi为预测值,Dense表示第一神经网络的输出层,zi(old-train)为训练特征集的特征,activation=’sigmod’表示输出层的激活函数为sigmod函数,
Figure BDA0003216093430000073
为模型参数。
具体的,本发明实施例中,可以将所述标准特征集合划分成5个的训练特征集,每次选取1个训练特征集作为验证特征集,用剩下的4个训练特征集进行训练,得到5个推荐模型,同时每次利用验证特征集对得到的推荐模型进行验证,会得到5个验证参数,取5个验证参数的平均值作为平均验证参数,并从5个模型中选取模型参数最接近平均验证参数的模型作为原始推荐模型。
S4、对所述原始产品模型进行参数迁移,得到第二神经网络。
本发明实施例中,所述参数迁移是指把已训练好的模型参数迁移到新的模型来加快新模型的训练。
本发明一可选实施例中,重新构建新的神经网络(可以和所述第一神经网络的网络设置一致),并将所述原始产品模型的每层参数作为新的网络的初始参数来得到第二神经网络。
S5、获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型。
本发明实施例中,可以通过知识迁移算法对所述第二神经网络进行知识迁移训练,例如,Fine-tine知识迁移算法、Transfer Learning算法等。所述实时用户特征集合可以为最近注册过且购买过产品的用户的特征集合,相对于历史用户特征集合,数据量小,但更能反映近期浏览产品的用户的属性特征,从而能提高模型对新用户进行产品推荐的准确率。比如,选取最近一周购买过保险产品的用户的特征作为实时用户特征集合。
具体地,所述利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型,包括:
依次选取所述第二神经网络中的一层作为训练层,并冻结所述第二神经网络未被选中的神经网络;
利用所述实时用户特征集合训练所述训练层,直至所述训练层的参数收敛,得到优化训练层;
汇总所有收敛的优化训练层,得到所述标准推荐模型。
本发明可选实施例中,例如,在保险领域,对于不同的新老用户,我们收集到的特征往往是差异巨大的,因此针对老用户的建模无法满足新用户的要求。利用知识迁移算法只需少量的新用户数据,即可训练出更准确的模型,在充分利用海量历史用户的同时,也提高了对新用户产品推荐的准确率。
本发明一可选实施例中,通过Fine-tine知识迁移算法可以得到二次优化后的参数
Figure BDA0003216093430000091
S6、利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。
本发明实施例中,所述待推荐用户可以为最新登记、注册的用户,通过将待推荐用户的特征集合输入所述标准推荐模型,可以直接得到对每个产品的推荐值。
例如,保险产品推荐时,推荐值通过下述公式进行计算:
Figure BDA0003216093430000092
最终的predi即为对每个保险产品的推荐值,1为推荐,0为不推荐。
本发明通过随机森林算法对历史用户特征集合进行特征筛选,可以得到对产品推荐更加重要的用户特征,提高产品的准确性。并且利用关键特征集合训练得到原始推荐模型,对原始产品模型进行参数迁移,得到第二神经网络,充分利用了海量的历史用户数据,提高数据的使用效率。同时由于实时用户特征集合中数据的实时性更强,更能反映最新用户的属性特征,因此利用实时用户特征集合训练所述第二神经网络,可以得到更加符合新用户特征的标准推荐模型,从而提高了对新用户进行产品推荐的准确率。因此本发明提出的基于知识迁移算法的产品推荐方法,可以解决对新用户进行产品推荐准确率较低的问题。
如图2所示,是本发明一实施例提供的基于知识迁移算法的产品推荐装置的功能模块图。
本发明所述基于知识迁移算法的产品推荐装置100可以安装于电子设备中。根据实现的功能,所述基于知识迁移算法的产品推荐装置100可以包括特征筛选模块101、原始模型训练模块102、参数迁移模块103、标准模型训练模块104及产品推荐模块105。本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述特征筛选模块101,用于获取多个产品的历史用户特征集合,利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合。
本发明实施例中,所述历史用户特征集合是指预设时间段内浏览或购买过产品的用户属性特征集合。具体的,历史用户特征集合可以为上一年浏览过保险产品的用户特征,这些特征集合反映了过去一段时间内浏览用户的属性,数据量大,能够提高模型训练的效率。
比如,在保险领域中,A险种的所述历史用户特征集合是从保险公司的历史服务销售数据中取得的用户本身登记的属性特征集合,包括但不限于:用户性别、年龄、职业、城市、区域编号、客户编号、任务编号、机构代码、保额、保费,保险编号等。
本发明一可选实施例中,将用户购买过的产品进行标签处理,购买过即为1,反之即为0,通过收集不同产品尽可能多的用户特征,来提高模型训练的准确性。
本发明实施例中,所述随机森林算法(Random Forest,简称RF)是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树。以分类问题为例,每棵决策树都是一个分类器,那么对于一个输入样本,N棵树会有N个分类结果,而随机森林集成了所有的分类投票结果,将投票次数最多的类别指定为最终的输出,从而获得最优的类别。
具体地,所述特征筛选模块101通过执行下述操作得到关键特征集合,包括:
提取历史数据集中的已成交产品作为样本集;
从所述样本集中随机选取子样本集,以及从所述历史用户特征集合中随机选取子特征集;
利用所述子样本集及所述子特征集构建随机森林;
根据所述随机森林输出的特征权重,选取预设个数的用户特征作为所述关键特征集合。
本发明实施例中,所述随机选取是指有放回的选取,即不同子数据集的元素可以重复,同一个子数据集中的元素也可以重复。
详细地,所述特征筛选模块101通过执行下述操作构建随机森林,包括:
依次选取所述子特征集中的特征作为根节点,并利用根节点中的特征依次对所述子样本集进行划分,得到多个叶节点;
确定所述根节点及所述根节点的多个叶节点构成决策树;
汇总得到的所述决策树,得到所述随机森林。
本发明一可选实施例中,所述特征权重可以通过下述公式计算;
Figure BDA0003216093430000111
其中,D为任一子样本集,a为子特征集中任一特征,Ent(D)为子样本集的信息熵,V为叶节点的个数,Dv为第v个叶节点包含了a特征的样本总数。
本发明实施例中,通过使用随机森林算法对历史用户特征集合进行特征筛选,可以更加聚焦每个特征在产品中的重要性,提高产品推荐的准确性
所述原始模型训练模块102,用于利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型。
本发明一可选实施例中,所述第一神经网络可以包括三层深度神经网络及一层输出层。其中,前三层所采用的神经单元个数分别为[128,64,16],并采用relu函数作为激活函数,所述输出层为Dense层,采用sigmod函数作为激活函数。整个第一神经网络可以使用交叉熵损失函数计算损失值。
详细地,所述原始模型训练模块102通过执行下述操作得到原始推荐模型,包括:
利用预设的数据标准化公式对所述关键特征集合进行归一化处理,得到标准特征集合;
基于交叉验证法,利用所述标准特征集合对所述第一神经网络进行训练,得到所述原始推荐模型。
本发明实施例中,所述预设的数据标准化公式可以为Z-score标准化公式:
Figure BDA0003216093430000112
其中,μ为所述关键特征集合的均值,δ为所述关键特征集合的标准差,xi为所述关键特征集合中的特征,zi为通过标准化得到的特征。
具体地,所述原始模型训练模块102通过执行下述操作得到所述原始推荐模型,包括:
将所述标准特征集合划分成预设个数的训练特征集;
随机选取一个训练特征集作为验证特征集,利用未被选取到的训练特征集训练所述第一神经网络,并计算所述第一神经网络的损失值,在所述损失值小于等于预设的损失阈值时,得到推荐模型;
利用所述验证特征集对所述推荐模型进行验证,得到验证参数;
返回所述随机选取一个训练特征集作为验证特征集的步骤,直至所有的训练特征集均被选取为验证特征集,得到多个推荐模型及多个验证参数;
计算所述多个验证参数的平均值,得到平均验证参数;
选取所述多个推荐模型中模型参数最接近所述平均验证参数的推荐模型为所述原始推荐模型。
可选的,所述所述原始模型训练模块102通过执行下述操作计算所述第一神经网络的损失值,包括:
利用下述预测公式计算所述第一神经网络输出的所述训练特征集中特征的预测值:
Figure BDA0003216093430000121
利用所述第一神经网络中预设的损失函数计算所述预测值的损失值:
Loss=lilog(1-predi)+(1-li)log(predi)
其中,li为标签,predi为预测值,Dense表示第一神经网络的输出层,zi(old-train)为训练特征集的特征,activation=’sigmod’表示输出层的激活函数为sigmod函数,
Figure BDA0003216093430000122
为模型参数。
具体的,本发明实施例中,可以将所述标准特征集合划分成5个的训练特征集,每次选取1个训练特征集作为验证特征集,用剩下的4个训练特征集进行训练,得到5个推荐模型,同时每次利用验证特征集对得到的推荐模型进行验证,会得到5个验证参数,取5个验证参数的平均值作为平均验证参数,并从5个模型中选取模型参数最接近平均验证参数的模型作为原始推荐模型。
所述参数迁移模块103,用于对所述原始产品模型进行参数迁移,得到第二神经网络。
本发明实施例中,所述参数迁移是指把已训练好的模型参数迁移到新的模型来加快新模型的训练。
本发明一可选实施例中,重新构建新的神经网络(可以和所述第一神经网络的网络设置一致),并将所述原始产品模型的每层参数作为新的网络的初始参数来得到第二神经网络。
所述标准模型训练模块104,用于获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型。
本发明实施例中,可以通过知识迁移算法对所述第二神经网络进行知识迁移训练,例如,Fine-tine知识迁移算法、Transfer Learning算法等。所述实时用户特征集合可以为最近注册过且购买过产品的用户的特征集合,相对于历史用户特征集合,数据量小,但更能反映近期浏览产品的用户的属性特征,从而能提高模型对新用户进行产品推荐的准确率。比如,选取最近一周购买过保险产品的用户的特征作为实时用户特征集合。
具体地,所述标准模型训练模块104通过执行下述操作得到标准推荐模型,包括:
依次选取所述第二神经网络中的一层作为训练层,并冻结所述第二神经网络未被选中的神经网络;
利用所述实时用户特征集合训练所述训练层,直至所述训练层的参数收敛,得到优化训练层;
汇总所有收敛的优化训练层,得到所述标准推荐模型。
本发明可选实施例中,例如,在保险领域,对于不同的新老用户,我们收集到的特征往往是差异巨大的,因此针对老用户的建模无法满足新用户的要求。利用知识迁移算法只需少量的新用户数据,即可训练出更准确的模型,在充分利用海量历史用户的同时,也提高了对新用户产品推荐的准确率。
本发明一可选实施例中,通过Fine-tine知识迁移算法可以得到二次优化后的参数
Figure BDA0003216093430000131
所述产品推荐模块105,用于利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。
本发明实施例中,所述待推荐用户可以为最新登记、注册的用户,通过将待推荐用户的特征集合输入所述标准推荐模型,可以直接得到对每个产品的推荐值。
例如,保险产品推荐时,推荐值通过下述公式进行计算:
Figure BDA0003216093430000132
最终的predi即为对每个保险产品的推荐值,1为推荐,0为不推荐。
本发明通过随机森林算法对历史用户特征集合进行特征筛选,可以得到对产品推荐更加重要的用户特征,提高产品的准确性。并且利用关键特征集合训练得到原始推荐模型,对原始产品模型进行参数迁移,得到第二神经网络,充分利用了海量的历史用户数据,提高数据的使用效率。同时由于实时用户特征集合中数据的实时性更强,更能反映最新用户的属性特征,因此利用实时用户特征集合训练所述第二神经网络,可以得到更加符合新用户特征的标准推荐模型,从而提高了对新用户进行产品推荐的准确率。因此本发明提出的基于知识迁移算法的产品推荐装置,可以解决对新用户进行产品推荐准确率较低的问题。
如图3所示,是本发明一实施例提供的实现基于知识迁移算法的产品推荐方法的电子设备的结构示意图,包括处理器111、通信接口112、存储器113和通信总线114,其中,处理器111,通信接口112,存储器113通过通信总线114完成相互间的通信。
存储器113,用于存放计算机程序,如基于知识迁移算法的产品推荐方法程序。
在本申请一个实施例中,处理器111,用于执行存储器113上所存放的程序时,实现前述任意一个方法实施例提供的基于知识迁移算法的产品推荐方法,包括:
获取多个产品的历史用户特征集合;
利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合;
利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型;
对所述原始产品模型进行参数迁移,得到第二神经网络;
获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型;
利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。
上述通信总线114可以是外设部件互连标准(PeripheralComponentInterconnect,简称PCI)总线或扩展工业标准结构(ExtendedIndustryStandardArchitecture,简称EISA)总线等。该通信总线114可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口112用于上述电子设备与其他设备之间的通信。
存储器113可以包括随机存取存储器(RandomAccessMemory,简称RAM),也可以包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。可选的,存储器113还可以是至少一个位于远离前述处理器111的存储装置。
上述的处理器111可以是通用处理器,包括中央处理器(CentralProcessingUnit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DigitalSignalProcessing,简称DSP)、专用集成电路(ApplicationSpecificIntegratedCircuit,简称ASIC)、现场可编程门阵列(Field-ProgrammableGateArray,简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是易失性的。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
本发明还提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
获取多个产品的历史用户特征集合;
利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合;
利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型;
对所述原始产品模型进行参数迁移,得到第二神经网络;
获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型;
利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (7)

1.一种基于知识迁移算法的产品推荐方法,其特征在于,所述方法包括:
获取多个产品的历史用户特征集合;
利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合;
利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型;
对所述原始推荐模型进行参数迁移,得到第二神经网络;
获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型;
利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果;
其中,所述利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型,包括:利用预设的数据标准化公式对所述关键特征集合进行归一化处理,得到标准特征集合;将所述标准特征集合划分成预设个数的训练特征集;随机选取一个训练特征集作为验证特征集,利用未被选取到的训练特征集训练所述第一神经网络,并计算所述第一神经网络的损失值,在所述损失值小于等于预设的损失阈值时,得到推荐模型;利用所述验证特征集对所述推荐模型进行验证,得到验证参数;返回所述随机选取一个训练特征集作为验证特征集的步骤,直至所有的训练特征集均被选取为验证特征集,得到多个推荐模型及多个验证参数;计算所述多个验证参数的平均值,得到平均验证参数;选取所述多个推荐模型中模型参数最接近所述平均验证参数的推荐模型为所述原始推荐模型;
所述计算所述第一神经网络的损失值,包括:
利用下述预测公式计算所述第一神经网络输出的所述训练特征集中特征的预测值:
Figure FDA0004190739080000013
利用所述第一神经网络中预设的损失函数计算所述预测值的损失值:
Loss=lilog(1-predi)+(1-li)log(predi)
其中,li为标签,predi为预测值,Dense表示第一神经网络的输出层,zi(old-train)为训练特征集的特征,activation=’sigmod’表示输出层的激活函数为sigmod函数,
Figure FDA0004190739080000012
为模型参数。
2.如权利要求1所述的基于知识迁移算法的产品推荐方法,其特征在于,所述利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型,包括:
依次选取所述第二神经网络中的一层作为训练层,并冻结所述第二神经网络未被选中的神经网络;
利用所述实时用户特征集合训练所述训练层,直至所述训练层的参数收敛,得到优化训练层;
汇总所有收敛的优化训练层,得到所述标准推荐模型。
3.如权利要求1所述的基于知识迁移算法的产品推荐方法,其特征在于,所述利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合,包括:
提取历史数据集中的已成交产品作为样本集;
从所述样本集中随机选取子样本集,以及从所述历史用户特征集合中随机选取子特征集;
利用所述子样本集及所述子特征集构建随机森林;
根据所述随机森林输出的特征权重,选取预设个数的用户特征作为所述关键特征集合。
4.如权利要求3所述的基于知识迁移算法的产品推荐方法,其特征在于,所述利用所述子样本集及所述子特征集构建随机森林,包括:
依次选取所述子特征集中的特征作为根节点,并利用根节点中的特征依次对所述子样本集进行划分,得到多个叶节点;
确定所述根节点及所述根节点的多个叶节点构成决策树;
汇总得到的所述决策树,得到所述随机森林。
5.一种基于知识迁移算法的产品推荐装置,所述产品推荐装置用于实现如权利要求1至4中任意一项所述的基于知识迁移算法的产品推荐方法,其特征在于,所述装置包括:
特征筛选模块,用于获取多个产品的历史用户特征集合,利用随机森林算法对所述历史用户特征集合进行特征筛选,得到关键特征集合;
原始模型训练模块,用于利用所述关键特征集合训练预构建的第一神经网络,得到原始推荐模型;
参数迁移模块,用于对所述原始推荐模型进行参数迁移,得到第二神经网络;
标准模型训练模块,用于获取实时用户特征集合,利用所述实时用户特征集合对所述第二神经网络进行知识迁移训练,得到标准推荐模型;
产品推荐模块,用于利用所述标准推荐模型对新注册用户输出所述多个产品的产品推荐结果。
6.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至4中任意一项所述的基于知识迁移算法的产品推荐方法。
7.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述的基于知识迁移算法的产品推荐方法。
CN202110944299.6A 2021-08-17 2021-08-17 基于知识迁移算法的产品推荐方法、装置、设备及介质 Active CN113656692B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110944299.6A CN113656692B (zh) 2021-08-17 2021-08-17 基于知识迁移算法的产品推荐方法、装置、设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110944299.6A CN113656692B (zh) 2021-08-17 2021-08-17 基于知识迁移算法的产品推荐方法、装置、设备及介质

Publications (2)

Publication Number Publication Date
CN113656692A CN113656692A (zh) 2021-11-16
CN113656692B true CN113656692B (zh) 2023-05-30

Family

ID=78480483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110944299.6A Active CN113656692B (zh) 2021-08-17 2021-08-17 基于知识迁移算法的产品推荐方法、装置、设备及介质

Country Status (1)

Country Link
CN (1) CN113656692B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114612194A (zh) * 2022-03-23 2022-06-10 平安普惠企业管理有限公司 产品推荐方法、装置、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016122A (zh) * 2017-04-26 2017-08-04 天津大学 基于时间迁移的知识推荐方法
CN110838020A (zh) * 2019-09-16 2020-02-25 平安科技(深圳)有限公司 基于向量迁移的推荐方法、装置、计算机设备及存储介质
WO2020078098A1 (zh) * 2018-10-17 2020-04-23 阿里巴巴集团控股有限公司 一种基于梯度提升决策树的模型训练方法及装置
CN111831908A (zh) * 2020-06-24 2020-10-27 平安科技(深圳)有限公司 医疗领域知识图谱构建方法、装置、设备及存储介质
CN112231584A (zh) * 2020-12-08 2021-01-15 平安科技(深圳)有限公司 基于小样本迁移学习的数据推送方法、装置及计算机设备

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016122A (zh) * 2017-04-26 2017-08-04 天津大学 基于时间迁移的知识推荐方法
WO2020078098A1 (zh) * 2018-10-17 2020-04-23 阿里巴巴集团控股有限公司 一种基于梯度提升决策树的模型训练方法及装置
CN110838020A (zh) * 2019-09-16 2020-02-25 平安科技(深圳)有限公司 基于向量迁移的推荐方法、装置、计算机设备及存储介质
CN111831908A (zh) * 2020-06-24 2020-10-27 平安科技(深圳)有限公司 医疗领域知识图谱构建方法、装置、设备及存储介质
CN112231584A (zh) * 2020-12-08 2021-01-15 平安科技(深圳)有限公司 基于小样本迁移学习的数据推送方法、装置及计算机设备

Also Published As

Publication number Publication date
CN113656692A (zh) 2021-11-16

Similar Documents

Publication Publication Date Title
US20160225076A1 (en) System and method for building and validating a credit scoring function
CN109800885A (zh) 针对黑盒机器学习模型的规则确定
CN108475393A (zh) 通过合成特征和梯度提升决策树进行预测的系统和方法
WO2019047790A1 (zh) 生成机器学习样本的组合特征的方法及系统
CN112990486A (zh) 生成机器学习样本的组合特征的方法及系统
CN111797320B (zh) 数据处理方法、装置、设备及存储介质
Deming et al. Exploratory Data Analysis and Visualization for Business Analytics
CN113706251B (zh) 基于模型的商品推荐方法、装置、计算机设备和存储介质
CN113011895B (zh) 关联账户样本筛选方法、装置和设备及计算机存储介质
CN113505936A (zh) 项目审批结果的预测方法、装置、设备及存储介质
CN113051291A (zh) 工单信息的处理方法、装置、设备及存储介质
CN109615504A (zh) 产品推荐方法、装置、电子设备和计算机可读存储介质
CN114612251A (zh) 风险评估方法、装置、设备及存储介质
CN113656692B (zh) 基于知识迁移算法的产品推荐方法、装置、设备及介质
CN112990989B (zh) 价值预测模型输入数据生成方法、装置、设备和介质
CN106779929A (zh) 一种产品推荐方法、装置和计算设备
CN111325255A (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN114282657A (zh) 一种市场数据长期预测模型训练方法、装置、设备及存储介质
CN113706258A (zh) 基于组合模型的产品推荐方法、装置、设备及存储介质
CN112529319A (zh) 基于多维特征的评分方法、装置、计算机设备及存储介质
CN114693325A (zh) 基于神经网络的用户口碑智能保障方法及装置
CN110751374A (zh) 基于神经网络的电子政务考核方法及相关设备
CN117172632B (zh) 一种企业异常行为检测方法、装置、设备及存储介质
CN113064986B (zh) 模型的生成方法、系统、计算机设备和存储介质
Marchev et al. Methods for Simulating Multi-dimensional Data for Financial Services Recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant