CN114399368A - 基于人工智能的商品推荐方法、装置、电子设备及介质 - Google Patents

基于人工智能的商品推荐方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN114399368A
CN114399368A CN202210081099.7A CN202210081099A CN114399368A CN 114399368 A CN114399368 A CN 114399368A CN 202210081099 A CN202210081099 A CN 202210081099A CN 114399368 A CN114399368 A CN 114399368A
Authority
CN
China
Prior art keywords
user data
target user
data
calculating
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210081099.7A
Other languages
English (en)
Inventor
卢显锋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202210081099.7A priority Critical patent/CN114399368A/zh
Publication of CN114399368A publication Critical patent/CN114399368A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Human Resources & Organizations (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种基于人工智能的商品推荐方法、装置、电子设备及介质,在获取到第一及第二目标用户群体的初始用户数据之后,通过计算时间影响因子来将第一及第二目标用户群体的初始用户数据更新为目标用户数据,从而修正了时间因素导致的目标用户数据无法实时更新的问题,进一步通过计算第一目标用户数据与第二目标用户数据的兴趣偏好因子,基于兴趣偏好因子计算对应的两个目标用户数据的相似度,相似度的准确度较高,使用基于第二目标用户数据训练得到的留存预测模型对第一目标用户数据进行留存预测,得到留存预测标签,最后结合留存预测标签和相似度为第一目标用户群体进行商品推荐,商品推荐的效果更佳。

Description

基于人工智能的商品推荐方法、装置、电子设备及介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于人工智能的商品推荐方法、装置、电子设备及介质。
背景技术
用户留存是常见的大数据挖掘应用场景,用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户,被认作是留存用户,留存用户体现了商品的质量和保留用户的能力。
发明人在实现本发明的过程中发现,现有技术中通过获取用户的不同属性的数据来训练Logistic回归模型进行留存预测,并根据留存预测的概率进行商品的推荐,然而Logistic回归模型的回归系数是利用已有的用户数据采用最大似然估计得到估计值,根据估计值优化Logistic回归模型,因而使用训练完成的Logistic回归模型对目标用户进行留存预测时,留存预测的准确度较低,从而导致推荐效果较差。
发明内容
鉴于以上内容,有必要提出一种基于人工智能的商品推荐方法、装置、电子设备及介质,能够商品推荐的效果。
本发明的第一方面提供一种基于人工智能的商品推荐方法,所述方法包括:
获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据;
计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据;
计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度;
基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签;
根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
根据本发明的一个可选的实施方式,所述计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据包括:
获取所述第一目标用户的第一注册时间及获取所述第二目标用户的第二注册时间;
根据所述第一注册时间计算对应的所述第一初始用户数据的第一时间影响因子,及根据所述第二注册时间计算对应的所述第二初始用户数据的第二时间影响因子;
使用所述第一时间影响因子更新所述第一初始用户数据为所述第一目标用户数据,及使用所述第二时间影响因子更新所述第二初始用户数据为所述第二目标用户数据。
根据本发明的一个可选的实施方式,所述计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度包括:
计算所述第一目标用户数据与所述第二目标用户数据中相同目标用户数据的第一数量;
计算所述第一目标用户数据与所述第二目标用户数据的总目标用户数据的第二数量;
基于所述第一数量及所述第二数量计算得到兴趣偏好因子;
计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数;
使用所述兴趣偏好因子对对应的所述皮尔森相关系数进行修正,得到所述相似度。
根据本发明的一个可选的实施方式,所述计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数包括:
根据所述第一目标用户数据计算得到第一均值数据,及根据所述第二目标用户数据计算得到第二均值数据;
根据所述第一目标用户数据与所述第一均值数据计算得到第一差值数据,及根据所述第二目标用户数据与所述第二均值数据计算得到第二差值数据;
基于所述第一差值数据与所述第二差值数据计算得到对应的所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数。
根据本发明的一个可选的实施方式,所述获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据包括:
响应于接收到的商品推荐指令,解析所述商品推荐指令的方法体,得到所述商品推荐指令所携带的信息;
从所述信息中获取所述第一目标用户群体的预设第一标签及所述第二目标用户群体的预设第二标签;
根据所述预设第一标签构建第一正则表达式及根据所述预设第二标签构建第二正则表达式;
利用所述第一正则表达式确定第一数据库标识,并将从所述第一数据库标识对应的第一数据库中遍历到的数据确定为第一初始用户数据;
利用所述第二正则表达式确定第二数据库标识,并将从所述第二数据库标识对应的第二数据库中遍历到的数据确定为第二初始用户数据。
根据本发明的一个可选的实施方式,所述基于所述第二目标用户数据训练留存预测模型包括:
获取第三目标用户群体的第三初始用户数据,并根据所述第三初始用户数据得到第三目标用户数据;
将所述第二目标用户数据及所述第三目标用户数据作为模型的输入数据,并将所述第二目标用户数据及所述第三目标用户数据对应的留存标签作为模型的训练目标;
根据所述模型的输入数据及所述模型的训练目标,基于梯度提升决策树算法进行训练,得到所述留存预测模型。
根据本发明的一个可选的实施方式,所述根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐包括:
获取所述留存预测标签中的目标留存预测标签;
获取所述第一目标用户群体中与所述目标留存预测标签对应的第一目标用户,作为待推荐用户;
对所述待推荐用户对应的相似度进行排序;
将排序在前N个的相似度对应的第二目标用户确定为所述待推荐用户的匹配用户;
根据所述匹配用户购买的商品为所述待推荐用户进行商品推荐。
本发明的第二方面提供一种基于人工智能的商品推荐装置,所述装置包括:
获取模块,用于获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据;
更新模块,用于计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据;
计算模块,用于计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度;
预测模块,用于基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签;
推荐模块,用于根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
本发明的第三方面提供一种电子设备,所述电子设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述基于人工智能的商品推荐方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的商品推荐方法。
综上所述,本发明所述的基于人工智能的商品推荐方法、装置、电子设备及介质,在获取到第一目标用户群体的第一初始用户数据及第二目标用户群体的第二初始用户数据之后,由于用户的个人兴趣会随着时间的迁移而不断变化,因而通过计算时间影响因子来将第一初始用户数据更新为第一目标用户数据及将第二初始用户数据更新为第二目标用户数据,从而修正了时间因素导致的目标用户数据无法实时更新的问题,进一步通过计算第一目标用户数据与第二目标用户数据的兴趣偏好因子,来有效的表征两个目标用户数据对应的目标用户之间的潜在的兴趣爱好,并基于所述兴趣偏好因子计算对应的两个目标用户数据的相似度,相似度的准确度较高,使用基于第二目标用户数据训练得到的留存预测模型对第一目标用户数据进行留存预测,得到留存预测标签,最后通过结合留存预测标签和相似度两方面的因素,为第一目标用户群体进行商品推荐,商品推荐的效果更佳。
附图说明
图1是本发明实施例一提供的基于人工智能的商品推荐方法的流程图。
图2是本发明实施例二提供的基于人工智能的商品推荐装置的结构图。
图3是本发明实施例三提供的电子设备的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述在一个可选的实施方式中实施例的目的,不是旨在于限制本发明。
本发明实施例提供的基于人工智能的商品推荐方法由电子设备执行,相应地,基于人工智能的商品推荐装置运行于电子设备中。
实施例一
图1是本发明实施例一提供的基于人工智能的商品推荐方法的流程图。所述基于人工智能的商品推荐方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据。
本申请实施例基于第二目标用户群体为第一目标用户群体进行商品推荐,其中,商品可以包括保险产品,学习课程,音视频、博客等,本申请实施例对商品的类型不做任何具体限制。
为便于理解本申请实施例,下面以保险产品推荐为例,其中,第一目标用户群体是指历史用户且当前不在保用户,第二目标用户群体是指历史用户但当前已续保用户。即,本申请实施例并不是对所有历史用户进行留存预测并根据留存预测概率进行保险产品的推荐。
在保险产品推荐的应用场景中,初始用户数据可以包括,但不限于:历史购买的保险产品信息、历史投保的保险代理人信息、触网活跃信息等。
在一个可选的实施方式中,第一初始用户数据及第二初始用户均可以包括:用户活动的时间间隔,用户最后一次活动的时间与当前时间的时间差值,用户的注册时间等。
例如,用户启动保险应用的时间间隔、互动点赞的时间间隔、浏览产品详情的时间间隔等。用户最后一次启动保险应用的时间与当前时间的时间差值、用户最后一次互动点赞的时间与当前时间的时间差值、浏览产品详情的时间与当前时间的时间差值。
从直观上来说,用户活动的时间间隔是描述用户活跃程度的最好特征,活动的时间间隔越大表示用户越不活跃,流失的可能性越大;相反,活动的时间间隔越小表示用户活动频繁,流失可能性较小。考虑到用户的活动具有一定黏性,所以用户最后一次活动的时间与当前时间的时间差值可以用来描述用户活动的黏性,时间差值越大说明黏性越小,用户再次活动的可能性也越小;反之,则很有可能会再次活动。
在一个可选的实施方式中,所述获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据包括:
响应于接收到的商品推荐指令,解析所述商品推荐指令的方法体,得到所述商品推荐指令所携带的信息;
从所述信息中获取所述第一目标用户群体的预设第一标签及所述第二目标用户群体的预设第二标签;
根据所述预设第一标签构建第一正则表达式及根据所述预设第二标签构建第二正则表达式;
利用所述第一正则表达式确定第一数据库标识,并将从所述第一数据库标识对应的第一数据库中遍历到的数据确定为第一初始用户数据;
利用所述第二正则表达式确定第二数据库标识,并将从所述第二数据库标识对应的第二数据库中遍历到的数据确定为第二初始用户数据。
所述商品推荐指令可以由需要进行商品推荐的部门领导触发,本发明不限制。
其中,所述商品推荐指令实质上是一条代码,根据代码的编写原则,{}之间的内容被称之为方法体。
不同的目标用户群体对应不同的预设标签,第一目标用户群体对应预设第一标签,第二目标用户群体对应预设第二标签,所述预设第一标签和预设第二标签可以进行自定义配置。
所述预设标签与数据库标识具有一一对应的关系,例如:所述预设标签可以是ID,进一步以所述预设标签建立正则表达式ID(),并以ID()进行遍历。
上述可选的实施方式,基于预设标签构建正则表达式,并利用正则表达式快速确定数据库标识,并进一步利用所述数据库标识调用对应的数据库,以便从对应的数据库中快速精准的获取目标用户群体的初始用户数据。
S12,计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据。
用户的个人兴趣会随着时间的迁移而不断变化,例如,对于保险产品的购买需求及保险产品的类型会随着时间的迁移而不断变化,通过计算时间影响因子,来调整初始用户数据为目标用户数据,从而基于目标用户数据进行相似度的计算。
在一个可选的实施方式中,所述计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据包括:
获取所述第一目标用户的第一注册时间及获取所述第二目标用户的第二注册时间;
根据所述第一注册时间计算对应的所述第一初始用户数据的第一时间影响因子,及根据所述第二注册时间计算对应的所述第二初始用户数据的第二时间影响因子;
使用所述第一时间影响因子更新所述第一初始用户数据为所述第一目标用户数据,及使用所述第二时间影响因子更新所述第二初始用户数据为所述第二目标用户数据。
由于第一目标用户群体和第二目标用户群体均为历史购买过保险产品的用户,因而每个第一目标用户和每个第二目标用户在购买保险产品的时候会登录保险产品应用进行注册。
计算注册时间与当前时间的时间差值,将时间差值作为时间影响因子,基于时间影响因子与初始用户数据的乘积,得到了目标用户数据,从而实现了将初始用户数据更新为目标用户数据的目的。
上述可选的实施方式中,通过目标用户的注册时间与当前时间的时间差值计算得到时间影响因子,并根据时间影响因子更新对应的初始用户数据,得到的目标用户数据有效的融合了时间因素。
S13,计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度。
通常而言,不同目标用户群体之间的共同用户数据较为稀疏,但用户数据的数值可能比较接近,导致最后计算的相似度较为接近,而这种情况可能是高估了用户的相似度,如两个用户同时感兴趣的保险产品的个数很少,那么他们的兴趣爱好可能很不相似,所以在使用皮尔森相关系数计算两个不同目标用户群体之间的目标用户的相似度的同时,需要考虑目标用户的共同兴趣爱好,从而确定兴趣偏好因子。
第一目标用户数据与第二目标用户数据之间的相似度越大,表明对应的第一目标用户与第二目标用户越具有偏好一致性;第一目标用户数据与第二目标用户数据之间的相似度越小,表明对应的第一目标用户与第二目标用户越不具有偏好一致性。
在一个可选的实施方式中,所述计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度包括:
计算所述第一目标用户数据与所述第二目标用户数据中相同目标用户数据的第一数量;
计算所述第一目标用户数据与所述第二目标用户数据的总目标用户数据的第二数量;
基于所述第一数量及所述第二数量计算得到兴趣偏好因子;
计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数;
使用所述兴趣偏好因子对对应的所述皮尔森相关系数进行修正,得到所述相似度。
示例性的,假设第一目标用户数据D1包括10个数据字段,第二目标用户数据D2包括10个数据字段,第一目标用户数据D1与第二目标用户数据D2中有5个数据字段是相同的,则兴趣偏好因子为5/20=0.25。
在计算得到第一目标用户数据与第二目标用户数据之间的皮尔森相关系数之后,将皮尔森相关系数与对应的兴趣偏好因子进行加权,得到的加权值作为第一目标用户数据与第二目标用户数据之间的相似度。
上述可选的实施方式,通过计算两个目标用户数据中相同目标用户数据的数量,能够有效的表征这两个目标用户数据对应的目标用户之间的潜在的兴趣爱好,从而在计算得到皮尔森相关性系数时,对皮尔森相关性系数进行修正,得到准确度较高的相似度,有助于提高后续的商品推荐的效果。
在一个可选的实施方式中,所述计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数包括:
根据所述第一目标用户数据计算得到第一均值数据,及根据所述第二目标用户数据计算得到第二均值数据;
根据所述第一目标用户数据与所述第一均值数据计算得到第一差值数据,及根据所述第二目标用户数据与所述第二均值数据计算得到第二差值数据;
基于所述第一差值数据与所述第二差值数据计算得到对应的所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数。
需要说明的是,在计算第一均值数据及第二均值数据之前,需要将第一目标用户数据及第二目标用户数据进行量纲上的统一,即将第一目标用户数据及第二目标用户数据中的非数值型的数据映射为数值型的数据。
将第一目标用户数据中的每个数据字段均与第一均值数据做差,得到第一差值数据,将第二目标用户数据中的每个数据字段均与第二均值数据做差,得到第二差值数据。
上述可选的实施方式中,通过计算每个目标用户数据的均值数据,再使用目标用户数据减去对应的均值数据,最后根据得到的差值数据计算皮尔森相关系数,不仅考虑了数据之间的方向性,更兼顾了数据的具体大小,因此计算得到的皮尔森相关系数更为准确,从而使得计算得到的相似度更为准确。
S14,基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签。
本实施例可以使用逻辑回归算法基于第二目标用户数据进行训练得到留存预测模型。
可以使用大数据计算框架(mapreduce+hive)对第二目标用户数据进行处理。具体而言,可以采用hive收集第二目标用户数据,通过mapreduce封装模型,再使用hive对模型预测得到的结果进行验证或者测试。
在一个可选的实施方式中,所述基于所述第二目标用户数据训练留存预测模型包括:
获取第三目标用户群体的第三初始用户数据,并根据所述第三初始用户数据得到第三目标用户数据;
将所述第二目标用户数据及所述第三目标用户数据作为模型的输入数据,并将所述第二目标用户数据及所述第三目标用户数据对应的留存标签作为模型的训练目标;
根据所述模型的输入数据及所述模型的训练目标,基于梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法进行训练,得到所述留存预测模型。
其中,第三目标用户群体是指历史用户但当前放弃续保的用户。第三初始用户数据同第一初始用户数据及第二初始用户数据相同,也可以包括用户活动的时间间隔,用户最后一次活动的时间与当前时间的时间差值,用户的注册时间等。获取每个所述第三目标用户的第三注册时间,根据所述第三注册时间计算对应的所述第三初始用户数据的第三时间影响因子,使用所述第三时间影响因子更新所述第三初始用户数据为所述第三目标用户数据。
第二目标用户数据的留存标签记为“1”,第三目标用户数据的留存标签记为“0”,将第二目标用户数据及第三目标用户数据作为训练数据集,训练梯度提升决策树,得到留存预测模型,从而使用留存预测模型对第一目标用户数据进行二分类预测。即,预测第一目标用户数据的留存标签为“1”还是“0”。
上述可选的实施方式中,以留存标签向目标不断进行拟合训练,同时,GBDT算法在迭代过程中的每次迭代侧重训练残差大的样本,然后获得多个树模型,通过对多个模型融合后获得最终结果,充分考虑了残差的影响,能够使留存预测模型的训练效果更佳。使用训练效果更佳的留存预测模型对第一目标用户数据进行留存预测时,能够得到准确度更高的留存预测标签。
S15,根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
用户的消费行为是企业获利的重要渠道,用户群体越大,企业获利的空间越大,当用户流失的速度低于获取新用户的速度时,用户量呈增加状态,提前预测可能的留存用户并及时对留存用户进行商品推荐,对降低用户流失率具有重要的现实意义。
在一个可选的实施方式中,所述根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐包括:
获取所述留存预测标签中的目标留存预测标签;
获取所述第一目标用户群体中与所述目标留存预测标签对应的第一目标用户,作为待推荐用户;
对所述待推荐用户对应的相似度进行排序;
将排序在前N个的相似度对应的第二目标用户确定为所述待推荐用户的匹配用户;
根据所述匹配用户购买的商品为所述待推荐用户进行商品推荐。
其中,目标留存预测标签为“1”。
由于具有目标留存预测标签的第一目标用户具有较大概率能够留存下来,并成为企业经济支撑的主要力量,因子只对第一目标用户群体中具有目标留存预测标签的第一目标用户进行商品的个性化推荐。
相似度越大的第一目标用户群体与第二目标用户群体,他们之间的潜在兴趣爱好更加相同,因此,通过第二目标用户群体购买的商品生成商品列表,推荐给第一目标用户群体,更能符合第一目标用户群体的购买需求,推荐精准度更高。
上述可选的实施方式中,通过结合留存预测标签和相似度两方面的因素,为第一目标用户群体进行商品推荐,商品推荐的效果更佳。
本申请实施例,在获取到第一目标用户群体的第一初始用户数据及第二目标用户群体的第二初始用户数据之后,由于用户的个人兴趣会随着时间的迁移而不断变化,因而通过计算时间影响因子来将第一初始用户数据更新为第一目标用户数据及将第二初始用户数据更新为第二目标用户数据,从而修正了时间因素导致的目标用户数据无法实时更新的问题,进一步通过计算第一目标用户数据与第二目标用户数据的兴趣偏好因子,来有效的表征两个目标用户数据对应的目标用户之间的潜在的兴趣爱好,并基于所述兴趣偏好因子计算对应的两个目标用户数据的相似度,相似度的准确度较高,使用基于第二目标用户数据训练得到的留存预测模型对第一目标用户数据进行留存预测,得到留存预测标签,最后通过结合留存预测标签和相似度两方面的因素,为第一目标用户群体进行商品推荐,商品推荐的效果更佳。
实施例二
图2是本发明实施例二提供的基于人工智能的商品推荐装置的结构图。
在一些实施例中,所述基于人工智能的商品推荐装置20可以包括多个由计算机程序段所组成的功能模块。所述基于人工智能的商品推荐装置20中的各个程序段的计算机程序可以存储于电子设备的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)基于人工智能的商品推荐的功能。
本实施例中,所述基于人工智能的商品推荐装置20根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:获取模块201、更新模块202、计算模块203、预测模块204及推荐模块205。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述获取模块201,用于获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据。
本申请实施例基于第二目标用户群体为第一目标用户群体进行商品推荐,其中,商品可以包括保险产品,学习课程,音视频、博客等,本申请实施例对商品的类型不做任何具体限制。
为便于理解本申请实施例,下面以保险产品推荐为例,其中,第一目标用户群体是指历史用户且当前不在保用户,第二目标用户群体是指历史用户但当前已续保用户。即,本申请实施例并不是对所有历史用户进行留存预测并根据留存预测概率进行保险产品的推荐。
在保险产品推荐的应用场景中,初始用户数据可以包括,但不限于:历史购买的保险产品信息、历史投保的保险代理人信息、触网活跃信息等。
在一个可选的实施方式中,第一初始用户数据及第二初始用户均可以包括:用户活动的时间间隔,用户最后一次活动的时间与当前时间的时间差值,用户的注册时间等。
例如,用户启动保险应用的时间间隔、互动点赞的时间间隔、浏览产品详情的时间间隔等。用户最后一次启动保险应用的时间与当前时间的时间差值、用户最后一次互动点赞的时间与当前时间的时间差值、浏览产品详情的时间与当前时间的时间差值。
从直观上来说,用户活动的时间间隔是描述用户活跃程度的最好特征,活动的时间间隔越大表示用户越不活跃,流失的可能性越大;相反,活动的时间间隔越小表示用户活动频繁,流失可能性较小。考虑到用户的活动具有一定黏性,所以用户最后一次活动的时间与当前时间的时间差值可以用来描述用户活动的黏性,时间差值越大说明黏性越小,用户再次活动的可能性也越小;反之,则很有可能会再次活动。
在一个可选的实施方式中,所述获取模块201获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据包括:
响应于接收到的商品推荐指令,解析所述商品推荐指令的方法体,得到所述商品推荐指令所携带的信息;
从所述信息中获取所述第一目标用户群体的预设第一标签及所述第二目标用户群体的预设第二标签;
根据所述预设第一标签构建第一正则表达式及根据所述预设第二标签构建第二正则表达式;
利用所述第一正则表达式确定第一数据库标识,并将从所述第一数据库标识对应的第一数据库中遍历到的数据确定为第一初始用户数据;
利用所述第二正则表达式确定第二数据库标识,并将从所述第二数据库标识对应的第二数据库中遍历到的数据确定为第二初始用户数据。
所述商品推荐指令可以由需要进行商品推荐的部门领导触发,本发明不限制。
其中,所述商品推荐指令实质上是一条代码,根据代码的编写原则,{}之间的内容被称之为方法体。
不同的目标用户群体对应不同的预设标签,第一目标用户群体对应预设第一标签,第二目标用户群体对应预设第二标签,所述预设第一标签和预设第二标签可以进行自定义配置。
所述预设标签与数据库标识具有一一对应的关系,例如:所述预设标签可以是ID,进一步以所述预设标签建立正则表达式ID(),并以ID()进行遍历。
上述可选的实施方式,基于预设标签构建正则表达式,并利用正则表达式快速确定数据库标识,并进一步利用所述数据库标识调用对应的数据库,以便从对应的数据库中快速精准的获取目标用户群体的初始用户数据。
所述更新模块202,用于计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据。
用户的个人兴趣会随着时间的迁移而不断变化,例如,对于保险产品的购买需求及保险产品的类型会随着时间的迁移而不断变化,通过计算时间影响因子,来调整初始用户数据为目标用户数据,从而基于目标用户数据进行相似度的计算。
在一个可选的实施方式中,所述更新模块202计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据包括:
获取所述第一目标用户的第一注册时间及获取所述第二目标用户的第二注册时间;
根据所述第一注册时间计算对应的所述第一初始用户数据的第一时间影响因子,及根据所述第二注册时间计算对应的所述第二初始用户数据的第二时间影响因子;
使用所述第一时间影响因子更新所述第一初始用户数据为所述第一目标用户数据,及使用所述第二时间影响因子更新所述第二初始用户数据为所述第二目标用户数据。
由于第一目标用户群体和第二目标用户群体均为历史购买过保险产品的用户,因而每个第一目标用户和每个第二目标用户在购买保险产品的时候会登录保险产品应用进行注册。
计算注册时间与当前时间的时间差值,将时间差值作为时间影响因子,基于时间影响因子与初始用户数据的乘积,得到了目标用户数据,从而实现了将初始用户数据更新为目标用户数据的目的。
上述可选的实施方式中,通过目标用户的注册时间与当前时间的时间差值计算得到时间影响因子,并根据时间影响因子更新对应的初始用户数据,得到的目标用户数据有效的融合了时间因素。
所述计算模块203,用于计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度。
通常而言,不同目标用户群体之间的共同用户数据较为稀疏,但用户数据的数值可能比较接近,导致最后计算的相似度较为接近,而这种情况可能是高估了用户的相似度,如两个用户同时感兴趣的保险产品的个数很少,那么他们的兴趣爱好可能很不相似,所以在使用皮尔森相关系数计算两个不同目标用户群体之间的目标用户的相似度的同时,需要考虑目标用户的共同兴趣爱好,从而确定兴趣偏好因子。
第一目标用户数据与第二目标用户数据之间的相似度越大,表明对应的第一目标用户与第二目标用户越具有偏好一致性;第一目标用户数据与第二目标用户数据之间的相似度越小,表明对应的第一目标用户与第二目标用户越不具有偏好一致性。
在一个可选的实施方式中,所述计算模块203计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度包括:
计算所述第一目标用户数据与所述第二目标用户数据中相同目标用户数据的第一数量;
计算所述第一目标用户数据与所述第二目标用户数据的总目标用户数据的第二数量;
基于所述第一数量及所述第二数量计算得到兴趣偏好因子;
计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数;
使用所述兴趣偏好因子对对应的所述皮尔森相关系数进行修正,得到所述相似度。
示例性的,假设第一目标用户数据D1包括10个数据字段,第二目标用户数据D2包括10个数据字段,第一目标用户数据D1与第二目标用户数据D2中有5个数据字段是相同的,则兴趣偏好因子为5/20=0.25。
在计算得到第一目标用户数据与第二目标用户数据之间的皮尔森相关系数之后,将皮尔森相关系数与对应的兴趣偏好因子进行加权,得到的加权值作为第一目标用户数据与第二目标用户数据之间的相似度。
上述可选的实施方式,通过计算两个目标用户数据中相同目标用户数据的数量,能够有效的表征这两个目标用户数据对应的目标用户之间的潜在的兴趣爱好,从而在计算得到皮尔森相关性系数时,对皮尔森相关性系数进行修正,得到准确度较高的相似度,有助于提高后续的商品推荐的效果。
在一个可选的实施方式中,所述计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数包括:
根据所述第一目标用户数据计算得到第一均值数据,及根据所述第二目标用户数据计算得到第二均值数据;
根据所述第一目标用户数据与所述第一均值数据计算得到第一差值数据,及根据所述第二目标用户数据与所述第二均值数据计算得到第二差值数据;
基于所述第一差值数据与所述第二差值数据计算得到对应的所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数。
需要说明的是,在计算第一均值数据及第二均值数据之前,需要将第一目标用户数据及第二目标用户数据进行量纲上的统一,即将第一目标用户数据及第二目标用户数据中的非数值型的数据映射为数值型的数据。
将第一目标用户数据中的每个数据字段均与第一均值数据做差,得到第一差值数据,将第二目标用户数据中的每个数据字段均与第二均值数据做差,得到第二差值数据。
上述可选的实施方式中,通过计算每个目标用户数据的均值数据,再使用目标用户数据减去对应的均值数据,最后根据得到的差值数据计算皮尔森相关系数,不仅考虑了数据之间的方向性,更兼顾了数据的具体大小,因此计算得到的皮尔森相关系数更为准确,从而使得计算得到的相似度更为准确。
所述预测模块204,用于基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签。
本实施例可以使用逻辑回归算法基于第二目标用户数据进行训练得到留存预测模型。
可以使用大数据计算框架(mapreduce+hive)对第二目标用户数据进行处理。具体而言,可以采用hive收集第二目标用户数据,通过mapreduce封装模型,再使用hive对模型预测得到的结果进行验证或者测试。
在一个可选的实施方式中,所述预测模块204基于所述第二目标用户数据训练留存预测模型包括:
获取第三目标用户群体的第三初始用户数据,并根据所述第三初始用户数据得到第三目标用户数据;
将所述第二目标用户数据及所述第三目标用户数据作为模型的输入数据,并将所述第二目标用户数据及所述第三目标用户数据对应的留存标签作为模型的训练目标;
根据所述模型的输入数据及所述模型的训练目标,基于梯度提升决策树(Gradient Boosting Decision Tree,GBDT)算法进行训练,得到所述留存预测模型。
其中,第三目标用户群体是指历史用户但当前放弃续保的用户。第三初始用户数据同第一初始用户数据及第二初始用户数据相同,也可以包括用户活动的时间间隔,用户最后一次活动的时间与当前时间的时间差值,用户的注册时间等。获取每个所述第三目标用户的第三注册时间,根据所述第三注册时间计算对应的所述第三初始用户数据的第三时间影响因子,使用所述第三时间影响因子更新所述第三初始用户数据为所述第三目标用户数据。
第二目标用户数据的留存标签记为“1”,第三目标用户数据的留存标签记为“0”,将第二目标用户数据及第三目标用户数据作为训练数据集,训练梯度提升决策树,得到留存预测模型,从而使用留存预测模型对第一目标用户数据进行二分类预测。即,预测第一目标用户数据的留存标签为“1”还是“0”。
上述可选的实施方式中,以留存标签向目标不断进行拟合训练,同时,GBDT算法在迭代过程中的每次迭代侧重训练残差大的样本,然后获得多个树模型,通过对多个模型融合后获得最终结果,充分考虑了残差的影响,能够使留存预测模型的训练效果更佳。使用训练效果更佳的留存预测模型对第一目标用户数据进行留存预测时,能够得到准确度更高的留存预测标签。
所述推荐模块205,用于根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
用户的消费行为是企业获利的重要渠道,用户群体越大,企业获利的空间越大,当用户流失的速度低于获取新用户的速度时,用户量呈增加状态,提前预测可能的留存用户并及时对留存用户进行商品推荐,对降低用户流失率具有重要的现实意义。
在一个可选的实施方式中,所述推荐模块205根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐包括:
获取所述留存预测标签中的目标留存预测标签;
获取所述第一目标用户群体中与所述目标留存预测标签对应的第一目标用户,作为待推荐用户;
对所述待推荐用户对应的相似度进行排序;
将排序在前N个的相似度对应的第二目标用户确定为所述待推荐用户的匹配用户;
根据所述匹配用户购买的商品为所述待推荐用户进行商品推荐。
其中,目标留存预测标签为“1”。
由于具有目标留存预测标签的第一目标用户具有较大概率能够留存下来,并成为企业经济支撑的主要力量,因子只对第一目标用户群体中具有目标留存预测标签的第一目标用户进行商品的个性化推荐。
相似度越大的第一目标用户群体与第二目标用户群体,他们之间的潜在兴趣爱好更加相同,因此,通过第二目标用户群体购买的商品生成商品列表,推荐给第一目标用户群体,更能符合第一目标用户群体的购买需求,推荐精准度更高。
上述可选的实施方式中,通过结合留存预测标签和相似度两方面的因素,为第一目标用户群体进行商品推荐,商品推荐的效果更佳。
本申请实施例,在获取到第一目标用户群体的第一初始用户数据及第二目标用户群体的第二初始用户数据之后,由于用户的个人兴趣会随着时间的迁移而不断变化,因而通过计算时间影响因子来将第一初始用户数据更新为第一目标用户数据及将第二初始用户数据更新为第二目标用户数据,从而修正了时间因素导致的目标用户数据无法实时更新的问题,进一步通过计算第一目标用户数据与第二目标用户数据的兴趣偏好因子,来有效的表征两个目标用户数据对应的目标用户之间的潜在的兴趣爱好,并基于所述兴趣偏好因子计算对应的两个目标用户数据的相似度,相似度的准确度较高,使用基于第二目标用户数据训练得到的留存预测模型对第一目标用户数据进行留存预测,得到留存预测标签,最后通过结合留存预测标签和相似度两方面的因素,为第一目标用户群体进行商品推荐,商品推荐的效果更佳。
实施例三
本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述基于人工智能的商品推荐方法实施例中的步骤,例如图1所示的S11-S15:
S11,获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据;
S12,计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据;
S13,计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度;
S14,基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签;
S15,根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的模块201-205:
所述获取模块201,用于获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据;
所述更新模块202,用于计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据;
所述计算模块203,用于计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度;
所述预测模块204,用于基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签;
所述推荐模块205,用于根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
实施例四
参阅图3所示,为本发明实施例三提供的电子设备的结构示意图。在本发明较佳实施例中,所述电子设备3包括存储器31、至少一个处理器32、至少一条通信总线33及收发器34。
本领域技术人员应该了解,图3示出的电子设备的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述电子设备3还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述电子设备3是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述电子设备3还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述电子设备3仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器31中存储有计算机程序,所述计算机程序被所述至少一个处理器32执行时实现如所述的基于人工智能的商品推荐方法中的全部或者部分步骤。所述存储器31包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
在一些实施例中,所述至少一个处理器32是所述电子设备3的控制核心(ControlUnit),利用各种接口和线路连接整个电子设备3的各个部件,通过运行或执行存储在所述存储器31内的程序或者模块,以及调用存储在所述存储器31内的数据,以执行电子设备3的各种功能和处理数据。例如,所述至少一个处理器32执行所述存储器中存储的计算机程序时实现本发明实施例中所述的基于人工智能的商品推荐方法的全部或者部分步骤;或者实现基于人工智能的商品推荐装置的全部或者部分功能。所述至少一个处理器32可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线33被设置为实现所述存储器31以及所述至少一个处理器32等之间的连接通信。
尽管未示出,所述电子设备3还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器32逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备3还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,电子设备,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,既可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。说明书中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (10)

1.一种基于人工智能的商品推荐方法,其特征在于,所述方法包括:
获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据;
计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据;
计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度;
基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签;
根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
2.如权利要求1所述的基于人工智能的商品推荐方法,其特征在于,所述计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据包括:
获取所述第一目标用户的第一注册时间及获取所述第二目标用户的第二注册时间;
根据所述第一注册时间计算对应的所述第一初始用户数据的第一时间影响因子,及根据所述第二注册时间计算对应的所述第二初始用户数据的第二时间影响因子;
使用所述第一时间影响因子更新所述第一初始用户数据为所述第一目标用户数据,及使用所述第二时间影响因子更新所述第二初始用户数据为所述第二目标用户数据。
3.如权利要求1所述的基于人工智能的商品推荐方法,其特征在于,所述计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度包括:
计算所述第一目标用户数据与所述第二目标用户数据中相同目标用户数据的第一数量;
计算所述第一目标用户数据与所述第二目标用户数据的总目标用户数据的第二数量;
基于所述第一数量及所述第二数量计算得到兴趣偏好因子;
计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数;
使用所述兴趣偏好因子对对应的所述皮尔森相关系数进行修正,得到所述相似度。
4.如权利要求3所述的基于人工智能的商品推荐方法,其特征在于,所述计算所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数包括:
根据所述第一目标用户数据计算得到第一均值数据,及根据所述第二目标用户数据计算得到第二均值数据;
根据所述第一目标用户数据与所述第一均值数据计算得到第一差值数据,及根据所述第二目标用户数据与所述第二均值数据计算得到第二差值数据;
基于所述第一差值数据与所述第二差值数据计算得到对应的所述第一目标用户数据与所述第二目标用户数据的皮尔森相关系数。
5.如权利要求1至4中任意一项所述的基于人工智能的商品推荐方法,其特征在于,所述获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据包括:
响应于接收到的商品推荐指令,解析所述商品推荐指令的方法体,得到所述商品推荐指令所携带的信息;
从所述信息中获取所述第一目标用户群体的预设第一标签及所述第二目标用户群体的预设第二标签;
根据所述预设第一标签构建第一正则表达式及根据所述预设第二标签构建第二正则表达式;
利用所述第一正则表达式确定第一数据库标识,并将从所述第一数据库标识对应的第一数据库中遍历到的数据确定为第一初始用户数据;
利用所述第二正则表达式确定第二数据库标识,并将从所述第二数据库标识对应的第二数据库中遍历到的数据确定为第二初始用户数据。
6.如权利要求1至4中任意一项所述的基于人工智能的商品推荐方法,其特征在于,所述基于所述第二目标用户数据训练留存预测模型包括:
获取第三目标用户群体的第三初始用户数据,并根据所述第三初始用户数据得到第三目标用户数据;
将所述第二目标用户数据及所述第三目标用户数据作为模型的输入数据,并将所述第二目标用户数据及所述第三目标用户数据对应的留存标签作为模型的训练目标;
根据所述模型的输入数据及所述模型的训练目标,基于梯度提升决策树算法进行训练,得到所述留存预测模型。
7.如权利要求1至4中任意一项所述的基于人工智能的商品推荐方法,其特征在于,所述根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐包括:
获取所述留存预测标签中的目标留存预测标签;
获取所述第一目标用户群体中与所述目标留存预测标签对应的第一目标用户,作为待推荐用户;
对所述待推荐用户对应的相似度进行排序;
将排序在前N个的相似度对应的第二目标用户确定为所述待推荐用户的匹配用户;
根据所述匹配用户购买的商品为所述待推荐用户进行商品推荐。
8.一种基于人工智能的商品推荐装置,其特征在于,所述装置包括:
获取模块,用于获取第一目标用户群体的第一初始用户数据,及获取第二目标用户群体的第二初始用户数据;
更新模块,用于计算时间影响因子并使用所述时间影响因子更新所述第一初始用户数据为第一目标用户数据及更新所述第二初始用户数据为第二目标用户数据;
计算模块,用于计算所述第一目标用户数据与所述第二目标用户数据的兴趣偏好因子,并基于所述兴趣偏好因子计算对应的所述第一目标用户数据与所述第二目标用户数据的相似度;
预测模块,用于基于所述第二目标用户数据训练留存预测模型,并使用所述留存预测模型对所述第一目标用户数据进行留存预测,得到留存预测标签;
推荐模块,用于根据所述留存预测标签及所述相似度为所述第一目标用户群体进行商品推荐。
9.一种电子设备,其特征在于,所述电子设备包括处理器和存储器,所述处理器用于执行所述存储器中存储的计算机程序时实现如权利要求1至7中任意一项所述基于人工智能的商品推荐方法。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任意一项所述基于人工智能的商品推荐方法。
CN202210081099.7A 2022-01-24 2022-01-24 基于人工智能的商品推荐方法、装置、电子设备及介质 Pending CN114399368A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210081099.7A CN114399368A (zh) 2022-01-24 2022-01-24 基于人工智能的商品推荐方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210081099.7A CN114399368A (zh) 2022-01-24 2022-01-24 基于人工智能的商品推荐方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN114399368A true CN114399368A (zh) 2022-04-26

Family

ID=81233613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210081099.7A Pending CN114399368A (zh) 2022-01-24 2022-01-24 基于人工智能的商品推荐方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN114399368A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116562926A (zh) * 2023-07-05 2023-08-08 荣耀终端有限公司 用户行为预测方法、终端、云端设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116562926A (zh) * 2023-07-05 2023-08-08 荣耀终端有限公司 用户行为预测方法、终端、云端设备及存储介质
CN116562926B (zh) * 2023-07-05 2024-04-16 荣耀终端有限公司 用户行为预测方法、终端、云端设备及存储介质

Similar Documents

Publication Publication Date Title
US11281969B1 (en) Artificial intelligence system combining state space models and neural networks for time series forecasting
US20140358829A1 (en) System and method for sharing record linkage information
CN112801718B (zh) 用户行为预测方法、装置、设备及介质
CN112445854B (zh) 多源业务数据实时处理方法、装置、终端及存储介质
CN114663198A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN112860989B (zh) 课程推荐方法、装置、计算机设备及存储介质
CN113657495A (zh) 基于概率预测模型的保险产品推荐方法、装置、设备
CN112288337B (zh) 行为推荐方法、装置、设备及介质
WO2021146802A1 (en) Method and system for optimizing an objective having discrete constraints
CN114781832A (zh) 课程推荐方法、装置、电子设备及存储介质
CN114399368A (zh) 基于人工智能的商品推荐方法、装置、电子设备及介质
CN111950707A (zh) 基于行为共现网络的行为预测方法、装置、设备及介质
CN111651452A (zh) 数据存储方法、装置、计算机设备及存储介质
CN111652282A (zh) 基于大数据的用户偏好分析方法、装置及电子设备
CN113420847B (zh) 基于人工智能的目标对象匹配方法及相关设备
CN116245458A (zh) 基于人工智能的库存管理方法、装置、电子设备及介质
CN113674065A (zh) 基于服务触点的业务推荐方法、装置、电子设备及介质
CN114219663A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN115545248A (zh) 目标对象预测方法、装置、设备及介质
CN112365051A (zh) 代理人留存预测方法、装置、计算机设备及存储介质
Hung et al. Application extensions from the stochastic capacity rationing decision approach
CN113869992B (zh) 基于人工智能的产品推荐方法、装置、电子设备及介质
CN112381595B (zh) 基于交往行为的用户价值预测方法及相关设备
CN112651778B (zh) 用户行为预测方法、装置、设备及介质
CN113553513B (zh) 基于人工智能的课程推荐方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination