CN115080868A - 产品推送方法、装置、计算机设备、存储介质和程序产品 - Google Patents
产品推送方法、装置、计算机设备、存储介质和程序产品 Download PDFInfo
- Publication number
- CN115080868A CN115080868A CN202210742381.5A CN202210742381A CN115080868A CN 115080868 A CN115080868 A CN 115080868A CN 202210742381 A CN202210742381 A CN 202210742381A CN 115080868 A CN115080868 A CN 115080868A
- Authority
- CN
- China
- Prior art keywords
- product
- data
- user
- information
- pushed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种产品推送方法、装置、计算机设备、存储介质和程序产品。所述方法包括:获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;根据所述用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;根据所述用户特征数据确定待推送产品信息;将所述待推送产品信息推送给所述用户标识所在的用户终端。采用本方法构建用户的社交关系,根据不同用户对产品的需求,制定差异化策略并反馈,提高产品推送成功率。
Description
技术领域
本申请涉及大数据技术领域,特别是涉及一种产品推送方法、装置、计算机设备、存储介质和程序产品。
背景技术
随着大数据技术的发展,通过大数据技术计算符合推送要求的产品已被广泛应用在产品推送方法中。对于不同类型的产品推送,往往需要不同的处理方式。较为常见的是根据用户在终端上浏览的产品,系统分析用户特征、浏览特征后为其推送相应产品;或是由系统针对某一产品,分析其潜在用户,再把用户列表展现给业务人员,由业务人员进行线下推送。
传统的根据用户特征、浏览特征等为其推送相应产品,以协同过滤为主,根据相似的用户具有相似的兴趣偏好,筛选出用户可能感兴趣的产品,进而推送给用户。
然而,目前的产品推送方法,产品推送的精准度不够。
发明内容
基于此,有必要针对上述技术问题,提供一种产品推送方法、装置、计算机设备、存储介质和程序产品,提高产品推送的精准率。
第一方面,本申请提供一种产品推送方法,所述方法包括:
获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
根据所述用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
根据所述用户特征数据确定待推送产品信息;
将所述待推送产品信息推送给所述用户标识所在的用户终端。
在其中一个实施例中,所述根据所述用户特征数据确定待推送产品信息,包括:
对所述用户特征数据进行聚类得到用户特征聚类数据;
根据所述用户特征聚类数据和所述用户特征数据确定待推送产品信息。
在其中一个实施例中,所述根据所述用户特征聚类数据和所述用户特征数据确定待推送产品信息,包括:
针对每个产品,根据所述用户特征聚类数据计算所述产品的第一转化率,基于所述第一转化率和所述用户特征数据,确定所述产品的第二转化率;
根据各个产品的第二转化率,确定所述用户标识对应的待推送产品信息。
在其中一个实施例中,所述根据所述用户特征聚类数据计算所述产品的第一转化率,包括:
将所述用户特征聚类数据输入产品推送模型进行处理,得到所述产品的第一转化率;其中,所述产品推送模型中不同神经元配置有影响系数,所述影响系数用于表征当前神经元与当前神经元之前的所有神经元的关联关系。
在其中一个实施例中,所述方法还包括:
召回所述用户特征数据,根据所述召回的用户特征数据训练所述产品推送模型,得到更新后的产品推送模型。
在其中一个实施例中,所述方法还包括:
基于用户历史浏览信息和已获得的产品信息对所述待推送产品信息进行调整,得到调整后的待推送产品信息;
所述将所述待推送产品信息推送给所述用户标识所在的用户终端,包括:
将调整后的所述待推送产品信息推送给所述用户标识所在的用户终端。
第二方面,本申请还提供一种产品推送装置。所述装置包括:
采集模块,用于获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
预处理模块,用于根据所述用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
预测模块,用于根据所述用户特征数据确定待推送产品信息;
反馈模块,用于将所述待推送产品信息推送给所述用户标识所在的用户终端。
第三方面,本申请还提供一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请还提供一种计算机可读存储介质。所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
第五方面,本申请还提供一种计算机程序产品。所述计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
上述一种产品推送方法、装置、计算机设备、存储介质和程序产品,根据用户标识对应的社交关系数据挖掘该用户存在的社交集群信息,根据约束信息数据计算如当前政策和新闻等事件对有投资行为的影响,结合用户资产状况、可承受风险等级等基本信息数据,构建用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据,丰富特征候选集。本申请在产品推送时的用户画像中结合用户标识对应的社交关系数据,计算出与用户兴趣匹配度高的待推送产品信息推送至用户终端,提高产品推送精准率。
附图说明
图1为一个实施例中产品推送方法的应用环境图;
图2为一个实施例中产品推送方法的流程示意图;
图3为一个实施例中待推送产品计算流程示意图;
图4为一个实施例中产品推送系统总体架构图;
图5为一个实施例中产品推送数据流示意图;
图6为一个实施例中产品推送装置的结构框图;
图7为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的产品推送方法,可以应用于如图1所示的应用环境中。其中,终端101通过网络与服务器102进行通信。数据存储系统可以存储服务器102需要处理的数据。数据存储系统可以集成在服务器102上,也可以放在云上或其他网络服务器上。服务器102通过终端101获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;服务器102根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;服务器102根据用户特征数据确定待推送产品信息,服务器102将待推送产品信息推送给用户标识所在的用户终端101。
其中,终端101可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器102可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种产品推送方法,以该方法应用于图1的终端为例进行说明,包括步骤100至步骤400。
步骤100:获取用户标识对应的社交关系数据、约束信息数据及基本信息数据。
其中,社交关系数据只采集用户标识对应的一阶社交关系,也就是两个用户之间存在的直接联系,不存在第三方中介。社交关系数据包括两类,第一类社交关系数据基于产品推送系统获取,可以是用户标识对应的资源交互信息,交互的资源可以是理财产品、股票、虚拟货币、电子优惠券等。第二类社交关系数据基于社交网络获取,是用户标识对应的基于社交网络进行的交互信息,例如用户标识在社交网络的发布、浏览、交互等数据,社交网络可以是财富社区、BBS论坛、留言板等与产品相关的社交网络平台。
约束信息数据可以是新闻政策等对产品获取行为有影响的数据,约束信息数据可以影响获取产品的概率。
基本信息数据可以是表示用户基本信息的数据,例如年龄、性别、产品获取等级等。
具体的,第一类社交关系数据以用户标识为索引读取数据,可以在系统的分布式数据库读取,或者在系统的云服务器、云数据库等云端读取,或者是通过大数据处理平台spark获取。第二类社交关系数据可以通过用户标识为索引,获取用户在社交网络的交互信息。采用纵向联邦学习,在产品推送系统侧以用户标识为主键,读取用户标识对应的第一类社交关系数据,再拼接用户标识对应的第二类社交关系数据,得到该用户标识对应的社交关系数据。纵向联邦学习将用户标识对应的不同业态下的特征联合,适合用户重叠多,特征重叠少场景下的数据处理。
约束信息数据可以使用爬虫技术通过网站获取,也可以自定义设置。将获取到的约束信息数据通过NLP(Natural Language Processing,自然语言处理技术)计算影响因子。使用NLP对约束信息数据进行语义分割,计算约束信息数据对产品产生影响的影响因子。
由于约束信息数据pi对产品产生影响的影响因子pR(pi)计算公式如下:
公式(1)中,代表当前产品净值,key代表当前约束信息数据中涉及的不同影响关键字,比如降息、利好等,pi(key)代表key在pi中出现的次数,L(key)表示在词库中key的程度评分,n代表key总次数,y(pi)表示当前约束信息数据与产品类别的相似率,该相似率一般分为三个类别:第一类表示该约束信息数据与产品类别相同,第二类表示该约束信息数据与产品类别较为相似,第二类表示该约束信息数据与产品类别无关。若根据约束信息数据计算得到的对产品产生影响的影响因子过大,表示最近一段时间该产品收益可能会产生波动,需减少对稳健型客群推荐该产品,增加对激进型客群推荐该产品。
基本信息数据通过产品推送系统读取,可以在系统的分布式数据库读取,可以在系统的云服务器、云数据库等云端读取,可以在大数据处理平台读取。
步骤200:根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据。
其中,用户特征数据是用户对用户进行画像的特征信息。用户特征数据包括表示用户特征的用户信息、表示行为特征的行为信息、表示场景特征的场景信息和表示产品特征的产品信息。
用户信息可以是用户标识对应的性别、年龄、收入、风险等级、信用等级等个人信息,行为信息可以是用户标识对应的浏览产品、获取产品、与他人交互资源等信息,场景信息可以是节假日、相关新闻发布等用于描述用户行为产生的数据,产品信息可以是产品风险等级、销售额等数据。
用户信息和产品信息属于存量类数据,这类数据的特点是变化幅度较小,在进行特征组合后生成高阶特征的可解释性没有增量类数据强,但该类数据却具有良好的区分度,比如高风险产品能区分稳健性用户和追求高收益用户,收入较高的用户比收入较低的营销成功率更大,存量类数据可以做成产品类别初筛,根据不同的用户信用等级、收入等信息,锁定预购买产品大类;行为信息和场景信息属于增量数据,衡量变化的效果比存量数据强,作为产品推送时的精筛,在产品大类中选出适合该用户的产品。
具体的,对获取到的用户标识对应的社交关系数据、约束信息数据和基本信息数据进行特征工程处理,去除获取数据的噪声和冗杂信息,处理异常数据,使用户特征数据尽可能完整、简洁的表达产品推送及用户行为的有效信息。
用户特征数据中的缺失值较常出现在社交关系数据中,如在产品推送系统侧存在该用户标识对应的第一类社交关系数据,但是在社交网络不存在该用户标识对应的第二类社交关系数据,此类用户标识对应的数据剔除标记不进行处理,在确定待推送产品信息后获取与该用户标识相似特征用户的待推送产品信息进行推送。
对于连续数据型可分类数据进行类别划分,例如将年龄信息分为青年、中青年、中老年、老年层来带代替。划分后的类别过多会导致特征维度过大,一般来说,可以划分为五个类别以下且有明显区分的连续性数值。
对于实时性要求较高的约束信息数据,进行数据衰减探测,例如新闻等约束信息数据对产品的影响一般呈现随时间递减情况,第一天的影响力肯定大于第二天,直至影响消失或出现新的约束信息数据。
对于长时间未更新的信息做还原处理,例如十年前录入的用户信息,收入和投资现在肯定会有较大区别。从当时的基本生活水平考虑,计算用户信息与当时基本生活水平差距,再将该差距迁移到当下生活水平进行还原,保证数据准确。
步骤300:根据用户特征数据确定待推送产品信息;
其中,待推送信息是根据根据用户特征数据,挖掘社交关系数据和约束信息数据和基本信息数据之间的关系,根据不同用户对产品的需求,制定的差异化的产品推送信息。
步骤400:将待推送产品信息推送给用户标识所在的用户终端。
具体的,根据不用用户对产品的不同需求,将确认得到的待推送产品信息推送给用户标识所在的用户终端,终端可以对推送到的产品信息进行浏览、获取、推送等操作。
上述产品推送方法中,将用户标识对应的社交关系数据、约束信息数据以及基本信息数据结合,根据社交关系数据挖掘用户的社交集群信息,根据约束信息数据计算新闻、政策等约束信息对产品的影响,再结合用户资产状况、可承担风险等基本信息数据,构建用户特征数据,丰富了用户特征候选集。基于本申请方法的用户特征数据计算出的待推送信息与用户兴趣匹配度高,具有较高的关联性,产品推送的精准率高。
在一个实施例中,产品推送方法根据用户特征数据确定待推送产品信息,包括:对用户特征数据进行聚类得到用户特征聚类数据;根据用户特征聚类数据和用户特征数据确定待推送产品信息。
其中,用户特征聚类数据是把用户特征数据聚类为用户特征值聚类数据,以簇类的形式进行计算,降低计算数据量。由于用户特征数据的数据量大,对用户特征数据进行聚类得到用户特征值聚类数据,将用户特征相似的特征数据归类,一方面减少数据计算维度、降低数据稀疏风险,另一方面把相似用户特征归为一类在一定程度上也能起到协同过滤作用。
具体的,聚类的方法没有限制,可以是划分式聚类方法、基于密度的聚类方法、层次化聚类方法等。以采用K-means(K均值聚类)算法进行聚类为例,聚类得到的中心簇的用户特征为属于该类簇的样本平均值,计算每个用户标识对应属于每个类簇用户特征聚类数据的概率并保留,具体计算方式是对于某一个用户特征数据,先计算该用户特征数据到每一个聚类簇的用户聚类特征数据的距离并求和,再用该距离减去该用户特征数据到用户聚类特征数据的最短距离,两者之比即为样本点分类到聚类簇的概率,即,用户特殊数据点到某个类簇的用户特征聚类特征数据距离最近,即属于该类簇用户特征聚类数据。
具体计算方式为:通过表示聚簇的用户特征聚类数据中心点坐标,其中,表示聚簇的用户特征聚类数据中第i个中心点第n个特征数据的坐标,i代表用户特征聚类数据中心点个数,n表示用户特征个数;Pt(yt1,yt2,yt3,...ytn)表示用户特征数据中的每个特征点坐标,ytn表示用户特征数据中第t个用户特征点的坐标,t代表用户特征点的个数及用户数目,计算公式如下:
在一个实施例中,在获取用户标识对应的社交关系数据、约束信息数据及基本信息数据时,可以根据用户标识为主键进行存储,并可以在存储时进行客群划分,使相同的客群用户存储在同一分区,降低数据量,还便于对同一客群用户产品偏好进行进一步分析。
在一个实施例中,如图3所示,产品推送方法根据用户特征聚类数据和用户特征数据确定待推送产品信息,包括:
步骤301:针对每个产品,根据用户特征聚类数据计算产品的第一转化率;
步骤302:基于第一转化率和用户特征数据,确定产品的第二转化率;
步骤303:根据各个产品的第二转化率,确定用户标识对应的待推送产品信息。
其中,产品的第一转化率是某一类用户对于产品的购买概率,产品的第二转化率是某一用户标识对于产品的购买概率。基于用户特征数据获得用户属于该类用户特征聚类数据的概率,可以将产品的第一转化率调整为产品的第二转化率。待推送产品信息根据产品的第二转化率确定,产品的第二转化率高,表示用户获取产品的概率大。
具体的,根据用户特征数据计算产品的第一转化率,将产品的第一转化率与基于用户特征数据获得用户属于该类用户特征聚类数据的概率相乘,得到产品的第二转化概率。计算所有产品的第二转化率,将所有计算得到的产品第二转化率排序,根据产品的第二转化率确定用户标识对应的待推送产品信息。
在一个实施例中,产品推送方法根据用户特征聚类数据计算产品的第一转化率,包括:将用户特征聚类数据输入产品推送模型进行处理,得到产品的第一转化率;其中,产品推送模型中不同神经元配置有影响系数,影响系数用于表征当前神经元与当前神经元之前的所有神经元的关联关系。
其中,产品推送模型使用深度学习网络构建,将用户特征聚类数据输入产品推送模型,计算得到待推送信息。一般的产品推送模型只计算相邻两个时刻的关联,本实施例设置影响系数将产品推送模型中的神经元关联起来,得到两个或以上不同输入的影响。
具体的,产品推送模型以通过LSTM(Long short-term memory,长短期记忆)模型训练得到为例。LSTM模型是一个具有时间反馈的深度学习网络,将不同时刻的数据进行关联,在更长的数据序列中有更好的表现,LSTM模型保留前次输入效果,可以挖掘到在某一时间间隔内用户标识对应的兴趣,实现产品推送。
在神经元过多时,为更好的计算距离为两个或以上的不同输入的影响,在该产品推送模型中设置影响系数,代表第i个神经元输入对第j个神经元输入的影响,影响系数计算公式如下:
公式(3)中,R(i,j)表示影响系数,ft表示神经元间的影响系数,xt表示神经元的特征;累次计算(i,j)间相邻两个神经元的用户特征数据输入差值乘以相邻神经元影响系数,最后除以各影响系数之和,将所有神经元与当前神经元相联系起来。在产品推送模型中引入影响系数,实现不同用户特征数据、不同神经元的相互关联,生成解释性更为有效的用户特征数据。
在一个实施例中,对用户特征数据进行降维处理,将稀疏的高维特征向量转化为稠密的低维特征向量。
具体的,采用EGES(Enhanced Graph Embedding with Side Information)方法。根据获取到的用户特征数据构建出一个包括用户信息、行为信息、产品信息、场景信息的用户特征,以及有向有权图;其中,每一个节点表示产品,有向边表示某一用户对产品的发生行为,若产生了多条相同有向边,权重增加,再带入到DeepWalk(深度游走)中学习,DeepWalk是一种随机序列训练方法,在得到item graph后,基于这个图结构进行随机采集图节点得到大量物品序列,然后将这些序列带入word2vec(word to vector)进行训练,实现embedding(嵌入),实现将稀疏的高维特征向量转化为稠密的低维特征向量。用户特征数据降维后得到:用户信息_embedding、行为信息_embedding、产品信息_embedding、场景信息_embedding,针对不同类别的降维信息加权求平均就得到最终降维后的数据,实现高维稀疏到低维稠密的转化。
在一个实施例中,产品推送模型基于RNN(Recurrent Neural Network,循环神经网络)模型训练得到。根据RNN构建的产品推送模型也可以实现记忆用户特征数据用的行为时序的效果,但是RNN模型只能控制单个神经元,无法对多个神经元进行组合。
在一个实施例中,产品推送方法还包括:召回用户特征数据,根据召回的用户特征数据训练产品推送模型,得到更新后的产品推送模型。
其中,召回是为了从海量的用户数据和产品数据中,快速找到用户标识和产品的对应关系,缩小计算范围,通过召回用户特征数据可以预圈定样本数据。在训练产品推送模型时,对用户特征数据进行召回,由于用户特征数据一般情况下会达到亿级,用户特征数据的维度在二百至五百之间,数据量庞大,将全部数据带入系统中会造成算力消耗以及时间成本增大,同时也会造成数据稀疏风险提升。尤其是在银行产品推送中,某些字段录入数据库时,会直接置空或赋值为零,造成用户特征矩阵过于稀疏,参数不易调节。
具体的,可采用多种方式实现用户特征数据的召回,如根据不同的用户特征或根据不同的策略召回数据,例如召回热门产品、活跃用户、新发产品等。将不同召回方式召回的数据混合在一起,用于产品推送模型的训练,得到更新后的产品推送模型。
在一个实施例中,若召回用户特征数据后,数据量还是过大,可以对召回后的数据进行聚类分片处理,将用户特征相似的用户归类。
在一个实施例中,产品推送方法还包括:基于用户历史浏览信息和已获得的产品信息对待推送产品信息进行调整,得到调整后的待推送产品信息;将待推送产品信息推送给用户标识所在的用户终端,包括:将调整后的待推送产品信息推送给用户标识所在的用户终端。
具体的,对待推送产品信息调整可以是对于用户已获取的产品信息,推送给与该用户属于同一特征群的用户,或者可以基于用户历史浏览信息,对于浏览超过限定次数的产品,在待推送产品信息中标记降低推送率,减少用户浏览疲劳,还可以根据用户对推送产品的点击浏览、购买撤销的行为进行线上标记,判断本次产品推送有效率。
参见图4,图4为一个实施例中产品推送系统总体架构图。如图4所示,产品推送系统包括数据层和模型层,数据层用于用户标识对应的社交关系数据、约束信息数据及基本信息数据,并根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;模型层用于根据用户特征数据确定待推送产品信息,然后将待推送产品信息推送给用户标识所在的用户终端。
图5所示的一个实施例中的数据流流程图,参见图4所示的架构和图5所示的数据流流程,具体描述一个实施例中的产品推送流程。
步骤501:获取用户标识对应的社交关系数据、约束信息数据及基本信息数据。
获取到的数据分为用户信息、行为信息、场景信息和产品信息。
通过大数据处理平台获取用户标识对应的社交关系数据和基本信息数据。社交关系数据通过纵向联邦学习进行训练采集,二次加工出高阶用户特征数据,系统对原始获取的社交数据并不可见。社交关系数据的获取利用自有联邦学习平台,训练结果直接存入大数据处理平台。
利用爬虫获取实时政策新闻等约束信息数据,并分析约束信息数据的影响因子,该影响因子用于表示在先的约束信息数据对目前的产品净值的影响。
产品信息通过候选产品集获取。
步骤502:根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据。
对获取的数据进行特征工程,也就是数据的预处理,使得经过预处理后的用户特征数据可以完整、简洁的表达所有有用信息。
对于获取到的数据类特征数据,可以通过归一化、离散化、非线性变化等方式进行数据处理,对于获取到的ID类特征,可以通过one-hot编码(一位有效编码),embedding降维等方式进行数据处理,还可以通过特征组合的方式组合用户特征数据。
预处理后的用户特征数据,减少用户特征数据中缺失值、异常值、无关值、噪声、重复值等异常数据对整体的影响,将预处理后的用户特征数据存入大数据平台或分布式数据库。
步骤503:对用户特征数据进行聚类得到用户特征聚类数据;召回用户特征数据,根据召回的用户特征数据训练产品推送模型,得到更新后的产品推送模型。
对用户特征数据进行分片,把用户特征数据相似的用户归类在一起,以采用K-means算法进行聚类为例,聚类得到的中心簇的用户特征数据为属于该类簇的样本平均值,计算每个用户属于每个类簇的概率并保留。
模型层在构建产品推送模型时,对于大量的用户特征数据,采取数据召回的方式训练产品推送模型。召回数据时可以根据广义的客群分类,结合产品信息,排除局部敏感哈希信息,对用户特征数据做分段式召回:例如先进行热门产品粗排,再进行活跃用户精排,以新发产品作补充。召回的数据输入深度学习模型训练产品推送模型。深度学习模型可使用LSTM模型,RNN模型等。一般情况下,产品推送模型训练操作为离线训练,用于统一各个用户特征数据的时间粒度,使其特征产生时间间隔尽可能小;且避免实时训练耗时较长导致的用户体验感较差,计算效率不高。
在数据召回时,数据量级仍过大还要进行聚类分片处理,聚类方式如上述用户特征数据的聚类,此处不再赘述。
步骤504:对用户特征数据进行降维处理,将稀疏的高维特征向量转化为稠密的低维特征向量。
根据获取到的用户特征数据构建出一个包括用户信息、行为信息、产品信息、场景信息的用户特征向量,该用户特征可以通过特征图表示。对于稀疏的高纬度特征向量,进行降维处理,先将用户特征数据中的用户信息、行为信息、产品信息和场景信息分别降维处理,得到降维后更新的用户信息_embedding、行为信息_embedding、产品信息_embedding、场景信息_embedding,针对不同类别的降维信息加权求平均就得到最终降维后的数据,实现高维稀疏到低维稠密的转化。
步骤505:根据用户特征数据确定待推送产品信息。
以LSTM为例构建的产品推送模型为例,输入用户特征聚类数据,得到产品的第一转化率,该第一转化率为某一类簇用户对于产品的获取概率,再与数据分片时,基于用户特征数据得到的用户属于某类簇的概率相乘,得到某一用户对于该产品的第二转化率,计算所有产品的第二转化率,得到待推送产品信息,待推送产品信息为产品的第二转化率高的产品数据。
在基于LSTM模型训练的产品推送模型中不同神经元配置影响系数,影响系数将当前神经元与当前神经元之前的所有神经元的关联,增强用户特征数据的表达效果。
步骤506:将待推送产品信息推送给用户标识所在的用户终端。
根据不用用户对产品的不同需求,将确认得到的待推送产品信息推送给用户标识所在的用户终端,终端可以对推送到的产品信息进行浏览、获取、推送等交互。
计算得到的待推送产品信息,可以根据不同客群的投资偏好、资金结构等信息,辅以产品热度,投资时间等信息进行重排,通过终端展现给用户。还可以根据用户对推送产品的点击浏览、购买撤销的行为进行线上标记,判断本次产品推送的有效率。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的产品推送方法的产品推送装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个产品推送装置实施例中的具体限定可以参见上文中对于产品推送方法的限定,在此不再赘述。
在一个实施例中,如图6所示,提供了一种产品推送装置,包括:采集模块601、预处理模块602、预测模块603和反馈模块604,其中:
采集模块601,用于获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
预处理模块602,用于根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
预测模块603,用于根据用户特征数据确定待推送产品信息;
反馈模块604,用于将待推送产品信息推送给用户标识所在的用户终端。
在一个实施例中,预处理模块602根据用户特征数据确定待推送产品信息,包括:对用户特征数据进行聚类得到用户特征聚类数据;预测模块603根据用户特征聚类数据和用户特征数据确定待推送产品信息。
在一个实施例中,预测模块603根据用户特征聚类数据和用户特征数据确定待推送产品信息,包括:针对每个产品,根据用户特征聚类数据计算产品的第一转化率,基于第一转化率和用户特征数据,确定产品的第二转化率;根据各个产品的第二转化率,确定用户标识对应的待推送产品信息。
在一个实施例中,预测模块603根据用户特征聚类数据计算产品的第一转化率,包括:将用户特征聚类数据输入产品推送模型进行处理,得到产品的第一转化率;其中,产品推送模型中不同神经元配置有影响系数,影响系数用于表征当前神经元与当前神经元之前的所有神经元的关联关系。
在一个实施例中,产品推送装置还包括:召回用户特征数据,根据召回的用户特征数据在预测模块603训练产品推送模型,得到更新后的产品推送模型。
在一个实施例中,产品推送装置还包括:反馈模块604基于用户历史浏览信息和已获得的产品信息对待推送产品信息进行调整,得到调整后的待推送产品信息;将待推送产品信息推送给用户标识所在的用户终端,包括:将调整后的待推送产品信息推送给用户标识所在的用户终端。
上述产品推送装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图7所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储与本申请实施例所述产品推送方法相关的一些数据,例如,前文所述的用户标识对应的社交关系数据、约束信息数据及基本信息数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种产品推送方法。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
根据用户特征数据确定待推送产品信息;
将待推送产品信息推送给用户标识所在的用户终端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对用户特征数据进行聚类得到用户特征聚类数据;根据用户特征聚类数据和用户特征数据确定待推送产品信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据用户特征聚类数据和用户特征数据确定待推送产品信息,包括:针对每个产品,根据用户特征聚类数据计算产品的第一转化率,基于第一转化率和用户特征数据,确定产品的第二转化率;根据各个产品的第二转化率,确定用户标识对应的待推送产品信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据用户特征聚类数据计算产品的第一转化率,包括:将用户特征聚类数据输入产品推送模型进行处理,得到产品的第一转化率;其中,产品推送模型中不同神经元配置有影响系数,影响系数用于表征当前神经元与当前神经元之前的所有神经元的关联关系。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
产品推送方法还包括:召回用户特征数据,根据召回的用户特征数据训练产品推送模型,得到更新后的产品推送模型。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
产品推送方法还包括:基于用户历史浏览信息和已获得的产品信息对待推送产品信息进行调整,得到调整后的待推送产品信息;将待推送产品信息推送给用户标识所在的用户终端,包括:将调整后的待推送产品信息推送给用户标识所在的用户终端。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
根据用户特征数据确定待推送产品信息;
将待推送产品信息推送给用户标识所在的用户终端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对用户特征数据进行聚类得到用户特征聚类数据;根据用户特征聚类数据和用户特征数据确定待推送产品信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据用户特征聚类数据和用户特征数据确定待推送产品信息,包括:针对每个产品,根据用户特征聚类数据计算产品的第一转化率,基于第一转化率和用户特征数据,确定产品的第二转化率;根据各个产品的第二转化率,确定用户标识对应的待推送产品信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据用户特征聚类数据计算产品的第一转化率,包括:将用户特征聚类数据输入产品推送模型进行处理,得到产品的第一转化率;其中,产品推送模型中不同神经元配置有影响系数,影响系数用于表征当前神经元与当前神经元之前的所有神经元的关联关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
产品推送方法还包括:召回用户特征数据,根据召回的用户特征数据训练产品推送模型,得到更新后的产品推送模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
产品推送方法还包括:基于用户历史浏览信息和已获得的产品信息对待推送产品信息进行调整,得到调整后的待推送产品信息;将待推送产品信息推送给用户标识所在的用户终端,包括:将调整后的待推送产品信息推送给用户标识所在的用户终端。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
根据用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
根据用户特征数据确定待推送产品信息;
将待推送产品信息推送给用户标识所在的用户终端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对用户特征数据进行聚类得到用户特征聚类数据;根据用户特征聚类数据和用户特征数据确定待推送产品信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据用户特征聚类数据和用户特征数据确定待推送产品信息,包括:针对每个产品,根据用户特征聚类数据计算产品的第一转化率,基于第一转化率和用户特征数据,确定产品的第二转化率;根据各个产品的第二转化率,确定用户标识对应的待推送产品信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据用户特征聚类数据计算产品的第一转化率,包括:将用户特征聚类数据输入产品推送模型进行处理,得到产品的第一转化率;其中,产品推送模型中不同神经元配置有影响系数,影响系数用于表征当前神经元与当前神经元之前的所有神经元的关联关系。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
产品推送方法还包括:召回用户特征数据,根据召回的用户特征数据训练产品推送模型,得到更新后的产品推送模型。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
产品推送方法还包括:基于用户历史浏览信息和已获得的产品信息对待推送产品信息进行调整,得到调整后的待推送产品信息;将待推送产品信息推送给用户标识所在的用户终端,包括:将调整后的待推送产品信息推送给用户标识所在的用户终端。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种产品推送方法,其特征在于,所述方法包括:
获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
根据所述用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
根据所述用户特征数据确定待推送产品信息;
将所述待推送产品信息推送给所述用户标识所在的用户终端。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户特征数据确定待推送产品信息,包括:
对所述用户特征数据进行聚类得到用户特征聚类数据;
根据所述用户特征聚类数据和所述用户特征数据确定待推送产品信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述用户特征聚类数据和所述用户特征数据确定待推送产品信息,包括:
针对每个产品,根据所述用户特征聚类数据计算所述产品的第一转化率,基于所述第一转化率和所述用户特征数据,确定所述产品的第二转化率;
根据各个产品的第二转化率,确定所述用户标识对应的待推送产品信息。
4.根据权利要求3所述的方法,其特征在于,所述根据所述用户特征聚类数据计算所述产品的第一转化率,包括:
将所述用户特征聚类数据输入产品推送模型进行处理,得到所述产品的第一转化率;其中,所述产品推送模型中不同神经元配置有影响系数,所述影响系数用于表征当前神经元与当前神经元之前的所有神经元的关联关系。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
召回所述用户特征数据,根据所述召回的用户特征数据训练所述产品推送模型,得到更新后的产品推送模型。
6.根据权利要求1至5中任一项所述的方法,其特征在于,所述方法还包括:
基于用户历史浏览信息和已获得的产品信息对所述待推送产品信息进行调整,得到调整后的待推送产品信息;
所述将所述待推送产品信息推送给所述用户标识所在的用户终端,包括:
将调整后的所述待推送产品信息推送给所述用户标识所在的用户终端。
7.一种产品推送装置,其特征在于,所述装置包括:
采集模块,用于获取用户标识对应的社交关系数据、约束信息数据及基本信息数据;
预处理模块,用于根据所述用户标识对应的社交关系数据、约束信息数据及基本信息数据确定用户特征数据;
预测模块,用于根据所述用户特征数据确定待推送产品信息;
反馈模块,用于将所述待推送产品信息推送给所述用户标识所在的用户终端。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210742381.5A CN115080868A (zh) | 2022-06-28 | 2022-06-28 | 产品推送方法、装置、计算机设备、存储介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210742381.5A CN115080868A (zh) | 2022-06-28 | 2022-06-28 | 产品推送方法、装置、计算机设备、存储介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115080868A true CN115080868A (zh) | 2022-09-20 |
Family
ID=83256418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210742381.5A Pending CN115080868A (zh) | 2022-06-28 | 2022-06-28 | 产品推送方法、装置、计算机设备、存储介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115080868A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116861101A (zh) * | 2023-06-30 | 2023-10-10 | 深圳市爱彼利科技有限公司 | 用于社交匹配的数据处理方法和装置 |
CN117648497A (zh) * | 2024-01-29 | 2024-03-05 | 贵州大学 | 一种基于大数据实现用户信息智能采集方法及系统 |
-
2022
- 2022-06-28 CN CN202210742381.5A patent/CN115080868A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116861101A (zh) * | 2023-06-30 | 2023-10-10 | 深圳市爱彼利科技有限公司 | 用于社交匹配的数据处理方法和装置 |
CN116861101B (zh) * | 2023-06-30 | 2024-03-29 | 深圳市爱彼利科技有限公司 | 用于社交匹配的数据处理方法和装置 |
CN117648497A (zh) * | 2024-01-29 | 2024-03-05 | 贵州大学 | 一种基于大数据实现用户信息智能采集方法及系统 |
CN117648497B (zh) * | 2024-01-29 | 2024-04-30 | 贵州大学 | 一种基于大数据实现用户信息智能采集方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112529168B (zh) | 一种基于gcn的属性多层网络表示学习方法 | |
Li et al. | Project success prediction in crowdfunding environments | |
Hu | A multivariate grey prediction model with grey relational analysis for bankruptcy prediction problems | |
CN109255586B (zh) | 一种面向电子政务办事的在线个性化推荐方法 | |
Ren et al. | Dynamic portfolio strategy using clustering approach | |
He et al. | A novel hybrid ensemble model based on tree-based method and deep learning method for default prediction | |
Hooman et al. | Statistical and data mining methods in credit scoring | |
CN112800053B (zh) | 数据模型的生成方法、调用方法、装置、设备及存储介质 | |
CN115080868A (zh) | 产品推送方法、装置、计算机设备、存储介质和程序产品 | |
CN112163963B (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
Guo et al. | An efficient and accurate recommendation strategy using degree classification criteria for item-based collaborative filtering | |
CN112528110A (zh) | 确定实体业务属性的方法及装置 | |
Abinaya et al. | Enhancing top-N recommendation using stacked autoencoder in context-aware recommender system | |
Behera et al. | Handling data sparsity via item metadata embedding into deep collaborative recommender system | |
CN112861003A (zh) | 一种基于云边协同的用户画像构建方法和系统 | |
Hasan et al. | A Novel Cryptocurrency Prediction Method Using Optimum CNN. | |
CN112685639A (zh) | 活动推荐方法、装置、计算机设备和存储介质 | |
Abakarim et al. | Towards an efficient real-time approach to loan credit approval using deep learning | |
Tripathi et al. | Exchange rate forecasting using ensemble modeling for better policy implications | |
Li et al. | A novel method for credit scoring based on feature transformation and ensemble model | |
CN115545886A (zh) | 逾期风险识别方法、装置、设备及存储介质 | |
CN114693409A (zh) | 产品匹配方法、装置、计算机设备、存储介质和程序产品 | |
CN111178986A (zh) | 用户-商品偏好的预测方法及系统 | |
Fareed et al. | A collaborative filtering recommendation framework utilizing social networks | |
Shan et al. | Incorporating user behavior flow for user risk assessment |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |