CN115049458A - 基于用户人群建模的商品推送方法及装置、介质、设备 - Google Patents

基于用户人群建模的商品推送方法及装置、介质、设备 Download PDF

Info

Publication number
CN115049458A
CN115049458A CN202210734064.9A CN202210734064A CN115049458A CN 115049458 A CN115049458 A CN 115049458A CN 202210734064 A CN202210734064 A CN 202210734064A CN 115049458 A CN115049458 A CN 115049458A
Authority
CN
China
Prior art keywords
commodity
conversion rate
target
commodities
user crowd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210734064.9A
Other languages
English (en)
Inventor
王永合
李子佳
李云超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An E Wallet Electronic Commerce Co Ltd
Original Assignee
Ping An E Wallet Electronic Commerce Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An E Wallet Electronic Commerce Co Ltd filed Critical Ping An E Wallet Electronic Commerce Co Ltd
Priority to CN202210734064.9A priority Critical patent/CN115049458A/zh
Publication of CN115049458A publication Critical patent/CN115049458A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0631Item recommendations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请公开了一种基于用户人群建模的商品推送方法及装置、介质、设备,涉及数据处理领域,主要目的在于改善现有由于估计不准确影响商品推荐的效果和商品销量以及估计每一商品在用户人群中的转化率,导致计算成本和时间成本增加的问题。包括:获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个目标商品在目标用户人群中的历史推送数量数据和历史转化率数据;基于商品转化率预测模型分别对目标商品进行转化率预测处理,得到在第二预设时间段内的多个目标商品在目标用户人群中的预测转化率数据;将在第二预设时间段内的多个目标商品在目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。

Description

基于用户人群建模的商品推送方法及装置、介质、设备
技术领域
本申请涉及数据处理技术领域,特别是涉及一种基于用户人群建模的商品推送方法及装置、介质、设备。
背景技术
为了提高商品的销量,商家通常会采取商品个性化推荐的方式来提高用户的购买欲,即针对不同的用户推荐不同的商品。但由于商品个性化推荐的人力与信息传递成本较高,因此,有相当一部分的商家选择爆款商品挖掘的方式来为用户推荐商品,即针对商品列表中的每一件商品,估计未来一段时间内,用户人群对该商品的购买倾向表示转化率,通过将高转化率的商品推送给用户人群以促进购买。
目前,爆款商品挖掘大致可分为两类,其一,针对每个商品,统计其在过去一段时间内的转化率,以作为未来一段时间内该商品转化率的估计值,然而,对于有周期性的消耗类商品在过去一段时间内转化率较高,并不能代表该商品在未来一段时间内同样有较高的转化率,由于未考虑商品的周期性,极易导致商品转化率估计值与实际严重不符,从而影响商品推荐的效果以及商品销量;其二,估计每个用户对每个商品的购买概率,再针对每个商品,对所有用户的购买概率取平均值,以作为每个商品的转化率估计值,然而,由于中间过程复杂,计算量庞大,需要耗费较大计算力以及时长,造成计算成本和时间成本的增加。
发明内容
有鉴于此,本申请提供一种基于用户人群建模的商品推送方法及装置、介质、设备,主要目的在于改善现有以商品过去转化率作为未来转化率估计值,由于估计不准确影响商品推荐的效果以及商品销量以及以所有用户的购买概率平均值作为单一商品的转化率估计值,导致计算成本和时间成本增加的问题。
依据本申请一个方面,提供了一种基于用户人群建模的商品推送方法,包括:
获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;
基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;
将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。
优选的,所述基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理之前,所述方法还包括:
基于注意力以及回归神经网络构建初始商品转化率预测模型;
获取第三预设时间段内的历史数据生成训练集;
基于所述训练集训练所述初始商品转化率预测模型,得到商品转化率预测模型;
若所述商品转化率预测模型的损失函数小于预设阈值,则完成模型训练,确定所述商品转化率预测模型为已完成模型训练的商品转化率预测模型。
优选的,所述获取第三预设时间段内的历史数据生成训练集,具体包括:
从所述第三预设时间段内选取多个锚点时刻;
获取各个所述锚点时刻的用户人群的信息、全量商品的信息以及所述锚点时刻前第四预设时间段内的所述全量商品在所述用户人群中的历史推送数量数据和历史转化率数据,生成多组训练集;
获取各个所述锚点时刻后第五预设时间段内的所述全量商品在所述用户人群中的真实转化率数据,以确定所述商品转化率预测模型的损失函数。
优选的,所述基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理之前,所述方法还包括:
基于全连接神经网络将所述目标用户人群的信息以及多个所述目标商品的信息中属于离散特征的信息转换为向量;
对所述目标用户人群的信息、多个所述目标商品的信息以及在所述第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据中属于连续数值特征的信息进行归一化处理。
优选的,所述预设规则为降序排列,所述方法还包括:
从经过排序处理的商品列表中选取预设数量的目标商品作为待推送商品,并对所述目标用户人群进行推送处理。
优选的,所述方法还包括:
获取所述待推送商品的信息,结合预设辅助策略,重新确定待推送商品。
优选的,所述预设辅助策略包括新鲜度辅助策略、品类多样性辅助策略。
依据本申请另一个方面,提供了一种基于用户人群建模的商品推送装置,包括:
获取模块,用于获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;
预测模块,用于基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;
推送模块,用于将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。
优选的,所述预测模块之前,所述装置还包括:
构建模块,用于基于注意力以及回归神经网络构建初始商品转化率预测模型;
生成模块,用于获取第三预设时间段内的历史数据生成训练集;
训练模块,用于基于所述训练集训练所述初始商品转化率预测模型,得到商品转化率预测模型;
确定模块,若所述商品转化率预测模型的损失函数小于预设阈值,则完成模型训练,确定所述商品转化率预测模型为已完成模型训练的商品转化率预测模型。
优选的,所述生成模块,具体包括:
选取单元,用于从所述第三预设时间段内选取多个锚点时刻;
生成单元,用于获取各个所述锚点时刻的用户人群的信息、全量商品的信息以及所述锚点时刻前第四预设时间段内的所述全量商品在所述用户人群中的历史推送数量数据和历史转化率数据,生成多组训练集;
获取单元,用于获取各个所述锚点时刻后第五预设时间段内的所述全量商品在所述用户人群中的真实转化率数据,以确定所述商品转化率预测模型的损失函数。
优选的,所述预测模块之前,所述装置还包括:
转换模块,用于基于全连接神经网络将所述目标用户人群的信息以及多个所述目标商品的信息中属于离散特征的信息转换为向量;
归一化模块,用于对所述目标用户人群的信息、多个所述目标商品的信息以及在所述第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据中属于连续数值特征的信息进行归一化处理。
优选的,所述预设规则为降序排列,所述装置还包括:
选取模块,用于从经过排序处理的商品列表中选取预设数量的目标商品作为待推送商品,并对所述目标用户人群进行推送处理。
优选的,所述装置还包括:
更新模块,用于获取所述待推送商品的信息,结合预设辅助策略,重新确定待推送商品。
优选的,所述预设辅助策略包括新鲜度辅助策略、品类多样性辅助策略。
根据本申请的又一方面,提供了一种存储介质,所述存储介质中存储有至少一条可执行指令,所述可执行指令使处理器执行如上述基于用户人群建模的商品推送方法对应的操作。
根据本申请的再一方面,提供了一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一条可执行指令,所述可执行指令使所述处理器执行上述基于用户人群建模的商品推送方法对应的操作。
借由上述技术方案,本申请实施例提供的技术方案至少具有下列优点:
本申请提供了一种基于用户人群建模的商品推送方法及装置、介质、设备,首先获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;其次基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;最后将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。与现有技术相比,本申请实施例通过基于用户人群整体建模得到的商品转化率预测模型对商品在用户人群中的转化率进行预测,并根据转化率进行商品推送,既考虑了转化率随时间变化的周期性,同时不需要对每一个用户的购买概率进行预测,避免了较大计算量,降低了对算力的需求,进而提高了模型训练与预测效率。
上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例提供的一种基于用户人群建模的商品推送方法流程图;
图2示出了本申请实施例提供的商品转化率预测模型结构示意图;
图3示出了本申请实施例提供的一种基于用户人群建模的商品推送装置组成框图;
图4示出了本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
基于此,在一个实施例中,如图1所示,提供了一种基于用户人群建模的商品推送方法,以该方法应用于服务器等计算机设备为例进行说明,其中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器,如智能医疗系统、数字医疗平台等。上述方法包括以下步骤:
101、获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个目标商品在目标用户人群中的历史推送数量数据和历史转化率数据。
本申请实施例中,目标用户人群的信息包括但不限于在预设时间段内目标用户人群购买最多的商品类型、平均购买次数、消费金额等;目标商品的信息包括但不限于商品类别、商品品牌、商品价格、品牌等级等;第一预设时间段用于表征当前时间点之前的一段历史时段,如前12周或前24周等。
示例性的,获取最近1周/2周/1个月/2个月/3个月目标用户人群购买最多的商品类别,共5个离散特征,以及最近1周/2周/1个月/2个月/3个月目标用户人群平均购买次数和消费金额,共10个连续数值特征,以作为目标用户人群的信息;获取商品类别、商品品牌,共2个离散特征,以及商品价格、品牌等级,共2个连续数值特征,以作为目标商品的信息,可以将上述获取到的目标用户人群的信息和目标商品的信息中的离散特征记作ai,i=1,2...7,连续数值特征xi,i=1,2...12;获取在第一预设时间段内的各个目标商品在目标用户人群中的历史推送数量数据,记作序列sl和历史转化率数据,记作序列cl,其中,设置时间窗口为1周,各个时间窗口相邻不重叠,l=1,2...L表示历史第l个时间窗口,L表示第一预设时间段,设置为12周,即共有24个连续数值特征,以作为历史12周内,目标商品在目标用户人群中的推送数量与转化率情况。
102、基于已完成模型训练的商品转化率预测模型分别对目标商品进行转化率预测处理,得到在第二预设时间段内的多个目标商品在目标用户人群中的预测转化率数据。
其中,商品转化率预测模型为基于用户人群整体建模得到的;第二预设时间段用于表征当前时间点之后的一段未来时间段,如未来的1周等。
本申请实施例中,通过基于用户人群整体进行建模得到的商品转化率预测模型对目标商品进行转化率预测处理,可以得到该目标商品在目标用户人群中的转化率,与现有以商品过去转化率作为未来转化率估计值的方案相比,将商品销量的周期性变化因素纳入了考虑范围,有效地提高了预测目标商品转化率的准确性,使商品推荐的效果得到保证,从而有助于提高商品的销量;另外,与现有以所有用户的购买概率平均值作为单一商品的转化率估计值的方案相比,本申请实施例无需对每一个用户的购买概率进行预测,避免了较大计算量,降低了对算力的需求,降低了计算成本和时间成本。
103、将在第二预设时间段内的多个目标商品在目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。
本申请实施例中,将上述步骤102中预测得到的在第二预设时间段内的各个目标商品在目标用户人群中的预测转化率数据按照预设规则进行排序处理,其中,预设规则可以是降序排列,也可以是升序排列。例如,采用降序排列,选取降序序列中前20件目标商品推送给目标用户人群;采用升序排列,将升序序列中前30件目标商品从本次推送中筛除掉,提高推送的效率。
与现有技术相比,本申请实施例通过基于用户人群整体建模得到的商品转化率预测模型对商品在用户人群中的转化率进行预测,并根据转化率进行商品推送,既考虑了转化率随时间变化的周期性,同时不需要对每一个用户的购买概率进行预测,避免了较大计算量,降低了对算力的需求,进而提高了模型训练与预测效率。
为了进一步说明以及限定,本申请实施例中,基于已完成模型训练的商品转化率预测模型分别对目标商品进行转化率预测处理之前,实施例方法还包括:基于注意力以及回归神经网络构建初始商品转化率预测模型;获取第三预设时间段内的历史数据生成训练集;基于训练集训练初始商品转化率预测模型,得到商品转化率预测模型;若商品转化率预测模型的损失函数小于预设阈值,则完成模型训练,确定商品转化率预测模型为已完成模型训练的商品转化率预测模型。
具体的,首先基于注意力以及回归神经网络构建初始商品转化率预测模型,结构如图2所示,包括:1)Embedding层,该层输入为离散特征,输出为该离散特征的表示向量。例如,输入为商品类别,所有商品共可分为K=100种类别,即该离散特征共有100种情况,表示向量设置元素个数为D=8,此时Embedding层将维护一个D行K列的参数矩阵,当输入商品类别为第k类时,该层将抽取矩阵第k列向量,作为输出向量,即第k类商品的表示向量。商品转化率预测模型输入中的每个离散特征,均对应一个Embedding层,将模型中所有Embedding层的参数集合记作{WE,i},i=1,2...7,分别对应上述示例中的ai,i=1,2...7共7个离散特征。2)b)Stacking层:该层输入为Embedding层输出的若干向量,输出为所有输出向量的拼接,即按照某固定顺序首尾相连,元素个数为输入向量元素个数的总和。3)c)MLP层:即多层感知器,以单隐层神经网络为例,其结构可表示为:
输入:记作x∈RD×1,即长度为D的列向量;
隐层:h=σh(Whx+bh),其中Wh∈RD'×D,bh∈RD'×1为模型参数,σh为relu激活函数,D'为隐藏神经元个数,可设置为256;
输出:o=σo(Wox+bo),其中Wo∈RL×D',bo∈RL×1为模型参数,σo为tanh激活函数。
该层整合了包括目标商品的信息、目标用户人群的信息在内的多种类型的特征,输出注意力向量,与历史转化率序列/历史推送数量序列具有相同元素个数,后续将以残差的形式,对历史转化率序列的权重系数进行修正。4)归一化层:用于对历史推送数量序列进行归一化,使其元素之和为1。该层输出原始权重向量,记作r∈RL×1,L=12,后续经注意力向量o修正后,用于对历史转化率序列cl进行加权平均。5)元素积层:其输入为原始权重向量r∈RL×1,以及注意力向量o∈RL×1.该层输出为两个向量的元素积,记作rres,其中每个元素rres,l=rl·ol,l=1,2...L,L=12。该层输出可作为原始权重向量的残差修正向量。6)加和层:该层输入为原始权重向量r∈RL×1及其残差修正向量rres∈RL×1,输出修正后的权重向量r'∈RL×1,每个元素为输入向量对应元素之和,即rl'=rl+rres,l。7)内积层:该层以修正后的权重向量r'∈RL×1为权重系数,以向量内积的形式,对历史转化率序列进行加权平均,输出未来1个时间窗口内,对应商品的转化率估计值y,即
Figure BDA0003714990950000111
该层使用历史转化率数据,并结合由注意力机制生成的权重参数,实现了对未来转化率的回归估计。
其次,获取第三预设时间段内的历史数据生成训练集,其中,第三预设时间段可以为过去1年,以过去1年的历史数据生成训练集。
最后,对初始商品转化率预测模型进行模型训练,直至模型收敛,说明训练完成。具体的,使用均方差函数作为优化目标
Figure BDA0003714990950000112
其中,y为模型输出结果,ygt为转化率真实值。例如,以随机梯度下降算法作为优化算法
Figure BDA0003714990950000113
其中,α为预设学习率,w表示所有模型参数,包括所有Embedding层参数集合{WE,i},i=1,2...7,以及与MLP层参数集合{Wh,hh,Wo,ho}。当训练至损失函数L保持低于预设阈值,并持续若干步时,模型训练完成,得到已完成模型训练的商品转化率预测模型,可用于商品转化率预测。
为了进一步说明以及限定,本申请实施例中,获取第三预设时间段内的历史数据生成训练集,具体包括:从第三预设时间段内选取多个锚点时刻;获取各个锚点时刻的用户人群的信息、全量商品的信息以及锚点时刻前第四预设时间段内的全量商品在用户人群中的历史推送数量数据和历史转化率数据,生成多组训练集;获取各个所述锚点时刻后第五预设时间段内的全量商品在用户人群中的真实转化率数据,以确定商品转化率预测模型的损失函数。
示例性的,以过去1年(即第三预设时间段)的历史数据作为训练集,约52周,按照时间先后的顺序分别称为1~52周。继续上述的示例,由于输入模型的历史信息的时间跨度为L=12个时间窗口,即12周(第四预设时间段),因此,分别选取第13~52周的第一天作为锚点时刻,生成40组历史数据,作为训练集。每组历史数据中,包含全量商品的信息、锚点时刻的用户人群的信息、以及锚点时刻前L=12周的所有商品的推送与转化率历史信息,共同作为模型输入;也包含锚点时刻后1周内(第五预设时间段)所有商品的转化率数据,作为模型输出真实转化率,用于确定商品转化率预测模型的损失函数。例如,第1组历史数据,锚点时刻为第13周第1天,获取全量商品的信息、锚点时刻的用户人群的信息、1~12周的商品推送与转化率信息作为模型输入,获取第13周商品转化率作为模型输出真实转化率;第2组历史数据,锚点时刻为第14周第1天,获取全量商品的信息、锚点时刻的用户人群的信息、2~13周的商品推送与转化率信息作为模型输入,获取第14周商品转化率作为模型输出真实转化率;以此类推……第40组历史数据,锚点时刻为第52周第1天,获取全量商品的信息、锚点时刻的用户人群的信息、40~51周的商品推送与转化率信息作为模型输入,获取第52周商品转化率作为模型输出真实转化率。
优选的,本申请实施例中,基于已完成模型训练的商品转化率预测模型分别对目标商品进行转化率预测处理之前,实施例方法还包括:基于全连接神经网络将目标用户人群的信息以及多个目标商品的信息中属于离散特征的信息转换为向量;对目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个目标商品在目标用户人群中的历史推送数量数据和历史转化率数据中属于连续数值特征的信息进行归一化处理。
具体的,针对模型输入中的所有离散特征,将该特征可能出现的选项按照固定顺序,分别编号为1、2、……,使之可以输入到模型的Embedding层参与运算。例如,商品类别特征,所有商品共可分为M=100种类别,即该离散特征共有M=100种情况,按照某固定顺序(例如拼音)进行排序后,记作类别1、类别2、类别3、…、类别M(=100),分别编号为1、2、3、…、M(=100).后续将输入到模型的Embedding层参与运算。针对输入中的每个连续数值特征xi,将其进行归一化处理,即根据训练集数据分布,统计该特征的均值μi与方差σi,并将特征转化为
Figure BDA0003714990950000131
使其均值为0,方差为1。
可选的,本申请实施例中,预设规则为降序排列,实施例方法还包括:从经过排序处理的商品列表中选取预设数量的目标商品作为待推送商品,并对目标用户人群进行推送处理。例如,采用降序排列,选取降序序列中前20件目标商品推送给目标用户人群。
可选的,为了提高商品推送的效率,本申请实施例中,实施例方法还包括:获取待推送商品的信息,结合预设辅助策略,重新确定待推送商品。其中,预设辅助策略包括新鲜度辅助策略包、品类多样性辅助策略。
示例性的,通过获取待推送商品的信息得知a类商品转化率相对较低,但考虑到该商品很久没有被推荐过,使得历史数据较少,对该商品转化率的估计可能不准,因此可以适当提高该商品的排名,使之拥有也被投放的机会,即为新鲜度辅助策略;或者当次爆款商品挖掘需要找出转化率最高的5个商品,但实际估计结果中,排名最靠前的5个商品都是一个品类,此时可以适当降低其中第3~5个商品的排名,使排名>5的商品拥有被投放机会,最终选出的5个商品,其种类尽量丰富,避免种类单一,即为品类多样性辅助策略。
本申请提供了一种基于用户人群建模的商品推送方法,首先获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;其次基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;最后将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。与现有技术相比,本申请实施例通过基于用户人群整体建模得到的商品转化率预测模型对商品在用户人群中的转化率进行预测,并根据转化率进行商品推送,既考虑了转化率随时间变化的周期性,同时不需要对每一个用户的购买概率进行预测,避免了较大计算量,降低了对算力的需求,进而提高了模型训练与预测效率。
进一步的,作为对上述图1所示方法的实现,本申请实施例提供了一种基于用户人群建模的商品推送装置,如图3所示,该装置包括:
获取模块21,预测模块22,推送模块23。
获取模块21,用于获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;
预测模块22,用于基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;
推送模块23,用于将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。
在具体的应用场景中,所述预测模块之前,所述装置还包括:
构建模块,用于基于注意力以及回归神经网络构建初始商品转化率预测模型;
生成模块,用于获取第三预设时间段内的历史数据生成训练集;
训练模块,用于基于所述训练集训练所述初始商品转化率预测模型,得到商品转化率预测模型;
确定模块,若所述商品转化率预测模型的损失函数小于预设阈值,则完成模型训练,确定所述商品转化率预测模型为已完成模型训练的商品转化率预测模型。
在具体的应用场景中,所述生成模块,具体包括:
选取单元,用于从所述第三预设时间段内选取多个锚点时刻;
生成单元,用于获取各个所述锚点时刻的用户人群的信息、全量商品的信息以及所述锚点时刻前第四预设时间段内的所述全量商品在所述用户人群中的历史推送数量数据和历史转化率数据,生成多组训练集;
获取单元,用于获取各个所述锚点时刻后第五预设时间段内的所述全量商品在所述用户人群中的真实转化率数据,以确定所述商品转化率预测模型的损失函数。
在具体的应用场景中,所述预测模块之前,所述装置还包括:
转换模块,用于基于全连接神经网络将所述目标用户人群的信息以及多个所述目标商品的信息中属于离散特征的信息转换为向量;
归一化模块,用于对所述目标用户人群的信息、多个所述目标商品的信息以及在所述第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据中属于连续数值特征的信息进行归一化处理。
在具体的应用场景中,所述预设规则为降序排列,所述装置还包括:
选取模块,用于从经过排序处理的商品列表中选取预设数量的目标商品作为待推送商品,并对所述目标用户人群进行推送处理。
在具体的应用场景中,所述装置还包括:
更新模块,用于获取所述待推送商品的信息,结合预设辅助策略,重新确定待推送商品。
在具体的应用场景中,所述预设辅助策略包括新鲜度辅助策略、品类多样性辅助策略。
本申请提供了一种基于用户人群建模的商品推送装置,首先获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;其次基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;最后将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。与现有技术相比,本申请实施例通过基于用户人群整体建模得到的商品转化率预测模型对商品在用户人群中的转化率进行预测,并根据转化率进行商品推送,既考虑了转化率随时间变化的周期性,同时不需要对每一个用户的购买概率进行预测,避免了较大计算量,降低了对算力的需求,进而提高了模型训练与预测效率。
根据本申请一个实施例提供了一种存储介质,所述存储介质存储有至少一条可执行指令,该计算机可执行指令可执行上述任意方法实施例中的基于用户人群建模的商品推送方法。
基于这样的理解,本申请的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施场景所述的方法。
图4示出了根据本申请一个实施例提供的一种计算机设备的结构示意图,本申请具体实施例并不对计算机设备的具体实现做限定。
如图4所示,该计算机设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。
通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器302,用于执行程序310,具体可以执行上述基于用户人群建模的商品推送方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。计算机设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行以下操作:
获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;
基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;
将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。
存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述基于用户人群建模的商品推送的实体设备硬件和软件资源的程序,支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信,以及与信息处理实体设备中其它硬件和软件之间通信。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
可能以许多方式来实现本申请的方法和系统。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本申请的方法和系统。用于所述方法的步骤的上述顺序仅是为了进行说明,本申请的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本申请实施为记录在记录介质中的程序,这些程序包括用于实现根据本申请的方法的机器可读指令。因而,本申请还覆盖存储用于执行根据本申请的方法的程序的记录介质。
显然,本领域的技术人员应该明白,上述的本申请的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包括在本申请的保护范围之内。

Claims (10)

1.一种基于用户人群建模的商品推送方法,其特征在于,包括:
获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;
基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;
将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。
2.根据权利要求1所述的方法,其特征在于,所述基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理之前,所述方法还包括:
基于注意力以及回归神经网络构建初始商品转化率预测模型;
获取第三预设时间段内的历史数据生成训练集;
基于所述训练集训练所述初始商品转化率预测模型,得到商品转化率预测模型;
若所述商品转化率预测模型的损失函数小于预设阈值,则完成模型训练,确定所述商品转化率预测模型为已完成模型训练的商品转化率预测模型。
3.根据权利要求2所述的方法,其特征在于,所述获取第三预设时间段内的历史数据生成训练集,具体包括:
从所述第三预设时间段内选取多个锚点时刻;
获取各个所述锚点时刻的用户人群的信息、全量商品的信息以及所述锚点时刻前第四预设时间段内的所述全量商品在所述用户人群中的历史推送数量数据和历史转化率数据,生成多组训练集;
获取各个所述锚点时刻后第五预设时间段内的所述全量商品在所述用户人群中的真实转化率数据,以确定所述商品转化率预测模型的损失函数。
4.根据权利要求1所述的方法,其特征在于,所述基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理之前,所述方法还包括:
基于全连接神经网络将所述目标用户人群的信息以及多个所述目标商品的信息中属于离散特征的信息转换为向量;
对所述目标用户人群的信息、多个所述目标商品的信息以及在所述第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据中属于连续数值特征的信息进行归一化处理。
5.根据权利要求1所述的方法,其特征在于,所述预设规则为降序排列,所述方法还包括:
从经过排序处理的商品列表中选取预设数量的目标商品作为待推送商品,并对所述目标用户人群进行推送处理。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
获取所述待推送商品的信息,结合预设辅助策略,重新确定待推送商品。
7.根据权利要求6所述的方法,其特征在于,所述预设辅助策略包括新鲜度辅助策略、品类多样性辅助策略。
8.一种基于用户人群建模的商品推送装置,其特征在于,包括:
获取模块,用于获取目标用户人群的信息、多个目标商品的信息以及在第一预设时间段内的各个所述目标商品在所述目标用户人群中的历史推送数量数据和历史转化率数据;
预测模块,用于基于已完成模型训练的商品转化率预测模型分别对所述目标商品进行转化率预测处理,得到在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据,所述商品转化率预测模型为基于用户人群整体建模得到的;
推送模块,用于将在第二预设时间段内的多个所述目标商品在所述目标用户人群中的预测转化率数据按照预设规则进行排序处理,以作为商品推送的依据。
9.一种存储介质,所述存储介质中存储有至少一条可执行指令,其特征在于,所述可执行指令使处理器执行如权利要求1-7中任一项所述的基于用户人群建模的商品推送方法对应的操作。
10.一种计算机设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一条可执行指令,其特征在于,所述可执行指令使所述处理器执行如权利要求1-7中任一项所述的基于用户人群建模的商品推送方法对应的操作。
CN202210734064.9A 2022-06-27 2022-06-27 基于用户人群建模的商品推送方法及装置、介质、设备 Pending CN115049458A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210734064.9A CN115049458A (zh) 2022-06-27 2022-06-27 基于用户人群建模的商品推送方法及装置、介质、设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210734064.9A CN115049458A (zh) 2022-06-27 2022-06-27 基于用户人群建模的商品推送方法及装置、介质、设备

Publications (1)

Publication Number Publication Date
CN115049458A true CN115049458A (zh) 2022-09-13

Family

ID=83163729

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210734064.9A Pending CN115049458A (zh) 2022-06-27 2022-06-27 基于用户人群建模的商品推送方法及装置、介质、设备

Country Status (1)

Country Link
CN (1) CN115049458A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116109338A (zh) * 2022-12-12 2023-05-12 广东南粤分享汇控股有限公司 一种基于人工智能的电商用户分析方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116109338A (zh) * 2022-12-12 2023-05-12 广东南粤分享汇控股有限公司 一种基于人工智能的电商用户分析方法及系统
CN116109338B (zh) * 2022-12-12 2023-11-24 广东南粤分享汇控股有限公司 一种基于人工智能的电商用户分析方法及系统

Similar Documents

Publication Publication Date Title
US11586880B2 (en) System and method for multi-horizon time series forecasting with dynamic temporal context learning
CN110503531B (zh) 时序感知的动态社交场景推荐方法
US20180293497A1 (en) Systems and Methods for Learning and Predicting Transactions
US11494644B2 (en) System, method, and computer program for recommending items using a direct neural network structure
JP4678943B2 (ja) 新製品の初期投入量予測方法、新製品の初期投入量予測装置及び記録媒体
CN111160968A (zh) Sku级别商品销量预测方法及装置
CN108537327B (zh) 一种基于时间序列bp神经网络预测方法及装置
KR20220111179A (ko) 매장 수요 예측 모델을 결정하는 기법
US20220414470A1 (en) Multi-Task Attention Based Recurrent Neural Networks for Efficient Representation Learning
JP2023024950A (ja) 共有されたニューラルアイテム表現をコールドスタート推薦に用いる改良型のレコメンダシステム及び方法
CN111178986B (zh) 用户-商品偏好的预测方法及系统
CN110781401A (zh) 一种基于协同自回归流实现的Top-n项目推荐方法
CN111340236A (zh) 一种基于债券估值数据与集成机器学习的债券违约预测方法
CN113656691A (zh) 数据预测方法、装置及存储介质
CN115049458A (zh) 基于用户人群建模的商品推送方法及装置、介质、设备
CN111222993A (zh) 基金推荐方法及装置
CN113240359B (zh) 一种应对外界重大变动的需求预测方法
CN115393098A (zh) 理财产品信息推荐方法及装置
CN113822371A (zh) 训练分组模型,以及对时序数据进行分组的方法和装置
CN111178987B (zh) 训练用户行为预测模型的方法和装置
CN113869596A (zh) 任务预测处理方法、设备、产品和介质
CN114092188A (zh) 一种轻量级b2b电商平台的推荐系统算法
CN113570204A (zh) 用户行为预测方法、系统和计算机设备
Mastelini et al. Online multi-target regression trees with stacked leaf models
Chashmi et al. Predicting customer turnover using recursive neural networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination