CN115204985A - 购物行为预测方法、装置、设备及存储介质 - Google Patents

购物行为预测方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN115204985A
CN115204985A CN202210894235.4A CN202210894235A CN115204985A CN 115204985 A CN115204985 A CN 115204985A CN 202210894235 A CN202210894235 A CN 202210894235A CN 115204985 A CN115204985 A CN 115204985A
Authority
CN
China
Prior art keywords
commodity
user
behavior
sample
comprehensive
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210894235.4A
Other languages
English (en)
Inventor
雷媛媛
王琛
李乐飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN202210894235.4A priority Critical patent/CN115204985A/zh
Publication of CN115204985A publication Critical patent/CN115204985A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/06Buying, selling or leasing transactions
    • G06Q30/0601Electronic shopping [e-shopping]
    • G06Q30/0623Item investigation

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computational Linguistics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及计算机技术领域,尤其涉及一种购物行为预测方法、装置、设备及存储介质。方法包括:获取待预测用户在预设时段内的历史购物数据;基于历史购物数据,获取用户特征、商品特征和综合特征;基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,隐马尔可夫模型基于操作行为和预设的隐状态预先设置;将初始隐状态概率和待预测用户的初始操作行为输入至隐马尔科夫模型,获得隐马尔科夫模型输出的至少一种操作行为的预测概率。本发明用以解决现有技术中购物行为预测过程逻辑简单,预测结果准确性较低的缺陷,实现更准确地购物行为预测。

Description

购物行为预测方法、装置、设备及存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种购物行为预测方法、装置、设备及存储介质。
背景技术
目前,线上购物为人们的生活提供了极大的便利。用户通过线上购物平台,进行浏览、收藏、加购物车和下单等一系列行为来完成购物。对用户的各种购物行为进行研究,预测用户后续的行为分布,进而实施货物库存管理、线上商品推荐等过程。现有技术中,对购物行为进行预测时,主要关注的是供应链中的商品需求,具体的,对购物行为的时间序列进行简单的分析和挖掘,例如,通过某一个商品历史上在单位时间内被购买数量的变化,来预测未来一段时间内该商品的购买数量。但是,这种方式计算逻辑简单,忽略了商品本身特点以及用户自身特点对该用户购买行为的影响,降低购物行为预测结果的准确性。
发明内容
本发明提供一种购物行为预测方法、装置、设备及存储介质,用以解决现有技术中购物行为预测过程逻辑简单,预测结果准确性较低的缺陷,实现更准确地购物行为预测。
本发明提供一种购物行为预测方法,包括:获取待预测用户在预设时段内的历史购物数据,其中,所述历史购物数据包括所述待预测用户购买任意一个商品的操作行为;基于所述历史购物数据,获取用户特征、商品特征和综合特征,其中,所述用户特征为表征所述待预测用户购买各个所述商品的特征,所述商品特征为表征每一个所述商品被所述待预测用户购买的特征,所述综合特征为表征所述待预测用户购买目标商品的特征;基于所述用户特征、所述商品特征和所述综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,所述隐马尔可夫模型基于所述操作行为和预设的隐状态预先设置;将初始隐状态概率和待预测用户的初始操作行为输入至所述隐马尔科夫模型,获得所述隐马尔科夫模型输出的至少一种所述操作行为的预测概率。
根据本发明提供的一种购物行为预测方法,所述特征矩阵参数包括状态行为矩阵参数和状态转移矩阵参数;所述基于所述用户特征、所述商品特征和所述综合特征,确定隐马尔可夫模型的特征矩阵参数,包括:将所述用户特征和所述综合特征输入预设的第一神经网络模型,获取所述第一神经网络模型输出的所述状态行为矩阵参数,其中,所述状态行为矩阵参数用于将所述用户特征关联至所述隐马尔可夫模型的概率计算过程;将所述商品特征和所述综合特征输入预设的第二神经网络模型,获取所述第二神经网络模型输出的所述状态转移矩阵参数,其中,所述状态转移矩阵参数用于将所述商品特征关联至所述隐马尔可夫模型的概率计算过程。
根据本发明提供的一种购物行为预测方法,所述操作行为包括行为方式和行为时间;所述基于所述历史购物数据,获取用户特征、商品特征和综合特征,包括:根据所述行为时间,获取所述待预测用户购买每一个所述商品分别对应的时序行为序列,其中,所述时序行为序列通过所述行为方式按照时间顺序排列获得;基于所述历史购物数据,获取每一个所述商品分别对应的商品类别序列,其中,所述商品类别序列包括所述商品对应的商品类别;基于所述时序行为序列和所述商品类别序列,获取所述用户特征、所述商品特征和所述综合特征。
根据本发明提供的一种购物行为预测方法,所述基于所述时序行为序列和所述商品类别序列,获取所述用户特征、所述商品特征和所述综合特征,包括:基于所述时序行为序列和所述商品类别序列,获取至少一个用户特征值,其中,所述用户特征值为所述待预测用户购买各个所述商品时发生的所述行为方式的统计值,或者,所述待预测用户购买各个所述商品类别对应的所述商品时发生的所述行为方式的统计值;基于所述用户特征值,获取所述用户特征;基于所述时序行为序列,获取至少一个商品特征值,其中,所述商品特征值为每一个所述商品被所述待预测用户购买时发生的所述行为方式的统计值;基于所述商品特征值,获取所述商品特征;基于所述时序行为序列,获取至少一个综合特征值,其中,所述综合特征值为所述待预测用户购买所述目标商品时发生的所述行为方式的统计值;基于所述综合特征值,获取所述综合特征。
根据本发明提供的一种购物行为预测方法,所述基于所述时序行为序列和所述商品类别序列,获取至少一个用户特征值,包括:对所述行为方式进行组合定义,确定购买行为和想要购买行为,其中,所述购买行为对应至少一种所述行为方式,所述想要购买行为对应至少一种所述行为方式;将所述购买行为和所述想要购买行为,更新至所述时序行为序列;基于所述商品类别序列和更新后的所述时序行为序列,获取至少一个所述用户特征值;所述基于所述时序行为序列,获取至少一个商品特征值,包括:基于更新后的所述时序行为序列,获取至少一个所述商品特征值;所述基于所述时序行为序列,获取至少一个综合特征值,包括:基于更新后的所述时序行为序列,获取至少一个所述综合特征值。
根据本发明提供的一种购物行为预测方法,所述基于所述用户特征值,获取所述用户特征,包括:通过每一种所述行为方式分别对应的预设权重,对所述用户特征值进行加权处理;基于加权前和加权后分别对应的所述用户特征值,获取所述用户特征;所述基于所述商品特征值,获取所述商品特征,包括:通过每一种所述行为方式分别对应的预设权重,对所述商品特征值进行加权处理;基于加权前和加权后分别对应的所述商品特征值,获取所述商品特征;所述基于所述综合特征值,获取所述综合特征,包括:通过每一种所述行为方式分别对应的预设权重,对所述综合特征值进行加权处理;基于加权前和加权后分别对应的所述综合特征值,获取所述综合特征。
根据本发明提供的一种购物行为预测方法,所述基于所述用户特征值,获取所述用户特征,包括:通过所述用户特征值对应的最大用户特征值和最小用户特征值,对每一个所述用户特征值进行标准化;基于标准化后的所述用户特征值,获取所述用户特征;所述基于所述商品特征值,获取所述商品特征,包括:通过所述商品特征值对应的最大商品特征值和最小商品特征值,对每一个所述商品特征值进行标准化;基于标准化后的所述商品特征值,获取所述商品特征;所述基于所述综合特征值,获取所述综合特征,包括:通过所述综合特征值对应的最大综合特征值和最小综合特征值,对每一个所述综合特征值进行标准化;基于标准化后的所述综合特征值,获取所述综合特征。
根据本发明提供的一种购物行为预测方法,所述基于所述历史购物数据,获取每一个所述商品分别对应的商品类别序列,包括:基于所述历史购物数据,确定所述待预测用户购买过的每一个所述商品;对于每一个所述商品:判断是否存在所述商品对应的所述商品类别,若是,对所述商品类别进行独热编码,获得所述商品类别对应的类别标识;若否,将所述商品作为新的所述商品类别,对新的所述商品类别进行独热编码,获得所述商品类别对应的类别标识;基于所述类别标识,获取每一个所述商品分别对应的所述商品类别序列。
根据本发明提供的一种购物行为预测方法,所述第一神经网络模型和所述第二神经网络模型,通过样本数据进行训练得到;其中,所述样本数据包括至少一个样本用户在样本时段内的样本购物数据,所述样本购物数据包括各个所述样本用户购买任意一个样本商品的操作行为;训练过程如下:基于所述样本购物数据,获取样本用户特征、样本商品特征和样本综合特征,其中,所述样本用户特征为表征所述样本用户购买各个所述样本商品的特征,所述样本商品特征为表征每一个所述样本商品被所述样本用户购买的特征,所述样本综合特征为表征所述样本用户购买样本目标商品的特征;将所述样本用户特征和所述样本综合特征输入预设的第一原始神经网络模型,获取所述第一原始神经网络模型输出的样本状态行为矩阵参数;将所述样本商品特征和所述样本综合特征输入预设的第二原始神经网络模型,获取所述第二原始神经网络模型输出的样本状态转移矩阵参数,其中,样本状态行为矩阵参数和样本状态转移矩阵参数为所述隐马尔可夫模型的样本特征矩阵参数;获取所述隐马尔可夫模型输出的至少一种所述操作行为的样本预测概率;基于所述样本预测概率,获取训练损失函数;根据所述训练损失函数,分别调整所述第一原始神经网络模型和所述第二原始神经网络模型的内部参数;重复基于所述样本购物数据,获取样本用户特征、样本商品特征和样本综合特征的步骤,直至所述训练损失函数达到最小值,获得所述第一神经网络模型和所述第二神经网络模型。
本发明还提供一种购物行为预测装置,包括:数据获取模块,用于获取待预测用户在预设时段内的历史购物数据,其中,所述历史购物数据包括所述待预测用户购买任意一个商品的操作行为;特征获取模块,用于基于所述历史购物数据,获取用户特征、商品特征和综合特征,其中,所述用户特征为表征所述待预测用户购买各个所述商品的特征,所述商品特征为表征每一个所述商品被所述待预测用户购买的特征,所述综合特征为表征所述待预测用户购买目标商品的特征;参数获取模块,用于基于所述用户特征、所述商品特征和所述综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,所述隐马尔可夫模型基于所述操作行为和预设的隐状态预先设置;概率计算模块,用于将初始隐状态概率和待预测用户的初始操作行为输入至所述隐马尔科夫模型,获得所述隐马尔科夫模型输出的至少一种所述操作行为的预测概率。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述购物行为预测方法。
本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述购物行为预测方法。
本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述购物行为预测方法。
本发明提供的购物行为预测方法、装置、设备及存储介质,通过待预测用户在预设时段内的历史购物数据,获得用户特征、商品特征和综合特征。基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数。最后由隐马尔可夫模型来得出至少一种操作行为的预测概率。也就是说,将用户特征、商品特征和综合特征关联至隐马尔可夫模型,相当于将用户特征、商品特征和综合特征关联至预测概率的计算过程,将影响购物行为的多种特征因素添加至预测过程中,提高购物行为预测的准确性。同时,由于用户购买商品的操作行为具备序列性、交互性和无记忆性的特征,而采用隐马尔可夫模型能够更好的对操作行为进行处理,使操作行为的预测概率更加贴近用户未来的真实操作,进一步提升购物行为预测的准确性。
附图说明
为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明提供的购物行为预测方法的流程示意图;
图2是本发明提供的嵌入神经网络的隐马尔可夫模型工作原理示意图;
图3是本发明提供的购物行为预测的训练测试示意图;
图4是本发明提供的购物行为预测装置的结构示意图;
图5是本发明提供的电子设备的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
目前,在认知决策行为研究领域中,潜在隐状态的挖掘是揭示行为内在机制的重要过程。在深度学习或问题理解的场景中,隐状态的挖掘可用来验证认知不均衡理论,例如,当可观测到的状态有“无聊”、“沉浸”、“迷惑”、“疲倦”、“高兴”、“惊讶”等,而隐状态可被建模为“均衡”、“不均衡”、“困顿”、“分心”这几个状态。在面对隐状态挖掘的问题时,若序列性的、多次交互的行为,具有一定无记忆性的特征时,可将其建模为隐马尔科夫模型;对于具有记忆性的行为序列,可用循环神经网络、长短期记忆网络等进行建模。
在一些选择性场景中,不同的选择会导致不同的结果反馈。这样的连续决策—反馈过程可通过脑电数据建模为一个隐马尔可夫模型,以此揭示持续决策—反馈过程中的生物学机制。当人的行为可被一个行为树表示时,也可将其建模为隐马尔科夫模型。隐马尔可夫模型是关于时序的概率模型,描述由一个隐藏的马尔可夫链随机生成不可观测的状态随机序列,再由各个状态生成一个可观测的随机序列的过程。
在线上购物场景中,用户在购物网站上针对某一商品的行为包括浏览、收藏、加购物车、下单等,且可能是在连续时间完成的,也可能是在经过一定间隔时间完成的。通过对数据的简单分析,我们发现用户的行为序列包括上万种不同的形式和长度,将用户行为进行降维,表征为“感兴趣”、“意愿想要购买”、“不再关注”三种不同的心理状态(即隐状态),即可建模为隐马尔科夫模型。
现有技术中,电商领域中的线上购物行为研究,多为大数据的时间序列挖掘与分析,关注整体供应链中的商品需求,较少从用户的行为特征入手,以个体用户的时间行为序列为目标,通过用户当前行为预测用户后续的行为分布,及是否购买的概率。
本发明实现基于隐状态挖掘的线上购物行为序列预测。以用户的历史购物数据(消费数据)为研究目标,分析用户过往消费行为,提取用户的消费动机,识别用户的消费特点,理解用户在商品浏览、购买等决策行为中的意识动机。此外,我们还结合神经网络,挖掘用户各种行为特征(即用户特征)和商品特征,将其作为神经网络模型的输入,输出隐马尔科夫模型的特征矩阵参数。该发明可以用于预测不同行为特征用户的行为序列,进行需求预测,且具有一定的可解释性。在商品促销、广告投放等销售环节中,可有针对性地对用户群体进行营销推广,提升购买率。
本发明提供的购物行为预测方法,通过预先设定的软件算法对数据的处理来实现,该软件算法能够在任意一种具备数据处理功能的设备中实现,例如,服务器、笔记本电脑或智能移动设备等。下面结合图1-图3描述本发明的购物行为预测方法。
一个实施例中,如图1所示,购物行为预测方法,实现的流程步骤如下:
步骤101,获取待预测用户在预设时段内的历史购物数据,其中,历史购物数据包括待预测用户购买任意一个商品的操作行为。
本实施例中,待预测用户指的是需要进行购物行为预测的用户。当对待预测用户进行购物行为预测时,需要采用待预测用户历史上预设时段内的历史购物数据,来确定隐马尔可夫模型的特征矩阵参数。优选的,预设时段可以为距离当前时刻预设时长的一段时间,例如,距离当前时刻24小时内的历史购物数据。这样,可以更好的获得待预测用户近期的特征信息。
步骤102,基于历史购物数据,获取用户特征、商品特征和综合特征,其中,用户特征为表征待预测用户购买各个商品的特征,商品特征为表征每一个商品被待预测用户购买的特征,综合特征为表征待预测用户购买目标商品的特征。
本实施例中,对历史购物数据进行数据预处理,从历史购物数据中提取用户特征、商品特征和综合特征。用户特征为以用户角度提取的特征,用于表征待预测用户购买各个商品的特征,例如,待预测用户浏览各个商品的次数统计值。商品特征为以商品角度提取的特征,用于表征某一个商品被待预测用户购买的特征,例如,商品A被用户操作的次数统计值。而综合特征以用户和商品一对一的角度进行提取,表征待预测用户购买目标商品的特征,其中,目标商品指的是待预测用户购买过的任意一个商品,例如,待预测用户对于商品A的浏览行为,占待预测用户所有操作行为的比例。
一个实施例中,待预测用户的历史购物数据,包括待预测用户历史上购买任意一个商品的操作行为,该操作行为包括行为方式和行为时间。在基于历史购物数据,获取用户特征、商品特征和综合特征时,具体实现过程如下:根据行为时间,获取待预测用户购买每一个商品分别对应的时序行为序列,其中,时序行为序列通过行为方式按照时间顺序排列获得;基于历史购物数据,获取每一个商品分别对应的商品类别序列,其中,商品类别序列包括商品对应的商品类别;基于时序行为序列和商品类别序列,获取用户特征、商品特征和综合特征。
本实施例中,用户的行为方式指的是可见行为,例如,“浏览”、“收藏”、“加购物车”或“下单”等。通过行为时间,可以对行为方式进行统计,以获得待预测用户对每一个商品操作行为形成的时间行为序列。
具体的,给定待预测用户在预设时段内的历史购物数据,该历史购物数据包括待预测用户在某一个线上购物网站的操作行为(包括行为方式和行为时间)。由于待预测用户对商品的行为方式在时间维度上是随机的,例如,待预测用户可能一分钟内多次浏览商品A,也可能间隔半个月再次浏览商品A。则为了避免数据冗余,将第一预设时长(例如,一分钟)内的多个同种行为方式记为一个。此外,为了避免数据过于分撒,将时间间隔超过第二预设时长(例如,24小时)的行为方式之间增加“间隔操作”。再次,用户在线上购物时,可能会对一个商品进行下单,完成一次购物行为,则当有“下单”行为出现时,完成一次时序行为序列的统计,该次时序行为序列的统计结束。若用户再次对该商品进行操作,则重新统计又一个时序行为序列。同时,用户也可能并不会对一个商品最终下单,此时,若时间间隔过长,超过第三预设时长(例如,3天),则增加“停止”行为作为操作结束的标志,由此可形成某一用户对某一商品的时间行为序列。其中,第三预设时长大于第二预设时长。
一个具体的实施例中,用户的行为方式包括“浏览”、“收藏”、“加购物车”、“下单”、“间隔”和“停止”6种。为了数据处理便利,且更适于计算机处理过程,可以对行为方式预先通过数字和/或字母等符号进行编码。例如,对6种行为方式通过数字进行编码,如下:
将“浏览”行为记为“0”;
将“收藏”行为记为“1”;
将“加购物车”行为记为“2”;
将“下单”行为记为“3”;
将“间隔”行为记为“4”;
将“停止”行为记为“5”。
则通过待预测用户的历史购物数据进行处理后,得到的各个时序行为序列则对应不同的数组。例如,待预测用户对商品A一次购物行为中的行为方式,以行为时间进行排序为“浏览、加购物车、浏览、间隔、浏览、下单”,则该次购物行为记为[020403]。又例如,待预测用户对商品B一次购物行为中的行为方式,以行为时间进行排序为“浏览、浏览、加购物车、收藏、浏览、浏览、停止”,则该次购物行为记为[0021005]。
本实施例中,基于历史购物数据,对被待预测购买过的每一个商品进行处理,获得该商品对应的商品类别序列。重要的,需要获取该商品所属的商品类别。具体的,对于某一个商品,可以通过历史购物数据获得该商品的名称,从而得到该商品的商品标识,其中,商品标识可以通过唯一身份编码(identity document,id)来表示;在预先存储的商品类别集合中,查询该商品标识对应的商品类别和类别标识,进而得到该商品对应的商品类别序列,记为[商品id、商品名称、类别id、类别名称]。
一个实施例中,基于历史购物数据,获取每一个商品分别对应的商品类别序列时,具体过程如下:基于历史购物数据,确定待预测用户购买过的每一个商品;对于每一个商品:判断是否存在商品对应的商品类别,若是,对商品类别进行独热编码,获得商品类别对应的类别标识;若否,将商品作为新的商品类别,对新的商品类别进行独热编码,获得商品类别对应的类别标识;基于类别标识,获取每一个商品分别对应的商品类别序列。
本实施例中,可以采用特定的编码方式对各个商品类别的类别标识进行编码,便于计算机处理。优选的,对类别标识采用独热(one-hot)编码,例如,美妆护肤、食品饮料、电子数码三种商品类别可分别编码为100、010、001。通过编码,有利于类别管理和计算机处理过程,提升购物行为预测过程的效率。
本实施例中,对于无法查询到商品类别的商品,进将商品作为新的商品类别,进行了缺失编码。
一个实施例中,时序行为序列和商品类别序列中,可能因为某种原因导致特征值缺失。例如当确认一个商品的商品名称和商品标识后,若无法在商品类别集合中查询到对应的商品类别,则表明该商品的商品类别序列中特征值缺失;又例如,历史购物数据中有错误数据,导致时序行为序列中特征值缺失。此时,可以通过删除、插值预测、数值填充或缺失编码中的任意一种方式对缺失值进行处理。具体的,当商品的商品类别查询失败时,则直接删除整个商品类别序列;或者,当时序行为序列中特征值缺失时,基于其他时序行为序列,进行插值预测,进而对缺失的特征值进行填充;或者,当时序行为序列中特征值缺失时,通过与特征值缺失的时序行为序列在时间上相邻的两个时序行为序列,计算均值、中位数或众数,然后采用均值、中位数或众数对缺失值进行填充;当商品的商品类别查询失败时,将该商品的商品名称直接作为该商品的商品类别进行编码,作为新的商品类别,同时将新的商品类别更新至商品类别集合中。
一个实施例中,获得时序行为序列和商品类别序列之后,在基于时序行为序列和商品类别序列,获取用户特征、商品特征和综合特征时,具体实现过程如下:基于时序行为序列和商品类别序列,获取至少一个用户特征值,其中,用户特征值为待预测用户购买各个商品时发生的行为方式的统计值,或者,待预测用户购买各个商品类别对应的商品时发生的行为方式的统计值;基于用户特征值,获取用户特征;基于时序行为序列,获取至少一个商品特征值,其中,商品特征值为每一个商品被待预测用户购买时发生的行为方式的统计值;基于商品特征值,获取商品特征;基于时序行为序列,获取至少一个综合特征值,其中,综合特征值为待预测用户购买目标商品时发生的行为方式的统计值;基于综合特征值,获取综合特征。
本实施例中,从历史购物数据中提取的时序行为序列和商品类别序列,作为特征挖掘的初始数据,进一步提取用户特征、商品特征和综合特征。具体的,用户特征值、商品特征值和综合特征值,分别是对行为方式的统计值,例如,对待预测户的购买行为总次数统计,计算购买行为次数在总行为数中的比例,计算购买行为在想要行为中的比例(不购买行为可以记为-1,不购买行为指的是间隔或停止),计算待预测用户对某类商品购买或想要购买的重复数。由此,可以由用户特征值获得用户特征,由商品特征值得到商品特征,由综合特征值获得综合特征。
本实施例中,为了进一步便于计算机处理过程,可以以数组的方式分别表征用户特征、商品特征和综合特征。
一个实施例中,对购物行为预测的过程,主要想要分析用户是否想用购买各个商品,因此,对上述可见的行为方式进一步的组合定义,获得购买行为和想要购买行为。具体的,基于时序行为序列和商品类别序列,获取至少一个用户特征值,具体过程如下:对行为方式进行组合定义,确定购买行为和想要购买行为,其中,购买行为对应至少一种行为方式,想要购买行为对应至少一种行为方式;将购买行为和想要购买行为,更新至时序行为序列;基于商品类别序列和更新后的时序行为序列,获取至少一个用户特征值。基于时序行为序列,获取至少一个商品特征值,具体过程如下:基于更新后的时序行为序列,获取至少一个商品特征值;基于时序行为序列,获取至少一个综合特征值,包括:基于更新后的时序行为序列,获取至少一个综合特征值。
进一步的,对于可见的6种行为方式:浏览、收藏、加购物车、下单、间隔和停止,进一步进行组合定义,具体的,将“下单”行为定义为“购买”行为,将“收藏”、“加购物车”与“下单”行为之和定义为“想要购买”行为。然后基于购买行为和想要购买行为,统计用户特征值和商品特征值。
一个具体的实施例中,用户特征包括行为活跃度、购买行为比例、用户在每一个行为方式下的商品类别统计、用户类别重复度、用户商品重复度等特征值。更具体的,用户特征的特征值包括以下至少一个:
对于用户行为活跃度,包括:
待预测用户的某一个行为方式(浏览、收藏、加购物车、下单、间断、停止)总次数统计值;
待预测用户的某一个行为方式出现次数,在所有行为方式出现次数的总统计值中的比例;
待预测用户所有行为方式出现次数的总统计值;
待预测用户所有行为方式出现次数的加权后的总统计值。
对于购买行为比例,包括:
待预测用户购买行为出现次数,与所有行为方式出现次数的总统计值的比例,其中,不购买记为-1,不购买行为包括停止和间隔;
待预测用户购买行为出现次数,与所有想要购买行为出现次数的比例(如不购买记为-1)。
对于用户行为的商品类别统计,包括:
待预测用户有过行为(包含所有行为)的商品类别数目统计;
待预测用户有过购买行为的商品类别数目统计;
待预测用户有过想要购买行为的商品类别数目统计。
对于用户类别重复度,包括:
待预测用户有过行为(包含所有行为)的商品类别数,与总类别数目的比例;
待预测用户有过购买行为的商品类别数,与总类别数目的比例;
待预测用户有过想要购买行为的商品类别数,与总类别数目的比例。
对于用户商品重复度,包括:
待预测用户有过行为(包含所有行为)的商品数,与总商品数目的比例;
待预测用户有过购买行为的商品数与总商品数目的比例;
待预测用户有过想要购买行为的商品数与总商品数目的比例;
进一步的,商品特征包括商品活跃度、商品受欢迎度、商品类别等特征值。更具体的,商品特征的特征值包括以下至少一个:
对于商品活跃度,包括:
某一商品被某一个行为方式操作过的(浏览、收藏、加购物车、下单、间断、停止)总数统计;
某一商品的被某一个行为方式操作过的次数,与所有行为方式出现次数的总统计值的比例;
某一商品所有行为方式出现次数的总统计值;
某一商品所有行为方式出现次数的加权后的总统计值。
对于商品受欢迎度,包括:
针对某一商品有过行为的待预测用户数目统计值;
针对某一商品有过购买行为的待预测用户数目统计值;
针对某一商品有过想要购买行为的待预测用户数目统计;
针对某一商品的购买行为出现的次数,与所有行为方式出现次数的总统计值的比例(如不购买记为-1);
针对某一商品的购买行为出现的次数,与所有想要购买行为出现次数的比例(如不购买记为-1)。
进一步的,综合特征包括用户针对某一商品的行为比例。更具体的,综合特征的特征值包括以下至少一种:
待预测用户针对某一商品的行为方式次数,与该待预测用户在所有商品行为方式总次数中的比例;
待预测用户针对某一商品的购买行为次数,与该待预测用户在所有商品购买行为次数的比例;
待预测用户针对某一商品的想要购买行为次数,与该待预测用户在所有商品想要购买行为数的比例。
一个实施例中,为了表征各个行为方式不同的重要性,通过预设权重对特征值进行加权处理。具体的,基于用户特征值,获取用户特征,实现过程如下:通过每一种行为方式分别对应的预设权重,对用户特征值进行加权处理;基于加权前和加权后分别对应的用户特征值,获取用户特征。基于商品特征值,获取商品特征,实现过程如下:通过每一种行为方式分别对应的预设权重,对商品特征值进行加权处理;基于加权前和加权后分别对应的商品特征值,获取商品特征。基于综合特征值,获取综合特征,实现过程如下:通过每一种行为方式分别对应的预设权重,对综合特征值进行加权处理;基于加权前和加权后分别对应的综合特征值,获取综合特征。
本实施例中,预设权重可以根据实际情况、经验或实验数据设定具体的权重值。例如,对“浏览”行为赋予权重1、对“收藏”行为赋予权重2、对“加购物车”行为赋予权重4、对“下单”行为赋予权重8,间隔和停止行为无实际意义,不进行赋权。
一个实施例中,为了避免特征值过于分散,对用户特征、商品特征和综合特征分别进行标准化处理。具体的,基于用户特征值,获取用户特征,实现过程如下:通过用户特征值对应的最大用户特征值和最小用户特征值,对每一个用户特征值进行标准化;基于标准化后的用户特征值,获取用户特征。基于商品特征值,获取商品特征,实现过程如下:通过商品特征值对应的最大商品特征值和最小商品特征值,对每一个商品特征值进行标准化;基于标准化后的商品特征值,获取商品特征。基于综合特征值,获取综合特征,实现过程如下:通过综合特征值对应的最大综合特征值和最小综合特征值,对每一个综合特征值进行标准化;基于标准化后的综合特征值,获取综合特征。
本实施例中,对于任意一个用户特征,该用户特征包含的数值最大的特征值为最大用户特征值,数值最小的特征值为最小用户特征值。对该用户特征中的每一个用户特征值,通过以下公式进行标准化处理:
Figure BDA0003768747950000171
对于任意一个商品特征,该商品特征包含的数值最大的特征值为最大商品特征值,数值最小的特征值为最小商品特征值。对该商品特征中的每一个商品特征值,通过以下公式进行标准化处理:
Figure BDA0003768747950000172
对于任意一个综合特征,该综合特征包含的数值最大的特征值为最大综合特征值,数值最小的特征值为最小综合特征值。对该综合特征中的每一个综合特征值,通过以下公式进行标准化处理:
Figure BDA0003768747950000173
步骤103,基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,隐马尔可夫模型基于操作行为和预设的隐状态预先设置。
本实施例中,预先通过操作行为和隐状态设置隐马尔可夫模型。进一步的,当操作行为包括“浏览”、“收藏”、“加购物车”、“下单”、“间隔”和“停止”6中可见的行为方式时,设定隐状态为3种,即“感兴趣”、“意愿想要购买”和“不再关注”。由此,将时序行为序列作为无记忆性的序列,构建基础的隐马尔可夫模型。
当需要对待预测用户进行购物行为预测时,需要通过待预测用户的历史购物数据,获得待预测用户对应的用户特征、商品特征和综合特征,然后基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,进而获得已知参数的隐马尔可夫模型,从未完成预测过程。
一个实施例中,隐马尔可夫模型的特征矩阵参数包括状态行为矩阵参数和状态转移矩阵参数。而为了进一步提升预测准确性,将神经网络嵌入到特征矩阵参数的计算过程中就。具体的,基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,实现过程如下:将用户特征和综合特征输入预设的第一神经网络模型,获取第一神经网络模型输出的状态行为矩阵参数,其中,状态行为矩阵参数用于将用户特征关联至隐马尔可夫模型的概率计算过程;将商品特征和综合特征输入预设的第二神经网络模型,获取第二神经网络模型输出的状态转移矩阵参数,其中,状态转移矩阵参数用于将商品特征关联至隐马尔可夫模型的概率计算过程。
本实施例中,如图2所示,第一神经网络模型用于处理用户特征和综合特征。将用户特征和综合特征输入第一神经网络模型,经过第一神经网络模型,输出隐马尔科夫模型的状态行为矩阵参数。将从隐状态到可见行为的概率计算过程,建构成与用户特征相关。
第二神经网络模型用于处理商品特征和综合特征。将商品特征和综合特征输入第二神经网络模型,经过第二神经网络模型,输出隐马尔科夫模型的状态转移矩阵参数。将从隐状态到可见行为的概率计算过程,建构成与商品特征相关。
当通过第一神经网络模型获得状态行为矩阵参数,以及通过第二神经网络模型获得状态转移矩阵参数后,将初始隐状态概率输入参数已知的隐马尔可夫模型,由隐马尔科夫模型输出至少一种操作行为的预测概率。进一步的,隐马尔科夫模型输出至少一种操作行为的预测概率,也可以通过预测时序行为序列的形式进行表示。
进一步的,未确定参数的状态行为矩阵的维度为3×6,包括7个未知参数,分别为x1,x2,x3,x4,x5,x6和x7,未知参数每行相加为1。
未确定参数的状态行为矩阵如下:
Figure BDA0003768747950000191
其中,x1,x2,x3,x4,x5,x6和x7为状态行为矩阵中的未知参数。
通过第一神经网络模型,即可确定x1,x2,x3,x4,x5,x6和x7的具体值,即获得了状态行为矩阵参数。
进一步的,未确定参数的状态转移矩阵的维度为3×3,包括6个未知参数,分别为y1,y2,y3,y4,y5和y6,未知参数每行相加为1。
未确定参数的状态转移矩阵如下:
Figure BDA0003768747950000192
其中,y1,y2,y3,y4,y5和y6为状态转移矩阵中的未知参数。
通过第一神经网络模型,即可确定y1,y2,y3,y4,y5和y6的具体值,即获得了状态转移矩阵参数。
一个实施例中,第一神经网络模型和第二神经网络模型,通过样本数据进行训练得到;其中,样本数据包括至少一个样本用户在样本时段内的样本购物数据,样本购物数据包括各个样本用户购买任意一个样本商品的操作行为。
训练过程如下:
基于样本购物数据,获取样本用户特征、样本商品特征和样本综合特征,其中,样本用户特征为表征样本用户购买各个样本商品的特征,样本商品特征为表征每一个样本商品被样本用户购买的特征,样本综合特征为表征样本用户购买样本目标商品的特征;
将样本用户特征和样本综合特征输入预设的第一原始神经网络模型,获取第一原始神经网络模型输出的样本状态行为矩阵参数;
将样本商品特征和样本综合特征输入预设的第二原始神经网络模型,获取第二原始神经网络模型输出的样本状态转移矩阵参数,其中,样本状态行为矩阵参数和样本状态转移矩阵参数为隐马尔可夫模型的样本特征矩阵参数;
获取隐马尔可夫模型输出的至少一种操作行为的样本预测概率;
基于样本预测概率,获取训练损失函数;
根据训练损失函数,分别调整第一原始神经网络模型和第二原始神经网络模型的内部参数;
重复基于样本购物数据,获取样本用户特征、样本商品特征和样本综合特征的步骤,直至训练损失函数达到最小值,获得第一神经网络模型和第二神经网络模型。
本实施例中,第一原始神经网络模型和第二原始神经网络模型的原始架构,可以根据实际情况和需要进行设定,例如,第一原始神经网络模型包括两层神经网络,同时,第二原始神经网络模型也包括两层神经网络。
本实施例中,在进行神经网络训练时,训练损失函数通过样本预测概率获得,具体的,训练损失函数为样本预测概率的对数的相反数的平均值,公式如下:
Figure BDA0003768747950000201
其中,pi表示本次训练得到的第i个样本预测概率,i为正整数,N表示本次训练得到的样本预测概率的总数,ln表示对数计算。
一个实施例中,为了方式第一神经网络模型和第二神经网络模型在训练过程中过拟合,利用L2正则化,在神经网络模型中的目标函数中加入L2正则化惩罚项,当正则化惩罚项达到预设的程度阈值时,第一神经网络模型和/或第二神经网络模型中部分特征系数会变成0,可防止过拟合。
一个实施例中,在训练过程中,与模型使用过程类似,基于样本购物数据,获取样本用户特征、样本商品特征和样本综合特征时,需要从原本购物数据中,提取每一个样本用户分别对应的样本时序行为序列,然后对样本时序行为序列中的行为方式进行统计,获得样本用户特征、样本商品特征和样本综合特征。进一步的,样本时序行为序列包括上述实施例提到的浏览、收藏、加购物车、下单、间隔和停止,以及组合定义的购买行为和想要购买行为。
进一步的,样本用户特征包括样本行为活跃度、样本购买行为比例、样本用户在每一个行为方式下的样本商品类别统计、样本用户类别重复度、样本用户商品重复度等特征值。更具体的,样本用户特征的特征值包括以下至少一个:
对于样本用户行为活跃度,包括:
某一样本用户的某一个行为方式(浏览、收藏、加购物车、下单、间断、停止)总次数统计值;
某一样本用户的某一个行为方式出现次数,在所有行为方式出现次数的总统计值中的比例;
某一样本用户所有行为方式出现次数的总统计值;
某一样本用户所有行为方式出现次数的加权后的总统计值。
对于样本购买行为比例,包括:
某一样本用户购买行为出现次数,与所有行为方式出现次数的总统计值的比例,其中,不购买记为-1,不购买行为包括停止和间隔;
某一样本用户购买行为出现次数,与所有想要购买行为出现次数的比例(如不购买记为-1)。
对于样本用户行为的商品类别统计,包括:
某一样本用户有过行为(包含所有行为)的商品类别数目统计;
某一样本用户有过购买行为的商品类别数目统计;
某一样本用户有过想要购买行为的商品类别数目统计。
对于样本用户类别重复度,包括:
某一样本用户有过行为(包含所有行为)的商品类别数,与总类别数目的比例;
某一样本用户有过购买行为的商品类别数,与总类别数目的比例;
某一样本用户有过想要购买行为的商品类别数,与总类别数目的比例。
对于样本用户商品重复度,包括:
某一样本用户有过行为(包含所有行为)的商品数,与总商品数目的比例;
某一样本用户有过购买行为的商品数与总商品数目的比例;
某一样本用户有过想要购买行为的商品数与总商品数目的比例;
进一步的,样本商品特征包括样本商品活跃度、样本商品受欢迎度、样本商品类别等特征值。更具体的,样本商品特征的特征值包括以下至少一个:
对于样本商品活跃度,包括:
某一样本商品被某一个行为方式操作过的(浏览、收藏、加购物车、下单、间断、停止)总数统计;
某一样本商品的被某一个行为方式操作过的次数,与所有行为方式出现次数的总统计值的比例;
某一样本商品所有行为方式出现次数的总统计值;
某一样本商品所有行为方式出现次数的加权后的总统计值。
对于样本商品受欢迎度,包括:
针对某一样本商品有过行为的样本用户数目统计值;
针对某一样本商品有过购买行为的样本用户数目统计值;
针对某一样本商品有过想要购买行为的样本用户数目统计;
针对某一样本商品的购买行为出现的次数,与所有行为方式出现次数的总统计值的比例(如不购买记为-1);
针对某一样本商品的购买行为出现的次数,与所有想要购买行为出现次数的比例(如不购买记为-1)。
进一步的,综合特征包括样本用户针对某一样本商品的行为比例。更具体的,样本综合特征的特征值包括以下至少一种:
某一样本用户针对某一样本商品的行为方式次数,与该样本用户在所有样本商品行为方式总次数中的比例;
某一样本用户针对某一样本商品的购买行为次数,与该样本用户在所有商品购买行为次数的比例;
某一样本用户针对某一样本商品的想要购买行为次数,与该样本用户在所有商品想要购买行为数的比例。
本实施例中,如图3所示购物行为预测的训练测试示意图,其中,浏览行为记为p,收藏行为记为f,加购物车行为记为c,下单行为记为o,间隔行为记为i,停止行为记为x,感兴趣状态记为X,不再关注状态记为Y,意愿想要购买状态记为Z,未知记为问号。一个例子中,在训练阶段,当某一样本用户对某一样本商品连续出现浏览、加购物车和下单行为时,表示该样本用户购买了此样本商品;当某一样本用户对某一商品连续出现浏览、间隔、浏览、停止行为时,表示该样本用户不购买此样本商品。其中,浏览行为对应感兴趣状态,加购物车和下单行为对应意愿想要购买状态,间隔行为和停止行为对应不再关注状态。在测试阶段,当待预测用户对某一商品出现浏览、加购物车、收藏行为之后,可以通过训练好的隐马尔可夫模型确定每一个行为方式对应的隐状态,以及计算接下来的操作行为的预测概率。
在训练集中,通过样本用户对样本商品的样本时序行为序列,对嵌入隐马尔科夫模型的第一神经网络模型和第二神经网络模型进行学习,得到样本状态转移矩阵参数和样本状态行为矩阵参数,即可获得用户特征、商品特征和隐马尔科夫模型参数之间隐含的关系。在测试集中,当已知待预测用户的用户特征、商品特征和综合特征,以及用户对商品的初始操作时,可根据待预测用户对应的状态转移矩阵参数和状态行为矩阵参数,通过确定参数后隐马尔可夫模型预测待预测用户后续行为序列分布,即获得待预测用户对应的至少一个操作行为的预测概率。
步骤104,将初始隐状态概率和待预测用户的初始操作行为输入至隐马尔科夫模型,获得隐马尔科夫模型输出的至少一种操作行为的预测概率。
本实施例中,考虑到用户在线上购物行为的开始都是基于一个“感兴趣”的状态,设定初始隐状态概率为[100],即“感兴趣”、“意愿想要购买”、“不再关注”分别对应的概率为1、0、0。上述第一神经网络模型和第二神经网络模型的输出联合起来,即可获得一个已知特征矩阵参数的隐马尔科夫模型,可计算出在该特征矩阵参数下特定行为序列的概率。
进一步的,获得待预测用户至少一个操作行为的预测概率,即计算出在该特征矩阵参数下特定行为序列的概率后,可以对得到的预测概率进行进一步处理,得到以下至少一种信息:待预测用户是否会购买任意一个商品;对待预测用户对某一个商品的预测进行聚合,预测该商品在一段时间内的购买率;以及待预测用户在一个周期内的行为特征。
本发明提供的购物行为预测方法、装置、设备及存储介质,通过待预测用户在预设时段内的历史购物数据,获得用户特征、商品特征和综合特征。基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数。最后由隐马尔可夫模型来得出至少一种操作行为的预测概率。也就是说,将用户特征、商品特征和综合特征关联至隐马尔可夫模型,相当于将用户特征、商品特征和综合特征关联至预测概率的计算过程,将影响购物行为的多种特征因素添加至预测过程中,提高购物行为预测的准确性。同时,由于用户购买商品的操作行为具备序列性、交互性和无记忆性的特征,而采用隐马尔可夫模型能够更好的对操作行为进行处理,使操作行为的预测概率更加贴近用户未来的真实操作,进一步提升购物行为预测的准确性。
进一步的,以待预测用户在线上购物过程中的操作行为(包括浏览、收藏、加购物车、下单、间隔、停止)作为输入,通过数据预处理、缺失值处理、特征构造(用户特征、商品特征、综合特征)、嵌入式选择等特征工程和统计方法,将用户在线上购物过程中的行为特征及不同商品所呈现的特征提取出来,以此作为影响待预测用户不同时序行为的因素。构建一个基于隐状态挖掘的行为决策模型,可将用户成千上万种行为序列降维成只包含少数隐状态转化的行为模态。使用神经网络,将所提取的用户特征、商品特征和综合特征作为输入,包含隐状态的行为决策模型的特征矩阵参数作为输出,通过最大化行为序列概率(即最小化训练损失函数)的方式来训练第一神经网络模型和第二神经网络模型,以此在已知待预测用户的用户特征、商品特征和综合特征的前提下,预测用户针对某个商品的各种行为的概率分布及其是否会进行购买行为,并通过聚合可预测出某种商品在一定时间内被购买的概率,以及待预测用户在一个周期时间内的消费行为。
下面对本发明提供的购物行为预测装置进行描述,下文描述的购物行为预测装置与上文描述的购物行为预测方法可相互对应参照。如图4所示,购物行为预测装置包括:
数据获取模块401,用于获取待预测用户在预设时段内的历史购物数据,其中,历史购物数据包括待预测用户购买任意一个商品的操作行为;
特征获取模块402,用于基于历史购物数据,获取用户特征、商品特征和综合特征,其中,用户特征为表征待预测用户购买各个商品的特征,商品特征为表征每一个商品被待预测用户购买的特征,综合特征为表征待预测用户购买目标商品的特征;
参数获取模块403,用于基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,隐马尔可夫模型基于操作行为和预设的隐状态预先设置;
概率计算模块404,用于将初始隐状态概率和待预测用户的初始操作行为输入至隐马尔科夫模型,获得隐马尔科夫模型输出的至少一种操作行为的预测概率。
图5示例了一种电子设备的实体结构示意图,如图5所示,该电子设备可以包括:处理器(processor)501、通信接口(Communications Interface)502、存储器(memory)503和通信总线504,其中,处理器501,通信接口502,存储器503通过通信总线504完成相互间的通信。处理器501可以调用存储器503中的逻辑指令,以执行购物行为预测方法,该方法包括:获取待预测用户在预设时段内的历史购物数据,其中,历史购物数据包括待预测用户购买任意一个商品的操作行为;基于历史购物数据,获取用户特征、商品特征和综合特征,其中,用户特征为表征待预测用户购买各个商品的特征,商品特征为表征每一个商品被待预测用户购买的特征,综合特征为表征待预测用户购买目标商品的特征;基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,隐马尔可夫模型基于操作行为和预设的隐状态预先设置;将初始隐状态概率和待预测用户的初始操作行为输入至隐马尔科夫模型,获得隐马尔科夫模型输出的至少一种操作行为的预测概率。
此外,上述的存储器503中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述各方法所提供的购物行为预测方法,该方法包括:获取待预测用户在预设时段内的历史购物数据,其中,历史购物数据包括待预测用户购买任意一个商品的操作行为;基于历史购物数据,获取用户特征、商品特征和综合特征,其中,用户特征为表征待预测用户购买各个商品的特征,商品特征为表征每一个商品被待预测用户购买的特征,综合特征为表征待预测用户购买目标商品的特征;基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,隐马尔可夫模型基于操作行为和预设的隐状态预先设置;将初始隐状态概率和待预测用户的初始操作行为输入至隐马尔科夫模型,获得隐马尔科夫模型输出的至少一种操作行为的预测概率。
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各方法提供的购物行为预测方法,该方法包括:获取待预测用户在预设时段内的历史购物数据,其中,历史购物数据包括待预测用户购买任意一个商品的操作行为;基于历史购物数据,获取用户特征、商品特征和综合特征,其中,用户特征为表征待预测用户购买各个商品的特征,商品特征为表征每一个商品被待预测用户购买的特征,综合特征为表征待预测用户购买目标商品的特征;基于用户特征、商品特征和综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,隐马尔可夫模型基于操作行为和预设的隐状态预先设置;将初始隐状态概率和待预测用户的初始操作行为输入至隐马尔科夫模型,获得隐马尔科夫模型输出的至少一种操作行为的预测概率。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (12)

1.一种购物行为预测方法,其特征在于,包括:
获取待预测用户在预设时段内的历史购物数据,其中,所述历史购物数据包括所述待预测用户购买任意一个商品的操作行为;
基于所述历史购物数据,获取用户特征、商品特征和综合特征,其中,所述用户特征为表征所述待预测用户购买各个所述商品的特征,所述商品特征为表征每一个所述商品被所述待预测用户购买的特征,所述综合特征为表征所述待预测用户购买目标商品的特征;
基于所述用户特征、所述商品特征和所述综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,所述隐马尔可夫模型基于所述操作行为和预设的隐状态预先设置;
将初始隐状态概率和待预测用户的初始操作行为输入至所述隐马尔科夫模型,获得所述隐马尔科夫模型输出的至少一种所述操作行为的预测概率。
2.根据权利要求1所述的购物行为预测方法,其特征在于,所述特征矩阵参数包括状态行为矩阵参数和状态转移矩阵参数;
所述基于所述用户特征、所述商品特征和所述综合特征,确定隐马尔可夫模型的特征矩阵参数,包括:
将所述用户特征和所述综合特征输入预设的第一神经网络模型,获取所述第一神经网络模型输出的所述状态行为矩阵参数,其中,所述状态行为矩阵参数用于将所述用户特征关联至所述隐马尔可夫模型的概率计算过程;
将所述商品特征和所述综合特征输入预设的第二神经网络模型,获取所述第二神经网络模型输出的所述状态转移矩阵参数,其中,所述状态转移矩阵参数用于将所述商品特征关联至所述隐马尔可夫模型的概率计算过程。
3.根据权利要求1所述的购物行为预测方法,其特征在于,所述操作行为包括行为方式和行为时间;
所述基于所述历史购物数据,获取用户特征、商品特征和综合特征,包括:
根据所述行为时间,获取所述待预测用户购买每一个所述商品分别对应的时序行为序列,其中,所述时序行为序列通过所述行为方式按照时间顺序排列获得;
基于所述历史购物数据,获取每一个所述商品分别对应的商品类别序列,其中,所述商品类别序列包括所述商品对应的商品类别;
基于所述时序行为序列和所述商品类别序列,获取所述用户特征、所述商品特征和所述综合特征。
4.根据权利要求3所述的购物行为预测方法,其特征在于,所述基于所述时序行为序列和所述商品类别序列,获取所述用户特征、所述商品特征和所述综合特征,包括:
基于所述时序行为序列和所述商品类别序列,获取至少一个用户特征值,其中,所述用户特征值为所述待预测用户购买各个所述商品时发生的所述行为方式的统计值,或者,所述待预测用户购买各个所述商品类别对应的所述商品时发生的所述行为方式的统计值;
基于所述用户特征值,获取所述用户特征;
基于所述时序行为序列,获取至少一个商品特征值,其中,所述商品特征值为每一个所述商品被所述待预测用户购买时发生的所述行为方式的统计值;
基于所述商品特征值,获取所述商品特征;
基于所述时序行为序列,获取至少一个综合特征值,其中,所述综合特征值为所述待预测用户购买所述目标商品时发生的所述行为方式的统计值;
基于所述综合特征值,获取所述综合特征。
5.根据权利要求4所述的购物行为预测方法,其特征在于,所述基于所述时序行为序列和所述商品类别序列,获取至少一个用户特征值,包括:
对所述行为方式进行组合定义,确定购买行为和想要购买行为,其中,所述购买行为对应至少一种所述行为方式,所述想要购买行为对应至少一种所述行为方式;
将所述购买行为和所述想要购买行为,更新至所述时序行为序列;
基于所述商品类别序列和更新后的所述时序行为序列,获取至少一个所述用户特征值;
所述基于所述时序行为序列,获取至少一个商品特征值,包括:
基于更新后的所述时序行为序列,获取至少一个所述商品特征值;
所述基于所述时序行为序列,获取至少一个综合特征值,包括:
基于更新后的所述时序行为序列,获取至少一个所述综合特征值。
6.根据权利要求4所述的购物行为预测方法,其特征在于,所述基于所述用户特征值,获取所述用户特征,包括:
通过每一种所述行为方式分别对应的预设权重,对所述用户特征值进行加权处理;
基于加权前和加权后分别对应的所述用户特征值,获取所述用户特征;
所述基于所述商品特征值,获取所述商品特征,包括:
通过每一种所述行为方式分别对应的预设权重,对所述商品特征值进行加权处理;
基于加权前和加权后分别对应的所述商品特征值,获取所述商品特征;
所述基于所述综合特征值,获取所述综合特征,包括:
通过每一种所述行为方式分别对应的预设权重,对所述综合特征值进行加权处理;
基于加权前和加权后分别对应的所述综合特征值,获取所述综合特征。
7.根据权利要求4所述的购物行为预测方法,其特征在于,所述基于所述用户特征值,获取所述用户特征,包括:
通过所述用户特征值对应的最大用户特征值和最小用户特征值,对每一个所述用户特征值进行标准化;
基于标准化后的所述用户特征值,获取所述用户特征;
所述基于所述商品特征值,获取所述商品特征,包括:
通过所述商品特征值对应的最大商品特征值和最小商品特征值,对每一个所述商品特征值进行标准化;
基于标准化后的所述商品特征值,获取所述商品特征;
所述基于所述综合特征值,获取所述综合特征,包括:
通过所述综合特征值对应的最大综合特征值和最小综合特征值,对每一个所述综合特征值进行标准化;
基于标准化后的所述综合特征值,获取所述综合特征。
8.根据权利要求3所述的购物行为预测方法,其特征在于,所述基于所述历史购物数据,获取每一个所述商品分别对应的商品类别序列,包括:
基于所述历史购物数据,确定所述待预测用户购买过的每一个所述商品;
对于每一个所述商品:判断是否存在所述商品对应的所述商品类别,若是,对所述商品类别进行独热编码,获得所述商品类别对应的类别标识;若否,将所述商品作为新的所述商品类别,对新的所述商品类别进行独热编码,获得所述商品类别对应的类别标识;
基于所述类别标识,获取每一个所述商品分别对应的所述商品类别序列。
9.根据权利要求2所述的购物行为预测方法,其特征在于,所述第一神经网络模型和所述第二神经网络模型,通过样本数据进行训练得到;其中,所述样本数据包括至少一个样本用户在样本时段内的样本购物数据,所述样本购物数据包括各个所述样本用户购买任意一个样本商品的操作行为;
训练过程如下:
基于所述样本购物数据,获取样本用户特征、样本商品特征和样本综合特征,其中,所述样本用户特征为表征所述样本用户购买各个所述样本商品的特征,所述样本商品特征为表征每一个所述样本商品被所述样本用户购买的特征,所述样本综合特征为表征所述样本用户购买样本目标商品的特征;
将所述样本用户特征和所述样本综合特征输入预设的第一原始神经网络模型,获取所述第一原始神经网络模型输出的样本状态行为矩阵参数;
将所述样本商品特征和所述样本综合特征输入预设的第二原始神经网络模型,获取所述第二原始神经网络模型输出的样本状态转移矩阵参数,其中,样本状态行为矩阵参数和样本状态转移矩阵参数为所述隐马尔可夫模型的样本特征矩阵参数;
获取所述隐马尔可夫模型输出的至少一种所述操作行为的样本预测概率;
基于所述样本预测概率,获取训练损失函数;
根据所述训练损失函数,分别调整所述第一原始神经网络模型和所述第二原始神经网络模型的内部参数;
重复基于所述样本购物数据,获取样本用户特征、样本商品特征和样本综合特征的步骤,直至所述训练损失函数达到最小值,获得所述第一神经网络模型和所述第二神经网络模型。
10.一种购物行为预测装置,其特征在于,包括:
数据获取模块,用于获取待预测用户在预设时段内的历史购物数据,其中,所述历史购物数据包括所述待预测用户购买任意一个商品的操作行为;
特征获取模块,用于基于所述历史购物数据,获取用户特征、商品特征和综合特征,其中,所述用户特征为表征所述待预测用户购买各个所述商品的特征,所述商品特征为表征每一个所述商品被所述待预测用户购买的特征,所述综合特征为表征所述待预测用户购买目标商品的特征;
参数获取模块,用于基于所述用户特征、所述商品特征和所述综合特征,确定隐马尔可夫模型的特征矩阵参数,其中,所述隐马尔可夫模型基于所述操作行为和预设的隐状态预先设置;
概率计算模块,用于将初始隐状态概率和待预测用户的初始操作行为输入至所述隐马尔科夫模型,获得所述隐马尔科夫模型输出的至少一种所述操作行为的预测概率。
11.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至9任一项所述的购物行为预测方法。
12.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至9任一项所述的购物行为预测方法。
CN202210894235.4A 2022-07-27 2022-07-27 购物行为预测方法、装置、设备及存储介质 Pending CN115204985A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210894235.4A CN115204985A (zh) 2022-07-27 2022-07-27 购物行为预测方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210894235.4A CN115204985A (zh) 2022-07-27 2022-07-27 购物行为预测方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN115204985A true CN115204985A (zh) 2022-10-18

Family

ID=83583332

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210894235.4A Pending CN115204985A (zh) 2022-07-27 2022-07-27 购物行为预测方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115204985A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116523608A (zh) * 2023-07-03 2023-08-01 苏州大学 基于概率逻辑推理的物品序列推荐方法
CN116823803A (zh) * 2023-07-21 2023-09-29 深圳鑫舟生物信息科技有限公司 一种生物补偿理疗系统
CN117273863A (zh) * 2023-11-03 2023-12-22 零一创造欢乐(深圳)科技有限公司 一种基于用户需求预测的信息推送方法及电子商务系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116523608A (zh) * 2023-07-03 2023-08-01 苏州大学 基于概率逻辑推理的物品序列推荐方法
CN116523608B (zh) * 2023-07-03 2023-08-29 苏州大学 基于概率逻辑推理的物品序列推荐方法
CN116823803A (zh) * 2023-07-21 2023-09-29 深圳鑫舟生物信息科技有限公司 一种生物补偿理疗系统
CN116823803B (zh) * 2023-07-21 2024-01-30 深圳鑫舟生物信息科技有限公司 一种生物补偿理疗系统
CN117273863A (zh) * 2023-11-03 2023-12-22 零一创造欢乐(深圳)科技有限公司 一种基于用户需求预测的信息推送方法及电子商务系统
CN117273863B (zh) * 2023-11-03 2024-05-28 零一创造欢乐(深圳)科技有限公司 一种基于用户需求预测的信息推送方法及电子商务系统

Similar Documents

Publication Publication Date Title
CN106485562B (zh) 一种基于用户历史行为的商品信息推荐方法及系统
CN108320171B (zh) 热销商品预测方法、系统及装置
CN108665311B (zh) 一种基于深度神经网络的电商用户时变特征相似性计算推荐方法
JP4218099B2 (ja) データベース、顧客情報検索方法及び顧客情報検索装置
Bose et al. Quantitative models for direct marketing: A review from systems perspective
CN115204985A (zh) 购物行为预测方法、装置、设备及存储介质
CN110427560B (zh) 一种应用于推荐系统的模型训练方法以及相关装置
CN104239338A (zh) 信息推荐方法及装置
US20210125073A1 (en) Method and system for individual demand forecasting
CN113469730A (zh) 一种非合同场景下的基于RF-LightGBM融合模型的客户复购预测方法及装置
CN110009432A (zh) 一种个人消费行为预测方法
CN112417294A (zh) 一种基于神经网络挖掘模型的业务智能推荐方法
CN116431931A (zh) 实时增量数据统计分析方法
CN111652735A (zh) 基于用户行为标签特征及商品特征的保险产品推荐的方法
CN114861050A (zh) 一种基于神经网络的特征融合推荐方法及系统
Li et al. A Hybrid Prediction Model for E-Commerce Customer Churn Based on Logistic Regression and Extreme Gradient Boosting Algorithm.
CN114997916A (zh) 潜在用户的预测方法、系统、电子设备和存储介质
CN117350766A (zh) 一种基于私域电商平台的数据处理方法、系统及存储介质
CN113076484A (zh) 基于深度学习的产品推荐方法、装置、设备和存储介质
CN112269920A (zh) 一种用于鉴定刷单的方法
CN111598588A (zh) 一种刷单识别方法
CN115438787A (zh) 行为预测系统的训练方法及装置
CN117196787B (zh) 一种基于人工智能的智能决策优化方法及系统
Alves Gomes et al. Will this online shopping session succeed? predicting customer's purchase intention using embeddings
CN117745349A (zh) 一种基于用户特征的个性化推券方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination