CN104915734B - 基于时间序列的商品热度预测方法和系统 - Google Patents

基于时间序列的商品热度预测方法和系统 Download PDF

Info

Publication number
CN104915734B
CN104915734B CN201510358159.5A CN201510358159A CN104915734B CN 104915734 B CN104915734 B CN 104915734B CN 201510358159 A CN201510358159 A CN 201510358159A CN 104915734 B CN104915734 B CN 104915734B
Authority
CN
China
Prior art keywords
commodity
purchase
clicks
recommended
training sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510358159.5A
Other languages
English (en)
Other versions
CN104915734A (zh
Inventor
刘博�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Tencent Computer Systems Co Ltd
Original Assignee
Shenzhen Tencent Computer Systems Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Tencent Computer Systems Co Ltd filed Critical Shenzhen Tencent Computer Systems Co Ltd
Priority to CN201510358159.5A priority Critical patent/CN104915734B/zh
Publication of CN104915734A publication Critical patent/CN104915734A/zh
Application granted granted Critical
Publication of CN104915734B publication Critical patent/CN104915734B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于时间序列的商品热度预测方法,包括:根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到;根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到;计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值。上述方法不需要参考用户画像和用户行为数据,也能准确地预测出用户感兴趣概率较高的商品。此外,还提供一种基于时间序列的商品热度预测系统。

Description

基于时间序列的商品热度预测方法和系统
技术领域
本发明涉及计算机技术领域,特别是涉及一种基于时间序列的商品热度预测方法和系统。
背景技术
互联网爆炸增长的信息使得用户发现有价值信息愈发困难,从而使得推荐系统成为当今学术最为活跃的研究领域之一。推荐系统力图辅助用户发现潜在喜欢的音乐,电影,商品,App等。
一些推荐系统根据用户信息和商品信息进行学习,使得用户更喜欢的商品拥有更高的权重。当有大量用户信息可供使用时,推荐系统可以提供个性化的推荐结果。例如为软件工作者推荐软件类书籍,而为艺术工作者提供艺术类书籍等。
协同过滤方法和基于内容的推荐方法是如今推荐系统最为主流的两种方法。其中,基于内容的推荐方法利用商品的信息(例如,商品的类别、风格等)和用户的画像(例如,用户的年龄、性别和潜在的兴趣)来预测用户对商品的兴趣。而另一种协同过滤方法查询相似用户的历史行为来预测用户对商品的兴趣。
因此,在没有获取到用户画像或者没有积累用户行为数据的情况下,传统的推荐系统很难推荐用户感兴趣的商品。
然而,获取用户的画像不仅十分昂贵而且面临着严重的隐私泄露的风险。而且,在许多的应用场合,用户绝大多数为新用户,不仅很难获取到新用户的用户画像,而且也没有积累新用户的行为数据。
发明内容
基于此,有必要提供一种基于时间序列的商品热度预测方法和系统,该方法和系统在缺少用户画像和用户行为数据的情况下,也可预测出用户感兴趣概率较高的商品。
一种基于时间序列的商品热度预测方法,包括以下步骤:
根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,所述第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到;
根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,所述第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到;
计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值。
一种基于时间序列的商品热度预测系统,包括:
购买次数估计模块,用于根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,所述第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到;
点击次数估计模块,用于根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,所述第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到;
热度计算模块,用于计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值。
上述基于时间序列的商品热度预测方法和系统中,第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到,各种商品的历史购买次数时间序列中隐藏着一些购买次数的发生规律,这些发生规律对于各种商品具有普遍的意义,根据历史购买次数时间序列训练得到的第一自回归模型可以表达这些规律,因此,上述方法和系统根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,可以准确地预测出待推荐商品的未来购买次数;同样的,第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到,各种商品的历史点击次数时间序列中隐藏着一些点击次数的发生规律,这些发生规律对于各种商品具有普遍的意义,根据历史点击次数时间序列训练得到的第一自回归模型可以表达这些规律,因此,上述方法和系统根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,可以准确地预测出待推荐商品的未来点击次数;进一步的,计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值,从而可准确的预测待推荐商品的未来热度。
未来热度较高的商品必定是大部分用户感兴趣的概率较高的商品,因此,上述方法和系统,不需要参考用户画像和用户行为数据,也能准确地预测出用户感兴趣概率较高的商品。
附图说明
图1为一个实施例中可运行本申请所述的基于时间序列的商品热度预测方法的服务器的部分结构框图;
图2为一个实施例中的基于时间序列的商品热度预测方法的流程示意图;
图3为一个实施例中训练自回归模型的过程的流程示意图;
图4为一个实施例中根据商品的历史购买次数时间序列构成购买训练样本的过程的流程示意图;
图5为一个实施例中根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数的步骤的流程示意图;
图6为一个实施例中根据商品的历史点击次数时间序列构成点击训练样本的过程的流程示意图;
图7为一个实施例中根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数的步骤的流程示意图;
图8示出了根据本申请所述的基于时间序列的商品热度预测方法预测的商品热度推荐商品以及采用协同过滤方法和采用基于内容的推荐方法推荐商品时的商品购买次数增长幅度对比图,对应于用户画像和用户行为数据的信息较少的场景;
图9示出了根据本申请所述的基于时间序列的商品热度预测方法预测的商品热度推荐商品以及采用协同过滤方法和采用基于内容的推荐方法推荐商品时的商品购买次数增长幅度对比图,对应于用户画像和用户行为数据的信息完全没有的场景;
图10为一个实施例中的基于时间序列的商品热度预测系统的结构示意图;
图11为另一实施例中的基于时间序列的商品热度预测系统的结构示意图;
图12为又一实施例中的基于时间序列的商品热度预测系统的结构示意图;
图13为再一实施例中的基于时间序列的商品热度预测系统的结构示意图;
图14为一个实施例中的基于时间序列的商品热度预测系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1为一个实施例中可运行本申请所述的基于时间序列的商品热度预测方法的服务器的部分结构框图。如图1所示,在一个实施例中,该服务器包括通过系统总线连接的处理器、存储介质、内存和网络接口;其中,网络接口用于与网络进行通信,内存用于缓存数据,存储介质中存储有操作系统、数据库以及用于实现本申请所述的基于时间序列的商品热度预测方法的软件指令,处理器协调各部件的工作并执行这些指令以实现本申请所述的基于时间序列的商品热度预测方法。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的服务器的限定,具体的服务器可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
为了方便理解,以下对本申请文件中的一些术语进行统一解释。
本申请文件中涉及多种时间序列,包括近期购买次数时间序列、近期点击次数时间序列、历史购买次数时间序列、历史点击次数时间序列。
每一条时间序列包括一个变量的多个时段的数值。
其中:
某一商品的一条近期购买次数时间序列包括该商品近期的预设数量个时段的购买次数;例如,最近24个小时中每一个小时的购买次数,其中,一个小时对应一个时段。
某一商品的一条近期点击次数时间序列包括该商品近期的预设数量个时段的点击次数;例如,最近7天中每一天的点击次数,其中,一天对应一个时段。
某一商品的一条历史购买次数时间序列包括该商品过去预设数量个时段的购买次数以及该预设个时段之后的一个时段的购买次数;例如,过去某一天的24个小时中每一个小时的购买次数,以及这一天之后的第一个小时的购买次数。
某一商品的一条历史点击次数时间序列包括该商品过去预设数量个时段的点击次数以及该预设个时段之后的一个时段的点击次数。例如,过去某一个星期的7天中每一天的点击次数,以及该星期之后的第一天的点击次数。
在一个实施例中,各近期购买次数时间序列所包含的数值数量相等,各近期点击次数时间序列所包含的数值数量相等,各历史购买次数时间序列所包含的数值数量相等,各历史点击次数时间序列所包含的数值数量相等,且各历史购买次数时间序列所包含的数值数量比各近期购买次数时间序列所包含的数值数量多1;各历史购买次数时间序列所包含的数值数量比各近期点击次数时间序列所包含的数值数量多1。
在另一个实施例中,商品被划分为多种类别,同一类别商品的各近期购买次数时间序列所包含的数值数量相等,同一类别商品的各近期点击次数时间序列所包含的数值数量相等,同一类别商品的各历史购买次数时间序列所包含的数值数量相等,同一类别商品的各历史点击次数时间序列所包含的数值数量相等,且同一类别商品的各历史购买次数时间序列所包含的数值数量比各近期购买次数时间序列所包含的数值数量多1;同一类别商品的各历史购买次数时间序列所包含的数值数量比各近期点击次数时间序列所包含的数值数量多1。
在一个实施例中,每一条时间序列所包含的各个时段的数值在时间序列中按照对应时段的时间先后顺序进行排列。
在一个实施例中,各种时间序列所包含的各个数值所对应的时段的时长都相等。例如,上述示例中,每个时段都对应一个小时,或者每个时段都对应一天,等等。
在另一个实施例中,商品被划分为多种类别,同一种类别的商品所对应的各种时间序列所包含的各个数值所对应的时段的时长都相等,将一种类别的商品所对应的各种时间序列所包含的各个数值所对应的时段的时长统称为该类别对应的时长,不同类别对应的时长可以不相等。例如,建材类商品对应的时长为一个月,日用类商品对应的时长为一个小时,等等。
在一个实施例中,每一条时间序列包含的数值对应的多个时段为连续的多个时段,即,前一时段与后一时段在时间轴上相邻且二者之间没有时间间隔。例如,上述示例中,24个小时指的是一天之内的24个小时,7天指的一个星期之内的7天,但本申请文件不限制该24个小时跨越日期分隔点,也不限制该7天跨越星期分隔点。
在一个实施例中,每一条时间序列包含的数值对应的多个时段为不连续的多个时段,相邻两时段之间具有时间间隔,但一条时间序列中所有的相邻两时段之间的时间间隔都相等。例如,一条历史购买次数时间序列包含p+1天中每一天的购买次数,其中一天对应一个时段,该p+1天相邻每两天之间都相隔一天。
自回归模型中,将一个变量的某一时刻的值表示为该变量的过去值的线性函数,该变量的过去值指的是该变量在该时刻之前的一个或多个过去时刻的值。可以理解的是,某一时刻可以理解为某一时间点,也可以理解为某一时间段。
自回归模型的一般的模型公式为:
其中,β1zt2zt-1,…,βl-1zt-l+2lzt-l+1为l个一次项,β12,…,βl-1l分别为一次项系数,a为常数项,且,β12,…,βl-1l和a为个待估计的参数。l即表示自回归模型的训练以及根据自回归模型进行预测所依据的过去值的数量。
本申请文件涉及第一自回归模型和第二自回归模型。
第一自回归模型用于预测商品的未来购买次数。在第一自回归模型中,某一商品的未来购买次数被表示为该商品过去预设数量个时段的购买次数的线性函数。
第二自回归模型用于预设商品的未来点击次数。在第二自回归模型中,某一商品的未来点击次数被表示为该商品过去预设数量个时段的点击次数的线性函数。
如图2所述,在一个实施例中,一种基于时间序列的商品热度预测方法,包括以下步骤:
步骤S202,根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到。
步骤S204,根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到。
步骤S206,计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值。
上述基于时间序列的商品热度预测方法中,第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到,各种商品的历史购买次数时间序列中隐藏着一些购买次数的发生规律,这些发生规律对于各种商品具有普遍的意义,根据历史购买次数时间序列训练得到的第一自回归模型可以表达这些规律,因此,上述方法根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,可以准确地预测出待推荐商品的未来购买次数;同样的,第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到,各种商品的历史点击次数时间序列中隐藏着一些点击次数的发生规律,这些发生规律对于各种商品具有普遍的意义,根据历史点击次数时间序列训练得到的第一自回归模型可以表达这些规律,因此,上述方法根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,可以准确地预测出待推荐商品的未来点击次数;进一步的,计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值,从而可准确的预测待推荐商品的未来热度。
未来热度较高的商品必定是大部分用户感兴趣的概率较高的商品,因此,上述方法,不需要参考用户画像和用户行为数据,也能准确地预测出用户感兴趣概率较高的商品。
如图3所示,在一个实施例中,上述的基于时间序列的商品热度预测方法,还包括训练自回归模型的过程,该过程包括以下步骤:
步骤S302,根据商品的历史购买次数时间序列构成的购买训练样本训练第一自回归模型。
在一个实施例中,一条历史购买次数时间序列包含的购买次数对应的过去时段的预设数量以p为例;即,一条历史购买次数时间序列包含过去p个时段的购买次数以及该p个时段之后的一个时段的购买次数;购买训练样本的特征即包含p个时段的购买次数。p为预设值。
基于上述实施例,第一自回归模型包含p+1个待估计参数。
在一个实施例中,可从海量商品的历史购买数据中提取出N条商品的历史购买次数时间序列。N为预设数值。在一个实施例中,N可达到上千万级别。在一个实施例中,N条商品的历史购买次数时间序列可覆盖各个商品种类。
进一步的,可将每一条商品的历史购买次数时间序列构成一个购买训练样本。其中,商品的历史购买次数时间序列中的过去p个时段的购买次数作为购买训练样本的特征,商品的历史购买次数时间序列中该p个时段的购买次数之后的一个时段的购买次数作为购买训练样本的标记结果。
第一自回归模型的模型公式可设置为:
其中,yt-p+1,yt-p+2,…,yt-1,yt分别表示p个时段的购买次数,表示该p个时段之后的一个时段的预测购买次数。c,w1,w2,…,wp为待估计参数。
进一步的,根据购买训练样本求解使得预测购买次数与标记结果之间的误差最小的参数c,w1,w2,…,wp,即,使得下式的E1最小的参数c,w1,w2,…,wp
其中,为N个购买训练样本中第i个购买训练样本的特征对应的预测购买次数;
分别为N个购买训练样本中第i个购买训练样本的特征所包含的按照时段的时间先后顺序排列的p个购买次数;
分别为N个购买训练样本中第i个购买训练样本的标记结果;
λ1是正则项参数;
在一个实施例中可采用随机梯度下降方法(Stochastic Gradient Descent)估计使得E1最小的参数c,w1,w2,…,wp的值。
在另一个实施例中,可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E1最小的参数c,w1,w2,…,wp的值。
步骤S304,根据商品的历史点击次数时间序列构成的点击训练样本训练第二自回归模型。
在一个实施例中,与第一自回归模型相对应的,第二自回归模型包含p+1个待估计参数。本实施例中,本实施例中,历史点击次数时间序列包含p个时段的点击次数以及该p个时段之后的一个时段的点击次数;点击训练样本的特征即包含p个时段的点击次数。
在一个实施例中,可从海量商品的历史点击数据中提取出与上述用于训练第一自回归模型的N条商品的历史购买次数时间序列相对应的N条商品的历史点击次数时间序列。一条历史点击次数时间序列与一条历史购买次数时间序列相对应,则该历史点击次数时间序列所包含的点击次数为该历史购买次数时间序列对应时段内对应商品的点击次数。
例如,某一商品的一条历史购买次数时间序列为包含t-p+1,t-p+2,…,t-1,t,t+1时段的购买次数,则对应的历史点击次数时间序列则包含该商品在该t-p+1,t-p+2,…,t-1,t,t+1时段的点击次数。
进一步的,可将每一条商品的历史点击次数时间序列构成一个点击训练样本。其中,商品的历史点击次数时间序列中的过去p个时段的点击次数作为点击训练样本的特征,商品的历史点击次数时间序列中该p个时段的点击次数之后的一个时段的点击次数作为点击训练样本的标记结果。
第二自回归模型的模型公式可设置为:
其中,xt-p+1,xt-p+2,…,xt-1,xt分别表示p个时段的点击次数,表示该p个时段之后的一个时段的预测点击次数。b,u1,u2,…,up为待估计参数。
进一步的,根据点击训练样本求解使得预测点击次数与标记结果之间的误差最小的参数b,u1,u2,…,up,即使得下式的E2最小的参数b,u1,u2,…,up
其中,为N个点击训练样本中第i个点击训练样本的特征对应的预测点击次数;
分别为N个点击训练样本中第i个点击训练样本的特征所包含的按照时段的时间先后顺序排列的p个点击次数;
分别为N个点击训练样本中第i个点击训练样本的标记结果;
λ2是正则项参数;
在一个实施例中可采用随机梯度下降方法(Stochastic Gradient Descent)估计使得E2最小的参数b,u1,u2,…,up的值。
在另一个实施例中,可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E2最小的参数b,u1,u2,…,up的值。
在一个实施例中,上述的基于时间序列的商品热度预测方法,还包括根据商品的历史购买次数时间序列构成购买训练样本的过程。
在一个实施例中,购买训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,M表示商品被划分的类别的总数量。购买训练样本的特征中指定的特征分量用于表示指定类别的商品特征。购买训练样本的特征空间相对于历史购买次数时间序列被扩大了。也可以理解为,购买训练样本的特征的维数相对于历史购买次数时间序列所包含的过去时段的购买次数的数量更大。
在一个实施例中,购买训练样本可以表示为:(Γ0,Γ1,Γ2,…,ΓM-1,ΓM,R),其中,Γ0用于表示通用特征,Γ1,Γ2,…,ΓM-1,ΓM分别用于表示M类商品中的一个种类商品的商品特征。
如图4所示,根据商品的历史购买次数时间序列构成购买训练样本的过程包括以下步骤:
步骤S402,获取商品所属的商品类别。
步骤S404,将商品的历史购买次数时间序列中过去预设数量个时段的购买次数作为购买训练样本中商品所属的商品类型对应的特征分量的特征值,以及作为购买训练样本中表示通用特征的特征分量的特征值,将购买训练样本中其它特征分量的特征值设置为0,将商品的历史购买次数时间序列中过去预设数量个时段之后的一个时段的购买次数作为购买训练样本的标记结果。
例如,某一商品的历史购买次数时间序列中过去预设数量个时段的购买次数可表示为Γ,该历史购买次数时间序列中上述预设数量个时段之后的一个时段的购买次数可表示为r,则根据该历史购买次数时间序列构成的购买训练样本可表示为(Γ,…,0,Γ,0,…,r),其中,Γ0和Γi的值被设置为Γ,Γ0用于表示通用特征,Γi用于表示商品所属的商品类别对应的商品特征,而其它的特征分量(包括Γ1~Γi-1以及Γi-1~ΓM)都被设置为0,标记结果R则被设置为r。
在一个实施例中,一条历史购买次数时间序列包含的购买次数对应的过去时段的预设数量以p为例,即,一条历史购买次数时间序列包含过去p个时段的购买次数以及该p个时段之后的一个时段的购买次数;p为预设值;
则购买训练样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;
且,第一自回归模型包含p×(M+1)+1个待估计参数。第一自回归模型中,指定的一次项对应指定商品种类,用于表示指定商品种类的商品特征,其中,一个商品种类对应p个一次项,各个商品种类对应的p个一次项不相同且不重叠;而且,第一自回归模型中指定的p个一次项用于对应通用特征。第一自回归模型中的一个一次项对应一个时段的购买次数。
在一个实施例中,基于上述实施例,第一自回归模型的模型公式可设置为:
其中,y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t表示通用特征;yk,t-p+1,yk,t-p+2,…,yk,t-1,yk,t分别表示p个时段的购买次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;表示该p个时段之后的一个时段的预测购买次数。c,wkj(k=0,1,…,M;j=1,…,p)为待估计参数。
在一个实施例中,可从海量商品的历史购买数据中提取出N条商品的历史购买次数时间序列,构成N个购买训练样本。N为预设数值。
进一步的,可将N个购买训练样本中的特征值分别代入到第一自回归模型中对应的一次项中,得到购买训练样本的特征值对应的预测的未来购买次数,并求解第一自回归模型中的待估计参数,使得购买训练样本对应的预测未来购买次数与购买训练样本的标记结果之间的误差最小。
具体而言,可根据N个购买训练样本求解使得预测购买次数与标记结果之间的误差最小的参数c,wkj(k=0,1,…,M;j=1,…,p),即,使得下式的E3最小的参数c,wkj(k=0,1,…,M;j=1,…,p):
其中,为N个购买训练样本中第i个购买训练样本的特征对应的预测购买次数;
分别为N个购买训练样本中第i个购买训练样本的特征所包含的按照时段的时间先后顺序排列的p个购买次数;
Li表示第i个购买训练样本对应的商品所属的商品种类在上述M个商品种类中的排列序号,可以理解为,第i个购买训练样本对应的商品属于上述M个商品种类中的第Li个种类;
由于第i个购买训练样本对应的商品属于上述M个商品种类中的第Li个种类,因此,购买训练样本中用于表示第1~(Li-1)种类及第(Li+1)~M种类商品的商品特征的特征分量都为0,因此,
分别为N个购买训练样本中第i个购买训练样本的标记结果;
λ3是正则项参数;
在一个实施例中可采用随机梯度下降方法(Stochastic Gradient Descent)估计使得E3最小的参数c,wkj(k=0,1,…,M;j=1,…,p)的值。
在另一个实施例中,可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E3最小的参数c,wkj(k=0,1,…,M;j=1,…,p)的值。
在一个实施例中,如图5所示,根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数的步骤包括:
步骤S502,获取待推荐商品所属的商品类别。
步骤S504,将待推荐商品的近期购买次数时间序列中所包含的近期预设数量个时段的购买次数构成购买测试样本,购买测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将近期预设数量个时段的购买次数作为购买测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为购买测试样本中表示通用特征的特征分量的特征值,将购买测试样本中其它特征分量的特征值设置为0。
其中,待推荐商品所属的商品类别对应的特征分量表示待推荐商品所属的商品类别的商品特征的特征分量。
购买测试样本的特征空间相对于近期购买次数时间序列被扩大了。也可以理解为,购买测试样本的特征的维数相对于近期购买次数时间序列所包含的近期时段的购买次数的数量更大。
在一个实施例中,一条近期购买次数时间序列包含的购买次数对应的近期时段的预设数量以p为例,即,一条近期购买次数时间序列包含近期p个时段的购买次数;p为预设值;
则购买测试样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;记购买测试样本为:
{y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t
y1,t-p+1,y1,t-p+2,…,y1,t-1,y1,t
……
yk,t-p+1,yk,t-p+2,…,yk,t-1,yk,t
……
yM,t-p+1,yM,t-p+2,…,yM,t-1,yM,t
}
其中,y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t表示通用特征;yk,t-p+1,yk,t-p+2,…,yk,t-1,yk,t分别表示p个时段的购买次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;
记待推荐商品的一条近期购买次数时间序列中所包含的近期p个时段的购买次数为:yt-p+1,yt-p+2,…,yt-1,yt,且记待推荐商品在上述的M个商品种类属于第L个种类,则根据该近期购买次数时间序列构成的购买测试样本为:
(yt-p+1,yt-p+2,…,yt-1,yt
0,0,…,0,
……
yt-p+1,yt-p+2,…,yt-1,yt
……
0,0,…,0),
其中,用于表示通用特征的特征分量y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t被分别设置为yt-p+1,yt-p+2,…,yt-1,yt,且用于表示第L个种类商品的商品特征的特征分量yL,t-p+1,yL,t-p+2,…,yL,t-1,yL,t也被分别设置为yt-p+1,yt-p+2,…,yt-1,yt,用于表示其它种类(包括第1~(L-1)种类及第(L+1)~M)的商品特征的特征分量都被设置为0。
步骤S506,根据第一自回归模型估计所构成的购买测试样本对应的未来购买次数,得到待推荐商品的未来购买次数。
可将购买测试样本中的特征值分别代入确定了参数后的(5)式中对应的特征分量,计算得到从而得到待推荐商品的未来购买次数。
商品可以被划分成不同的类别,若分别为每一个商品类别训练独立的第一自回归模型,一般而言,各商品类别对应的第一自回归模型可以更准确的反映本类别的商品的购买次数的发生规律,从而根据待推荐商品所属商品类别对应的第一自回归模型预测待推荐商品的未来购买次数,可以得到更准确的预测结果。
但是,上述方式存在两个方面的问题。第一,当商品类别数量较多时,需要训练数量较多的第一自回归模型,工作量巨大;第二,训练模型需要大量的训练样本,对于历史购买数据较少的商品类别,则无法训练出较好的第一自回归模型。
针对上述问题,上述的基于时间序列的商品热度预测方法,将购买训练样本的特征空间扩大(可以理解为将购买训练样本的特征的维数扩大),使得购买训练样本包含表示被划分的商品种类中各商品种类对应的商品特征的特征分量以及包含表示所有商品种类的通用特征的特征分量。在根据商品的历史购买次数时间序列构成购买训练样本的过程中,将商品的历史购买次数时间序列既作为自身所属商品类别对应的特征值,又作为通用特征值,构成购买训练样本,并且将购买训练样本中的其他特征分量的值设置为0。
根据扩大特征空间后的购买训练样本训练第一自回归模型,从而既可以训练得到通用特征对应的待估计参数,又可以训练得到各商品种类对应的待估计参数;而且可以确保某一商品种类的历史购买次数时间序列(蕴含着购买次数发生规律)在训练第一自回归模型的过程中,仅对本商品种类对应的待估计参数的训练做出贡献,以及对通用特征对应的待估计参数的训练做出贡献。从而训练得到的通用特征对应的待估计参数的值反映所有商品种类的通用的购买次数发生规律,而训练得到的各商品种类对应的待估计参数的值反映本商品种类的购买次数发生规律。
因此,不需要针对每一个商品类型训练一个独立的第一自回归模型。
进一步的,在预测某一待推荐商品的未来购买次数的过程中,同样的将购买测试样本的特征空间扩大,即,将待推荐商品的近期购买次数时间序列作为自身所属商品类别对应的特征值,又作为通用特征值,构成购买测试样本,并且将购买测试样本中的其它特征分量的值设置为0,并利用第一自回归模型计算购买测试样本对应的未来购买次数,从而使得且仅使得通用特征对应的一次项系数以及待推荐商品所属商品类别对应的一次项系数在计算过程中起作用,相当于利用所有商品种类的通用的购买次数发生规律以及利用待推荐商品所属商品类别的购买次数发生规律对待推荐商品的未来购买次数进行预测。
因此,对于属于历史购买数据较少的商品类别的待推荐商品,由于可以根据所有商品类别的通用的购买次数发生规律来预测其未来购买次数,因此,相对根据待推荐商品所属类别的历史购买数据训练得到的独立的第一自回归模型,可以获得更好的预测结果。
而对于属于历史购买数据较多的商品类别的待推荐商品,由于所属商品类别的历史购买数据较多,因此,在训练第一回归模型的反映所有商品种类的通用的购买次数发生规律的一次项系数(即通用特征对应的一次项系数)时,所属商品类别的历史购买次数时间序列所起作用相对于其它商品类别所起作用较大,因此,第一回归模型中的通用特征对应的一次项系数所反映的所有商品种类的通用的购买次数发生规律会较大程度地遵循所属商品类别的购买次数发生规律,因此,对于属于历史购买数据较多的商品类别的待推荐商品,利用所有商品种类的通用的购买次数发生规律以及利用待推荐商品所属商品类别的购买次数发生规律对待推荐商品的未来购买次数进行预测,同样可以获得较好的预测结果。
在一个实施例中,上述的基于时间序列的商品热度预测方法,还包括根据商品的历史点击次数时间序列构成点击训练样本的过程。
在一个实施例中,点击训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,M表示商品被划分的类别的总数量。点击训练样本的特征中指定的特征分量用于表示指定类别的商品特征。点击训练样本的特征空间相对于历史点击次数时间序列被扩大了。也可以理解为,点击训练样本的特征的维数相对于历史点击次数时间序列所包含的过去时段的点击次数的数量更大。
在一个实施例中,点击训练样本可以表示为:(τ0,τ1,τ2,…,τM-1,τM,Q),其中,τ0用于表示通用特征,τ1,τ2,…,τM-1,τM分别用于表示M类商品中的一个种类商品的商品特征。
如图6所示,在一个实施例中,根据商品的历史点击次数时间序列构成点击训练样本的过程包括以下步骤:
步骤S602,获取商品所属的商品类别。
步骤S604,将商品的历史点击次数时间序列中过去预设数量个时段的点击次数作为点击训练样本中商品所属的商品类型对应的特征分量的特征值,以及作为点击训练样本中表示通用特征的特征分量的特征值,将点击训练样本中其它特征分量的特征值设置为0,将商品的历史点击次数时间序列中过去预设数量个时段之后的一个时段的点击次数作为点击训练样本的标记结果。
例如,某一商品的历史点击次数时间序列中过去预设数量个时段的点击次数可表示为τ,该历史点击次数时间序列中上述预设数量个时段之后的一个时段的点击次数可表示为q,则根据该历史点击次数时间序列构成的点击训练样本可表示为(τ,…,0,τ,0,…,q),其中,τ0和τi的值被设置为τ,τ0用于表示通用特征,τi用于表示商品所属的商品类别对应的商品特征,而其它的特征分量(包括τ1~τi-1以及τi-1~τM)都被设置为0,标记结果Q则被设置为q。
在一个实施例中,一条历史点击次数时间序列包含的点击次数对应的过去时段的预设数量以p为例,即,一条历史点击次数时间序列包含过去p个时段的点击次数以及该p个时段之后的一个时段的点击次数;p为预设值;
则点击训练样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;
且,第二自回归模型包含p×(M+1)+1个待估计参数。第二自回归模型中,指定的数据项对应指定商品种类,用于表示指定商品种类的商品特征,其中,一个商品种类对应p个数据项,各个商品种类对应的p个数据项不相同且不重叠;而且,第二自回归模型中指定的p个数据项用于对应通用特征。
在一个实施例中,基于上述实施例,第二自回归模型的模型公式可设置为:
其中,x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t表示通用特征;xk,t-p+1,xk,t-p+2,…,xk,t-1,xk,t分别表示p个时段的点击次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;表示该p个时段之后的一个时段的预测点击次数。b,ukj(k=0,1,…,M;j=1,…,p)为待估计参数。
在一个实施例中,可从海量商品的历史点击数据中提取出N条商品的历史点击次数时间序列,构成N个点击训练样本。N为预设数值。在一个实施例中,本实施例中提取出的N条历史点击次数时间序列与上述实施例中提取的N条历史购买次数时间序列相对应。
进一步的,可将N个点击训练样本中的特征值分别代入到第二自回归模型中对应的一次项中,得到点击训练样本的特征值对应的预测的未来点击次数,并求解第二自回归模型中的待估计参数,使得点击训练样本对应的预测未来点击次数与购买训练样本的标记结果之间的误差最小。
具体而言,可根据N个点击训练样本求解使得预测点击次数与标记结果之间的误差最小的参数b,ukj(k=0,1,…,M;j=1,…,p),即,使得下式的E4最小的参数b,ukj(k=0,1,…,M;j=1,…,p):
其中,为N个点击训练样本中第i个点击训练样本的特征对应的预测点击次数;
分别为N个点击训练样本中第i个点击训练样本的特征所包含的按照时段的时间先后顺序排列的p个点击次数;
Li表示第i个点击训练样本对应的商品所属的商品种类在上述M个商品种类中的排列序号,可以理解为,第i个点击训练样本对应的商品属于上述M个商品种类中的第Li个种类;
由于第i个点击训练样本对应的商品属于上述M个商品种类中的第Li个种类,因此,点击训练样本中用于表示第1~(Li-1)种类及第(Li+1)~M种类商品的商品特征的特征分量都为0,因此,
分别为N个点击训练样本中第i个点击训练样本的标记结果;
λ4是正则项参数;
在一个实施例中可采用随机梯度下降方法(Stochastic Gradient Descent)估计使得E4最小的参数b,ukj(k=0,1,…,M;j=1,…,p)的值。
在另一个实施例中,可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E4最小的参数b,ukj(k=0,1,…,M;j=1,…,p)的值。
在一个实施例中,如图7所示,根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数的步骤包括:
步骤S702,获取待推荐商品所属的商品类别。
步骤S704,将待推荐商品的近期点击次数时间序列中所包含的近期预设数量个时段的点击次数构成点击测试样本,点击测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将近期预设数量个时段的点击次数作为点击测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为点击测试样本中表示通用特征的特征分量的特征值,将点击测试样本中其它特征分量的特征值设置为0。
其中,待推荐商品的近期点击次数时间序列与上述的用于计算待推荐商品的未来购买次数的近期购买次数时间序列相对应。
点击测试样本的特征空间相对于近期点击次数时间序列被扩大了。也可以理解为,点击测试样本的特征的维数相对于近期点击次数时间序列所包含的近期时段的点击次数的数量更大。
在一个实施例中,一条近期点击次数时间序列包含的点击次数对应的近期时段的预设数量以p为例,即,一条近期点击次数时间序列包含近期p个时段的点击次数;p为预设值;
则点击测试样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;记点击测试样本为:
{x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t
x1,t-p+1,x1,t-p+2,…,x1,t-1,x1,t
……
xk,t-p+1,xk,t-p+2,…,xk,t-1,xk,t
……
xM,t-p+1,xM,t-p+2,…,xM,t-1,xM,t
}
其中,x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t表示通用特征;xk,t-p+1,xk,t-p+2,…,xk,t-1,xk,t分别表示p个时段的点击次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;
记待推荐商品的一条近期点击次数时间序列中所包含的近期p个时段的点击次数为:xt-p+1,xt-p+2,…,xt-1,xt,且记待推荐商品在上述的M个商品种类属于第L个种类,则根据该近期点击次数时间序列构成的点击测试样本为:
(xt-p+1,xt-p+2,…,xt-1,xt
0,0,…,0,
……
xt-p+1,xt-p+2,…,xt-1,xt
……
0,0,…,0),
其中,用于表示通用特征的特征分量x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t被分别设置为xt-p+1,xt-p+2,…,xt-1,xt,且用于表示第L个种类商品的商品特征的特征分量xL,t-p+1,xL,t-p+2,…,xL,t-1,xL,t也被分别设置为xt-p+1,xt-p+2,…,xt-1,xt,用于表示其它种类(包括第1~(L-1)种类及第(L+1)~M)的商品特征的特征分量都被设置为0。
步骤S706,根据第二自回归模型估计所构成的点击测试样本对应的未来点击次数,得到待推荐商品的未来点击次数。
可将点击测试样本中的特征值分别代入确定了参数后的(7)式中对应的特征分量,计算得到从而得到待推荐商品的未来点击次数。
基于类似的理由,上述基于时间序列的商品热度预测方法,将点击训练样本的特征空间扩大,根据扩大特征空间后的点击训练样本训练第二自回归模型,并将待推荐商品的近期点击次数序列构成扩大特征空间后的点击测试样本,采用第二自回归模型预测点击测试样本对应的未来点击次数,可以获得较好的预测结果。
采用上述实施例所述的根据扩大特征空间的购买训练样本训练的第一自回归模型预测商品的未来购买次数,以及采用上述实施例所述的根据扩大特征空间的点击训练本校训练的第二自回归模型预测商品的未来点击次数,并计算商品的未来热度为未来购买次数与未来点击次数的比值,向用户推荐未来热度靠前的商品,在实际应用中获得了很好的效果。
图8和图9示出了根据本申请所述的基于时间序列的商品热度预测方法预测的商品热度推荐商品以及采用协同过滤方法和采用基于内容的推荐方法推荐商品时的商品购买次数增长幅度对比图。
其中,基于时间序列的商品热度预测方法采用上述实施例所述的根据扩大特征空间的购买训练样本训练的第一自回归模型预测商品的未来购买次数,以及采用上述实施例所述的根据扩大特征空间的点击训练本校训练的第二自回归模型预测商品的未来点击次数;
三种方法所基于的其它因素相同,例如推荐平台(例如,推荐网页等)、所面向的用户和所推荐的商品数量等;
图8对应于用户画像和用户行为数据的信息较少的场景,图9对应于用户画像和用户行为数据的信息完全没有的场景。
从图8和图9可以明显看出,根据本申请所述的基于时间序列的商品热度预测方法预测的商品热度推荐商品所达到的推荐效果优于采用协同过滤方法和采用基于内容的推荐方法推荐商品所达到的推荐效果。
在一个实施例中,上述基于时间序列的商品热度预测方法,其特征在于,还包括以下步骤:
向用户推送未来热度排名靠前的待推荐商品的信息。
在一个实施例中,可选取未来热度排名靠前的预设数量位待推荐商品。
在另一个实施例中,可选取未来热度靠前的待推荐商品,且选取待推荐商品的数量占所有待推荐商品的总量的预设比例,例如,20%等等。
在一个实施例中,向用户推送的待推荐商品的信息包括待推荐商品的商品序列号、商品名、商品图片和商品描述信息等中的一种或两种以上。
如图10所述,在一个实施例中,一种基于时间序列的商品热度预测系统,包括购买次数估计模块1002、点击次数估计模块1004和热度计算模块1006,其中:
购买次数估计模块1002用于根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到。
点击次数估计模块1004用于根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到。
热度计算模块1006用于计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值。
上述基于时间序列的商品热度预测系统,不需要参考用户画像和用户行为数据,也能准确地预测出用户感兴趣概率较高的商品。
如图11所示,在一个实施例中,上述的基于时间序列的商品热度预测系统,还包括第一模型训练模块1102和第二模型训练模块1104,其中:
第一模型训练模块1102用于根据商品的历史购买次数时间序列构成的购买训练样本训练第一自回归模型。
在一个实施例中,一条历史购买次数时间序列包含的购买次数对应的过去时段的预设数量以p为例;即,一条历史购买次数时间序列包含过去p个时段的购买次数以及该p个时段之后的一个时段的购买次数;购买训练样本的特征即包含p个时段的购买次数。p为预设值。
基于上述实施例,第一自回归模型包含p+1个待估计参数。
在一个实施例中,第一模型训练模块1102可从海量商品的历史购买数据中提取出N条商品的历史购买次数时间序列。N为预设数值。在一个实施例中,N可达到上千万级别。在一个实施例中,N条商品的历史购买次数时间序列可覆盖各个商品种类。
进一步的,第一模型训练模块1102可将每一条商品的历史购买次数时间序列构成一个购买训练样本。其中,商品的历史购买次数时间序列中的过去p个时段的购买次数作为购买训练样本的特征,商品的历史购买次数时间序列中该p个时段的购买次数之后的一个时段的购买次数作为购买训练样本的标记结果。
第一自回归模型的模型公式可设置为:
其中,yt-p+1,yt-p+2,…,yt-1,yt分别表示p个时段的购买次数,表示该p个时段之后的一个时段的预测购买次数。c,w1,w2,…,wp为待估计参数。
进一步的,第一模型训练模块1102可根据购买训练样本求解使得预测购买次数与标记结果之间的误差最小的参数c,w1,w2,…,wp,即,使得下式的E1最小的参数c,w1,w2,…,wp
其中,为N个购买训练样本中第i个购买训练样本的特征对应的预测购买次数;
分别为N个购买训练样本中第i个购买训练样本的特征所包含的按照时段的时间先后顺序排列的p个购买次数;
分别为N个购买训练样本中第i个购买训练样本的标记结果;
λ1是正则项参数;
在一个实施例中,第一模型训练模块1102可采用随机梯度下降方法(StochasticGradient Descent)估计使得E1最小的参数c,w1,w2,…,wp的值。
在另一个实施例中,第一模型训练模块1102可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E1最小的参数c,w1,w2,…,wp的值。
第二模型训练模块1104用于根据商品的历史点击次数时间序列构成的点击训练样本训练第二自回归模型。
在一个实施例中,与第一自回归模型相对应的,第二自回归模型包含p+1个待估计参数。本实施例中,本实施例中,历史点击次数时间序列包含p个时段的点击次数以及该p个时段之后的一个时段的点击次数;点击训练样本的特征即包含p个时段的点击次数。
在一个实施例中,第二模型训练模块1104可从海量商品的历史点击数据中提取出与上述用于训练第一自回归模型的N条商品的历史购买次数时间序列相对应的N条商品的历史点击次数时间序列。一条历史点击次数时间序列与一条历史购买次数时间序列相对应,则该历史点击次数时间序列所包含的点击次数为该历史购买次数时间序列对应时段内对应商品的点击次数。
例如,某一商品的一条历史购买次数时间序列为包含t-p+1,t-p+2,…,t-1,t,t+1时段的购买次数,则对应的历史点击次数时间序列则包含该商品在该t-p+1,t-p+2,…,t-1,t,t+1时段的点击次数。
进一步的,第二模型训练模块1104可将每一条商品的历史点击次数时间序列构成一个点击训练样本。其中,商品的历史点击次数时间序列中的过去p个时段的点击次数作为点击训练样本的特征,商品的历史点击次数时间序列中该p个时段的点击次数之后的一个时段的点击次数作为点击训练样本的标记结果。
第二自回归模型的模型公式可设置为:
其中,xt-p+1,xt-p+2,…,xt-1,xt分别表示p个时段的点击次数,表示该p个时段之后的一个时段的预测点击次数。b,u1,u2,…,up为待估计参数。
进一步的,第二模型训练模块1104可根据点击训练样本求解使得预测点击次数与标记结果之间的误差最小的参数b,u1,u2,…,up,即使得下式的E2最小的参数b,u1,u2,…,up
其中,为N个点击训练样本中第i个点击训练样本的特征对应的预测点击次数;
分别为N个点击训练样本中第i个点击训练样本的特征所包含的按照时段的时间先后顺序排列的p个点击次数;
分别为N个点击训练样本中第i个点击训练样本的标记结果;
λ2是正则项参数;
在一个实施例中,第二模型训练模块1104可采用随机梯度下降方法(StochasticGradient Descent)估计使得E2最小的参数b,u1,u2,…,up的值。
在另一个实施例中,第二模型训练模块1104可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E2最小的参数b,u1,u2,…,up的值。
如图12所示,在一个实施例中,上述的基于时间序列的商品热度预测系统,还包括购买训练样本构成模块1202,用于根据商品的历史购买次数时间序列构成购买训练样本。
在一个实施例中,购买训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,M表示商品被划分的类别的总数量。购买训练样本的特征中指定的特征分量用于表示指定类别的商品特征。购买训练样本的特征空间相对于历史购买次数时间序列被扩大了。也可以理解为,购买训练样本的特征的维数相对于历史购买次数时间序列所包含的过去时段的购买次数的数量更大。
在一个实施例中,购买训练样本可以表示为:(Γ0,Γ1,Γ2,…,ΓM-1,ΓM,R),其中,Γ0用于表示通用特征,Γ1,Γ2,…,ΓM-1,ΓM分别用于表示M类商品中的一个种类商品的商品特征。
在一个实施例中,购买训练样本构成模块1202用于获取商品所属的商品类别,进一步将商品的历史购买次数时间序列中过去预设数量个时段的购买次数作为购买训练样本中商品所属的商品类型对应的特征分量的特征值,以及作为购买训练样本中表示通用特征的特征分量的特征值,将购买训练样本中其它特征分量的特征值设置为0,将商品的历史购买次数时间序列中过去预设数量个时段之后的一个时段的购买次数作为购买训练样本的标记结果。
在一个实施例中,一条历史购买次数时间序列包含的购买次数对应的过去时段的预设数量以p为例,即,一条历史购买次数时间序列包含过去p个时段的购买次数以及该p个时段之后的一个时段的购买次数;p为预设值;
则购买训练样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;
且,第一自回归模型包含p×(M+1)+1个待估计参数。第一自回归模型中,指定的一次项对应指定商品种类,用于表示指定商品种类的商品特征,其中,一个商品种类对应p个一次项,各个商品种类对应的p个一次项不相同且不重叠;而且,第一自回归模型中指定的p个一次项用于对应通用特征。第一自回归模型中的一个一次项对应一个时段的购买次数。
在一个实施例中,基于上述实施例,第一自回归模型的模型公式可设置为:
其中,y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t表示通用特征;yk,t-p+1,yk,t-p+2,…,yk,t-1,yk,t分别表示p个时段的购买次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;表示该p个时段之后的一个时段的预测购买次数。c,wkj(k=0,1,…,M;j=1,…,p)为待估计参数。
在一个实施例中,购买训练样本构成模块1202可从海量商品的历史购买数据中提取出N条商品的历史购买次数时间序列,构成N个购买训练样本。N为预设数值。
第一模型训练模块1102可将N个购买训练样本中的特征值分别代入到第一自回归模型中对应的一次项中,得到购买训练样本的特征值对应的预测的未来购买次数,并求解第一自回归模型中的待估计参数,使得购买训练样本对应的预测未来购买次数与购买训练样本的标记结果之间的误差最小。
具体而言,第一模型训练模块1102可根据N个购买训练样本求解使得预测购买次数与标记结果之间的误差最小的参数c,wkj(k=0,1,…,M;j=1,…,p),即,使得下式的E3最小的参数c,wkj(k=0,1,…,M;j=1,…,p):
其中,为N个购买训练样本中第i个购买训练样本的特征对应的预测购买次数;
分别为N个购买训练样本中第i个购买训练样本的特征所包含的按照时段的时间先后顺序排列的p个购买次数;
Li表示第i个购买训练样本对应的商品所属的商品种类在上述M个商品种类中的排列序号,可以理解为,第i个购买训练样本对应的商品属于上述M个商品种类中的第Li个种类;
由于第i个购买训练样本对应的商品属于上述M个商品种类中的第Li个种类,因此,购买训练样本中用于表示第1~(Li-1)种类及第(Li+1)~M种类商品的商品特征的特征分量都为0,因此,
分别为N个购买训练样本中第i个购买训练样本的标记结果;
λ3是正则项参数;
在一个实施例中,第一模型训练模块1102可采用随机梯度下降方法(StochasticGradient Descent)估计使得E3最小的参数c,wkj(k=0,1,…,M;j=1,…,p)的值。
在另一个实施例中,第一模型训练模块1102可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E3最小的参数c,wkj(k=0,1,…,M;j=1,…,p)的值。
在一个实施例中,购买次数估计模块1002用于获取待推荐商品所属的商品类别,将待推荐商品的近期购买次数时间序列中所包含的近期预设数量个时段的购买次数构成购买测试样本,购买测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将近期预设数量个时段的购买次数作为购买测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为购买测试样本中表示通用特征的特征分量的特征值,将购买测试样本中其它特征分量的特征值设置为0。
其中,待推荐商品所属的商品类别对应的特征分量表示待推荐商品所属的商品类别的商品特征的特征分量。
购买测试样本的特征空间相对于近期购买次数时间序列被扩大了。也可以理解为,购买测试样本的特征的维数相对于近期购买次数时间序列所包含的近期时段的购买次数的数量更大。
在一个实施例中,一条近期购买次数时间序列包含的购买次数对应的近期时段的预设数量以p为例,即,一条近期购买次数时间序列包含近期p个时段的购买次数;p为预设值;
则购买测试样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;记购买测试样本为:
{y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t
y1,t-p+1,y1,t-p+2,…,y1,t-1,y1,t
……
yk,t-p+1,yk,t-p+2,…,yk,t-1,yk,t
……
yM,t-p+1,yM,t-p+2,…,yM,t-1,yM,t
}
其中,y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t表示通用特征;yk,t-p+1,yk,t-p+2,…,yk,t-1,yk,t分别表示p个时段的购买次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;
记待推荐商品的一条近期购买次数时间序列中所包含的近期p个时段的购买次数为:yt-p+1,yt-p+2,…,yt-1,yt,且记待推荐商品在上述的M个商品种类属于第L个种类,则根据该近期购买次数时间序列构成的购买测试样本为:
(yt-p+1,yt-p+2,…,yt-1,yt
0,0,…,0,
……
yt-p+1,yt-p+2,…,yt-1,yt
……
0,0,…,0),
其中,用于表示通用特征的特征分量y0,t-p+1,y0,t-p+2,…,y0,t-1,y0,t被分别设置为yt-p+1,yt-p+2,…,yt-1,yt,且用于表示第L个种类商品的商品特征的特征分量yL,t-p+1,yL,t-p+2,…,yL,t-1,yL,t也被分别设置为yt-p+1,yt-p+2,…,yt-1,yt,用于表示其它种类(包括第1~(L-1)种类及第(L+1)~M)的商品特征的特征分量都被设置为0。
进一步的,购买次数估计模块1002用于根据第一自回归模型估计所构成的购买测试样本对应的未来购买次数,得到待推荐商品的未来购买次数。
购买次数估计模块1002可将购买测试样本中的特征值分别代入确定了参数后的(5)式中对应的特征分量,计算得到从而得到待推荐商品的未来购买次数。
如图13所示,在一个实施例中,上述的基于时间序列的商品热度预测系统,还包括点击训练样本构成模块1302,用于根据商品的历史点击次数时间序列构成点击训练样本的过程。
在一个实施例中,点击训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,M表示商品被划分的类别的总数量。点击训练样本的特征中指定的特征分量用于表示指定类别的商品特征。点击训练样本的特征空间相对于历史点击次数时间序列被扩大了。也可以理解为,点击训练样本的特征的维数相对于历史点击次数时间序列所包含的过去时段的点击次数的数量更大。
在一个实施例中,点击训练样本可以表示为:(τ0,τ1,τ2,…,τM-1,τM,Q),其中,τ0用于表示通用特征,τ1,τ2,…,τM-1,τM分别用于表示M类商品中的一个种类商品的商品特征。
在一个实施例中,点击训练样本构成模块1302根据商品的历史点击次数时间序列构成点击训练样本的过程包括:获取商品所属的商品类别,将商品的历史点击次数时间序列中过去预设数量个时段的点击次数作为点击训练样本中商品所属的商品类型对应的特征分量的特征值,以及作为点击训练样本中表示通用特征的特征分量的特征值,将点击训练样本中其它特征分量的特征值设置为0,将商品的历史点击次数时间序列中过去预设数量个时段之后的一个时段的点击次数作为点击训练样本的标记结果。
例如,某一商品的历史点击次数时间序列中过去预设数量个时段的点击次数可表示为τ,该历史点击次数时间序列中上述预设数量个时段之后的一个时段的点击次数可表示为q,则根据该历史点击次数时间序列构成的点击训练样本可表示为(τ,…,0,τ,0,…,q),其中,τ0和τi的值被设置为τ,τ0用于表示通用特征,τi用于表示商品所属的商品类别对应的商品特征,而其它的特征分量(包括τ1~τi-1以及τi-1~τM)都被设置为0,标记结果Q则被设置为q。
在一个实施例中,一条历史点击次数时间序列包含的点击次数对应的过去时段的预设数量以p为例,即,一条历史点击次数时间序列包含过去p个时段的点击次数以及该p个时段之后的一个时段的点击次数;p为预设值;
则点击训练样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;
且,第二自回归模型包含p×(M+1)+1个待估计参数。第二自回归模型中,指定的数据项对应指定商品种类,用于表示指定商品种类的商品特征,其中,一个商品种类对应p个数据项,各个商品种类对应的p个数据项不相同且不重叠;而且,第二自回归模型中指定的p个数据项用于对应通用特征。
在一个实施例中,基于上述实施例,第二自回归模型的模型公式可设置为:
其中,x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t表示通用特征;xk,t-p+1,xk,t-p+2,…,xk,t-1,xk,t分别表示p个时段的点击次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;表示该p个时段之后的一个时段的预测点击次数。b,ukj(k=0,1,…,M;j=1,…,p)为待估计参数。
在一个实施例中,点击训练样本构成模块1302可从海量商品的历史点击数据中提取出N条商品的历史点击次数时间序列,构成N个点击训练样本。N为预设数值。在一个实施例中,本实施例中提取出的N条历史点击次数时间序列与上述实施例中提取的N条历史购买次数时间序列相对应。
第二模型训练模块1104可将N个点击训练样本中的特征值分别代入到第二自回归模型中对应的一次项中,得到点击训练样本的特征值对应的预测的未来点击次数,并求解第二自回归模型中的待估计参数,使得点击训练样本对应的预测未来点击次数与购买训练样本的标记结果之间的误差最小。
具体而言,第二模型训练模块1104可根据N个点击训练样本求解使得预测点击次数与标记结果之间的误差最小的参数b,ukj(k=0,1,…,M;j=1,…,p),即,使得下式的E4最小的参数b,ukj(k=0,1,…,M;j=1,…,p):
其中,为N个点击训练样本中第i个点击训练样本的特征对应的预测点击次数;
分别为N个点击训练样本中第i个点击训练样本的特征所包含的按照时段的时间先后顺序排列的p个点击次数;
Li表示第i个点击训练样本对应的商品所属的商品种类在上述M个商品种类中的排列序号,可以理解为,第i个点击训练样本对应的商品属于上述M个商品种类中的第Li个种类;
由于第i个点击训练样本对应的商品属于上述M个商品种类中的第Li个种类,因此,点击训练样本中用于表示第1~(Li-1)种类及第(Li+1)~M种类商品的商品特征的特征分量都为0,因此,
分别为N个点击训练样本中第i个点击训练样本的标记结果;
λ4是正则项参数;
在一个实施例中,第二模型训练模块1104可采用随机梯度下降方法(StochasticGradient Descent)估计使得E4最小的参数b,ukj(k=0,1,…,M;j=1,…,p)的值。
在另一个实施例中,第二模型训练模块1104可采用最小二乘法、解Yule-Walker方程法、UI-rych-Clayton法、LUD法、BSMF法或Burg法估计使得E4最小的参数b,ukj(k=0,1,…,M;j=1,…,p)的值。
在一个实施例中,点击次数估计模块1004用于获取待推荐商品所属的商品类别,将待推荐商品的近期点击次数时间序列中所包含的近期预设数量个时段的点击次数构成点击测试样本,点击测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将近期预设数量个时段的点击次数作为点击测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为点击测试样本中表示通用特征的特征分量的特征值,将点击测试样本中其它特征分量的特征值设置为0。
其中,待推荐商品的近期点击次数时间序列与上述的用于计算待推荐商品的未来购买次数的近期购买次数时间序列相对应。
点击测试样本的特征空间相对于近期点击次数时间序列被扩大了。也可以理解为,点击测试样本的特征的维数相对于近期点击次数时间序列所包含的近期时段的点击次数的数量更大。
在一个实施例中,一条近期点击次数时间序列包含的点击次数对应的近期时段的预设数量以p为例,即,一条近期点击次数时间序列包含近期p个时段的点击次数;p为预设值;
则点击测试样本的特征所包含的用于表示M类商品中各类商品的商品特征的特征分量以及用于表示通用特征的特征分量的维数为p;记点击测试样本为:
{x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t
x1,t-p+1,x1,t-p+2,…,x1,t-1,x1,t
……
xk,t-p+1,xk,t-p+2,…,xk,t-1,xk,t
……
xM,t-p+1,xM,t-p+2,…,xM,t-1,xM,t
}
其中,x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t表示通用特征;xk,t-p+1,xk,t-p+2,…,xk,t-1,xk,t分别表示p个时段的点击次数且对应于M个商品种类中的第k个种类,其中k=1,…,M;
记待推荐商品的一条近期点击次数时间序列中所包含的近期p个时段的点击次数为:xt-p+1,xt-p+2,…,xt-1,xt,且记待推荐商品在上述的M个商品种类属于第L个种类,则根据该近期点击次数时间序列构成的点击测试样本为:
(xt-p+1,xt-p+2,…,xt-1,xt
0,0,…,0,
……
xt-p+1,xt-p+2,…,xt-1,xt
……
0,0,…,0),
其中,用于表示通用特征的特征分量x0,t-p+1,x0,t-p+2,…,x0,t-1,x0,t被分别设置为xt-p+1,xt-p+2,…,xt-1,xt,且用于表示第L个种类商品的商品特征的特征分量xL,t-p+1,xL,t-p+2,…,xL,t-1,xL,t也被分别设置为xt-p+1,xt-p+2,…,xt-1,xt,用于表示其它种类(包括第1~(L-1)种类及第(L+1)~M)的商品特征的特征分量都被设置为0。
进一步的,点击次数估计模块1004用于根据所述第二自回归模型估计所构成的点击测试样本对应的未来点击次数,得到待推荐商品的未来点击次数。
点击次数估计模块1004可将点击测试样本中的特征值分别代入确定了参数后的(7)式中对应的特征分量,计算得到从而得到待推荐商品的未来点击次数。
基于类似的理由,上述基于时间序列的商品热度预测系统,将点击训练样本的特征空间扩大,根据扩大特征空间后的点击训练样本训练第二自回归模型,并将待推荐商品的近期点击次数序列构成扩大特征空间后的点击测试样本,采用第二自回归模型预测点击测试样本对应的未来点击次数,可以获得较好的预测结果。
如图14所示,在一个实施例中,上述基于时间序列的商品热度预测系统,还包括推荐模块1402,用于向用户推送未来热度排名靠前的待推荐商品的信息。
在一个实施例中,推荐模块1402可选取未来热度排名靠前的预设数量位待推荐商品。
在另一个实施例中,推荐模块1402可选取未来热度靠前的待推荐商品,且选取待推荐商品的数量占所有待推荐商品的总量的预设比例,例如,20%等等。
在一个实施例中,推荐模块1402可向用户推送的待推荐商品的信息包括待推荐商品的商品序列号、商品名、商品图片和商品描述信息等中的一种或两种以上。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (14)

1.一种基于时间序列的商品热度预测方法,包括以下步骤:
根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,所述第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到;
根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,所述第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到;
计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值。
2.根据权利要求1所述的基于时间序列的商品热度预测方法,其特征在于,还包括以下步骤:
根据商品的历史购买次数时间序列构成的购买训练样本训练所述第一自回归模型;
根据商品的历史点击次数时间序列构成的点击训练样本训练所述第二自回归模型。
3.根据权利要求1所述的基于时间序列的商品热度预测方法,其特征在于,还包括根据商品的历史购买次数时间序列构成购买训练样本的过程,某一商品的一条历史购买次数时间序列包含该商品过去预设数量个时段的购买次数以及该预设数量个时段之后的一个时段的购买次数,所述购买训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,所述M表示商品被划分的类别的总数量;
所述根据商品的历史购买次数时间序列构成购买训练样本的过程包括以下步骤:
获取商品所属的商品类别;
将商品的历史购买次数时间序列中所述预设数量个时段的购买次数作为购买训练样本中商品所属的商品类型对应的特征分量的特征值,以及将商品的历史购买次数时间序列中所述预设数量个时段的购买次数作为购买训练样本中表示通用特征的特征分量的特征值,将购买训练样本中其它特征分量的特征值设置为0,将商品的历史购买次数时间序列中所述之后的一个时段的购买次数作为购买训练样本的标记结果。
4.根据权利要求3所述的基于时间序列的商品热度预测方法,其特征在于,所述待推荐商品的近期购买次数时间序列包括待推荐商品近期的预设数量个时段的购买次数;
根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数的步骤包括:
获取待推荐商品所属的商品类别;
将所述近期预设数量个时段的购买次数构成购买测试样本,所述购买测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将所述近期预设数量个时段的购买次数作为购买测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为购买测试样本中表示通用特征的特征分量的特征值,将购买测试样本中其它特征分量的特征值设置为0;
根据所述第一自回归模型估计所构成的购买测试样本对应的未来购买次数,得到待推荐商品的未来购买次数。
5.根据权利要求1所述的基于时间序列的商品热度预测方法,其特征在于,还包括根据商品的历史点击次数时间序列构成点击训练样本的过程,某一商品的一条历史点击次数时间序列包含该商品的预设数量个时段的点击次数以及该预设数量个时段之后的一个时段的点击次数,所述点击训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,所述M表示商品被划分的类别的总数量;
所述根据商品的历史点击次数时间序列构成点击训练样本的过程包括以下步骤:
获取商品所属的商品类别;
将商品的历史点击次数时间序列中所述预设数量个时段的点击次数作为点击训练样本中商品所属的商品类型对应的特征分量的特征值,以及作为点击训练样本中表示通用特征的特征分量的特征值,将点击训练样本中其它特征分量的特征值设置为0,将商品的历史点击次数时间序列中所述之后的一个时段的点击次数作为点击训练样本的标记结果。
6.根据权利要求5所述的基于时间序列的商品热度预测方法,其特征在于,所述待推荐商品的近期点击次数时间序列包括待推荐商品近期的预设数量个时段的点击次数;
根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数的步骤包括:
获取待推荐商品所属的商品类别;
将所述近期预设数量个时段的点击次数构成点击测试样本,所述点击测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将所述近期预设数量个时段的点击次数作为点击测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为点击测试样本中表示通用特征的特征分量的特征值,将点击测试样本中其它特征分量的特征值设置为0;
根据所述第二自回归模型估计所构成的点击测试样本对应的未来点击次数,得到待推荐商品的未来点击次数。
7.根据权利要求1所述的基于时间序列的商品热度预测方法,其特征在于,还包括以下步骤:
向用户推送未来热度排名靠前的待推荐商品的信息。
8.一种基于时间序列的商品热度预测系统,其特征在于,包括:
购买次数估计模块,用于根据待推荐商品的近期购买次数时间序列以及第一自回归模型估计待推荐商品的未来购买次数,所述第一自回归模型根据商品的历史购买次数时间序列构成的购买训练样本训练得到;
点击次数估计模块,用于根据待推荐商品的近期点击次数时间序列以及第二自回归模型估计待推荐商品的未来点击次数,所述第二自回归模型根据商品的历史点击次数时间序列构成的点击训练样本训练得到;
热度计算模块,用于计算待推荐商品的未来热度为估计得到的待推荐商品的未来购买次数与估计得到的待推荐商品的未来点击次数的比值。
9.根据权利要求8所述的基于时间序列的商品热度预测系统,其特征在于,还包括:
第一模型训练模块,用于根据商品的历史购买次数时间序列构成的购买训练样本训练所述第一自回归模型;
第二模型训练模块,用于根据商品的历史点击次数时间序列构成的点击训练样本训练所述第二自回归模型。
10.根据权利要求8所述的基于时间序列的商品热度预测系统,其特征在于,还包括:
购买训练样本构成模块,用于根据商品的历史购买次数时间序列构成购买训练样本,某一商品的一条历史购买次数时间序列包含该商品过去预设数量个时段的购买次数以及该预设数量个时段之后的一个时段的购买次数,所述购买训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,所述M表示商品被划分的类别的总数量;
所述购买训练样本构成模块根据商品的历史购买次数时间序列构成购买训练样本的过程包括:获取商品所属的商品类别;将商品的历史购买次数时间序列中所述预设数量个时段的购买次数作为购买训练样本中商品所属的商品类型对应的特征分量的特征值,以及将商品的历史购买次数时间序列中所述预设数量个时段的购买次数作为购买训练样本中表示通用特征的特征分量的特征值,将购买训练样本中其它特征分量的特征值设置为0,将商品的历史购买次数时间序列中所述之后的一个时段的购买次数作为购买训练样本的标记结果。
11.根据权利要求10所述的基于时间序列的商品热度预测系统,其特征在于,所述待推荐商品的近期购买次数时间序列包括待推荐商品近期的预设数量个时段的购买次数;
所述购买次数估计模块用于获取待推荐商品所属的商品类别,将所述近期预设数量个时段的购买次数构成购买测试样本,所述购买测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将所述近期预设数量个时段的购买次数作为购买测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为购买测试样本中表示通用特征的特征分量的特征值,将购买测试样本中其它特征分量的特征值设置为0,进一步根据所述第一自回归模型估计所构成的购买测试样本对应的未来购买次数,得到待推荐商品的未来购买次数。
12.根据权利要求8所述的基于时间序列的商品热度预测系统,其特征在于,还包括:
点击训练样本构成模块,用于根据商品的历史点击次数时间序列构成点击训练样本,某一商品的一条历史点击次数时间序列包含该商品的预设数量个时段的点击次数以及该预设数量个时段之后的一个时段的点击次数,所述点击训练样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,所述M表示商品被划分的类别的总数量;
所述点击训练样本构成模块根据商品的历史点击次数时间序列构成点击训练样本的过程包括:获取商品所属的商品类别;将商品的历史点击次数时间序列中所述预设数量个时段的点击次数作为点击训练样本中商品所属的商品类型对应的特征分量的特征值,以及作为点击训练样本中表示通用特征的特征分量的特征值,将点击训练样本中其它特征分量的特征值设置为0,将商品的历史点击次数时间序列中所述之后的一个时段的点击次数作为点击训练样本的标记结果。
13.根据权利要求12所述的基于时间序列的商品热度预测系统,其特征在于,所述待推荐商品的近期点击次数时间序列包括待推荐商品近期的预设数量个时段的点击次数;
所述点击次数估计模块用于获取待推荐商品所属的商品类别,将所述近期预设数量个时段的点击次数构成点击测试样本,所述点击测试样本的特征包含用于表示M类商品的商品特征的特征分量以及用于表示通用特征的特征分量,其中,将所述近期预设数量个时段的点击次数作为点击测试样本中待推荐商品所属的商品类别对应的特征分量的特征值,以及作为点击测试样本中表示通用特征的特征分量的特征值,将点击测试样本中其它特征分量的特征值设置为0,进一步根据所述第二自回归模型估计所构成的点击测试样本对应的未来点击次数,得到待推荐商品的未来点击次数。
14.根据权利要求8所述的基于时间序列的商品热度预测系统,其特征在于,还包括:
推荐模块,用于向用户推送未来热度排名靠前的待推荐商品的信息。
CN201510358159.5A 2015-06-25 2015-06-25 基于时间序列的商品热度预测方法和系统 Active CN104915734B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510358159.5A CN104915734B (zh) 2015-06-25 2015-06-25 基于时间序列的商品热度预测方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510358159.5A CN104915734B (zh) 2015-06-25 2015-06-25 基于时间序列的商品热度预测方法和系统

Publications (2)

Publication Number Publication Date
CN104915734A CN104915734A (zh) 2015-09-16
CN104915734B true CN104915734B (zh) 2017-03-22

Family

ID=54084781

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510358159.5A Active CN104915734B (zh) 2015-06-25 2015-06-25 基于时间序列的商品热度预测方法和系统

Country Status (1)

Country Link
CN (1) CN104915734B (zh)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105761102B (zh) * 2016-02-04 2021-05-11 杭州朗和科技有限公司 一种预测用户购买商品行为的方法和装置
CN107239963A (zh) * 2016-03-29 2017-10-10 阿里巴巴集团控股有限公司 抢购平台商品上线方法、装置及抢购系统
CN107330709B (zh) * 2016-04-29 2020-05-05 阿里巴巴集团控股有限公司 确定目标对象的方法及装置
CN107105031A (zh) * 2017-04-20 2017-08-29 北京京东尚科信息技术有限公司 信息推送方法和装置
CN107341176B (zh) * 2017-05-23 2020-05-29 北京三快在线科技有限公司 一种样本权重设置方法及装置,电子设备
CN108304440B (zh) * 2017-11-01 2021-08-31 腾讯科技(深圳)有限公司 游戏推送的方法、装置、计算机设备及存储介质
CN111143579A (zh) * 2018-11-05 2020-05-12 北京京东尚科信息技术有限公司 索引库信息生成方法和装置
CN109934633A (zh) * 2019-03-15 2019-06-25 广州溯源信息技术有限公司 一种基于rfid技术的精准营销陈列架系统及方法
CN109961192B (zh) * 2019-04-03 2021-11-26 南京中科九章信息技术有限公司 目标事件预测方法及装置
CN110322203B (zh) * 2019-07-05 2022-05-03 江苏云脑数据科技有限公司 零售业库存优化分析方法
CN110503332B (zh) * 2019-08-21 2022-12-30 谷元(上海)文化科技有限责任公司 一种信息筛选处理方法
CN111178951B (zh) * 2019-12-20 2023-05-16 深圳大学 一种商品推荐方法及装置
CN111598310A (zh) * 2020-04-27 2020-08-28 天闻数媒科技(北京)有限公司 一种基于时间序列分析的图书热度预测方法以及设备
CN112132622B (zh) * 2020-09-25 2021-07-16 北京达佳互联信息技术有限公司 数据预估方法及装置
CN112150206B (zh) * 2020-09-28 2022-11-08 京东科技控股股份有限公司 用户感兴趣物品的预测方法及设备
CN113010779B (zh) * 2021-03-10 2023-07-25 腾讯科技(深圳)有限公司 媒体信息的热度计算方法、装置、电子设备及存储介质
CN117114761B (zh) * 2023-10-18 2024-02-06 深圳迅销科技股份有限公司 基于积分数据分析的供应链信息管理系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012221469A (ja) * 2011-04-14 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 購買データ解析装置、方法、及びプログラム
CN104484708A (zh) * 2014-11-12 2015-04-01 南京大学 一种基于一元线性回归和最小二乘法的商品需求预测方法
CN104517224A (zh) * 2014-12-22 2015-04-15 浙江工业大学 一种网络热销商品的预测方法及系统
CN104616180A (zh) * 2015-03-09 2015-05-13 浪潮集团有限公司 一种热销商品预测方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012221469A (ja) * 2011-04-14 2012-11-12 Nippon Telegr & Teleph Corp <Ntt> 購買データ解析装置、方法、及びプログラム
CN104484708A (zh) * 2014-11-12 2015-04-01 南京大学 一种基于一元线性回归和最小二乘法的商品需求预测方法
CN104517224A (zh) * 2014-12-22 2015-04-15 浙江工业大学 一种网络热销商品的预测方法及系统
CN104616180A (zh) * 2015-03-09 2015-05-13 浪潮集团有限公司 一种热销商品预测方法

Also Published As

Publication number Publication date
CN104915734A (zh) 2015-09-16

Similar Documents

Publication Publication Date Title
CN104915734B (zh) 基于时间序列的商品热度预测方法和系统
CN108804633B (zh) 基于行为语义知识网络的内容推荐方法
CN108256093B (zh) 一种基于用户多兴趣及兴趣变化的协同过滤推荐算法
US20200117675A1 (en) Obtaining of Recommendation Information
CN109582876B (zh) 旅游行业用户画像构造方法、装置和计算机设备
US8380784B2 (en) Correlated information recommendation
US8738436B2 (en) Click through rate prediction system and method
CN105824912A (zh) 基于用户画像的个性化推荐方法和装置
CN104050184B (zh) 显示页面内容的方法及装置
CN106503022A (zh) 推送推荐信息的方法和装置
KR102340463B1 (ko) 샘플 가중치 설정방법 및 장치, 전자 기기
CN108510303A (zh) 广告投放方法及装置
CN104391849A (zh) 融入时间上下文信息的协同过滤推荐方法
CN102567900A (zh) 一种向客户推荐商品的方法
CN107895213A (zh) 消费额度的预测方法、装置及电子设备
CN105009103A (zh) 网页的显示时间
CN110019943A (zh) 视频推荐方法、装置、电子设备和存储介质
CN110753920A (zh) 用于优化和模拟网页排序和流量的系统和方法
CN108153792A (zh) 一种数据处理方法和相关装置
CN106570031A (zh) 一种业务对象的推荐方法和装置
CN109460519A (zh) 浏览对象推荐方法及装置、存储介质、服务器
CN104615631A (zh) 一种信息推荐的方法及装置
CN105894310A (zh) 一种个性化推荐方法
CN112487283A (zh) 训练模型的方法、装置、电子设备及可读存储介质
CN111340522B (zh) 资源推荐方法、装置、服务器及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant