CN108090794B - 一种基于动态滑动时间窗口的商品对象排序方法及装置 - Google Patents
一种基于动态滑动时间窗口的商品对象排序方法及装置 Download PDFInfo
- Publication number
- CN108090794B CN108090794B CN201611036050.0A CN201611036050A CN108090794B CN 108090794 B CN108090794 B CN 108090794B CN 201611036050 A CN201611036050 A CN 201611036050A CN 108090794 B CN108090794 B CN 108090794B
- Authority
- CN
- China
- Prior art keywords
- time window
- determining
- dynamic sliding
- commodity
- sliding time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明实施例提供一种基于动态滑动时间窗口的商品对象排序方法和设备,所述方法包括:确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。本发明实施例可以确定动态滑动时间窗口,有效提高商品对象排序结果的时效性和准确性。
Description
技术领域
本发明实施例涉及计算机技术领域,具体涉及一种基于动态滑动时间窗口的商品对象排序方法及装置。
背景技术
随着网络技术的发展,人们使用互联网来检索、获取信息。为了方便用户直观、有效地获取信息,在展示信息时往往需要对信息进行排序。举例说明,在线商品交易网站往往会统计各店铺的商品的热门程度,根据商品的热门程度顺序展示商品,或者将热门商品在显著位置上展示。用户可以点击感兴趣的热门商品进行查看。这样,通过对热门商品的排序,增加了商品的点击率,提高了用户获取信息的效率。
现有技术中,针对不同店铺的热门商品,往往采用固定的时间窗口进行统计。例如,针对所有店铺,统计1小时内的热门商品。然而,由于每个店铺的访问量不同,当采用固定的时间窗口采集数据时,往往会出现无法捕捉到热门店铺的实时热点商品或者不能有效统计冷门店铺的热门商品的情况。因此,现有技术提供的固定时间窗口的排序方法,不能够实时、有效、准确地对商品进行排序。由于排序结果的时效性和准确性不高,将会导致将部分无效或者不准确的信息推送给用户,导致网络资源的占用和浪费。用户也需要多次点击才能找到真正感兴趣的商品,由此增加了用户查找感兴趣信息的时间,增加了用户与网络的交互,并从一定程度上造成了网络资源的占用和浪费。
发明内容
本发明实施例提供了一种基于动态滑动时间窗口的商品对象排序方法及装置,可以确定动态滑动时间窗口,有效提高商品对象排序结果的时效性和准确性。
为此,本发明实施例提供如下技术方案:
第一方面,本发明实施例提供了一种基于动态滑动时间窗口的商品对象排序方法,包括:实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果;根据所述解析结果确定当前店铺的流量密度;根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口;根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分;基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。
第二方面,本发明实施例提供了一种基于动态滑动时间窗口的商品对象排序方法,包括:确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
第三方面,本发明实施例提供了一种基于动态滑动时间窗口的商品对象排序装置,包括:用户行为日志采集单元,用于实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果;流量密度确定单元,用于根据所述解析结果确定当前店铺的流量密度;动态滑动时间窗口确定单元,用于根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口;排序单元,用于根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分;基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。
第四方面,本发明实施例提供了一种基于动态滑动时间窗口的商品对象排序装置,包括:流量密度确定单元,用于确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;动态滑动时间窗口确定单元,用于根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;排序单元,用于计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
第五方面,本发明实施例提供了一种用于基于动态滑动时间窗口的商品对象排序的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果;根据所述解析结果确定当前店铺的流量密度;根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口;根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分;基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。
第六方面,本发明实施例提供了一种用于基于动态滑动时间窗口的商品对象排序的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
本发明实施例提供的基于动态滑动时间窗口的商品对象排序方法及装置,可以通过计算不同统计单元的流量密度,根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口,并基于所述动态滑动时间窗口,计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。由于本发明可以针对不同的统计单元,确定不同的时间窗口进行排序,从而有效提高商品对象排序结果的时效性和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例一个应用场景示意图;
图2为本发明一实施例提供的基于动态滑动时间窗口的商品对象排序方法流程图;
图3为本发明另一实施例提供的基于动态滑动时间窗口的商品对象排序方法流程图;
图4为本发明再一实施例提供的基于动态滑动时间窗口的商品对象排序方法流程图;
图5为本发明一实施例提供的基于动态滑动时间窗口的商品对象排序装置示意图;
图6为本发明又一实施例提供的基于动态滑动时间窗口的商品对象排序装置示意图;
图7是根据一示例性实施例示出的一种用于基于动态滑动时间窗口的商品对象排序装置的框图。
具体实施方式
本发明实施例提供了一种基于动态滑动时间窗口的商品对象排序方法及装置,可以确定动态滑动时间窗口,有效提高商品对象排序结果的时效性和准确性。
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
参见图1,为本发明实施例的示例性应用场景。本发明实施例提供的方法可以应用于如图1所示的场景,其中,本发明实施例提供的方法可以应用于如图1所示的网上交易系统200中,其中,所述网上交易系统可以与多个客户端进行数据交互,所述多个客户端例如可以是客户端101、客户端102……客户端N。网上交易系统200用于提供商品对象信息处理,卖家可以通过客户端在所述网上交易系统200上展示商品对象,买家可以通过客户端从网上交易系统200上购买商品对象。当然,本发明实施例还可以应用到其他场景中,在此不进行限制。需要注意的是,上述应用场景仅是为了便于理解本发明而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
下面将结合附图2至附图4对本发明示例性实施例示出的基于动态滑动时间窗口的商品对象排序方法进行介绍。
参见图2,为本发明一实施例提供的基于动态滑动时间窗口的商品对象排序方法流程图。如图2所示,可以包括:
S201,确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系。
具体实现时,所述当前统计单元可以是店铺、类目或者网站。举例说明,若需统计某个店铺的热门商品对象,则可以将店铺作为一个统计单元。又举例说明,类目一般是指对物品(例如商品对象)的分类,例如可以将商品对象分为女装类、男装类、母婴类、生活用品类、电子产品类等,具体的划分方式可以是多样的,在此不限制。在实际应用中,可以统计某一类目下的热门商品对象排序,还可以针对全网即整个网站进行统计。当然,本发明的方法也可以应用到其他统计维度,在此不进行限制。需要说明的是,商品对象与统计单元具有归属关系。例如,商品对象与店铺具有归属关系,或者,商品对象与类目具有归属关系。
在一些实施方式中,在确定当前统计单元的流量密度时,可以根据所述当前统计单元的流量与基准时间窗口的比值确定流量密度;所述当前统计单元的流量与当前统计单元的页面访问次数或者当前统计单元的用户访问次数相关联。具体实现时,可以实时获取日志,对所述日志进行解析,获取当前统计单元的流量,所述流量可以是页面访问次数PV,或者用户访问次数UV等。
在一些实施方式中,可以通过以下公式获取流量密度:
其中,ρ代表流量密度,Δf为流量,Δtn-1为基准时间窗口值,单位可以是秒s、毫秒ms或者分钟min。具体实现时,基准时间窗口的初始值为Δt0,后续取值为上一个时间窗口的大小。n为正整数。
S202,根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口。
在一些实施方式中,所述根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口包括:当所述流量密度大于第一阈值时,调整基准时间窗口的大小使之变小,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口;当所述流量密度小于第二阈值时,调整基准时间窗口的大小使之变大,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口。
举例说明,为了有效获取商品对象的热度,需要确定时间窗口的大小。如果热度时间区间太小,则用户行为稀疏,如果时间区间太大,得不到时效性。因此,本发明通过确定动态时间窗口,以有效确定商品对象热度排序。为了解决冷启动问题,基准时间窗口的初始值由离线获取,初始值大小为Δt0,例如可以是5分钟,10分钟或者1h等。而当Δtn-1时间的流量密度ρ小于α时,则对窗口进行扩大,而当Δtn-1内的流量密度ρ大于β时则对窗口进行缩减。具体计算公式如下:
其中,Δtn代表当前滑动时间窗口大小。K代表衰减系数,其取值可以根据经验确定,K为正数。利用上述公式,可以保证衰减的范围在[0,K]之间。其中ρ0代表置信的流量密度,其取值例如可以是所有统计单元流量密度的均值。当ρ是当前流量密度。Δtn-1为基准时间窗口,其取值可以是上一个滑动时间窗口的值,n为正整数。α以及β为正数,其取值可以根据经验确定。
sigmoid的公式为:
需要说明的是,上述公式仅为确定动态时间窗口的一种实现方式,还可以采用其他方法获得动态时间窗口,在此不进行限定。
S203,计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
具体实现时,S203可以通过下述步骤实现:
S203A,分析用户行为数据,对用户行为数据进行分类,对不同类别的用户行为赋予不同的权重得分。
具体实现时,可以实时接收用户行为日志,对用户行为日志进行清洗,甄别出不同类别的用户行为,并针对不同类别的用户行为赋予不同的权重得分Wi。举例说明,针对某一店铺的某一商品对象,用户行为的分类可以是浏览、收藏、添加购物车、购买等。针对不同类别的用户行为,其权重得分也是不一样的。例如,购买行为的权重得分大于添加购物车行为的权重得分,添加购物车行为的权重得分大于收藏行为的权重得分,收藏行为的权重得分大于浏览行为的权重得分。具体的权重得分可以根据经验设定。
S203B,根据用户行为与商品对象的对应关系以及商品对象与统计单元的归属关系,确定与归属于当前统计单元的各商品对象具有对应关系的用户行为的权重得分,根据所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分。
具体实现时,可以根据用户行为与商品对象的对应关系以及商品对象与统计单元的归属关系,获得在当前统计单元下某个商品对象对应的所有用户行为的权重得分总和。举例说明,可以统计某个店铺下的某个商品对象对应的所有用户行为,针对该用户行为的类别获得所述用户行为的权重得分,将所有用户行为的权重得求和即可以得到与归属于当前统计单元的各商品对象具有对应关系的用户行为的权重得分。在根据所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分时,可以利用时间衰减因子以及所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分。具体实现时,可以计算与商品对象具有对应关系各用户行为的权重得分乘以时间衰减因子得到的乘积;计算在所述动态滑动时间窗口内得到的乘积的和值作为所述商品对象的得分。
在一些实施方式中,可以通过以下方式得到商品对象的得分:
其中,ScoreT代表商品对象的得分,Δtn代表当前滑动时间窗口,Δt是用户行为发生时间与当前统计时间的差值。λ,σ是衰减因子,其取值范围一般是(0,1)。wi是某次用户行为的权重得分,不同种类的用户行为具有不同的权重得分。
需要说明的是,在本发明中,根据不同类别的用户行为对应的权重得分以及用户行为与商品对象的对应关系,获取商品对象的得分,能够更加准确、有效地衡量商品对象的热门程度。具体实现时,可以仅统计一个滑动时间窗口内各商品对象的得分,也可以统计多个时间窗口内同一统计单元的各商品对象的得分,所述多个时间窗口的长度可以是相同的,也可以是不同的。需要说明的是,不同统计单元的时间窗口一般是不同的。
具体实现时,可以根据下述公式获得商品对象的得分:
其中,N代表统计的时间窗口的个数,T代表当前时间窗口的编号,公式代表的含义是统计从编号为(T-N)时间窗口起至当前时间窗口这一段时间内,商品对象的得分。
S203C,根据各商品对象的得分对商品对象进行排序,获得排序结果。
举例说明,根据上述处理,可以获得某个店铺所有商品对象的得分,可以对商品对象的得分进行排序,从中选取得分排在前M个的商品对象,作为店铺的热门商品对象进行展示。当然,也可以针对某一类目,例如女装类商品对象,获得女装类各商品对象的排序,将得分排在前面的M个商品对象在显著位置展示。M可以根据需要设置,例如M可以取值为10、5等。
在一些实施方式中,还可以获取用户行为偏好信息,根据用户行为偏好信息与所述各商品对象的得分对商品对象进行排序,获得排序结果。举例说明,可以将当前商品对象与用户购买过的商品对象进行相似度计算,得到相似度得分,再根据相似度得分与S202B中计算的商品对象得分进行加权处理,得到商品对象的最终得分,根据商品对象的最终得分进行排序,获得排序结果。
其中,商品对象的相似度得分可以通过以下公式获得:
其中,scorek代表第k个候选商品对象的相似度得分,Vi代表用户实时行为(例如购买行为)对应的第i个商品对象的词向量,Ck代表第k个候选商品对象的词向量。其中,词向量的获取可以根据现有技术提供的方法实现。
需要说明的是,还可以利用其他方式获取用户行为偏好信息,在此不进行限定。
为了便于本领域技术人员更清楚地理解本申请在具体场景下的实施方式,下面以一个具体示例对本申请实施方式进行介绍。需要说明的是,该具体示例仅为使得本领域技术人员更清楚地了解本发明,但本发明的实施方式不限于该具体示例。
参见图3,为本发明又一实施例提供的基于动态滑动时间窗口的商品对象排序方法流程图。在图3所示实施例中,以统计单元为店铺为例进行说明。如图3所示,可以包括:
S301,实时采集用户行为日志。
S302,对用户行为日志进行解析。
S303,获取当前店铺的流量密度。
流量密度是指单位时间内的流量大小,可以根据以下公式获得:
其中,ρ代表流量密度,Δf为流量,Δtn-1为基准时间窗口值,单位可以是秒s、毫秒ms或者分钟min。具体实现时,基准时间窗口的初始值为Δt0,后续取值为上一个时间窗口的大小。n为正整数。
S304,根据当前店铺的流量密度确定动态滑动时间窗口。
本发明通过确定动态时间窗口,以有效确定商品对象热度排序。为了解决冷启动问题,基准时间窗口的初始值由离线获取,初始值大小为Δt0,例如可以是5分钟,10分钟或者1h等。而当Δtn-1时间的流量密度ρ小于α时,则对窗口进行扩大,而当Δtn-1内的流量密度ρ大于β时则对窗口进行缩减。
S305,分析用户行为数据,对用户行为数据进行分类,对不同类别的用户行为赋予不同的权重得分。
S306,根据当前店铺与商品对象的对应关系以及商品对象与用户行为的对应关系,根据用户行为的权重得分确定在所述动态滑动时间窗口内当前店铺各商品对象的得分。
举例说明,针对某一店铺的某一商品对象,用户行为的分类可以是浏览、收藏、添加购物车、购买等。针对不同类别的用户行为,其权重得分也是不一样的。可以统计某个店铺下的某个商品对象对应的所有用户行为,针对该用户行为的类别获得所述用户行为的权重得分,再根据下述公式可以获得商品对象的分数:
其中,N代表统计的时间窗口的个数,T代表当前时间窗口的编号,公式代表的含义是统计从编号为(T-N)时间窗口起至当前时间窗口这一段时间内,商品对象的得分。
S307,基于各商品对象的得分,对当前店铺的商品对象进行排序。
S308,选取排在前M位的商品对象在热门商品对象栏中展示。
需要说明的是,在本发明具体实现时,可以基于Storm框架实现本发明的方法。storm架构在使用的时候需要设计一个图状的拓扑结构,称之为topology。这个拓扑将会被提交给集群,由集群中的主控节点(master node)分发代码,将任务分配给工作节点(worker node)执行。一个拓扑中包括spout和bolt两种角色,其中spout发送消息,负责将数据流以tuple元组的形式发送出去;而bolt则负责转换这些数据流,在bolt中可以完成计算、过滤等操作,bolt自身也可以随机将数据发送给其他bolt。
在本发明实施例中,可以根据店铺的流量密度确定与该店铺对应的动态滑动时间窗口,不同店铺确定的动态滑动时间窗口不同,由此更能有效、准确地对商品对象的热门程度进行统计。此外,本发明根据用户的行为与商品对象的对应关系,为不同类别的用户行为赋予不同权重,基于用户行为的权重得分获取商品对象的得分,并综合考虑了时间衰减因子的影响,使得距离当前时间越近的用户行为的得分越高,使得统计结果更有时效性,统计结果更加准确。
参见图4,为本发明又一实施例提供的基于动态滑动时间窗口的商品对象排序方法流程图。
S401,实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果。
S402,根据所述解析结果确定当前店铺的流量密度。
S403,根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口。
S404,根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分。
S405,基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。
下面对本发明实施例提供的方法对应的设备进行介绍。
参见图5,为本发明一实施例提供的基于动态滑动时间窗口的商品对象排序装置示意图。
一种基于动态滑动时间窗口的商品对象排序装置500,包括:
流量密度确定单元501,用于确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;
动态滑动时间窗口确定单元502,用于根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;
排序单元503,用于计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
在一些实施方式中,所述流量密度确定单元501具体用于:
根据所述当前统计单元的流量与基准时间窗口的比值确定流量密度;所述当前统计单元的流量与当前统计单元的页面访问次数或者当前统计单元的用户访问次数相关联。
在一些实施方式中,所述动态滑动时间窗口确定单元502包括:
第一调整单元,用于当所述流量密度大于第一阈值时,调整基准时间窗口的大小使之变小,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口;
第二调整单元,用于当所述流量密度小于第二阈值时,调整基准时间窗口的大小使之变大,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口。
在一些实施方式中,所述排序单元503包括:
分析单元,用于分析用户行为数据,对用户行为数据进行分类,对不同类别的用户行为赋予不同的权重得分;
得分计算单元,用于根据用户行为与商品对象的对应关系以及商品对象与统计单元的归属关系,确定与归属于当前统计单元的各商品对象具有对应关系的用户行为的权重得分,根据所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分。
在一些实施方式中,所述得分计算单元包括:
第一计算单元,用于计算与商品对象具有对应关系各用户行为的权重得分乘以时间衰减因子得到的乘积;
第二计算单元,用于计算在所述动态滑动时间窗口内得到的乘积的和值作为所述商品对象的得分。
在一些实施方式中,所述装置还包括:
用户行为偏好获取单元,用于获取用户行为偏好信息;
所述排序单元503具体用于:
根据用户行为偏好信息与所述各商品对象的得分对商品对象进行排序,获得排序结果。
参见图6,为本发明一实施例提供的基于动态滑动时间窗口的商品对象排序装置示意图。
一种基于动态滑动时间窗口的商品对象排序装置600,包括:
用户行为日志采集单元601,用于实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果。
流量密度确定单元602,用于根据所述解析结果确定当前店铺的流量密度。
动态滑动时间窗口确定单元603,用于根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口。
排序单元604,用于根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分;基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。
其中,本发明装置各单元或模块的设置可以参照图2至图4所示的方法而实现,在此不赘述。
参见图7,是本发明另一实施例提供的基于动态滑动时间窗口的商品对象排序的装置的框图。包括:至少一个处理器701(例如CPU),存储器702和至少一个通信总线703,用于实现这些设备之间的连接通信。处理器701用于执行存储器702中存储的可执行模块,例如计算机程序。存储器702可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器701执行所述一个或者一个以上程序包含用于进行以下操作的指令:确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
在一些实施方式中,处理器701具体用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:根据所述当前统计单元的流量与基准时间窗口的比值确定流量密度;所述当前统计单元的流量与当前统计单元的页面访问次数或者当前统计单元的用户访问次数相关联。
在一些实施方式中,处理器701具体用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:当所述流量密度大于第一阈值时,调整基准时间窗口的大小使之变小,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口;当所述流量密度小于第二阈值时,调整基准时间窗口的大小使之变大,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口。
在一些实施方式中,处理器701具体用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:分析用户行为数据,对用户行为数据进行分类,对不同类别的用户行为赋予不同的权重得分;根据用户行为与商品对象的对应关系以及商品对象与统计单元的归属关系,确定与归属于当前统计单元的各商品对象具有对应关系的用户行为的权重得分,根据所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分。
在一些实施方式中,处理器701具体用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:计算与商品对象具有对应关系各用户行为的权重得分乘以时间衰减因子得到的乘积;计算在所述动态滑动时间窗口内得到的乘积的和值作为所述商品对象的得分。
在一些实施方式中,处理器701具体用于执行所述一个或者一个以上程序包含用于进行以下操作的指令:获取用户行为偏好信息;所述根据各商品对象的得分对商品对象进行排序,获得排序结果包括:根据用户行为偏好信息与所述各商品对象的得分对商品对象进行排序,获得排序结果。
在本发明另一实施例中,提供了基于动态滑动时间窗口的商品对象排序的装置,包括:至少一个处理器(例如CPU),存储器和至少一个通信总线,用于实现这些设备之间的连接通信。处理器用于执行存储器中存储的可执行模块,例如计算机程序。存储器可能包含高速随机存取存储器(RAM:Random Access Memory),也可能还包括非不稳定的存储器(non-volatile memory),例如至少一个磁盘存储器。一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果;根据所述解析结果确定当前店铺的流量密度;根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口;根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分;基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。本发明可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本发明,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。以上所述仅是本发明的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (11)
1.一种基于动态滑动时间窗口的商品对象排序方法,其特征在于,包括:
实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果;
根据所述解析结果确定当前店铺的流量密度;
根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口;
根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分;
基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。
2.一种基于动态滑动时间窗口的商品对象排序方法,其特征在于,包括:
确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;
根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;
计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
3.根据权利要求2所述的方法,其特征在于,所述确定当前统计单元的流量密度包括:
根据所述当前统计单元的流量与基准时间窗口的比值确定流量密度;所述当前统计单元的流量与当前统计单元的页面访问次数或者当前统计单元的用户访问次数相关联。
4.根据权利要求3所述的方法,其特征在于,所述根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口包括:
当所述流量密度大于第一阈值时,调整基准时间窗口的大小使之变小,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口;
当所述流量密度小于第二阈值时,调整基准时间窗口的大小使之变大,将调整后的时间窗口确定为与当前统计单元对应的动态滑动时间窗口。
5.根据权利要求2所述的方法,其特征在于,所述计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分包括:
分析用户行为数据,对用户行为数据进行分类,对不同类别的用户行为赋予不同的权重得分;
根据用户行为与商品对象的对应关系以及商品对象与统计单元的归属关系,确定与归属于当前统计单元的各商品对象具有对应关系的用户行为的权重得分,根据所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分。
6.根据权利要求5所述的方法,其特征在于,所述根据所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分包括:
利用时间衰减因子以及所述用户行为的权重得分确定在所述动态滑动时间窗口内属于所述统计单元的各商品对象的得分。
7.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取用户行为偏好信息;
所述根据各商品对象的得分对商品对象进行排序,获得排序结果包括:
根据用户行为偏好信息与所述各商品对象的得分对商品对象进行排序,获得排序结果。
8.根据权利要求2至7中任一项所述的方法,其特征在于,所述当前统计单元具体为店铺、类目或网站。
9.一种基于动态滑动时间窗口的商品对象排序装置,其特征在于,包括:
用户行为日志采集单元,用于实时采集用户行为日志,对所述用户行为日志进行解析,获得解析结果;
流量密度确定单元,用于根据所述解析结果确定当前店铺的流量密度;
动态滑动时间窗口确定单元,用于根据所述当前店铺的流量密度确定与所述当前店铺对应的动态滑动时间窗口;
排序单元,用于根据所述解析结果对用户行为进行分类,对不同类别的用户行为赋予不同的权重得分,根据用户行为的权重得分确定在所述动态滑动时间窗口内归属于所述店铺的各商品对象的得分;基于各商品对象的得分,对当前店铺的商品对象进行排序,获得排序结果。
10.一种基于动态滑动时间窗口的商品对象排序装置,其特征在于,包括:
流量密度确定单元,用于确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;
动态滑动时间窗口确定单元,用于根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;
排序单元,用于计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
11.一种用于基于动态滑动时间窗口的商品对象排序的装置,其特征在于,包括有存储器,以及一个或者一个以上的程序,其中一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行所述一个或者一个以上程序包含用于进行以下操作的指令:
确定当前统计单元的流量密度;其中,多个商品对象与所述统计单元具有归属关系;
根据所述流量密度确定与当前统计单元对应的动态滑动时间窗口;
计算在所述动态滑动时间窗口内归属于所述统计单元的各商品对象的得分,根据各商品对象的得分对商品对象进行排序,获得排序结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611036050.0A CN108090794B (zh) | 2016-11-22 | 2016-11-22 | 一种基于动态滑动时间窗口的商品对象排序方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611036050.0A CN108090794B (zh) | 2016-11-22 | 2016-11-22 | 一种基于动态滑动时间窗口的商品对象排序方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108090794A CN108090794A (zh) | 2018-05-29 |
CN108090794B true CN108090794B (zh) | 2021-08-27 |
Family
ID=62169918
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611036050.0A Active CN108090794B (zh) | 2016-11-22 | 2016-11-22 | 一种基于动态滑动时间窗口的商品对象排序方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108090794B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109670914B (zh) * | 2018-12-17 | 2020-11-17 | 华中科技大学 | 一种基于时间动态特性的产品推荐方法 |
CN111915383A (zh) * | 2019-05-09 | 2020-11-10 | 第四范式(北京)技术有限公司 | 基于窗口的物品冷启动推荐方法及装置 |
CN112631875A (zh) * | 2020-12-31 | 2021-04-09 | 浙江子不语电子商务有限公司 | 流量监控系统 |
CN115640470A (zh) * | 2022-11-17 | 2023-01-24 | 荣耀终端有限公司 | 一种推荐方法及电子设备 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101645067A (zh) * | 2008-08-05 | 2010-02-10 | 北京大学 | 一种讨论区集合中热点讨论区的预测方法 |
CN102629360B (zh) * | 2012-03-13 | 2016-04-20 | 浙江大学 | 一种有效的动态商品推荐方法及商品推荐系统 |
CN103368813B (zh) * | 2012-03-26 | 2016-09-14 | 腾讯科技(深圳)有限公司 | 一种实现网络信息发布的方法及系统 |
CN102880676A (zh) * | 2012-09-10 | 2013-01-16 | 新浪网技术(中国)有限公司 | 统计用户行为数据的方法及用户行为数据统计系统 |
JP6150166B2 (ja) * | 2013-08-13 | 2017-06-21 | 株式会社大気社 | 水耕栽培方法及び栽培支援システム |
CN105844508B (zh) * | 2016-03-22 | 2020-04-17 | 天津中科智能识别产业技术研究院有限公司 | 一种基于动态周期神经网络的商品推荐方法 |
-
2016
- 2016-11-22 CN CN201611036050.0A patent/CN108090794B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN108090794A (zh) | 2018-05-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110503531B (zh) | 时序感知的动态社交场景推荐方法 | |
CN108090794B (zh) | 一种基于动态滑动时间窗口的商品对象排序方法及装置 | |
CN110020128B (zh) | 一种搜索结果排序方法及装置 | |
CN107516235B (zh) | 商品偏好预估方法和装置 | |
CN109711955B (zh) | 基于当前订单的差评预警方法、系统、黑名单库建立方法 | |
CN107341716A (zh) | 一种恶意订单识别的方法、装置及电子设备 | |
CN106934035B (zh) | 一种基于类与特征分布的多标签数据流中概念漂移检测方法 | |
JP2016511906A (ja) | 商品検索結果の順位付け | |
CN112102037A (zh) | 一种基于大数据的直播电商平台商品内容智能推送管理系统 | |
CN108572984A (zh) | 一种实时用户兴趣识别方法及装置 | |
CN103425664A (zh) | 一种对实体数据单元进行搜索、显示的方法和设备 | |
TWI705411B (zh) | 社交業務特徵用戶的識別方法和裝置 | |
CN111340566B (zh) | 一种商品分类方法、装置、电子设备及存储介质 | |
CN111626767B (zh) | 资源数据的发放方法、装置及设备 | |
CN112465533A (zh) | 智能选品方法、装置及计算设备 | |
CN112149003B (zh) | 商品社群推荐方法、装置和计算机设备 | |
CN117710054A (zh) | 线上商城商品智能化展示系统 | |
CN110717097A (zh) | 业务推荐方法、装置、计算机设备和存储介质 | |
CN108268519B (zh) | 一种推荐网络对象的方法和装置 | |
CN108460630B (zh) | 基于用户数据进行分类分析的方法和装置 | |
CN113077292B (zh) | 一种用户分类方法、装置、存储介质及电子设备 | |
CN113822691B (zh) | 用户账号的识别方法、装置、系统和介质 | |
CN107480154B (zh) | 一种数据处理的方法及装置 | |
CN113674043B (zh) | 商品推荐方法及装置、计算机可读存储介质、电子设备 | |
Cho et al. | Clustering method using weighted preference based on RFM score for personalized recommendation system in u-commerce |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |