CN103744904A - 一种提供信息的方法及装置 - Google Patents

一种提供信息的方法及装置 Download PDF

Info

Publication number
CN103744904A
CN103744904A CN201310726942.3A CN201310726942A CN103744904A CN 103744904 A CN103744904 A CN 103744904A CN 201310726942 A CN201310726942 A CN 201310726942A CN 103744904 A CN103744904 A CN 103744904A
Authority
CN
China
Prior art keywords
user
article
frequent item
item set
described user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310726942.3A
Other languages
English (en)
Other versions
CN103744904B (zh
Inventor
吴帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Jingdong Shangke Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Jingdong Shangke Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN201310726942.3A priority Critical patent/CN103744904B/zh
Publication of CN103744904A publication Critical patent/CN103744904A/zh
Application granted granted Critical
Publication of CN103744904B publication Critical patent/CN103744904B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及计算机技术领域,尤其涉及一种提供信息的方法及装置。该方法包括:接收终端发送的用户登录请求;根据所述用户登录请求,向所述终端返回相应的网页内容,所述网页内容包括与所述用户过去行为相关的物品信息,所述用户过去行为为所述用户本次登录之前对所述网页所属网站提供的物品的行为,所述与所述用户过去行为相关的物品信息的获得过程包括:根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集;根据获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息。该方法通过迭代和散列的方式获得频繁项集,提高了被提供信息的实用性。

Description

一种提供信息的方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种提供信息的方法及装置。
背景技术
伴随着计算机技术的快速发展,互联网已经成为用户获取物品的信息的重要方式。用户在操作物品时,通常同时操作多个物品,并且同时操作的多个物品之间存在着强关联关系,其中同时操作的物品为物品的项集。根据用户操作物品之间的强关联关系能够有效为用户提醒信息。
现有的提供信息的方法中,提供的信息通过协同过滤算法得到。使用的协同过滤算法主要为:基于用户的协同过滤和基于项目的协同过滤。基于用户的协同过滤和基于项目的协同过滤分别是以用户-项目评分矩阵中用户数据计算用户或项目之间的相似性,其中项目为物品的频繁项集,用户-项目评分矩阵即用户对频繁项集的评分矩阵。
现有的提供信息的方法由于采用上述协同过滤算法,使得得到的频繁项集的评分矩阵为稀疏矩阵,导致获得的待提供给用户的信息的有效性降低。
发明内容
本发明实施例提供一种提供信息的方法及装置,以提高系统为用户提供的物品信息的有效性。
本发明实施例提供了一种提供信息的方法,所述方法包括:
接收终端发送的用户登录请求;
根据所述用户登录请求,向所述终端返回相应的网页内容,所述网页内容包括与所述用户过去行为相关的物品信息,所述用户过去行为为所述用户本次登录之前对所述网页所属网站提供的物品的行为,所述与所述用户过去行为相关的物品信息的获得过程包括:
根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集;
根据获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息。
对应地,本发明实施例还提供了一种提供信息的装置,所述装置包括:
请求接收单元,用于接收终端发送的用户登录请求;
网页返回单元,用于根据所述用户登录请求,向所述终端返回相应的网页内容,所述网页内容包括与所述用户过去行为相关的物品信息,所述用户过去行为为所述用户本次登录之前对所述网页所属网站提供的物品的行为,所述与所述用户过去行为相关的物品信息由频繁项集获取单元和物品信息筛选单元获得,其中,
频繁项集获取单元,用于根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集;
物品信息筛选单元,用于根据获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息。
本发明实施例提出了一种提供信息的方法及装置,通过迭代和散列的方式获得频繁项集,有效地提高了频繁项集的计算效率以及避免了频繁项集的评分矩阵成为稀疏矩阵,提高了被提供信息的实用性。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,并不构成对本发明的限定。在附图中:
图1是本发明第一实施例提供的一种提供信息的方法的实现流程图;
图2是本发明第二实施例提供的一种提供信息的装置的结构示意图。
具体实施方式
下面结合附图及具体实施例对本发明进行更加详细与完整的说明。可以理解的是,此处所描述的具体实施例仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
图1是本发明第一实施例提供的一种提供信息的方法的实现流程图。本发明实施例提供的方法可以由本发明实施例提供的提供信息装置来执行,该装置可以由软件和/或硬件来实现。如图1所示,本发明实施例提供的方法包括:
步骤101、接收终端发送的用户登录请求。
例如,当用户在终端登录时将通过该终端向服务端发送登录请求,相应的,服务端接收终端发送的用户登录请求。其中,终端通常是指那些与集中式主机系统(服务器)远程相连的“哑”用户设备。终端可以将用户通过键盘输入的信息,以网络传输的方式发送给主机系统。例如用户登录京东商城时,终端接收用户通过键盘输入的用户名和密码。终端可以是移动终端,例如手机、笔记本和平板电脑。上述登录请求一般包括用户的属性信息,例如,用户名和密码。
步骤102、根据所述用户登录请求,向所述终端返回相应的网页内容,所述网页内容包括与所述用户过去行为相关的物品信息,所述用户过去行为为所述用户本次登录之前对所述网页所属网站提供的物品的行为。
例如,服务端接收用户登录请求后,首先,根据用户登录请求中的用户的属性信息(例如用户名)获取用户过去行为,其中,用户过去行为为用户本次登录之前对所述网页所属网站提供的物品的行为;其次,根据用户过去行为获取用户过去行为相关的物品信息;最后,服务端向终端返回相应的网页内容,其中所述网页内容包括与所述用户过去行为相关的物品信息。由于服务器向终端返回的物品信息与用户过去对物品的行为相关联,即返回的物品信息与用户的个体需求相关联,因此返回的物品信息对用户行为的影响性较大。
以京东商城提醒用户商品为例,具体的介绍服务端根据用户登录请求返回相应的网页内容的方法。用户成功登录京东商城后京东商城的服务端,首先,根据用户登录请求中的用户名获取用户在本次登录之前对京东商城中所有商品的行为,其中对商品的行为包括对商品的浏览、喜欢、收藏以及购买行为;其次,根据用户过去对商品的行为获取用户过去行为相关的物品信息,即根据用户过去对京东商城上所有商品的行为,获取用户可能感兴趣的商品,进而获取用户可能购买的商品;其次,服务端将用户可能购买的商品返回到相应的网页,从而将用户可能购买的商品的信息返回给用户。
其中,所述与所述用户过去行为相关的物品信息的获得过程可包括:根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集;根据获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息。
例如,服务端根据用户过去行为为用户预置的构建一系列物品搭配集合,其中,物品搭配集合为服务端包含的全体物品集合的子集,并且物品搭配集合包括的各项物品之间具有相关性,即用户同时操作属于同一个物品搭配集合中的各个物品之间的可能性较大。一个物品搭配集合为用户一次登录过程中的操作的物品的集合,也即项的集合。物品搭配集合对应的用户的行为数据为用户一次登录过程中操作物品搭配集合中的物品的集合。用户一次登录过程中操作某个物品搭配集合中的各个物品的集合为一个事务,每一个事务都有一个唯一标识符(Transaction ID,TID)。获取事务集合即获取针对某个物品搭配集合的用户每次登录的事务之后,通过迭代和散列的方式获取频繁项集。
其中,项的集合也称为项集,包含k个项的项集称为k阶项集,包含项集的事务的个数,为项集的频率,支持度计数或计数。如果项集的频率满足预定义的最小支持度阈值,则是频繁项集,包含k个项的频繁项集称为k阶频繁项集。
获取物品搭配集合中的频繁项集之后,根据所述频繁项集得到与用户过去行为相关的物品信息,即得到对用户行为具有影响性的物品信息。
示例性的,上述根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集,可包括:根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,获得k阶频繁项集,其中,k大于或等于1;根据所述k阶频繁项集获得k+1阶频繁项集。
例如,可以采用Apriori算法获取频繁项集。Apriori算法为一种逐层搜索的迭代方法,其中,k阶项集用于探索(k+1)阶项集。采用Apriori算法获取频繁项集时,首先,统计所有事务中每一个项的频率,并找出满足预设的最小支持度的项,找出的项的集合为一阶频繁项集的集合;然后用一阶频繁项集的集合找出频繁2项集的集合,如此下去,找到各阶频繁项集的集合。该算法能够有效的减少候选项集的生成。
以物品搭配集合{网球拍,网球,运动鞋,羽毛球}为例,假设与该集合相关的事务有6个:T1,T2,T3,T4,T5和T6,如表1所示:
事务 网球拍 网球 运动鞋 羽毛球
T1 1 1 1 0
T2 1 1 0 0
T3 1 0 0 0
T4 1 0 1 0
T5 0 1 1 1
T6 1 1 0 0
从表1可以看出,T1={网球拍,网球,运动鞋},T2={网球拍,网球},T3={网球拍},T4={网球拍,运动鞋},T5={网球,运动鞋,羽毛球}和T6={网球拍,网球}。那么,首先,统计6个事务中网球拍、网球、运动鞋和羽毛球的频率分别为5、4、3和1,并频率大于2的项的集合为一阶频繁项集的集合即{网球拍,网球,运动鞋};然后用一阶频繁项集的集合找出二阶频繁项集的集合{{网球拍,网球}},如此下去,找到各阶频繁项集的集合。
本发明中根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,可采用Apriori算法获取频繁项集,其中,物品搭配集合对应的用户行为数据为各个事务,因此,本发明中通过迭代的方式先获得k阶频繁项集,再由k阶频繁项集获得k+1阶频繁项集,具体包括:首先根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据获得1阶频繁项集,再由1阶频繁项集获得2阶频繁项集,如此下去,直到不能找到k阶频繁项集。
采用迭代算法获取频繁项集,能够有效减小获取频繁项集的计算量并且有效解决现有的提供信息方法中初始矩阵稀疏性问题。
示例性的,上述频繁项集的阶数可小于或等于3。
示例性的,根据所述k阶频繁项集获得k+1阶频繁项集,还包括:根据所述k阶频繁项集获取k+1阶候选项集;根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过散列的方式从所述k+1阶候选项集中找到k+1阶频繁项集。
仍以表1为例,首先,根据上述事务中包括的所有物品得到一阶候选项集的集合,即一阶候选项集的集合为{{网球拍},{网球},{运动鞋},{羽毛球}}。随后将一阶候选项集的集合中包含的各个物品在所有事务中出现的频率少于最小支持度(例如为2)的全部过滤,剩下的物品构成的一阶项集属于一阶频繁项集的集合,即一阶频繁项集的集合为{{网球拍},{网球},{运动鞋}}。一阶频繁项集中任意两个物品组成的二阶项集为二阶候选项集,即二阶候选项集的集合为{{网球拍,网球},{网球拍,运动鞋},{网球,运动鞋}}。随后将二阶候选项集的集合中两项物品同时在所有事物中出现的频率少于最小支持度的全部过滤,剩下的二阶项集属于二阶频繁项集的集合,二阶频繁项集的集合为{{网球拍,网球}}。由于三阶候选项集的任何真子集均须为频繁项集,并且本例中只有一个二阶频繁项集,因此本例中没有k阶频繁项集(k大于2)。因此,在获取频繁项集过程中,定义Ck为k阶候选项集;定义Lk为k阶频繁项集;Sk为k阶候选项集的集合,即Sk为Ck的集合;Rk为k阶频繁项集的集合,即Rk为Lk的集合,其中,本发明中任意一个k阶频繁项集Lk的真子集均为频繁项集。下面以最小支持度(min sv)等于2为例,具体介绍如何通过迭代和散列获取各阶频繁项集。
所述物品搭配集合对应的所述用户的行为数据中包含的各个物品均属于一级候选项集的集合S1,即各个事务中所有物品单独组成的一阶项集属于一阶候选项集的集合S1。例如,如果各个事务中包含的所有物品的集合为{i1,i2,……,im},则S1={{i1},{i2},……,{im}},随后将各个物品在所有事务中出现的频率少于minsv的全部过滤,剩下的即为R1,经过滤后构成一阶频繁项集的集合R1={{if},{ik},……,{in}}。紧接着,R1所包含的所有物品中,任意两项物品组成的二阶项集属于候选二阶项集的集合S2,即S2={{if,ik},{if,in},……,{ik,in}}。随后,通过散列由S2获取R2,即将S2中的各个二阶候选项集通过公式:
h({x,y})=(xid+yid)%hashsize
散列到桶中,其中,xid和yid分别为项在数据表中的标识值(标识为唯一标识),hashsize由
Figure BDA0000446226440000083
其中R1,size为R1中包含的L1的个数。统计散列桶中,每一个二阶项集的个数,如果二阶项集的个数minsv则将位矢量中相对应的值置为0,否则置为1,从而生成位矢量。将二阶候选项集的集合{{if,ik},{if,in},……,{ik,in}}与位矢量集合进行交集,如果生成位矢量为{1,0,……,1}剩下的二阶项集即属于二阶频繁项集的集合R2
由二阶频繁项集获取三阶候选项集时,构建每个L2的超集C2',若C2'的任意真子集均是频繁项集则其为三阶候选项集C3,随后根据S3通过散列获取三阶频繁项集的集合R3
所述根据获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息,包括:根据获得的所述频繁项集挖掘关联规则;根据与所述物品搭配集合对应的所述用户的行为数据,获取所述用户的最相似用户;根据所述关联规则和所述最相似用户得到所述与所述用户过去行为相关的物品信息。
若有全体商品集合P={i1,i2,……,in};事务的定义为T={if,ik,……,im},其中每一个事务都有一个唯一的TID,全部搭配集D={T1,T2,……Tn},设X和Y分别是一个项集且X包含于T;Y包含于P,以及
Figure BDA0000446226440000084
,有关联规则X→Y的X称为规则头,Y称为规则尾。
定义X→Y的支持度:
Figure BDA0000446226440000081
其中n是D中事务T的数目;
定义X→Y的置信度: cv ( X → Y ) = ( X ∪ Y ) . count X . count ;
并且分别给支持度和置信度设置其阀值:
sv≥minsv;cv≥mincv
当关联规则X→Y满足sv(X→Y)≥minsv并且cv(X→Y)≥mincv时,其为强关联规则,,例如minsv和mincv均为2时,若sv(X→Y)=3并且cv(X→Y)=5则关联规则(X→Y)为强关联规则。
另外,由上面的定义,可以得到:
cv ( X → Y ) = P ( Y | X ) = sv ( X ∪ Y ) sv ( X ) = ( X ∪ Y ) . count X . count ≥ min cv
即关联规则X→Y的置信度可以从X和X∪Y的支持度计算得到。一旦得到X、Y和X∪Y的支持度,即可导出对应的关联规则X→Y和Y→X。
综上分析可知,能够通过频繁项集来进行关联分析并且挖掘关联规则,因此,一旦由数据库D中的事务找出频繁项集,由它们产生强关联规则是直接了当的,即强关联规则满足最小支持度和最小置信度。
另外,根据与所述物品搭配集合对应的所述用户的行为数据,获取所述用户的最相似用户,其中与所述用户的行为数据最接近的用户为最相似用户。结合关联规则和最相似用户的过去行为得到所述用户过去行为相关的物品信息。若用户的最相似用户的行为数据中包含的物品为候选目标物品,能够通过关联规则获得与所述候选目标物品之间最关联的物品为目标物品,即获取与候选目标物品之间支持度/置信度最大的物品,在用户浏览物品时,向用户提供目标物品的信息。
上述根据与所述物品搭配集合对应的所述用户的行为数据,获取所述用户的最相似用户,包括:根据与所述物品搭配集合对应的所述用户的行为数据,为所述用户生成所述物品搭配集合的分值;根据生成的所述物品搭配集合的分值,获取所述用户的最相似用户。
根据用户的行为数据中用户对各个物品搭配集合所包含的物品的浏览、喜欢、收藏和购买行为生成各个物品搭配集合的分值,其中根据用户行为为物品搭配集合生成分值是为浏览、喜欢、收藏和购买等行为分配的不同权重来进行计算的。随后,根据生成的所述物品搭配集合的分值,计算用户之间的相似因子,与所述用户的相似因子最大的用户即为最相似用户。
最后,根据评分矩阵中的各个商品搭配的评分计算用户之间的相似因子。
通过以下的公式来计算两个用户之间的相似因子。
D xy = Σ i ∈ I c ix ( c iy ( H ix - H iy ) ) 2 Σ i ∈ I c ix c iy
其中,Dxy表示两个用户x和y之间的相似因子,Hix或Hiy表示用户x或y给搭配i的评分,I表示数据库中所有的搭配,cix是一个布尔值,如果用户x给搭配i进行了评分,则cix为1,反正为0。
根据上面的计算,可以得到每个用户的最近邻用户,即可以得到与每个用户的相似因子最接近的用户。
本发明实施例中提出的提供信息的方法,采用Apriori算法构建频繁项集即通过迭代依次获取频繁项集,并且在获取频繁项集过程中通过散列的方式计算各个项集的频率,即只需要扫描一次事务的集合即可以获得各个项集的频率,从而提高了项集的计算效率。迭代和散列获取的频繁项集提高被提供信息的实用性。
本发明实施例提出的提供信息的方法主要是根据用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西,从而提高被提供信息的实用性。本发明实施例中的提供信息方法广泛应用于计算机技术领域,例如应用于在线购物系统的商品推荐。本发明第二实施例中以在线购物系统的商品推荐为例,具体介绍本发明提出的提供信息的方法。
在线购物系统(例如京东商城)的搭配购项目中,海量的商品信息给用户提供了巨大的选择空间,同时极大地提高了搜索商品的成本。一方面,用户面对日趋膨胀的搭配,寻找感兴趣的商品如同大海捞针,逐渐减低了用户浏览商品的激情;另一方面,由于在线购物系统提供的商品与用户真正需要的商品之间存在差距,使得用户不能及时的获取到感兴趣的商品及流行商品。因此,将本发明提出的提供信息的方法应用于在线购物系统中是十分必要的。
系统根据用户的行为为用户预置的创建搭配,即物品搭配集合,一个搭配中包含多个类型的商品,搭配中的多个商品之间存在着强关联关系,例如:用户在夏天购买了连衣裙,那么其有很大可能也会同时再购买包含该连衣裙的搭配中其他的商品,如凉鞋,墨镜等。利用搭配的关联关系和分析用户的购物习惯,可以为用户提供更好的商品,从而为系统提供更好的营销策略。
在获取用户的行为信息,系统对浏览、喜欢、收藏和购买商品分别分配相应的权重,从而为用户生成搭配的分值,以构建商品的效用矩阵。但该效用矩阵是非常的稀疏,基于传统的协同过滤等算法计算其相似性可能不准确,而且随着用户和商品的增加,系统的性能会越来越低,使得如果没有用户对搭配进行评分,该搭配以及搭配中的所有商品将不会被推荐。
将本发明提出的新的协同过滤算法应用到商品推荐时,首先找出商品之间的关联关系,关联分析的产物为:频繁模式和关联规则。获取关联规则主要通过搭配中各个商品的关系,使用改进Apriori算法和散列寻找频繁项集,并从频繁项集中推出高支持度和可信度的关联规则。
对于计算性能方面,获取频繁项集时,需要一定的计算时间,示例性的,商品搭配中有6个商品,则该商品搭配中有
Figure BDA0000446226440000111
即15个二阶项集。针对于n个商品组成的商品搭配,生成所有大小为k的子集的时间大约为
Figure BDA0000446226440000121
因此,使用迭代算法提高了频繁项集的计算效率。
最后,通过用户的对商品搭配的评分,计算相似度,获得用户的邻近用户,通过对商品的评分为用户提供商品。
根据用户的行为数据,记录了每个用户对每个搭配给予的评级分数。其中评级分数是根据浏览、喜欢、收藏和购买分配的不同权重来进行计算的。根据相似度,可以得到每个用户的最相似用户。当用户的最相似用户在搭配购项目中购买某个商品时,可以通过频繁项集向用户提供与该商品最为关联的商品。或是在浏览商品或搭配,向该用户提供其最相似用户感兴趣的搭配或是商品。从而,有效的提供了用户的购买欲望并且提升了系统的订单量。
将本发明提出的提供信息的方法应用到在线购物系统中时,通过记录用户购买、浏览、收藏以及浏览搭配或商品记录等,向用户推荐感兴趣的搭配和商品,从而改善系统的营销策略,提高订单量。
图2是本发明第三实施例中提供的一种提供信息的装置的结构效果图。本发明实施例和本发明中方法实施例处于统一构思,网页返回单元302中未详述的内容,请参考本发明方法实施例。如图2所示,本发明实施例提供的装置,包括:
请求接收单元301,用于接收终端发送的用户登录请求;网页返回单元302,用于根据所述用户登录请求,向所述终端返回相应的网页内容,所述网页内容包括与所述用户过去行为相关的物品信息,所述用户过去行为为所述用户本次登录之前对所述网页所属网站提供的物品的行为,所述与所述用户过去行为相关的物品信息由频繁项集获取单元和物品信息筛选单元获得,其中,
频繁项集获取单元,用于根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集;
物品信息筛选单元,用于根据所述频繁项集获取单元获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息。
所述物品信息筛选单元包括:关联规则挖掘单元,用于根据所述频繁项集获取单元获得的所述频繁项集挖掘关联规则;最相似用户获取单元,用于根据与所述物品搭配集合对应的所述用户的行为数据,获取所述用户的最相似用户;相关信息获取单元,用于根据所述关联规则和所述最相似用户得到所述与所述用户过去行为相关的物品信息。
所述最相似用户获取单元包括:分组生成单元,用于根据与所述物品搭配集合对应的所述用户的行为数据,为所述用户生成所述物品搭配集合的分值;最相似用户获取单元,用于根据生成的所述物品搭配集合的分值,获取所述用户的最相似用户。
所述频繁项集获取单元包括:k阶频繁项集获取单元,用于根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,获得k阶频繁项集,其中,k大于或等于1;k+1阶频繁项集获取单元,用于根据所述k阶频繁项集获得k+1阶频繁项集。
所述k+1阶频繁项集获取单元根据所述k阶频繁项集获得k+1阶频繁项集,还包括:k+1阶候选项集获取单元,用于根据所述k阶频繁项集获取k+1阶候选项集;k+1阶频繁项集散列获取单元,用于根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过散列的方式从所述k+1阶候选项集中找到k+1阶频繁项集。
本发明实施例中,请求接收单元301接收用户的登录请求,网页返回单元302根据用户的登录请求,将与用户过去行为相关的物品信息通过网页返回给用户,其中与用户过去行为相关的物品信息是通过物品信息筛选单元和物品信息筛选单元先后经过通过迭代和散列获取与用户过去行为相关的频繁项集、根据频繁项集挖掘关联构造、根据用户过去行为填充稀疏效用矩阵、计算用户相似因子以获得最相似用户等步骤获得的。
本发明实施例中提出的提供信息的装置,通过迭代和散列构建频繁项集,提高了频繁项集的计算效率,并且提高了被提供信息的实用性。
本实施例提出的提供信息的装置用于执行本发明任意实施例提供的提供信息的方法,具备相应的功能模块,达到相同的技术效果。
上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种提供信息的方法,其特征在于,包括:
接收终端发送的用户登录请求;
根据所述用户登录请求,向所述终端返回相应的网页内容,所述网页内容包括与所述用户过去行为相关的物品信息,所述用户过去行为为所述用户本次登录之前对所述网页所属网站提供的物品的行为,所述与所述用户过去行为相关的物品信息的获得过程包括:
根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集;
根据获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息。
2.根据权利要求1所述的方法,其特征在于,根据获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息,包括:
根据获得的所述频繁项集挖掘关联规则;
根据与所述物品搭配集合对应的所述用户的行为数据,获取所述用户的最相似用户;
根据所述关联规则和所述最相似用户得到所述与所述用户过去行为相关的物品信息。
3.根据权利要求2所述的方法,其特征在于,根据与所述物品搭配集合对应的所述用户的行为数据,获取所述用户的最相似用户,包括:
根据与所述物品搭配集合对应的所述用户的行为数据,为所述用户生成所述物品搭配集合的分值;
根据生成的所述物品搭配集合的分值,获取所述用户的最相似用户。
4.根据权利要求1-3任一项所述的方法,其特征在于,根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集,包括:
根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,获得k阶频繁项集,其中,k大于或等于1;
根据所述k阶频繁项集获得k+1阶频繁项集。
5.根据权利要求4所述的方法,其特征在于,根据所述k阶频繁项集获得k+1阶频繁项集,还包括:
根据所述k阶频繁项集获取k+1阶候选项集;
根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过散列的方式从所述k+1阶候选项集中找到k+1阶频繁项集。
6.根据权利要求1-3任一项所述的方法,其特征在于,所述频繁项集的阶数小于或等于3。
7.一种提供信息的装置,其特征在于,包括:
请求接收单元,用于接收终端发送的用户登录请求;
网页返回单元,用于根据所述用户登录请求,向所述终端返回相应的网页内容,所述网页内容包括与所述用户过去行为相关的物品信息,所述用户过去行为为所述用户本次登录之前对所述网页所属网站提供的物品的行为,所述与所述用户过去行为相关的物品信息由频繁项集获取单元和物品信息筛选单元获得,其中,
频繁项集获取单元,用于根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,通过迭代和散列的方式获得频繁项集;
物品信息筛选单元,用于根据所述频繁项集获取单元获得的所述频繁项集得到所述与所述用户过去行为相关的物品信息。
8.根据权利要求7所述的装置,其特征在于,所述物品信息筛选单元包括:
关联规则挖掘单元,用于根据所述频繁项集获取单元获得的所述频繁项集挖掘关联规则;
最相似用户获取单元,用于根据与所述物品搭配集合对应的所述用户的行为数据,获取所述用户的最相似用户;
相关信息获取单元,用于根据所述关联规则和所述最相似用户得到所述与所述用户过去行为相关的物品信息。
9.根据权利要求7所述的装置,其特征在于,所述最相似用户获取单元包括:
分组生成单元,用于根据与所述物品搭配集合对应的所述用户的行为数据,为所述用户生成所述物品搭配集合的分值;
最相似用户获取单元,用于根据生成的所述物品搭配集合的分值,获取所述用户的最相似用户。
10.根据权利要求7-9任一项所述的装置,其特征在于,所述频繁项集获取单元包括:
k阶频繁项集获取单元,用于根据物品搭配集合及与所述物品搭配集合对应的所述用户的行为数据,获得k阶频繁项集,其中,k大于或等于1;
k+1阶频繁项集获取单元,用于根据所述k阶频繁项集获得k+1阶频繁项集。
CN201310726942.3A 2013-12-25 2013-12-25 一种提供信息的方法及装置 Active CN103744904B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310726942.3A CN103744904B (zh) 2013-12-25 2013-12-25 一种提供信息的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310726942.3A CN103744904B (zh) 2013-12-25 2013-12-25 一种提供信息的方法及装置

Publications (2)

Publication Number Publication Date
CN103744904A true CN103744904A (zh) 2014-04-23
CN103744904B CN103744904B (zh) 2018-02-16

Family

ID=50501922

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310726942.3A Active CN103744904B (zh) 2013-12-25 2013-12-25 一种提供信息的方法及装置

Country Status (1)

Country Link
CN (1) CN103744904B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205081A (zh) * 2014-06-27 2015-12-30 华为技术有限公司 物品推荐方法和装置
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN106294494A (zh) * 2015-06-08 2017-01-04 哈尔滨工业大学深圳研究生院 项集挖掘方法及装置
WO2017041226A1 (zh) * 2015-09-08 2017-03-16 深圳市赛亿科技开发有限公司 一种商品信息推送方法
CN107870939A (zh) * 2016-09-27 2018-04-03 腾讯科技(深圳)有限公司 一种模式挖掘方法及装置
CN111158699A (zh) * 2019-12-31 2020-05-15 青岛海尔科技有限公司 基于Apriori算法的应用优化方法、装置和智能设备
CN115002691A (zh) * 2021-03-01 2022-09-02 中国移动通信集团四川有限公司 消息发送方法、装置、设备和计算机可读存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101446978A (zh) * 2008-12-11 2009-06-03 南京大学 基于频繁项集挖掘的核心节点发现方法
CN102073732B (zh) * 2011-01-18 2014-04-30 东北大学 基于相同结点链和哈希链的事件序列频繁情节挖掘方法
CN102760163B (zh) * 2012-06-12 2015-04-29 北京奇虎科技有限公司 一种特征信息的个性化推荐方法及装置

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105205081A (zh) * 2014-06-27 2015-12-30 华为技术有限公司 物品推荐方法和装置
CN105205081B (zh) * 2014-06-27 2019-11-05 华为技术有限公司 物品推荐方法和装置
CN106294494A (zh) * 2015-06-08 2017-01-04 哈尔滨工业大学深圳研究生院 项集挖掘方法及装置
CN106294494B (zh) * 2015-06-08 2022-11-15 哈尔滨工业大学深圳研究生院 项集挖掘方法及装置
WO2017041226A1 (zh) * 2015-09-08 2017-03-16 深圳市赛亿科技开发有限公司 一种商品信息推送方法
CN107251075A (zh) * 2015-09-08 2017-10-13 深圳市赛亿科技开发有限公司 一种商品信息推送方法
CN105389400A (zh) * 2015-12-24 2016-03-09 Tcl集团股份有限公司 语音交互方法及装置
CN105389400B (zh) * 2015-12-24 2020-02-14 Tcl集团股份有限公司 语音交互方法及装置
CN107870939A (zh) * 2016-09-27 2018-04-03 腾讯科技(深圳)有限公司 一种模式挖掘方法及装置
CN111158699A (zh) * 2019-12-31 2020-05-15 青岛海尔科技有限公司 基于Apriori算法的应用优化方法、装置和智能设备
CN115002691A (zh) * 2021-03-01 2022-09-02 中国移动通信集团四川有限公司 消息发送方法、装置、设备和计算机可读存储介质
CN115002691B (zh) * 2021-03-01 2023-08-15 中国移动通信集团四川有限公司 消息发送方法、装置、设备和计算机可读存储介质

Also Published As

Publication number Publication date
CN103744904B (zh) 2018-02-16

Similar Documents

Publication Publication Date Title
CN103744904A (zh) 一种提供信息的方法及装置
CN102236851B (zh) 基于用户赋权的多维信用体系实时计算的方法及系统
CN102456203B (zh) 确定候选产品链表的方法及相关装置
CN101957834B (zh) 一种基于用户特征进行内容推荐的方法与设备
US10825047B2 (en) Apparatus and method of selection and placement of targeted messages into a search engine result page
CN102332006B (zh) 一种信息推送控制方法及装置
CN110222272A (zh) 一种潜在客户挖掘与推荐方法
JP5438087B2 (ja) 広告配信装置
US20140188593A1 (en) Selecting an advertisement for a traffic source
US11216852B2 (en) Systems and methods for automatically generating remarketing lists
CN102073717A (zh) 一种面向垂直电子商务网站的首页推荐方法
CN104111941A (zh) 信息展示的方法及设备
CN102682001A (zh) 一种确定推荐词的方法及设备
CN102609533A (zh) 一种基于核方法的协同过滤推荐系统及方法
CN103885971A (zh) 数据推送的方法及装置
CN104899229A (zh) 基于群体智能的行为聚类系统
CN104951460A (zh) 基于关键词聚类的排名参量值确定方法及装置
CN107545471A (zh) 一种基于高斯混合的大数据智能推荐方法
CN104765758A (zh) 用于搜索结果定向的系统和方法
CN109299426A (zh) 一种精确头条信息的推荐方法及装置
CN104699693A (zh) 一种信息处理方法及装置
JP6748312B2 (ja) メディアミックスモデリングにおけるバイアスを除去するためのシステムおよび方法
CN103262079B (zh) 检索装置及检索方法
CN103177371B (zh) 一种信息展示方法和装置
KR20160148015A (ko) 알림들을 생성하는 시스템들 및 방법들

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant