CN103902538A - 基于决策树的信息推荐装置及方法 - Google Patents

基于决策树的信息推荐装置及方法 Download PDF

Info

Publication number
CN103902538A
CN103902538A CN201210569218.XA CN201210569218A CN103902538A CN 103902538 A CN103902538 A CN 103902538A CN 201210569218 A CN201210569218 A CN 201210569218A CN 103902538 A CN103902538 A CN 103902538A
Authority
CN
China
Prior art keywords
information
record
decision tree
browse
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210569218.XA
Other languages
English (en)
Other versions
CN103902538B (zh
Inventor
袁奇华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201210569218.XA priority Critical patent/CN103902538B/zh
Publication of CN103902538A publication Critical patent/CN103902538A/zh
Application granted granted Critical
Publication of CN103902538B publication Critical patent/CN103902538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了基于决策树的信息推荐装置及方法。其中,所述装置包括用户接口、决策树生成模块、加权模块和推荐模块,所述决策树生成模块能够基于接收到的信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类,所述加权模块在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值。本发明所公开的基于决策树的信息推荐装置及方法能够提高信息搜索的效率和准确度。

Description

基于决策树的信息推荐装置及方法
技术领域
本发明涉及信息推荐装置,更具体地,涉及基于决策树的信息推荐装置及方法。
背景技术
目前,随着网络应用的日益广泛以及不同领域的业务种类的日益丰富,用户通过网络进行特定信息的搜索和浏览(例如搜索和浏览意向购买的商品)变得越来越普遍。
然而,现有的信息搜索和浏览系统和方法存在如下问题:由于信息的种类和数量快速增长,用户需要花费大量的时间和精力在海量信息数据中查找感兴趣的信息,故信息搜索的效率和准确度较低。
因此,存在如下需求:提供能够根据用户的信息浏览数据提供相匹配的推荐信息的基于决策树的信息推荐装置及方法。
发明内容
为了解决上述现有技术方案所存在的问题,本发明提出了能够根据用户的信息浏览数据提供相匹配的推荐信息的基于决策树的信息推荐装置及方法。
本发明的目的是通过以下技术方案实现的:
一种基于决策树的信息推荐装置,所述基于决策树的信息推荐装置包括:
用户接口,所述用户接口基于用户的行为获取用户的信息浏览记录序列,并将所述信息浏览记录序列传送到决策树生成模块,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间;
决策树生成模块,所述决策树生成模块基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类;
加权模块,所述加权模块在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;
推荐模块,所述推荐模块基于加权后的决策树确定推荐目标。
在上面所公开的方案中,优选地,所述决策树生成模块以如下方式生成所述决策树:(1)获取所述信息浏览记录序列中的第一信息浏览记录并将其作为当前信息浏览记录;(2)基于所述第一信息浏览记录生成具有三层的决策树,并基于所述第一信息浏览记录中的与浏览目标相关联的属性的分类设置所述决策树中的每个节点的值,其中所述决策树的第一层是代表第一级属性分类的根节点,所述决策树的第二层是代表第二级属性分类的节点,所述决策树的第二层是代表第三级属性分类的节点;(3)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束决策树生成过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(4)将当前信息浏览记录中的与浏览目标相关联的属性按属性分类层级规则依次与所述决策树的节点进行比较,如果在与所述决策树的一个节点的比较中发现与该节点已包含的属性分类不同的属性分类,则在该节点处生成新的分支树,并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支树中的每个节点的值,随后返回步骤(3),其中,该不同的属性分类是该新的分支树的根节点的值。
在上面所公开的方案中,优选地,所述决策树的第三层中的每个节点是具有至少一层的子节点树,并且所述步骤(2)进一步包括:基于所述第一信息浏览记录中的与浏览目标相关联的属性中的对应的属性信息的分类设置所述子节点树中的每个子节点的值,以及所述步骤(4)进一步包括:将当前信息浏览记录中的与浏览目标相关联的属性中的对应的属性按属性分类层级规则依次与相关的第三层中的节点的子节点树中的子节点进行比较,如果在与该子节点树的一个子节点的比较中发现与该子节点已包含的属性分类不同的属性分类,则在该子节点处生成新的分支子节点树,并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支子节点树中的每个子节点的值。
在上面所公开的方案中,优选地,所述加权模块以如下方式对所述决策树中的每个节点赋以权重值:(a)获取所述信息浏览记录序列中第一信息浏览记录,并将其作为当前信息浏览记录;(b)将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值;(c)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束加权过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(d) 将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值,随后返回步骤(c)。
在上面所公开的方案中,优选地,所述步骤(b)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值,并且所述步骤(d)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值。
在上面所公开的方案中,优选地,所述推荐模块以如下方式确定推荐目标的属性信息:将由所述决策树的每个层级中权重值最高的属性分类构成的属性分类集合确定为推荐目标的属性信息,并根据所确定的属性信息从数据库中获取推荐目标。
在上面所公开的方案中,优选地,所述推荐模块在从数据库中获取推荐目标后将所获取的推荐目标呈现给用户。
本发明的目的也可以通过以下技术方案实现:
一种基于决策树的信息推荐方法,所述基于决策树的信息推荐方法包括下列步骤:
(A1)基于用户的行为获取用户的信息浏览记录序列,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间;
(A2)基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类;
(A3)在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;
(A4)基于加权后的决策树确定推荐目标。
本发明所公开的基于决策树的信息推荐装置及方法具有以下优点:能够根据用户的信息浏览数据提供相匹配的推荐信息,从而提高了信息搜索的效率和准确度。
附图说明
结合附图,本发明的技术特征以及优点将会被本领域技术人员更好地理解,其中:
图1是根据本发明的实施例的基于决策树的信息推荐装置的示意性结构图;
图2是根据本发明的实施例的基于决策树的信息推荐方法的流程图;
图3是根据本发明的实施例而构建的决策树的示意图。
具体实施方式
图1是根据本发明的实施例的基于决策树的信息推荐装置的示意性结构图。如图1所示,本发明所公开的基于决策树的信息推荐装置包括用户接口1、决策树生成模块2、加权模块3和推荐模块4。其中,所述用户接口1基于用户的行为获取用户的信息浏览记录序列,并将所述信息浏览记录序列传送到决策树生成模块2,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间。所述决策树生成模块2基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类(即浏览目标的最宽泛的分类)。所述加权模块3在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值。所述推荐模块4基于加权后的决策树确定推荐目标。
优选地,在本发明所公开的基于决策树的信息推荐装置中,所述决策树生成模块2以如下方式生成所述决策树:(1)获取所述信息浏览记录序列中的第一信息浏览记录并将其作为当前信息浏览记录;(2)基于所述第一信息浏览记录生成具有三层的决策树,并基于所述第一信息浏览记录中的与浏览目标相关联的属性的分类设置所述决策树中的每个节点的值,其中所述决策树的第一层是代表第一级属性分类的根节点,所述决策树的第二层是代表第二级属性分类的节点,所述决策树的第二层是代表第三级属性分类(即信息的最本质的(一个或多个)属性)的节点;(3)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束决策树生成过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(4)将当前信息浏览记录中的与浏览目标相关联的属性按属性分类层级规则依次与所述决策树的节点进行比较,如果在与所述决策树的一个节点的比较中发现与该节点已包含的属性分类不同的属性分类,则在该节点处生成新的分支树(即该不同的属性分类以新的分支的方式被包含在该节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支树中的每个节点的值(即从该分支树的根节点开始按层级为该分支树的每个节点赋值),随后返回步骤(3),其中,该不同的属性分类是该新的分支树的根节点的值。
优选地,在本发明所公开的基于决策树的信息推荐装置中,所述决策树的第三层中的每个节点是具有至少一层的子节点树(示例性地,子节点树具有11层,即第三级属性分类具有11个分类层级),并且所述步骤(2)进一步包括:基于所述第一信息浏览记录中的与浏览目标相关联的属性中的对应的属性信息的分类设置所述子节点树中的每个子节点的值,以及所述步骤(4)进一步包括:将当前信息浏览记录中的与浏览目标相关联的属性中的对应的属性按属性分类层级规则依次与相关的第三层中的节点的子节点树中的子节点进行比较,如果在与该子节点树的一个子节点的比较中发现与该子节点已包含的属性分类不同的属性分类,则在该子节点处生成新的分支子节点树(即该不同的属性分类以新的分支的方式被包含在该子节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支子节点树中的每个子节点的值。
优选地,在本发明所公开的基于决策树的信息推荐装置中,所述加权模块3以如下方式对所述决策树中的每个节点赋以权重值:(a)获取所述信息浏览记录序列中第一信息浏览记录,并将其作为当前信息浏览记录;(b)将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值;(c)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束加权过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(d) 将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值,随后返回步骤(c)。
优选地,在本发明所公开的基于决策树的信息推荐装置中,所述步骤(b)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值,并且所述步骤(d)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值。
优选地,在本发明所公开的基于决策树的信息推荐装置中,所述推荐模块4以如下方式确定推荐目标的属性信息:将由所述决策树的每个层级中权重值最高的属性分类构成的属性分类集合确定为推荐目标的属性信息,并根据所确定的属性信息从数据库中获取推荐目标(例如将符合所确定的属性分类集合中的每个属性分类的商品作为推荐商品)。
可选地,在本发明所公开的基于决策树的信息推荐装置中,所述推荐模块4在确定推荐目标的属性信息后将所述属性信息传送到相关的数据处理服务器(例如电子商务领域中的用于推荐商品的推理操作服务器)以进行后续的处理。
优选地,在本发明所公开的基于决策树的信息推荐装置中,所述推荐模块4在从数据库中获取推荐目标后将所获取的推荐目标呈现给用户。
由上可见,本发明所公开的基于决策树的信息推荐装置具有下列优点:能够根据用户的信息浏览数据提供相匹配的推荐信息,从而提高了信息搜索的效率和准确度。
图3是根据本发明的实施例而构建的决策树的示意图。如图3所示,在电子商务领域中,根据本发明所公开的工作原理的决策树的构建过程如下:设商品属性集A分别由                                                
Figure DEST_PATH_IMAGE001
Figure 599868DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
 组成,即A={
Figure 565550DEST_PATH_IMAGE001
Figure 747133DEST_PATH_IMAGE002
Figure 625221DEST_PATH_IMAGE003
}。其中:
Figure 525044DEST_PATH_IMAGE001
为一级属性,即对商品最宽泛的分类(例如通过,可以区分生活用品与建筑材料);
Figure 330506DEST_PATH_IMAGE002
 是二级属性(例如,通过
Figure 691080DEST_PATH_IMAGE002
 可以区分用户浏览的商品是冰箱还是洗衣机; 是商品最本质的属性(例如,通过
Figure 634951DEST_PATH_IMAGE003
,可以区分商品是红色还是白色,是塑料材质还是钢铁材质),其中,
Figure 525547DEST_PATH_IMAGE003
 可以进一步被细化为
Figure 260285DEST_PATH_IMAGE003
={
Figure 869121DEST_PATH_IMAGE004
Figure DEST_PATH_IMAGE005
,…,
Figure 731029DEST_PATH_IMAGE006
}(例如,可以将
Figure 741710DEST_PATH_IMAGE003
定义为:
Figure 647349DEST_PATH_IMAGE004
=名称,
Figure 743481DEST_PATH_IMAGE005
=内容描述, =品牌, =价格,
Figure DEST_PATH_IMAGE009
 =颜色, =形状,
Figure DEST_PATH_IMAGE011
=尺寸,=原料,=材质,
Figure 855608DEST_PATH_IMAGE014
=产地,
Figure 43006DEST_PATH_IMAGE006
=销售地),此外,设用户在时间T内共浏览了n个商品
Figure DEST_PATH_IMAGE015
Figure 215231DEST_PATH_IMAGE016
,…,,则
Figure 462672DEST_PATH_IMAGE018
为浏览者对商品P的访问时间,而Σ
Figure DEST_PATH_IMAGE019
Figure 292797DEST_PATH_IMAGE020
+… +
Figure DEST_PATH_IMAGE021
为用户对网络站点的总的浏览时长,在以上假设的基础上,以如下方式构建决策树:(1)用户浏览商品
Figure 70260DEST_PATH_IMAGE022
后,为其产生一棵决策树
Figure DEST_PATH_IMAGE023
,示例性地,初始的
Figure 737871DEST_PATH_IMAGE023
自动地生成X,Y,Z三个检验节点,其中Z节点又包括了
Figure 30312DEST_PATH_IMAGE004
Figure 887409DEST_PATH_IMAGE005
,…,
Figure 519379DEST_PATH_IMAGE006
共11个检验节点,依次对其后浏览商品的属性值进行检验;(2)用户浏览
Figure 170940DEST_PATH_IMAGE024
后,从X检验节点开始将
Figure DEST_PATH_IMAGE025
Figure 904672DEST_PATH_IMAGE026
进行比对,检验节点可以将相同的属性值归为同类,如果发现了新的值,则形成一个新的分支,以此类推,直到所有节点都为单一属性值即形成叶子节点,如图3所示,检验节点Z节点包括了
Figure 299881DEST_PATH_IMAGE004
Figure 786357DEST_PATH_IMAGE005
,…,
Figure 874399DEST_PATH_IMAGE006
共11个小检验节点,由此,当一件商品的所有属性值都被分离出来后就形成一个叶子节点,一棵决策树可以有多个叶子节点,此外,因为商品越吸引用户,用户的停留时间越长,所以用户对商品的浏览时间是用户对商品感兴趣程度的直观表述,因此,将
Figure 527283DEST_PATH_IMAGE018
值作为商品P的各项属性值的基础权重,用户每浏览一次商品,就增加权重值
Figure 930583DEST_PATH_IMAGE018
,如图3所示,示例性地,当用户浏览了商品
Figure 127209DEST_PATH_IMAGE015
Figure 881538DEST_PATH_IMAGE016
Figure DEST_PATH_IMAGE027
后,由于
Figure 306966DEST_PATH_IMAGE015
Figure 830351DEST_PATH_IMAGE027
都属于“生活用品”,所以
Figure 197878DEST_PATH_IMAGE015
Figure 173925DEST_PATH_IMAGE027
 的加权属性值
Figure 714627DEST_PATH_IMAGE028
 =
Figure 545049DEST_PATH_IMAGE019
Figure DEST_PATH_IMAGE029
,从而最终得出每项属性权重值最高的商品属性集合
Figure 817898DEST_PATH_IMAGE030
 ={
Figure 235236DEST_PATH_IMAGE032
,(
Figure DEST_PATH_IMAGE033
Figure 314050DEST_PATH_IMAGE034
,…,
Figure DEST_PATH_IMAGE035
)},此时,推荐装置对用户的属性进行判断,如果用户是注册用户,则继续使用其他推理技术进行进一步推理分析;如果用户为未注册用户,则直接向用户推荐与计算结果最为匹配的商品,即最后向未注册用户推荐的商品为P=(
Figure 749711DEST_PATH_IMAGE030
∪叶子节点子组),即各项属性值最高且形成了叶子节点的那个商品。
图2是根据本发明的实施例的基于决策树的信息推荐方法的流程图。如图2所示,本发明所公开的基于决策树的信息推荐方法包括下列步骤:(A1)基于用户的行为获取用户的信息浏览记录序列,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间;(A2)基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类(即浏览目标的最宽泛的分类);(A3)在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;(A4)基于加权后的决策树确定推荐目标。
优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A2)包括:(1)获取所述信息浏览记录序列中的第一信息浏览记录并将其作为当前信息浏览记录;(2)基于所述第一信息浏览记录生成具有三层的决策树,并基于所述第一信息浏览记录中的与浏览目标相关联的属性的分类设置所述决策树中的每个节点的值,其中所述决策树的第一层是代表第一级属性分类的根节点,所述决策树的第二层是代表第二级属性分类的节点,所述决策树的第二层是代表第三级属性分类(即信息的最本质的(一个或多个)属性)的节点;(3)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束决策树生成过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(4)将当前信息浏览记录中的与浏览目标相关联的属性按属性分类层级规则依次与所述决策树的节点进行比较,如果在与所述决策树的一个节点的比较中发现与该节点已包含的属性分类不同的属性分类,则在该节点处生成新的分支树(即该不同的属性分类以新的分支的方式被包含在该节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支树中的每个节点的值(即从该分支树的根节点开始按层级为该分支树的每个节点赋值),随后返回步骤(3),其中,该不同的属性分类是该新的分支树的根节点的值。
优选地,在本发明所公开的基于决策树的信息推荐方法中,所述决策树的第三层中的每个节点是具有至少一层的子节点树(示例性地,子节点树具有11层,即第三级属性分类具有11个分类层级),并且所述步骤(2)进一步包括:基于所述第一信息浏览记录中的与浏览目标相关联的属性中的对应的属性信息的分类设置所述子节点树中的每个子节点的值,以及所述步骤(4)进一步包括:将当前信息浏览记录中的与浏览目标相关联的属性中的对应的属性按属性分类层级规则依次与相关的第三层中的节点的子节点树中的子节点进行比较,如果在与该子节点树的一个子节点的比较中发现与该子节点已包含的属性分类不同的属性分类,则在该子节点处生成新的分支子节点树(即该不同的属性分类以新的分支的方式被包含在该子节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支子节点树中的每个子节点的值。
优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A3)包括:(a)获取所述信息浏览记录序列中第一信息浏览记录,并将其作为当前信息浏览记录;(b)将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值;(c)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束加权过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(d) 将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值,随后返回步骤(c)。
优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(b)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值,并且所述步骤(d)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值。
优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A4)包括:将由所述决策树的每个层级中权重值最高的属性分类构成的属性分类集合确定为推荐目标的属性信息,并根据所确定的属性信息从数据库中获取推荐目标(例如将符合所确定的属性分类集合中的每个属性分类的商品作为推荐商品)。
可选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A4)包括:在确定推荐目标的属性信息后将所述属性信息传送到相关的数据处理服务器(例如电子商务领域中的用于推荐商品的推理操作服务器)以进行后续的处理。
优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A4)进一步包括:在从数据库中获取推荐目标后将所获取的推荐目标呈现给用户。
由上可见,本发明所公开的基于决策树的信息推荐方法具有下列优点:能够根据用户的信息浏览数据提供相匹配的推荐信息,从而提高了信息搜索的效率和准确度。
尽管本发明是通过上述的优选实施方式进行描述的,但是其实现形式并不局限于上述的实施方式。应该认识到:在不脱离本发明主旨和范围的情况下,本领域技术人员可以对本发明做出不同的变化和修改。

Claims (8)

1.一种基于决策树的信息推荐装置,所述基于决策树的信息推荐装置包括:
用户接口,所述用户接口基于用户的行为获取用户的信息浏览记录序列,并将所述信息浏览记录序列传送到决策树生成模块,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间;
决策树生成模块,所述决策树生成模块基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类;
加权模块,所述加权模块在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;
推荐模块,所述推荐模块基于加权后的决策树确定推荐目标。
2.根据权利要求1所述的基于决策树的信息推荐装置,其特征在于,所述决策树生成模块以如下方式生成所述决策树:(1)获取所述信息浏览记录序列中的第一信息浏览记录并将其作为当前信息浏览记录;(2)基于所述第一信息浏览记录生成具有三层的决策树,并基于所述第一信息浏览记录中的与浏览目标相关联的属性的分类设置所述决策树中的每个节点的值,其中所述决策树的第一层是代表第一级属性分类的根节点,所述决策树的第二层是代表第二级属性分类的节点,所述决策树的第二层是代表第三级属性分类的节点;(3)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束决策树生成过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(4)将当前信息浏览记录中的与浏览目标相关联的属性按属性分类层级规则依次与所述决策树的节点进行比较,如果在与所述决策树的一个节点的比较中发现与该节点已包含的属性分类不同的属性分类,则在该节点处生成新的分支树,并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支树中的每个节点的值,随后返回步骤(3),其中,该不同的属性分类是该新的分支树的根节点的值。
3.根据权利要求2所述的基于决策树的信息推荐装置,其特征在于,所述决策树的第三层中的每个节点是具有至少一层的子节点树,并且所述步骤(2)进一步包括:基于所述第一信息浏览记录中的与浏览目标相关联的属性中的对应的属性信息的分类设置所述子节点树中的每个子节点的值,以及所述步骤(4)进一步包括:将当前信息浏览记录中的与浏览目标相关联的属性中的对应的属性按属性分类层级规则依次与相关的第三层中的节点的子节点树中的子节点进行比较,如果在与该子节点树的一个子节点的比较中发现与该子节点已包含的属性分类不同的属性分类,则在该子节点处生成新的分支子节点树,并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支子节点树中的每个子节点的值。
4.根据权利要求3所述的基于决策树的信息推荐装置,其特征在于,所述加权模块以如下方式对所述决策树中的每个节点赋以权重值:(a)获取所述信息浏览记录序列中第一信息浏览记录,并将其作为当前信息浏览记录;(b)将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值;(c)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束加权过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(d) 将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值,随后返回步骤(c)。
5.根据权利要求4所述的基于决策树的信息推荐装置,其特征在于,所述步骤(b)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值,并且所述步骤(d)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值。
6.根据权利要求5所述的基于决策树的信息推荐装置,其特征在于,所述推荐模块以如下方式确定推荐目标的属性信息:将由所述决策树的每个层级中权重值最高的属性分类构成的属性分类集合确定为推荐目标的属性信息,并根据所确定的属性信息从数据库中获取推荐目标。
7.根据权利要求6所述的基于决策树的信息推荐装置,其特征在于,所述推荐模块在从数据库中获取推荐目标后将所获取的推荐目标呈现给用户。
8.一种基于决策树的信息推荐方法,所述基于决策树的信息推荐方法包括下列步骤:
(A1)基于用户的行为获取用户的信息浏览记录序列,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间;
(A2)基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类;
(A3)在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;
(A4)基于加权后的决策树确定推荐目标。
CN201210569218.XA 2012-12-25 2012-12-25 基于决策树的信息推荐装置及方法 Active CN103902538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210569218.XA CN103902538B (zh) 2012-12-25 2012-12-25 基于决策树的信息推荐装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210569218.XA CN103902538B (zh) 2012-12-25 2012-12-25 基于决策树的信息推荐装置及方法

Publications (2)

Publication Number Publication Date
CN103902538A true CN103902538A (zh) 2014-07-02
CN103902538B CN103902538B (zh) 2017-03-15

Family

ID=50993868

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210569218.XA Active CN103902538B (zh) 2012-12-25 2012-12-25 基于决策树的信息推荐装置及方法

Country Status (1)

Country Link
CN (1) CN103902538B (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320719A (zh) * 2015-01-16 2016-02-10 焦点科技股份有限公司 一种基于项目标签和图形关系的众筹网站项目推荐方法
CN106156127A (zh) * 2015-04-08 2016-11-23 深圳市腾讯计算机系统有限公司 选择数据内容向终端推送的方法及装置
CN106547785A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 知识库中信息获取方法和系统
CN106780273A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 旅客航班需求分析方法和系统
CN107360222A (zh) * 2017-06-30 2017-11-17 广东欧珀移动通信有限公司 商品信息推送方法、装置、存储介质以及服务器
CN107766869A (zh) * 2016-08-22 2018-03-06 富士通株式会社 对象分类方法和对象分类设备
CN108985900A (zh) * 2018-07-16 2018-12-11 广州友米科技有限公司 基于运营业务的分时推荐方法
CN109271590A (zh) * 2018-09-29 2019-01-25 四川灵灵器机器人有限责任公司 一种基于时序决策模型的推荐方法
CN109389490A (zh) * 2018-09-26 2019-02-26 深圳壹账通智能科技有限公司 贷款产品匹配方法、装置、计算机设备和存储介质
CN109447865A (zh) * 2018-10-26 2019-03-08 广东小天才科技有限公司 一种学习内容推荐方法及系统
CN109978650A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 构建决策树的方法及系统
CN110532439A (zh) * 2019-08-30 2019-12-03 中国科学院自动化研究所 基于树搜索的同顺序部门决策流程生成方法、系统、装置
CN110659362A (zh) * 2019-09-17 2020-01-07 武汉鼎森电子科技有限公司 一种自动调节候选范围的推荐方法和系统
CN110795290A (zh) * 2019-10-30 2020-02-14 杭州迪普科技股份有限公司 一种双机配置策略一致性检测方法及装置
CN111191115A (zh) * 2019-12-10 2020-05-22 未鲲(上海)科技服务有限公司 基于用户数据的信息推送方法及装置
CN111861679A (zh) * 2020-08-04 2020-10-30 深圳市创智园知识产权运营有限公司 一种基于人工智能的商品推荐方法
CN112182386A (zh) * 2020-09-29 2021-01-05 中国银联股份有限公司 一种基于知识图谱的目标推荐方法及装置
CN112818228A (zh) * 2021-01-29 2021-05-18 北京百度网讯科技有限公司 向用户推荐对象的方法、装置、设备和介质
CN115827715A (zh) * 2023-02-08 2023-03-21 上海合见工业软件集团有限公司 基于用户行为和设计层次树的搜索推荐列表生成系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1347618A (zh) * 1999-12-17 2002-05-01 皇家菲利浦电子有限公司 利用决策树推荐电视节目的方法和装置
CN101866341A (zh) * 2009-04-17 2010-10-20 华为技术有限公司 一种信息推送方法、装置及系统
US20110238608A1 (en) * 2010-03-25 2011-09-29 Nokia Corporation Method and apparatus for providing personalized information resource recommendation based on group behaviors
CN102567392A (zh) * 2010-12-24 2012-07-11 华东师范大学 一种基于时间窗口兴趣主题挖掘的控制方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1347618A (zh) * 1999-12-17 2002-05-01 皇家菲利浦电子有限公司 利用决策树推荐电视节目的方法和装置
CN101866341A (zh) * 2009-04-17 2010-10-20 华为技术有限公司 一种信息推送方法、装置及系统
US20110238608A1 (en) * 2010-03-25 2011-09-29 Nokia Corporation Method and apparatus for providing personalized information resource recommendation based on group behaviors
CN102567392A (zh) * 2010-12-24 2012-07-11 华东师范大学 一种基于时间窗口兴趣主题挖掘的控制方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
苏欣: "Web使用挖掘的个性化推荐系统研究", 《中国优秀硕士学位论文全文数据库》 *

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105320719A (zh) * 2015-01-16 2016-02-10 焦点科技股份有限公司 一种基于项目标签和图形关系的众筹网站项目推荐方法
CN105320719B (zh) * 2015-01-16 2019-02-05 焦点科技股份有限公司 一种基于项目标签和图形关系的众筹网站项目推荐方法
CN106156127A (zh) * 2015-04-08 2016-11-23 深圳市腾讯计算机系统有限公司 选择数据内容向终端推送的方法及装置
US10789311B2 (en) 2015-04-08 2020-09-29 Tencent Technology (Shenzhen) Company Limited Method and device for selecting data content to be pushed to terminal, and non-transitory computer storage medium
CN106156127B (zh) * 2015-04-08 2020-06-16 深圳市腾讯计算机系统有限公司 选择数据内容向终端推送的方法及装置
CN106547785A (zh) * 2015-09-22 2017-03-29 阿里巴巴集团控股有限公司 知识库中信息获取方法和系统
CN106547785B (zh) * 2015-09-22 2020-08-04 阿里巴巴集团控股有限公司 知识库中信息获取方法和系统
CN107766869A (zh) * 2016-08-22 2018-03-06 富士通株式会社 对象分类方法和对象分类设备
CN106780273A (zh) * 2016-12-30 2017-05-31 中国民航信息网络股份有限公司 旅客航班需求分析方法和系统
CN107360222A (zh) * 2017-06-30 2017-11-17 广东欧珀移动通信有限公司 商品信息推送方法、装置、存储介质以及服务器
CN109978650B (zh) * 2017-12-28 2024-05-24 北京京东尚科信息技术有限公司 构建决策树的方法及系统
CN109978650A (zh) * 2017-12-28 2019-07-05 北京京东尚科信息技术有限公司 构建决策树的方法及系统
CN108985900B (zh) * 2018-07-16 2021-06-29 广州天高软件科技有限公司 基于运营业务的分时推荐方法
CN108985900A (zh) * 2018-07-16 2018-12-11 广州友米科技有限公司 基于运营业务的分时推荐方法
CN109389490A (zh) * 2018-09-26 2019-02-26 深圳壹账通智能科技有限公司 贷款产品匹配方法、装置、计算机设备和存储介质
CN109271590A (zh) * 2018-09-29 2019-01-25 四川灵灵器机器人有限责任公司 一种基于时序决策模型的推荐方法
CN109271590B (zh) * 2018-09-29 2021-08-31 四川灵灵器机器人有限责任公司 一种基于时序决策模型的推荐方法
CN109447865A (zh) * 2018-10-26 2019-03-08 广东小天才科技有限公司 一种学习内容推荐方法及系统
CN110532439A (zh) * 2019-08-30 2019-12-03 中国科学院自动化研究所 基于树搜索的同顺序部门决策流程生成方法、系统、装置
CN110532439B (zh) * 2019-08-30 2022-02-08 中国科学院自动化研究所 基于树搜索的同顺序部门决策流程生成方法、系统、装置
CN110659362A (zh) * 2019-09-17 2020-01-07 武汉鼎森电子科技有限公司 一种自动调节候选范围的推荐方法和系统
CN110795290A (zh) * 2019-10-30 2020-02-14 杭州迪普科技股份有限公司 一种双机配置策略一致性检测方法及装置
CN111191115B (zh) * 2019-12-10 2022-10-11 未鲲(上海)科技服务有限公司 基于用户数据的信息推送方法及装置
CN111191115A (zh) * 2019-12-10 2020-05-22 未鲲(上海)科技服务有限公司 基于用户数据的信息推送方法及装置
CN111861679A (zh) * 2020-08-04 2020-10-30 深圳市创智园知识产权运营有限公司 一种基于人工智能的商品推荐方法
CN112182386A (zh) * 2020-09-29 2021-01-05 中国银联股份有限公司 一种基于知识图谱的目标推荐方法及装置
CN112182386B (zh) * 2020-09-29 2023-12-05 中国银联股份有限公司 一种基于知识图谱的目标推荐方法及装置
CN112818228A (zh) * 2021-01-29 2021-05-18 北京百度网讯科技有限公司 向用户推荐对象的方法、装置、设备和介质
CN112818228B (zh) * 2021-01-29 2023-08-04 北京百度网讯科技有限公司 向用户推荐对象的方法、装置、设备和介质
CN115827715A (zh) * 2023-02-08 2023-03-21 上海合见工业软件集团有限公司 基于用户行为和设计层次树的搜索推荐列表生成系统

Also Published As

Publication number Publication date
CN103902538B (zh) 2017-03-15

Similar Documents

Publication Publication Date Title
CN103902538A (zh) 基于决策树的信息推荐装置及方法
CN102609523B (zh) 基于物品分类和用户分类的协同过滤推荐方法
CN105913273A (zh) 智能推荐的全端显示方法及装置
Bok et al. Social group recommendation based on dynamic profiles and collaborative filtering
WO2014015079A2 (en) Method and apparatus of recommending clothing products
De et al. Discriminative link prediction using local, community, and global signals
CN103559622A (zh) 基于特征的协同过滤推荐方法
CN106326318B (zh) 搜索方法及装置
CN105760443A (zh) 项目推荐系统、项目推荐装置以及项目推荐方法
CN104778237A (zh) 一种基于关键用户的个性化推荐方法和系统
Li et al. Social recommendation based on trust and influence in SNS environments
CN113343077A (zh) 一种融合用户兴趣时序波动的个性化推荐方法及系统
CN106021428A (zh) 一种基于knn和三支决策的电影推荐方法
Liu et al. Context similarity metric for multidimensional service recommendation
Li et al. A Personalization Recommendation Algorithm for E-Commerce.
Gong A Personalized Recommendation Algorithm on Integration of Item Semantic Similarity and Item Rating Similarity.
CN110968780B (zh) 页面内容推荐方法、装置、计算机设备和存储介质
Li et al. Multidimensional clustering based collaborative filtering approach for diversified recommendation
CN101986301A (zh) 一种基于逆邻分析的协作过滤推荐系统及方法
Cai et al. An extension of social network group decision-making based on trustrank and personas
Sharma et al. CCFRS–community based collaborative filtering recommender system
Pujahari et al. An approach to content based recommender systems using decision list based classification with k-DNF rule set
CN105868242A (zh) 网络推荐中标签的排序方法及系统
Gang Personalized Recommendation of Tourist Attractions Based on Collaborative Filtering
Arora et al. Research issues, innovation and associated approaches for recommendation on social networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant