CN110659362A - 一种自动调节候选范围的推荐方法和系统 - Google Patents
一种自动调节候选范围的推荐方法和系统 Download PDFInfo
- Publication number
- CN110659362A CN110659362A CN201910874833.3A CN201910874833A CN110659362A CN 110659362 A CN110659362 A CN 110659362A CN 201910874833 A CN201910874833 A CN 201910874833A CN 110659362 A CN110659362 A CN 110659362A
- Authority
- CN
- China
- Prior art keywords
- tree structure
- candidate
- features
- recommendation
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出了一种自动调节候选范围的推荐方法和系统,可以提取用户行为日志中的特征,并将该特征与特征分类树状结构匹配,获得该特征至根节点的一条树枝路径,为树枝路径上所有节点进行加权,随着用户阅读行为积累,特征分类树状结构上各节点的权重不断更新,从各层次选取一定数量候选项,因为可以从不同层次选取候选项,平衡了特征分布不均匀的问题,解决了推荐候选项分布不均匀,特别是稀疏特征导致的问题,在推荐的相关性和新颖感之间取得较好的平衡效果。
Description
技术领域
本发明涉及大数据领域,尤其涉及一种自动调节候选范围的推荐方法和系统。
背景技术
基于用户历史行为推荐关联信息,已经成为电子商务、在线阅读、音乐影视等应用的基本功能,并发展出了很多完善的技术,例如协同过滤技术、用户-物品(User-ItemModel)模型技术等。现实工程实践中,可能会遇到推荐候选项目分布不均衡问题。例如:文学作品中,言情类小说偏多,科幻类偏少,同样是言情小说,某个作家的作品偏多,其他寥寥。这种不均衡导致推荐的相关性和新颖感之间的矛盾突出,具体表现为:遇到候选项多的类型会一直推荐同类型的物品,相关性高,但新颖感越来越低,导致用户接受率下降,需要根据用户反馈进行调整,导致系统算法复杂,采集数据增大,而遇到候选项少的类型,可推荐项少甚至无,也需要额外算法解决,相关性低。因此,为解决上述问题,本发明提供一种自动调节候选范围的推荐方法和系统,可以在推荐候选物品分布不均衡的情况下,自动调节候选范围,达到相关性和新颖感的综合性能指标。
发明内容
有鉴于此,本发明提出了一种自动调节候选范围的推荐方法和系统,可以在推荐候选物品分布不均衡的情况下,自动调节候选范围,达到相关性和新颖感的综合性能指标。
本发明的技术方案是这样实现的:一方面,本发明提供了一种自动调节候选范围的推荐方法,包括以下步骤:
S1、根据图书分类生成特征分类树状结构;
S2、收集用户阅读行为产生的用户行为日志,从用户行为日志提取出特征,将该特征与特征分类树状结构匹配,获得该特征至根节点的树枝路径,根据预设的权重分配原则对该树枝路径的节点进行加权;
S3、从特征分类树状结构的各层次上根据权重高低顺序选取多个候选项;
S4、从候选项中选取1到n个特征推荐给用户。
在以上技术方案的基础上,优选的,S1中具体包括以下步骤:
S101、获取图书的Item属性;
S102、根据Item属性计算分布,对分布集中的Item属性进一步计算,产生多层次的特征分类,最后生成特征分类树状结构。
在以上技术方案的基础上,优选的,S1中特征分类树状结构有n层,设根节点为一级特征,特征分类树状结构的第二层节点均为二级特征,第三层节点均为三级特征,依次往下定义,第n层节点为n级特征。
在以上技术方案的基础上,优选的,S2中特征包括图书类别、图书标签、图书作者、图书背景或写作风格。
在以上技术方案的基础上,优选的,S2中一次用户阅读行为对应一个特征,一个特征对应特征分类树状结构上从根节点到该特征的一条树枝路径。
进一步优选的,S2中特征分类树状结构上的各节点初始权重均为0,特征分类树状结构的最终权重是多次阅读行为权重的迭代。
进一步优选的,S2中权重分配原则为:树枝路径上的上级节点至下级节点的权重逐渐增大。
在以上技术方案的基础上,S4具体包括以下步骤:
S1、将候选项中权重最高的特征纳入第一推荐候选范围,若候选项中包含该特征的下级特征,则推荐时按照附属特征的权重高低顺序形成推荐顺序;
S2、将候选项中的符合第一推荐候选范围的特征删除,将剩余候选项中权重最高的特征纳入第二推荐候选范围,依次循环,直至达到推荐数量为止。
另一方面,本发明提供一种自动调节候选范围的推荐系统,包括属性分类模块、用户行为分析模块、权重分配模块、选取模块和排序模块;
用户行为分析模块获取用户阅读时产生的用户行为日志,根据用户行为日志提取出特征,并将该特征发送给属性分类模块;
属性分类模块根据图书特征生成特征分类树状结构,并将用户行为分析模块发送的特征与特征分类树状结构进行匹配,获得该特征在特征分类树状结构上从根节点到该特征的一条树枝路径;
权重分配模块根据预设的权重分配原则对属性分类模块获得的树枝路径上所有节点分配不同的权重,并根据加权结果排序;
选取模块依据排序选择1到n个节点作为候选项,并将候选项发送给排序模块;
排序模块对多个候选项进行综合评价,从候选项中选取评分最高的候选项推荐给用户。
本发明的一种自动调节候选范围的推荐系统相对于现有技术具有以下有益效果:
(1)本发明预先生成特征分类树状结构,对系统资源消耗低,简化了后续算法;
(2)本发明可以提取用户行为日志中的特征,并将该特征与特征分类树状结构匹配,获得该特征至根节点的一条树枝路径,为树枝路径上所有节点进行加权,随着用户阅读行为积累,特征分类树状结构上各节点的权重不断更新,从各层次选取一定数量候选项,因为可以从不同层次选取候选项,平衡了特征分布不均匀的问题,解决了推荐候选项分布不均匀,特别是稀疏特征导致的问题,在推荐的相关性和新颖感之间取得较好的平衡效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种自动调节候选范围的推荐方法的流程图;
图2为本发明一种自动调节候选范围的推荐系统的结构图;
图3为实施例3中特征分类树状结构的结构图。
具体实施方式
下面将结合本发明实施方式,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
实施例1
本实施例提供一种自动调节候选范围的推荐方法,包括以下步骤:
S1、根据图书分类生成特征分类树状结构;
具体的,包括以下步骤:
S101、获取图书的Item属性;
S102、根据Item属性计算分布,对分布集中的Item属性进一步计算,产生多层次的特征分类,最后生成特征分类树状结构。
其中,Item属性包括图书类别、图书作者、图书背景或写作风格,图书类别为图书的分类,一般有5个部,二十二个大类,每一小类下再分子小类。最后,每一种书都可以分到某一个类目下,每一个类目都有一个类号。
S2、收集用户阅读行为产生的用户行为日志,从用户行为日志提取出特征,将该特征与特征分类树状结构匹配,获得该特征至根节点的树枝路径,根据预设的权重分配原则对该树枝路径的节点进行加权;
需要说明的是,当用户产生阅读行为时,一次用户阅读行为产生一个用户行为日志,对应一个特征,就可以在特征分类树状结构上从根节点到该特征的一条树枝路径。例如,用户阅读一本言情小说,则提取的特征为言情小说,以“言情小说”这个特征匹配特征分类树状结构,可以在特征分类树状结构上找到与言情小说相匹配的特征,就可以获取所有的言情小说作品。
另外,为了简化算法,特征分类树状结构上所有节点的权重初始值均设为0,当用户的一次阅读行为匹配到某节点时,该节点至根节点的树枝路径上所有节点按照预设的权重进行加权,并保留加权结果,本实施例中,树枝路径上的上级节点至下级节点的权重逐渐增大,且每层节点的预设权重均相同;当第二次匹配到该节点或者该节点处于其他匹配到的树枝路径上时,该节点再次加权。随着阅读行为的累积,特征分类树状结构上各节点的权重不断更新,特征分类树状结构的最终权重是多次阅读行为权重的迭代。
S3、从特征分类树状结构的各层次上根据权重高低顺序选取多个候选项;
需要说明的是,从各层次中选取多个候选项,在推荐时,可以从各层次中推荐用户以前阅读过相似或者用户没有阅读过的作品,可以平衡推荐特征分布不均匀以及新颖性不足的问题。
S4、从候选项中选取多本图书推荐给用户。
具体包括以下步骤:
S1、将候选项中权重最高的特征纳入第一推荐候选范围,若候选项中包含该特征的下级特征,则推荐时按照附属特征的权重高低顺序形成推荐顺序;
S2、将候选项中的符合第一推荐候选范围的特征删除,将剩余候选项中权重最高的特征纳入第二推荐候选范围,依次循环,直至达到推荐数量为止。
需要说明的是,本实施例从各候选项中选取多个符合特征并且用户又没阅读过的图书推荐给用户。
本实例提供的一种自动调节候选范围的推荐系统,可以提取用户行为日志中的特征,并将该特征与特征分类树状结构匹配,获得该特征至根节点的一条树枝路径,为树枝路径上所有节点进行加权,随着用户阅读行为积累,特征分类树状结构上各节点的权重不断更新,从各层次选取一定数量候选项,因为可以从不同层次选取候选项,平衡了特征分布不均匀的问题;从该候选项中按照权重高低排序,最后推荐给用户。
实施例2
在实施例1的基础上,本实施例提供一种自动调节候选范围的推荐系统,包括属性分类模块、用户行为分析模块、权重分配模块、选取模块和排序模块;
用户行为分析模块获取用户阅读时产生的用户行为日志,根据用户行为日志提取出特征,并将该特征发送给属性分类模块;
属性分类模块根据图书特征生成特征分类树状结构,并将用户行为分析模块发送的特征与特征分类树状结构进行匹配,获得该特征在特征分类树状结构上从根节点到该特征的一条树枝路径;
权重分配模块根据预设的权重分配原则对属性分类模块获得的树枝路径上所有节点分配不同的权重,并根据加权结果排序;
选取模块依据排序选择1到n个节点作为候选项,并将候选项发送给排序模块;
排序模块对多个候选项进行综合评价,从候选项中选取评分最高的候选项推荐给用户。
实施例3
在实施例1的基础上,本实施例给出一种自动调节候选范围的推荐方法的一个具体的实施例。
假设一本图书,其一级特征是文学,二级特征有小说和诗歌,小说的下级特征有言情、科幻,言情的下级特征有作者A、作者B和作者C,诗歌的下级特征有词、抒情诗和叙事诗。
本实施例中,特征分类树状结构上的每个节点权重初始值均设为0。当用户有一次阅读行为匹配到作者A小说,则对“作者A”计算一个评分,设评分为15,其上级特征“言情”可以计算出一个评分,设评分为10,同时,对“言情”的上级特征“小说”也以较低权重计算出评分,设评分为2,同理对“小说”的上级特征“文学”也会计算出评分,设评分为1,依据上述评分原则,每次阅读行为均按不同权重依次对特征,特征父节点,...直到根节点加分,随着阅读行为的累积,特征分类树状结构的权重不断更新。假设用户产生10次阅读行为,其中匹配到2次“作者A”特征、3次“作者B”特征、2次“科幻”特征、2次“词”特征和1次“抒情诗”特征,此时特征分类树状结构上各节点的权重如图3所示。
进入选取阶段,首先从各层选取多个候选项,本实施例中,从第四层选取的候选项有:作者A、作者B和作者C,评分分别为:30、45和0;第三层选取的候选项有:言情、科幻、词、抒情诗和叙事诗,评分分别为:50、20、20、10和0;第二层选取的候选项有:小说、诗歌和散文,评分分别为14、6和0;第一层选取的候选项有文学,评分为10。可以看出,选取的候选项包括了用户阅读过以及没有阅读过的特征,本实施例不仅可以向用户推荐同类别作品,还可以向用户推荐相似的作品,进而解决推荐不平衡以及新颖性不高的问题。
最后进入排序阶段,对候选项进行综合评分,最后将评分高的前n个特征推荐给用户。本实施例中,设选取10个特征推荐给用户,候选项权重排第一的是言情,得分是50,高于作者B的45,表明这个读者对言情小说的喜爱并不限于某个作者。这种情况下,阅读作者A的行为对阅读作者B的行为产生“平衡”效果,提示推荐系统:用户对言情小说这种图书类型的偏爱大于对作者B的偏爱,应该向其推荐更多作家的言情小说。因此这一类型下的读者所有未阅读的图书都可以纳入第一推荐候选范围,再结合其他指标和算法,例如这一类型其他读者阅读数据产生的阅读排行榜,或者新上架的图书等,有很大几率推荐到这个读者视野范围外的符合他偏好的图书,提高推荐的新颖性。另外,科幻和词的权重均为20,抒情诗和叙事诗的权重比科幻和词的权重低,因此将科幻或者词纳入第二推荐候选范围,本实施例中将科幻纳入第二推荐候选范围,将词纳入第三推荐候选范围,将抒情诗纳入第四推荐候选范围,将叙事诗纳入第五推荐候选范围。所以,排序为言情、作者B、作者A、作者C、科幻、词、抒情诗、叙事诗、散文。
以上所述仅为本发明的较佳实施方式而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (9)
1.一种自动调节候选范围的推荐方法,其特征在于:包括以下步骤:
S1、根据图书分类生成特征分类树状结构;
S2、收集用户阅读行为产生的用户行为日志,从用户行为日志提取出特征,将该特征与特征分类树状结构匹配,获得该特征至根节点的树枝路径,根据预设的权重分配原则对该树枝路径的节点进行加权;
S3、从特征分类树状结构的各层次上根据权重高低顺序选取多个候选项;
S4、从候选项中选取1到n个特征推荐给用户。
2.如权利要求1所述的一种自动调节候选范围的推荐方法,其特征在于:所述S1中具体包括以下步骤:
S101、获取图书的Item属性;
S102、根据Item属性计算分布,对分布集中的Item属性进一步计算,产生多层次的特征分类,最后生成特征分类树状结构。
3.如权利要求1所述的一种自动调节候选范围的推荐方法,其特征在于:所述S1中特征分类树状结构有n层,设根节点为一级特征,特征分类树状结构的第二层节点均为二级特征,第三层节点均为三级特征,依次往下定义,第n层节点为n级特征。
4.如权利要求1所述的一种自动调节候选范围的推荐方法,其特征在于:所述S2中特征包括图书类别、图书标签、图书作者、图书背景或写作风格。
5.如权利要求1所述的一种自动调节候选范围的推荐系统,其特征在于:所述S2中一次用户阅读行为对应一个特征,一个特征对应特征分类树状结构上从根节点到该特征的一条树枝路径。
6.如权利要求5所述的一种自动调节候选范围的推荐方法,其特征在于:所述S2中特征分类树状结构上的各节点初始权重均为0,特征分类树状结构的最终权重是多次阅读行为权重的迭代。
7.如权利要求6所述的一种自动调节候选范围的推荐方法,其特征在于:所述S2中权重分配原则为:树枝路径上的上级节点至下级节点的权重逐渐增大。
8.如权利要求1所述的一种自动调节候选范围的推荐方法,其特征在于:所述S4具体包括以下步骤:
S1、将候选项中权重最高的特征纳入第一推荐候选范围,若候选项中包含该特征的下级特征,则推荐时按照附属特征的权重高低顺序形成推荐顺序;
S2、将候选项中的符合第一推荐候选范围的特征删除,将剩余候选项中权重最高的特征纳入第二推荐候选范围,依次循环,直至达到推荐数量为止。
9.一种自动调节候选范围的推荐系统,其特征在于:包括属性分类模块、用户行为分析模块、权重分配模块、选取模块和排序模块;
所述用户行为分析模块获取用户阅读时产生的用户行为日志,根据用户行为日志提取出特征,并将该特征发送给属性分类模块;
所述属性分类模块根据图书特征生成特征分类树状结构,并将用户行为分析模块发送的特征与特征分类树状结构进行匹配,获得该特征在特征分类树状结构上从根节点到该特征的一条树枝路径;
所述权重分配模块根据预设的权重分配原则对属性分类模块获得的树枝路径上所有节点分配不同的权重,并根据加权结果排序;
所述选取模块依据排序选择1到n个节点作为候选项,并将候选项发送给排序模块;
所述排序模块对多个候选项进行综合评价,从候选项中选取评分最高的候选项推荐给用户。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910874833.3A CN110659362A (zh) | 2019-09-17 | 2019-09-17 | 一种自动调节候选范围的推荐方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910874833.3A CN110659362A (zh) | 2019-09-17 | 2019-09-17 | 一种自动调节候选范围的推荐方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110659362A true CN110659362A (zh) | 2020-01-07 |
Family
ID=69038088
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910874833.3A Pending CN110659362A (zh) | 2019-09-17 | 2019-09-17 | 一种自动调节候选范围的推荐方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110659362A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984689A (zh) * | 2020-08-21 | 2020-11-24 | 北京百度网讯科技有限公司 | 信息检索的方法、装置、设备以及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968802A (zh) * | 2010-09-30 | 2011-02-09 | 百度在线网络技术(北京)有限公司 | 一种基于用户浏览行为进行互联网内容推荐的方法与设备 |
CN103902538A (zh) * | 2012-12-25 | 2014-07-02 | 中国银联股份有限公司 | 基于决策树的信息推荐装置及方法 |
CN106407204A (zh) * | 2015-07-29 | 2017-02-15 | 小米科技有限责任公司 | 图书推荐方法及装置 |
CN107545491A (zh) * | 2017-08-28 | 2018-01-05 | 北京三快在线科技有限公司 | 一种推荐信息的数据处理方法和装置 |
CN109559208A (zh) * | 2019-01-04 | 2019-04-02 | 平安科技(深圳)有限公司 | 一种信息推荐方法、服务器及计算机可读介质 |
-
2019
- 2019-09-17 CN CN201910874833.3A patent/CN110659362A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101968802A (zh) * | 2010-09-30 | 2011-02-09 | 百度在线网络技术(北京)有限公司 | 一种基于用户浏览行为进行互联网内容推荐的方法与设备 |
CN103902538A (zh) * | 2012-12-25 | 2014-07-02 | 中国银联股份有限公司 | 基于决策树的信息推荐装置及方法 |
CN106407204A (zh) * | 2015-07-29 | 2017-02-15 | 小米科技有限责任公司 | 图书推荐方法及装置 |
CN107545491A (zh) * | 2017-08-28 | 2018-01-05 | 北京三快在线科技有限公司 | 一种推荐信息的数据处理方法和装置 |
CN109559208A (zh) * | 2019-01-04 | 2019-04-02 | 平安科技(深圳)有限公司 | 一种信息推荐方法、服务器及计算机可读介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111984689A (zh) * | 2020-08-21 | 2020-11-24 | 北京百度网讯科技有限公司 | 信息检索的方法、装置、设备以及存储介质 |
CN111984689B (zh) * | 2020-08-21 | 2023-07-25 | 北京百度网讯科技有限公司 | 信息检索的方法、装置、设备以及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245160B (zh) | 一种确定房屋装修方案的方法及系统 | |
CN105893609B (zh) | 一种基于加权混合的移动app推荐方法 | |
CN108763362A (zh) | 基于随机锚点对选择的局部模型加权融合Top-N电影推荐方法 | |
CN110532379B (zh) | 一种基于lstm的用户评论情感分析的电子资讯推荐方法 | |
CN107220365A (zh) | 基于协同过滤与关联规则并行处理的精准推荐系统及方法 | |
CN109146626B (zh) | 一种基于用户动态兴趣分析的时尚服装搭配推荐方法 | |
CN105975496A (zh) | 一种基于上下文感知的音乐推荐方法及装置 | |
CN101430704A (zh) | 支持分类规则创建的方法和装置 | |
US11501358B2 (en) | Systems and computer program product for determining an object property | |
CN107918818A (zh) | 基于大数据技术的供应链管理决策支持系统 | |
CN107665217A (zh) | 一种用于搜索业务的词汇处理方法及系统 | |
CN107918657A (zh) | 一种数据源的匹配方法和装置 | |
CN109816438A (zh) | 信息推送方法及装置 | |
CN109460462A (zh) | 一种中文相似问题生成系统与方法 | |
CN113761114A (zh) | 短语生成方法、装置和计算机可读存储介质 | |
KR101230034B1 (ko) | 취향 아이디 코드의 생성시스템 및 생성방법, 그리고 상품 추천 시스템 및 추천 방법 | |
CN110781300A (zh) | 基于百度百科知识图谱的旅游资源文化特色评分算法 | |
CN110659362A (zh) | 一种自动调节候选范围的推荐方法和系统 | |
CN113326432A (zh) | 一种基于决策树与推荐方法的模型优选方法 | |
KR101516329B1 (ko) | 소셜 네트워크 환경에서의 그룹 추천 시스템 및 방법 | |
CN111611432A (zh) | 一种基于Labeled LDA模型的歌手分类方法 | |
CN115033799B (zh) | 一种商品搜索方法、系统及存储介质 | |
CN109902131A (zh) | 一种基于对偶自编码器的组推荐方法 | |
Saaidin et al. | Recommender system: rating predictions of steam games based on genre and topic modelling | |
CN108182288A (zh) | 一种基于人工免疫的推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200107 |
|
RJ01 | Rejection of invention patent application after publication |