CN104462560B - 一种个性化推荐系统的推荐方法 - Google Patents
一种个性化推荐系统的推荐方法 Download PDFInfo
- Publication number
- CN104462560B CN104462560B CN201410831549.5A CN201410831549A CN104462560B CN 104462560 B CN104462560 B CN 104462560B CN 201410831549 A CN201410831549 A CN 201410831549A CN 104462560 B CN104462560 B CN 104462560B
- Authority
- CN
- China
- Prior art keywords
- user
- data
- recommendation
- entity
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000007787 solid Substances 0.000 claims description 28
- 238000001914 filtration Methods 0.000 claims description 6
- 206010068052 Mosaicism Diseases 0.000 claims description 3
- 210000003765 sex chromosome Anatomy 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 230000035945 sensitivity Effects 0.000 claims 1
- 238000003786 synthesis reaction Methods 0.000 claims 1
- 238000007418 data mining Methods 0.000 abstract description 2
- 238000005516 engineering process Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000009412 basement excavation Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004138 cluster model Methods 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及基于大数据和数据挖掘推荐系统技术领域,尤其是一种个性化推荐系统的推荐方法。本发明系统包括:数据接口层、用户日志系统、知识库、实体关系图库、推荐运算系统。数据接口层用于与上层业务系统进行通信;用户日志系统包含用户在应用系统里的所有操作记录;知识库是应用系统里所有数据的集合和推荐系统的学习集;实体关系图库用于存储用户、数据实体、属性等相互之间的关联关系;推荐运算系统是综合用户偏好和用户权值根据特定的算法自动向用户推荐其感兴趣的话题数据。本发明解决推荐系统的冷启动问题以及用户的兴趣不断变化带来的推荐运算复杂度增长的问题;可以用于大数据的处理。
Description
技术领域
本发明涉及基于大数据和数据挖掘推荐系统技术领域,尤其是一种基于用户日志和实体关联图库的个性化推荐系统的推荐方法。
背景技术
近年来,随着信息技术的日益发展以及连入互联网用户数量的不断增长,互联网中时时刻刻都会产生数量巨大的比特数据。如何有效利用这些信息已经成为一个世界性关注的问题。在经过学术界和工业界多年的研究和应用,对于这些数据附加价值的挖掘和利用技术也逐渐成熟,最主要的就是在电子商务、在线信息应用(如在线新闻、在线音乐、在线影视)等领域的关联信息推荐系统。
推荐系统里应用最广泛的是协同过滤技术,包括基于邻居和基于模型的方法。基于邻居的方法通常用于研究用户或物品之间的相似度计算问题:基于用户的协同过滤方法首先查找主要属性相似的用户(即邻居),然后收集和分析邻居的数据以进一步为目标用户推荐其感兴趣的物品。相似的,基于物品的协同过滤方法利用了相似物品的信息评级的优势。基于模型的方法试图将用户-物品的关系评估数据转化为不同的模型(如贝叶斯网络、因式分解或者集群模型等)并使用这些模型在未知场景中向用户推荐物品(因式分解技术在具有显式或隐式反馈的应用系统中获得了越来越高的关注)。
然而目前主流的推荐系统在面对新用户时,由于没有历史数据作为推荐依据而带来的“冷启动”问题也让用户体验比较差,而且用户的数据阅读兴趣或偏好也是随时间而不断变化,如何比较好的解决推荐系统的冷启动问题并且随时根据用户的偏好变化而调整推荐结果也是一个研究和应用的热点话题。
发明内容
本发明提供了一种基于用户日志和实体关联图库的个性化推荐系统的推荐方法;可以有效解决推荐系统的冷启动问题,并且使推荐结果随用户偏好的转换而动态变化,增强用户对推荐系统的使用体验性和个性化需求。
本发明解决上述技术问题的技术方案是:
所述的系统主要包括有以下模块:
数据接口层,主要负责与业务层的数据通信,接收数据请求以及发送推荐结果;
知识库,作为系统的数据源和推荐运算系统的学习集;
用户日志系统,记录用户在业务层的所有操作记录;
实体关联图库,分析知识库的数据,剖析并存储用户、实体数据、属性相互之间的关联关系;
推荐运算系统,接收数据接口层的输入,根据用户日志系统计算其最近偏好值,综合最邻近用户的偏好数据,得出用户可能最感兴趣的一个数据实体序列;
所述的推荐方法主要包括如下步骤,
步骤一,用户点击查看一条实体数据时,实体关联图库中相应属性的关联权值也会动态变化并重新被计算;
步骤二,分析用户当前点击实体数据的时间点和一个较早的时间点之间的实体数据的相关性,通过不断迭代收敛找出相关值最高的一个最近时间点,取这两个时间点之间的实体数据作为用户的最近偏好值数据源;
步骤三,根据用户的最近偏好值和动态变化的实体关联图库,综合处理后得出与用户当前偏好最接近的推荐结果。
所述的步骤二中计算两个指定时间点范围内实体数据的相关性时采取基于局部敏感哈希的随机投影方法,时间复杂度从传统的K-NN方法的O(N2)变为O(N)。
所述的知识库的数据实体主要为新闻、文献等文字性内容,且数据量随时间推移而不断增长。
所述实体关联图库是通过分析所述知识库的每一项实体数据以及用户配置文件,分解其属性,通过TF-IDF等相关算法计算各自的权值,权值范围为0至1之间;并以多维图形式记录实体-属性、属性-属性、实体-实体、用户-用户、用户-实体、用户-属性等相互之间的关联关系。
所述用户日志系统记录了业务层用户所有的操作,但在应用到推荐运算系统时,主要是提取用户对实体数据的点击操作日志,并且根据不同时间段之间实体数据的关联关系计算用户在某个时间点相对稳定的偏好值以作为个性化推荐的输入。
所述推荐运算系统中,用户第一次在业务层获取推荐数据时是用户本身的配置文件,此时主要采取基于用户的协同过滤方法获取该用户的最邻近用户之最热实体数据为推荐结果;正常情况下还需综合考虑用户以往的历史点击记录,减少实体数据的稀疏性问题对结果的影响。
附图说明
下面结合附图对本发明进一步说明:
图1是本发明个性化推荐系统的框架结构;
图2是本发明个性化推荐系统的实体关系图库示意图;
图3是本发明推荐方法的流程图。
具体实施方式
如附图1所示,本发明一种基于用户日志和实体关联图库的个性化推荐系统主要包括但不限于5个部分:数据接口层、知识库、用户日志系统、实体关系图库、推荐运算系统。
其中数据接口层主要负责与业务层的数据通信,接收数据请求以及发送实体数据推荐结果;知识库,是应用系统的数据源和推荐运算系统的学习集;用户日志系统,记录用户在业务层的所有操作记录;实体关系图库,将知识库的数据实体属性和用户属性分离并计算、存储相互之间的关联关系;推荐运算系统,接收数据接口层的输入,根据用户日志系统计算其偏好,在实体关系数据库查找或分析其实体属性关系,得出相关性最强的一个数据实体序列。
如附图2所示,本发明一种基于用户日志和实体关联图库的个性化推荐系统的实体关系图库示意图是同时从横向和纵向的角度剖析知识库中数据的相互关联性。
实体数据和用户的每个属性都有其在全局的一个权值ω(主要是通过TF-IDF等相关算法计算其全局词频),同时实体数据和用户的不同属性又根据属性重要程度有一个比重参数θ,由此可分别计算出实体数据或者用户之间的权值ω;同时根据用户日志记录计算出用户的最近偏好值参数λ,可以以λ参数为依据寻找最邻近用户,获取其偏好数据作为推荐结果。
如附图3所示,本发明一种基于用户日志和实体关联图库的个性化方法的步骤流程图,可以有效解决推荐系统的冷启动和用户偏好漂移问题。该方法包括以下步骤:
1、用户查看某个实体数据的详细信息,此时需判断用户是否为新用户;
2、若用户为新用户,通过实体关联图查找该用户的最邻近用户,以最邻近用户的偏好数据作为推荐结果;
3、若用户为老用户,首先在日志系统中以当前的日志记录为终点分析并计算用户的最近稳定偏好区间数据,得出偏好值,然后综合该偏好值以及最邻近用户权值得出关联度最高的实体数据作为推荐结果。
Claims (8)
1.一种基于用户日志和实体关联图库的个性化推荐系统的推荐方法,其特征在于:所述的系统主要包括有以下模块:
数据接口层,负责与业务层的数据通信,接收数据请求以及发送推荐结果;
知识库,作为系统的数据源和推荐运算系统的学习集;
用户日志系统,记录用户在业务层的所有操作记录;
实体关联图库,分析知识库的数据,剖析并存储用户、实体数据、属性相互之间的关联关系;
推荐运算系统,接收数据接口层的输入,根据用户日志系统计算其最近偏好值,综合最邻近用户的偏好数据,得出用户可能最感兴趣的一个数据实体序列;
所述的推荐方法包括如下步骤,
步骤一,用户点击查看一条实体数据时,实体关联图库中相应属性的关联权值也会动态变化并重新被计算;
步骤二,分析用户当前点击实体数据的时间点和一个较早的时间点之间的实体数据的相关性,通过不断迭代收敛找出相关值最高的一个最近时间点,取这两个时间点之间的实体数据作为用户的最近偏好值数据源;
步骤三,根据用户的最近偏好值和动态变化的实体关联图库,综合处理后得出与用户当前偏好最接近的推荐结果。
2.根据权利要求1所述的推荐方法,其特征在于:所述的步骤二中计算两个指定时间点范围内实体数据的相关性时采取基于局部敏感哈希的随机投影方法,时间复杂度从传统的K-NN方法的O(N2)变为O(N)。
3.根据权利要求1所述的推荐方法,其特征在于:所述的知识库的数据实体为新闻、文献的文字性内容,且数据量随时间推移而不断增长。
4.根据权利要求1所述的推荐方法,其特征在于:所述实体关联图库是通过分析所述知识库的每一项实体数据以及用户配置文件,分解其属性,通过TF-IDF算法计算各自的权值,权值范围为0至1之间;并以多维图形式记录实体-属性、属性-属性、实体-实体、用户-用户、用户-实体、用户-属性相互之间的关联关系。
5.根据权利要求3所述的推荐方法,其特征在于:所述实体关联图库是通过分析所述知识库的每一项实体数据以及用户配置文件,分解其属性,通过TF-IDF算法计算各自的权值,权值范围为0至1之间;并以多维图形式记录实体-属性、属性-属性、实体-实体、用户-用户、用户-实体、用户-属性相互之间的关联关系。
6.根据权利要求1至5任一项所述的推荐方法,其特征在于:所述用户日志系统记录了业务层用户所有的操作,但在应用到推荐运算系统时,提取用户对实体数据的点击操作日志,并且根据不同时间段之间实体数据的关联关系计算用户在某个时间点相对稳定的偏好值以作为个性化推荐的输入。
7.根据权利要求1至5任一项所述的推荐方法,其特征在于:所述推荐运算系统中,用户第一次在业务层获取推荐数据时是用户本身的配置文件,此时采取基于用户的协同过滤方法获取该用户的最邻近用户之最热实体数据为推荐结果;正常情况下还需综合考虑用户以往的历史点击记录,减少实体数据的稀疏性问题对结果的影响。
8.根据权利要求6所述的推荐方法,其特征在于:所述推荐运算系统中,用户第一次在业务层获取推荐数据时是用户本身的配置文件,此时采取基于用户的协同过滤方法获取该用户的最邻近用户之最热实体数据为推荐结果;正常情况下还需综合考虑用户以往的历史点击记录,减少实体数据的稀疏性问题对结果的影响。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410831549.5A CN104462560B (zh) | 2014-12-25 | 2014-12-25 | 一种个性化推荐系统的推荐方法 |
PCT/CN2014/095495 WO2016101302A1 (zh) | 2014-12-25 | 2014-12-30 | 基于用户日志和实体关联图库的个性化推荐系统及其推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410831549.5A CN104462560B (zh) | 2014-12-25 | 2014-12-25 | 一种个性化推荐系统的推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104462560A CN104462560A (zh) | 2015-03-25 |
CN104462560B true CN104462560B (zh) | 2018-01-05 |
Family
ID=52908595
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410831549.5A Active CN104462560B (zh) | 2014-12-25 | 2014-12-25 | 一种个性化推荐系统的推荐方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN104462560B (zh) |
WO (1) | WO2016101302A1 (zh) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104850645B (zh) * | 2015-05-28 | 2018-08-14 | 苏州大学张家港工业技术研究院 | 一种基于矩阵分解的主动学习评分引导方法及系统 |
CN105426392B (zh) * | 2015-10-28 | 2019-03-26 | 浪潮软件集团有限公司 | 一种协同过滤推荐方法及系统 |
CN105488214A (zh) * | 2015-12-15 | 2016-04-13 | 成都陌云科技有限公司 | 基于大数据的页面定制化方法 |
CN106251195A (zh) * | 2016-07-25 | 2016-12-21 | 四川易想电子商务有限公司 | 基于b/s结构的电子商务系统 |
CN106097079A (zh) * | 2016-07-25 | 2016-11-09 | 四川易想电子商务有限公司 | 基于uml的电子商务系统 |
CN106228406A (zh) * | 2016-07-25 | 2016-12-14 | 四川易想电子商务有限公司 | 基于个性化推荐的电子商务推荐系统 |
CN106204241A (zh) * | 2016-07-25 | 2016-12-07 | 四川易想电子商务有限公司 | 一种电子商务交易系统 |
CN106503267A (zh) * | 2016-12-07 | 2017-03-15 | 电子科技大学 | 一种适用于用户偏好动态演变的个性化推荐算法 |
CN107122411B (zh) * | 2017-03-29 | 2020-08-14 | 浙江大学 | 一种基于离散多视图哈希的协同过滤推荐方法 |
CN107066582B (zh) * | 2017-04-14 | 2020-06-26 | 聚好看科技股份有限公司 | 实现虚拟资源推荐的方法及装置 |
WO2019232440A1 (en) * | 2018-06-01 | 2019-12-05 | Systems And Software Enterprises, Llc | Systems and methods for recommendation system based on implicit feedback |
CN108921657B (zh) * | 2018-06-25 | 2021-06-29 | 中国人民大学 | 一种基于知识增强记忆网络的序列推荐方法 |
CN108965844A (zh) * | 2018-07-06 | 2018-12-07 | 维沃移动通信有限公司 | 一种拍照效果调节方法、装置及移动终端 |
CN110083773B (zh) * | 2019-04-30 | 2022-09-23 | 南京邮电大学 | 个性化知识推荐方法及计算机存储介质 |
CN111104603A (zh) * | 2019-11-01 | 2020-05-05 | 复旦大学 | 一种基于Lambda架构的实时混合推荐方法及系统 |
CN111461118B (zh) * | 2020-03-31 | 2023-11-24 | 中国移动通信集团黑龙江有限公司 | 兴趣特征确定方法、装置、设备及存储介质 |
CN111625837B (zh) * | 2020-05-22 | 2023-07-04 | 北京金山云网络技术有限公司 | 识别系统漏洞的方法、装置和服务器 |
CN112069408B (zh) * | 2020-06-15 | 2023-06-09 | 北京理工大学 | 一种融合关系抽取的推荐系统及方法 |
CN113283908B (zh) * | 2021-06-09 | 2023-07-18 | 武汉斗鱼鱼乐网络科技有限公司 | 目标团体的识别方法及装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102208086A (zh) * | 2010-03-31 | 2011-10-05 | 北京邮电大学 | 面向领域的个性化智能推荐系统及实现方法 |
CN103049865A (zh) * | 2012-12-17 | 2013-04-17 | 中国农业大学 | 主动推荐产品信息服务的方法及系统 |
CN103544663A (zh) * | 2013-06-28 | 2014-01-29 | Tcl集团股份有限公司 | 网络公开课的推荐方法、系统和移动终端 |
CN103823908A (zh) * | 2014-03-21 | 2014-05-28 | 北京飞流九天科技有限公司 | 基于用户偏好的内容推荐方法和服务器 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002042959A2 (en) * | 2000-11-22 | 2002-05-30 | Koninklijke Philips Electronics N.V. | Television program recommender with interval-based profiles for determining time-varying conditional probabilities |
US8484226B2 (en) * | 2011-07-09 | 2013-07-09 | Yahoo! Inc. | Media recommendations for a social-software website |
KR20130035064A (ko) * | 2011-09-29 | 2013-04-08 | 삼성전자주식회사 | 개인 성향 기반의 개인화 서비스 제공 방법 및 시스템 |
CN102402766B (zh) * | 2011-12-27 | 2017-07-28 | 北京京东尚科信息技术有限公司 | 一种基于网页浏览的用户兴趣建模方法 |
-
2014
- 2014-12-25 CN CN201410831549.5A patent/CN104462560B/zh active Active
- 2014-12-30 WO PCT/CN2014/095495 patent/WO2016101302A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102208086A (zh) * | 2010-03-31 | 2011-10-05 | 北京邮电大学 | 面向领域的个性化智能推荐系统及实现方法 |
CN103049865A (zh) * | 2012-12-17 | 2013-04-17 | 中国农业大学 | 主动推荐产品信息服务的方法及系统 |
CN103544663A (zh) * | 2013-06-28 | 2014-01-29 | Tcl集团股份有限公司 | 网络公开课的推荐方法、系统和移动终端 |
CN103823908A (zh) * | 2014-03-21 | 2014-05-28 | 北京飞流九天科技有限公司 | 基于用户偏好的内容推荐方法和服务器 |
Non-Patent Citations (1)
Title |
---|
一种基于时间效应和用户兴趣变化的改进推荐算法;孙光辉等;《中国科技论文在线》;20131223;1-7 * |
Also Published As
Publication number | Publication date |
---|---|
CN104462560A (zh) | 2015-03-25 |
WO2016101302A1 (zh) | 2016-06-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104462560B (zh) | 一种个性化推荐系统的推荐方法 | |
TWI636416B (zh) | 內容個人化之多相排序方法和系統 | |
CN104935963B (zh) | 一种基于时序数据挖掘的视频推荐方法 | |
CN102929928B (zh) | 基于多维相似度的个性化新闻推荐方法 | |
US8819716B2 (en) | Apparatus, system, method and computer readable recording medium storing the program for related recommendation of TV program contents and web contents | |
AU2011242753B2 (en) | Product synthesis from multiple sources | |
CN109684538A (zh) | 一种基于用户个人特征的推荐方法及推荐系统 | |
EP2706497A1 (en) | Method for recommending musical entities to a user | |
TW201248435A (en) | Method and apparatus of providing suggested terms | |
CN105426528A (zh) | 一种商品数据的检索排序方法及系统 | |
US20130054638A1 (en) | System for detecting and tracking topic based on opinion and social-influencer for each topic and method thereof | |
CN103970891B (zh) | 一种基于情境的用户兴趣信息查询方法 | |
US20150213136A1 (en) | Method and System for Providing a Personalized Search List | |
US20190034544A1 (en) | Content placement criteria expansion | |
CN105426550A (zh) | 一种基于用户质量模型的协同过滤标签推荐方法及系统 | |
Stanescu et al. | A hybrid recommender system: User profiling from keywords and ratings | |
JP6264946B2 (ja) | データ収集方法、及びデータ収集装置 | |
CN104866490A (zh) | 一种视频智能推荐方法及其系统 | |
CN106951459B (zh) | 基于熵值法的改进协同过滤推荐方法 | |
Sun | Music Individualization Recommendation System Based on Big Data Analysis | |
JP6310529B1 (ja) | 検索装置、検索方法および検索プログラム | |
CN105912727B (zh) | 一种在线社交网络标注系统中的快速推荐方法 | |
CN109410008B (zh) | 一种融合频繁项集的油田业务服务推荐方法 | |
Rahman | Contextual recommender systems using a multidimensional approach | |
US20170236171A1 (en) | Relative pricing indication estimation of content item criteria |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |