CN108876457B - 一种用于解决数据稀疏的新闻推荐方法 - Google Patents
一种用于解决数据稀疏的新闻推荐方法 Download PDFInfo
- Publication number
- CN108876457B CN108876457B CN201810624042.0A CN201810624042A CN108876457B CN 108876457 B CN108876457 B CN 108876457B CN 201810624042 A CN201810624042 A CN 201810624042A CN 108876457 B CN108876457 B CN 108876457B
- Authority
- CN
- China
- Prior art keywords
- user
- news
- target
- users
- broadcasting
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Data Mining & Analysis (AREA)
- Economics (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明请求保护一种用于解决数据稀疏的新闻推荐方法,其包括以下步骤:接收播报新闻的语音请求,对所述语音请求的用户历史行为数据进行筛选,得到新闻收听用户—新闻播报评分矩阵,基于筛选结果从预设用户属性项集合中确定出与所述语音请求关联的目标属性项;并为每个新闻收听用户和每个新闻播报端构建历史评分记录集合,同时构建用户集合,按照用户的评分新闻播报端数从大到小对用户集合中的用户排序;构造最终的相似用户集,利用目标用户的相似用户集对新闻收听用户—新闻播报评分矩阵进行填充;对评分矩阵中剩下的未填充数据,利用相似新闻播报端来对再次填充,进行新闻播报端初步推荐;筛选出目标新闻进行推荐。本发明可以提高新闻推荐准确性。
Description
技术领域
本发明属于推荐技术领域,具体属于一种用于解决数据稀疏的新闻推荐方法。
背景技术
随着计算机技术的发展和网络数据的不断积累,人工智能技术飞速发展。用于为用户提供新闻服务的新闻推荐方法,是利用电子设备主动向用户推荐新闻的方法,是一种可以简化用户获取新闻的操作、提升用户获取新闻的效率的信息处理方式。不同的用户对新闻资讯的诉求、偏好具有差异。在传统的新闻推荐方法中筛选为用户推荐的新闻时,通常会考虑新闻的时效性和新闻内容的质量,对不同的用户输出相同的推荐结果,因此导致不同的人群对推荐结果不满意,最常见的是协同过滤算法。在新闻推荐领域,由于网站上的新闻数量巨大,但只有很少的用户愿意给去过的新闻播放端评分,所以造成了新闻收听用户—新闻播报评分矩阵的极大稀疏,导致基于协同过滤算法得到的商家推荐列表不够准确。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种提高矩阵稀疏度的用于解决数据稀疏的新闻推荐方法。
本发明的技术方案如下:
一种用于解决数据稀疏的新闻推荐方法,其包括以下步骤:
接收播报新闻的语音请求,对所述语音请求的用户历史行为数据进行筛选,获取与新闻播报端及新闻收听用户相关的信息,得到新闻收听用户—新闻播报评分矩阵,基于筛选结果从预设用户属性项集合中确定出与所述语音请求关联的目标属性项;并利用建立的新闻收听用户—新闻播报评分矩阵,为每个新闻收听用户和每个新闻播报端构建历史评分记录集合,同时构建用户集合,按照用户的评分新闻播报端数从大到小对用户集合中的用户排序;按用户在用户集合中的顺序,选取一个评分最高的用户作为目标用户;根据新闻收听用户—新闻播报评分矩阵,计算其余用户与目标用户的相似度;选取与目标用户相似度大于第一设定值的用户构建目标用户的优先用户集;计算目标用户与各优先用户的历史共同评分差均值,若两个用户历史本身没有共同新闻播报端,则不做计算;选取共同评分差均值小于第二设定值的用户构造最终的相似用户集,利用目标用户的相似用户集对新闻收听用户—新闻播报评分矩阵进行填充;对评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似新闻播报端,并利用相似新闻播报端来对新闻收听用户—新闻播报评分矩阵进行再次填充,进行新闻播报端初步推荐;并获取所述目标用户属性项对应的用户属性信息;基于用户属性信息在待推荐新闻播报端中筛选出目标新闻进行推荐,若和初步推荐结果一样则按此推荐,若不一样则选取用户的评分新闻播报端数第二高评分数作为目标用户,重复以上步骤进行填充,得到推荐新闻播报端,播报该新闻播报端。
进一步的,所述构建目标用户的优先用户集过程如下:
其中,simu,v表示用户u和用户v的相似度,Iu,v为用户u和用户v的共同评分商家集合,Rui、Rvi分别为用户u、用户v对商家i的评分,Ru、Rv分别为用户u、用户v的平均评分;选取与目标用户相似度大于α的用户构建目标用户的优选邻居用户集p_N(u)。
进一步的,所述最相似新闻播报端的选取过程如下:
计算目标用户与各优先用户的历史共同评分差均值,计算公式如下:
其中,avg(u,v)为用户u和用户v的历史共同评分差均值,Iu′,v为目标用户u和用户v的历史共同评分新闻播报端集合,Rui、Rvi分别为用户u、用户v对新闻播报端i的评分;选取共同评分差均值小于β的优先用户构造最终的最相似新闻播报端N(u)。
进一步的,所述获取所述目标用户属性项对应的用户属性信息;基于用户属性信息在待推荐新闻播报端中筛选出目标新闻进行推荐,包括:判断所述筛选结果中是否包含与所述预设用户属性项集合中的用户属性项的标识关联的关键词;若是,提取出标识与所述解析结果中的关键词匹配的用户属性项,作为所述目标属性项;获取所述待推荐新闻库中的各待推荐新闻的摘要信息,所述摘要信息包括标题和内容摘要;基于各所述待推荐新闻的摘要信息与解析结果和所述目标属性项对应的用户属性信息之间的相似度筛选出所述目标新闻;推送所述目标新闻。
本发明的有益效果
本发明一方面通过接收播报新闻的语音请求,然后对语音请求进行解析,基于解析结果从预设用户属性项集合中确定出与语音请求关联的目标属性项,而后获取目标属性项对应的用户属性信息,最后基于语音请求的解析结果和目标属性项对应的用户属性信息在待推荐新闻库中筛选出目标新闻进行推荐,实现了基于语音交互的新闻推荐,并且在推荐时基于语音请求的解析结果确定了关联的用户属性信息,从而提升了新闻推荐的针对性。另一方面,加入了历史共同评分差均值来筛选邻居,去掉了与目标项评分差异较大的邻居,使相似邻居集的选取更加准确,有效避免了把一个用户讨厌的新闻播报端当成另一个用户喜欢的新闻播报端来进行推荐,使推荐更加准确。本发明先从用户的角度做第一步填充,再从新闻播报端的角度做第二步填充,使稀疏的用户—新闻播报端评分矩阵的填充更加完整。同时每一步填充都采用动态填充方式,按评分个数的大小来依次选取目标用户或目标新闻播报端进行填充,每一次做填充的矩阵都是对上一个目标填充完成后的矩阵。动态填充使用户或新闻播报端的共同评分数增多,相似度计算更加准确,因此对稀疏的用户—新闻播报端评分矩阵的填充也更加准确,最后给出的推荐列表更加符合用户的心意,提高了用户对推荐系统的粘性,并且当两者评判结果不一样时,则再次选取评分值第二高的用户作为目标用户,重复以上步骤进行填充,得到推荐新闻播报端,这样就避免了评分最高客户的局限性,播报该第二高的新闻播报端,使得推荐更加人性化。
附图说明
图1是本发明提供优选实施例用于解决数据稀疏的新闻推荐方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、详细地描述。所描述的实施例仅仅是本发明的一部分实施例。
本发明解决上述技术问题的技术方案是:
如图1所示为一种用于解决数据稀疏的新闻推荐方法,其包括以下步骤:
接收播报新闻的语音请求,对所述语音请求的用户历史行为数据进行筛选,获取与新闻播报端及新闻收听用户相关的信息,得到新闻收听用户—新闻播报评分矩阵,基于筛选结果从预设用户属性项集合中确定出与所述语音请求关联的目标属性项;并利用建立的新闻收听用户—新闻播报评分矩阵,为每个新闻收听用户和每个新闻播报端构建历史评分记录集合,同时构建用户集合,按照用户的评分新闻播报端数从大到小对用户集合中的用户排序;按用户在用户集合中的顺序,选取一个评分最高的用户作为目标用户;根据新闻收听用户—新闻播报评分矩阵,计算其余用户与目标用户的相似度;选取与目标用户相似度大于第一设定值的用户构建目标用户的优先用户集;计算目标用户与各优先用户的历史共同评分差均值,若两个用户历史本身没有共同新闻播报端,则不做计算;选取共同评分差均值小于第二设定值的用户构造最终的相似用户集,利用目标用户的相似用户集对新闻收听用户—新闻播报评分矩阵进行填充;对评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似新闻播报端,并利用相似新闻播报端来对新闻收听用户—新闻播报评分矩阵进行再次填充,进行新闻播报端初步推荐;并获取所述目标用户属性项对应的用户属性信息;基于用户属性信息在待推荐新闻播报端中筛选出目标新闻进行推荐,若和初步推荐结果一样则按此推荐,若不一样则选取用户的评分新闻播报端数第二高评分数作为目标用户,重复以上步骤进行填充,得到推荐新闻播报端,播报该新闻播报端。
优选的,所述构建目标用户的优先用户集过程如下:
其中,simu,v表示用户u和用户v的相似度,Iu,v为用户u和用户v的共同评分商家集合,Rui、Rvi分别为用户u、用户v对商家i的评分,分别为用户u、用户v的平均评分;选取与目标用户相似度大于α的用户构建目标用户的优选邻居用户集p_N(u)。
优选的,所述最相似新闻播报端的选取过程如下:
计算目标用户与各优先用户的历史共同评分差均值,计算公式如下:
其中,avg(u,v)为用户u和用户v的历史共同评分差均值,Iu′,v为目标用户u和用户v的历史共同评分新闻播报端集合,Rui、Rvi分别为用户u、用户v对新闻播报端i的评分;选取共同评分差均值小于β的优先用户构造最终的最相似新闻播报端N(u)。
优选的,所述获取所述目标用户属性项对应的用户属性信息;基于用户属性信息在待推荐新闻播报端中筛选出目标新闻进行推荐,包括:判断所述筛选结果中是否包含与所述预设用户属性项集合中的用户属性项的标识关联的关键词;若是,提取出标识与所述解析结果中的关键词匹配的用户属性项,作为所述目标属性项;获取所述待推荐新闻库中的各待推荐新闻的摘要信息,所述摘要信息包括标题和内容摘要;基于各所述待推荐新闻的摘要信息与解析结果和所述目标属性项对应的用户属性信息之间的相似度筛选出所述目标新闻;推送所述目标新闻。
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
Claims (2)
1.一种用于解决数据稀疏的新闻推荐方法,其特征在于,包括以下步骤:
接收播报新闻的语音请求,对所述语音请求的用户历史行为数据进行筛选,获取与新闻播报端及新闻收听用户相关的信息,得到新闻收听用户-新闻播报评分矩阵,基于筛选结果从预设用户属性项集合中确定出与所述语音请求关联的目标属性项;并利用建立的新闻收听用户-新闻播报评分矩阵,为每个新闻收听用户和每个新闻播报端构建历史评分记录集合,同时构建用户集合,按照用户的评分新闻播报端数从大到小对用户集合中的用户排序;按用户在用户集合中的顺序,选取一个评分最高的用户作为目标用户;根据新闻收听用户-新闻播报评分矩阵,计算其余用户与目标用户的相似度;选取与目标用户相似度大于第一设定值的用户构建目标用户的优先用户集;计算目标用户与各优先用户的历史共同评分差均值,若两个用户历史本身没有共同新闻播报端,则不做计算;选取共同评分差均值小于第二设定值的用户构造最终的相似用户集,利用目标用户的相似用户集对新闻收听用户-新闻播报评分矩阵进行填充;对评分矩阵中剩下的未填充数据,同样采用相似度阈值法和共同评分差均值来选取最相似新闻播报端,并利用相似新闻播报端来对新闻收听用户-新闻播报评分矩阵进行再次填充,进行新闻播报端初步推荐;并获取所述目标用户属性项对应的用户属性信息;基于用户属性信息在待推荐新闻播报端中筛选出目标新闻进行推荐,若和初步推荐结果一样则按此推荐,若不一样则选取用户的评分新闻播报端数第二高评分数作为目标用户,重复以上步骤进行填充,得到推荐新闻播报端,播报该新闻播报端;
所述最相似新闻播报端的选取过程如下:
计算目标用户与各优先用户的历史共同评分差均值,计算公式如下:
其中,avg(u,v)为用户u和用户v的历史共同评分差均值,I′u,v为目标用户u和用户v的历史共同评分新闻播报端集合,Rui、Rvi分别为用户u、用户v对新闻播报端i的评分;选取共同评分差均值小于β的优先用户构造最终的最相似新闻播报端N(u);
所述获取所述目标用户属性项对应的用户属性信息;基于用户属性信息在待推荐新闻播报端中筛选出目标新闻进行推荐,包括:判断所述筛选结果中是否包含与所述预设用户属性项集合中的用户属性项的标识关联的关键词;若是,提取出标识与解析结果中的关键词匹配的用户属性项,作为所述目标属性项;获取所述待推荐新闻库中的各待推荐新闻的摘要信息,所述摘要信息包括标题和内容摘要;基于各所述待推荐新闻的摘要信息与解析结果和所述目标属性项对应的用户属性信息之间的相似度筛选出所述目标新闻;推送所述目标新闻。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810624042.0A CN108876457B (zh) | 2018-06-15 | 2018-06-15 | 一种用于解决数据稀疏的新闻推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810624042.0A CN108876457B (zh) | 2018-06-15 | 2018-06-15 | 一种用于解决数据稀疏的新闻推荐方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108876457A CN108876457A (zh) | 2018-11-23 |
CN108876457B true CN108876457B (zh) | 2021-05-18 |
Family
ID=64339242
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810624042.0A Active CN108876457B (zh) | 2018-06-15 | 2018-06-15 | 一种用于解决数据稀疏的新闻推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN108876457B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929928A (zh) * | 2012-09-21 | 2013-02-13 | 北京格致璞科技有限公司 | 基于多维相似度的个性化新闻推荐方法 |
CN105354330A (zh) * | 2015-11-27 | 2016-02-24 | 南京邮电大学 | 一种基于稀疏数据预处理的协同过滤推荐方法 |
CN106021329A (zh) * | 2016-05-06 | 2016-10-12 | 西安电子科技大学 | 基于用户相似度的稀疏数据协同过滤推荐方法 |
CN106227866A (zh) * | 2016-07-29 | 2016-12-14 | 武汉理工大学 | 一种基于数据挖掘的混合过滤电影推荐方法 |
CN107844586A (zh) * | 2017-11-16 | 2018-03-27 | 百度在线网络技术(北京)有限公司 | 新闻推荐方法和装置 |
-
2018
- 2018-06-15 CN CN201810624042.0A patent/CN108876457B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102929928A (zh) * | 2012-09-21 | 2013-02-13 | 北京格致璞科技有限公司 | 基于多维相似度的个性化新闻推荐方法 |
CN105354330A (zh) * | 2015-11-27 | 2016-02-24 | 南京邮电大学 | 一种基于稀疏数据预处理的协同过滤推荐方法 |
CN106021329A (zh) * | 2016-05-06 | 2016-10-12 | 西安电子科技大学 | 基于用户相似度的稀疏数据协同过滤推荐方法 |
CN106227866A (zh) * | 2016-07-29 | 2016-12-14 | 武汉理工大学 | 一种基于数据挖掘的混合过滤电影推荐方法 |
CN107844586A (zh) * | 2017-11-16 | 2018-03-27 | 百度在线网络技术(北京)有限公司 | 新闻推荐方法和装置 |
Non-Patent Citations (2)
Title |
---|
分布填充缓解数据稀疏性的协同过滤算法;张玉芳等;《计算机应用研究》;20130930;第30卷(第9期);第2602-2605页 * |
协同过滤算法中的用户相似度量方法研究;任看看等;《计算机工程》;20150831;第41卷(第8期);第18-22,31页 * |
Also Published As
Publication number | Publication date |
---|---|
CN108876457A (zh) | 2018-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11593894B2 (en) | Interest recommendation method, computer device, and storage medium | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN109086439B (zh) | 信息推荐方法及装置 | |
EP3690768A1 (en) | User behavior prediction method and apparatus, and behavior prediction model training method and apparatus | |
CN108876537B (zh) | 一种用于网上商场系统的混合推荐方法 | |
CN111797321B (zh) | 一种面向不同场景的个性化知识推荐方法及系统 | |
CN110473040B (zh) | 一种产品推荐方法及装置,电子设备 | |
CN109325182B (zh) | 基于会话的信息推送方法、装置、计算机设备及存储介质 | |
CN110321422A (zh) | 在线训练模型的方法、推送方法、装置以及设备 | |
CN105138653B (zh) | 一种基于典型度和难度的题目推荐方法及其推荐装置 | |
US20190294259A1 (en) | Sticker recommendation method and apparatus | |
CN112559764B (zh) | 一种基于领域知识图谱的内容推荐方法 | |
CN112100504B (zh) | 内容推荐方法、装置、电子设备及存储介质 | |
CN106339507A (zh) | 流媒体消息推送方法和装置 | |
CN111159563A (zh) | 用户兴趣点信息的确定方法、装置、设备及存储介质 | |
CN113343091A (zh) | 面向产业和企业的科技服务推荐计算方法、介质及程序 | |
CN111639230B (zh) | 一种相似视频的筛选方法、装置、设备和存储介质 | |
CN106791964A (zh) | 广播电视节目推荐系统及方法 | |
WO2020073526A1 (zh) | 基于信任网络的推送方法、装置、计算机设备及存储介质 | |
CN117216362A (zh) | 内容推荐方法、装置、设备、介质和程序产品 | |
CN110297967B (zh) | 兴趣点确定方法、装置、设备及计算机可读存储介质 | |
CN115374362A (zh) | 多路召回模型训练方法、多路召回方法、装置及电子设备 | |
CN113254795A (zh) | 一种推荐模型的训练方法和装置 | |
CN114428910A (zh) | 资源推荐方法、装置、电子设备、产品及介质 | |
CN108810640B (zh) | 一种电视节目的推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20210427 Address after: 341000 Ganzhou economic and Technological Development Zone, Ganzhou City, Jiangxi Province Applicant after: Ganzhou Bailang Technology Co.,Ltd. Address before: No. 12, No. 12, Lake Yun street, Chongqing, Chongqing Applicant before: CHONGQING ZHIAO TECHNOLOGY Co.,Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |