CN107818156A - 一种实时个性化新闻推荐方法及系统 - Google Patents

一种实时个性化新闻推荐方法及系统 Download PDF

Info

Publication number
CN107818156A
CN107818156A CN201711042415.5A CN201711042415A CN107818156A CN 107818156 A CN107818156 A CN 107818156A CN 201711042415 A CN201711042415 A CN 201711042415A CN 107818156 A CN107818156 A CN 107818156A
Authority
CN
China
Prior art keywords
news
user
real time
content
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201711042415.5A
Other languages
English (en)
Inventor
曾映方
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Civic Mdt Infotech Ltd
Original Assignee
Guangdong Civic Mdt Infotech Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Civic Mdt Infotech Ltd filed Critical Guangdong Civic Mdt Infotech Ltd
Priority to CN201711042415.5A priority Critical patent/CN107818156A/zh
Publication of CN107818156A publication Critical patent/CN107818156A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种实时个性化新闻推荐方法和系统,所述方法包括步骤:实时获取最新的新闻内容;对于实时新闻内容进行增量计算及分类;客户端采集用户的行为日志,并上报至后台服务端进行分析,后台服务端同时根据用户画像及用户的最近行为计算用户的实时内容偏好;后台服务端分析后,根据用户的实时内容偏好找出匹配且分类好的实时新闻内容,并推送生成的内容给客户端;客户端展示推荐的新闻内容。本发明提供的技术方案采集与分析新闻数据,依据客户端采集用户的行为日志分析用户的喜好,依据用户的喜好对该新闻进行控制,使得用户都能收到感兴趣的新闻推荐内容,提高用户对于软件的满意度。

Description

一种实时个性化新闻推荐方法及系统
技术领域
本发明涉及计算机应用技术领域,具体为一种实时个性化新闻推荐方法及系统。
背景技术
随着互联网的发展,人们逐渐从信息匮乏的时代走入了信息过载的时代。新闻是信息的重要载体之一,当前网络上的新闻信息呈现爆炸式增长趋势,面对海量的新闻内容,用户需要花费大量的时间才能找到自己感兴趣的新闻内容。在这种背景下,个性化新闻推荐技术应运而生。个性化新闻推荐是根据用户的兴趣特点和行为,向用户推荐其感兴趣的新闻内容。个性化新闻推荐技术是个性化推荐在新闻处理领域的一个延伸应用,它通过推荐系统将新闻自动推荐个对其感兴趣的用户,实现新闻网站和网站用户的双赢。
传统的新闻推荐的模式中,一般是通过获取用户的基本资料,再根据用户的爱好、习惯和其他特定的特征来确定用户的新闻适用人群,从而较为精准地推荐新闻给用户。例如,最近发展起来的个性化服务新闻网站( 如百度新闻、网易新闻等)允许用户根据自己感兴趣的新闻主题、关键词、地区等信息订制个性化新闻,但这种需要用户经常手动参与采集用户兴趣信息的方式,增加了用户的负担。近些年来,个性化新闻推荐系统越来越受到人们的关注。
现有的个性化新闻推荐方法主要有三种:
第一种基于用户的协同过滤推荐,可以在数据集完善且内容丰富的情况下准确率较高。但是该方法需要维护庞大的用户相似度矩阵,计算时间会逐渐变长,系统效率逐步降低。同时存在冷启动的问题。
第二种基于物品的协同过滤,该方法给用户推荐之前看过的相似内容,也存在冷启动的问题。同时,由于新闻更新非常快,计算新闻相似度的计算开销会更大。
第三种基于内容的新闻推荐,结合用户的行为数据对用户进行建模,并通过新闻匹配计算新闻与目标间的相似度,将相似度最高的新闻推荐给目标用户。它会产生推荐内容新颖性上的缺陷。
发明内容
本发明的目的在于提供一种实时个性化新闻推荐方法,使得用户都能收到感兴趣的新闻推荐内容,提高用户对于软件的满意度。
为实现上述目的,本发明提供如下技术方案:
一种实时个性化新闻推荐方法,所述方法包括步骤:
S1、实时获取最新的新闻内容;
S2、对于实时新闻内容进行增量计算及分类;
S3、客户端采集用户的行为日志,并上报至后台服务端进行分析,后台服务端同时根据用户画像及用户的最近行为计算用户的实时内容偏好;
S4、后台服务端分析后,根据用户的实时内容偏好找出匹配且分类好的实时新闻内容,并推送生成的内容给客户端;
S5、客户端展示推荐的新闻内容。
具体的,上述实时个性化新闻推荐方法中,步骤S2具体为:
对于实时新闻进行增量计算分类,打上标签,同时根据点击量提取热门新闻。
具体的,上述实时个性化新闻推荐方法中,步骤S2具体为:
所述用户的行为日志具体包括:
阅读日志、评论日志、不感兴趣日志及操作日志。
具体的,上述实时个性化新闻推荐方法中,步骤S3中所述根据用户的实时内容偏好找出匹配且分类好的实时新闻内容具体为:
根据用户的实时内容偏好找出最近的带有相应标签的新闻。
基于同一构思,本发明还提供一种实时个性化新闻推荐方法,包括新闻客户端、后台服务端及用于采集用户的行为日志的用户行为日志采集模块,所述后台服务端包括:
新闻抓取模块,用于实时获取最新的新闻内容数据;
新闻分类模块,与新闻抓取模块连接,用于对新闻抓取模块抓取的实时新闻数据进行增量计算分类,打上标签,并根据点击量提取热门新闻数据;
收集模块,对新闻分类模块的新闻数据、以及用户行为日志采集模块的采集数据进行数据整理预处理后转发给分析模块;
分析模块,分别与新闻分类模块和收集模块连接,根据用户画像及用户的最近行为计算用户的实时内容偏好;
推送模块,与分析模块连接,接收来自分析模块的分析后的数据,并推送生成的内容给新闻客户端,
所述新闻客户端包括:
新闻接收模块,与推送模块连接,用于接收推送模块推送生成的内容;
新闻展示模块,与新闻接收模块连接,用于展示推荐的新闻内容。
与现有技术相比,本发明的有益效果如下:
本发明提供的技术方案采集与分析新闻数据,依据客户端采集用户的行为日志分析用户的喜好,依据用户的喜好对该新闻进行控制,使得用户都能收到感兴趣的新闻推荐内容,提高用户对于软件的满意度。
附图说明
图1为本发明提供的一种推荐视频广告的具体方法的流程图;
图2为本发明提供的一种推荐视频广告的具体系统的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供一种技术方案:一种实时个性化新闻推荐方法,所述方法包括步骤:
新闻内容抓取,实时获取最新的新闻内容;
新闻分类模块,对于实时新闻进行增量计算分类,打上标签,根据点击量提取热门新闻;
客户端采集用户的行为日志,包括阅读,评论,不感兴趣等操作;
客户端上报给后台收集模块;
后台收集模块进行数据整理预处理后转发给分析模块;
分析模块根据用户画像及用户的最近行为计算用户的实时内容偏好;
根据实时的用户内容偏好找出最近的带有相应标签的新闻;
推送模块推送生成的内容给客户端;
客户端端展示推荐的新闻内容。
基于同一构思,本发明还提供一种实时个性化新闻推荐方法,包括新闻客户端、后台服务端及用于采集用户的行为日志的用户行为日志采集模块,所述后台服务端包括:
新闻抓取模块,用于实时获取最新的新闻内容数据;
新闻分类模块,与新闻抓取模块连接,用于对新闻抓取模块抓取的实时新闻数据进行增量计算分类,打上标签,并根据点击量提取热门新闻数据;
收集模块,对新闻分类模块的新闻数据、以及用户行为日志采集模块的采集数据进行数据整理预处理后转发给分析模块;
分析模块,分别与新闻分类模块和收集模块连接,根据用户画像及用户的最近行为计算用户的实时内容偏好;
推送模块,与分析模块连接,接收来自分析模块的分析后的数据,并推送生成的内容给新闻客户端,
所述新闻客户端包括:
新闻接收模块,与推送模块连接,用于接收推送模块推送生成的内容;
新闻展示模块,与新闻接收模块连接,用于展示推荐的新闻内容。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
本发明实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减。
本发明实施例装置中的单元可以根据实际需要进行合并、划分和删减。本领域的技术人员可以将本说明书中描述的不同实施例以及不同实施例的特征进行结合或组合。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可以用硬件实现,或固件实现,或它们的组合方式来实现。当使用软件实现时,可以将上述功能存储在计算机可读介质中或作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是计算机能够存取的任何可用介质。以此为例但不限于:计算机可读介质可以包括随机存取存储器( Random Access Memory,RAM )、只读存储器( Read-Only Memory,ROM )、电可擦可编程只读存储器( ElectricallyErasable Programmable Read-Only Memory,EEPROM )、只读光盘( Compact DiscReadOnly Memory,CD-ROM )或其他光盘存储、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质。此外。任何连接可以适当的成为计算机可读介质。例如,如果软件是使用同轴电缆、光 纤光缆、双绞线、数字用户线( Digital Subscriber Line,DSL )或者诸如红外线、无线电和微波之类的无线技术从网站、服务器或者其他远程源传输的,那么同轴电缆、光纤光缆、双 绞线、DSL或者诸如红外线、无线和微波之类的无线技术包括在所属介质的定影中。如本发明所使用的,盘( Disk )和碟(disc )包括压缩光碟( CD )、激光碟、光碟、数字通用光碟( DVD )、 软盘和蓝光光碟,其中盘通常磁性的复制数据,而碟则用激光来光学的复制数据。上面的组 合也应当包括在计算机可读介质的保护范围之内。

Claims (5)

1.一种实时个性化新闻推荐方法,所述方法包括步骤:
S1、实时获取最新的新闻内容;
S2、对于实时新闻内容进行增量计算及分类;
S3、客户端采集用户的行为日志,并上报至后台服务端进行分析,后台服务端同时根据用户画像及用户的最近行为计算用户的实时内容偏好;
S4、后台服务端分析后,根据用户的实时内容偏好找出匹配且分类好的实时新闻内容,并推送生成的内容给客户端;
S5、客户端展示推荐的新闻内容。
2.根据权利要求1所述的一种实时个性化新闻推荐方法,其特征在于:上述实时个性化新闻推荐方法中,步骤S2具体为:
对于实时新闻进行增量计算分类,打上标签,同时根据点击量提取热门新闻。
3.根据权利要求1所述的一种实时个性化新闻推荐方法,其特征在于:上述实时个性化新闻推荐方法中,步骤S3中所述用户的行为日志具体包括:
阅读日志、评论日志、不感兴趣日志及操作日志。
4.根据权利要求1所述的一种实时个性化新闻推荐方法,其特征在于:上述实时个性化新闻推荐方法中,步骤S3中所述根据用户的实时内容偏好找出匹配且分类好的实时新闻内容具体为:
根据用户的实时内容偏好找出最近的带有相应标签的新闻。
5.一种实时个性化新闻推荐方法,其特征在于:包括新闻客户端、后台服务端及用于采集用户的行为日志的用户行为日志采集模块,所述后台服务端包括:
新闻抓取模块,用于实时获取最新的新闻内容数据;
新闻分类模块,与新闻抓取模块连接,用于对新闻抓取模块抓取的实时新闻数据进行增量计算分类,打上标签,并根据点击量提取热门新闻数据;
收集模块,对新闻分类模块的新闻数据、以及用户行为日志采集模块的采集数据进行数据整理预处理后转发给分析模块;
分析模块,分别与新闻分类模块和收集模块连接,根据用户画像及用户的最近行为计算用户的实时内容偏好;
推送模块,与分析模块连接,接收来自分析模块的分析后的数据,并推送生成的内容给新闻客户端,
所述新闻客户端包括:
新闻接收模块,与推送模块连接,用于接收推送模块推送生成的内容;
新闻展示模块,与新闻接收模块连接,用于展示推荐的新闻内容。
CN201711042415.5A 2017-10-31 2017-10-31 一种实时个性化新闻推荐方法及系统 Withdrawn CN107818156A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711042415.5A CN107818156A (zh) 2017-10-31 2017-10-31 一种实时个性化新闻推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711042415.5A CN107818156A (zh) 2017-10-31 2017-10-31 一种实时个性化新闻推荐方法及系统

Publications (1)

Publication Number Publication Date
CN107818156A true CN107818156A (zh) 2018-03-20

Family

ID=61603449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711042415.5A Withdrawn CN107818156A (zh) 2017-10-31 2017-10-31 一种实时个性化新闻推荐方法及系统

Country Status (1)

Country Link
CN (1) CN107818156A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595580A (zh) * 2018-04-17 2018-09-28 阿里巴巴集团控股有限公司 新闻推荐方法、装置、服务器及存储介质
CN109660591A (zh) * 2018-11-02 2019-04-19 北京奇虎科技有限公司 个性化新闻的自动推送方法、装置和计算设备
CN109710875A (zh) * 2018-12-11 2019-05-03 广州市西美信息科技有限公司 一种基于用户操作日志数据的行为分析方法
CN110188265A (zh) * 2019-04-26 2019-08-30 中国科学院计算技术研究所 一种融合用户画像的网络舆情热点推荐方法及系统
CN111143688A (zh) * 2019-12-31 2020-05-12 南京新一代人工智能研究院有限公司 一种基于移动新闻客户端的评估方法及其系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611785A (zh) * 2011-01-20 2012-07-25 北京邮电大学 面向手机的移动用户个性化新闻主动推荐服务系统及方法
CN106383887A (zh) * 2016-09-22 2017-02-08 深圳市博安达信息技术股份有限公司 一种环保新闻数据采集和推荐展示的方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102611785A (zh) * 2011-01-20 2012-07-25 北京邮电大学 面向手机的移动用户个性化新闻主动推荐服务系统及方法
CN106383887A (zh) * 2016-09-22 2017-02-08 深圳市博安达信息技术股份有限公司 一种环保新闻数据采集和推荐展示的方法及系统

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595580A (zh) * 2018-04-17 2018-09-28 阿里巴巴集团控股有限公司 新闻推荐方法、装置、服务器及存储介质
CN109660591A (zh) * 2018-11-02 2019-04-19 北京奇虎科技有限公司 个性化新闻的自动推送方法、装置和计算设备
CN109710875A (zh) * 2018-12-11 2019-05-03 广州市西美信息科技有限公司 一种基于用户操作日志数据的行为分析方法
CN110188265A (zh) * 2019-04-26 2019-08-30 中国科学院计算技术研究所 一种融合用户画像的网络舆情热点推荐方法及系统
CN111143688A (zh) * 2019-12-31 2020-05-12 南京新一代人工智能研究院有限公司 一种基于移动新闻客户端的评估方法及其系统
WO2021134944A1 (zh) * 2019-12-31 2021-07-08 南京新一代人工智能研究院有限公司 一种基于移动新闻客户端的评估方法及其系统

Similar Documents

Publication Publication Date Title
CN107818156A (zh) 一种实时个性化新闻推荐方法及系统
US10572565B2 (en) User behavior models based on source domain
CN110489633B (zh) 一种基于图书馆数据的智慧大脑服务系统
JP5078674B2 (ja) 分析システム、情報処理装置、アクティビティ分析方法、およびプログラム
WO2016161976A1 (zh) 选择数据内容向终端推送的方法和装置
US20220150292A1 (en) Personalized Recommendation Method and System, and Terminal Device
CN104618806A (zh) 获取视频的评论信息的方法、装置及系统
CN104091596B (zh) 一种乐曲识别方法、系统和装置
CN106030569A (zh) 重构搜索查询的技术
CN102929966B (zh) 一种用于提供个性化搜索列表的方法及系统
WO2004029777A2 (en) Method, system and computer product for performing e-channel analytics
CN105095211A (zh) 多媒体数据的获取方法和装置
US20110246277A1 (en) Multi-factor promotional offer suggestion
CN107977678B (zh) 用于输出信息的方法和装置
CN106484774A (zh) 一种多源视频元数据的关联方法及系统
CN106294601B (zh) 数据处理方法和装置
CN111159341A (zh) 基于用户投资理财偏好的资讯推荐方法及装置
CN106603690A (zh) 数据分析装置、数据分析处理系统和数据分析方法
CN108319641A (zh) 菜品信息录入方法及装置
CN111159561A (zh) 根据用户行为和用户画像构建推荐引擎的方法
CN103700004A (zh) 一种微博广告服务信息推送方法及装置
CN109471974A (zh) 过滤第三方网页广告的方法、装置、电子设备及存储介质
CN103745383A (zh) 基于运营商数据实现重定向服务的方法和系统
CN100555283C (zh) 一种直接针对用户的相关信息的发布方法和系统
CN106383857A (zh) 一种信息处理方法及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20180320

WW01 Invention patent application withdrawn after publication