CN112328861B - 一种基于大数据处理的新闻传播方法 - Google Patents

一种基于大数据处理的新闻传播方法 Download PDF

Info

Publication number
CN112328861B
CN112328861B CN202011331810.7A CN202011331810A CN112328861B CN 112328861 B CN112328861 B CN 112328861B CN 202011331810 A CN202011331810 A CN 202011331810A CN 112328861 B CN112328861 B CN 112328861B
Authority
CN
China
Prior art keywords
news
data
user
preference
recommended
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011331810.7A
Other languages
English (en)
Other versions
CN112328861A (zh
Inventor
王微
梅晓春
孙立文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei Wisdom Dragon Machinery Design Co ltd
Original Assignee
Zhengzhou University of Aeronautics
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhengzhou University of Aeronautics filed Critical Zhengzhou University of Aeronautics
Priority to CN202011331810.7A priority Critical patent/CN112328861B/zh
Publication of CN112328861A publication Critical patent/CN112328861A/zh
Application granted granted Critical
Publication of CN112328861B publication Critical patent/CN112328861B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/958Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据处理的新闻传播方法,包括如下步骤:S1、以脚本录制的方式记录用户的新闻浏览记录,并基于用户的新闻游览记录获取用户的新闻偏好关键词组;S2、基于网络爬虫模块根据所述新闻偏好关键词组在各新闻发布基站上挖取对应的新闻数据;S3、基于预设的模板实现所爬取新闻数据的推荐,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程;S4、基于对所述操作过程的评估实现用户的新闻偏好关键词组的修订,并基于修订完成后的新闻偏好关键词组在各新闻网络基站挖取对应的新闻数据实现推荐。本发明可以实现新闻数据的定向高效推送,使得用户可以在极短的时间成本内获取到自己感兴趣的新闻数据。

Description

一种基于大数据处理的新闻传播方法
技术领域
本发明涉及新闻传播方法领域,具体涉及一种基于大数据处理的新闻传播方法。
背景技术
在信息爆炸的时代,为了帮助用户降低获取到自己感兴趣的新闻的时间成本,如何从海量新闻中挖掘出用户所偏好的新闻并实现定向推送,是当今研究的一个热点。
目前,传统的新闻传播方式是将新闻按种类进行分类,根据用户喜欢的种类进行新闻推送,由于新闻种类有限,同种类新闻数量大,如果按新闻种类进行新闻推送,被推送新闻正好是用户喜欢的新闻概率较低;往往需要推送10篇以上新闻,甚至推送上百篇新闻后,才会出现一篇用户想要的新闻,新闻推送效率低下。
发明内容
为解决上述问题,本发明提供了一种基于大数据处理的新闻传播方法,可以实现新闻数据的定向高效推送,使得用户可以在极短的时间成本内获取到自己感兴趣的新闻数据。
为实现上述目的,本发明采取的技术方案为:
一种基于大数据处理的新闻传播方法,包括如下步骤:
S1、以脚本录制的方式记录用户的新闻浏览记录,并基于用户的新闻游览记录获取用户的新闻偏好关键词组;
S2、基于网络爬虫模块根据所述新闻偏好关键词组在各新闻发布基站上挖取对应的新闻数据;
S3、基于预设的模板实现所爬取新闻数据的推荐,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程;
S4、基于对所述操作过程的评估实现用户的新闻偏好关键词组的修订,并基于修订完成后的新闻偏好关键词组在各新闻网络基站挖取对应的新闻数据实现推荐。
进一步地,所述步骤S1中,首先根据用户的新闻游览记录剔除不符合完整阅读标准的新闻数据条参数,然后基于数据挖掘模块挖取符合新闻数据条参数内载的偏好关键字,构成新闻偏好关键词组。
进一步地,还包括:基于新闻偏好关键词组训练构建Inception V3深度神经网络模型的步骤,所述步骤S2中,基于网络爬虫模块根据所述Inception V3深度神经网络模型在各新闻发布基站上挖取对应的新闻数据,生成待推荐新闻数据库。
进一步地,还包括:构建网络爬虫模块新闻数据爬取时间模型,并基于当前时间实现新闻数据爬取时间模型实时更新的步骤,所述步骤S2中,基于网络爬虫模块根据新闻数据爬取时间模型+Inception V3深度神经网络模型在各新闻发布基站上挖取对应的新闻数据,生成待推荐新闻数据库。
进一步地,所述步骤S3中,同一关键字的新闻数据,一次仅推荐一条,一条新闻数据仅推荐一次,完成推荐后的新闻数据自动从待推荐新闻数据库中移除。
进一步地,所述步骤S4中,每一天执行一次操作过程评估,并根据评估结果实现用户的新闻偏好关键词组的修订,剔除未阅读或未完整阅读的新闻数据条对应的关键字。
进一步地,还包括:根据用户的新闻偏好关键词组、账户注册信息进行用户可能喜欢关键词组的生成,基于可能喜欢关键词组通过数据挖掘模块在各新闻发布基站上挖取实时更新的新闻数据,在每一次推荐符合新闻偏好关键词组新闻数据时,按一定的比例掺杂可能喜欢关键词组对应的新闻数据,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程,基于对操作过程的评估实现用户的可能喜欢关键词组的修订。
本发明具有以下有益效果:
1)可以实现新闻数据的定向高效推送,使得用户可以在极段的时间成本内获取到自己感兴趣的新闻数据。
2)自带新闻偏好关键词组修订功能,可以根据用户每一个时间段的感兴趣点推荐对应的新闻数据;
3)自带可能喜欢关键词组生成和修订功能,可以为用户推荐可能感兴趣的新闻数据,从而扩大用户的兴趣范围,达到新闻传播的目的。
附图说明
图1为本发明实施例1一种基于大数据处理的新闻传播方法的流程图。
图2为本发明实施例2一种基于大数据处理的新闻传播方法的流程图。
图3为本发明实施例3一种基于大数据处理的新闻传播方法的流程图。
具体实施方式
下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
实施例1
一种基于大数据处理的新闻传播方法,包括如下步骤:
S1、以脚本录制的方式记录用户的新闻浏览记录,并基于用户的新闻游览记录获取用户的新闻偏好关键词组;
S2、基于网络爬虫模块根据所述新闻偏好关键词组在各新闻发布基站上挖取对应的新闻数据;
S3、基于预设的模板实现所爬取新闻数据的推荐,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程;
S4、基于对所述操作过程的评估实现用户的新闻偏好关键词组的修订,并基于修订完成后的新闻偏好关键词组在各新闻网络基站挖取对应的新闻数据实现推荐。
本实施例中,所述步骤S1中,首先根据用户的新闻游览记录剔除不符合完整阅读标准的新闻数据条参数,然后基于数据挖掘模块挖取符合新闻数据条参数内载的偏好关键字,构成新闻偏好关键词组。
本实施例中,所述步骤S3中,同一关键字的新闻数据,一次仅推荐一条,一条新闻数据仅推荐一次,完成推荐后的新闻数据自动从待推荐新闻数据库中移除。
本实施例中,所述步骤S4中,每一天执行一次操作过程评估,并根据评估结果实现用户的新闻偏好关键词组的修订,剔除未阅读或未完整阅读的新闻数据条对应的关键字。
实施例2
一种基于大数据处理的新闻传播方法,包括如下步骤:
S1、以脚本录制的方式记录用户的新闻浏览记录,并基于用户的新闻游览记录获取用户的新闻偏好关键词组;
S2、基于新闻偏好关键词组训练构建Inception V3深度神经网络模型;同时,构建网络爬虫模块新闻数据爬取时间模型,并基于当前时间实现新闻数据爬取时间模型实时更新;
S3、基于网络爬虫模块根据新闻数据爬取时间模型+Inception V3深度神经网络模型在各新闻发布基站上挖取对应的新闻数据,生成待推荐新闻数据库;
S4、基于预设的模板实现所爬取新闻数据的推荐,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程;
S5、基于对所述操作过程的评估实现用户的新闻偏好关键词组的修订,并基于修订完成后的新闻偏好关键词组在各新闻网络基站挖取对应的新闻数据实现推荐。
本实施例中,所述步骤S1中,首先根据用户的新闻游览记录剔除不符合完整阅读标准的新闻数据条参数,然后基于数据挖掘模块挖取符合新闻数据条参数内载的偏好关键字,构成新闻偏好关键词组。
本实施例中,所述步骤S4中,同一关键字的新闻数据,一次仅推荐一条,一条新闻数据仅推荐一次,完成推荐后的新闻数据自动从待推荐新闻数据库中移除。
本实施例中,所述步骤S5中,每一天执行一次操作过程评估,并根据评估结果实现用户的新闻偏好关键词组的修订,剔除未阅读或未完整阅读的新闻数据条对应的关键字。
实施例3
一种基于大数据处理的新闻传播方法,包括如下步骤:
S1、以脚本录制的方式记录用户的新闻浏览记录,并基于用户的新闻游览记录获取用户的新闻偏好关键词组;
S2、根据用户的新闻偏好关键词组、账户注册信息进行用户可能喜欢关键词组的生成;
S3、基于网络爬虫模块根据所述新闻偏好关键词组+可能喜欢关键词组在各新闻发布基站上挖取对应的新闻数据,生成待推荐偏好新闻数据库和待推荐可能喜欢新闻数据库;
S4、基于预设的模板实现所爬取新闻数据的推荐,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程;其中,在每一次推荐符合新闻偏好关键词组新闻数据时,按一定的比例掺杂(1/10)可能喜欢关键词组对应的新闻数据;
S5、基于对所述操作过程的评估实现用户的新闻偏好关键词组和可能喜欢关键词组的修订,并基于修订完成后的新闻偏好关键词组和可能喜欢关键词组在各新闻网络基站挖取对应的新闻数据实现推荐。
本实施例中,所述步骤S1中,首先根据用户的新闻游览记录剔除不符合完整阅读标准的新闻数据条参数,然后基于数据挖掘模块挖取符合新闻数据条参数内载的偏好关键字,构成新闻偏好关键词组。
本实施例中,所述步骤S4中,同一关键字的新闻数据,一次仅推荐一条,一条新闻数据仅推荐一次,完成推荐后的新闻数据自动从待推荐新闻数据库中移除。
本实施例中,所述步骤S5中,每一天执行一次操作过程评估,并根据评估结果实现用户的新闻偏好关键词组的修订,剔除未阅读或未完整阅读的新闻数据条对应的关键字。
以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变化或修改,这并不影响本发明的实质内容。在不冲突的情况下,本申请的实施例和实施例中的特征可以任意相互组合。

Claims (4)

1.一种基于大数据处理的新闻传播方法,其特征在于:包括如下步骤:
S1、以脚本录制的方式记录用户的新闻浏览记录,并基于用户的新闻浏览记录获取用户的新闻偏好关键词组;
S2、基于网络爬虫模块,根据所述新闻偏好关键词组在各新闻发布基站上挖取对应的新闻数据;
S3、基于预设的模板实现所爬取新闻数据的推荐,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程;
S4、基于对所述操作过程的评估实现用户的新闻偏好关键词组的修订,并基于修订完成后的新闻偏好关键词组在各新闻网络基站挖取对应的新闻数据实现推荐;
所述步骤S1中,首先根据用户的新闻浏览记录剔除不符合完整阅读标准的新闻数据条,然后基于数据挖掘模块挖取符合的新闻数据条中内载的偏好关键词,构成新闻偏好关键词组;
所述步骤S4中,每一天执行一次操作过程评估,并根据评估结果实现用户的新闻偏好关键词组的修订,剔除未阅读或未完整阅读的新闻数据条对应的关键词;
还包括:根据用户的新闻偏好关键词组、账户注册信息进行用户可能喜欢关键词组的生成,基于可能喜欢关键词组通过数据挖掘模块在各新闻发布基站上挖取实时更新的新闻数据,在每一次推荐符合新闻偏好关键词组新闻数据时,按一定的比例掺杂可能喜欢关键词组对应的新闻数据,并以脚本录制的方式记录用户对所推荐新闻数据的操作过程,基于对操作过程的评估实现用户的可能喜欢关键词组的修订。
2.如权利要求1所述的一种基于大数据处理的新闻传播方法,其特征在于:还包括:基于新闻偏好关键词组训练构建Inception V3深度神经网络模型的步骤,所述步骤S2中,基于网络爬虫模块,根据所述Inception V3深度神经网络模型在各新闻发布基站上挖取对应的新闻数据,生成待推荐新闻数据库。
3.如权利要求1所述的一种基于大数据处理的新闻传播方法,其特征在于:还包括:构建网络爬虫模块新闻数据爬取时间模型,并基于当前时间实现新闻数据爬取时间模型实时更新的步骤,所述步骤S2中,基于网络爬虫模块,根据新闻数据爬取时间模型+InceptionV3深度神经网络模型在各新闻发布基站上挖取对应的新闻数据,生成待推荐新闻数据库。
4.如权利要求1所述的一种基于大数据处理的新闻传播方法,其特征在于:所述步骤S3中,同一关键词的新闻数据,一次仅推荐一条,一条新闻数据仅推荐一次,完成推荐后的新闻数据自动从待推荐新闻数据库中移除。
CN202011331810.7A 2020-11-24 2020-11-24 一种基于大数据处理的新闻传播方法 Active CN112328861B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011331810.7A CN112328861B (zh) 2020-11-24 2020-11-24 一种基于大数据处理的新闻传播方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011331810.7A CN112328861B (zh) 2020-11-24 2020-11-24 一种基于大数据处理的新闻传播方法

Publications (2)

Publication Number Publication Date
CN112328861A CN112328861A (zh) 2021-02-05
CN112328861B true CN112328861B (zh) 2023-06-23

Family

ID=74307874

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011331810.7A Active CN112328861B (zh) 2020-11-24 2020-11-24 一种基于大数据处理的新闻传播方法

Country Status (1)

Country Link
CN (1) CN112328861B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014142301A1 (ja) * 2013-03-15 2014-09-18 日本電気株式会社 情報提供システム、サーバ装置、動画表示装置、情報提供方法、およびプログラム
CN104462578A (zh) * 2014-12-29 2015-03-25 北京邮电大学 新闻推送方法
CN106777139A (zh) * 2016-12-19 2017-05-31 浙江工业大学 基于阅读时间的用户阅读偏好统计的个性化推送方法
WO2017173801A1 (zh) * 2016-04-07 2017-10-12 乐视控股(北京)有限公司 一种个性化多媒体推荐方法和装置
WO2018090793A1 (zh) * 2016-11-18 2018-05-24 腾讯科技(深圳)有限公司 多媒体推荐方法和装置
CN108073606A (zh) * 2016-11-10 2018-05-25 北京搜狗科技发展有限公司 一种新闻推荐方法和装置、一种用于新闻推荐的装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20170154116A1 (en) * 2014-06-30 2017-06-01 Beijing Qihoo Technology Company Limited Method and system for recommending contents based on social network
CN107992531B (zh) * 2017-11-21 2020-11-27 吉浦斯信息咨询(深圳)有限公司 基于深度学习的新闻个性化智能推荐方法与系统
CN111259228A (zh) * 2018-11-15 2020-06-09 南开大学 基于大数据深度学习的个性化新闻推荐方法
CN110737783B (zh) * 2019-10-08 2023-01-17 腾讯科技(深圳)有限公司 一种推荐多媒体内容的方法、装置及计算设备
CN110837474A (zh) * 2019-11-13 2020-02-25 北京博睿宏远数据科技股份有限公司 一种脚本录制方法、装置、终端及存储介质
CN111246256B (zh) * 2020-02-21 2021-05-25 华南理工大学 基于多模态视频内容和多任务学习的视频推荐方法
CN111767228B (zh) * 2020-06-30 2024-02-06 深圳赛安特技术服务有限公司 基于人工智能的界面测试方法、装置、设备和介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014142301A1 (ja) * 2013-03-15 2014-09-18 日本電気株式会社 情報提供システム、サーバ装置、動画表示装置、情報提供方法、およびプログラム
CN104462578A (zh) * 2014-12-29 2015-03-25 北京邮电大学 新闻推送方法
WO2017173801A1 (zh) * 2016-04-07 2017-10-12 乐视控股(北京)有限公司 一种个性化多媒体推荐方法和装置
CN108073606A (zh) * 2016-11-10 2018-05-25 北京搜狗科技发展有限公司 一种新闻推荐方法和装置、一种用于新闻推荐的装置
WO2018090793A1 (zh) * 2016-11-18 2018-05-24 腾讯科技(深圳)有限公司 多媒体推荐方法和装置
CN106777139A (zh) * 2016-12-19 2017-05-31 浙江工业大学 基于阅读时间的用户阅读偏好统计的个性化推送方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Lei Li.SCENE: a scalable two-stage personalized news recommendation system.SIGIR '11: Proceedings of the 34th international ACM SIGIR conference on Research and development in Information RetrievalJuly 2011.2011,125–134. *
一种融入个体人格特质的混合图书推荐方法;琚春华 等;情报学报;第34卷(第02期);164-175 *
移动新媒体极简信息页面新闻推送及其优化;胡明川;;郑州大学学报(哲学社会科学版);50(01);151-155+161 *

Also Published As

Publication number Publication date
CN112328861A (zh) 2021-02-05

Similar Documents

Publication Publication Date Title
CN110147437B (zh) 一种基于知识图谱的搜索方法及装置
CN101882162B (zh) 一种网络信息推送方法及系统
CN102096717B (zh) 搜索方法及搜索引擎
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN103023714B (zh) 基于网络话题的活跃度与集群结构分析系统及方法
CN112989055B (zh) 文本识别方法、装置、计算机设备和存储介质
CN101901247B (zh) 一种领域本体约束的垂直搜索引擎方法及系统
CN103116657B (zh) 一种网络教学资源的个性化搜索方法
CN104063383A (zh) 信息推荐方法及装置
CN102110170B (zh) 一种具有信息发布和搜索功能的系统及信息发布方法
CN106095762A (zh) 一种基于本体模型库的新闻推荐方法及装置
CN101655862A (zh) 信息对象搜索的方法和装置
CN103399883A (zh) 根据用户兴趣点/关注点进行个性化推荐的方法和系统
CN101770520A (zh) 基于用户浏览行为的用户兴趣建模方法
CN103473283A (zh) 一种文本案例匹配方法
CN101630314A (zh) 一种基于领域知识的语义查询扩展方法
CN106202563A (zh) 一种实时关联事件新闻推荐方法及系统
CN112559704A (zh) 一种用户自定义配置的知识图谱生成工具
CN104133877A (zh) 软件标签的生成方法和装置
CN105518661A (zh) 经由挖掘的超链接文本的片段来浏览图像
CN102609465A (zh) 基于潜在社群的信息推荐方法
CN110275962A (zh) 用于输出信息的方法和装置
CN111931022A (zh) Ai热点内容智能编辑系统
CN103927177A (zh) 基于LDA模型和PageRank算法建立特征接口有向图的方法
CN115130601A (zh) 基于多维特征融合的二阶段学术数据网页分类方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240624

Address after: 230000 b-1018, Woye Garden commercial office building, 81 Ganquan Road, Shushan District, Hefei City, Anhui Province

Patentee after: HEFEI WISDOM DRAGON MACHINERY DESIGN Co.,Ltd.

Country or region after: China

Address before: 450046 15 Wen Yuan Xi Road, Zheng Dong New District, Zhengzhou, Henan.

Patentee before: ZHENGZHOU INSTITUTE OF AERONAUTICAL INDUSTRY MANAGEMENT

Country or region before: China