CN114328765B - 新闻传播预测方法及装置 - Google Patents

新闻传播预测方法及装置 Download PDF

Info

Publication number
CN114328765B
CN114328765B CN202210207157.6A CN202210207157A CN114328765B CN 114328765 B CN114328765 B CN 114328765B CN 202210207157 A CN202210207157 A CN 202210207157A CN 114328765 B CN114328765 B CN 114328765B
Authority
CN
China
Prior art keywords
news
entity
propagation
data
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210207157.6A
Other languages
English (en)
Other versions
CN114328765A (zh
Inventor
丛凯
王运鹏
徐彦斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan University
Original Assignee
Sichuan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan University filed Critical Sichuan University
Priority to CN202210207157.6A priority Critical patent/CN114328765B/zh
Publication of CN114328765A publication Critical patent/CN114328765A/zh
Application granted granted Critical
Publication of CN114328765B publication Critical patent/CN114328765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了新闻传播预测方法及装置,涉及数据传播领域,方法包括S1构建预测模型,S2获取新闻数据,导入预测模型,S3识别定向的新闻数据的实体和实体关系,并保存到数据库,S4优化传播图谱模块,S5对待预测新闻数据进行预测得到传播路径;装置包括用于获取新闻数据的获取模块、预处理模块、知识图谱模块、数据库、传播图谱模块和显示模块;本方法通过对已发生新闻的实体抽取、关系抽取形成新闻实体数据库、新闻实体关系数据库;根据以上新闻实体数据库和新闻实体关系数据库形成新闻知识图谱和传播图谱,依据传播图谱可有效对对新闻传播路径进行预测,解决了无法对有害新闻进行传播路径预测和阻止传播的效果。

Description

新闻传播预测方法及装置
技术领域
本发明涉及数据传播领域,尤其涉及一种新闻传播预测方法及装置。
背景技术
在传统的新闻预测方法中,多根据新闻中的关键字进行统计预测,但中文新闻中经常出现多个名词或相近的词同时指代同一新闻事件或新闻人物,仅依据某些关键词则存在对需要预测的新闻无法识别的情况,最终导致对传播路径的预测不准确;同时新闻涉及的传播要素比较多,如新闻创作人、新闻传播媒介、新闻发生的地点、新闻中事件所属的行业领域等往往都会决定新闻的传播路径,传统仅依据新闻中的关键词去进行传播的预测则结果是不精确的。
发明内容
本发明的目的就在于为了解决上述问题设计了一种新闻传播预测方法及装置。
本发明通过以下技术方案来实现上述目的:
新闻传播预测方法,包括:
S1、构建预测模型,预测模型包括知识图谱模块、传播图谱模块和数据库;
S2、定向获取新闻数据,并导入预测模型;
S3、知识图谱模块识别定向的新闻数据的实体和实体关系,并将识别的实体和实体关系分别保存到数据库的实体库和实体关系库;
S4、根据实体和实体关系优化传播图谱模块;
S5、待预测新闻数据导入优化后的预测模型进行预测,得到待预测新闻数据的传播路径。
新闻预测装置,应用于如上述的新闻传播预测方法,包括:
用于获取新闻数据的采集模块;
预处理模块;预处理模块用于去除新闻数据中无法识别的数据并补全新闻数据中的要素;
知识图谱模块;知识图谱模块用于识别新闻数据的实体和实体关系;
数据库;数据库用于保存实体和实体关系;
传播图谱模块;传播图谱模块用于预测新闻数据得到传播路径;
显示模块;显示模块用于显示预测的传播路径和输入指令。
本发明的有益效果在于:本方法通过对已发生新闻的实体抽取、关系抽取形成新闻实体数据库、新闻实体关系数据库;根据以上新闻实体数据库和新闻实体关系数据库形成新闻知识图谱和传播图谱,依据传播图谱可有效对对新闻传播路径进行预测,解决了无法对有害新闻进行传播路径预测和阻止传播的效果。
附图说明
图1是本发明新闻传播预测方法的示意图;
图2是本发明新闻传播预测装置的示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要理解的是,术语“上”、“下”、“内”、“外”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该发明产品使用时惯常摆放的方位或位置关系,或者是本领域技术人员惯常理解的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的设备或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
在本发明的描述中,还需要说明的是,除非另有明确的规定和限定,“设置”、“连接”等术语应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接连接,也可以通过中间媒介间接连接,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
下面结合附图,对本发明的具体实施方式进行详细说明。
如图1所示,新闻传播预测方法,包括:
S1、构建预测模型,预测模型包括知识图谱模块、传播图谱模块和数据库。
S1’、对新闻数据进行预处理,去除新闻数据中的格式化数据、无法识别的新闻图片、视频数据,并查询知识图谱模块中存在实体和实体关系信息补全新闻数据中的新闻创作人、新闻传播媒介、新闻发生的地点、新闻中事件所属的行业领域等要素。
S2、定向获取新闻数据,并导入预测模型。
S3、知识图谱模块识别定向的新闻数据的实体和实体关系,并将识别的实体和实体关系分别保存到数据库的实体库和实体关系库,具体包括:
S31、通过自然语言处理技术对新闻数据进行分析获得该新闻数据的实体;
S32、通过实体对齐和实体消歧技术对实体进行处理,并将其导入数据库的实体库;
S33、根据实体在新闻数据中的逻辑关系得到实体关系,并将其导入数据库的实体关系库。
S4、传播图谱模块通过实体、实体关系和贝叶斯网络对各传播关系的状态转化概率进行优化,得到优化后的预测模型;
S5、待预测新闻数据导入优化后的预测模型进行预测得到待预测新闻数据的传播路径,具体包括:
待预测新闻数据导入优化后的预测模型,知识图谱模块进行识别获得实体和实体关系,传播图谱模块根据实体和实体关系进行实体查询和子图匹配,根据查询结果和匹配结果对待预测新闻数据的传播路径概率进行预测,形成新闻的预测路径图。
本方法通过对已发生新闻的实体抽取、关系抽取形成新闻实体数据库、新闻实体关系数据库;根据以上新闻实体数据库和新闻实体关系数据库形成新闻知识图谱和传播图谱,依据传播图谱可有效对对新闻传播路径进行预测,解决了无法对有害新闻进行传播路径预测和阻止传播的效果。
如图2所示,新闻预测装置,应用于上述的新闻传播预测方法,包括:
用于获取新闻数据的采集模块;
预处理模块;预处理模块用于去除新闻数据中无法识别的数据并补全新闻数据中的要素;
知识图谱模块;知识图谱模块用于识别新闻数据的实体和实体关系;
数据库;数据库用于保存实体和实体关系;
传播图谱模块;传播图谱模块用于预测新闻数据得到传播路径;
显示模块;显示模块用于显示预测的传播路径和输入指令。
本发明的技术方案不限于上述具体实施例的限制,凡是根据本发明的技术方案做出的技术变形,均落入本发明的保护范围之内。

Claims (4)

1.新闻传播预测方法,其特征在于,包括:
S1、构建预测模型,预测模型包括知识图谱模块、传播图谱模块和数据库;
S2、定向获取新闻数据,并导入预测模型;
S3、知识图谱模块识别定向的新闻数据的实体和实体关系,并将识别的实体和实体关系分别保存到数据库的实体库和实体关系库;
S4、通过实体、实体关系和贝叶斯网络对各传播关系的状态转化概率优化传播图谱模块;
S5、待预测新闻数据导入优化后的预测模型进行预测,得到待预测新闻数据的传播路径,具体为:待预测新闻数据导入优化后的预测模型,知识图谱模块进行识别获得实体和实体关系,传播图谱模块根据实体和实体关系进行实体查询和子图匹配,根据查询结果和匹配结果对待预测新闻数据的传播路径概率进行预测,形成新闻的预测路径图。
2.根据权利要求1所述的新闻传播预测方法,其特征在于,在S3中包括;
S31、通过自然语言处理技术对新闻数据进行分析获得该新闻数据的实体;
S32、通过实体对齐和实体消歧技术对实体进行处理,并将其导入数据库的实体库;
S33、根据实体在新闻数据中的逻辑关系得到实体关系,并将其导入数据库的实体关系库。
3.根据权利要求1所述的新闻传播预测方法,其特征在于,在S1和S2之间还包括S1’、对新闻数据进行预处理,去除新闻数据中的格式化数据、无法识别的新闻图片、视频数据,并查询知识图谱模块中存在实体和实体关系信息, 补全新闻数据中的新闻创作人、新闻传播媒介、新闻发生的地点、新闻中事件所属的行业领域的要素。
4.新闻预测装置,应用于如权利要求1-3任一项所述的新闻传播预测方法,其特征在于,包括:
用于获取新闻数据的获取模块;
预处理模块;预处理模块用于去除新闻数据中无法识别的数据并补全新闻数据中的要素;
知识图谱模块;知识图谱模块用于识别新闻数据的实体和实体关系;
数据库;数据库用于保存实体和实体关系;
传播图谱模块;传播图谱模块用于预测新闻数据得到传播路径;
显示模块;显示模块用于显示预测的传播路径和输入指令。
CN202210207157.6A 2022-03-04 2022-03-04 新闻传播预测方法及装置 Active CN114328765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210207157.6A CN114328765B (zh) 2022-03-04 2022-03-04 新闻传播预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210207157.6A CN114328765B (zh) 2022-03-04 2022-03-04 新闻传播预测方法及装置

Publications (2)

Publication Number Publication Date
CN114328765A CN114328765A (zh) 2022-04-12
CN114328765B true CN114328765B (zh) 2022-05-31

Family

ID=81030605

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210207157.6A Active CN114328765B (zh) 2022-03-04 2022-03-04 新闻传播预测方法及装置

Country Status (1)

Country Link
CN (1) CN114328765B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及系统
CN111061843A (zh) * 2019-12-26 2020-04-24 武汉大学 一种知识图谱引导的假新闻检测方法
CN111241300A (zh) * 2020-01-09 2020-06-05 中信银行股份有限公司 舆情预警以及风险传播分析方法、系统、设备及存储介质
CN111444231A (zh) * 2019-01-17 2020-07-24 融汇鑫成(北京)信息科技有限公司 一种新闻传播预测的方法
CN111970327A (zh) * 2020-07-22 2020-11-20 南京审计大学 一种基于大数据处理的新闻传播方法及系统
CN112241456A (zh) * 2020-12-18 2021-01-19 成都晓多科技有限公司 基于关系网络与注意力机制的假新闻预测方法
CN113239111A (zh) * 2021-06-17 2021-08-10 上海海洋大学 一种基于知识图谱的网络舆情可视化分析方法及系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8600979B2 (en) * 2010-06-28 2013-12-03 Yahoo! Inc. Infinite browse
CN110275965B (zh) * 2019-06-27 2021-12-21 卓尔智联(武汉)研究院有限公司 假新闻检测方法、电子装置及计算机可读存储介质
US20210224488A1 (en) * 2020-01-22 2021-07-22 Devfactory Fz-Llc Business graph engine for connection recommendations
CN113268603A (zh) * 2021-05-08 2021-08-17 大箴(杭州)科技有限公司 一种新闻舆情知识图谱的构建方法及装置、介质、设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108596439A (zh) * 2018-03-29 2018-09-28 北京中兴通网络科技股份有限公司 一种基于知识图谱的企业风险预测方法及系统
CN111444231A (zh) * 2019-01-17 2020-07-24 融汇鑫成(北京)信息科技有限公司 一种新闻传播预测的方法
CN111061843A (zh) * 2019-12-26 2020-04-24 武汉大学 一种知识图谱引导的假新闻检测方法
CN111241300A (zh) * 2020-01-09 2020-06-05 中信银行股份有限公司 舆情预警以及风险传播分析方法、系统、设备及存储介质
CN111970327A (zh) * 2020-07-22 2020-11-20 南京审计大学 一种基于大数据处理的新闻传播方法及系统
CN112241456A (zh) * 2020-12-18 2021-01-19 成都晓多科技有限公司 基于关系网络与注意力机制的假新闻预测方法
CN113239111A (zh) * 2021-06-17 2021-08-10 上海海洋大学 一种基于知识图谱的网络舆情可视化分析方法及系统

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
Event identification in social media through latent dirichlet allocation and named entity recognition;G. Abinaya 等;《Proceedings of IEEE International Conference on Computer Communication and Systems ICCCS14》;20150326;142-146 *
探索大数据时代新闻传播的创新路径;丁宁;《卫星电视与宽带多媒体》;20200405(第07期);186-187 *
联合罪名预测的涉案新闻重叠实体关系抽取;张明芳 等;《南京理工大学学报》;20210228;第45卷(第1期);46-55 *

Also Published As

Publication number Publication date
CN114328765A (zh) 2022-04-12

Similar Documents

Publication Publication Date Title
US10438050B2 (en) Image analysis device, image analysis system, and image analysis method
CN105975939A (zh) 视频检测方法和装置
CN111784528A (zh) 异常社群检测方法、装置、计算机设备及存储介质
CN112258254B (zh) 基于大数据架构的互联网广告风险监测方法及系统
CN111563382A (zh) 文本信息的获取方法、装置、存储介质及计算机设备
CN112506925A (zh) 一种基于区块链的数据检索系统及方法
CN112084342A (zh) 试题生成方法、装置、计算机设备及存储介质
CN111932308A (zh) 数据推荐方法、装置和设备
CN114741544B (zh) 图像检索方法、检索库构建方法、装置、电子设备及介质
CN111586695A (zh) 短信识别方法及相关设备
EP3564833B1 (en) Method and device for identifying main picture in web page
CN114328765B (zh) 新闻传播预测方法及装置
CN111563527B (zh) 异常事件检测方法以及装置
CN112632249A (zh) 产品不同版本信息的展示方法、装置、计算机设备及介质
CN111984797A (zh) 客户身份识别装置及方法
CN113673214B (zh) 信息清单的对齐方法、装置、存储介质和电子设备
CN111160410A (zh) 一种物体检测方法和装置
CN112507098B (zh) 问题处理方法、装置、电子设备、存储介质及程序产品
Uehara et al. A computer-aided visual exploration system for knowledge discovery from images
CN114385837A (zh) 一种媒体内容自动检测审核方法与审核系统
CN114706899A (zh) 快递数据的敏感度计算方法、装置、存储介质及设备
CN113033333A (zh) 实体词识别方法、装置、电子设备和存储介质
CN112308678A (zh) 基于图像识别的价格信息处理方法、装置、设备和介质
CN115187153B (zh) 应用于业务风险溯源的数据处理方法及系统
CN114584616B (zh) 一种消息推送方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant