CN110275965A - 假新闻检测方法、电子装置及计算机可读存储介质 - Google Patents
假新闻检测方法、电子装置及计算机可读存储介质 Download PDFInfo
- Publication number
- CN110275965A CN110275965A CN201910570455.XA CN201910570455A CN110275965A CN 110275965 A CN110275965 A CN 110275965A CN 201910570455 A CN201910570455 A CN 201910570455A CN 110275965 A CN110275965 A CN 110275965A
- Authority
- CN
- China
- Prior art keywords
- news
- entity
- newsletter archive
- knowledge mapping
- abstract
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Animal Behavior & Ethology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供一种假新闻检测方法,包括构建事实新闻的知识图谱;根据输入的待检测的新闻文本生成新闻文本的摘要;识别所述新闻文本摘要中的实体及实体之间的关联关系;及将识别到的实体及实体之间的关联关系与知识图谱中的事实新闻进行比对,确定待检测的新闻文本与知识图谱中的事实新闻之间的相似度;及当待检测的新闻文本与知识图谱中的事实新闻之间的相似度小于或等于第一预设值时,判定所述待检测的新闻文本中的新闻为假新闻。本发明还提供一种电子装置及计算机可读存储介质。本发明根据事实新闻构建知识图谱作为假新闻检测的依据,提高了假新闻检测的精确度,有效减少了由于错误信息造成的损失和给社会带来的不稳定因素。
Description
技术领域
本发明涉及语言处理技术领域,尤其涉及一种假新闻检测方法、电子装置及计算机可读存储介质。
背景技术
随着互联网及信息技术的发展,新闻平台与社交平台的数量也日益增长,与此同时,新闻信息量也随之增长。现如今,许多平台或个人在利益的驱使下,或者为了博关注,经常通过互联网发布假新闻,给人们造成很大的不便。现有的识别假新闻的方式通常为人工检测或者根据文本风格和语言特征进行判断,缺乏以事实作为判断依据,容易造成误判。
发明内容
有鉴于此,有必要提供一种假新闻检测方法、电子装置及计算机可读存储介质,以事实作为检测依据,提高假新闻检测的精确度。
本发明的第一方面提供一种假新闻检测方法,应用于电子装置中,所述方法包括:
构建事实新闻的知识图谱;
根据用户通过终端设备输入的对所述知识图谱的更改信息,发布所述更改信息是否通过的投票页面;
当所述更改信息基于其他用户在所述投票页面的投票而通过时,根据所述更改信息对所述知识图谱进行更新;
根据输入的待检测的新闻文本生成新闻文本的摘要;
识别所述新闻文本摘要中的实体及实体之间的关联关系;及
将识别到的实体及实体之间的关联关系与知识图谱中的事实新闻进行比对,确定待检测的新闻文本与知识图谱中的事实新闻之间的相似度;及
当待检测的新闻文本与知识图谱中的事实新闻之间的相似度小于或等于第一预设值时,判定所述待检测的新闻文本中的新闻为假新闻。
优选地,所述方法还包括:
当待检测的新闻文本与知识图谱中的事实新闻之间的相似度大于或等于第二预设值时,判定所述待检测的新闻文本中的新闻为事实新闻。
优选地,步骤“构建事实新闻的知识图谱”具体包括:
接收用户通过终端设备输入的与实时新闻相关的信息;及
将所述与实时新闻相关的信息填充至预设的知识图谱框架以生成事实新闻的知识图谱。
优选地,步骤“根据用户通过终端设备输入的对所述知识图谱的更改信息,发布所述更改信息是否通过的投票页面”具体包括:
接收用户通过终端设备输入的对所述知识图谱的更改信息;
发布所述更改信息是否通过的投票页面,其中,所述投票页面包括赞成选项与反对选项;
统计所述投票页面的投票结果以确定赞成票与反对票之间的比例;及
当所述投票结果中赞成票与反对票之间的比例大于预设比例值时,确定所述更改信息通过。
优选地,所述新闻文本的摘要至少包括标题、来源及正文,步骤“根据输入的待检测的新闻文本生成新闻文本的摘要”具体包括:
采用提取式算法或摘要式算法对输入的待检测新闻文本进行处理以生成所述新闻文本的摘要。
优选地,步骤“识别所述新闻文本摘要中的实体及实体之间的关联关系”具体包括:
对所述新闻文本摘要中的语句进行分词与词性标注,采用深度学习模型识别出语句中的多个实体。
优选地,步骤“识别所述新闻文本摘要中的实体及实体之间的关联关系”还包括:
生成所述新闻文本摘要中语句的句法分析树;
根据生成的句法分析树获取语句的词法信息、句法信息及语义信息;及
根据语句的词法信息、句法信息及语义信息提取出所述多个实体之间的关联关系。
优选地,所述知识图谱包含多个实体及多个实体之间的关联关系,步骤“将识别到的实体及实体之间的关联关系与知识图谱中的事实新闻进行比对”具体包括:
将识别到的所述新闻文本摘要中的实体及实体之间的关联关系与所述知识图谱中的实体及实体之间的关联关系分别进行比对。
本发明的第二方面提供一种电子装置,所述电子装置包括:
处理器;以及
存储器,所述存储器中存储有多个程序模块,所述多个程序模块由所述处理器加载并执行上述的假新闻检测方法。
本发明的第三方面提供一种计算机可读存储介质,其上存储有至少一条计算机指令,所述指令由处理器并加载执行上述的假新闻检测方法。
上述假新闻检测方法、电子装置及计算机可读存储介质根据事实新闻构建知识图谱作为假新闻检测的依据,提高了假新闻检测的精确度,有效减少了由于错误信息造成的损失和给社会带来的不稳定因素。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1是本发明较佳实施方式提供的假新闻检测方法的应用环境架构示意图。
图2是本发明较佳实施方式提供的电子装置的结构示意图。
图3是本发明较佳实施方式提供的假新闻检测系统的结构示意图。
图4是本发明较佳实施方式提供的假新闻检测方法的流程图。
主要元件符号说明
电子装置 | 1 |
处理器 | 10 |
假新闻检测系统 | 100 |
构建模块 | 101 |
生成模块 | 102 |
识别模块 | 103 |
比对模块 | 104 |
确定模块 | 105 |
存储器 | 20 |
计算机程序 | 30 |
终端设备 | 2 |
如下具体实施方式将结合上述附图进一步说明本发明。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
请参阅图1所示,为本发明较佳实施方式提供的假新闻检测方法的应用环境架构示意图。
本发明中的假新闻检测方法应用在电子装置1中,所述电子装置1与至少一个终端设备2通过网络建立通信连接。所述网络可以是有线网络,也可以是无线网络,例如无线电、无线保真(Wireless Fidelity,WIFI)、蜂窝、卫星、广播等。
所述电子装置1可以为安装有假新闻检测程序的电子设备,例如个人电脑、服务器等,其中,所述服务器可以是单一的服务器、服务器集群或云端服务器等。
所述终端设备2可以是智能手机或个人电脑等。
请参阅图2所示,为本发明电子装置较佳实施方式的结构示意图。
所述电子装置1包括,但不仅限于,处理器10、存储器20以及存储在所述存储器20中并可在所述处理器10上运行的计算机程序30,例如假新闻检测程序。所述处理器10执行所述计算机程序30时实现假新闻检测方法中的步骤,例如图4所示的步骤S10~S50。或者,所述处理器10执行所述计算机程序30时实现假新闻检测系统中各模块/单元的功能,例如图3中的模块101-105。
示例性的,所述计算机程序30可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器10执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,所述指令段用于描述所述计算机程序30在所述电子装置1中的执行过程。例如,所述计算机程序30可以被分割成图3中的构建模块101、生成模块102、识别模块103、比对模块104及确定模块105。各模块具体功能参见假新闻检测系统实施例中各模块的功能。
本领域技术人员可以理解,所述示意图仅仅是电子装置1的示例,并不构成对电子装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子装置1还可以包括输入输出设备、网络接入设备、总线等。
所称处理器10可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者所述处理器10也可以是任何常规的处理器等,所述处理器10是所述电子装置1的控制中心,利用各种接口和线路连接整个电子装置1的各个部分。
所述存储器20可用于存储所述计算机程序30和/或模块/单元,所述处理器10通过运行或执行存储在所述存储器20内的计算机程序和/或模块/单元,以及调用存储在存储器20内的数据,实现所述电子装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子装置1的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
请参阅图3所示,本发明假新闻检测系统较佳实施方式的功能模块图。
在一些实施方式中,假新闻检测系统100运行于所述电子装置1中。所述假新闻检测系统100可以包括多个由程序代码段所组成的功能模块。所述假新闻检测系统100中的各个程序段的程序代码可以存储于电子装置1的存储器20中,并由所述至少一个处理器10所执行,以实现假新闻检测功能。
本实施方式中,假新闻检测系统100根据其所执行的功能,可以被划分为多个功能模块。参阅图3所示,所述功能模块可以包括构建模块101、生成模块102、识别模块103、比对模块104及确定模块105。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器20中。可以理解的是,在其他实施例中,上述模块也可为固化于所述处理器10中的程序指令或固件(firmware)。
所述构建模块101用于构建事实新闻的知识图谱。
在本实施方式中,所述构建模块101采用众包模式进行事实新闻知识图谱的构建,即所述事实新闻由多个用户通过互联网提供。其中,所述事实新闻为用户提供的实际发生的新闻。所述事实新闻的知识图谱记录于所述电子装置1提供的新闻平台,例如门户网站、微博等,互联网用户可以在所述新闻平台发布或浏览新闻。
具体的,用户可以将附近发生的实时新闻通过所述终端设备2发送至与所述终端设备2通信的电子装置1,所述构建模块101接收用户通过所述终端设备2输入的与所述实时新闻相关的信息,并将所述与实时新闻相关的信息填充至预设的知识图谱框架以生成所述事实新闻的知识图谱。在本实施方式中,所述与实时新闻相关的信息至少包括时间、地点、人物、数据、过程,所述预设的知识图谱框架包括多个与实时新闻相关的信息相对应的栏位,所述构建模块101将与实时新闻相关的信息填充至所述预设的知识图谱框架对应的栏位中。
进一步地,当有用户发现所述知识图谱中的事实新闻存在不准确信息时,可以通过所述终端设备2发起更改申请,并将更改信息发送至所述电子装置1。所述构建模块101还接收用户通过终端设备2输入的对所述知识图谱的更改信息,并发布所述更改信息是否通过的投票页面。在本实施方式中,所述投票页面包括赞成选项与反对选项,所述构建模块101接收用户通过所述终端设备2选择所述赞成选项而投出的赞成票,以及选择所述反对选项而投出的反对票。
在本实施方式中,所述投票页面由所述构建模块101发布在互联网,其他用户可以使用所述终端设备2通过访问互联网查询到。可以理解的是,在其他实施方式中,所述构建模块101在发布所述更改信息是否通过的投票页面后,还发送提示信息至多个审核用户的终端设备2,以提醒审核用户审核所述更改信息。
所述构建模块101还统计所述投票页面的投票结果以确定赞成票与反对票之间的比例,当所述投票结果中赞成票与反对票之间的比例大于预设比例值时,确定所述更改信息通过,并根据所述更改信息对所述知识图谱进行更新。在本实施方式中,所述预设比例值为4。
在本实施方式中,所述构建模块101还在统计所述投票页面的投票结果时,确定每个投票用户的相关信息。其中,所述相关信息至少包括用户的基本信息、用户与待更改新闻的关联度、用户对待更改新闻的关注度以及用户的历史新闻投票行为。具体的,用户的基本信息包括学历、职业及认证等级等,用户与待更改新闻的关联度包括用户与待更改新闻当事人的关系、用户的地理位置与待更改新闻发生位置之间的距离等,用户对待更改新闻的关注度包括用户的历史浏览及搜索记录,用户的历史新闻投票行为包括用户的历史投票成功率。在本实施方式中,所述构建模块101可以通过查询用户在所述新闻平台的账号信息或根据用户提供的信息确定用户的基本信息及用户与待更改新闻的关联度,还可以通过查询用户在所述新闻平台的历史操作行为确定用户的历史浏览及搜索记录及历史投票成功率。
在本实施方式中,所述存储器20存储有用户的每一相关信息与投票权重值的对应关系,即每当用户的一个相关信息符合预设信息时可以获得一投票权重值。其中,所述投票权重值为1到5的整数。具体的,当用户的基本信息符合预设信息时,例如学历达到硕士、职业为新闻工作者,获得投票权重值2;当用户与待更改新闻的关联度符合预设信息时,例如用户与待更改新闻当事人具有血缘关系、用户的地理位置与待更改新闻发生位置之间的距离小于五公里,获得投票权重值5;当用户对待更改新闻的关注度符合预设信息时,例如用户的历史浏览及搜索记录包含待更改新闻,获得投票权重值2;当用户的历史新闻投票行为符合预设信息时,例如用户的历史投票成功率大于80%,获得投票权重值3。
进一步地,所述构建模块101确定每个用户的投票数量为其总投票权重值,并根据所有用户的投票数量与投票选项统计所述投票页面的投票结果。例如,当一用户的总投票权重值为4时,所述构建模块101确定所述用户的赞成票或反对票的数量为4。
需要说明的是,在所述构建模块101发布所述投票页面的预设时间段内投票的总数量小于预设数量时,由所述电子装置1的管理员决定所述更改信息是否通过。在本实施方式中,所述预设时间段为三天,所述预设数量为10。
所述生成模块102用于根据输入的待检测的新闻文本生成新闻文本的摘要。
在本实施方式中,用户可以通过所述终端设备2将待检测的新闻文本发送至所述电子装置1。可以理解的是,在其他实施方式中,所述电子装置1可以实时侦测新闻平台是否发布新闻,并将所述新闻平台新发布的新闻内容作为待检测的新闻文本。
当所述电子装置1获取输入的待检测新闻文本时,采用单文档摘要算法生成所述待检测新闻文本的摘要。在本实施方式中,所述新闻文本的摘要至少包括标题、来源及正文。
在本实施方式中,所述单文档摘要算法为提取式摘要算法。所述生成模块102将待检测新闻文本分割为多个语句,对多个语句进行分词及删除停止词处理,根据经过分词及删除停止词处理而产生的词语,采用机器学习的方法确定每一语句的权重值,将所述多个语句根据权重值进行排序,选取权重值较高的预设数量的语句作为候选语句,根据字数或语句数量的要求,从候选语句中提取语句组成摘要。在其他实施方式中,所述单文档摘要算法也可以是摘要式摘要算法。
所述识别模块103用于识别所述新闻文本摘要中的实体及实体之间的关联关系。
在本实施方式中,所述识别模块103对所述新闻文本摘要中的语句进行分词与词性标注,采用深度学习模型识别出语句中的多个实体。其中,所述多个实体可以包括,但不仅限于人名、地名及组织机构名。在本实施方式中,实体之间的关系可以包括地址关系、因果关系、单位关系等,通过三元组“实体-关系-实体”进行表示,例如,人名张三某税务局的关联关系可以表示为“张三-单位关系-某税务局”。
在本实施方式中,所述识别模块103对所述新闻文本摘要中的语句进行解析,生成语句的句法分析树,以获取语句的词法信息和句法信息,并通过语句的特定结构获取语句的语义信息。所述识别模块103还将语句的词法信息、句法信息及语义信息输入预设的关系提取模型,通过远程监督的机器学习方法确定所述多个实体之间的关联关系。在本实施方式中,远程监督为将已有的知识对应到语句中以生成大量的训练数据。其中,已有的所述知识来源于人工标注、现有的知识库及特定的语句结构等。
在本实施方式中,特定的语句结构可以对应一预设的关联关系,例如语句结构“A在某地B”对应的预设关联关系为地址关系,表示为A-地址关系-B。例如,语句“王二在武汉实施盗窃案”,所述识别模块103通过语句解析与关系提取可以确定以下关联关系:王二-地址关系-武汉。
所述比对模块104用于将识别到的实体及实体之间的关联关系与知识图谱中的事实新闻进行比对,确定待检测的新闻文本与知识图谱中的事实新闻之间的相似度。
在本实施方式中,所述知识图谱中也包含根据事实新闻提取的多个实体及所述多个实体之间的关联关系。所述比对模块104将识别到的所述新闻文本摘要中的实体与所述知识图谱中的多个实体逐一进行比对,以及将识别到的实体之间的关联关系与所述知识图谱中的多个实体之间的关联关系逐一进行比对。
在本实施方式中,当两个实体相同或语义相近时,所述比对模块104确定所述两个实体相似。当两个关联关系相同或语义相近时,所述比对模块104所述两个关联关系相似。因此,所述比对模块104确定所述新闻文本摘要中与所述知识图谱中的实体及实体关联关系相似的实体及实体关联关系的数量所占百分比为所述待检测的新闻文本与知识图谱中的事实新闻之间的相似度。
当待检测的新闻文本与知识图谱中的事实新闻之间的相似度小于或等于第一预设值时,所述确定模块105用于判定所述待检测的新闻文本中的新闻为假新闻。在本实施方式中,所述第一预设值为40%,所述假新闻为未发生过或杜撰的新闻。
进一步地,当判定所述待检测的新闻文本中的新闻为假新闻时,所述确定模块105可以举报、屏蔽或删除新闻平台中的所述假新闻,还可以根据所述假新闻的来源确定发布者,当所述发布者发布的假新闻达到一定数量时,将所述发布者加入黑名单或基于所述发布者的信息进行报警处理。
当待检测的新闻文本与知识图谱中的事实新闻之间的相似度大于或等于第二预设值时,所述确定模块105判定所述待检测的新闻文本中的新闻为事实新闻。在本实施方式中,所述第二预设值为60%,所述事实新闻即为确实有发生的新闻。
当待检测的新闻文本与知识图谱中的事实新闻之间的相似度大于第一预设值且小于第二预设值时,所述确定模块105输出不确定所述待检测的新闻是否真实的提示信息,以提醒用户自行判定所述待检测新闻的真实性。可以理解,所述第一预设值和所述第二预设值的具体数值可以根据需要进行相应的设置。
请参阅图4所示,是本发明提供的假新闻检测方法的流程图。根据不同的需求,所述流程图中步骤的顺序可以改变,某些步骤可以省略。
步骤S10,构建事实新闻的知识图谱。
步骤S20,根据输入的待检测的新闻文本生成新闻文本的摘要。
步骤S30,识别所述新闻文本摘要中的实体及实体之间的关联关系。
步骤S40,将识别到的实体及实体之间的关联关系与知识图谱中的事实新闻进行比对,确定待检测的新闻文本与知识图谱中的事实新闻之间的相似度。
步骤S50,当待检测的新闻文本与知识图谱中的事实新闻之间的相似度小于或等于第一预设值时,判定所述待检测的新闻文本中的新闻为假新闻。
步骤S60,当待检测的新闻文本与知识图谱中的事实新闻之间的相似度大于或等于第二预设值时,判定所述待检测的新闻文本中的新闻为事实新闻。
步骤S70,当待检测的新闻文本与知识图谱中的事实新闻之间的相似度大于第一预设值且小于第二预设值时,输出不确定所述待检测的新闻是否真实的提示信息。
所述电子装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,所述计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
上述假新闻检测方法、电子装置及计算机可读存储介质,根据事实新闻构建知识图谱作为假新闻检测的依据,提高了假新闻检测的精确度,有效减少了由于错误信息造成的损失和给社会带来的不稳定因素。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由同一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (10)
1.一种假新闻检测方法,应用于电子装置中,其特征在于,所述方法包括:
构建事实新闻的知识图谱;
根据用户通过终端设备输入的对所述知识图谱的更改信息,发布所述更改信息是否通过的投票页面;
当所述更改信息基于其他用户在所述投票页面的投票而通过时,根据所述更改信息对所述知识图谱进行更新;
根据输入的待检测的新闻文本生成新闻文本的摘要;
识别所述新闻文本摘要中的实体及实体之间的关联关系;及
将识别到的实体及实体之间的关联关系与知识图谱中的事实新闻进行比对,确定待检测的新闻文本与知识图谱中的事实新闻之间的相似度;及
当待检测的新闻文本与知识图谱中的事实新闻之间的相似度小于或等于第一预设值时,判定所述待检测的新闻文本中的新闻为假新闻。
2.如权利要求1所述的假新闻检测方法,其特征在于,所述方法还包括:
当待检测的新闻文本与知识图谱中的事实新闻之间的相似度大于或等于第二预设值时,判定所述待检测的新闻文本中的新闻为事实新闻。
3.如权利要求1所述的假新闻检测方法,其特征在于,步骤“构建事实新闻的知识图谱”具体包括:
接收用户通过终端设备输入的与实时新闻相关的信息;及
将所述与实时新闻相关的信息填充至预设的知识图谱框架以生成事实新闻的知识图谱。
4.如权利要求1所述的假新闻检测方法,其特征在于,步骤“根据用户通过终端设备输入的对所述知识图谱的更改信息,发布所述更改信息是否通过的投票页面”具体包括:
接收用户通过终端设备输入的对所述知识图谱的更改信息;
发布所述更改信息是否通过的投票页面,其中,所述投票页面包括赞成选项与反对选项;
统计所述投票页面的投票结果以确定赞成票与反对票之间的比例;及
当所述投票结果中赞成票与反对票之间的比例大于预设比例值时,确定所述更改信息通过。
5.如权利要求1所述的假新闻检测方法,其特征在于,所述新闻文本的摘要至少包括标题、来源及正文,步骤“根据输入的待检测的新闻文本生成新闻文本的摘要”具体包括:
采用提取式算法或摘要式算法对输入的待检测新闻文本进行处理以生成所述新闻文本的摘要。
6.如权利要求1所述的假新闻检测方法,其特征在于,步骤“识别所述新闻文本摘要中的实体及实体之间的关联关系”具体包括:
对所述新闻文本摘要中的语句进行分词与词性标注,采用深度学习模型识别出语句中的多个实体。
7.如权利要求6所述的假新闻检测方法,其特征在于,步骤“识别所述新闻文本摘要中的实体及实体之间的关联关系”还包括:
生成所述新闻文本摘要中语句的句法分析树;
根据生成的句法分析树获取语句的词法信息、句法信息及语义信息;及
根据语句的词法信息、句法信息及语义信息提取出所述多个实体之间的关联关系。
8.如权利要求1所述的假新闻检测方法,其特征在于,所述知识图谱包含多个实体及多个实体之间的关联关系,步骤“将识别到的实体及实体之间的关联关系与知识图谱中的事实新闻进行比对”具体包括:
将识别到的所述新闻文本摘要中的实体及实体之间的关联关系与所述知识图谱中的实体及实体之间的关联关系分别进行比对。
9.一种电子装置,其特征在于,所述电子装置包括:
处理器;以及
存储器,所述存储器中存储有多个程序模块,所述多个程序模块由所述处理器加载并执行如权利要求1-8中任意一项所述的假新闻检测方法。
10.一种计算机可读存储介质,其上存储有至少一条计算机指令,其特征在于,所述指令由处理器并加载执行如权利要求1-8中任意一项所述的假新闻检测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910570455.XA CN110275965B (zh) | 2019-06-27 | 2019-06-27 | 假新闻检测方法、电子装置及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910570455.XA CN110275965B (zh) | 2019-06-27 | 2019-06-27 | 假新闻检测方法、电子装置及计算机可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110275965A true CN110275965A (zh) | 2019-09-24 |
CN110275965B CN110275965B (zh) | 2021-12-21 |
Family
ID=67962432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910570455.XA Active CN110275965B (zh) | 2019-06-27 | 2019-06-27 | 假新闻检测方法、电子装置及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110275965B (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111061843A (zh) * | 2019-12-26 | 2020-04-24 | 武汉大学 | 一种知识图谱引导的假新闻检测方法 |
CN111683119A (zh) * | 2020-05-19 | 2020-09-18 | 南京数娱天下网络科技有限公司 | 一种基于云平台的新闻阅读系统 |
CN111831790A (zh) * | 2020-06-23 | 2020-10-27 | 广东工业大学 | 一种基于低门限集成与文本内容匹配的虚假新闻识别方法 |
CN112241456A (zh) * | 2020-12-18 | 2021-01-19 | 成都晓多科技有限公司 | 基于关系网络与注意力机制的假新闻预测方法 |
CN113779358A (zh) * | 2021-09-14 | 2021-12-10 | 支付宝(杭州)信息技术有限公司 | 一种事件检测方法和系统 |
CN113849599A (zh) * | 2021-09-03 | 2021-12-28 | 北京中科睿鉴科技有限公司 | 基于模式信息和事实信息的联合虚假新闻检测方法 |
CN114328765A (zh) * | 2022-03-04 | 2022-04-12 | 四川大学 | 新闻传播预测方法及装置 |
CN114969269A (zh) * | 2022-06-23 | 2022-08-30 | 济南大学 | 基于实体识别和关系抽取的虚假新闻检测方法及系统 |
US11762896B2 (en) | 2020-11-16 | 2023-09-19 | International Business Machines Corporation | Relationship discovery and quantification |
CN117807322A (zh) * | 2024-02-29 | 2024-04-02 | 南京信息工程大学 | 一种基于知识图谱检索的虚假新闻检测方法及系统 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462487A (zh) * | 2014-12-19 | 2015-03-25 | 南开大学 | 一种融合多信息源的个性化在线新闻评论情绪预测方法 |
CN106156365A (zh) * | 2016-08-03 | 2016-11-23 | 北京智能管家科技有限公司 | 一种知识图谱的生成方法及装置 |
CN107247795A (zh) * | 2017-06-22 | 2017-10-13 | 巴拉巴网络科技(北京)有限公司 | 内容发布方法、装置、系统及机器可读存储介质 |
CN108241727A (zh) * | 2017-09-01 | 2018-07-03 | 新华智云科技有限公司 | 新闻可信度评价方法及设备 |
CN108319630A (zh) * | 2017-07-05 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、存储介质和计算机设备 |
US20180276279A1 (en) * | 2017-03-23 | 2018-09-27 | International Business Machines Corporation | Leveraging extracted entity and relation data to automatically filter data streams |
CN108766509A (zh) * | 2018-05-16 | 2018-11-06 | 中国联合网络通信集团有限公司 | 基于区块链技术的鉴真方法、装置、终端及存储介质 |
US20190018904A1 (en) * | 2017-07-14 | 2019-01-17 | Phylot Inc. | Method and system for identifying and discovering relationships between disparate datasets from multiple sources |
CN109314660A (zh) * | 2017-03-31 | 2019-02-05 | 微软技术许可有限责任公司 | 在自动聊天中提供新闻推荐 |
CN109388696A (zh) * | 2018-09-30 | 2019-02-26 | 北京字节跳动网络技术有限公司 | 删除谣言文章的方法、装置、存储介质及电子设备 |
US20190164015A1 (en) * | 2017-11-28 | 2019-05-30 | Sigma Ratings, Inc. | Machine learning techniques for evaluating entities |
CN109858930A (zh) * | 2019-01-24 | 2019-06-07 | 同济大学 | 基于关联图谱表征学习的线上交易欺诈检测方法 |
-
2019
- 2019-06-27 CN CN201910570455.XA patent/CN110275965B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462487A (zh) * | 2014-12-19 | 2015-03-25 | 南开大学 | 一种融合多信息源的个性化在线新闻评论情绪预测方法 |
CN106156365A (zh) * | 2016-08-03 | 2016-11-23 | 北京智能管家科技有限公司 | 一种知识图谱的生成方法及装置 |
US20180276279A1 (en) * | 2017-03-23 | 2018-09-27 | International Business Machines Corporation | Leveraging extracted entity and relation data to automatically filter data streams |
CN109314660A (zh) * | 2017-03-31 | 2019-02-05 | 微软技术许可有限责任公司 | 在自动聊天中提供新闻推荐 |
CN107247795A (zh) * | 2017-06-22 | 2017-10-13 | 巴拉巴网络科技(北京)有限公司 | 内容发布方法、装置、系统及机器可读存储介质 |
CN108319630A (zh) * | 2017-07-05 | 2018-07-24 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、存储介质和计算机设备 |
US20190018904A1 (en) * | 2017-07-14 | 2019-01-17 | Phylot Inc. | Method and system for identifying and discovering relationships between disparate datasets from multiple sources |
CN108241727A (zh) * | 2017-09-01 | 2018-07-03 | 新华智云科技有限公司 | 新闻可信度评价方法及设备 |
US20190164015A1 (en) * | 2017-11-28 | 2019-05-30 | Sigma Ratings, Inc. | Machine learning techniques for evaluating entities |
CN108766509A (zh) * | 2018-05-16 | 2018-11-06 | 中国联合网络通信集团有限公司 | 基于区块链技术的鉴真方法、装置、终端及存储介质 |
CN109388696A (zh) * | 2018-09-30 | 2019-02-26 | 北京字节跳动网络技术有限公司 | 删除谣言文章的方法、装置、存储介质及电子设备 |
CN109858930A (zh) * | 2019-01-24 | 2019-06-07 | 同济大学 | 基于关联图谱表征学习的线上交易欺诈检测方法 |
Non-Patent Citations (2)
Title |
---|
ELMAR GERHARDS-PADILLA等: "Detecting Black Hole Attacks in Tactical MANETs using Topology Graphs", 《32ND IEEE CONFERENCE ON LOCAL COMPUTER NETWORKS (LCN 2007)》 * |
吴连伟 等: "网络传播信息内容的可信度研究进展", 《中文信息学报》 * |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111061843A (zh) * | 2019-12-26 | 2020-04-24 | 武汉大学 | 一种知识图谱引导的假新闻检测方法 |
CN111061843B (zh) * | 2019-12-26 | 2023-08-25 | 武汉大学 | 一种知识图谱引导的假新闻检测方法 |
CN111683119A (zh) * | 2020-05-19 | 2020-09-18 | 南京数娱天下网络科技有限公司 | 一种基于云平台的新闻阅读系统 |
CN111831790B (zh) * | 2020-06-23 | 2023-07-14 | 广东工业大学 | 一种基于低门限集成与文本内容匹配的虚假新闻识别方法 |
CN111831790A (zh) * | 2020-06-23 | 2020-10-27 | 广东工业大学 | 一种基于低门限集成与文本内容匹配的虚假新闻识别方法 |
US11762896B2 (en) | 2020-11-16 | 2023-09-19 | International Business Machines Corporation | Relationship discovery and quantification |
CN112241456A (zh) * | 2020-12-18 | 2021-01-19 | 成都晓多科技有限公司 | 基于关系网络与注意力机制的假新闻预测方法 |
CN113849599B (zh) * | 2021-09-03 | 2023-01-24 | 北京中科睿鉴科技有限公司 | 基于模式信息和事实信息的联合虚假新闻检测方法 |
CN113849599A (zh) * | 2021-09-03 | 2021-12-28 | 北京中科睿鉴科技有限公司 | 基于模式信息和事实信息的联合虚假新闻检测方法 |
CN113779358A (zh) * | 2021-09-14 | 2021-12-10 | 支付宝(杭州)信息技术有限公司 | 一种事件检测方法和系统 |
CN113779358B (zh) * | 2021-09-14 | 2024-05-24 | 支付宝(杭州)信息技术有限公司 | 一种事件检测方法和系统 |
CN114328765A (zh) * | 2022-03-04 | 2022-04-12 | 四川大学 | 新闻传播预测方法及装置 |
CN114969269A (zh) * | 2022-06-23 | 2022-08-30 | 济南大学 | 基于实体识别和关系抽取的虚假新闻检测方法及系统 |
CN117807322A (zh) * | 2024-02-29 | 2024-04-02 | 南京信息工程大学 | 一种基于知识图谱检索的虚假新闻检测方法及系统 |
CN117807322B (zh) * | 2024-02-29 | 2024-05-14 | 南京信息工程大学 | 一种基于知识图谱检索的虚假新闻检测方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN110275965B (zh) | 2021-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110275965A (zh) | 假新闻检测方法、电子装置及计算机可读存储介质 | |
JP6689515B2 (ja) | ユーザ地理的ロケーションのタイプを識別するための方法および装置 | |
US8688791B2 (en) | Methods and systems for analysis of real-time user-generated text messages | |
US20180203835A1 (en) | Generating a form response interface in an online application | |
US20140172415A1 (en) | Apparatus, system, and method of providing sentiment analysis result based on text | |
US8489626B2 (en) | Method and apparatus for recommending a short message recipient | |
CN103577531A (zh) | 用于基于消息聚合特征的消息订阅的系统和方法 | |
CN113849702B (zh) | 一种确定目标数据的方法、装置、电子设备及存储介质 | |
CN113127506A (zh) | 目标查询语句的构建方法、装置、存储介质和电子装置 | |
CN113516529A (zh) | 异常订单确定方法、装置、存储介质及电子设备 | |
CN114417118A (zh) | 一种异常数据处理方法、装置、设备以及存储介质 | |
CN112163127B (zh) | 关系图谱构建方法、装置、电子设备及存储介质 | |
US20040064499A1 (en) | Method and system for active knowledge management | |
CN117493671A (zh) | 信息处理方法、装置、电子设备及计算机存储介质 | |
CN113722580A (zh) | 地址信息处理方法、装置、电子设备和计算机可读介质 | |
CN112883725A (zh) | 一种文案生成方法、装置、电子设备、存储介质 | |
CN115374793B (zh) | 基于服务场景识别的语音数据处理方法及相关装置 | |
CN111125332A (zh) | 计算词的tf-idf值的方法、装置、设备及存储介质 | |
CN111083705A (zh) | 群发诈骗短信检测方法、装置、服务器及存储介质 | |
CN103312584A (zh) | 一种在网络社区中发布信息的方法与设备 | |
CN109064191A (zh) | 车源数据解析方法、装置及电子设备 | |
CN114862479A (zh) | 信息推送方法、装置、电子设备和介质 | |
CN112348614B (zh) | 用于推送信息的方法和装置 | |
CN111026991B (zh) | 数据展示方法及装置、计算机设备 | |
CN115146148A (zh) | 一种推荐内容数据的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |