CN110188284B - 一种基于检索辅助的谣言检测方法及系统 - Google Patents
一种基于检索辅助的谣言检测方法及系统 Download PDFInfo
- Publication number
- CN110188284B CN110188284B CN201910341053.2A CN201910341053A CN110188284B CN 110188284 B CN110188284 B CN 110188284B CN 201910341053 A CN201910341053 A CN 201910341053A CN 110188284 B CN110188284 B CN 110188284B
- Authority
- CN
- China
- Prior art keywords
- rumor
- similar
- object information
- information
- library
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 76
- 238000004364 calculation method Methods 0.000 claims description 20
- 238000000034 method Methods 0.000 claims description 18
- 230000004913 activation Effects 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 5
- 230000006870 function Effects 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 238000012216 screening Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 229940060587 alpha e Drugs 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000009395 breeding Methods 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提出一种基于检索辅助的谣言检测方法及系统,包括:获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签。
Description
技术领域
本发明涉及大数据挖掘中的新闻检测领域,特别涉及一种基于检索辅助的谣言检测方法及系统。
背景技术
社交媒体的蓬勃发展改变了用户获取信息的方式,越来越多的用户倾向于在社交媒体中获取与发布信息,但是这也为谣言的滋生与快速传播提供了方便,肆意散布的谣言可能会引起社会恐慌。例如,在2015年8月25日,有谣言称墨西哥维拉克鲁斯一幼儿园内被吸毒分子挟持,发生枪击事件,该谣言迅速在Twitter与Facebook中传播,导致当日该城市发生至少26起车祸。但传统的基于人工审核的谣言检测系统往往需要大量的人工,耗时耗力,且难以实时的对谣言信息作出判定,因此亟需一种自动化检测系统对谣言信息进行实时判定。
现有的谣言检测算法使用机器学习方法配合人工抽取的特征共同判定谣言,Castillo等人从新闻内容、用户属性、传播特征等方面抽取了大量特征,在此基础上,Adrien,Aniko等人在此工作基础上又提出了一些新的时序特征来表示谣言的散布特征,这些方法在谣言检测中取得了一定的成效。
与定义一系列复杂特征不同,Zhao等人通过一系列正则表达式来进行谣言的初筛(如:真的吗?是这样吗?),然后通过专家再进行人为判定。近期Ma等人使用循环神经网络(RNN)来自动学习不同时间段内谣言及谣言散布者的特征,取得了优于传统方法的效果。
发明人在进行谣言检测研究时发现,现有方法通常单独的处理每一条信息,忽视了信息与信息之间的相关性。实际上,日常接触到的谣言往往是旧料翻新,即将以往谣言进行一定修改后再次发布,针对这类谣言,利用以往的相关谣言的判定结果对其进行判定往往比单纯使用算法对其判定效果要大有提升。
发明内容
针对以上问题,本发明提出了一种基于检索辅助的谣言检测系统。该系统在使用谣言检测算法进行自动判定的同时,使用搜索算法在系统的谣言库中检索,筛选出与当前信息相似的历史谣言,并利用其标签辅助判定当前信息。
针对现有技术的不足,本发明提出一种基于检索辅助的谣言检测方法,其中包括:
步骤1、获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;
步骤2、集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;
步骤3、根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签。
所述的基于检索辅助的谣言检测方法,其中该步骤2包括:
步骤21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度,并根据相似度大小排序,选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言,其中k为正整数。
所述的基于检索辅助的谣言检测方法,其中该权重赋予的方法为:
第i条相似谣言权重计算方法如下:
i=1,2,3,…,k
其中wi为第i条相似谣言的权重,e(·)为指数运算操作。
所述的基于检索辅助的谣言检测方法,其中该辅助谣言检测结果的计算方法如下:
其中li表示第i条相似谣言的谣言标签,α为该辅助谣言检测结果。
所述的基于检索辅助的谣言检测方法,其中步骤3中该对象信息的谣言标签计算方法如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为该初步谣言检测结果,sigmoid(·)为激活函数,f(ω)为类别标签计算函数。
其中还包括:步骤4、将该对象信息的谣言标签通过人工复核认证后,追加到该谣言库中,以动态维护该谣言库。
本发明还提出了一种基于检索辅助的谣言检测系统,其中包括:
模块1、获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;
模块2、集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;
模块3、根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签。
所述的基于检索辅助的谣言检测系统,其中该模块2包括:
模块21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度,并根据相似度大小排序,选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言,其中k为正整数;
且该权重赋予的模块为:
第i条相似谣言权重计算模块如下:
i=1,2,3,…,k
其中wi为第i条相似谣言的权重,e(·)为指数运算操作。
所述的基于检索辅助的谣言检测系统,其中该辅助谣言检测结果的计算模块如下:
其中li表示第i条相似谣言的谣言标签,α为该辅助谣言检测结果;
模块3中该对象信息的谣言标签计算模块如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为该初步谣言检测结果,sigmoid(·)为激活函数,f(ω)为类别标签计算函数。
所述的基于检索辅助的谣言检测系统,其中还包括:模块4、将该对象信息的谣言标签通过人工复核认证后,追加到该谣言库中,以动态维护该谣言库。
由以上方案可知,本发明的优点在于:
由于基于检索辅助的谣言检测方法提出,本发明与现有发明方法相比,在谣言判别的准确度上有了更高的识别精度。以往的自动谣言检测系统往往单纯的依赖于算法判定,当当前待测信息所包含的信息特征较少时,其判定算法往往难以给出准确度判定结果。不同与此,本发明提出的基于检索辅助的谣言检测方法在利用算法自动判定的同时在系统的历史谣言库中检索相关谣言,并利用相关谣言的判定结果辅助判定当前信息。是的本发明在判定谣言的过程中具有更高的识别准确度。
附图说明
图1为本发明基于检索辅助的谣言检测系统框架图。
具体实施方式
本发明的目的是提供一种基于检索辅助的谣言检测系统,主要解决的问题是,如何利用相似的历史谣言信息来辅助判别当前谣言的真假,以提高自动检测谣言系统的识别准确度。
主要包括:
1、相关谣言检索:相关谣言即当前信息在谣言历史库中的相似样本,为当前信息的谣言判定提供辅助判定信息。相关谣言检索的质量直接决定了其提供的辅助判定信息的质量,越准确地相关谣言检索质量其能提供的辅助判定信息越优秀,从而使谣言检测系统的判定准确率越高。
2、相关谣言提供辅助判别:本发明在检索出相关谣言后,对相关谣言进行排序过滤。筛选出与待检索信息最相似的k条谣言并对其赋予不同的权重,相关谣言标签的加权和为待检测信息提供辅助判定信息。
3、综合判定与更新谣言库:在本发明中,系统对待测信息的判定是综合算法判定结果与相关谣言的辅助判别信息共同判定的。两种判定结果通过加权的方式融合,作为最终的系统判定结果。该结果经过人工复核后添加到历史谣言库中,为后续信息判别提供辅助依据。
为让本发明的上述特征和效果能阐述的更明确易懂,下文特举实施例,并配合说明书附图作详细说明如下。
一、相关谣言检索
相关谣言检索是本发明核心发明点。在这一部分中,使用信息检索技术从既有历史谣言库中检索与当前待检测信息相关度最高的若干条相似新闻作为辅助判别信息。信息检索技术是从大规模非结构化数据中进行快速检索的一门技术,例如百度、谷歌等搜索引擎均为信息检索技术的应用。值得说明的是,本发明重点关注在利用信息检索技术来查询相关谣言信息,而非构建一套信息检索系统。因此在相关检索谣言部分使用开源的信息检索模型框架来完成相应任务。且该历史谣言库可以使本地私有数据库,也可以是开源的公共数据库,现有的公开谣言数据库例如有LairLairPantsonfire。
具体来说,根据信息检索流程,相关谣言检索分为以下几步:
1、抽取待检测谣言关键词;
2、在历史谣言库中检索关键词,并计算历史谣言库中谣言文本与关键词之间的相似度;
3、根据相似度大小排序,返回相关结果与相似度值γ。
二、相关谣言提供辅助判别
利用信息检索方法在既有历史谣言库中筛选出与待测信息相关的历史谣言后,依照相关程度为这些相似谣言排序,并筛选出相似度γ大于阈值θ的n条相似谣言,取其前k条,当不足k条时无需补齐。不同相关度的谣言所能提供的辅助信息也不同,因此本发明为每条相似谣言赋予不同的权重,具体第i条相似谣言权重wi计算方法如下:
其中i表示该谣言在相关谣言排序中的位置(i=1,2,3,…,k),e(·)为指数运算操作。
k条相关谣言信息提供的辅助判别信息α表示为:
其中li表示第i个相关谣言的标签,例如li=1表示该谣言被验证为真实信息,li=-1表示该谣言被验证为虚假信息。α∈[-1,1]表示相关谣言对当前待检测信息支持程度的大小,当α=1时支持力度最大,表示相关谣言认为当前待测信息大概率为真实信息;当α=-1时支持力度最小,表示相关谣言认为当前待测信息大概率为虚假信息;当α=0时表示相关谣言无法为当前待测信息提供有效的辅助信息。
三、综合判定与更新谣言库
本系统通过综合算法判定结果与辅助判定结果对待测信息进行综合判定,其判定方式如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为算法辅助判定结果(初步谣言检测结果),f(ω)为类别标签计算函数,负责将综合判定结果映射为-1或+1,-1表示虚假信息,0表示真实信息。sigmoid(·)为激活函数,待对待测信息的综合检测结果产生后,进一步通过人工复核认证,并将人工复核认证结果追加到历史谣言库中,动态维护历史谣言库。
以下为与上述方法实施例对应的系统实施例,本实施方式可与上述实施方式互相配合实施。上述实施方式中提到的相关技术细节在本实施方式中依然有效,为了减少重复,这里不再赘述。相应地,本实施方式中提到的相关技术细节也可应用在上述实施方式中。
本发明还提出了一种基于检索辅助的谣言检测系统,其中包括:
模块1、获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;
模块2、集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;
模块3、根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签。
所述的基于检索辅助的谣言检测系统,其中该模块2包括:
模块21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度,并根据相似度大小排序,选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言,其中k为正整数;
且该权重赋予的模块为:
第i条相似谣言权重计算模块如下:
i=1,2,3,…,k
其中wi为第i条相似谣言的权重,e(·)为指数运算操作。
所述的基于检索辅助的谣言检测系统,其中该辅助谣言检测结果的计算模块如下:
其中li表示第i条相似谣言的谣言标签,α为该辅助谣言检测结果;
模块3中该对象信息的谣言标签计算模块如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为该初步谣言检测结果,sigmoid(·)为激活函数,f(ω)为类别标签计算函数。
所述的基于检索辅助的谣言检测系统,其中还包括:模块4、将该对象信息的谣言标签通过人工复核认证后,追加到该谣言库中,以动态维护该谣言库。
Claims (4)
1.一种基于检索辅助的谣言检测方法,其特征在于,包括:
步骤1、获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;
步骤2、集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;
步骤3、根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签;
其中,该步骤2包括:
步骤21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度,并根据相似度大小排序,选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言,其中k为正整数;
该权重赋予的方法为:
第i条相似谣言权重计算方法如下:
其中wi为第i条相似谣言的权重,e(·)为指数运算操作;
该辅助谣言检测结果的计算方法如下:
其中li表示第i条相似谣言的谣言标签,α为该辅助谣言检测结果;
步骤3中该对象信息的谣言标签计算方法如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为该初步谣言检测结果,sigmoid(·)为激活函数,f(ω)为类别标签计算函数。
2.如权利要求1所述的基于检索辅助的谣言检测方法,其特征在于,还包括:步骤4、将该对象信息的谣言标签通过人工复核认证后,追加到该谣言库中,以动态维护该谣言库。
3.一种基于检索辅助的谣言检测系统,其特征在于,包括:
模块1、获取待谣言检测的对象信息,并使用谣言检测算法对该对象信息进行判定,得到该对象信息的初步谣言检测结果;
模块2、集合已标记谣言标签的谣言信息作为谣言库,抽取得到该对象信息的关键词,以该关键词检索该谣言库,得到该谣言库中与该对象信息相似的多条相似谣言,计算每一条该相似谣言与该对象信息之间的相似度,以为每一条该相似谣言赋予权重,并根据每一条该相似谣言的谣言标签和权重,加权求和得到该多条相似谣言的辅助谣言检测结果;
模块3、根据该初步谣言检测结果和该辅助谣言检测结果,综合判定该对象信息的谣言标签;
其中,该模块2包括:
模块21、根据该关键词得到该谣言库中谣言信息与该对象信息的相似度,并根据相似度大小排序,选取排序中相似度大于阈值的前k条谣言信息作为该多条相似谣言,其中k为正整数;
且该权重赋予的模块为:
第i条相似谣言权重计算模块如下:
其中wi为第i条相似谣言的权重,e(·)为指数运算操作;
该辅助谣言检测结果的计算模块如下:
其中li表示第i条相似谣言的谣言标签,α为该辅助谣言检测结果;
模块3中该对象信息的谣言标签计算模块如下:
ω=0.5*α+0.5*β
l=f(ω)
f(ω)=2*sigmoid(ω)-1
其中β为该初步谣言检测结果,sigmoid(·)为激活函数,f(ω)为类别标签计算函数。
4.如权利要求3所述的基于检索辅助的谣言检测系统,其特征在于,还包括:模块4、将该对象信息的谣言标签通过人工复核认证后,追加到该谣言库中,以动态维护该谣言库。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910341053.2A CN110188284B (zh) | 2019-04-25 | 2019-04-25 | 一种基于检索辅助的谣言检测方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910341053.2A CN110188284B (zh) | 2019-04-25 | 2019-04-25 | 一种基于检索辅助的谣言检测方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110188284A CN110188284A (zh) | 2019-08-30 |
CN110188284B true CN110188284B (zh) | 2022-01-28 |
Family
ID=67715102
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910341053.2A Active CN110188284B (zh) | 2019-04-25 | 2019-04-25 | 一种基于检索辅助的谣言检测方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110188284B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105787101A (zh) * | 2016-03-18 | 2016-07-20 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN106294346A (zh) * | 2015-05-13 | 2017-01-04 | 厦门美柚信息科技有限公司 | 一种论坛帖子识别方法及装置 |
CN108038240A (zh) * | 2017-12-26 | 2018-05-15 | 武汉大学 | 基于内容、用户多因素分析的社交网络谣言检测方法 |
CN109271425A (zh) * | 2018-09-30 | 2019-01-25 | 北京字节跳动网络技术有限公司 | 构建谣言数据库的方法、分析谣言数据的方法及电子设备 |
CN109388696A (zh) * | 2018-09-30 | 2019-02-26 | 北京字节跳动网络技术有限公司 | 删除谣言文章的方法、装置、存储介质及电子设备 |
CN110032733A (zh) * | 2019-03-12 | 2019-07-19 | 中国科学院计算技术研究所 | 一种针对新闻长文本的谣言检测方法及系统 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6993515B2 (en) * | 2001-09-17 | 2006-01-31 | Coemergence Inc. | Intelligence system and a method of generating flags for use therein |
CN108319630B (zh) * | 2017-07-05 | 2021-12-14 | 腾讯科技(深圳)有限公司 | 信息处理方法、装置、存储介质和计算机设备 |
-
2019
- 2019-04-25 CN CN201910341053.2A patent/CN110188284B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106294346A (zh) * | 2015-05-13 | 2017-01-04 | 厦门美柚信息科技有限公司 | 一种论坛帖子识别方法及装置 |
CN105787101A (zh) * | 2016-03-18 | 2016-07-20 | 联想(北京)有限公司 | 一种信息处理方法和电子设备 |
CN108038240A (zh) * | 2017-12-26 | 2018-05-15 | 武汉大学 | 基于内容、用户多因素分析的社交网络谣言检测方法 |
CN109271425A (zh) * | 2018-09-30 | 2019-01-25 | 北京字节跳动网络技术有限公司 | 构建谣言数据库的方法、分析谣言数据的方法及电子设备 |
CN109388696A (zh) * | 2018-09-30 | 2019-02-26 | 北京字节跳动网络技术有限公司 | 删除谣言文章的方法、装置、存储介质及电子设备 |
CN110032733A (zh) * | 2019-03-12 | 2019-07-19 | 中国科学院计算技术研究所 | 一种针对新闻长文本的谣言检测方法及系统 |
Non-Patent Citations (2)
Title |
---|
Automatic Rumor Detection on Microblogs: A Survey;Juan Cao 等;《arXiv:1807.03505v1》;20180731;第1-12页 * |
融合多模态特征的社会多媒体谣言检测技术研究;金志威 等;《南京信息工程大学学报(自然科学版)》;20171128;第9卷(第6期);第583-592页 * |
Also Published As
Publication number | Publication date |
---|---|
CN110188284A (zh) | 2019-08-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107577688B (zh) | 基于媒体信息采集的原创文章影响力分析系统 | |
CN112347244B (zh) | 基于混合特征分析的涉黄、涉赌网站检测方法 | |
CN106156372B (zh) | 一种互联网网站的分类方法及装置 | |
KR102213670B1 (ko) | 약물-표적 상호 작용 예측을 위한 방법 | |
CN108733791B (zh) | 网络事件检测方法 | |
CN106202124A (zh) | 网页分类方法及装置 | |
CN1637744A (zh) | 为在大量电子文档中搜索而确定文档相关性的机器学习方法 | |
JP7103496B2 (ja) | 関連スコア算出システム、方法およびプログラム | |
CN109960727A (zh) | 针对非结构化文本的个人隐私信息自动检测方法及系统 | |
CN112749328B (zh) | 搜索方法、装置和计算机设备 | |
CN112528022A (zh) | 主题类别对应的特征词提取和文本主题类别识别方法 | |
CN110910175A (zh) | 一种旅游门票产品画像生成方法 | |
CN107451120B (zh) | 一种公开文本情报的内容冲突检测方法及系统 | |
TWI556128B (zh) | Forensic system, forensic method and evidence collection program | |
CN107480126B (zh) | 一种工程材料类别智能识别方法 | |
KR101158750B1 (ko) | 문서분류장치 및 그것의 문서분류방법 | |
CN110188284B (zh) | 一种基于检索辅助的谣言检测方法及系统 | |
CN116069674B (zh) | 一种用于等级测评的安全评估方法及系统 | |
CN108763242B (zh) | 标签生成方法及装置 | |
JP2007317133A (ja) | 画像分類方法及び装置及びプログラム | |
CN109446330B (zh) | 网络服务平台情感倾向识别方法、装置、设备和存储介质 | |
CN114925759A (zh) | 一种以太坊钓鱼行为账户的特征分析方法 | |
CN110633466B (zh) | 基于语义分析的短信犯罪识别方法、系统和可读存储介质 | |
CN113220843A (zh) | 确定信息关联关系的方法、装置、存储介质和设备 | |
Keskin et al. | Cohort fertility heterogeneity during the fertility decline period in Turkey |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20231219 Address after: Room 1005, 10th Floor, No. 27 Zhichun Road, Haidian District, Beijing, 100088 Patentee after: Hangzhou Zhongke Ruijian Technology Co.,Ltd. Address before: 100080 No. 6 South Road, Zhongguancun Academy of Sciences, Beijing, Haidian District Patentee before: Institute of Computing Technology, Chinese Academy of Sciences |
|
TR01 | Transfer of patent right |