CN103927297A - 基于证据理论的中文微博可信度评估方法 - Google Patents

基于证据理论的中文微博可信度评估方法 Download PDF

Info

Publication number
CN103927297A
CN103927297A CN201410149429.7A CN201410149429A CN103927297A CN 103927297 A CN103927297 A CN 103927297A CN 201410149429 A CN201410149429 A CN 201410149429A CN 103927297 A CN103927297 A CN 103927297A
Authority
CN
China
Prior art keywords
factor
confidence level
information
microblogging
subjective
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410149429.7A
Other languages
English (en)
Other versions
CN103927297B (zh
Inventor
高明霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Changsha liuteng Technology Co.,Ltd.
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201410149429.7A priority Critical patent/CN103927297B/zh
Publication of CN103927297A publication Critical patent/CN103927297A/zh
Application granted granted Critical
Publication of CN103927297B publication Critical patent/CN103927297B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于信息检索与评估领域,具体涉及基于证据理论的中文微博可信度评估方法。本发明从中文微博的固有特点入手,兼顾了这些特点的可测量性和实际任务,系统地梳理了中文微博信息的可信度测量指标,并将其归属为文本信息、信息来源与信息传播三个高层维度。考虑到人类认知的模糊性本质,提出一个基于多维证据的微博可信度评估方法用于融合上述三个异构维度。与现有的仅针对网络文本或互连关系的单一特征评估方法比较,基于证据理论的中文微博可信度评估方法考虑更全面、合理,在同样的查询条件下,可以优选哪些来源可靠,传播广泛的信息。

Description

基于证据理论的中文微博可信度评估方法
技术领域
基于证据理论的中文微博可信度评估方法属于信息检索与评估领域。
背景技术
最近几年,社会媒体得到迅猛发展,特别是微博,如美国的推特(Twitter)、中国的新浪微博、腾讯微博等,已发展成为互联网上的巨擘。中国互联网络信息中心(CNNIC)于2012年7月发布的《第30次中国互联网络发展状况统计报告》显示,截至2012年6月底,我国微博用户数达到2.74亿,微博的渗透率已经过半,而且微博在手机端的增长幅度仍然明显,增速达到24.2%。根据中国互联网调查社区(http://h.cnnicresearch.cn/sv/result/sid/22253)2013年1月13日完成的关于“社会化媒体使用率的调查”结果显示,微博(73.46%)已经取代“即时聊天工具”(66.93%)、搜索引擎(61.64%)、官方网站(56.64%)成为大众接触最多的社会媒体。
随着微博的蓬勃发展而带来的一大隐患,就是用户对微博内容的真实性和价值越来越难以判断。这主要是由微博内容的固有特点造成的。和其他社会媒体相似,微博的最大特点依然是媒体内容产生于用户(UGC,用户创造内容)和消费者(CGM,消费者产生媒体)。而且比起强调版面布置的博客来说,微博内容更简短、零碎,微博书写更随意、自由。正是由于微博内容的创造者自由度很大,没有编辑条款限制,使得微博上的信息质量差异很大。而且,由于信息的随便发布,群体的话语暴力,不负责任的非理性表达,也使得微博成为了众多网络谣言的发源地。因此,针对微博在信息书写、信息传播、社会网络分析等方面的固有特点,分析、评估微博内容、微博用户,并将其应用于微博信息综合或垂直搜索、微博知识发现等领域的研究,已经引起了国内外计算机科学、信息科学、传媒科学领域研究人员的关注和重视,成为微博研究领域的重要内容之一。
由于时间因素,目前对微博质量的研究实例大多集中于推特(Twitter)分析,这些研究可以分为两类,一类是利用传统分类技术的定性分析,这类研究需要大量样本,获取的是非数值结论,无法用于定量评估;另一类是针对不同性能指标的一些定量算法,只是现有质量评估函数多数只关注信息本身或某一侧面,缺少系统、全面地分析和评估,更没有从模糊认知的角度进行度量。目前针对中文微博质量分析的研究多数集中于内容分析和特定主题提取,缺少专门针对质量进行定量评估的系统方法。
发明内容
本发明从中文微博的固有特点入手,兼顾了这些特点的可测量性和实际任务,系统地梳理了中文微博信息的可信度测量指标,并将其归属为文本信息、信息来源与信息传播三个高层维度,考虑到人类认知的模糊性本质,提出一个基于多维证据的微博可信度评估方法用于融合上述三个异构维度,具体流程如图1所示。与现有的仅针对网络文本或互连关系的单一特征评估方法比较,基于证据理论的中文微博可信度评估方法考虑更全面、合理,在同样的查询条件下,可以优选哪些来源可靠,传播广泛的信息。本发明提供的中文微博可信度评估方法,具体步骤如下:
步骤1:预处理,将从各微博平台获取的Json格式微博,通过格式解析形成有效数据,然后借助现有的自然语言处理工具,对有效数据中的微博文本进行分词、词性标注、图标检测、错误词检测、重复标点检测等预处理工作,并统计相关数据;
步骤2:文本信息的可信度测量,信息本身的可信度可以从客观和主观两个方面入手考察,客观因素主要包括句法、语法、语气和语义四个层面,前两个层面,考虑了文本长度Slength和拼写错误Sspelling两个指标,具体计算方法如表1所示,表1同时列出了本发明考虑的和语气相关的三个因素分别是:图标Semoticons、重复标点Spunc以及正性词/负性词Sposi/neg,本发明将语义因素归结到任务相关领域,信息本身的可信度测量不涉及,影响文本信息可信度的主观因素反映的是其他用户对该文本质量的主观看法,通过分析主流中文微博平台数据,发现针对单个文本的可直接测量的主观因素有直接转贴数Sreposts和用户评论数Scomments,具体计算方法如表1所示;
本发明采用均值模式来分别融合客观因素和主观因素,然后再通过一个介于[0,1]之间的权重λ来控制客观和主观因素的相对权重,将各个影响因素的得分进行min-max标准化,计算方法如下:
v ′ = v - min max - min × ( max ′ - min ′ ) - - - ( 1 )
其中v是需要标准化的值,min与max是某一影响因素得分的最小值与最大值,min'与max'是标准化区间的最小最大值;
所述主观和客观综合可信度值的加权融合计算方法如下:
C post = λ [ 1 n Σ i = 1 n S i ext ( post ) ] + ( 1 - λ ) [ 1 n Σ i = 1 n S i sub ( post ) ] - - - ( 2 )
由于客观因素更重要,本发明设定λ=0.7,分别表示表1中各客观影响因素和各主观影响因素的标准化取值;
表1文本质量影响因素的计算方法
步骤3:信息来源的可信度测量,任何微博最初都是由人产生的,因此信息来源就是文本信息作者,微博用户可信度由他的客观日常行为和主观外部评价累积形成,可测量客观日常行为包括是否做过实名认证Φ,发布的文本信息总数Sposts,以及发布的高可信文本信息总数SHposts,而微博用户可测量外部评价包括追随者数目Sfellows,文本信息反馈情况Scomments,上述指标中,对作者影响最大的是是否实名认证,本发明将实名认证这一指标定义为一个二值函数[0,1],信息总数和高可信信息总数是两个关联指标,表2列出了这些指标的具体计算方法,作者可信度的加权综合融合方式计算方法如下:
C author = w aut × Φ + w ext × S Hposts S posts + w sub × [ 1 n Σ i = 1 n S i sub ( author ) ] - - - ( 3 )
其中是表2中主观影响因素的min-max标准化取值,waut、wext和wsub分别是认证因素、客观因素和主观因素的权重,为突出认证的重要性本发明权重比例设定waut:wext:wsub=5:3:2;
表2作者影响因素的计算方法
步骤4:信息传播的可信度测量,影响信息传播可信度的因素包括两项,一是时效,二是传播媒介,本发明将时效因素也归结到了任务相关领域,传播媒介对文本信息可信度的影响方式通过两种情况递增:一种是传播媒价中包含可信度高的名人;另外一种是传播媒介中节点数目庞大,这种提升趋向于一个确定的阈值。依据可信度递增规律,本发明定义了用于具体计算传播媒介对微博文本可信度的影响,计算方法如下:
C ptree = Σ i = 1 n μ i × C author - - - ( 4 )
其中Cauthoir是用户根据可信度值递减排序后得到的第i个传播者的可信度,μ<1是递减因子;
步骤5:基于多维证据理论的可信度融合评估,本发明对三个维度可信度检测结果进行合成,得到综合微博可信度的过程将采用改进的D-S证据理论方法对多个维度的基本概率分配函数进行合成,计算方法如下:
m ( φ ) = 0 m ( h ) = Π i = 1 n m i ( h ) + kq ( h ) m ( h ‾ ) = 1 - m ( h ) m ( Θ ) = 0 - - - ( 5 )
其中,辨识框架 Θ = { h , ⫬ h } , 幂集 2 Θ = { φ , { h } , { ⫬ h } , Θ } , φ表示不可能事件“微博信息既可信又不可信”,h表示“微博信息可信”,表示“微博信息不可信”,Θ表示“微博信息可信度无法评估”, q ( h ) = 1 n Σ i = 1 n m i ( h ) .
附图说明
图1中文微博可信度评估流程;
图2传播媒介的树形结构;
图3-(a)Json格式的新浪微博样本片段;
图3-(b)解析后获取的有效数据;
图4自然语言预处理后获取的文本信息相关值;
图5特定时间点收集到的样本微博的作者数据;
图6A的单层传播树。
具体实施方式
下面将结合附图和具体实施例对本发明进行详细说明。以下实施例中的微博是新浪微博中的个体样本。计算中文微博可信度的具体处理流程如下:
步骤1:预处理,依据图3-(a)所示是一个从新浪微博平台获取的Json格式微博样例A,图3-(b)是通过Json解析得到的A中对应有效数据。图4是通过自然语言处理工具和相关统计后获取的A的对应值。
步骤2:为待处理的微博文本计算可信度,有了A需要的统计数据,然后根据实际情况确定出各影响因子可能的最大/最小值后,表3中列出了A的具体计算值和对应的区间为[0,1]的标准化值。
表3A的影响因素值
最后根据公式(2)可以得到:
C post = 0.7 × [ 1 5 × ( 0.6 + 1 + 1 + 1 + 1 ) ] + 0.3 × [ 1 2 × ( 0.1561 + 0.159 ) ] = 0.6912
步骤3:计算微博来源可信度,微博来源也即微博作者,为了计算来源的影响因素,需要收集微博作者的相关信息,图5是特定时间点收集到的样本微博A的作者数据,其中标注为“统计:”的数据是需要计算后才能统计获取的,本例为了计算方便采用了人为设置。表4是计算值和标准化值。
表4A作者的影响因素值
最后根据公式(3)可以得到:
C author = 0.5 × 1 + 0.3 × 0.6734 + 0.2 × [ 1 2 × ( 0.4 + 0.176 ) ] = 0.7576
步骤4:计算信息传播的可信度,由于选取的微博样本A是最平常的信息,因此传播树高度只有一层如图6所示,使用和上一步骤同样的方式计算传播树中所有传播者的可信度,并根据可信度排序后,使用公式(4)就可以计算该传播树的可信度。假设7个作者的可信度值排序为:{0.85,0.78,0.7576,0.73,0.68,0.40,0.30},且μ=0.6,则A的传播可信度值为:
Cptree=0.6×0.85+0.62×0.78+0.63×0.7576+0.64×0.73+0.65×0.68+0.66×0.4+0.67×0.3≈1.14
假设min=0,max=2,则传播可信度值的标准化取值为:0.57。
步骤5:基于多维证据理论的可信度融合,有了上述文本、作者和传播分量后,获取的可信值可以直接作为概率值,因此根据多维证据合成公式可得到参数k和q(h),分别为:k=1-0.7576×0.6912×0.57-0.2424×0.3088×0.43=0.6693,q(h)=0.6729。
则:m(h)=0.7576×0.6912×0.57+0.6693×0.6729=0.7489
最后应说明的是:以上示例仅用以说明本发明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的示例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或等同替换;而一切不脱离发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。

Claims (1)

1.基于证据理论的中文微博可信度评估方法,其特征在于步骤如下:
步骤1:预处理,将从各微博平台获取的Json格式微博,通过格式解析形成有效数据,然后借助现有的自然语言处理工具,对有效数据中的微博文本进行分词、词性标注、图标检测、错误词检测、重复标点检测等预处理工作,并统计相关数据;
步骤2:文本信息的可信度测量,信息本身的可信度可以从客观和主观两个方面入手考察,客观因素主要包括句法、语法、语气和语义四个层面,前两个层面,考虑了文本长度Slength和拼写错误Sspelling两个指标,具体计算方法如表1所示,表1同时列出了本发明考虑的和语气相关的三个因素分别是:图标Semoticons、重复标点Spunc以及正性词/负性词Sposi/neg,本发明将语义因素归结到任务相关领域,信息本身的可信度测量不涉及;影响文本信息可信度的主观因素反映的是其他用户对该文本质量的主观看法,通过分析主流中文微博平台数据,发现针对单个文本的可直接测量的主观因素有直接转贴数Sreposts和用户评论数Scomments,具体计算方法如表1所示;
本发明采用均值模式来分别融合客观因素和主观因素,然后再通过一个介于[0,1]之间的权重λ来控制客观和主观因素的相对权重,将各个影响因素的得分进行min-max标准化,计算方法如下:
v ′ = v - min max - min × ( max ′ - min ′ )
其中v是需要标准化的值,min与max是某一影响因素得分的最小值与最大值,min'与max'是标准化区间的最小最大值;
所述主观和客观综合可信度值的加权融合计算方法如下:
C post = λ [ 1 n Σ i = 1 n S i ext ( post ) ] + ( 1 - λ ) [ 1 n Σ i = 1 n S i sub ( post ) ]
由于客观因素更重要,本发明设定λ=0.7,分别表示表1中各客观影响因素和各主观影响因素的标准化取值;
表1文本质量影响因素的计算方法
步骤3:信息来源的可信度测量,任何微博最初都是由人产生的,因此信息来源就是文本信息作者,微博用户可信度由他的客观日常行为和主观外部评价累积形成,可测量客观日常行为包括是否做过实名认证Φ,发布的文本信息总数Sposts,以及发布的高可信文本信息总数SHposts,而微博用户可测量外部评价包括追随者数目Sfellows,文本信息反馈情况Scomments,上述指标中,对作者影响最大的是是否实名认证,本发明将实名认证这一指标定义为一个二值函数[0,1],信息总数和高可信信息总数是两个关联指标,表2列出了这些指标的具体计算方法,作者可信度的加权综合融合方式计算方法如下:
C author = w aut × Φ + w ext × S Hposts S posts + w sub × [ 1 n Σ i = 1 n S i sub ( author ) ]
其中是表2中主观影响因素的min-max标准化取值,waut、wext和wsub分别是认证因素、客观因素和主观因素的权重,为突出认证的重要性本发明权重比例设定waut:wext:wsub=5:3:2;
表2作者影响因素的计算方法
步骤4:信息传播的可信度测量,影响信息传播可信度的因素包括两项,一是时效,二是传播媒介,本发明将时效因素也归结到了任务相关领域,传播媒介对文本信息可信度的影响方式通过两种情况递增:一种是传播媒价中包含可信度高的名人;另外一种是传播媒介中节点数目庞大,这种提升趋向于一个确定的阈值,依据可信度递增规律,本发明定义了用于具体计算传播媒介对微博文本可信度的影响,计算方法如下:
C ptree = Σ i = 1 n μ i × C author
其中Cauthoir是用户根据可信度值递减排序后得到的第i个传播者的可信度,μ<1是递减因子;
步骤5:基于多维证据理论的可信度融合评估,本发明对三个维度可信度检测结果进行合成,得到综合微博可信度的过程将采用改进的D-S证据理论方法对多个维度的基本概率分配函数进行合成,计算方法如下:
m ( φ ) = 0 m ( h ) = Π i = 1 n m i ( h ) + kq ( h ) m ( h ‾ ) = 1 - m ( h ) m ( Θ ) = 0
其中,辨识框架 Θ = { h , ⫬ h } , 幂集 2 Θ = { φ , { h } , { ⫬ h } , Θ } , φ表示不可能事件“微博信息既可信又不可信”,h表示“微博信息可信”,表示“微博信息不可信”,Θ表示“微博信息可信度无法评估”, k = 1 - Π i = 1 n m i ( h ) - Π i = 1 n m i ( h ‾ ) , q ( h ) = 1 n Σ i = 1 n m i ( h ) .
CN201410149429.7A 2014-04-13 2014-04-13 基于证据理论的中文微博可信度评估方法 Active CN103927297B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410149429.7A CN103927297B (zh) 2014-04-13 2014-04-13 基于证据理论的中文微博可信度评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410149429.7A CN103927297B (zh) 2014-04-13 2014-04-13 基于证据理论的中文微博可信度评估方法

Publications (2)

Publication Number Publication Date
CN103927297A true CN103927297A (zh) 2014-07-16
CN103927297B CN103927297B (zh) 2017-02-15

Family

ID=51145520

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410149429.7A Active CN103927297B (zh) 2014-04-13 2014-04-13 基于证据理论的中文微博可信度评估方法

Country Status (1)

Country Link
CN (1) CN103927297B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104134004A (zh) * 2014-07-31 2014-11-05 哈尔滨工程大学 一种基于d-s证据理论的海洋环境安全评估方法
CN104239472A (zh) * 2014-09-03 2014-12-24 百度在线网络技术(北京)有限公司 对象信息的提供方法和装置
CN104572807A (zh) * 2014-10-29 2015-04-29 中国科学院计算技术研究所 一种基于微博信息源的新闻认证方法及系统
CN104899800A (zh) * 2015-06-18 2015-09-09 上海梓逊网络科技有限公司 呼叫中心b2b信息交流平台
CN105046533A (zh) * 2015-08-07 2015-11-11 北京品友互动信息技术有限公司 一种分析信息投放影响因素的方法和装置
CN106815257A (zh) * 2015-12-01 2017-06-09 阿里巴巴集团控股有限公司 一种用户可信度的计算方法及装置
CN108415895A (zh) * 2017-02-09 2018-08-17 腾讯科技(北京)有限公司 媒体内容纠错方法和装置
CN108710999A (zh) * 2018-05-03 2018-10-26 上海电机学院 一种基于大数据环境下共享资源的可信度自动评估方法
CN108780660A (zh) * 2016-02-29 2018-11-09 皇家飞利浦有限公司 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法
CN110223092A (zh) * 2018-03-01 2019-09-10 北京京东尚科信息技术有限公司 选品方法、装置和计算机可读存储介质
CN110347800A (zh) * 2019-07-15 2019-10-18 中国工商银行股份有限公司 文本处理方法和装置、以及电子设备和可读存储介质
CN111160749A (zh) * 2019-12-23 2020-05-15 北京神州绿盟信息安全科技股份有限公司 一种情报质量评估和情报融合方法及装置
CN112989816A (zh) * 2021-04-20 2021-06-18 中译语通科技股份有限公司 文本内容质量评估方法及系统
CN116401339A (zh) * 2023-06-07 2023-07-07 北京百度网讯科技有限公司 数据处理方法、装置、电子设备、介质以及程序产品

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090187979A1 (en) * 2008-01-19 2009-07-23 Sever Gil Method and apparatus for global unique identifier, including id database
CN103117891A (zh) * 2013-01-18 2013-05-22 武汉大学 微博平台上的僵尸用户探测方法
CN103136330A (zh) * 2013-01-04 2013-06-05 武汉大学 基于微博平台的用户可信度评估方法
US20130151641A1 (en) * 2011-06-10 2013-06-13 Lucas J. Myslinski Method of and system for fact checking email
CN103177084A (zh) * 2013-02-21 2013-06-26 浙江工商大学 一种考虑数据可信度的数据挖掘方法
CN103222256A (zh) * 2012-11-13 2013-07-24 华为技术有限公司 实现微博彩铃业务的方法、装置及系统
US20130346178A1 (en) * 2012-06-22 2013-12-26 Ith Corporation Method and system for providing coupon in connection with social networking service
WO2014003735A1 (en) * 2012-06-27 2014-01-03 Empire Technology Development Llc Determining reliability of online post

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090187979A1 (en) * 2008-01-19 2009-07-23 Sever Gil Method and apparatus for global unique identifier, including id database
US20130151641A1 (en) * 2011-06-10 2013-06-13 Lucas J. Myslinski Method of and system for fact checking email
US20130346178A1 (en) * 2012-06-22 2013-12-26 Ith Corporation Method and system for providing coupon in connection with social networking service
WO2014003735A1 (en) * 2012-06-27 2014-01-03 Empire Technology Development Llc Determining reliability of online post
CN103222256A (zh) * 2012-11-13 2013-07-24 华为技术有限公司 实现微博彩铃业务的方法、装置及系统
CN103136330A (zh) * 2013-01-04 2013-06-05 武汉大学 基于微博平台的用户可信度评估方法
CN103117891A (zh) * 2013-01-18 2013-05-22 武汉大学 微博平台上的僵尸用户探测方法
CN103177084A (zh) * 2013-02-21 2013-06-26 浙江工商大学 一种考虑数据可信度的数据挖掘方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
张连帅: "微博数据分析中的若干关键问题研究", 《中国万方学位论文全文数据库》 *
赵宗贵等: "D-S证据理论中冲突证据的合成方法", 《电子科技大学学报》 *
高雅: "微博新闻事件信息可信度评价", 《中国优秀硕士学位论文全文数据库 信息科技辑》 *

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104134004A (zh) * 2014-07-31 2014-11-05 哈尔滨工程大学 一种基于d-s证据理论的海洋环境安全评估方法
CN104134004B (zh) * 2014-07-31 2017-10-27 哈尔滨工程大学 一种基于d‑s证据理论的海洋环境安全评估方法
CN104239472B (zh) * 2014-09-03 2018-11-06 百度在线网络技术(北京)有限公司 对象信息的提供方法和装置
CN104239472A (zh) * 2014-09-03 2014-12-24 百度在线网络技术(北京)有限公司 对象信息的提供方法和装置
CN104572807A (zh) * 2014-10-29 2015-04-29 中国科学院计算技术研究所 一种基于微博信息源的新闻认证方法及系统
CN104572807B (zh) * 2014-10-29 2018-02-06 中国科学院计算技术研究所 一种基于微博信息源的新闻认证方法及系统
CN104899800A (zh) * 2015-06-18 2015-09-09 上海梓逊网络科技有限公司 呼叫中心b2b信息交流平台
CN105046533A (zh) * 2015-08-07 2015-11-11 北京品友互动信息技术有限公司 一种分析信息投放影响因素的方法和装置
CN106815257A (zh) * 2015-12-01 2017-06-09 阿里巴巴集团控股有限公司 一种用户可信度的计算方法及装置
CN108780660A (zh) * 2016-02-29 2018-11-09 皇家飞利浦有限公司 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法
CN108780660B (zh) * 2016-02-29 2023-10-20 皇家飞利浦有限公司 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法
CN108415895B (zh) * 2017-02-09 2023-04-07 腾讯科技(北京)有限公司 媒体内容纠错方法和装置
CN108415895A (zh) * 2017-02-09 2018-08-17 腾讯科技(北京)有限公司 媒体内容纠错方法和装置
CN110223092A (zh) * 2018-03-01 2019-09-10 北京京东尚科信息技术有限公司 选品方法、装置和计算机可读存储介质
CN108710999A (zh) * 2018-05-03 2018-10-26 上海电机学院 一种基于大数据环境下共享资源的可信度自动评估方法
CN110347800B (zh) * 2019-07-15 2022-06-10 中国工商银行股份有限公司 文本处理方法和装置、以及电子设备和可读存储介质
CN110347800A (zh) * 2019-07-15 2019-10-18 中国工商银行股份有限公司 文本处理方法和装置、以及电子设备和可读存储介质
CN111160749A (zh) * 2019-12-23 2020-05-15 北京神州绿盟信息安全科技股份有限公司 一种情报质量评估和情报融合方法及装置
CN111160749B (zh) * 2019-12-23 2023-07-21 绿盟科技集团股份有限公司 一种情报质量评估和情报融合方法及装置
CN112989816A (zh) * 2021-04-20 2021-06-18 中译语通科技股份有限公司 文本内容质量评估方法及系统
CN112989816B (zh) * 2021-04-20 2021-10-01 中译语通科技股份有限公司 文本内容质量评估方法及系统
CN116401339A (zh) * 2023-06-07 2023-07-07 北京百度网讯科技有限公司 数据处理方法、装置、电子设备、介质以及程序产品

Also Published As

Publication number Publication date
CN103927297B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
CN103927297A (zh) 基于证据理论的中文微博可信度评估方法
de Oliveira et al. Identifying fake news on social networks based on natural language processing: trends and challenges
Dahal et al. Topic modeling and sentiment analysis of global climate change tweets
Varshney et al. A review on rumour prediction and veracity assessment in online social network
Priya et al. Where should one get news updates: Twitter or Reddit
Morstatter et al. A new approach to bot detection: striking the balance between precision and recall
Mejova et al. GOP primary season on twitter: " popular" political sentiment in social media
Popat Assessing the credibility of claims on the web
JP6007088B2 (ja) 大量のコメント文章を用いた質問回答プログラム、サーバ及び方法
Kherwa et al. An approach towards comprehensive sentimental data analysis and opinion mining
US20140040301A1 (en) Real-time and adaptive data mining
CN103544255A (zh) 基于文本语义相关的网络舆情信息分析方法
CN103268350A (zh) 一种互联网舆情信息监测系统及监测方法
US9069880B2 (en) Prediction and isolation of patterns across datasets
Xu et al. Wikipedia‐based topic clustering for microblogs
CN102169496A (zh) 基于锚文本分析的领域术语自动生成方法
CN103577404A (zh) 一种面向微博的全新突发事件发现方法
JP5435249B2 (ja) イベント分析装置、イベント分析方法、およびプログラム
Kibanov et al. Is web content a good proxy for real-life interaction? A case study considering online and offline interactions of computer scientists
Wang et al. Who are in the darknet? Measurement and analysis of darknet person attributes
Aamir et al. Trust in social-sensor cloud service
CN105677906A (zh) 网络事件自动搜集分析系统及方法
Kumar et al. A hybrid data-driven framework for spam detection in online social network
US10430473B2 (en) Deep mining of network resource references
Peng et al. Trending sentiment-topic detection on twitter

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210916

Address after: 100089 Beijing Haidian District 2 Huayuan Road peony Venture Building 4 floor 1424 room

Patentee after: Beijing Zhonglian Technology Service Co.,Ltd.

Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing

Patentee before: Beijing University of Technology

Effective date of registration: 20210916

Address after: D080-3, 13th floor, 13 / F, Wanjiali International Mall project, No.99, Section 1, Wanjiali Middle Road, dongtundu street, Furong district, Changsha City, Hunan Province, 410000

Patentee after: Changsha liuteng Technology Co.,Ltd.

Address before: 100089 Beijing Haidian District 2 Huayuan Road peony Venture Building 4 floor 1424 room

Patentee before: Beijing Zhonglian Technology Service Co.,Ltd.