CN104166726B - 一种面向微博文本流的突发关键词检测方法 - Google Patents

一种面向微博文本流的突发关键词检测方法 Download PDF

Info

Publication number
CN104166726B
CN104166726B CN201410424542.1A CN201410424542A CN104166726B CN 104166726 B CN104166726 B CN 104166726B CN 201410424542 A CN201410424542 A CN 201410424542A CN 104166726 B CN104166726 B CN 104166726B
Authority
CN
China
Prior art keywords
mrow
keyword
burst
user
mtd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410424542.1A
Other languages
English (en)
Other versions
CN104166726A (zh
Inventor
杨武
董国忠
王巍
苘大鹏
玄世昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201410424542.1A priority Critical patent/CN104166726B/zh
Publication of CN104166726A publication Critical patent/CN104166726A/zh
Application granted granted Critical
Publication of CN104166726B publication Critical patent/CN104166726B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing

Abstract

本发明涉及互联网信息管理领域,尤其涉及一种面向微博文本流的突发关键词检测方法。本发明包括:实时采集微博数据,针对实时微博数据流建立基于动态滑动窗口机制的消息会话模型;从消息会话模型中抽取用户信任属性,根据设定的信任窗口大小构建动态信任模型,计算用户的信任度;根据设定的消息窗口大小对实时微博消息流进行切分,融合用户信任度计算每个时间窗口中关键词的权重,形成突发关键词的权重序列;针对突发关键词的权重序列,采用基于动力学模型的突发关键词发现算法计算关键词的突发权值,如果关键词的突发权值大于系统设定的突发阈值则该词为突发关键词。此方法能够降低人类作息时间的影响,提高检测突发关键词的准确度。

Description

一种面向微博文本流的突发关键词检测方法
技术领域
本发明涉及互联网信息管理领域,尤其涉及一种面向微博文本流的突发关键词检测方法。
背景技术
随着2006年Twitter正式上线以及Web2.0技术的快速发展,以互联网为载体的各种社交网络平台成为Web2.0时代最具代表性的应用,其中微博客(以下简称微博)作为其中主要的平台得到了广大网民的关注。国内包括新浪、腾讯、搜狐和网易等主要网络媒体平台自2009年开始分别推出各自的微博服务,微博正式进入中文上网主流人群视野。
目前微博以及成为网民获取信息的重要途径之一,微博从满足人们弱关系的社交需求上逐渐演变成为大众化的舆论平台,越来越多机构及公众人物都通过微博来发布或传播信息。由于微博的即时性、自主性以及互动性,使得许多非常规突发事件发生后,微博作为人们信息发布的主要载体为突发事件提供了第一传播平台,包括“2013年吉林省松原地震”以及“青岛石油管线爆炸”等突发事件,微博都是最早的信息来源。
微博中对于社会突发事件的报道和讨论对于危机应对和态势感知是有积极意义的,但是由于用户参与微博的技术门槛较低,用户自身素质良莠不齐,特别是微博用户中存在一些僵尸粉丝为了自身利益以人为外力作用的方式协同推动对消费者有蛊惑的虚假突发话题,这类话题一旦通过微博在短时间内不断被转发扩散,将会助长虚假突发话题的传播并产生极为不良的影响。微博已经成为互联网舆情形成的主要网络媒体之一,其中对突发话题的检测是网络舆情管理的重要目标之一,因此,突发关键词检测作为突发话题检测最重要的一个步骤显得尤为重要。
现有的微博突发关键词发现方法中未考虑僵尸粉丝在突发话题形成过程中的推动作用以及人类生活作息对突发关键词检测方法的准确度的影响,应用到实际微博舆情监管中可能将僵尸粉丝推动以及受人类生活作息影响较大的关键词误判为突发关键词从而导致较大的误报率、较低的检测率。
发明内容
本发明的目的是提供一种提高突发关键词检测率和准确度的面向微博文本流的突发关键词检测方法。
本发明的目的是这样实现的:
(1)实时采集微博数据,针对实时微博数据流建立基于动态滑动窗口机制的消息会话模型;
(2)从消息会话模型中抽取用户信任属性,根据设定的信任窗口大小构建动态信任模型,计算用户的信任度;
(3)根据设定的消息窗口大小对实时微博消息流进行切分,融合用户信任度计算每个时间窗口中关键词的权重,形成突发关键词的权重序列;
(4)针对突发关键词的权重序列,采用基于动力学模型的突发关键词发现算法计算关键词的突发权值,如果关键词的突发权值大于系统设定的突发阈值则该词为突发关键词。
动态滑动窗口机制为动态滑动信任窗口和动态滑动消息窗口。
消息会话模型中包括:
微博消息、微博用户以及关键词的关联操作;
针对实时消息流消息会话模型的更新以及删除操作。
在抽取用户信任属性之前还包括:
根据用户交互行为定义用户交互动作以及用户交互指数;
根据信任窗口内的用户交互动作建立用户交互图。
用户信任属性包括:
用户交互度以及用户交互质量。
在计算关键词的权重之前还包括:
对微博消息内容进行预处理,包括中文分词、标签的识别与提取、去停用词、提取名词和动词作为关键词。
在生成关键词的权重序列之前还包括:
根据用户作息时间以及关键词的历史权重值消除用户作息时间对突发关键词检测的影响。
基于动力学模型的突发关键词发现算法包括:
定义与形式化基于动力学的趋势分析指标对关键词权重序列进行处理。
本发明的有益效果在于:
1、本发明提出一个基于用户交互行为的信任模型,利用两个信任属性评估用户的信任度,融合此信任模型的突发关键词发现方法能够避免发现由僵尸粉丝推动的伪突发关键词。
2、本发明提出一个基于动力学模型的突发关键词发生方法,此方法能够降低人类作息时间的影响,提高检测突发关键词的准确度。
附图说明
图1是本发明提供的微博突发关键词检测的方法的流程图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部内容。
此方法利用信任模型对微博用户的交互行为进行可信度评估从而获取用户可信度,只有用户信任度高于设定信任阈值的可信用户的微博消息才可以作为基于动力学的突发关键词发现算法的输入,结合信任模型以及基于动力学的突发关键词发现算法检测微博中的突发关键词从而降低微博中僵尸粉丝以及人类生活作息时间的影响,快速准确的检测微博中的突发关键词。
为实现上诉发明目的,本发明提供一种面向微博文本流的突发关键词检测方法,该方法包括:
实时采集微博数据,针对实时微博数据流建立基于动态滑动窗口机制的消息会话模型;
从消息会话模型中抽取用户信任属性,根据设定的信任窗口大小构建动态信任模型,计算用户的信任度;
根据设定的消息窗口大小对实时微博消息流进行切分,融合用户信任度计算每个消息窗口中关键词的权重,形成突发关键词的权重序列;
针对突发关键词的权重序列,采用基于动力学模型的突发关键词发现算法计算关键词的突发权值,如果关键词的突发权值大于系统设定的突发阈值则该词为突发关键词。
进一步地,所述动态滑动窗口机制为动态滑动信任窗口和动态滑动消息窗口,并且根据突发关键词的检测精度和实时性角度考虑设定信任窗口以及消息窗口的大小。
进一步地,在所述的消息会话模型中包括:
微博消息、微博用户以及关键词的关联操作;
针对实时消息流消息会话模型的更新以及删除操作。
进一步地,在抽取用户信任属性之前还包括:
根据用户交互行为定义用户交互动作以及用户交互指数;
根据信任窗口内的用户交互动作建立用户交互图。
进一步地,所述用户信任属性包括:
用户交互度以及用户交互质量。
进一步地,在计算关键词的权重之前还包括:
对微博消息内容进行预处理,包括中文分词、标签的识别与提取、去停用词、提取名词和动词作为关键词。
进一步地,在生成关键词的权重序列之前还包括:
根据用户作息时间以及关键词的历史权重值消除用户作息时间对突发关键词检测的影响。
进一步地,所述基于动力学模型的突发关键词发现算法包括:
定义与形式化基于动力学的趋势分析指标对关键词权重序列进行处理。
图1是本发明实施例提供的面向微博文本流的突发关键词检测方法的实现流程图,该方法详述如下:
在步骤101中,实时采集微博数据,针对实时微博数据流建立基于动态滑动窗口机制的消息会话模型。
针对采集到的微博实时消息流的微博消息,对消息内容进行切分处理,并对切分结果进行处理,便于添加和删除,同时进行微博消息、用户和消息内容关联操作。由于微博消息流中微博消息更新速度快,方案中通过增量更新方法更新二部图中已有的边的权值,考虑不同窗口下的流特征模式增加淘汰机制,针对超过阈值时间没有更新的节点或者权值衰退为0的边进行删除操作。
在步骤102中,从消息会话模型中抽取用户信任属性,根据设定的滑动信任窗口大小构建动态社会信任模型,计算用户的信任度。
示例性地,在信任模型中从用户交互度以及用户交互质量两个信任属性对微博用户的可信度进行评估,在抽取用户信任属性之前,根据用户交互行为定义用户交互动作、用户交互图以及用户交互指数:
用户交互动作:对于用户ui和uj,如果ui与uj主动交互(评论、转发等行为)则称单向交互为主动交互,其中ui主动用户,uj为被动用户。当uj回应ui的主动交互(回复),则称其为被动交互,单向用户交互转变为双向用户交互。
用户交互图:用户交互图定义为无向有权图G=(U,E,W),用户交互图中U表示用户集合,E表示顶点之间有双向交互关系的边的集合,对于任意的wij∈W,wij表示用户ui和uj的交互次数。
用户交互指数:如果用户ui在用户交互图G中的至少有r个邻居节点,每个邻居节点至少有r次交互,则称用户ui的交互指数为r。
示例性地,在社会信任模型中利用滑动信任窗口机制根据被动交互的时间将用户的历史交互划分成M个信任窗口,每个窗口大小为Tt。用户动态社会信任模型主要由三部分构 成:用户交互度、用户交互质量以及用户交互演变,其量化指标如下:
⑴用户交互度
假设用户ui在信任窗口m的用户交互图表示为Gi,m,用户ui的双向交互数的计算公式如下:
其中Ui,m为用户ui的邻居节点集合,用户ui的交互度定义如下:
⑵用户交互质量
用户ui的交互质量计算公式如下:
其中I(i,m)表示用户ui在信任窗口m的交互指数。用户ui的交互质量在一定程度上反应了与用户ui有交互关系的用户质量。结合用户交互度和交互质量,用户在信任窗口m的信任值计算公式如下:
T(i,m)=λR(i,m)+(1-λ)D(i,m)
其中λ(0≤λ≤1)为调节因子,表示用户交互度和用户交互质量在计算用户信任值的不同权重。
⑶用户交互演变
由于用户的信任会随着时间不断变化,因此需要基于历史信任窗口的信任值建立长期动态信任模型。假设用户ui的历史信任值为T(i,m),其中1≤m≤M,M为最近的历史信任窗口数,历史信任窗口的信任值可以表示如下:
其中θM-n(0<θ≤1,1≤m≤M)表示第m个历史信任窗口的信任权重,当θ=1时,其表示历史信任窗口的平均值。
用户ui的长期信任由当前信任窗口和历史信任窗口的信任值共同决定,其动态信任值计算公式如下:
T(i)=α·T(i,m)+β·Ta(i)
其中α+β=1(0≤α≤1,0≤β≤1),α和β调节当前信任窗口与历史信任窗口信任值的权重。
在步骤103中,根据设定的消息窗口大小对实时微博消息流进行切分,融合用户信任度计算每个消息窗口中关键词的权重,形成突发关键词的权重序列。
在滑动消息窗口模型中,根据实时微博消息流中的微博消息时间将消息划分到对应的微博窗口中,示例性地,第d天第k个微博窗口可以表示为:
其中,表示第d天第k个微博窗口,表示第d天第k个微博窗口的开始时间,Tm表示微博窗口的大小。
示例性地,融合用户信任度的关键词在微博消息中的权重计算公式如下:
其中,w表示消息窗口中的关键词,ms表示消息窗口中的微博消息,表示关键词w在标签中的词频,tfw表示关键词w在不在标签中的词频。由于在标签中的关键词在微博中的重要性高于不在标签中的关键词,调节因子γ为标签中关键词的调节因子,wti表示发布微博消息ms的用户i的可信度且其值由下式决定:
为了避免发现僵尸粉丝推动的伪突发关键词,在计算关键词权重过程中,去除用户i在对应信任窗口的信任度低于信任阈值的微博消息,关键词w在微博窗口中的权重计算公式可表示如下:
其中,表示关键词w在第d天第k个微博窗口的权重。
示例性地,为了降低人类生活作息对检测突发关键词准确度的影响,利用关键词在对应 的历史微博窗口的权重对当前微博窗口的关键词权重进行修正,关键词w在第d天第k个微博窗口的权重修正公式表示如下:
其中,表示关键词w在过去D天中第k个微博窗口的权重平均值,其计算公式如下:
综上所述,根据动态时间窗口选择机制,分析消息突发模式,在不同时间窗口内的关键词权重时考虑关键词在作息周期内对应历史时间窗口内的历史权重对关键词权重进行消除作息时间处理,关键词权重序列最终可以表示为:
其中,n代表时间窗口序号,代表关键词w在第n个时间窗口的权重,Ww表示关键词w的权重序列。
在步骤104中,针对突发关键词的权重序列,采用基于动力学模型的突发关键词发现算法计算关键词的突发权值,如果关键词的突发权值大于系统设定的突发阈值则该词为突发关键词。
示例性地,给定关键词的权重序列,提出一个基于动力学的趋势分析指标发现突发关键词,此方法能够在线性时间内发现突发关键词并且能够以在线方式运行。动力学模型中的基本概念定义如下:
指数移动平均值(EMA):对于每个时间窗口的变量x满足第n个时间窗口的指数移动平均值可以表示如下:
其中,EMAw(n)[x]t表示特征w在第n个窗口的指数移动平均值,εn为平滑因子,其值通常取为εn=2/(n+1)。
指数平滑异同移动平均值(MACD):特征w的短期(n1个时间窗口)与长期(n2个时间窗口)的指数平滑异同移动平均值可以表示如下:
MACDw(n1,n2)=EMAw(n1)-EMAw(n2)
基于以上定义,关键词w的突发权值可以由下式计算得出:
BSTw(n1,n2,n3)=MACDw(n1,n2)-EMAw(n3)[MACD(n1,n2)]
关键词w在每个时间窗口的突发权值序列可以表示如下:
如果关键词w在某个时间窗口的突发权值大于设定的突发阈值,则该关键词为突发关键词。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (4)

1.一种面向微博文本流的突发关键词检测方法,其特征在于,包括:
(1)实时采集微博数据,针对实时微博数据流建立基于动态滑动窗口机制的消息会话模型;
(2)从消息会话模型中抽取用户信任属性,根据设定的信任窗口大小构建动态信任模型,计算用户的信任度;
(3)根据设定的消息窗口大小对实时微博消息流进行切分,融合用户信任度计算每个时间窗口中关键词的权重,形成突发关键词的权重序列;
(4)针对突发关键词的权重序列,采用基于动力学模型的突发关键词发现算法计算关键词的突发权值,如果关键词的突发权值大于系统设定的突发阈值则该词为突发关键词;
所述动态滑动窗口机制为动态滑动信任窗口和动态滑动消息窗口;
在所述的消息会话模型中包括:
微博消息、微博用户以及关键词的关联操作;
针对实时消息流消息会话模型的更新以及删除操作;
在抽取用户信任属性之前还包括:
根据用户交互行为定义用户交互动作以及用户交互指数;根据信任窗口内的用户交互动作建立用户交互图;
用户交互度
设用户ui在信任窗口m的用户交互图表示为Gi,m,用户ui的双向交互数的计算公式如下:
<mrow> <mi>N</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>&amp;Element;</mo> <msub> <mi>U</mi> <mrow> <mi>i</mi> <mo>,</mo> <mi>m</mi> </mrow> </msub> </mrow> </munder> <msub> <mi>w</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> </mrow>
wij表示用户ui和uj的交互次数,其中Ui,m为用户ui的邻居节点集合,用户ui的交互度定义如下:
<mrow> <mi>D</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>N</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0.5</mn> </mtd> <mtd> <mrow> <mn>0</mn> <mo>&lt;</mo> <mi>N</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>&amp;le;</mo> <mn>5</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <mi>N</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>&gt;</mo> <mn>5</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
用户交互质量
用户ui的交互质量计算公式如下:
<mrow> <mi>R</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0.5</mn> </mtd> <mtd> <mrow> <mn>0</mn> <mo>&lt;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>&amp;le;</mo> <mn>5</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>m</mi> <mo>)</mo> </mrow> <mo>&gt;</mo> <mn>5</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中I(i,m)表示用户ui在信任窗口m的交互指数;用户ui的交互质量在一定程度上反应了与用户ui有交互关系的用户质量;结合用户交互度和交互质量,用户在信任窗口m的信任值计算公式如下:
T(i,m)=λR(i,m)+(1-λ)D(i,m)
其中λ(0≤λ≤1)为调节因子,表示用户交互度和用户交互质量在计算用户信任值的不同权重。
2.根据权利要求1所述的一种面向微博文本流的突发关键词检测方法,其特征在于,在计算关键词的权重之前还包括:
对微博消息内容进行预处理,包括中文分词、标签的识别与提取、去停用词、提取名词和动词作为关键词。
3.根据权利要求1所述的一种面向微博文本流的突发关键词检测方法,其特征在于,在生成关键词的权重序列之前还包括:
根据用户作息时间以及关键词的历史权重值消除用户作息时间对突发关键词检测的影响。
4.根据权利要求1所述的一种面向微博文本流的突发关键词检测方法,其特征在于,所述基于动力学模型的突发关键词发现算法包括:
定义与形式化基于动力学的趋势分析指标对关键词权重序列进行处理。
CN201410424542.1A 2014-08-26 2014-08-26 一种面向微博文本流的突发关键词检测方法 Active CN104166726B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410424542.1A CN104166726B (zh) 2014-08-26 2014-08-26 一种面向微博文本流的突发关键词检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410424542.1A CN104166726B (zh) 2014-08-26 2014-08-26 一种面向微博文本流的突发关键词检测方法

Publications (2)

Publication Number Publication Date
CN104166726A CN104166726A (zh) 2014-11-26
CN104166726B true CN104166726B (zh) 2017-11-28

Family

ID=51910539

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410424542.1A Active CN104166726B (zh) 2014-08-26 2014-08-26 一种面向微博文本流的突发关键词检测方法

Country Status (1)

Country Link
CN (1) CN104166726B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104484390A (zh) * 2014-12-11 2015-04-01 哈尔滨工程大学 一种面向微博的僵尸粉丝检测方法
CN104537096A (zh) * 2015-01-09 2015-04-22 哈尔滨工程大学 一种基于微博消息传播树的微博消息影响力度量方法
CN104518930B (zh) * 2015-01-09 2017-11-21 哈尔滨工程大学 一种面向微博的异常用户和消息同时检测方法
CN106294333B (zh) * 2015-05-11 2019-10-29 国家计算机网络与信息安全管理中心 一种微博突发话题检测方法及装置
CN105095419B (zh) * 2015-07-15 2018-08-31 哈尔滨工程大学 一种面向微博特定类型用户的信息影响力最大化方法
CN112579874A (zh) * 2019-09-29 2021-03-30 腾讯科技(深圳)有限公司 一种关键词的指数确定方法、装置、设备及存储介质
CN112069387B (zh) * 2020-11-12 2021-02-26 北京智慧星光信息技术有限公司 互联网事件传播爆发预测方法、装置、电子设备及介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020050670A (ko) * 2000-12-21 2002-06-27 조명래 실시간 정보 제공 장치 및 그 처리 방법
CN101789023A (zh) * 2010-03-04 2010-07-28 浙江中医药大学 一种基于Web的食材信息发布管理系统及其发布管理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20020050670A (ko) * 2000-12-21 2002-06-27 조명래 실시간 정보 제공 장치 및 그 처리 방법
CN101789023A (zh) * 2010-03-04 2010-07-28 浙江中医药大学 一种基于Web的食材信息发布管理系统及其发布管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
中文微博突发事件检测研究;王勇 等;《情报理论与实践》;20130228(第230期);125-128 *
基于滑动窗口的网络实体行为信任评估;张忠平 等;《计算机工程》;20110420;第37卷(第8期);124-126 *

Also Published As

Publication number Publication date
CN104166726A (zh) 2014-11-26

Similar Documents

Publication Publication Date Title
CN104166726B (zh) 一种面向微博文本流的突发关键词检测方法
Roxburgh et al. Characterising climate change discourse on social media during extreme weather events
Nguyen et al. Real-time event detection for online behavioral analysis of big social data
Holmberg et al. Gender differences in the climate change communication on Twitter
US20150363402A1 (en) Statistical Filtering of Search Results on Online Social Networks
CN104216954B (zh) 突发事件话题状态的预测装置及预测方法
Serrano et al. A novel agent-based rumor spreading model in twitter
US20160041982A1 (en) Conditioned Search Ranking Models on Online Social Networks
CN108399241B (zh) 一种基于多类特征融合的新兴热点话题检测系统
CN103886105A (zh) 一种基于社交网络用户行为的用户影响力分析方法
CN110362818A (zh) 基于用户关系结构特征的微博谣言检测方法和系统
Li et al. Novel user influence measurement based on user interaction in microblog
CN107273496A (zh) 一种微博网络地域突发事件的检测方法
CN106294333B (zh) 一种微博突发话题检测方法及装置
CN103218412A (zh) 舆情信息处理方法与装置
CN106921795A (zh) 一种联系人数据管理方法及其系统
Liu et al. Social network rumor detection method combining dual-attention mechanism with graph convolutional network
WO2015084756A1 (en) Event detection through text analysis using trained event template models
CN104199947A (zh) 一种对重点人员言论监督与关联关系挖掘的方法
Wei et al. Analysis of information dissemination based on emotional and the evolution life cycle of public opinion
US10719779B1 (en) System and means for generating synthetic social media data
JP6839001B2 (ja) モデル学習装置、情報判定装置およびそれらのプログラム
Yu et al. Prediction of users retweet times in social network
CN106557551A (zh) 基于微博事件聚类建模的微博传播规模预测方法和系统
Van de Guchte et al. Near real-time detection of misinformation on online social networks

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant