CN104133897A - 一种基于话题影响力的微博话题溯源方法 - Google Patents

一种基于话题影响力的微博话题溯源方法 Download PDF

Info

Publication number
CN104133897A
CN104133897A CN201410374437.1A CN201410374437A CN104133897A CN 104133897 A CN104133897 A CN 104133897A CN 201410374437 A CN201410374437 A CN 201410374437A CN 104133897 A CN104133897 A CN 104133897A
Authority
CN
China
Prior art keywords
topic
influence power
microblogging
influence
source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410374437.1A
Other languages
English (en)
Other versions
CN104133897B (zh
Inventor
杨静
董圆
张健沛
王勇
初妍
张乐君
杨悦
张泽宝
国林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201410374437.1A priority Critical patent/CN104133897B/zh
Publication of CN104133897A publication Critical patent/CN104133897A/zh
Application granted granted Critical
Publication of CN104133897B publication Critical patent/CN104133897B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于话题溯源范畴语义社会网络中的数据挖掘领域,具体涉及一种基于话题影响力的微博话题溯源方法。本发明包括:根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题;确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN;根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头。本发明使话题溯源递推的终止条件更加准确,溯源更加准确有效。

Description

一种基于话题影响力的微博话题溯源方法
技术领域
本发明属于话题溯源范畴语义社会网络中的数据挖掘领域,具体涉及一种基于话题影响力的微博话题溯源方法。
背景技术
本文所提出的话题溯源方法主要依据话题影响力的变化趋势,故量化话题的影响力成为关键。目前,在线社会网络的影响力研究主要分为两大类:一是从结点的属性特征分析影响力;二是基于社会网络的拓扑结构计算影响力。较早的研究常采用用户的粉丝数作为度量影响力的指标,这种方法过于直接简单缺乏理论分析,在多数情况下并不准确。另外,也有其他研究者借鉴WEB数据挖掘中链接分析的方法,如LeaderRank方法,在网络中增加一个与所有节点双向联通的节点来改进PageRank方法在非连通图下排序不唯一的缺点;还有一种类PageRank方法称为TwitterRank。该方法对主题内容敏感,并且认为用户的影响力是其所有粉丝影响力的总和;由于上述方法仅依靠网络结构,使得某些节点能够采用增加虚假粉丝的手段提高影响力。针对以上方法存在的缺陷,本文通过话题的内容与话题中意见领袖的影响力确定话题在网络中的全局影响力,使得话题的影响力度量更为全面准确,并适合于话题溯源研究。
目前在话题研究方面,有学者提出一种K树模型,根据事件发生的时间戳,推测信息传播的路径以此达到溯源的目的;另有学者将互联网上的话题溯源抽象为一个排序问题,并提出基于文档时间、话题相关性和文档之间关系三者结合的TCL话题溯源模型;还有人通过分析博客空间的转发网络,根据时间和链接关系进行回溯抽取出信息传播的骨干关系。当前的话题溯源方法大多基于内容相似度、时间顺序以及链接关系,而如今的微博不同于以往的信息载体,其文本短小且用户经常采用转发机制来推动信息传播,并不适合进行页面相似度分析。由于话题在传播扩散过程中影响力不断变化,因此可以通过分析语义相似的话题间影响力的变化情况,根据传播理论中的动力学分析逐层缩小话题溯源的范围,最终达到溯源的目的。基于以上分析,本发明提出了一种基于话题影响力的微博话题溯源方法。
发明内容
本发明的目的在于提出一种溯源准确度更高的基于话题影响力的微博话题溯源方法。
本发明的目的是这样实现的:
(1)根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题:
(1.1)对数据集中的所有微博进行去停用词、词干化预处理,构建基于向量空间模型的文本数据库;
(1.2)对用户提交的查询话题进行去停用词、词干化预处理,形成查询的向量形式TP;
(1.3)根据隐形语义索引LSI方法获得与给定话题语义相关的前k个话题;
(2)确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN:
(2.1)在微博中搜索话题tpk包含的所有微博wbj,j=1……n;
(2.2)计算每条微博wbj的影响力wbinj
wbinj=log fwj×log cmj×cpj
其中,fwj代表微博的被转发数,cmj代表微博的回复数,cpj代表微博的有效回复率即回复的微博中有效回复数占回复数之比;
(2.3)通过标签字段判断话题tpk所属的类别,确定话题类别在话题影响力计算公式中的权重tc;
tc = log wb a wb × tc 0
tc0代表话题类别的初始权重,wb代表某一时间段内要溯源的话题tpk的微博数量,wba表示这一时间段内网络中的所有微博数;
(2.4)计算话题tpk的内容影响力CIN;
CIN = 1 wb × Σ j = 1 wb ( wbin j ) × tc
(2.5)计算话题的意见领袖的影响力LIN,其中影响因素包括用户对话题的敏感度贡献度UC和权威度UA,用户的影响力排名中前5位用户为话题的意见领袖,他们的影响力之和为话题的意见领袖影响力;
t表示实验持续时间,Bu tp(i)表示距实验起始时间第i个时间步用户u所发布的与话题tp有关的微博数,包括转发、回复、原创微博,代表Bu tp(i)的均值;Bi tp表示距实验起始时间第i个时间步与话题tp有关的微博数,代表Bi tp的均值,以1h为一个时间步,
UC = log u 2 u 1 + log b 2 b 1
u1代表该用户之前他的关注者中参与话题的人数,u2代表该用户之后他的粉丝中参与话题的人数,b1代表用户参与话题前他的关注者发表的与话题相关的微博数,b2代表用户参与话题后他的粉丝发表的与话题相关的微博数,在影响力计算中的权重分配为:机构和媒体,UA=1.0;明星达人,UA=0.8;草根用户,UA=0.4;
(2.6)计算话题的影响力强度TIN;
TIN=CIN+LIN;
(2.7)重复上述(2.1)到(2.6)步,计算出与话题tp相关的k个话题的影响力;
(3)根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;
(4)推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头wbp
(4.1)根据话题的影响力变化趋势逆向推导,得到溯源递推公式:
TIN(tp)=min TIN(tpk);
(4.2)对话题的溯源模型进行动力学分析,仿真话题传播的演化过程,当演化曲线趋于平稳时即停止话题的溯源递推,
da ( t ) dt = - λn ( t ) a ( t )
dn ( t ) dt = λn ( t ) a ( t ) - μa ( t )
dr ( t ) dt = μa ( t ) + θn ( t )
话题溯源模型包括三个状态,以N表示未接触话题状态即未激活状态,A表示接触话题并传播状态即激活状态,R表示接触话题而不愿传播状态即免疫状态;未激活态到激活态的概率为λ,激活态到免疫态的概率为μ,未激活态到免疫态的概率为θ;a(t),n(t),r(t)分别为A,N,R状态的密度;
(4.3)输出曲线中处于话题从出现到发展成为热门话题的临界区间的微博wbp,p=1……n。
本发明的有益效果是:
1、改进微博网络中的影响力计算方法,从宏观层面考虑话题的影响力,使话题的影响力的度量方法更加全面并适合于话题溯源模型。
2、对话题溯源递推公式加入了动力学分析,改进了传统SIR传染病模型中不同类型节点的状态转移关系,使得话题溯源递推的终止条件更加准确。
3、由话题的影响力变化规律来构建话题的溯源递推公式,将话题的相似性与社会影响力相结合进行溯源的方法在以短文本信息为主的微博网络中更加准确有效。
附图说明
图1为基于话题影响力的话题溯源的系统流程图;
图2为话题溯源递推算法的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
本发明的功能实现包括下述模块:
(1)查询话题扩展模块
根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组进行语义扩展,得到与给定话题相关的其他话题;
(2)微博话题的影响力计算模块
对微博网络中的用户关系及信息传播规律进行探究,确定话题影响力由话题内容和意见领袖的影响力共同决定,并分别给出话题内容影响力计算公式和意见领袖的影响力计算公式;
(3)话题影响力变化趋势分析模块
根据话题影响力计算公式绘制话题在传播过程中的影响力变化趋势曲线,并分析其传播规律;
(4)话题溯源递推模块
推导话题溯源递推公式,并确定其溯源递推终止条件,最终输出引发话题的源头。
查询话题扩展模块的步骤为:1)对数据集中的所有微博进行预处理,构建基于向量空间的文本数据库;2)对用户提交的查询话题进行预处理,形成查询的向量形式;3)根据隐形语义查询扩展方法获得与给定话题语义相关的其他话题。
微博话题影响力计算模块的步骤为:1)根据公式计算话题内每条微博的内容影响力;2)所有微博内容影响力的平均值作为话题的内容影响力;3)根据公式计算参与话题的每位用户的影响力;4)用户影响力排名中前5位用户为该话题的意见领袖,其影响力之和作为话题的意见领袖的影响力;5)将话题的内容影响力和意见领袖影响力相加得到话题的影响力强度。
话题影响力变化趋势分析模块通过话题影响力计算公式可以得到话题在传播过程中的影响力变化趋势,并构建基于影响力的话题传播、演化路径。
话题溯源递推模块的步骤为:1)根据话题传播的影响力变化趋势,建立话题溯源递推公式;2)对话题的传播过程进行动力学分析确定溯源递推的终止条件;3)输出引发话题的初始微博集合。
参照图1,本发明提出了一种基于话题影响力的微博话题溯源方法,该方法包括下述几个步骤:
(1)根据已有的信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题,其具体如下:
(1-1)对数据集中的所有微博进行去停用词、词干化等预处理,构建基于向量空间模型的文本数据库。
(1-2)对用户提交的查询话题进行去停用词、词干化等预处理,形成查询的向量形式TP。
(1-3)根据隐形语义索引LSI方法获得与给定话题语义相关的前k个话题。
(2)对微博网络中的用户关系及信息传播规律进行探究,确定话题影响力TIN。
(2-1)在微博中搜索话题tpk包含的所有微博wbj,j=1……n。
(2-2)计算每条微博wbj的影响力wbinj
wbinj=log fwj×log cmj×cpj
其中,fwj代表微博的被转发数,cmj代表微博的回复数,cpj代表微博的有效回复率(回复的微博中有效回复数占回复数之比),判断某条回复微博是否为有效回复将采用话题检测与跟踪技术中的TF-IDF距离计算,将余弦函数作为相似性函数。
(2-3)通过标签字段判断话题tpk所属的类别,确定话题类别在话题影响力计算公式中的权重tc。
tc = log wb a wb × tc 0
tc0代表话题类别的初始权重,根据各个类别话题在网络中被关注度的不同分成不同等级。wb代表某一时间段内要溯源的话题tpk的微博数量,wba表示这一时间段内网络中的所有微博数。
(2-4)计算话题tpk的内容影响力CIN。
CIN = 1 wb × Σ j = 1 wb ( wbin j ) × tc
(2-5)计算话题的意见领袖的影响力LIN,其中影响因素包括用户对话题的敏感度贡献度UC和权威度UA。用户的影响力排名中前5位用户为话题的意见领袖,他们的影响力之和为话题的意见领袖影响力。
t表示实验持续时间,Bu tp(i)表示距实验起始时间第i个时间步用户u所发布的与话题tp有关的微博数(包括转发、回复、原创微博),代表Bu tp(i)的均值;Bi tp表示距实验起始时间第i个时间步与话题tp有关的微博数,代表Bi tp的均值,以1h为一个时间步。
UC = log u 2 u 1 + log b 2 b 1
u1代表该用户之前他的关注者中参与话题的人数,u2代表该用户之后他的粉丝中参与话题的人数,b1代表用户参与话题前他的关注者发表的与话题相关的微博数,b2代表用户参与话题后他的粉丝发表的与话题相关的微博数。
根据对新浪微博的用户分析,大致分为机构和媒体、明星达人、草根用户这三个类别。不同类别的权威度也不同。所以,在在影响力计算中的权重分配为:机构和媒体,UA=1.0;明星达人,UA=0.8;草根用户,UA=0.4。
(2-6)计算话题的影响力强度TIN。
TIN=CIN+LIN
(2-7)重复上述1到6步,计算出与话题tp相关的k个话题的影响力。
(3)根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点。
(4)推导话题溯源递推公式,并确定其溯源递推终止条件,最终输出引发话题的源头wbp
(4-1)根据话题的影响力变化趋势逆向推导,得到溯源递推公式。
TIN(tp)=min TIN(tpk)
(4-2)对话题的溯源模型进行动力学分析,仿真话题传播的演化过程。当演化曲线趋于平稳时即停止话题的溯源递推。
da ( t ) dt = - λn ( t ) a ( t )
dn ( t ) dt = λn ( t ) a ( t ) - μa ( t )
dr ( t ) dt = μa ( t ) + θn ( t )
话题溯源模型包括三个状态,以N表示未接触话题状态(未激活状态),A表示接触话题并传播状态(激活状态),R表示接触话题而不愿传播状态(即免疫状态);未激活态到激活态的概率为λ,激活态到免疫态的概率为μ,未激活态到免疫态的概率为θ;a(t),n(t),r(t)分别为A,N,R状态的密度。
(4-3)输出曲线中处于话题从出现到发展成为热门话题的临界区间的微博wbp,p=1……n;。

Claims (1)

1.一种基于话题影响力的微博话题溯源方法,其特征在于:
(1)根据信息检索领域的隐形语义查询扩展方法,对输入的话题词组tp进行语义扩展,得到与给定话题相关的前k个话题:
(1.1)对数据集中的所有微博进行去停用词、词干化预处理,构建基于向量空间模型的文本数据库;
(1.2)对用户提交的查询话题进行去停用词、词干化预处理,形成查询的向量形式TP;
(1.3)根据隐形语义索引LSI方法获得与给定话题语义相关的前k个话题;
(2)确定微博网络中的用户关系及信息传播规律,确定话题影响力TIN:
(2.1)在微博中搜索话题tpk包含的所有微博wbj,j=1……n;
(2.2)计算每条微博wbj的影响力wbinj
wbinj=log fwj×log cmj×cpj
其中,fwj代表微博的被转发数,cmj代表微博的回复数,cpj代表微博的有效回复率即回复的微博中有效回复数占回复数之比;
(2.3)通过标签字段判断话题tpk所属的类别,确定话题类别在话题影响力计算公式中的权重tc;
tc = log wb a wb × tc 0
tc0代表话题类别的初始权重,wb代表某一时间段内要溯源的话题tpk的微博数量,wba表示这一时间段内网络中的所有微博数;
(2.4)计算话题tpk的内容影响力CIN;
CIN = 1 wb × Σ j = 1 wb ( wbin j ) × tc
(2.5)计算话题的意见领袖的影响力LIN,其中影响因素包括用户对话题的敏感度贡献度UC和权威度UA,用户的影响力排名中前5位用户为话题的意见领袖,他们的影响力之和为话题的意见领袖影响力;
t表示实验持续时间,Bu tp(i)表示距实验起始时间第i个时间步用户u所发布的与话题tp有关的微博数,包括转发、回复、原创微博,代表Bu tp(i)的均值;Bi tp表示距实验起始时间第i个时间步与话题tp有关的微博数,代表Bi tp的均值,以1h为一个时间步,
UC = log u 2 u 1 + log b 2 b 1
u1代表该用户之前他的关注者中参与话题的人数,u2代表该用户之后他的粉丝中参与话题的人数,b1代表用户参与话题前他的关注者发表的与话题相关的微博数,b2代表用户参与话题后他的粉丝发表的与话题相关的微博数,在影响力计算中的权重分配为:机构和媒体,UA=1.0;明星达人,UA=0.8;草根用户,UA=0.4;
(2.6)计算话题的影响力强度TIN;
TIN=CIN+LIN;
(2.7)重复上述(2.1)到(2.6)步,计算出与话题tp相关的k个话题的影响力;
(3)根据影响力计算公式,以1h为一个时间步计算话题的影响力,得到话题在传播过程中随着时间变化的的影响力趋势,其影响力强度从话题初期的缓慢增长到急剧上升最后达到平稳状态,即话题成长为热点;
(4)推导话题溯源递推公式,并确定其溯源递推终止条件,输出引发话题的源头wbp
(4.1)根据话题的影响力变化趋势逆向推导,得到溯源递推公式:
TIN(tp)=min TIN(tpk);
(4.2)对话题的溯源模型进行动力学分析,仿真话题传播的演化过程,当演化曲线趋于平稳时即停止话题的溯源递推,
da ( t ) dt = - λn ( t ) a ( t )
dn ( t ) dt = λn ( t ) a ( t ) - μa ( t )
dr ( t ) dt = μa ( t ) + θn ( t )
话题溯源模型包括三个状态,以N表示未接触话题状态即未激活状态,A表示接触话题并传播状态即激活状态,R表示接触话题而不愿传播状态即免疫状态;未激活态到激活态的概率为λ,激活态到免疫态的概率为μ,未激活态到免疫态的概率为θ;a(t),n(t),r(t)分别为A,N,R状态的密度;
(4.3)输出曲线中处于话题从出现到发展成为热门话题的临界区间的微博wbp,p=1……n。
CN201410374437.1A 2014-08-01 2014-08-01 一种基于话题影响力的微博话题溯源方法 Active CN104133897B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410374437.1A CN104133897B (zh) 2014-08-01 2014-08-01 一种基于话题影响力的微博话题溯源方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410374437.1A CN104133897B (zh) 2014-08-01 2014-08-01 一种基于话题影响力的微博话题溯源方法

Publications (2)

Publication Number Publication Date
CN104133897A true CN104133897A (zh) 2014-11-05
CN104133897B CN104133897B (zh) 2017-07-11

Family

ID=51806575

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410374437.1A Active CN104133897B (zh) 2014-08-01 2014-08-01 一种基于话题影响力的微博话题溯源方法

Country Status (1)

Country Link
CN (1) CN104133897B (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778210A (zh) * 2015-03-13 2015-07-15 国家计算机网络与信息安全管理中心 一种微博转发树和转发森林构建方法
CN106339389A (zh) * 2015-07-09 2017-01-18 天津市国瑞数码安全系统股份有限公司 一种基于微博网站敏感信息的管控方法
CN108230169A (zh) * 2017-12-20 2018-06-29 重庆邮电大学 基于社交影响力的信息传播模型及态势感知系统及方法
CN108304521A (zh) * 2018-01-25 2018-07-20 重庆邮电大学 基于演化博弈的微博谣言传播的分析方法与系统
CN108492009A (zh) * 2018-03-06 2018-09-04 宁波中青华云新媒体科技有限公司 影响力评价系统构建方法及系统、影响力评价方法
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN108647334A (zh) * 2018-05-11 2018-10-12 电子科技大学 一种spark平台下的视频社交网络同源性分析方法
CN109885760A (zh) * 2019-01-22 2019-06-14 上海交通大学 基于用户兴趣的信息溯源方法和系统
CN110147482A (zh) * 2017-09-11 2019-08-20 百度在线网络技术(北京)有限公司 用于获取突发热点主题的方法和装置
CN117150104A (zh) * 2023-10-23 2023-12-01 西安康奈网络科技有限公司 一种基于互联网的多路径舆情话题溯源追踪系统

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107135153A (zh) * 2017-04-28 2017-09-05 常州工学院 基于传播路径逆向追溯的信源和影响力节点定位方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270204A (zh) * 2010-06-02 2011-12-07 上海佳艾商务信息咨询有限公司 一种基于矩阵分解对在线论坛用户影响力进行计算的方法
CN102314489A (zh) * 2011-08-15 2012-01-11 哈尔滨工业大学 网络论坛中舆论领袖分析方法
CN103116605A (zh) * 2013-01-17 2013-05-22 上海交通大学 一种基于监测子网的微博热点事件实时检测方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102270204A (zh) * 2010-06-02 2011-12-07 上海佳艾商务信息咨询有限公司 一种基于矩阵分解对在线论坛用户影响力进行计算的方法
CN102314489A (zh) * 2011-08-15 2012-01-11 哈尔滨工业大学 网络论坛中舆论领袖分析方法
CN103116605A (zh) * 2013-01-17 2013-05-22 上海交通大学 一种基于监测子网的微博热点事件实时检测方法及系统

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778210B (zh) * 2015-03-13 2018-04-27 国家计算机网络与信息安全管理中心 一种微博转发树和转发森林构建方法
CN104778210A (zh) * 2015-03-13 2015-07-15 国家计算机网络与信息安全管理中心 一种微博转发树和转发森林构建方法
CN106339389A (zh) * 2015-07-09 2017-01-18 天津市国瑞数码安全系统股份有限公司 一种基于微博网站敏感信息的管控方法
CN110147482A (zh) * 2017-09-11 2019-08-20 百度在线网络技术(北京)有限公司 用于获取突发热点主题的方法和装置
CN108230169A (zh) * 2017-12-20 2018-06-29 重庆邮电大学 基于社交影响力的信息传播模型及态势感知系统及方法
CN108564479A (zh) * 2017-12-20 2018-09-21 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN108564479B (zh) * 2017-12-20 2022-02-11 重庆邮电大学 一种基于隐链接分析热点话题传播趋势的系统及方法
CN108304521A (zh) * 2018-01-25 2018-07-20 重庆邮电大学 基于演化博弈的微博谣言传播的分析方法与系统
CN108304521B (zh) * 2018-01-25 2021-11-16 重庆邮电大学 基于演化博弈的微博谣言传播的分析方法与系统
CN108492009A (zh) * 2018-03-06 2018-09-04 宁波中青华云新媒体科技有限公司 影响力评价系统构建方法及系统、影响力评价方法
CN108647334A (zh) * 2018-05-11 2018-10-12 电子科技大学 一种spark平台下的视频社交网络同源性分析方法
CN108647334B (zh) * 2018-05-11 2021-10-19 电子科技大学 一种spark平台下的视频社交网络同源性分析方法
CN109885760A (zh) * 2019-01-22 2019-06-14 上海交通大学 基于用户兴趣的信息溯源方法和系统
CN117150104A (zh) * 2023-10-23 2023-12-01 西安康奈网络科技有限公司 一种基于互联网的多路径舆情话题溯源追踪系统
CN117150104B (zh) * 2023-10-23 2024-01-26 西安康奈网络科技有限公司 一种基于互联网的多路径舆情话题溯源追踪系统

Also Published As

Publication number Publication date
CN104133897B (zh) 2017-07-11

Similar Documents

Publication Publication Date Title
CN104133897A (zh) 一种基于话题影响力的微博话题溯源方法
CN103150374B (zh) 一种识别微博异常用户的方法和系统
Cui et al. Who should share what? item-level social influence prediction for users and posts ranking
Miller et al. Sentiment flow through hyperlink networks
US11238233B2 (en) Artificial intelligence engine for generating semantic directions for websites for automated entity targeting to mapped identities
CN103064917A (zh) 一种面向微博的特定倾向的高影响力用户群发现方法
CN102394798A (zh) 一种基于多元特征的微博信息传播行为预测方法及系统
CN104008109A (zh) 基于用户兴趣的Web信息推送服务系统
CN104933622A (zh) 一种基于用户和微博主题的微博流行度预测方法及系统
CN104182457A (zh) 在社交网络中基于泊松过程模型的事件流行度预测方法
Li et al. Novel user influence measurement based on user interaction in microblog
Liu et al. Content matters: A GNN-based model combined with text semantics for social network cascade prediction
Liu et al. Information diffusion and opinion leader mathematical modeling based on microblog
CN104035972A (zh) 一种基于微博的知识推荐方法与系统
Shi et al. Event detection and multi-source propagation for online social network management
Basile et al. Populating a knowledge base with object-location relations using distributional semantics
Yan et al. Analysis of research papers on E-commerce (2000–2013): based on a text mining approach
Zhou et al. Research on small-world network communication of public sentiment by self-media based on energy model
Yu et al. Prediction of users retweet times in social network
Yi et al. Mining the key predictors for event outbreaks in social networks
Zhang et al. Information dissemination analysis using a time-weight null model: A case study of sina micro-blog
Cai et al. A novel rumor detection method based on labeled cascade propagation tree
Cao et al. A study on predicting the microblog retweet based the random walk model
Chen et al. Probabilistic topic modelling with semantic graph
Ren et al. Discovery and dynamic prediction of user's interest based on ARIMA

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant