CN105447196B - 一种重点博主追踪确认方法及装置 - Google Patents

一种重点博主追踪确认方法及装置 Download PDF

Info

Publication number
CN105447196B
CN105447196B CN201511015944.7A CN201511015944A CN105447196B CN 105447196 B CN105447196 B CN 105447196B CN 201511015944 A CN201511015944 A CN 201511015944A CN 105447196 B CN105447196 B CN 105447196B
Authority
CN
China
Prior art keywords
bloger
microblogging
emphasis
event
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201511015944.7A
Other languages
English (en)
Other versions
CN105447196A (zh
Inventor
陈志群
李晓亮
廖庆平
易杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhonghong On-Line Co Ltd
Original Assignee
Shenzhen Zhonghong On-Line Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhonghong On-Line Co Ltd filed Critical Shenzhen Zhonghong On-Line Co Ltd
Priority to CN201511015944.7A priority Critical patent/CN105447196B/zh
Publication of CN105447196A publication Critical patent/CN105447196A/zh
Application granted granted Critical
Publication of CN105447196B publication Critical patent/CN105447196B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及信息搜索领域,具体涉及一种重点博主追踪确认方法及装置。该方法和装置分别计算出每个博主的事件参与度值、基础总分值及心态指数,再有三者计算出每个博主的博主权重值,通过阈值比较来确认重点博主;其依据博主的发帖频率来分析博主从以往的行为中及预测博主在未来的微博事件中所表现出的影响力,微博影响力可以从微博的转发量和评论量等方面分析得出、博主心态分析以博主发布微博内容的语义来分析,计算出正负面关键词的相对比例,从而得出博主在舆情事件中是推动舆情发酵还是传播正能量。重点博主的筛选结果对每个用户都是可用的,在微博监测中对重点博主的微博进行监测,重点博主的信息就可以作为重点参考依据。

Description

一种重点博主追踪确认方法及装置
技术领域
本发明涉及信息搜索领域,具体涉及一种重点博主追踪确认方法及装置。
背景技术
目前,市场上充斥着各种微博监测系统,可以对微博信息进行抓取以及分析,但是很多的监测系统对信息的抓取及分析只是停留在表面,对微博博主的信息并不能深入的挖掘及分析,只是获取了微博的主要信息,微博属性值不足,潜在关系难以发现。因为属性不足,造成无法判断博主参与一个事件中是否对事件的发展起到作用。此外,微博博主的评分计算也是五花八门,因为计算方法的不同,设置的权重不同,导致很多不同的结果,其大部分的结果是不能有效反映微博博主的重要性。
发明内容
为克服上述缺陷,本发明的目的即在于提供一种重点博主追踪确认方法及装置。
本发明的目的是通过以下技术方案来实现的:
本发明的一种重点博主追踪确认方法,包括以下步骤:
选取一个以上的微博舆情事件,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据,对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主的心态指数;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值,将该博主权重值与预设的权重阈值进行比较来确认重点博主。
进一步,包括以下步骤:
选取N个微博舆情事件,根据该N个微博舆情事件相对应的事件关键词在微博上下载相关微博数据,对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值G:
G=(W1*Q1+ W2*Q2+…+Wd*Qd+…+ Wf*Qf )*S/N,其中S为参与事件数,N为舆情事件总数,d=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Wd为每个微博数据属性值的个数,Qd为每个微博数据属性值的参与度权重,Q1+Q2+…+Qd+…+Qf=1,N≥1;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值Total:
Total=V1*T1+V2*T2+…+Vi*Ti+…+ Vf*Tf ,其中i=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Vi为每一个分析因子的基础分权重,V1+V2+…+Vi+…+Vf =1,Ti为每一个分析因子的T分值;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主的心态指数H:
H=(h1+h2+…+hk+…+hn)/n,其中k=1、2、…、n,n≥1,n为每一个博主发出的原创微博数,hk=reverse/obverse,hk为每一个原创微博的正负关键词比例,reverse为负面关键词数,obverse为正面关键词数;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值Imp,将该博主权重值与预设的权重阈值进行比较来确认重点博主:
其中,Imp=Total+G*H。
进一步,所述T=(标准分满分/2)+(标准分制*10/100)*标准分Z,标准分Z=(Xi- X_bar)/S,其中i=1、2、…、m,m≥1,m为博主的个数,Xi为对应每一个分析因子时每一个博主的样本数值,X_bar为每一个分析因子的样本平均值,S为每一个分析因子的样本标准差。
进一步,所述标准分满分为100,所述标准分制为100。
进一步,将该博主权重值与预设的权重阈值进行比较,若博主权重值大于预设的权重阈值,则该博主权重值对应的博主确定为重点博主,若博主权重值小于预设的权重阈值,则该博主权重值对应的博主确定为非重点博主。
进一步,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据为:对微博页面进行分析,获得解析模板,由解析模板采用数据模板匹配属性值的方式根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载微博基本属性数据,由微博基本属性数据拼接目标url地址,获取其他相关信息微博页面,再对其他相关信息微博页面进行分析获得解析模板,由解析模板采用数据模板匹配属性值的方式下载解析超过100个微博数据属性值入库保存。
更进一步,所述相关微博数据内的微博数据属性值为三个,分别为原创微博数、转发微博数及评论微博数。
一种重点博主追踪确认装置,包括依次连接的:
选取一个以上的微博舆情事件,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据的微博数据采集单元;
对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主事件参与度值的事件参与度计算单元;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主基础总分值的基础总分值计算单元;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主心态指数的心态指数计算单元;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值,将该博主权重值与预设的权重阈值进行比较来确认重点博主的重点博主确认单元。
进一步,该装置还包括与心态指数计算单元连接、为心态指数计算单元提供正面关键词及负面关键词的正负关键词存储单元。
本发明提供的一种重点博主追踪确认方法及装置,该方法和装置分别计算出每个博主的事件参与度值、基础总分值及心态指数,再有三者计算出每个博主的博主权重值,通过阈值比较来确认重点博主;其对博主进行深入分析,依据博主的发帖频率来分析博主从以往的行为中及预测博主在未来的微博事件中所表现出的影响力,微博影响力可以从微博的转发量和评论量等方面分析得出、博主心态分析以博主发布微博内容的语义来分析,计算出正负面关键词的相对比例,从而得出博主在舆情事件中是推动舆情发酵还是传播正能量。从以上几个方面,我们可以将博主分门别类开来,谁有可能是重点博主也就有据可依。重点博主的筛选结果对每个用户都是可用的,并不是只对一个用户服务,在微博监测中对重点博主的微博进行监测,这样就更有针对性,重点博主的信息就可以作为重点参考依据。
附图说明
为了易于说明,本发明由下述的较佳实施例及附图作以详细描述。
图1为本发明一种重点博主追踪确认方法的步骤流程图;
图2为本发明一种重点博主追踪确认装置的模块框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
请参照图1,本发明的一种重点博主追踪确认方法,包括以下步骤:
100:微博采集,选取一个以上的微博舆情事件,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据。
:数据解析,对微博页面进行分析,获得解析模板,由解析模板采用数据模板匹配属性值的方式根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载微博基本属性数据,该微博基本属性数据包括微博内容、转发、评论等基础数据,以及博主的名称、注册时间、粉丝等数据,并格式化数据入库;由微博基本属性数据拼接目标url地址,获取其他相关信息微博页面,再对其他相关信息微博页面进行分析获得解析模板,由解析模板采用数据模板匹配属性值的方式下载解析超过100个微博数据属性值入库保存。
:数据统计分析,具体为:
1021:对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值;通过属性值微博id,转发博主id,评论博主id,用户id其中的关联,比如转发了热点事件微博,评论了舆情事件的相关微博都属于参与了舆情事件,我们把这个参与情况作为是否是舆情事件重点博主的第一个指数。
选取N个微博舆情事件,根据该N个微博舆情事件相对应的事件关键词在微博上下载相关微博数据,对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值G:
G=(W1*Q1+ W2*Q2+…+Wd*Qd+…+ Wf*Qf )*S/N,其中S为参与事件数,N为舆情事件总数,d=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Wd为每个微博数据属性值的个数,Qd为每个微博数据属性值的参与度权重,Q1+Q2+…+Qd+…+Qf=1,N≥1;作为一种优选,该相关微博数据内的微博数据属性值的个数为三个,即分别为原创微博数、转发微博数及评论微博数,此时G=(W*Q1+P*Q2+C*Q3)*S/N,其中W为原创微博数,P为转发微博数,C为评论微博数,Q1、Q2、Q3分别为参与度权重,Q1+Q2+Q3=1,N≥1,参与度权重的大小选取可根据微博用户对该微博舆情事件的关注度,关注度越高其相应的参与度权重值越大。
:将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值。
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值Total,作为一个是否是重点博主的第二个指数:
Total=V1*T1+V2*T2+…+Vi*Ti+…+ Vf*Tf ,其中i=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Vi为每一个分析因子的基础分权重,V1+V2+…+Vi+…+Vf =1,Ti为每一个分析因子的T分值;作为一种优选,该相关微博数据内的微博数据属性值的个数为三个,即分别为原创微博数、转发微博数及评论微博数,此时:
Total=V1*T1+V2*T2+V3*T3,其中i=1、2、3,i为分析因子数,即是微博数据属性值的个数,Vi为每一个分析因子的基础分权重,V1+V2+V3=1,Ti为每一个分析因子的T分值,此处的微博数据属性值还可以增加其他属性值,如粉丝数、点赞数等等,由于在数据采集中下载解析超过100个微博数据属性值并入库保存,因此所选取的微博数据属性值很多,选取的微博数据属性值越多,所计算出的每一个博主的基础总分值越具有统计代表性;所述T=(标准分满分/2)+(标准分制*10/100)*标准分Z,标准分Z=(Xi- X_bar)/S,其中i=1、2、…、m,m≥1,m为博主的个数,Xi为对应每一个分析因子时每一个博主的样本数值,X_bar为每一个分析因子的样本平均值,S为每一个分析因子的样本标准差,所述标准分满分为100,所述标准分制为100。具体为:
(1).计算单项因子的平均分
平均分能够准确地反映数据的集中程度,作为选取的参考点,所有原始值共同以平均分为参考点进行比较。设样本总数为m,样本个体值为Xi,则平均分X_bar =(X1+X2+…+Xi+…+Xm)/m。
计算单项因子的标准差
标准差能反映数据相对平均分的离散程度,是一组被测试的全体与平均值差的平方和的一个平均数,我们把它叫做标准差,也就是我们所取的单位,大家都以标准差为同一单位进行量度。
标准差S=方差开根号;方差= n个数据,每个样本个体值Xi和平均分X_bar差的平方和除以数据个数m。
计算各单项因子的标准分(Z分数)
标准分是以标准差S为单位来度量样本个体与参考点之间的离差,即原始值距平均分相差了多少个单位。
标准分Z=(Xi- X_bar)/S(也叫Z分数);
如果把平均分作为坐标原点,S作为单位长度,则可用数轴表示:
   -3S -2S -S  0  S  2S  3S
可以很形象地表示出个体在整体中的位置,也就是其距平均分的位置,因此,标准分适合用于对被试对象进行排队比较。
计算各单项因子的T分数(Z转换)
将非正态分布的原始分数转换成正态分布,也叫常态化T分数(Normalized TScore),即经过常态化的标准分数,计算公式为:T=基础分(标准分满分/2)+量度单位同比系数k(标准分制*10/100)*标准分Z。
分数有正负或等于零,为了避免负数和零的出现,我们常选择一个固定的平均值(基础分)和新的测定单位来对原标准分(Z分数)进行转换。通常使用的平均值为50(满分为100分),测定单位为10。转换后的分数叫T分数,所有被测的分数在50分上下浮动。50分为一般成绩,大于50分越多,则成绩越好,小于50分越多,则成绩越差。
转换公式:若满分为100分制,则T=50+10*标准分Z;
-3S’ -2S’ -S’  50  S’  2S’  3S’
T分数仍然保持了Z分数的基本特性。
等比例转换标准分T为实际中的因子值,或者单项因子权重V取范围为0到1的闭区间任意值(0和1之间的任意小数)。
计算微博博主的基础总分值
当该相关微博数据内的微博数据属性值的个数为三个,即分别为原创微博数、转发微博数及评论微博数时,Total=V1*T1+V2*T2+V3*T3,其中i=1、2、3,i为分析因子数,Vi为每一个分析因子的基础分权重,V1+V2+V3=1,Ti为每一个分析因子的T分值。
:对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主的心态指数H,心态指数越高,表示该博主发布的言论传播的正面积极的信息居多,反之传播的负面消极的信息居多。我们将心态指数作为是否是舆情事件重点博主的第三个指数:
H=(h1+h2+…+hk+…+hn)/n,其中k=1、2、…、n,n≥1,n为每一个博主发出的原创微博数,hk=reverse/obverse,hk为每一个原创微博的正负关键词比例,reverse为负面关键词数,obverse为正面关键词数。
:由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值Imp,其中,Imp=Total+G*H。
:阈值判定,将该博主权重值与预设的权重阈值进行比较来确认重点博主,将该博主权重值与预设的权重阈值进行比较,若博主权重值大于预设的权重阈值,则该博主权重值对应的博主确定为重点博主,即进入104重点博主追踪,若博主权重值小于预设的权重阈值,则该博主权重值对应的博主确定为非重点博主,即进入105普通博主追踪。
具体参见图2,一种应用上述重点博主追踪确认方法的重点博主追踪确认装置,包括依次连接的:
选取一个以上的微博舆情事件,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据的微博数据采集单元;
对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主事件参与度值的事件参与度计算单元;
将原创微博数、转发微博数及评论微博数均作为一个分析因子,根据统计学公式计算出每一个博主基础总分值的基础总分值计算单元;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主心态指数的心态指数计算单元;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值,将该博主权重值与预设的权重阈值进行比较来确认重点博主的重点博主确认单元。
该装置还包括与心态指数计算单元连接、为心态指数计算单元提供正面关键词及负面关键词的正负关键词存储单元。
本发明提供的一种重点博主追踪确认方法及装置,其微博相关属性值分析比较全面,100+微博用户属性值,更深入的分析用户,微博之间的关联,从多方面入手,增加了相互关系的可靠性;
其对博主进行深入分析,依据博主的发帖频率来分析博主从以往的行为中及预测博主在未来的微博事件中所表现出的影响力,微博影响力可以从微博的转发量和评论量等方面分析得出、博主心态分析以博主发布微博内容的语义来分析,计算出正负面关键词的相对比例,从而得出博主在舆情事件中是推动舆情发酵还是传播正能量。从以上几个方面,我们可以将博主分门别类开来,谁有可能是重点博主也就有据可依。重点博主的筛选结果对每个用户都是可用的,并不是只对一个用户服务,在微博监测中对重点博主的微博进行监测,这样就更有针对性,重点博主的信息就可以作为重点参考依据。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种重点博主追踪确认方法,其特征在于,包括以下步骤:
选取一个以上的微博舆情事件,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据,对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主的心态指数;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值,将该博主权重值与预设的权重阈值进行比较来确认重点博主。
2.根据权利要求1所述的一种重点博主追踪确认方法,其特征在于,包括以下步骤:
选取N个微博舆情事件,根据该N个微博舆情事件相对应的事件关键词在微博上下载相关微博数据,对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主的事件参与度值G:
G=(W1*Q1+W2*Q2+…+Wd*Qd+…+Wf*Qf)*S/N,其中S为参与事件数,N为舆情事件总数,d=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Wd为每个微博数据属性值的个数,Qd为每个微博数据属性值的参与度权重,Q1+Q2+…+Qd+…+Qf=1,N≥1;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主的基础总分值Total:
Total=V1*T1+V2*T2+…+Vi*Ti+…+Vf*Tf,其中i=1、2、…、f,f为相关微博数据内的微博数据属性值的个数,f≥3,Vi为每一个分析因子的基础分权重,V1+V2+…+Vi+…+Vf=1,Ti为每一个分析因子的T分值;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主的心态指数H:
H=(h1+h2+…+hk+…+hn)/n,其中k=1、2、…、n,n≥1,n为每一个博主发出的原创微博数,hk=reverse/obverse,hk为每一个原创微博的正负关键词比例,reverse为负面关键词数,obverse为正面关键词数;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值Imp,将该博主权重值与预设的权重阈值进行比较来确认重点博主:
其中,Imp=Total+G*H。
3.根据权利要求2所述的一种重点博主追踪确认方法,其特征在于,所述T=(标准分满分/2)+(标准分制*10/100)*标准分Z,标准分Z=(Xi-X_bar)/Y,其中i=1、2、…、m,m≥1,m为博主的个数,Xi为对应每一个分析因子时每一个博主的样本数值,X_bar为每一个分析因子的样本平均值,Y为每一个分析因子的样本标准差。
4.根据权利要求3所述的一种重点博主追踪确认方法,其特征在于,所述标准分满分为100,所述标准分制为100。
5.根据权利要求1-4任一项所述的一种重点博主追踪确认方法,其特征在于,将该博主权重值与预设的权重阈值进行比较,若博主权重值大于预设的权重阈值,则该博主权重值对应的博主确定为重点博主,若博主权重值小于预设的权重阈值,则该博主权重值对应的博主确定为非重点博主。
6.根据权利要求1所述的一种重点博主追踪确认方法,其特征在于,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据为:对微博页面进行分析,获得解析模板,由解析模板采用数据模板匹配属性值的方式根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载微博基本属性数据,由微博基本属性数据拼接目标url地址,获取其他相关信息微博页面,再对其他相关信息微博页面进行分析获得解析模板,由解析模板采用数据模板匹配属性值的方式下载解析超过100个微博数据属性值入库保存。
7.根据权利要求1所述的一种重点博主追踪确认方法,其特征在于,所述相关微博数据内的微博数据属性值为三个,分别为原创微博数、转发微博数及评论微博数。
8.一种重点博主追踪确认装置,其特征在于,包括依次连接的:
选取一个以上的微博舆情事件,根据该一个以上的微博舆情事件相对应的事件关键词在微博上下载相关微博数据的微博数据采集单元;
对相关微博数据内的每一个博主进行事件参与度统计计算出每一个博主事件参与度值的事件参与度计算单元;
将相关微博数据内的微博数据属性值均作为一个分析因子,根据统计学公式计算出每一个博主基础总分值的基础总分值计算单元;
对每一个博主的每一个原创微博进行语义分析找出正面关键词及负面关键词,统计正面关键词数及负面关键词数由正面关键词数及负面关键词数计算出每一个博主心态指数的心态指数计算单元;
由事件参与度值、基础总分值及心态指数计算出每一个博主的博主权重值,将该博主权重值与预设的权重阈值进行比较来确认重点博主的重点博主确认单元。
9.根据权利要求8所述的一种重点博主追踪确认装置,其特征在于,该装置还包括与心态指数计算单元连接、为心态指数计算单元提供正面关键词及负面关键词的正负关键词存储单元。
CN201511015944.7A 2015-12-31 2015-12-31 一种重点博主追踪确认方法及装置 Active CN105447196B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201511015944.7A CN105447196B (zh) 2015-12-31 2015-12-31 一种重点博主追踪确认方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201511015944.7A CN105447196B (zh) 2015-12-31 2015-12-31 一种重点博主追踪确认方法及装置

Publications (2)

Publication Number Publication Date
CN105447196A CN105447196A (zh) 2016-03-30
CN105447196B true CN105447196B (zh) 2019-03-05

Family

ID=55557372

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201511015944.7A Active CN105447196B (zh) 2015-12-31 2015-12-31 一种重点博主追踪确认方法及装置

Country Status (1)

Country Link
CN (1) CN105447196B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106547901A (zh) * 2016-11-08 2017-03-29 周口师范学院 一种基于能量优化的微博用户转发行为预测方法
CN106875277A (zh) * 2017-01-16 2017-06-20 星云纵横(北京)大数据信息技术有限公司 一种社交媒体账号影响力的判断方法
CN107908804B (zh) * 2017-12-27 2021-06-04 北京锐安科技有限公司 一种网民参与程度的评估方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122484A (ja) * 2003-10-16 2005-05-12 Sony Corp 私的情報管理装置及び私的情報管理方法
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN103064917A (zh) * 2012-12-20 2013-04-24 中国科学院深圳先进技术研究院 一种面向微博的特定倾向的高影响力用户群发现方法
CN103577405A (zh) * 2012-07-19 2014-02-12 中国人民大学 基于兴趣分析的微博博主社区分类方法
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法
CN103885993A (zh) * 2012-12-24 2014-06-25 北大方正集团有限公司 用于微博的舆情监控方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005122484A (ja) * 2003-10-16 2005-05-12 Sony Corp 私的情報管理装置及び私的情報管理方法
CN102663046A (zh) * 2012-03-29 2012-09-12 中国科学院自动化研究所 一种面向微博短文本的情感分析方法
CN103577405A (zh) * 2012-07-19 2014-02-12 中国人民大学 基于兴趣分析的微博博主社区分类方法
CN103064917A (zh) * 2012-12-20 2013-04-24 中国科学院深圳先进技术研究院 一种面向微博的特定倾向的高影响力用户群发现方法
CN103885993A (zh) * 2012-12-24 2014-06-25 北大方正集团有限公司 用于微博的舆情监控方法和装置
CN103617279A (zh) * 2013-12-09 2014-03-05 南京邮电大学 基于Pagerank方法的微博信息传播影响力评估模型的实现方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"一种新的中文微博社区博主影响力的评估方法";杨长春 等;《计算机工程与应用》;20120901;第48卷(第25期);229-233、248
"微博主影响力评价指标体系的科学构建";陈明亮 等;《浙江大学学报(人文社会科学版)》;20140123;第44卷(第2期);53-63
"微博博主权威度及其评价方法研究";王洪流;《中国优秀硕士学位论文全文数据库 信息科技辑(月刊)》;20141015(第10期);I141-36

Also Published As

Publication number Publication date
CN105447196A (zh) 2016-03-30

Similar Documents

Publication Publication Date Title
US11659050B2 (en) Discovering signature of electronic social networks
Bourigault et al. Representation learning for information diffusion through social networks: an embedded cascade model
CN108647309B (zh) 基于敏感词的聊天内容审核方法及系统
CN104915392B (zh) 一种微博转发行为预测方法及装置
Bornmann et al. The state of h index research: Is the h index the ideal way to measure research performance?
CN103150374B (zh) 一种识别微博异常用户的方法和系统
CN107291886A (zh) 一种基于增量聚类算法的微博话题检测方法及系统
CN103927297B (zh) 基于证据理论的中文微博可信度评估方法
CN106126582A (zh) 推荐方法及装置
CN105488092A (zh) 一种时间敏感和自适应的子话题在线检测方法及系统
CN105447196B (zh) 一种重点博主追踪确认方法及装置
CN106815746A (zh) 一种网络问卷调查可信度评估方法
US20140156673A1 (en) Measuring and altering topic influence on edited and unedited media
CN103150333A (zh) 微博媒体中的意见领袖识别方法
CN111079029B (zh) 敏感账号的检测方法、存储介质和计算机设备
CN106909638A (zh) 一种基于用户查询日志实时发现热点视频的方法和装置
Strupczewski et al. On seasonal approach to flood frequency modelling. Part I: Two‐component distribution revisited
CN111949848B (zh) 一种基于特定事件的跨平台传播态势评估及分级方法
US20170323210A1 (en) Techniques for prediction of popularity of media
Jorde Allele frequency covariance among cohorts and its use in estimating effective size of age‐structured populations
CN108596276A (zh) 基于特征加权的朴素贝叶斯微博用户分类方法
Mignatti et al. Sex‐and age‐structured models for Alpine ibex Capra ibex ibex population dynamics
CN112711691A (zh) 网络舆情引导效果数据信息处理方法、系统、终端及介质
Zhao et al. Teenagers’ stress detection based on time-sensitive micro-blog comment/response actions
Xu et al. LSDSCC: a large scale domain-specific conversational corpus for response generation with diversity oriented evaluation metrics

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant