CN109783712A - 一种基于微博用户的社交网络分析方法及装置 - Google Patents

一种基于微博用户的社交网络分析方法及装置 Download PDF

Info

Publication number
CN109783712A
CN109783712A CN201811530577.8A CN201811530577A CN109783712A CN 109783712 A CN109783712 A CN 109783712A CN 201811530577 A CN201811530577 A CN 201811530577A CN 109783712 A CN109783712 A CN 109783712A
Authority
CN
China
Prior art keywords
user
power
region
information
influence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811530577.8A
Other languages
English (en)
Other versions
CN109783712B (zh
Inventor
吴壮伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201811530577.8A priority Critical patent/CN109783712B/zh
Publication of CN109783712A publication Critical patent/CN109783712A/zh
Application granted granted Critical
Publication of CN109783712B publication Critical patent/CN109783712B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明适用于数据挖掘技术领域,提供了一种基于微博用户的社交网络分析方法及装置,所述方法包括:确定进行社交网络分析的地域和第一微博用户,通过网络爬虫技术抓取所述第一微博用户的数据,根据所述数据,构建所述第一微博用户在所述地域的静态影响力和动态影响力,根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力,实现了结合地域因素的微博用户社交网络影响力的计算分析,得到更加精确的微博用户的社交网络影响力,从而为基于微博的拓展应用提供更加准确的理论基础。

Description

一种基于微博用户的社交网络分析方法及装置
技术领域
本发明属于数据挖掘技术领域,尤其涉及一种基于微博用户的社交网络分析方法及装置。
背景技术
随着互联网的快速发展,近些年来以微博为代表的社交媒体发展迅猛,微博已成为众用户信息发布、分享的首要平台,微博也是热点事件产生和扩散的重要场所。在微博平台上微博用户数量巨大,微博用户之间的关系结构纷繁复杂,其信息量相当庞大,微博用户的各种行为都对信息的传播起着影响,对微博用户的影响力进行合理的度量,为微博数据的利用提供量化数据,可以为微博的拓展应用提供理论基础,如微博的舆情监控、预警或营销推广等。
目前,针对微博用户的社交网络影响力的计算方法主要分两步:一是对微博用户信息和微博内容计算直接影响力;二是对微博用户的被关注用户信息计算间接影响力,根据直接影响力和间接影响力得到微博用户的社交网络影响力。现有的计算微博用户的社交网络影响力的方法仅考虑了微博用户的微博内容和被关注用户信息,考虑因素较少,导致计算的影响力数据不够精确,无法适用于具体的微博舆情监控、预警或营销推广等应用。
发明内容
有鉴于此,本发明实施例提供了一种基于微博用户的社交网络分析方法及装置,以解决现有技术中计算微博用户的社交网络影响力时考虑因素较少,无法精确计算微博用户的社交网络影响力的问题。
本发明实施例的第一方面提供了一种基于微博用户的社交网络分析方法,包括:
确定进行社交网络分析的地域和第一微博用户;
通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户;
根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力;
根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力;
根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力。
一种可能的实现方式中,所述静态影响力包括直接静态影响力和间接静态影响力,所述直接静态影响力为所述第一微博用户在所述地域内部的静态影响力,所述间接静态影响力为所述第一微博用户在所述地域之外的静态影响力;
所述根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力,包括:
判断所述被关注用户的所在地是否属于所述地域,若所述被关注用户的所在地属于所述地域,获取所述被关注用户的被关注用户数,根据所述被关注用户的被关注用户数计算所述直接静态影响力;
根据所述关注用户的信息和所述被关注用户的信息,确定第二微博用户,所述第二微博用户与所述第一微博用户互为关注用户和被关注用户,获取所述第二微博用户的被关注用户作为所述第一微博用户的间接被关注用户,判断所述间接被关注用户的所在地是否属于所述地域,若所述间接被关注用户的所在地属于所述地域,获取所述间接被关注用户的被关注用户数,根据所述间接被关注用户的被关注用户数计算所述间接静态影响力;
根据所述直接静态影响力和所述间接静态影响力,计算所述第一微博用户在所述地域的静态影响力。
一种可能的实现方式中,所述动态影响力包括转发动态影响力和评论动态影响力,所述转发动态影响力为第一转发用户转发所述微博内容的动态影响力,所述评论动态影响力为第一评论用户评论所述微博内容的动态影响力;
所述根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力,包括:
根据所述第一转发用户的信息,筛选所在地属于所述地域的第一转发用户,根据筛选的第一转发用户的个数计算所述转发动态影响力;
根据所述第一评论用户的信息,筛选所在地属于所述地域的第一评论用户,根据筛选的第一评论用户的个数计算所述评论动态影响力;
根据所述转发动态影响力和所述评论动态影响力,计算所述第一微博用户在所述地域的动态影响力。
一种可能的实现方式中,所述数据还包括点赞用户的信息,所述点赞用户为所述微博内容的点赞用户;
所述动态影响力包括转发动态影响力、评论动态影响力和点赞动态影响力,所述转发动态影响力为第一转发用户转发所述微博内容的动态影响力,所述评论动态影响力为第一评论用户评论所述微博内容的动态影响力,所述点赞动态影响力为点赞用户点赞所述微博内容的动态影响力;
所述根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力,包括:
根据所述第一转发用户的信息,筛选所在地属于所述地域的第一转发用户,根据筛选的第一转发用户的个数计算所述转发动态影响力;
根据所述第一评论用户的信息,筛选所在地属于所述地域的第一评论用户,根据筛选的第一评论用户的个数计算所述评论动态影响力;
根据所述点赞用户的信息,筛选所在地属于所述地域的点赞用户,根据筛选的点赞用户的个数计算所述点赞动态影响力;
根据所述转发动态影响力、所述评论动态影响力和所述点赞动态影响力,计算所述第一微博用户在所述地域的动态影响力。
一种可能的实现方式中,所述话题影响力包括转发话题影响力和评论话题影响力;
所述根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力,包括:
根据所述微博内容提取话题;
根据所述话题获取第二转发用户的信息和第二评论用户的信息,所述第二转发用户为所述话题的转发用户,所述第二评论用户为所述话题的评论用户;
根据所述第二转发用户的信息和所述第二评论用户的信息,构建所述第一微博用户在所述地域的话题影响力。
一种可能的实现方式中,所述话题影响力包括转发话题影响力和评论话题影响力;
所述根据所述第二转发用户的信息和所述第二评论用户的信息,构建所述第一微博用户在所述地域的话题影响力,包括:
根据所述第二转发用户的信息,筛选所在地属于所述地域的第二转发用户,根据筛选的第二转发用户的个数计算所述转发话题影响力;
根据所述第二评论用户的信息,筛选所在地属于所述地域的第二评论用户,根据筛选的第二评论用户的个数计算所述评论话题影响力;
根据所述转话题影响力和所述评论话题影响力,计算所述第一微博用户在所述地域的话题影响力。
本发明实施例的第二方面提供了一种基于微博用户的社交网络分析方法,包括:
确定进行社交网络分析的地域和第一微博用户;
通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户;
根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力;
根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力;
根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力;
根据所述静态影响力、所述动态影响力和所述话题影响力,计算所述第一微博用户在所述地域的社交网络影响力。
本发明实施例的第三方面提供了一种基于微博用户的社交网络分析装置,包括:
确定模块,用于确定进行社交网络分析的地域和第一微博用户;
抓取模块,用于通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户;
构建模块,用于根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力;
所述构建模块,还用于根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力;
计算模块,用于根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力。
本发明实施例的第四方面提供了一种基于微博用户的社交网络分析装置,包括:
确定模块,用于确定进行社交网络分析的地域和第一微博用户;
抓取模块,用于通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户;
构建模块,用于根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力;
所述构建模块,还用于根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力;
所述构建模块,还用于根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力;
计算模块,用于根据所述静态影响力、所述动态影响力和所述话题影响力,计算所述第一微博用户在所述地域的社交网络影响力。
本发明实施例的第五方面提供了一种终端设备,包括:
存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述所述方法的步骤。
本发明实施例的第六方面提供了一种计算机可读存储介质,包括:
所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述方法的步骤。
本发明提供了一种基于微博用户的社交网络分析方法及装置,所述方法包括:确定进行社交网络分析的地域和第一微博用户,通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户,根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力,根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力,根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力,实现了结合地域因素的微博用户社交网络影响力的计算分析,得到更加精确的微博用户的社交网络影响力,从而为基于微博的拓展应用提供更加准确的理论基础。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的一种基于微博用户的社交网络分析方法的实现流程示意图;
图2是本发明实施例二提供的一种基于微博用户的社交网络分析方法的实现流程示意图;
图3是本发明实施例三提供的一种构建第一微博用户在进行社交网络分析的地域的静态影响力方法的实现流程示意图;
图4是本发明实施例四提供的一种构建第一微博用户在进行社交网络分析的地域的动态影响力方法的实现流程示意图;
图5是本发明实施例五提供的另一种构建第一微博用户在进行社交网络分析的地域的动态影响力方法的实现流程示意图;
图6是本发明实施例六提供的一种构建第一微博用户在进行社交网络分析的地域的话题影响力方法的实现流程示意图;
图7是本发明实施例七提供的一种基于微博用户的社交网络分析装置的示意图;
图8是本发明实施例八提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1是本发明实施例一提供的一种基于微博用户的社交网络分析方法的实现流程示意图,本实施例的方法包括以下步骤:
步骤11、确定进行社交网络分析的地域和第一微博用户。
分别获取分析人员输入或选择的地域和第一微博用户,确定其为进行社交网络分析的地域和第一微博用户。可选的,进行社交网络分析的第一微博用户的所在地与进行社交网络分析的地域是无关的。第一微博用户所在地可以在进行社交网络分析的地域内,此时分析第一微博用户对其所属地的影响力,例如,第一微博用户在深圳,进行社交网络分析的地域为深圳或广东;第一微博用户所在地也可以不在进行社交网络分析的地域内,此时,分析的是第一微博用户对其所属地之外的某地域的影响力,例如,第一微博用户在深圳,进行社交网络分析的地域为上海。
可选的,若所述地域是由分析人员输入的,在确定其为进行社交网络分析的地域之前,对分析人员输入的地域进行合法性验证,并将验证结果发送给分析人员。
可选的,若所述第一微博用户是由分析人员输入的,在确定其为进行社交网络分析的第一微博用户之前,对分析人员输入的地域进行合法性验证。具体的,判断分析人员输入的第一微博用户是否存在于数据库中的注册表,若分析人员输入的第一微博用户存在于数据库中的注册表,表明该第一微博用户已经注册,该分析人员输入的第一微博用户是合法的;否则,表明该第一微博用户不存在,该分析人员的输入操作是不合法的。验证完毕后,向分析人员发送验证结果。
可选的,所述地域可以为一个,也可以为多个。当分析人员只分析微博用户在某一地域的社交网络影响力时,确定的地域为一个;当分析人员输入多个地域,预分析第一微博用户在不同地域的社交网络影响力差异时,确定的地域为多个。当确定的地域为多个时,该多个地域之间的关系可以为并列,如广州和深圳,也可以为包含,如广东和深圳,也可以为交叉,如沿海地区和华北地区。本实施例不作具体限定。
步骤12、通过网络爬虫技术抓取所述第一微博用户的数据。
以第一微博用户为抓取关键词,通过网络爬虫技术抓取与第一微博用户相关的数据。其中,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户。关注用户为第一微博用户关注的用户,被关注用户为关注第一微博用户的用户。微博内容可以为第一微博用户发布的原创微博内容,也可以为第一微博用户转发其他用户的微博内容。
为提高抓取数据的效率,本实施例中采用分布式爬虫的方式进行抓取。服务器将抓取任务通过消息队列发送给各个分布式节点进行执行,抓取完成后上传到服务器,实现了在不同的节点上同时运行不同的抓取任务,从而极大的提高程序的抓取效率。
步骤13、根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力。
静态影响力是第一微博用户对与其存在静态关系的其他微博用户产生的影响力,该静态关系包括关注关系和被关注关系。第一微博用户在所述地域的静态影响力,即为第一微博用户对其关注用户和被关注用户在进行社交网络分析的地域产生的影响力。第一微博用户在进行社交网络分析的地域的静态影响力具体根据关注用户的信息和被关注用户的信息计算得到。
步骤14、根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力。
动态影响力是第一微博用户对与其存在动态关系的其他微博用户产生的影响力,该动态关系包括转发关系和评论关系,与第一微博用户之间存在转发关系的微博用户,即第一转发用户,转发了第一微博用户发布的微博内容,与第一微博用户之间存在评论关系的微博用户,即第一评论用户,评论了第一微博用户发布的微博内容。第一微博用户在进行社交网络分析的地域的动态影响力,即为第一微博用户对转发或评论过其微博内容的微博用户在进行社交网络分析的地域产生的影响力。第一微博用户在进行社交网络分析的地域的动态影响力具体根据第一转发用户的信息和第一评论用户的信息计算得到。
步骤15、根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力。
本实施例中,社交网络影响力包括静态影响力和动态影响力,根据抓取的第一微博用户的数据,分别计算静态影响力和动态影响力,再根据计算得到的静态影响力和动态影响力,计算第一微博用户在进行社交网络分析的地域的社交网络影响力。
可选的,根据步骤13得到的静态影响力Static_Influence和步骤14得到的动态影响力Dynamic_Influence计算第一微博用户在进行社交网络分析的地域的社交网络影响力Influence时,可以将其直接求加和,得到第一微博用户在进行社交网络分析的地域的社交网络影响力,表示为社交网络影响力Influence=Static_Influence+Dynamic_Influence。或者,根据静态影响力Static_Influence和动态影响力Dynamic_Influence的重要性划分权重,再求其加权和,得到第一微博用户在进行社交网络分析的地域的社交网络影响力,表示为社交网络影响力Influence=a1*Static_Influence+b1*Dynamic_Influence,其中,a1、b1分别为静态影响力和动态影响力的权重。实际应用中,结合具体情况,可以选择上述计算社交网络影响力的方式中的任一种进行计算,当然,还可以是其他方式,本实施不做具体限定。
本实施例在现有的社交网络影响力的计算基础上,增加了地域因素,实现了结合地域因素的微博用户社交网络影响力的计算分析,得到更加精确的微博用户的社交网络影响力,从而为基于微博的拓展应用,例如根据社交网络影响力的大小,选取影响力较大的微博用户在微博平台进行营销推广,或者根据影响力进行微博舆情分析、预警等拓展应用,提供了更加准确的理论基础。
本实施例提供了一种基于微博用户的社交网络分析方法,包括:确定进行社交网络分析的地域和第一微博用户,通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户,根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力,根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力,根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力,实现了结合地域因素的微博用户社交网络影响力的计算分析,得到更加精确的微博用户的社交网络影响力,从而为基于微博的拓展应用提供更加准确的理论基础。
图2是本发明实施例二提供的一种基于微博用户的社交网络分析方法的实现流程示意图,本实施例的方法是在实施例一的基础上,考虑话题因素对社交网络分析的影响。本实施例的方法包括以下步骤:
步骤21、确定进行社交网络分析的地域和第一微博用户。
步骤22、通过网络爬虫技术抓取所述第一微博用户的数据。
步骤23、根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力。
步骤24、根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力。
本实施例步骤21至步骤24分别对应实施例一的步骤11至步骤14,参考实施例一的步骤11至步骤14中相应的描述,其实现原理和技术效果类似,此处不再赘述。
步骤25、根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力。
话题影响力是第一微博用户发布的微博内容对进行社交网络分析的地域内产生的影响力。第一微博用户在进行社交网络分析的地域的话题影响力具体根据其发布的微博内容计算得到。其中,第一微博用户发布的微博内容包括其原创的微博内容和其转发其他微博用户的微博内容。
步骤26、根据所述静态影响力、所述动态影响力和所述话题影响力,计算所述第一微博用户在所述地域的社交网络影响力。
本实施例中,社交网络影响力包括静态影响力、动态影响力和话题影响力,根据抓取的第一微博用户的数据,分别计算静态影响力、动态影响力和话题影响力,再根据计算得到的静态影响力、动态影响力和话题影响力,计算第一微博用户在进行社交网络分析的地域的社交网络影响力。
可选的,根据步骤23得到的静态影响力Static_Influence、步骤24得到的动态影响力Dynamic_Influence和步骤25得到的话题影响力Topic_Influence计算第一微博用户在进行社交网络分析的地域的社交网络影响力Influence时,可以将其直接求加和,得到第一微博用户在进行社交网络分析的地域的社交网络影响力,表示为Influence=Static_Influence+Dynamic_Influence+Topic_Influence。
可以根据静态影响力Static_Influence、动态影响力Dynamic_Influence和话题影响力Topic_Influence的重要性划分权重,再求加权和,得到第一微博用户在进行社交网络分析的地域的社交网络影响力,表示为Influence=a2*Static_Influence+b2*Dynamic_Influence+c2*Topic_Influence,其中,a2、b2、c2分别为静态影响力、动态影响力和话题影响力的权重。实际应用中,结合具体情况,可以选择上述计算社交网络影响力的方式中的任一种进行计算,当然,还可以是其他方式,本实施不做具体限定。
本实施例在现有的社交网络影响力的计算基础上,增加了话题因素和地域因素,实现了结合话题因素和地域因素的微博用户社交网络影响力的计算分析,得到更加精确的微博用户的社交网络影响力,从而为基于微博的拓展应用,例如根据社交网络影响力的大小,选取影响力较大的微博用户在微博平台进行营销推广,或者根据影响力进行微博舆情分析、预警等拓展应用,提供了更加准确的理论基础。
图3是本发明实施例三提供的一种构建第一微博用户在进行社交网络分析的地域的静态影响力方法的实现流程示意图,是图1所示实施例一的步骤13或图2所示实施例二的步骤23的一种可能的实现方式。在本实施例中,所述静态影响力包括直接静态影响力和间接静态影响力,所述直接静态影响力为所述第一微博用户在所述地域内部的静态影响力,所述间接静态影响力为所述第一微博用户在所述地域之外的静态影响力。如图3所示,本实施例的方法包括以下步骤:
步骤301、判断所述被关注用户的所在地是否属于所述地域。
步骤302、若所述被关注用户的所在地属于所述地域,获取所述被关注用户的被关注用户数。
步骤303、根据所述被关注用户的被关注用户数计算所述直接静态影响力。
步骤301至步骤303用于计算直接静态影响力。具体的,根据被关注用户的信息获取第一微博用户的被关注用户的所在地,判断被关注用户的所在地是否包含在进行社交网络分析的地域范围内,若被关注用户的所在地包含在进行社交网络分析的地域范围内,则该第一微博用户对该被关注用户存在影响;若被关注用户的所在地不包含在进行社交网络分析的地域范围内,则该第一微博用户对该被关注用户不存在影响,即影响力为零。
举例说明,进行社交网络分析的地域为A,第一微博用户为B,该第一微博用户B的被关注用户(即粉丝)为fan,判断fan的所在地是否属于地域A,若属于,B在地域A影响fan,若不属于,B在地域A不影响fan。
第一微博用户对被关注用户存在影响时,影响力的大小由被关注用户的被关注用户数确定,具体的:获取存在影响的被关注用户的被关注用户数,将所有存在影响的被关注用户的被关注用户数求加和,即为第一微博用户在进行社交网络分析的地域的直接静态影响力。
仍以上述举例进行说明,当B影响被关注用户fan时,B对被关注用户fan的影响力大小即为被关注用户fan的被关注用户数ffan;当B不影响fan时,B对fan的影响力大小即为0。获取第一微博用户B的所有被关注用户{fan1,fan2,…,fani,…,fanN}对应的被关注用户数{ffan1,ffan2,…,ffani,…,ffanN},将所有存在影响的被关注用户的被关注用户数求加和,得到第一微博用户B在地域A的直接静态影响力,表示为:其中,N为第一微博用户B的被关注用户的个数,i为不大于N的正整数,fani_is_regionA为判断第i个被关注用户fan是否属于地域A,若属于,fani_is_regionA为1,若不属于,fani_is_regionA为0。
步骤304、根据所述关注用户的信息和所述被关注用户的信息,确定第二微博用户。
其中,所述第二微博用户与所述第一微博用户互为关注用户和被关注用户。
步骤305、获取所述第二微博用户的被关注用户作为所述第一微博用户的间接被关注用户。
具体的,根据第一微博用的关注用户和被关注用户,确定第二微博用户,该第二微博用户满足与第一微博用户互为关注用户和被关注用户的条件,即,该第二微博用户既是第一微博用户的关注用户,同时是第一微博用户的被关注用户。将第二微博用户的被关注用户作为第一微博用户的间接被关注用户。
将第二微博用户记为C,该第二微博用户C既是第一微博用户B的关注用户,同时也是第一微博用户B的被关注用户。将第二微博用户C的被关注用户Cfan作为第一微博用户B的间接被关注用户。
步骤306、判断所述间接被关注用户的所在地是否属于所述地域。
步骤307、若所述间接被关注用户的所在地属于所述地域,获取所述间接被关注用户的被关注用户数。
步骤308、根据所述间接被关注用户的被关注用户数计算所述间接静态影响力。
步骤306至步骤308用于计算间接静态影响力。具体的,根据第一微博用户B的间接被关注用户Cfan计算间接静态影响力Indirect_Static_Influence的计算方法,与根据第一微博用户B的被关注用户fan计算直接静态影响力Direct_Static_Influence的计算方法相同,判断Cfan的所在地是否属于地域A,若属于,B在地域A影响Cfan,若不属于,B在地域A不影响Cfan。采用上述步骤301至步骤303描述的相同方法,得到第一微博用户B在地域A的间接静态影响力,表示为:其中,Cffan为间接被关注用户Cfan的被关注用户数,M为第一微博用户B的间接被关注用户的个数(即第二微博用户C的被关注用户的个数),i为不大于M的正整数,Cfani_is_regionA为判断第i个间接被关注用户Cfan是否属于地域A,若属于,Cfani_is_regionA为1,若不属于,Cfani_is_regionA为0。
步骤309、根据所述直接静态影响力和所述间接静态影响力,计算所述第一微博用户在所述地域的静态影响力。
可选的,将步骤303计算的直接静态影响力Direct_Sta tic_Influe nce和步骤308计算的间接静态影响力Indirect_Static_Influence直接求加和,得到第一微博用户在进行社交网络分析的地域的静态影响力,表示为静态影响力
或者,根据直接静态影响力Direct_Sta tic_Influe nce和间接静态影响力Indirect_Static_Influence的重要性确定权重,求其加权和,得到第一微博用户在进行社交网络分析的地域的静态影响力,表示为静态影响力 其中,s1、t1分别为直接静态影响力和间接静态影响力的权重。
实际应用中,结合具体情况,可以选择上述计算社交网络影响力的方式中的任一种进行计算,当然,还可以是其他方式,本实施不做具体限定。
本实施例在现有的社交网络静态影响力的计算基础上,增加了地域因素,通过分别计算基于地域的直接静态影响力和基于地域的间接静态影响力,得到了基于地域的静态影响力,结合了地域因素的社交网络静态影响力使得社交网络分析更加精确。
图4是本发明实施例四提供的一种构建第一微博用户在进行社交网络分析的地域的动态影响力方法的实现流程示意图,是图1所示实施例一的步骤14或图2所示实施例二的步骤24的一种可能的实现方式。在本实施例中,所述动态影响力包括转发动态影响力和评论动态影响力,所述转发动态影响力为第一转发用户转发所述微博内容的动态影响力,所述评论动态影响力为第一评论用户评论所述微博内容的动态影响力。如图4所示,本实施例的方法包括以下步骤:
步骤401、根据所述第一转发用户的信息,筛选所在地属于所述地域的第一转发用户。
步骤402、根据筛选的第一转发用户的个数计算所述转发动态影响力。
步骤401和步骤402用于计算转发动态影响力。具体的,根据第一转发用户的信息获取第一转发用户的所在地,判断第一转发用户的所在地是否包含在进行社交网络分析的地域范围内,若第一转发用户的所在地包含在进行社交网络分析的地域范围内,则该第一微博用户对转发其微博内容的第一转发用户产生影响,所有第一转发用户转发产生的影响力大小相等,均为一大于零的定值,该定值由用户设定;若第一转发用户的所在地不包含在进行社交网络分析的地域范围内,则该第一微博用户对转发其微博内容的第一转发用户不产生影响,即影响力为零。
从所有第一转发用户中筛选第一转发用户所在地包含在进行社交网络分析的地域范围内的第一转发用户,得到筛选的第一转发用户的个数,由于第一微博用户对一个第一转发用户的影响力为一定值,由此根据在进行社交网络分析的地域范围内的第一转发用户的个数计算转发动态影响力的大小。
举例说明,进行社交网络分析的地域为A,第一微博用户为B,转发第一微博用户B的微博内容的第一转发用户为fwd,判断fwd的所在地是否属于地域A,若属于,B在地域A影响fwd,B对一个fwd的影响力的大小为Value1,若不属于,B在地域A不影响fwd。从所有第一转发用户中筛选其所在地包含在地域A的第一转发用户,得到筛选的fwd的个数为S,第一微博用户B在地域A的转发动态影响力,表示为其中,S为第一转发用户的个数,i为不大于S的正整数,Value1为预设的大于0的定值,fwdi_is_regionA为判断第一转发用户的所在地是否属于地域A,若属于,fwdi_is_regionA为1,若不属于,fwdi_is_regionA为0。
步骤403、根据所述第一评论用户的信息,筛选所在地属于所述地域的第一评论用户。
步骤404、根据筛选的第一评论用户的个数计算所述评论动态影响力。
步骤403和步骤404用于计算评论动态影响力。根据第一评论用户的信息计算评论动态影响力Cmt_Dynamic_Influence的计算方法,与根据第一转发用户的信息计算转发动态影响力Fwd_Dynamic_Influence的计算方法相同。第一微博用户B对一个第一评论用户Cmt的影响力的大小为Value2,该值由用户设定,可以与Value1相等,也可以与Value1不相等。采用上述步骤401和步骤402描述的相同方法,得到第一微博用户B在地域A的评论动态影响力,表示为:其中,L为第一评论用户的个数,i为不大于L的正整数,Value2为预设的大于0的定值,cmti_is_regionA为判断第一评论用户的所在地是否属于地域A,若属于,cmti_is_regionA为1,若不属于,cmti_is_regionA为0。
步骤405、根据所述转发动态影响力和所述评论动态影响力,计算所述第一微博用户在所述地域的动态影响力。
可选的,将步骤402计算的转发动态影响力Fwd_Dynamic_Influence和步骤404计算的评论动态影响力Cmt_Dynamic_Influence直接求加和,得到第一微博用户在进行社交网络分析的地域的动态影响力,表示为动态影响力
或者,根据转发动态影响力Fwd_Dynamic_Influence和评论动态影响力Cmt_Dynamic_Influence的重要性确定权重,求其加权和,得到第一微博用户在进行社交网络分析的地域的动态影响力,表示为动态影响力 其中,s2、t2分别为转发动态影响力和评论动态影响力的权重。
从而,根据实施例三得到的静态影响力和实施例四得到的动态影响力,计算实施例一的第一微博用户在进行社交网络分析的地域的社交网络影响力。
本实施例在现有的社交网络动态影响力的计算基础上,增加了地域因素,通过分别计算基于地域的转发动态影响力和基于地域的评论动态影响力,得到了基于地域的动态影响力,结合了地域因素的社交网络动态影响力使得社交网络分析更加精确。
图5是本发明实施例五提供的另一种构建第一微博用户在进行社交网络分析的地域的动态影响力方法的实现流程示意图,是图1所示实施例一的步骤14或图2所示实施例二的步骤24的另一种可能的实现方式,相较于实施例四,在计算动态影响力时考虑了点赞操作的动态影响。在本实施例中,通过网络爬虫技术抓取的第一微博用户的数据还包括点赞用户的信息,所述点赞用户为所述微博内容的点赞用户。本实施例的动态影响力包括转发动态影响力、评论动态影响力和点赞动态影响力,所述转发动态影响力为第一转发用户转发所述微博内容的动态影响力,所述评论动态影响力为第一评论用户评论所述微博内容的动态影响力,所述点赞动态影响力为点赞用户点赞所述微博内容的动态影响力。如图5所示,本实施例的方法包括以下步骤:
步骤501、根据所述第一转发用户的信息,筛选所在地属于所述地域的第一转发用户。
步骤502、根据筛选的第一转发用户的个数计算所述转发动态影响力。
步骤503、根据所述第一评论用户的信息,筛选所在地属于所述地域的第一评论用户。
步骤504、根据筛选的第一评论用户的个数计算所述评论动态影响力。
本实施例步骤步骤501至步骤504分别对应实施例四的步骤401至步骤404,参考实施例四的步骤401至步骤404中相应的描述,其实现原理和技术效果类似,此处不再赘述。
步骤505、根据所述点赞用户的信息,筛选所在地属于所述地域的点赞用户。
步骤506、根据筛选的点赞用户的个数计算所述点赞动态影响力。
步骤505和步骤506用于计算点赞动态影响力。根据点赞用户的信息计算点赞动态影响力Like_Dynamic_Influence的计算方法,与根据第一转发用户的信息计算转发动态影响力Fwd_Dynamic_Influence的计算方法相同。第一微博用户B对一个点赞用户Like的影响力的大小为Value3,该值由用户设定,可以与Value1或Value2相等,也可以与Value1或Value2不相等。采用上述步骤501和步骤502描述的相同方法,得到第一微博用户B在地域A的点赞动态影响力,表示为:其中,T为点赞用户的个数,i为不大于T的正整数,Value3为预设的大于0的定值,likei_is_regionA为判断点赞用户的所在地是否属于地域A,若属于,likei_is_regionA为1,若不属于,likei_is_regionA为0。
步骤507、根据所述转发动态影响力、所述评论动态影响力和所述点赞动态影响力,计算所述第一微博用户在所述地域的动态影响力。
可选的,将步骤502计算的转发动态影响力Fwd_Dynamic_Influence、步骤504计算的评论动态影响力Cmt_Dynamic_Influence和步骤506计算的点赞动态影响力Like_Dynamic_Influence直接求加和,得到第一微博用户在进行社交网络分析的地域的动态影响力,表示为动态影响力
或者,根据转发动态影响力Fwd_Dynamic_Influence、评论动态影响力Cmt_Dynamic_Influence和点赞动态影响力Like_Dynamic_Influence的重要性确定权重,求其加权和,得到第一微博用户在进行社交网络分析的地域的动态影响力,表示为动态影响力 其中,s3、t3、w3分别为转发动态影响力、评论动态影响力和点赞动态影响力的权重。
从而,根据实施例三得到的静态影响力和实施例五得到的动态影响力,计算实施例一的第一微博用户在进行社交网络分析的地域的社交网络影响力。
本实施例在现有的社交网络动态影响力的计算基础上,考虑了点赞操作对动态影响力的影响,同时增加了地域因素,通过分别计算基于地域的转发动态影响力、基于地域的评论动态影响力和基于地域的点赞动态影响力,得到了基于地域的动态影响力,结合了点赞、地域因素的社交网络动态影响力使得社交网络分析更加精确。
图6是本发明实施例六提供的一种构建第一微博用户在进行社交网络分析的地域的话题影响力方法的实现流程示意图,是图2所示实施例二的步骤25的一种可能的实现方式。如图6所示,根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力具体包括以下步骤:
步骤601、根据所述微博内容提取话题。
话题为微博内容的主题或关键词,基于微博用户发布或转发的微博内容,可以通过分词、词频-逆文本频率指数(Term Frequency-Inverse Document Frequency,TF-IDF)矩阵抽取关键词、潜狄利克雷分配(Latent Dirichlet Allocation,LDA)模型等方式提取微博内容的话题。
可选的,微博用户可以根据微博定义的特殊符号定义话题,例如采用特殊符号“#”标示话题,根据微博用户发布的微博内容提取话题时,查找微博内容中是否存在相匹配的“#”,若微博内容中存在相匹配的“#”,匹配的“#”之间的内容确定为提取的话题,例如,微博内容为“#xx市天气#晴,最高气温25摄氏度,最低气温11摄氏度,吹2-3级西南风”,根据特殊符号提取的话题为“xx市天气”。
可选的,也可以根据微博用户发布的微博内容的语义确定话题,例如,微博内容为“明天xx市,晴,最高气温25摄氏度,最低气温11摄氏度,吹2-3级西南风”,根据语义分析得到的话题为“明天xx市天气”。
可选的,还可以根据微博用户发布的微博内容中实词出现的次数确定话题,仍以上述举例说明,微博内容为“明天xx市,晴,最高气温25摄氏度,最低气温11摄氏度,吹2-3级西南风”,根据实词出现的次数提取的话题为“气温”。
也可以为其他可选的方式,此处不再一一赘述。实际应用中,可以结合实际情况,选择多种提取话题的方式同时提取,以确保提取的话题的准确性。
步骤602、根据所述话题获取第二转发用户的信息和第二评论用户的信息。其中,所述第二转发用户为所述话题的转发用户,所述第二评论用户为所述话题的评论用户。
根据提取的话题,以该话题为抓取关键词,通过网络爬虫技术获取转发或评论过该话题的用户,确定转发过该话题的用户为第二转发用户,确定评论过该话题的用户为第二评论用户。
步骤603、根据所述第二转发用户的信息和所述第二评论用户的信息,构建所述第一微博用户在所述地域的话题影响力。
在本实施例中,所述话题影响力包括转发话题影响力和评论话题影响力。话题的转发用户在进行社交网络分析的地域产生的影响力为转发话题影响力,话题的评论用户在进行社交网络分析的地域产生的影响力为评论话题影响力。
可选的,步骤603具体包括以下步骤:
S1、根据所述第二转发用户的信息,筛选所在地属于所述地域的第二转发用户。
S2、根据筛选的第二转发用户的个数计算所述转发话题影响力。
S3、根据所述第二评论用户的信息,筛选所在地属于所述地域的第二评论用户。
S4、根据筛选的第二评论用户的个数计算所述评论话题影响力。
S5、根据所述转话题影响力和所述评论话题影响力,计算所述第一微博用户在所述地域的话题影响力。
S1至S5为根据所述话题的第二转发用户和所述话题的第二评论用户计算所述第一微博用户在进行社交网络分析的地域的话题影响力Topic_Influence,与实施例四中步骤401至步骤405描述的根据所述微博内容的第一转发用户和所述微博内容的第一评论用户计算所述第一微博用户在进行社交网络分析的地域的动态影响力的方法相同,参见实施例四中步骤401至步骤405中相应的描述,其实现原理类似,此处不再赘述。
可选的,步骤603还可以考虑点赞话题影响力,点赞话题影响力的计算方法参见实施例五中的步骤505和506计算的点赞动态影响力,其实现原理类似,此处不再赘述。
从而,根据实施例三得到的静态影响力、实施例四或实施例五得到的动态影响力,以及实施例六得到的话题影响力,得到实施例二的第一微博用户在进行社交网络分析的地域的社交网络影响力。
本实施例在现有的社交网络影响力的计算基础上,考虑了话题和地域因素对影响力的影响,通过分别计算基于地域的转发话题影响力和基于地域的评论话题影响力,得到了基于地域的话题影响力,结合了地域因素的社交网络话题影响力使得社交网络分析更加精确。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
图7是本发明实施例七提供的一种基于微博用户的社交网络分析装置的示意图,如图7所示,在一种可能的实现方式中,本实施例的装置包括以下模块:
确定模块71,用于确定进行社交网络分析的地域和第一微博用户。
抓取模块72,用于通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户。
构建模块73,用于根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力。
所述构建模块73,还用于根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力。
计算模块74,用于根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力。
本实施例提供的一种基于微博用户的社交网络分析装置,用于实现实施例一所述的基于微博用户的社交网络分析方法,其中各个模块的功能可以参考方法实施例中相应的描述,其实现原理和技术效果类似,此处不再赘述。
同样如图7所示,在另一种可能的实现方式中,本实施例的装置包括以下模块:
确定模块71,用于确定进行社交网络分析的地域和第一微博用户。
抓取模块72,用于通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户。
构建模块73,用于根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力。
所述构建模块73,还用于根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力。
所述构建模块73,还用于根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力。
计算模块74,用于根据所述静态影响力、所述动态影响力和所述话题影响力,计算所述第一微博用户在所述地域的社交网络影响力。
本实施例提供的另一种基于微博用户的社交网络分析装置,用于实现实施例二所述的基于微博用户的社交网络分析方法,其中各个模块的功能可以参考方法实施例中相应的描述,其实现原理和技术效果类似,此处不再赘述。
图8是本发明实施例八提供的终端设备的示意图。如图8所示,该实施例的终端设备8包括:处理器80、存储器81以及存储在所述存储器81中并可在所述处理器80上运行的计算机程序82,例如基于微博用户的社交网络分析程序。所述处理器80执行所述计算机程序82时实现上述各个基于微博用户的社交网络分析方法实施例中的步骤,例如图1所示的步骤11至15。或者,所述处理器80执行所述计算机程序82时实现上述各装置实施例中各模块的功能,例如图7所示模块71至74的功能。
示例性的,所述计算机程序82可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器81中,并由所述处理器80执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序82在所述终端设备8中的执行过程。例如,所述计算机程序82可以被分割成确定模块、抓取模块、构建模块、计算模块(虚拟装置中的单元模块),各模块具体功能如下:
确定模块,用于确定进行社交网络分析的地域和第一微博用户;
抓取模块,用于通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户;
构建模块,用于根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力;
所述构建模块,还用于根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力;
计算模块,用于根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力。
所述终端设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备8可包括,但不仅限于,处理器80、存储器81。本领域技术人员可以理解,图8仅仅是终端设备8的示例,并不构成对终端设备8的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备8还可以包括输入输出设备、网络接入设备、总线等。
所称处理器80可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器81可以是所述终端设备8的内部存储单元,例如终端设备8的硬盘或内存。所述存储器81也可以是所述终端设备8的外部存储设备,例如所述终端设备8上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器81还可以既包括所述终端设备8的内部存储单元也包括外部存储设备。所述存储器81用于存储所述计算机程序以及所述终端设备8所需的其他程序和数据。所述存储器81还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述终端设备的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种基于微博用户的社交网络分析方法,其特征在于,包括:
确定进行社交网络分析的地域和第一微博用户;
通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户;
根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力;
根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力;
根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力。
2.如权利要求1所述的方法,其特征在于,所述根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力之后,还包括:根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力;
所述根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力,相应的成为:根据所述静态影响力、所述动态影响力和所述话题影响力,计算所述第一微博用户在所述地域的社交网络影响力。
3.如权利要求1或2所述的方法,其特征在于,所述静态影响力包括直接静态影响力和间接静态影响力,所述直接静态影响力为所述第一微博用户在所述地域内部的静态影响力,所述间接静态影响力为所述第一微博用户在所述地域之外的静态影响力;
所述根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力,包括:
判断所述被关注用户的所在地是否属于所述地域,若所述被关注用户的所在地属于所述地域,获取所述被关注用户的被关注用户数,根据所述被关注用户的被关注用户数计算所述直接静态影响力;
根据所述关注用户的信息和所述被关注用户的信息,确定第二微博用户,所述第二微博用户与所述第一微博用户互为关注用户和被关注用户,获取所述第二微博用户的被关注用户作为所述第一微博用户的间接被关注用户,判断所述间接被关注用户的所在地是否属于所述地域,若所述间接被关注用户的所在地属于所述地域,获取所述间接被关注用户的被关注用户数,根据所述间接被关注用户的被关注用户数计算所述间接静态影响力;
根据所述直接静态影响力和所述间接静态影响力,计算所述第一微博用户在所述地域的静态影响力。
4.如权利要求1或2所述的方法,其特征在于,所述动态影响力包括转发动态影响力和评论动态影响力,所述转发动态影响力为第一转发用户转发所述微博内容的动态影响力,所述评论动态影响力为第一评论用户评论所述微博内容的动态影响力;
所述根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力,包括:
根据所述第一转发用户的信息,筛选所在地属于所述地域的第一转发用户,根据筛选的第一转发用户的个数计算所述转发动态影响力;
根据所述第一评论用户的信息,筛选所在地属于所述地域的第一评论用户,根据筛选的第一评论用户的个数计算所述评论动态影响力;
根据所述转发动态影响力和所述评论动态影响力,计算所述第一微博用户在所述地域的动态影响力。
5.如权利要求1或2所述的方法,其特征在于,所述数据还包括点赞用户的信息,所述点赞用户为所述微博内容的点赞用户;
所述动态影响力包括转发动态影响力、评论动态影响力和点赞动态影响力,所述转发动态影响力为第一转发用户转发所述微博内容的动态影响力,所述评论动态影响力为第一评论用户评论所述微博内容的动态影响力,所述点赞动态影响力为点赞用户点赞所述微博内容的动态影响力;
所述根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力,包括:
根据所述第一转发用户的信息,筛选所在地属于所述地域的第一转发用户,根据筛选的第一转发用户的个数计算所述转发动态影响力;
根据所述第一评论用户的信息,筛选所在地属于所述地域的第一评论用户,根据筛选的第一评论用户的个数计算所述评论动态影响力;
根据所述点赞用户的信息,筛选所在地属于所述地域的点赞用户,根据筛选的点赞用户的个数计算所述点赞动态影响力;
根据所述转发动态影响力、所述评论动态影响力和所述点赞动态影响力,计算所述第一微博用户在所述地域的动态影响力。
6.如权利要求2所述的方法,其特征在于,所述话题影响力包括转发话题影响力和评论话题影响力;
所述根据所述微博内容,构建所述第一微博用户在所述地域的话题影响力,包括:
根据所述微博内容提取话题;
根据所述话题获取第二转发用户的信息和第二评论用户的信息,所述第二转发用户为所述话题的转发用户,所述第二评论用户为所述话题的评论用户;
根据所述第二转发用户的信息和所述第二评论用户的信息,构建所述第一微博用户在所述地域的话题影响力。
7.如权利要求6所述的方法,其特征在于,所述话题影响力包括转发话题影响力和评论话题影响力;
所述根据所述第二转发用户的信息和所述第二评论用户的信息,构建所述第一微博用户在所述地域的话题影响力,包括:
根据所述第二转发用户的信息,筛选所在地属于所述地域的第二转发用户,根据筛选的第二转发用户的个数计算所述转发话题影响力;
根据所述第二评论用户的信息,筛选所在地属于所述地域的第二评论用户,根据筛选的第二评论用户的个数计算所述评论话题影响力;
根据所述转话题影响力和所述评论话题影响力,计算所述第一微博用户在所述地域的话题影响力。
8.一种基于微博用户的社交网络分析装置,其特征在于,包括:
确定模块,用于确定进行社交网络分析的地域和第一微博用户;
抓取模块,用于通过网络爬虫技术抓取所述第一微博用户的数据,所述数据包括所述第一微博用户的关注用户的信息、被关注用户的信息、第一转发用户的信息、第一评论用户的信息和微博内容,其中,第一转发用户为所述微博内容的转发用户,第一评论用户为所述微博内容的评论用户;
构建模块,用于根据所述关注用户的信息和所述被关注用户的信息,构建所述第一微博用户在所述地域的静态影响力;
所述构建模块,还用于根据所述第一转发用户的信息和所述第一评论用户的信息,构建所述第一微博用户在所述地域的动态影响力;
计算模块,用于根据所述静态影响力和所述动态影响力,计算所述第一微博用户在所述地域的社交网络影响力。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN201811530577.8A 2018-12-14 2018-12-14 一种基于微博用户的社交网络分析方法及装置 Active CN109783712B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811530577.8A CN109783712B (zh) 2018-12-14 2018-12-14 一种基于微博用户的社交网络分析方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811530577.8A CN109783712B (zh) 2018-12-14 2018-12-14 一种基于微博用户的社交网络分析方法及装置

Publications (2)

Publication Number Publication Date
CN109783712A true CN109783712A (zh) 2019-05-21
CN109783712B CN109783712B (zh) 2023-10-17

Family

ID=66496948

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811530577.8A Active CN109783712B (zh) 2018-12-14 2018-12-14 一种基于微博用户的社交网络分析方法及装置

Country Status (1)

Country Link
CN (1) CN109783712B (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104008182A (zh) * 2014-06-10 2014-08-27 盐城师范学院 社交网络交流影响力的测定方法及系统
CN105205146A (zh) * 2015-09-18 2015-12-30 国家计算机网络与信息安全管理中心 一种计算微博用户影响力的方法
CN105260474A (zh) * 2015-10-29 2016-01-20 俞定国 一种基于信息交互网络的微博用户影响力计算方法
US20160117328A1 (en) * 2013-06-03 2016-04-28 Hewlett-Packard Development Company, L.P. Influence score of a social media domain
US20170140397A1 (en) * 2015-11-18 2017-05-18 Estia, Inc. Measuring influence propagation within networks
CN106980692A (zh) * 2016-05-30 2017-07-25 国家计算机网络与信息安全管理中心 一种基于微博特定事件的影响力计算方法
US20170277691A1 (en) * 2016-03-22 2017-09-28 Facebook, Inc. Quantifying Social Influence
CN108960562A (zh) * 2018-05-18 2018-12-07 深圳市和讯华谷信息技术有限公司 一种区域影响力评估方法及装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160117328A1 (en) * 2013-06-03 2016-04-28 Hewlett-Packard Development Company, L.P. Influence score of a social media domain
CN104008182A (zh) * 2014-06-10 2014-08-27 盐城师范学院 社交网络交流影响力的测定方法及系统
CN105205146A (zh) * 2015-09-18 2015-12-30 国家计算机网络与信息安全管理中心 一种计算微博用户影响力的方法
CN105260474A (zh) * 2015-10-29 2016-01-20 俞定国 一种基于信息交互网络的微博用户影响力计算方法
US20170140397A1 (en) * 2015-11-18 2017-05-18 Estia, Inc. Measuring influence propagation within networks
US20170277691A1 (en) * 2016-03-22 2017-09-28 Facebook, Inc. Quantifying Social Influence
CN106980692A (zh) * 2016-05-30 2017-07-25 国家计算机网络与信息安全管理中心 一种基于微博特定事件的影响力计算方法
CN108960562A (zh) * 2018-05-18 2018-12-07 深圳市和讯华谷信息技术有限公司 一种区域影响力评估方法及装置

Also Published As

Publication number Publication date
CN109783712B (zh) 2023-10-17

Similar Documents

Publication Publication Date Title
Chen et al. Phishing scams detection in ethereum transaction network
CN105260474B (zh) 一种基于信息交互网络的微博用户影响力计算方法
Yuan et al. Detecting phishing scams on ethereum based on transaction records
Narayanam et al. A shapley value-based approach to discover influential nodes in social networks
Zhou et al. A two-phase multiobjective evolutionary algorithm for enhancing the robustness of scale-free networks against multiple malicious attacks
Kolda et al. Counting triangles in massive graphs with MapReduce
CN107169873B (zh) 一种多特征融合的微博用户权威度评价方法
Yuan et al. ITARS: trust-aware recommender system using implicit trust networks
Liu et al. Fa-gnn: Filter and augment graph neural networks for account classification in ethereum
Liao et al. Predicting missing links via correlation between nodes
Sela et al. Active viral marketing: Incorporating continuous active seeding efforts into the diffusion model
CN103678436B (zh) 信息处理系统和信息处理方法
Xia et al. Effectively identifying the influential spreaders in large-scale social networks
Liu et al. Information diffusion and opinion leader mathematical modeling based on microblog
KR102086936B1 (ko) 사용자 데이터 공유 방법 및 디바이스
Deng et al. Highly efficient epidemic spreading model based LPA threshold community detection method
Chen et al. Understanding the user behavior of foursquare: A data-driven study on a global scale
Wu et al. Coritivity-based influence maximization in social networks
Sun et al. A parallel self-organizing overlapping community detection algorithm based on swarm intelligence for large scale complex networks
Derr et al. Relevance measurements in online signed social networks
Liu et al. Influence nodes identifying method via community-based backward generating network framework
Wang et al. High‐Order Degree and Combined Degree in Complex Networks
CN109783712A (zh) 一种基于微博用户的社交网络分析方法及装置
Xiao et al. Mpurank: A social hotspot tracking scheme based on tripartite graph and multimessages iterative driven
Liu et al. A new method of identifying core designers and teams based on the importance and similarity of networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant