CN103870534A - 社交网络分析 - Google Patents

社交网络分析 Download PDF

Info

Publication number
CN103870534A
CN103870534A CN201310682393.4A CN201310682393A CN103870534A CN 103870534 A CN103870534 A CN 103870534A CN 201310682393 A CN201310682393 A CN 201310682393A CN 103870534 A CN103870534 A CN 103870534A
Authority
CN
China
Prior art keywords
user
social
group
social networks
thermodynamic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310682393.4A
Other languages
English (en)
Other versions
CN103870534B (zh
Inventor
普拉迪克·库马尔·米什拉
迪内希·伯希纳尼
阿迪尔·拉希德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tata Consultancy Services Ltd
Original Assignee
Tata Consultancy Services Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tata Consultancy Services Ltd filed Critical Tata Consultancy Services Ltd
Publication of CN103870534A publication Critical patent/CN103870534A/zh
Application granted granted Critical
Publication of CN103870534B publication Critical patent/CN103870534B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N99/00Subject matter not provided for in other groups of this subclass

Abstract

公开了一种用于分析社交网络的方法和系统,该方法包括:由处理器将社交网络分成多个用户组,其中,每个用户组在该社交网络中具有唯一标识;由处理器从所述多个用户组中的用户组挖掘数据;从所述数据中识别多个社交变量,其中,所述多个社交变量包括用户数量、用户的联系、用户的交互、用户密切性和用户发表的帖子中的至少一个;将所述多个社交变量中的社交变量与多个热力学变量中的热力学变量等同;基于所述多个社交变量确定所述多个热力学变量的定量值;基于所述定量值生成虚拟热力学系统以分析所述社交网络。

Description

社交网络分析
相关申请及优先权的交叉引用
本申请要求于2012年12月12日提交的、申请号为3498/MUM/2012的印度临时专利申请的优先权,该临时专利申请的全部内容通过引用并入文本中。
技术领域
本文中记载的主题总体上涉及社交网络中的数据分析。
背景技术
诸如FacebookTM、TwitterTM、FoursquareTM、LinkedinTM等社交网络已能够吸引上百万用户。这些用户在这些社交网络上进行登记并进行各种活动,例如共享信息、建立群组、与他人进行联系、发表评论、共享情感,等等。每天在这些社交网络上进行着数百万计的活动。从这些社交网络中可以对用户的这些活动、喜好、习惯和人口概况进行数据挖掘。应当理解,从社交网络中挖掘或获取的数据可以有不同类型,和/或涉及用户社区或用户组的群体行为。由于该数据中存在复杂的关系,所以对该数据进行分析是很复杂的任务。
为了分析该数据,需要若干复杂算法用于理解数据之间的关系。由于用户行为的不确定性以及社交网络中不断变化的趋势,基于该数据分析得出结论则更加麻烦。可以对数据进行分析以在社交网络中进行商业相关活动。商业相关活动可以包括在社交网络中进行广告、或者产品或服务推广。
发明内容
本发明内容部分介绍用于基于社交网络生成虚拟热力学系统的方法和系统的构思,并且该构思在以下详细说明书中进一步予以说明。本发明内容部分并非旨在标识本发明主题的实质性特征,也不是旨在确定或限制本发明主题的保护范围。
在一种实现方式中,公开了一种用于分析社交网络的方法和系统,该方法包括:由处理器将社交网络分成多个用户组,其中,每个用户组在该社交网络中具有唯一标识;处理器从所述多个用户组中的用户组挖掘数据;从所述数据中识别多个社交变量,其中,所述多个社交变量包括用户数量、用户的联系、用户的交互、用户密切性和用户发表的帖子中的至少一个;将所述多个社交变量中的社交变量与多个热力学变量中的热力学变量等同,其中,所述多个热力学变量包括分子、体积、内能、压力、温度、熵、质量、粘度、密度、功、以及分子之间的键合中的至少一个;基于所述多个社交变量确定所述多个热力学变量的定量值,其中,通过控制一个或多个热状态来确定所述定量值;基于所述定量值生成虚拟热力学系统以分析所述社交网络,其中,所述虚拟热力学系统与所述社交网络类似。
此外,公开了一种计算机程序产品,该计算机程序产品上设有用于分析社交网络的计算机程序,该计算机程序产品包括:程序代码,该程序代码用于:将社交网络分成多个用户组,其中,每个用户组在该社交网络中具有唯一标识;从所述多个用户组中的用户组挖掘数据;从所述数据中识别多个社交变量,其中,所述多个社交变量包括用户数量、用户的联系、用户的交互、用户密切性和用户发表的帖子中的至少一个;将所述多个社交变量中的社交变量与多个热力学变量中的热力学变量等同,其中,所述多个热力学变量包括分子、体积、内能、压力、温度、熵、质量、粘度、密度、功、以及分子之间的键合中的至少一个;基于所述多个社交变量确定所述多个热力学变量的定量值,其中,通过控制一个或多个热状态来确定所述定量值;基于所述定量值生成虚拟热力学系统以分析所述社交网络,其中,所述虚拟热力学系统与所述社交网络类似。
附图说明
下面参考附图提供详细说明。在附图中,标号中最左侧的数字表示首次出现该标号的附图。在所有附图中,相同的号码用于指代相同的特征和部件。
图1示出了根据本发明实施例的、用于分析社交网络的社交网络分析系统的网络实现方式。
图2示出了根据本发明实施例的、图1所示社交网络分析系统。
图3示出了根据本发明实施例的、社交网络中能量相对于温度的变化的图形表示。
图4示出了根据本发明实施例的、社交网络中压力相对于体积的变化的图形表示。
图5示出了根据本发明实施例的、用于分析社交网络的方法。
具体实施方式
本发明公开了用于分析社交网络的系统和方法。虽然用于分析社交网络的系统和方法所描述的方案可以实现在任何数量的不同计算系统、环境和/或配置中,但是在下面示例性系统的上下文中描述这些实施例。
现在参照图1,图示出了根据本主题的实施例的用于分析社交网络的社交网络分析系统(SNAS)102的网络实现100。社交网络的示例可以包括FacebookTM、TwritterTM、FoursquareTM、LinkedinTM等。
虽然考虑到社交网络分析系统102被实现在服务器上来解释本主题,但是可以理解的是,社交网络分析系统102还可以实现在多种计算系统(例如、膝上型计算机、台式计算机、笔记本、工作站、大型计算机、服务器、网络服务器等)中。在一个实现中,SNAS102可以实现在基于云的环境中。应当理解的是,可以由用户通过一个或多个用户设备104-1、104-2……104-N(在下文中共同地称为用户104)或者驻留在用户设备104上的应用来访问该SNAS102。用户设备104的示例可以包括但不限于便携式计算机、个人数字助理、手持式设备和工作站。用户设备104通过网络106可通信地耦合到社交网络分析系统102。
在一个实现中,网络106可以是无线网络、有线网络或其组合。网络106可以实现为不同类型网络之一,例如,企业内部网、局域网(LAN)、广域网(WAN)、互联网等。网络106可以是专用网络或者共享网络。共享网络表示不同类型网络的联合,不同类型的网络使用各种协议(例如,超文本传输协议(HTTP)、传输控制协议/互联网协议(TCP/IP)、无线应用协议(WAP)等)以彼此进行通信。此外,网络106可以包括各种网络设备(包括路由器、网桥、服务器、计算设备、存储设备等)。
现在参照图2,示出根据本主题的实施例的社交网络分析系统102。在一个实施例中,社交网络分析系统102可以包括至少一个处理器202,、输入/输出(I/O)接口204和存储器206。该至少一个处理器202可以实现为一个或多个微处理器、微型计算机、微控制器、数字信号处理器、中央处理单元、状态机、逻辑电路和/或基于操作指令来操控信号的任何设备。在其它能力之中,该至少一个处理器202被配置为提取并且执行在存储器206中所存储的计算机可读指令
I/O接口204可以包括各种软件和硬件接口,例如,网页接口、图形用户接口等。I/O接口204可以允许SNAS102与用户直接或者通过客户端设备104进行交互。此外,I/O接口204可以使社交网络分析系统102能够与其它计算设备(例如,网页服务器和外部数据服务器(未示出))进行通信。I/O接口204可以有助于各种网络和协议类型(包括有线网络,例如LAN、电缆等和无线网络,例如,WLAN、移动电话或卫星)之内的多路通信。I/O接口204可以包括用于将多个装置彼此连接或者将多个装置连接到另一个服务器的一个或多个端口。
存储器206可以包括本领域已知的任何计算机可读介质,包括例如易失性存储器(例如,静态随机存取存储器(SRAM)和动态随机存取存储器(DRAM))和/或非易失性存储器(例如,只读存储器(ROM)、可擦除编程ROM、闪速存储器、硬盘、光盘和磁带)。存储器206可以包括模块。该模块包括例程、程序指令、对象、组件、数据结构等,其执行特定任务或者实现特定抽象数据类型。由处理器运行这些模块以执行SNAS102的功能。
在一个实现中,为了分析社交网络,首先,社交网络分析系统102将社交网络分成多个用户组。用户组可以被理解为社交网络中的子网络或子系统。可以在社交网络中基于由每个组所拥有的唯一标识/特征来执行该分隔。例如,18-21岁的年龄组中的用户可以被分在组G1中;新德里的用户可以被分在组G2中;支持特定政党的用户可以被分在组G3中,支持或者赞赏特定产品的用户可以被分在G4中;具有相似资格的用户可以被分在组G5中;类似地,基于组的唯一标识/特征可以将整个社交网络分成子系统/组/子网络。
公布社交网络的分隔,处理器202可以挖掘或者提取来自社交网络的一个或多个组的数据。可以使用本领域中已知的数据挖掘技术来挖掘数据。应当理解的是,针对每个组独立地挖掘数据。在一个示例中,可以挖掘来自组G1中的数据。在挖掘来自组G1的数据之后,处理器202可以从数据中识别社交变量集合。在一个实施例中,社交变量集合可以包括组G1中多个用户、组G1中的用户之间的联系、组G1中的用户的交互、组G1中的用户的密切性和组G1的用户发表的帖子/评论、组G1的用户的博客或者报告书、组G1的用户的简档信息、组G1的用户的共同习惯等。类似地,可以挖掘针对其它组(例如,组G2、G3、G4等)的数据。
在挖掘社交网络中存在一个或多个组的数据之后,处理器202可以把组G1的多个社交变量中的社交变量与多个热力学变量中的热力学变量等同。多个热力学变量可以包括分子、内能、压力、温度、熵、体积、质量、粘度、密度、功和分子之间的键合中的至少一个。把社交变量与热力学变量等同意味着将多个人类比为分子;将用户之间的联系类比为体积;将用户之间的交互类比为内能;将用户可以存在的多个可能状态类比为熵;将强迫改变社交网络的状态所做的努力类比为功等。用这种方法,社交变量可以等同于热力学变量。
为了理解社交变量和热力学变量之间的关系,可以考虑下面的示例。在该示例中,可以专注于具有18-21岁的年龄组的用户的组G1。在挖掘组G1的数据之后,可以断定:组G1中的用户的数量为1000;组G1的用户的联系为50000,组G1的用户的交互为1百万,并且组G1的用户发表的帖子/评论为25000,组G1的用户的博客为5000等等。用这种方法,可以确定所有社交变量的定量值。根据社交变量的定量值,可以确定社交网络中的分子的数量为1000,这是因为分子等同于用户的数量;社交网络的体积为50000立方厘米(cc),这是因为体积等同于关系数量;社交网络的内能为1百万焦耳(J),这是因为内能等同于交互的数量。必须理解的是,当多个社交变量在社交网络中改变时,也改变对应的热力学变量的值。
因此,应当理解的是,可以通过把社交变量与热力学变量等同来创建社交网络和虚拟的热力学网络之间的相似。不断地影响其他用户控制的方式的用户彼此之间的交互、交流情感和意见表示内能在社交网络中从一个用户转移到另一个用户的存在。因此,可以正常断定社交网络拥有某种形式的内能并且不断地尝试达到平衡态。
虽然可以根据社交变量的值来直接地确定某些热力学变量的值,但是必须导出其它热力学变量。例如,可以通过应用某些热力学原理来确定社交网络的熵、社交网络中的压力、社交网络的温度、社交网络中的内能的变化等。在一个实施例中,这些热力学变量可能需要控制社交网络的热力学状态。可以基于本领域中已知的热力学原理来控制这些热状态。热状态的示例可以包括绝热压缩、等容加热、绝热冷却和等容冷却。在该实施例中,深度地用在汽车“奥托循环(Otto Cycle)”中的热学系统被认为最接近的模拟过程,该最接近的模拟过程涉及四个阶段,即1)绝热压缩:在没有消散热的情况下,作功增加温度;2)等容加热:在恒压下所供应的热提高温度;3)绝热冷却:压力的剧烈减少导致热损耗;4)等容冷却:由于热损耗而导致在定体积下温度的突然下降。对等容加热和绝热冷却进行建模并且将其映射到社交网络系统,如在“奥托循环”中一样。
情况1:等容加热
在一个实施例中,考虑等容加热,以计算在条件:(N-用户、V-体积|联系)下的压力。在该情况中,当社交网络通过形成足够的联系来达到体积成熟时,可以执行社交网络的等容加热,在这之后,由于各种外部影响而发生的交互使社交网络加热。此时,社交网络严守条件(V是恒定的,ΔV=0),这使得其宜于随时间计算暂时压力、温度和内能变化。
根据理想气体定律等式,压力“P”乘以时间的体积“V”等于摩尔数“n”乘以气体常数“R”乘以温度“T”,即,
PV=nRT………………………………………………..(1)
然而,等式(1)未考虑与社交网络的同步,因为很难依靠在社交背景中为模糊未定单位的分子的数量。因此,可以考虑另一个等式,即,
PV=NKBT=nRT…………………………………………(2)
可以依赖通用波尔兹曼常数,同时保持所需要的相同热力学变量。代替摩尔,放置分子数量(N)在等式(2)的右侧,这考虑了气体密度,即每体积粒子数量。此外,在等容加热中,当社交网络在达到成熟水平之后停止扩展时,体积变得恒定,即,
PαT;其中V是恒定的………………………………(3)
此外,压力和能量密度不是相同的而是相关的。当考虑KBT即气体的动能密度时,初看压力和能量密度好像相同。然而,当专心看时,压力为施加在空间方向的动量通量同时能量对应于时间方向,即,
T=Q/S……………………………………………………..(4)
考虑等式(4)中的温度、热量和熵之间的关系,可以得出这样一种热力学系统,其中熵是独立的外部测量变量,温度可以被限定为内能关于熵的内能的导数,即,
Q热量=U内能+W所作的功…………………………….(5)
同时作功为零,ΔV=0
T=dU/dS……………………………………………………………(6)
热量ΔQ=ΔU(随着创建新交互的内能的变化和信息流动)
ΔQ=∑λi Ni Ii……………………………………………………….(7)
λi是社交系数。
社交网络的用户之间的每个交互未承载相等的能量和关于交互类型的变量。这可以称为社交网络相关变量,即,社交系数λi
Ni—交互中所涉及的用户的数量并且取决于交互的类型、组消息、共享、评
论等
Vy—基于我的联系的个人体积
Iz—交互中的变化
此外,根据熵的物理等式:
S=Ks ln(ΩS=Ks ln(Ω(N,V,U)…………………………………………….(8)
其中,S是社交网络的熵。
用在等式(8)中的热力学变量Ω(N,V,U,X…)可以包括可能在实验期间改变的一个或多个热力学变量。等式(8)可能同样地在其它方面是有帮助的,因为可以观察到的是,对于熵的性质来说,熵的下降再次是一种悖论。灌输到社交网络中的任何新信息是用户之间的某种交互。这些交互对添加到社交网络中的能量负责。类似于光子,这些交互具有可忽略的质量但是以各种可能的方式为对社交网络提供能量负责,因此影响社交网络的通信动态。
就交互来说,人或者用户是发射能量的分子,然而,用户之间的联系类似于构建实际体积的管子。随着用户的增加,能量增加。假定所有管子是相同体积的具有转移信息的相等能力,在实际情况中,随着用户之间的密切性的增加,管子的体积(即,信息从一端传递到另一端的概率)可能增加。理想地应当将强关系和弱关系的因素考虑到未来的模型中,因为独立的用户在他们之间没有桥的情况下会有关系。换言之,单独的分子可能不以任何方式影响社交网络。
在理想情景中,分子从在自社交网络中所产生的热量来获得能量。影响连接的分子之间的社交密切性的某些形式的势能和继而数据的扩散存在,即,
功=pdV……………………………….…………………………(9)
在该情况中所作的功=0。
情况2:绝热冷却
绝热热力学过程不允许系统和环境之间热传递。最主要的突发事件是没有足够的时间来有助于热交换。自由膨胀是真空膨胀的过程,这在社交网络中对应于用户在缺乏外部压力的情况下建立联系。这可能通过有影响的用户的到来来触发,从而在社交网络中创建巨大的冲击。尽管外部用户到来,但是网络可以仍然被认为是封闭的,这是因为当该用户的数量高时可忽略对用户的数量的影响。所生成的冲击在缺乏外部压力的情况下将社交网络设置处于突然膨胀的状态中。忽略内能的变化,这是因为该短跨度时间中的新交互的概率是可忽略的。
ΔH=ΔU+ΔW……………………………………………………….(10)
ΔH=ΔW{asΔU=0}………………………………………………(11)
整个过程是不可逆的,这是因为社交网络进入到自由膨胀,存在跨社交网络的压力的突然变化,具有在熵和体积上的突然下降。所以,热力学变量的量化是不可行的。
生成虚拟热力学系统
应当理解的是,在基于多个社交变量并且基于一个或多个热状态来确定多个热力学变量的定量值之后,处理器可以生成虚拟的热力学系统。具体地,可以基于热力学变量的定量值来生成虚拟的热力学系统。虚拟的热力学系统(VTS)类似于社交网络并且可以用于分析社交网络。在一个示例中,如果社交网络/VTS的内能在特定的组中是高的,则个人可以将那个组的高的内能用于在那个特定组中递归扩散相关信息。扩散相关信息可以意味着:在用户组中传播广告运动,在用户组中引导单元数据,在用户组中传播政治和社交运动,在用户组中传播新闻,以及在用户组中识别压力区。在一个示例中,相关信息可以表示由商务人士提供的关于产品或服务的信息,其中,产品或服务可以对组中的用户是有意义的。可以针对预先定义的时间周期递归扩散相关信息并且可以其后停止扩散相关信息。
基于组G1的用户对相关信息的反应,可以在社交网络中执行影响分析。在一个实施例中,通过比较在多于一个组中的相关信息的扩散的影响来执行影响分析。换言之,影响分析是部分或者整个社交网络的整体考虑以理解相关信息对社交网络中定义的多个组的影响。
在另一个实施例中,可以考虑社交网络的粘度来执行影响分析。粘度可以理解为让信息经过用户或者一个组或者多个组时该用户或者一个组或者多个组所表现出的阻力。例如,组X中的iphoneTM爱好者将会开心于共享关于AppleTM的任何积极的事,但是对于For MotoersTM可能不愿意那么做。换言之,组X的人群到ForMotoersTM。在该示例中,AppleTM是影响者。直截了当地说,由于影响用户/组的状态的变化,系统102测量一个或多个组中的粘度的下降。
方法流程
现在参照图5,根据本发明主题的实施例示出了用于分析社交网络的方法500。方法500可在计算机可执行指令的通用背景中描述,并且由处理器202执行。通常,计算机可执行指令可包括:例程、程序、对象、组件、数据结构、进程、模块、功能等,它们执行特定功能或实现特定的抽象数据类型。方法500还可以被实践在分布式计算环境中,在该分布式计算环境中,由通过通信网络链接的远程处理设备来执行功能。在分布式计算环境中,计算机可执行指令可以位于本地和远程计算机存储介质中,该计算机存储介质包括存储器存储设备。
该方法500描述的顺序不应被解释为限制,并且任何数量的所述方法方框都可以按任何顺序结合以执行方法500或可替选的方法。此外,在不脱离本文描述的主题的精神和范围下,各个方框可以从方法500删除。此外,该方法可以以任何合适的硬件、软件、固件,或其组合来实现。然而,为了便于解释,在下面描述的实施例中,方法500可以被认为是在上述系统102中实施。
在方框502中,社交网络可以被分成多个用户组。每个用户组具有在社交网络中的唯一标识。
在方框504中,多个用户组中的用户组的数据可以从社交网络挖掘。
在方框506中,多个社交变量可以从数据中被识别。多个社交变量包括:用户的数量、用户的联系、用户的交互、用户的亲密性、或用户发表的帖子中的至少一个。
在方框508中,多个社交变量中的社交变量可以等同于多个热力学变量中的热力学变量。多个热力学变量包括:分子、体积、内能、压力、温度、熵、质量、粘度、密度、功、以及分子间的键合中的至少一个。
在方框510中,可以基于多个社交变量来确定多个热力学变量的定量值。定量值通过控制一个或多个热状态(例如绝热压缩、等容加热、绝热冷却和等容冷却)来确定。
在方框512中,虚拟热力学系统可以基于定量值而生成以用于分析社交网络。虚拟热力学系统类似于社交网络。
工作示例
已经在连接250K用户的社交网络上测试了系统和方法。所考虑的社交网络是一种新兴的网络,自其成立以来,具有约8.77亿的识别出的连接。6个月的持续时间内的历史数据被考虑以用于分析。为了模拟合适的环境以用于试验,经历最小变化的成熟连接被选择,并且网络中的萌芽连接被忽略。这些所连接的用户和连接的集合代表宏观状态。对于这些宏观状态,体积(V)保持恒定,这是因为没有正在发展的新连接,并且可以被看作是等容社交热力学过程。
在本发明的一个示例性实施例中,通过将网络与其它干扰数据隔离来开始调度。封闭的宏观状态/组的能量利用观察到的交互的数量来定量。熵被计算为所有可能的微观状态/组的量度。使用这些值,通过在一段时间内比较能量和熵中的变化来计算所选择的宏观状态的温度和压力。
表1列出了来自一个这样的宏观状态/组的数据,该宏观状态/组具有723个连接,这些连接在一个月的时间段内从这些连接中生成的交互中获悉。它们显示出:随着对应的能量的增加,温度和压力中的近似线性增量,这在图1中绘制。
表1(a)针对等容加热过程,跨时间动作中的各热力学变量
Figure BDA0000436428760000101
在一个示例性实施例中,参照图1,披露了表1中的统计数据的图形表示。数据被分成4个场景,并与实时数据进行比较。场景1、3和4是大多数宏观状态的通常行为,随系统的能量增加具有压力上的显著增量。图的第一和第三半示出了具有小于能量中的平均增加的剧烈的压力增量;并且第二半示出了:对于更高的能量值的更低的增量。当参照实时数据时,这个行为示出了场景2是网络中具有低参与的延长周末的时间段。第一半的开始伴随着主要影响初始交互,其造成达到平衡的压力值的突然激增,并且第二半具有源自这个父交互的大多数交互并且没有任何压力上的明显影响。场景的第三部分标记了平台的新特征的发布,以展示外部压力在宏观状态上的影响。在初始假设下,认为在宏观状态中的用户没有质量。情景2的第一阶段展示出随着用户所产生的交互施加更大压力而在系统中用户的质量的影响。该模型确实显示基于质量的相关下降和升高,但是将需要很大的重建模以考虑质量来限定其它主要方程。认为在任何给定时间下对于宏观状态存在恒定的外部压力,但是如从场景2的阶段3中明显的那样,外力不影响宏观状态中的压力并且算法需要被调整以衡量和量化这些影响。
当建模社交热力学模型并且将其与实时数据一起参考时,进行如下观察:
观察1:该模型假定针对信息流具有可以忽略的阻力,并且每个用户作为宏观状态中的完美信息消散器。然而,信息扩散是高度依赖于联系的数量的并且联系的增加影响交互模式。随着系统体积的增加,信息扩散的增加变得更加明显。这可以被定义为随着联系增加而降低扩散阈值,这在社交网络意味着通过降低信息流的阻力,更多的感兴趣的组共享信息。扩散阈值被定义为产生的热量与用户吸收的热量之比。换句话说,这是产生的交互与交互之比。还观察到,影响者具有针对扩散阈值的极低值,以证明其与用户的质量成反比。
表1(b):当涉及等容加热过程与熵挂钩时对应于压力的温度的变化
熵的变化 能量的变化 温度 压力
110.395 282 2.554463 74.07943
87.6131 257.2 2.925634 85.13339
28.30994 90 3.179095 92.19376
73.23236 249.8 3.41106 98.92074
18.14735 65.8 3.625873 105.1503
24.55422 92.4 3.763101 109.1299
19.15823 73.4 3.831251 111.1063
34.17354 137 4.008949 116.2595
16.3768 68.4 4.176632 121.1223
观察2:在恒定热量的约束下,可能的高质量的、有影响的和频繁的用户的引入(被称为有影响的)将在社交热力学中具有爆炸效果。假设有影响的加入后的小的时间间隔内,宏观状态在这个极短间距获得新连接。因为交互在这个时间段期间保持恒定,所以由于可能的微观状态系统可与现在减少的能量一起显著下降,因此宏观状态的熵急剧下降。
有影响的到来在其他用户上施加了内爆力,导致了联系的快速膨胀。这个联系的突然激增降低了宏观状态的整体压力,稳定了系统并标记了新的平衡。对于社交网络中的宏观状态而言,这是超膨胀期,新的联系在极高速度下产生,且没有足够数据来在这个阶段保持压力和温度恒定,引起了系统中的温度以及总压力的突然下降。这个场景建模了社交热力学过程的绝热膨胀。
表2:示出随体积的变化的熵的变化。
体积的增加 熵的变化
2 23.5
3 32
1 10
3 28.4
5 42
2 15
在一个示例性实施例中,图2示出了随体积变化的宏观状态的压力变化并且表2将熵的变化与体积的变化进行比较。这意味着,每个联系的平均交互在所考虑的时间内减小。所以低的温度和压力并非是由于缺乏足够的交互,而是由于系统的总熵的减少。
因此,根据一个实施例,本发明能够在企业社交平台上执行热力学变量分析的映射和建模。在一个实施例中,外部冲击在社交系统中的影响被并行观察,并且分析与实时数据一起执行。用于在社交网络中量化个体影响力并映射扩散模式的可能应用和探索领域如下:
1.)可以通过改变仅某些特定于平台的变量而利用任何信息流网络来实现。
2.)基于温度&压力变化来建立用于跟踪信息扩散模式的信息分析工具,以优化广告活动、引导/路由单位数据、识别有影响的用户和压力区。
尽管对用于分析社交网络的系统和方法的实现以特定于结构特征和/或方法的语言进行了描述,但是应当理解的是,所附权利要求不必限于所述的特定特征或方法。相反,这些特定特征和方法以实现分析社交网络的示例公开。

Claims (15)

1.一种用于分析社交网络的方法,该方法包括:
由处理器将社交网络分成多个用户组,其中,每个用户组在该社交网络中具有唯一标识;
由处理器从所述多个用户组中的用户组挖掘数据;
从所述数据中识别多个社交变量,其中,所述多个社交变量包括用户数量、用户的联系、用户的交互、用户密切性和用户发表的帖子中的至少一个;
将所述多个社交变量中的社交变量与多个热力学变量中的热力学变量等同,其中,所述多个热力学变量包括分子、体积、内能、压力、温度、熵、质量、粘度、密度、功、以及分子之间的键合中的至少一个;
基于所述多个社交变量确定所述多个热力学变量的定量值,其中,通过控制一个或多个热状态来确定所述定量值;
基于所述定量值生成虚拟热力学系统以分析所述社交网络,其中,所述虚拟热力学系统与所述社交网络类似。
2.根据权利要求1所述的方法,其中,所述分子等同于人数,所述体积等同于所述用户之间的联系,且所述内能等同于所述用户之间的交互。
3.根据权利要求1所述的方法,还包括:
基于所述虚拟热力学系统的行为在所述用户组中递归扩散相关信息;以及
基于所述用户组中递归扩散的相关信息在所述社交网络中进行影响分析。
4.根据权利要求3所述的方法,还包括:当进行所述扩散的时间段到期时,停止在所述用户组中扩散所述相关信息。
5.根据权利要求3所述的方法,其中,扩散所述相关信息包括在所述用户组中传播广告运动、在所述用户组中引导单元数据、在所述用户组中传播政治和社交活动、在所述用户组中传播新闻、以及在所述用户组中识别压力区中的至少一个。
6.根据权利要求1所述的方法,还包括:基于所述多个社交变量的变化,动态改变与一个或多个热力学变量相关联的所述定量值。
7.根据权利要求1所述的方法,其中,所述热力学状态包括绝热压缩、等容加热、绝热冷却和等容冷却中的至少一个。
8.一种用于分析社交网络的系统,该系统包括:
存储器;以及
与所述存储器耦合的处理器,该处理器用于执行存储于所述存储器中的程序指令,以执行:
将社交网络分成多个用户组,其中,每个用户组在该社交网络中具有唯一标识;
从所述多个用户组中的用户组挖掘数据;
从所述数据中识别多个社交变量,其中,所述多个社交变量包括用户数量、用户的联系、用户的交互、用户密切性和用户发表的帖子中的至少一个;
将所述多个社交变量中的社交变量与多个热力学变量中的热力学变量等同,其中,所述多个热力学变量包括分子、体积、内能、压力、温度、熵、质量、粘度、密度、功、以及分子之间的键合中的至少一个;
基于所述多个社交变量确定所述多个热力学变量的定量值,其中,通过控制一个或多个热状态来确定所述定量值;
基于所述定量值生成虚拟热力学系统以分析所述社交网络,其中,所述虚拟热力学系统与所述社交网络类似。
9.根据权利要求8所述的系统,其中,所述分子等同于人数,所述体积等同于所述用户之间的联系,且所述内能等同于所述用户之间的交互。
10.根据权利要求8所述的系统,还包括:
基于所述虚拟热力学系统的行为在所述用户组中递归扩散相关信息;以及
基于所述用户组中递归扩散的相关信息在所述社交网络中进行影响分析。
11.根据权利要求10所述的系统,还包括:当进行所述扩散的时间段到期时,停止在所述用户组中扩散所述相关信息。
12.根据权利要求10所述的系统,其中,扩散所述相关信息包括在所述用户组中传播广告运动、在所述用户组中引导单元数据、在所述用户组中传播政治和社交活动、在所述用户组中传播新闻、以及在所述用户组中识别压力区中的至少一个。
13.根据权利要求8所述的系统,还包括:基于所述多个社交变量的变化,动态改变与一个或多个热力学变量相关联的所述定量值。
14.根据权利要求8所述的系统,其中,所述热力学状态包括绝热压缩、等容加热、绝热冷却和等容冷却中的至少一个。
15.一种计算机程序产品,该计算机程序产品上设有用于分析社交网络的计算机程序,该计算机程序产品包括:
程序代码,该程序代码用于:
将社交网络分成多个用户组,其中,每个用户组在该社交网络中具有唯一标识;
从所述多个用户组中的用户组挖掘数据;
从所述数据中识别多个社交变量,其中,所述多个社交变量包括用户数量、用户的联系、用户的交互、用户密切性和用户发表的帖子中的至少一个;
将所述多个社交变量中的社交变量与多个热力学变量中的热力学变量等同,其中,所述多个热力学变量包括分子、体积、内能、压力、温度、熵、质量、粘度、密度、功、以及分子之间的键合中的至少一个;
基于所述多个社交变量确定所述多个热力学变量的定量值,其中,通过控制一个或多个热状态来确定所述定量值;
基于所述定量值生成虚拟热力学系统以分析所述社交网络,其中,所述虚拟热力学系统与所述社交网络类似。
CN201310682393.4A 2012-12-12 2013-12-12 社交网络分析 Active CN103870534B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
IN3498MU2012 2012-12-12
IN3498/MUM/2012 2012-12-12

Publications (2)

Publication Number Publication Date
CN103870534A true CN103870534A (zh) 2014-06-18
CN103870534B CN103870534B (zh) 2018-01-09

Family

ID=50882085

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310682393.4A Active CN103870534B (zh) 2012-12-12 2013-12-12 社交网络分析

Country Status (3)

Country Link
US (1) US9235866B2 (zh)
JP (1) JP6110781B2 (zh)
CN (1) CN103870534B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372125A (zh) * 2016-08-24 2017-02-01 安阳师范学院 一种sna视角下教育技术微博群个案研究模型构建方法
CN110543364A (zh) * 2019-07-21 2019-12-06 聊城市光明医院 一种医学影像快速加载方法及系统

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10182029B2 (en) * 2015-02-20 2019-01-15 International Business Machines Corporation Estimation of information diffusion route on computer mediated communication network
KR101551656B1 (ko) * 2015-02-25 2015-09-09 이진혁 가변적 소셜 네트워크 서비스 방법 및 장치
US10778803B2 (en) * 2015-11-18 2020-09-15 International Business Machines Corporation Sub-social network based on contextual inferencing
US11132413B2 (en) * 2016-05-24 2021-09-28 Microsoft Technology Licensing, Llc Providing travel or promotion based recommendation associated with social graph

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101617332A (zh) * 2006-12-29 2009-12-30 谷歌公司 网络节点广告定向
US20110167071A1 (en) * 2010-01-05 2011-07-07 O Wave Media Co., Ltd. Method for scoring individual network competitiveness and network effect in an online social network
CN102414706A (zh) * 2009-03-03 2012-04-11 谷歌公司 用于社交网络的AdHeat广告模型

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55125322A (en) * 1979-03-17 1980-09-27 Isamu Nemoto Thermodynamic cycle for performing regenerative heat exchange and double acting internal combustion engine for such cycle
US7668957B2 (en) * 2004-06-30 2010-02-23 Microsoft Corporation Partitioning social networks
KR101624680B1 (ko) * 2009-03-03 2016-05-27 구글 인코포레이티드 소셜 네트워크의 사용자들에게 광고를 제공하기 위한 방법 및 시스템
US20120137367A1 (en) 2009-11-06 2012-05-31 Cataphora, Inc. Continuous anomaly detection based on behavior modeling and heterogeneous information analysis
US8868652B2 (en) * 2010-11-12 2014-10-21 International Business Machines Corporation Systems and methods for federating open social networks for analyses

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101617332A (zh) * 2006-12-29 2009-12-30 谷歌公司 网络节点广告定向
CN102414706A (zh) * 2009-03-03 2012-04-11 谷歌公司 用于社交网络的AdHeat广告模型
US20110167071A1 (en) * 2010-01-05 2011-07-07 O Wave Media Co., Ltd. Method for scoring individual network competitiveness and network effect in an online social network

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106372125A (zh) * 2016-08-24 2017-02-01 安阳师范学院 一种sna视角下教育技术微博群个案研究模型构建方法
CN110543364A (zh) * 2019-07-21 2019-12-06 聊城市光明医院 一种医学影像快速加载方法及系统

Also Published As

Publication number Publication date
JP2014132450A (ja) 2014-07-17
US20140164300A1 (en) 2014-06-12
CN103870534B (zh) 2018-01-09
JP6110781B2 (ja) 2017-04-05
US9235866B2 (en) 2016-01-12

Similar Documents

Publication Publication Date Title
Sahoo et al. Hybrid approach for detection of malicious profiles in twitter
CN103870534A (zh) 社交网络分析
Li et al. An algorithm for efficient privacy-preserving item-based collaborative filtering
KR101820893B1 (ko) 온라인 소셜 네트워크에서의 대규모 페이지 추천
Tur et al. PACDIN statement of methods
Dang et al. Simulating the spatial diffusion of memes on social media networks
Shen et al. A group decision support system for value management studies in the construction industry
Yu et al. Computational modeling of Weibo user influence based on information interactive network
Hillen et al. Birth-jump processes and application to forest fire spotting
Rahmaniani et al. A study on maximum covering transportation network design with facility location under uncertainty
Li et al. Social network user influence dynamics prediction
Wang A new algorithm for the influence maximization problem in dynamic networks or traffic sensor networks
CN107005576A (zh) 从服务器日志生成用于链接标识符的桥接匹配标识符
Liu et al. Hyperlink network analysis of the educational blog
Zhang et al. Global attractivity and almost periodic solution of a discrete mutualism model with delays
Ahsen et al. On the analysis of a dynamical model representing gene regulatory networks under negative feedback
Gonçalves et al. A contribution of dynamical systems theory and epidemiological modeling to a viral marketing campaign
Kaiiali et al. Grid authorization graph
US10936683B2 (en) Content generation and targeting
KR20190048699A (ko) 소셜 네트워크 분석 방법
CN106156136A (zh) 公司排序数据的生成
Zhu et al. Beaver Triple Generator from Multiplicatively Homomorphic Key Management Protocol
Li et al. Output synchronisation design for master–slave Boolean networks
Yi et al. A novel method for information propagation model perceiving
Sen et al. A benders decomposition approach for static data segment location to servers connected by a tree backbone

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant