CN113254797A - 一种社交网络社区的搜索方法、装置以及处理设备 - Google Patents
一种社交网络社区的搜索方法、装置以及处理设备 Download PDFInfo
- Publication number
- CN113254797A CN113254797A CN202110417236.5A CN202110417236A CN113254797A CN 113254797 A CN113254797 A CN 113254797A CN 202110417236 A CN202110417236 A CN 202110417236A CN 113254797 A CN113254797 A CN 113254797A
- Authority
- CN
- China
- Prior art keywords
- social network
- network community
- community
- behavior pattern
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 73
- 238000000034 method Methods 0.000 title claims abstract description 55
- 239000013598 vector Substances 0.000 claims abstract description 111
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 15
- 238000005295 random walk Methods 0.000 claims abstract description 12
- 230000009471 action Effects 0.000 claims abstract description 7
- 230000006399 behavior Effects 0.000 claims description 130
- 238000004590 computer program Methods 0.000 claims description 13
- 238000012935 Averaging Methods 0.000 claims description 12
- 230000006870 function Effects 0.000 description 5
- 238000007726 management method Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012217 deletion Methods 0.000 description 4
- 230000037430 deletion Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Economics (AREA)
- Marketing (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computing Systems (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
技术领域
本申请涉及社交领域,具体涉及一种社交网络社区的搜索方法、装置以及处理设备。
背景技术
在社交网络的管理工作中,对社交网络中潜在的、由小部分用户组成的社交网络社区的搜索,具有重要价值,例如进行社交网络社区颗粒度的舆论管控、精准营销等。
而在传统的社交网络社区的搜索技术中,其社交网络社区的搜索,是以用户之间的社交关系形成的社交网络拓扑结构进行的。
与此同时,对于如今不断发展的社交网络而言,以社交关系为中心进行社交网络社区的搜索,考虑如今社交网络中愈加复杂的用户属性带来的干扰,显然搜索精度成为一大问题。
发明内容
本申请提供了一种社交网络社区的搜索方法、装置以及处理设备,用于以行为模式作为切入点,构建多级搜索机制,精确地在目标社交网络中寻找出目标用户节点所属的社交网络社区。
第一方面,本申请提供了一种社交网络社区的搜索方法,方法包括:
获取目标社交网络的初始社交网络社区数据,其中,初始社交网络数据以无向图G=(V,E)的数据类型配置,V为初始社交网络数据中包含的用户节点,E为无向图G=(V,E)中的边集;
根据不同用户节点的行为模式数据,计算相邻的用户节点之间的行为紧密度,并在无向图G=(V,E)中将行为紧密度作为对应用户节点之间的边的权值;
以权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,目标用户节点为待搜索所属社交网络社区的用户节点;
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,k-truss模型进行的紧密用户节点搜索,包括:
若是,则进行更新处理,更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出顶点u以及顶点w构成的边e′(u,w),将sup(e′)=sup(e′)-1,找出顶点v以及顶点w构成的边e′(v,w),将sup(e′)=sup(e′)-1,从社交网络社区中删除当前边e,
其中,当遍历社交网络社区中的每条边e并执行对应的更新处理后,判断社交网络社区是否被更新,若是,则设置k=k+1,继续比较社交网络社区中的每条边e的支撑度sup(e)是否小于k-2,并执行对应的更新处理;
结合本申请第一方面,在本申请第一方面第二种可能的实现方式中,以目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对社交网络社区进行二次社区搜索,得到社交网络社区H,作为目标用户节点所属的社交网络社区,包括:
将目标用户节点初始化到社交网络社区H中;
计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
计算当前的社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与相似度阈值sim之间的差值小于预设差值,则退出循环处理,输出当前的社交网络社区H。
结合本申请第一方面第二种可能的实现方式,在本申请第一方面第三种可能的实现方式中,若目标用户节点的数量为一个,在计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度、将社交网络社区H中包含的用户节点的行为模式向量进行相加,得到行为模式向量之前,方法还包括:
结合本申请第一方面,在本申请第一方面第四种可能的实现方式中,不同用户节点之间在行为模式向量上的相似度,具体为余弦相似度,预先相似度通过对应两个向量之间的夹角的余弦值计算得到。
第二方面,本申请提供了一种社交网络社区的搜索装置,装置包括:
获取单元,用于获取目标社交网络的初始社交网络社区数据,其中,初始社交网络数据以无向图G=(V,E)的数据类型配置,V为初始社交网络数据中包含的用户节点,E为无向图G=(V,E)中的边集;
计算单元,用于根据不同用户节点的行为模式数据,计算相邻的用户节点之间的行为紧密度,并在无向图G=(V,E)中将行为紧密度作为对应用户节点之间的边的权值;
查询单元,用于以权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,目标用户节点为待搜索所属社交网络社区的用户节点;
结合本申请第二方面,在本申请第二方面第一种可能的实现方式中,k-truss模型进行的紧密用户节点搜索,包括:
若是,则进行更新处理,更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出顶点u以及顶点w构成的边e′(u,w),将sup(e′)=sup(e′)-1,找出顶点v以及顶点w构成的边e′(v,w),将sup(e′)=sup(e′)-1,从社交网络社区中删除当前边e,
其中,当遍历社交网络社区中的每条边e并执行对应的更新处理后,判断社交网络社区是否被更新,若是,则设置k=k+1,继续比较社交网络社区中的每条边e的支撑度sup(e)是否小于k-2,并执行对应的更新处理;
结合本申请第二方面,在本申请第二方面第二种可能的实现方式中,二次搜索单元,具体用于:
将目标用户节点初始化到社交网络社区H中;
计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
计算当前的社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与相似度阈值sim之间的差值小于预设差值,则退出循环处理,输出当前的社交网络社区H。
结合本申请第二方面第二种可能的实现方式,在本申请第二方面第三种可能的实现方式中,若目标用户节点的数量为一个,二次搜索单元,在计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度、将社交网络社区H中包含的用户节点的行为模式向量进行相加,得到行为模式向量之前,还用于:
结合本申请第二方面,在本申请第二方面第四种可能的实现方式中,不同用户节点之间在行为模式向量上的相似度,具体为余弦相似度,余弦相似度通过对应两个向量之间的夹角的余弦值计算得到。
第三方面,本申请提供了一种处理设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。
从以上内容可得出,本申请具有以下的有益效果:
针对于社交网络社区的搜索场景,本申请首先以无向图的形式构建目标社交网络的初始社交网络数据,并以此展开搜索,根据用户节点行为模式数据,计算用户节点之间的行为紧密度,并作为对应边的权值,并进一步地结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,此时初步构建了目标用户节点为中心的子网,再次采用重启随机游走算法对社交网络社区G′进行搜索优化,得到社交网络社区然后引入k-truss模型,通过k-truss算法继续对社交网络社区进行紧密用户节点搜索,得到满足社区结构紧密度需求的社交网络社区最后再以目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对社交网络社区进行二次社区搜索,得到社交网络社区H进行输出,此时的社交网络社区H,既满足社区结构紧密度需求,又满足用户节点之间的属性相似性,因此可从复杂的用户属性中捕捉到显著提高精确度的社交网络社区搜索结果。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请社交网络社区的搜索方法的一种流程示意图;
图2为本申请社交网络社区的搜索装置的一种结构示意图;
图3为本申请处理设备的一种结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。在本申请中出现的对步骤进行的命名或者编号,并不意味着必须按照命名或者编号所指示的时间/逻辑先后顺序执行方法流程中的步骤,已经命名或者编号的流程步骤可以根据要实现的技术目的变更执行次序,只要能达到相同或者相类似的技术效果即可。
本申请中所出现的模块的划分,是一种逻辑上的划分,实际应用中实现时可以有另外的划分方式,例如多个模块可以结合成或集成在另一个系统中,或一些特征可以忽略,或不执行,另外,所显示的或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,模块之间的间接耦合或通信连接可以是电性或其他类似的形式,本申请中均不作限定。并且,作为分离部件说明的模块或子模块可以是也可以不是物理上的分离,可以是也可以不是物理模块,或者可以分布到多个电路模块中,可以根据实际的需要选择其中的部分或全部模块来实现本申请方案的目的。
在介绍本申请提供的社交网络社区的搜索方法之前,首先介绍本申请所涉及的背景内容。
本申请提供的社交网络社区的搜索方法、装置以及计算机可读存储介质,可应用于处理设备,用于以行为模式作为切入点,构建多级搜索机制,精确地在目标社交网络中寻找出目标用户节点所属的社交网络社区。
本申请提及的社交网络社区的搜索方法,其执行主体可以为社交网络社区的搜索装置,或者集成了该社交网络社区的搜索装置的服务器、物理主机或者用户设备(UserEquipment,UE)等类型的处理设备。其中,社交网络社区的搜索装置可以采用硬件或者软件的方式实现,UE具体可以为智能手机、平板电脑、笔记本电脑、台式电脑或者个人数字助理(Personal Digital Assistant,PDA)等终端设备,处理设备可以通过设备集群的方式设置。
下面,开始介绍本申请提供的社交网络社区的搜索方法。
首先,参阅图1,图1示出了本申请社交网络社区的搜索方法的一种流程示意图,本申请提供的社交网络社区的搜索方法,具体可包括如下步骤:
步骤S101,获取目标社交网络的初始社交网络社区数据,其中,初始社交网络数据以无向图G=(V,E)的数据类型配置,V为初始社交网络数据中包含的用户节点,E为无向图G=(V,E)中的边集;
步骤S102,根据不同用户节点的行为模式数据,计算相邻的用户节点之间的行为紧密度,并在无向图G=(V,E)中将行为紧密度作为对应用户节点之间的边的权值;
步骤S103,以权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,目标用户节点为待搜索所属社交网络社区的用户节点;
从图1所示实施例可看出,针对于社交网络社区的搜索场景,本申请首先以无向图的形式构建目标社交网络的初始社交网络数据,并以此展开搜索,根据用户节点行为模式数据,计算用户节点之间的行为紧密度,并作为对应边的权值,并进一步地结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,此时初步构建了目标用户节点为中心的子网,再次采用重启随机游走算法对社交网络社区G′进行搜索优化,得到社交网络社区然后引入k-truss模型,通过k-truss算法继续对社交网络社区进行紧密用户节点搜索,得到满足社区结构紧密度需求的社交网络社区最后再以目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对社交网络社区进行二次社区搜索,得到社交网络社区H进行输出,此时的社交网络社区H,既满足社区结构紧密度需求,又满足用户节点之间的属性相似性,因此可从复杂的用户属性中捕捉到显著提高精确度的社交网络社区搜索结果。
下面则对上述图1所示实施例的各个步骤及其在实际应用中可能的实现方式进行详细阐述。
在本申请中,应用本申请提供的社交网络社区的搜索方法的处理设备,具体可以为目标社交网络中的设备,如此,对于目标社交网络的管理方,可从内部捕捉到更为精确的用户间潜在的社交网络社区,以此作为数据支持,实现对目标社交网络更为精确的数据研究、舆论管控等管理工作。
当然,处理设备具体也可以为目标社交网络外部的设备,在网络外部进行用户间的社交网络影响力的捕捉,为目标社交网络的管理工作提供数据支持。
可以理解的是,对于社交网络社区的搜索,在实际应用中,是在满足用户隐私需求,或者得到用户确认后进行的。
目标社交网络,可以为任意形式的社交网络,例如现今的微博、贴吧等社交网络,具体可随定义的社交网络形式调整,其中,目标社交网络不仅可以值得是单一的社交网络产品所构建的社交网络,还可以为不同社交网络产品所构建的社交网络,具体在此不做限定。
在现有的社交网络社区的搜索策略中,传统是基于明面上的社交网络拓扑结构构件的,而在比较前沿的搜索策略中,则出现了考虑特定的用户节点属性,以用户节点属性进行社交网络社区的搜索,尽管在预期中相较于传统搜索策略可提高一定的搜索精度,然而这类搜索策略在实际应用中,由于用户节点在物理、社会、网络空间等方面的局部属性信息,很可能还存在主动匿名或者被动篡改等情形,这又带来搜索精度难以保障的问题。
而本申请,具体则从用户节点的行为模式数据出发,通过多级的搜索机制,精确地在目标社交网络中寻找出目标用户节点所属的社交网络社区。
首先,对于目标社交网络,构建一无向图G=(V,E),作为初始社交网络数据,在该无向图G=(V,E)中,V为目标社交网络数据中包含的用户节点,可表示为V={v1,v2,…,vn},n为用户节点的数量,E为无向图G(V,E)中的边集,可表示为E={eij},其中0≤i,j<n。
此时,用户节点之间是否存在共同所属的社交网络社区,还是未知的,而对应于无向图G=(V,E),用户节点之间存在边时的权值,则可在一定程度上反应两者是否存在共同所属的社交网络社区。
具体的,可根据不同用户节点的行为模式数据,计算相邻的用户节点之间的行为紧密度,并在无向图G=(V,E)中将行为紧密度作为对应用户节点之间的边的权值。
行为紧密度,在实际应用中,可采用行为模式向量上的相似度进行量化,例如余弦相似度。
得到行为紧密度后,则可作为依据,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′。
三度影响力原则,可以理解为用户所做或所说的任何事情,都会在网络上泛起涟漪,影响用户的朋友(一度),用户朋友的朋友(二度),甚至用户朋友的朋友的朋友(三度),因为社会网络本身是不稳定的,用户与用户之间的链接随时可能断掉,而且影响力的传递是递减的,如果超出三度分隔,用户的影响就会逐渐消失,以此推广到社交网络中,即一个节点最多只能够用影响到他的朋友的朋友的朋友,也就是说用户之间的影响力只能扩散到其三阶子网中。
而该目标用户节点,则为当前待搜索所属社交网络社区的用户节点。
依据三度影响力原则,以目标用户节点为中心进行深度优先搜索,查找节点距离到目标用户节点的距离d不大于3的用户节点,将查找到的用户节点与目标用户节点形成以目标用户节点为中心的三阶子网,即社交网络社区G′。
重启随机游走算法,可以理解为从社交网络中的某一用户节点出发,每一步面临两个选择,随机选择相邻用户节点或者返回开始的用户节点,在任意一个用户节点,遍历者将以概率1-a游走到这个用户节点的邻居用户节点,以概率a随机跳跃到图中的任何一个用户节点,称为a跳转发生概率,每次游走后得出一个概率分布,该概率分布刻画了图中每一个用户节点被访问到的概率,用这个概率分布作为下一次游走的输入并反复迭代这一过程,当满足一定前提条件时,这个概率分布会趋于收敛。收敛后,即可以得到一个平稳的概率分布。公式如下:
r=aPr+(1-a)e#(1),
其中,a的大小在(0,1)之间,P为转移概率矩阵,Pij是从节点i到节点j的概率,e是起点向量,i为起点,则e[i]=1,r是重点向量。
接着在社交网络社区的基础上,继续引入k-truss模型,通过k-truss算法继续对社交网络社区进行紧密用户节点搜索,在k-truss模型的迭代搜索下,寻找社交网络中满足社区结构紧密度的用户节点,得到满足社区结构紧密度需求的社交网络社区
在通过k-truss模型满足搜索过程中社区结构紧密度需求的同时,本申请还考虑了用户节点之间的属性相似性,此时再以目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对社交网络社区进行二次社区搜索,得到社交网络社区H进行输出,这样既满足社区结构紧密度需求,又满足用户节点之间的属性相似性,从而从复杂的用户属性中捕捉到了显著提高精确度的社交网络社区搜索结果。
其中,对于k-truss模型的紧密用户节点搜索,以及基于相似度的二次社区搜索,分别涉及到循环搜索处理。
k-truss模型的紧密用户节点搜索,具体的,可包括:
其中,支撑度的计算处理包括:边e的顶点u和顶点v的邻居顶点集合分别为nb(u)和nb(v),取nb(u)和nb(v)的交集顶点集合中的每个顶点,与边e(u,v)构建支撑三角形,然后将构建的支撑三角形数量登记为边e(u,v)的支撑度sup(e)。
若是,则进行更新处理,更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出顶点u以及顶点w构成的边e′(u,w),将sup(e′)=sup(e′)-1,找出顶点v以及顶点w构成的边e′(v,w),将sup(e′)=sup(e′)-1,从社交网络社区中删除当前边e,
其中,当遍历社交网络社区中的每条边e并执行对应的更新处理后,判断社交网络社区是否被更新,若是,则设置k=k+1,继续比较社交网络社区中的每条边e的支撑度sup(e)是否小于k-2,并执行对应的更新处理;
而基于相似度的二次社区搜索,具体的,可包括:
将目标用户节点初始化到社交网络社区H中;
计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
计算当前的社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与相似度阈值sim之间的差值小于预设差值,则退出循环处理,输出当前的社交网络社区H。
其中,可以理解的是,目标用户节点作为查询节点,在实际应用中不仅可以为多个数量级的用户节点,还可以为一个的用户节点。
而若目标用户节点的数量为一个,在初始阶段社交网络社区H则仅包括一个用户节点,此时则可先从社交网络社区提取以最为适配的用户节点,先加入到社交网络社区H中,满足处理计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度、行为模式向量的需求。
其中,涉及的不同用户节点之间在行为模式向量上的相似度,具体为余弦相似度,余弦相似度通过对应两个向量之间的夹角的余弦值计算得到。
以上是本申请提供社交网络社区的搜索方法的介绍,为便于更好的实施本申请提供的社交网络社区的搜索方法,本申请还提供了社交网络社区的搜索装置。
参阅图2,图2为本申请社交网络社区的搜索装置的一种结构示意图,在本申请中,社交网络社区的搜索装置200具体可包括如下结构:
获取单元201,用于获取目标社交网络的初始社交网络社区数据,其中,初始社交网络数据以无向图G=(V,E)的数据类型配置,V为初始社交网络数据中包含的用户节点,E为无向图G=(V,E)中的边集;
计算单元202,用于根据不同用户节点的行为模式数据,计算相邻的用户节点之间的行为紧密度,并在无向图G=(V,E)中将行为紧密度作为对应用户节点之间的边的权值;
查询单元203,用于以权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,目标用户节点为待搜索所属社交网络社区的用户节点;
在一种示例性的实现方式中,k-truss模型进行的紧密用户节点搜索,包括:
若是,则进行更新处理,更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出顶点u以及顶点w构成的边e′(u,w),将sup(e′)=sup(e′)-1,找出顶点v以及顶点w构成的边e′(v,w),将sup(e′)=sup(e′)-1,从社交网络社区中删除当前边e,
其中,当遍历社交网络社区中的每条边e并执行对应的更新处理后,判断社交网络社区是否被更新,若是,则设置k=k+1,继续比较社交网络社区中的每条边e的支撑度sup(e)是否小于k-2,并执行对应的更新处理;
在又一种示例性的实现方式中,二次搜索单元,具体用于:
将目标用户节点初始化到社交网络社区H中;
计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
计算当前的社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与相似度阈值sim之间的差值小于预设差值,则退出循环处理,输出当前的社交网络社区H。
在又一种示例性的实现方式中,若目标用户节点的数量为一个,二次搜索单元,在计算社交网络社区H中包含的用户节点之间在行为模式向量上的相似度、将社交网络社区H中包含的用户节点的行为模式向量进行相加,得到行为模式向量之前,还用于:
在又一种示例性的实现方式中,不同用户节点之间在行为模式向量上的相似度,具体为余弦相似度,余弦相似度通过对应两个向量之间的夹角的余弦值计算得到。
本申请还提供了处理设备,参阅图3,图3示出了本申请处理设备的一种结构示意图,具体的,本申请处理设备可包括处理器301、存储器302以及输入输出设备303,处理器301用于执行存储器302中存储的计算机程序时实现如图1对应实施例中方法的各步骤;或者,处理器301用于执行存储器302中存储的计算机程序时实现如图2对应实施例中各单元的功能,存储器302用于存储处理器301执行上述图1对应实施例中方法所需的计算机程序。
示例性的,计算机程序可以被分割成一个或多个模块/单元,一个或者多个模块/单元被存储在存储器302中,并由处理器301执行,以完成本申请。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序在计算机装置中的执行过程。
处理设备可包括,但不仅限于处理器301、存储器302、输入输出设备303。本领域技术人员可以理解,示意仅仅是处理设备的示例,并不构成对处理设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如处理设备还可以包括网络接入设备、总线等,处理器301、存储器302、输入输出设备303以及网络接入设备等通过总线相连。
处理器301可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,处理器是处理设备的控制中心,利用各种接口和线路连接整个设备的各个部分。
存储器302可用于存储计算机程序和/或模块,处理器301通过运行或执行存储在存储器302内的计算机程序和/或模块,以及调用存储在存储器302内的数据,实现计算机装置的各种功能。存储器302可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据处理设备的使用所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。
处理器301用于执行存储器302中存储的计算机程序时,具体可实现以下功能:
获取目标社交网络的初始社交网络社区数据,其中,初始社交网络数据以无向图G=(V,E)的数据类型配置,V为初始社交网络数据中包含的用户节点,E为无向图G=(V,E)中的边集;
根据不同用户节点的行为模式数据,计算相邻的用户节点之间的行为紧密度,并在无向图G=(V,E)中将行为紧密度作为对应用户节点之间的边的权值;
以权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,目标用户节点为待搜索所属社交网络社区的用户节点;
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的社交网络社区的搜索装置、处理设备及其相应单元的具体工作过程,可以参考如图1对应实施例中方法的说明,具体在此不再赘述。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本申请提供一种计算机可读存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本申请如图1对应实施例中社交网络社区的搜索方法中的步骤,具体操作可参考如图1对应实施例中社交网络社区的搜索方法的说明,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(Read Only Memory,ROM)、随机存取记忆体(Random Access Memory,RAM)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本申请如图1对应实施例社交网络社区的搜索方法中的步骤,因此,可以实现本申请如图1对应实施例中社交网络社区的搜索方法所能实现的有益效果,详见前面的说明,在此不再赘述。
以上对本申请提供的社交网络社区的搜索方法、装置、处理设备以及计算机可读存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种社交网络社区的搜索方法,其特征在于,所述方法包括:
获取所述目标社交网络的初始社交网络社区数据,其中,所述初始社交网络数据以无向图G=(V,E)的数据类型配置,V为所述初始社交网络数据中包含的用户节点,E为所述无向图G=(V,E)中的边集;
根据不同所述用户节点的行为模式数据,计算相邻的所述用户节点之间的行为紧密度,并在所述无向图G=(V,E)中将所述行为紧密度作为对应用户节点之间的边的权值;
以所述权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,所述目标用户节点为待搜索所属社交网络社区的用户节点;
2.根据权利要求1所述的方法,其特征在于,所述k-truss模型进行的所述紧密用户节点搜索,包括:
若是,则进行更新处理,所述更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出所述顶点u以及所述顶点w构成的边e′(u,w),将sup(e′)=sup(e′)-1,找出所述顶点v以及所述顶点w构成的边e′(v,w),将sup(e′)=sup(e′)-1,从所述社交网络社区中删除所述当前边e,
其中,当遍历所述社交网络社区中的每条边e并执行对应的所述更新处理后,判断所述社交网络社区是否被更新,若是,则设置k=k+1,继续比较所述社交网络社区中的每条边e的支撑度sup(e)是否小于k-2,并执行对应的所述更新处理;
3.根据权利要求1所述的方法,其特征在于,所述以所述目标用户节点为中心,结合不同用户节点之间在行为模式向量上的相似度,对所述社交网络社区进行二次社区搜索,得到社交网络社区H,作为所述目标用户节点所属的社交网络社区,包括:
将所述目标用户节点初始化到所述社交网络社区H中;
计算所述社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
计算当前的所述社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与所述相似度阈值sim之间的差值小于所述预设差值,则退出循环处理,输出当前的所述社交网络社区H。
5.根据权利要求1所述的方法,其特征在于,所述不同用户节点之间在行为模式向量上的相似度,具体为余弦相似度,所述预先相似度通过对应两个向量之间的夹角的余弦值计算得到。
6.一种社交网络社区的搜索装置,其特征在于,所述装置包括:
获取单元,用于获取所述目标社交网络的初始社交网络社区数据,其中,所述初始社交网络数据以无向图G=(V,E)的数据类型配置,V为所述初始社交网络数据中包含的用户节点,E为所述无向图G=(V,E)中的边集;
计算单元,用于根据不同所述用户节点的行为模式数据,计算相邻的所述用户节点之间的行为紧密度,并在所述无向图G=(V,E)中将所述行为紧密度作为对应用户节点之间的边的权值;
查询单元,用于以所述权值为基础,结合三度影响力原则,查询目标用户节点为中心的社交网络社区G′,所述目标用户节点为待搜索所属社交网络社区的用户节点;
7.根据权利要求6所述的装置,其特征在于,所述k-truss模型进行的所述紧密用户节点搜索,包括:
若是,则进行更新处理,所述更新处理包括确定当前边e对应顶点u和顶点v,将nb(u)以及nb(v)的交集顶点集合W中取出每个顶点w,找出所述顶点u以及所述顶点w构成的边e′(u,w),将sup(e′)=sup(e′)-1,找出所述顶点v以及所述顶点w构成的边e′(v,w),将sup(e′)=sup(e′)-1,从所述社交网络社区中删除所述当前边e,
其中,当遍历所述社交网络社区中的每条边e并执行对应的所述更新处理后,判断所述社交网络社区是否被更新,若是,则设置k=k+1,继续比较所述社交网络社区中的每条边e的支撑度sup(e)是否小于k-2,并执行对应的所述更新处理;
8.根据权利要求6所述的装置,其特征在于,所述二次搜索单元,具体用于:
将所述目标用户节点初始化到所述社交网络社区H中;
计算所述社交网络社区H中包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim;
计算当前的所述社交网络社区H包含的用户节点之间在行为模式向量上的相似度,并将均值化得到的相似度作为相似度阈值sim 0;
若相似度阈值sim 0与所述相似度阈值sim之间的差值小于所述预设差值,则退出循环处理,输出当前的所述社交网络社区H。
9.一种处理设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110417236.5A CN113254797B (zh) | 2021-04-19 | 2021-04-19 | 一种社交网络社区的搜索方法、装置以及处理设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110417236.5A CN113254797B (zh) | 2021-04-19 | 2021-04-19 | 一种社交网络社区的搜索方法、装置以及处理设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254797A true CN113254797A (zh) | 2021-08-13 |
CN113254797B CN113254797B (zh) | 2022-09-20 |
Family
ID=77221022
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110417236.5A Active CN113254797B (zh) | 2021-04-19 | 2021-04-19 | 一种社交网络社区的搜索方法、装置以及处理设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254797B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114637912A (zh) * | 2022-03-08 | 2022-06-17 | 浙江工商大学 | 位置社交网络中的基于高覆盖性社区发现的朋友推荐方法及装置 |
CN115827996A (zh) * | 2023-02-27 | 2023-03-21 | 杭州电子科技大学 | 一种具有共享约束的社区查询方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140122472A1 (en) * | 2012-10-31 | 2014-05-01 | Benjamin Frederick Wells | Sorting Social Profile Search Results Based on Computing Personal Similarity Scores |
CN109543077A (zh) * | 2018-10-16 | 2019-03-29 | 清华大学 | 社区搜索方法 |
CN110119462A (zh) * | 2019-04-03 | 2019-08-13 | 杭州中科先进技术研究院有限公司 | 一种属性网络的社区搜索方法 |
-
2021
- 2021-04-19 CN CN202110417236.5A patent/CN113254797B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140122472A1 (en) * | 2012-10-31 | 2014-05-01 | Benjamin Frederick Wells | Sorting Social Profile Search Results Based on Computing Personal Similarity Scores |
CN109543077A (zh) * | 2018-10-16 | 2019-03-29 | 清华大学 | 社区搜索方法 |
CN110119462A (zh) * | 2019-04-03 | 2019-08-13 | 杭州中科先进技术研究院有限公司 | 一种属性网络的社区搜索方法 |
Non-Patent Citations (2)
Title |
---|
李振军等: "多维图结构聚类的社交关系挖掘算法", 《软件学报》 * |
李源等: "一种大规模双网络中k-连通Truss子图发现算法", 《计算机学报》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114637912A (zh) * | 2022-03-08 | 2022-06-17 | 浙江工商大学 | 位置社交网络中的基于高覆盖性社区发现的朋友推荐方法及装置 |
CN114637912B (zh) * | 2022-03-08 | 2024-05-03 | 浙江工商大学 | 位置社交网络中的基于高覆盖性社区发现的朋友推荐方法及装置 |
CN115827996A (zh) * | 2023-02-27 | 2023-03-21 | 杭州电子科技大学 | 一种具有共享约束的社区查询方法及系统 |
CN115827996B (zh) * | 2023-02-27 | 2023-05-02 | 杭州电子科技大学 | 一种具有共享约束的社区查询方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113254797B (zh) | 2022-09-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10102227B2 (en) | Image-based faceted system and method | |
TWI712963B (zh) | 推薦系統建構方法及裝置 | |
CN113254797B (zh) | 一种社交网络社区的搜索方法、装置以及处理设备 | |
US20150127677A1 (en) | Enterprise graph search based on object and actor relationships | |
WO2014194642A1 (en) | Systems and methods for matching users | |
CN111460234B (zh) | 图查询方法、装置、电子设备及计算机可读存储介质 | |
US10268655B2 (en) | Method, device, server and storage medium of searching a group based on social network | |
US20230401281A1 (en) | Matrix operation-based method for modifying mobile social network graph | |
CN109120431B (zh) | 复杂网络中传播源选择的方法、装置及终端设备 | |
CN112100450A (zh) | 一种图计算数据分割方法、终端设备及存储介质 | |
Olsen et al. | On the approximability of the link building problem | |
CN109802859B (zh) | 一种网络图中的节点推荐方法和服务器 | |
CN111008873B (zh) | 一种用户确定方法、装置、电子设备及存储介质 | |
Ovchinnikov | Topological field theory of dynamical systems. II | |
CN116028832A (zh) | 一种样本聚类处理方法、装置、存储介质及电子设备 | |
CN114547476A (zh) | 一种基于二部图的社区搜索方法、装置以及处理设备 | |
CN115827280A (zh) | 消息处理方法、装置、电子设备及存储介质 | |
US10872121B2 (en) | Systems and methods for matching users | |
US9536199B1 (en) | Recommendations based on device usage | |
CN110020087B (zh) | 一种基于相似度估计的分布式PageRank加速方法 | |
CN110647664A (zh) | 一种知识图谱中树图大规模更新方法、系统、介质及设备 | |
JP6333306B2 (ja) | 検索データ管理装置、検索データ管理方法、および検索データ管理プログラム | |
CN113255712A (zh) | 一种推荐方法以及装置 | |
CN114490095B (zh) | 请求结果的确定方法和装置、存储介质及电子装置 | |
CN112488767B (zh) | 一种客户群体划分方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |