CN113424180A - 基于时间跨度优化的短时社区搜索方法 - Google Patents

基于时间跨度优化的短时社区搜索方法 Download PDF

Info

Publication number
CN113424180A
CN113424180A CN202180001416.3A CN202180001416A CN113424180A CN 113424180 A CN113424180 A CN 113424180A CN 202180001416 A CN202180001416 A CN 202180001416A CN 113424180 A CN113424180 A CN 113424180A
Authority
CN
China
Prior art keywords
community
short
time
subgraph
time span
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202180001416.3A
Other languages
English (en)
Inventor
王朝坤
顾天凯
楼昀恺
竺俊超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Publication of CN113424180A publication Critical patent/CN113424180A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供一种基于时间跨度优化的短时社区搜索方法,包括:获取用户的查询需求;查询需求包括:用来约束社区的子图拓扑结构特征,预设返回短时社区的数量和网络中需要的查询节点;根据查询需求计算网络中的全局时间跨度上限,获取最大子图;在最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区;将最小短时社区向外扩展且不超过最大子图,将满足条件的社区纳入短时社区集合;判断当前短时社区集合中社区的数量是否达到查询需求预设返回短时社区的数量:若是,则输出短时社区集合;若否,则继续将短时社区向外扩展,将满足条件的社区纳入短时社区集合再次进行判断。本公开可以有效解决推荐系统中对用户社区的时效性需求。

Description

基于时间跨度优化的短时社区搜索方法
技术领域
本公开涉及社区搜索技术领域,特别涉及一种基于时间跨度优化的短时社区搜索方法。
背景技术
随着互联网的不断发展,用户规模也在逐年增加。近十几年来,越来越多的用户习惯于在网络上进行交友,浏览,购物等活动。由于互联网上数据量的不断增加,用户很难直接在庞大的数据中找到适合自己的内容。因此,如何结合海量数据挖掘用户行为是推荐技术中的重点研究问题之一。其中,用户社区推荐作为推荐技术中的关键任务,近年来在学术界和工业界也受到越来越多的关注。
在用户社区推荐方面,其目的是在网络中找到与查询用户相似成员所构成的社区。例如在短视频平台,用户常常会在平台中浏览喜爱的视频。尽管不同用户偏好不同,随着用户量的不断增加可以找到其他与之观看视频类别相类似的用户群体。由于这些用户往往具有一定程度的相似性,通过找到这部分用户群体,有助于发现用户兴趣爱好,引导用户加入到感兴趣的社区中。然而,尽管社区是社交网络的一个重要属性,但是社区这一概念尚无统一的形式化定义。通常,社区具有社区内节点连接较为紧密,社区间节点连接较为松散的特点。因此,如何挖掘社交网络图数据中的社区结构是近年来的研究热点。
研究者可以借助社区结构进行大量实际应用,例如社交网络中基于条件的社区发现,基于社区结构优化子图匹配,层次化社区发现以及利用网络上的时序属性进行社区搜索等。近几年中,网络图数据的时序性逐渐受到学者关注。在时序网络中,节点间的边具有时间属性,代表两个节点在某一或某些时刻(即时间戳)产生关联。在时序图中存在许多与时序性相关的社区搜索问题,例如在时序动物行为网络中寻找周期性出现的动物路线以探寻周期性的迁徙现象,或者在时序社交网络中找出在任意一个固定长度的子区间中都能满足拓扑约束的时序紧密型社区。
在推荐场景下的社区推荐往往具有时效性要求。通常情况下,用户兴趣可以分为长期兴趣和短期兴趣两类。长期兴趣是用户稳定的兴趣爱好,其特点是在较长时间段内用户的兴趣爱好不会发生变化。而短期兴趣往往由平台中的话题、活动等突发事件引起,用户对此的兴趣往往随着话题、活动的结束而快速消失。时效性对应用户的短时兴趣,通过找到近期内活跃的社区,平台既可以为用户提供共同讨论圈,又可以通过这些社区挖掘近期活跃内容。目前已有社区搜索算法尚未考虑到建模用户短期兴趣的社区结构,此时应用已有算法无法保证找到的社区满足时效性需求。大多数社区搜索算法返回的社区中,用户交互时间差异较大,因而不能用于解决推荐场景下的社区推荐问题。
针对上述在社区推荐中尚存的问题,本发明提出了基于时间跨度优化的短时社区搜索方法,通过分析时序社交网络用户交互的特点,提出了带有时间约束的社区结构并进一步提出了相应的社区搜索方法以返回具有时效性的社区。
发明内容
本公开实施例所要解决的一个技术问题是:提供一种基于时间跨度优化的短时社区搜索方法,通过分析时序社交网络用户交互的特点,提出了带有时间约束的社区结构并进一步提出了相应的社区搜索方法以返回具有时效性的社区,所述基于时间跨度优化的短时社区搜索方法包括:
S1获取用户的查询需求;所述查询需求包括:用来约束社区的子图拓扑结构特征,预设返回短时社区的数量和网络中需要的查询节点;
S2根据查询需求计算网络中的全局时间跨度上限,获取最大子图;
S3在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区;
S4将所获取的最小短时社区向外扩展且不超过最大子图范围,将满足条件的社区纳入短时社区集合;
S5判断当前短时社区集合中社区的数量是否达到查询需求预设返回短时社区的数量:
若是,则输出短时社区集合;
若否,则执行S4继续将短时社区向外扩展,将满足条件的社区纳入短时社区集合。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述根据查询需求计算网络中的全局时间跨度上限,获取最大子图包括:
S21在静态网络中找到查询节点所在的社区;所述静态网络不考虑时序特点;
S22在静态网络中确定查询节点所在完全图的数量,在全部完全图构成的完全图集合中任取一个完全图,计算所取完全图在时序网络中存在不重复的时间跨度的数量;
S23判断所计算的不重复的时间跨度的数量与完全图集合中除去所取完全图外其它完全图数量之和是否不小于预设返回短时社区的数量:
若是,则S24将完全图叠加的子图作为最大子图;
若否,则S25将各完全图在原时序网络范围向外扩展,直到每个完全图在扩展之后重新满足约束社区的子图拓扑结构的约束条件,形成扩展后的子图,计算各扩展后的子图中存在的不重复时间跨度的数量,累加后判断是否不小于预设返回短时社区的数量:
若是,则各扩展后子图叠加所形成的子图为最大子图;
若否,则S25,直到扩展后的子图为查询节点所在的社区,各扩展叠加后子图中存在的不重复时间跨度的数量累加后仍小于预设返回短时社区的数量,则在静态网络中找到的查询节点所在社区作为全局时间跨度上限对应的最大子图。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区包括:
在最大子图范围查询节点所在的基本块的集合;
在所有基本块中找到查询节点的最小短时社区;
计算各基本块的时间跨度,拥有最小时间跨度的基本块为最小短时社区。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述向外扩展的方式为向当前区域增加新的节点和边,所增加新的节点和边存在于静态网络中查询节点所在的社区,不存在于当前的区域中。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述将所获取的最小短时社区向外扩展且不超过最大子图的范围,并将满足条件的社区纳入短时社区集合包括:
根据查询需求计算在每次扩展过程中的渐进时间跨度上限;
从最小短时社区开始,在新增节点和边对图中时间跨度增量不超过渐进时间跨度上限的基础上,在最大子图的范围内不断新增节点和边,直至再一次满足约束社区的子图拓扑结构的约束条件;
在新的满足约束社区的子图拓扑结构约束条件的子图上计算子图的最小时间跨度并与扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度作比较:
当新的满足约束社区的子图拓扑结构约束条件的子图上计算的子图最小时间跨度等于扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度时,去除短时社区集合当前存储的最小短时社区,加入新的满足约束社区的子图拓扑结构约束条件的子图;
当新的满足约束社区的子图拓扑结构约束条件的子图上计算的子图最小时间跨度大于扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度时,加入新的满足约束社区的子图拓扑结构约束条件的子图。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述根据查询需求计算在每次扩展过程中的渐进时间跨度上限包括:
S411在当前满足条件的子图上新增若干节点和边,直至满足约束社区的子图拓扑结构约束条件构成新的子图,记录过程中新增节点的节点序列;
S412对于新增节点的节点序列中每一个节点,当前子图中存在一些节点与其相连构成新边,在新增边序列中分别在每个新增节点所构成的新边集合中任取一条时序边,计算各个时序边构成的集合的时间跨度增量;
重复S412直至遍历完所有情况,即不存在未被计算的时间跨度增量;
将所有的时间跨度按升序排序,找到第预设返回短时社区数量小的时间跨度,作为当次扩展过程中的渐进时间跨度上限。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区为短时社区的集合。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述根据查询需求计算网络中的全局时间跨度上限,获取最大子图还包括:根据查询需求计算网络中的短时社区数量的上限。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述时间跨度是由时序边组成的集合中拥有最大时间戳的时序边和拥有最小时间戳的时序边的时间间隔,即最大时间戳与最小时间戳之差。
在基于本公开上述基于时间跨度优化的短时社区搜索方法的另一个实施例中,所述网络中的短时社区数量上限计算为网络中所有边上时间戳数量的乘积,预设返回短时社区的数量不应超过网络中短时社区数量的上限。
与现有技术相比,本公开具有以下优点:
本公开提出了一种基于时间跨度优化的短时社区搜索方法,通过分析时序社交网络用户交互的特点,设计了高效的算法在大规模时序网络中挖掘短时社区,并在真实数据集和合成数据集上取得了最好的表现,可以有效解决推荐系统中对用户社区的时效性需求,同时本公开找到的短时社区在真实应用中可以捕捉到用户的短期兴趣。
附图说明
构成说明书的一部分的附图描述了本公开的实施例,并且连同描述一起用于解释本公开的原理。
参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:
图1为本公开的基于时间跨度优化的短时社区搜索方法的一个实施例的流程图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
图1为本公开的基于时间跨度优化的短时社区搜索方法的一个实施例的流程图,如图1所示,所述基于时间跨度优化的短时社区搜索方法包括:
S1获取用户的查询需求;所述查询需求包括:用来约束社区的子图拓扑结构特征,预设返回短时社区的数量和网络中需要的查询节点;
实际应用中,根据用户的查询需求,输入参数δ、参数k和查询节点vq,输出短时社区集合MSTCs,其中δ用来约束社区结构,参数k用来确定返回短时社区的数量,vq用来确定网络中需要进行查询的节点。
S2根据查询需求计算网络中的全局时间跨度上限,获取最大子图;
根据查询需求计算网络中的全局时间跨度上限,确定并输出最大子图maxG。
具体实现包括,S21在静态网络中找到查询节点所在的社区;所述静态网络不考虑时序特点;
S22在静态网络中确定查询节点所在完全图的数量,在全部完全图构成的完全图集合中任取一个完全图,计算所取完全图在时序网络中存在不重复的时间跨度的数量;
S23判断所计算的不重复的时间跨度的数量与完全图集合中除去所取完全图外其它完全图数量之和是否不小于预设返回短时社区的数量:
若是,则S24将完全图叠加的子图作为最大子图;
若否,则S25将各完全图在原时序网络范围向外扩展,直到每个完全图在扩展之后重新满足约束社区的子图拓扑结构的约束条件,形成扩展后的子图,计算各扩展后的子图中存在的不重复时间跨度的数量,累加后判断是否不小于预设返回短时社区的数量:
若是,则各扩展后子图叠加所形成的子图为最大子图;
若否,则S25,直到扩展后的子图为查询节点所在的社区,各扩展叠加后子图中存在的不重复时间跨度的数量累加后仍小于预设返回短时社区的数量,则在静态网络中找到的查询节点所在社区作为全局时间跨度上限对应的最大子图。
实际应用中,2.1应用不考虑时序特点的已有社区搜索方法找到查询节点所在的社区,将其记为C。2.2在静态网络中(即对时序网络做投影,不考虑图中的时序属性)确定查询节点vq所在δ完全图的数量,记为N,同时在N个完全图(G1,G2,…,GN)所构成的集合中任取一个δ完全图,并计算这个δ完全图在时序网络上存在不重复的时间跨度的数量,记为Num,判断Num+N-1是否不小于输入参数k。若是,则认为最大子图maxG是将N个完全图(G1,G2,…,GN)叠加所形成的子图,并将这N个完全图中最大的时间跨度作为全局时间上限,进入步骤2.4将完全图叠加的子图作为最大子图;否则进入步骤2.3。2.3对N个完全图中的每一个完全图,分别在原时序网络的范围内不断向其中加入新的节点和边,所述新的节点和边存在于静态网络中查询节点所在的社区,不存在于当前的完全图中。直至每一个完全图在扩展之后重新满足约束社区的子图拓扑结构δ-truss结构约束,形成新的子图。计算每一个扩展后的子图中存在的不重复时间跨度的数量,将其累加后判断是否大于等于输入参数k,若是,则认为最大子图maxG是N个扩展后子图叠加所形成的子图,N个扩展后子图叠加所形成的子图为最大子图;并将这N个扩展后的子图中最大的时间跨度作为全局时间上限。否则重复步骤2.3,直至扩展后的子图为查询节点所在的社区,说明图中不重复时间跨度的数量仍小于参数k,此时静态网络中找到查询节点所在的社区对应的时间跨度作为最大的时间跨度并返回静态网络中找到查询节点所在的社区。给定一个时序网络G和一组查询参数(δ,k,vq)可以确定一个唯一的最大子图maxG和对应的最大时间跨度。
应用中,所述向外扩展的方式为向当前区域增加新的节点和边,所增加新的节点和边存在于静态网络中查询节点所在的社区,不存在于当前的区域中。
S3在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区;
具体包括:在最大子图范围查询节点所在的基本块的集合;在所有基本块中找到查询节点的最小短时社区;计算各基本块的时间跨度,拥有最小时间跨度的基本块为最小短时社区。在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区为短时社区的集合。
实施例应用中,在最大子图的范围内找到查询节点所在的δ-基本块集合,确定并输出查询节点的最小短时社区(或最小短时社区集合)。3.1根据δ-基本块的定义,找到查询节点vq所有δ-基本块所构成的集合。在最大子图范围内查询节点所在的基本块的集合;3.2在所有δ-基本块中找到查询节点vq的最小短时社区(或最小短时社区集合)。即对于各个δ-基本块分别计算其时间跨度,拥有最小时间跨度的δ-基本块(或δ-基本块集合)为最小短时社区(或最小短时社区集合)。
S4将所获取的最小短时社区向外扩展且不超过最大子图范围,将满足条件的社区纳入短时社区集合;
具体包括:根据查询需求计算在每次扩展过程中的渐进时间跨度上限;
更为具体的包括:S411在当前满足条件的子图上新增若干节点和边,直至满足约束社区的子图拓扑结构约束条件构成新的子图,记录过程中新增节点的节点序列;S412对于新增节点的节点序列中每一个节点,当前子图中存在一些节点与其相连构成新边,在新增边序列中分别在每个新增节点所构成的新边集合中任取一条时序边,计算各个时序边构成的集合的时间跨度增量;重复S412直至遍历完所有情况,即不存在未被计算的时间跨度增量;将所有的时间跨度按升序排序,找到第预设返回短时社区数量小的时间跨度,作为当次扩展过程中的渐进时间跨度上限。
更具体的,所述根据查询需求计算网络中的全局时间跨度上限,获取最大子图还包括:根据查询需求计算网络中的短时社区数量的上限。所述时间跨度是由时序边组成的集合中拥有最大时间戳的时序边和拥有最小时间戳的时序边的时间间隔,即最大时间戳与最小时间戳之差。
从最小短时社区开始,在新增节点和边对图中时间跨度增量不超过渐进时间跨度上限的基础上,在最大子图的范围内不断新增节点和边,直至再一次满足约束社区的子图拓扑结构的约束条件;
在新的满足约束社区的子图拓扑结构约束条件的子图上计算子图的最小时间跨度并与扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度作比较:
当新的满足约束社区的子图拓扑结构约束条件的子图上计算子图的最小时间跨度等于扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度时,去除短时社区集合当前存储的最小短时社区,加入新的满足约束社区的子图拓扑结构约束条件的子图;
当新的满足约束社区的子图拓扑结构约束条件的子图上计算子图的最小时间跨度大于扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度时,加入新的满足约束社区的子图拓扑结构约束条件的子图。
在最小短时社区(或短时社区集合)的基础上不断向外扩展,扩展范围不超过最大子图maxG,并将满足条件的社区纳入短时社区集合MSTCs中。
实施例应用中,4.1根据查询需求计算在每次扩展过程中的渐进时间跨度上限。4.1.1在当前满足条件的子图上(记为h)新增若干节点和边,直至满足约束社区的子图拓扑结构δ-truss约束构成新的子图(记为h’),记这一过程中新增节点的节点序列为{v1v2..vm}。4.1.2对于新增节点的节点序列中每一个节点,h中都会存在一些节点与其相连构成新边,记在h中与节点序列中某一节点(记vi)所构成的新边集合为S(vi),那么h到h’的过程中增加的边可以表示为S(v1)S(v2)…S(vm),其大小为m。在这大小为m的新增边序列中分别在各个集合(即S(v1),S(v2),…,S(vm))任取一条时序边,计算由这m个时序边构成的集合的时间跨度增量。不断重复4.1.2步骤直至遍历完所有情况,即不存在未被计算的时间跨度增量。4.1.3将所有的时间跨度按升序排序,找到第k小的时间跨度,作为当次扩展过程中的渐进时间跨度上限。4.2从最小短时社区(或最小短时社区集合)开始,在新增节点和边对图中时间跨度增量不超过渐进时间跨度上限的基础上,在最大子图maxG的范围内不断新增节点和边,直至再一次满足约束社区的子图拓扑结构δ-truss约束。4.3在新的满足约束社区的子图拓扑结构δ-truss的子图上计算子图的最小时间跨度,进行如下判断(记当前新的满足δ-truss的子图为g,扩展之前满足δ-truss的子图为g’,那么最开始的g’就是最小短时社区):如果在新的满足δ-truss的子图g(以下简称为g)上计算得到的最小时间跨度等于g’上计算得到的最小时间跨度,则在短时社区集合MSTCs中去除g’,加入g。如果在g上得到的最小时间跨度大于g’上计算得到的最小时间跨度,则无需在短时社区集合MSTCs中去除g’,在原来的基础上继续加入g。
S5判断当前短时社区集合中社区的数量是否达到查询需求预设返回短时社区的数量:
若是,则S6输出短时社区集合;
若否,则执行S4继续将短时社区向外扩展,将满足条件的社区纳入短时社区集合。
实施例应用中,判断当前状态是否达到方法结束条件,若未满足则返回第4.3步,否则返回并输出短时社区集合MSTCs,结束方法。5.1判断短时社区集合MSTCs中存储的短时社区数量是否为k。若数量为k,则返回短时社区集合并结束方法,否则进入步骤5.2;5.2判断新的满足δ-truss的子图g的规模是否已经达到最大子图maxG。若已经达到最大子图maxG,则说明k值超过网络中短时社区数量的上限,实际时序网络中不存在如此规模的短时社区,此时直接返回当前存储的短时社区MSTCs并结束方法。否则说明实际时序网络中尚存在未被发现的短时社区,回到步骤4.3。
具体的:满足δ-结构约束:给定一个子图g,对于g中的任意一条边,都可以在g中组成至少δ-2个三角形,且对于g中的任意两条边,都可以通过任意多个三角形(包括0个三角形)相互连接。时间跨度计算为由时序边组成的集合中拥有最大时间戳的时序边和拥有最小时间戳的时序边的时间间隔,即最大时间戳与最小时间戳之差。所述网络中的短时社区数量上限计算为网络中所有边上时间戳数量的乘积,预设返回短时社区的数量不应超过网络中短时社区数量的上限。
本说明书中各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似的部分相互参见即可。对于系统实施例而言,由于其与方法实施例基本对应,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本公开的描述是为了示例和描述起见而给出的,而并不是无遗漏的或者将本公开限于所公开的形式。很多修改和变化对于本领域的普通技术人员而言是显然的。选择和描述实施例是为了更好说明本公开的原理和实际应用,并且使本领域的普通技术人员能够理解本公开从而设计适于特定用途的带有各种修改的各种实施例。

Claims (10)

1.一种基于时间跨度优化的短时社区搜索方法,其特征在于,包括:
S1获取用户的查询需求;所述查询需求包括:用来约束社区的子图拓扑结构特征,预设返回短时社区的数量和网络中需要的查询节点;
S2根据查询需求计算网络中的全局时间跨度上限,获取最大子图;
S3在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区;
S4将所获取的最小短时社区向外扩展且不超过最大子图范围,将满足条件的社区纳入短时社区集合;
S5判断当前短时社区集合中社区的数量是否达到查询需求预设返回短时社区的数量:
若是,则输出短时社区集合;
若否,则执行S4继续将短时社区向外扩展,将满足条件的社区纳入短时社区集合。
2.根据权利要求1所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述根据查询需求计算网络中的全局时间跨度上限,获取最大子图包括:
S21在静态网络中找到查询节点所在的社区;所述静态网络不考虑时序特点;
S22在静态网络中确定查询节点所在完全图的数量,在全部完全图构成的完全图集合中任取一个完全图,计算所取完全图在时序网络中存在不重复的时间跨度的数量;
S23判断所计算的不重复的时间跨度的数量与完全图集合中除去所取完全图外其它完全图数量之和是否不小于预设返回短时社区的数量:
若是,则S24将完全图叠加的子图作为最大子图;
若否,则S25将各完全图在原时序网络范围向外扩展,直到每个完全图在扩展之后重新满足约束社区的子图拓扑结构的约束条件,形成扩展后的子图,计算各扩展后的子图中存在的不重复时间跨度的数量,累加后判断是否不小于预设返回短时社区的数量:
若是,则各扩展后子图叠加所形成的子图为最大子图;
若否,则S25,直到扩展后的子图为查询节点所在的社区,各扩展叠加后子图中存在的不重复时间跨度的数量累加后仍小于预设返回短时社区的数量,则将在静态网络中找到的查询节点所在社区作为全局时间跨度上限对应的最大子图。
3.根据权利要求2所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区包括:
在最大子图范围查询节点所在的基本块的集合;
在所有基本块中找到查询节点的最小短时社区;
计算各基本块的时间跨度,拥有最小时间跨度的基本块为最小短时社区。
4.根据权利要求3所述的基于时间跨度优化的短时社区搜索方法,其特征在于:
所述向外扩展的方式为向当前区域增加新的节点和边,所增加新的节点和边存在于静态网络中查询节点所在的社区,不存在于当前的区域中。
5.根据权利要求4所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述将所获取的最小短时社区向外扩展且不超过最大子图的范围,并将满足条件的社区纳入短时社区集合包括:
根据查询需求计算在每次扩展过程中的渐进时间跨度上限;
从最小短时社区开始,在新增节点和边对图中时间跨度增量不超过渐进时间跨度上限的基础上,在最大子图的范围内不断新增节点和边,直至再一次满足约束社区的子图拓扑结构的约束条件;
在新的满足约束社区的子图拓扑结构约束条件的子图上计算子图的最小时间跨度并与扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度作比较:
当新的满足约束社区的子图拓扑结构约束条件的子图上计算的子图最小时间跨度等于扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度时,去除短时社区集合当前存储的最小短时社区,加入新的满足约束社区的子图拓扑结构约束条件的子图;
当新的满足约束社区的子图拓扑结构约束条件的子图上计算的子图最小时间跨度大于扩展前满足约束社区的子图拓扑结构约束条件的子图上计算的最小时间跨度时,加入新的满足约束社区的子图拓扑结构约束条件的子图。
6.根据权利要求5所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述根据查询需求计算在每次扩展过程中的渐进时间跨度上限包括:
S411在当前满足条件的子图上新增若干节点和边,直至满足约束社区的子图拓扑结构约束条件构成新的子图,记录过程中新增节点的节点序列;
S412对于新增节点的节点序列中每一个节点,当前子图中存在一些节点与其相连构成新边,在新增边序列中分别在每个新增节点所构成的新边集合中任取一条时序边,计算各个时序边构成的集合的时间跨度增量;
重复S412直至遍历完所有情况,即不存在未被计算的时间跨度增量;
将所有的时间跨度按升序排序,找到第预设返回短时社区数量小的时间跨度,作为当次扩展过程中的渐进时间跨度上限。
7.根据权利要求1所述的基于时间跨度优化的短时社区搜索方法,其特征在于,在所获取的最大子图的范围内找到查询节点所在的集合,获取查询节点的最小短时社区为短时社区的集合。
8.根据权利要求1所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述根据查询需求计算网络中的全局时间跨度上限,获取最大子图还包括:根据查询需求计算网络中的短时社区数量的上限。
9.根据权利要求8所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述时间跨度是由时序边组成的集合中拥有最大时间戳的时序边和拥有最小时间戳的时序边的时间间隔,即最大时间戳与最小时间戳之差。
10.根据权利要求9所述的基于时间跨度优化的短时社区搜索方法,其特征在于,所述网络中的短时社区数量上限计算为网络中所有边上时间戳数量的乘积,预设返回短时社区的数量不应超过网络中短时社区数量的上限。
CN202180001416.3A 2021-05-13 2021-05-13 基于时间跨度优化的短时社区搜索方法 Pending CN113424180A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2021/093526 WO2022236760A1 (zh) 2021-05-13 2021-05-13 基于时间跨度优化的短时社区搜索方法

Publications (1)

Publication Number Publication Date
CN113424180A true CN113424180A (zh) 2021-09-21

Family

ID=77719475

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202180001416.3A Pending CN113424180A (zh) 2021-05-13 2021-05-13 基于时间跨度优化的短时社区搜索方法

Country Status (2)

Country Link
CN (1) CN113424180A (zh)
WO (1) WO2022236760A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115827996A (zh) * 2023-02-27 2023-03-21 杭州电子科技大学 一种具有共享约束的社区查询方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180341696A1 (en) * 2017-05-27 2018-11-29 Hefei University Of Technology Method and system for detecting overlapping communities based on similarity between nodes in social network
CN110162716A (zh) * 2019-05-21 2019-08-23 湖南大学 一种基于社区检索的影响力社区搜索方法和系统
CN111666468A (zh) * 2020-05-11 2020-09-15 浙江工商大学 一种基于团簇属性在社交网络中搜索个性化影响力社区的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108319728A (zh) * 2018-03-15 2018-07-24 深圳大学 一种基于k-star的频繁社区搜索方法及系统
US10887315B2 (en) * 2018-06-19 2021-01-05 At&T Intellectual Property I, L.P. Data and context based role membership system
US11397897B2 (en) * 2019-09-10 2022-07-26 Abbas Ameri Knowledge currency
CN111177578B (zh) * 2019-12-16 2022-04-15 杭州电子科技大学 一种用户周边最具影响力社区的搜索方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180341696A1 (en) * 2017-05-27 2018-11-29 Hefei University Of Technology Method and system for detecting overlapping communities based on similarity between nodes in social network
CN110162716A (zh) * 2019-05-21 2019-08-23 湖南大学 一种基于社区检索的影响力社区搜索方法和系统
CN111666468A (zh) * 2020-05-11 2020-09-15 浙江工商大学 一种基于团簇属性在社交网络中搜索个性化影响力社区的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
顾天凯等: "《时序网络中短时社区搜索方法研究》", 《计算机学报》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115827996A (zh) * 2023-02-27 2023-03-21 杭州电子科技大学 一种具有共享约束的社区查询方法及系统
CN115827996B (zh) * 2023-02-27 2023-05-02 杭州电子科技大学 一种具有共享约束的社区查询方法及系统

Also Published As

Publication number Publication date
WO2022236760A1 (zh) 2022-11-17

Similar Documents

Publication Publication Date Title
Marche et al. How to exploit the social Internet of Things: Query generation model and device profiles’ dataset
Aynaud et al. Communities in evolving networks: definitions, detection, and analysis techniques
CN102799671B (zh) 基于PageRank算法的网络个性化推荐方法
CN109271488B (zh) 一种结合行为序列和文本信息的社交网络用户间因果关系发现方法及系统
CN103955535A (zh) 一种基于元路径的个性化推荐方法及系统
CN102855309B (zh) 一种基于用户行为关联分析的信息推荐方法及装置
CN114265986B (zh) 一种融合知识图谱结构与路径语义的信息推送方法和系统
Anwar et al. Capturing the spatiotemporal evolution in road traffic networks
CN103914493A (zh) 一种微博用户群体结构发现分析方法及系统
TW201342088A (zh) 數位內容次序調整方法和數位內容匯流器
CN105224959A (zh) 排序模型的训练方法和装置
CN104063448A (zh) 一种视频领域相关的分布式微博数据抓取系统
CN111597449A (zh) 用于搜索的候选词构建方法、装置、电子设备及可读介质
CN113424180A (zh) 基于时间跨度优化的短时社区搜索方法
CN113312563A (zh) 信息推荐方法、装置、设备及存储介质
Reddy et al. An enhanced travel package recommendation system based on location dependent social data
CN102722569A (zh) 基于rdf图路径游走的知识发现装置及方法
Abdrabbah et al. Collaborative filtering based on dynamic community detection
CN113810234A (zh) 微服务链路拓扑处理方法、装置及可读存储介质
CN103345509B (zh) 获取路网上复反向最远邻居的层次分区树方法及系统
CN107730306A (zh) 基于多维偏好模型的电影评分预测与偏好估计方法
CN115827996B (zh) 一种具有共享约束的社区查询方法及系统
CN104935967A (zh) 一种视频终端用户的兴趣识别方法及装置
CN111291904B (zh) 偏好预测方法、装置及计算机设备
CN108898506A (zh) 一种基于多标签传播的重叠社团挖掘方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210921