CN116561377A - 一种图数据集的流式图划分方法 - Google Patents

一种图数据集的流式图划分方法 Download PDF

Info

Publication number
CN116561377A
CN116561377A CN202310351154.4A CN202310351154A CN116561377A CN 116561377 A CN116561377 A CN 116561377A CN 202310351154 A CN202310351154 A CN 202310351154A CN 116561377 A CN116561377 A CN 116561377A
Authority
CN
China
Prior art keywords
vertex
partition
graph
vertexes
dividing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310351154.4A
Other languages
English (en)
Inventor
姚正安
施章灿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sun Yat Sen University
Original Assignee
Sun Yat Sen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sun Yat Sen University filed Critical Sun Yat Sen University
Priority to CN202310351154.4A priority Critical patent/CN116561377A/zh
Publication of CN116561377A publication Critical patent/CN116561377A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开一种图数据集的流式图划分方法,包括以下步骤:S1:获取外部数据,所述外部数据形成大规模的图数据;S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。本发明对图流的顶点输入顺序进行改进,在保证流式图划分算法的运行速度前提下对其划分质量进行提升,另外还利用之前的分区结果信息对后续迭代进行改进。

Description

一种图数据集的流式图划分方法
技术领域
本发明涉及图计算技术领域,更具体地,涉及一种图数据集的流式图划分方法。
背景技术
在图计算领域中,如何利用有限的计算资源对大规模的图数据进行计算是当今大数据时代背景下的一个重要问题。不断产生的用户行为及网络内容带来了大规模的海量的图数据集,使得单台计算机难以完成计算任务。对于此类问题的典型解决方案是将输入的图数据划分为多个分区,并分配到多台机器上进行计算,以此提高计算效率。因此,如何更好的对图进行划分是分布式图计算中的一个关键问题。
目前,最为前沿的图划分算法为流式图划分算法及其迭代式版本流式重划分算法。在流式算法中,图数据以顶点流或边流的形式输入算法,算法对其进行线性的扫描,仅利用其局部信息立即执行分配,并不再进行更改。因此,该类算法能取得极快的处理速度并使用相对于图本身大小而言较小的内存。同时,流式算法也存在一些不足。首先,由于其仅利用图的局部信息,并不关注图的整体结构,使其划分质量相较目前最优的离线划分算法(如METIS)仍有一定差距。其次,目前关于流式图划分算法的研究中通常使用随机顺序或BFS/DFS顺序,这些顺序会对算法的划分质量产生显著影响。
现有技术公开了一种基于并发改进的大规模图数据流式划分方法及系统,包括:工作节点登记同步;代理服务器发送顶点信息;工作节点返回梯度信息;代理服务器发送最优分区信息;工作节点保存分区结果。该方案通过一次发送多个顶点及其相关信息的方法,解决了现有流式图划分方法一次网络时延处理一个顶点的问题,减少网络时延对系统的影响,提高了图划分效率。但是该方案未对流式重划分算法的划分质量有所改进。
发明内容
本发明提供一种图数据集的流式图划分方法,保证流式图划分算法的运行速度前提下对其划分质量进行提升。
为解决上述技术问题,本发明的技术方案如下:
一种图数据集的流式图划分方法,包括以下步骤:
Sl:获取外部数据,所述外部数据形成大规模的图数据;
S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
上述方案中仅使用顶点的度进行排序,无需利用现有的分区信息,并在多次迭代中保持不变。该静态顺序可使用在仅进行一次迭代的流式图划分算法。
优选地,所述外部数据为用户行为及网络内容,其中,所述外部数据形成大规模的图数据中,图的顶点为用户,边为用户之间的行为。
优选地,步骤S2中所述按照顶点的度的大小对顶点进行排序,具体为:
按照顶点的度的大小对顶点进行降序排序。
优选地,步骤S3中利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间,具体为:
S3.1:当前输入的顶点为v,计算顶点v的相邻顶点N(v),设定分区数k;
S3.2:寻找顶点v在第i个分区Pi的所有相邻顶点,即Pi∩N(v),i=1,2,...,k;
S3.3:根据分区Pi的当前负载计算惩罚项;
S3.4:根据步骤S3.2的分区Pi含有的顶点v的相邻顶点数和步骤S3.3的惩罚项,计算分区Pi的得分;
S3.4:按照步骤S3.2至S3.4,计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区;
S3.5:对输入的每一个顶点,按照步骤S3.1至S3.4,划分至得分最大的分区。
优选地,步骤S3.3中根据分区Pi的当前负载计算惩罚项,具体为:
式中,w(i)为惩罚项,|Pi|为分区Pi中当前含有的顶点数,C为分区Pi所能承载的最大顶点数。
优选地,步骤S3.4中计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,具体为:
g(v,Pi)=|Pi∩N(v)|w(i)
式中,g(v,Pi)为顶点v在分区Pi的得分。
优选地,步骤S3后,还包括以下步骤:
S4:根据步骤S3的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
S5:根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序;
S6:使用步骤S3的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
S7:以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
S8:重复步骤S4至步骤S7,直到达到预先设定的迭代次数,得到最后的划分结果。
步骤S3后,得到分区结果,在给定已有的分区情况下,对每个顶点根据其相邻顶点在当前分区和其他分区的分布情况计算一个值,根据该值对所有顶点进行排序,以此作为下次迭代时顶点的图流输入顺序。该顺序在每次迭代前均根据上次迭代的结果重新进行计算。本发明所采用的方案,可充分利用已有的分区结果信息,并以图流输入顺序的方式融入到下一次迭代中,从而对流式重划分算法的划分质量带来显著的提升。
本发明还提供一种图数据集的流式图划分系统,所述系统应用上述所述的图数据集的流式图划分方法,所述系统包括:
数据获取模块,所述数据获取模块用于获取外部数据,所述外部数据形成大规模的图数据;
第一排序模块,所述排序模块用于计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
第一划分模块,所述第一划分模块利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
优选地,所述系统还包括:
计算模块,所述计算模块根据所述第一划分模块的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
第二排序模块,所述第二排序模块根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序,并在划分过程中使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
第二划分模块,所述第二划分模块使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
迭代模块,所述迭代模块以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
结果输出模块,所述结果输出模块重复计算模块至迭代模块,直到达到预先设定的迭代次数,得到最后的划分结果。
本发明还提供一种计算机存储介质,所述计算机存储介质储存有计算机程序,所述计算机程序被处理器执行时,实现上述所述的图数据集的流式图划分方法。
与现有技术相比,本发明技术方案的有益效果是:
本发明对图流的顶点输入顺序进行改进,在保证流式图划分算法的运行速度前提下对其划分质量进行提升,另外还利用之前的分区结果信息对后续迭代进行改进。
附图说明
图1为本发明的方法流程示意图。
图2为实施例提供的静态流式图划分算法示例图。
图3为实施例提供的流式图划分算法示意图。
图4为实施例3的方法流程示意图。
图5为实施例提供的基于前次迭代分区结果的流式图划分算法示例图。
图6为本发明的系统模块示意图。
图7为实施例4的系统模块示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
本实施例提供一种图数据集的流式图划分方法,如图1所示,包括以下步骤:
S1:获取外部数据,所述外部数据形成大规模的图数据;
S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
上述方案针对单次迭代的流式图划分算法,称为静态流式图划分算法,提供了基于图中顶点的度的图流顺序改进方法,在已知图中顶点的度信息情况下,对顶点按其度的大小进行降序排序,以该顺序输入流式图划分算法,在算法具体的划分过程中,采用与传统的流式划分算法相同的划分策略,如使用LDG的启发式目标函数等。该静态顺序仅使用顶点的度进行排序,无需利用现有的分区信息,并在多次迭代中保持不变。
实施例2
本实施例在实施例1的基础上,继续公开以下内容:
所述外部数据为用户行为及网络内容,其中,所述外部数据形成大规模的图数据中,图的顶点为用户,边为用户之间的行为。
步骤S2中所述按照顶点的度的大小对顶点进行排序,如图2所示,具体为:
按照顶点的度的大小对顶点进行降序排序。
步骤S3中利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间,如图3所示,具体为:
S3.1:当前输入的顶点为v,计算顶点v的相邻顶点N(v),设定分区数k;
S3.2:寻找顶点v在第i个分区Pi的所有相邻顶点,即Pi∩N(v),i=1,2,...,k;
S3.3:根据分区Pi的当前负载计算惩罚项;
S3.4:根据步骤S3.2的分区Pi含有的顶点v的相邻顶点数和步骤S3.3的惩罚项,计算分区Pi的得分;
S3.4:按照步骤S3.2至S3.4,计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,返回该分区的序号ind;
S3.5:对输入的每一个顶点,按照步骤S3.1至S3.4,划分至得分最大的分区。
步骤S3.3中根据分区Pi的当前负载计算惩罚项,具体为:
式中,w(i)为惩罚项,|Pi|为分区Pi中当前含有的顶点数,C为分区Pi所能承载的最大顶点数。
步骤S3.4中计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,具体为:
g(v,Pi)=|Pi∩N(v)|w(i)
式中,g(v,Pi)为顶点v在分区Pi的得分。
实施例3
本实施例在实施例1和实施例2的基础上,继续公开以下内容:
针对多次迭代的流式重划分算法,本实施例提供了基于前次迭代分区结果的动态图流顺序方法,该方法包括:使用实施例1和实施例2的基于度的方法进行第一次划分,以得到初始分区结果信息;
步骤S3后,如图4所示,还包括以下步骤:
S4:根据步骤S3的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
S5:如图5所示,根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序;
S6:使用步骤S3的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
S7:以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
S8:重复步骤S4至步骤S7,直到达到预先设定的迭代次数,得到最后的划分结果。
上述实施例在给定已有的分区情况下,对每个顶点根据其相邻顶点在当前分区和其他分区的分布情况计算一个值,根据该值对所有顶点进行排序,以此作为下次迭代时顶点的图流输入顺序。该顺序在每次迭代前均根据上次迭代的结果重新进行计算。
实施例4
本实施例提供一种图数据集的流式图划分系统,所述系统应用实施例l至实施例3所述的图数据集的流式图划分方法,如图6所示,所述系统包括:
数据获取模块,所述数据获取模块用于获取外部数据,所述外部数据形成大规模的图数据;
第一排序模块,所述排序模块用于计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
第一划分模块,所述第一划分模块利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
所述系统如图7所示,还包括:
计算模块,所述计算模块根据所述第一划分模块的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
第二排序模块,所述第二排序模块根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序,并在划分过程中使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
第二划分模块,所述第二划分模块使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
迭代模块,所述迭代模块以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
结果输出模块,所述结果输出模块重复计算模块至迭代模块,直到达到预先设定的迭代次数,得到最后的划分结果。
实施例5
本发明还提供一种计算机存储介质,所述计算机存储介质储存有计算机程序,所述计算机程序被处理器执行时,实现上述所述的图数据集的流式图划分方法。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

Claims (10)

1.一种图数据集的流式图划分方法,其特征在于,包括以下步骤:
S1:获取外部数据,所述外部数据形成大规模的图数据;
S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
2.根据权利要求1所述的图数据集的流式图划分方法,其特征在于,所述外部数据为用户行为及网络内容,其中,所述外部数据形成大规模的图数据中,图的顶点为用户,边为用户之间的行为。
3.根据权利要求1所述的图数据集的流式图划分方法,其特征在于,步骤S2中所述按照顶点的度的大小对顶点进行排序,具体为:
按照顶点的度的大小对顶点进行降序排序。
4.根据权利要求3所述的图数据集的流式图划分方法,其特征在于,步骤S3中利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间,具体为:
S3.1:当前输入的顶点为v,计算顶点v的相邻顶点N(v),设定分区数k;
S3.2:寻找顶点v在第i个分区Pi的所有相邻顶点,即Pi∩N(v),i=1,2,...,k;
S3.3:根据分区Pi的当前负载计算惩罚项;
S3.4:根据步骤S3.2的分区Pi含有的顶点v的相邻顶点数和步骤S3.3的惩罚项,计算分区Pi的得分;
S3.4:按照步骤S3.2至S3.4,计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区;
S3.5:对输入的每一个顶点,按照步骤S3.1至S3.4,划分至得分最大的分区。
5.根据权利要求4所述的图数据集的流式图划分方法,其特征在于,步骤S3.3中根据分区Pi的当前负载计算惩罚项,具体为:
式中,w(i)为惩罚项,|Pi|为分区Pi中当前含有的顶点数,c为分区Pi所能承载的最大顶点数。
6.根据权利要求5所述的图数据集的流式图划分方法,其特征在于,步骤S3.4中计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,具体为:
g(v,Pi)=|Pi∩N(v0|w(i)
式中,g(v,Pi)为顶点v在分区Pi的得分。
7.根据权利要求1至6任一项所述的图数据集的流式图划分方法,其特征在于,步骤S3后,还包括以下步骤:
S4:根据步骤S3的划分结果,对每个顶点计算如下的au值:
式中,|N(i)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
S5:根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序;
S6:使用步骤S3的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
S7:以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
S8:重复步骤S4至步骤S7,直到达到预先设定的迭代次数,得到最后的划分结果。
8.一种图数据集的流式图划分系统,其特征在于,所述系统应用权利要求1至7任一项所述的图数据集的流式图划分方法,所述系统包括:
数据获取模块,所述数据获取模块用于获取外部数据,所述外部数据形成大规模的图数据;
第一排序模块,所述排序模块用于计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
第一划分模块,所述第一划分模块利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
9.根据权利要求8所述的图数据集的流式图划分系统,其特征在于,所述系统还包括:
计算模块,所述计算模块根据所述第一划分模块的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
第二排序模块,所述第二排序模块根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序,并在划分过程中使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
第二划分模块,所述第二划分模块使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
迭代模块,所述迭代模块以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
结果输出模块,所述结果输出模块重复计算模块至迭代模块,直到达到预先设定的迭代次数,得到最后的划分结果。
10.一种计算机存储介质,其特征在于,所述计算机存储介质储存有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至7任一项所述的图数据集的流式图划分方法。
CN202310351154.4A 2023-03-31 2023-03-31 一种图数据集的流式图划分方法 Pending CN116561377A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310351154.4A CN116561377A (zh) 2023-03-31 2023-03-31 一种图数据集的流式图划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310351154.4A CN116561377A (zh) 2023-03-31 2023-03-31 一种图数据集的流式图划分方法

Publications (1)

Publication Number Publication Date
CN116561377A true CN116561377A (zh) 2023-08-08

Family

ID=87488788

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310351154.4A Pending CN116561377A (zh) 2023-03-31 2023-03-31 一种图数据集的流式图划分方法

Country Status (1)

Country Link
CN (1) CN116561377A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556095A (zh) * 2024-01-11 2024-02-13 腾讯科技(深圳)有限公司 图数据分割方法、装置、计算机设备和存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556095A (zh) * 2024-01-11 2024-02-13 腾讯科技(深圳)有限公司 图数据分割方法、装置、计算机设备和存储介质
CN117556095B (zh) * 2024-01-11 2024-04-09 腾讯科技(深圳)有限公司 图数据分割方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US10706103B2 (en) System and method for hierarchical distributed processing of large bipartite graphs
Crainic et al. Cooperative parallel variable neighborhood search for the p-median
US20120330864A1 (en) Fast personalized page rank on map reduce
Broderick et al. MAD-Bayes: MAP-based asymptotic derivations from Bayes
US7761462B2 (en) Searching queries using database partitioning
CN107710696B (zh) 用于路径确定的方法和网络组件
CN108170639B (zh) 基于分布式环境的张量cp分解实现方法
Lord et al. Geometric k-nearest neighbor estimation of entropy and mutual information
CN105117488B (zh) 一种基于混合层次聚类的分布式存储rdf数据平衡分割方法
US10191998B1 (en) Methods of data reduction for parallel breadth-first search over graphs of connected data elements
CN116561377A (zh) 一种图数据集的流式图划分方法
CN111400555A (zh) 图数据查询任务处理方法、装置、计算机设备和存储介质
Jafari et al. Fast shared-memory streaming multilevel graph partitioning
CN109032630B (zh) 一种参数服务器中全局参数的更新方法
Saegusa et al. An FPGA implementation of real-time K-means clustering for color images
Echbarthi et al. Fractional greedy and partial restreaming partitioning: New methods for massive graph partitioning
Yin et al. Accelerating distributed Expectation–Maximization algorithms with frequent updates
Floderus et al. 3D rectangulations and geometric matrix multiplication
Buš et al. Towards auction algorithms for large dense assignment problems
CN116303763A (zh) 一种基于顶点度的分布式图数据库增量图划分方法及系统
JP2020003860A (ja) 学習システム、処理装置、処理方法、およびプログラム
CN115346099A (zh) 基于加速器芯片的图像卷积方法、芯片、设备及介质
Boukerche et al. An exact parallel algorithm to compare very long biological sequences in clusters of workstations
Chen et al. A distributed graph partitioning algorithm for processing large graphs
CN110309367B (zh) 信息分类的方法、信息处理的方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination