CN116561377A - 一种图数据集的流式图划分方法 - Google Patents
一种图数据集的流式图划分方法 Download PDFInfo
- Publication number
- CN116561377A CN116561377A CN202310351154.4A CN202310351154A CN116561377A CN 116561377 A CN116561377 A CN 116561377A CN 202310351154 A CN202310351154 A CN 202310351154A CN 116561377 A CN116561377 A CN 116561377A
- Authority
- CN
- China
- Prior art keywords
- vertex
- partition
- graph
- vertexes
- dividing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000005192 partition Methods 0.000 claims abstract description 91
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 52
- 238000012163 sequencing technique Methods 0.000 claims abstract description 14
- 238000000638 solvent extraction Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000006399 behavior Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000003068 static effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 241001229889 Metis Species 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种图数据集的流式图划分方法,包括以下步骤:S1:获取外部数据,所述外部数据形成大规模的图数据;S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。本发明对图流的顶点输入顺序进行改进,在保证流式图划分算法的运行速度前提下对其划分质量进行提升,另外还利用之前的分区结果信息对后续迭代进行改进。
Description
技术领域
本发明涉及图计算技术领域,更具体地,涉及一种图数据集的流式图划分方法。
背景技术
在图计算领域中,如何利用有限的计算资源对大规模的图数据进行计算是当今大数据时代背景下的一个重要问题。不断产生的用户行为及网络内容带来了大规模的海量的图数据集,使得单台计算机难以完成计算任务。对于此类问题的典型解决方案是将输入的图数据划分为多个分区,并分配到多台机器上进行计算,以此提高计算效率。因此,如何更好的对图进行划分是分布式图计算中的一个关键问题。
目前,最为前沿的图划分算法为流式图划分算法及其迭代式版本流式重划分算法。在流式算法中,图数据以顶点流或边流的形式输入算法,算法对其进行线性的扫描,仅利用其局部信息立即执行分配,并不再进行更改。因此,该类算法能取得极快的处理速度并使用相对于图本身大小而言较小的内存。同时,流式算法也存在一些不足。首先,由于其仅利用图的局部信息,并不关注图的整体结构,使其划分质量相较目前最优的离线划分算法(如METIS)仍有一定差距。其次,目前关于流式图划分算法的研究中通常使用随机顺序或BFS/DFS顺序,这些顺序会对算法的划分质量产生显著影响。
现有技术公开了一种基于并发改进的大规模图数据流式划分方法及系统,包括:工作节点登记同步;代理服务器发送顶点信息;工作节点返回梯度信息;代理服务器发送最优分区信息;工作节点保存分区结果。该方案通过一次发送多个顶点及其相关信息的方法,解决了现有流式图划分方法一次网络时延处理一个顶点的问题,减少网络时延对系统的影响,提高了图划分效率。但是该方案未对流式重划分算法的划分质量有所改进。
发明内容
本发明提供一种图数据集的流式图划分方法,保证流式图划分算法的运行速度前提下对其划分质量进行提升。
为解决上述技术问题,本发明的技术方案如下:
一种图数据集的流式图划分方法,包括以下步骤:
Sl:获取外部数据,所述外部数据形成大规模的图数据;
S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
上述方案中仅使用顶点的度进行排序,无需利用现有的分区信息,并在多次迭代中保持不变。该静态顺序可使用在仅进行一次迭代的流式图划分算法。
优选地,所述外部数据为用户行为及网络内容,其中,所述外部数据形成大规模的图数据中,图的顶点为用户,边为用户之间的行为。
优选地,步骤S2中所述按照顶点的度的大小对顶点进行排序,具体为:
按照顶点的度的大小对顶点进行降序排序。
优选地,步骤S3中利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间,具体为:
S3.1:当前输入的顶点为v,计算顶点v的相邻顶点N(v),设定分区数k;
S3.2:寻找顶点v在第i个分区Pi的所有相邻顶点,即Pi∩N(v),i=1,2,...,k;
S3.3:根据分区Pi的当前负载计算惩罚项;
S3.4:根据步骤S3.2的分区Pi含有的顶点v的相邻顶点数和步骤S3.3的惩罚项,计算分区Pi的得分;
S3.4:按照步骤S3.2至S3.4,计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区;
S3.5:对输入的每一个顶点,按照步骤S3.1至S3.4,划分至得分最大的分区。
优选地,步骤S3.3中根据分区Pi的当前负载计算惩罚项,具体为:
式中,w(i)为惩罚项,|Pi|为分区Pi中当前含有的顶点数,C为分区Pi所能承载的最大顶点数。
优选地,步骤S3.4中计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,具体为:
g(v,Pi)=|Pi∩N(v)|w(i)
式中,g(v,Pi)为顶点v在分区Pi的得分。
优选地,步骤S3后,还包括以下步骤:
S4:根据步骤S3的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
S5:根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序;
S6:使用步骤S3的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
S7:以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
S8:重复步骤S4至步骤S7,直到达到预先设定的迭代次数,得到最后的划分结果。
步骤S3后,得到分区结果,在给定已有的分区情况下,对每个顶点根据其相邻顶点在当前分区和其他分区的分布情况计算一个值,根据该值对所有顶点进行排序,以此作为下次迭代时顶点的图流输入顺序。该顺序在每次迭代前均根据上次迭代的结果重新进行计算。本发明所采用的方案,可充分利用已有的分区结果信息,并以图流输入顺序的方式融入到下一次迭代中,从而对流式重划分算法的划分质量带来显著的提升。
本发明还提供一种图数据集的流式图划分系统,所述系统应用上述所述的图数据集的流式图划分方法,所述系统包括:
数据获取模块,所述数据获取模块用于获取外部数据,所述外部数据形成大规模的图数据;
第一排序模块,所述排序模块用于计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
第一划分模块,所述第一划分模块利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
优选地,所述系统还包括:
计算模块,所述计算模块根据所述第一划分模块的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
第二排序模块,所述第二排序模块根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序,并在划分过程中使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
第二划分模块,所述第二划分模块使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
迭代模块,所述迭代模块以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
结果输出模块,所述结果输出模块重复计算模块至迭代模块,直到达到预先设定的迭代次数,得到最后的划分结果。
本发明还提供一种计算机存储介质,所述计算机存储介质储存有计算机程序,所述计算机程序被处理器执行时,实现上述所述的图数据集的流式图划分方法。
与现有技术相比,本发明技术方案的有益效果是:
本发明对图流的顶点输入顺序进行改进,在保证流式图划分算法的运行速度前提下对其划分质量进行提升,另外还利用之前的分区结果信息对后续迭代进行改进。
附图说明
图1为本发明的方法流程示意图。
图2为实施例提供的静态流式图划分算法示例图。
图3为实施例提供的流式图划分算法示意图。
图4为实施例3的方法流程示意图。
图5为实施例提供的基于前次迭代分区结果的流式图划分算法示例图。
图6为本发明的系统模块示意图。
图7为实施例4的系统模块示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
本实施例提供一种图数据集的流式图划分方法,如图1所示,包括以下步骤:
S1:获取外部数据,所述外部数据形成大规模的图数据;
S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
上述方案针对单次迭代的流式图划分算法,称为静态流式图划分算法,提供了基于图中顶点的度的图流顺序改进方法,在已知图中顶点的度信息情况下,对顶点按其度的大小进行降序排序,以该顺序输入流式图划分算法,在算法具体的划分过程中,采用与传统的流式划分算法相同的划分策略,如使用LDG的启发式目标函数等。该静态顺序仅使用顶点的度进行排序,无需利用现有的分区信息,并在多次迭代中保持不变。
实施例2
本实施例在实施例1的基础上,继续公开以下内容:
所述外部数据为用户行为及网络内容,其中,所述外部数据形成大规模的图数据中,图的顶点为用户,边为用户之间的行为。
步骤S2中所述按照顶点的度的大小对顶点进行排序,如图2所示,具体为:
按照顶点的度的大小对顶点进行降序排序。
步骤S3中利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间,如图3所示,具体为:
S3.1:当前输入的顶点为v,计算顶点v的相邻顶点N(v),设定分区数k;
S3.2:寻找顶点v在第i个分区Pi的所有相邻顶点,即Pi∩N(v),i=1,2,...,k;
S3.3:根据分区Pi的当前负载计算惩罚项;
S3.4:根据步骤S3.2的分区Pi含有的顶点v的相邻顶点数和步骤S3.3的惩罚项,计算分区Pi的得分;
S3.4:按照步骤S3.2至S3.4,计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,返回该分区的序号ind;
S3.5:对输入的每一个顶点,按照步骤S3.1至S3.4,划分至得分最大的分区。
步骤S3.3中根据分区Pi的当前负载计算惩罚项,具体为:
式中,w(i)为惩罚项,|Pi|为分区Pi中当前含有的顶点数,C为分区Pi所能承载的最大顶点数。
步骤S3.4中计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,具体为:
g(v,Pi)=|Pi∩N(v)|w(i)
式中,g(v,Pi)为顶点v在分区Pi的得分。
实施例3
本实施例在实施例1和实施例2的基础上,继续公开以下内容:
针对多次迭代的流式重划分算法,本实施例提供了基于前次迭代分区结果的动态图流顺序方法,该方法包括:使用实施例1和实施例2的基于度的方法进行第一次划分,以得到初始分区结果信息;
步骤S3后,如图4所示,还包括以下步骤:
S4:根据步骤S3的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
S5:如图5所示,根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序;
S6:使用步骤S3的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
S7:以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
S8:重复步骤S4至步骤S7,直到达到预先设定的迭代次数,得到最后的划分结果。
上述实施例在给定已有的分区情况下,对每个顶点根据其相邻顶点在当前分区和其他分区的分布情况计算一个值,根据该值对所有顶点进行排序,以此作为下次迭代时顶点的图流输入顺序。该顺序在每次迭代前均根据上次迭代的结果重新进行计算。
实施例4
本实施例提供一种图数据集的流式图划分系统,所述系统应用实施例l至实施例3所述的图数据集的流式图划分方法,如图6所示,所述系统包括:
数据获取模块,所述数据获取模块用于获取外部数据,所述外部数据形成大规模的图数据;
第一排序模块,所述排序模块用于计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
第一划分模块,所述第一划分模块利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
所述系统如图7所示,还包括:
计算模块,所述计算模块根据所述第一划分模块的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
第二排序模块,所述第二排序模块根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序,并在划分过程中使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
第二划分模块,所述第二划分模块使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
迭代模块,所述迭代模块以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
结果输出模块,所述结果输出模块重复计算模块至迭代模块,直到达到预先设定的迭代次数,得到最后的划分结果。
实施例5
本发明还提供一种计算机存储介质,所述计算机存储介质储存有计算机程序,所述计算机程序被处理器执行时,实现上述所述的图数据集的流式图划分方法。
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
1.一种图数据集的流式图划分方法,其特征在于,包括以下步骤:
S1:获取外部数据,所述外部数据形成大规模的图数据;
S2:计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
S3:利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
2.根据权利要求1所述的图数据集的流式图划分方法,其特征在于,所述外部数据为用户行为及网络内容,其中,所述外部数据形成大规模的图数据中,图的顶点为用户,边为用户之间的行为。
3.根据权利要求1所述的图数据集的流式图划分方法,其特征在于,步骤S2中所述按照顶点的度的大小对顶点进行排序,具体为:
按照顶点的度的大小对顶点进行降序排序。
4.根据权利要求3所述的图数据集的流式图划分方法,其特征在于,步骤S3中利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间,具体为:
S3.1:当前输入的顶点为v,计算顶点v的相邻顶点N(v),设定分区数k;
S3.2:寻找顶点v在第i个分区Pi的所有相邻顶点,即Pi∩N(v),i=1,2,...,k;
S3.3:根据分区Pi的当前负载计算惩罚项;
S3.4:根据步骤S3.2的分区Pi含有的顶点v的相邻顶点数和步骤S3.3的惩罚项,计算分区Pi的得分;
S3.4:按照步骤S3.2至S3.4,计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区;
S3.5:对输入的每一个顶点,按照步骤S3.1至S3.4,划分至得分最大的分区。
5.根据权利要求4所述的图数据集的流式图划分方法,其特征在于,步骤S3.3中根据分区Pi的当前负载计算惩罚项,具体为:
式中,w(i)为惩罚项,|Pi|为分区Pi中当前含有的顶点数,c为分区Pi所能承载的最大顶点数。
6.根据权利要求5所述的图数据集的流式图划分方法,其特征在于,步骤S3.4中计算所有k个分区的得分,以得分最大的分区作为划分的结果,将顶点v划分至得分最大的分区,具体为:
g(v,Pi)=|Pi∩N(v0|w(i)
式中,g(v,Pi)为顶点v在分区Pi的得分。
7.根据权利要求1至6任一项所述的图数据集的流式图划分方法,其特征在于,步骤S3后,还包括以下步骤:
S4:根据步骤S3的划分结果,对每个顶点计算如下的au值:
式中,|N(i)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
S5:根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序;
S6:使用步骤S3的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
S7:以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
S8:重复步骤S4至步骤S7,直到达到预先设定的迭代次数,得到最后的划分结果。
8.一种图数据集的流式图划分系统,其特征在于,所述系统应用权利要求1至7任一项所述的图数据集的流式图划分方法,所述系统包括:
数据获取模块,所述数据获取模块用于获取外部数据,所述外部数据形成大规模的图数据;
第一排序模块,所述排序模块用于计算所述图数据中顶点的度,按照顶点的度的大小对顶点进行排序后,将顶点按照排序后的顺序输入至流式图划分算法;
第一划分模块,所述第一划分模块利用流式图划分算法对输入的顶点进行划分,将顶点划分至目标区间。
9.根据权利要求8所述的图数据集的流式图划分系统,其特征在于,所述系统还包括:
计算模块,所述计算模块根据所述第一划分模块的划分结果,对每个顶点计算如下的au值:
式中,|N(u)∩Vi|表示分区Vi含有的顶点u的相邻顶点数,|N(u)∩VP(u)|表示顶点u所在的分区含有的顶点u的相邻顶点数;
第二排序模块,所述第二排序模块根据每个顶点的au值进行增序排序,作为下次迭代顶点输入的图流顺序,并在划分过程中使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
第二划分模块,所述第二划分模块使用第一划分模块的流式划分算法进行顶点划分,得到当前迭代的划分结果和分区信息;
迭代模块,所述迭代模块以新的分区信息对au值进行重新计算并对顶点重新排序,作为下次迭代的图流顺序;
结果输出模块,所述结果输出模块重复计算模块至迭代模块,直到达到预先设定的迭代次数,得到最后的划分结果。
10.一种计算机存储介质,其特征在于,所述计算机存储介质储存有计算机程序,所述计算机程序被处理器执行时,实现权利要求1至7任一项所述的图数据集的流式图划分方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310351154.4A CN116561377A (zh) | 2023-03-31 | 2023-03-31 | 一种图数据集的流式图划分方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310351154.4A CN116561377A (zh) | 2023-03-31 | 2023-03-31 | 一种图数据集的流式图划分方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116561377A true CN116561377A (zh) | 2023-08-08 |
Family
ID=87488788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310351154.4A Pending CN116561377A (zh) | 2023-03-31 | 2023-03-31 | 一种图数据集的流式图划分方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116561377A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556095A (zh) * | 2024-01-11 | 2024-02-13 | 腾讯科技(深圳)有限公司 | 图数据分割方法、装置、计算机设备和存储介质 |
-
2023
- 2023-03-31 CN CN202310351154.4A patent/CN116561377A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117556095A (zh) * | 2024-01-11 | 2024-02-13 | 腾讯科技(深圳)有限公司 | 图数据分割方法、装置、计算机设备和存储介质 |
CN117556095B (zh) * | 2024-01-11 | 2024-04-09 | 腾讯科技(深圳)有限公司 | 图数据分割方法、装置、计算机设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10706103B2 (en) | System and method for hierarchical distributed processing of large bipartite graphs | |
Crainic et al. | Cooperative parallel variable neighborhood search for the p-median | |
US20120330864A1 (en) | Fast personalized page rank on map reduce | |
Broderick et al. | MAD-Bayes: MAP-based asymptotic derivations from Bayes | |
US7761462B2 (en) | Searching queries using database partitioning | |
CN107710696B (zh) | 用于路径确定的方法和网络组件 | |
CN108170639B (zh) | 基于分布式环境的张量cp分解实现方法 | |
Lord et al. | Geometric k-nearest neighbor estimation of entropy and mutual information | |
CN105117488B (zh) | 一种基于混合层次聚类的分布式存储rdf数据平衡分割方法 | |
US10191998B1 (en) | Methods of data reduction for parallel breadth-first search over graphs of connected data elements | |
CN116561377A (zh) | 一种图数据集的流式图划分方法 | |
CN111400555A (zh) | 图数据查询任务处理方法、装置、计算机设备和存储介质 | |
Jafari et al. | Fast shared-memory streaming multilevel graph partitioning | |
CN109032630B (zh) | 一种参数服务器中全局参数的更新方法 | |
Saegusa et al. | An FPGA implementation of real-time K-means clustering for color images | |
Echbarthi et al. | Fractional greedy and partial restreaming partitioning: New methods for massive graph partitioning | |
Yin et al. | Accelerating distributed Expectation–Maximization algorithms with frequent updates | |
Floderus et al. | 3D rectangulations and geometric matrix multiplication | |
Buš et al. | Towards auction algorithms for large dense assignment problems | |
CN116303763A (zh) | 一种基于顶点度的分布式图数据库增量图划分方法及系统 | |
JP2020003860A (ja) | 学習システム、処理装置、処理方法、およびプログラム | |
CN115346099A (zh) | 基于加速器芯片的图像卷积方法、芯片、设备及介质 | |
Boukerche et al. | An exact parallel algorithm to compare very long biological sequences in clusters of workstations | |
Chen et al. | A distributed graph partitioning algorithm for processing large graphs | |
CN110309367B (zh) | 信息分类的方法、信息处理的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |