CN109815237B - 针对最短路的图数据冗余边识别方法、压缩方法及装置 - Google Patents

针对最短路的图数据冗余边识别方法、压缩方法及装置 Download PDF

Info

Publication number
CN109815237B
CN109815237B CN201910048136.2A CN201910048136A CN109815237B CN 109815237 B CN109815237 B CN 109815237B CN 201910048136 A CN201910048136 A CN 201910048136A CN 109815237 B CN109815237 B CN 109815237B
Authority
CN
China
Prior art keywords
graph
edge
compressed
edges
redundant
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910048136.2A
Other languages
English (en)
Other versions
CN109815237A (zh
Inventor
李超
张桂刚
宋克禹
张勇
邢春晓
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201910048136.2A priority Critical patent/CN109815237B/zh
Publication of CN109815237A publication Critical patent/CN109815237A/zh
Application granted granted Critical
Publication of CN109815237B publication Critical patent/CN109815237B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供针对最短路的图数据冗余边识别方法、压缩方法及装置,其中,针对最短路的图数据冗余边识别方法包括:输入待识别的图,待识别的图中包含结点、边和边的权值;对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。本实施例能够在保证所有点对间的最短路径被完整保留的前提下,识别出图数据中的冗余边,以供后续能够在删除冗余边后减小存储图数据的空间消耗,达到无损压缩目的。

Description

针对最短路的图数据冗余边识别方法、压缩方法及装置
技术领域
本发明实施例涉及图论及数据压缩技术领域,尤其涉及一种针对最短路的图数据冗余边识别方法、压缩方法及装置。
背景技术
在互联网技术不断发展,网络应用的地位逐步提升,网络数据量快速增长的背景下,减少数据存储空间,提高数据读取速度,是当下许多大数据服务提升性能的关键。
目前,图数据已经被广泛应用于各类网络应用中。图数据是一种常见的大数据存储形式,常用于存储关系型数据,可以抽象为图论意义下由点和边构成的集合。然而,随着数据规模的不断发展,一个图数据中可能包括百万个甚至千万个结点,而这些结点之间也可能存在着千万条边以表示这些结点之间的关联关系,要存储并处理如此大规模的图数据是一个巨大的挑战。
鉴于此,如何识别出图数据中的冗余边,以供后续能够在删除冗余边后减小存储图数据的空间消耗,达到无损压缩目的成为目前需要解决的技术问题。
发明内容
针对现有技术存在的问题,本发明实施例提供一种针对最短路的图数据冗余边识别方法、压缩方法及装置。
本发明实施例提供一种针对最短路的图数据冗余边识别方法,包括:
输入待识别的图,所述待识别的图中包含结点、边和边的权值;
对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;
对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。
本发明实施例提供一种针对最短路的图数据压缩方法,包括:
输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;
选择所述待压缩的图中任一有出度的结点作为源点进行遍历;
选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别方法,标记所述目标边是否为冗余边;
判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;
若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
本发明实施例提供一种针对最短路的图数据冗余边识别装置,包括:
第一输入模块,用于输入待识别的图,所述待识别的图中包含结点、边和边的权值;
获取模块,用于对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;
识别模块,用于对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。
本发明实施例提供一种针对最短路的图数据压缩装置,包括:
第二输入模块,用于输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;
第一选择模块,用于选择所述待压缩的图中任一有出度的结点作为源点进行遍历;
第二选择模块,用于选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别装置,标记所述目标边是否为冗余边;
判断模块,用于判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;
输出模块,用于若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述针对最短路的图数据冗余边识别方法的步骤,或者所述处理器执行所述程序时实现如上述针对最短路的图数据压缩方法的步骤。
本发明实施例提供的针对最短路的图数据冗余边识别方法、压缩方法及装置,通过输入待识别的图,待识别的图中包含结点、边和边的权值,对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径,对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边,由此,能够在保证所有点对间的最短路径被完整保留的前提下,识别出图数据中的冗余边,以供后续能够在删除冗余边后减小存储图数据的空间消耗,达到无损压缩目的。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一实施例提供的一种针对最短路的图数据冗余边识别方法的流程示意图;
图2为本发明一实施例提供的一种针对最短路的图数据压缩方法的流程示意图;
图3为本发明另一实施例提供的一种针对最短路的图数据压缩方法的流程示意图;
图4为本发明另一实施例提供的一种针对最短路的图数据压缩方法的流程示意图;
图5为本发明实施例提供的一种举例的待压缩的图;
图6为本发明本实施例对图5提供的待压缩的图的压缩中间过程的中间结果;
图7为本发明本实施例对图5提供的待压缩的图进行压缩完毕后的图;
图8为本发明一实施例提供的一种针对最短路的图数据冗余边识别装置的结构示意图;
图9为本发明一实施例提供的一种针对最短路的图数据压缩装置的结构示意图;
图10为本发明一实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1示出了本发明一实施例提供的一种针对最短路的图数据冗余边识别方法的流程示意图,如图1所示,本实施例的针对最短路的图数据冗余边识别方法,包括:
P1、输入待识别的图,所述待识别的图中包含结点、边和边的权值。
需要说明的是,所述待识别的图中包含的边的权值是待压缩的图中预先就有的。
P2、对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径。
需要说明的是,在图论中,结点的出边条数称为该结点的出度。
P3、对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。
可以理解的是,所述待识别的图可以是无向图,也可以是有向图,可以有除最短路定义所需的边的权值以外的其它属性,如点权等,本实施例并不对其进行限制。
可以理解的是,最短路查询是图数据上最基础的查询需求之一,针对最短路查询,可以精确地对图数据进行冗余边识别。
本发明实施例提供的针对最短路的图数据冗余边识别方法,通过输入待识别的图,待识别的图中包含结点、边和边的权值,对于待识别的图中任一有出度的结点,利用最短路算法获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径,对于待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若是则标记为冗余边,由此,能够在保证所有点对间的最短路径被完整保留的前提下,识别出图数据中的冗余边,以供后续能够在删除冗余边后减小存储图数据的空间消耗,达到无损压缩目的。
进一步地,在上述实施例的基础上,所述最短路算法,可以包括:单源最短路算法或全图最短路算法。
具体地,所述单源最短路算法,可以包括:Dijkstra(迪克斯特拉)算法或Bellman-Ford(贝尔曼-福特)算法等单源最短路算法,本实施例并不对其进行限制。
具体地,所述全图最短路算法,可以包括:Floyd(弗洛伊德)算法等,本实施例并不对其进行限制。
本发明实施例提供的针对最短路的图数据冗余边识别方法,能够在保证所有点对间的最短路径被完整保留的前提下,识别出图数据中的冗余边,以供后续能够在删除冗余边后减小存储图数据的空间消耗,达到无损压缩目的。
图2示出了本发明一实施例提供的一种针对最短路的图数据压缩方法的流程示意图,如图2所示,本实施例的针对最短路的图数据压缩方法,包括:
S1、输入待压缩的图,所述待压缩的图中包含结点、边和边的权值。
需要说明的是,所述待压缩的图中包含的边的权值是待压缩的图中预先就有的。
可以理解的是,本实施例的压缩对象是所有可以抽象为带有边的权值的图,并且有最短路查询需求的数据。图的边有实数表示的权值,任意点对间的最短路径指该点对间所有路径中,路径上所有的边的权值和最小的路径。图的结点是有标记的,也就是任意两个结点都被视为不同的结点。
可以理解的是,所述待压缩的图可以是无向图,也可以是有向图,可以有除最短路定义所需的边的权值以外的其它属性,如点权等,本实施例并不对其进行限制。
S2、选择所述待压缩的图中任一有出度的结点进行遍历。
需要说明的是,在图论中,结点的出边条数称为该结点的出度。
S3、选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别方法,标记所述目标边是否为冗余边。
S4、判断所述待压缩的图中从所述源点发出的所有边是否都遍历完。
S5、若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
可以理解的是,最短路查询是图数据上最基础的查询需求之一,针对最短路查询对图数据进行压缩,可以减少存储空间并提高数据存储速度。
可以理解的是,本实施例所述方法是从图论角度达到数据压缩的目的,区别于对编码序列的压缩,具体方法为最大化地删除图中的部分边,压缩结果仍是一个图,并且压缩是无损压缩。本方法依据最短路性质对所删除的边的选择,可以保证原图中所有点对之间的最短路径能够在压缩结果中被完整保留。
本实施例提供的针对最短路的图数据压缩方法,通过输入待压缩的图,待压缩的图中包含结点、边和边的权值,选择待压缩的图中任一有出度的结点作为源点进行遍历,选择待压缩的图中从源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别方法,标记所述目标边是否为冗余边,判断待压缩的图中从所述源点发出的所有边是否都遍历完,若是,则将待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图,由此,能够在保证所有点对之间的最短路径被完整保留的前提下,删除冗余边,减小存储图数据的空间消耗,达到无损压缩的目的。
进一步地,在上述实施例的基础上,可以参考图3,所述步骤S5可以包括:
S51、若所述待压缩的图中从所述源点发出的所有边都遍历完,则判断所述待压缩的图中所有有出度的结点是否都遍历完。
S52、若所述待压缩的图中所有有出度的结点都遍历完,则将所述待压缩的图中所有标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
相应地,所述步骤S3利用上述针对最短路的图数据冗余边识别方法,判断所述目标边不是冗余边后,可直接判断所述待压缩的图中从所述源点发出的所有边是否都遍历完。
本实施例提供的针对最短路的图数据压缩方法,能够在保证所有点对之间的最短路径被完整保留的前提下,删除尽可能多的冗余边,减小存储图数据的空间消耗,达到无损压缩的目的。
进一步地,在上述实施例的基础上,可以参考图4,在判断所述待压缩的图中从所述源点发出的所有边是否都遍历完之后,本实施例所述方法还可以包括:
若所述待压缩的图中从所述源点发出的边未都遍历完,则返回所述选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历的步骤。
进一步地,在上述实施例的基础上,可以参考图4,在判断所述待压缩的图中所有有出度的结点是否都遍历完之后,本实施例所述方法还可以包括:
若所述待压缩的图中所有有出度的结点未都遍历完,则返回所述选择所述待压缩的图中任一有出度的结点作为源点进行遍历的步骤。
这样,可以确保所述待压缩的图中所有有出度的结点都遍历完,以删除待压缩的图中尽可能多的冗余边。
下面以图5示出的一种举例的待压缩的图为例,对本实施例所述方法进行进一步说明。图5中给出了一个只有8个结点的待压缩图的简单样例,其中边的权值已在图中标出。
本实施例所述方法主要是判断每一条边是否是可以删除的冗余边,分别考虑由每个始点发出的边。选择将要遍历的始点s(从1遍历到9),使用最短路算法求得从该始点出发到各点i的最短路径长度D(s,i),作为下一步中判断相关边是否可删除的依据。本实施例中各点对之间的最短路径长度可在图6下部的最短路径长度矩阵中查得,如第3行第6列的数据5表示结点3到结点6的最短路径长度D(3,6)=5,对应路径结点3-结点5-结点6的长度。
求得所需的最短路径长度D(s,i)之后,遍历所有由该始点发出的边,比较每条边的权值W(s,i)和s到i之间的最短路径长度D(s,i)。本实施例中边的权值的具体数据可在图6上部的邻接长度矩阵中查得,如第3行第6列的7表示结点3到结点6的边的权值值W(3,6)=7。如果W(s,i)>D(s,i),则标记由s到i的边为冗余边。由所选始点发出的边都经过判断之后,继续遍历由其它始点发出的边直到所有边都经过判断。
需要比较的数据在图6中为对应行列数相同的矩阵元素,完成遍历判断之后,所有W(s,i)>D(s,i)的边被标记为冗余边。本实施例中满足标记条件的数据在图6中用圆圈或下划线来标记。
最后删除所有被标记的冗余边,剩余的边和结点组成的图就是压缩结果,如图7所示,3条边的权值值大于两端点之间的最短路径长度的边:(3,6),(4,6),(6,7)被删除。
本发明实施例提供的针对最短路的图数据压缩方法,能够在保证所有点对之间的最短路径被完整保留的前提下,删除尽可能多的冗余边,减小存储图数据的空间消耗,达到无损压缩的目的。本实施例所述方法可以和绝大多数图数据压缩方法同时使用,从图论的角度针对最短路查询删除冗余边,使得压缩结果是和原图格式相同的图,对原图有效的其它压缩方法都能够在本实施例所述方法的输出结果上继续压缩。本实施例所述方法单独使用也可以有效减少总边数(实验结果显示约能减少30%~40%的边)从而减少数据存储所需的空间,同时在最短路径查询等价的意义下,最大程度地简化了图。
图8示出了本发明一实施例提供的一种针对最短路的图数据冗余边识别装置的结构示意图,如图8所示,本实施例的针对最短路的图数据冗余边识别装置,包括:第一输入模块81、获取模块82和识别模块83;其中:
所述第一输入模块81,用于输入待识别的图,所述待识别的图中包含结点、边和边的权值;
所述获取模块82,用于对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;
所述识别模块83,用于对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。
具体地,所述第一输入模块81输入待识别的图,所述待识别的图中包含结点、边和边的权值;所述获取模块82对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;所述识别模块83对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。
需要说明的是,所述待识别的图中包含的边的权值是待压缩的图中预先就有的。
需要说明的是,在图论中,结点的出边条数称为该结点的出度。
可以理解的是,所述待识别的图可以是无向图,也可以是有向图,可以有除最短路定义所需的边的权值以外的其它属性,如点权等,本实施例并不对其进行限制。
可以理解的是,最短路查询是图数据上最基础的查询需求之一,针对最短路查询,可以精确地对图数据进行冗余边识别。
本发明实施例提供的针对最短路的图数据冗余边识别装置,能够在保证所有点对间的最短路径被完整保留的前提下,识别出图数据中的冗余边,以供后续能够在删除冗余边后减小存储图数据的空间消耗,达到无损压缩目的。
进一步地,在上述实施例的基础上,所述最短路算法,可以包括:单源最短路算法或全图最短路算法。
具体地,所述单源最短路算法,可以包括:Dijkstra算法或Bellman-Ford算法等单源最短路算法,本实施例并不对其进行限制。
具体地,所述全图最短路算法,可以包括:Floyd算法等,本实施例并不对其进行限制。
本发明实施例提供的针对最短路的图数据冗余边识别装置,能够在保证所有点对间的最短路径被完整保留的前提下,识别出图数据中的冗余边,以供后续能够在删除冗余边后减小存储图数据的空间消耗,达到无损压缩目的。
本发明实施例提供的针对最短路的图数据冗余边识别装置,可以用于执行前述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图9示出了本发明一实施例提供的一种针对最短路的图数据压缩装置的结构示意图,如图9所示,本实施例的针对最短路的图数据压缩装置,包括:第二输入模块91、第一选择模块92、第二选择模块93、判断模块94和输出模块95;其中:
所述第二输入模块91,用于输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;
所述第一选择模块92,用于选择所述待压缩的图中任一有出度的结点作为源点进行遍历;
所述第二选择模块93,用于选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别装置,标记所述目标边是否为冗余边;
所述判断模块94,用于判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;
所述输出模块95,用于若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
具体地,所述第二输入模块91输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;所述第一选择模块92选择所述待压缩的图中任一有出度的结点作为源点进行遍历;所述第二选择模块93选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别装置,标记所述目标边是否为冗余边;所述判断模块94判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;所述输出模块95若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
需要说明的是,所述待压缩的图中包含的边的权值是待压缩的图中预先就有的。
可以理解的是,本实施例的压缩对象是所有可以抽象为带有边的权值的图,并且有最短路查询需求的数据,边的权值是待压缩的图中预先就有的。图的边有实数表示的权值,任意点对间的最短路径指该点对间所有路径中,路径上所有的边的权值和最小的路径。图的结点是有标记的,也就是任意两个结点都被视为不同的结点。
可以理解的是,所述待压缩的图可以是无向图,也可以是有向图,可以有除最短路定义所需的边的权值以外的其它属性,如点权等,本实施例并不对其进行限制。
需要说明的是,在图论中,结点的出边条数称为该结点的出度。
可以理解的是,最短路查询是图数据上最基础的查询需求之一,针对最短路查询对图数据进行压缩,可以减少存储空间并提高数据存储速度。
可以理解的是,本实施例所述装置是从图论角度达到数据压缩的目的,区别于对编码序列的压缩,具体为最大化地删除图中的部分边,压缩结果仍是一个图,并且压缩是无损压缩。本装置依据最短路性质对所删除的边的选择,可以保证原图中所有点对之间的最短路径能够在压缩结果中被完整保留。
本发明实施例提供的针对最短路的图数据压缩装置,能够在保证所有点对之间的最短路径被完整保留的前提下,删除冗余边,减小存储图数据的空间消耗,达到无损压缩的目的。
进一步地,在上述实施例的基础上,所述输出模块95,可具体用于
若所述待压缩的图中从所述源点发出的所有边都遍历完,则判断所述待压缩的图中所有有出度的结点是否都遍历完;
若所述待压缩的图中所有有出度的结点都遍历完,则将所述待压缩的图中所有标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
相应地,所述第二选择模块93利用上述针对最短路的图数据冗余边识别方法,判断所述目标边不是冗余边后,可直接判断所述待压缩的图中从所述源点发出的所有边是否都遍历完。
本实施例提供的针对最短路的图数据压缩装置,能够在保证所有点对之间的最短路径被完整保留的前提下,删除尽可能多的冗余边,减小存储图数据的空间消耗,达到压缩的目的,且该压缩是无损压缩。
进一步地,在上述实施例的基础上,所述输出模块95,还可用于
判断所述待压缩的图中从所述源点发出的所有边是否都遍历完之后,若所述待压缩的图中从所述源点发出的边未都遍历完,则返回执行所述第二选择模块93。
进一步地,在上述实施例的基础上,所述输出模块95,还可用于
判断所述待压缩的图中所有有出度的结点是否都遍历完之后,若所述待压缩的图中所有有出度的结点未都遍历完,则返回执行所述第一选择模块92。
这样,可以确保所述待压缩的图中所有有出度的结点都遍历完,以删除待压缩的图中尽可能多的冗余边。
本发明实施例提供的针对最短路的图数据压缩装置,能够在保证所有点对之间的最短路径被完整保留的前提下,删除尽可能多的冗余边,减小存储图数据的空间消耗,达到无损压缩的目的。本实施例所述装置可以和绝大多数图数据压缩方法同时使用,从图论的角度针对最短路查询删除冗余边,使得压缩结果是和原图格式相同的图,对原图有效的其它压缩方法都能够在本实施例所述装置的输出结果上继续压缩。本实施例所述装置单独使用也可以有效减少总边数(实验结果显示约能减少30%~40%的边)从而减少数据存储所需的空间,同时在最短路径查询等价的意义下,最大程度地简化了图。
本发明实施例提供的针对最短路的图数据压缩装置,可以用于执行前述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图10示出了本发明一实施例提供的一种电子设备的实体结构示意图,如图10所示,该电子设备可以包括存储器1002、处理器1001及存储在存储器802上并可在处理器1001上运行的计算机程序,所述处理器1001执行所述程序时实现上述方法的步骤,例如包括:输入待识别的图,所述待识别的图中包含结点、边和边的权值;对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边;或者,包括:输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;选择所述待压缩的图中任一有出度的结点作为源点进行遍历;选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别方法,标记所述目标边是否为冗余边;判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤,例如包括:输入待识别的图,所述待识别的图中包含结点、边和边的权值;对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边;或者,包括:输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;选择所述待压缩的图中任一有出度的结点作为源点进行遍历;选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用上述针对最短路的图数据冗余边识别方法,标记所述目标边是否为冗余边;判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.一种针对最短路的图数据压缩方法,其特征在于,包括:
输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;
选择所述待压缩的图中任一有出度的结点作为源点进行遍历;
选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,标记所述目标边是否为冗余边;
判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;
若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图;
所述标记所述目标边是否为冗余边,具体包括:
输入待识别的图,所述待识别的图中包含结点、边和边的权值;
对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;
对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。
2.根据权利要求1所述的方法,其特征在于,所述最短路算法,包括:单源最短路算法或全图最短路算法。
3.根据权利要求1所述的方法,其特征在于,在判断所述待压缩的图中从所述源点发出的所有边是否都遍历完之后,所述方法还包括:
若所述待压缩的图中从所述源点发出的边未都遍历完,则返回所述选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历的步骤。
4.根据权利要求1所述的方法,其特征在于,若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图,包括:
若所述待压缩的图中从所述源点发出的所有边都遍历完,则判断所述待压缩的图中所有有出度的结点是否都遍历完;
若所述待压缩的图中所有有出度的结点都遍历完,则将所述待压缩的图中所有标记为冗余边的边删除,输出删除冗余边后压缩完毕的图。
5.根据权利要求4所述的方法,其特征在于,在判断所述待压缩的图中所有有出度的结点是否都遍历完之后,所述方法还包括:
若所述待压缩的图中所有有出度的结点未都遍历完,则返回所述选择所述待压缩的图中任一有出度的结点作为源点进行遍历的步骤。
6.一种针对最短路的图数据压缩装置,其特征在于,包括:
第二输入模块,用于输入待压缩的图,所述待压缩的图中包含结点、边和边的权值;
第一选择模块,用于选择所述待压缩的图中任一有出度的结点作为源点进行遍历;
第二选择模块,用于选择所述待压缩的图中从所述源点发出的任意边为目标边进行遍历,利用针对最短路的图数据冗余边识别装置,标记所述目标边是否为冗余边;
判断模块,用于判断所述待压缩的图中从所述源点发出的所有边是否都遍历完;
输出模块,用于若所述待压缩的图中从所述源点发出的所有边都遍历完,则将所述待压缩的图中标记为冗余边的边删除,输出删除冗余边后压缩完毕的图;
所述针对最短路的图数据冗余边识别装置,具体包括:
第一输入模块,用于输入待识别的图,所述待识别的图中包含结点、边和边的权值;
获取模块,用于对于所述待识别的图中任一有出度的结点,利用最短路算法,获取从当前结点到所述待识别的图中除了当前结点之外的其他所有结点的最短路径;
识别模块,用于对于所述待识别的图中的任意边,判断边的权值是否大于边的始点到终点的最短路径的长度,若边的权值大于边的始点到终点的最短路径的长度,则标记为冗余边。
7.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述方法的步骤。
8.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN201910048136.2A 2019-01-18 2019-01-18 针对最短路的图数据冗余边识别方法、压缩方法及装置 Active CN109815237B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910048136.2A CN109815237B (zh) 2019-01-18 2019-01-18 针对最短路的图数据冗余边识别方法、压缩方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910048136.2A CN109815237B (zh) 2019-01-18 2019-01-18 针对最短路的图数据冗余边识别方法、压缩方法及装置

Publications (2)

Publication Number Publication Date
CN109815237A CN109815237A (zh) 2019-05-28
CN109815237B true CN109815237B (zh) 2021-01-05

Family

ID=66604508

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910048136.2A Active CN109815237B (zh) 2019-01-18 2019-01-18 针对最短路的图数据冗余边识别方法、压缩方法及装置

Country Status (1)

Country Link
CN (1) CN109815237B (zh)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108111858A (zh) * 2016-11-24 2018-06-01 腾讯科技(深圳)有限公司 一种图片压缩方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103218427B (zh) * 2013-04-08 2016-06-29 北京大学 局部描述子的提取方法、图像检索方法及图像匹配方法
CN105893486A (zh) * 2016-03-29 2016-08-24 华中科技大学 一种基于团的大规模图最短距离索引方法
DE102017110338A1 (de) * 2017-05-12 2018-11-15 Volume Graphics Gmbh Computerimplementiertes Verfahren zur Komprimierung einer digitalen Darstellung eines Objekts

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108111858A (zh) * 2016-11-24 2018-06-01 腾讯科技(深圳)有限公司 一种图片压缩方法及装置

Also Published As

Publication number Publication date
CN109815237A (zh) 2019-05-28

Similar Documents

Publication Publication Date Title
CN109146892B (zh) 一种基于美学的图像裁剪方法及装置
CN112199375A (zh) 跨模态的数据处理方法、装置、存储介质以及电子装置
CN108710671B (zh) 文本中公司名称的提取方法及装置
CN113642659B (zh) 一种训练样本集生成的方法、装置、电子设备及存储介质
CN111695517B (zh) 图像的表格提取方法、装置、电子设备及存储介质
CN114005012A (zh) 多模态预训练模型的训练方法、装置、设备及存储介质
JP2017526021A (ja) データ検索におけるエラー修正装置及びその方法
CN111125408B (zh) 基于特征提取的搜索方法、装置、计算机设备和存储介质
CN110569507A (zh) 语义识别方法、装置、设备及存储介质
CN112434188A (zh) 一种异构数据库的数据集成方法、装置及存储介质
CN113032580A (zh) 关联档案推荐方法、系统及电子设备
CN115858861A (zh) 视频浓缩方法、电子设备和计算机可读存储介质
CN110209780B (zh) 一种问题模板生成方法、装置、服务器及存储介质
CN111144407A (zh) 一种目标检测方法、系统、装置及可读存储介质
CN109815237B (zh) 针对最短路的图数据冗余边识别方法、压缩方法及装置
CN105550240B (zh) 一种推荐的方法及装置
CN107463676B (zh) 文本数据存储方法及装置
CN115115901A (zh) 获取跨域学习模型的方法及装置
CN112182382B (zh) 数据处理方法、电子设备及介质
CN114638236A (zh) 一种智能问答方法、装置、设备及计算机可读存储介质
CN110909097B (zh) 多边形电子围栏生成方法、装置、计算机设备和存储介质
CN108154177B (zh) 业务识别方法、装置、终端设备及存储介质
CN109885733B (zh) 针对目标生成树查询的图数据压缩方法及装置
CN111143643A (zh) 元素识别方法、装置、可读存储介质和电子设备
CN106933911A (zh) 最短路径识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant