CN117196930A - 基于gpu集群的高性能图像处理系统及方法 - Google Patents
基于gpu集群的高性能图像处理系统及方法 Download PDFInfo
- Publication number
- CN117196930A CN117196930A CN202311462675.3A CN202311462675A CN117196930A CN 117196930 A CN117196930 A CN 117196930A CN 202311462675 A CN202311462675 A CN 202311462675A CN 117196930 A CN117196930 A CN 117196930A
- Authority
- CN
- China
- Prior art keywords
- distributed
- image processing
- gpu cluster
- task
- processing task
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 110
- 238000000034 method Methods 0.000 title claims abstract description 15
- 230000005540 biological transmission Effects 0.000 claims description 15
- 238000003672 processing method Methods 0.000 claims description 8
- 238000004891 communication Methods 0.000 claims description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Multi Processors (AREA)
Abstract
本发明涉及图像数据处理领域,公开了基于GPU集群的高性能图像处理系统及方法,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,得到分布式GPU集群运行状态;分布式任务调度模块根据图像处理任务类型,若为本地图像处理任务,则分别获取分布式GPU集群列表中各个分布式GPU集群的延迟,根据延迟选择分布式GPU集群,进行图像处理;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;直到图像处理任务完成。通过本发明可以实现对大规模图像数据的高效处理和高精度计算。
Description
技术领域
本发明涉及图像数据处理领域,具体是基于GPU集群的高性能图像处理系统及方法。
背景技术
在传统的图像处理系统中,通常使用中央处理器(CPU)进行图像数据的处理和计算。然而,随着图像数据规模的不断扩大,CPU处理图像的速度和效率已经无法满足实际需求。此外,对于一些复杂的图像处理任务,如特征提取、目标检测、图像生成等,CPU的计算能力和内存容量也受到限制,无法满足高精度、高质量和高效率的处理要求。
随着图形处理器(GPU)技术的发展,GPU在并行计算能力上的优势逐渐被发掘出来。GPU具有大量的核心和高效的内存带宽,可以同时处理多个数据,提供更高的计算速度和效率。因此,基于GPU的图像处理系统逐渐成为研究的热点。
因此,如何利用多个GPU构建的分布式GPU集群进行图像数据处理,是当下亟待解决的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供基于GPU集群的高性能图像处理方法,包括如下步骤:
步骤一,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,并与分布式GPU集群连接,获取分布式GPU集群运行数据,得到分布式GPU集群运行状态;
步骤二,分布式任务调度模块根据终端上传的图像处理任务,获取图像处理任务类型,若为本地图像处理任务,则进入步骤三;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;
步骤三,分布式任务调度模块根据终端上传的图像处理任务,得到图像处理任务的算力需求数据,根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟;
步骤四,分别获取第一延迟中的最小值和第二延迟中的最小值,若第一延迟中的最小值不大于第二延迟中的最小值,则进入步骤五,否则,进入步骤六;
步骤五,第一延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务和终端上传的图像数据发送到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成;
步骤六,第二延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务发送到匹配的分布式GPU集群,并建立临时图像数据传输容器,终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成。
进一步的,所述的获取分布式GPU集群运行数据,得到分布式GPU集群运行状态,包括:获取分布式GPU集群的总算力、已使用的总算力,得到分布式GPU集群剩余可用算力。
进一步的,所述的若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理,包括:
分布式任务调度模块根据图像处理任务中图像信息的获取地址,获取图像数据,将图像数据和图像处理任务,发送到与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群,进行图像处理;其中所述的与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群为:剩余算力不小于图像处理任务需求算力的分布式GPU集群。
进一步的,所述的根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟,包括:
剩余算力不小于图像处理任务需求算力的分布式GPU集群为匹配的分布式GPU集群,所有的匹配的分布式GPU集群构成分布式GPU集群列表;
所述的第一延迟为:终端传输图像数据到云端数据服务器的时长,与云端数据服务器传输到分布式GPU集群的时长的和;
所述的第二延迟为:终端传输图像数据到分布式GPU集群的时长。
进一步的,所述的终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,还包括:图像数据传输完成后,关闭临时图像数据传输容器。
基于GPU集群的高性能图像处理系统,应用所述的基于GPU集群的高性能图像处理方法,包括云端数据服务器、分布式GPU集群和终端;
所述的分布式GPU集群和终端分别与所述的云端数据服务器通信连接。
本发明的有益效果是:通过本发明所提供的技术方案,可以根据图像处理任务进行灵活的图像数据处理任务分配,实现对大规模图像数据的高效处理和高精度计算。
附图说明
图1为基于GPU集群的高性能图像处理方法的流程示意图;
图2为基于GPU集群的高性能图像处理系统的原理示意图。
实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
为了使本发明的目的,技术方案及优点更加清楚明白,结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
而且,术语“包括”,“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程,方法,物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程,方法,物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程,方法,物品或者设备中还存在另外的相同要素。
以下结合实施例对本发明的特征和算力作进一步的详细描述。
如图1所示,基于GPU集群的高性能图像处理方法,包括如下步骤:
步骤一,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,并与分布式GPU集群连接,获取分布式GPU集群运行数据,得到分布式GPU集群运行状态;
步骤二,分布式任务调度模块根据终端上传的图像处理任务,获取图像处理任务类型,若为本地图像处理任务,则进入步骤三;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;
步骤三,分布式任务调度模块根据终端上传的图像处理任务,得到图像处理任务的算力需求数据,根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟;
步骤四,分别获取第一延迟中的最小值和第二延迟中的最小值,若第一延迟中的最小值不大于第二延迟中的最小值,则进入步骤五,否则,进入步骤六;
步骤五,第一延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务和终端上传的图像数据发送到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成;
步骤六,第二延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务发送到匹配的分布式GPU集群,并建立临时图像数据传输容器,终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成。
所述的获取分布式GPU集群运行数据,得到分布式GPU集群运行状态,包括:获取分布式GPU集群的总算力、已使用的总算力,得到分布式GPU集群剩余可用算力。
所述的若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理,包括:
分布式任务调度模块根据图像处理任务中图像信息的获取地址,获取图像数据,将图像数据和图像处理任务,发送到与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群,进行图像处理;其中所述的与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群为:剩余算力不小于图像处理任务需求算力的分布式GPU集群。
所述的根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟,包括:
剩余算力不小于图像处理任务需求算力的分布式GPU集群为匹配的分布式GPU集群,所有的匹配的分布式GPU集群构成分布式GPU集群列表;
所述的第一延迟为:终端传输图像数据到云端数据服务器的时长,与云端数据服务器传输到分布式GPU集群的时长的和;
所述的第二延迟为:终端传输图像数据到分布式GPU集群的时长。
所述的终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,还包括:图像数据传输完成后,关闭临时图像数据传输容器。
如图2所示,基于GPU集群的高性能图像处理系统,应用所述的基于GPU集群的高性能图像处理方法,包括云端数据服务器、分布式GPU集群和终端;
所述的分布式GPU集群和终端分别与所述的云端数据服务器通信连接。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。
Claims (6)
1.基于GPU集群的高性能图像处理方法,其特征在于,包括如下步骤:
步骤一,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,并与分布式GPU集群连接,获取分布式GPU集群运行数据,得到分布式GPU集群运行状态;
步骤二,分布式任务调度模块根据终端上传的图像处理任务,获取图像处理任务类型,若为本地图像处理任务,则进入步骤三;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;
步骤三,分布式任务调度模块根据终端上传的图像处理任务,得到图像处理任务的算力需求数据,根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟;
步骤四,分别获取第一延迟中的最小值和第二延迟中的最小值,若第一延迟中的最小值不大于第二延迟中的最小值,则进入步骤五,否则,进入步骤六;
步骤五,第一延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务和终端上传的图像数据发送到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成;
步骤六,第二延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务发送到匹配的分布式GPU集群,并建立临时图像数据传输容器,终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成。
2.根据权利要求1所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的获取分布式GPU集群运行数据,得到分布式GPU集群运行状态,包括:获取分布式GPU集群的总算力、已使用的总算力,得到分布式GPU集群剩余可用算力。
3.根据权利要求2所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理,包括:
分布式任务调度模块根据图像处理任务中图像信息的获取地址,获取图像数据,将图像数据和图像处理任务,发送到与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群,进行图像处理;其中所述的与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群为:剩余算力不小于图像处理任务需求算力的分布式GPU集群。
4.根据权利要求1所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟,包括:
剩余算力不小于图像处理任务需求算力的分布式GPU集群为匹配的分布式GPU集群,所有的匹配的分布式GPU集群构成分布式GPU集群列表;
所述的第一延迟为:终端传输图像数据到云端数据服务器的时长,与云端数据服务器传输到分布式GPU集群的时长的和;
所述的第二延迟为:终端传输图像数据到分布式GPU集群的时长。
5.根据权利要求1所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,还包括:图像数据传输完成后,关闭临时图像数据传输容器。
6.基于GPU集群的高性能图像处理系统,其特征在于,应用权利要求1-5任一所述的基于GPU集群的高性能图像处理方法,包括云端数据服务器、分布式GPU集群和终端;
所述的分布式GPU集群和终端分别与所述的云端数据服务器通信连接。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311462675.3A CN117196930B (zh) | 2023-11-06 | 2023-11-06 | 基于gpu集群的高性能图像处理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311462675.3A CN117196930B (zh) | 2023-11-06 | 2023-11-06 | 基于gpu集群的高性能图像处理系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117196930A true CN117196930A (zh) | 2023-12-08 |
CN117196930B CN117196930B (zh) | 2024-01-23 |
Family
ID=88987259
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311462675.3A Active CN117196930B (zh) | 2023-11-06 | 2023-11-06 | 基于gpu集群的高性能图像处理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117196930B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107067365A (zh) * | 2017-04-25 | 2017-08-18 | 中国石油大学(华东) | 基于深度学习的分布嵌入式实时视频流处理系统及方法 |
CN108594816A (zh) * | 2018-04-23 | 2018-09-28 | 长沙学院 | 一种通过改进orb-slam算法实现定位与构图的方法和系统 |
US20190205649A1 (en) * | 2017-12-28 | 2019-07-04 | Microsoft Technology Licensing, Llc | Querying video data with reduced latency and cost |
CN114741207A (zh) * | 2022-06-10 | 2022-07-12 | 之江实验室 | 一种基于多维度组合并行的gpu资源调度方法和系统 |
KR20230051064A (ko) * | 2021-10-08 | 2023-04-17 | 한국과학기술원 | Gpu 클러스터 기반 지역별 분산 제어 시스템 및 방법, gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램 및 gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램이 저장된 컴퓨터 판독 가능한 기록매체 |
CN116048721A (zh) * | 2022-12-27 | 2023-05-02 | 中国电信股份有限公司 | 一种gpu集群的任务分配方法、装置、电子设备和介质 |
-
2023
- 2023-11-06 CN CN202311462675.3A patent/CN117196930B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107067365A (zh) * | 2017-04-25 | 2017-08-18 | 中国石油大学(华东) | 基于深度学习的分布嵌入式实时视频流处理系统及方法 |
US20190205649A1 (en) * | 2017-12-28 | 2019-07-04 | Microsoft Technology Licensing, Llc | Querying video data with reduced latency and cost |
CN108594816A (zh) * | 2018-04-23 | 2018-09-28 | 长沙学院 | 一种通过改进orb-slam算法实现定位与构图的方法和系统 |
KR20230051064A (ko) * | 2021-10-08 | 2023-04-17 | 한국과학기술원 | Gpu 클러스터 기반 지역별 분산 제어 시스템 및 방법, gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램 및 gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램이 저장된 컴퓨터 판독 가능한 기록매체 |
CN114741207A (zh) * | 2022-06-10 | 2022-07-12 | 之江实验室 | 一种基于多维度组合并行的gpu资源调度方法和系统 |
CN116048721A (zh) * | 2022-12-27 | 2023-05-02 | 中国电信股份有限公司 | 一种gpu集群的任务分配方法、装置、电子设备和介质 |
Non-Patent Citations (2)
Title |
---|
SEO, W 等: "Efficient Ray Tracing of Large 3D Scenes for Mobile Distributed Computing Environments", 《SENSORS》, vol. 22, no. 2, pages 1 - 21 * |
姚鹏 等: "高算力芯片未来技术发展途径", 《前瞻科技》, vol. 1, no. 3, pages 115 - 129 * |
Also Published As
Publication number | Publication date |
---|---|
CN117196930B (zh) | 2024-01-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657782B (zh) | 运算方法、装置及相关产品 | |
CN110147251B (zh) | 用于计算神经网络模型的系统、芯片及计算方法 | |
US20220004480A1 (en) | Log data collection method, log data collection device, storage medium, and log data collection system | |
CN102906726B (zh) | 协处理加速方法、装置及系统 | |
CN106033476A (zh) | 一种云计算环境中分布式计算模式下的增量式图计算方法 | |
CN102625144A (zh) | 基于局域网云网络的并行视频处理方法 | |
CN112422977A (zh) | 音视频转码任务的分配方法和分配装置 | |
CN117196930B (zh) | 基于gpu集群的高性能图像处理系统及方法 | |
US20220129179A1 (en) | Data processing apparatus, data processing system including the same, and operating method thereof | |
CN111447592B (zh) | 一种确定传输资源的方法、设备及存储介质 | |
CN112084023A (zh) | 数据并行处理的方法、电子设备及计算机可读存储介质 | |
CN115378937B (zh) | 任务的分布式并发方法、装置、设备和可读存储介质 | |
CN105915910A (zh) | 一种基于云平台的视频转码方法和装置 | |
CN113900793B (zh) | 一种服务器集群及其深度学习的集合通信系统和方法 | |
CN112883110A (zh) | 一种基于nifi的终端大数据分发方法、存储介质及系统 | |
CN115454923A (zh) | 数据计算的装置、板卡、方法以及存储介质 | |
CN112799829A (zh) | 一种知识驱动的网络资源编排方法 | |
CN112765294A (zh) | 一种气象大数据处理调度系统 | |
CN110751423A (zh) | 一种状态估计服务系统、微服务架构和状态估计方法 | |
CN111400598A (zh) | 信息推送方法、服务器、多端口转发器和存储介质 | |
CN217883683U (zh) | 一种基于工业制造的数据交换设备 | |
CN214011978U (zh) | 一种扩展usb端口的装置和电子设备 | |
CN111988310B (zh) | 基于iec61850协议的数据获取方法及装置 | |
CN104580330A (zh) | 一种基于云计算的数据加工系统 | |
CN115292053B (zh) | 移动端cnn的cpu、gpu、npu统一调度方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |