CN117196930A - 基于gpu集群的高性能图像处理系统及方法 - Google Patents

基于gpu集群的高性能图像处理系统及方法 Download PDF

Info

Publication number
CN117196930A
CN117196930A CN202311462675.3A CN202311462675A CN117196930A CN 117196930 A CN117196930 A CN 117196930A CN 202311462675 A CN202311462675 A CN 202311462675A CN 117196930 A CN117196930 A CN 117196930A
Authority
CN
China
Prior art keywords
distributed
image processing
gpu cluster
task
processing task
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202311462675.3A
Other languages
English (en)
Other versions
CN117196930B (zh
Inventor
王晓丹
王曦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Bingji Technology Co ltd
Original Assignee
Sichuan Bingji Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Bingji Technology Co ltd filed Critical Sichuan Bingji Technology Co ltd
Priority to CN202311462675.3A priority Critical patent/CN117196930B/zh
Publication of CN117196930A publication Critical patent/CN117196930A/zh
Application granted granted Critical
Publication of CN117196930B publication Critical patent/CN117196930B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Multi Processors (AREA)

Abstract

本发明涉及图像数据处理领域,公开了基于GPU集群的高性能图像处理系统及方法,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,得到分布式GPU集群运行状态;分布式任务调度模块根据图像处理任务类型,若为本地图像处理任务,则分别获取分布式GPU集群列表中各个分布式GPU集群的延迟,根据延迟选择分布式GPU集群,进行图像处理;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;直到图像处理任务完成。通过本发明可以实现对大规模图像数据的高效处理和高精度计算。

Description

基于GPU集群的高性能图像处理系统及方法
技术领域
本发明涉及图像数据处理领域,具体是基于GPU集群的高性能图像处理系统及方法。
背景技术
在传统的图像处理系统中,通常使用中央处理器(CPU)进行图像数据的处理和计算。然而,随着图像数据规模的不断扩大,CPU处理图像的速度和效率已经无法满足实际需求。此外,对于一些复杂的图像处理任务,如特征提取、目标检测、图像生成等,CPU的计算能力和内存容量也受到限制,无法满足高精度、高质量和高效率的处理要求。
随着图形处理器(GPU)技术的发展,GPU在并行计算能力上的优势逐渐被发掘出来。GPU具有大量的核心和高效的内存带宽,可以同时处理多个数据,提供更高的计算速度和效率。因此,基于GPU的图像处理系统逐渐成为研究的热点。
因此,如何利用多个GPU构建的分布式GPU集群进行图像数据处理,是当下亟待解决的问题。
发明内容
本发明的目的在于克服现有技术的不足,提供基于GPU集群的高性能图像处理方法,包括如下步骤:
步骤一,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,并与分布式GPU集群连接,获取分布式GPU集群运行数据,得到分布式GPU集群运行状态;
步骤二,分布式任务调度模块根据终端上传的图像处理任务,获取图像处理任务类型,若为本地图像处理任务,则进入步骤三;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;
步骤三,分布式任务调度模块根据终端上传的图像处理任务,得到图像处理任务的算力需求数据,根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟;
步骤四,分别获取第一延迟中的最小值和第二延迟中的最小值,若第一延迟中的最小值不大于第二延迟中的最小值,则进入步骤五,否则,进入步骤六;
步骤五,第一延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务和终端上传的图像数据发送到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成;
步骤六,第二延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务发送到匹配的分布式GPU集群,并建立临时图像数据传输容器,终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成。
进一步的,所述的获取分布式GPU集群运行数据,得到分布式GPU集群运行状态,包括:获取分布式GPU集群的总算力、已使用的总算力,得到分布式GPU集群剩余可用算力。
进一步的,所述的若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理,包括:
分布式任务调度模块根据图像处理任务中图像信息的获取地址,获取图像数据,将图像数据和图像处理任务,发送到与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群,进行图像处理;其中所述的与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群为:剩余算力不小于图像处理任务需求算力的分布式GPU集群。
进一步的,所述的根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟,包括:
剩余算力不小于图像处理任务需求算力的分布式GPU集群为匹配的分布式GPU集群,所有的匹配的分布式GPU集群构成分布式GPU集群列表;
所述的第一延迟为:终端传输图像数据到云端数据服务器的时长,与云端数据服务器传输到分布式GPU集群的时长的和;
所述的第二延迟为:终端传输图像数据到分布式GPU集群的时长。
进一步的,所述的终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,还包括:图像数据传输完成后,关闭临时图像数据传输容器。
基于GPU集群的高性能图像处理系统,应用所述的基于GPU集群的高性能图像处理方法,包括云端数据服务器、分布式GPU集群和终端;
所述的分布式GPU集群和终端分别与所述的云端数据服务器通信连接。
本发明的有益效果是:通过本发明所提供的技术方案,可以根据图像处理任务进行灵活的图像数据处理任务分配,实现对大规模图像数据的高效处理和高精度计算。
附图说明
图1为基于GPU集群的高性能图像处理方法的流程示意图;
图2为基于GPU集群的高性能图像处理系统的原理示意图。
实施方式
下面结合附图进一步详细描述本发明的技术方案,但本发明的保护范围不局限于以下所述。
为了使本发明的目的,技术方案及优点更加清楚明白,结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,即所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,术语“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
而且,术语“包括”,“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程,方法,物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程,方法,物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程,方法,物品或者设备中还存在另外的相同要素。
以下结合实施例对本发明的特征和算力作进一步的详细描述。
如图1所示,基于GPU集群的高性能图像处理方法,包括如下步骤:
步骤一,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,并与分布式GPU集群连接,获取分布式GPU集群运行数据,得到分布式GPU集群运行状态;
步骤二,分布式任务调度模块根据终端上传的图像处理任务,获取图像处理任务类型,若为本地图像处理任务,则进入步骤三;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;
步骤三,分布式任务调度模块根据终端上传的图像处理任务,得到图像处理任务的算力需求数据,根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟;
步骤四,分别获取第一延迟中的最小值和第二延迟中的最小值,若第一延迟中的最小值不大于第二延迟中的最小值,则进入步骤五,否则,进入步骤六;
步骤五,第一延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务和终端上传的图像数据发送到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成;
步骤六,第二延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务发送到匹配的分布式GPU集群,并建立临时图像数据传输容器,终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成。
所述的获取分布式GPU集群运行数据,得到分布式GPU集群运行状态,包括:获取分布式GPU集群的总算力、已使用的总算力,得到分布式GPU集群剩余可用算力。
所述的若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理,包括:
分布式任务调度模块根据图像处理任务中图像信息的获取地址,获取图像数据,将图像数据和图像处理任务,发送到与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群,进行图像处理;其中所述的与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群为:剩余算力不小于图像处理任务需求算力的分布式GPU集群。
所述的根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟,包括:
剩余算力不小于图像处理任务需求算力的分布式GPU集群为匹配的分布式GPU集群,所有的匹配的分布式GPU集群构成分布式GPU集群列表;
所述的第一延迟为:终端传输图像数据到云端数据服务器的时长,与云端数据服务器传输到分布式GPU集群的时长的和;
所述的第二延迟为:终端传输图像数据到分布式GPU集群的时长。
所述的终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,还包括:图像数据传输完成后,关闭临时图像数据传输容器。
如图2所示,基于GPU集群的高性能图像处理系统,应用所述的基于GPU集群的高性能图像处理方法,包括云端数据服务器、分布式GPU集群和终端;
所述的分布式GPU集群和终端分别与所述的云端数据服务器通信连接。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (6)

1.基于GPU集群的高性能图像处理方法,其特征在于,包括如下步骤:
步骤一,云端数据服务器中的分布式任务调度模块基于各个分布式GPU集群的基础数据,分别建立对应分布式GPU集群的任务执行容器,并与分布式GPU集群连接,获取分布式GPU集群运行数据,得到分布式GPU集群运行状态;
步骤二,分布式任务调度模块根据终端上传的图像处理任务,获取图像处理任务类型,若为本地图像处理任务,则进入步骤三;若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理;
步骤三,分布式任务调度模块根据终端上传的图像处理任务,得到图像处理任务的算力需求数据,根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟;
步骤四,分别获取第一延迟中的最小值和第二延迟中的最小值,若第一延迟中的最小值不大于第二延迟中的最小值,则进入步骤五,否则,进入步骤六;
步骤五,第一延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务和终端上传的图像数据发送到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成;
步骤六,第二延迟中的最小值对应的分布式GPU集群为匹配的分布式GPU集群,分布式任务调度模块将图像处理任务发送到匹配的分布式GPU集群,并建立临时图像数据传输容器,终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,分布式GPU集群进行图像处理任务,直到图像处理任务完成。
2.根据权利要求1所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的获取分布式GPU集群运行数据,得到分布式GPU集群运行状态,包括:获取分布式GPU集群的总算力、已使用的总算力,得到分布式GPU集群剩余可用算力。
3.根据权利要求2所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的若为云端图像处理任务,分布式任务调度模块根据终端上传的图像处理任务中的图像信息,调取图像数据,与图像处理任务发送到匹配的分布式GPU集群,进行图像处理,包括:
分布式任务调度模块根据图像处理任务中图像信息的获取地址,获取图像数据,将图像数据和图像处理任务,发送到与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群,进行图像处理;其中所述的与分布式任务调度模块网络延迟最小的匹配的分布式GPU集群为:剩余算力不小于图像处理任务需求算力的分布式GPU集群。
4.根据权利要求1所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的根据算力需求数据匹配得到分布式GPU集群列表,分别获取分布式GPU集群列表中各个分布式GPU集群的第一延迟和第二延迟,包括:
剩余算力不小于图像处理任务需求算力的分布式GPU集群为匹配的分布式GPU集群,所有的匹配的分布式GPU集群构成分布式GPU集群列表;
所述的第一延迟为:终端传输图像数据到云端数据服务器的时长,与云端数据服务器传输到分布式GPU集群的时长的和;
所述的第二延迟为:终端传输图像数据到分布式GPU集群的时长。
5.根据权利要求1所述的基于GPU集群的高性能图像处理方法,其特征在于,所述的终端通过临时图像数据传输容器将图像数据传输到匹配的分布式GPU集群,还包括:图像数据传输完成后,关闭临时图像数据传输容器。
6.基于GPU集群的高性能图像处理系统,其特征在于,应用权利要求1-5任一所述的基于GPU集群的高性能图像处理方法,包括云端数据服务器、分布式GPU集群和终端;
所述的分布式GPU集群和终端分别与所述的云端数据服务器通信连接。
CN202311462675.3A 2023-11-06 2023-11-06 基于gpu集群的高性能图像处理系统及方法 Active CN117196930B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311462675.3A CN117196930B (zh) 2023-11-06 2023-11-06 基于gpu集群的高性能图像处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311462675.3A CN117196930B (zh) 2023-11-06 2023-11-06 基于gpu集群的高性能图像处理系统及方法

Publications (2)

Publication Number Publication Date
CN117196930A true CN117196930A (zh) 2023-12-08
CN117196930B CN117196930B (zh) 2024-01-23

Family

ID=88987259

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311462675.3A Active CN117196930B (zh) 2023-11-06 2023-11-06 基于gpu集群的高性能图像处理系统及方法

Country Status (1)

Country Link
CN (1) CN117196930B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107067365A (zh) * 2017-04-25 2017-08-18 中国石油大学(华东) 基于深度学习的分布嵌入式实时视频流处理系统及方法
CN108594816A (zh) * 2018-04-23 2018-09-28 长沙学院 一种通过改进orb-slam算法实现定位与构图的方法和系统
US20190205649A1 (en) * 2017-12-28 2019-07-04 Microsoft Technology Licensing, Llc Querying video data with reduced latency and cost
CN114741207A (zh) * 2022-06-10 2022-07-12 之江实验室 一种基于多维度组合并行的gpu资源调度方法和系统
KR20230051064A (ko) * 2021-10-08 2023-04-17 한국과학기술원 Gpu 클러스터 기반 지역별 분산 제어 시스템 및 방법, gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램 및 gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램이 저장된 컴퓨터 판독 가능한 기록매체
CN116048721A (zh) * 2022-12-27 2023-05-02 中国电信股份有限公司 一种gpu集群的任务分配方法、装置、电子设备和介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107067365A (zh) * 2017-04-25 2017-08-18 中国石油大学(华东) 基于深度学习的分布嵌入式实时视频流处理系统及方法
US20190205649A1 (en) * 2017-12-28 2019-07-04 Microsoft Technology Licensing, Llc Querying video data with reduced latency and cost
CN108594816A (zh) * 2018-04-23 2018-09-28 长沙学院 一种通过改进orb-slam算法实现定位与构图的方法和系统
KR20230051064A (ko) * 2021-10-08 2023-04-17 한국과학기술원 Gpu 클러스터 기반 지역별 분산 제어 시스템 및 방법, gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램 및 gpu 클러스터 기반 지역별 분산 제어 방법을 수행하는 프로그램이 저장된 컴퓨터 판독 가능한 기록매체
CN114741207A (zh) * 2022-06-10 2022-07-12 之江实验室 一种基于多维度组合并行的gpu资源调度方法和系统
CN116048721A (zh) * 2022-12-27 2023-05-02 中国电信股份有限公司 一种gpu集群的任务分配方法、装置、电子设备和介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
SEO, W 等: "Efficient Ray Tracing of Large 3D Scenes for Mobile Distributed Computing Environments", 《SENSORS》, vol. 22, no. 2, pages 1 - 21 *
姚鹏 等: "高算力芯片未来技术发展途径", 《前瞻科技》, vol. 1, no. 3, pages 115 - 129 *

Also Published As

Publication number Publication date
CN117196930B (zh) 2024-01-23

Similar Documents

Publication Publication Date Title
CN109657782B (zh) 运算方法、装置及相关产品
CN110147251B (zh) 用于计算神经网络模型的系统、芯片及计算方法
US20220004480A1 (en) Log data collection method, log data collection device, storage medium, and log data collection system
CN102906726B (zh) 协处理加速方法、装置及系统
CN106033476A (zh) 一种云计算环境中分布式计算模式下的增量式图计算方法
CN102625144A (zh) 基于局域网云网络的并行视频处理方法
CN112422977A (zh) 音视频转码任务的分配方法和分配装置
CN117196930B (zh) 基于gpu集群的高性能图像处理系统及方法
US20220129179A1 (en) Data processing apparatus, data processing system including the same, and operating method thereof
CN111447592B (zh) 一种确定传输资源的方法、设备及存储介质
CN112084023A (zh) 数据并行处理的方法、电子设备及计算机可读存储介质
CN115378937B (zh) 任务的分布式并发方法、装置、设备和可读存储介质
CN105915910A (zh) 一种基于云平台的视频转码方法和装置
CN113900793B (zh) 一种服务器集群及其深度学习的集合通信系统和方法
CN112883110A (zh) 一种基于nifi的终端大数据分发方法、存储介质及系统
CN115454923A (zh) 数据计算的装置、板卡、方法以及存储介质
CN112799829A (zh) 一种知识驱动的网络资源编排方法
CN112765294A (zh) 一种气象大数据处理调度系统
CN110751423A (zh) 一种状态估计服务系统、微服务架构和状态估计方法
CN111400598A (zh) 信息推送方法、服务器、多端口转发器和存储介质
CN217883683U (zh) 一种基于工业制造的数据交换设备
CN214011978U (zh) 一种扩展usb端口的装置和电子设备
CN111988310B (zh) 基于iec61850协议的数据获取方法及装置
CN104580330A (zh) 一种基于云计算的数据加工系统
CN115292053B (zh) 移动端cnn的cpu、gpu、npu统一调度方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant