CN107067365A - 基于深度学习的分布嵌入式实时视频流处理系统及方法 - Google Patents

基于深度学习的分布嵌入式实时视频流处理系统及方法 Download PDF

Info

Publication number
CN107067365A
CN107067365A CN201710278169.7A CN201710278169A CN107067365A CN 107067365 A CN107067365 A CN 107067365A CN 201710278169 A CN201710278169 A CN 201710278169A CN 107067365 A CN107067365 A CN 107067365A
Authority
CN
China
Prior art keywords
video
gpu
deep learning
embedded
layer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201710278169.7A
Other languages
English (en)
Inventor
张卫山
孙浩云
赵德海
徐亮
卢清华
李忠伟
宫文娟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China University of Petroleum East China
Original Assignee
China University of Petroleum East China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China University of Petroleum East China filed Critical China University of Petroleum East China
Priority to CN201710278169.7A priority Critical patent/CN107067365A/zh
Publication of CN107067365A publication Critical patent/CN107067365A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T1/00General purpose image data processing
    • G06T1/20Processor architectures; Processor configuration, e.g. pipelining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Abstract

本发明涉及一种基于深度学习的分布嵌入式实时视频流处理系统及方法,视频数据采集层通过ARM板采集视频数据并预处理;视频处理层根据指定的视频处理任务在嵌入式GPU处理器集群上根据深度学习算法进行视频处理;GPU资源调度层实时监控嵌入式GPU处理器中的GPU使用情况并根据调度策略进行调度,存储层将处理结果上传到云存储服务器,服务层将结果可视化反馈给客户端。本发明的一种基于深度学习的分布嵌入式实时视频流处理框架,将视频处理、深度学习相结合,把视频处理利用分布嵌入式技术并行化,以达到实时视频处理的效果;把深度学习应用到视频处理中,提高视频处理的准确率。

Description

基于深度学习的分布嵌入式实时视频流处理系统及方法
技术领域
本发明属于视频处理的技术领域,尤其涉及一种基于深度学习的分布嵌入式实时视频流处理系统及方法。
背景技术
目前,随着半导体工艺以及芯片设计水平的不断进步,电子设备的性能取得了极大提高;其中,尤其是嵌入式应用终端得到了空前的发展。现有技术中的嵌入式应用终端能够处理的数据量更大,覆盖的领域更为广泛,一些原本只能在PC机上实现的应用,也已出现在嵌入式设备中,如视频处理。另一方面,人们对于嵌入式设备的应用提出的更高的要求也在推动嵌入式应用终端快速发展,如在视频处理等方面的要求。原本PC机中由图形处理器(GPU)完成的应用不仅需要强大的计算能力以及大数据的处理,更需要低功耗、低成本以适应不断发展的嵌入式系统需求。嵌入式GPU正是为了满足这些功能而设计的,是专用于嵌入式终端或者手持设备上的图形处理器。与PC机的GPU相比,嵌入式GPU需要同时兼顾高性能、低功耗、低成本等特点。例如,Jetson TX1是NVIDIA推出的首款TX系列的嵌入式超级视觉计算系统,也是全球首款模块化超级计算机。
在人工智能领域,出现了对嵌入式设备的连续视频数据的快速处理的需求,例如无人机航拍、自动驾驶等。
深度学习,是目前机器学习发展中一类最热门的算法,卷积神经网络(Convolutional Neural Networks,CNN)作为深度学习的一种方法,在物体识别、图像处理等领域有着较好的效果。然而,大规模的深度神经网络需要高性能、高功耗、高成本的硬件支持。一方面,大规模的深度神经网络需要高性能的设备。另一方面,移动设备的计算能力是受限于自身的重量和电池容量性。虽然移动云计算可以讲一部分计算转移到后端云服务器,但是当解决高流量和实时流数据时,带宽,延迟和可用性仍是具有挑战性的,因此,有必要设计一个分布式平台,实现高效的嵌入式计算。
综上所述,如何解决对嵌入式设备的连续视频数据的快速处理的需求的实现,如何解决处理高流量和实时流数据时带宽、延迟和可用性的问题,尚缺乏有效的解决方案。
发明内容
本发明为了解决上述问题,克服现有技术中嵌入式设备无法对连续视频数据进行快速处理,以及在处理高流量和实时流数据时带宽、延迟和可用性中存在的问题,提供一种基于深度学习的分布嵌入式实时视频流处理系统及方法,该系统及方法大幅度地提高了视频流处理的效率,减少了嵌入式设备的功耗。
为了实现上述目的,本发明采用如下一种技术方案:
一种基于深度学习的分布嵌入式实时视频流处理系统,该系统包括:
视频数据采集层,所述视频数据采集层采集视频数据并进行预处理;
视频数据处理层,所述视频数据处理层包括嵌入式GPU分布集群,根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理;
GPU资源调度层,所述GPU资源调度层实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
存储层,所述存储层包括云存储服务器,将视频处理结果上传到云存储服务器进行存储;
服务层,所述服务层与客户端连接,将视频处理结果可视化反馈给客户端。
进一步的,所述视频数据采集层包括摄像装置和嵌入式微处理器,所述嵌入式微处理器包括视频采集模块和视频预处理模块;
所述视频数据采集层通过嵌入式微处理器的视频采集模块连接摄像装置采集视频数据,采集的视频数据传输至视频预处理模块进行视频数据的预处理,所述视频预处理模块与视频数据处理层连接,将预处理后的视频数据传输至所述视频数据处理层的嵌入式GPU分布集群进行进一步视频处理。
进一步的,所述视频数据处理层的嵌入式GPU分布集群包括至少两个的GPU进行视频处理,所述GPU分别与所述GPU资源调度层连接。
进一步的,所述视频数据处理层包括深度学习模块,所述深度学习模块包括数据采集模块、训练模块和测试模块;
所述数据采集模块采集不同种类的视频数据集,并根据比例分为训练数据集和测试数据集;
所述训练模块采用深度学习算法对训练数据集进行训练,生成深度学习网络模型;
所述测试模块通过测试数据集对所述深度学习网络模型进行测试,并将测试完善后的深度学习网络模型分别设置于嵌入式GPU分布集群的各个GPU中。
本发明为了解决上述问题,克服现有技术中嵌入式设备无法对连续视频数据进行快速处理,以及在处理高流量和实时流数据时带宽、延迟和可用性中存在的问题,提供一种基于深度学习的分布嵌入式实时视频流处理系统及方法,该系统及方法大幅度地提高了视频流处理的效率,减少了嵌入式设备的功耗。
为了实现上述目的,本发明采用如下一种技术方案:
一种基于深度学习的分布嵌入式实时视频流处理方法,该方法基于上述一种基于深度学习的分布嵌入式实时视频流处理系统,该方法的具体步骤包括:
(1)视频数据采集:视频数据采集层采集视频数据并进行预处理;
(2)视频数据处理和GPU资源调度:将深度学习算法部署在GPU嵌入式分布集群上;视频数据处理层根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理;
GPU资源调度层实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
(3)视频数据存储:存储层将视频处理结果上传到云存储服务器进行存储;
(4)视频处理结果显示:服务层将视频处理结果可视化反馈给与其连接的客户端。
进一步的,所述步骤(1)中的视频数据采集的预处理的具体步骤为:
在视频预处理模块中,将接收的视频数据进行解码,解码为帧图像传输至所述视频数据处理层的嵌入式GPU分布集群进行进一步视频处理。
进一步的,所述步骤(2)中将深度学习算法部署在GPU嵌入式分布集群上的具体步骤为:
(2-1a)所述数据采集模块采集不同种类的视频数据集,并根据比例分为训练数据集和测试数据集;
(2-2a)所述训练模块采用深度学习算法对训练数据集进行训练,生成深度学习网络模型;
(2-3a)所述测试模块通过测试数据集对所述深度学习网络模型进行测试,并将测试完善后的深度学习网络模型分别设置于嵌入式GPU分布集群的各个GPU中。
进一步的,所述步骤(2)中视频数据处理层根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理的具体步骤为:
将从视频预处理模块中得到的帧图像作为视频数据处理层中的分布式计算框架的输入源,将每一帧图像分别传入分布式计算框架中进行处理,利用分布式计算框架的并行能力在视频数据处理层的各个GPU中进行视频的并行处理。
进一步的,所述步骤(2)中GPU资源调度层通过基于GPU的资源调度方法实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
基于GPU的资源调度方法的具体步骤为:
实时监控分布式计算框架中各个数据处理组件的GPU使用状况,将GPU消耗过大的进程分配到有较强GPU的数据处理组件上。
进一步的,所述步骤(3)中存储层将视频处理结果上传到云存储服务器的具体步骤为:
聚合视频处理后的视频处理结果,并将聚合视频处理后的视频处理结果存储到存储服务器中。
进一步的,所述步骤(4)中服务层将视频处理结果可视化反馈给与其连接的客户端的具体步骤为:
针对客户端不同的业务需求与数据集,通过个性化的交互性强的数据可视化组件将服务层的视频处理结果反馈给与其连接的客户端。
本发明的有益效果:
1.本发明的一种基于深度学习的分布嵌入式实时视频流处理系统,在视频数据处理层中采用嵌入式GPU分布集群,进行视频数据的GPU并行处理,有效提高了视频流的处理效率,且降低了嵌入式系统的功耗。
2.本发明的一种基于深度学习的分布嵌入式实时视频流处理系统,将深度学习算法在嵌入式GPU处理器集群上运行,提高资源利用率、算法准确率和效率。
3.本发明的一种基于深度学习的分布嵌入式实时视频流处理方法中的基于GPU的资源调度方法,将分布式计算框架中的GPU资源调度与视频处理技术结合,有效提高了视频处理的效率;且通过实时监控分布式计算框架中国各个数据处理组件的GPU使用状况,将GPU消耗过大的进程分配到有较强GPU的数据处理组件上,解决视频处理会消耗大量的GPU资源的问题,从而避免由于计算量过大达不到实际应用场景中实时效果的问题,实现实时效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的系统结构示意图;
图2是本发明的方法流程图;
图3是本发明的基于GPU的资源调度方法流程图。
具体实施方式:
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面结合附图与实施例对本发明作进一步说明。
实施例1:
正如背景技术所介绍的,现有技术中存在嵌入式设备无法对连续视频数据进行快速处理,以及在处理高流量和实时流数据时带宽、延迟和可用性中存在的问题,提供一种基于深度学习的分布嵌入式实时视频流处理系统及方法,该系统及方法大幅度地提高了视频流处理的效率,减少了嵌入式设备的功耗。
为了实现上述目的,本实施例采用如下一种技术方案:
一种基于深度学习的分布嵌入式实时视频流处理系统,如图1所示,该系统包括:
视频数据采集层,所述视频数据采集层采集视频数据并进行预处理;
视频数据处理层,所述视频数据处理层包括嵌入式GPU分布集群,根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理;
GPU资源调度层,所述GPU资源调度层实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
存储层,所述存储层包括云存储服务器,将视频处理结果上传到云存储服务器进行存储;
服务层,所述服务层与客户端连接,将视频处理结果可视化反馈给客户端。
所述视频数据采集层包括摄像装置和嵌入式微处理器,所述嵌入式微处理器包括视频采集模块和视频预处理模块;
所述视频数据采集层通过嵌入式微处理器的视频采集模块连接摄像装置采集视频数据,采集的视频数据传输至视频预处理模块进行视频数据的预处理,所述视频预处理模块与视频数据处理层连接,将预处理后的视频数据传输至所述视频数据处理层的嵌入式GPU分布集群进行进一步视频处理。
在本实施例中,摄像装置选用高清摄像头,嵌入式微处理器选用ARM板。
在本实施例中,如图1所示,所述视频数据处理层的嵌入式GPU分布集群包括三个GPU进行视频处理,三个GPU分别与所述GPU资源调度层连接。
所述视频数据处理层包括深度学习模块,所述深度学习模块包括数据采集模块、训练模块和测试模块;
所述数据采集模块采集不同种类的视频数据集,并将视频数据集70%的视频数据作为训练数据集,剩余30%的视频数据作为测试数据集;
所述训练模块采用深度学习算法对训练数据集进行训练,生成深度学习网络模型;
所述测试模块通过测试数据集对所述深度学习网络模型进行测试,并将测试完善后的深度学习网络模型分别设置于嵌入式GPU分布集群的各个GPU中。
实施例2:
正如背景技术所介绍的,现有技术中存在嵌入式设备无法对连续视频数据进行快速处理,以及在处理高流量和实时流数据时带宽、延迟和可用性中存在的问题,提供一种基于深度学习的分布嵌入式实时视频流处理系统及方法,该系统及方法大幅度地提高了视频流处理的效率,减少了嵌入式设备的功耗。
为了实现上述目的,本实施例采用如下另一种技术方案:
一种基于深度学习的分布嵌入式实时视频流处理方法,如图2所示,该方法基于上述实施例一种基于深度学习的分布嵌入式实时视频流处理系统,该方法的具体步骤包括:
(S1)视频数据采集:视频数据采集层采集视频数据并进行预处理;
(S2)视频数据处理和GPU资源调度:将深度学习算法部署在GPU嵌入式分布集群上;视频数据处理层根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理;
GPU资源调度层实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
(S3)视频数据存储:存储层将视频处理结果上传到云存储服务器进行存储;
(S4)视频处理结果显示:服务层将视频处理结果可视化反馈给与其连接的客户端。
所述步骤(S1)中的视频数据采集的预处理的具体步骤为:
在视频预处理模块中,将接收的视频数据进行解码,解码为帧图像传输至所述视频数据处理层的嵌入式GPU分布集群进行进一步视频处理。
可选的,在视频预处理模块中,获取来自流媒体服务器的实时视频流,将实时视频流解码为帧图像,传输每一帧图像至所述视频数据处理层的嵌入式GPU分布集群进行进一步视频处理。
所述步骤(S2)中将深度学习算法部署在GPU嵌入式分布集群上的具体步骤为:
(2-1a)所述数据采集模块采集不同种类的视频数据集,并根据比例分为训练数据集和测试数据集;
(2-2a)所述训练模块采用深度学习算法对训练数据集进行训练,生成深度学习网络模型;
(2-3a)所述测试模块通过测试数据集对所述深度学习网络模型进行测试,并将测试完善后的深度学习网络模型分别设置于嵌入式GPU分布集群的各个GPU中。
所述步骤(S2)中视频数据处理层根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理的具体步骤为:
将从视频预处理模块中得到的帧图像作为视频数据处理层中的分布式计算框架的输入源,将每一帧图像分别传入分布式计算框架中进行处理,利用分布式计算框架的并行能力在视频数据处理层的各个GPU中根据深度学习网络模型进行视频的并行处理。
在本实施例中,分布式计算框架选用Storm框架,Storm框架为实时或接近实时地处理大数据流的分布式计算框架。将从视频预处理模块中得到的帧图像作为Storm框架的输入源,将每一帧图像分别传入Storm框架中进行处理,利用Storm框架的并行能力在视频数据处理层的各个GPU中进行视频的并行处理。
所述步骤(S2)中,由于视频处理会消耗大量的GPU资源,GPU资源调度层通过基于GPU的资源调度方法实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;解决视频处理会消耗大量的GPU资源的问题,从而避免由于计算量过大达不到实际应用场景中实时效果的问题,实现实时效果。
如图3所示,基于GPU的资源调度方法的具体步骤为:
(2-1b)实时监控分布式计算框架中各个数据处理组件的GPU使用状况,即实时监控各个任务队列;
(2-2b)判断当前视频处理任务是否GPU消耗过大,若是,进入步骤(2-3b),若否,在当前GPU执行视频处理任务;
(2-3b)根据GPU使用情况列表和GPU计算能力列表,重新选择计算能力大的GPU,将GPU消耗过大的进程分配到有较强GPU的数据处理组件上。
所述步骤(S3)中存储层将视频处理结果上传到云存储服务器的具体步骤为:
聚合视频处理后的视频处理结果,并将聚合视频处理后的视频处理结果存储到HDFS存储服务器中。
HDFS(Hadoop Distributed File System,Hadoop分布式文件系统)被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。HDFS是一个高度容错性的系统,适合部署在廉价的机器上。HDFS能提供高吞吐量的数据访问,非常适合大规模数据集上的应用。HDFS放宽了一部分POSIX约束,来实现流式读取文件系统数据的目的。HDFS在最开始是作为Apache Nutch搜索引擎项目的基础架构而开发的。HDFS是Apache Hadoop Core项目的一部分。HDFS有着高容错性(fault-tolerant)的特点,并且设计用来部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求(requirements)这样可以实现流的形式访问(streaming access)文件系统中的数据。
所述步骤(S4)中服务层将视频处理结果可视化反馈给与其连接的客户端的具体步骤为:
针对客户端不同的业务需求与数据集,通过个性化的交互性强的数据可视化组件将服务层的视频处理结果反馈给与其连接的客户端。
本发明的有益效果:
1.本发明的一种基于深度学习的分布嵌入式实时视频流处理系统,在视频数据处理层中采用嵌入式GPU分布集群,进行视频数据的GPU并行处理,有效提高了视频流的处理效率,且降低了嵌入式系统的功耗。
2.本发明的一种基于深度学习的分布嵌入式实时视频流处理系统,将深度学习算法在嵌入式GPU处理器集群上运行,提高资源利用率、算法准确率和效率。
3.本发明的一种基于深度学习的分布嵌入式实时视频流处理方法中的基于GPU的资源调度方法,将分布式计算框架中的GPU资源调度与视频处理技术结合,有效提高了视频处理的效率;且通过实时监控分布式计算框架中国各个数据处理组件的GPU使用状况,将GPU消耗过大的进程分配到有较强GPU的数据处理组件上,解决视频处理会消耗大量的GPU资源的问题,从而避免由于计算量过大达不到实际应用场景中实时效果的问题,实现实时效果。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于深度学习的分布嵌入式实时视频流处理系统,其特征是:该系统包括:
视频数据采集层,所述视频数据采集层采集视频数据并进行预处理;
视频数据处理层,所述视频数据处理层包括嵌入式GPU分布集群,根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理;
GPU资源调度层,所述GPU资源调度层实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
存储层,所述存储层包括云存储服务器,将视频处理结果上传到云存储服务器进行存储;
服务层,所述服务层与客户端连接,将视频处理结果可视化反馈给客户端。
2.如权利要求1所述的一种基于深度学习的分布嵌入式实时视频流处理系统,其特征是:所述视频数据采集层包括摄像装置和嵌入式微处理器,所述嵌入式微处理器包括视频采集模块和视频预处理模块;
所述视频数据采集层通过嵌入式微处理器的视频采集模块连接摄像装置采集视频数据,采集的视频数据传输至视频预处理模块进行视频数据的预处理,所述视频预处理模块与视频数据处理层连接,将预处理后的视频数据传输至所述视频数据处理层的嵌入式GPU分布集群进行进一步视频处理。
3.如权利要求1所述的一种基于深度学习的分布嵌入式实时视频流处理系统,其特征是:所述视频数据处理层的嵌入式GPU分布集群包括至少两个的GPU进行视频处理,所述GPU分别与所述GPU资源调度层连接。
4.如权利要求1所述的一种基于深度学习的分布嵌入式实时视频流处理系统,其特征是:所述视频数据处理层包括深度学习模块,所述深度学习模块包括数据采集模块、训练模块和测试模块;
所述数据采集模块采集不同种类的视频数据集,并根据比例分为训练数据集和测试数据集;
所述训练模块采用深度学习算法对训练数据集进行训练,生成深度学习网络模型;
所述测试模块通过测试数据集对所述深度学习网络模型进行测试,并将测试完善后的深度学习网络模型分别设置于嵌入式GPU分布集群的各个GPU中。
5.一种基于深度学习的分布嵌入式实时视频流处理方法,该方法基于如权利要求1-4任一所述的一种基于深度学习的分布嵌入式实时视频流处理系统,其特征是:该方法的具体步骤包括:
(1)视频数据采集:视频数据采集层采集视频数据并进行预处理;
(2)视频数据处理和GPU资源调度:将深度学习算法部署在GPU嵌入式分布集群上;视频数据处理层根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理;
GPU资源调度层实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
(3)视频数据存储:存储层将视频处理结果上传到云存储服务器进行存储;
(4)视频处理结果显示:服务层将视频处理结果可视化反馈给与其连接的客户端。
6.如权利要求5所述的一种基于深度学习的分布嵌入式实时视频流处理方法,其特征是:所述步骤(1)中的视频数据采集的预处理的具体步骤为:
在视频预处理模块中,将接收的视频数据进行解码,解码为帧图像传输至所述视频数据处理层的嵌入式GPU分布集群进行进一步视频处理。
7.如权利要求5所述的一种基于深度学习的分布嵌入式实时视频流处理方法,其特征是:所述步骤(2)中将深度学习算法部署在GPU嵌入式分布集群上的具体步骤为:
(2-1a)所述数据采集模块采集不同种类的视频数据集,并根据比例分为训练数据集和测试数据集;
(2-2a)所述训练模块采用深度学习算法对训练数据集进行训练,生成深度学习网络模型;
(2-3a)所述测试模块通过测试数据集对所述深度学习网络模型进行测试,并将测试完善后的深度学习网络模型分别设置于嵌入式GPU分布集群的各个GPU中。
8.如权利要求6所述的一种基于深度学习的分布嵌入式实时视频流处理方法,其特征是:所述步骤(2)中视频数据处理层根据指定的视频处理任务在嵌入式GPU分布集群上通过深度学习算法进行视频处理的具体步骤为:
将从视频预处理模块中得到的帧图像作为视频数据处理层中的分布式计算框架的输入源,将每一帧图像分别传入分布式计算框架中进行处理,利用分布式计算框架的并行能力在视频数据处理层的各个GPU中进行视频的并行处理。
9.如权利要求5所述的一种基于深度学习的分布嵌入式实时视频流处理方法,其特征是:所述步骤(2)中GPU资源调度层通过基于GPU的资源调度方法实时监控嵌入式GPU分布集群中的GPU使用情况并进行调度;
基于GPU的资源调度方法的具体步骤为:
实时监控分布式计算框架中各个数据处理组件的GPU使用状况,将GPU消耗过大的进程分配到有较强GPU的数据处理组件上。
10.如权利要求5所述的一种基于深度学习的分布嵌入式实时视频流处理方法,其特征是:所述步骤(3)中存储层将视频处理结果上传到云存储服务器的具体步骤为:
聚合视频处理后的视频处理结果,并将聚合视频处理后的视频处理结果存储到存储服务器中;
所述步骤(4)中服务层将视频处理结果可视化反馈给与其连接的客户端的具体步骤为:
针对客户端不同的业务需求与数据集,通过个性化的交互性强的数据可视化组件将服务层的视频处理结果反馈给与其连接的客户端。
CN201710278169.7A 2017-04-25 2017-04-25 基于深度学习的分布嵌入式实时视频流处理系统及方法 Pending CN107067365A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710278169.7A CN107067365A (zh) 2017-04-25 2017-04-25 基于深度学习的分布嵌入式实时视频流处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710278169.7A CN107067365A (zh) 2017-04-25 2017-04-25 基于深度学习的分布嵌入式实时视频流处理系统及方法

Publications (1)

Publication Number Publication Date
CN107067365A true CN107067365A (zh) 2017-08-18

Family

ID=59604457

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710278169.7A Pending CN107067365A (zh) 2017-04-25 2017-04-25 基于深度学习的分布嵌入式实时视频流处理系统及方法

Country Status (1)

Country Link
CN (1) CN107067365A (zh)

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108012156A (zh) * 2017-11-17 2018-05-08 深圳市华尊科技股份有限公司 一种视频处理方法及控制平台
CN108600254A (zh) * 2018-05-07 2018-09-28 龚麟 一种音视频识别系统
CN108647559A (zh) * 2018-03-21 2018-10-12 四川弘和通讯有限公司 一种基于深度学习的危险物识别方法
CN108712630A (zh) * 2018-04-19 2018-10-26 安凯(广州)微电子技术有限公司 一种基于深度学习的互联网摄像系统及其实现方法
CN108920274A (zh) * 2018-06-21 2018-11-30 北京陌上花科技有限公司 用于图像处理服务器端的性能优化及装置
CN109167979A (zh) * 2018-10-30 2019-01-08 深兰科技(上海)有限公司 多路监控视频人工智能分析的处理方法及系统
CN109361902A (zh) * 2018-11-19 2019-02-19 河海大学 一种基于边缘计算的智能安全帽佩戴监测系统
CN109598348A (zh) * 2017-09-28 2019-04-09 北京猎户星空科技有限公司 一种图像样本获取、模型训练方法及系统
CN109905423A (zh) * 2017-12-08 2019-06-18 上海仪电(集团)有限公司中央研究院 一种智能管理系统
CN109948428A (zh) * 2019-01-28 2019-06-28 上海理工大学 面向传感信息处理的gpu集群深度学习边缘计算系统
CN109976911A (zh) * 2019-03-25 2019-07-05 哈尔滨工程大学 一种自适应资源调度方法
CN110096367A (zh) * 2019-05-14 2019-08-06 宁夏融媒科技有限公司 一种基于多gpu的全景实时视频流处理方法
CN110175636A (zh) * 2019-05-08 2019-08-27 深圳欧翼思特科技有限公司 一种物联网深度神经网络分布式判别推论系统及方法
CN110708567A (zh) * 2019-04-15 2020-01-17 中国石油大学(华东) 一种基于主动学习的分布式自优化视频实时解析框架
CN110728202A (zh) * 2019-09-23 2020-01-24 国网宁夏电力有限公司电力科学研究院 一种输电导线异物检测方法、终端及系统
CN111050039A (zh) * 2019-11-18 2020-04-21 北京小米移动软件有限公司 摄像方法、摄像装置及计算机可读存储介质
CN111527501A (zh) * 2018-08-28 2020-08-11 深圳鲲云信息科技有限公司 芯片适配确定方法及相关产品
CN112200007A (zh) * 2020-09-15 2021-01-08 青岛邃智信息科技有限公司 一种社区监控场景下车牌检测及识别方法
CN112364763A (zh) * 2020-11-10 2021-02-12 南京农业大学 基于边缘计算的仔猪吃奶行为监测系统
WO2021026775A1 (zh) * 2019-08-13 2021-02-18 深圳鲲云信息科技有限公司 神经网络数据流加速方法、装置、计算机设备及存储介质
CN112702605A (zh) * 2020-12-24 2021-04-23 百果园技术(新加坡)有限公司 视频转码系统、视频转码方法、电子设备和存储介质
CN117196930A (zh) * 2023-11-06 2023-12-08 四川并济科技有限公司 基于gpu集群的高性能图像处理系统及方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541640A (zh) * 2011-12-28 2012-07-04 厦门市美亚柏科信息股份有限公司 一种集群gpu资源调度系统和方法
WO2014118378A1 (de) * 2013-02-02 2014-08-07 Novomatic Ag Eingebettetes system zur videoverarbeitung mit hardware-mitteln
CN105336017A (zh) * 2015-09-29 2016-02-17 爱培科科技开发(深圳)有限公司 一种基于Storm技术的行车记录信息处理方法及系统
CN105786757A (zh) * 2016-02-26 2016-07-20 涂旭平 一种板上集成分布式高性能运算系统装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102541640A (zh) * 2011-12-28 2012-07-04 厦门市美亚柏科信息股份有限公司 一种集群gpu资源调度系统和方法
WO2014118378A1 (de) * 2013-02-02 2014-08-07 Novomatic Ag Eingebettetes system zur videoverarbeitung mit hardware-mitteln
CN105336017A (zh) * 2015-09-29 2016-02-17 爱培科科技开发(深圳)有限公司 一种基于Storm技术的行车记录信息处理方法及系统
CN105786757A (zh) * 2016-02-26 2016-07-20 涂旭平 一种板上集成分布式高性能运算系统装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHANG W ET.AL: ""Distributed embedded deep learning based real-time video processing"", 《2016 IEEE INTERNATIONAL CONFERENCE ON SYSTEMS, MAN, AND CYBERNETICS (SMC)》 *
樊重俊,刘臣,霍良安编: "《大数据分析与应用》", 31 January 2016, 立信会计出版社 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109598348A (zh) * 2017-09-28 2019-04-09 北京猎户星空科技有限公司 一种图像样本获取、模型训练方法及系统
CN108012156A (zh) * 2017-11-17 2018-05-08 深圳市华尊科技股份有限公司 一种视频处理方法及控制平台
CN109905423A (zh) * 2017-12-08 2019-06-18 上海仪电(集团)有限公司中央研究院 一种智能管理系统
CN108647559A (zh) * 2018-03-21 2018-10-12 四川弘和通讯有限公司 一种基于深度学习的危险物识别方法
CN108712630A (zh) * 2018-04-19 2018-10-26 安凯(广州)微电子技术有限公司 一种基于深度学习的互联网摄像系统及其实现方法
CN108600254A (zh) * 2018-05-07 2018-09-28 龚麟 一种音视频识别系统
CN108920274A (zh) * 2018-06-21 2018-11-30 北京陌上花科技有限公司 用于图像处理服务器端的性能优化及装置
CN108920274B (zh) * 2018-06-21 2021-05-28 北京陌上花科技有限公司 用于图像处理服务器端的性能优化及装置
CN111527501A (zh) * 2018-08-28 2020-08-11 深圳鲲云信息科技有限公司 芯片适配确定方法及相关产品
CN109167979A (zh) * 2018-10-30 2019-01-08 深兰科技(上海)有限公司 多路监控视频人工智能分析的处理方法及系统
CN109167979B (zh) * 2018-10-30 2020-09-11 深兰科技(上海)有限公司 多路监控视频人工智能分析的处理方法及系统
CN109361902A (zh) * 2018-11-19 2019-02-19 河海大学 一种基于边缘计算的智能安全帽佩戴监测系统
CN109948428B (zh) * 2019-01-28 2022-12-09 上海理工大学 面向传感信息处理的gpu集群深度学习边缘计算系统
CN109948428A (zh) * 2019-01-28 2019-06-28 上海理工大学 面向传感信息处理的gpu集群深度学习边缘计算系统
CN109976911A (zh) * 2019-03-25 2019-07-05 哈尔滨工程大学 一种自适应资源调度方法
CN110708567A (zh) * 2019-04-15 2020-01-17 中国石油大学(华东) 一种基于主动学习的分布式自优化视频实时解析框架
CN110175636A (zh) * 2019-05-08 2019-08-27 深圳欧翼思特科技有限公司 一种物联网深度神经网络分布式判别推论系统及方法
CN110096367A (zh) * 2019-05-14 2019-08-06 宁夏融媒科技有限公司 一种基于多gpu的全景实时视频流处理方法
WO2021026775A1 (zh) * 2019-08-13 2021-02-18 深圳鲲云信息科技有限公司 神经网络数据流加速方法、装置、计算机设备及存储介质
CN110728202A (zh) * 2019-09-23 2020-01-24 国网宁夏电力有限公司电力科学研究院 一种输电导线异物检测方法、终端及系统
CN111050039A (zh) * 2019-11-18 2020-04-21 北京小米移动软件有限公司 摄像方法、摄像装置及计算机可读存储介质
CN112200007A (zh) * 2020-09-15 2021-01-08 青岛邃智信息科技有限公司 一种社区监控场景下车牌检测及识别方法
CN112364763A (zh) * 2020-11-10 2021-02-12 南京农业大学 基于边缘计算的仔猪吃奶行为监测系统
CN112364763B (zh) * 2020-11-10 2024-01-26 南京农业大学 基于边缘计算的仔猪吃奶行为监测系统
CN112702605A (zh) * 2020-12-24 2021-04-23 百果园技术(新加坡)有限公司 视频转码系统、视频转码方法、电子设备和存储介质
CN117196930A (zh) * 2023-11-06 2023-12-08 四川并济科技有限公司 基于gpu集群的高性能图像处理系统及方法
CN117196930B (zh) * 2023-11-06 2024-01-23 四川并济科技有限公司 基于gpu集群的高性能图像处理系统及方法

Similar Documents

Publication Publication Date Title
CN107067365A (zh) 基于深度学习的分布嵌入式实时视频流处理系统及方法
CN110390246A (zh) 一种边云环境中的视频分析方法
CN102200906B (zh) 大规模并发数据流处理系统及其处理方法
CN106375721A (zh) 一种基于云平台的智能视频监控系统
Kristiani et al. On construction of sensors, edge, and cloud (ISEC) framework for smart system integration and applications
CN109067859A (zh) 一种面向跨域协同服务的双层云架构系统及实现方法
CN106686352B (zh) 多gpu平台的多路视频数据的实时处理方法
CN110856018A (zh) 一种基于云计算的监控系统中的快速转码方法及系统
CN105678436B (zh) 一种基于云服务平台的物联网协同管理方法和系统
CN105955807A (zh) 一种任务处理系统及方法
CN103345431A (zh) 一种基于虚拟化技术的业务云平台系统
CN106131227A (zh) 负载平衡方法、元数据服务器系统及负载平衡系统
CN109308212A (zh) 一种任务处理方法、任务处理器及任务处理设备
Filip et al. Data capsule: Representation of heterogeneous data in cloud-edge computing
CN110096367A (zh) 一种基于多gpu的全景实时视频流处理方法
CN108958286A (zh) 多旋翼飞行器云服务器网络系统及其控制方法
CN109976873A (zh) 容器化分布式计算框架的调度方案获取方法及调度方法
Wang et al. SmartEye: An open source framework for real-time video analytics with edge-cloud collaboration
CN116996112A (zh) 一种遥感卫星数据实时预处理方法
CN107729218A (zh) 一种监控处理计算资源设备的系统及方法
Zhang et al. Efficient online surveillance video processing based on spark framework
CN111510680A (zh) 一种图像数据的处理方法、系统及存储介质
CN104767964A (zh) 视频存储控制和优化的方法及其装置、视频监控系统
CN112817732B (zh) 一种适应云边协同多数据中心场景下的流数据处理方法及系统
CN104702663B (zh) 云处理装置和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170818

RJ01 Rejection of invention patent application after publication