CN110659628A - 一种基于深度学习的煤矿监控视频解压缩方法及系统 - Google Patents

一种基于深度学习的煤矿监控视频解压缩方法及系统 Download PDF

Info

Publication number
CN110659628A
CN110659628A CN201910953370.XA CN201910953370A CN110659628A CN 110659628 A CN110659628 A CN 110659628A CN 201910953370 A CN201910953370 A CN 201910953370A CN 110659628 A CN110659628 A CN 110659628A
Authority
CN
China
Prior art keywords
frame
video
worker
image
rectangular
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910953370.XA
Other languages
English (en)
Inventor
尹青山
李锐
于治楼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Original Assignee
Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Inspur Artificial Intelligence Research Institute Co Ltd filed Critical Shandong Inspur Artificial Intelligence Research Institute Co Ltd
Priority to CN201910953370.XA priority Critical patent/CN110659628A/zh
Publication of CN110659628A publication Critical patent/CN110659628A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/103Static body considered as a whole, e.g. static pedestrian or occupant recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/167Position within a video image, e.g. region of interest [ROI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast

Abstract

本发明公开一种基于深度学习的煤矿监控视频解压缩方法及系统,涉及视频压缩技术领域,采用方案包括:将原始视频差分为图像帧,并选取一帧作为背景帧;基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中;从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中;对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将重构图像帧组合形成视频。本方法只获取关键信息,减少了冗余信息,可以提高视频的压缩率。

Description

一种基于深度学习的煤矿监控视频解压缩方法及系统
技术领域
本发明涉及视频压缩技术领域,具体的说是一种基于深度学习的煤矿监控视频解压缩方法及系统。
背景技术
煤矿井下环境复杂,危险点较多,安全生产工作进展缓慢,为了进一步提高安全生产工作的,适应新时期国家对煤矿安全生产的客观要求,众多矿井都开始布设矿用视频监控系统。由于煤矿井下存在瓦斯、煤尘等混合气体,存在着一定的爆炸风险,故而煤矿井下视频监控系统所配备的摄像仪必须通过煤安认证和防爆认证,外壳为不锈钢构造,密封性能良好,防腐防尘防水。由于煤矿井下环境的复杂性,对视频的传输提出了更高的要求,因此需要在保证视频质量的前提下,尽量的压缩视频的大小,以提高视频实时传输的效率,保证井下工人的安全。
基于深度学习的视频压缩方法对传统的H.264和H.265等传统视频压缩方法带了颠覆性的革命,使视频压缩技术得到飞速的发展,大大提高了视频的压缩效率。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种基于深度学习的煤矿监控视频解压缩方法及系统,其在保证原有视频质量的前提下能够进一步提高视频的压缩率,减少其他无关因素对视频的影响。
首先,本发明提供一种基于深度学习的煤矿监控视频解压缩方法,解决上述技术问题采用的技术方案如下:
一种基于深度学习的煤矿监控视频解压缩方法,该方法的实现过程包括:
S10、将原始视频差分为图像帧,并选取一帧作为背景帧;
S20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;
S30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;
S40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。
在步骤S10中,将原始视频差分为图像帧,并选取一帧作为背景帧,其操作具体为:
固定监控摄像头,使拍摄的背景保持不变;
获取原始视频;
将原始视频差分为图像帧;
选取一张没有运动物体的图像帧作为背景图片;
将背景图片存入链表的第一个位置。
在步骤S20中,所述目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。
在步骤S20中,将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,将工人所在的位置作为感兴趣区域,将其他运动的物体作为非感兴趣区域对其滤除。
在步骤S40中,对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,微调的方法为:
将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。
其次,本发明提供一种基于深度学习的煤矿监控视频解压缩系统,解决上述技术问题采用的技术方案如下:
一种基于深度学习的煤矿监控视频解压缩系统,该系统包括:
视频拆分模块,用于将原始视频差分为图像帧,并选取一帧作为背景帧;
行人检测模块,基于深度学习的注意力机制和目标检测算法,用于将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;
解码还原模块,用于从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;
图像帧微调模块,用于对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。
具体的,所涉及视频拆分模块包括:
监控摄像子模块,用于拍摄图像并保持固定;
获取子模块,用于获取原始视频;
拆分子模块,用于将原始视频差分为图像帧
选取子模块,用于选取一张没有运动物体的图像帧作为背景图片;
存储子模块,用于将背景图片存入链表的第一个位置。
具体的,所涉及目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。
具体的,所涉及行人检测模块将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,会将工人所在的位置作为感兴趣区域,同时,将其他运动的物体作为非感兴趣区域对其滤除。
具体的,所涉及图像帧微调模块对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调的具体方法为:
将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。
本发明的一种基于深度学习的煤矿监控视频解压缩方法及系统,与现有技术相比具有的有益效果是:
1)本发明基于深度学习的注意力机制和目标检测算法,根据煤矿井下工人安全状况监控的特点,通过只关注工人在煤矿井下的位置和行走轨迹,忽略其他运动的物体,对每一帧进行重构,减少了大量的冗余信息,提高了视频的压缩率,同时,还提高了煤矿的视频的传输速率,节省了大量的视频存储空间,减少了其他无关因素对视频的影响。
2)本发明基于注意力机制保留视频所包含图片帧中的感兴趣区域,筛除非感兴趣区域,从而只需要存储少量的图片,位置信息等数据,大大缩小了存储空间,以提高视频在传输过程中的效率。
附图说明
附图1是本发明实施例一的方法流程图;
附图2是本发明实施例二的连接框图。
附图中各标号信息表示:
1、视频拆分模块,2、行人检测模块,3、解码还原模块,4、图像帧微调模块;
5、监控摄像子模块,6、获取子模块,7、拆分子模块,
8、选取子模块,9、存储子模块。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清楚、完整的描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。
实施例一:
结合附图1,本实施例提出一种基于深度学习的煤矿监控视频解压缩方法,该方法的实现过程包括:
S10、将原始视频差分为图像帧,并选取一帧作为背景帧;
S20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;
S30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;
S40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。
在本实施例的步骤S10中,将原始视频差分为图像帧,并选取一帧作为背景帧,其操作具体为:
固定监控摄像头,使拍摄的背景保持不变;
获取原始视频;
将原始视频差分为图像帧;
选取一张没有运动物体的图像帧作为背景图片;
将背景图片存入链表的第一个位置。
在本实施例的步骤S20中,所述目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。
在本实施例的步骤S20中,将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,将工人所在的位置作为感兴趣区域,将其他运动的物体作为非感兴趣区域对其滤除。
在本实施例的步骤S40中,对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,微调的方法为:
将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。
本实施例基于深度学习的注意力机制和目标检测算法,根据煤矿井下工人安全状况监控的特点,通过只关注工人在煤矿井下的位置和行走轨迹,忽略其他运动的物体,对每一帧进行重构,减少了大量的冗余信息,提高了视频的压缩率,同时,还提高了煤矿的视频的传输速率,节省了大量的视频存储空间,减少了其他无关因素对视频的影响。
实施例二:
结合附图2,本实施例提出一种基于深度学习的煤矿监控视频解压缩系统,该系统包括:
视频拆分模块1,用于将原始视频差分为图像帧,并选取一帧作为背景帧;
行人检测模块2,基于深度学习的注意力机制和目标检测算法,用于将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;
解码还原模块3,用于从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;
图像帧微调模块4,用于对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。
在本实施例中,所涉及视频拆分模块1包括:
监控摄像子模块,用于拍摄图像并保持固定;
获取子模块,用于获取原始视频;
拆分子模块,用于将原始视频差分为图像帧
选取子模块,用于选取一张没有运动物体的图像帧作为背景图片;
存储子模块,用于将背景图片存入链表的第一个位置。
具体的,所涉及目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。
在本实施例中,所涉及行人检测模块2将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,会将工人所在的位置作为感兴趣区域,同时,将其他运动的物体作为非感兴趣区域对其滤除。
在本实施例中,所涉及图像帧微调模块4对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调的具体方法为:
将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。
本实施例基于视频拆分模块1将原始视频差分为图像帧,基于行人检测模块2将每一帧图像中的工人检测出来,并将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩,基于解码还原模块3从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原,基于图像帧微调模块4对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频,实现视频的高效压缩和传输,并节省大量的视频存储空间,减少其他无关因素对视频的影响。
综上可知,采用本发明的一种基于深度学习的煤矿监控视频解压缩方法及系统,基于深度学习的注意力机制和目标检测算法,只关注工人在煤矿井下的位置和行走轨迹,减少大量的冗余信息,提高视频的压缩率及传输速率。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。

Claims (10)

1.一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,该方法的实现过程包括:
S10、将原始视频差分为图像帧,并选取一帧作为背景帧;
S20、基于深度学习的注意力机制和目标检测算法将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;
S30、从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;
S40、对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。
2.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S10中,将原始视频差分为图像帧,并选取一帧作为背景帧,其操作具体为:
固定监控摄像头,使拍摄的背景保持不变;
获取原始视频;
将原始视频差分为图像帧;
选取一张没有运动物体的图像帧作为背景图片;
将背景图片存入链表的第一个位置。
3.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S20中,所述目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。
4.根据权利要求3所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S20中,将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,将工人所在的位置作为感兴趣区域,将其他运动的物体作为非感兴趣区域对其滤除。
5.根据权利要求1所述的一种基于深度学习的煤矿监控视频解压缩方法,其特征在于,在步骤S40中,对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,微调的方法为:
将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。
6.一种基于深度学习的煤矿监控视频解压缩系统,其特征在于,该系统包括:
视频拆分模块,用于将原始视频差分为图像帧,并选取一帧作为背景帧;
行人检测模块,基于深度学习的注意力机制和目标检测算法,用于将每一帧图像中的工人检测出来,并将工人所在的位置行成矩形框裁剪出来,保存为图片,随后,将裁剪的工人矩形框图片、定位信息、所处理的帧信息这三项作为一组保存到链表中,完成所有帧图像的压缩;
解码还原模块,用于从链表中依次取出工人的裁剪矩形框、位置和图像帧的编号作为一组,把每一组覆盖到背景帧中,完成所有帧图像的解码还原;
图像帧微调模块,用于对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调,以将解码还原的所有帧图像帧组合形成视频。
7.根据权利要求6所述的一种基于深度学习的煤矿监控视频解压缩系统,其特征在于,所述视频拆分模块包括:
监控摄像子模块,用于拍摄图像并保持固定;
获取子模块,用于获取原始视频;
拆分子模块,用于将原始视频差分为图像帧
选取子模块,用于选取一张没有运动物体的图像帧作为背景图片;
存储子模块,用于将背景图片存入链表的第一个位置。
8.根据权利要求6所述的一种基于深度学习的煤矿监控视频解压缩系统,其特征在于,所述目标检测算法为基于区域的卷积神经网络,包括Fast-RCNN,SSD,YOLO,目标检测算法用于检测出物体的种类,定位物体的位置。
9.根据权利要求8所述的一种基于深度学习的煤矿监控视频解压缩系统,其特征在于,所述行人检测模块将工人所在的位置行成矩形框裁剪出来保存为图片的过程中,会将工人所在的位置作为感兴趣区域,同时,将其他运动的物体作为非感兴趣区域对其滤除。
10.根据权利要求6所述的一种基于深度学习的煤矿监控视频解压缩系统,其特征在于,所述图像帧微调模块对工人的矩形框图片和工人的矩形框在背景图片的位置之间存在的色彩进行微调的具体方法为:
将矩形框图像的边缘和背景图像RGB颜色信息数值求均值,使两张图像之间的色彩平滑过渡,以便于将解码还原的所有帧图像帧组合形成视频。
CN201910953370.XA 2019-10-09 2019-10-09 一种基于深度学习的煤矿监控视频解压缩方法及系统 Pending CN110659628A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910953370.XA CN110659628A (zh) 2019-10-09 2019-10-09 一种基于深度学习的煤矿监控视频解压缩方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910953370.XA CN110659628A (zh) 2019-10-09 2019-10-09 一种基于深度学习的煤矿监控视频解压缩方法及系统

Publications (1)

Publication Number Publication Date
CN110659628A true CN110659628A (zh) 2020-01-07

Family

ID=69038684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910953370.XA Pending CN110659628A (zh) 2019-10-09 2019-10-09 一种基于深度学习的煤矿监控视频解压缩方法及系统

Country Status (1)

Country Link
CN (1) CN110659628A (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111464790A (zh) * 2020-04-21 2020-07-28 济南浪潮高新科技投资发展有限公司 一种基于深度学习的工业环境监控视频处理方法及系统
CN111565318A (zh) * 2020-05-06 2020-08-21 中国科学院重庆绿色智能技术研究院 一种基于稀疏样本的视频压缩方法
CN111953940A (zh) * 2020-08-06 2020-11-17 中标慧安信息技术股份有限公司 一种监控视频的上传处理方法及系统
CN112348967A (zh) * 2020-10-29 2021-02-09 国网浙江省电力有限公司 一种电力设备三维模型与实时视频无缝融合的方法
US11403069B2 (en) 2017-07-24 2022-08-02 Tesla, Inc. Accelerated mathematical engine
US11409692B2 (en) 2017-07-24 2022-08-09 Tesla, Inc. Vector computational unit
CN115147501A (zh) * 2022-09-05 2022-10-04 深圳市明源云科技有限公司 图片解压方法、装置、终端设备以及存储介质
US11487288B2 (en) 2017-03-23 2022-11-01 Tesla, Inc. Data synthesis for autonomous control systems
US11537811B2 (en) 2018-12-04 2022-12-27 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11562231B2 (en) 2018-09-03 2023-01-24 Tesla, Inc. Neural networks for embedded devices
US11561791B2 (en) 2018-02-01 2023-01-24 Tesla, Inc. Vector computational unit receiving data elements in parallel from a last row of a computational array
US11567514B2 (en) 2019-02-11 2023-01-31 Tesla, Inc. Autonomous and user controlled vehicle summon to a target
US11610117B2 (en) 2018-12-27 2023-03-21 Tesla, Inc. System and method for adapting a neural network model on a hardware platform
US11636333B2 (en) 2018-07-26 2023-04-25 Tesla, Inc. Optimizing neural network structures for embedded systems
US11665108B2 (en) 2018-10-25 2023-05-30 Tesla, Inc. QoS manager for system on a chip communications
US11681649B2 (en) 2017-07-24 2023-06-20 Tesla, Inc. Computational array microprocessor system using non-consecutive data formatting
US11734562B2 (en) 2018-06-20 2023-08-22 Tesla, Inc. Data pipeline and deep learning system for autonomous driving
US11748620B2 (en) 2019-02-01 2023-09-05 Tesla, Inc. Generating ground truth for machine learning from time series elements
US11790664B2 (en) 2019-02-19 2023-10-17 Tesla, Inc. Estimating object properties using visual image data
US11816585B2 (en) 2018-12-03 2023-11-14 Tesla, Inc. Machine learning models operating at different frequencies for autonomous vehicles
US11841434B2 (en) 2018-07-20 2023-12-12 Tesla, Inc. Annotation cross-labeling for autonomous control systems
US11893393B2 (en) 2017-07-24 2024-02-06 Tesla, Inc. Computational array microprocessor system with hardware arbiter managing memory requests
US11893774B2 (en) 2018-10-11 2024-02-06 Tesla, Inc. Systems and methods for training machine models with augmented data
US11983630B2 (en) 2023-01-19 2024-05-14 Tesla, Inc. Neural networks for embedded devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080310742A1 (en) * 2007-06-15 2008-12-18 Physical Optics Corporation Apparatus and method employing pre-ATR-based real-time compression and video frame segmentation
US20160275354A1 (en) * 2015-03-17 2016-09-22 Samsung Eletrônica da Amazônia Ltda. System and method for video context-based composition and compression from normalized spatial resolution objects
CN108389217A (zh) * 2018-01-31 2018-08-10 华东理工大学 一种基于梯度域混合的视频合成方法
CN109951710A (zh) * 2019-03-26 2019-06-28 中国民航大学 基于深度学习的机坪监控视频压缩方法及系统
US20190244371A1 (en) * 2018-02-04 2019-08-08 Applied Research, LLC Target Detection, Tracking, and Classification in Compressive Measurement Domain

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080310742A1 (en) * 2007-06-15 2008-12-18 Physical Optics Corporation Apparatus and method employing pre-ATR-based real-time compression and video frame segmentation
US20160275354A1 (en) * 2015-03-17 2016-09-22 Samsung Eletrônica da Amazônia Ltda. System and method for video context-based composition and compression from normalized spatial resolution objects
CN108389217A (zh) * 2018-01-31 2018-08-10 华东理工大学 一种基于梯度域混合的视频合成方法
US20190244371A1 (en) * 2018-02-04 2019-08-08 Applied Research, LLC Target Detection, Tracking, and Classification in Compressive Measurement Domain
CN109951710A (zh) * 2019-03-26 2019-06-28 中国民航大学 基于深度学习的机坪监控视频压缩方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
郭源生等: "智慧医疗与健康养老", 《中国科学技术出版社》 *

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11487288B2 (en) 2017-03-23 2022-11-01 Tesla, Inc. Data synthesis for autonomous control systems
US11409692B2 (en) 2017-07-24 2022-08-09 Tesla, Inc. Vector computational unit
US11681649B2 (en) 2017-07-24 2023-06-20 Tesla, Inc. Computational array microprocessor system using non-consecutive data formatting
US11893393B2 (en) 2017-07-24 2024-02-06 Tesla, Inc. Computational array microprocessor system with hardware arbiter managing memory requests
US11403069B2 (en) 2017-07-24 2022-08-02 Tesla, Inc. Accelerated mathematical engine
US11797304B2 (en) 2018-02-01 2023-10-24 Tesla, Inc. Instruction set architecture for a vector computational unit
US11561791B2 (en) 2018-02-01 2023-01-24 Tesla, Inc. Vector computational unit receiving data elements in parallel from a last row of a computational array
US11734562B2 (en) 2018-06-20 2023-08-22 Tesla, Inc. Data pipeline and deep learning system for autonomous driving
US11841434B2 (en) 2018-07-20 2023-12-12 Tesla, Inc. Annotation cross-labeling for autonomous control systems
US11636333B2 (en) 2018-07-26 2023-04-25 Tesla, Inc. Optimizing neural network structures for embedded systems
US11562231B2 (en) 2018-09-03 2023-01-24 Tesla, Inc. Neural networks for embedded devices
US11893774B2 (en) 2018-10-11 2024-02-06 Tesla, Inc. Systems and methods for training machine models with augmented data
US11665108B2 (en) 2018-10-25 2023-05-30 Tesla, Inc. QoS manager for system on a chip communications
US11816585B2 (en) 2018-12-03 2023-11-14 Tesla, Inc. Machine learning models operating at different frequencies for autonomous vehicles
US11537811B2 (en) 2018-12-04 2022-12-27 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11908171B2 (en) 2018-12-04 2024-02-20 Tesla, Inc. Enhanced object detection for autonomous vehicles based on field view
US11610117B2 (en) 2018-12-27 2023-03-21 Tesla, Inc. System and method for adapting a neural network model on a hardware platform
US11748620B2 (en) 2019-02-01 2023-09-05 Tesla, Inc. Generating ground truth for machine learning from time series elements
US11567514B2 (en) 2019-02-11 2023-01-31 Tesla, Inc. Autonomous and user controlled vehicle summon to a target
US11790664B2 (en) 2019-02-19 2023-10-17 Tesla, Inc. Estimating object properties using visual image data
CN111464790A (zh) * 2020-04-21 2020-07-28 济南浪潮高新科技投资发展有限公司 一种基于深度学习的工业环境监控视频处理方法及系统
CN111565318A (zh) * 2020-05-06 2020-08-21 中国科学院重庆绿色智能技术研究院 一种基于稀疏样本的视频压缩方法
CN111953940A (zh) * 2020-08-06 2020-11-17 中标慧安信息技术股份有限公司 一种监控视频的上传处理方法及系统
CN112348967A (zh) * 2020-10-29 2021-02-09 国网浙江省电力有限公司 一种电力设备三维模型与实时视频无缝融合的方法
CN115147501B (zh) * 2022-09-05 2022-12-02 深圳市明源云科技有限公司 图片解压方法、装置、终端设备以及存储介质
CN115147501A (zh) * 2022-09-05 2022-10-04 深圳市明源云科技有限公司 图片解压方法、装置、终端设备以及存储介质
US11983630B2 (en) 2023-01-19 2024-05-14 Tesla, Inc. Neural networks for embedded devices

Similar Documents

Publication Publication Date Title
CN110659628A (zh) 一种基于深度学习的煤矿监控视频解压缩方法及系统
US20210034044A1 (en) Method for quality controling of target object and edge computing device
US11115680B2 (en) Apparatuses and methods for encoding and decoding a panoramic video signal
JP4854582B2 (ja) 画像処理装置、画像処理方法
CN102348115A (zh) 一种去除视频中冗余图像的方法和装置
CN111047532B (zh) 一种基于3d卷积神经网络的低照度视频增强方法
TW200604847A (en) Method for video image processing
CN110717070A (zh) 一种用于室内监控场景的视频压缩方法及系统
CN110674787A (zh) 一种基于Hog特征和lgb分类器的视频解压缩方法及系统
CN111464790A (zh) 一种基于深度学习的工业环境监控视频处理方法及系统
CN111355928A (zh) 一种基于多摄像头内容分析的视频拼接方法及其系统
JP2019097157A (ja) 補助フレームをサポートするビデオコーディングフォーマットでビデオストリームを符号化するための方法およびエンコーダ
CN105701515A (zh) 一种基于双层流形约束的人脸超分辨率处理方法及系统
CN105701770A (zh) 一种基于上下文线性模型的人脸超分辨率处理方法及系统
US9131127B2 (en) Method and apparatus for reconstructing motion compensated video frames
CN112995558A (zh) 一种视频文件的存储方法、装置及存储介质
CN103475877A (zh) 视频传输方法和系统
CN110913118B (zh) 视频处理方法、装置及存储介质
US9769473B2 (en) Predictive video coder with low power reference picture transformation
CN103888735A (zh) 一种多路视频监控图像数据处理方法及系统
US20210233280A1 (en) Encoding device control method and device, and storage medium
CN113055613A (zh) 一种基于矿山场景下的全景视频拼接的方法及装置
JP2017207818A (ja) 画像処理装置、画像処理方法、プログラム
CN113645448A (zh) 一种适用于指挥调度的视频解码方法和装置
CN105554375A (zh) 一种硬盘录像机中视频预览的方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200107

RJ01 Rejection of invention patent application after publication