CN110428373B - 一种用于视频插帧的训练样本处理方法和系统 - Google Patents

一种用于视频插帧的训练样本处理方法和系统 Download PDF

Info

Publication number
CN110428373B
CN110428373B CN201910631720.0A CN201910631720A CN110428373B CN 110428373 B CN110428373 B CN 110428373B CN 201910631720 A CN201910631720 A CN 201910631720A CN 110428373 B CN110428373 B CN 110428373B
Authority
CN
China
Prior art keywords
frames
samples
triple
training
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910631720.0A
Other languages
English (en)
Other versions
CN110428373A (zh
Inventor
邱明丰
李�杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Youlexue Technology Co ltd
Original Assignee
Shenzhen Youlexue Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Youlexue Technology Co ltd filed Critical Shenzhen Youlexue Technology Co ltd
Priority to CN201910631720.0A priority Critical patent/CN110428373B/zh
Publication of CN110428373A publication Critical patent/CN110428373A/zh
Application granted granted Critical
Publication of CN110428373B publication Critical patent/CN110428373B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Television Systems (AREA)

Abstract

本发明公开了一种用于视频插帧的训练样本处理方法和系统,包括将视频解析为帧序列,从解析后的视频中选择多个训练样本,每个训练样本均包含多帧连续的帧序列;计算训练样本相邻帧的SSIM值和PSNR值,去除训练样本中基本静止、运动幅度小的帧序列;计算三元组样本中f1帧和f3帧的光流幅值,排除运动幅度过小或过大的样本,存储剩余的三元组样本作为视频插帧的训练样本;对三元组样本的三帧做随机处理;对三元组样本的三帧做翻转处理,改变f1帧和f3帧的时序顺序。本发明通过SSIM PSNR等度量手段,先排除运动幅度值很小的样本;通过检测的手段加光流的度量,使得选取的样本运动幅度即不会过大,也不会过小,使得训练网络更容易收敛,效果也更好。

Description

一种用于视频插帧的训练样本处理方法和系统
技术领域
本发明涉及视频处理领域,特别是指一种用于视频插帧的训练样本处理方法和系统。
背景技术
随着深度学习的发展,视频平滑(video frame interpolation)任务引入了很多深度学习的方式,比如seperable conv、nvidia的super slomo、memc-net、DAIN、cylicframe generation等。深度学习解决视频插帧任务依赖于两方面,训练样本的质量和训练网络的表达能力。训练样本质量的高低,直接影响训练网络的训练效果,选取好的训练样本集对于训练网络的学习至关重要。
发明内容
本发明提出一种用于视频插帧的训练样本处理方法和系统,为视频插帧任务的深度学习选取和处理训练样本,有效的提升训练网络的表现和收敛速度。
本发明的技术方案是这样实现的:
一种用于视频插帧的训练样本处理方法,包括:
S1,将视频解析为帧序列,从解析后的视频中选择多个训练样本,每个训练样本均包含多帧连续的帧序列;
S2,计算训练样本相邻帧的SSIM值和PSNR值,若连续三帧的SSIM值和PSNR值均满足一定阈值条件,将该连续三帧记为一个三元组样本,直至将所有训练样本计算完毕,去除训练样本中基本静止、运动幅度小的帧序列;
S3,计算三元组样本中f1帧和f3帧的光流幅值,若光流幅值在0-10范围内的占比超过一定比例或光流幅值大于30范围内的占比超过一定比例,则排除对应的三元组样本,直至所有的三元组样本计算完毕,存储剩余的三元组样本,作为视频插帧的训练样本;
S4,对三元组样本的三帧做随机处理;
S5,对三元组样本的三帧做翻转处理,改变f1帧和f3帧的时序顺序。
作为本发明的优选实施例,所述S4,对三元组样本的三帧做随机处理具体包括:
S401,先对三元组样本做随机crop处理,然后对f1帧和f3帧做随机的shift处理,否则执行下一步;
S402,先对三元组样本的原始帧做随机角度的旋转,然后在翻转后的图中心做随机crop处理,否则执行下一步;
S403,对三元组样本的三帧做随机亮度、对比度、hsv值的扰动,三帧的扰动方式一致。
作为本发明的优选实施例,在步骤S403中,在三元组样本的三帧中随机增加一定噪声。
作为本发明的优选实施例,所述S1,每个训练样本均包含三帧以上连续的帧序列。
作为本发明的优选实施例,所述S3,计算三元组样本中f1帧和f3帧的光流幅值,具体包括:
通过一个检测网络,找出聚焦于人体的矩形框,计算矩形框中光流值幅值的直方图,若无人体,则计算f1帧和f3帧整帧的光流值幅值的直方图,光流有x和y两个方向的特征值,光流的幅值=sqrt(fx^2+fy^2),fx为光流在x方向的特征值,fy为光流在y方向的特征值。
作为本发明的优选实施例,所述S3,计算三元组样本中f1帧和f3帧的光流幅值,采用tvl1、tvnet、pwc-net算法计算。
一种用于视频插帧的训练样本处理系统,包括
视频解析单元,用于将视频解析为帧序列,从解析后的视频中选择多个训练样本,每个训练样本均包含多帧连续的帧序列;
第一训练样本选择单元,用于计算训练样本相邻帧的SSIM值和PSNR值,若连续三帧的SSIM值和PSNR值均满足一定阈值条件,将该连续三帧记为一个三元组样本,直至将所有训练样本计算完毕,去除训练样本中基本静止、运动幅度小的帧序列;
第二训练样本选择单元,计算三元组样本中f1帧和f3帧的光流幅值,若光流幅值在0-10范围内的占比超过一定比例或光流幅值大于30范围内的占比超过一定比例,则排除对应的三元组样本,直至所有的三元组样本计算完毕,存储剩余的三元组样本,作为视频插帧的训练样本;
随机处理单元,用于对三元组样本的三帧做随机处理;
翻转处理单元,对三元组样本的三帧做翻转处理,改变f1帧和f3帧的时序顺序。
作为本发明的优选实施例,所述随机处理单元,用于对三元组样本的三帧做随机处理,具体包括三种随机处理方式:
先对三元组样本做随机crop处理,然后对f1帧和f3帧做随机的shift处理;
先对三元组样本的原始帧做随机角度的旋转,然后在翻转后的图中心做随机crop处理;
对三元组样本的三帧做随机亮度、对比度、hsv值的扰动,三帧的扰动方式一致。
作为本发明的优选实施例,所述视频解析单元,第一训练样本选择单元,第二训练样本选择单元为离线处理,所述视频解析单元输出训练样本至第一训练样本选择单元,所述第一训练样本选择单元去除训练样本中基本静止、运动幅度小的帧序列,然后输出三元组样本至第二训练样本选择单元,所述第二训练样本选择单元对三元组样本进行筛选,输出样本存储至本地硬盘;
所述随机处理单元,翻转处理单元为在线处理,所述随机处理单元将随机处理后的三元组样本输出至翻转处理单元,所述翻转处理单元将翻转处理和时序处理后的三元组样本输入训练网络。
本发明的有益效果在于:
1、通过SSIM PSNR等度量手段,先排除运动幅度值很小的样本;
2、通过检测的手段加光流的度量,使得选取的样本运动幅度即不会过大,也不会过小,使得训练网络更容易收敛,效果也更好。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种用于视频插帧的训练样本处理方法一个实施例的流程图;
图2为本发明一种用于视频插帧的训练样本处理方法一个实施例步骤S4的流程图;
图3本发明一种用于视频插帧的训练样本处理系统一个实施例的原理框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明提出了一种用于视频插帧的训练样本处理方法,包括:
S1,将视频解析为帧序列,从解析后的视频中选择多个训练样本,每个训练样本均包含多帧连续的帧序列;具体的,视频插帧任务一般需要连续的三帧作为一个训练样本,因此每个训练样本均包含三帧以上连续的帧序列。比如视频解析为1000帧,每个训练样本包含12个连续的帧序列。
S2,计算训练样本相邻帧的SSIM值和PSNR值,若连续三帧的SSIM值和PSNR值均满足一定阈值条件,将该连续三帧记为一个三元组样本,直至将所有训练样本计算完毕,去除训练样本中基本静止、运动幅度小的帧序列;阈值基于实际数据统计得出,比如SSIM<98,PSNR<31。
S3,计算三元组样本中f1帧和f3帧的光流幅值,若光流幅值在0-10范围内的占比超过一定比例(比如90%)或光流幅值大于30范围内的占比超过一定比例(比如50%),则排除对应的三元组样本,直至所有的三元组样本计算完毕,存储剩余的三元组样本,作为视频插帧的训练样本;具体占比的比例可由实验获得以及由用户自定义获得。
S3中计算三元组样本中f1帧和f3帧的光流幅值,采用tvl1、tvnet、pwc-net算法计算。计算三元组样本中f1帧和f3帧的光流幅值,具体包括:
通过一个检测网络,检测网络是常规的检测网络,比如yolo、ssd、faster-rcnn等均可,找出f1帧和f3帧聚焦于人体的矩形框,计算矩形框中光流值幅值的直方图,若无人体,则计算f1帧和f3帧整帧的光流值幅值的直方图,光流有x和y两个方向的特征值,光流的幅值=sqrt(fx^2+fy^2),fx为光流在x方向的特征值,fy为光流在y方向的特征值。
上述步骤为离线处理部分,结果可作为样本集存储在硬盘上。下述步骤为在线处理,即在训练的时候进行。
S4,对三元组样本的三帧做随机处理;
如图2所示,对三元组样本的三帧做随机处理具体包括:
S401,先对三元组样本做随机crop处理,比如256*256的样本随机选取224*224的样本,此时f1帧、f2帧、f3帧的选取规则一致,crop后的帧仍记作f1帧、f2帧、f3帧。然后对f1帧和f3帧做随机的shift处理,比如f1帧向左shift 3个像素,f3帧向右shift 3个像素,否则执行下一步;若进行了shift操作,后续步骤S403不进行。
S402,先对三元组样本的原始帧做随机角度的旋转,(比如小于5度),然后在翻转后的图中心做随机crop处理,执行下一步;做此操作不进行shift操作。
S403,对三元组样本的三帧做随机亮度、对比度、hsv值的扰动,三帧的扰动方式一致。在三元组样本的三帧中随机增加一定噪声。
S5,对三元组样本的三帧做翻转处理(比如左右、上下的翻转),改变f1帧和f3帧的时序顺序,送入训练网络。
如图3所示,本发明提出了一种用于视频插帧的训练样本处理系统,包括
视频解析单元,用于将视频解析为帧序列,从解析后的视频中选择多个训练样本,每个训练样本均包含多帧连续的帧序列;
第一训练样本选择单元,用于计算训练样本相邻帧的SSIM值和PSNR值,若连续三帧的SSIM值和PSNR值均满足一定阈值条件,将该连续三帧记为一个三元组样本,直至将所有训练样本计算完毕,去除训练样本中基本静止、运动幅度小的帧序列;
第二训练样本选择单元,计算三元组样本中f1帧和f3帧的光流幅值,若光流幅值在0-10范围内的占比超过一定比例或光流幅值大于30范围内的占比超过一定比例,则排除对应的三元组样本,直至所有的三元组样本计算完毕,存储剩余的三元组样本,作为视频插帧的训练样本;
随机处理单元,用于对三元组样本的三帧做随机处理;
翻转处理单元,对三元组样本的三帧做翻转处理,改变f1帧和f3帧的时序顺序。
作为本发明的优选实施例,随机处理单元,用于对三元组样本的三帧做随机处理,具体包括三种随机处理方式:
先对三元组样本做随机crop处理,然后对f1帧和f3帧做随机的shift处理;
先对三元组样本的原始帧做随机角度的旋转,然后在翻转后的图中心做随机crop处理;
对三元组样本的三帧做随机亮度、对比度、hsv值的扰动,三帧的扰动方式一致。
视频解析单元,第一训练样本选择单元,第二训练样本选择单元为离线处理,视频解析单元输出训练样本至第一训练样本选择单元,第一训练样本选择单元去除训练样本中基本静止、运动幅度小的帧序列,然后输出三元组样本至第二训练样本选择单元,第二训练样本选择单元对三元组样本进行筛选,输出样本存储至本地硬盘;
随机处理单元,翻转处理单元为在线处理,随机处理单元将随机处理后的三元组样本输出至翻转处理单元,翻转处理单元将翻转处理和时序处理后的三元组样本输入训练网络。
本发明的有益效果在于:
1、通过SSIM PSNR等度量手段,先排除运动幅度值很小的样本;
2、通过检测的手段加光流的度量,使得选取的样本运动幅度即不会过大,也不会过小,使得训练网络更容易收敛,效果也更好。
3、通过数据增强的手段,使得网络对光照、摄像头的抖动、噪声的鲁棒性更好。
以上仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种用于视频插帧的训练样本处理方法,其特征在于:包括
S1,将视频解析为帧序列,从解析后的视频中选择多个训练样本,每个训练样本均包含多帧连续的帧序列;
S2,计算训练样本相邻帧的SSIM值和PSNR值,若连续三帧的SSIM值和PSNR值均满足一定阈值条件,将该连续三帧记为一个三元组样本,直至将所有训练样本计算完毕,去除训练样本中基本静止、运动幅度小的帧序列;
S3,计算三元组样本中f1帧和f3帧的光流幅值,若光流幅值在0-10范围内的占比超过一定比例或光流幅值大于30范围内的占比超过一定比例,则排除对应的三元组样本,直至所有的三元组样本计算完毕,存储剩余的三元组样本,作为视频插帧的训练样本;
S4,对三元组样本的三帧做随机处理;
S5,对三元组样本的三帧做翻转处理,改变f1帧和f3帧的时序顺序。
2.根据权利要求1所述的用于视频插帧的训练样本处理方法,其特征在于:所述S4,对三元组样本的三帧做随机处理具体包括:
S401,先对三元组样本做随机crop处理,然后对f1帧和f3帧做随机的shift处理,若不进行shift处理则执行下一步,若进行了shift处理,后续步骤S403不进行;
S402,先对三元组样本的原始帧做随机角度的旋转,然后在翻转后的图中心做随机crop处理,执行下一步;
S403,对三元组样本的三帧做随机亮度、对比度、hsv值的扰动,三帧的扰动方式一致。
3.根据权利要求2所述的用于视频插帧的训练样本处理方法,其特征在于:在步骤S403中,在三元组样本的三帧中随机增加一定噪声。
4.根据权利要求2所述的用于视频插帧的训练样本处理方法,其特征在于:所述S1,每个训练样本均包含三帧以上连续的帧序列。
5.根据权利要求2所述的用于视频插帧的训练样本处理方法,其特征在于:所述S3,计算三元组样本中f1帧和f3帧的光流幅值,具体包括:
通过一个检测网络,找出聚焦于人体的矩形框,计算矩形框中光流值幅值的直方图,若无人体,则计算f1帧和f3帧整帧的光流值幅值的直方图,光流有x和y两个方向的特征值,光流的幅值=sqrt(fx^2+fy^2),fx为光流在x方向的特征值,fy为光流在y方向的特征值。
6.根据权利要求2所述的用于视频插帧的训练样本处理方法,其特征在于:所述S3,计算三元组样本中f1帧和f3帧的光流幅值,采用tvl1、tvnet、pwc-net算法计算。
7.一种用于视频插帧的训练样本处理系统,其特征在于,包括
视频解析单元,用于将视频解析为帧序列,从解析后的视频中选择多个训练样本,每个训练样本均包含多帧连续的帧序列;
第一训练样本选择单元,用于计算训练样本相邻帧的SSIM值和PSNR值,若连续三帧的SSIM值和PSNR值均满足一定阈值条件,将该连续三帧记为一个三元组样本,直至将所有训练样本计算完毕,去除训练样本中基本静止、运动幅度小的帧序列;
第二训练样本选择单元,计算三元组样本中f1帧和f3帧的光流幅值,若光流幅值在0-10范围内的占比超过一定比例或光流幅值大于30范围内的占比超过一定比例,则排除对应的三元组样本,直至所有的三元组样本计算完毕,存储剩余的三元组样本,作为视频插帧的训练样本;
随机处理单元,用于对三元组样本的三帧做随机处理;
翻转处理单元,对三元组样本的三帧做翻转处理,改变f1帧和f3帧的时序顺序。
8.根据权利要求7所述的用于视频插帧的训练样本处理系统,其特征在于,所述随机处理单元,用于对三元组样本的三帧做随机处理,具体包括三种随机处理方式:
先对三元组样本做随机crop处理,然后对f1帧和f3帧做随机的shift处理;
先对三元组样本的原始帧做随机角度的旋转,然后在翻转后的图中心做随机crop处理;
对三元组样本的三帧做随机亮度、对比度、hsv值的扰动,三帧的扰动方式一致。
9.根据权利要求8所述的用于视频插帧的训练样本处理系统,其特征在于,所述视频解析单元,第一训练样本选择单元,第二训练样本选择单元为离线处理,所述视频解析单元输出训练样本至第一训练样本选择单元,所述第一训练样本选择单元去除训练样本中基本静止、运动幅度小的帧序列,然后输出三元组样本至第二训练样本选择单元,所述第二训练样本选择单元对三元组样本进行筛选,输出样本存储至本地硬盘;
所述随机处理单元,翻转处理单元为在线处理,所述随机处理单元将随机处理后的三元组样本输出至翻转处理单元,所述翻转处理单元将翻转处理和时序处理后的三元组样本输入训练网络。
CN201910631720.0A 2019-07-12 2019-07-12 一种用于视频插帧的训练样本处理方法和系统 Active CN110428373B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910631720.0A CN110428373B (zh) 2019-07-12 2019-07-12 一种用于视频插帧的训练样本处理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910631720.0A CN110428373B (zh) 2019-07-12 2019-07-12 一种用于视频插帧的训练样本处理方法和系统

Publications (2)

Publication Number Publication Date
CN110428373A CN110428373A (zh) 2019-11-08
CN110428373B true CN110428373B (zh) 2021-11-23

Family

ID=68409344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910631720.0A Active CN110428373B (zh) 2019-07-12 2019-07-12 一种用于视频插帧的训练样本处理方法和系统

Country Status (1)

Country Link
CN (1) CN110428373B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949431B (zh) * 2021-02-08 2024-06-25 证通股份有限公司 视频篡改检测方法和系统、存储介质
CN113935537A (zh) * 2021-10-22 2022-01-14 北京华云星地通科技有限公司 一种基于深度学习的云图内插预测方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901334A (zh) * 2009-05-31 2010-12-01 汉王科技股份有限公司 静态目标检测方法
CN105517671A (zh) * 2015-05-25 2016-04-20 北京大学深圳研究生院 一种基于光流法的视频插帧方法及系统
CN106022229A (zh) * 2016-05-11 2016-10-12 北京航空航天大学 基于视频运动信息特征提取与自适应增强算法的误差反向传播网络的异常行为识别方法
CN107346332A (zh) * 2017-06-23 2017-11-14 维沃移动通信有限公司 一种图像处理方法以及移动终端
CN109151474A (zh) * 2018-08-23 2019-01-04 复旦大学 一种生成新视频帧的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150221335A1 (en) * 2014-02-05 2015-08-06 Here Global B.V. Retiming in a Video Sequence

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101901334A (zh) * 2009-05-31 2010-12-01 汉王科技股份有限公司 静态目标检测方法
CN105517671A (zh) * 2015-05-25 2016-04-20 北京大学深圳研究生院 一种基于光流法的视频插帧方法及系统
CN106022229A (zh) * 2016-05-11 2016-10-12 北京航空航天大学 基于视频运动信息特征提取与自适应增强算法的误差反向传播网络的异常行为识别方法
CN107346332A (zh) * 2017-06-23 2017-11-14 维沃移动通信有限公司 一种图像处理方法以及移动终端
CN109151474A (zh) * 2018-08-23 2019-01-04 复旦大学 一种生成新视频帧的方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
DEEP MULTI-SCALE VIDEO PREDICTION BEYOND MEAN SQUARE ERROR;Michael Mathieu 等;《arXiv》;20160115;1-14 *
基于MSSIM商一致性的视频插帧和删帧篡改检测;张珍珍 等;《北京邮电大学学报》;20150815;第38卷(第4期);84-88 *
基于视频对象的自适应去帧/插帧视频处理;肖永豪 等;《华南理工大学学报(自然科学版)》;20030828;第31卷(第8期);6-9 *
基于视频监控的群体异常行为检测研究;宋丹妮;《中国优秀硕士学位论文全文数据库 信息科技辑》;20170415(第4期);I136-184 *
细微运动的视觉增强及硬件加速技术研究;张克宁;《中国优秀硕士学位论文全文数据库 信息科技辑》;20180115(第1期);I138-1351 *

Also Published As

Publication number Publication date
CN110428373A (zh) 2019-11-08

Similar Documents

Publication Publication Date Title
CN108229526B (zh) 网络训练、图像处理方法、装置、存储介质和电子设备
CN109272509B (zh) 一种连续图像的目标检测方法、装置、设备及存储介质
Zhou Cognition and removal of impulse noise with uncertainty
US9830736B2 (en) Segmenting objects in multimedia data
CN111462183A (zh) 一种基于注意力机制双流网络的行为识别方法及系统
WO2017185772A1 (zh) 一种视频图像增强的方法、装置和计算机存储介质
CN104284192B (zh) 图像处理设备和图像处理方法
CN110428373B (zh) 一种用于视频插帧的训练样本处理方法和系统
Zhang et al. Single image dehazing via dual-path recurrent network
CN112417955B (zh) 巡检视频流处理方法及装置
US10812815B2 (en) Methods, systems, and computer readable media for compressing video images
CN113642576B (zh) 一种目标检测及语义分割任务中训练图像集合的生成方法及装置
CN111445424A (zh) 图像处理和移动终端视频处理方法、装置、设备和介质
CN111985281A (zh) 图像生成模型的生成方法、装置及图像生成方法、装置
KR20210144887A (ko) 이미지 처리 방법 및 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체
CN110033424A (zh) 图像处理的方法、装置、电子设备及计算机可读存储介质
CN113505707A (zh) 吸烟行为检测方法、电子设备及可读存储介质
CN108520263B (zh) 一种全景图像的识别方法、系统及计算机存储介质
CN112102185A (zh) 基于深度学习的图像去模糊方法及装置、电子设备
CN112785572A (zh) 图像质量评估方法、装置以及计算机可读存储介质
CN117351011A (zh) 屏幕缺陷检测方法、设备和可读存储介质
CN113052019B (zh) 目标跟踪方法及装置、智能设备和计算机存储介质
CN108509876B (zh) 针对视频的物体检测方法、装置、设备、存储介质及程序
CN111369591A (zh) 一种运动物体的跟踪方法、装置及设备
CN110309829B (zh) 影视资源下架的在线监控方法、装置及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant