CN115187490A - 视频与图形处理系统及方法 - Google Patents
视频与图形处理系统及方法 Download PDFInfo
- Publication number
- CN115187490A CN115187490A CN202211091724.2A CN202211091724A CN115187490A CN 115187490 A CN115187490 A CN 115187490A CN 202211091724 A CN202211091724 A CN 202211091724A CN 115187490 A CN115187490 A CN 115187490A
- Authority
- CN
- China
- Prior art keywords
- frame
- defect
- graph
- video
- repair
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 84
- 238000000034 method Methods 0.000 title claims abstract description 34
- 230000007547 defect Effects 0.000 claims abstract description 213
- 230000008439 repair process Effects 0.000 claims abstract description 107
- 238000003062 neural network model Methods 0.000 claims abstract description 51
- 238000003672 processing method Methods 0.000 claims abstract description 13
- 230000002950 deficient Effects 0.000 claims abstract description 11
- 238000012549 training Methods 0.000 claims description 65
- 238000013528 artificial neural network Methods 0.000 claims description 10
- 238000009432 framing Methods 0.000 abstract description 4
- 230000008569 process Effects 0.000 description 11
- 230000000694 effects Effects 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 238000010276 construction Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000000903 blocking effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/77—Retouching; Inpainting; Scratch removal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/50—Image enhancement or restoration using two or more images, e.g. averaging or subtraction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/80—Responding to QoS
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Software Systems (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Computer Networks & Wireless Communication (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Image Generation (AREA)
Abstract
本发明实施例涉及视频编解码领域,具体公开了视频与图形处理系统及方法。本发明实施例通过构建图形修复神经网络模型;对目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形;标记缺陷图形和对应的缺陷位置;将缺陷图形导入图形修复神经网络模型中,对缺陷位置进行修复处理;对缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频。能够构建图形修复神经网络模型,在进行目标视频播放时,提前进行缓存与逐帧化处理,对多个逐帧图形进行缺陷识别,通过图形修复神经网络模型进行修复处理,并将修复图形对缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频,从而提供了高性能、优异图像质量的视频播放。
Description
技术领域
本发明属于视频编解码领域,尤其涉及视频与图形处理系统及方法。
背景技术
编解码器(codec)指的是一个能够对一个信号或者一个数据流进行变换的设备或者程序。这里指的变换既包括将信号或者数据流进行编码或者提取得到一个编码流的操作,也包括为了观察或者处理从这个编码流中恢复适合观察或操作的形式的操作,编解码器经常用在视频会议和流媒体等应用中。
视频编解码标准,通常只定义上述的解码过程。例如 H.264 / AVC 标准,它定义了什么是符合标准的视频流,对每一个比特的顺序和意义都进行了严格地定义,对如何使用每个比特或者几个比特表达的信息也有精确的定义。正是这样的严格和精确,保证了不同厂商的视频相关服务,可以很方便地兼容在一起,例如用 iPhone、Android Phone 或者windows PC 都可以观看同一在线视频网站的同一视频。世界上有多个组织进行视频编码标准的制定工作,国际标准组织 ISO 的 MPEG 小组、国际电信联盟 ITU-T 的 VCEG 小组、中国的 AVS 工作组、Google 及各大厂商组成的开放媒体联盟等。
视频编解码技术的主要作用,是在可用的计算资源内,追求尽可能高的视频重建质量和尽可能高的压缩比,以达到带宽和存储容量的要求。与编码相对应的是解码或者解压缩过程,是将接收到的或者已经存储在介质上的压缩码流重建成视频信号,然后在各种设备上进行显示。因为视频编码是个有损的过程,用户只能从收到的视频流中解析出“重建”画面,它与原始的画面已经不同,例如观看低质量视频时经常会碰到的“块”效应。如何在一定的带宽占用下,尽可能地保持视频的质量,或者在保持质量情况下,尽可能地减少带宽利用率,是视频编码的目标。
发明内容
本发明实施例的目的在于提供视频与图形处理系统及方法,旨在解决背景技术中提出的问题。
为实现上述目的,本发明实施例提供如下技术方案:
视频与图形处理方法,所述方法具体包括以下步骤:
进行神经网络推理训练,构建图形修复神经网络模型;
获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形;
对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置;
将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形;
通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段。
作为本发明实施例技术方案进一步的限定,所述进行神经网络推理训练,构建图形修复神经网络模型具体包括以下步骤:
获取多个训练图形;
对多个所述训练图形进行缺陷标记,得到多个对应的训练缺陷;
对多个所述训练缺陷进行修复处理,生成多个对应的处理图形;
按照多个所述训练缺陷和对应的处理图形,对预设的基础模型进行训练、评估和优化,得到图形修复神经网络模型。
作为本发明实施例技术方案进一步的限定,所述获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形具体包括以下步骤:
获取需要进行修复处理的目标视频;
按照预设的缓存需求,对所述目标视频进行缓存,实时生成缓存视频段;
对所述缓存视频段进行逐帧化处理,实时生成多个逐帧图形。
作为本发明实施例技术方案进一步的限定,所述对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置具体包括以下步骤:
对多个所述逐帧图形分别进行缺陷判断,生成缺陷判断信息;
根据所述缺陷判断信息,标记缺陷图形;
根据所述缺陷判断信息,确定所述缺陷图形中的缺陷位置。
作为本发明实施例技术方案进一步的限定,所述将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形具体包括以下步骤:
将所述缺陷图形导入所述图形修复神经网络模型中;
生成并发送修复指令;
按照所述修复指令,对所述缺陷位置进行修复处理,导出修复图形。
作为本发明实施例技术方案进一步的限定,所述通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段具体包括以下步骤:
删除所述缓存视频段中的缺陷图形;
在所述缓存视频段中替换所述缺陷图形对应的修复图形,生成缓存修复视频段;
播放所述缓存修复视频段。
视频与图形处理系统,所述系统包括修复模型构建单元、逐帧图形生成单元、缺陷判断标记单元、缺陷修复处理单元和修复视频生成单元,其中:
修复模型构建单元,用于进行神经网络推理训练,构建图形修复神经网络模型;
逐帧图形生成单元,用于获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形;
缺陷判断标记单元,用于对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置;
缺陷修复处理单元,用于将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形;
修复视频生成单元,用于通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段。
作为本发明实施例技术方案进一步的限定,所述修复模型构建单元具体包括:
图形获取模块,用于获取多个训练图形;
缺陷标记模块,用于对多个所述训练图形进行缺陷标记,得到多个对应的训练缺陷;
修复处理模块,用于对多个所述训练缺陷进行修复处理,生成多个对应的处理图形;
模型构建模块,用于按照多个所述训练缺陷和对应的处理图形,对预设的基础模型进行训练、评估和优化,得到图形修复神经网络模型。
作为本发明实施例技术方案进一步的限定,所述逐帧图形生成单元具体包括:
视频获取模块,用于获取需要进行修复处理的目标视频;
视频缓存模块,用于按照预设的缓存需求,对所述目标视频进行缓存,实时生成缓存视频段;
逐帧处理模块,用于对所述缓存视频段进行逐帧化处理,实时生成多个逐帧图形。
作为本发明实施例技术方案进一步的限定,所述缺陷判断标记单元具体包括:
缺陷判断模块,用于对多个所述逐帧图形分别进行缺陷判断,生成缺陷判断信息;
图形标记模块,用于根据所述缺陷判断信息,标记缺陷图形;
位置确定模块,用于根据所述缺陷判断信息,确定所述缺陷图形中的缺陷位置。
与现有技术相比,本发明的有益效果是:
本发明实施例通过构建图形修复神经网络模型;对目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形;标记缺陷图形和对应的缺陷位置;将缺陷图形导入图形修复神经网络模型中,对缺陷位置进行修复处理;对缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频。能够构建图形修复神经网络模型,在进行目标视频播放时,提前进行缓存与逐帧化处理,对多个逐帧图形进行缺陷识别,通过图形修复神经网络模型进行修复处理,并将修复图形对缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频,从而提供了高性能、优异图像质量的视频播放。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例。
图1示出了本发明实施例提供的方法的流程图。
图2示出了本发明实施例提供的方法中构建图形修复模型的流程图。
图3示出了本发明实施例提供的方法中视频缓存逐帧化处理的流程图。
图4示出了本发明实施例提供的方法中缺陷判断图形标记的流程图。
图5示出了本发明实施例提供的方法中缺陷位置修复处理的流程图。
图6示出了本发明实施例提供的方法中生成播放修复视频的流程图。
图7示出了本发明实施例提供的系统的应用架构图。
图8示出了本发明实施例提供的系统中修复模型构建单元的结构框图。
图9示出了本发明实施例提供的系统中逐帧图形生成单元的结构框图。
图10示出了本发明实施例提供的系统中缺陷判断标记单元的结构框图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
可以理解的是,因为视频编码是个有损的过程,用户只能从收到的视频流中解析出“重建”画面,它与原始的画面已经不同,例如观看低质量视频时经常会碰到的“块”效应,包括平铺、锯齿、马赛克、像素化、拼布和棋盘格。因此,如何在一定的带宽占用下,尽可能地保持视频的质量,或者在保持质量情况下,尽可能地减少带宽利用率,是视频编码的目标。
为解决上述问题,本发明实施例通过进行神经网络推理训练,构建图形修复神经网络模型;对目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形;标记缺陷图形和对应的缺陷位置;将缺陷图形导入图形修复神经网络模型中,对缺陷位置进行修复处理;对缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频。能够构建图形修复神经网络模型,在进行目标视频播放时,提前进行缓存与逐帧化处理,对多个逐帧图形进行缺陷识别,通过图形修复神经网络模型进行修复处理,并将修复图形对缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频,从而提供了高性能、优异图像质量的视频播放。
图1示出了本发明实施例提供的方法的流程图。
具体的,视频与图形处理方法,所述方法具体包括以下步骤:
步骤S101,进行神经网络推理训练,构建图形修复神经网络模型。
在本发明实施例中,通过获取多个进行训练准备的训练图形,在对多个训练图形进行人工缺陷标记与修复处理的过程进行记录,得到与多个训练图形相对应的训练缺陷和处理图形,并将多个训练缺陷和处理图形进行划分,取80%的训练缺陷和处理图形为训练集,取20%的训练缺陷和处理图形为测试集,通过训练集和测试集对预设的基础模型进行训练、评估,构建图形修复神经网络模型,并在图形修复神经网络模型使用过程中,对图形修复神经网络模型进行持续优化。
具体的,图2示出了本发明实施例提供的方法中构建图形修复模型的流程图。
其中,在本发明提供的优选实施方式中,所述进行神经网络推理训练,构建图形修复神经网络模型具体包括以下步骤:
步骤S1011,获取多个训练图形。
步骤S1012,对多个所述训练图形进行缺陷标记,得到多个对应的训练缺陷。
步骤S1013,对多个所述训练缺陷进行修复处理,生成多个对应的处理图形。
步骤S1014,按照多个所述训练缺陷和对应的处理图形,对预设的基础模型进行训练、评估和优化,得到图形修复神经网络模型。
进一步的,所述视频与图形处理方法还包括以下步骤:
步骤S102,获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形。
在本发明实施例中,可以将需要进行修复处理的目标视频导入,通过获取导入的目标视频,按照预设的缓存需求,在目标视频中进行预设大小的视频段实时缓存,实时生成缓存视频段,进而通过对缓存视频段进行逐帧化处理,实时更新并生成多个逐帧图形。
可以理解的是,逐帧化处理,是按照相关视频的帧率,将缓存视频段中的视频进行图片化分解,从而生成与视频帧率相关的多个逐帧图形。
具体的,图3示出了本发明实施例提供的方法中视频缓存逐帧化处理的流程图。
其中,在本发明提供的优选实施方式中,所述获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形具体包括以下步骤:
步骤S1021,获取需要进行修复处理的目标视频。
步骤S1022,按照预设的缓存需求,对所述目标视频进行缓存,实时生成缓存视频段。
步骤S1023,对所述缓存视频段进行逐帧化处理,实时生成多个逐帧图形。
进一步的,所述视频与图形处理方法还包括以下步骤:
步骤S103,对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置。
在本发明实施例中,通过对多个逐帧图形分别进行缺陷判断,生成与每个逐帧图形相关的缺陷判断信息,并按照缺陷判断信息判断该逐帧图形是否存在“块”效应的缺陷,并将存在“块”效应的逐帧图形标记为缺陷图形,将缺陷图形中存在“块”效应的位置标记为缺陷位置。
可以理解的是,“块”效应的缺陷,具体包括平铺、锯齿、马赛克、像素化、拼布和棋盘格等。
具体的,图4示出了本发明实施例提供的方法中缺陷判断图形标记的流程图。
其中,在本发明提供的优选实施方式中,所述对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置具体包括以下步骤:
步骤S1031,对多个所述逐帧图形分别进行缺陷判断,生成缺陷判断信息。
步骤S1032,根据所述缺陷判断信息,标记缺陷图形。
步骤S1033,根据所述缺陷判断信息,确定所述缺陷图形中的缺陷位置。
进一步的,所述视频与图形处理方法还包括以下步骤:
步骤S104,将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形。
在本发明实施例中,通过将存在“块”效应缺陷的缺陷图形导入构建的图形修复神经网络模型中,通过图形修复神经网络模型对缺陷图形中相应的缺陷位置进行修复处理,生成并导出与缺陷图形相对应的修复图形。
具体的,图5示出了本发明实施例提供的方法中缺陷位置修复处理的流程图。
其中,在本发明提供的优选实施方式中,所述将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形具体包括以下步骤:
步骤S1041,将所述缺陷图形导入所述图形修复神经网络模型中。
步骤S1042,生成并发送修复指令。
步骤S1043,按照所述修复指令,对所述缺陷位置进行修复处理,导出修复图形。
进一步的,所述视频与图形处理方法还包括以下步骤:
步骤S105,通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段。
在本发明实施例中,将缓存视频段中的缺陷图形删除,并在删除位置处,替换成与删除的缺陷图形相对应的修复图形,从而实现对缓存视频段的修复,生成缓存修复视频段,并在到达对应的播放时间时,对缓存修复视频段进行实时播放。
具体的,图6示出了本发明实施例提供的方法中生成播放修复视频的流程图。
其中,在本发明提供的优选实施方式中,所述通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段具体包括以下步骤:
步骤S1051,删除所述缓存视频段中的缺陷图形。
步骤S1052,在所述缓存视频段中替换所述缺陷图形对应的修复图形,生成缓存修复视频段。
步骤S1053,播放所述缓存修复视频段。
进一步的,图7示出了本发明实施例提供的系统的应用架构图。
其中,在本发明提供的又一个优选实施方式中,视频与图形处理系统,所述系统包括修复模型构建单元101、逐帧图形生成单元102、缺陷判断标记单元103、缺陷修复处理单元104和修复视频生成单元105,具体的:
修复模型构建单元101,用于进行神经网络推理训练,构建图形修复神经网络模型。
在本发明实施例中,修复模型构建单元101通过获取多个进行训练准备的训练图形,再对多个训练图形进行人工缺陷标记与修复处理的过程进行记录,得到与多个训练图形相对应的训练缺陷和处理图形,并将多个训练缺陷和处理图形进行划分,取80%的训练缺陷和处理图形为训练集,取20%的训练缺陷和处理图形为测试集,通过训练集和测试集对预设的基础模型进行训练、评估,构建图形修复神经网络模型,并在图形修复神经网络模型使用过程中,对图形修复神经网络模型进行持续优化。
具体的,图8示出了本发明实施例提供的系统中修复模型构建单元101的结构框图。
其中,在本发明提供的优选实施方式中,所述修复模型构建单元101具体包括:
图形获取模块1011,用于获取多个训练图形。
缺陷标记模块1012,用于对多个所述训练图形进行缺陷标记,得到多个对应的训练缺陷。
修复处理模块1013,用于对多个所述训练缺陷进行修复处理,生成多个对应的处理图形。
模型构建模块1014,用于按照多个所述训练缺陷和对应的处理图形,对预设的基础模型进行训练、评估和优化,得到图形修复神经网络模型。
进一步的,所述视频与图形处理系统还包括:
逐帧图形生成单元102,用于获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形。
在本发明实施例中,可以将需要进行修复处理的目标视频导入,逐帧图形生成单元102通过获取导入的目标视频,按照预设的缓存需求,在目标视频中进行预设大小的视频段实时缓存,实时生成缓存视频段,进而通过对缓存视频段进行逐帧化处理,实时更新并生成多个逐帧图形。
具体的,图9示出了本发明实施例提供的系统中逐帧图形生成单元102的结构框图。
其中,在本发明提供的优选实施方式中,所述逐帧图形生成单元102具体包括:
视频获取模块1021,用于获取需要进行修复处理的目标视频。
视频缓存模块1022,用于按照预设的缓存需求,对所述目标视频进行缓存,实时生成缓存视频段。
逐帧处理模块1023,用于对所述缓存视频段进行逐帧化处理,实时生成多个逐帧图形。
进一步的,所述视频与图形处理系统还包括:
缺陷判断标记单元103,用于对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置。
在本发明实施例中,缺陷判断标记单元103通过对多个逐帧图形分别进行缺陷判断,生成与每个逐帧图形相关的缺陷判断信息,并按照缺陷判断信息判断该逐帧图形是否存在“块”效应的缺陷,并将存在“块”效应的逐帧图形标记为缺陷图形,将缺陷图形中存在“块”效应的位置标记为缺陷位置。
具体的,图10示出了本发明实施例提供的系统中缺陷判断标记单元103的结构框图。
其中,在本发明提供的优选实施方式中,所述缺陷判断标记单元103具体包括:
缺陷判断模块1031,用于对多个所述逐帧图形分别进行缺陷判断,生成缺陷判断信息。
图形标记模块1032,用于根据所述缺陷判断信息,标记缺陷图形。
位置确定模块1033,用于根据所述缺陷判断信息,确定所述缺陷图形中的缺陷位置。
进一步的,所述视频与图形处理系统还包括:
缺陷修复处理单元104,用于将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形。
在本发明实施例中,缺陷修复处理单元104通过将存在“块”效应缺陷的缺陷图形导入构建的图形修复神经网络模型中,通过图形修复神经网络模型对缺陷图形中相应的缺陷位置进行修复处理,生成并导出与缺陷图形相对应的修复图形。
修复视频生成单元105,用于通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段。
在本发明实施例中,修复视频生成单元105将缓存视频段中的缺陷图形删除,并在删除位置处,替换成与删除的缺陷图形相对应的修复图形,从而实现对缓存视频段的修复,生成缓存修复视频段,并在到达对应的播放时间时,对缓存修复视频段进行实时播放。
综上所述,本发明实施例能够构建图形修复神经网络模型,在进行目标视频播放时,提前进行缓存与逐帧化处理,对多个逐帧图形进行缺陷识别,通过图形修复神经网络模型进行修复处理,并将修复图形对缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频,从而提供了高性能、优异图像质量的视频播放。
应该理解的是,虽然本发明各实施例的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,各实施例中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink) DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.视频与图形处理方法,其特征在于,所述方法具体包括以下步骤:
进行神经网络推理训练,构建图形修复神经网络模型;
获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形;
对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置;
将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形;
通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段。
2.根据权利要求1所述的视频与图形处理方法,其特征在于,所述进行神经网络推理训练,构建图形修复神经网络模型具体包括以下步骤:
获取多个训练图形;
对多个所述训练图形进行缺陷标记,得到多个对应的训练缺陷;
对多个所述训练缺陷进行修复处理,生成多个对应的处理图形;
按照多个所述训练缺陷和对应的处理图形,对预设的基础模型进行训练、评估和优化,得到图形修复神经网络模型。
3.根据权利要求1所述的视频与图形处理方法,其特征在于,所述获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形具体包括以下步骤:
获取需要进行修复处理的目标视频;
按照预设的缓存需求,对所述目标视频进行缓存,实时生成缓存视频段;
对所述缓存视频段进行逐帧化处理,实时生成多个逐帧图形。
4.根据权利要求1所述的视频与图形处理方法,其特征在于,所述对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置具体包括以下步骤:
对多个所述逐帧图形分别进行缺陷判断,生成缺陷判断信息;
根据所述缺陷判断信息,标记缺陷图形;
根据所述缺陷判断信息,确定所述缺陷图形中的缺陷位置。
5.根据权利要求1所述的视频与图形处理方法,其特征在于,所述将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形具体包括以下步骤:
将所述缺陷图形导入所述图形修复神经网络模型中;
生成并发送修复指令;
按照所述修复指令,对所述缺陷位置进行修复处理,导出修复图形。
6.根据权利要求1所述的视频与图形处理方法,其特征在于,所述通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段具体包括以下步骤:
删除所述缓存视频段中的缺陷图形;
在所述缓存视频段中替换所述缺陷图形对应的修复图形,生成缓存修复视频段;
播放所述缓存修复视频段。
7.视频与图形处理系统,其特征在于,所述系统包括修复模型构建单元、逐帧图形生成单元、缺陷判断标记单元、缺陷修复处理单元和修复视频生成单元,其中:
修复模型构建单元,用于进行神经网络推理训练,构建图形修复神经网络模型;
逐帧图形生成单元,用于获取目标视频,对所述目标视频进行缓存与逐帧化处理,实时生成缓存视频段和对应的多个逐帧图形;
缺陷判断标记单元,用于对多个所述逐帧图形进行缺陷判断,标记缺陷图形和对应的缺陷位置;
缺陷修复处理单元,用于将所述缺陷图形导入所述图形修复神经网络模型中,对所述缺陷位置进行修复处理,生成修复图形;
修复视频生成单元,用于通过所述修复图形,对所述缓存视频段中对应的缺陷图形进行替换,生成并播放缓存修复视频段。
8.根据权利要求7所述的视频与图形处理系统,其特征在于,所述修复模型构建单元具体包括:
图形获取模块,用于获取多个训练图形;
缺陷标记模块,用于对多个所述训练图形进行缺陷标记,得到多个对应的训练缺陷;
修复处理模块,用于对多个所述训练缺陷进行修复处理,生成多个对应的处理图形;
模型构建模块,用于按照多个所述训练缺陷和对应的处理图形,对预设的基础模型进行训练、评估和优化,得到图形修复神经网络模型。
9.根据权利要求7所述的视频与图形处理系统,其特征在于,所述逐帧图形生成单元具体包括:
视频获取模块,用于获取需要进行修复处理的目标视频;
视频缓存模块,用于按照预设的缓存需求,对所述目标视频进行缓存,实时生成缓存视频段;
逐帧处理模块,用于对所述缓存视频段进行逐帧化处理,实时生成多个逐帧图形。
10.根据权利要求7所述的视频与图形处理系统,其特征在于,所述缺陷判断标记单元具体包括:
缺陷判断模块,用于对多个所述逐帧图形分别进行缺陷判断,生成缺陷判断信息;
图形标记模块,用于根据所述缺陷判断信息,标记缺陷图形;
位置确定模块,用于根据所述缺陷判断信息,确定所述缺陷图形中的缺陷位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211091724.2A CN115187490A (zh) | 2022-09-07 | 2022-09-07 | 视频与图形处理系统及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211091724.2A CN115187490A (zh) | 2022-09-07 | 2022-09-07 | 视频与图形处理系统及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115187490A true CN115187490A (zh) | 2022-10-14 |
Family
ID=83523606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211091724.2A Pending CN115187490A (zh) | 2022-09-07 | 2022-09-07 | 视频与图形处理系统及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115187490A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111614996A (zh) * | 2020-04-07 | 2020-09-01 | 上海推乐信息技术服务有限公司 | 一种视频修复方法和系统 |
CN111800630A (zh) * | 2019-04-09 | 2020-10-20 | Tcl集团股份有限公司 | 一种视频超分辨率重建的方法、系统及电子设备 |
CN112102212A (zh) * | 2020-11-19 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种视频修复方法、装置、设备及存储介质 |
CN112717389A (zh) * | 2020-12-31 | 2021-04-30 | 贵阳动视云科技有限公司 | 一种云游戏图像花屏修复方法及装置 |
CN113038135A (zh) * | 2021-05-19 | 2021-06-25 | 杭州微帧信息科技有限公司 | 基于块效应检测的crf自适应方法 |
-
2022
- 2022-09-07 CN CN202211091724.2A patent/CN115187490A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111800630A (zh) * | 2019-04-09 | 2020-10-20 | Tcl集团股份有限公司 | 一种视频超分辨率重建的方法、系统及电子设备 |
CN111614996A (zh) * | 2020-04-07 | 2020-09-01 | 上海推乐信息技术服务有限公司 | 一种视频修复方法和系统 |
CN112102212A (zh) * | 2020-11-19 | 2020-12-18 | 腾讯科技(深圳)有限公司 | 一种视频修复方法、装置、设备及存储介质 |
CN112717389A (zh) * | 2020-12-31 | 2021-04-30 | 贵阳动视云科技有限公司 | 一种云游戏图像花屏修复方法及装置 |
CN113038135A (zh) * | 2021-05-19 | 2021-06-25 | 杭州微帧信息科技有限公司 | 基于块效应检测的crf自适应方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021051597A1 (zh) | 动画播放方法、装置、计算机设备和存储介质 | |
CN107995494A (zh) | 视频图像数据的压缩方法与解压方法、计算机装置、计算机可读存储介质 | |
CN108134932A (zh) | 基于卷积神经网络的视频编解码环路内滤波实现方法及系统 | |
CN116233445B (zh) | 视频的编解码处理方法、装置、计算机设备和存储介质 | |
CN105551512A (zh) | 音频格式转换方法和装置 | |
CN109672893A (zh) | 一种视频解码方法、装置、设备和存储介质 | |
CN107333133A (zh) | 一种码流接收设备的码流编码的方法及装置 | |
CN104853132A (zh) | 一种延时视频录制方法及系统 | |
US10070142B2 (en) | Continuous generation of non-displayed reference frame in video encoding and decoding | |
CN113645448A (zh) | 一种适用于指挥调度的视频解码方法和装置 | |
CN106713901A (zh) | 一种视频质量评价方法及装置 | |
CN111263164A (zh) | 一种高帧频视频并行编码及重组方法 | |
CN115187490A (zh) | 视频与图形处理系统及方法 | |
CN112866695B (zh) | 一种视频编码器 | |
KR102245682B1 (ko) | 영상 압축 장치, 이의 학습 장치 및 방법 | |
CN110944197A (zh) | 一种图像、音频编码的方法和装置 | |
US11095901B2 (en) | Object manipulation video conference compression | |
CN103609109A (zh) | 动态图像编码装置以及动态图像编码方法 | |
CN115379291B (zh) | 一种码表更新方法、装置、设备及存储介质 | |
CN106101596B (zh) | 一种视频存储方法和装置 | |
CN114727116A (zh) | 编码方法及装置 | |
WO2017124305A1 (zh) | 基于多方式边界填充的全景视频编码、解码方法和装置 | |
CN112203117A (zh) | 基于视频编/解码器的视频溯源和防篡改方法 | |
Xia et al. | GAN-based image compression with improved RDO process | |
CN102833547B (zh) | 一种应用于jpeg图像的快速嵌入显性信息的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221014 |