CN117615137B - 一种视频处理方法、装置、设备以及存储介质 - Google Patents

一种视频处理方法、装置、设备以及存储介质 Download PDF

Info

Publication number
CN117615137B
CN117615137B CN202410051797.1A CN202410051797A CN117615137B CN 117615137 B CN117615137 B CN 117615137B CN 202410051797 A CN202410051797 A CN 202410051797A CN 117615137 B CN117615137 B CN 117615137B
Authority
CN
China
Prior art keywords
video
target
determining
frame
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410051797.1A
Other languages
English (en)
Other versions
CN117615137A (zh
Inventor
马凌志
王鹤桐
甘超莹
袁伟
何宇峰
王建文
王雯淇
文泽宁
孟兆健
丁江伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Tielishan Technology Co ltd
Original Assignee
Beijing Tielishan Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Tielishan Technology Co ltd filed Critical Beijing Tielishan Technology Co ltd
Priority to CN202410051797.1A priority Critical patent/CN117615137B/zh
Publication of CN117615137A publication Critical patent/CN117615137A/zh
Application granted granted Critical
Publication of CN117615137B publication Critical patent/CN117615137B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种视频处理方法、装置、设备以及存储介质,属于视频处理技术领域,所述方法包括:对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源;根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度;根据分块编码资源和目标压缩长度,对目标视频进行压缩,得到目标压缩视频。本发明提高了对高动态、高复杂、高分辨率或高变化的视频的视频编码效率和视频压缩质量。

Description

一种视频处理方法、装置、设备以及存储介质
技术领域
本发明涉及视频处理技术领域,尤其涉及一种视频处理方法、装置、设备以及存储介质。
背景技术
随着数字技术的发展,视频编解码技术在多个应用领域得到广泛应用。视频编解码技术的主要目标是在保证视频质量的前提下,尽量降低视频数据的大小,从而实现更快速的传输和更小的存储需求。
传统的视频编解码技术,虽然提供了前所未有的编解码效率,但仍然存在一些固有的局限性,比如,在处理高动态、高复杂、高分辨率或高变化的视频时,不仅编码效率低,而且得到的压缩视频的视频质量也往往不尽人意。
发明内容
本发明提供了一种视频处理方法、装置、设备以及存储介质,以提高对高动态、高复杂、高分辨率或高变化的视频的视频编码效率和视频压缩质量。
根据本发明的一方面,提供了一种视频处理方法,该方法包括:
对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源;
根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度;
根据分块编码资源和目标压缩长度,对目标视频进行压缩,得到目标压缩视频。
根据本发明的另一方面,提供了一种视频处理装置,该装置包括:
分块编码资源确定模块,用于对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源;
目标压缩长度确定模块,用于根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度;
目标压缩视频确定模块,用于根据分块编码资源和压缩长度,对目标视频进行压缩,得到目标压缩视频。
根据本发明的另一方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的计算机程序,计算机程序被至少一个处理器执行,以使至少一个处理器能够执行本发明任一实施例的视频处理方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,计算机指令用于使处理器执行时实现本发明任一实施例的视频处理方法。
本发明实施例的技术方案,通过对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源;根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度;根据分块编码资源和目标压缩长度,对目标视频进行压缩,得到目标压缩视频。上述技术方案,通过对初始视频进行颜色调整,优化了初始视频中视频的色彩和对比度,从而使得得到的目标视频的视频质量和色彩还原度更高;同时,确定为目标视频中至少一个分块视频分配的分块编码资源;之后,借助目标视频中重复帧的重复信息,确定目标压缩长度;进而,基于目标压缩长度和目标视频中为各分块视频分配的分块编码资源,对目标视频进行压缩,得到目标压缩视频,一方面实现了对目标视频中重复视频内容的压缩,另一方面,确保了目标视频中更重要的视频部分可以获得更多的编码资源,从而使得得到的目标压缩视频拥有更高的视频质量。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种视频处理方法的流程图;
图2是根据本发明实施例二提供的一种视频处理方法的流程图;
图3是根据本发明实施例三提供的一种视频处理装置的结构示意图;
图4是实现本发明实施例的视频处理方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“原始”、“初始”和“目标”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
此外,还需要说明的是,本发明的技术方案中,所涉及的初始视频、原始视频、以及回声状态模型的历史网络状态等的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
实施例一
图1为本发明实施例一提供的一种视频处理方法的流程图,本实施例可适用于对视频进行编解码的情况,尤其适用于对高动态、高复杂、高分辨率或高变化的视频进行编解码的情况,该方法可以由视频处理装置来执行,该装置可以采用硬件和/或软件的形式实现,可配置于电子设备中。如图1所示,该方法包括:
S101、对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源。
其中,初始视频是指经初步数据处理后所得的高动态、高复杂、高分辨率或高变化的视频。目标视频是指初始视频经颜色调整后得到的视频。分块视频是指目标视频经分块处理后得到的视频块。需要说明的是,目标视频包括至少一个分块视频;一个分块视频包括至少两个视频帧。分块编码资源是指为分块视频分配的编码资源。需要说明的是,一个分块视频对应一个分块编码资源。
具体的,可以基于色彩校正模型,对初始视频进行颜色调整,得到目标视频;并基于随机算法,根据目标视频拥有的总编码资源,为目标视频中的每一个分块视频分配对应的分块编码资源。其中,色彩校正模型可以根据实际业务需求预先设置,比如,基于直方图均衡化的色彩校正模型,本发明实施例对其不做具体限定。
S102、根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度。
其中,目标数据长度是指目标视频的总数据长度。重复帧是指目标视频中重复出现的视频帧。重复信息是指与重复帧相关的信息;可选的,重复信息包括每一重复帧的单帧长度、目标视频中重复帧的总数量、以及目标视频中重复帧所占的比例。目标压缩长度是指目标视频进行视频压缩时的实际长度。
具体的,可以计算目标视频的目标数据长度;根据目标视频中每一重复帧的单帧长度,计算目标视频中重复帧的总重复帧长度;将目标数据长度与总重复帧长度之间的差值,作为目标视频的目标压缩长度。
S103、根据分块编码资源和目标压缩长度,对目标视频进行压缩,得到目标压缩视频。
其中,目标压缩视频是指目标视频经压缩后得到的视频。
具体的,按照目标压缩长度和目标视频中各分块视频的时序位置,采用为各分块视频分配的分块编码资源,依次对目标视频中的分块视频进行编码,得到目标压缩视频。
本发明实施例的技术方案,通过对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源;根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度;根据分块编码资源和目标压缩长度,对目标视频进行压缩,得到目标压缩视频。上述技术方案,通过对初始视频进行颜色调整,优化了初始视频中视频的色彩和对比度,从而使得得到的目标视频的视频质量和色彩还原度更高;同时,确定为目标视频中至少一个分块视频分配的分块编码资源;之后,借助目标视频中重复帧的重复信息,确定目标压缩长度;进而,基于目标压缩长度和目标视频中为各分块视频分配的分块编码资源,对目标视频进行压缩,得到目标压缩视频,一方面实现了对目标视频中重复视频内容的压缩,另一方面,确保了目标视频中更重要的视频部分可以获得更多的编码资源,从而使得得到的目标压缩视频拥有更高的视频质量。
在上述实施例的基础上,作为本发明实施例的一种可选方式,还可以:对原始视频进行分块,得到至少一个原始视频块;对于每一原始视频块,根据该原始视频块中相邻视频帧的像素差值,确定该原始视频块的动态得分;根据动态得分,对该原始视频块进行结构调整,得到调整后的新视频块;根据各新视频块的时序位置,确定初始视频。
其中,原始视频是指未经处理的原始的高动态、高复杂、高分辨率或高变化的视频。原始视频块是指原始视频中的视频块。需要说明的是,原始视频块中包括至少一对相邻视频帧。
具体的,根据原始视频中视频帧之间的相关性,对原始视频进行分块,得到至少一个原始视频块;对于每一原始视频块,计算该原始视频块中各相邻视频帧之间的像素差值;之后,计算这些像素差值的平均值,作为该原始视频块的动态得分;根据动态得分和得分阈值,通过如下公式,对该原始视频块进行结构调整,得到调整后的新视频块:
其中,为调整后的新视频块,/>为该原始视频块的动态得分,/>为得分阈值;/>为当前形态系数,其值介于0和1之间,用于表征视频的形态变化程度;其中,1表示视频最大的形态变化,0表示视频无形态变化。需要说明的是,/>可以通过特定视频形态检测算法得到;其中,特定视频形态检测算法可以根据实际业务需求预先设置,本发明实施例对其不做具体限定。/>可以根据实际业务需求预先设置,也可以随机设置,本发明实施例对其不做具体限定。
进而,可以根据各新视频块的时序位置,将各新视频块进行重新拼接,得到初始视频。需要说明的是,原始视频中原始视频块结构调整前后的时序位置不变。
可以理解的是,通过检测原始视频中原始视频块的形态变化,对原始视频进行结构调整,从而得到初始视频,为初始视频中具有高动态的视频内容提供了更多的编码细节,进而确保了初始视频中快速移动的物体在后续视频压缩处理的过程中可以被清晰地编码。
在上述实施例的基础上,作为本发明实施例的一种可选方式,还可以:基于回声状态模型,对目标压缩视频进行解码,得到目标视频。
其中,回声状态模型是指基于回声状态网络的模型。其中,回声状态网络(echostate network,ESN)是一种循环神经网络,其网络的某些部分维持着前一时刻的状态或“回声”。这种特性使得回声状态网络能够更好地处理时间序列数据,因为它可以记住过去的信息,并可以利用这些信息来预测未来的数据。
具体的,可以根据回声状态模型的历史网络状态和当前视频帧,确定当前时刻的当前预激励值;其中,历史网络状态是指回声状态模型在当前时刻的上一时刻的网络状态;当前视频帧是指目标压缩视频中当前时刻的视频帧;根据当前预激励值,确定当前时刻的当前网络状态;根据当前网络状态,确定当前视频帧的解码视频帧。同理,可以对目标压缩视频中的各视频帧进行解码,从而得到目标视频。
其中,当前预激励值是指基于历史网络状态和当前视频帧计算得到的激励值。
具体的,可以根据回声状态模型的历史网络状态和当前视频帧,通过如下公式,确定当前时刻的当前预激励值:
其中,为当前预激励值,/>为输入权重矩阵,/>为回声权重矩阵,/>为当前视频帧,/>为历史网络状态。需要说明的是,/>和/>预先通过训练得到。
之后,根据当前预激励值,通过如下公式,确定当前时刻的当前网络状态:
其中,为当前网络状态,tanh()为双曲正切函数,为当前预激励值。
之后,根据当前网络状态,通过如下公式,确定当前视频帧的解码视频帧:
其中,为当前视频帧的解码视频帧,/>为输出权重矩阵,/>为当前网络状态。需要说明的是,/>预先通过训练得到。
进而,按照上述解码原理,依次对目标压缩视频中的视频帧进行解码,从而得到目标视频。
可以理解的是,基于回声状态模型,对目标压缩视频进行解码,得到目标视频,有效减少了对目标压缩视频进行解码的时延,从而提高了视频播放时的流畅性。
实施例二
图2为本发明实施例二提供的一种视频处理方法的流程图,本实施例在上述实施例的基础上,进一步对“对初始视频进行颜色调整,得到目标视频”进行优化,提供了一种可选实施方案。需要说明的是,在本发明实施例中未详述部分,可参照其他实施例的相关表述。如图2所示,该方法包括:
S201、根据初始视频中单帧的像素点亮度,确定初始视频的整体亮度。
其中,单帧是指初始视频中的一个视频帧。像素点亮度是指单帧中像素点的亮度。整体亮度是指初始视频中视频帧的平均亮度。需要说明的是,一个视频帧包括至少一个像素点。
具体的,统计初始视频中视频帧的总帧数;对于初始视频中每一视频帧,计算该视频帧中像素点的总亮度,作为单帧亮度;将初始视频中各视频帧的单帧亮度进行求和,得到视频帧总亮度;将视频帧总亮度与总帧数之间的商,作为初始视频的整体亮度。
S202、对于初始视频中的每一视频帧,根据整体亮度、该视频帧的单帧亮度和单帧颜色强度,确定该视频帧的新颜色强度。
其中,单帧亮度是指一个视频帧中像素点的总亮度,也是指一个视频帧的外部光线强度。单帧颜色强度是指一个视频帧原始的颜色强度。
具体的,对于初始视频中的每一视频帧,根据整体亮度、该视频帧的单帧亮度和单帧颜色强度,具体通过如下公式,确定该视频帧的新颜色强度:
其中,为该视频帧的新颜色强度,/>为该视频帧的单帧颜色强度,/>为单帧亮度,为整体亮度。/>为光子共振的反射率系数,其值介于0和1之间,通常通过实验计算得到。
示例性的,若光子共振的反射率系数为0.8,即,初始视频的整体亮度为1.0,即/>,对于初始视频中的某一视频帧,该视频帧的单帧颜色强度为0.5,即/>,单帧亮度为1.2,即/>,根据整体亮度、该视频帧的单帧亮度和单帧颜色强度,通过上述公式确定该视频帧的新颜色强度为0.66。
S203、根据初始视频中各视频帧的新颜色强度,对初始视频进行颜色调整,得到目标视频。
具体的,根据初始视频中各视频帧的时序位置,依次采用各视频帧的新颜色强度替换其单帧颜色强度,从而得到目标视频。
可以理解的是,通过模拟光子共振的行为,对初始视频的颜色进行调整,使得得到的目标视频的视频色彩还原度和视频质量更高,使得各种光照条件下,目标视频的色彩和对比度均是最优的。
S204、确定为目标视频中至少一个分块视频分配的分块编码资源。
可选的,对于目标视频中的每一分块视频,确定该分块视频的视频重要度;根据目标视频的目标编码资源和视频重要度,确定为该分块视频分配的分块编码资源。
其中,视频重要度是指分块视频的视频内容的重要程度。目标编码资源是指目标视频拥有的总编码资源。
具体的,对于目标视频中的每一分块视频,基于视频重要度评分标准,计算该分块视频的视频重要度;同理,可以得到目标视频中各分块视频的视频重要度;计算目标视频中各分块视频的视频重要度的总和,作为视频重要度总和;进而根据目标视频的目标编码资源、该分块视频的视频重要度和视频重要度总和,具体通过如下公式,确定为该分块视频分配的分块编码资源:
其中,R是为该分块视频分配的分块编码资源,为目标视频的目标编码资源,/>为该分块视频的视频重要度,/>为视频重要度总和。需要说明的是,视频重要度评分标准可以根据影响视频压缩质量的视频颜色、视频亮度以及视频内容的运动变化情况等预先设置,本发明实施例对其不做具体限定。
示例性的,若目标视频有3个分块视频,分别为分块视频A、分块视频B和分块视频C,若分块视频A的视频重要度为10,分块视频B的视频重要度为20,分块视频C的视频重要度为30,目标视频的目标编码资源为60;对于分块视频A,根据目标视频的目标编码资源(即)、分块视频A的视频重要度(即/>)和视频重要度总和(即/>),确定为分块视频A分配的分块编码资源为10。
可以理解的是,通过确定目标视频中各分块视频的视频重要度,针对性的为目标视频中各分块视频分配对应的分块编码资源,确保了目标视频中重要的分块视频可以分配到更多的编码资源,进而确保了后续对目标视频进行压缩时,可以得到更高视频质量的压缩视频。
S205、根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度。
可选的,重复信息包括单帧长度和重复数量。其中,单帧长度是指每一重复帧的数据长度。重复数量是指目标视频中重复帧的总数量。
具体的,可以根据目标视频中重复帧的单帧长度和重复数量,确定平均重复帧长度;根据重复数量,确定目标视频的视频重复率;根据目标视频的目标数据长度、平均重复帧长度和视频重复率,确定目标视频的目标压缩长度。
其中,平均重复帧长度是指目标视频中所有重复帧的平均数据长度。视频重复率是指重复帧在目标视频的总视频帧中所占的比例。
更具体的,可以依次遍历目标视频中的重复帧,并记录每一重复帧的单帧长度;对目标视频中各重复帧的单帧长度进行求和,得到目标视频中重复帧的总重复帧长度;将总重复帧长度与目标视频中重复帧的重复数量之间的商,作为平均重复帧长度。
之后,统计目标视频中视频帧的总视频帧数量;根据总视频帧数量和重复数量,通过如下公式,确定目标视频的视频重复率:
其中,P为初始视频的视频重复率,为重复数量,/>为总视频帧数量。
之后,可以计算平均重复帧长度和视频重复率的乘积,作为冗余帧长度;将目标视频的目标数据长度与冗余帧长度之间的差值,作为目标视频的目标压缩长度;具体的,可以通过如下公式,确定目标视频的目标压缩长度:
其中,P为视频重复率,为平均重复帧长度,/>为冗余帧长度,/>为目标数据长度,为目标压缩长度。
示例性的,若平均重复帧长度为50字节,视频重复率为0.4,目标视频的目标数据长度为1000字节,则冗余帧长度为20字节,目标视频的目标压缩长度为980字节。
可以理解的是,通过识别目标视频中的重复帧,确定平均重复帧长度和视频重复率;之后,根据平均重复帧长度和视频重复率,确定冗余帧长度,实现了对目标视频中重复帧的有效压缩。之后,根据目标视频的目标数据长度和冗余帧长度,确定目标视频的目标压缩长度,有效减少了目标视频中的重复视频内容和冗余信息,从而减少了目标视频中视频帧的数量,便于后续更高效的对目标视频进行视频压缩。
S206、根据分块编码资源和目标压缩长度,对目标视频进行压缩,得到目标压缩视频。
本发明实施例的技术方案,通过对初始视频进行颜色调整,优化了初始视频中视频的色彩和对比度,从而使得得到的目标视频的视频质量和色彩还原度更高;同时,确定为目标视频中至少一个分块视频分配的分块编码资源;之后,借助目标视频中重复帧的重复信息,确定目标压缩长度;进而,基于目标压缩长度和目标视频中为各分块视频分配的分块编码资源,对目标视频进行压缩,得到目标压缩视频,一方面实现了对目标视频中重复视频内容的压缩,另一方面,确保了目标视频中更重要的视频部分可以获得更多的编码资源,从而使得得到的目标压缩视频拥有更高的视频质量。
实施例三
图3为本发明实施例三提供的一种视频处理装置的结构示意图,本实施例可适用于对视频进行编解码的情况,尤其适用于对高动态、高复杂、高分辨率或高变化的视频进行编解码的情况,该装置可以采用硬件和/或软件的形式实现,可配置于电子设备中。如图3所示,该装置包括:
分块编码资源确定模块301,用于对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源;
目标压缩长度确定模块302,用于根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度;
目标压缩视频确定模块303,用于根据分块编码资源和压缩长度,对目标视频进行压缩,得到目标压缩视频。
本发明实施例的技术方案,通过对初始视频进行颜色调整,得到目标视频,并确定为目标视频中至少一个分块视频分配的分块编码资源;根据目标视频的目标数据长度和目标视频中重复帧的重复信息,确定目标视频的目标压缩长度;根据分块编码资源和目标压缩长度,对目标视频进行压缩,得到目标压缩视频。上述技术方案,通过对初始视频进行颜色调整,优化了初始视频中视频的色彩和对比度,从而使得得到的目标视频的视频质量和色彩还原度更高;同时,确定为目标视频中至少一个分块视频分配的分块编码资源;之后,借助目标视频中重复帧的重复信息,确定目标压缩长度;进而,基于目标压缩长度和目标视频中为各分块视频分配的分块编码资源,对目标视频进行压缩,得到目标压缩视频,一方面实现了对目标视频中重复视频内容的压缩,另一方面,确保了目标视频中更重要的视频部分可以获得更多的编码资源,从而使得得到的目标压缩视频拥有更高的视频质量
可选的,分块编码资源确定模块301包括目标视频确定单元,该目标视频确定单元,具体用于:
根据初始视频中单帧的像素点亮度,确定初始视频的整体亮度;
对于初始视频中的每一视频帧,根据整体亮度、该视频帧的单帧亮度和单帧颜色强度,确定该视频帧的新颜色强度;
根据初始视频中各视频帧的新颜色强度,对初始视频进行颜色调整,得到目标视频。
可选的,分块编码资源确定模块301包括分块编码资源确定单元,该分块编码资源确定单元,具体用于:
对于目标视频中的每一分块视频,确定该分块视频的视频重要度;
根据目标视频的目标编码资源和视频重要度,确定为该分块视频分配的分块编码资源。
可选的,重复信息包括单帧长度和重复数量;相应的,目标压缩长度确定模块302,具体用于:
根据目标视频中重复帧的单帧长度和重复数量,确定平均重复帧长度;
根据重复数量,确定目标视频的视频重复率;
根据目标视频的目标数据长度、平均重复帧长度和视频重复率,确定目标视频的目标压缩长度。
可选的,该装置还包括:
原始视频块确定模块,用于对原始视频进行分块,得到至少一个原始视频块;
动态得分确定模块,用于对于每一原始视频块,根据该原始视频块中相邻视频帧的像素差值,确定该原始视频块的动态得分;
新视频块确定模块,用于根据动态得分,对该原始视频块进行结构调整,得到调整后的新视频块;
初始视频确定模块,用于根据各新视频块的时序位置,确定初始视频。
可选的,该装置还包括:
视频解码模块,用于基于回声状态模型,对目标压缩视频进行解码,得到目标视频。
可选的,视频解码模块,具体用于:
根据回声状态模型的历史网络状态和当前视频帧,确定当前时刻的当前预激励值;其中,历史网络状态是指回声状态模型在当前时刻的上一时刻的网络状态;当前视频帧是指目标压缩视频中当前时刻的视频帧;
根据当前预激励值,确定当前时刻的当前网络状态;
根据当前网络状态,确定当前视频帧的解码视频帧。
本发明实施例所提供的视频处理装置可执行本发明任意实施例所提供的视频处理方法,具备执行各视频处理方法相应的功能模块和有益效果。
实施例四
图4示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图4所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM12以及RAM13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如视频处理方法。
在一些实施例中,视频处理方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM13并由处理器11执行时,可以执行上文描述的视频处理方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行视频处理方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (7)

1.一种视频处理方法,其特征在于,包括:
根据初始视频中单帧的像素点亮度,确定所述初始视频的整体亮度;对于所述初始视频中的每一视频帧,根据所述整体亮度、该视频帧的单帧亮度和单帧颜色强度,确定该视频帧的新颜色强度;根据所述初始视频中各视频帧的新颜色强度,对所述初始视频进行颜色调整,得到目标视频;对于所述目标视频中的每一分块视频,确定该分块视频的视频重要度;根据所述目标视频的目标编码资源和所述视频重要度,确定为该分块视频分配的分块编码资源;
根据所述目标视频的目标数据长度和所述目标视频中重复帧的重复信息,确定所述目标视频的目标压缩长度;其中,所述重复信息包括单帧长度和重复数量;
根据所述分块编码资源和所述目标压缩长度,对所述目标视频进行压缩,得到目标压缩视频;
其中,所述根据所述目标视频的目标数据长度和所述目标视频中重复帧的重复信息,确定所述目标视频的目标压缩长度,包括:
根据所述目标视频中重复帧的单帧长度和重复数量,确定平均重复帧长度;
根据所述重复数量,确定所述目标视频的视频重复率;
根据所述目标视频的目标数据长度、所述平均重复帧长度和所述视频重复率,确定所述目标视频的目标压缩长度。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对原始视频进行分块,得到至少一个原始视频块;
对于每一原始视频块,根据该原始视频块中相邻视频帧的像素差值,确定该原始视频块的动态得分;
根据所述动态得分,对该原始视频块进行结构调整,得到调整后的新视频块;
根据各新视频块的时序位置,确定初始视频。
3.根据权利要求1-2中任一项所述的方法,其特征在于,所述方法还包括:
基于回声状态模型,对所述目标压缩视频进行解码,得到目标视频。
4.根据权利要求3所述的方法,其特征在于,所述基于回声状态模型,对所述目标压缩视频进行解码,得到目标视频,包括:
根据回声状态模型的历史网络状态和当前视频帧,确定当前时刻的当前预激励值;其中,所述历史网络状态是指回声状态模型在当前时刻的上一时刻的网络状态;所述当前视频帧是指目标压缩视频中当前时刻的视频帧;
根据所述当前预激励值,确定当前时刻的当前网络状态;
根据所述当前网络状态,确定所述当前视频帧的解码视频帧。
5.一种视频处理装置,其特征在于,包括:
分块编码资源确定模块,用于根据初始视频中单帧的像素点亮度,确定所述初始视频的整体亮度;对于所述初始视频中的每一视频帧,根据所述整体亮度、该视频帧的单帧亮度和单帧颜色强度,确定该视频帧的新颜色强度;根据所述初始视频中各视频帧的新颜色强度,对所述初始视频进行颜色调整,得到目标视频;对于所述目标视频中的每一分块视频,确定该分块视频的视频重要度;根据所述目标视频的目标编码资源和所述视频重要度,确定为该分块视频分配的分块编码资源;
目标压缩长度确定模块,用于根据所述目标视频的目标数据长度和所述目标视频中重复帧的重复信息,确定所述目标视频的目标压缩长度;其中,所述重复信息包括单帧长度和重复数量;
目标压缩视频确定模块,用于根据所述分块编码资源和所述压缩长度,对所述目标视频进行压缩,得到目标压缩视频;
其中,所述目标压缩长度确定模块,具体用于:
根据所述目标视频中重复帧的单帧长度和重复数量,确定平均重复帧长度;
根据所述重复数量,确定所述目标视频的视频重复率;
根据所述目标视频的目标数据长度、所述平均重复帧长度和所述视频重复率,确定所述目标视频的目标压缩长度。
6.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4中任一项所述的视频处理方法。
7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-4中任一项所述的视频处理方法。
CN202410051797.1A 2024-01-15 2024-01-15 一种视频处理方法、装置、设备以及存储介质 Active CN117615137B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410051797.1A CN117615137B (zh) 2024-01-15 2024-01-15 一种视频处理方法、装置、设备以及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410051797.1A CN117615137B (zh) 2024-01-15 2024-01-15 一种视频处理方法、装置、设备以及存储介质

Publications (2)

Publication Number Publication Date
CN117615137A CN117615137A (zh) 2024-02-27
CN117615137B true CN117615137B (zh) 2024-04-09

Family

ID=89951887

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410051797.1A Active CN117615137B (zh) 2024-01-15 2024-01-15 一种视频处理方法、装置、设备以及存储介质

Country Status (1)

Country Link
CN (1) CN117615137B (zh)

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1277517A (zh) * 1999-06-12 2000-12-20 三星电子株式会社 用于视频分组传输的无线通信系统
CN109120929A (zh) * 2018-10-18 2019-01-01 北京达佳互联信息技术有限公司 一种视频编码、解码方法、装置、电子设备及系统
CN110490119A (zh) * 2019-08-14 2019-11-22 腾讯科技(深圳)有限公司 重复视频标记方法、装置和计算机可读存储介质
KR102140398B1 (ko) * 2019-05-27 2020-07-31 한국항공대학교산학협력단 영상 처리 장치 및 영상 처리 방법
CN113068042A (zh) * 2021-03-19 2021-07-02 浪潮(北京)电子信息产业有限公司 一种视频压缩方法、系统及装置
CN115134656A (zh) * 2021-03-26 2022-09-30 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN115941958A (zh) * 2022-12-08 2023-04-07 北京淳中科技股份有限公司 一种视频编码方法、装置、电子设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8135063B2 (en) * 2006-09-08 2012-03-13 Mediatek Inc. Rate control method with frame-layer bit allocation and video encoder

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1277517A (zh) * 1999-06-12 2000-12-20 三星电子株式会社 用于视频分组传输的无线通信系统
CN109120929A (zh) * 2018-10-18 2019-01-01 北京达佳互联信息技术有限公司 一种视频编码、解码方法、装置、电子设备及系统
KR102140398B1 (ko) * 2019-05-27 2020-07-31 한국항공대학교산학협력단 영상 처리 장치 및 영상 처리 방법
CN110490119A (zh) * 2019-08-14 2019-11-22 腾讯科技(深圳)有限公司 重复视频标记方法、装置和计算机可读存储介质
CN113068042A (zh) * 2021-03-19 2021-07-02 浪潮(北京)电子信息产业有限公司 一种视频压缩方法、系统及装置
CN115134656A (zh) * 2021-03-26 2022-09-30 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN115941958A (zh) * 2022-12-08 2023-04-07 北京淳中科技股份有限公司 一种视频编码方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN117615137A (zh) 2024-02-27

Similar Documents

Publication Publication Date Title
CN112801164A (zh) 目标检测模型的训练方法、装置、设备及存储介质
CN113222916B (zh) 采用目标检测模型检测图像的方法、装置、设备和介质
CN112488060B (zh) 目标检测方法、装置、设备和介质
CN114282670A (zh) 神经网络模型的压缩方法、设备和存储介质
CN117615137B (zh) 一种视频处理方法、装置、设备以及存储介质
CN116567246A (zh) Avc编码方法和装置
CN115174774B (zh) 一种深度图像的压缩方法、装置、设备及存储介质
CN115205163B (zh) 一种标识图像的处理方法、装置、设备及存储介质
CN114724144B (zh) 文本识别方法、模型的训练方法、装置、设备及介质
CN114549904B (zh) 视觉处理及模型训练方法、设备、存储介质及程序产品
CN116761020A (zh) 视频处理方法、装置、设备和介质
CN115035605A (zh) 基于深度学习的动作识别方法、装置、设备及存储介质
CN113989152A (zh) 图像增强方法、装置、设备以及存储介质
CN113033373A (zh) 用于训练人脸识别模型及识别人脸的方法及相关装置
CN115482422B (zh) 深度学习模型的训练方法、图像处理方法和装置
CN116260973B (zh) 一种时域滤波方法、装置、电子设备及存储介质
CN114501026B (zh) 视频编码方法、装置、设备及存储介质
CN112866693B (zh) 编码单元cu的划分方法、装置、电子设备和存储介质
CN117278765B (zh) 一种视频压缩方法、装置、设备以及存储介质
CN116996503B (zh) 一种桌面图像传输方法、系统、电子设备及介质
CN117459719A (zh) 一种参考帧选择方法、装置、电子设备和存储介质
CN117574404A (zh) 一种图像安全处理方法、装置、设备及存储介质
CN117014602A (zh) 参考帧筛选模型的训练方法、装置及计算机程序产品
CN117097955A (zh) 视频处理方法、装置、设备和存储介质
CN116361658A (zh) 模型训练方法、任务处理方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant