CN110944201A - 一种视频去重压缩的方法、装置、服务器及存储介质 - Google Patents

一种视频去重压缩的方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110944201A
CN110944201A CN201911213186.8A CN201911213186A CN110944201A CN 110944201 A CN110944201 A CN 110944201A CN 201911213186 A CN201911213186 A CN 201911213186A CN 110944201 A CN110944201 A CN 110944201A
Authority
CN
China
Prior art keywords
image
frame image
convolution
current frame
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911213186.8A
Other languages
English (en)
Inventor
闫骏
刘青青
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Cloud Data Technology Co Ltd
Original Assignee
Shenzhen Cloud Data Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Cloud Data Technology Co Ltd filed Critical Shenzhen Cloud Data Technology Co Ltd
Priority to CN201911213186.8A priority Critical patent/CN110944201A/zh
Publication of CN110944201A publication Critical patent/CN110944201A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明实施例公开了一种视频去重压缩的方法、装置、服务器及存储介质,该方法包括:从目标视频中提取第一帧图像作为压缩集合的基准图像;获取所述第一帧图像的神经卷积图像特征;针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;判断所述距离是否大于预设阈值;若大于,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;若小于,则将所述当前帧图像删除。本发明实施例的技术方案,通过计算当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离,将神经网络技术融合到了视频去重压缩技术中,大大减少了视频压缩的数据量,提高了压缩效率。

Description

一种视频去重压缩的方法、装置、服务器及存储介质
技术领域
本发明实施例涉及视频压缩技术,尤其涉及一种视频去重压缩的方法、装置、服务器及存储介质。
背景技术
目前,随着视频监控行业的快速发展,视频压缩技术越来越重要。传统视频压缩技术的发展已经进入停滞期,无法实现较大的突破,随着神经网络的快速发展,我们可以使用神经网络实现更高效率的视频压缩。
基于此,在传统视频压缩已经可以提供较为优秀的视频压缩效率的基础上,如何能将神经网络融入视频压缩来提高视频压缩效率显得尤为重要。
发明内容
本发明实施例提供一种视频去重压缩的方法、装置、服务器及存储介质,以实现减少视频压缩的数据量,提高压缩效率。
第一方面,本发明实施例提供了一种视频去重压缩的方法,包括:
从目标视频中提取第一帧图像作为压缩集合的基准图像;
获取所述第一帧图像的神经卷积图像特征;
针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;
判断所述距离是否大于预设阈值;
若大于,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;
若小于,则将所述当前帧图像删除。
可选的,所述获取所述第一帧图像的神经卷积图像特征,包括:
将所述第一帧图像输入预设的神经卷积网络,获取所述第一帧图像的特征描述子。
可选的,所述计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离,包括:
获取所述当前帧图像的第一神经卷积图像特征和所述基准图像的第二神经卷积图像特征;
根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离。
可选的,所述根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离的公式为:
Figure BDA0002298725270000021
其中,A为第一神经卷积图像特征,B为第二神经卷积图像特征。
可选的,所述方法还包括:
确认预设的视频压缩算法;
根据所述预设的视频压缩算法对所述压缩集合进行视频压缩。
第二方面,本发明实施例还提供了一种视频去重压缩的装置,包括:
首次提取单元,用于从目标视频中提取第一帧图像作为压缩集合的基准图像;
首次特征单元,用于获取所述第一帧图像的神经卷积图像特征;
距离计算单元,用于针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;
距离判断单元,用于判断所述距离是否大于预设阈值;
存入压缩单元,用于若大于预设阈值,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;
当前删除单元,用于若小于预设阈值,则将所述当前帧图像删除。
可选的,所述距离计算单元,还用于获取所述当前帧图像的第一神经卷积图像特征和所述基准图像的第二神经卷积图像特征;根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离。
可选的,所述根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离的公式为:
Figure BDA0002298725270000031
其中,A为第一神经卷积图像特征,B为第二神经卷积图像特征。
第三方面,本发明实施例还提供了一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中任一所述的视频去重压缩的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中任一所述的视频去重压缩的方法。
本发明实施例的技术方案,通过计算当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离,将神经网络技术融合到了视频去重压缩技术中,大大减少了视频压缩的数据量,提高了压缩效率。
附图说明
图1是本发明实施例一中的一种视频去重压缩的方法的流程示意图;
图2是本发明实施例二中的一种视频去重压缩的装置的结构示意图;
图3是本发明实施例三中的一种服务器的结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各步骤描述成顺序的处理,但是其中的许多步骤可以被并行地、并发地或者同时实施。此外,各步骤的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
此外,术语“第一”、“第二”等可在本文中用于描述各种方向、动作、步骤或元件等,但这些方向、动作、步骤或元件不受这些术语限制。这些术语仅用于将第一个方向、动作、步骤或元件与另一个方向、动作、步骤或元件区分。举例来说,在不脱离本申请的范围的情况下,可以将第一速度差值称为第二速度差值,且类似地,可将第二速度差值称为第一速度差值。第一速度差值和第二速度差值两者都是速度差值,但其不是同一速度差值。术语“第一”、“第二”等不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
实施例一
图1为本发明实施例一提供的一种视频去重压缩的方法的流程示意图,本发明实施例可适用于视频去重压缩的情况。本发明实施例的方法可以由视频去重压缩的装置来执行,该装置可以由软件和/或硬件的方式实现,并一般可集成于服务器或终端设备中。参照图1,本发明实施例的视频去重压缩的方法,具体包括如下步骤:
步骤S110、从目标视频中提取第一帧图像作为压缩集合的基准图像。
具体的,目标视频为需要进行处理的视频,例如,一段监控视频。视频实际上是由多张连续的图像按照时间顺序组合而成的,帧就是视频中最小单位的单幅图像,一帧就是一副图像。压缩集合为对目标视频进行压缩后的视频集合,基准图像为压缩集合中用来与目标视频中的当前帧图像计算判断当前帧图像是否要存入压缩集合的图像。在本发明实施例中,基准图像为压缩集合中的最后一帧图像,即最后存入压缩集合的图像。在压缩集合刚建立时,就从目标视频中提取第一帧图像作为压缩集合的第一帧图像,此时,也是压缩集合的基准图像,随着新图像存入压缩集合,基准图像也在不断变化,不断更新为刚存入压缩集合的图像。
步骤S120、获取所述第一帧图像的神经卷积图像特征。
具体的,神经卷积图像特征是指采用神经卷积网络提取的第一帧图像的特征信息。例如,在交通路口的视频监控中,一般一天24小时都处在拍摄获取图像当中,不同帧画面可能有人或车经过,也可能没有人或车经过。有人或车经过和没人或车经过的图像特征是不一样的。该神经卷积图像特征包含有目标对象的特征信息,这些特征信息可以包括人脸特征、步态特征、燃烧特征、烟雾特征等。本实施的图像特征是基于VGG-16卷积神经网络提取的第一帧图像的整体特征。例如,使用VGG-16卷积神经网络来提取当前帧画面的图像特征。具体先后使用卷积、padding(填充)、pooling(池化)、flatten(拉开)、dropout(丢弃)等步骤来提取当前帧画面的图像特征。例如,卷积过程是基于一个小矩阵,也就是卷积核,在每层像素矩阵上不断按步长扫过去的,扫到数与卷积核对应位置的数相乘,然后求总和,每扫一次,得到一个值,全部扫完则生成一个新的矩阵。padding是在每次卷积操作之前,在原矩阵外边补包一层0,可以只在横向补,或只在纵向补,或者四周都补0,从而使得卷积后输出的图像跟输入图像在尺寸上一致。pooling是在一个小矩阵区域内,取该区域的最大值或平均值来代替该区域,该小矩阵的大小可以在搭建网络的时候自己设置。flatten是指将多维的矩阵拉开,变成一维向量来表示。dropout是指在网络的训练过程中,按照一定的概率将网络中的神经元丢弃,这样有效防止过拟合。在本发明实施例中,获取所述第一帧图像的神经卷积图像特征,即将所述第一帧图像输入预设的神经卷积网络,获取所述第一帧图像的特征描述子。VGG16前13的卷积层,在pool5之后,进行ROI感兴趣采样,最后经过一层NIP(嵌套不变性池化),得到512个特征描述子。其中,NIP模型是MPEG的一个模型,通过使用该模型对深度特征描述符进行转换,来提高其对几何转换的鲁棒性。NIP是主要针对视频检索中描述子的平移、旋转和缩放不变性的问题,提出了一种基于不变性理论的嵌套不变性池化的方法,使描述子具有更好的紧凑性和良好的全局性能。通俗点说就是一张图片进行90°、180°、270°和原图四种旋转,得到四组不同的feature map,再对这四组feature map进行ROI感兴趣采样,得到四组特征描述子,再进行均值池化,得到四个新的特征描述子,再对这四个新的特征描述子进行一次最大值池化,形成这一帧的512个特征描述子。在提取特征值之后就是特征值的表达,特征值是一个512位的浮点向量,每一个浮点数的范围在[-0.3,0.3],精度达到18位,其包含了一张图片的所有特征。比如一张图片里有车、有人、有红绿灯、有斑马线,那么,这512位的浮点向量就包含了车、人、红绿灯、斑马线所有的特征,该向量由机器分析,人是看不出这个向量里哪个是代表车,哪个是代表人。对于存储方式,本地视频文件生成的特征描述子以二进制文件(拥有特定文件头标识)存储在本地文件系统;视频流的特征描述子,按照时间序列存储在时序数据库中。
替代实施例中用于提取图像特征的神经卷积网络也可以包括KNN(k-NearestNeighbor)计算模型,Svm(Support Vector Machine)计算模型、随机森林(RandomForests)计算模型、Adaboost计算模型中的至少一种。本实施例提取的图像特征可以是LBP(Local Binary Pattern)特征、Hog(Histogram of Oriented Gradient)特征、Surf(Speeded Up Robust Features)特征和Sift(Scale-Invariant Feature Transform)特征中的至少一个。所述LBP特征是通过LBP算子提取的第一图像的局部的纹理特征。所述Hog特征是通过HOG算子计算和统计的第一图像局部区域的梯度方向直方图来构成的直方图特征。Sift特征是通过Sift算子提取的第一图像的尺度不变特征。Surf特征是通过在Sift算子基础上改进的Surf算子提取的第一图像的尺度不变特征。
步骤S130、针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离。
具体的,神经卷积图像特征是指采用卷积神经网络提取的预设图像的特征信息,该特征信息是目标对象的一些特征,包括但不限于人脸特征、步态特征、燃烧特征、烟雾特征等。例如,需要识别一辆小轿车是否出现在一段监控视频中,在小轿车在视频画面出现之前,监控视频画面中只有环境画面,基本不发生变化。在不发生变化的监控视频中,连续出现的每一帧图像基本相同,前一帧图像和后一帧图像的神经卷积图像特征的距离比较小。此时,前后两帧的神经卷积图像特征的图像特征的类型相同,可以是LBP(LocalBinaryPattern)特征、Hog(HistogramofOrientedGradient)特征、Surf(SpeededUpRobustFeatures)特征和Sift(Scale-InvariantFeatureTransform)特征中的至少一个。在本发明实施例中,从目标视频中提取第一帧图像作为压缩集合的基准图像后,计算第二帧图像的神经卷积图像特征和该基准图像的神经卷积图像特征的距离,该距离越小,说明第二帧图像和基准图像越相似,该距离越大,说明第二帧图像和基准图像差异越大,当该距离大于某个阈值时,说明第二帧图像和基准图像差异较大,不能舍弃,所以将第二帧图像存入压缩集合并定义为新的基准图像,用于和目标视频的第三帧图像进行计算比较;当该距离小于某个阈值时,说明第二帧图像和基准图像非常相似,可以删除,此时,基准图像不变,还是原来目标视频的第一帧图像。在计算第二帧图像之后,就提取第三帧图像,计算第三帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离,此时的基准图像可能是第二帧图像,也可能是第一帧图像,取决于前面第二帧图像与前面基准图像的神经卷积图像特征的距离。当该第三帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离大于某个阈值时,说明第三帧图像和基准图像差异较大,不能舍弃,所以将第三帧图像存入压缩集合并定义为新的基准图像,用于和目标视频的第四帧图像进行计算比较;当该距离小于某个阈值时,说明第三帧图像和基准图像非常相似,可以删除,此时,基准图像不变,还继续用于和目标视频的第四帧图像进行计算比较。
下面具体描述如何计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离:
步骤S130-1、获取所述当前帧图像的第一神经卷积图像特征和所述基准图像的第二神经卷积图像特征。
具体的,一实施例以KNN计算模型为例说明所述第一神经卷积图像特征和所述第二神经卷积图像特征。具体地,一实施例中,当前帧图像大小以1280*720像素为例,图像特征以LBP特征为例,1280*720的图像包括921600个图像元素,便是1*921600的向量,如果提取到当前帧图像的目标LBP特征,当前帧图像的第一神经卷积图像特征为一个1*921600的向量,记为AA[AA0,AA1……AA921599];相应的,基准图像的第二神经卷积图像特征记为BB[BB0,BB1……BB921599]。
步骤S130-2、根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离。
具体的,例如,一实施例中,当前帧图像A的第一神经卷积图像特征为一个1*512的向量,记为A[A0,A1……A511];基准图像B的第二神经卷积图像特征B[B0,B1……B511]。将当前帧图像A的第一神经卷积图像特征的每个元素Ai与基准图像B的第二神经卷积图像特征的每个元素Bi做余弦距离计算:
Figure BDA0002298725270000101
其中,n=512,Ai和Bi分别代表A和B的各512分量。计算两帧图片的余弦距离,若为1,则表示完全不同;若为0,则表示完全相同。即:值越大,越差异越大。
步骤S140、判断所述距离是否大于预设阈值。
步骤S150、若大于,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像。
具体的,若当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离大于预设阈值,表明这两帧图像的神经卷积图像特征的距离比较大,即这两帧图像具有较大差异,则将当前帧图像存入所述压缩集合并定义为新的基准图像。
步骤S160、若小于,则将所述当前帧图像删除。
具体的,若当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离小于预设阈值,表明这两帧图像的神经卷积图像特征的距离比较小,即这两帧图像非常相似,则将当前帧图像删除。
作为一可选实施例,在筛选出压缩集合后,选择预设的视频压缩算法;根据所述预设的视频压缩算法对所述压缩集合进行视频压缩。这里的视频压缩算法可以是目前现有的算法,也可以是以后新提出的算法,本发明对此不作限定。
本发明实施例的技术方案,通过计算当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离,将神经网络技术融合到了视频去重压缩技术中,大大减少了视频压缩的数据量,提高了压缩效率。
实施例二
本发明实施例所提供的一种视频去重压缩的装置可执行本发明任意实施例所提供的一种视频去重压缩的方法,具备执行方法相应的功能模块和有益效果,该装置可以由软件和/或硬件(集成电路)的方式实现,并一般可集成于服务器或终端设备中。图2是本发明实施例二中的视频去重压缩的装置200的结构示意图。参照图2,本发明实施例的视频去重压缩的装置200具体可以包括:
首次提取单元210,用于从目标视频中提取第一帧图像作为压缩集合的基准图像;
首次特征单元220,用于获取所述第一帧图像的神经卷积图像特征;
距离计算单元230,用于针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;
距离判断单元240,用于判断所述距离是否大于预设阈值;
存入压缩单元250,用于若大于预设阈值,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;
当前删除单元260,用于若小于预设阈值,则将所述当前帧图像删除。
可选的,所述首次特征单元220还用于将所述第一帧图像输入预设的神经卷积网络,获取所述第一帧图像的特征描述子。
可选的,所述距离计算单元230,还用于获取所述当前帧图像的第一神经卷积图像特征和所述基准图像的第二神经卷积图像特征;根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离。
可选的,所述根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离的公式为:
Figure BDA0002298725270000121
其中,A为第一神经卷积图像特征,B为第二神经卷积图像特征。
可选的,所述装置200还包括:
第二图像压缩单元,用于确认预设的视频压缩算法;根据所述预设的视频压缩算法对所述压缩集合进行视频压缩。
本发明实施例的技术方案,通过计算当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离,将神经网络技术融合到了视频去重压缩技术中,大大减少了视频压缩的数据量,提高了压缩效率。
实施例三
图3为本发明实施例三提供的一种服务器的结构示意图,如图3所示,该服务器包括处理器310、存储器320、输入装置330和输出装置340;服务器中处理器310的数量可以是一个或多个,图3中以一个处理器310为例;服务器中的处理器310、存储器320、输入装置330和输出装置340可以通过总线或其他方式连接,图3中以通过总线连接为例。
存储器320作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的视频去重压缩的方法对应的程序指令/模块(例如,视频去重压缩的装置200中的第一图像提取单元210、第一特征获取单元220、第二图像生成单元230和第二图像压缩单元240)。处理器310通过运行存储在存储器320中的软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述的视频去重压缩的方法。
也即:
从目标视频中提取第一帧图像作为压缩集合的基准图像;
获取所述第一帧图像的神经卷积图像特征;
针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;
判断所述距离是否大于预设阈值;
若大于,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;
若小于,则将所述当前帧图像删除。
当然,本发明实施例所提供的服务器,其处理器不限于执行如上所述的方法操作,还可以执行本发明任意实施例所提供的视频去重压缩的方法中的相关操作。
存储器320可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据终端的使用所创建的数据等。此外,存储器320可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器320可进一步包括相对于处理器310远程设置的存储器,这些远程存储器可以通过网络连接至服务器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置330可用于接收输入的数字或字符信息,以及产生与服务器的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
本发明实施例的技术方案,通过计算当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离,将神经网络技术融合到了视频去重压缩技术中,大大减少了视频压缩的数据量,提高了压缩效率。
实施例四
本发明实施例四还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种视频去重压缩的方法,该方法包括:
从目标视频中提取第一帧图像作为压缩集合的基准图像;
获取所述第一帧图像的神经卷积图像特征;
针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;
判断所述距离是否大于预设阈值;
若大于,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;
若小于,则将所述当前帧图像删除。
当然,本发明实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本发明任意实施例所提供的视频去重压缩的方法中的相关操作。
本发明实施例的计算机可读存储介质,可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
存储介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或终端上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本发明实施例的技术方案,通过计算当前帧图像的神经卷积图像特征和基准图像的神经卷积图像特征的距离,将神经网络技术融合到了视频去重压缩技术中,大大减少了视频压缩的数据量,提高了压缩效率。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (10)

1.一种视频去重压缩的方法,其特征在于,包括:
从目标视频中提取第一帧图像作为压缩集合的基准图像;
获取所述第一帧图像的神经卷积图像特征;
针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;
判断所述距离是否大于预设阈值;
若大于,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;
若小于,则将所述当前帧图像删除。
2.根据权利要求1所述的视频去重压缩的方法,其特征在于,所述获取所述第一帧图像的神经卷积图像特征,包括:
将所述第一帧图像输入预设的神经卷积网络,获取所述第一帧图像的特征描述子。
3.根据权利要求2所述的视频去重压缩的方法,其特征在于,所述计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离,包括:
获取所述当前帧图像的第一神经卷积图像特征和所述基准图像的第二神经卷积图像特征;
根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离。
4.根据权利要求3所述的视频去重压缩的方法,其特征在于,所述根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离的公式为:
Figure FDA0002298725260000021
其中,A为第一神经卷积图像特征,B为第二神经卷积图像特征。
5.根据权利要求1所述的视频去重压缩的方法,其特征在于,所述方法还包括:
确认预设的视频压缩算法;
根据所述预设的视频压缩算法对所述压缩集合进行视频压缩。
6.一种视频去重压缩的装置,其特征在于,包括:
首次提取单元,用于从目标视频中提取第一帧图像作为压缩集合的基准图像;
首次特征单元,用于获取所述第一帧图像的神经卷积图像特征;
距离计算单元,用于针对所述目标视频的第二帧图像开始的每一帧图像,计算当前帧图像的神经卷积图像特征和所述基准图像的神经卷积图像特征的距离;
距离判断单元,用于判断所述距离是否大于预设阈值;
存入压缩单元,用于若大于预设阈值,则将所述当前帧图像存入所述压缩集合并定义为新的基准图像;
当前删除单元,用于若小于预设阈值,则将所述当前帧图像删除。
7.根据权利要求6所述的视频去重压缩的装置,其特征在于,所述距离计算单元,还用于获取所述当前帧图像的第一神经卷积图像特征和所述基准图像的第二神经卷积图像特征;根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离。
8.根据权利要求7所述的视频去重压缩的装置,其特征在于,所述根据所述第一神经卷积图像特征和所述第二神经卷积图像特征计算余弦距离作为所述距离的公式为:
Figure FDA0002298725260000031
其中,A为第一神经卷积图像特征,B为第二神经卷积图像特征。
9.一种服务器,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现根据权利要求1-5中任一所述的视频去重压缩的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现根据权利要求1-5中任一所述的视频去重压缩的方法。
CN201911213186.8A 2019-12-02 2019-12-02 一种视频去重压缩的方法、装置、服务器及存储介质 Pending CN110944201A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911213186.8A CN110944201A (zh) 2019-12-02 2019-12-02 一种视频去重压缩的方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911213186.8A CN110944201A (zh) 2019-12-02 2019-12-02 一种视频去重压缩的方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN110944201A true CN110944201A (zh) 2020-03-31

Family

ID=69908715

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911213186.8A Pending CN110944201A (zh) 2019-12-02 2019-12-02 一种视频去重压缩的方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110944201A (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111935506A (zh) * 2020-08-19 2020-11-13 百度时代网络技术(北京)有限公司 用于确定重复视频帧的方法和装置
CN113435515A (zh) * 2021-06-29 2021-09-24 青岛海尔科技有限公司 图片识别方法和装置、存储介质及电子设备
CN113556575A (zh) * 2021-07-19 2021-10-26 北京百度网讯科技有限公司 用于压缩数据的方法、装置、设备、介质和产品
CN114298992A (zh) * 2021-12-21 2022-04-08 北京百度网讯科技有限公司 一种视频帧去重方法、装置、电子设备及存储介质
CN115190320A (zh) * 2022-06-09 2022-10-14 武汉鸿宸信信息科技有限公司 一种用于视频处理与存储的云计算系统和方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633023A (zh) * 2017-08-25 2018-01-26 北京奇艺世纪科技有限公司 一种图像去重方法和装置
US20190045207A1 (en) * 2017-12-28 2019-02-07 Yen-Kuang Chen Context-aware image compression
CN110008916A (zh) * 2019-04-11 2019-07-12 深圳云朵数据科技有限公司 一种视频图像存储方法、装置、设备及存储介质
CN110414457A (zh) * 2019-08-01 2019-11-05 深圳云朵数据技术有限公司 一种用于视频监控的算力系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107633023A (zh) * 2017-08-25 2018-01-26 北京奇艺世纪科技有限公司 一种图像去重方法和装置
US20190045207A1 (en) * 2017-12-28 2019-02-07 Yen-Kuang Chen Context-aware image compression
CN110008916A (zh) * 2019-04-11 2019-07-12 深圳云朵数据科技有限公司 一种视频图像存储方法、装置、设备及存储介质
CN110414457A (zh) * 2019-08-01 2019-11-05 深圳云朵数据技术有限公司 一种用于视频监控的算力系统

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111935506A (zh) * 2020-08-19 2020-11-13 百度时代网络技术(北京)有限公司 用于确定重复视频帧的方法和装置
CN111935506B (zh) * 2020-08-19 2023-03-28 百度时代网络技术(北京)有限公司 用于确定重复视频帧的方法和装置
CN113435515A (zh) * 2021-06-29 2021-09-24 青岛海尔科技有限公司 图片识别方法和装置、存储介质及电子设备
CN113435515B (zh) * 2021-06-29 2023-12-19 青岛海尔科技有限公司 图片识别方法和装置、存储介质及电子设备
CN113556575A (zh) * 2021-07-19 2021-10-26 北京百度网讯科技有限公司 用于压缩数据的方法、装置、设备、介质和产品
CN114298992A (zh) * 2021-12-21 2022-04-08 北京百度网讯科技有限公司 一种视频帧去重方法、装置、电子设备及存储介质
CN115190320A (zh) * 2022-06-09 2022-10-14 武汉鸿宸信信息科技有限公司 一种用于视频处理与存储的云计算系统和方法

Similar Documents

Publication Publication Date Title
Chen et al. Single-image super-resolution algorithm based on structural self-similarity and deformation block features
CN110944201A (zh) 一种视频去重压缩的方法、装置、服务器及存储介质
JP5654127B2 (ja) インクリメントな特徴抽出を使用するオブジェクト認識
US20230196837A1 (en) Action recognition method and apparatus, and device and storage medium
CN107729809B (zh) 一种自适应生成视频摘要的方法、装置及其可读存储介质
CN112270755B (zh) 三维场景构建方法、装置、存储介质与电子设备
CN111402412A (zh) 数据采集方法及装置、设备、存储介质
CN114550070A (zh) 视频片段的识别方法、装置、设备以及存储介质
CN115205150A (zh) 图像的去模糊方法、装置、设备、介质及计算机程序产品
CN108229281B (zh) 神经网络的生成方法和人脸检测方法、装置及电子设备
CN113688839B (zh) 视频处理方法及装置、电子设备、计算机可读存储介质
Gong et al. FastRoadSeg: Fast monocular road segmentation network
CN112235598B (zh) 一种视频结构化处理方法、装置及终端设备
CN112257638A (zh) 一种图像比对方法、系统、设备及计算机可读存储介质
Liao et al. TransRef: Multi-scale reference embedding transformer for reference-guided image inpainting
CN110555406A (zh) 一种基于Haar-like特征及CNN匹配的视频运动目标识别方法
CN115393761A (zh) 视频关键帧提取方法、装置、设备和存储介质
CN113808157B (zh) 图像处理方法、装置、及计算机设备
CN115830342A (zh) 检测框的确定方法、装置、存储介质及电子装置
CN113033616B (zh) 高质量视频重建方法、装置、设备及存储介质
CN115631339A (zh) 视觉特征提取方法、装置及电子设备
CN117237386A (zh) 对目标对象进行结构化处理的方法、装置和计算机设备
CN112257666B (zh) 目标图像内容的聚合方法、装置、设备及可读存储介质
CN112487943B (zh) 关键帧去重的方法、装置和电子设备
CN115965839A (zh) 图像识别方法、存储介质及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20200331

RJ01 Rejection of invention patent application after publication