CN106851437A - 一种提取视频摘要的方法 - Google Patents
一种提取视频摘要的方法 Download PDFInfo
- Publication number
- CN106851437A CN106851437A CN201710035223.5A CN201710035223A CN106851437A CN 106851437 A CN106851437 A CN 106851437A CN 201710035223 A CN201710035223 A CN 201710035223A CN 106851437 A CN106851437 A CN 106851437A
- Authority
- CN
- China
- Prior art keywords
- similarity
- frame
- value
- clustering
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/85—Assembly of content; Generation of multimedia applications
- H04N21/854—Content authoring
- H04N21/8549—Creating video summaries, e.g. movie trailer
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种提取视频摘要的方法,包括:计算待提取视频段中所有帧图像的HSV直方图;计算出相邻两帧图像的相似性;通过自适应局部双阈值法检测镜头的转换,在存在镜头转换的地方对视频进行切割,最后形成一个镜头集合;采用基于自适应阈值的聚类方法将相似的镜头规整到一个聚类集合中;取一个镜头聚类,进行的关键帧提取;重复S6操作,直到所有的镜头聚类都已完成关键帧提取为止;对获取的关键帧按照时间顺序进行组合,形成最后的视频摘要。本方法使用更接近人类感知的L值作为特征,通过相邻帧差的欧式距离获取优选极大值点,极大程度上确定了最优的关键帧数及较合理的初始聚类中心,加快了收敛速度。
Description
技术领域
本发明涉及视频图像处理技术领域,具体涉及一种提取视频摘要的方法。
背景技术
视频摘要对视频的意义正如文章摘要对文章的意义。视频摘要是用来对整个视频内容做总结说明,通过视频摘要让观看者理解整个视频的大致内容,以提高视频的访问效率。
提取视频摘要最重要的一步是提取关键帧,对于多镜头的视频,需要在镜头分割的基础上,采用聚类方法将同一镜头所包含的n帧图像分别归类到不同聚类中,从每个类中选取某一帧作为这个类的代表帧,从而形成关键帧集合。现有技术中提取关键帧通常都是用K-means算法,该算法首先随机选择K个对象作为初始的K个聚类的中心,然后对剩余的每个对象,根据其与各个中心的距离,将它归给最近的聚类,然后重新计算每个聚类的中心,不断重复直至准则函数收敛。但是在实际应用中这个K值的选定是很难估计的,绝大多数情况下事先并不知道给定的数据集应该分成多少个聚类才最合适;而且随机选择初始聚类中心,对聚类结果有较大的影响,一旦初始值选择不好,可能无法得到有效的聚类结果;该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销非常大。
发明内容
本发明要解决的技术问题是:现有视频摘要生成过程中提取关键帧时存在盲目性、聚类结果不准确和计算复杂性高的问题。
为解决上述问题,本发明提出了一种提取视频摘要的方法,包括以下步骤:
S1、基于直方图法对视频进行镜头分割,具体包括:
S1.1、计算视频中每帧图像的H、S、V分量值,对上述三个分量值进行非等间隔量化后合成每帧图像的特征矢量La=(La(1),La(2),…,La(G)),其中La为第a帧图像的特征矢量,G为第a帧图像的总像素数,a∈[1,P-1],P为视频中图像的总帧数;
S1.2、对每帧图像的特征矢量做归一化处理,得到归一化特征矢量,计算两两相邻图像的相似度;
S1.3、采用双阈值法检测镜头转换,根据检测结果将视频分割成多个镜头;
S1.4、使用聚类算法将上述镜头划分到多个镜头聚类中;
S2、取一个镜头聚类,对该镜头聚类进行关键帧提取,具体包括:
S2.1、计算本镜头聚类中两两相邻图像的帧差diffn(i)=Ln+1(i)-Ln(i),i∈[1,G],n∈[1,N-1],其中diffn(i)为第n+1帧与第n帧在第i像素的帧差,N为本镜头聚类中图像的总帧数;
S2.2、计算相邻帧差之间的欧式距离其中m∈[1,N-2],diffm(i)为第m+1帧与第m帧在第i像素的帧差,diffm+1(i)为第m+2帧与第m+1帧在第i像素的帧差;
S2.3、以m为横坐标,de(m)为纵坐标绘制二维坐标曲线,找出所有极大值点;
S2.4、求所有极大值点纵坐标的平均值,选取纵坐标值大于平均值的极大值点为优选极值点,优选极值点的个数K为聚类个数,找出各个优选极值点的横坐标对应的图像,将对应图像的特征矢量作为各个聚类的聚类中心;
S2.5、计算每帧图像的特征矢量与聚类中心的欧式距离,并把每帧图像归到最近的聚类中;
S2.6、计算各聚类中所有图像的特征矢量的均值,作为各个聚类的新的聚类中心;
S2.7、重复步骤S2.5和S2.6,直到目标函数达到最优或者达到最大迭代次数为止,其中目标函数为最小化该聚类中所有图像的特征矢量到其聚类中心的距离的平方和;
S2.8、输出上述得到的K个聚类中心,提取距离上述K个聚类中心最近的帧图像为本镜头聚类的关键帧;
S3、重复步骤S2,直到所有的镜头聚类完成关键帧提取为止;
S4、对获取的所有关键帧按照时间顺序进行组合,形成视频摘要。
作为本发明的进一步改进,步骤S1.3中使用自适应方法设置双阈值,设置双阈值的具体步骤为:计算当前检测图像与其后连续的w帧图像的两两相邻图像的相似度,得到共w个相似度,再计算w个相似度的平均值和标准值,最后求得两个阈值:
THb=QH(Gb-cRb),TLb=QLGb
其中THb为检测第b帧图像与第b+1帧图像之间是否具有镜头转换的高阈值,TLb为检测第b帧图像与第b+1帧图像之间是否具有镜头转换的高阈值,w为预设值,为相似度的平均值,为相似度的标准值,Dj为求取的w个相似度中的第j个相似度,标准值系数c的取值范围是[1,3],高阈值系数QH的取值范围是[0.8,1.0],低阈值系数QL的取值范围是[0.3,0.5]。
作为本发明的进一步改进,步骤S1.4中使用自适应阈值的聚类方法将镜头分类,具体包括:计算视频中所有图像的两两相邻图像之间的相似度;对每个相似度对应求取一个方差和,该方差和为所有大于该相似度值的相似度的方差与所有小于该相似度值的相似度的方差的和;找到最小的方差和所对应的相似度,设置聚类阈值的大小为该相似度的大小;分别计算出每个镜头的所有图像的特征矢量的平均值,计算相邻镜头间的镜头相似度,将镜头相似度大于聚类阈值的连续镜头归为一个镜头聚类,从而得到多个镜头聚类。
本发明的有益效果:(1)本发明方法在提取关键帧时,采用了一种改进的K-means算法,与传统的K-means算法相比,本方法将图像特征由原来的灰度值改为更接近人类感知的特征矢量值,H、S、V这3个分量相对独立,在进行图形图像分析处理时计算量相对较小,算法效率更高;(2)通过相邻帧差的欧式距离获取优选极大值点,从而获得了最优的关键帧数,即聚类的个数,同时获得较合理的初始聚类中心,使得聚类结果更准确,加快了收敛速度,解决了传统K-means算法存在的盲目性;(3)本发明方法在进行关键帧提取之前对分割形成的多个镜头使用聚类方法,将相似镜头置放在一个聚类集合中,从而消除同一类镜头冗余,得到更具概括性的关键帧。
附图说明
图1为本发明提取视频摘要流程图。
图2为相似镜头聚类示意图。
图3为提取关键帧的流程图。
具体实施方式
本发明提出了一种提取视频摘要的方法,包括以下步骤:
S1、基于直方图法对视频进行镜头分割,具体包括:
S1.1、计算视频中每帧图像的H(色调)、S(饱和度)、V(明度)分量值,对上述三个分量值进行非等间隔量化后合成每帧图像的特征矢量。
以图像的每个像素为单位计算HVS分量:
为了减小计算量提高效率,本方法按照人的视觉感知和分辨能力,根据表1和表2对HSV进行非等间隔量化,把H分为8份,S和V分别分为3份。
表1 H的量化表
取值范围 | [316,20) | [20,40) | [40,75) | [75,155) | [155,190) | [190,270) | [270,295) | [295,316) |
量化值 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 |
表2 S和V的量化表
取值范围 | [0,0.2) | [0.2,0.7) | [0.7,1.0) |
量化值 | 0 | 1 | 2 |
将量化后的H、V、S合成特征值:L(i)=9H(i)+3S(i)+V(i),其中L(i)为该图像的第i像素的特征值,H(i)为第i像素的量化后的H值,S(i)为第i像素的量化后的S值,V(i)为第i像素的量化后的V值。
图像的特征矢量由图像中每个像素的特征值构成:L=(L(1),L(2),…,L(G)),其中L(1)为图像的第1像素的特征值,依次类推,G为图像的总像素数。第a帧图像的特征矢量用La=(La(1),La(2),…,La(G))表示,a∈[1,P-1],P为视频中图像的总帧数。
S1.2、将每帧图像的特征矢量进行归一化处理,得到归一化特征矢量:
La'=(La(1)',La(2)',…,La(G)')
其中La'为第a帧图像的归一化特征矢量,La(i)为第a帧图像的第i像素的特征值。
计算视频中两两相邻帧图像的相似度:
其中sim(a,a+1)为第a帧和第a+1帧之间的相似度,La(i)'和La+1(i)'分别为第a帧和第a+1帧图像的归一化特征矢量,G为每帧图像的总像素数。两帧图像相似度的取值范围为0到1,两帧图像的差异越小值越大,如果两帧图像的HSV分布相同,那么它们的相似度为1。
S1.3、视频镜头的转换有切变和渐变之分,通常渐变过程的帧差异值幅度要比切变小,而且渐变是一个持续过程,用单一的阈值无法准确判断渐变过程,故本发明使用双阈值法来检测镜头的转换。首先设置两个阈值TL和TH(TL<TH),计算视频中相邻帧的相似度,若相似度值大于TH,则认为发生了镜头突变,若相似度小于TH大于TL,则认为开始发生镜头渐变,此时累加此后的相似度,直到累加值达到TH,认为镜头渐变结束,若在累加过程中帧差异值回落到TL以下,则认为无镜头转换,停止累加,重新判断。针对找到的这些位置,将视频分割成多个镜头。
考虑到在整个视频检测中使用相同的阈值,对内容变化较大的视频可能产生误检,对内容变化较小的视频可能产生漏检,本发明优选采用自适应方法设置双阈值,具体的双阈值的计算方法是:设计一个窗口宽度w帧,步长为1的滑动窗口,若检测第b帧与第b+1帧之间是否有镜头转换,则计算从第b帧到第b+w+1帧内的两两相邻图像的相似度,得到共w个相似度,计算w个相似度的平均值和标准方差:
其中Dj为求取的第b帧图像到第b+w+1帧图像的两两相邻图像的相似度中的第j个相似度,w为预设值。
计算两个阈值:
THb=QH(Gb-cRb),TLb=QLGb
其中THb为检测第b帧图像与第b+1帧图像之间是否具有镜头转换的高阈值,TLb为检测第b帧图像与第b+1帧图像之间是否具有镜头转换的低阈值,c的取值范围是[1,3],高阈值系数QH的取值范围是[0.8,1.0],低阈值系数QL的取值范围是[0.3,0.5]。
本发明具体实施例中滑动窗口的宽度w设为5,c设为2,QH设为0.9,QL设为0.4。
上述优选实施例根据待检测图像与后续w帧图像之间的两两相邻图像的相似度来设置双阈值,在整个视频检测过程中不断自适应调整双阈值,对内容变化较大的视频或这内容变化较小的视频均可准确检测,提高镜头检测的准确度。
S1.4、经过分割得到的多个镜头,其中会存在很多相似镜头,为了消除镜头冗余,得到更具概括性的关键帧,本发明采用基于自适应阈值的聚类方法将相似的镜头规整到一个镜头聚类中,其中求取自适应阈值的步骤如下:
S1.4.1、计算整个视频的所有相邻帧之间的相似度,组成相似度数组Sim,将所有相似度从小到大进行排序,得到一个新的数组S,其中数组Sim和S的元素个数为P-1;
S1.4.2、设置循环变量e,赋值为1;
S1.4.3、以数组S中第e个元素Se为界,将数组S分割为S1和S2两个数组,分别计算两个数组的方差d1(e)和d2(e);
S1.4.4、计算两个数组的方差和D(e)=d1(e)+d2(e),并存入到数组D中,循环变量e增加1;
S1.4.5、判断e是否大于P-1,若条件不成立,则跳到S1.4.3,否则在数组D中找到最小值D(k),从而找到最小值D(k)对应的那个作为分界点的元素Sk;
S1.4.6、设置聚类阈值为Sk;
S1.4.7、分别计算出每个镜头中的所有图像的特征矢量的平均值,以此作为每个镜头的平均直方图,计算相邻镜头间的相似度,将相似度大于聚类阈值Sk的连续子镜头归为一个镜头聚类,依次判断将所有镜头分为多个镜头聚类。
这些相邻镜头聚类之间的差别比较明显,这样就达到减少了镜头之间冗余的目的。最终就得到了图2所示的镜头聚类。
S2、取一个镜头聚类,对该镜头聚类进行关键帧提取:
S2.1、计算该镜头聚类中两两相邻图像的帧差diffn(i)=Ln+1(i)-Ln(i),i∈[1,G],n∈[1,N-1],其中diffn(i)为第n+1帧与第n帧在第i像素的帧差,N为该镜头聚类中图像的帧数;
S2.2、计算相邻帧差之间的欧式距离其中m∈[1,N-2],diffm(i)为第m+1帧与第m帧在第i像素的帧差,diffm+1(i)为第m+2帧与第m+1帧在第i像素的帧差;
S2.3、以m为横坐标,de(m)为纵坐标绘制二维坐标曲线,绘制二维坐标曲线,找出所有极大值点(Xk,Yk)和极大值点的个数Q,其中k的取值范围为[1,Q];
S2.4、求所有极大值点的纵坐标Yk的平均值纵坐标值Yk大于的极大值点为优选极值点,优选极值点的个数K即为聚类个数,找出各个优选极值点的横坐标对应的图像,将对应图像的特征矢量作为各个聚类的聚类中心;
S2.5、计算每帧图像的特征矢量与各个聚类中心的欧式距离:
其中Lg(i)为第g个聚类中心的第i像素的特征值,Lf(i)为第f帧图像的第i像素的特征值;并把每帧图像归到最近的聚类;
S2.6、计算各聚类中所有图像的特征矢量的均值,即向量各维取平均,作为各个聚类的新的聚类中心;
S2.7、重复步骤S2.5和S2.6,直到目标函数达到最优或者达到最大迭代次数为止,其中目标函数为最小化该聚类中所有图像的特征矢量到其聚类中心的距离的平方和;
S2.8、输出上述得到的K个聚类中心,提取距离上述K个聚类中心最近的帧图像为本镜头聚类的关键帧。
S3、重复步骤S2,直到所有的镜头聚类完成关键帧提取为止。
S4、对获取的所有关键帧按照时间顺序进行组合,形成视频摘要。
Claims (3)
1.一种提取视频摘要的方法,其特征在于,包括以下步骤:
S1、基于直方图法对视频进行镜头分割,具体包括:
S1.1、计算视频中每帧图像的H、S、V分量值,对上述三个分量值进行非等间隔量化后合成每帧图像的特征矢量La=(La(1),La(2),…,La(G)),其中La为第a帧图像的特征矢量,G为第a帧图像的总像素数,a∈[1,P-1],P为视频中图像的总帧数;
S1.2、对每帧图像的特征矢量做归一化处理,得到归一化特征矢量,计算两两相邻图像的相似度;
S1.3、采用双阈值法检测镜头转换,根据检测结果将视频分割成多个镜头;
S1.4、使用聚类算法将上述镜头划分到多个镜头聚类中;
S2、取一个镜头聚类,对该镜头聚类进行关键帧提取,具体包括:
S2.1、计算本镜头聚类中两两相邻图像的帧差diffn(i)=Ln+1(i)-Ln(i),i∈[1,G],n∈[1,N-1],其中diffn(i)为第n+1帧与第n帧在第i像素的帧差,N为本镜头聚类中图像的总帧数;
S2.2、计算相邻帧差之间的欧式距离其中m∈[1,N-2],diffm(i)为第m+1帧与第m帧在第i像素的帧差,diffm+1(i)为第m+2帧与第m+1帧在第i像素的帧差;
S2.3、以m为横坐标,de(m)为纵坐标绘制二维坐标曲线,找出所有极大值点;
S2.4、求所有极大值点纵坐标的平均值,选取纵坐标值大于平均值的极大值点为优选极值点,优选极值点的个数K为聚类个数,找出各个优选极值点的横坐标对应的图像,将对应图像的特征矢量作为各个聚类的聚类中心;
S2.5、计算每帧图像的特征矢量与聚类中心的欧式距离,并把每帧图像归到最近的聚类中;
S2.6、计算各聚类中所有图像的特征矢量的均值,作为各个聚类的新的聚类中心;
S2.7、重复步骤S2.5和S2.6,直到目标函数达到最优或者达到最大迭代次数为止,其中目标函数为最小化该聚类中所有图像的特征矢量到其聚类中心的距离的平方和;
S2.8、输出上述得到的K个聚类中心,提取距离上述K个聚类中心最近的图像为本镜头聚类的关键帧;
S3、重复步骤S2,直到所有的镜头聚类完成关键帧提取为止;
S4、对获取的所有关键帧按照时间顺序进行组合,形成视频摘要。
2.根据权利要求1所述的提取视频摘要的方法,其特征在于,步骤S1.3中使用自适应方法设置双阈值,设置双阈值的具体步骤为:计算当前检测图像与其后连续的w帧图像的两两相邻图像的相似度,得到共w个相似度,再计算w个相似度的平均值和标准值,最后求得两个阈值:
THb=QH(Gb-cRb),TLb=QLGb
其中THb为检测第b帧图像与第b+1帧图像之间是否具有镜头转换的高阈值,TLb为检测第b帧图像与第b+1帧图像之间是否具有镜头转换的低阈值,w为预设值,为相似度的平均值,为相似度的标准值,Dj为求取的w个相似度中的第j个相似度,标准值系数c的取值范围是[1,3],高阈值系数QH的取值范围是[0.8,1.0],低阈值系数QL的取值范围是[0.3,0.5]。
3.根据权利要求1或2所述的提取视频摘要的方法,其特征在于,步骤S1.4中使用自适应阈值的聚类方法将镜头分类,具体包括:计算视频中所有图像的两两相邻图像之间的相似度;对每个相似度对应求取一个方差和,该方差和为所有大于该相似度值的相似度的方差与所有小于该相似度值的相似度的方差的和;找到最小的方差和所对应的相似度,设置聚类阈值的大小为该相似度的大小;分别计算出每个镜头的所有图像的特征矢量的平均值,计算相邻镜头间的镜头相似度,将镜头相似度大于聚类阈值的连续镜头归为一个镜头聚类,从而得到多个镜头聚类。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710035223.5A CN106851437A (zh) | 2017-01-17 | 2017-01-17 | 一种提取视频摘要的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710035223.5A CN106851437A (zh) | 2017-01-17 | 2017-01-17 | 一种提取视频摘要的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106851437A true CN106851437A (zh) | 2017-06-13 |
Family
ID=59125013
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710035223.5A Pending CN106851437A (zh) | 2017-01-17 | 2017-01-17 | 一种提取视频摘要的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106851437A (zh) |
Cited By (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108600865A (zh) * | 2018-05-14 | 2018-09-28 | 西安理工大学 | 一种基于超像素分割的视频摘要生成方法 |
CN108804578A (zh) * | 2018-05-24 | 2018-11-13 | 南京理工大学 | 基于一致性片段生成的无监督视频摘要方法 |
CN108924644A (zh) * | 2018-06-20 | 2018-11-30 | 北京优酷科技有限公司 | 视频片段提取方法及装置 |
CN108966004A (zh) * | 2018-06-27 | 2018-12-07 | 维沃移动通信有限公司 | 一种视频处理方法及终端 |
CN109151501A (zh) * | 2018-10-09 | 2019-01-04 | 北京周同科技有限公司 | 一种视频关键帧提取方法、装置、终端设备及存储介质 |
CN109327713A (zh) * | 2018-10-31 | 2019-02-12 | 微梦创科网络科技(中国)有限公司 | 一种媒体信息的生成方法和装置 |
CN109413510A (zh) * | 2018-10-19 | 2019-03-01 | 深圳市商汤科技有限公司 | 视频摘要生成方法和装置、电子设备、计算机存储介质 |
CN109635736A (zh) * | 2018-12-12 | 2019-04-16 | 北京搜狐新媒体信息技术有限公司 | 一种视频头图选择方法及系统 |
CN110287912A (zh) * | 2019-06-28 | 2019-09-27 | 广东工业大学 | 基于深度学习的目标对象情感状态确定方法、装置及介质 |
CN110381392A (zh) * | 2019-06-06 | 2019-10-25 | 五邑大学 | 一种视频摘要提取方法及其系统、装置、存储介质 |
WO2020010997A1 (zh) * | 2018-07-09 | 2020-01-16 | 腾讯科技(深圳)有限公司 | 视频帧的提取方法、装置、计算机可读介质及电子设备 |
CN110705462A (zh) * | 2019-09-29 | 2020-01-17 | 四川乐为科技有限公司 | 基于Hadoop 的分布式视频关键帧提取方法 |
CN110769259A (zh) * | 2019-11-05 | 2020-02-07 | 智慧视通(杭州)科技发展有限公司 | 一种视频目标跟踪轨迹内容的图像数据压缩方法 |
CN111078943A (zh) * | 2018-10-18 | 2020-04-28 | 山西医学期刊社 | 一种视频文本摘要生成方法及装置 |
CN111510792A (zh) * | 2020-05-22 | 2020-08-07 | 山东师范大学 | 基于自适应加权图差异分析的视频摘要生成方法及系统 |
CN112118494A (zh) * | 2019-06-20 | 2020-12-22 | 腾讯科技(深圳)有限公司 | 一种视频数据处理方法、装置及存储介质 |
CN112528856A (zh) * | 2020-12-10 | 2021-03-19 | 天津大学 | 一种基于特征帧的重复视频检测方法 |
CN113051236A (zh) * | 2021-03-09 | 2021-06-29 | 北京沃东天骏信息技术有限公司 | 审核视频的方法、装置及计算机可读存储介质 |
CN113112519A (zh) * | 2021-04-23 | 2021-07-13 | 电子科技大学 | 基于感兴趣目标分布的关键帧筛选方法 |
CN113302915A (zh) * | 2019-01-14 | 2021-08-24 | 杜比实验室特许公司 | 在视频会议中共享物理书写表面 |
CN113850299A (zh) * | 2021-09-01 | 2021-12-28 | 浙江爱达科技有限公司 | 一种自适应阈值的胃肠道胶囊内镜视频关键帧提取方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872346A (zh) * | 2009-04-22 | 2010-10-27 | 中国科学院自动化研究所 | 一种自动生成视频导航系统的方法 |
CN103049514A (zh) * | 2012-12-14 | 2013-04-17 | 杭州淘淘搜科技有限公司 | 一种基于分层聚类的均衡图像聚类方法 |
CN104820718A (zh) * | 2015-05-22 | 2015-08-05 | 哈尔滨工业大学 | 基于地理位置特征与全局视觉特征的图像分类和检索方法 |
CN105761263A (zh) * | 2016-02-19 | 2016-07-13 | 浙江大学 | 一种基于镜头边界检测和聚类的视频关键帧提取方法 |
-
2017
- 2017-01-17 CN CN201710035223.5A patent/CN106851437A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101872346A (zh) * | 2009-04-22 | 2010-10-27 | 中国科学院自动化研究所 | 一种自动生成视频导航系统的方法 |
CN103049514A (zh) * | 2012-12-14 | 2013-04-17 | 杭州淘淘搜科技有限公司 | 一种基于分层聚类的均衡图像聚类方法 |
CN104820718A (zh) * | 2015-05-22 | 2015-08-05 | 哈尔滨工业大学 | 基于地理位置特征与全局视觉特征的图像分类和检索方法 |
CN105761263A (zh) * | 2016-02-19 | 2016-07-13 | 浙江大学 | 一种基于镜头边界检测和聚类的视频关键帧提取方法 |
Non-Patent Citations (2)
Title |
---|
程德强等: "《煤矿井下视频关键帧提取算法》", 《工矿自动化》 * |
邓婵: "《视频摘要关键技术研究》", 《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》 * |
Cited By (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108600865B (zh) * | 2018-05-14 | 2019-07-23 | 西安理工大学 | 一种基于超像素分割的视频摘要生成方法 |
CN108600865A (zh) * | 2018-05-14 | 2018-09-28 | 西安理工大学 | 一种基于超像素分割的视频摘要生成方法 |
CN108804578A (zh) * | 2018-05-24 | 2018-11-13 | 南京理工大学 | 基于一致性片段生成的无监督视频摘要方法 |
CN108804578B (zh) * | 2018-05-24 | 2022-06-07 | 南京理工大学 | 基于一致性片段生成的无监督视频摘要方法 |
CN108924644B (zh) * | 2018-06-20 | 2021-11-26 | 阿里巴巴(中国)有限公司 | 视频片段提取方法及装置 |
CN108924644A (zh) * | 2018-06-20 | 2018-11-30 | 北京优酷科技有限公司 | 视频片段提取方法及装置 |
CN108966004B (zh) * | 2018-06-27 | 2022-06-17 | 维沃移动通信有限公司 | 一种视频处理方法及终端 |
CN108966004A (zh) * | 2018-06-27 | 2018-12-07 | 维沃移动通信有限公司 | 一种视频处理方法及终端 |
US11200426B2 (en) | 2018-07-09 | 2021-12-14 | Tencent Technology (Shenzhen) Company Limited | Video frame extraction method and apparatus, computer-readable medium |
WO2020010997A1 (zh) * | 2018-07-09 | 2020-01-16 | 腾讯科技(深圳)有限公司 | 视频帧的提取方法、装置、计算机可读介质及电子设备 |
CN109151501A (zh) * | 2018-10-09 | 2019-01-04 | 北京周同科技有限公司 | 一种视频关键帧提取方法、装置、终端设备及存储介质 |
CN109151501B (zh) * | 2018-10-09 | 2021-06-08 | 北京周同科技有限公司 | 一种视频关键帧提取方法、装置、终端设备及存储介质 |
CN111078943B (zh) * | 2018-10-18 | 2023-07-04 | 山西医学期刊社 | 一种视频文本摘要生成方法及装置 |
CN111078943A (zh) * | 2018-10-18 | 2020-04-28 | 山西医学期刊社 | 一种视频文本摘要生成方法及装置 |
CN109413510B (zh) * | 2018-10-19 | 2021-05-18 | 深圳市商汤科技有限公司 | 视频摘要生成方法和装置、电子设备、计算机存储介质 |
CN109413510A (zh) * | 2018-10-19 | 2019-03-01 | 深圳市商汤科技有限公司 | 视频摘要生成方法和装置、电子设备、计算机存储介质 |
CN109327713A (zh) * | 2018-10-31 | 2019-02-12 | 微梦创科网络科技(中国)有限公司 | 一种媒体信息的生成方法和装置 |
CN109635736A (zh) * | 2018-12-12 | 2019-04-16 | 北京搜狐新媒体信息技术有限公司 | 一种视频头图选择方法及系统 |
CN113302915A (zh) * | 2019-01-14 | 2021-08-24 | 杜比实验室特许公司 | 在视频会议中共享物理书写表面 |
CN110381392A (zh) * | 2019-06-06 | 2019-10-25 | 五邑大学 | 一种视频摘要提取方法及其系统、装置、存储介质 |
CN110381392B (zh) * | 2019-06-06 | 2021-08-10 | 五邑大学 | 一种视频摘要提取方法及其系统、装置、存储介质 |
CN112118494A (zh) * | 2019-06-20 | 2020-12-22 | 腾讯科技(深圳)有限公司 | 一种视频数据处理方法、装置及存储介质 |
CN110287912A (zh) * | 2019-06-28 | 2019-09-27 | 广东工业大学 | 基于深度学习的目标对象情感状态确定方法、装置及介质 |
CN110705462A (zh) * | 2019-09-29 | 2020-01-17 | 四川乐为科技有限公司 | 基于Hadoop 的分布式视频关键帧提取方法 |
CN110705462B (zh) * | 2019-09-29 | 2022-05-10 | 四川乐为科技有限公司 | 基于Hadoop的分布式视频关键帧提取方法 |
CN110769259A (zh) * | 2019-11-05 | 2020-02-07 | 智慧视通(杭州)科技发展有限公司 | 一种视频目标跟踪轨迹内容的图像数据压缩方法 |
CN111510792B (zh) * | 2020-05-22 | 2022-04-15 | 山东师范大学 | 基于自适应加权图差异分析的视频摘要生成方法及系统 |
CN111510792A (zh) * | 2020-05-22 | 2020-08-07 | 山东师范大学 | 基于自适应加权图差异分析的视频摘要生成方法及系统 |
CN112528856B (zh) * | 2020-12-10 | 2022-04-15 | 天津大学 | 一种基于特征帧的重复视频检测方法 |
CN112528856A (zh) * | 2020-12-10 | 2021-03-19 | 天津大学 | 一种基于特征帧的重复视频检测方法 |
CN113051236A (zh) * | 2021-03-09 | 2021-06-29 | 北京沃东天骏信息技术有限公司 | 审核视频的方法、装置及计算机可读存储介质 |
CN113112519A (zh) * | 2021-04-23 | 2021-07-13 | 电子科技大学 | 基于感兴趣目标分布的关键帧筛选方法 |
CN113850299A (zh) * | 2021-09-01 | 2021-12-28 | 浙江爱达科技有限公司 | 一种自适应阈值的胃肠道胶囊内镜视频关键帧提取方法 |
CN113850299B (zh) * | 2021-09-01 | 2024-05-14 | 浙江爱达科技有限公司 | 一种自适应阈值的胃肠道胶囊内镜视频关键帧提取方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106851437A (zh) | 一种提取视频摘要的方法 | |
CN105025392B (zh) | 基于摘要空间特征学习的视频摘要关键帧提取方法 | |
CN107767413B (zh) | 一种基于卷积神经网络的图像深度估计方法 | |
CN110866896B (zh) | 基于k-means与水平集超像素分割的图像显著性目标检测方法 | |
CN109636784B (zh) | 基于最大邻域和超像素分割的图像显著性目标检测方法 | |
US9076043B2 (en) | Video summarization using group sparsity analysis | |
US8913835B2 (en) | Identifying key frames using group sparsity analysis | |
Panwar et al. | Image Segmentation using K-means clustering and Thresholding | |
WO2018137126A1 (zh) | 一种静态视频摘要的生成方法及装置 | |
CN106157330B (zh) | 一种基于目标联合外观模型的视觉跟踪方法 | |
JP4098021B2 (ja) | シーン識別方法および装置ならびにプログラム | |
CN107833224B (zh) | 一种基于多层次区域合成的图像分割方法 | |
CN102073841A (zh) | 一种不良视频检测方法及装置 | |
CN108600865A (zh) | 一种基于超像素分割的视频摘要生成方法 | |
CN106778768A (zh) | 基于多特征融合的图像场景分类方法 | |
CN111091129A (zh) | 一种基于多重颜色特征流形排序的图像显著区域提取方法 | |
CN110188625B (zh) | 一种基于多特征融合的视频精细结构化方法 | |
CN108491883B (zh) | 一种基于条件随机场的显著性检测优化方法 | |
CN111161282B (zh) | 基于深度种子的图像多层次分割的目标尺度选择方法 | |
CN111651633A (zh) | 一种视频封面选取方法和系统 | |
Sahu et al. | Color image segmentation using genetic algorithm | |
Kothyari et al. | Content based image retrieval using statistical feature and shape extraction | |
CN103679170B (zh) | 一种基于局部特征的显著区域检测方法 | |
CN106296740B (zh) | 一种基于低秩稀疏表达的目标精细轮廓跟踪方法 | |
Silverman et al. | Segmentation of multi-dimensional infrared imagery from histograms |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20170613 |
|
RJ01 | Rejection of invention patent application after publication |