CN107832694B - 一种视频关键帧提取方法 - Google Patents
一种视频关键帧提取方法 Download PDFInfo
- Publication number
- CN107832694B CN107832694B CN201711047162.0A CN201711047162A CN107832694B CN 107832694 B CN107832694 B CN 107832694B CN 201711047162 A CN201711047162 A CN 201711047162A CN 107832694 B CN107832694 B CN 107832694B
- Authority
- CN
- China
- Prior art keywords
- frame
- difference
- value
- values
- calculating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/78—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/783—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种视频关键帧提取算法,属于信息安全技术领域。该算法首先计算当前输入视频流中某帧的水平方向的黑边宽度和垂直方向的黑边高度,以及该帧有效图像区域的宽度和高度;然后计算该帧的有效图像区域的特征信息,并与上一帧比较,计算差异度;差异度大于阈值时,将该差异帧中的数据与缓存区中的每帧数据分别比较,计算该帧的相似度;该差异帧的相似度大于阈值时,将该差异帧与缓存区中的该某帧视为相似,将非差异帧计数加1,达到非差异帧累计数最大值,输出该帧为差异帧并写入缓存区,统计该帧的Y值的方差值和UV值的方差值,并输出关键帧和空白帧。本发明算法通过C语言实现,可应用于多视频多线程的调用,适应性强,高效快速。
Description
技术领域
本发明属于信息安全技术领域,涉及视频内容信息的提取,具体来说,是一种视频关键帧提取方法。
背景技术
随着Internet的应用和普及,多媒体信息检索系统对社会各领域产生越来越大的影响。传统的信息检索采用基于文本的检索方式,查询时需要说明文本特征,要求用户对文本特征的描述具有一定的准确性和规范性。但由于视频数据的丰富内涵以及人们对视频内容进行抽取的主观性,视频信息难以用几个关键词描述。因此,基于内容的视频检索应运而生。
传统的基于内容的视频检索方法是将视频作为帧图像的集合,运用图像检索的方法逐帧进行检索,这种方法的缺点是需要处理大量的图像信息,对信息传输和计算造成很大的困难。在视频帧序列中,包含有关键内容节点的帧可以简单的概括视频的主要内容,这些帧成为视频的关键帧,通过提取关键帧,可以极大的减少后续处理的数据量。
发明内容
本发明提供一种视频关键帧提取方法,通过在各类视频的所有帧中提取出能够反映视频内容信息的关键帧,可以有效的降低视频分析时的数据量,提高视频处理效率。
具体步骤如下:
步骤一、针对当前的输入视频流中的某帧,经黑边检测模块计算得到水平方向的黑边宽度和垂直方向的黑边高度;
具体计算过程如下:
对输入视频流图像的上下边逐行检测黑边范围,计算得到每行黑边的高度,取高度最大值作为垂直方向上的黑边高度,对图像左右边逐列检测黑边范围,计算得到每列黑边的宽度,取宽度最大值作为水平方向的黑边宽度。
步骤二、利用垂直方向的黑边高度和水平方向的黑边宽度,计算该帧有效图像区域的宽度和高度;
具体计算如下:
有效图像区域的起始点水平方向坐标等于水平方向黑边宽度,垂直方向的坐标等于垂直方向黑边高度,有效区域的宽度等于原图像宽减去两倍的水平方向黑边宽度,有效区域的高度等于原图像高减去两倍的垂直方向黑边高度。
步骤三、将该帧的有效图像区域的长宽分别等分成16块,计算每块的Y值均值和UV差值的均值,并将256块区域的Y值均值和UV差值的均值作为该帧的特征信息。
针对该帧的有效图像区域,将长宽均等分分割为16块,得到256块区域,分别计算每块的Y值均值和UV差值的均值,作为该帧的特征信息。
步骤四、用帧差异比较模块将该帧的特征信息与前一帧的特征信息比较,并计算该帧的差异度;
计算差异度的过程如下:
步骤401、将两帧的256块区域一一对应,将每个区域中的Y值分别比较;
步骤402、针对某对应区域块,将两个区域块中的Y值均值作差,得到差值绝对值;
步骤403、计算该两个对应区域块中的Y值均值的平均值;
步骤404、计算差值绝对值与平均值的比例,并判断比例值是否大于预设值,如果是,定义该区域块的差异值为1,否则该区域块的差异值为0;
步骤405、针对该帧,利用256个区域块的差异值加权得到该帧的差异度。
256个区域块中每个区域块对应各自的权值;
步骤五、判断该帧的差异度是否大于阈值;如果是,则该帧视为差异帧,进入步骤六;否则该帧视为无差异帧,进入步骤八;
步骤六、将该差异帧中的数据与缓存区中的每帧数据分别比较,计算该帧的相似度;
计算相似度的过程如下:
步骤601、选择缓存区域中的某帧,将该差异帧与该某帧做比较,将256个区域中的Y值分别比较;
步骤602、针对某对应区域块,将两个区域块中的Y值均值作差,得到差值绝对值;
步骤603、计算该两个对应区域块中的Y值均值的平均值;
步骤604、计算差值绝对值与平均值的比例,并判断比例值是否小于预设值,如果是,定义该区域块的相似值为1,否则该区域块的相似值为0;
步骤605、针对该差异帧,利用256个区域块的相似值加权得到该帧的相似度。
256个区域块中每个区域块对应各自的权值;
步骤七、判断该差异帧的相似度是否大于阈值,如果是,则将该差异帧与缓存区中的该某帧视为相似,进入步骤八;否则,将该差异帧的数据写入到缓存区,并输出该帧存在差异。
步骤八、将非差异帧计数加1,并判断计数是否达到非差异帧累计数最大值,如果是,输出该帧为差异帧并写入缓存区,进入步骤九;否则,输出该帧为无差异帧。
步骤九、利用空白帧检测模块分别统计该帧的Y值的方差值和UV值的方差值,并输出关键帧和空白帧;
首先,统计256块区域的Y值的方差值,并判断该方差值是否大于阈值,如果是,则将该帧视为关键帧输出;否则,统计256块区域的UV值的方差值,判断该方差值是否大于阈值,如果是,则将该帧视为关键帧输出,否则,将该帧视为空白帧输出。
本发明的优点及带来的有益效果在于:本发明所有模块均通过C语言实现,可应用于多视频多线程的调用,适应性强,高效快速。
附图说明
图1为本发明视频关键帧提取方法的整体结构图;
图2为本发明视频关键帧提取方法的流程图;
图3为本发明的黑边检测模块结构图;
图4为本发明的空白帧检测模块结构图。
具体实施方式
下面结合附图对本发明的技术方案进行详细说明。
本发明一种视频关键帧提取方法的整体结构,如图1所示,对于当前的输入视频流中的某帧,经过黑边检测模块计算该帧的特征信息,然后经帧差异比较模块判断是否存在差异,如果是,进一步经过空白帧检测模块区分关键帧或非关键帧,否则,直接将无差异帧输出为非关键帧,最终得到视频流中的该帧是否为关键帧。
具体地,如图2所示,本发明的实施步骤如下:
步骤一、针对当前的输入视频流中的某帧,经黑边检测模块计算得到水平方向的黑边宽度和垂直方向的黑边高度;
黑边检测模块具体运算过程,如图3所示,如下:
针对输入视频流图像,逐行遍历上边缘像素点,直至检测到非黑边,计算出上边缘到非黑边之间的距离;同理,逐行遍历下边缘像素点,直至检测到非黑边,计算出下边缘到非黑边之间的距离;取两距离中的最大值作为上下边的黑边高度,图像的宽度作为黑边的宽度;
逐列遍历左边缘像素点,直至检测到非黑边,计算出左边缘到非黑边之间的距离;同理,逐列遍历右边缘像素点,直至检测到非黑边,计算出右边缘到非黑边之间的距离;取两距离中的最大值作为左右边的黑边宽度,图像的高度作为黑边的宽度;
步骤二、利用垂直方向的黑边高度和水平方向的黑边宽度,计算该帧有效图像区域的宽度和高度;
具体计算如下:
有效图像区域的起始点水平方向坐标等于水平方向黑边宽度,垂直方向的坐标等于垂直方向黑边高度,有效区域的宽度等于原图像宽减去两倍的水平方向黑边宽度,有效区域的高度等于原图像高减去两倍的垂直方向黑边高度。
步骤三、将该帧的有效图像区域的长宽分别等分成16块,计算每块的Y值均值和UV差值的均值,并将256块区域的Y值均值和UV差值的均值作为该帧的特征信息。
针对该帧计算后的有效图像区域进行长宽16*16等分分割,得到256块区域,分别计算每块的Y值均值和UV差值的均值,作为该帧的特征信息。
步骤四、用帧差异比较模块将该帧的特征信息与前一帧的特征信息比较,并计算该帧的差异度;
计算差异度的过程如下:
步骤401、将两帧的256块区域一一对应,将每个区域中的Y值分别比较;
步骤402、针对某对应区域块,将两个区域块中的Y值均值作差,得到差值绝对值;
步骤403、计算该两个对应区域块中的Y值均值的平均值;
步骤404、计算差值绝对值与平均值的比例,并判断比例值是否大于预设值,如果是,定义该区域块的差异值为1,否则该区域块的差异值为0;
步骤405、针对该帧,利用256个区域块的差异值加权得到该帧的差异度。
256个区域块中每个区域块对应各自的权值;
步骤五、判断该帧的差异度是否大于阈值;如果是,则该帧视为差异帧,进入步骤六;否则该帧视为无差异帧,进入步骤八;
步骤六、将该差异帧中的数据与缓存区中的每帧数据分别比较,计算该帧的相似度;
计算相似度的过程如下:
步骤601、选择缓存区域中的某帧,将该差异帧与该某帧做比较,将256个区域中的Y值分别比较;
步骤602、针对某对应区域块,将两个区域块中的Y值均值作差,得到差值绝对值;
步骤603、计算该两个对应区域块中的Y值均值的平均值;
步骤604、计算差值绝对值与平均值的比例,并判断比例值是否小于预设值,如果是,定义该区域块的相似值为1,否则该区域块的相似值为0;
步骤605、针对该差异帧,利用256个区域块的相似值加权得到该帧的相似度。
256个区域块中每个区域块对应各自的权值;
步骤七、判断该差异帧的相似度是否大于阈值,如果是,则将该差异帧与缓存区中的该某帧视为相似,进入步骤八;否则,将该差异帧的数据写入到缓存区,并输出该帧存在差异。
步骤八、将非差异帧计数加1,并判断计数是否达到非差异帧累计数最大值,如果是,输出该帧为差异帧并写入缓存区,进入步骤九;否则,输出该帧为无差异帧。
步骤九、利用空白帧检测模块分别统计该帧的Y值的方差值和UV值的方差值,并输出关键帧和空白帧;
如图4所示,首先,统计256块区域的Y值的方差值,并判断该方差值是否大于阈值,如果是,则将该帧视为关键帧输出;否则,继续统计256块区域的UV值的方差值,判断该方差值是否大于阈值,如果是,则将该帧视为关键帧输出,否则,将该帧视为空白帧输出。
Claims (4)
1.一种视频关键帧提取方法,其特征在于,具体步骤如下:
步骤一、针对当前的输入视频流中的某帧,经黑边检测模块计算得到水平方向的黑边宽度和垂直方向的黑边高度;
步骤二、利用垂直方向的黑边高度和水平方向的黑边宽度,计算该帧有效图像区域的宽度和高度;
步骤三、将该帧的有效图像区域的长宽分别等分成16块,计算每块的Y值均值和UV差值的均值,并将256块区域的Y值均值和UV差值的均值作为该帧的特征信息;
步骤四、用帧差异比较模块将该帧的特征信息与前一帧的特征信息比较,并计算该帧的差异度;
步骤五、判断该帧的差异度是否大于阈值;如果是,则该帧视为差异帧,进入步骤六;否则该帧视为无差异帧,进入步骤八;
步骤六、将该差异帧中的数据与缓存区中的每帧数据分别比较,计算该帧的相似度;
计算相似度的过程如下:
步骤601、选择缓存区域中的任意帧,将该差异帧与该任意帧做比较,将256个区域中的Y值分别比较;
步骤602、针对某对应区域块,将两个区域块中的Y值均值作差,得到差值绝对值;
步骤603、计算该两个对应区域块中的Y值均值的平均值;
步骤604、计算差值绝对值与平均值的比例,并判断比例值是否小于预设值,如果是,定义该区域块的相似值为1,否则该区域块的相似值为0;
步骤605、针对该差异帧,利用256个区域块的相似值加权得到该帧的相似度;
256个区域块中每个区域块对应各自的权值;
步骤七、判断该差异帧的相似度是否大于阈值,如果是,则将该差异帧与缓存区中的该某帧视为相似,进入步骤八;否则,将该差异帧的数据写入到缓存区,并输出该帧存在差异;
步骤八、将非差异帧计数加1,并判断计数是否达到非差异帧累计数最大值,如果是,输出该帧为差异帧并写入缓存区,进入步骤九;否则,输出该帧为无差异帧;
步骤九、利用空白帧检测模块分别统计该帧的Y值的方差值和UV值的方差值,并输出关键帧和空白帧;
首先,统计256块区域的Y值的方差值,并判断该方差值是否大于阈值,如果是,则将该帧视为关键帧输出;否则,统计256块区域的UV值的方差值,判断该方差值是否大于阈值,如果是,则将该帧视为关键帧输出,否则,将该帧视为空白帧输出。
2.如权利要求1所述的一种视频关键帧提取方法,其特征在于,所述的步骤一中,水平方向的黑边宽度和垂直方向的黑边高度具体计算过程如下:
对输入视频流图像的上下边逐行检测黑边范围,计算得到每行黑边的高度,取高度最大值作为垂直方向上的黑边高度,对图像左右边逐列检测黑边范围,计算得到每列黑边的宽度,取宽度最大值作为水平方向的黑边宽度。
3.如权利要求1所述的一种视频关键帧提取方法,其特征在于,所述的步骤二中,有效图像区域的宽度和高度具体计算如下:
有效图像区域的起始点水平方向坐标等于水平方向黑边宽度,垂直方向的坐标等于垂直方向黑边高度,有效区域的宽度等于原图像宽减去两倍的水平方向黑边宽度,有效区域的高度等于原图像高减去两倍的垂直方向黑边高度。
4.如权利要求1所述的一种视频关键帧提取方法,其特征在于,步骤四中,所述的差异度的计算过程如下:
步骤401、将两帧的256块区域一一对应,将每个区域中的Y值分别比较;
步骤402、针对某对应区域块,将两个区域块中的Y值均值作差,得到差值绝对值;
步骤403、计算该两个对应区域块中的Y值均值的平均值;
步骤404、计算差值绝对值与平均值的比例,并判断比例值是否大于预设值,如果是,定义该区域块的差异值为1,否则该区域块的差异值为0;
步骤405、针对该帧,利用256个区域块的差异值加权得到该帧的差异度;
256个区域块中每个区域块对应各自的权值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711047162.0A CN107832694B (zh) | 2017-10-31 | 2017-10-31 | 一种视频关键帧提取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201711047162.0A CN107832694B (zh) | 2017-10-31 | 2017-10-31 | 一种视频关键帧提取方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107832694A CN107832694A (zh) | 2018-03-23 |
CN107832694B true CN107832694B (zh) | 2021-01-12 |
Family
ID=61650446
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201711047162.0A Active CN107832694B (zh) | 2017-10-31 | 2017-10-31 | 一种视频关键帧提取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107832694B (zh) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108540822A (zh) * | 2018-04-04 | 2018-09-14 | 南京信安融慧网络技术有限公司 | 一种基于OpenCL的视频关键帧提取加速系统及其提取方法 |
CN109785275A (zh) * | 2018-12-27 | 2019-05-21 | 珠海亿智电子科技有限公司 | 一种图像的色调映射方法及设备 |
CN110956648A (zh) * | 2019-11-15 | 2020-04-03 | 深圳市宏电技术股份有限公司 | 一种视频图像处理方法、装置、设备及存储介质 |
CN111310657B (zh) * | 2020-02-14 | 2023-07-07 | 北京远特科技股份有限公司 | 驾驶员人脸监控方法、装置、终端和计算机可读存储介质 |
CN111757062A (zh) * | 2020-06-29 | 2020-10-09 | 郑州信大捷安信息技术股份有限公司 | 一种视频流的高效安全传输方法和系统 |
CN114579805B (zh) * | 2022-03-01 | 2023-03-28 | 北京赛思信安技术股份有限公司 | 一种基于注意力机制的卷积神经网络相似视频检索方法 |
CN114565878B (zh) * | 2022-03-01 | 2024-05-03 | 北京赛思信安技术股份有限公司 | 一种支持类别可配置的视频标志物检测方法 |
CN114550268A (zh) * | 2022-03-01 | 2022-05-27 | 北京赛思信安技术股份有限公司 | 一种利用时空特征的深度伪造视频检测方法 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101398855A (zh) * | 2008-10-24 | 2009-04-01 | 清华大学 | 一种视频关键帧提取方法和系统 |
CN102685398A (zh) * | 2011-09-06 | 2012-09-19 | 天脉聚源(北京)传媒科技有限公司 | 一种新闻视频场景生成方法 |
CN103093458A (zh) * | 2012-12-31 | 2013-05-08 | 清华大学 | 关键帧的检测方法及装置 |
CN103778237A (zh) * | 2014-01-27 | 2014-05-07 | 北京邮电大学 | 一种基于活动事件时空重组的视频摘要生成方法 |
CN105761263A (zh) * | 2016-02-19 | 2016-07-13 | 浙江大学 | 一种基于镜头边界检测和聚类的视频关键帧提取方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8107015B1 (en) * | 1996-06-07 | 2012-01-31 | Virage, Incorporated | Key frame selection |
US8989503B2 (en) * | 2012-08-03 | 2015-03-24 | Kodak Alaris Inc. | Identifying scene boundaries using group sparsity analysis |
-
2017
- 2017-10-31 CN CN201711047162.0A patent/CN107832694B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101398855A (zh) * | 2008-10-24 | 2009-04-01 | 清华大学 | 一种视频关键帧提取方法和系统 |
CN102685398A (zh) * | 2011-09-06 | 2012-09-19 | 天脉聚源(北京)传媒科技有限公司 | 一种新闻视频场景生成方法 |
CN103093458A (zh) * | 2012-12-31 | 2013-05-08 | 清华大学 | 关键帧的检测方法及装置 |
CN103778237A (zh) * | 2014-01-27 | 2014-05-07 | 北京邮电大学 | 一种基于活动事件时空重组的视频摘要生成方法 |
CN105761263A (zh) * | 2016-02-19 | 2016-07-13 | 浙江大学 | 一种基于镜头边界检测和聚类的视频关键帧提取方法 |
Non-Patent Citations (2)
Title |
---|
Automatic key frame extraction in continuous videos from construction monitoring by using color, texture, and gradient features:必应学术国际版,(key frame detect) and block and YUV;Ling Chen et.al;《Automation in Construction》;20170930;第81卷;第355-368页 * |
基于内容的视频检索关键技术研究;汪翔;《中国优秀硕士学位论文全文数据库 信息科技辑》;20120915;第I138-742页 * |
Also Published As
Publication number | Publication date |
---|---|
CN107832694A (zh) | 2018-03-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107832694B (zh) | 一种视频关键帧提取方法 | |
WO2017016516A1 (zh) | 一种复杂场景下基于人脸识别的视频人像跟踪方法 | |
CN103336957A (zh) | 一种基于时空特征的网络同源视频检测方法 | |
CN102395984A (zh) | 用于视频内容分析的关键帧提取 | |
CN109325507B (zh) | 结合超像素显著性特征与hog特征图像分类方法和系统 | |
WO2020224325A1 (zh) | 视频指纹提取及视频检索方法、装置、终端及存储介质 | |
WO2017166597A1 (zh) | 一种卡通视频识别方法、装置和电子设备 | |
EP2951783A1 (en) | Method and system for detecting moving objects | |
CN104866843A (zh) | 一种面向监控视频的蒙面人脸检测方法 | |
CN113283351B (zh) | 一种使用cnn优化相似度矩阵的视频抄袭检测方法 | |
Zhou et al. | End-to-end lane detection with one-to-several transformer | |
CN103093467A (zh) | 一种基于双重检测模型的镜头边界检测方法 | |
CN107358621A (zh) | 对象跟踪方法及装置 | |
CN111160099B (zh) | 一种视频图像目标的智能化分割方法 | |
HE et al. | Chronological video synopsis via events rearrangement optimization | |
WO2019041447A1 (zh) | 一种3d视频帧特征点提取的方法及系统 | |
CN105224619B (zh) | 一种适用于视频/图像局部特征的空间关系匹配方法及系统 | |
Kalirajan et al. | Moving object detection using median-based scale invariant local ternary pattern for video surveillance system | |
CN103578094A (zh) | 镜头分割方法 | |
CN105678298A (zh) | 台标识别方法 | |
CN107992474B (zh) | 一种流式数据主题挖掘方法及其系统 | |
Huang et al. | An integrated scheme for video key frame extraction | |
CN109308458B (zh) | 一种基于特征谱尺度变换提升小目标检测精度的方法 | |
Ye et al. | A parallel top-n video big data retrieval method based on multi-features | |
Xu et al. | A shot boundary detection method for news video based on object segmentation and tracking |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |