CN106162222B

CN106162222B - 一种视频镜头切分的方法及装置

Info

Publication number: CN106162222B
Application number: CN201510195911.9A
Authority: CN
Inventors: 胡东方
Original assignee: Wuxi Tvmining Juyuan Media Technology Co Ltd
Current assignee: Wuxi Tvmining Juyuan Media Technology Co Ltd
Priority date: 2015-04-22
Filing date: 2015-04-22
Publication date: 2019-05-24
Anticipated expiration: 2035-04-22
Also published as: CN106162222A

Abstract

本发明公开了一种视频镜头切分的方法及装置，用以解决背景相似的视频文件难以切分的问题，实现了在相似的会场背景下精确切分视频镜头。所述方法包括：根据自所述视频关键帧中检测并记录的人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人；在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。该方案在会场背景相同的情况下，可以通过发言人物的人脸不同判断其属于不同的镜头而对视频文件进行镜头切分，解决了背景相似或相同的视频文件难以进行镜头切分的问题，提高了镜头切分效率，提升了用户体验。

Description

一种视频镜头切分的方法及装置

技术领域

本发明涉及互联网技术领域，特别涉及一种视频镜头切分的方法及装置。

背景技术

随着科学技术的发展，视频等多媒体格式的信息数据越来越丰富，而为了便于查看或者建立检索的视频数据库等，可以将一个视频文件切分为多个不同的视频镜头对视频文件进行结构化处理。目前，在进行视频文件的镜头切分时，经常会出现的情况是待切分的视频文件的拍摄背景均为相似或者相同的场景，比如在会场中进行会议的视频文件，由于会场的布景都是一样的，但是在进行镜头切分时，需要对不同发言人物的视频镜头进行切分，因此，相同的会场背景对镜头切分的过程造成了很大的影响，加重了镜头切分难度。

发明内容

本发明提供一种视频镜头切分的方法及装置，用以解决背景相似的视频文件难以切分的问题，实现了在相似的会场背景下精确切分视频镜头。

根据本发明实施例的第一方面，提供一种视频镜头切分的方法，包括：

自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息；

根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人；

在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。

在一个实施例中，所述自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息，包括：

接收待切分镜头的视频文件，自所述视频文件中提取视频关键帧；

检测所述视频关键帧中是否存在人脸；

在所述视频关键帧中存在人脸时，将所述视频关键帧标记为存在人脸状态后，将检测到的人脸信息与所述视频关键帧关联后存储；

在所述视频关键帧中不存在人脸时，将所述视频关键帧的人脸信息标记为无人脸状态。

在一个实施例中，所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人，包括：

检测相邻的两个视频关键帧是否均为存在人脸状态；

在相邻的两个所述视频关键帧均为存在人脸状态时，检测两个所述视频关键帧中存在的人脸是否属于同一个人。

在一个实施例中，所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人，还包括：

在相邻的两个所述视频关键帧均为无人脸状态时，确定两个所述视频关键帧属于同一个镜头；

在相邻的两个所述视频关键帧中，一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。

在一个实施例中，所述在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分，还包括：

在所述人脸属于同一个人时，确定两个所述视频关键帧属于相同的镜头；

在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分；

获取切分后的所述镜头的视频镜头序列。

根据本发明实施例的第二方面，还提供一种视频镜头切分的装置，包括：

第一检测模块，用于自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息；

第二检测模块，用于根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人；

镜头切分模块，用于在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。

在一个实施例中，所述第一检测模块包括：

提取子模块，用于接收待切分镜头的视频文件，自所述视频文件中提取视频关键帧；

第一检测子模块，用于检测所述视频关键帧中是否存在人脸；

第一标记模块，用于在所述视频关键帧中存在人脸时，将所述视频关键帧标记为存在人脸状态后，将检测到的人脸信息与所述视频关键帧关联后存储；

第二标记模块，用于在所述视频关键帧中不存在人脸时，将所述视频关键帧的人脸信息标记为无人脸状态。

在一个实施例中，所述第二检测模块包括：

第二检测子模块，用于检测相邻的两个视频关键帧是否均为存在人脸状态；

第三检测子模块，用于在相邻的两个所述视频关键帧均为存在人脸状态时，检测两个所述视频关键帧中存在的人脸是否属于同一个人。

在一个实施例中，所述第二检测模块还包括：

第一确认子模块，用于在相邻的两个所述视频关键帧均为无人脸状态时，确定两个所述视频关键帧属于同一个镜头；

第一镜头切分子模块，用于在相邻的两个所述视频关键帧中，一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。

在一个实施例中，所述镜头切分模块包括：

第二确认子模块，用于在所述人脸属于同一个人时，确定两个所述视频关键帧属于相同的镜头；

第二镜头切分子模块，用于在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分；

获取子模块，用于获取切分后的所述镜头的视频镜头序列。

本发明实施例提供的技术方案可产生以下有益效果：自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息；根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人；在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。该方案首先检测视频关键帧中的人脸信息，并通过检测到的所述人脸信息判断两个背景相同的相邻视频关键帧是否属于同一个镜头，最终根据判断结果进行镜头切分；该方案在会场背景相同的情况下，可以通过发言人物的人脸不同判断其属于不同的镜头而对视频文件进行镜头切分，解决了背景相似或相同的视频文件难以进行镜头切分的问题，提高了镜头切分效率，提升了用户体验。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。

在附图中：

图1为本发明根据一示例性实施例示出的一种视频镜头切分的方法的流程图；

图2为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S10的实施方式流程图；

图3为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S20的一种实施方式流程图；

图4为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S20的另一种实施方式流程图；

图5为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S30的实施方式流程图；

图6为本发明根据一示例性实施例示出的视频镜头切分的装置的框图；

图7为本发明根据一示例性实施例示出的视频镜头切分的装置中第一检测模块61的框图；

图8为本发明根据一示例性实施例示出的视频镜头切分的装置中一种第二检测模块62的框图；

图9为本发明根据一示例性实施例示出的视频镜头切分的装置中另一种第二检测模块62的框图；

图10为本发明根据一示例性实施例示出的视频镜头切分的装置中镜头切分模块63的框图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

本公开实施例提供了一种视频镜头切分的方法，用于解决背景相似的视频文件难以切分的问题，实现了在相似的会场背景下精确切分视频镜头。如图1所示，该方法包括步骤S10-S30：

在步骤S10中，自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息。

本公开中的方法主要针对背景相似且将不同人物的存在场景作为切分依据的情况进行视频文件的视频镜头切分，比如在背景相同的会场或者是其他类似于会场的场景。其中，在本实施例中，检测所述视频关键帧中是否存在人脸后，所记录的人脸信息包括人物的图像、其所在的视频关键帧信息、该人物在视频中出现的时间、人脸在视频画面中的位置、人脸图像的大小等，以上信息均可用于判断相邻两个视频关键帧中的人脸是否属于同一个人，因此并不限定于为以上例举的参数，还可以是其他有助于分辨相邻两个视频关键帧中的人脸是否属于同一个人的信息。

在一个实施例中，如图2所示，所述步骤S10可包括：

步骤S101、接收待切分镜头的视频文件，自所述视频文件中提取视频关键帧。也即，首先需要接收到待处理的视频文件，并记录该视频文件的视频序列以便于在进行视频镜头切分后，将切分后的视频镜头序列与所述视频序列关联。之后，自所述视频文件中提取视频关键帧，同时给予所有视频关键帧不同的视频关键帧序列号并将其与所述视频文件的视频序列关联。

步骤S102、检测所述视频关键帧中是否存在人脸。也即，按照预先设定的顺序对各所述视频关键帧进行检测，判断各所述视频关键帧是否存在人脸。

步骤S103、在所述视频关键帧中存在人脸时，将所述视频关键帧标记为存在人脸状态后，将检测到的人脸信息与所述视频关键帧关联后存储。在步骤S102中检测到存在人脸时，先将所述视频关键帧标记为存在人脸，所述标记可以由用户或者系统自行定义，比如将存在人脸状态设定为“Yes”，无人脸状态设定为“No”；或者将存在人脸状态设定为“Ture”，无人脸状态设定为“False”，或者其他能代表两种状态的标记。在将所述视频关键帧标记为存在人脸状态后，将检测到的人脸信息与所述视频关键帧关联后存储，也即，所述人脸信息由于还需要用于与其他视频关键帧中的人脸进行比对，因此需要将其与当前视频关键帧关联后进行存储，以判断进行比对的两个所述视频关键帧是否属于同一视频镜头。

步骤S104、在所述视频关键帧中不存在人脸时，将所述视频关键帧的人脸信息标记为无人脸状态。在步骤S102中检测到不存在人脸时，先将所述视频关键帧标记为无人脸状态，由上述，所述标记可以由用户或者系统自行定义为能代表两种状态的标记。

在步骤S20中，根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人。

也即，在步骤S10中记录的所述人脸信息用于与其他视频关键帧中的人脸进行比对，因此在步骤S10中将检测到的人脸信息与其所在的视频关键帧关联后进行存储，并以此判断进行比对的两个所述视频关键帧中的人脸是否属于同一人，进而判断两个所述视频关键帧是否属于同一视频镜头。

在一个实施例中，如图3所示，所述步骤S20可包括：

步骤S201、检测相邻的两个视频关键帧是否均为存在人脸状态。首先，需要检测所述视频关键帧的状态为存在人脸状态还是无人脸状态；当两个所述视频关键帧的状态均为存在人脸状态时，需要根据两个所述视频关键帧的人脸信息进一步判断两个所述视频关键帧中的人脸是否属于同一人，进而判断两个所述视频关键帧是否属于同一视频镜头；如果两个所述视频关键帧的状态均为不在人脸状态时，则两个所述视频关键帧属于同一个视频镜头，不需要进行镜头切分；如果两个所述视频关键帧的状态一个为无人脸状态而另一个为存在人脸状态时，两个所述视频关键帧属于不同的镜头，此时需要对两个所述视频关键帧进行镜头切分。

步骤S202、在相邻的两个所述视频关键帧均为存在人脸状态时，检测两个所述视频关键帧中存在的人脸是否属于同一个人；在两个所述视频关键帧的人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分；在所述视频关键帧的人脸属于同一个人时，确定两个所述视频关键帧属于相同的镜头，不对其进行镜头切分。

在一个实施例中，如图4所示，所述步骤S20还可包括：

步骤S203、在相邻的两个所述视频关键帧均为无人脸状态时，确定两个所述视频关键帧属于同一个镜头；比如，在会场中两个发言人物交替发言的中间阶段或者是休息时段均会出现该种场景。

步骤S204、在相邻的两个所述视频关键帧中，一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。比如，在会场中两个发言人物交替发言的中间阶段或者休息时段的前后交接时分会出现该种场景。

在步骤S30中，在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。两个所述视频关键帧的所述人脸不属于同一个人时，表明两个所述视频关键帧属于不同发言人物的镜头，因此属于不同的视频镜头，需要对其进行镜头切分。

在一个实施例中，如图5所示，所述步骤S30可包括：

步骤S301、在所述人脸属于同一个人时，确定两个所述视频关键帧属于相同的镜头；两个所述视频关键帧的所述人脸属于同一个人时，表明两个所述视频关键帧属于相同发言人物的镜头，因此属于相同的视频镜头，不需要对其进行镜头切分。

步骤S302、在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。

步骤S303、获取切分后的所述镜头的视频镜头序列。在进行镜头切分之后，将进行镜头切分后的视频镜头分别给予一个视频镜头序列，以便于将其关联至所述视频文件，亦方便其后对其进行排序与检索。

本发明实施例提供的上述方法，自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息；根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人；在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。该方案首先检测视频关键帧中的人脸信息，并通过检测到的所述人脸信息判断两个背景相同的相邻视频关键帧是否属于同一个镜头，最终根据判断结果进行镜头切分；该方案在会场背景相同的情况下，可以通过发言人物的人脸不同判断其属于不同的镜头而对视频文件进行镜头切分，解决了背景相似或相同的视频文件难以进行镜头切分的问题，提高了镜头切分效率，提升了用户体验。

对应本发明实施例提供的视频镜头切分的方法，本发明还提供视频镜头切分的装置，如图6所示，该装置可包括：

第一检测模块61，用于自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息；

第二检测模块62，用于根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人；

镜头切分模块63，用于在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。

在一个实施例中，如图7所示，所述第一检测模块61包括：

提取子模块611，用于接收待切分镜头的视频文件，自所述视频文件中提取视频关键帧；

第一检测子模块612，用于检测所述视频关键帧中是否存在人脸；

第一标记模块613，用于在所述视频关键帧中存在人脸时，将所述视频关键帧标记为存在人脸状态后，将检测到的人脸信息与所述视频关键帧关联后存储；

第二标记模块614，用于在所述视频关键帧中不存在人脸时，将所述视频关键帧的人脸信息标记为无人脸状态。

在一个实施例中，如图8所示，所述第二检测模块62包括：

第二检测子模块621，用于检测相邻的两个视频关键帧是否均为存在人脸状态；

第三检测子模块622，用于在相邻的两个所述视频关键帧均为存在人脸状态时，检测两个所述视频关键帧中存在的人脸是否属于同一个人。

在一个实施例中，如图9所示，所述第二检测模块62还包括：

第一确认子模块623，用于在相邻的两个所述视频关键帧均为无人脸状态时，确定两个所述视频关键帧属于同一个镜头；

第一镜头切分子模块624，用于在相邻的两个所述视频关键帧中，一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。

在一个实施例中，如图10所示，所述镜头切分模块63包括：

第二确认子模块631，用于在所述人脸属于同一个人时，确定两个所述视频关键帧属于相同的镜头；

第二镜头切分子模块632，用于在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分；

获取子模块633，用于获取切分后的所述镜头的视频镜头序列。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种视频镜头切分的方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，所述自接收到的待切分镜头的视频文件中提取视频关键帧，并在检测所述视频关键帧中是否存在人脸后，记录人脸信息，包括：

检测所述视频关键帧中是否存在人脸；

3.如权利要求2所述的方法，其特征在于，所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人，包括：

检测相邻的两个视频关键帧是否均为存在人脸状态；

4.如权利要求3所述的方法，其特征在于，所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人，还包括：

5.如权利要求3所述的方法，其特征在于，所述在所述人脸不属于同一个人时，确定两个所述视频关键帧属于不同的镜头，并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分，还包括：

获取切分后的所述镜头的视频镜头序列。

6.一种视频镜头切分的装置，其特征在于，包括：

7.如权利要求6所述的装置，其特征在于，所述第一检测模块包括：

8.如权利要求6所述的装置，其特征在于，所述第二检测模块包括：

9.如权利要求6或8所述的装置，其特征在于，所述第二检测模块还包括：

10.如权利要求8所述的装置，其特征在于，所述镜头切分模块包括：

获取子模块，用于获取切分后的所述镜头的视频镜头序列。