CN106162222B - 一种视频镜头切分的方法及装置 - Google Patents
一种视频镜头切分的方法及装置 Download PDFInfo
- Publication number
- CN106162222B CN106162222B CN201510195911.9A CN201510195911A CN106162222B CN 106162222 B CN106162222 B CN 106162222B CN 201510195911 A CN201510195911 A CN 201510195911A CN 106162222 B CN106162222 B CN 106162222B
- Authority
- CN
- China
- Prior art keywords
- video
- key frame
- face
- adjacent
- same person
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23418—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
- G06V40/162—Detection; Localisation; Normalisation using pixel segmentation or colour matching
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs
- H04N21/23412—Processing of video elementary streams, e.g. splicing of video streams, manipulating MPEG-4 scene graphs for generating or manipulating the scene composition of objects, e.g. MPEG-4 objects
Abstract
本发明公开了一种视频镜头切分的方法及装置,用以解决背景相似的视频文件难以切分的问题,实现了在相似的会场背景下精确切分视频镜头。所述方法包括:根据自所述视频关键帧中检测并记录的人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。该方案在会场背景相同的情况下,可以通过发言人物的人脸不同判断其属于不同的镜头而对视频文件进行镜头切分,解决了背景相似或相同的视频文件难以进行镜头切分的问题,提高了镜头切分效率,提升了用户体验。
Description
技术领域
本发明涉及互联网技术领域,特别涉及一种视频镜头切分的方法及装置。
背景技术
随着科学技术的发展,视频等多媒体格式的信息数据越来越丰富,而为了便于查看或者建立检索的视频数据库等,可以将一个视频文件切分为多个不同的视频镜头对视频文件进行结构化处理。目前,在进行视频文件的镜头切分时,经常会出现的情况是待切分的视频文件的拍摄背景均为相似或者相同的场景,比如在会场中进行会议的视频文件,由于会场的布景都是一样的,但是在进行镜头切分时,需要对不同发言人物的视频镜头进行切分,因此,相同的会场背景对镜头切分的过程造成了很大的影响,加重了镜头切分难度。
发明内容
本发明提供一种视频镜头切分的方法及装置,用以解决背景相似的视频文件难以切分的问题,实现了在相似的会场背景下精确切分视频镜头。
根据本发明实施例的第一方面,提供一种视频镜头切分的方法,包括:
自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息;
根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;
在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
在一个实施例中,所述自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息,包括:
接收待切分镜头的视频文件,自所述视频文件中提取视频关键帧;
检测所述视频关键帧中是否存在人脸;
在所述视频关键帧中存在人脸时,将所述视频关键帧标记为存在人脸状态后,将检测到的人脸信息与所述视频关键帧关联后存储;
在所述视频关键帧中不存在人脸时,将所述视频关键帧的人脸信息标记为无人脸状态。
在一个实施例中,所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人,包括:
检测相邻的两个视频关键帧是否均为存在人脸状态;
在相邻的两个所述视频关键帧均为存在人脸状态时,检测两个所述视频关键帧中存在的人脸是否属于同一个人。
在一个实施例中,所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人,还包括:
在相邻的两个所述视频关键帧均为无人脸状态时,确定两个所述视频关键帧属于同一个镜头;
在相邻的两个所述视频关键帧中,一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
在一个实施例中,所述在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分,还包括:
在所述人脸属于同一个人时,确定两个所述视频关键帧属于相同的镜头;
在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分;
获取切分后的所述镜头的视频镜头序列。
根据本发明实施例的第二方面,还提供一种视频镜头切分的装置,包括:
第一检测模块,用于自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息;
第二检测模块,用于根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;
镜头切分模块,用于在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
在一个实施例中,所述第一检测模块包括:
提取子模块,用于接收待切分镜头的视频文件,自所述视频文件中提取视频关键帧;
第一检测子模块,用于检测所述视频关键帧中是否存在人脸;
第一标记模块,用于在所述视频关键帧中存在人脸时,将所述视频关键帧标记为存在人脸状态后,将检测到的人脸信息与所述视频关键帧关联后存储;
第二标记模块,用于在所述视频关键帧中不存在人脸时,将所述视频关键帧的人脸信息标记为无人脸状态。
在一个实施例中,所述第二检测模块包括:
第二检测子模块,用于检测相邻的两个视频关键帧是否均为存在人脸状态;
第三检测子模块,用于在相邻的两个所述视频关键帧均为存在人脸状态时,检测两个所述视频关键帧中存在的人脸是否属于同一个人。
在一个实施例中,所述第二检测模块还包括:
第一确认子模块,用于在相邻的两个所述视频关键帧均为无人脸状态时,确定两个所述视频关键帧属于同一个镜头;
第一镜头切分子模块,用于在相邻的两个所述视频关键帧中,一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
在一个实施例中,所述镜头切分模块包括:
第二确认子模块,用于在所述人脸属于同一个人时,确定两个所述视频关键帧属于相同的镜头;
第二镜头切分子模块,用于在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分;
获取子模块,用于获取切分后的所述镜头的视频镜头序列。
本发明实施例提供的技术方案可产生以下有益效果:自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息;根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。该方案首先检测视频关键帧中的人脸信息,并通过检测到的所述人脸信息判断两个背景相同的相邻视频关键帧是否属于同一个镜头,最终根据判断结果进行镜头切分;该方案在会场背景相同的情况下,可以通过发言人物的人脸不同判断其属于不同的镜头而对视频文件进行镜头切分,解决了背景相似或相同的视频文件难以进行镜头切分的问题,提高了镜头切分效率,提升了用户体验。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。
在附图中:
图1为本发明根据一示例性实施例示出的一种视频镜头切分的方法的流程图;
图2为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S10的实施方式流程图;
图3为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S20的一种实施方式流程图;
图4为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S20的另一种实施方式流程图;
图5为本发明根据一示例性实施例示出的视频镜头切分的方法中步骤S30的实施方式流程图;
图6为本发明根据一示例性实施例示出的视频镜头切分的装置的框图;
图7为本发明根据一示例性实施例示出的视频镜头切分的装置中第一检测模块61的框图;
图8为本发明根据一示例性实施例示出的视频镜头切分的装置中一种第二检测模块62的框图;
图9为本发明根据一示例性实施例示出的视频镜头切分的装置中另一种第二检测模块62的框图;
图10为本发明根据一示例性实施例示出的视频镜头切分的装置中镜头切分模块63的框图。
具体实施方式
以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
本公开实施例提供了一种视频镜头切分的方法,用于解决背景相似的视频文件难以切分的问题,实现了在相似的会场背景下精确切分视频镜头。如图1所示,该方法包括步骤S10-S30:
在步骤S10中,自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息。
本公开中的方法主要针对背景相似且将不同人物的存在场景作为切分依据的情况进行视频文件的视频镜头切分,比如在背景相同的会场或者是其他类似于会场的场景。其中,在本实施例中,检测所述视频关键帧中是否存在人脸后,所记录的人脸信息包括人物的图像、其所在的视频关键帧信息、该人物在视频中出现的时间、人脸在视频画面中的位置、人脸图像的大小等,以上信息均可用于判断相邻两个视频关键帧中的人脸是否属于同一个人,因此并不限定于为以上例举的参数,还可以是其他有助于分辨相邻两个视频关键帧中的人脸是否属于同一个人的信息。
在一个实施例中,如图2所示,所述步骤S10可包括:
步骤S101、接收待切分镜头的视频文件,自所述视频文件中提取视频关键帧。也即,首先需要接收到待处理的视频文件,并记录该视频文件的视频序列以便于在进行视频镜头切分后,将切分后的视频镜头序列与所述视频序列关联。之后,自所述视频文件中提取视频关键帧,同时给予所有视频关键帧不同的视频关键帧序列号并将其与所述视频文件的视频序列关联。
步骤S102、检测所述视频关键帧中是否存在人脸。也即,按照预先设定的顺序对各所述视频关键帧进行检测,判断各所述视频关键帧是否存在人脸。
步骤S103、在所述视频关键帧中存在人脸时,将所述视频关键帧标记为存在人脸状态后,将检测到的人脸信息与所述视频关键帧关联后存储。在步骤S102中检测到存在人脸时,先将所述视频关键帧标记为存在人脸,所述标记可以由用户或者系统自行定义,比如将存在人脸状态设定为“Yes”,无人脸状态设定为“No”;或者将存在人脸状态设定为“Ture”,无人脸状态设定为“False”,或者其他能代表两种状态的标记。在将所述视频关键帧标记为存在人脸状态后,将检测到的人脸信息与所述视频关键帧关联后存储,也即,所述人脸信息由于还需要用于与其他视频关键帧中的人脸进行比对,因此需要将其与当前视频关键帧关联后进行存储,以判断进行比对的两个所述视频关键帧是否属于同一视频镜头。
步骤S104、在所述视频关键帧中不存在人脸时,将所述视频关键帧的人脸信息标记为无人脸状态。在步骤S102中检测到不存在人脸时,先将所述视频关键帧标记为无人脸状态,由上述,所述标记可以由用户或者系统自行定义为能代表两种状态的标记。
在步骤S20中,根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人。
也即,在步骤S10中记录的所述人脸信息用于与其他视频关键帧中的人脸进行比对,因此在步骤S10中将检测到的人脸信息与其所在的视频关键帧关联后进行存储,并以此判断进行比对的两个所述视频关键帧中的人脸是否属于同一人,进而判断两个所述视频关键帧是否属于同一视频镜头。
在一个实施例中,如图3所示,所述步骤S20可包括:
步骤S201、检测相邻的两个视频关键帧是否均为存在人脸状态。首先,需要检测所述视频关键帧的状态为存在人脸状态还是无人脸状态;当两个所述视频关键帧的状态均为存在人脸状态时,需要根据两个所述视频关键帧的人脸信息进一步判断两个所述视频关键帧中的人脸是否属于同一人,进而判断两个所述视频关键帧是否属于同一视频镜头;如果两个所述视频关键帧的状态均为不在人脸状态时,则两个所述视频关键帧属于同一个视频镜头,不需要进行镜头切分;如果两个所述视频关键帧的状态一个为无人脸状态而另一个为存在人脸状态时,两个所述视频关键帧属于不同的镜头,此时需要对两个所述视频关键帧进行镜头切分。
步骤S202、在相邻的两个所述视频关键帧均为存在人脸状态时,检测两个所述视频关键帧中存在的人脸是否属于同一个人;在两个所述视频关键帧的人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分;在所述视频关键帧的人脸属于同一个人时,确定两个所述视频关键帧属于相同的镜头,不对其进行镜头切分。
在一个实施例中,如图4所示,所述步骤S20还可包括:
步骤S203、在相邻的两个所述视频关键帧均为无人脸状态时,确定两个所述视频关键帧属于同一个镜头;比如,在会场中两个发言人物交替发言的中间阶段或者是休息时段均会出现该种场景。
步骤S204、在相邻的两个所述视频关键帧中,一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。比如,在会场中两个发言人物交替发言的中间阶段或者休息时段的前后交接时分会出现该种场景。
在步骤S30中,在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。两个所述视频关键帧的所述人脸不属于同一个人时,表明两个所述视频关键帧属于不同发言人物的镜头,因此属于不同的视频镜头,需要对其进行镜头切分。
在一个实施例中,如图5所示,所述步骤S30可包括:
步骤S301、在所述人脸属于同一个人时,确定两个所述视频关键帧属于相同的镜头;两个所述视频关键帧的所述人脸属于同一个人时,表明两个所述视频关键帧属于相同发言人物的镜头,因此属于相同的视频镜头,不需要对其进行镜头切分。
步骤S302、在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
步骤S303、获取切分后的所述镜头的视频镜头序列。在进行镜头切分之后,将进行镜头切分后的视频镜头分别给予一个视频镜头序列,以便于将其关联至所述视频文件,亦方便其后对其进行排序与检索。
本发明实施例提供的上述方法,自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息;根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。该方案首先检测视频关键帧中的人脸信息,并通过检测到的所述人脸信息判断两个背景相同的相邻视频关键帧是否属于同一个镜头,最终根据判断结果进行镜头切分;该方案在会场背景相同的情况下,可以通过发言人物的人脸不同判断其属于不同的镜头而对视频文件进行镜头切分,解决了背景相似或相同的视频文件难以进行镜头切分的问题,提高了镜头切分效率,提升了用户体验。
对应本发明实施例提供的视频镜头切分的方法,本发明还提供视频镜头切分的装置,如图6所示,该装置可包括:
第一检测模块61,用于自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息;
第二检测模块62,用于根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;
镜头切分模块63,用于在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
在一个实施例中,如图7所示,所述第一检测模块61包括:
提取子模块611,用于接收待切分镜头的视频文件,自所述视频文件中提取视频关键帧;
第一检测子模块612,用于检测所述视频关键帧中是否存在人脸;
第一标记模块613,用于在所述视频关键帧中存在人脸时,将所述视频关键帧标记为存在人脸状态后,将检测到的人脸信息与所述视频关键帧关联后存储;
第二标记模块614,用于在所述视频关键帧中不存在人脸时,将所述视频关键帧的人脸信息标记为无人脸状态。
在一个实施例中,如图8所示,所述第二检测模块62包括:
第二检测子模块621,用于检测相邻的两个视频关键帧是否均为存在人脸状态;
第三检测子模块622,用于在相邻的两个所述视频关键帧均为存在人脸状态时,检测两个所述视频关键帧中存在的人脸是否属于同一个人。
在一个实施例中,如图9所示,所述第二检测模块62还包括:
第一确认子模块623,用于在相邻的两个所述视频关键帧均为无人脸状态时,确定两个所述视频关键帧属于同一个镜头;
第一镜头切分子模块624,用于在相邻的两个所述视频关键帧中,一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
在一个实施例中,如图10所示,所述镜头切分模块63包括:
第二确认子模块631,用于在所述人脸属于同一个人时,确定两个所述视频关键帧属于相同的镜头;
第二镜头切分子模块632,用于在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分;
获取子模块633,用于获取切分后的所述镜头的视频镜头序列。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种视频镜头切分的方法,其特征在于,包括:
自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息;
根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;
在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
2.如权利要求1所述的方法,其特征在于,所述自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息,包括:
接收待切分镜头的视频文件,自所述视频文件中提取视频关键帧;
检测所述视频关键帧中是否存在人脸;
在所述视频关键帧中存在人脸时,将所述视频关键帧标记为存在人脸状态后,将检测到的人脸信息与所述视频关键帧关联后存储;
在所述视频关键帧中不存在人脸时,将所述视频关键帧的人脸信息标记为无人脸状态。
3.如权利要求2所述的方法,其特征在于,所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人,包括:
检测相邻的两个视频关键帧是否均为存在人脸状态;
在相邻的两个所述视频关键帧均为存在人脸状态时,检测两个所述视频关键帧中存在的人脸是否属于同一个人。
4.如权利要求3所述的方法,其特征在于,所述根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人,还包括:
在相邻的两个所述视频关键帧均为无人脸状态时,确定两个所述视频关键帧属于同一个镜头;
在相邻的两个所述视频关键帧中,一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
5.如权利要求3所述的方法,其特征在于,所述在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分,还包括:
在所述人脸属于同一个人时,确定两个所述视频关键帧属于相同的镜头;
在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分;
获取切分后的所述镜头的视频镜头序列。
6.一种视频镜头切分的装置,其特征在于,包括:
第一检测模块,用于自接收到的待切分镜头的视频文件中提取视频关键帧,并在检测所述视频关键帧中是否存在人脸后,记录人脸信息;
第二检测模块,用于根据记录的所述人脸信息检测相邻的两个视频关键帧中的人脸是否属于同一个人;
镜头切分模块,用于在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
7.如权利要求6所述的装置,其特征在于,所述第一检测模块包括:
提取子模块,用于接收待切分镜头的视频文件,自所述视频文件中提取视频关键帧;
第一检测子模块,用于检测所述视频关键帧中是否存在人脸;
第一标记模块,用于在所述视频关键帧中存在人脸时,将所述视频关键帧标记为存在人脸状态后,将检测到的人脸信息与所述视频关键帧关联后存储;
第二标记模块,用于在所述视频关键帧中不存在人脸时,将所述视频关键帧的人脸信息标记为无人脸状态。
8.如权利要求6所述的装置,其特征在于,所述第二检测模块包括:
第二检测子模块,用于检测相邻的两个视频关键帧是否均为存在人脸状态;
第三检测子模块,用于在相邻的两个所述视频关键帧均为存在人脸状态时,检测两个所述视频关键帧中存在的人脸是否属于同一个人。
9.如权利要求6或8所述的装置,其特征在于,所述第二检测模块还包括:
第一确认子模块,用于在相邻的两个所述视频关键帧均为无人脸状态时,确定两个所述视频关键帧属于同一个镜头;
第一镜头切分子模块,用于在相邻的两个所述视频关键帧中,一个所述视频关键帧为无人脸状态而另一个所述视频关键帧为存在人脸状态时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分。
10.如权利要求8所述的装置,其特征在于,所述镜头切分模块包括:
第二确认子模块,用于在所述人脸属于同一个人时,确定两个所述视频关键帧属于相同的镜头;
第二镜头切分子模块,用于在所述人脸不属于同一个人时,确定两个所述视频关键帧属于不同的镜头,并在两个所述视频关键帧的相邻位置对所述视频文件进行镜头切分;
获取子模块,用于获取切分后的所述镜头的视频镜头序列。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510195911.9A CN106162222B (zh) | 2015-04-22 | 2015-04-22 | 一种视频镜头切分的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510195911.9A CN106162222B (zh) | 2015-04-22 | 2015-04-22 | 一种视频镜头切分的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106162222A CN106162222A (zh) | 2016-11-23 |
CN106162222B true CN106162222B (zh) | 2019-05-24 |
Family
ID=57346324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510195911.9A Expired - Fee Related CN106162222B (zh) | 2015-04-22 | 2015-04-22 | 一种视频镜头切分的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106162222B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108924644B (zh) * | 2018-06-20 | 2021-11-26 | 阿里巴巴(中国)有限公司 | 视频片段提取方法及装置 |
CN109582823A (zh) * | 2018-11-21 | 2019-04-05 | 平安科技(深圳)有限公司 | 视频信息链式存储方法、装置、计算机设备及存储介质 |
CN110430443B (zh) * | 2019-07-11 | 2022-01-25 | 平安科技(深圳)有限公司 | 视频镜头剪切的方法、装置、计算机设备及存储介质 |
CN110287949B (zh) * | 2019-07-30 | 2021-04-06 | 腾讯音乐娱乐科技(深圳)有限公司 | 视频片段提取方法、装置、设备及存储介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021904A (zh) * | 2006-10-11 | 2007-08-22 | 鲍东山 | 视频内容分析系统 |
CN101790049A (zh) * | 2010-02-25 | 2010-07-28 | 深圳市茁壮网络股份有限公司 | 一种新闻节目视频分段方法及系统 |
CN102547139A (zh) * | 2010-12-30 | 2012-07-04 | 北京新岸线网络技术有限公司 | 一种新闻视频节目切分方法、新闻视频编目方法及系统 |
CN103530652A (zh) * | 2013-10-23 | 2014-01-22 | 北京中视广信科技有限公司 | 一种基于人脸聚类的视频编目方法、检索方法及其系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8825478B2 (en) * | 2011-01-10 | 2014-09-02 | Nuance Communications, Inc. | Real time generation of audio content summaries |
-
2015
- 2015-04-22 CN CN201510195911.9A patent/CN106162222B/zh not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101021904A (zh) * | 2006-10-11 | 2007-08-22 | 鲍东山 | 视频内容分析系统 |
CN101790049A (zh) * | 2010-02-25 | 2010-07-28 | 深圳市茁壮网络股份有限公司 | 一种新闻节目视频分段方法及系统 |
CN102547139A (zh) * | 2010-12-30 | 2012-07-04 | 北京新岸线网络技术有限公司 | 一种新闻视频节目切分方法、新闻视频编目方法及系统 |
CN103530652A (zh) * | 2013-10-23 | 2014-01-22 | 北京中视广信科技有限公司 | 一种基于人脸聚类的视频编目方法、检索方法及其系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106162222A (zh) | 2016-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109858371B (zh) | 人脸识别的方法及装置 | |
Truong et al. | Video abstraction: A systematic review and classification | |
US8879788B2 (en) | Video processing apparatus, method and system | |
KR100827846B1 (ko) | 동영상에 포함된 특정 인물을 검색하여 원하는 시점부터재생하기 위한 방법 및 시스템 | |
US20160198097A1 (en) | System and method for inserting objects into an image or sequence of images | |
US9324374B2 (en) | Method and system for automatic generation of clips from a plurality of images based on an inter-objects relationship score | |
CN103200463A (zh) | 一种视频摘要生成方法和装置 | |
CN110914872A (zh) | 用认知洞察力导航视频场景 | |
US8873861B2 (en) | Video processing apparatus and method | |
Chen et al. | Visual storylines: Semantic visualization of movie sequence | |
KR20070118635A (ko) | 오디오 및/또는 비주얼 데이터의 서머라이제이션 | |
CN102231820B (zh) | 一种监控图像处理的方法、装置和系统 | |
CN101945212B (zh) | 图像捕获设备、图像处理方法 | |
US20190013047A1 (en) | Identifying interesting portions of videos | |
TW200536389A (en) | Intelligent key-frame extraction from a video | |
CN106162222B (zh) | 一种视频镜头切分的方法及装置 | |
CN113709561A (zh) | 视频剪辑方法、装置、设备及存储介质 | |
US10037467B2 (en) | Information processing system | |
KR20090093904A (ko) | 장면 변화에 강인한 멀티미디어 영상 분석 장치 및 그 방법과, 그를 이용한 객체 기반 멀티미디어 편집 시스템 | |
KR20160057867A (ko) | 디스플레이 장치 및 그에 의한 이미지 처리 방법 | |
CN106851395B (zh) | 视频播放方法和播放器 | |
US10924637B2 (en) | Playback method, playback device and computer-readable storage medium | |
KR100827848B1 (ko) | 영상 통화 기록을 이용하여 디지털 데이터에 포함된 인물을인식하고 화면에 영상을 디스플레이하는 방법 및 시스템 | |
CN112287771A (zh) | 用于检测视频事件的方法、装置、服务器和介质 | |
JP2013195725A (ja) | 画像表示システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A method and device for video shot segmentation Effective date of registration: 20210104 Granted publication date: 20190524 Pledgee: Inner Mongolia Huipu Energy Co.,Ltd. Pledgor: WUXI TVMINING MEDIA SCIENCE & TECHNOLOGY Co.,Ltd. Registration number: Y2020990001517 |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20190524 Termination date: 20210422 |