CN107911748A - 一种基于人脸识别的视频裁剪方法 - Google Patents

一种基于人脸识别的视频裁剪方法 Download PDF

Info

Publication number
CN107911748A
CN107911748A CN201711202996.4A CN201711202996A CN107911748A CN 107911748 A CN107911748 A CN 107911748A CN 201711202996 A CN201711202996 A CN 201711202996A CN 107911748 A CN107911748 A CN 107911748A
Authority
CN
China
Prior art keywords
face
video
frame
picture
extraction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711202996.4A
Other languages
English (en)
Inventor
何欣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Rong Sheng Education Technology Co Ltd
Original Assignee
Nanjing Rong Sheng Education Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Rong Sheng Education Technology Co Ltd filed Critical Nanjing Rong Sheng Education Technology Co Ltd
Priority to CN201711202996.4A priority Critical patent/CN107911748A/zh
Publication of CN107911748A publication Critical patent/CN107911748A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47205End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for manipulating displayed content, e.g. interacting with MPEG-4 objects, editing locally
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/168Feature extraction; Face representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/172Classification, e.g. identification
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Oral & Maxillofacial Surgery (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明公开了一种基于人脸识别的视频裁剪方法,该方法包括如下步骤:1)从源视频文件中进行帧提取,通过openCV对视频进行逐帧解码,并提取每帧画面;2)通过基于caffe自研训练的人脸探测机制对单幅画面中的人脸位置进行探测提取;3)通过基于caffe训练,利用人脸特征分析提取库对画面中的人脸和标准人脸逐一对比相识度,判断是否匹配;4)将在视频中出现的同一个人脸的帧通过OpenH264编码库重新压缩写为MP4视频文件。本发明的有益技术效果是:可以在海量数据中自动裁剪出人物有效的短视频,并生成标签化视频数据,方便家长、老师对孩子的童年生活进行保存、留念。

Description

一种基于人脸识别的视频裁剪方法
技术领域
本发明涉及一种视频裁剪方法,尤其涉及一种基于人脸识别的视频裁剪方法。
背景技术
目前幼儿园拍摄的海量幼儿成长过程中的视频都无标签化处理,家长或相关业务系统都无法精准的获取某个小孩的视频数据,已经不能满足人们的要求。
发明内容
本发明的目的在于提供一种基于人脸识别的视频裁剪方法,解决现有技术存在的缺憾。
本发明采用如下技术方案实现:
一种基于人脸识别的视频裁剪方法,其特征在于,该方法包括如下步骤:1)从源视频文件中进行帧提取,通过openCV对视频进行逐帧解码,并提取每帧画面;2)通过基于caffe自研训练的人脸探测机制对单幅画面中的人脸位置进行探测提取;3)通过基于caffe训练,利用人脸特征分析提取库对画面中的人脸和标准人脸逐一对比相识度,判断是否匹配;4)将在视频中出现的同一个人脸的帧通过OpenH264编码库重新压缩写为MP4视频文件。
进一步的,在步骤3)中,判断基础算法如下:通过对画面中人脸的特征和标准库中人脸特性做欧氏距离测算;欧式距离最短的前10对距离结果中出现特征为同一个人被判别人为视频中出现的人。
本发明的有益技术效果是:可以在海量数据中自动裁剪出人物有效的短视频,并生成标签化视频数据,方便家长、老师对孩子的童年生活进行保存、留念。
附图说明
图1是总体架构图。
具体实施方式
通过下面对实施例的描述,将更加有助于公众理解本发明,但不能也不应当将申请人所给出的具体的实施例视为对本发明技术方案的限制,任何对部件或技术特征的定义进行改变和/或对整体结构作形式的而非实质的变换都应视为本发明的技术方案所限定的保护范围。
如图1所示的基于人脸识别的视频裁剪方法,该方法包括如下步骤:1)从源视频文件中进行帧提取,通过openCV对视频进行逐帧解码,并提取每帧画面;2)通过基于caffe自研训练的人脸探测机制对单幅画面中的人脸位置进行探测提取;3)通过基于caffe训练,利用人脸特征分析提取库对画面中的人脸和标准人脸逐一对比相识度,判断是否匹配;4)将在视频中出现的同一个人脸的帧通过OpenH264编码库重新压缩写为MP4视频文件,在步骤3)中,判断基础算法如下:通过对画面中人脸的特征和标准库中人脸特性做欧氏距离测算;欧式距离最短的前10对距离结果中出现特征为同一个人被判别人为视频中出现的人。本发明通过人脸识别判断人物在视频中的连续性,并根据连续性裁剪视频文件,同时将人物和表情数据附属给裁剪后的视频,通过欧氏距离提取筛选前10中出现概率最高的。
当然,本发明还可以有其他多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员可以根据本发明做出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

Claims (2)

1.一种基于人脸识别的视频裁剪方法,其特征在于,该方法包括如下步骤:1)从源视频文件中进行帧提取,通过openCV对视频进行逐帧解码,并提取每帧画面;2)通过基于caffe自研训练的人脸探测机制对单幅画面中的人脸位置进行探测提取;3)通过基于caffe训练,利用人脸特征分析提取库对画面中的人脸和标准人脸逐一对比相识度,判断是否匹配;4)将在视频中出现的同一个人脸的帧通过OpenH264编码库重新压缩写为MP4视频文件。
2.根据权利要求1所述的基于人脸识别的视频裁剪方法,其特征在于,在步骤3)中,判断基础算法如下:通过对画面中人脸的特征和标准库中人脸特性做欧氏距离测算;欧式距离最短的前10对距离结果中出现特征为同一个人被判别人为视频中出现的人。
CN201711202996.4A 2017-11-24 2017-11-24 一种基于人脸识别的视频裁剪方法 Pending CN107911748A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711202996.4A CN107911748A (zh) 2017-11-24 2017-11-24 一种基于人脸识别的视频裁剪方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711202996.4A CN107911748A (zh) 2017-11-24 2017-11-24 一种基于人脸识别的视频裁剪方法

Publications (1)

Publication Number Publication Date
CN107911748A true CN107911748A (zh) 2018-04-13

Family

ID=61848906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711202996.4A Pending CN107911748A (zh) 2017-11-24 2017-11-24 一种基于人脸识别的视频裁剪方法

Country Status (1)

Country Link
CN (1) CN107911748A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595679A (zh) * 2018-05-02 2018-09-28 武汉斗鱼网络科技有限公司 一种标签确定方法、装置、终端和存储介质
CN109543638A (zh) * 2018-11-29 2019-03-29 与德科技有限公司 一种人脸识别方法、装置、设备及存储介质
CN110072055A (zh) * 2019-05-07 2019-07-30 中国联合网络通信集团有限公司 基于人工智能的视频制作方法及系统
CN110287765A (zh) * 2019-05-06 2019-09-27 平安科技(深圳)有限公司 基于人脸识别的宝宝长相预测方法、装置及存储介质
CN110446061A (zh) * 2019-07-04 2019-11-12 深圳壹账通智能科技有限公司 视频数据获取方法、装置、计算机设备及存储介质
CN110933488A (zh) * 2018-09-19 2020-03-27 传线网络科技(上海)有限公司 视频剪辑方法及装置
CN111031178A (zh) * 2019-12-19 2020-04-17 维沃移动通信有限公司 一种视频流裁剪方法及电子设备
WO2021196409A1 (zh) * 2020-04-01 2021-10-07 山东云缦智能科技有限公司 一种基于深度学习的视频人物检索方法及检索系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175021A1 (en) * 2002-11-29 2004-09-09 Porter Robert Mark Stefan Face detection
US20130051756A1 (en) * 2011-08-26 2013-02-28 Cyberlink Corp. Systems and Methods of Detecting Significant Faces in Video Streams
CN103530652A (zh) * 2013-10-23 2014-01-22 北京中视广信科技有限公司 一种基于人脸聚类的视频编目方法、检索方法及其系统
CN106534967A (zh) * 2016-10-25 2017-03-22 司马大大(北京)智能系统有限公司 视频剪辑方法及装置
CN106650577A (zh) * 2016-09-22 2017-05-10 江苏理工学院 监控视频数据文件中目标人物快速检索方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040175021A1 (en) * 2002-11-29 2004-09-09 Porter Robert Mark Stefan Face detection
US20130051756A1 (en) * 2011-08-26 2013-02-28 Cyberlink Corp. Systems and Methods of Detecting Significant Faces in Video Streams
CN103530652A (zh) * 2013-10-23 2014-01-22 北京中视广信科技有限公司 一种基于人脸聚类的视频编目方法、检索方法及其系统
CN106650577A (zh) * 2016-09-22 2017-05-10 江苏理工学院 监控视频数据文件中目标人物快速检索方法及系统
CN106534967A (zh) * 2016-10-25 2017-03-22 司马大大(北京)智能系统有限公司 视频剪辑方法及装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108595679A (zh) * 2018-05-02 2018-09-28 武汉斗鱼网络科技有限公司 一种标签确定方法、装置、终端和存储介质
CN110933488A (zh) * 2018-09-19 2020-03-27 传线网络科技(上海)有限公司 视频剪辑方法及装置
CN109543638A (zh) * 2018-11-29 2019-03-29 与德科技有限公司 一种人脸识别方法、装置、设备及存储介质
CN110287765A (zh) * 2019-05-06 2019-09-27 平安科技(深圳)有限公司 基于人脸识别的宝宝长相预测方法、装置及存储介质
CN110072055A (zh) * 2019-05-07 2019-07-30 中国联合网络通信集团有限公司 基于人工智能的视频制作方法及系统
CN110446061A (zh) * 2019-07-04 2019-11-12 深圳壹账通智能科技有限公司 视频数据获取方法、装置、计算机设备及存储介质
CN111031178A (zh) * 2019-12-19 2020-04-17 维沃移动通信有限公司 一种视频流裁剪方法及电子设备
WO2021196409A1 (zh) * 2020-04-01 2021-10-07 山东云缦智能科技有限公司 一种基于深度学习的视频人物检索方法及检索系统

Similar Documents

Publication Publication Date Title
CN107911748A (zh) 一种基于人脸识别的视频裁剪方法
US10637674B2 (en) System and method for real-time decoding and monitoring for encrypted instant messaging and other information exchange applications
US10304458B1 (en) Systems and methods for transcribing videos using speaker identification
CN107529068A (zh) 视频内容鉴别方法及系统
CN110232340B (zh) 建立视频分类模型以及视频分类的方法、装置
CN110675433A (zh) 视频处理方法、装置、电子设备及存储介质
CN111723791A (zh) 文字纠错方法、装置、设备及存储介质
CN108595477B (zh) 一种视频数据的处理方法和装置
WO2007019842A3 (de) Verfahren und schaltungsanordnung zum erkennen und verfolgen von augen mehrerer betrachter in echtzeit
US20230306463A1 (en) Methods, systems, and media for automated compliance determination of content items
MY182985A (en) Keyframe scheduling method and apparatus, electronic device, program and medium
CN102087704A (zh) 信息处理装置、信息处理方法和程序
CN106776971A (zh) 视频与电子书关联方法、设备、客户端设备和服务器
CN109922334A (zh) 一种视频质量的识别方法及系统
CN113705300A (zh) 音转文训练语料的获取方法、装置、设备以及存储介质
US9633542B2 (en) Electronic device and computer-based method for reminding using the electronic device
CN112511818A (zh) 视频播放质量检测方法、装置
CN112567416A (zh) 用于处理数字视频的设备及方法
US9008428B2 (en) Efficient verification or disambiguation of character recognition results
CN114240926B (zh) 板卡缺陷类别识别方法、装置、设备及可读存储介质
EP3616104B1 (en) Methods, systems, and media for detecting and transforming rotated video content items
CN111695670A (zh) 神经网络模型训练方法及装置
US20210241324A1 (en) Device and method for detecting display of provided credit, and program
CN111311197A (zh) 差旅数据处理方法及装置
Jiang et al. Exploiting 3D human recovery for action recognition with Spatio-temporal bifurcation fusion

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180413