JP2017528016A5 - - Google Patents

Download PDF

Info

Publication number
JP2017528016A5
JP2017528016A5 JP2016572515A JP2016572515A JP2017528016A5 JP 2017528016 A5 JP2017528016 A5 JP 2017528016A5 JP 2016572515 A JP2016572515 A JP 2016572515A JP 2016572515 A JP2016572515 A JP 2016572515A JP 2017528016 A5 JP2017528016 A5 JP 2017528016A5
Authority
JP
Japan
Prior art keywords
video
frame
video frame
importance
video file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016572515A
Other languages
English (en)
Other versions
JP2017528016A (ja
JP6694829B2 (ja
Filing date
Publication date
Priority claimed from US14/303,466 external-priority patent/US10664687B2/en
Application filed filed Critical
Publication of JP2017528016A publication Critical patent/JP2017528016A/ja
Publication of JP2017528016A5 publication Critical patent/JP2017528016A5/ja
Application granted granted Critical
Publication of JP6694829B2 publication Critical patent/JP6694829B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Claims (10)

  1. デオファイルをデコードして、ビデオフレーム及び該ビデオフレームに関連付けられたオーディオデータのうち少なくとも1つを取得することと、
    前記ビデオフレーム及び前記ビデオフレームに関連付けられた前記オーディオデータのうち前記少なくとも1つの、1つ以上の特徴を、局所的ルール及び大局的ルールのうち少なくとも1つに基づいて解析して、前記ビデオフレームの1つ以上の特徴スコアを取得することであって、前記1つ以上の特徴は、前記ビデオフレーム内の人間の顔の動き又は位置に関連する少なくとも1つの特徴を含む、ことと、
    前記ビデオフレームの前記1つ以上の特徴スコアを組み合わせて、前記ビデオフレームのフレーム重要度スコアを導出することと、
    前記ビデオファイルを、前記ビデオフレームの前記フレーム重要度スコアと前記ビデオファイルのさらなるビデオフレームの他フレーム重要度スコアとに少なくとも基づいて、異なるセクション重要度値のビデオセクションに区分することと、
    を含む動作をプロセッサに実行させるプログラム
  2. 前記動作は、前記セクション重要度値に従って前記ビデオセクションをランク付けすること、をさらに含む請求項1に記載のプログラム
  3. 前記動作は、
    前記ビデオファイル内のすべてのビデオフレームの前記フレーム重要度スコアに少なくとも基づいて前記ビデオファイルのビデオ重要度値を算出することと、
    前記ビデオファイルの前記ビデオ重要度値とさらなるビデオファイルの他ビデオ重要度値とに少なくとも基づいて、前記さらなるビデオファイルに対して前記ビデオファイルをランク付けすることと、
    をさらに含む請求項1に記載のプログラム
  4. 前記解析することは、
    前記ビデオフレームに対して顔検出を実行して1つ以上の人間の顔を検出することと、
    顔追跡を実行して前記1つ以上の人間の顔を追跡することと、
    前記ビデオフレーム内の少なくとも1つの人間の顔の顔サイズ、顔位置、又は1つ以上の顔面特徴に少なくとも基づいて、前記ビデオフレームに否定的スコアバイアス又は肯定的スコアバイアスを割り当てることであって、前記1つ以上の顔面特徴は、前記少なくとも1つの人間の顔内の笑み及び開いた目のうち少なくとも1つの、欠如又は存在を含む、ことと、
    前記1つ以上の人間の顔のうち少なくとも1つの人間の顔に対して、顔認識及び顔グループ化のうち少なくとも1つを実行することと、
    認識データ及び顔グループ化データのうち少なくとも1つに少なくとも基づいて1以上の主要人物を識別することと、
    前記ビデオフレーム内における主要人物の存在に対して、前記ビデオフレームにさらなる肯定的スコアバイアスを割り当てることと、
    前記否定的スコアバイアスと前記肯定的スコアバイアスとについて考慮する前記ビデオフレームの顔重要度スコアを計算することと、
    を含む、請求項1に記載のプログラム
  5. ビデオファイルをデコードして、ビデオフレーム及び該ビデオフレームに関連付けられたオーディオデータのうち少なくとも1つを取得することと、
    前記ビデオフレーム及び前記ビデオフレームに関連付けられた前記オーディオデータのうち少なくとも1つの、1つ以上の特徴を、局所的ルール及び大局的ルールのうち少なくとも1つに基づいて解析して、前記ビデオフレームの1つ以上の特徴スコアを取得することと、
    前記ビデオフレームの前記1つ以上の特徴スコアを組み合わせて、前記ビデオフレームのフレーム重要度スコアを導出することと、
    前記ビデオファイルのビデオ重要度値を、前記ビデオフレームの前記フレーム重要度スコアと前記ビデオファイルのさらなるビデオフレームの他フレーム重要度スコアとに少なくとも基づいて算出することと、
    前記ビデオファイルを、前記ビデオファイル内の複数のビデオフレームに関連付けられた、前記ビデオファイル内の複数のビデオフレームの前記フレーム重要度スコアに少なくとも基づいて、異なるセクション重要度のビデオセクションに区分することと、
    前記ビデオファイルの前記ビデオ重要度値とさらなるビデオファイルの他ビデオ重要度値とに少なくとも基づいて、前記さらなるビデオファイルに対して前記ビデオファイルをランク付けすることと、
    を含む、コンピュータにより実施される方法。
  6. 前記ビデオファイルを区分することは、
    前記ビデオファイルの前記ビデオフレーム内の特徴点を、前記ビデオフレームの複数のダウンサンプリングされた画像間における共通点を検出することによって、検出することと、
    前記ビデオフレーム内の前記特徴点を、前記ビデオファイルの前のビデオフレーム内の特徴点のさらなるセットに対してマッチさせることと、
    前記ビデオフレーム間における前記特徴点の動きを説明するホモグラフィ変換マトリクスを算出することと、
    前記ホモグラフィ変換マトリクスから前記ビデオフレームのモーションデータを計算することであって、前記モーションデータは、前記特徴点の動きのズーミング及び垂直並進成分の大きさ及び方向を含む、ことと、
    前記ビデオフレームの前記モーションデータを、前記ビデオファイル内の1つ以上の残りのフレームのモーションデータと組み合わせることと、
    前記ビデオファイル内の前記ビデオフレームの前記モーションデータの移動平均を算出することと、
    ゼロ交差ゾーンを確認して、前記移動平均に少なくとも基づいて前記モーションデータの局所的ピーク及び谷情報を見つけることと、
    前記ビデオファイルのビデオセクションを、前記モーションデータの前記局所的ピーク及び前記谷情報に少なくとも基づいて決定することと、
    を含む、請求項5に記載のコンピュータにより実施される方法。
  7. 前記解析することは、
    ビデオフレームに対して顔検出を実行して1つ以上の人間の顔を検出することと、
    顔追跡を実行して前記1つ以上の人間の顔を追跡することと、
    前記ビデオフレーム内の少なくとも1つの人間の顔の顔サイズ、顔位置、又は1つ以上の顔面特徴に少なくとも基づいて、前記ビデオフレームに否定的スコアバイアス又は肯定的スコアバイアスを割り当てることであって、前記1つ以上の顔面特徴は、前記少なくとも1つの人間の顔内の笑み及び開いた目のうち少なくとも1つの、欠如又は存在を含む、ことと、
    前記1つ以上の人間の顔のうち少なくとも1つの人間の顔に対して、顔認識及び顔グループ化のうち少なくとも1つを実行することと、
    認識データ及び顔グループ化データのうち少なくとも1つに少なくとも基づいて1以上の主要人物を識別することと、
    前記ビデオフレーム内における主要人物の存在に対して、前記ビデオフレームに肯定的スコアバイアスを割り当てることと、
    前記否定的スコアバイアスと前記肯定的スコアバイアスとについて考慮する前記ビデオフレームの顔重要度スコアを計算することと、
    を含む、請求項5に記載のコンピュータにより実施される方法。
  8. システムであって、
    1つ以上のプロセッサと、
    複数の動作を実行するように前記1つ以上のプロセッサにより実行可能である複数のコンピュータ実行可能コンポーネントを含むメモリと、
    を含み、前記複数の動作は、
    ビデオファイルをデコードして、ビデオフレーム及び該ビデオフレームに関連付けられたオーディオデータのうち少なくとも1つを取得することと、
    前記ビデオフレーム及び前記ビデオフレームに関連付けられた前記オーディオデータのうち前記少なくとも1つの、1つ以上の特徴を、局所的ルール及び大局的ルールのうち少なくとも1つに基づいて解析して、前記ビデオフレームの1つ以上の特徴スコアを取得することであって、前記局所的ルールは、前記ビデオフレームの特徴重要度の割り当てに影響し、前記大局的ルールは、前記ビデオフレームを含む前記ビデオファイル内の複数のビデオフレームの特徴重要度の割り当てに影響する、ことと、
    前記ビデオフレームの前記1つ以上の特徴スコアを組み合わせて、前記ビデオフレームのフレーム重要度スコアを導出することと、
    前記ビデオファイルを、前記ビデオファイル内の複数のビデオフレームに関連付けられた、前記ビデオファイル内の複数のビデオフレームの前記フレーム重要度スコアに少なくとも基づいて、異なるセクション重要度のビデオセクションに区分することと、
    前記ビデオフレームと前記ビデオファイル内のさらなるビデオフレームとの前記フレーム重要度スコアに少なくとも基づいて算出された、前記ビデオセクションのセクション重要度値に従って、前記ビデオセクションをランク付けすることと、
    を含む、システム。
  9. 前記複数の動作は、
    前記ビデオファイル内の前記複数のビデオフレームの前記フレーム重要度スコアに少なくとも基づいて、前記ビデオファイルのビデオ重要度値を算出することと、
    前記ビデオファイルの前記ビデオ重要度値とさらなるビデオファイルの他ビデオ重要度値とに少なくとも基づいて、前記さらなるビデオファイルに対して前記ビデオファイルをランク付けすることと、
    をさらに含む請求項に記載のシステム。
  10. 請求項1乃至4いずれか一項に記載のプログラムを記憶している記憶媒体。
JP2016572515A 2014-06-12 2015-06-10 ルールに基づくビデオ重要度解析 Active JP6694829B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/303,466 US10664687B2 (en) 2014-06-12 2014-06-12 Rule-based video importance analysis
US14/303,466 2014-06-12
PCT/US2015/034992 WO2015191650A1 (en) 2014-06-12 2015-06-10 Rule-based video importance analysis

Publications (3)

Publication Number Publication Date
JP2017528016A JP2017528016A (ja) 2017-09-21
JP2017528016A5 true JP2017528016A5 (ja) 2018-06-28
JP6694829B2 JP6694829B2 (ja) 2020-05-20

Family

ID=53488465

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016572515A Active JP6694829B2 (ja) 2014-06-12 2015-06-10 ルールに基づくビデオ重要度解析

Country Status (11)

Country Link
US (1) US10664687B2 (ja)
EP (1) EP3155557A1 (ja)
JP (1) JP6694829B2 (ja)
KR (1) KR102354692B1 (ja)
CN (1) CN106462744B (ja)
AU (1) AU2015274708B2 (ja)
BR (1) BR112016028586B1 (ja)
CA (1) CA2948529A1 (ja)
MX (1) MX2016016293A (ja)
RU (1) RU2693906C2 (ja)
WO (1) WO2015191650A1 (ja)

Families Citing this family (43)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160149956A1 (en) * 2014-11-21 2016-05-26 Whip Networks, Inc. Media management and sharing system
US9607224B2 (en) * 2015-05-14 2017-03-28 Google Inc. Entity based temporal segmentation of video streams
US9832484B2 (en) * 2015-05-20 2017-11-28 Texas Instruments Incorporated Still block detection in a video sequence
US9911202B2 (en) * 2015-08-24 2018-03-06 Disney Enterprises, Inc. Visual salience of online video as a predictor of success
US10602153B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Ultra-high video compression
US10602157B2 (en) 2015-09-11 2020-03-24 Facebook, Inc. Variable bitrate control for distributed video encoding
US10063872B2 (en) 2015-09-11 2018-08-28 Facebook, Inc. Segment based encoding of video
US10375156B2 (en) 2015-09-11 2019-08-06 Facebook, Inc. Using worker nodes in a distributed video encoding system
US10506235B2 (en) 2015-09-11 2019-12-10 Facebook, Inc. Distributed control of video encoding speeds
US10341561B2 (en) * 2015-09-11 2019-07-02 Facebook, Inc. Distributed image stabilization
US10499070B2 (en) 2015-09-11 2019-12-03 Facebook, Inc. Key frame placement for distributed video encoding
US10002435B2 (en) 2016-01-29 2018-06-19 Google Llc Detecting motion in images
EP3417608B1 (en) * 2016-02-18 2020-05-13 IMINT Image Intelligence AB System and method for video processing
US10432983B2 (en) * 2016-04-04 2019-10-01 Twitter, Inc. Live video classification and preview selection
US10402436B2 (en) * 2016-05-12 2019-09-03 Pixel Forensics, Inc. Automated video categorization, value determination and promotion/demotion via multi-attribute feature computation
US10347294B2 (en) * 2016-06-30 2019-07-09 Google Llc Generating moving thumbnails for videos
WO2018017836A1 (en) 2016-07-21 2018-01-25 Twitter, Inc. Live video streaming services with machine-learning based highlight replays
JP6866142B2 (ja) * 2016-12-09 2021-04-28 キヤノン株式会社 プログラム、画像処理装置、および画像処理方法
JP6948787B2 (ja) * 2016-12-09 2021-10-13 キヤノン株式会社 情報処理装置、方法およびプログラム
US10734027B2 (en) * 2017-02-16 2020-08-04 Fusit, Inc. System and methods for concatenating video sequences using face detection
EP3396964B1 (en) * 2017-04-25 2020-07-22 Accenture Global Solutions Ltd Dynamic content placement in a still image or a video
EP3396963B1 (en) 2017-04-25 2021-04-07 Accenture Global Solutions Limited Dynamic media content rendering
EP3396596B1 (en) * 2017-04-25 2020-08-19 Accenture Global Solutions Limited Heat ranking of media objects
US10409859B2 (en) * 2017-05-15 2019-09-10 Facebook, Inc. Video heat maps personalized for online system users
CN107437083B (zh) * 2017-08-16 2020-09-22 广西荷福智能科技有限公司 一种自适应池化的视频行为识别方法
CN107578000B (zh) * 2017-08-25 2023-10-31 百度在线网络技术(北京)有限公司 用于处理图像的方法及装置
WO2019070325A1 (en) * 2017-10-03 2019-04-11 Google Llc MICRO-VIDEO SYSTEM, FORMAT AND METHOD OF GENERATION
US10628486B2 (en) * 2017-11-15 2020-04-21 Google Llc Partitioning videos
EP3528196A1 (en) 2018-02-16 2019-08-21 Accenture Global Solutions Limited Dynamic content generation
CN108337535B (zh) * 2018-03-21 2020-12-29 广州视源电子科技股份有限公司 客户端视频的转发方法、装置、设备和存储介质
US10942816B1 (en) * 2018-09-06 2021-03-09 NortonLifeLock Inc. Systems and methods for dynamically adjusting a backup policy
EP3672256A1 (en) 2018-12-20 2020-06-24 Accenture Global Solutions Limited Dynamic media placement in video feed
US11514713B2 (en) * 2019-05-31 2022-11-29 Apple Inc. Face quality of captured images
CN110087145B (zh) * 2019-06-06 2020-04-21 北京字节跳动网络技术有限公司 用于处理视频的方法和装置
US11373407B2 (en) * 2019-10-25 2022-06-28 International Business Machines Corporation Attention generation
CN111125022A (zh) * 2019-11-15 2020-05-08 浙江大华技术股份有限公司 录像覆盖权重的确定方法、装置、设备和存储介质
WO2021174118A1 (en) * 2020-02-26 2021-09-02 Nvidia Corporation Object detection using image alignment for autonomous machine applications
CN114697700A (zh) * 2020-12-28 2022-07-01 北京小米移动软件有限公司 视频剪辑方法、视频剪辑装置及存储介质
CN112995676A (zh) * 2021-04-25 2021-06-18 北京金和网络股份有限公司 一种音视频压缩方法、装置、设备、系统及存储介质
US11917206B2 (en) 2021-12-17 2024-02-27 Lenovo (Singapore) Pte. Ltd. Video codec aware radio access network configuration and unequal error protection coding
US11824653B2 (en) 2021-12-17 2023-11-21 Lenovo (Singapore) Pte. Ltd. Radio access network configuration for video approximate semantic communications
US20240096102A1 (en) * 2022-09-17 2024-03-21 Nvidia Corporation Freespace detection using machine learning for autonomous systems and applications
CN115396622B (zh) * 2022-10-28 2023-03-24 广东电网有限责任公司中山供电局 一种低码率视频重构的电子设备

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001160066A (ja) 1998-12-25 2001-06-12 Matsushita Electric Ind Co Ltd データ処理装置、データ処理方法および記録媒体、並びに該データ処理方法をコンピュータに実行させるためのプログラム
SE9902328A0 (sv) 1999-06-18 2000-12-19 Ericsson Telefon Ab L M Förfarande och system för att alstra sammanfattad video
EP1182584A3 (en) 2000-08-19 2005-12-28 Lg Electronics Inc. Method and apparatus for video skimming
US20020167537A1 (en) 2001-05-11 2002-11-14 Miroslav Trajkovic Motion-based tracking with pan-tilt-zoom camera
US7143352B2 (en) 2002-11-01 2006-11-28 Mitsubishi Electric Research Laboratories, Inc Blind summarization of video content
NZ560223A (en) 2003-06-23 2008-12-24 Sony Pictures Entertainment Fingerprinting of data
WO2005001715A1 (en) 2003-06-30 2005-01-06 Koninklijke Philips Electronics, N.V. System and method for generating a multimedia summary of multimedia streams
JP4453976B2 (ja) 2004-03-30 2010-04-21 正彦 谷内田 画像生成装置、画像データ列生成システム、及び画像伝送システム
US8879856B2 (en) 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US20100005485A1 (en) 2005-12-19 2010-01-07 Agency For Science, Technology And Research Annotation of video footage and personalised video generation
US7836050B2 (en) 2006-01-25 2010-11-16 Microsoft Corporation Ranking content based on relevance and quality
KR100749045B1 (ko) * 2006-01-26 2007-08-13 삼성전자주식회사 음악 내용 요약본을 이용한 유사곡 검색 방법 및 그 장치
US7889794B2 (en) 2006-02-03 2011-02-15 Eastman Kodak Company Extracting key frame candidates from video clip
US20080019661A1 (en) 2006-07-18 2008-01-24 Pere Obrador Producing output video from multiple media sources including multiple video sources
US8200063B2 (en) 2007-09-24 2012-06-12 Fuji Xerox Co., Ltd. System and method for video summarization
JP2009118009A (ja) 2007-11-02 2009-05-28 Sony Corp 撮像装置、その制御方法およびプログラム
EP2112619B1 (en) 2008-04-22 2012-07-25 Universität Stuttgart Video data processing
WO2010006334A1 (en) * 2008-07-11 2010-01-14 Videosurf, Inc. Apparatus and software system for and method of performing a visual-relevance-rank subsequent search
JP4645707B2 (ja) 2008-09-01 2011-03-09 ソニー株式会社 コンテンツデータ処理装置
US8145648B2 (en) 2008-09-03 2012-03-27 Samsung Electronics Co., Ltd. Semantic metadata creation for videos
US8195038B2 (en) 2008-10-24 2012-06-05 At&T Intellectual Property I, L.P. Brief and high-interest video summary generation
JP4623201B2 (ja) 2008-10-27 2011-02-02 ソニー株式会社 画像処理装置、画像処理方法およびプログラム
JP5247356B2 (ja) 2008-10-29 2013-07-24 キヤノン株式会社 情報処理装置およびその制御方法
JP2011040860A (ja) 2009-08-07 2011-02-24 Nikon Corp 画像処理装置及び画像処理プログラム
US8553982B2 (en) * 2009-12-23 2013-10-08 Intel Corporation Model-based play field registration
CN101853286B (zh) 2010-05-20 2016-08-10 上海全土豆网络科技有限公司 视频缩略图智能选取方法
US8619150B2 (en) 2010-05-25 2013-12-31 Intellectual Ventures Fund 83 Llc Ranking key video frames using camera fixation
US8599316B2 (en) 2010-05-25 2013-12-03 Intellectual Ventures Fund 83 Llc Method for determining key video frames
US8665345B2 (en) 2011-05-18 2014-03-04 Intellectual Ventures Fund 83 Llc Video summary including a feature of interest
US8649558B2 (en) * 2011-05-31 2014-02-11 Wisconsin Alumni Research Foundation Video processing with region-based warping
CN102263907B (zh) 2011-08-04 2013-09-18 央视国际网络有限公司 比赛视频的播放控制方法及其片段信息的生成方法和装置
WO2013030634A1 (en) 2011-08-31 2013-03-07 Rocks International Group Pte Ltd Virtual advertising platform
US8873813B2 (en) 2012-09-17 2014-10-28 Z Advanced Computing, Inc. Application of Z-webs and Z-factors to analytics, search engine, learning, recognition, natural language, and other utilities
US20130179112A1 (en) * 2012-01-09 2013-07-11 Honeywell International Inc. Robust method for signal segmentation for motion classification in personal navigation
WO2013186958A1 (ja) 2012-06-13 2013-12-19 日本電気株式会社 映像重要度算出方法、映像処理装置およびその制御方法と制御プログラムを格納した記憶媒体
US8995823B2 (en) 2012-07-17 2015-03-31 HighlightCam, Inc. Method and system for content relevance score determination
US10362977B2 (en) * 2013-10-01 2019-07-30 Sway Operations, Llc System and method for measuring reaction time of a subject

Similar Documents

Publication Publication Date Title
JP2017528016A5 (ja)
McDuff et al. AFFDEX SDK: a cross-platform real-time multi-face expression recognition toolkit
CN106557726B (zh) 一种带静默式活体检测的人脸身份认证系统及其方法
RU2016148407A (ru) Основанный на правилах анализ важности видео
CN105678250B (zh) 视频中的人脸识别方法和装置
Marin-Jimenez et al. Detecting people looking at each other in videos
EP2905724B1 (en) Object detection system and method
CN106557723B (zh) 一种带交互式活体检测的人脸身份认证系统及其方法
Liong et al. Automatic micro-expression recognition from long video using a single spotted apex
US9110501B2 (en) Method and apparatus for detecting talking segments in a video sequence using visual cues
Marin-Jimenez et al. " Here's looking at you, kid": Detecting people looking at each other in videos
Rajagopalan et al. Detecting self-stimulatory behaviours for autism diagnosis
Bloom et al. Linear latent low dimensional space for online early action recognition and prediction
US10360441B2 (en) Image processing method and apparatus
US20150268728A1 (en) Systems and methods for notifying users of mismatches between intended and actual captured content during heads-up recording of video
JP2015204030A5 (ja)
Huang et al. Real-time automated detection of older adults' hand gestures in home and clinical settings
Kinasih et al. Centroid-Tracking-Aided Robust Object Detection for Hospital Objects
US20200125855A1 (en) Information processing apparatus, information processing method, system, and storage medium to determine staying time of a person in predetermined region
Lowhur et al. Dense optical flow based emotion recognition classifier
Chen et al. Soft biometrics integrated multi-target tracking
Kanagamalliga et al. Advancements in Real-Time Face Recognition Algorithms for Enhanced Smart Video Surveillance
KR101956166B1 (ko) 비주얼 큐를 이용하여 비디오 시퀀스에서 토킹 세그먼트를 검출하는 방법 및 장치
Gervasi et al. A method for predicting words by interpreting labial movements
Shahid et al. Comparisons of visual activity primitives for voice activity detection