WO2016038522A1

WO2016038522A1 - Sélection et présentation de trames représentatives pour des prévisualisations vidéo

Info

Publication number: WO2016038522A1
Application number: PCT/IB2015/056783
Authority: WO
Inventors: Sanketh Shetty; Tomas IZO; Min-Hsuan Tsai; Sudheendra Vijayanarasimhan; Apostol Natsev; Sami Abu-El-Haija; George Toderici; Susanna Ricco; Balakrishnan Varadarajan; Nicola MUSCETTOLA; Weihsin Gu; Weilong Yang; Nitin Khandelwal; Phuong Le
Original assignee: Google Inc.
Priority date: 2014-09-08
Filing date: 2015-09-05
Publication date: 2016-03-17
Also published as: EP3192273A1; US12014542B2; US10867183B2; CN107077595A; US20160070962A1; EP3192273A4; US9953222B2; US20180239964A1; US20210166035A1

Abstract

L'invention concerne un procédé mis en œuvre par ordinateur pour sélectionner des trames représentatives pour des vidéos. Le procédé consiste à recevoir une vidéo et à identifier un ensemble de caractéristiques pour chacune des trames de la vidéo. Les caractéristiques comprennent des caractéristiques à base de trame et des caractéristiques sémantiques. Les caractéristiques sémantiques identifient des probabilités de concepts sémantiques qui sont présents sous forme de contenu dans les trames de la vidéo. Un ensemble de segments vidéo pour la vidéo est ensuite généré. Chaque segment vidéo comprend un sous-ensemble chronologique de trames provenant de la vidéo et chaque trame est associée à au moins une des caractéristiques sémantiques. Le procédé génère un score pour chaque trame du sous-ensemble de trames pour chaque segment vidéo, sur la base au moins des caractéristiques sémantiques, et sélectionne une trame représentative pour chaque segment vidéo sur la base des scores des trames dans le segment vidéo. La trame représentative représente et résume le segment vidéo.