JP2020536455A - ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体 - Google Patents

ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体 Download PDF

Info

Publication number
JP2020536455A
JP2020536455A JP2020519269A JP2020519269A JP2020536455A JP 2020536455 A JP2020536455 A JP 2020536455A JP 2020519269 A JP2020519269 A JP 2020519269A JP 2020519269 A JP2020519269 A JP 2020519269A JP 2020536455 A JP2020536455 A JP 2020536455A
Authority
JP
Japan
Prior art keywords
video
target
long
keyframe
target short
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020519269A
Other languages
English (en)
Other versions
JP2020536455A5 (ja
Inventor
リーキャン ドン,
リーキャン ドン,
シャオドン カオ,
シャオドン カオ,
シンウェイ ユー,
シンウェイ ユー,
グオキン チェン,
グオキン チェン,
チャンシン ジア,
チャンシン ジア,
スー ワン,
スー ワン,
ジンシェン チェン,
ジンシェン チェン,
シー ゼン,
シー ゼン,
シン チャン,
シン チャン,
ジャキ ジャン,
ジャキ ジャン,
チェンファ リウ,
チェンファ リウ,
ユエヤン ソン,
ユエヤン ソン,
シレイ ウェン,
シレイ ウェン,
フー リー,
フー リー,
ハオ スン,
ハオ スン,
シャオ リウ,
シャオ リウ,
リシン ゴン,
リシン ゴン,
ティアンバオ ユー,
ティアンバオ ユー,
フェン リー,
フェン リー,
フェイ リー,
フェイ リー,
ジュンリン チャオ,
ジュンリン チャオ,
ハイピン ワン,
ハイピン ワン,
ヤン シア,
ヤン シア,
チャオ リー,
チャオ リー,
シュウ ウェイ,
シュウ ウェイ,
キ ガオ,
キ ガオ,
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2020536455A publication Critical patent/JP2020536455A/ja
Publication of JP2020536455A5 publication Critical patent/JP2020536455A5/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4826End-user interface for program selection using recommendation lists, e.g. of programs or channels sorted out according to their score
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/73Querying
    • G06F16/735Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/431Generation of visual interfaces for content selection or interaction; Content or additional data rendering
    • H04N21/4312Generation of visual interfaces for content selection or interaction; Content or additional data rendering involving specific graphical features, e.g. screen layout, special fonts or colors, blinking icons, highlights or animations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/482End-user interface for program selection
    • H04N21/4828End-user interface for program selection for searching program descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4882Data services, e.g. news ticker for displaying messages, e.g. warnings, reminders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/65Transmission of management data between client and server
    • H04N21/658Transmission by the client directed to the server
    • H04N21/6582Data stored in the client, e.g. viewing habits, hardware capabilities, credit card number

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Computational Linguistics (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

ユーザが視聴するターゲットショートビデオを取得した後、これのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識し、ユーザにターゲットロングビデオを推奨する。ビデオフィンガープリント特徴に基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識する方式を採用するため、ターゲットショートビデオのタイトルにいずれのロングビデオ関連情報が含まれていない場合でも、ターゲットショートビデオが切り取られたターゲットロングビデオを認識でき、ユーザにターゲットロングビデオを能動的に推奨するため、ユーザが手動で検索するプロセスが回避され、従来技術の技術的課題が解決される。【選択図】 図1

Description

優先権情報
本出願は、バイドゥオンラインネットテクノロジー(ベイジン)カンパニーリミテッドが2017年12月07日付で提出した、発明の名称が「ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体」であり、中国特許出願番号が「201711287361.9」である特許出願の優先権を主張するものである。
本出願は、ビデオ処理技術の分野に関し、特に、ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体に関する。
再生時間が長い映画、ドラマ、バラエティなどのロングビデオに対して、ショートビデオは、短く洗練された特徴を持っているため、ユーザが随時視聴するのに便利である。したがって、このようなユーザの要求の中、ショートビデオ技術は、急速に発展している。
いくつかの応用シーンでは、ショートビデオは、ロングビデオを切り取ることによって得られ、ユーザはショートビデオを視聴した後、ショートビデオが切り取られたロングビデオを知ることができることを望んでいる。しかし、従来技術では、ユーザは、ショートビデオのタイトルによって関連するロングビデオを手動で検索することしかできず、ショートビデオのタイトルにロングビデオ関連情報が一つもない場合、ユーザは、関連するロングビデオを見つけることができない。
本出願は、関連技術における少なくとも一つの技術的課題をある程度解決することを目的とする。
そのため、本出願の第1の目的は、ユーザにショートビデオが切り取られたターゲットロングビデオを推奨して、ユーザが手動で検索するプロセスを回避するビデオ推奨方法を提供する。
本出願の第2の目的は、ビデオ推奨装置を提供することである。
本出願の第3の目的は、コンピュータ機器を提供することである。
本出願の第4の目的は、非一時的なコンピュータ読み取り可能な記憶媒体を提供することである。
本出願の第5の目的は、コンピュータプログラム製品を提供することである。
上記の目的を達成するために、本出願の第1の態様の実施例は、ユーザが視聴するターゲットショートビデオを取得するステップと、前記ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、前記候補ロングビデオから、前記ターゲットショートビデオが切り取られたターゲットロングビデオを認識するステップと、ユーザに前記ターゲットロングビデオを推奨するステップと、を含むビデオ推奨方法を提供する。
本出願の実施例のビデオ推奨方法は、ユーザが視聴するターゲットショートビデオを取得した後、ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識し、ユーザにターゲットロングビデオを推奨する。ビデオフィンガープリント特徴に基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識する方式を採用するため、ターゲットショートビデオのタイトルにいずれのロングビデオ関連情報が含まれていない場合でも、ターゲットショートビデオが切り取られたターゲットロングビデオを認識することができるとともに、ユーザにターゲットロングビデオを能動的に推奨するため、ユーザが手動で検索するプロセスが回避され、従来技術においてショートビデオが切り取られたロングビデオを認識する操作が便利ではないという技術的課題が解決される。
上記の目的を達成するために、本出願の第2の態様の実施例は、ユーザが視聴するターゲットショートビデオを取得するように構成される取得モジュールと、前記ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、前記候補ロングビデオから、前記ショートビデオが切り取られたターゲットロングビデオを認識するように構成される認識モジュールと、ユーザに前記ターゲットロングビデオを推奨するように構成される推奨モジュールと、を備えるビデオ推奨装置を提供する。
本出願の実施例のビデオ推奨装置は、ユーザが視聴するターゲットショートビデオを取得した後、ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識し、ユーザにターゲットロングビデオを推奨する。ビデオフィンガープリント特徴に基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識する方式を採用するため、ターゲットショートビデオのタイトルにいずれのロングビデオ関連情報が含まれていない場合でも、ターゲットショートビデオが切り取られたターゲットロングビデオを認識することができるとともに、ユーザにターゲットロングビデオを能動的に推奨するため、ユーザが手動で検索するプロセスが回避され、従来技術においてショートビデオが切り取られたロングビデオを認識する操作が便利ではないという技術的課題が解決される。
上記の目的を達成するために、本出願の第3の態様の実施例は、メモリと、プロセッサと、メモリに記憶され、プロセッサで実行可能なコンピュータプログラムと、を備えるコンピュータ機器であって、前記プロセッサが前記プログラムを実行する場合に、第1の態様に記載のビデオ推奨方法を実現するコンピュータ機器を提供する。
上記の目的を実現するために、本出願の第4の態様の実施例は、コンピュータプログラムが記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、当該プログラムがプロセッサによって実行される場合に、第1の態様に記載のビデオ推奨方法が実現される非一時的なコンピュータ読み取り可能な記憶媒体を提供する。
上記の目的を実現するために、本出願の第5の態様の実施例は、コンピュータプログラム製品であって、当前記コンピュータプログラム製品における命令がプロセッサによって実行される場合に、第1の態様に記載のビデオ推奨方法が実行されるンピュータプログラム製品を提供する。
本出願の付加的な特徴及び利点は、一部が以下の説明において示され、一部が以下の説明により明らかになり、又は本出願の実践により理解される。
本出願の上記及び/又は付加的な特徴及び利点は、実施例について図面を参照して以下に説明することにより、明らかになり、理解されやすくなる。
本出願の実施例により提供されるビデオ推奨方法の概略フローチャートである。 ビデオ再生関連ページの第1の概略図である。 ビデオ再生関連ページの第2の概略図である。 ビデオ再生関連ページの第3の概略図である。 ビデオ再生関連ページの第4の概略図である。 本出願の実施例により提供される別のビデオ推奨方法の概略フローチャートである。 第1のキーフレームを複数の局所的領域に分割した概略図である。 座標系XYの概略図である。 本出願の実施例により提供されるビデオ推奨装置の概略構成図である。 本出願の実施例により提供される別のビデオ推奨装置の概略構成図である。 本出願の実施形態の実現に適する例示的なコンピュータ機器のブロック図を示す。
以下、本出願の実施例を詳細に説明する。前記実施例における例が図面に示され、同一又は類似する符号は、常に同一又は類似する素子、或いは、同一又は類似する機能を有する素子を示す。以下に、図面を参照しながら説明される実施例は例示的なものであり、本出願を解釈するためだけに用いられ、本出願を限定するものと理解してはいけない。
以下、図面を参照して本出願の実施例のビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体を説明する。
図1は、本出願の実施例により提供されるビデオ推奨方法の概略フローチャートである。
ロングビデオから切り取れたショートビデオセグメントは、非常に効果的な伝播方式であり、映画やテレビなどのロングビデオをショートビデオ形式で伝播することができる。伝播中に、一部のユーザは、視聴するショートビデオがどのロングビデオから来るかをさらに知る要求がある。
この問題について、本出願の実施例は、ユーザが視聴するターゲットショートビデオが切り取られたターゲットロングビデオを認識し、ユーザに当該ターゲットロングビデオを推奨するビデオ推奨方法を提供する。
図1に示すように、当該ビデオ推奨方法は、以下のようなステップ101〜103を含む。
ステップ101において、ユーザが視聴するターゲットショートビデオを取得する。
具体的には、ユーザが使用するブラウザ又はビデオ再生アプリケーションプログラムがショートビデオリソースを要求することが検出された場合、ユーザが視聴するターゲットショートビデオのコンテンツを取得し、ここで、コンテンツは、ターゲットショートビデオの識別子と、画像と、オーディオとを含む。
ステップ102において、ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識する。
具体的には、本実施例の方法を実行するサーバは、複数の候補ロングビデオのビデオフィンガープリント特徴を事前に取得することによって、ターゲットショートビデオのビデオフィンガープリント特徴に基づいて、ビデオフィンガープリント特徴が互いにマッチングする候補ロングビデオを、ターゲットロングビデオとして検索することができる。ビデオフィンガープリント特徴は、ビデオのコンテンツを記述するためのものであるため、ターゲットショートビデオがターゲットロングビデオから切り取られたものである場合、二者のコンテンツは近似しており、ビデオフィンガープリント特徴も互いにマッチングすべきである。本実施例では、ビデオフィンガープリント特徴に基づいて、ターゲットショートビデオが切り取られたターゲットロングビデオを認識することは、高い精度を有する。
ビデオフィンガープリント特徴は、画像特徴とオーディオ特徴とを含み、ビデオに対してキーフレームを抽出した後、特徴抽出を行って得られたものである。ビデオフィンガープリント特徴を具体的に取得する方式について、後続の実施例で詳細に説明し、本実施例中では説明を省略する。
ステップ103において、ユーザにターゲットロングビデオを推奨する。
具体的には、前記ターゲットショートビデオを再生するための再生ページに、前記ターゲットロングビデオの提示情報を表示する。
ここでの提示情報は、ターゲットロングビデオの識別子、ターゲットロングビデオのリソースリンク、及びターゲットロングビデオが属するロングビデオ集合の識別子のうちの少なくとも一つを含んでもよい。具体的には、ターゲットロングビデオの識別子は、具体的には、ターゲットロングビデオのタイトルであってもよい。ターゲットロングビデオは、ドラマのある話である可能性があり、ターゲットロングビデオが属するロングビデオ集合は、具体的には、当該ドラマのタイトルである。
例えば、ターゲットショートビデオは、ドラマのある話から切り取られ、ターゲットショートビデオがドラマAの第n話から切り取られたことが認識された場合、提示情報は、「《ドラマA》から切り取られたものであり、クリックして完全なエピソードを視聴する」を表示することができ、提示情報は、「《ドラマA》の第n話から切り取られたものであり、クリックして完全なエピソードを視聴する」など、具体的な話数をさらに表示することができる。
提示情報にはターゲットロングビデオのリソースリンクが含まれているため、ユーザがターゲットロングビデオの提示情報に対してターゲット操作を実行することが検出された場合、前記ターゲットロングビデオを再生するように、ターゲットロングビデオを再生するための再生ページを表示する。ターゲット操作は、具体的には、ターゲットロングビデオの再生ページへのジャンプをトリガするためのクリックなどの操作であってもよい。
可能な一実現形態として、再生ページにターゲットショートビデオをフルスクリーンモードで再生する場合、前記再生ページにフローティングコントロールを表示する。ここで、フローティングコントロールは、前記ターゲットロングビデオの提示情報を表示し、ユーザが実行したターゲット操作に応答するように構成される。
別の可能な実現形態として、前記再生ページに一部の表示領域を用いて前記ターゲットショートビデオを再生する場合、つまり、前記ターゲットショートビデオを非フルスクリーンモードで再生する場合、前記再生ページに別の一部の表示領域を用いて前記提示情報を表示する。
本実施例の実現プロセスを明確に説明するために、以下、図2Aから図2Dのビデオ再生関連ページの概略図を組み合わせて、ユーザ操作の観点からビデオ推奨方法を詳細に説明する。
1)ユーザは、図2Aに示す再生リストページからリスト内の第2のショートビデオをターゲットショートビデオとして選択する。具体的には、ユーザは、第2のショートビデオのサムネイル、又はサムネイル右側のタイトルをクリックして選択することによって、図2Aに示す再生リストページから図2Bに示すターゲットショートビデオの再生ページへジャンプして、ショートビデオを再生することができる。
2)図2Bに示す再生ページ内には、ターゲットショートビデオを再生するための表示領域が配置されており、また、当該表示領域の下方には、別の表示領域が配置されており、別の表示領域を使用して提示情報を表示し、別の表示領域は、ターゲットショートビデオを再生するための表示領域の下方に位置することができる。別の表示領域内に表示された提示情報にはターゲットロングビデオのリソースリンクが含まれ、ユーザが提示情報をクリックすると、如図2Dに示すターゲットロングビデオの再生ページにジャンプして、ターゲットロングビデオを再生する。
3)図2Bに示す再生ページは、非フルスクリーン再生の方式でターゲットショートビデオを再生し、ユーザが図2Bに示す再生ページ内でフルスクリーン操作によって、図2Cに示すフルスクリーン再生モードでの再生ページを取得した場合、図2Cに示すページに、フローティングコントロールの方式で、ターゲットロングビデオの提示情報を表示し、ユーザがフローティングコントロールをクリックすると、図2Dに示すターゲットロングビデオの再生ページにジャンプして、ターゲットロングビデオを再生する。
本実施例では、ユーザが視聴するターゲットショートビデオを取得した後、ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識し、ユーザにターゲットロングビデオを推奨する。ビデオフィンガープリント特徴に基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識する方式を採用するため、ターゲットショートビデオのタイトルにいずれのロングビデオ関連情報が含まれていない場合でも、ショートビデオが切り取られたターゲットロングビデオを認識することができるとともに、ユーザにターゲットロングビデオを能動的に推奨するため、ユーザが手動で検索するプロセスが回避され、従来技術においてショートビデオが切り取られたロングビデオを認識する操作が便利ではないという技術的課題が解決される。
前の実施例は、フロントグラウンドでの実現を重点にして、ユーザにターゲットロングビデオを推奨するプロセスを説明した。前の実施例をさらに説明するために、本実施例は、別のビデオ推奨方法を提供して、どのように候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識することを実現するかというバックグラウンドの処理プロセスを重点的に説明する。図3は、本出願の実施例により提供される別のビデオ推奨方法の概略フローチャートである。
図3に示すように、当該ビデオ推奨方法は、以下のステップ201〜ステップ205を含むことができる。
ステップ201において、特徴インデックスライブラリを構築する。
具体的には、各候補ロングビデオの各第1のキーフレームに対して、第1のキーフレーム内の複数の局所的領域に基づいてそれぞれ画像特徴を抽出して、第1のキーフレームの画像特徴を取得し、複数の候補ロングビデオの各第1のキーフレームの画像特徴に基づいて、前記特徴インデックスライブラリを構築する。
特徴インデックスライブラリには、主に、各候補ロングビデオの各第1のキーフレームの画像特徴が記憶されている。具体的な実現では、ターゲットショートビデオは、ターゲットロングビデオから完全なフレーム画面を切り取り、これらの完全なフレーム画面をビデオ合成して得られたものであってもよいし、完全なフレーム画面を切り取った後、中央領域などのフレーム画面の一部を取り、フレーム画面下方の字幕、フレーム画面の四隅位置のマークなどの当該完全なフレーム画面における不要な画面を切り捨てる。
したがって、この場合、認識精度を向上させるために、各第1のキーフレームを複数の局所的領域に分割することができる。ここで、局所的領域の大きさは、本実施例の方法を実行するサーバ処理能力に基づいて決定することができ、処理能力が強いほど、第1のキーフレームを分割する局所的領域が多く、含まれる画素数は、それに応じて少ない。
図4は、第1のキーフレームが複数の局所的領域に分割される概略図である。図4に示すように、各局所的領域間には重複部分を有さなくてもよく、別の可能な実現形態では、隣接する局所的領域間には重複部分を有してもよく、本実施例ではこれについて限定しない。
第1のキーフレームを分割した各局所的領域の画像特徴を抽出し、各局所的領域の画像特徴を当該第1のキーフレームの画像特徴とする。
特徴インデックスライブラリには、第1のキーフレームの画像特徴が記憶されているだけでなく、対応するオーディオ特徴も記憶されている。可能な実現形態として、各第1のキーフレームに対して、当該第1のキーフレームの再生時刻に近似する1セグメントのオーディオを抽出し、抽出されたオーディオの特徴を抽出して、第1のキーフレームのオーディオ特徴を取得する。
これまで、特徴インデックスライブラリの構築プロセスが完了した。構築された特徴インデックスライブラリに、各候補ロングビデオについて、各第1のキーフレームの画像特徴及びオーディオ特徴が対応付けられて記憶されている。
ステップ202において、ユーザが視聴するターゲットショートビデオを取得し、ターゲットショートビデオのビデオフィンガープリント特徴を抽出する。
前記ターゲットショートビデオの画像コンテンツに基づいて、前記ターゲットショートビデオの複数の第2のキーフレームを抽出し、前記ターゲットショートビデオの各第2のキーフレームに対して、前記第2のキーフレームの画像特徴を前記ターゲットショートビデオのビデオフィンガープリント特徴として抽出する。
可能な実現形態として、第2のキーフレームの画像特徴を抽出した後、各第2のキーフレームについて、当該第2のキーフレーム再生時刻に近似する1セグメントのオーディオを抽出し、抽出されたオーディオに対して特徴抽出を行い、第2のキーフレームのオーディオ特徴を取得する。各第2のキーフレームの画像特徴及びオーディオ特徴を前記ターゲットショートビデオのビデオフィンガープリント特徴とする。
ステップ203において、特徴インデックスライブラリにおいて、ターゲットショートビデオにおける複数の第2のキーフレームの画像特徴に基づいて、画像特徴にマッチングする第1のキーフレームを検索して、各第2のキーフレームにマッチングするターゲット第1のキーフレームを取得する。
上記のステップでは、第1のキーフレームの複数の局所的領域の画像特徴を抽出して、第1のキーフレームの画像特徴を取得する。したがって、本ステップでは、第2のキーフレームを第1のキーフレームにマッチングする時、第1のキーフレームの複数の局所的領域における、画像特徴が第2のキーフレームにマッチングする局所的領域の数が閾値の数に達すると、当該第2のキーフレームが当該第1のキーフレームにマッチングすることが決定される。上記の方式を採用することによって、各キーフレームと特徴インデックスライブラリにおける各第2のキーフレームとを比較することによって、各第2のキーフレームにマッチングするターゲット第1のキーフレームが決定される。ここで決定されたターゲット第1のキーフレームは複数であり、異なる候補ロングビデオに属する可能性がある。
ステップ204において、同一候補ロングビデオに属する各ターゲット第1のキーフレームの再生時刻と、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻とに基づいて、各候補ロングビデオからターゲットロングビデオを決定する。
ここで、ターゲットロングビデオの各ターゲット第1のキーフレームの再生時刻は、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻にマッチングする。
可能な実現形態として、ターゲットショートビデオには、再生時刻に基づいて順番に並べられた複数の第2のキーフレームが含まれ、候補ロングビデオには、再生時刻に基づいて順番に並べられた複数のターゲット第1のキーフレームが含まれる。二つの第2のキーフレームの再生時刻に基づいて、二者の再生間隔を算出することができる。候補ロングビデオが所望のターゲットロングビデオである場合、当該再生間隔は、候補ロングビデオにおける、この二つの第2のキーフレームに対応してマッチングする二つのターゲット第1のキーフレーム間の再生間隔と一致しなければならない。なおは、ここでの一致は、一定の誤差範囲内の一致を指す。
別の可能な実現形態として、各候補ロングビデオについて、ターゲットショートビデオにおける複数の第2のキーフレームの再生時刻を縦軸Yとし、該候補ロングビデオにおける複数のターゲット第1のキーフレームの再生時刻を横軸Xとして、座標系XYを構築する。互いにマッチングするターゲット第1のキーフレームの再生時刻をx値とし、第2のキーフレームの再生時刻をy値とし、在座標系XYにおいて(x、y)座標点をプロットする。図5に示すように、各座標点を接続し、各座標点間の接続線が傾きが1の線形関係に近いか否かに基づいて、候補ロングビデオがターゲットロングビデオであるか否かを決定する。候補ロングビデオが所望のターゲットロングビデオである場合、各座標点間の接続線は線形関係に近いわけである。
ステップ205において、ユーザにターゲットロングビデオを推奨する。
具体的な推奨方式は、上記の実施例における関連説明を参照されたく、本実施例ではこれについての説明を省略する。
本実施例では、ユーザが視聴するターゲットショートビデオを取得した後、ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識し、ユーザにターゲットロングビデオを推奨する。ビデオフィンガープリント特徴に基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識する方式を採用するため、ターゲットショートビデオのタイトルにいずれのロングビデオ関連情報が含まれていない場合でも、切り取りのソースであるターゲットロングビデオを認識することができるとともに、ユーザにターゲットロングビデオを能動的に推奨するため、ユーザが手動で検索するプロセスが回避され、従来技術においてショートビデオが切り取られたロングビデオを認識する操作が便利ではないという技術的課題が解決されるとともに、第1のキーフレームの局所的領域に基づいて特徴抽出を行うため、所望のターゲットロングビデオをより正確に認識することができ、ショートビデオはフレーム画面の一部のみが切り取られたことによってターゲットロングビデオを認識できないことが回避される。
上記の実施例を実現するために、本出願は、ビデオ推奨装置をさらに提供する。
図6は、本出願の実施例により提供されるビデオ推奨装置の概略構成図である。
図6に示すように、当該ビデオ推奨装置は、取得モジュール61と、認識モジュール62と、推奨モジュール63とを備えている。
取得モジュール61は、ユーザが視聴するターゲットショートビデオを取得するように構成される。
認識モジュール62は、前記ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、前記候補ロングビデオから、前記ショートビデオが切り取られたターゲットロングビデオを認識するように構成される。
推奨モジュール63は、ユーザに前記ターゲットロングビデオを推奨するように構成される。
選択可能に、推奨モジュール63は、具体的には、前記ターゲットショートビデオを再生するための再生ページに前記ターゲットロングビデオの提示情報を表示するように構成され、前記提示情報は、前記ターゲットロングビデオの識別子、前記ターゲットロングビデオのリソースリンク、及び前記ターゲットロングビデオが属するロングビデオ集合の識別子のうちの少なくとも一つを含む。
可能な実現形態として、前記再生ページに前記ターゲットショートビデオをフルスクリーンモードで再生する場合、前記再生ページにフローティングコントロールを表示し、前記フローティングコントロールは、前記ターゲットロングビデオの提示情報を表示し、ユーザが実行したターゲット操作に応答するように構成される。
別の可能な実現形態として、前記再生ページに一部の表示領域を用いて前記ターゲットショートビデオを再生する場合、前記再生ページに別の一部の表示領域を用いて前記提示情報を表示する。
さらに、本出願の実施例の可能な一実現形態では、推奨モジュール63は、さらに、ユーザが前記ターゲットロングビデオの提示情報に対してターゲット操作を実行することが検出された場合、前記ターゲットロングビデオを再生するように、前記ターゲットロングビデオを再生するための再生ページを表示するように構成される。
なお、上記の方法実施例の説明は、当該実施例の装置にも適用されるため、ここでは説明を省略する。
上記の実施例に基づいて、本出願の実施例は、ビデオ推奨装置の可能な実現形態をさらに提供する。図7は、本出願の実施例により提供される別のビデオ推奨装置の概略構成図である。図7に示すように、前の実施例に基づいて、ビデオ推奨装置は、構築モジュール71をさらに備える。
構築モジュール71は、特徴インデックスライブラリを取得する前に、複数の候補ロングビデオの画像コンテンツに基づいて、第1のキーフレームを抽出して、各候補ロングビデオの複数の第1のキーフレームを取得し、各候補ロングビデオの各第1のキーフレームに対して、前記第1のキーフレーム内の複数の局所的領域に基づいてそれぞれ画像特徴を抽出して、前記第1のキーフレームの画像特徴を取得し、複数の候補ロングビデオの各第1のキーフレームの画像特徴に基づいて、前記特徴インデックスライブラリを構築するように構成される。
認識モジュール62は、取得ユニット621と、抽出ユニット622と、検索ユニット623と、を備える。
取得ユニット621は、複数の候補ロングビデオのビデオフィンガープリント特徴を含む特徴インデックスライブラリを取得するように構成され、前記ビデオフィンガープリント特徴は、画像特徴及び/又はオーディオ特徴を含む。
抽出ユニット622は、前記ターゲットショートビデオに対して前記ターゲットショートビデオのビデオフィンガープリント特徴を抽出するように構成される。
具体的には、抽出ユニット622は、具体的には、前記ターゲットショートビデオの画像コンテンツに基づいて、前記ターゲットショートビデオの複数の第2のキーフレームを抽出し、前記ターゲットショートビデオの各第2のキーフレームに対して、前記第2のキーフレームの画像特徴を前記ターゲットショートビデオのビデオフィンガープリント特徴として抽出するように構成される。
検索ユニット623は、前記特徴インデックスライブラリに基づいて、ビデオフィンガープリント特徴が前記ターゲットショートビデオにマッチングする候補ロングビデオを、前記ターゲットロングビデオとして検索するように構成される。
具体的には、検索ユニット623は、具体的には、前記特徴インデックスライブラリにおいて、前記ターゲットショートビデオにおける複数の第2のキーフレームの画像特徴に基づいて、画像特徴がマッチングする第1のキーフレームを検索して、各第2のキーフレームにマッチングするターゲット第1のキーフレームを取得し、同一候補ロングビデオに属する各ターゲット第1のキーフレームの再生時刻と、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻とに基づいて、各候補ロングビデオからターゲットロングビデオを決定するように構成され、前記ターゲットロングビデオの各ターゲット第1のキーフレームの再生時刻は、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻にマッチングする。
本出願の実施例では、ユーザが視聴するターゲットショートビデオを取得した後、ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識し、ユーザにターゲットロングビデオを推奨する。ビデオフィンガープリント特徴に基づいて、候補ロングビデオから、ターゲットショートビデオが切り取られたターゲットロングビデオを認識する方式を採用するため、ターゲットショートビデオのタイトルにいずれのロングビデオ関連情報が含まれていない場合でも、ターゲットショートビデオが切り取られたターゲットロングビデオを認識することができるとともに、ユーザにターゲットロングビデオを能動的に推奨するため、ユーザが手動で検索するプロセスが回避され、従来技術においてショートビデオが切り取られたロングビデオを認識する操作が便利ではないという技術的課題が解決される。
上記の実施例を実現するために、本出願は、メモリと、プロセッサと、メモリに記憶され、プロセッサで実行可能なコンピュータプログラムと、を備えるコンピュータ機器であって、前記プロセッサが前記プログラムを実行する場合に、上記のビデオ推奨方法を実現するコンピュータ機器をさらに提供する。
上記の実施例を実現するために、本出願は、コンピュータプログラムが記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、当該プログラムがプロセッサによって実行される場合に、上記のビデオ推奨方法が実現される非一時的なコンピュータ可読読み取り可能な記憶媒体をさらに提供する。
上記の実施例を実現するために、本出願は、コンピュータプログラム製品であって当前記コンピュータプログラム製品における命令がプロセッサによって実行される場合に、上記のビデオ推奨方法が実行されるをさらに提供する。
図8は、本出願の実施形態の実現に適する例示的なコンピュータ機器12のブロック図を示す。図8に示されるコンピュータ機器は、単なる一例であり、本出願の実施例の機能及び使用範囲を一切限定しない。
図8に示すように、コンピュータ機器12は、汎用コンピューティング機器の形態で示されている。コンピュータ機器12の構成要素は、一つ又は複数のプロセッサ又は処理ユニット16と、メモリ28と、異なるシステム構成要素(メモリ28と処理ユニット16とを含む)を接続するバス18と、を備えてもよいが、これらに限定されない。
バス18は、メモリバス又はメモリコントローラ、周辺バス、アクセラレーテッドグラフィックスポート、プロセッサ又は多様なバス構造のうちのいずれかのバス構造を使用するローカルバスを含む、複数種類のバス構造のうち一つ又は複数を表す。例を挙げると、これらのアーキテクチャは、インダストリスタンダードアーキテクチャ(Industry Standard Architecture、以下ISAと略する)バス、マイクロチャネルアーキテクチャ(Micro Channel Architecture、以下MACと略する)バス、拡張ISAバス、ビデオエレクトロニクススタンダーズアソシエーション(Video Electronics Standards Association、以下VESAと略する)ローカルバス、及びペリフェラルコンポーネントインターコネクト(Peripheral Component Interconnection、以下PCIと略する)バスを含むが、これらに限定されない。
コンピュータ機器12は、典型的には、複数種類のコンピュータシステム読み取り可能な媒体を備える。これらの媒体は、コンピュータ機器12がアクセスすることができる任意の使用可能な媒体であってもよく、揮発性媒体及び不揮発性媒体、リムーバブル媒体及びノンリムーバブル媒体を含む。
メモリ28は、ランダムアクセスメモリ(Random Access Memory、以下RAMと略する)30及び/又はキャッシュメモリ32などの揮発性メモリの形態のコンピュータシステム読み取り可能な媒体を備えてもよい。コンピュータ機器12は、他のリムーバブル/ノンリムーバブル、揮発性/不揮発性コンピュータシステム記憶媒体をさらに備えてもよい。単なる一例として、ストレージシステム34は、ノンリムーバブル、不揮発性磁気媒体(図8に示されていないが、通常「ハードドライブ」という)に対して読み出し及び書き込みをするために用いることができる。図8に示されていないが、リムーバブル不揮発性磁気ディスク(例えば、「フロッピーディスク」)に対して読み出し及び書き込みをするための磁気ディスクドライブ、及びリムーバブル不揮発性光学ディスク(例えば、光ディスク読取り専用メモリ(Compact Disc Read Only Memory、以下CD−ROMと略する)、デジタル多機能読取り用光ディスク(Digital Video Disc Read Only Memory、以下DVD−ROMと略する)又は他の光学媒体)に対して読み出し及び書き込みをするための光学ディスクドライブを提供することができる。これらの場合、各ドライブは、一つ又は複数のデータメディアインターフェイスを介してバス18に接続することができる。メモリ28は、本発明の各実施例に記載の機能を実行するように構成される1セット(例えば、少なくとも一つ)のプログラムモジュールを有する少なくとも一つのプログラム製品を備えてもよい。
1セットの(少なくとも1つ)プログラムモジュール42を有するプログラム/ユーティリティ40は、例えば、メモリ28に記憶されてもよく、このようなプログラムモジュール42は、オペレーティングシステム、1つまたは複数のアプリケーションプログラム、他のプログラムモジュールおよびプログラムデータを備えるが、これらに限定されない。これらの例のそれぞれまたはある組み合わせには、ネットワーキング環境の実装が含まれる可能性がある。プログラムモジュール42は、通常、本開示に記載の実施例における機能および/または方法を実行する。
コンピュータ機器12は、1つまたは複数の外部デバイス14(例えば、キーボード、ポインティングデバイス、ディスプレイ24など)と通信することができ、また、ユーザが当該コンピュータ機器12とインタラクションすることを可能にする1つまたは複数のデバイスと通信することができ、および/または、当該コンピュータ機器12が1つまたは複数の他のコンピューティングデバイスと通信することを可能にする任意のデバイス(例えば、ネットワークカード、モデムなど)と通信することもできる。そのような通信は、入力/出力(I/O)インターフェイス22を介して行うことができる。また、コンピュータ機器12は、ネットワークアダプタ20を介して、1つまたは複数のネットワーク(例えば、ローカルエリアネットワーク(Local Area Network、以下LANと略する)、ワイドエリアネットワーク(Wide Area Network、以下WANと略する)、および/またはパブリックネットワーク、例えば、インターネット)と通信することができる。図に示すように、ネットワークアダプタ20は、バス18を介してコンピュータ機器12の他のモジュールと通信する。なお、図に示されていないが、マイクロコード、デバイスドライバ、冗長化処理ユニット、外部ディスク駆動アレイ、RAIDシステム、テープドライバ、およびデータバックアップストレージシステムなどを備えるが、これらに限定されない他のハードウェアおよび/またはソフトウェアモジュールをコンピュータ機器12と組み合わせて使用することができる。
処理ユニット16は、メモリ28に記憶されているプログラムを実行することにより、多様な機能アプリケーションおよびデータ処理を実行し、例えば、上記の実施例に提出された方法を実現する。
本明細書の説明において、「一実施例」、「一部の実施例」、「例」、「具体的な例」、或いは「一部の例」などの用語を参考した説明とは、当該実施例或いは例を合わせて説明された具体的な特徴、構成、材料或いは特性が、本開示の少なくとも1つの実施例或いは例に含まれることである。本明細書において、上記用語に対する例示的な説明は、必ずしも同じ実施例或いは例を示すものではない。また、説明された具体的な特徴、構成、材料或いは特性は、いずれか1つ或いは複数の実施例又は例において適切に結合することができる。なお、相互に矛盾しない限り、当業者は、本明細書において説明された異なる実施例又は例、及び異なる実施例又は例の特徴を結合し、組み合わせることができる。
本発明の説明において、「第1」、「第2」の用語は、単に説明するためのものであり、比較的な重要性を指示又は暗示するか、或いは示された技術的特徴の数を黙示的に指示すると理解してはいけない。よって、「第1」、「第2」が限定されている特徴は少なくとも1つの前記特徴を含むことを明示又は暗示するものである。本開示の説明において、明確且つ具体的な限定がない限り、「複数」とは、少なくとも2つ、例えば、2つ、3つなどを意味する。
フローチャート、又はここで他の方式により説明されるいかなるプロセス又は方法の説明は、特定のロジック機能又はプロセスのステップを実現するための一つ又はそれ以上の実行可能な命令のコードを含むモジュール、セグメント又は部分と理解されてもよい。また、本出願の好ましい実施形態の範囲は、他の実現形態が含まれており、例示され又は議論された順序に従わなくてもよく、言及された機能が実質的に同時に、又は逆の順序に応じて機能を実行することを含む。本出願の実施例が属する技術分野の当業者は、これを理解すべきである。
フローチャートで示された又はここで他の形態で説明されたロジック及び/又はステップは、例えば、ロジック機能を実現するための実行可能な命令の順番付けられたリストと見なすことができ、任意のコンピュータ読み取り可能な記憶媒体に具体的に実装されて、命令実行システム、装置、又はデバイス(例えばコンピュータに基づいたシステム、プロセッサを含むシステム、又は他の命令実行システム、装置又はデバイスから命令を獲得して命令を実行するシステム)に利用されるか、又はこれらの命令実行システム、装置又はデバイスと組み合わせて利用される。本願明細書において、「コンピュータ読み取り可能な記憶媒体」は、命令実行システム、装置又はデバイスによって、又は、命令実行システム、装置又はデバイスと組み合わせて使用するためのプログラムを含む、格納する、通信する、伝播する、又は伝送することができる任意の装置であってもよい。コンピュータ読み取り可能な記憶媒体のより具体的な例(非限定的なリスト)として、1つ又は複数の配線を備える電気接続部(電子デバイス)、ポータブルコンピュータディスクカートリッジ(磁気デバイス)、ランダムアクセスメモリ(RAM)読み出し専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバデバイス、及びポータブルコンパクトディスク読み出し専用リメモリ(CDROM)を含む。また、コンピュータ読み取り可能な記憶媒体は、前記プログラムが印刷され得る紙又は他の適切な媒体であってもよく、これは、例えば、紙や他の媒体を光学的スキャンし、次に編集し、解釈し、又は必要な場合に他の適切な形態で処理して前記プログラムを電子的に取得して、そしてコンピュータメモリに格納するからである。
なお、本出願の各部分は、ハードウェア、ソフトウェア、ファームウェア、又はこれらの組み合わせにより実現できる。上記実施形態では、複数のステップ又は方法は、メモリに記憶され、且つ適切なコマンド実行システムによって実行されるソフトウェア又はファームウェアにより実現することができる。例えば、ハードウェアにより実現される場合は、他の実施形態と同じく、本分野の以下の公知技術のうち何れか一つ又はこれらの組み合わせにより実現することができる。データ信号のロジック機能を実現するための論理ゲート回路を備えたディスクリート論理回路、適切な組み合わせ論理ゲート回路を備えた専用集積回路、プログラム可能なゲートアレイ(PGA)、フィールドプログラム可能なゲートアレイ(
FPGA)などである。
当業者は、上記実施形態に係る方法に含まれている全部又は一部のステップが、プログラムにより関連するハードウェアを命令することにより完成できることを理解できる。前記プログラムは、コンピュータ読み取り可能な媒体に記憶されてもよく、当該プログラムは実行時に、方法の実施形態における一つのステップ又はその組み合わせを含むことができる。
また、本出願の各実施形態に係る各機能ユニットは、一つの処理モジュールに集積されてもよく、各ユニットが物理的に独立して存在してもよく、2つ又は2つ以上のユニットが一つのモジュールに集積されてもよい。上記集積されたモジュールは、ハードウェアの形式により実現されてもよく、ソフトウェアの機能モジュールの形式により実現されてもよい。上記集積されたモジュールがソフトウェアの機能モジュールの形式により実現され、独立の製品として販売又は使用される場合、一つのコンピュータ読み取り可能な記憶媒体に記憶することもできる。
上記記憶媒体は、読み出し専用メモリや磁気ディスク、光ディスクなどであってもよい。以上に本出願の実施例を示して説明したが、上記実施例は、例示的なものであり、本出願を限定するものと理解してはいけない。当業者は、本出願の範囲内に、上記実施例に対して変化、修正、取り替え及び変形を行うことができる。

Claims (19)

  1. ユーザが視聴するターゲットショートビデオを取得するステップと、
    前記ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、前記候補ロングビデオから、前記ターゲットショートビデオが切り取られたターゲットロングビデオを認識するステップと、
    ユーザに前記ターゲットロングビデオを推奨するステップと、
    を含むビデオ推奨方法。
  2. 前記ユーザに前記ターゲットロングビデオを推奨するステップが、
    前記ターゲットショートビデオを再生するための再生ページに前記ターゲットロングビデオの提示情報を表示するステップを含み、前記提示情報が、前記ターゲットロングビデオの識別子、前記ターゲットロングビデオのリソースリンク、及び前記ターゲットロングビデオが属するロングビデオ集合の識別子のうちの少なくとも一つを含む請求項1に記載のビデオ推奨方法。
  3. 前記ターゲットロングビデオの提示情報を表示するステップの後に、
    ユーザが前記ターゲットロングビデオの提示情報に対してターゲット操作を実行することが検出された場合、前記ターゲットロングビデオを再生するように、前記ターゲットロングビデオを再生するための再生ページを表示するステップを含む請求項2に記載のビデオ推奨方法。
  4. 前記ターゲットショートビデオを再生するための再生ページに前記ターゲットロングビデオの提示情報を表示するステップが、
    前記再生ページに前記ターゲットショートビデオをフルスクリーンモードで再生する場合、前記再生ページにフローティングコントロールを表示するステップであって、前記フローティングコントロールは、前記ターゲットロングビデオの提示情報を表示し、ユーザが実行したターゲット操作に応答するように構成されるステップと、
    前記再生ページに一部の表示領域を用いて前記ターゲットショートビデオを再生する場合、前記再生ページに別の一部の表示領域を用いて前記提示情報を表示するステップと、
    を含む請求項2又は3に記載のビデオ推奨方法。
  5. 前記ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、前記候補ロングビデオから、前記ショートビデオが切り取られたターゲットロングビデオを認識するステップが、
    複数の候補ロングビデオのビデオフィンガープリント特徴を含む特徴インデックスライブラリを取得するステップであって、前記ビデオフィンガープリント特徴は、画像特徴及び/又はオーディオ特徴を含むステップと、
    前記ターゲットショートビデオに対して前記ターゲットショートビデオのビデオフィンガープリント特徴を抽出するステップと、
    前記特徴インデックスライブラリに基づいて、ビデオフィンガープリント特徴が前記ターゲットショートビデオにマッチングする候補ロングビデオを、前記ターゲットロングビデオとして検索するステップと、
    を含む請求項1から4のいずれか一項に記載のビデオ推奨方法。
  6. 前記特徴インデックスライブラリを取得するステップの前に、
    複数の候補ロングビデオの画像コンテンツに基づいて、第1のキーフレームを抽出して、各候補ロングビデオの複数の第1のキーフレームを取得するステップと、
    各候補ロングビデオの各第1のキーフレームに対して、前記第1のキーフレーム内の複数の局所的領域に基づいてそれぞれ画像特徴を抽出して、前記第1のキーフレームの画像特徴を取得するステップと、
    複数の候補ロングビデオの各第1のキーフレームの画像特徴に基づいて、前記特徴インデックスライブラリを構築するステップと、
    を含む請求項5に記載のビデオ推奨方法。
  7. 前記ターゲットショートビデオに対して前記ターゲットショートビデオのビデオフィンガープリント特徴を抽出するステップが、
    前記ターゲットショートビデオの画像コンテンツに基づいて、前記ターゲットショートビデオの複数の第2のキーフレームを抽出するステップと、
    前記ターゲットショートビデオの各第2のキーフレームに対して、前記第2のキーフレームの画像特徴を前記ターゲットショートビデオのビデオフィンガープリント特徴として抽出するステップと、
    を含む請求項6に記載のビデオ推奨方法。
  8. 前記特徴インデックスライブラリに基づいて、ビデオフィンガープリント特徴が前記ターゲットショートビデオにマッチングする候補ロングビデオを、前記ターゲットロングビデオとして検索するステップが、
    前記特徴インデックスライブラリにおいて、前記ターゲットショートビデオにおける複数の第2のキーフレームの画像特徴に基づいて、画像特徴がマッチングする第1のキーフレームを検索して、各第2のキーフレームにマッチングするターゲット第1のキーフレームを取得するステップと、
    同一候補ロングビデオに属する各ターゲット第1のキーフレームの再生時刻と、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻とに基づいて、各候補ロングビデオからターゲットロングビデオを決定するステップであって、前記ターゲットロングビデオの各ターゲット第1のキーフレームの再生時刻は、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻にマッチングするステップと、
    を含む請求項7に記載のビデオ推奨方法。
  9. ユーザが視聴するターゲットショートビデオを取得するように構成される取得モジュールと、
    前記ターゲットショートビデオのビデオフィンガープリント特徴と候補ロングビデオのビデオフィンガープリント特徴とに基づいて、前記候補ロングビデオから、前記ショートビデオが切り取られたターゲットロングビデオを認識するように構成される認識モジュールと、
    ユーザに前記ターゲットロングビデオを推奨するように構成される推奨モジュールと、
    を備えるビデオ推奨装置。
  10. 前記推奨モジュールが、具体的には、
    前記ターゲットショートビデオを再生するための再生ページに前記ターゲットロングビデオの提示情報を表示するように構成され、前記提示情報が、前記ターゲットロングビデオの識別子、前記ターゲットロングビデオのリソースリンク、及び前記ターゲットロングビデオが属するロングビデオ集合の識別子のうちの少なくとも一つを含む請求項9に記載のビデオ推奨装置。
  11. 前記推奨モジュールが、
    ユーザが前記ターゲットロングビデオの提示情報に対してターゲット操作を実行することが検出された場合、前記ターゲットロングビデオを再生するように、前記ターゲットロングビデオを再生するための再生ページを表示するように構成される請求項10に記載のビデオ推奨装置。
  12. 前記推奨モジュールが、具体的には、
    前記再生ページに前記ターゲットショートビデオをフルスクリーンモードで再生する場合、前記再生ページにフローティングコントロールを表示するように構成され、前記フローティングコントロールは、前記ターゲットロングビデオの提示情報を表示し、ユーザが実行したターゲット操作に応答するように構成され、
    前記再生ページに一部の表示領域を用いて前記ターゲットショートビデオを再生する場合、前記再生ページに別の一部の表示領域を用いて前記提示情報を表示するように構成される請求項10又は11に記載のビデオ推奨装置。
  13. 前記認識モジュールが、
    複数の候補ロングビデオのビデオフィンガープリント特徴を含む特徴インデックスライブラリを取得するように構成される取得ユニットであって、前記ビデオフィンガープリント特徴は、画像特徴及び/又はオーディオ特徴を含む取得ユニットと、
    前記ターゲットショートビデオに対して前記ターゲットショートビデオのビデオフィンガープリント特徴を抽出するように構成される抽出ユニットと、
    前記特徴インデックスライブラリに基づいて、ビデオフィンガープリント特徴が前記ターゲットショートビデオにマッチングする候補ロングビデオを、前記ターゲットロングビデオとして検索するように構成される検索ユニットと、
    を備える請求項9から12のいずれか一項に記載のビデオ推奨装置。
  14. 前記装置が、
    複数の候補ロングビデオの画像コンテンツに基づいて、第1のキーフレームを抽出して、各候補ロングビデオの複数の第1のキーフレームを取得し、
    各候補ロングビデオの各第1のキーフレームに対して、前記第1のキーフレーム内複数の局所的領域に基づいてそれぞれ画像特徴を抽出して、前記第1のキーフレームの画像特徴を取得し、
    複数の候補ロングビデオの各第1のキーフレームの画像特徴に基づいて、前記特徴インデックスライブラリを構築するように構成される構築モジュールを備える請求項13に記載のビデオ推奨装置。
  15. 前記抽出ユニットが、具体的には、
    前記ターゲットショートビデオの画像コンテンツに基づいて、前記ターゲットショートビデオの複数の第2のキーフレームを抽出し、
    前記ターゲットショートビデオの各第2のキーフレームに対して、前記第2のキーフレームの画像特徴を前記ターゲットショートビデオのビデオフィンガープリント特徴として抽出するように構成される請求項14に記載のビデオ推奨装置。
  16. 前記検索ユニットが、具体的には、
    前記特徴インデックスライブラリにおいて、前記ターゲットショートビデオにおける複数の第2のキーフレームの画像特徴に基づいて、画像特徴がマッチングする第1のキーフレームを検索して、各第2のキーフレームにマッチングするターゲット第1のキーフレームを取得し、
    同一候補ロングビデオに属する各ターゲット第1のキーフレームの再生時刻と、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻とに基づいて、各候補ロングビデオからターゲットロングビデオを決定するように構成され、前記ターゲットロングビデオの各ターゲット第1のキーフレームの再生時刻は、前記ターゲットショートビデオにおける各第2のキーフレームの再生時刻にマッチングする請求項15に記載のビデオ推奨装置。
  17. メモリと、プロセッサと、メモリに記憶され、プロセッサで実行可能なコンピュータプログラムと、を備えるコンピュータ機器であって、
    前記プロセッサが前記プログラムを実行する場合に、請求項1から8のいずれか一項に記載のビデオ推奨方法を実現するコンピュータ機器。
  18. コンピュータプログラムが記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    当該プログラムがプロセッサによって実行される場合に、請求項1から8のいずれか一項に記載のビデオ推奨方法が実現される非一時的なコンピュータ読み取り可能な記憶媒体。
  19. コンピュータプログラム製品であって、
    前記コンピュータプログラム製品における命令がプロセッサによって実行される場合に、請求項1から8のいずれか一項に記載のビデオ推奨方法が実行されるコンピュータプログラム製品。
JP2020519269A 2017-12-07 2018-07-18 ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体 Pending JP2020536455A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201711287361.9 2017-12-07
CN201711287361.9A CN108024145B (zh) 2017-12-07 2017-12-07 视频推荐方法、装置、计算机设备和存储介质
PCT/CN2018/096177 WO2019109643A1 (zh) 2017-12-07 2018-07-18 视频推荐方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
JP2020536455A true JP2020536455A (ja) 2020-12-10
JP2020536455A5 JP2020536455A5 (ja) 2021-01-28

Family

ID=62078906

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020519269A Pending JP2020536455A (ja) 2017-12-07 2018-07-18 ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体

Country Status (4)

Country Link
US (1) US20200322684A1 (ja)
JP (1) JP2020536455A (ja)
CN (1) CN108024145B (ja)
WO (1) WO2019109643A1 (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108024145B (zh) * 2017-12-07 2020-12-11 北京百度网讯科技有限公司 视频推荐方法、装置、计算机设备和存储介质
CN108989856B (zh) * 2018-06-19 2021-05-18 康佳集团股份有限公司 基于短视频获取正片关联数据的处理方法、终端及介质
CN110691281B (zh) 2018-07-04 2022-04-01 北京字节跳动网络技术有限公司 视频播放处理方法、终端设备、服务器及存储介质
CN110418147A (zh) * 2018-10-11 2019-11-05 彩云之端文化传媒(北京)有限公司 一种短视频引导长视频的跨屏收视方法
CN109389088B (zh) * 2018-10-12 2022-05-24 腾讯科技(深圳)有限公司 视频识别方法、装置、机器设备以及计算机可读存储介质
CN111246254A (zh) * 2018-11-28 2020-06-05 北京字节跳动网络技术有限公司 一种视频推荐方法、装置,服务器、终端设备及存储介质
CN110162664B (zh) * 2018-12-17 2021-05-25 腾讯科技(深圳)有限公司 视频推荐方法、装置、计算机设备及存储介质
CN109982106B (zh) * 2019-04-29 2021-11-26 百度在线网络技术(北京)有限公司 一种视频推荐方法、服务器、客户端及电子设备
CN110290419B (zh) * 2019-06-25 2021-11-26 北京奇艺世纪科技有限公司 视频播放方法、装置及电子设备
CN110213661A (zh) * 2019-06-26 2019-09-06 深圳市酷开网络科技有限公司 全视频化的控制方法、智能电视及计算机可读存储介质
CN110278449B (zh) * 2019-06-26 2022-06-10 腾讯科技(深圳)有限公司 一种视频检测方法、装置、设备及介质
CN112182290A (zh) * 2019-07-05 2021-01-05 北京字节跳动网络技术有限公司 一种信息处理方法、装置和电子设备
CN112911378A (zh) * 2019-12-03 2021-06-04 西安光启未来技术研究院 一种视频帧的查询方法
CN110958470A (zh) * 2019-12-09 2020-04-03 北京字节跳动网络技术有限公司 一种多媒体内容处理方法、装置、介质和电子设备
CN111428087B (zh) * 2020-03-20 2022-10-25 腾讯科技(深圳)有限公司 视频截取方法、装置、计算机设备和存储介质
CN111447239B (zh) * 2020-04-13 2023-07-04 抖音视界有限公司 视频流播放控制方法、设备及存储介质
CN111767814A (zh) * 2020-06-19 2020-10-13 北京奇艺世纪科技有限公司 一种视频确定方法及装置
CN111970560B (zh) * 2020-07-09 2022-07-22 北京百度网讯科技有限公司 视频获取方法、装置、电子设备及存储介质
WO2022015464A1 (en) * 2020-07-16 2022-01-20 Sony Interactive Entertainment Inc. Influencer tools for stream curation based on follower information
CN111966909B (zh) * 2020-08-26 2023-07-21 腾讯科技(深圳)有限公司 视频推荐方法、装置、电子设备及计算机可读存储介质
CN112153470B (zh) * 2020-09-11 2022-04-08 腾讯科技(深圳)有限公司 一种视频播放方法、装置、计算机设备和存储介质
CN113395584B (zh) * 2020-10-10 2024-03-22 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN112203108A (zh) * 2020-10-12 2021-01-08 广州欢网科技有限责任公司 根据短视频流识别切换成直播视频流的方法及设备
CN112235625A (zh) * 2020-10-14 2021-01-15 广州欢网科技有限责任公司 电视端的短视频正片溯源方法、系统及电视终端
CN112565838A (zh) * 2020-11-12 2021-03-26 深圳市易平方网络科技有限公司 基于电视的开机处理方法、装置、终端及介质
CN112565825B (zh) * 2020-12-02 2022-05-13 腾讯科技(深圳)有限公司 一种视频数据处理方法、装置、设备以及介质
CN112612919A (zh) * 2020-12-16 2021-04-06 北京字节跳动网络技术有限公司 一种视频资源的关联方法、装置、设备及介质
CN112637668B (zh) * 2020-12-16 2023-02-28 北京字节跳动网络技术有限公司 一种视频播放方法、装置、设备及介质
CN112632323A (zh) * 2020-12-16 2021-04-09 北京字节跳动网络技术有限公司 一种视频播放方法、装置、设备及介质
CN112612435A (zh) * 2020-12-16 2021-04-06 北京字节跳动网络技术有限公司 信息处理方法、装置、设备及存储介质
CN112612918A (zh) * 2020-12-16 2021-04-06 北京字节跳动网络技术有限公司 一种视频资源的映射方法、装置、设备及介质
CN113194351B (zh) * 2021-02-24 2023-06-27 北京字跳网络技术有限公司 一种视频展示方法、装置、电子设备及存储介质
CN113010703B (zh) * 2021-03-22 2024-04-12 深圳市雅阅科技有限公司 一种信息推荐方法、装置、电子设备和存储介质
CN113065008A (zh) * 2021-03-23 2021-07-02 北京达佳互联信息技术有限公司 信息推荐方法、装置、电子设备及存储介质
CN115278326A (zh) * 2021-04-29 2022-11-01 腾讯科技(深圳)有限公司 视频展示方法、装置、计算机可读介质及电子设备
CN115348460B (zh) * 2021-05-13 2024-06-07 北京字节跳动网络技术有限公司 视频的预加载方法、装置、设备及存储介质
CN113515696A (zh) * 2021-05-17 2021-10-19 上海众源网络有限公司 推荐方法、装置、电子设备及存储介质
CN113468374A (zh) * 2021-05-31 2021-10-01 北京达佳互联信息技术有限公司 目标展示方法、装置、电子设备及存储介质
CN113438522A (zh) * 2021-06-24 2021-09-24 广州欢网科技有限责任公司 一种电视端长视频推荐方法及系统
CN113676764B (zh) * 2021-08-04 2023-12-05 深圳康佳电子科技有限公司 一种屏幕分屏显示方法、装置及存储介质
CN113608651A (zh) * 2021-08-11 2021-11-05 北京字跳网络技术有限公司 数据交互方法、装置、设备及存储介质
CN113688260A (zh) * 2021-08-31 2021-11-23 维沃移动通信有限公司 视频推荐方法和装置
CN113825007B (zh) * 2021-09-27 2023-05-09 海信视像科技股份有限公司 视频播放方法、装置及显示设备
CN114401435A (zh) * 2021-12-29 2022-04-26 阿里巴巴(中国)有限公司 短视频的生成方法、装置、电子设备及可读存储介质
CN114286198B (zh) * 2021-12-30 2023-11-10 北京爱奇艺科技有限公司 一种视频关联方法、装置、电子设备和存储介质
CN114786062A (zh) * 2022-03-07 2022-07-22 维沃移动通信有限公司 信息推荐方法、装置和电子设备
CN115237314B (zh) * 2022-04-18 2023-09-08 网易(杭州)网络有限公司 信息推荐方法、装置和电子设备
CN114579801B (zh) * 2022-04-28 2022-08-12 深圳市华曦达科技股份有限公司 一种基于天鹰优化算法的长视频推荐方法
US20230412885A1 (en) * 2022-05-18 2023-12-21 Lemon Inc. Automatic identification of video series
CN115086700A (zh) * 2022-06-15 2022-09-20 北京有竹居网络技术有限公司 推送处理方法、装置、设备及介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010199907A (ja) * 2009-02-25 2010-09-09 Canon Inc 記録再生装置
US20130024754A1 (en) * 2011-07-22 2013-01-24 Google Inc. Rich Web Page Generation
JP2014519660A (ja) * 2011-06-10 2014-08-14 シャザム エンターテインメント リミテッド データストリームのコンテンツを識別する方法及びシステム

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9558407B1 (en) * 2013-12-24 2017-01-31 Google Inc. Methods, systems, and media for detecting and presenting related media content
CN104159140B (zh) * 2014-03-03 2018-04-27 腾讯科技(北京)有限公司 一种视频处理的方法、装置和系统
CN103984778B (zh) * 2014-06-06 2017-12-01 北京猎豹网络科技有限公司 一种视频检索方法及系统
CN104142984B (zh) * 2014-07-18 2017-04-05 电子科技大学 一种基于粗细粒度的视频指纹检索方法
CN104618788B (zh) * 2014-12-29 2018-08-07 北京奇艺世纪科技有限公司 一种显示视频信息的方法及装置
US9740775B2 (en) * 2015-03-13 2017-08-22 TCL Research America Inc. Video retrieval based on optimized selected fingerprints
CN104881486A (zh) * 2015-06-05 2015-09-02 腾讯科技(北京)有限公司 一种信息查询方法、终端设备及系统
CN108024145B (zh) * 2017-12-07 2020-12-11 北京百度网讯科技有限公司 视频推荐方法、装置、计算机设备和存储介质

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010199907A (ja) * 2009-02-25 2010-09-09 Canon Inc 記録再生装置
JP2014519660A (ja) * 2011-06-10 2014-08-14 シャザム エンターテインメント リミテッド データストリームのコンテンツを識別する方法及びシステム
US20130024754A1 (en) * 2011-07-22 2013-01-24 Google Inc. Rich Web Page Generation

Also Published As

Publication number Publication date
CN108024145A (zh) 2018-05-11
WO2019109643A1 (zh) 2019-06-13
US20200322684A1 (en) 2020-10-08
CN108024145B (zh) 2020-12-11

Similar Documents

Publication Publication Date Title
JP2020536455A (ja) ビデオ推奨方法、ビデオ推奨装置、コンピュータ機器及び記憶媒体
RU2557457C2 (ru) Жесты функций управления
KR102028198B1 (ko) 동영상 장면과 메타데이터 저작 방법
CN106303723B (zh) 视频处理方法和装置
US10909307B2 (en) Web-based system for capturing and sharing instructional material for a software application
US8966372B2 (en) Systems and methods for performing geotagging during video playback
US10003737B2 (en) Video processing device, video processing method, and video processing program
US20130308922A1 (en) Enhanced video discovery and productivity through accessibility
US20140245205A1 (en) Keyboard navigation of user interface
CN110109607B (zh) 信息处理方法及装置、电子设备和存储介质
US20130077876A1 (en) Apparatus and method for identifying a still image contained in moving image contents
WO2017181597A1 (zh) 视频播放方法及装置
EP3905663A1 (en) Multi-subtitle display method, intelligent terminal and storage medium
CN111885313A (zh) 一种音视频的修正方法、装置、介质及计算设备
CN112987999B (zh) 视频编辑方法、装置、计算机可读存储介质及电子设备
CN112114926A (zh) 基于语音识别的页面操作方法、装置、设备和介质
KR20210091082A (ko) 영상 처리 장치, 이의 제어 방법 및 컴퓨터 프로그램이 기록된 기록 매체
US11544322B2 (en) Facilitating contextual video searching using user interactions with interactive computing environments
US20180350404A1 (en) Video splitter
CN107180058B (zh) 一种用于基于字幕信息进行查询的方法和装置
KR102353797B1 (ko) 영상 컨텐츠에 대한 합성음 실시간 생성에 기반한 컨텐츠 편집 지원 방법 및 시스템
US20230054388A1 (en) Method and apparatus for presenting audiovisual work, device, and medium
US20190090024A1 (en) Elastic video browser
AU2020288833B2 (en) Techniques for text rendering using font patching
KR102545040B1 (ko) 비디오 재생 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램 제품

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200403

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200403

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210414

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220118

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220412

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220823