JP7007474B2 - ビデオ特徴抽出方法及び装置 - Google Patents

ビデオ特徴抽出方法及び装置 Download PDF

Info

Publication number
JP7007474B2
JP7007474B2 JP2020520052A JP2020520052A JP7007474B2 JP 7007474 B2 JP7007474 B2 JP 7007474B2 JP 2020520052 A JP2020520052 A JP 2020520052A JP 2020520052 A JP2020520052 A JP 2020520052A JP 7007474 B2 JP7007474 B2 JP 7007474B2
Authority
JP
Japan
Prior art keywords
video
video feature
feature extraction
frame image
detection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2020520052A
Other languages
English (en)
Other versions
JP2020536335A (ja
Inventor
▲軼▼ 何
磊 李
成 ▲楊▼
根 李
亦▲タン▼ 李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Publication of JP2020536335A publication Critical patent/JP2020536335A/ja
Application granted granted Critical
Publication of JP7007474B2 publication Critical patent/JP7007474B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/27Server based end-user applications
    • H04N21/274Storing end-user multimedia data in response to end-user request, e.g. network recorder
    • H04N21/2743Video hosting of uploaded data from client
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/60Extraction of image or video features relating to illumination properties, e.g. using a reflectance or lighting model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/40Scenes; Scene-specific elements in video content
    • G06V20/46Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/254Management at additional data server, e.g. shopping server, rights management server
    • H04N21/2541Rights Management
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Databases & Information Systems (AREA)
  • Image Analysis (AREA)

Description

「関連出願の相互参照」
本願は、2018年3月29日に中国専利局に提出された出願番号が201810271773.1である中国特許出願の優先権を主張し、その全ての内容を援用する形で本願に組み込む。
本開示は、ビデオ処理技術の分野に関し、特に、ビデオ特徴の抽出方法及び装置に関する。
今日のマルチメディア情報社会では、ユーザは毎日大量のビデオをビデオプラットフォームにアップロードするが、これらのビデオのほとんどは通常の価値のあるビデオであるが、問題のあるビデオもあり、問題のあるビデオは主に、プラットフォームビデオデータベースにおける既存のビデオと重複するビデオ、著作権データベースにおけるビデオと重複するビデオ(例えば、著作権料を支払う必要のあるビデオ)、及び不適切なビデオ又は表示禁止のビデオを含む。そのためユーザがアップロードした大量のビデオに対して高速照合及びフィルタリングを行う必要がある。ビデオ照合速度及び正確性を向上させるコア技術はビデオフレームの特徴に対して合理的な抽出及び類似度判定を行うことである。
照合速度及び正確性を向上させるために、1つのビデオに該ビデオを特徴付けるビデオ特徴を生成する必要があり、目的は2つのビデオの特徴を照合することによりビデオの類似度を判断することである。ビデオ特徴の抽出方法及びビデオ特徴の優良度はビデオ照合の効率と正確率を決定する。
本開示の目的は、新たなビデオ特徴抽出方法及び装置を提供することである。
本開示の目的は、以下の技術的解決手段によって達成される。
本開示にて提案されるビデオ特徴抽出方法は、ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るステップと、前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定するステップと、前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定するステップと、を含む。
本開示の目的は、以下の技術的解決手段によってさらに達成され得る。
上述したビデオ特徴抽出方法において、前記検出ベクトルの長さと方向は任意である。
上述したビデオ特徴抽出方法において、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定する前記ステップは、前記検出ベクトルのそれぞれについて1つの前記フレーム画像における各前記始点と対応する前記終点との差分を決定し、前記検出ベクトル毎の特徴ビットを得るために、同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することと、前記1つ又は複数の検出ベクトルに基づく前記フレーム画像の前記特徴ビットに基づいて前記フレーム画像の画像特徴を決定することと、を含む。
上述したビデオ特徴抽出方法において、1つ又は複数の検出ベクトルを取得する前記ステップは、前記検出ベクトル毎にカウンタを割り当てることを含む。同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することは、前記検出ベクトルの各前記始点と前記終点との差分に基づいて、前記検出ベクトルに対応する前記カウンタの値を増減することと、前記カウンタの値と予め設定された設定値との間で大きさを比較し、前記比較結果に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することとを含む。
上述したビデオ特徴抽出方法において、前記始点と前記終点との差分は、前記始点の輝度情報と前記終点の輝度情報との差分を含む。
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるビデオ特徴ライブラリ構築方法は、上述したいずれかのビデオ特徴抽出方法に基づいてビデオオブジェクトのビデオ特徴を抽出するステップと、前記ビデオ特徴をビデオ特徴ライブラリに記憶するステップと、を含む。
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるビデオ特徴抽出装置は、ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るためのフレーム抽出モジュールと、画像特徴決定モジュールであって、前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定するためのモジュールと、前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定するためのビデオ特徴決定モジュールと、を含む。
本開示の目的は、以下の技術的解決手段によってさらに達成され得る。
上述したビデオ特徴抽出装置は、上述したビデオ特徴抽出方法のいずれかのステップを実行するモジュールをさらに含む。
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるオーディオ指紋ライブラリ構築装置は、上述したビデオ特徴抽出方法のいずれかに従ってビデオオブジェクトのビデオ特徴を抽出するためのビデオ特徴抽出モジュールと、前記ビデオ特徴をビデオ特徴ライブラリに記憶するためのビデオ特徴記憶モジュールと、前記ビデオ特徴を記憶するためのビデオ特徴ライブラリと、を含む。
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案されるビデオ特徴抽出ハードウェア装置は、非一時的なコンピュータ読み取り可能な命令を記憶するためのメモリと、実行時に上述したビデオ特徴抽出方法のいずれかを実現するように前記コンピュータ読み取り可能な命令を実行するプロセッサと、を含む。
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案される、非一時的なコンピュータ読み取り可能な命令を記憶するためのコンピュータ読み取り可能な記憶媒体は、前記非一時的なコンピュータ読み取り可能な命令がコンピュータによって実行される際に、前記コンピュータに前記ビデオ特徴抽出方法のいずれかを実行させる。
本開示の目的は、さらに以下の技術的解決手段によって達成される。本開示にて提案される端末機器は、上述したビデオ特徴抽出装置のいずれかを含む。
上記の説明は、本開示の技術的解決手段の概要に過ぎず、本開示の技術的手段をより明確に理解し、本明細書の内容に従って実施することができ、また本開示の上記及び他の目的、特徴、及び利点をより明確に理解するように、以下、添付図面を参照して、好適な実施例を挙げて詳細に説明する。
本開示の一実施例によるビデオ特徴抽出方法のフローを示すブロック図である。 本開示の一実施例によるビデオ特徴抽出方法のフローチャートである。 本開示の一実施例によるフレーム画像の画像特徴を決定するプロセスのフローを示すブロック図である。 本開示の一実施例によるビデオ特徴ライブラリ構築方法のフローを示すブロック図である。 本開示の一実施例によるビデオ特徴抽出装置の構造を示すブロック図である。 本開示の一実施例による画像特徴決定モジュールの構造を示すブロック図である。 本開示の一実施例によるビデオ特徴ライブラリ構築装置の構造を示すブロック図である。 本開示の一実施例によるビデオ特徴抽出ハードウェア装置のハードウェアを示すブロック図である。 本開示の一実施例によるコンピュータ読み取り可能な記憶媒体を示す概略図である。 本開示の一実施例による端末機器の構造を示すブロック図である。
発明の意図する目的を達成するための本開示の技術的手段及び効果をさらに説明するために、本開示によるビデオ特徴抽出方法及び装置の具体的な実施形態、構造、特徴、及び効果を、添付図面及び好適な実施例を参照して以下のように詳しく説明する。
図1は本開示によるビデオ特徴抽出方法の一実施例を示すブロック図である。図2は本開示によるビデオ特徴抽出方法の一実施例を示すフローチャートである。図1、図2に示すように、本開示の例示によるビデオ特徴抽出方法は主に、ステップS11~ステップS13を含む。
ステップS11:ビデオオブジェクト(例えば、ビデオ信号又はビデオファイルであってもよい)に対してフレームを抽出して1つ又は複数のフレーム画像を取得する。抽出されたフレーム画像の具体的な数を設定することができ、例えば、1秒間のビデオから2つのフレーム画像を抽出してもよく、1秒間のビデオから1つのフレーム画像を抽出してもよい。なお、フレームを均一に抽出することができ、すなわち隣接する2つのフレーム画像間の時間間隔は同じである。その後、処理はステップS12に進む。
ステップS12:フレーム画像のそれぞれについて1つ又は複数の検出ベクトル(shift vectors)を取得し、仮に取得された検出ベクトルの数はN個であり、ここでNは正の整数である。各検出ベクトルを用いて、該フレーム画像内の任意のピクセルを始点とし、該検出ベクトルが指す該始点の終点のピクセルを決定し、該始点と対応する該終点との差分に基づいて該フレーム画像の画像特徴を決定する。その後、処理はステップS13に進む。
具体的に言えば、該N個の検出ベクトルは、事前に設定されてもよく、ランダムに生成されてもよい。取得された検出ベクトルは図2における001に示すとおりである。さらに、各検出ベクトルの長さと方向は任意である。また、それぞれの検出ベクトルは独立しており、関連付けを必要としない。なお、フレーム抽出によって取得された複数のフレーム画像では、一般に、同じ群の検出ベクトルを使用して各フレーム画像の画像特徴を決定できるが、異なる複数群の検出ベクトルを使用して各フレーム画像の画像特徴をそれぞれ決定することもできる。
なお、任意のピクセルを始点とするとは、一般的には、フレーム画像内の全てのピクセルを起点として定義してもよく、あるいは、フレーム画像のうち、1つ又は複数の予め設定された位置のピクセルを始点として定義してもよく、具体的な位置が任意であり、例えば、1つのフレーム画像におけるエッジ上にない全ての点を始点としてもよいことをいう。
本開示の一具体例では、1つのフレーム画像の画像特徴を決定するプロセスにおいて、各検出ベクトルを用いて、該フレーム画像における各ピクセルを始点とし、各始点ピクセルと対応する終点ピクセルとの差分を走査し、各検出ベクトルの特徴ビットを得るように、同一の検出ベクトルに基づく各差分の総合に基づいて該検出ベクトルに基づく該フレーム画像の特徴ビット(bit)を決定する。一例では、該各差分の総合を決定するように同一の検出ベクトルに基づく各差分を合計してもよい。そして、得られたN個の検出ベクトルに対応する該特徴ビットに基づいて、該フレーム画像に対応する長さがNである1つの画像特徴(ビデオ特徴単体ともいう)を決定する。得られた長さがNである画像特徴は、図2における004に示すとおりである。
本開示のいくつかの実施例では、上述した始点と終点との差分は、始点の輝度情報と終点の輝度情報との差分を含む。
ステップS13:該ビデオオブジェクトに対応する各フレーム画像の画像特徴に基づいて該ビデオオブジェクトのビデオ特徴を決定する。具体的には、画像特徴シーケンスを取得するように、対応するフレーム画像の時系列順に従って複数の画像特徴を配列し、そして該画像特徴シーケンスをビデオ特徴として決定する。
本開示の例示によるビデオ特徴抽出方法は、ビデオオブジェクトから抽出されたフレーム画像に対して、長さ及び方向の任意な検出ベクトルに従ってフレーム画像内の始点ピクセル及び終点ピクセルを決定し、また始点ピクセルと終点ピクセルとの差分を比較してビデオ特徴を生成し、ビデオ特徴抽出の正確性と抽出効率を向上させ、取得したビデオ特徴の優良度を向上させることができる。さらに、本開示のビデオ特徴抽出方法によって得られたビデオ特徴に基づいて行われたビデオ照合、ビデオ検索、ビデオ重複排除、及びビデオコンテンツ監視においてより高い正確率及び効率を有する。
図3は本開示のビデオ特徴抽出方法の一実施例によるフレーム画像の画像特徴を決定するフローを示すブロック図である。図2、図3に示すように、本開示の一実施例では、ステップS12に記載のN個の検出ベクトルを用いて、フレーム画像の1つの画像特徴を決定するプロセスは具体的には、ステップS21~ステップS24を含む。
ステップS21:N個の検出ベクトルのそれぞれに1つのカウンタ(counter)を割り当てる。その後、処理はステップS22に進む。
ステップS22:1つの検出ベクトルに基づいて、1つのフレーム画像内の任意のピクセルに対して該ピクセルを始点とし、該検出ベクトルが指す終点のピクセルを決定し、該始点と該終点との輝度値の差分を決定するように該始点及び該終点の輝度値を取得し、例えば、該差分は始点がより明るい場合と、終点がより明るい場合とを含み、該検出ベクトルの各始点の該差分に基づいて、該検出ベクトルに対応するカウンタの値を増減する。その後、処理はステップS23に進む。
具体的に言えば、図2における002に示すように、一例では、フレーム画像内の任意のピクセルを始点とし、1つの検出ベクトル(図2における001の中で最も右側の検出ベクトルを取っても構わない)に基づいて各始点が指す終点を決定し、対応する始点の輝度値と終点の輝度値を比較し、始点の輝度値が終点の輝度値よりも大きい場合(図2に示すように始点が終点よりも浅い場合)は、カウンタの値が+1となり、逆に始点の輝度値が終点の輝度値よりも小さい場合(図2に示すように始点の輝度値が終点の輝度値よりも黒い場合)は、カウンタの値が-1となる。全てのピクセルを統計し、カウンタの値を増減し、得られたカウンタは図2における003に示すとおりである。
なお、検出ベクトルの終点がフレーム画像の範囲を超えれば、カウンタの値を変更しなくてもよく、該フレーム画像に対して周期的に遅延させ、該フレーム画像の4つの面に該フレーム画像と同様のフレーム画像を設定することで、検出ベクトルの終点に対応するピクセルが必ず存在するようにしてもよい。
ステップS23:該カウンタの値と予め設定された設定値との間の大きさを比較して比較結果を取得し、該比較結果に基づいて該検出ベクトルに基づく該フレーム画像の特徴ビットを決定する。その後、処理はステップS24に進む。
具体的に言えば、該設定値を0に予め設定してもよい。該カウンタの値が予め設定された設定値よりも大きいか否かを判断し、該カウンタの値が該設定値よりも大きい場合、値が1の特徴ビットを生成し、逆に値が0の特徴ビットを生成する。図2の003及び004に示すように、カウンタの値が+2であれば、値が1の特徴ビットを生成する。
ステップS24:該N個の検出ベクトルに基づく1つのフレーム画像の特徴ビットに基づいて、該フレーム画像の画像特徴を決定する。取得された画像特徴は図2における004に示すとおりである。
なお、ステップS22におけるカウンタの増加と減少の規則は上記の実施例の態様に限定されず、例えば始点輝度値が終点輝度値よりも小さい場合にカウンタの値が+1となり、逆にカウンタの値が-1となり、また、始点と終点の輝度値が等しい場合には、カウンタの値を+1に一律に設定してもよいし、カウンタの値を-1に一律に設定してもよいし、カウンタの値を変更しないように一律に設定してもよい。同様に、ステップS23について、他の方式を用いて特徴ビットの値を決定してもよく、例えば以下のようにしてもよい。ステップS22で値を変更した後のカウンタに基づき、カウンタの値が0よりも小さい場合に値が1の特徴ビットを生成し、逆に値が0の特徴ビットを生成する。
図4は本開示によるビデオ特徴ライブラリ構築方法の一実施例を示すフローチャートである。図4に示すように、本開示の例示によるビデオ特徴ライブラリ構築方法は、主にステップS31とステップS32を含む。
ステップS31:上記の本開示の例示によるビデオ特徴抽出方法のステップに従ってビデオオブジェクトのビデオ特徴を抽出する。その後、処理はステップS32に進む。
ステップS32:ビデオオブジェクトのビデオ特徴をビデオ特徴ライブラリに記憶する。
なお、1つのビデオ特徴ライブラリにおけるビデオ特徴は同様の特徴抽出方法に基づいて得られ、すなわちステップS31のビデオ特徴抽出のプロセスにおいて、ステップS11では同様の方法でフレームを抽出し、ステップS12で取得されたのは同様の検出ベクトルであり、また同様の方法で画像特徴を決定し、且つステップS13では同様の方法でビデオ特徴を決定する。また、時間の経過とともに、ビデオ特徴ライブラリを随時更新することができる。
図5は本開示によるビデオ特徴抽出装置の一実施例の構造を示すブロック図である。図5に示すように、本開示の例示によるビデオ特徴抽出装置100は主に、
ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るためのフレーム抽出モジュール110と、
画像特徴決定モジュール120であって、フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各検出ベクトルを用いて、該フレーム画像内の任意のピクセルを始点とし、該検出ベクトルが指す該始点の終点のピクセルを決定し、該始点と該終点との差分に基づいて該フレーム画像の画像特徴を決定するためのモジュールと、
該ビデオオブジェクトに対応する各フレーム画像の画像特徴に基づいて該ビデオオブジェクトのビデオ特徴を決定するためのビデオ特徴決定モジュール130と、を含む。
図6は本開示のビデオ特徴抽出装置の一実施例による画像特徴決定モジュール120の構造を示すブロック図である。図6に示すように、本開示の一実施例では、画像特徴決定モジュール120は具体的に、
N個の検出ベクトルのそれぞれに1つのカウンタを割り当てるためのカウンタ生成ユニット121と、
カウントユニット122であって、1つの検出ベクトルに基づいて、1つのフレーム画像内の任意のピクセルに対して該ピクセルを始点とし、該検出ベクトルが指す終点のピクセルを決定し、該始点と該終点との輝度値の差分を決定するように該始点及び該終点の輝度値を取得し、該検出ベクトルの各始点の該差分に基づいて、該検出ベクトルに対応するカウンタの値を増減するためのユニットと、
該カウンタの値と予め設定された設定値との間の大きさを比較して比較結果を取得し、該比較結果に基づいて該検出ベクトルに基づく該フレーム画像の特徴ビットを決定するための特徴ビット決定ユニット123と、
該N個の検出ベクトルに基づく1つのフレーム画像の特徴ビットに基づいて、該フレーム画像の画像特徴を決定するための画像特徴決定ユニット124と、を含む。
図7は本開示によるビデオ特徴ライブラリ構築装置の一実施例の構造を示す概略図である。図7に示すように、本開示の例示によるビデオ特徴ライブラリ構築装置200は主に、
ビデオ特徴抽出モジュール201であって、上述した本開示の例示によるビデオ特徴抽出装置のフレーム抽出モジュール110と、画像特徴決定モジュール120と、ビデオ特徴決定モジュール130とを含み、上述した本開示の例示によるビデオ特徴抽出方法のステップに従ってビデオオブジェクトのビデオ特徴を抽出するためのモジュールと、
ビデオ特徴をビデオ特徴ライブラリに記憶するためのビデオ特徴記憶モジュール202と、
各ビデオオブジェクトのビデオ特徴を記憶するためのビデオ特徴ライブラリ203と、を含む。
図8は本開示の実施例によるビデオ特徴抽出ハードウェア装置のハードウェアを示すブロック図である。図8に示すように、本開示の実施例によるビデオ特徴抽出ハードウェア装置300はメモリ301と、プロセッサ302とを含む。ビデオ特徴抽出ハードウェア装置300のコンポーネントのそれぞれは、バスシステム及び/又は他の形態の接続機構(図示せず)によって相互接続される。
該メモリ301は非一時的なコンピュータ読み取り可能な命令を記憶するために用いられる。具体的に言えば、メモリ301は、1つ又は複数のコンピュータプログラム製品を含むことができ、該コンピュータプログラム製品は揮発性メモリ及び/又は不揮発性メモリなどの様々な形態のコンピュータ読み取り可能な記憶媒体を含むことができる。該揮発性メモリは、例えば、ランダムアクセスメモリ(RAM)及び/又はキャッシュ(cache)などを含むことができる。該不揮発性メモリは、例えば、読み取り専用メモリ(ROM)、ハードディスク、フラッシュメモリなどを含むことができる。
該プロセッサ302は、中央処理ユニット(CPU)又はデータ処理機能及び/又は命令実行機能を備えた他の形態の処理ユニットであってもよく、所望の機能を実行するためにビデオ特徴抽出ハードウェア装置300の他のコンポーネントを制御することができる。本開示の一実施例において、該プロセッサ302は該メモリ301に記憶された該コンピュータ読み取り可能な命令を実行し、該ビデオ特徴抽出ハードウェア装置300に上述した本開示の各実施例のビデオ特徴抽出方法のステップの全て又は一部を実行させる。
図9は本開示の実施例によるコンピュータ読み取り可能な記憶媒体を示す概略図である。図9に示すように、本開示の実施例によるコンピュータ読み取り可能な記憶媒体400には、非一時的なコンピュータ読み取り可能な命令401が記憶されている。該非一時的なコンピュータ読み取り可能な命令401がプロセッサによって実行される際に、上述した本開示の各実施例のビデオ特徴抽出方法のステップの全て又は一部を実行する。
図10は本開示の実施例による端末機器のハードウェアの構造を示す概略図である。端末機器はいくつかの形態で実施されることが可能であり、本開示における端末機器は、携帯電話、スマートフォン、ノートブックコンピュータ、デジタル放送受信機、PDA(パーソナルデジタルアシスタント)、PAD(タブレット)、PMP(ポータブルマルチメディアプレーヤー)、ナビゲーション装置、車載端末機器、車載表示端末、車載電子バックミラーなどの携帯端末機器及びデジタルTV、デスクトップコンピュータなどの固定端末機器などを含んでもよいが、これらに限定されない。
図10に示すように、端末機器1100は、無線通信ユニット1110、A/V(オーディオ/ビデオ)入力ユニット1120、ユーザ入力ユニット1130、検知ユニット1140、出力ユニット1150、メモリ1160、インタフェースユニット1170、コントローラ1180及び電源ユニット1190などを含んでもよい。図10は、各種のコンポーネントを有する端末機器を示したが、図示されている全てのコンポーネントを実施する必要があるわけではないことを理解されたい。代わりに、より多く又はより少ないコンポーネントを実施できる。
そのうち、無線通信ユニット1110は端末機器1100と無線通信システム又はネットワークとの間の無線通信を許可する。A/V入力ユニット1120は、オーディオ又はビデオ信号を受信する。ユーザ入力ユニット1130は、ユーザが入力した命令に応じてキー入力データを生成し、端末機器の各種の動作を制御することができる。検知ユニット1140は、端末機器1100の現在の状態、端末機器1100の位置、端末機器1100に対するユーザのタッチ入力の有無、端末機器1100の向き、端末機器1100の加減速や方向などを検出し、且つ端末機器1100の動作を制御するための命令や信号を生成する。インタフェースユニット1170は、少なくとも1つの外部装置と端末機器1100とを接続するためのインタフェースとして機能する。出力ユニット1150は、視覚的、音響的及び/又は触覚的に出力信号を提供するものである。メモリ1160は、コントローラ1180が実行する処理、動作を制御するソフトウェアプログラムなどを記憶してもよいし、出力されたデータ又は出力されるデータを一時的に記憶してもよい。メモリ1160は、少なくとも1種類の記憶媒体を含むことができる。また、端末機器1100は、ネットワーク接続によってメモリ1160の記憶機能を実行するネットワーク記憶装置と連携することができる。コントローラ1180は、通常、端末機器全体の動作を制御する。また、コントローラ1180は、マルチメディアデータを再生又は再放送するためのマルチメディアモジュールを含むことができる。コントローラ1180は、タッチスクリーン上での手書き入力又は描画入力を文字又は画像として認識するようにパターン認識処理を行うことができる。電源ユニット1190は、コントローラ1180の制御に基づいて、外部電力又は内部電力を受信し、各素子及びコンポーネントを動作させるために必要な電力を供給する。
本開示にて提案されるビデオ特徴抽出方法の様々な実施形態は例えばコンピュータソフトウェア、ハードウェア又はそれらの任意の組み合わせのコンピュータ可読媒体を用いて実施することができる。ハードウェアによる実施について、本開示にて提案されるビデオ特徴抽出方法の様々な実施形態は特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、デジタル信号処理装置(DSPD)、プログラマブル論理装置(PLD)、現場でプログラム可能なゲートアレイ(FPGA)、プロセッサ、コントローラ、マイクロコントローラ、マイクロプロセッサは、ここで説明した機能を実行する電子ユニットのうちの少なくとも1つを用いて実施し、いくつかの場合は、本開示にて提案されるビデオ特徴抽出方法の様々な実施形態はコントローラ1180において実施可能である。ソフトウェアによる実施について、本開示にて提案されるビデオ特徴抽出方法の様々な実施形態は、少なくとも1つの機能又は動作の実行を可能にする個別のソフトウェアモジュールで実施されてもよい。ソフトウェアコードは、任意の適切なプログラミング言語で書かれたソフトウェアアプリケーション(又はプログラム)によって実施することができ、ソフトウェアコードはメモリ1160に記憶され、コントローラ1180により実行されてもよい。
以上、本開示の実施例によるビデオ特徴抽出方法、装置、ハードウェア装置、コンピュータ読み取り可能な記憶媒体及び端末機器は、任意の長さ及び任意の方向の複数の検出ベクトルを取得し、検出ベクトルの始点ピクセルと終点ピクセルとの差分を判断してビデオ特徴を生成し、ビデオ特徴抽出の正確性と抽出効率を向上させ、取得したビデオ特徴の優良度を向上させることができ、さらに、本開示のビデオ特徴抽出方法によって得られたビデオ特徴に基づいて行われたビデオ照合、ビデオ検索、ビデオ重複排除、及びビデオコンテンツ監視においてより高い正確率及び効率を有する。
本開示の基本的な原理は、上記で具体的な実施例を参照しながら説明されたが、本開示で言及されている利点、長所、効果などは、限定ではなく例示に過ぎず、これらの利点、長所、効果などは本開示の様々な実施例に必要であると考えられるべきではない。また、上記の開示の特定の詳細は、例示と理解の容易化のためだけのものであり、限定ではなく、上記の詳細は、本開示を上記の特定の詳細に限定することを意図したものではない。
本開示に係るデバイス、装置、機器、システムのブロック図は単なる例示であり、ブロック図に示されている方法で接続、配置、又は構造を意図又は要求するものではない。当業者には理解されるように、これらのデバイス、装置、機器、システムは任意の方法で接続、配置、及び構造することができる。「備える」、「含む」、「有する」などの言葉はオープンボキャブラリーであり、「含むが、これらに限定されない」ことを意味し、且つ交換可能に使用されてもよい。ここで使用される「又は」と「及び」とは「及び/又は」という用語であり、文脈からそうでないことが明確に示されていない限り交換可能に使用されてもよい。本明細書で使用される「~など」という用語は、「~などであるがこれらに限定されない」という語句を指し、それと交換可能に使用されてもよい。
また、ここで使用されているように、「少なくとも1つ」で始まる項目の列挙で使用されている「又は」は、別々の列挙を示し、例えば「A、B、又はCの少なくとも1つ」の列挙とは、A、又はB、又はC、又はAB、又はAC、又はBC、又はABC(すなわちA、B、及びC)を意味する。さらに、「例示的な」という表現は、説明された例が他の例よりも好ましい又は優れていることを意味しない。
また、本開示のシステム及び方法では、各部材又は各ステップが分解及び/又は再結合され得ることに留意されたい。これらの分解及び/又は再結合は、本開示と同等であると見なされるべきである。
添付の特許請求の範囲で定義される本開示の教示から逸脱することなく、本明細書に記載の技術の様々な変更、置換、及び変更を行うことができる。さらに、本開示の特許請求の範囲は、上記のプロセス、機械、製造、イベントの組成、手段、方法、及び動作の特定の態様に限定されない。本明細書で説明する対応する態様を利用して実質的に同じ機能を実行し又は実質的に同じ結果の現在存在する、又は後に開発されるプロセス、機械、製造、イベントの組成、手段、方法、又は動作を実現することができる。従って、添付の特許請求の範囲はその範囲内のこのようなプロセス、機械、製造、イベントの組成、手段、方法又は動作を含む。
開示された態様の上記の説明は、当業者が本開示を作成又は使用することを可能にするために提供される。これらの態様に対する様々な補正は、当業者には明らかであり、本明細書で定義される一般原理は、本開示の範囲から逸脱することなく他の態様に適用されてもよい。従って、本開示は、本明細書に示される態様に限定されるものではなく、本明細書に開示される原理及び新規の特徴の最も広い範囲内にあるものとする。
上記の説明は、例示及び説明の目的で提案されたものである。さらに、本説明は、本開示の実施例を本明細書に開示された形態に限定することを意図するものではない。多くの例示的な態様及び実施例が上記で議論されたが、当業者は、それらの特定の変形、補正、変更、追加、及びサブコンビネーションを認識するであろう。
100 ビデオ特徴抽出装置
110 フレーム抽出モジュール
120 画像特徴決定モジュール
121 カウンタ生成ユニット
122 カウントユニット
123 特徴ビット決定ユニット
124 画像特徴決定ユニット
130 ビデオ特徴決定モジュール
200 ビデオ特徴ライブラリ構築装置
201 ビデオ特徴抽出モジュール
202 ビデオ特徴記憶モジュール
203 ビデオ特徴ライブラリ
300 ビデオ特徴抽出ハードウェア装置
301 メモリ
302 プロセッサ
400 コンピュータ読み取り可能な記憶媒体
401 非一時的なコンピュータ読み取り可能な命令
1110 無線通信ユニット
1120 A/V入力ユニット
1130 ユーザ入力ユニット
1140 検知ユニット
1150 出力ユニット
1160 メモリ
1170 インタフェースユニット
1180 コントローラ
1190 電源ユニット

Claims (11)

  1. ビデオ特徴抽出方法であって、
    ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得ることと、
    前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定することと、
    前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定することと、を含み、
    前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定することは、
    前記検出ベクトルのそれぞれについて1つの前記フレーム画像における各前記始点と対応する前記終点との差分を決定し、前記検出ベクトルのそれぞれの特徴ビットを得るために、同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することと、
    前記1つ又は複数の検出ベクトルに基づく前記フレーム画像の前記特徴ビットに基づいて前記フレーム画像の画像特徴を決定することと、を含む、ビデオ特徴抽出方法。
  2. 請求項1に記載のビデオ特徴抽出方法であって、
    前記検出ベクトルの長さと方向は任意である、ビデオ特徴抽出方法。
  3. 請求項に記載のビデオ特徴抽出方法であって、
    記1つ又は複数の検出ベクトルを取得することは、さらに、前記検出ベクトルのそれぞれにカウンタを割り当てることを含み、
    記同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することは、前記検出ベクトルごとの前記差分に基づいて、前記検出ベクトルに対応する前記カウンタの値を増減することと、前記カウンタの値と予め設定された設定値との間で大きさを比較し、前記比較結果に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定することとを含む、ビデオ特徴抽出方法。
  4. 請求項1からのいずれか一項に記載のビデオ特徴抽出方法であって、
    前記始点と前記終点との差分は、前記始点の輝度情報と前記終点の輝度情報との差分を含む、ビデオ特徴抽出方法。
  5. ビデオ特徴ライブラリ構築方法であって、
    請求項1~の何れか一項に記載のビデオ特徴抽出方法に基づいてビデオオブジェクトのビデオ特徴を抽出することと、
    前記ビデオ特徴をビデオ特徴ライブラリに記憶することと、を含む、ビデオ特徴ライブラリ構築方法。
  6. ビデオ特徴抽出装置であって、
    ビデオオブジェクトに対してフレームを抽出して1つ又は複数のフレーム画像を得るためのフレーム抽出モジュールと、
    画像特徴決定モジュールであって、前記フレーム画像のそれぞれについて1つ又は複数の検出ベクトルを取得し、各前記検出ベクトルを用いて、前記フレーム画像内の任意のピクセルを始点とし、前記検出ベクトルが指す前記始点の終点を決定し、前記始点と前記終点との差分に基づいて前記フレーム画像の画像特徴を決定するためのモジュールと、
    前記1つ又は複数のフレーム画像の前記画像特徴に基づいて前記ビデオオブジェクトのビデオ特徴を決定するためのビデオ特徴決定モジュールと、を含み、
    前記画像特徴決定モジュールは、前記検出ベクトルのそれぞれについて1つの前記フレーム画像における各前記始点と対応する前記終点との差分を決定し、前記検出ベクトルのそれぞれの特徴ビットを得るために、同一の前記検出ベクトルのそれぞれの前記差分の総合に基づいて前記検出ベクトルに基づく前記フレーム画像の特徴ビットを決定し、前記1つ又は複数の検出ベクトルに基づく前記フレーム画像の前記特徴ビットに基づいて前記フレーム画像の画像特徴を決定する、ビデオ特徴抽出装置。
  7. 請求項に記載のビデオ特徴抽出装置であって、
    請求項のいずれか一項に記載のビデオ特徴抽出方法のステップを実行するモジュールをさらに含む、ビデオ特徴抽出装置。
  8. ビデオ特徴ライブラリ構築装置であって、
    請求項1~のいずれか一項に記載のビデオ特徴抽出方法に従ってビデオオブジェクトのビデオ特徴を抽出するためのビデオ特徴抽出モジュールと、
    前記ビデオ特徴をビデオ特徴ライブラリに記憶するためのビデオ特徴記憶モジュールと、
    前記ビデオ特徴を記憶するためのビデオ特徴ライブラリと、を含む、ビデオ特徴ライブラリ構築装置。
  9. ビデオ特徴抽出ハードウェア装置であって、
    非一時的なコンピュータ読み取り可能な命令を記憶するためのメモリと、
    実行時に請求項1~のいずれか一項に記載のビデオ特徴抽出方法を実現するように前記コンピュータ読み取り可能な命令を実行するプロセッサと、を含む、ビデオ特徴抽出ハードウェア装置。
  10. 非一時的なコンピュータ読み取り可能な命令を記憶するためのコンピュータ読み取り可能な記憶媒体であって、
    前記非一時的なコンピュータ読み取り可能な命令がコンピュータによって実行される際に、前記コンピュータに請求項1~のいずれか一項に記載のビデオ特徴抽出方法を実行させる、コンピュータ読み取り可能な記憶媒体。
  11. 端末機器であって、請求項またはに記載のビデオ特徴抽出装置を含む、端末機器。
JP2020520052A 2018-03-29 2018-12-29 ビデオ特徴抽出方法及び装置 Active JP7007474B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN201810271773.1A CN110324659B (zh) 2018-03-29 2018-03-29 一种视频特征提取方法及装置
CN201810271773.1 2018-03-29
PCT/CN2018/125499 WO2019184521A1 (zh) 2018-03-29 2018-12-29 一种视频特征提取方法及装置

Publications (2)

Publication Number Publication Date
JP2020536335A JP2020536335A (ja) 2020-12-10
JP7007474B2 true JP7007474B2 (ja) 2022-01-24

Family

ID=68062180

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020520052A Active JP7007474B2 (ja) 2018-03-29 2018-12-29 ビデオ特徴抽出方法及び装置

Country Status (5)

Country Link
US (1) US11055536B2 (ja)
JP (1) JP7007474B2 (ja)
CN (1) CN110324659B (ja)
SG (1) SG11202008423YA (ja)
WO (1) WO2019184521A1 (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013018913A1 (ja) 2011-08-04 2013-02-07 日本電気株式会社 映像処理システム、視聴者の嗜好判定方法、映像処理装置およびその制御方法と制御プログラム
JP2017021606A (ja) 2015-07-10 2017-01-26 学校法人早稲田大学 動画像検索方法、動画像検索装置及びそのプログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7426301B2 (en) * 2004-06-28 2008-09-16 Mitsubishi Electric Research Laboratories, Inc. Usual event detection in a video using object and frame features
JP2007074592A (ja) * 2005-09-09 2007-03-22 Sony Corp 画像処理装置および方法、プログラム、並びに記録媒体
US20090028517A1 (en) * 2007-07-27 2009-01-29 The University Of Queensland Real-time near duplicate video clip detection method
GB0901263D0 (en) 2009-01-26 2009-03-11 Mitsubishi Elec R&D Ct Europe Detection of similar video segments
KR101165359B1 (ko) * 2011-02-21 2012-07-12 (주)엔써즈 이미지와 이미지 또는 이미지와 동영상 사이의 상호 관계 분석 장치 및 방법
CN103605786A (zh) 2013-11-27 2014-02-26 姚领众 一种基于样本视频片段进行海量视频检索的方法
CN104020430B (zh) 2014-04-15 2017-01-25 清华大学 磁共振成像运动伪影的校正方法及系统
US9432702B2 (en) * 2014-07-07 2016-08-30 TCL Research America Inc. System and method for video program recognition
CN104216949A (zh) * 2014-08-13 2014-12-17 中国科学院计算技术研究所 一种融合空间信息的图像特征聚合表示方法及系统
US10572735B2 (en) * 2015-03-31 2020-02-25 Beijing Shunyuan Kaihua Technology Limited Detect sports video highlights for mobile computing devices
CN104881640B (zh) * 2015-05-15 2018-06-15 华为技术有限公司 一种获取向量的方法及装置
CN105574894B (zh) * 2015-12-21 2018-10-16 天津远度科技有限公司 一种运动物体特征点跟踪结果的筛选方法和系统
CN106951484B (zh) * 2017-03-10 2020-10-30 百度在线网络技术(北京)有限公司 图片检索方法及装置、计算机设备及计算机可读介质
CN107452401A (zh) * 2017-05-27 2017-12-08 北京字节跳动网络技术有限公司 一种广告语音识别方法及装置
CN107239535A (zh) * 2017-05-31 2017-10-10 北京小米移动软件有限公司 相似图片检索方法及装置
CN107748750A (zh) * 2017-08-30 2018-03-02 百度在线网络技术(北京)有限公司 相似视频查找方法、装置、设备及存储介质

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013018913A1 (ja) 2011-08-04 2013-02-07 日本電気株式会社 映像処理システム、視聴者の嗜好判定方法、映像処理装置およびその制御方法と制御プログラム
JP2017021606A (ja) 2015-07-10 2017-01-26 学校法人早稲田大学 動画像検索方法、動画像検索装置及びそのプログラム

Also Published As

Publication number Publication date
CN110324659A (zh) 2019-10-11
US20200302183A1 (en) 2020-09-24
US11055536B2 (en) 2021-07-06
SG11202008423YA (en) 2020-10-29
JP2020536335A (ja) 2020-12-10
WO2019184521A1 (zh) 2019-10-03
CN110324659B (zh) 2020-08-28

Similar Documents

Publication Publication Date Title
JP7000468B2 (ja) 重複ビデオの判定方法及び装置
KR102323333B1 (ko) 애플리케이션 데이터 프로세싱 방법 및 장치, 및 저장 매체
EP3449348B1 (en) Animation of user interface elements
KR20110071708A (ko) 터치 스크린 디바이스의 컨텐츠 검색 방법 및 장치
JP5693369B2 (ja) 情報処理装置、その制御方法及びコンピュータプログラム
US10282887B2 (en) Information processing apparatus, moving image reproduction method, and computer readable medium for generating display object information using difference information between image frames
JP6982194B2 (ja) ビデオ特徴の抽出方法および装置
JPWO2015151162A1 (ja) 類似度算出システム、類似度算出方法およびプログラム
WO2017107737A1 (zh) 终端灭屏时间的调整方法、装置、设备及计算机存储介质
CN110555334A (zh) 人脸特征确定方法、装置、存储介质及电子设备
JP2016085534A (ja) 画像処理装置、画像処理装置の制御方法およびプログラム
JP2016062582A (ja) 走査対象情報を走査する方法、装置、及びコンピュータデバイス
JP7007474B2 (ja) ビデオ特徴抽出方法及び装置
US11328236B2 (en) Information processing apparatus and non-transitory computer readable medium storing information processing program
CN111954076A (zh) 资源显示方法、装置及电子设备
JP6987987B2 (ja) メディア特徴の比較方法及び装置
CN111142659A (zh) 触感信号的实现方法、装置、终端及存储介质
JP2015102875A (ja) 表示システム及び表示制御装置
CN112740161A (zh) 终端、用于控制终端的方法以及其中记录有用于实现该方法的程序的记录介质
CN110737963A (zh) 海报元素布局方法、系统、计算机设备和存储介质
US20180101288A1 (en) Information processing apparatus that scrolls and displays contents, control method therefor, and storage medium storing control program therefor
CN104090911A (zh) 一种信息处理方法和电子设备
JP2016110387A (ja) 検索装置、方法及びプログラム
US11899552B2 (en) Estimation device, estimation method and estimation program
JP2020119001A (ja) 情報処理装置、情報処理方法、及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210728

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220106

R150 Certificate of patent or registration of utility model

Ref document number: 7007474

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150