JP7512523B2

JP7512523B2 - ビデオ検出方法、装置、電子機器及び記憶媒体

Info

Publication number: JP7512523B2
Application number: JP2023519078A
Authority: JP
Inventors: シオーン，ジュインフオン; ワーン，ヤーン; ジョウ，ユエ; ジャーン，ホワン; ジョーン，ジェンユイ
Original assignee: バイドゥオンラインネットワークテクノロジー（ペキン）カンパニーリミテッド
Priority date: 2021-03-12
Filing date: 2021-07-05
Publication date: 2024-07-08
Anticipated expiration: 2041-07-05

Description

本出願は、２０２１年０３月１２日に中国国家知識産権局に提出された、出願番号が２０２１１０２７２１３２．Ｘ、発明名称が「ビデオ検出方法、装置、電子機器及び記憶媒体」である中国特許出願の優先権を主張し、その内容の全ては参照により本出願に組み込まれる。

本開示は、コンピュータ処理分野に関し、特に、人工知能、深層学習、コンピュータビジョン、画像処理、顔認識、肢体認識、偽造検出などの分野に関する。

コンピュータ技術の発展に伴い、画像及び音声だけでなく、ビデオも偽造されることができる。ビデオの深さ偽造処理において、偽造された画像を用いてビデオを生成することができ、例えば、一部のビデオコンテンツに対して、新しい要素（例えば他の人の顔を入れ替える）を入れ替えることによって偽造の目的を達成し、各種のアプリケーション（例えば銀行クライアント、入退室管理システムなど）のセキュリティホールを利用して攻撃を実現することによって、ユーザに巨大な損失を与える。

本開示はビデオ検出方法、装置、電子機器及び記憶媒体を提供する。

本開示の一態様によれば、ビデオ検出方法を提供し、
ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すための、前記ビデオフレームにおける目標領域を得ることと、
前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索することと、
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定することとを含む。

本開示の別の態様によれば、ビデオ検出装置を提供し、
ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオフレームにおける目標領域を得て、前記目標領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すためのものであるための目標領域検出モジュールと、
前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索するための異常ビデオ検索モジュールと、
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定するためのビデオ確定モジュールとを含む。

本開示の別の態様によれば、電子機器を提供し、この電子機器は、
少なくとも一つのプロセッサと、
この少なくとも１つのプロセッサに通信接続されたメモリと、を含み、
このメモリには、少なくとも１つのプロセッサによって実行可能な命令が記憶されており、この命令はこの少なくとも１つのプロセッサによって実行されることにより、この少なくとも１つのプロセッサが本開示のいずれか１つの実施例による方法を実行することができる。

本開示の別の態様によれば、本開示のいずれか１つの実施例による方法をコンピュータに実行させるためのコンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体を提供する。

本開示の別の態様によれば、プロセッサによって実行されると、本開示のいずれか１つの実施例による方法を実現するコンピュータ命令を含むコンピュータプログラムを提供する。

本開示を用いると、ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオフレームにおける目標領域を得ることができ、前記目標領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すためのものであり、前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索し、前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定することによって、ビデオデータストリームにおける人為的に編集された（又は偽造されたと呼ばれる）異常ビデオフレームを検出することができる。

理解すべきこととして、この部分に説明される内容は、本開示の実施例の要点又は重要な特徴を識別することを意図しておらず、本開示の保護範囲を限定するためのものではない。本開示の他の特徴は、以下の明細書によって容易に理解されるであろう。

図面は、本案をより良く理解するためのものであり、本開示に対する限定を構成しない。
本開示の実施例によるビデオ検出方法のフローチャートである。本開示の実施例によるビデオ検出方法のフローチャートである。本開示の実施例によるビデオ検出装置の構成構造の概略図である。本開示の実施例によるビデオ検出装置の構成構造の概略図である。本発明の実施例によるビデオ検出方法を実現するための電子機器のブロック図である。

以下、図面を結び付けながら本開示の例示的な実施例を説明し、理解を容易にするために、その中には本開示の実施例の様々な詳細が含まれているが、それらは単なる例示的なものと見なされるべきである。したがって、当業者であれば認識できるように、本開示の範囲及び精神から逸脱することなく、本明細書で説明された実施例に対して様々な変更及び修正を行うことができる。同様に、明瞭と簡潔のために、以下の説明では公知の機能及び構造についての説明を省略している。

本明細書における「及び／又は」という用語は、単に関連対象を説明する関連関係に過ぎず、３つの関係が存在できることを示し、例えば、Ａ及び／又はＢは、単独のＡ、ＡとＢとの組み合わせ、単独のＢの３つのケースを表すことができる。本明細書における「少なくとも１つ」という用語は、複数のうちの任意の１つ又は複数のうちの少なくとも２つの任意の組み合わせを表し、例えば、Ａ、Ｂ、Ｃのうちの少なくとも１つを含むことは、Ａ、Ｂ及びＣからなる集合から選択された任意の１つ又は複数の要素を含むことを表すことができる。本明細書における「第１」、「第２」という用語は、類似する複数の技術用語を指してそれらを区別することを表し、順序を限定することも、２つのみを限定することも意味しなく、例えば、第１の特徴と第２の特徴は、２つのタイプ／２つの特徴があることを指し、第１の特徴は、１つまたは複数であってもよく、第２の特徴は、１つまたは複数であってもよい。

さらに、本開示をより詳細に説明するために、多数の具体的な詳細が以下の具体的な実施形態に示される。当業者であれば、具体的なの詳細なしに、本開示を同様に実施することができることを理解するであろう。いくつかの例では、本開示の趣旨を強調するために、当業者に周知の方法、手段、要素、及び回路については詳細に説明しない。

ビデオの深さ偽造については、入退室管理システムの応用シーンを例として、携帯アプリ、入退室管理、閉回路テレビなどのカメラシーンに基づいてビデオを収集し、ビデオフレームが三原色（ＲＧＢ）に基づく画像であるビデオデータストリームを得ることができる。この画像は、構造化光又は双眼カメラにより収集された深さ情報（Ｄｅｐｈ）、及び赤外線と色照射などのマルチモーダルの手段を組み合わせることができても、例えば顔、肢体、動作などのセキュリティ検証機能を実行する場合、ＲＧＢ上の弱点も避けられず、画像によるビデオ偽造を容易にする。特に、システムへの侵入時に偽造されたビデオを同時に組み込むことで、ユーザに対する攻撃の脅威がより明らかになる。このように、画像に基づいてビデオを駆動することによって、偽造された顔、偽造された人物の肢体、偽造された動作などを介して詐欺的な攻撃を実現することを達成し、攻撃効果がよく、攻撃コストが低いため、各種のアプリケーションに関連するセキュリティ認証機能に対しては、危害が非常に大きい。

これに鑑み、画像に基づいてビデオを駆動する方案において、ビデオ理解、ビデオ画像畳み込みネットワークでトレーニングされた分類器により、ビデオデータストリームにおける偽造された顔、偽造された人物の肢体、偽造された動作などに関連する検出を実行することができるが、このビデオ画像畳み込みネットワークには大量のパラメータがあり、トレーニングする前に大量のデータをマーキングする必要があり、実現コストが高い。また、このビデオ画像畳み込みネットワークは一般的に、オーバーフィッティング（即ち汎用性を備えていない）しやすく、ネットワーク性能を改善するために、大量のパラメータ調整操作が必要であり、効率が低く、適用シーンが比較的少ない。このビデオ画像畳み込みネットワークを実行する機械は精密で、製造コストが高い。

本開示において、目標領域を合理的に選択することで、この目標領域に基づいてビデオデータストリーム全体を整理することによって、このビデオデータストリームにおいて、どのビデオフレームに編集された跡が存在するかを見つけ出すことができ、このような編集された異常ビデオを正確に判断することができる。画像に基づいて駆動されるビデオは、キーポイントに基づいて一部の位置を駆動し、異なるビデオフレーム画面には一部の画素が全く同じことがあることを考慮すると、ビデオデータストリームに一定のランダムなノイズがあっても、通常のビデオ（編集処理された偽造ビデオではない）では画素が同じである可能性がほぼゼロであり、この現象はビデオフレームにこの編集された跡が存在すると考えられる。

本開示の実施例によれば、ビデオ検出方法を提供し、図１は本開示の実施例によるビデオ検出方法のフローチャートであり、この方法はビデオ検出装置に適用することができ、例えば、この装置は、端末やサーバや他の処理機器に配備して実行することができる場合、目標領域検出、異常ビデオフレーム検索、及び異常ビデオフレームを評価した後に目標ビデオフレームを確定するなどの処理を実現することができる。ここで、端末は、ユーザ機器（ＵＥ、ＵｓｅｒＥｑｕｉｐｍｅｎｔ）、携帯機器、パーソナルデジタル処理（ＰＤＡ、ＰｅｒｓｏｎａｌＤｉｇｉｔａｌＡｓｓｉｓｔａｎｔ）、ハンドヘルド機器、計算機器、車載機器、ウェアラブル機器などであってもよい。いくつかの可能な実現形態において、この方法は、プロセッサでメモリに記憶されるコンピュータ可読命令を呼び出す方式によって実現されてもよい。図１に示すように、
ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオフレームにおける目標領域を得て、前記目標領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すためのものであるステップＳ１０１と、
前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索するステップＳ１０２と、
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定するステップＳ１０３とを含む。

Ｓ１０１～Ｓ１０３の一例において、ビデオデータストリームにおけるビデオフレームを検出することで、この目標領域を検索し、例えば、この目標領域は、偽造者によって人為的に編集された領域であってもよく、この偽造者によって人為的に編集された領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域である。この目標領域に基づいてビデオデータストリーム全体を整理する過程において、このビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索することができる。このビデオデータストリームにおいて複数の異常ビデオフレームに対して演算を行うことで、異常ビデオフレームに対応する検出パラメータ、例えば、ビデオフレームシーケンスの画素が異常である画素異常率、または、さらに異なる画素異常率で構成される異常ビデオシーケンスを採点して得られたビデオ検出スコア値を得ることもでき、これによって、検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定する。この閾値については、このビデオ検出スコア値に基づいてこの閾値を設定することで、この閾値に基づいてこのビデオデータストリームにおけるこの目標ビデオフレームの具体的な位置をより正確に位置決めることもできる。

本開示を用いると、ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオフレームにおける目標領域を得ることができ、前記目標領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すためのものであり、前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索し、前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定する。「前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域」は人為的に編集される領域（または偽造領域と称される）であるため、このビデオフレームは異常であり、ビデオデータストリーム全体を検出することを必要とし、まずこのような目標領域（即ちこの人為的に編集される領域）を見つける。その後、この目標領域によってビデオデータストリーム全体を整理するによって、この目標領域が存在するビデオフレームを異常ビデオフレームとする。異常ビデオフレームの検出の正確性を考慮すると、さらに、この異常ビデオフレームに対応する検出パラメータが閾値に一致すると判断した場合、この異常ビデオフレームを最終的に、検出によって選別して得されたこの目標ビデオフレームとして確定する必要があり、それによって、ビデオデータストリームにおける人為的に編集された（または偽造されたと称される）異常ビデオフレームを正確に検出することができる。

本開示の実施例によれば、ビデオ検出方法を提供し、図２は本開示の実施例によるビデオ検出方法のフローチャートであり、図２に示すように、
前記ビデオデータストリームにおける隣接する少なくとも２つのビデオフレームに対して、キー領域をそれぞれ抽出するステップＳ２０１と、
前記少なくとも２つのビデオフレームのそれぞれに対応するキー領域に対して画素点の特徴照合を行い、照合して得られた前記キー領域における、前記一部の全く同じ画素が存在する領域を、前記目標領域とするステップＳ２０２と、
前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索するステップＳ２０３と、
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定するステップＳ２０４とを含む。

Ｓ２０１～Ｓ２０４の一例において、ビデオデータストリームにおけるビデオフレームを検出することで、この目標領域を検索する。画像に基づいてビデオを駆動することは、偽造された顔、偽造された人物の肢体、偽造された動作などによって詐欺的な攻撃を実現すると考慮すると、応用シーンのニーズに応じて、すべての人体及び実行された動作を検出することではなく、顔、人物の肢体、偽造された動作（例えば指定されたジェスチャーなど）などをこのキー領域とすることができる。ここで、この目標領域は、偽造者によって人為的に編集された領域であってもよく、この偽造者によって人為的に編集された領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域である。このビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索により見つけた後、このビデオデータストリームにおいて複数の異常ビデオフレームに対して演算を行うことで、異常ビデオフレームに対応する検出パラメータ、例えば、ビデオフレームシーケンスにおいて画素が異常である画素異常率、または、さらに異なる画素異常率で構成される異常ビデオシーケンスを採点して得られたビデオ検出スコア値を得ることもでき、これによって、検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定する。この閾値については、このビデオ検出スコア値に基づいてこの閾値を設定することで、この閾値に基づいてこのビデオデータストリームにおけるこの目標ビデオフレームの具体的な位置をより正確に位置決めることもできる。本実施形態を用いて、このキー領域に対して検出を行うため、処理速度を向上させるだけでなく、検出の正確性をより高くする。

１つの実施形態において、前記の、前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定することは、前記ビデオデータストリームにおいて前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得ることと、前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得ることと、前記画素異常率を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第１のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定することとを含む。本実施形態を用いて、第１のビデオシーケンスに対して画素異常の演算を行うことで、同一スコア値を得ることができ、同一スコア値は、画素異常率を評価するための指標として、この同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得ることができ、それによって、画素異常率を検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第１のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定する。換言すれば、画素異常率に基づいて、ビデオデータストリーム全体から第１のビデオシーケンスにおける異常ビデオフレームを選別し、最終的にこの第１のビデオシーケンスにおける異常ビデオフレームを目標ビデオフレームとして確定し、検出の正確性を向上させることができる。

１つの実施形態において、前記の、前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定することは、前記ビデオデータストリームにおいて前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得ることと、前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得ることと、前記第１のビデオシーケンスから異なる画素異常率で構成される第２のビデオシーケンスを選択し、それぞれ採点し、対応するビデオ検出スコア値を得ることと、前記ビデオ検出スコア値を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第２のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定することとを含む。本実施形態を用いて、第１のビデオシーケンスに対して画素異常の演算を行うことで、同一スコア値を得ることができ、同一スコア値は、画素異常率を評価するための指標として、この同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得ることができる。さらに、前記第１のビデオシーケンスから異なる画素異常率で構成される第２のビデオシーケンスを選択し、それぞれ採点し、対応するビデオ検出スコア値を得ることで、前記ビデオ検出スコア値を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第２のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定することもできる。換言すれば、画素異常率に基づいて、ビデオデータストリーム全体から第１のビデオシーケンスにおける異常ビデオフレームを選別し、前記第１のビデオシーケンスから異なる画素異常率で構成される第２のビデオシーケンスを選択し、それぞれ採点し、対応するビデオ検出スコア値を得た後、さらに、このビデオ検出スコア値に基づいて、第１のビデオシーケンスから第２のビデオシーケンスにおける、ビデオ検出スコア値が予想に一致する異常ビデオフレームを選別し、最終的に、この第２のビデオシーケンスにおけるビデオ検出スコア値が予想に一致する異常ビデオフレームを目標ビデオフレームとして確定し、検出の正確性を向上させることができる。

１つの実施形態において、ビデオ検出スコア値に基づいて前記閾値を設定することをさらに含む。ここで、前記ビデオ検出スコア値は、異なる画素異常率で構成される第２のビデオシーケンスの第１のビデオシーケンスにおけるスコア値割合を含み、前記第１のビデオシーケンスは前記ビデオデータストリームにおける、前記異常ビデオフレームで構成される第１のビデオシーケンスである。閾値を設定する一例において、前記ビデオデータストリームにおける、前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得て、この同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得て、前記第１のビデオシーケンスから異なる画素異常率で構成される第２のビデオシーケンスを選択し、それぞれ採点し、対応するビデオ検出スコア値を得ることによって、この前記異常ビデオフレームに対して演算して得られたこのビデオ検出スコア値に基づいてこの閾値を設定することができる。本実施形態を用いて、このビデオ検出スコア値に基づいて評価を行う過程において、異常ビデオの検出の正確性は、異常ビデオフレームの位置と関係なく、主に、採点されて異なる画素異常率を得た異常ビデオフレームのビデオデータストリーム全体における割合に依存し、それによって、検出の正確性を向上させる。

１つの実施形態において、前記閾値に基づいて、前記目標ビデオフレームの前記ビデオデータストリームにおける位置を位置決めることをさらに含む。この閾値については、上記のビデオ検出スコア値に基づいて閾値を設定することで、この閾値に基づいてこのビデオデータストリームにおけるこの目標ビデオフレームの具体的な位置をより正確に位置決めることもできる。本実施形態を用いて、この閾値は上記のビデオ検出スコア値によって設定して得られたものであるため、この閾値自体は異常が存在する目標ビデオフレームを評価するために用いることができ、それによって、ニューラルネットワークのトレーニングに係る必要がなく、閾値に基づいてこの目標ビデオフレームの位置を直接的に推論することができる。これ以外、より正確にし、かつポジショニング効率を向上させるために、閾値に基づいて簡単にトレーニングして位置決めるためのニューラルネットワークを得て、位置決めるためのこのニューラルネットワークに基づいて、この目標ビデオフレームの位置をこのビデオデータストリームから位置決めることもでき、トレーニングに必要なデータが少ないため、ニューラルネットワークの複雑度を低減させる。

適用例：
本開示の実施例を適用する処理フローには、以下の内容が含まれる。

１．ビデオデータストリームを読み出し、複数のビデオフレームを得て、各ビデオフレームは１フレームの画像であり、複数のビデオフレームは画像ストリームＸ（ｉ＝１，２，…，ｎ）を構成し、ｎが１よりも大きい正の整数で画像の数を表す。

２．キー領域を検出し、画像キー領域検出器などのセンサを使用して各フレーム画像における関心領域（例えば顔領域、人物の肢体を含む人体領域、偽造動作を認識するためのものを含む動作領域など）検出することができ、これらの関心領域をこのキー領域として、画像流Ｘ（ｉ＝１，２，…，ｎ）において、マークを付ける。。

３．ハイパーパラメータのサンプリング間隔ｄを設定し、画像シーケンスＳ（ｊ＝１，２，…，ｎ／ｄ）を得て、ｎが１よりも大きい正の整数であり、画像の数を表し、画像シーケンスＳは複数の画像シーケンスの総称である。

４．各画像シーケンスを例として、各画像シーケンスを画像シーケンスＳｊと記し、少なくとも前後２枚の画像、即ちＳ１＝（Ｘ１，Ｘ３）、Ｓ２＝（Ｘ３，Ｘ５）、…、Ｓ（ｎ／ｄ）＝（Ｘｎ-２，Ｘｎ）を含み、サンプリング間隔ｄの選択については、前後２枚の画像を例として、ｄ＝２を選択することができる。

５．式（１）に基づいて画像シーケンスに対する画素異常率を計算し、

ここで、Ｒａｔｉｏは画素異常率であり、

は同一スコア値であり、この同一スコア値によって画像シーケンスにおけるビデオフレームに比較およびサンプリングをすることで、同一フレーム数を見つけることができる。

指摘すべきことは、同一スコア値という指標は、画素異常率を評価するための１つの指標であり、本開示はこの指標に限定されず、画素異常率を評価できるための指標はいずれも、本出願の保護範囲内にあることである。

６．Ｒ（ｋ＝１，２，…，ｎ／ｄ）で表される複数の画素異常率シーケンスを得る。ここで、ｎが１よりも大きい正の整数で画像の数を表し、ｄはサンプリング間隔である。

７．複数の画素異常率シーケンスの評価について、複数の方式でビデオ検出スコア値を得ることができ、本適用例は以下のように式（２）または式（３）によってビデオ検出スコア値を計算し、ビデオ検出スコア値ｓｃｏｒｅ∈（0,1）、ここで、ｓｃｏｒｅが０である場合、通常のビデオのラベルを表し、後続のビデオ検出スコア値に基づいて閾値を設定するトレーニング過程において、ある画像にこのラベルが付加されると、このビデオフレームは編集されておらず（または偽造されていないと呼ばれる）、「真」のオリジナルビデオフレームであると示し、ｓｃｏｒｅが１である場合、異常ビデオのラベルを表し、後続のビデオ検出スコア値に基づいて閾値を設定するトレーニング過程において、ある画像にこのラベルが付加されると、このビデオフレームは編集された（または偽造されたと呼ばれる）、「偽」の偽造ビデオであると示し、即ち、画像に基づいてビデオを駆動して得られたラベルはユーザに攻撃の可能性がある。

ここで、式（２）において、Ｒは複数の画素異常率シーケンスであり、ポリシーは、異なる応用シーンの検出ニーズに応じて指向的に設定することができ、ｓｃｏｒｅはビデオ検出スコア値である。ｓｃｏｒｅに基づいて閾値を設定し、例えば、このｓｃｏｒｅを閾値とすることもでき、それによって、ポリシーに基づいて異常ビデオのある位置を直接的に位置決めることができる。

ここで、式（３）において、Ｒは複数の画素異常率シーケンスであり、ｂは予め設定されたパラメータであり、このパラメータは、異なる応用シーンの検出ニーズに応じて指向的に設定することができ、ｗは重みであり、ｓｃｏｒｅはビデオ検出スコア値であり、複数の画素異常率シーケンスの分布に基づいて、式（２）のように予め設定されたポリシーだけで採点することではなく、ビデオをより正確に採点するために、式（３）のＬｏｇｉｓｔｉｃ回帰原理（Ｌｏｇｉｓｔｉｃ回帰プロセスにおいて、トレーニングセットと検証セットを作成する方法でトレーニングすることで、実際の応用シーン推理のためのｗパラメータを得ることができる）によって特徴抽出器を設計することができる。指摘すべきことは、Ｌｏｇｉｓｔｉｃ回帰を採用することは、ビデオデータストリームに対して手動で設計された畳み込みカーネルを実行し、さらに畳み込みの複雑な操作を行うことと等価であることができる。ｓｃｏｒｅに基づいて閾値を設定することもでき、例えば、このｓｃｏｒｅを閾値とすることによって、トレーニングにより得られたニューラルネットワークの方式によって異常ビデオのある位置を位置決める。

本適用例を用いると、ビデオフレームが偽造された、編集されたとすると、「異なるフレーム画面に一部の画素が完全に同じであるという状況が存在する」ことが存在すると考えられるので、検出すべき領域を合理的に選択し、ビデオ全体を整理することで、このような編集跡を見つけ出すことができ、ビデオフレームの「真」または「偽」を判断することによって、ビデオデータストリーム全体における異常ビデオ位置を迅速に位置決めることができる。計算しやすく、ビジョンプロセッサ（ＧＰＵ、ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）を必要とせず、計算の複雑度が低く、迅速であり、精度が高く、解釈可能性が強く、異常ビデオの位置を直接的に位置決めることができ、閾値を設定することで直接的に推論することができ、トレーニングが必要ないか、トレーニングに必要なデータが少ない。また、上記の式によってビデオの任意シーケンスにおける編集された領域の大きさを計算し、ビデオレベルの判断根拠として、複雑な畳み込みニューラルネットワークを設計する必要もなく、ポリシーに基づいてまたは簡単にトレーニングして得られたｓｃｏｒｅによって、閾値を設定し、それによって、最小のコストで、最速の演算で良い検出効果を達成することができる。

本開示の実施形態によれば、ビデオ検出装置を提供し、図３は、本開示の実施例によるビデオ検出装置の構成構造の概略図であり、図３に示すように、ビデオ検出装置３００は、ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオフレームにおける目標領域を得て、前記目標領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すためのものであるための目標領域検出モジュール３０１と、前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索するための異常ビデオ検索モジュール３０２と、前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定するための目標ビデオ確定モジュール３０３とを含む。

本開示の実施形態によれば、ビデオ検出装置を提供し、図４は、本開示の実施例によるビデオ検出装置の構成構造の概略図であり、図４に示すように、ビデオ検出装置４００は、ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオフレームにおける目標領域を得て、前記目標領域は、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すためのものであるための目標領域検出モジュール４０１であって、前記ビデオデータストリームにおける隣接する少なくとも２つのビデオフレームに対して、キー領域をそれぞれ抽出するためのキー領域抽出サブモジュール４０１１と、前記少なくとも２つのビデオフレームにそれぞれに対応するキー領域を画素点の特徴照合を行い、照合して得られた前記キー領域における前記一部の画素が全く同じである領域を、前記目標領域とするための照合サブモジュール４０１２とをさらに含む目標領域検出モジュール４０１と、前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索するための異常ビデオ検索モジュール４０２と、前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定するための目標ビデオ確定モジュール４０３とを含む。

１つの実施形態において、前記目標ビデオ確定モジュールは、前記ビデオデータストリームにおける前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得て、前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得て、前記画素異常率を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第１のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定するために用いられる。

１つの実施形態において、前記目標ビデオ確定モジュールは、前記ビデオデータストリームにおける前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得て、前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得て、前記第１のビデオシーケンスから異なる画素異常率で構成される第２のビデオシーケンスを選択し、それぞれ採点し、対応するビデオ検出スコア値を得て、前記ビデオ検出スコア値を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第２のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定するために用いられる。

１つの実施形態において、ビデオ検出スコア値に基づいて前記閾値を設定するための閾値設定モジュールをさらに含み、ここで、前記ビデオ検出スコア値は、異なる画素異常率で構成される第２のビデオシーケンスの第１のビデオシーケンスにおけるスコア値割合を含み、前記第１のビデオシーケンスは前記ビデオデータストリームにおける前記異常ビデオフレームで構成される第１のビデオシーケンスである。

１つの実施形態において、前記閾値に基づいて、前記目標ビデオフレームの前記ビデオデータストリームにおける位置を位置決めるための位置決めモジュールをさらに含む。

本開示の実施例の各装置における各モジュールの機能は、上記の方法における対応説明を参照することができ、ここでは説明を省略する。

本開示の実施例によれば、本開示は、電子機器、可読記憶媒体及びコンピュータプログラム製品をさらに提供する。

図５は本発明の実施例によるビデオ検出方法を実現するための電子機器のブロック図である。この電子機器は、前記配備機器またはエージェント機器であってもよい。電子機器は、様々な形態のデジタル電子コンピュータ機器、例えば、ラップトップ型コンピュータ、デスクトップ型コンピュータ、ステージ、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、その他の適切なコンピュータを示すことを目的とする。電子機器はさらに、様々な形態の移動装置、例えば、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブル機器とその他の類似する計算装置を示してよい。本明細書に示される部品、これらの接続関係及びこれらの機能は例示的なものに過ぎず、本明細書に説明した及び／又は請求した本開示の実現を制限しない。

図５に示すように、電子機器５００は、計算ユニット５０１を含み、それはリードオンリーメモリ（ＲＯＭ）５０２に記憶されるコンピュータプログラムまた記憶ユニット５０８からランダムアクセスメモリ（ＲＡＭ）５０３にロードされるコンピュータプログラムによって、種々の適当な操作と処理を実行することができる。ＲＡＭ５０３において、更に電子機器５００を操作するために必要な様々なプログラムとデータを記憶してよい。計算ユニット５０１、ＲＯＭ５０２およびＲＡＭ５０３はバス５０４によって互いに接続される。入力／出力（Ｉ／Ｏ）インターフェース５０５もバス５０４に接続される。

電子機器５００における複数の部品はＩ／Ｏインターフェース５０５に接続され、例えばキーボード、マウスなどの入力ユニット５０６と、例えば様々なタイプのディスプレイ、スピーカーなどの出力ユニット５０７と、例えば磁気ディスク、光ディスクなどの記憶ユニット５０８と、例えばネットワークカード、モデム、無線通信送受信機などの通信ユニット５０９とを含む。通信ユニット５０９は、電子機器５００が例えばインターネットなどのコンピュータネットワークおよび／又は様々な電気通信ネットワークを介して他の機器と情報／データを交換することを可能にする。

計算ユニット５０１は処理及びコンピューティング能力を有する様々な汎用及び／又は専用の処理アセンブリであってもよい。計算ユニット５０１のいくつかの例として、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、様々な専用人工知能（ＡＩ）計算チップ、機械学習モデルアルゴリズムを実行する様々な計算ユニット、デジタルシグナルプロセッサ（ＤＳＰ）、及び任意の適当なプロセッサ、コントローラ、マイクロコントローラなどを含んでもよいが、これらに限定されない。計算ユニット５０１は上記内容で説明した各方法と処理、例えばビデオ検出方法を実行する。例えば、いくつかの実施例において、ビデオ検出方法はコンピュータソフトウェアプログラムとして実現してよく、機械読み取り可能な媒体、例えば、記憶ユニット５０８に有形に含まれる。いくつかの実施例において、コンピュータプログラムの一部の又は全てはＲＯＭ５０２及び／又は通信ユニット５０９を経して電子機器５００にロード及び／又はインストールされてよい。コンピュータプログラムがＲＡＭ５０３にロードされて計算ユニット５０１によって実行される時、以上で説明されるビデオ検出方法の１つ又は複数のステップを実行することができる。代替的に、別の実施例において、計算ユニット５０１は他のいかなる適切な方式で（例えば、ファームウェアにより）ビデオ検出方法を実行するように構成されてよい。

本明細書で上述したシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールド・プログラマブル・ゲート・アレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準製品（ＡＳＳＰ）、システムオンチップ（ＳＯＣ）、ロードプログラマブル論理デバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／又はこれらの組み合わせにおいて実現することができる。これらの様々な実施形態は、一つ又は複数のコンピュータプログラムに実施され、この一つ又は複数のコンピュータプログラムは少なくとも一つのプログラマブルプロセッサを含むプログラマブルシステムで実行し及び／又は解釈してもよく、このプログラマブルプロセッサは専用又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも一つの入力装置、少なくとも一つの出力装置からデータと命令を受信し、データと命令をこの記憶システム、この少なくとも一つの入力装置、この少なくとも一つの出力装置に送信してよいこと、を含んでもよい。

本開示の方法を実施するプログラムコードは一つ又は複数のプログラミング言語のいかなる組み合わせで書かれてよい。これらのプログラムコードを汎用コンピュータ、特殊目的のコンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供してよく、プログラムコードはプロセッサ又はコントローラにより実行される時にフローチャート及び／又はブロック図に規定の機能／操作は実施される。プログラムコードは完全に機械で実行してよく、部分的に機械で実行してよく、独立ソフトウェアパッケージとして部分的に機械で実行し且つ部分的に遠隔機械で実行してよく、又は完全に遠隔機械又はサーバで実行してよい。

本開示の文脈において、機械読み取り可能な媒体は有形の媒体であってもよく、命令実行システム、装置又はデバイスに使用される又は命令実行システム、装置又はデバイスに結合されて使用されるプログラムを具備又は記憶してよい。機械読み取り可能な媒体は機械読み取り可能な信号媒体又は機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体は、電子、磁気、光学、電磁、赤外線、又は半導体システム、装置又はデバイス、又は上記内容のいかなる適切な組み合わせを含んでもよいが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例は、一つ又は複数のリード線による電気接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能なプログラマブル読み出し専用メモリ（ＥＰＲＯＭ又はフラッシュメモリ）、光ファイバー、ポータブルコンパクトディスク読み出し専用メモリ（ＣＤ－ＲＯＭ）、光記憶装置、磁気記憶装置、又は上記内容のいかなる適切な組み合わせを含む。

ユーザとのインタラクションを提供するために、コンピュータにはここで説明したシステムと技術を実施してよく、このコンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）又はＬＣＤ（液晶ディスプレイ）監視モニタ）、及びキーボードとポインティング装置（例えば、マウスやトラックボール）を備え、ユーザはこのキーボードとこのポインティング装置を介してコンピュータに入力してよい。その他の種類の装置はさらに、ユーザとのインタラクティブを提供するためのものであってもよい。例えば、ユーザに提供するフィードバックはいかなる形態の感覚フィードバック（例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック）であってもよく、いかなる形態（音入力、音声入力、又は触覚入力を含む）でユーザからの入力を受信してよい。

ここで述べたシステムや技術は、バックステージ部品を含む計算システム（例えば、データサーバとして）や、ミドルウェア部品を含む計算システム（例えば、アプリケーションサーバ）や、フロントエンド部品を含む計算システム（例えば、グラフィカルユーザインターフェースやウェブブラウザを有するユーザコンピュータ、ユーザが、そのグラフィカルユーザインターフェースやウェブブラウザを通じて、それらのシステムや技術の実施形態とのインタラクティブを実現できる）、あるいは、それらのバックステージ部品、ミドルウェア部品、あるいはフロントエンド部品の任意の組み合わせからなる計算システムには実施されてもよい。システムの部品は、任意の形式や媒体のデジタルデータ通信（例えば、通信ネットワーク）により相互に接続されてもよい。通信ネットワークの一例は、ローカルネットワーク（ＬＡＮ）、広域ネットワーク（ＷＡＮ）とインターネットを含む。

コンピュータシステムは、クライアント側とサーバを含んでもよい。クライアントとサーバは、一般的に相互に遠く離れ、通常、通信ネットワークを介してインタラクションを行う。互にクライアント－サーバという関係を有するコンピュータプログラムを対応するコンピュータで実行することによってクライアントとサーバとの関係を生成しする。

理解すべきこととして、前述した様々な形態のフローを用いて、ステップを改めて順位付け、増加又は削除してよい。例えば、本開示に記載された各ステップは、並列的に実行してもよいし、順次実行してもよいし、異なる順序で実行してもよい。本開示に開示された技術案が所望する結果を実現できれば、本明細書はこれに限定されない。

上述した具体的な実施形態は、本開示の保護範囲に対する限定を構成するものではない。当業者であれば、設計要求及び他の要因に応じて、各種の修正、コンビネーション、サブコンビネーション及び代替を行うことができると理解すべきである。本開示の趣旨及び原則内になされた任意の修正、同等置換及び改良などは、いずれも本開示の保護範囲に含まれるべきである。

Claims

ビデオ検出方法であって、
ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すための、前記ビデオフレームにおける目標領域を得ることと、
前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索することと、
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定することとを含み、
前記ビデオデータストリームにおけるビデオフレームを検出し、前記ビデオフレームにおける目標領域を得ることは、
前記ビデオデータストリームにおける隣接する少なくとも２つのビデオフレームに対して、キー領域をそれぞれ抽出することと、
前記少なくとも２つのビデオフレームのそれぞれに対応するキー領域に対して画素点の特徴照合を行い、照合して得られた前記キー領域における、前記一部の画素が全く同じである領域を、前記目標領域とすることとを含む、ビデオ検出方法。
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定することは、
前記ビデオデータストリームにおいて前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得ることと、
前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得ることと、
前記画素異常率を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第１のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定することとを含み、
前記画素異常の演算は、前記異常ビデオフレームにおける画素と、前記異常ビデオフレームの隣接異常ビデオフレームにおける画素との比較を行うことであり、前記同一スコア値は、前記比較によって得られた同一の画素の数であり、
前記画素異常率は、前記同一スコア値と前記異常ビデオフレームの画素の数の比である、請求項１に記載のビデオ検出方法。
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定することは、
前記ビデオデータストリームにおいて前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得ることと、
前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得ることと、
前記第１のビデオシーケンスから異なる画素異常率で構成される第２のビデオシーケンスを選択し、それぞれ採点し、対応するビデオ検出スコア値を得ることと、
前記ビデオ検出スコア値を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第２のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定することとを含み、
前記画素異常の演算は、前記異常ビデオフレームにおける画素と、前記異常ビデオフレームの隣接異常ビデオフレームにおける画素との比較を行うことであり、前記同一スコア値は、前記比較によって得られた同一の画素の数であり、
前記画素異常率は、前記同一スコア値と前記異常ビデオフレームの画素の数の比である、請求項１に記載のビデオ検出方法。
ビデオ検出スコア値に基づいて前記閾値を設定することをさらに含み、
前記ビデオ検出スコア値は、異なる画素異常率で構成される第２のビデオシーケンスの第１のビデオシーケンスにおけるスコア値割合を含み、前記第１のビデオシーケンスは前記ビデオデータストリームにおける前記異常ビデオフレームで構成される第１のビデオシーケンスであり、
前記異常ビデオフレームの画素異常率は、前記異常ビデオフレームの同一スコア値と前記異常ビデオフレームの画素の数の比であり、
前記同一スコア値は、前記異常ビデオフレームと前記異常ビデオフレームの隣接異常ビデオフレームにおける同一の画素の数であり、
前記スコア値割合は、異なる画素異常率で構成される第２のビデオシーケンスに含まれる異常ビデオフレームの数と前記第１のビデオシーケンスに含まれる異常ビデオフレームの数の比である、請求項１に記載のビデオ検出方法。
前記閾値に基づいて、前記目標ビデオフレームの前記ビデオデータストリームにおける位置を位置決めることをさらに含む、請求項４に記載のビデオ検出方法。
ビデオ検出装置であって、
ビデオデータストリームにおけるビデオフレームを検出して、前記ビデオデータストリームにおける異なるビデオフレームの一部の画素が全く同じである領域を表すための、前記ビデオフレームにおける目標領域を得るための目標領域検出モジュールと、
前記ビデオデータストリームにおける、前記目標領域が存在する異常ビデオフレームを検索するための異常ビデオ検索モジュールと、
前記異常ビデオフレームに対応する検出パラメータが閾値に一致する場合、前記異常ビデオフレームを目標ビデオフレームとして確定するための目標ビデオ確定モジュールとを含み、
前記目標領域検出モジュールは、
前記ビデオデータストリームにおける隣接する少なくとも２つのビデオフレームに対して、キー領域をそれぞれ抽出し、
前記少なくとも２つのビデオフレームのそれぞれに対応するキー領域に対して画素点の特徴照合を行い、照合して得られた前記キー領域における、前記一部の画素が全く同じである領域を、前記目標領域とするために用いられる、ビデオ検出装置。
前記目標ビデオ確定モジュールは、
前記ビデオデータストリームにおいて前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得て、
前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得て、
前記画素異常率を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第１のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定するために用いられ、
前記画素異常の演算は、前記異常ビデオフレームにおける画素と、前記異常ビデオフレームの隣接異常ビデオフレームにおける画素との比較を行うことであり、前記同一スコア値は、前記比較によって得られた同一の画素の数であり、
前記画素異常率は、前記同一スコア値と前記異常ビデオフレームの画素の数の比である、請求項６に記載のビデオ検出装置。
前記目標ビデオ確定モジュールは、
前記ビデオデータストリームにおける前記異常ビデオフレームで構成される第１のビデオシーケンスに対して画素異常の演算を行い、同一スコア値を得て、
前記同一スコア値に基づいて、前記異常ビデオフレームに対する画素異常率を得て、
前記第１のビデオシーケンスから異なる画素異常率で構成される第２のビデオシーケンスを選択し、それぞれ採点し、対応するビデオ検出スコア値を得て、
前記ビデオ検出スコア値を前記検出パラメータとして、前記検出パラメータが閾値に一致する場合、前記第２のビデオシーケンスに存在する異常ビデオフレームを目標ビデオフレームとして確定するために用いられ、
前記画素異常の演算は、前記異常ビデオフレームにおける画素と、前記異常ビデオフレームの隣接異常ビデオフレームにおける画素との比較を行うことであり、前記同一スコア値は、前記比較によって得られた同一の画素の数であり、
前記画素異常率は、前記同一スコア値と前記異常ビデオフレームの画素の数の比である、請求項６に記載のビデオ検出装置。
閾値設定モジュールをさらに含み、前記閾値設定モジュールは、
ビデオ検出スコア値に基づいて前記閾値を設定するために用いられ、
前記ビデオ検出スコア値は、異なる画素異常率で構成される第２のビデオシーケンスの第１のビデオシーケンスにおけるスコア値割合を含み、前記第１のビデオシーケンスは前記ビデオデータストリームにおける前記異常ビデオフレームで構成される第１のビデオシーケンスであり、
前記異常ビデオフレームの画素異常率は、前記異常ビデオフレームの同一スコア値と前記異常ビデオフレームの画素の数の比であり、
前記同一スコア値は、前記異常ビデオフレームと前記異常ビデオフレームの隣接異常ビデオフレームにおける同一の画素の数であり、
前記スコア値割合は、異なる画素異常率で構成される第２のビデオシーケンスに含まれる異常ビデオフレームの数と前記第１のビデオシーケンスに含まれる異常ビデオフレームの数の比である、請求項６に記載のビデオ検出装置。
位置決めモジュールをさらに含み、前記位置決めモジュールは、
前記閾値に基づいて、前記目標ビデオフレームの前記ビデオデータストリームにおける位置を位置決めるために用いられる、請求項９に記載のビデオ検出装置。
電子機器であって、
少なくとも一つのプロセッサと、
前記少なくとも一つのプロセッサに通信接続されたメモリと、を含み、
前記メモリには、前記少なくとも１つのプロセッサによって実行可能な命令が記憶されており、前記命令は、前記少なくとも１つのプロセッサによって実行されることにより、前記少なくとも１つのプロセッサが請求項１～５のいずれか一項に記載のビデオ検出方法を実行する、電子機器。
コンピュータに請求項１～５のいずれか一項に記載のビデオ検出方法を実行させるためのコンピュータ命令が記憶された非一時的コンピュータ可読記憶媒体。
プロセッサによって実行されると、請求項１～５のいずれか一項に記載のビデオ検出方法を実現するコンピュータ命令を含むコンピュータプログラム。