JP2022160646A - ビデオジッタの検出方法、装置、電子機器および記憶媒体 - Google Patents

ビデオジッタの検出方法、装置、電子機器および記憶媒体 Download PDF

Info

Publication number
JP2022160646A
JP2022160646A JP2022127538A JP2022127538A JP2022160646A JP 2022160646 A JP2022160646 A JP 2022160646A JP 2022127538 A JP2022127538 A JP 2022127538A JP 2022127538 A JP2022127538 A JP 2022127538A JP 2022160646 A JP2022160646 A JP 2022160646A
Authority
JP
Japan
Prior art keywords
video frame
target
video
determining
distance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022127538A
Other languages
English (en)
Inventor
シャンヤン ワン,
Xiangyang Wang
ファイフェイ シン,
Huaifei Xing
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Publication of JP2022160646A publication Critical patent/JP2022160646A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/248Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/68Control of cameras or camera modules for stable pick-up of the scene, e.g. compensating for camera body vibrations
    • H04N23/681Motion detection
    • H04N23/6811Motion detection based on the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream or rendering scenes according to encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10016Video; Image sequence
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30168Image quality inspection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Studio Devices (AREA)
  • Image Processing (AREA)

Abstract

【課題】後続の安定化装置または画像の安定化処理を容易にするために、ビデオにジッタが発生しているか否かを検出するには、客観的かつ迅速で有効な方法、装置、電子機器および記憶媒体を提供する。【解決手段】方法は、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定し、移動距離に基づいて、ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、ターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定する。【効果】ビデオフレームのジッタ振幅と周期とに基づいてビデオフレームのジッタを決定することにより、ジッタの誤判定を回避し、ビデオのジッタ検出の精度を向上させる。【選択図】図1

Description

本開示は、画像処理技術の分野に関し、具体的にインテリジェント推奨およびメディアクラウド技術の分野に関し、特にビデオジッタの検出方法、装置、電子機器および記憶媒体に関する。
ビデオの撮影、録画、監視の過程で、撮像装置が揺れ、撮影されたビデオ画像の品質が低下する場合がある。従って、後続の安定化装置または画像の安定化処理を容易にするために、ビデオにジッタが発生しているか否かを検出するには、客観的かつ迅速で有効な方法が必要である。
本開示は、ビデオジッタの検出方法、装置、電子機器および記憶媒体を提供する。
本開示の一態様によれば、ビデオジッタの検出方法を提供し、ターゲットビデオフレームと前記ターゲットビデオフレームの前の複数の履歴ビデオフレームを取得するステップと、前記ターゲットビデオフレームおよび前記複数の履歴ビデオフレームの各前記ビデオフレームについて、設定された方向での前のビデオフレームに対する移動距離を決定するステップと、設定された方向での前のビデオフレームに対する各前記ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定するステップと、設定された方向での前記ターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、前記ターゲット周期が設定された周期よりも小さい場合、前記ビデオにジッタがあると決定されるステップと、を含む。
本開示の別の態様によれば、ビデオジッタの検出装置を提供し、ターゲットビデオフレームと前記ターゲットビデオフレームの前の複数の履歴ビデオフレームを取得する取得モジュールと、前記ターゲットビデオフレームおよび前記複数の履歴ビデオフレームの各前記ビデオフレームについて、設定された方向での前のビデオフレームに対する移動距離を決定する第1の決定モジュールと、設定された方向での前のビデオフレームに対する各前記ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する第2の決定モジュールと、設定された方向での前記ターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、前記ターゲット周期が設定された周期よりも小さい場合、前記ビデオにジッタがあると決定される第3の決定モジュールと、を備える。
本開示の別の態様によれば、電子機器を提供し、少なくとも1つのプロセッサと、該少なくとも1つのプロセッサと通信可能に接続されたメモリと、を備え、前記メモリには、前記少なくとも1つのプロセッサによって実行される命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが上記一態様の方法を実行できる。
本開示の別の態様によれば、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供し、ここで、前記コンピュータ命令は、コンピュータに上記一態様の方法を実行させる。
本開示の別の態様によれば、コンピュータプログラムを提供し、前記コンピュータプログラムがプロセッサによって実行される場合、上記一態様の方法が実現される。
なお、この部分に記載の内容は、本開示の実施例の肝心または重要な特徴を特定することを意図しておらず、本開示の範囲を限定することも意図していない。本出願の他の特徴は下記の明細書の記載を通して理解しやすくなる。
図面は、本出願をより良く理解するためのものであり、本開示を限定するものではない。
本開示の実施例に係るビデオジッタの検出方法の概略フローチャートである。 本開示の実施例に係る別のビデオジッタの検出方法の概略フローチャートである。 本開示の実施例に係る別のビデオジッタの検出方法の概略フローチャートである。 本開示の実施例に係る別のビデオジッタの検出方法の概略フローチャートである。 本開示の実施例に係るビデオジッタの検出装置の概略構成図である。 本開示の実施例による例示的な電子機器600の概略ブロック図である。
以下、図面と組み合わせて本出願の例示的な実施例を説明する。理解を容易にするために、その中には本発明の実施例の様々な詳細が含まれ、それらは単なる例示と見なされるべきである。したがって、当業者は、本発明の範囲及び精神から逸脱することなく、本明細書に記載の実施例に対して様々な変更及び修正を行うことができる。また、わかりやすくかつ簡潔にするために、以下の説明では、周知の機能及び構造の説明を省略する。
以下、図面を参照して、本開示の実施例のビデオジッタの検出方法、装置、電子機器および記憶媒体を説明する。
関連技術では、ジッタ振幅に基づいて、ビデオにジッタがあるか否かを判断し、撮影装置がゆっくり往復運動すると、算出されたジッタ振幅が大きくなる可能性があり、ターゲットビデオフレームにジッタがあると見なされるが、実は撮影装置の動きであるため、誤判定が発生する。このため、本開示の実施例はビデオジッタの検出方法を提供し、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。本開示では、ビデオフレームのジッタ振幅と周期とに基づいてビデオフレームのジッタを決定することにより、ジッタの誤判定を回避し、ビデオのジッタ検出の精度を向上させる。
図1は、本開示の実施例に係るビデオジッタの検出方法の概略フローチャートである。
図1に示すように、この方法は、以下のステップ101~104を含む。
ステップ101では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得する。
本開示の実施例では、ビデオはビデオフレームで構成され、ターゲットビデオフレームは、ビデオ再生プロセスにおける任意の一つのビデオフレーム、またはビデオ再生プロセスにおける現在のビデオフレームであり得る。ターゲットビデオフレームは、ビデオ内のビデオクリップ内の任意の一つのフレーム、または特定の一つのフレームにすることもできる。
例えば、ビデオクリップAには、区別するために、「1、2、3...、30」との番号が付けられた30つのビデオフレームが含まれ、ターゲットビデオフレームが30番目のフレーム、即ち30番のビデオフレームである場合、1~29番のビデオフレームは、30番のビデオフレームより前の履歴のビデオフレームである。ターゲットビデオフレームが28番目のフレーム、即ち28番のビデオフレームである場合、1~27番のビデオフレームは、28番のビデオフレームより前の履歴ビデオフレームである。
ステップ102、ターゲットビデオフレームおよび複数の履歴ビデオフレームの各ビデオフレームについて、設定された方向での前のビデオフレームに対する移動距離を決定する。
ここで、各ビデオフレームには、ターゲットビデオフレームと、ターゲットビデオフレームより前の複数の履歴ビデオフレームが含まれる。
本開示の実施例では、各ビデオフレーム内の2つの隣接するビデオフレーム間の設定された方向での移動距離を決定することで、各ビデオフレーム内の各フレームの設定された方向での移動距離を決定する。ここで、設定された方向は、水平方向、または垂直方向、または水平方向と垂直方向、または水平方向と垂直方向の一方の方向にすることができる。
可能な実現形態として、各ビデオフレーム内のいずれかの隣接するビデオフレーム間のアフィン変換行列を決定し、アフィン変換行列によって、隣接するビデオフレームの設定された方向での前のフレームに対する次のフレームの移動距離が得られる。
ステップ103では、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する。
本開示の実施例では、各ビデオフレーム内の設定された方向での前のビデオフレームに対する各フレームの移動距離に基づいて、設定された方向での各ビデオフレームの移動軌跡を決定し、各ビデオフレームの移動軌跡に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、ひいてはターゲット振幅とターゲット周期とに基づいて、ターゲットビデオフレームにジッタがあるか否かを決定する。本開示の実施例では、ターゲットビデオフレームにジッタがあるか否かを判断する際に考慮すべき要素を追加することにより、ビデオフレームのジッタ判定の精度を向上させる。
ステップ104では、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。
本開示の実施例では、設定された方向でのターゲットビデオフレームの決定された目標振幅および目標周期に基づいて、ターゲット振幅が設定された振幅よりも大きく、ターゲット周期が設定された周期よりも小さいと決定された場合、ターゲットビデオフレームにジッタがあると決定され、ターゲットビデオフレームから取得されたビデオにジッタがあると決定され、フレームのビデオにジッタがある。振幅によって、ビデオにジッタがあるか否かを決定する従来技術の方法と比較して、ビデオキャプチャデバイスが通常の往復運動をしているときに、大きな振幅によるジッタの誤判定を回避し、ビデオジッタの決定の精度を向上させる。
本開示の技術案では、関与するユーザの個人情報の取得、保存、および適用はすべて、関連する法律および規制の規定に準拠し、公序良俗に違反しない。
本開示の実施例のビデオジッタの検出方法では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。本開示では、ビデオフレームのジッタ振幅と周期とに基づいてビデオフレームのジッタを決定することにより、ジッタの誤判定を回避し、ビデオのジッタ検出の精度を向上させる。
上記の実施例に基づいて、本実施例は、別のビデオジッタの検出方法を提供し、図2は本開示の実施例に係る別のビデオジッタの検出方法の概略フローチャートであり、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を如何に決定するかを具体的に説明し、図2に示すように、この方法は、以下のステップ201~206を含む。
ステップ201では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得する。
具体的には、前述の実施例の説明を参照することができ、原理は同じであり、本実施例では詳しく説明しない。
ステップ202では、各ビデオフレームについて、ビデオフレーム内の特徴点とビデオフレームの前のビデオフレーム内の特徴点をマッチングし、ビデオフレーム内の第1のマッチング特徴点とビデオフレームの前のビデオフレーム内の第2のマッチング特徴点を決定する。
ここで、ビデオフレーム内の特徴点は、ビデオ内のオブジェクトの形状、色、テクスチャ、および他の特性を含む1つまたは複数のピクセルポイントの組み合わせであり得る。
本開示の実施例の実施形態では、隣接する2つのビデオフレーム画像を取得し、前のビデオフレーム画像と次のビデオフレーム画像から複数の特徴点の特徴を抽出し、例えば、SURFアルゴリズムに基づいてビデオフレーム画像内の特徴点を抽出し、特徴点の特徴をマッチングし、前のビデオフレーム画像と次のビデオフレーム画像内のマッチングされた特徴点を取得し、特徴点マッチングペアを構成することができる。区別しやすくなるように、各ビデオフレームについて、本開示の実施例では、このビデオフレーム内の第1のマッチング特徴点と呼ばれ、このビデオフレームの前のビデオフレーム内の第1のマッチング特徴点とマッチングする第2のマッチング特徴点と呼ばれる。例えば、ビデオフレーム画像の特徴点はそれぞれP1、P2、P3...、Pnであり、前のビデオフレーム画像の対応するマッチングされる特徴点はそれぞれQ1、Q2、Q3...、Qnである。ここで、P1とQ1は特徴点マッチングペアであり、P2とQ2は特徴点マッチングペアであり、P3とQ3は特徴点マッチングペアである。特徴点のマッチングでは、ブルートフォース(Brute
Force)または高速近似最近傍(FLANN)アルゴリズムを使用して特徴をマッチングすることができ、高速近似最近傍アルゴリズムは、最も近いマッチング距離と次に最も近いマッチング距離との比率が、設定された閾値を超えるか否かを判断し、設定された閾値を超える場合、マッチングが成功したと判断されることにより、間違うマッチングポイントペアが削減される。
ステップ203では、設定された方向での各第2のマッチング特徴点に対する各第1のマッチング特徴点の移動距離を決定する。
ここで、設定された方向は、水平方向及び/又は垂直方向である。画像を収集するための撮影装置の揺れは、水平方向の動きであることがあるし、垂直方向の変位であることがあるし、水平方向と垂直方向の揺れが同時に発生していることもあるため、2方向の移動距離を決定することにより、後続のジッタ決定の精度を向上させることができる。
本開示の実施例では、各第1のマッチング特徴点の設定された方向での移動距離、及び各第2のマッチング特徴点の設定された方向での移動距離を決定することにより、各第2のマッチング特徴点に対する各第1のマッチング特徴点の移動距離を決定することができる。
ステップ204では、第1のマッチング特徴点の数が、設定された特徴点の数よりも大きい場合、各第1のマッチング特徴点の移動距離の平均値を、設定された方向での前のビデオフレームに対するビデオフレームの移動距離とする。
本開示の実施例では、第1のマッチング特徴点の数を決定し、第1のマッチング特徴点の数と設定された特徴点の数とを比較し、第1のマッチング特徴点の数が、設定された特徴点の数よりも大きいことを決定することにより、第1のマッチング特徴点の数が少ないときに誤ってマッチングする特徴点による誤判定を回避し、精度を向上させる。さらに、第1のマッチング特徴点の移動距離の平均値を、設定された方向での前のビデオフレームに対するビデオフレームの移動距離とする。
なお、第1のマッチング特徴点の数が設定された特徴点の数以下である場合、ビデオフレームは前のビデオフレームに対して設定された方向に移動していないとみなされる。
ステップ205では、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する。
ステップ206では、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。
具体的に、ステップ205とステップ206は、前述の実施例の説明を参照することができ、原理は同じであり、本実施例では詳しく説明しない。
本開示の実施例のビデオジッタの検出方法では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。本開示では、ビデオフレームのジッタ振幅と周期とに基づいてビデオフレームのジッタを決定することにより、ジッタの誤判定を回避し、ビデオのジッタ検出の精度を向上させる。設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定するとき、各ビデオフレーム内のマッチングされる特徴点の総数を判断することにより、誤ってマッチングされた特徴点による誤判定を減少し、各ビデオフレームの移動距離を決定する精度を向上させる。
上記の実施例に基づいて、本実施例は別の実施形態を提供し、各ビデオフレームについて、設定距離よりも移動距離が大きいマッチングされた特徴点の数を決定することにより、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離の精度を向上させ、図3は、本開示の実施例に係る別のビデオジッタの検出方法の概略フローチャートであり、図3に示すように、この方法は、以下のステップ301~307をさらに含む。
ステップ301では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得する。
ステップ302では、各ビデオフレームについて、ビデオフレーム内の特徴点とビデオフレームの前のビデオフレーム内の特徴点をマッチングし、ビデオフレーム内の第1のマッチング特徴点とビデオフレームの前のビデオフレーム内の第2のマッチング特徴点を決定する。
ステップ303では、各第2のマッチング特徴点に対する各第1のマッチング特徴点の移動距離を決定する。
具体的に、ステップ301~303は、前述の実施例の説明を参照することができ、原理は同じであり、本実施例では詳しく説明しない。
ステップ304では、第1のマッチング特徴点のうち、移動距離が設定距離よりも大きい第3のマッチング特徴点の数を集計し、第3のマッチング特徴点の数が第3の設定数よりも大きいか、または第1のマッチング特徴点の数に占める第3のマッチング特徴点の数の割合が第1の割合よりも大きいと決定される。
本開示の実施例では、第1のマッチング特徴点のうち、移動距離が設定距離よりも大きい第3のマッチング特徴点の数を集計して、第3のマッチング特徴点の数が第3の設定数よりも大きいか、または第1のマッチング特徴点の数に占める第3のマッチング特徴点の数の割合が第1の割合よりも大きいと決定され、各第1のマッチング特徴点のうち移動距離が大きい特徴点の数または特徴点の割合を決定することにより、対応するビデオフレームには、多数の特徴点が移動することを決定し、ビデオフレーム内のオブジェクトの一部の動きのため、ビデオフレーム内の動きがあると誤判断することを避け、ビデオフレームの動きの判断の精度を向上させる。
なお、第3のマッチング特徴点の数が第3の設定数以下であり、又は第1のマッチング特徴点の数に占める第3のマッチング特徴点の数の割合が第1の割合以下であると決定される場合、ビデオ内の一部のオブジェクトが移動し、ビデオフレームが前のビデオフレームに対して移動しないと見なされる。
ステップ305では、第1のマッチング特徴点の数が設定された特徴点の数よりも大きく、第3のマッチング特徴点の数が第3の設定数よりも大きいか、または第1のマッチング特徴点の数に占める第3のマッチング特徴点の数の割合が第1の割合よりも大きい場合、各第1のマッチング特徴点の移動距離の平均値を、設定された方向での前のビデオフレームに対するビデオフレームの移動距離とする。
本開示の実施例では、第1のマッチング特徴点の数が設定された特徴点の数よりも大きく、第3のマッチング特徴点の数が第3の設定数よりも大きいか、または第1のマッチング特徴点の数に占める第3のマッチング特徴点の数の割合が第1の割合よりも大きいと決定される場合、対応するビデオフレームに動きがあると決定され、ビデオフレームの各第1のマッチング特徴点の移動距離の平均値を、設定された方向での前のビデオフレームに対するビデオフレームの移動距離とすることにより、各ビデオフレームの動きの判断の精度を向上させる。
ステップ306では、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する。
ステップ307では、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。
具体的に、ステップ306とステップ307は、前述の実施例の説明を参照することができ、原理は同じであり、本実施例では詳しく説明しない。
本開示の実施例のビデオジッタの検出方法では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。本開示では、ビデオフレームのジッタ振幅と周期とに基づいてビデオフレームのジッタを決定することにより、ジッタの誤判定を回避し、ビデオのジッタ検出の精度を向上させる。設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定する場合、各ビデオフレーム内のマッチングされた特徴点の総数、及び設定された要件を満たす特徴点の移動距離の割合、または設定された要件を満たす移動する特徴点の数を判断することによって、ビデオフレーム内の一部のオブジェクトの移動による誤判断を減少し、各ビデオフレームの移動距離を決定する精度を向上させる。
上記の実施例に基づいて、本実施例は、別のビデオジッタの検出方法を提供し、図4は、本開示の実施例に係る別のビデオジッタの検出方法の概略フローチャートであり、図4に示すように、この方法は、以下のステップ401~407を含む。
ステップ401では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得する。
ステップ402では、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定する。
具体的に、ステップ401とステップ402は、前述の実施例における関連する説明を参照することができ、原理は同じであり、本実施例では詳しく説明しない。
ステップ403では、各移動距離に基づいて、設定された順序に従って移動距離リストを生成する。
ここで、設定された順序は、各ビデオフレームの生成順序を示す。
本開示の実施例の実施形態では、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離と各ビデオフレームの生成順序とに基づいて、移動距離リストにデータを順次に書き込む。例えば、各ビデオフレームには合計10個のフレームがあり、各ビデオフレームの生成順序に基づいて、1から10までの番号が付けられ、ここで、10番のフレームは直近の一つのフレームであり、9番のフレームは、10番のフレームの前のフレームであり、このように推察すると、1番のフレームは最も早く生成されたフレームであるため、設定された方向での1~10番のフレームの移動距離は、移動距離リストの左から右に入力される。
本開示の実施例では、移動距離リストに含まれる各ビデオフレームの移動距離の数が、設定された閾値の数よりも大きい場合、移動距離リストは、ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定するたに後で使用される複数のビデオフレームを絞り出すために使用されるため、前列に生成されたビデオフレームを削除することにより、移動距離リストに含まれる移動距離の数を低減し、計算量を減らすとともに、移動距離リストに含まれる各ビデオフレームの移動距離に基づいてターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する精度を向上させる。
ステップ404では、移動距離リストに基づいて、移動距離の絶対値が設定された距離閾値よりも大きい第1の設定数の連続ビデオフレームを決定する。
本開示の実施例の実施形態では、移動距離リストにおいて、設定された順序とは逆方向に、各ビデオフレームに対応する移動距離リストから、移動距離の絶対値が設定された距離閾値よりも大きい第1の設定数の連続ビデオフレームを決定することにより、移動距離が短い、または移動がないビデオフレームを除外し、有效な連続ビデオフレームを決定し、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定するために用いられる連続ビデオフレームの数を減らし、精度を向上させる。
例えば、移動距離リストにおいて、10番のフレームから1番のフレームまでクエリを実行し、移動距離の絶対値が設定された距離閾値よりも大きい第1の設定数の連続ビデオフレームを決定し、例えば10フレームである。
ステップ405では、第1の設定数の連続ビデオフレームにおいて、移動距離の絶対値が極値である第2の設定数の候補ビデオフレームを決定する。
ここで、第2の設定数は、第1の設定数よりも小さい。例えば、第1の設定数は10フレームであり、第2の設定数は3フレームである。
本開示の実施例では、移動距離の絶対値が極値である第2の設定数の候補ビデオフレームを決定し、即ち、複数の局所移動距離の絶対値の極値点を決定することにより、移動距離をさらに絞り出す。
例えば、前で決定された10個の連続ビデオフレームから、局所移動距離が極値点である第2の設定数のビデオフレームを決定し、例えば3フレームである。
ステップ406では、設定された方向での第2の設定数の候補ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する。
本開示の実施例では、第2の設定数の候補ビデオフレーム移動距離が大きく、ジッタが存在する可能性のある各ビデオフレームを示し、ひいては、ジッタが生じる可能性がある第2の設定数の候補ビデオフレームの設定された方向での移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を推定することにより、ターゲット振幅とターゲット周期の2つのパラメータに基づいて、ターゲットビデオフレームにジッタがあるか否かを決定し、ターゲットビデオフレームのジッタ決定の精度を向上させることができる。
本開示の実施例の実施形態では、第2の設定数の候補ビデオフレームにおいて、設定された方向での隣接する候補ビデオフレームの移動距離に基づいて、基準ビデオフレームを決定する。1つのシナリオでは、第2の設定数が2以上である場合、第2の設定数の候補ビデオフレームから、隣接関係のある候補ビデオフレームペアがあると決定される場合、複数の候補ビデオフレームペアから、移動距離の短い候補ビデオフレームを絞り出し、ひいては、絞り出される候補ビデオフレームの数が2つになるまで、上記のスクリーニング操作を繰り返し、そして、最終的にスクリーニングされた2つの候補ビデオフレームから、移動距離が大きい候補ビデオフレームを基準ビデオフレームとして選択する。
例えば、第2の設定数の候補ビデオフレームは3であり、距離リストの順序に従ってそれぞれA、B、Cになり、ここで、候補ビデオフレームAの移動距離が最も大きく、候補ビデオフレームBの移動距離は、候補ビデオフレームCの移動距離よりも大きく、候補ビデオフレームCおよび候補ビデオフレームBの移動距離の絶対値を比較すると、候補ビデオフレームCは、移動距離が小さい候補ビデオフレームであると決定され、候補ビデオフレームBおよび候補ビデオフレームAの移動距離の絶対値を比較すると、候補ビデオフレームBは、移動距離が小さい候補ビデオフレームであると決定され、ひいては、候補ビデオフレームCおよび候補ビデオフレームBの移動距離を比較すると、移動距離が大きい候補ビデオフレームBは基準ビデオフレームであると決定される。
他のシーンでは、第2の設定数が1である場合、この極値に対応する候補ビデオフレームが基準ビデオフレームとして使用され、基準ビデオフレームがある場合、設定された方向でのターゲットビデオフレームのターゲット振幅とターゲット周期は両方とも0であり、ビデオにジッタがないと決定される。
ひいては、ターゲットビデオフレームの設定された方向での移動距離を、設定された方向でのターゲットビデオフレームのターゲット振幅とする。そして、前記基準ビデオフレームと隣接する候補ビデオフレームとの間のフレーム差に基づいて、設定された方向でのターゲットビデオフレームのターゲット周期を決定する。
ここで、1つのシーンでは、基準ビデオフレームに隣接する候補ビデオフレームが2つある場合、基準ビデオフレームと、いずれの隣接する候補ビデオフレームの間のフレーム間隔を決定し、フレーム間隔に基づいて、基準ビデオフレームと任意の隣接する一つの候補ビデオフレームの間の周期、即ちT1とT2を決定し、ひいては、T1またはT2をターゲットビデオフレームのターゲット周期として、または、T1とT2の平均値をターゲットビデオフレームのターゲット周期とする。
ここで、T1またはT2を決定する方法については、本開示の実施例では、T1を例にすると、例えば、基準ビデオフレームは上記で決定された候補ビデオフレームBであり、候補ビデオフレームBと候補ビデオフレームAとの間のフレーム間隔は3フレームであり、ターゲットビデオフレームを収集するデバイスの撮影フレームレートを取得し、フレームレートに基づいて1フレームの長さをt1として決定し、1フレームの長さにフレーム間隔の2倍を掛け、基準ビデオフレームBと隣接する候補ビデオフレームAの間の周期、即ちt1*3*2とする。
他のシーンでは、基準ビデオフレームに隣接する候補ビデオフレームが1つある場合、基準ビデオフレームと隣接する候補ビデオフレームとの間のフレーム間隔によって決定される期間を、ターゲットビデオフレームのターゲット周期とする。
ひいては、決定されたターゲットビデオフレームのターゲット振幅およびターゲット周期に基づいて、ターゲットビデオフレームにジッタがあるか否かを正確に決定することができ、ジッタ決定の精度を向上させる。本開示の実施例では、第2の設定数が大きい場合、第2の設定数の候補ビデオフレームから、基準ビデオフレームを繰り返して絞り出し、基準ビデオフレームの移動距離に基づいてターゲットビデオフレームのターゲット振幅を決定することができ、これにより、ターゲット振幅の決定精度が向上し、さらに、基準ビデオフレームと隣接するフレームとの間のフレーム間隔に基づいて、ターゲット周期を決定し、ターゲット周期の推定の精度も高くなる。
ステップ407では、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。
具体的に、前述の実施例の説明を参照することができ、本実施例では詳しく説明しない。
本開示の実施例のビデオジッタの検出方法では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。本開示では、ビデオフレームのジッタ振幅と周期とに基づいてビデオフレームのジッタを決定することにより、ジッタの誤判定を回避し、ビデオのジッタ検出の精度を向上させる。
上記の実施例では、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ターゲットビデオフレームにジッタがあると決定され、ビデオにジッタがあると判断される。ビデオジッタの決定の精度を向上させるために、上記の実施例に基づいて、本開示の実施例は、別のビデオジッタの検出方法を提供し、ターゲットビデオフレームにジッタがあると決定した後、ターゲットビデオフレームの後に取得された複数の連続ビデオフレームを取得し、上記のターゲットビデオフレームの決定方法を使用して、ターゲットビデオフレームの後の連続ビデオフレーム内の各ビデオの設定された方向での振幅と周期を決定し、各ビデオ在設定された方向での振幅と周期とに基づいて、ジッタのある連続ビデオフレームの数を決定し、ジッタのある連続ビデオフレームの数が第1のフレームの数よりも大きい場合、ビデオにジッタがあると判断される。本開示の実施例では、連続する複数のビデオフレームのジッタ状態を決定することにより、ビデオにジッタのある各フレームビデオフレームを決定することができ、つまり、ビデオのジッタの開始時間と終了時間を決定することができ、これにより、ジッタのあるビデオ部分を正確に特定し、ビデオジッタの決定の精度を向上させ、その後のジッタ除去とジッタ分析に根拠を提供する。
上記実施例を実現するために、本実施例は、ビデオジッタの検出装置を提供する。
図5は、本開示の実施例に係るビデオジッタの検出装置の概略構成図であり、図5に示すように、この装置は、以下のモジュールを備える。
取得モジュール51は、ターゲットビデオフレームと前記ターゲットビデオフレームの前の複数の履歴ビデオフレームを取得する。
第1の決定モジュール52は、ターゲットビデオフレームおよび複数の履歴ビデオフレームの各ビデオフレームについて、設定された方向での前のビデオフレームに対する移動距離を決定する。
第2の決定モジュール53は、設定された方向での前のビデオフレームに対する各前記ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する。
第3の決定モジュール54は、設定された方向での前記ターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、前記ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。
さらに、本開示の実施例の実施形態では、第2の決定モジュール53は、さらに、各前記移動距離に基づいて、設定された順序に従って移動距離リストを生成し、前記設定された順序は、各前記ビデオフレームの生成順序を示し、前記移動距離リストに基づいて、移動距離の絶対値が設定された距離閾値よりも大きい第1の設定数の連続ビデオフレームを決定し、前記第1の設定数の連続ビデオフレームにおいて、移動距離の絶対値が極値である第2の設定数の候補ビデオフレームを決定し、前記第2の設定数は、前記第1の設定数よりも小さく、第3の決定ユニットは、設定された方向での前記第2の設定数の候補ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する。
本開示の実施例の実施形態では、第2の決定モジュール53は、さらに、前記第2の設定数の候補ビデオフレームにおいて、設定された方向での隣接する候補ビデオフレームの移動距離に基づいて、基準ビデオフレームを決定し、設定された方向での前記基準ビデオフレームの移動距離を、設定された方向での前記ターゲットビデオフレームのターゲット振幅とし、前記基準ビデオフレームと隣接する候補ビデオフレームとの間のフレーム差に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット周期を決定する。
本開示の実施例の実施形態では、第1の決定モジュール52は、さらに、各前記ビデオフレームについて、前記ビデオフレーム内の特徴点と前記ビデオフレームの前のビデオフレーム内の特徴点をマッチングし、前記ビデオフレーム内の第1のマッチング特徴点と前記ビデオフレームの前のビデオフレーム内の第2のマッチング特徴点を決定し、各前記第2のマッチング特徴点に対する各前記第1のマッチング特徴点の移動距離を決定し、前記第1のマッチング特徴点の数が、設定された特徴点の数よりも大きい場合、各前記第1のマッチング特徴点の移動距離の平均値を、前のビデオフレームに対する前記ビデオフレームの設定された方向での移動距離とする。
本開示の実施例の実施形態では、第1の決定モジュール52は、さらに、前記第1のマッチング特徴点のうち移動距離が設定距離よりも大きい第3のマッチング特徴点の数を集計し、前記第3のマッチング特徴点の数が第3の設定数よりも大きいか、または前記第1のマッチング特徴点の数に占める前記第3のマッチング特徴点の数の割合が第1の割合よりも大きいと決定される。
本開示の実施例の実施形態では、第3の決定モジュール54、さらに、前記ターゲットビデオフレームの後に取得された複数の連続ビデオフレームを取得し、設定された方向での前記連続ビデオフレーム内の各前記ビデオフレームの振幅と周期に基づいて、ジッタのある連続ビデオフレームの数を決定し、前記ジッタのある連続ビデオフレームの数が第1のフレームの数よりも大きい場合、前記ビデオにジッタがあると決定される。
本開示の実施例の実施形態では、前記設定された方向には水平方向及び/又は垂直方向が含まれる。
なお、前述の方法の実施例における説明は、本実施例の装置にも適用可能であり、原理は同じであり、本実施例では詳しく説明しない。
本開示の実施例のビデオジッタの検出装置では、ターゲットビデオフレームとターゲットビデオフレームの前の複数の履歴ビデオフレームを取得し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離を決定し、設定された方向での前のビデオフレームに対する各ビデオフレームの移動距離に基づいて、設定された方向でのターゲットビデオフレームのターゲット振幅およびターゲット周期を決定し、設定された方向でのターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される。本開示では、ビデオフレームのジッタ振幅と周期とに基づいてビデオフレームのジッタを決定することにより、ジッタの誤判定を回避し、ビデオのジッタ検出の精度を向上させる。
上記実施例を実現するために、本開示の実施例は、電子機器をさらに提供し、少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信可能に接続されたメモリと、を備え、前記メモリには、前記少なくとも1つのプロセッサによって実行される命令が記憶されており、前記命令は、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが上記の方法の実施例の前記方法を実行できる。
上記実施例を実現するために、本開示の実施例は、コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体をさらに提供し、ここで、前記コンピュータ命令は、コンピュータに上記の方法の実施例の前記方法を実行させる。
上記実施例を実現するために、本開示の実施例は、コンピュータプログラムをさらに提供し、前記コンピュータプログラムがプロセッサによって実行される場合、上記の方法の実施例の前記方法が実現される。
本開示の実施例によれば、本開示は、電子機器、読み取り可能な記憶媒体、及びコンピュータプログラムをさらに提供する。
図6は、本開示の実施例を実施するための例示的な電子機器600の概略ブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、携帯情報端末、サーバ、ブレードサーバ、メインフレームコンピュータ、及び他の適切なコンピュータなどの様々な形態のデジタルコンピュータを表すことを目のとする。電子機器は、パーソナルデジタルプロセシング、セルラー電話、スマートフォン、ウェアラブルデバイス、及び他の同様のコンピューティングデバイスなど、様々な形態のモバイルデバイスを表してもよい。本明細書に示されるコンポーネント、それらの接続及び関係、並びにそれらの機能は、単なる例であり、本明細書に記載及び/または求められる本願の実現を限定することを意図しない。
図6に示すように、電子機器600は、ROM(Read-Only Memory、リードオンリーメモリ)602に記憶されたコンピュータプログラム、または記憶ユニット608からRAM(Random Access Memory、ランダムアクセスメモリ)603にローディングされたコンピュータプログラムに基づいて、様々な適切な動作と処理を実行できる計算ユニット601を備える。RAM603には、電子機器600の動作に必要な各種のプログラム及びデータをさらに記憶することができる。計算ユニット601と、ROM602と、RAM603とは、バス604を介して互いに接続されている。I/O(Input/Output、入力/出力)インタフェース605もバス604に接続されている。
電子機器600における複数のコンポーネントは、I/Oインタフェース605に接続されており、その複数のコンポーネントは、キーボードやマウスなどの入力ユニット606と、種々なディスプレイやスピーカなどの出力ユニット607と、磁気ディスクや光学ディスクなどの記憶ユニット608と、ネットワークカード、モデム、無線通信トランシーバーなどの通信ユニット609と、を備える。通信ユニット609は、電子機器600がインターネットのようなコンピュータネット及び/または種々なキャリアネットワークを介して他の機器と情報/データを交換することを可能にする。
計算ユニット601は、処理及び計算能力を有する様々な汎用及び/または専用の処理コンポーネントであってもよい。計算ユニット601のいくつかの例としては、CPU(Central Processing Unit、中央処理ユニット)、GPU(Graphic Processing Units、グラフィックス処理ユニット)、様々な専用のAI(Artificial Intelligence、人工知能)計算チップ、様々な機械学習モデルアルゴリズムを実行する計算ユニット、DSP(Digital Signal Processor、デジタル信号プロセッサ)、及び任意の適切なプロセッサ、コントローラ、マイクロコントローラなどを備えるが、これらに限定されない。計算ユニット601は、上記で説明された各方法及び処理、例えば本開示の第1の態様の実施例に記載のビデオジッタの検出方法又は本開示の第2の態様の実施例に記載のビデオジッタの検出方法を実行する。例えば、いくつかの実施形態では、ビデオジッタの検出方法を、記憶ユニット608のような機械読み取り可能な媒体に有形的に含まれるコンピュータソフトウエアプログラムとして実現されてもよい。一部の実施形態では、コンピュータプログラムの一部または全ては、ROM602及び/または通信ユニット609を介して、電子機器600にロード及び/またはインストールされてもよい。コンピュータプログラムがRAM603にロードされて計算ユニット601によって実行される場合に、前述したビデオジッタの検出方法の一つまたは複数を実行することができる。代替的に、他の実施例では、計算ユニット601は、他の任意の適当な方式(例えば、ファームウェア)によりビデオジッタの検出方法を実行するように構成されてもよい。
ここで記載されているシステムまたは技術の各種の実施形態は、デジタル電サブ回路システム、集積回路システム、FPGA(Field Programmable Gate Array、フィールドプログラマブルゲートアレイ)、ASIC(Application-Specific Integrated Circuit、専用集積回路)、ASSP(Application Specific Standard Product、専用標準品)、SOC(System On Chip、システムオンチップ)、CPLD(Complex Programmable Logic Device、コンプレックスプログラマブルロジックデバイス)、コンピュータのハードウェア、ファームウェア、ソフトウェア、及び/またはこれらの組み合わせによって実現することができる。これらの各実施形態は、少なくとも1つのプログラマブルプロセッサを備えるプログラマブルシステムにて実行及び/または解釈される1つまたは複数のコンピュータプログラムにより実行することを含み得、当該プログラマブルプロセッサは、ストレージシステム、少なくとも1つの入力デバイス、及び少なくとも1つの出力デバイスからデータ及び命令を受け取り、データ及び命令を該ストレージシステム、当該少なくとも1つの入力デバイス、及び当該少なくとも1つの出力デバイスに転送することができる専用または汎用のプログラマブルプロセッサであってもよい。
本開示の方法を実施するためのプログラムコードは、1または複数のプログラミング言語の組み合わせで記述されていてもよい。これらのプログラムコードは、プロセッサ又はコントローラによって実行されるとされた際に、フローチャート及び/またはブロック図で規定された機能・動作が実施されるように、汎用コンピュータや専用コンピュータまたは他のプログラム可能な人間の画像復元装置のプロセッサやコントローラに提供されてもよい。プログラムコードは、機械上で完全に実行されるか、機械上で部分的に実行されるか、独立したソフトウェアパッケージとして機械上で部分的に実行されるとともにリモートマシン上で部分的に実行されるか、またはリモートマシンまたはサーバ上で完全に実行されてもよい。
本開示の文脈において、機械読み取り可能な媒体は、命令実行システム、装置またはデバイスによって使用されるために、または命令実行システム、装置またはデバイスと組み合わせて使用されるためのプログラムを含むか、または記憶することができる有形媒体であってもよい。機械読み取り可能な媒体は、機械読み取り可能な信号媒体であってもよいし、機械読み取り可能な記憶媒体であってもよい。機械読み取り可能な媒体としては、電子の、磁気の、光学の、電磁の、赤外線の、半導体システム、装置、デバイス、またはこれらの任意の適切な組み合わせが挙げられるが、これらに限定されない。機械読み取り可能な記憶媒体のより具体的な例としては、1または複数のラインに基づく電気の接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、EPROM(消去可能なプログラム可能なリードオンリメモリ)またはフラッシュメモリ、光ファイバ、CD-ROM(Compact Disc Read-Only Memory、ポータブルコンパクトディスク読み取り専用メモリ)、光記憶装置、磁気記憶装置、またはこれらの任意の適切な組み合わせが挙げられる。
ユーザとのインタラクションを提供するために、ここで説明されているシステム及び技術をコンピュータで実施することができ、当該コンピュータは、ユーザに情報を表示するためのディスプレイ装置(例えば、CRT(Cathode-Ray Tube、陰極線チューブ)またはLCD(Liquid Crystal Display、液晶ディスプレイ)モニタ)と、キーボード及びポインティングデバイス(例えば、マウスまたはトラックボール)とを有し、ユーザは、当該キーボード及び当該ポインティングデバイスによって入力をコンピュータに提供することができる。他の種類の装置も、ユーザとのインタラクションを提供するために用いられることができ、例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、任意の形式(音響入力と、音声入力と、触覚入力とを含む)でユーザからの入力を受信することができる。
ここで説明されるシステム及び技術は、バックエンドコンポーネントを備えるコンピューティングシステム(例えば、データサーバとする)、またはミドルウェアコンポーネントを備えるコンピューティングシステム(例えば、アプリケーションサーバー)、またはフロントエンドコンポーネントを備えるコンピューティングシステム(例えば、グラフィカルユーザインタフェースまたはウェブブラウザを有するユーザコンピュータであり、ユーザは、当該グラフィカルユーザインタフェースまたは当該ウェブブラウザによってここで説明されるシステム及び技術の実施形態とインタラクションする)、またはこのようなバックエンドコンポーネントと、ミドルウェアコンポーネントと、フロントエンドコンポーネントの任意の組み合わせを備えるコンピューティングシステムで実施することができる。任意の形式または媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムのコンポーネントを互いに接続することができる。通信ネットワークの例は、LAN(Local Area Network、ローカルエリアネットワーク)と、WAN(Wide Area Network、ワイドエリアネットワーク)と、インターネットと、ブロックチェーンネットワークとを含む。
コンピュータシステムは、クライアントとサーバとを備えることができる。クライアントとサーバは、一般的に、互いに離れており、通常に通信ネットワークを介してインタラクションする。対応するコンピュータで実行され、互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバとの関係が生成される。ここで、サーバはクラウドサーバであってもよく、クラウドコンピューティングサーバまたはクラウドホストとも呼ばれ、クラウドコンピューティングサービス体系のうちのホスト製品であり、従来の物理ホストとVPSサービス(「Virtual Private Server」、また、「VPS」と略記する)では、管理が難しく、業務拡張性が弱いという欠点を解決している。サーバーは、分散システムのサーバー、またはブロックチェーンを結合したサーバーであってもよい。
ここで、人工知能は、コンピュータに人間のある思考過程及び知能行為(例えば、学習、推論、考え、計画など)をシミュレーションさせることを研究する学科であり、ハードウェアレベルの技術とソフトウェアレベルの技術との両方がある。人工知能ハードウェア技術は、一般に、コンピュータビジョン技術、音声認識技術、自然言語処理技術及び学習/深層学習、ビッグデータ処理技術、ナレッジグラフ技術などのいくつかの態様を含む。
なお、上記のした様々な形態のフローを用いて、ステップを並び替え、追加または削除を行うことができることを理解されるべきである。例えば、本開示に記載された各ステップは、本願に開示された技術案の所望の結果が達成できる限り、並列に実行されてもよいし、順番に実行されてもよいし、異なる順序で実行されてもよい。本明細書は制限されない。
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な修正、組み合わせ、サブ組合、及び代替を行うことができることは理解される。本願の精神及び原理内で行われたあらゆる修正、同などの置換及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。

Claims (17)

  1. ターゲットビデオフレームと前記ターゲットビデオフレームの前の複数の履歴ビデオフレームを取得するステップと、
    前記ターゲットビデオフレームおよび前記複数の履歴ビデオフレームの各前記ビデオフレームについて、設定された方向での前のビデオフレームに対する移動距離を決定するステップと、
    設定された方向での前のビデオフレームに対する各前記ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定するステップと、
    設定された方向での前記ターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、前記ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定されるステップと、
    を含む、ビデオジッタの検出方法。
  2. 前記設定された方向での前のビデオフレームに対する各前記ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定するステップが、
    各前記移動距離に基づいて、設定された順序に従って移動距離リストを生成するステップであって、前記設定された順序は、各前記ビデオフレームの生成順序を示すステップと、
    前記移動距離リストに基づいて、移動距離の絶対値が設定された距離閾値よりも大きい第1の設定数の連続ビデオフレームを決定するステップと、
    前記第1の設定数の連続ビデオフレームにおいて、移動距離の絶対値が極値である第2の設定数の候補ビデオフレームを決定するステップであって、前記第2の設定数は、前記第1の設定数よりも小さいステップと、
    設定された方向での前記第2の設定数の候補ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定するステップと、
    を含む請求項1に記載の方法。
  3. 前記設定された方向での前記第2の設定数の候補ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定するステップが、
    前記第2の設定数の候補ビデオフレームにおいて、設定された方向での隣接する候補ビデオフレームの移動距離に基づいて、基準ビデオフレームを決定するステップと、
    設定された方向での前記基準ビデオフレームの移動距離を、設定された方向での前記ターゲットビデオフレームのターゲット振幅とするステップと、
    前記基準ビデオフレームと隣接する候補ビデオフレームとの間のフレーム差に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット周期を決定するステップと、
    を含む請求項2に記載の方法。
  4. 前記ターゲットビデオフレームおよび前記複数の履歴ビデオフレームの各前記ビデオフレームについて、設定された方向での前のビデオフレームに対する移動距離を決定するステップが、
    各前記ビデオフレームについて、前記ビデオフレーム内の特徴点と前記ビデオフレームの前のビデオフレーム内の特徴点をマッチングし、前記ビデオフレーム内の第1のマッチング特徴点と前記ビデオフレームの前のビデオフレーム内の第2のマッチング特徴点を決定するステップと、

    各前記第2のマッチング特徴点に対する各前記第1のマッチング特徴点の移動距離を決定するステップと、
    前記第1のマッチング特徴点の数が、設定された特徴点の数よりも大きい場合、各前記第1のマッチング特徴点の移動距離の平均値を、前のビデオフレームに対する前記ビデオフレームの設定された方向での移動距離とするステップと、
    を含む請求項1に記載の方法。
  5. 前記各前記第1のマッチング特徴点の移動距離の平均値を、前のビデオフレームに対する前記ビデオフレームの設定された方向での移動距離とするステップの前に、
    前記第1のマッチング特徴点のうち移動距離が設定距離よりも大きい第3のマッチング特徴点の数を集計するステップと、
    前記第3のマッチング特徴点の数が第3の設定数よりも大きいか、または前記第1のマッチング特徴点の数に占める前記第3のマッチング特徴点の数の割合が第1の割合よりも大きいと決定されるステップと、
    を含む請求項4に記載の方法。
  6. 前記ビデオにジッタがあると判断されるステップが、
    前記ターゲットビデオフレームの後に取得された複数の連続ビデオフレームを取得するステップと、
    設定された方向での前記連続ビデオフレーム内の各前記ビデオフレームの振幅と周期に基づいて、ジッタのある連続ビデオフレームの数を決定するステップと、
    前記ジッタのある連続ビデオフレームの数が第1のフレームの数よりも大きい場合、前記ビデオにジッタがあると決定されるステップと、
    を含む請求項1から5のいずれか一項に記載の方法。
  7. 前記設定された方向には、水平方向及び/又は垂直方向が含まれる請求項1から5のいずれか一項に記載の方法。
  8. ターゲットビデオフレームと前記ターゲットビデオフレームの前の複数の履歴ビデオフレームを取得する取得モジュールと、
    前記ターゲットビデオフレームおよび前記複数の履歴ビデオフレームの各前記ビデオフレームについて、設定された方向での前のビデオフレームに対する移動距離を決定する第1の決定モジュールと、
    設定された方向での前のビデオフレームに対する各前記ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する第2の決定モジュールと、
    設定された方向での前記ターゲットビデオフレームのターゲット振幅が設定された振幅より大きく、前記ターゲット周期が設定された周期よりも小さい場合、ビデオにジッタがあると決定される第3の決定モジュールと、
    を備える、ビデオジッタの検出装置。
  9. 前記第2の決定モジュールが、
    各前記移動距離に基づいて、設定された順序に従って移動距離リストを生成し、前記設定された順序は、各前記ビデオフレームの生成順序を示し、
    前記移動距離リストに基づいて、移動距離の絶対値が設定された距離閾値よりも大きい第1の設定数の連続ビデオフレームを決定し、
    前記第1の設定数の連続ビデオフレームにおいて、移動距離の絶対値が極値である第2の設定数の候補ビデオフレームを決定し、前記第2の設定数は、前記第1の設定数よりも小さく、
    第3の決定ユニットは、設定された方向での前記第2の設定数の候補ビデオフレームの移動距離に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット振幅およびターゲット周期を決定する請求項8に記載の装置。
  10. 前記第2の決定モジュールが、
    前記第2の設定数の候補ビデオフレームにおいて、設定された方向での隣接する候補ビデオフレームの移動距離に基づいて、基準ビデオフレームを決定し、
    設定された方向での前記基準ビデオフレームの移動距離を、設定された方向での前記ターゲットビデオフレームのターゲット振幅とし、
    前記基準ビデオフレームと隣接する候補ビデオフレームとの間のフレーム差に基づいて、設定された方向での前記ターゲットビデオフレームのターゲット周期を決定する請求項9に記載の装置。
  11. 前記第1の決定モジュールが、
    各前記ビデオフレームについて、前記ビデオフレーム内の特徴点と前記ビデオフレームの前のビデオフレーム内の特徴点をマッチングし、前記ビデオフレーム内の第1のマッチング特徴点と前記ビデオフレームの前のビデオフレーム内の第2のマッチング特徴点を決定し、

    各前記第2のマッチング特徴点に対する各前記第1のマッチング特徴点の移動距離を決定し、

    前記第1のマッチング特徴点の数が、設定された特徴点の数よりも大きい場合、各前記第1のマッチング特徴点の移動距離の平均値を、前のビデオフレームに対する前記ビデオフレームの設定された方向での移動距離とする請求項8に記載の装置。
  12. 前記第1の決定モジュールが、
    前記第1のマッチング特徴点のうち移動距離が設定距離よりも大きい第3のマッチング特徴点の数を集計し、
    前記第3のマッチング特徴点の数が第3の設定数よりも大きいか、または前記第1のマッチング特徴点の数に占める前記第3のマッチング特徴点の数の割合が第1の割合よりも大きいと決定される請求項11に記載の装置。
  13. 前記第3の決定モジュールが、
    前記ターゲットビデオフレームの後に取得された複数の連続ビデオフレームを取得し、
    設定された方向での前記連続ビデオフレーム内の各前記ビデオフレームの振幅と周期に基づいて、ジッタのある連続ビデオフレームの数を決定し、
    前記ジッタのある連続ビデオフレームの数が第1のフレームの数よりも大きい場合、前記ビデオにジッタがあると決定される請求項8から12のいずれか一項に記載の装置。
  14. 前記設定された方向には、水平方向及び/又は垂直方向が含まれる請求項8から12のいずれか一項に記載の装置。
  15. 少なくとも1つのプロセッサと、
    該少なくとも1つのプロセッサと通信可能に接続されたメモリと、
    を備え、
    前記メモリには、前記少なくとも1つのプロセッサによって実行される命令が記憶されており、前記命令が、前記少なくとも1つのプロセッサによって実行される場合、前記少なくとも1つのプロセッサが請求項1から5のいずれか一項に記載の方法を実行できる電子機器。
  16. コンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体であって、
    前記コンピュータ命令が、コンピュータに請求項1から5のいずれか一項に記載の方法を実行させる非一時的なコンピュータ読み取り可能な記憶媒体。
  17. コンピュータプログラムがプロセッサによって実行される場合、請求項1から5のいずれか一項に記載の方法が実現されるコンピュータプログラム。
JP2022127538A 2021-09-18 2022-08-10 ビデオジッタの検出方法、装置、電子機器および記憶媒体 Pending JP2022160646A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202111112132.XA CN113691733B (zh) 2021-09-18 2021-09-18 视频抖动检测方法、装置、电子设备和存储介质
CN202111112132.X 2021-09-18

Publications (1)

Publication Number Publication Date
JP2022160646A true JP2022160646A (ja) 2022-10-19

Family

ID=78587029

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022127538A Pending JP2022160646A (ja) 2021-09-18 2022-08-10 ビデオジッタの検出方法、装置、電子機器および記憶媒体

Country Status (5)

Country Link
US (1) US20230013170A1 (ja)
EP (1) EP4145844A1 (ja)
JP (1) JP2022160646A (ja)
KR (1) KR20220126264A (ja)
CN (1) CN113691733B (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114339395A (zh) * 2021-12-14 2022-04-12 浙江大华技术股份有限公司 视频抖动检测方法、检测装置、电子设备和可读存储介质
CN114298992A (zh) * 2021-12-21 2022-04-08 北京百度网讯科技有限公司 一种视频帧去重方法、装置、电子设备及存储介质
CN114494328B (zh) * 2022-02-11 2024-01-30 北京字跳网络技术有限公司 图像显示方法、装置、电子设备及存储介质
CN114640754B (zh) * 2022-03-08 2024-06-14 京东科技信息技术有限公司 视频抖动检测方法、装置、计算机设备及存储介质
CN114531549B (zh) * 2022-04-22 2022-08-09 浙江大华技术股份有限公司 图像采集方法、电子设备和计算机可读存储介质
CN117750203A (zh) * 2024-02-20 2024-03-22 荣耀终端有限公司 电子设备及其视频处理方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005102082A (ja) * 2003-09-26 2005-04-14 Mitsubishi Electric Corp 画像空間安定化方法
JP2007096481A (ja) * 2005-09-27 2007-04-12 Matsushita Electric Ind Co Ltd 撮像装置および撮像システム
JP2007267115A (ja) * 2006-03-29 2007-10-11 Seiko Epson Corp 手ぶれ補正装置、それを用いた撮影装置、手ぶれ補正方法、手ぶれ補正プログラム、及び手ぶれ補正プログラムの記録媒体
JP2008118638A (ja) * 2006-11-02 2008-05-22 Seiko Epson Corp デジタル・ビデオ・シーケンスにおける2つのビデオ・フレーム間のジッタを推定する方法、デジタル・ビデオ・シーケンスにおける2つのビデオ・フレーム間のジッタを推定する装置、およびデジタル・ビデオ・シーケンスにおける2つのビデオ・フレーム間のジッタを推定するコンピュータ・プログラムを具現するコンピュータが読み取り可能な媒体
JP2010025963A (ja) * 2008-07-15 2010-02-04 Canon Inc 防振制御装置及び撮像装置
JP2011082901A (ja) * 2009-10-09 2011-04-21 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2011097512A (ja) * 2009-11-02 2011-05-12 Canon Inc 画像処理装置、画像処理方法、及びコンピュータプログラム
CN104135597A (zh) * 2014-07-04 2014-11-05 上海交通大学 一种视频抖动自动检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5822430B2 (ja) * 2008-11-28 2015-11-24 キヤノン株式会社 像振れ補正装置およびそれを有する撮像装置
CN103763461B (zh) * 2013-12-31 2015-06-10 合一网络技术(北京)有限公司 一种视频抖动检测方法及装置
CN107958462A (zh) * 2017-11-20 2018-04-24 江西服装学院 一种视频抖动判定方法及装置
CN110740247B (zh) * 2018-07-18 2021-10-08 腾讯科技(深圳)有限公司 视频增稳方法、装置、计算机设备及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005102082A (ja) * 2003-09-26 2005-04-14 Mitsubishi Electric Corp 画像空間安定化方法
JP2007096481A (ja) * 2005-09-27 2007-04-12 Matsushita Electric Ind Co Ltd 撮像装置および撮像システム
JP2007267115A (ja) * 2006-03-29 2007-10-11 Seiko Epson Corp 手ぶれ補正装置、それを用いた撮影装置、手ぶれ補正方法、手ぶれ補正プログラム、及び手ぶれ補正プログラムの記録媒体
JP2008118638A (ja) * 2006-11-02 2008-05-22 Seiko Epson Corp デジタル・ビデオ・シーケンスにおける2つのビデオ・フレーム間のジッタを推定する方法、デジタル・ビデオ・シーケンスにおける2つのビデオ・フレーム間のジッタを推定する装置、およびデジタル・ビデオ・シーケンスにおける2つのビデオ・フレーム間のジッタを推定するコンピュータ・プログラムを具現するコンピュータが読み取り可能な媒体
JP2010025963A (ja) * 2008-07-15 2010-02-04 Canon Inc 防振制御装置及び撮像装置
JP2011082901A (ja) * 2009-10-09 2011-04-21 Canon Inc 画像処理装置、画像処理方法及びプログラム
JP2011097512A (ja) * 2009-11-02 2011-05-12 Canon Inc 画像処理装置、画像処理方法、及びコンピュータプログラム
CN104135597A (zh) * 2014-07-04 2014-11-05 上海交通大学 一种视频抖动自动检测方法

Also Published As

Publication number Publication date
EP4145844A1 (en) 2023-03-08
CN113691733B (zh) 2023-04-18
CN113691733A (zh) 2021-11-23
US20230013170A1 (en) 2023-01-19
KR20220126264A (ko) 2022-09-15

Similar Documents

Publication Publication Date Title
JP2022160646A (ja) ビデオジッタの検出方法、装置、電子機器および記憶媒体
US20220383535A1 (en) Object Tracking Method and Device, Electronic Device, and Computer-Readable Storage Medium
US9396523B2 (en) Image restoration cascade
Ma et al. Towards a universal model for cross-dataset crowd counting
CN112597837B (zh) 图像检测方法、装置、设备、存储介质和计算机程序产品
CN110659600B (zh) 物体检测方法、装置及设备
JP7273129B2 (ja) 車線検出方法、装置、電子機器、記憶媒体及び車両
CN113177472B (zh) 动态手势识别方法、装置、设备以及存储介质
US10430966B2 (en) Estimating multi-person poses using greedy part assignment
JP7297989B2 (ja) 顔生体検出方法、装置、電子機器及び記憶媒体
CN112994980B (zh) 时延测试方法、装置、电子设备和存储介质
CN111462174A (zh) 多目标跟踪方法、装置以及电子设备
CN112488060B (zh) 目标检测方法、装置、设备和介质
CN116403083A (zh) 图像的处理方法、装置、电子设备及存储介质
CN108734718B (zh) 用于图像分割的处理方法、装置、存储介质及设备
CN112580563A (zh) 视频摘要的生成方法、装置、电子设备和存储介质
JPWO2018179119A1 (ja) 映像解析装置、映像解析方法およびプログラム
CN113628192B (zh) 图像模糊检测方法、装置、设备、存储介质及程序产品
CN114120180B (zh) 一种时序提名的生成方法、装置、设备及介质
CN115937950A (zh) 一种多角度人脸数据采集方法、装置、设备及存储介质
CN112183484B (zh) 一种图像处理方法、装置、设备以及存储介质
CN111967299B (zh) 无人机巡检方法、装置、设备及存储介质
CN114093006A (zh) 活体人脸检测模型的训练方法、装置、设备以及存储介质
CN113361455A (zh) 人脸鉴伪模型的训练方法、相关装置及计算机程序产品
CN113657209B (zh) 动作识别方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220810

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230829

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20240326