JP2015507796A - 動き推定を用いたオブジェクト検出 - Google Patents

動き推定を用いたオブジェクト検出 Download PDF

Info

Publication number
JP2015507796A
JP2015507796A JP2014549288A JP2014549288A JP2015507796A JP 2015507796 A JP2015507796 A JP 2015507796A JP 2014549288 A JP2014549288 A JP 2014549288A JP 2014549288 A JP2014549288 A JP 2014549288A JP 2015507796 A JP2015507796 A JP 2015507796A
Authority
JP
Japan
Prior art keywords
frame
region
object detection
logic
motion estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014549288A
Other languages
English (en)
Other versions
JP5908605B2 (ja
Inventor
リー,チアーン
チウ,イー−ジェン
プオン,ヤー−ティー
ドゥ,ヤーンジョウ
リー,ジアーングオ
Original Assignee
インテル コーポレイション
インテル コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by インテル コーポレイション, インテル コーポレイション filed Critical インテル コーポレイション
Publication of JP2015507796A publication Critical patent/JP2015507796A/ja
Application granted granted Critical
Publication of JP5908605B2 publication Critical patent/JP5908605B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/223Analysis of motion using block-matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • G06T7/248Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/14Picture signal circuitry for video frequency region
    • H04N5/144Movement detection
    • H04N5/145Movement estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Signal Processing (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Analysis (AREA)
  • Picture Signal Circuits (AREA)

Abstract

動き推定を用いてオブジェクトを検出するシステム及び方法は、プロセッサと、該プロセッサに結合される動き推定及びオブジェクト検出ロジックと、を有しても良い。動き推定及びオブジェクト検出ロジックは、動き推定に基づきビデオのフレーム内のオブジェクトを検出するロジックを有するよう構成されても良い。ビデオは、第1のフレーム及び第2のフレームを有しても良い。動き推定は、第2のフレームの領域と対応する第1のフレームの領域との間の絶対差差を用いて第2のフレームの領域に対して実行されても良い。

Description

本発明は、動き推定を用いたオブジェクト検出に関する。
自然画像及ビデオにおける信頼できるリアルタイムオブジェクト検出及び認識は、視覚探索において重要である。ビデオ内のオブジェクト追跡の1つのアプローチは、各ビデオフレーム内で完全なオブジェクト検出を実行することである。しかしながら、このアプローチは、非常に計算負荷が高い。
本発明は、動き推定を用いてオブジェクトを検出する装置、方法、システムに関する。
本発明の実施形態の種々の利点は、以下の詳細な説明及び添付の請求の範囲を読むことにより、及び以下の図面を参照することにより、当業者に明らかになるだろう。
幾つかの実施形態による例示的なコンピュータシステムを示すブロック図である。 幾つかの実施形態による、画像をスキャンするためにスライディングウインドウを使用する一例を示すブロック図である。 幾つかの実施形態による例示的なビデオ動き推定尾及び検出システムを示すブロック図である。 幾つかの実施形態による例示的なマクロブロックを示すブロック図である。 幾つかの実施形態による例示的なフレーム領域を示す。 幾つかの実施形態による動き推定及びオブジェクト検出の例示的な方法のフローチャートである。 幾つかの実施形態による動き推定及びオブジェクト検出を実行するために絶対差和(sum of absolute difference:SAD)を用いる例示的な方法のフローチャートである。 幾つかの実施形態による例示的なコンピュータシステムを示す。 幾つかの実施形態による例示的な小さな形状因子の装置を示す。
実施形態は、第1のフレームと第2のフレームとを有するビデオの第2のフレームの領域に対して動き推定を実行するロジックを有する装置に関する。装置は、第2のフレームの領域に対する動き推定に基づき、第2のフレームの領域に対してオブジェクト検出を実行するか否かを決定するロジックも有しても良い。動き推定は、絶対差和を実行するロジックに基づいても良い。オブジェクト検出は、分類関数に基づいても良い。
実施形態は、プロセッサ、及び該プロセッサに結合される動き推定及びオブジェクト検出ロジックを有し得るシステムに関する。動き推定及びオブジェクト検出ロジックは、動き推定に基づきビデオのフレーム内のオブジェクトを検出するロジックを有するよう構成されても良い。ビデオは、第1のフレーム及び第2のフレームを有しても良い。動き推定は、第2のフレームの領域と対応する第1のフレームの領域との間の絶対差差を用いて第2のフレームの領域に対して実行されても良い。絶対差和は、第2のフレームの領域と対応する第1のフレームの領域に含まれるマクロブロックに対して実行されても良い。第2のフレームは、ビデオ内の第1のフレームの後続のフレームであっても良い。
実施形態は、第1のフレームに含まれるオブジェクトを検出するために、ビデオの第1のフレームの複数の領域に対してオブジェクト検出を実行するステップを含み得る方法を実施するコンピュータに関する。方法は、ビデオの第2のフレームの領域に対して動き推定を実行するステップと、第2のフレームの領域に対する動き推定に基づき第2のフレームの領域に対してオブジェクト検出を実行するか否かを決定するステップと、を更に有しても良い。第2のフレームは、ビデオ内の第1のフレームに続いても良い。オブジェクト検出は、分類関数に基づいて実行されても良い。
実施形態は、プロセッサと、該プロセッサに結合される外部電源と、該プロセッサに結合される動き推定及びオブジェクト検出ロジックと、を有し得るシステムに関する。動き推定及びオブジェクト検出ロジックは、動き推定に基づきビデオのフレーム内のオブジェクトを検出するロジックを有するよう構成されても良い。ビデオは、第1のフレーム及び第2のフレームを有しても良い。動き推定は、第2のフレームの領域と対応する第1のフレームの領域との間の絶対差差を用いて第2のフレームの領域に対して実行されても良い。
図1は、幾つかの実施形態による例示的なコンピュータシステム100を示すブロック図である。コンピュータシステム100は、中央演算処理装置(central processing unit:CPU)と、グラフィック及びメモリ制御ハブ(graphics and memory controller hub:GMCH)110と、入力/出力制御ハブ(input/output controller hub:ICH)125と、を有しても良い。GMCH110は、バス107を介してCPU105に結合されても良い。ICH125は、バス122を介してGMCH110に結合されても良い。GMCH110は、メモリ装置115及びディスプレイ装置120にも結合されても良い。ICH125は、I/O装置130に結合されても良い。GMCH110は、グラフィックシステム200(図2に示す)を有しても良い。CPU105、GMCH110及びICH125は、別個のコンポーネントとして図示されるが、これらのコンポーネントのうちの2以上の機能は結合されても良い。電源150は、コンピュータシステム100に電力を供給するために用いられても良い。電源150は、バッテリ又は外部電源であっても良い。コンピュータシステム100は、多くの他のコンポーネントを有しても良いが、簡単のためそれらは示されない。
図2は、画像をスキャンするために例示的なスライディングウインドウ200を用いることを示すブロック図を示す。スライディングウインドウは、画像内でオブジェクト検出及び認識を実行するために用いられ得る技術である。スライディングウインドウ技術は、オブジェクトを検出するために用いられ得る分類関数と関連し得る。オブジェクトは、最大分類スコアが閾を超えるとき、画像内に存在すると決定されても良い。例えば、スライディングウインドウ200は、左上位置から右下位置へと画像201をスキャンするために用いられても良い。画像201では、スライディングウインドウ200は、サブ画像205〜26−をスキャンしても良い。スライディングウインドウ200は、異なるサイズを有しても良い。例えば、スライディングウインドウ200は、16ピクセル×16ピクセルであっても良い。通常、サブ画像の数は、サイズN×Nを有する画像では、Nの4乗まで、Nだけ増大し得る。例えば、サブ画像の数は、10億個より多くても良い。オブジェクト検出に関連する動作は、各サブ画像について実行される必要がある。つまり、スライディングウインドウ200が小さいほど、実行する必要のある計算の数が多い。その結果、全てのサブ画像について徹底的に分類関数を評価することは計算的に非常に高価になり得る。計算コストは、オブジェクトを検出するためにスライディングウインドウ技術がビデオの複数のフレームに適用されるとき、非常に高価になり得る。例えば、25Hz/30Hzビデオでは、ビデオ内でオブジェクト検出を実行するための計算コストは、単一画像についてオブジェクト検出を実行する場合の10倍になり得る。
図3は、幾つかの実施形態による例示的なビデオ動き推定及び検出システム300を示すブロック図である。動き推定及び検出システム300は、動き推定ロジック305と、オブジェクト検出ロジック310と、スライディングウインドウロジック325と、ビデオ処理ロジック330と、を有しても良い。動き推定ロジック305は、絶対差和ロジック315を有しても良い。オブジェクト検出ロジック310は、分類関数ロジック320を有しても良い。
幾つかの実施形態では、スライディングウインドウロジック325は、異なるサイズのスライディングウインドウを設定するよう構成されても良い。例えば、小さいスライディングウインドウは、ビデオフレーム内の小さいオブジェクトを検出するためにビデオフレームをスキャンするために用いられても良い。一方、大きいスライディングウインドウは、ビデオフレーム内の大きいオブジェクトを検出するために用いられても良い。ビデオフレームは、ビデオ処理ロジック330により受信されても良い。幾つかの実施形態では、異なるサイズのスライディングウインドウは、第1のフレームについて完全なスキャンを実行するために用いられても良い。完全なスキャンは、小さいオブジェクトと大きいオブジェクトの両方を検出するために、異なるサイズを有するスライディングウインドウを用いて複数回実行されても良い。後続のフレームでは、完全なスキャンを実行する代わりに、動き推定ロジック305が、計算コストを低減するために用いられても良い。
スライディングウインドウによりカバーされ得るフレームの領域は、領域として参照される。例えば、ビデオグラフィックアレイ(VGA)サイズのビデオ入力では、スライディングウインドウは、フレームの領域をカバーし得る20×20ピクセルの最小サイズから、フレーム全体をカバーし得る480×480ピクセルの最大サイズまで変化しても良い。
分類関数ロジック320は、オブジェクトがスライディングウインドウによりカバーされるフレームの領域内に存在するか否かを検出するよう構成されても良い。分類関数ロジック320は、最大分類スコアに基づき検出動作を実行しても良い。幾つかの実施形態では、分類関数ロジック320は、第1のフレームの各領域についてオブジェクト検出を実行するために用いられても良い。更に詳細に記載するように、分類関数ロジック320は、特定の条件が満たされた場合、後続のフレームの幾つかの領域についてオブジェクト検出を実行するために用いられても良い。
動き推定ロジック305は、現在フレームと先行フレームとを比べたとき、特定の領域内で動きがあったか否かを決定するよう構成されても良い。動き推定ロジック305の動作は、ビデオ符号化で通常用いられる動きベクトル情報及び各マクロブロック(図4に示す)の絶対差和(SAD)に基づいても良い。
連続フレーム内の画像の殆どは実質的に同様であるので、動き推定ロジック305は、ビデオの連続フレーム内の画像間の時間的冗長性を除去するよう構成されても良い。これは、符号化効率を向上させるために、現在フレームの動きベクトル情報を見付けるために、先行フレームに含まれる情報を再利用することを可能にし得る。幾つかの実施形態では、動き推定ロジック305は、現在フレームが先行フレームの対応する領域と同様であるかどうかを決定するために、SADロジック315を用いても良い。
オブジェクト検出ロジック310は、現在フレームの領域内のオブジェクトを検出するよう構成されても良い。例えば、特定の条件が満たされたとき、オブジェクト検出ロジック310は、領域内のオブジェクトを検出するために分類関数ロジック320を適用しても良い。
図4は、幾つかの実施形態によるマクロブロックの例を示す。マクロブロック(MB)は、動き推定のための基本的要素であり、符号化のために用いられても良い。マクロブロックは16×16ピクセルであっても良い。本例では、スライディングウインドウ200は、9個のマクロブロック405乃至445を含む領域(斜線を付した長方形により示す)を覆う。通常、現在フレームに関連するマクロブロックは、先行フレームに関連する(同じMBサイズを有する)領域と同様であり、該マクロブロックは現在フレームのために符号化される必要がない。先行フレームからの同様の画像領域についての符号化情報は、再利用されても良い。
SADロジック315(図3)は、マクロブロックに関連するSAD及び領域に関連するSADを決定するよう構成されても良い。SADロジック315は、現在フレームの1つのマクロブロック内の各ピクセルと、先行フレームの別のマクロブロック内の対応するピクセルとの間の絶対差を決定するよう構成されても良い。差は、ブロック類似性のメトリックを生成するために加算されても良い。類似性を決定するために、閾が用いられても良い。
幾つかの実施形態では、マクロブロック405乃至445からのSADは、累算され、マクロブロック405乃至445が関連し得る領域のSADとして用いられても良い。次に、領域のSADは、マクロブロックの数に比例し得る閾と比較されても良い。領域のSADが閾より大きいとき、これは、スライディングウインドウ200により覆われる現在フレームの領域が先行フレームの対応する領域に一致しないことを示し得る。この状況では、現在フレームの領域についてオブジェクト検出を実行するために分類関数を用いる必要がある。例えば、先行フレームの領域はオブジェクトを含まないが、現在フレームの対応する領域はオブジェクトを含み得る。別の例として、先行フレームの領域は第1の位置にオブジェクトを含み、現在フレームの対応する領域は第2の位置にオブジェクトを含んでも良い。これは、オブジェクトが動きを通じて行ってしまったこと、したがって現在フレーム内で検出される必要がないことを示し得る。領域のSADが閾より小さいとき、これは、先行フレームの対応する領域からの符号化情報を再利用することが可能であり得る。例えば、先行フレーム内の領域がオブジェクトを含まない場合、現在フレームの対応する領域は、オブジェクトを含まないと考えられても良い。
図5は、幾つかの実施形態による例示的な領域を示す。領域500、520、540は先行フレームに関連付けられ、領域510、530、550は現在フレームに関連付けられても良い。領域500及び510は、両領域が異なる位置に同じオブジェクト505を含む状況を説明するために用いることができる。第2の位置は第1の位置にとても近い(又は殆ど同じ)なので、領域510のSADは閾より小さくても良い。領域510のサンプルエリア(例えば、中心点)が決定され、該サンプルエリアが領域505内に位置するか否かが検証されても良い。これは、オブジェクト505の追跡と似ている。幾つかの実施形態では、領域510のサンプルエリアが領域505にも存在するとき、分類関数ロジック320(図3)は領域510に適用できる。
領域520及び530は、オブジェクト525が領域530に含まれるが、オブジェクト525が領域520に含まれなかった状況を説明するために用いることができる。領域530のSADは閾より大きく、分類関数ロジック320が領域530に適用されても良い。オブジェクト525が領域520に含まれるが領域530に含まれないとき、状況は逆転しても良い。領域530のSADは閾より大きく、分類関数ロジック320が領域530に適用されても良い。領域540及び550は、領域540及び550にオブジェクトが存在しない状況を説明するために用いることができる。領域550のSADは閾より小さく、分類関数ロジック320が領域550に適用される必要はない。
図6Aは、幾つかの実施形態による動き推定及びオブジェクト検出の方法600を示す。方法600は、図3の動き推定及びオブジェクト検出システムに関連しても良い。方法600は、ビデオのフレームに適用されても良い。
ブロック605で、ビデオの第1のフレームが受信されても良い。ブロック610で、第1のフレーム内のオブジェクトを検出するために、異なるサイズのスライディングウインドウが用いられても良い。ブロック615で、スライディングウインドウを用いて第1のフレーム内のオブジェクトを検出するために、分類関数が用いられても良い。ブロック620で、ビデオの第2のフレームが受信される。ブロック625で、第2のフレーム内にないオブジェクトは、第2のフレームと第1のフレームとの間の動き推定を用いて検出されても良い。
図6Bは、幾つかの実施形態による動き推定及びオブジェクト検出を実行するために、絶対差和(sum of absolute difference:SAD)を用いる方法650を示す。方法650は、フレームの領域に適用されても良い。ブロック655で、現在フレームの領域と先行フレームの対応する領域とに基づく動きベクトル情報及びSADが決定されても良い。領域のSADは、領域に含まれるマクロブロックのSADに基づいても良い。ブロック660で、SADは閾と比較されても良い。SADが閾より大きい場合、処理はブロック655へと続き、現在フレームの領域内のオブジェクトを検出するために分類関数が実行されても良い。例えば、この状況は、現在フレームの領域内にオブジェクトが存在するが、先行フレームの対応する領域内にオブジェクトが存在しないときに生じ得る。
ブロック660から、SADが閾より小さい又は等しい場合、処理はブロック670へと続き、現在フレームの領域のサンプルエリア(例えば、中心点)が先行フレームの対応する領域内で見付かるか否かを決定するためにテストが実行されても良い。サンプルエリアが先行フレームの対応する領域内にもある場合、処理はブロック665へと続き、現在フレームの領域内のオブジェクトを検出するために分類関数が適用されても良い。例えば、この状況は、現在フレームの領域内にオブジェクトが存在し、且つ該オブジェクトが先行フレームの対応する領域内にも場合によっては動きによる僅かな差を有し存在するときに生じ得る。
代替で、ブロック670から、処理はブロック675へと続き、先行フレームの対応する領域の符号化情報が現在フレームのために再利用されても良い。例えば、この状況は、現在フレームと先行フレームの両方の同じ領域がオブジェクトを含まないときに生じ得る。方法600及び650は、オブジェクトを含まない領域に対して分類関数を実行する必要をなくすことができる。方法650は、現在フレームの全ての領域について繰り返されても良い。
本発明の実施形態は、各ビデオフレームについて完全な検出が実行された場合と同じ精度を保ちながら、少ない領域を評価することにより、オブジェクト検出動作の実行を大幅に向上できる。本発明の実施形態は、新しいオブジェクトがビデオ内に現れない限りビデオ背景の大部分の領域がオブジェクトの無い領域であり且つそれらが時間と共に有意に変化しない、ビデオカメラが使用され得るビデオ関連アプリケーション(例えば、ビデオ会議、ビデオ監視、等)にとって有用である。本発明の実施形態は、ビデオフレームのスケーリングの必要なしに、生ビデオに直接適用できる。スケーリングが必要なとき、グラフィック制御部は、一定のスケーリングファクタでビデオフレームのチェーンを維持する必要がある。各々のスケーリングされたビデオフレームは、自身の動き情報に関連付けられる必要があっても良い。本発明の実施形態は、ソフトウェア、ハードウェア、又は両者の組み合わせで実行されても良い。幾つかの実施形態では、SADロジック315(図3)の動作又はブロック655で実行される動作は、性能を向上し動き推定コストを低減するために、ハードウェアで実行されても良い。例えば、特定のグラフィック制御部は、SADロジック315の動作を実行するために用いられ得るハードウェア加速エンジンを有しても良い。
上述の方法は、RAM(random access memory)、ROM(read only memory)、PROM(programmable ROM)、フラッシュメモリ等のような機械又はコンピュータ可読記憶媒体に格納された論理命令セットとして、PLA(programmable logic array)、FPGA(field−programmable gate arrays)、CPLD(complex programmable logic device)のような構成可能ロジックで、ASIC(application−specific integrated circuit)、CMOS(complementary−symmetry metal−oxide−semiconductor)又はTTL(transistor−transistor logic)技術のような回路技術を用いた固定機能論理ハードウェアで、又はそれらの組合せで実施されても良い。例えば、方法の中で示した動作を実行するためのコンピュータプログラムコードは、C++等のようなオブジェクト指向プログラミング言語及びCプログラミング言語若しくは類似のプログラミング言語のような従来の手続き型プログラミング言語を含む1又は複数のプログラミング言語の組合せで記述されても良い。
図7は、システム700の一実施形態を示す。実施形態では、システム700はメディアシステムであっても良いが、システム700はこの環境に限定されない。例えば、システム700は、パーソナルコンピュータ(PC)、ラップトップコンピュータ、ウルトララップトップコンピュータ、タブレット、タッチパッド、ポータブルコンピュータ、ハンドヘルドコンピュータ、パームトップコンピュータ、PDA(personal digital assistant)、携帯電話機、携帯電話機/PDAの組合せ、テレビ、スマートデバイス(例えば、スマートフォン、スマートタブレット、又はスマートテレビ)、MID(mobile internet device)、メッセージング装置、データ通信装置、等に組み込まれても良い。
実施形態では、システム700は、ディスプレイ720に結合されるプラットフォーム702を有する。プラットフォーム702は、コンテンツサービス装置730若しくはコンテンツ配信装置740のようなコンテンツ装置、又は他の類似のコンテンツソースからコンテンツを受信しても良い。1又は複数のナビゲーション機能を有するナビゲーション制御部750は、例えばプラットフォーム702及び/又はディスプレイ720と相互作用するために用いられても良い。これらのコンポーネントの各々は、以下に詳細に説明される。
実施形態では、プラットフォーム702は、チップセット705、プロセッサ710、メモリ712、記憶装置714、グラフィックサブシステム715、アプリケーション716及び/又は無線機718の任意の組合せを有しても良い。チップセット705は、プロセッサ710、メモリ12、記憶装置714、グラフィックサブシステム715、アプリケーション716及び/又は無線機718の間の相互通信を提供しても良い。例えば、チップセット705は、記憶装置714との相互通信を提供可能な記憶装置アダプタ(図示しない)を有しても良い。
プロセッサ710は、CISC(Complex Instruction Set Computer)又はRISC(Reduced Instruction Set Computer)プロセッサ、x86命令セット互換プロセッサ、マルチコア、又は任意の他のマイクロプロセッサ又はCPU(central processing unit)として実施されても良い。実施形態では、プロセッサ710は、デュアルコアプロセッサ、デュアルコアモバイルプロセッサ、等を有しても良い。
メモリ712は、RAM(Random Access Memory)、DRAM(Dynamic Random Access Memory)、又はSRAM(Static RAM)のような揮発性メモリ装置として実施されても良いが、これらに限定されない。
記憶装置714は、磁気ディスクドライブ、光ディスクドライブ、テープドライブ、内蔵記憶装置、外付け記憶装置、フラッシュメモリ、バッテリバックアップSDRAM(synchronous DRAM)、及び/又はネットワークアクセス可能な記憶装置のような不揮発性メモリ装置として実施されても良いが、これらに限定されない。実施形態では、記憶装置714は、例えば複数のハードドライブが含まれるとき重要なデジタルメディアのために記憶性能拡張保護を増大させる技術を有しても良い。
グラフィックサブシステム715は、表示のために静止画像又はビデオのような画像の処理を実行しても良い。グラフィックサブシステム715は、例えばGPU(graphics processing unit)又はVPU(visual processing unit)であっても良い。アナログ又はデジタルインタフェースは、グラフィックサブシステム715及びディスプレイ720に通信可能に結合するために用いられても良い。例えば、インタフェースは、HDMI(登録商標)(High−Definition Multimedia Interface)、DisplayPort、無線HDMI、及び/又は無線HD準拠技術のうちの任意のものであっても良い。グラフィックサブシステム715は、プロセッサ710又はチップセット705に統合され得る。グラフィックサブシステム715は、チップセット705に通信可能に結合されるスタンドアロン型カードであり得る。
ここに記載されるグラフィック及び/又はビデオ処理技術は、種々のハードウェアアーキテクチャで実施されても良い。例えば、グラフィック及び/又はビデオ機能は、チップセットに統合されても良い。代替で、別個のグラフィック及び/又はビデオプロセッサが用いられても良い。更に別の実施形態として、グラフィック及び/又はビデオ機能は、マルチコアプロセッサを含む汎用プロセッサにより実施されても良い。更なる実施形態では、機能は、消費者電子機器内に実装されても良い。
無線機718は、種々の適切な無線通信技術を用いて信号を送信及び受信可能な1又は複数の無線機を有しても良い。このような技術は、1又は複数の無線ネットワークに渡る通信に関与し得る。例示的な無線ネットワークは、WLAN(wireless local area network)、WPAN(wireless personal area network)、WMAN(wireless metropolitan area network)、セルラネットワーク、及び衛星ネットワークを含む(が、これらに限定されない)。このようなネットワークに渡る通信では、無線機718は、任意のバージョンの1又は複数の適用規格に従って動作しても良い。
実施形態では、ディスプレイ720は、テレビ型モニタ又はディスプレイを有しても良い。ディスプレイ720は、例えば、コンピュータディスプレイスクリーン、タッチスクリーンディスプレイ、ビデオモニタ、テレビ型装置、及び/又はテレビを有しても良い。ディスプレイ720は、デジタル及び/又はアナログであっても良い。実施形態では、ディスプレイ720は、ホログラフィックディスプレイであっても良い。また、ディスプレイ720は、視覚投影を受け得る透過面であっても良い。このような投影は、種々の形式の情報、画像及び/又はオブジェクトを伝達し得る。例えば、このような投影は、MAR(mobile augmented reality)アプリケーションのための視覚的オーバレイであっても良い。1又は複数のソフトウェアアプリケーション716の制御下で、プラットフォーム702は、ユーザーインターフェース722をディスプレイ720に表示しても良い。
実施形態では、コンテンツサービス730は、任意の全国的、国際的、及び/又は独立型サービスにより干すとされても良く、したがって例えばインターネットを介してプラットフォーム702にアクセス可能であっても良い。コンテンツサービス装置730は、プラットフォーム702に及び/又はディスプレイ720に結合されても良い。プラットフォーム702に及び/又はコンテンツサービス装置730は、ネットワーク760へ及びそれからメディア情報を通信(例えば、送信及び/又は受信)するために、ネットワーク760に結合されても良い。コンテンツ配信装置740も、プラットフォーム702に及び/又はディスプレイ720に結合されても良い。
実施形態では、コンテンツサービス装置730は、ケーブルテレビボックス、パーソナルコンピュータ、ネットワーク、電話機、インターネット可能装置、又はデジタル情報及び/又はコンテンツを配信可能な機器、及びネットワークを介して又は直接にコンテンツプロバイダとプラットフォーム702及び/又はディスプレイ720との間でコンテンツを単方向若しくは双方向通信可能な任意の他の類似の装置を有しても良い。コンテンツは、単方向若しくは双方向に、システム700内のコンポーネントのうちの任意の1つ及びネットワーク760を介してコンテンツプロバイダへ及びそれから通信されても良い。コンテンツの例は、例えば、ビデオ、音楽、医用及びゲーム情報、等を含む任意のメディア情報を有しても良い。
コンテンツサービス装置730は、メディア情報、デジタル情報、及び/又は他のコンテンツを含むケーブルテレビ番組のようなコンテンツを受信する。コンテンツプロバイダの例は、任意のケーブル又は衛星テレビ又は無線機又はインターネットコンテンツプロバイダを含み得る。提供される例は、本発明の実施形態を限定するものではない。
実施形態では、プラットフォーム702は、1又は複数のナビゲーション機能を有するナビゲーション制御部750から制御信号を受信しても良い。制御部750のナビゲーション機能は、例えばユーザーインターフェース722と相互作用するために用いられても良い。実施形態では、ナビゲーション制御部750は、ユーザに空間的(例えば、連続する多次元)データをコンピュータに入力させるコンピュータハードウェアコンポーネント(特に、ヒューマンインタフェース装置)であっても良いポインティングデバイスであっても良い。GUI(graphical user interface)、テレビ、及びモニタのような多くのシステムは、ユーザに、身体的ジェスチャを用いてコンピュータ又はテレビを制御させ及びそれらにデータを提供させる。
制御部750のナビゲーション機能の動きは、ディスプレイ(例えば、ディスプレイ720)上で、ディスプレイに表示されるポインタ、カーソル、フォーカス、リング又は他の視覚的指示子の動きにより同調されても良い。例えば、ソフトウェアアプリケーション716の制御下で、ナビゲーション制御部750に配置されたナビゲーション機能は、例えばユーザーインターフェース722上に表示される仮想ナビゲーション機能にマッピングされても良い。実施形態では、制御部750は、別個のコンポーネントではなく、プラットフォーム702及び/又はディスプレイ720に統合されても良い。しかしながら、実施形態は、ここに示された又は記載された要素又は環境に限定されない。
実施形態では、ドライバ(図示しない)は、例えば、有効にされると、初期ブートアップ後のボタンのタッチで、テレビのように即座に、ユーザがプラットフォーム702をオン及びオフにできるようにする技術を有しても良い。プログラムロジックは、プラットフォーム702に、プラットフォームが「オフ」にされると、コンテンツをメディアアダプタ又は他のコンテンツサービス装置730又はコンテンツ配信装置740へストリーミングさせても良い。さらに、チップセット705は、例えば5.1サラウンドサウンド音声及び/又は高品位7.1サラウンドサウンド音声をサポートするハードウェア及び/又はソフトウェアを有しても良い。ドライバは、統合グラフィックプラットフォームのグラフィックドライバを有しても良い。実施形態では、グラフィックドライバは、PCI(peripheral component interconnect)Expressグラフィックカードを有しても良い。
種々の実施形態では、システム700の中で示した1又は複数のコンポーネントのうちの任意のものは、統合されても良い。例えば、プラットフォーム702及びコンテンツサービス装置730が統合されても良く、プラットフォーム702及びコンテンツ配信装置740が統合されても良く、又はプラットフォーム702、コンテンツサービス装置730及びコンテンツ配信装置740が統合されても良い。種々の実施形態では、プラットフォーム702及びディスプレイ720は、統合ユニットであっても良い。例えば、ディスプレイ720及びコンテンツサービス装置730が統合されても良く、又はディスプレイ720及びコンテンツ配信装置740が統合されても良い。これらの例は、本発明を限定するものではない。
種々の実施形態では、システム700は、無線システム、有線システム又は両者の組合せとして実装されても良い。無線システムとして実施されるとき、システム700は、1又は複数のアンテナ、送信機、受信機、通信機、増幅器、フィルタ、制御ロジック、等のような無線共有媒体を介して通信するのに適するコンポーネント及びインタフェースを有しても良い。無線共有媒体の例は、RFスペクトル等のような無線スペクトルの部分を含んでも良い。有線システムとして実施されるとき、システム700は、入力/出力(I/O)アダプタ、対応する有線通信媒体でI/Oアダプタに接続するための物理コネクタ、NIC(network interface card)、ディスク制御部、ビデオ制御部、音声制御部、等のような、有線通信媒体を介して通信するのに適するコンポーネント及びインタフェースを有しても良い。有線通信媒体の例は、ワイヤ、ケーブル、金属線、プリント回路基板(PCB)、バックプレーン、スイッチ構造、半導体物質、ツイストペアワイヤ、同軸ケーブル、光ファイバ等を含んでも良い。
プラットフォーム702は、情報を通信するために1又は複数の論理又は物理チャネルを確立しても良い。情報は、媒体情報及び制御情報を有しても良い。媒体情報は、ユーザに意味のあるデータ提示コンテンツを表し得る。コンテンツの例は、例えば、音声会話、ビデオ会議、ストリーミングビデオ、電子メール(email)メッセージ、音声メールメッセージ、英数字シンボル、グラフィック、画像、ビデオ、テキスト等からのデータを含み得る。ビデオ会議からのデータは、例えば、会話情報、無音期間、背景雑音、快適雑音、トーン等であっても良い。制御情報は、自動システム向けのコマンド、命令又は制御ワードを表す任意のデータを表しても良い。例えば、制御情報は、システムを通じて媒体情報を転送し、又は所定の方法で媒体情報を処理するようノードに指示するために用いられても良い。しかしながら、実施形態は、図7に示された又は記載された要素又は環境に限定されない。
上述のように、システム700は、変化する物理的様式又は形状因子で実施されても良い。図8は、方法700が実施され得る小型装置800の実施形態を示す。実施形態では、例えば、装置800は、無線機能を有するモバイルコンピューティング装置として実施されても良い。モバイルコンピューティング装置は、例えば、処理システム及び1又は複数のバッテリのようなモバイル電源若しくは供給を有する任意の装置を表しても良い。
上述のように、モバイルコンピューティング装置の例は、パーソナルコンピュータ(PC)、ラップトップコンピュータ、ウルトララップトップコンピュータ、タブレット、タッチパッド、ポータブルコンピュータ、ハンドヘルドコンピュータ、パームトップコンピュータ、PDA(personal digital assistant)、携帯電話機、携帯電話機/PDAの組合せ、テレビ、スマートデバイス(例えば、スマートフォン、スマートタブレット、又はスマートテレビ)、MID(mobile internet device)、メッセージング装置、データ通信装置、等を有しても良い。
モバイルコンピューティング装置の例は、腕時計型コンピュータ、指輪型コンピュータ、リングコンピュータ、眼鏡型コンピュータ、ベルトクリップ型コンピュータ、腕章型コンピュータ、靴型コンピュータ、衣類型コンピュータ、及び他の装着可能コンピュータのような、人により装着されるよう配置されるコンピュータも含み得る。実施形態では、例えば、モバイルコンピューティング装置は、コンピュータアプリケーション及び音声通信及び/又はデータ通信を実行可能なスマートフォンとして実施されても良い。幾つかの実施形態は、例としてスマートフォンとして実施されるモバイルコンピューティング装置と共に記載され得るが、他の実施形態も他の無線モバイルコンピューティング装置を持ち手実施できることが理解される。実施形態は、この文脈に限定されない。
図8に示すように、装置800は、筐体802、ディスプレイ804、入力/出力(I/O)装置806、アンテナ808を有しても良い。装置800は、ナビゲーション機能812を有しても良い。ディスプレイ804は、モバイルコンピューティング装置に適切な情報を表示する任意の適切なディスプレイを有しても良い。I/O装置806は、モバイルコンピューティング装置に情報を入力する任意の適切なI/O装置を有しても良い。I/O装置806の例は、英数字キーボード、数字キーパッド、タッチパッド、入力キー、ボタン、スイッチ、ロッカースイッチ、マイクロフォン、スピーカ、音声認識装置及びソフトウェア、等を有しても良い。情報は、マイクロフォンにより装置800に入力されても良い。このような情報は、音声認識装置によりデジタル化されても良い。実施形態は、この文脈に限定されない。
種々の実施形態は、ハードウェア要素、ソフトウェア要素、又は両者の組み合わせを用いて実施されても良い。ハードウェア要素の例は、プロセッサ、マイクロプロセッサ、回路、回路要素(例えば、トランジスタ、抵抗器、キャパシタ、インダクタ等)、集積回路、ASIC(application specific integrated circuit)、PLD(programmable logic device)、DSP(digital signal processor)、FPGA(field programmable gate array)、メモリユニット、論理ゲート、レジスタ、半導体装置、チップ、マイクロチップ、チップセット等を有しても良い。ソフトウェアの例は、ソフトウェアコンポーネント、プログラム、アプリケーション、コンピュータプログラム、アプリケーションプログラム、システムプログラム、機械プログラム、オペレーティングシステムソフトウェア、ミドルウェア、ファームウェア、ソフトウェアモジュール、ルーチン、サブルーチン、関数、メソッド、プロシジャ、ソフトウェアインタフェース、API(application program interface)、命令セット、コンピューティングコード、コンピュータコード、コードセグメント、コンピュータコードセグメント、ワード、値、シンボル、又はそれらの任意の組合せを含んでも良い。実施形態がハードウェア要素及び/又はソフトウェア要素を用いて実装されるかの決定は、所望の計算レート、パワーレベル、熱耐性、処理周期バジェット、入力データレート、出力データレート、メモリ資源、データバス速度、及び他の設計若しくは性能制約のような任意の数の要因に従って変化し得る。
少なくとも1つの実施形態の1又は複数の態様は、プロセッサ内の種々のロジックを表し、機械により読み込まれると本願明細書に記載の技術を実行するために該機械にロジックを組み立てさせる、機械可読媒体に格納された典型的な命令により実施されても良い。「IPコア」として知られるこのような表現は、有形の、機械可読媒体に格納され、実際にロジック又はプロセッサを作成する製造機械にロードするために種々の顧客若しくは製造設備に供給されても良い。
例示的なサイズ/モデル/値/範囲が与えられ得るが、本発明の実施形態はそれらに限定されない。製造技術(例えば、フォトリソグラフィー)は時間の経過と共に熟成するので、より小型の装置が製造されることが期待される。さらに、集積回路(IC)チップ及び他のコンポーネントとのよく知られている電力/グランド接続は、図示される場合もあり、説明及び議論を簡単にするため及び本発明の実施形態の特定の態様を不明確にしないために図示されない場合もある。さらに、配置は、本発明の実施形態の特定の態様を不明確にしないために、及びこのようなブロック図配置の実装に関する詳細が実施形態が実施されるプラットフォームに大きく依存する、つまりこのような詳細は当業者の範囲内であるという事実の観点からブロック図の形式で示され得る。本発明の例示的な実施形態を説明するために固有の詳細(例えば、回路)が説明される場合、当業者には、本発明の実施形態がこれら固有の詳細を有しないで又はそれらの変形を有して実施できることが明らかである。したがって、説明は、限定ではなく説明のためとして考えられるべきである。
用語「結合される」は、本願明細書では、問題となっているコンポーネント間の直接的又は間接的な任意の種類の関係を表すために用いられ、電気的、機械的、流体、光学、電磁気、電気機械、又は他の接続に適用されても良い。さらに、用語「第1の」、「第2の」等は、本願明細書では、議論を行うためにのみ用いられ、特に示さない限り、特定の時間的又は年代順の意味を伝達しない。
当業者は、本発明の実施形態の広範な技術が種々の形式で実施できることを前述の説明から理解するだろう。したがって、本発明の実施形態はそれらの特定の例と共に記載されたが、図面、明細書及び請求の範囲を調査すると−当業者には他の変形が明らかであるので、本発明の実施形態の真の範囲はそれら特定の例に限定されるべきではない。

Claims (29)

  1. 第1のフレーム及び第2のフレームを有するビデオの前記第2のフレームの領域に対して動き推定を実行するロジックと、
    前記第2のフレームの前記領域の前記動き推定に基づき、前記第2のフレームの前記領域に対してオブジェクト検出を実行するか否かを決定するロジックと、
    を有する装置。
  2. 前記第2のフレームは、前記ビデオ内の前記第1のフレームに対する後続フレームであり、前記動き推定するロジックは、前記第2のフレームの前記領域と前記第1のフレームの対応する領域との間の絶対差和を決定するロジックを有する、請求項1に記載の装置。
  3. 前記絶対差和を決定するロジックは、前記第2のフレームの前記領域及び前記第1のフレームの前記対応する領域に含まれるマクロブロックの絶対差和を決定するロジックを有する、請求項2に記載の装置。
  4. 前記オブジェクト検出を実行するか否かを決定するロジックは、分類関数を実行するロジックを有する、請求項3に記載の装置。
  5. 前記第2のフレームの前記領域に前記オブジェクト検出を実行するか否かを決定するために、前記絶対差和を閾と比較するロジック、を更に有する請求項4に記載の装置。
  6. 前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より大きい場合に実行される、請求項5に記載の装置。
  7. 前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より小さい又は等しい場合、且つ前記第2のフレームの前記領域のサンプルエリアが前記第1のフレームの前記対応する領域に含まれる場合に実行される、請求項6に記載の装置。
  8. 前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より小さい又は等しい場合、且つ前記第2のフレームの前記領域のサンプルエリアが前記第1のフレームの前記対応する領域に含まれない場合に実行されない、請求項7に記載の装置。
  9. 前記第1のフレームの前記対応する領域の符号化情報は、前記第2のフレームの前記領域のために再利用される、請求項8に記載の装置。
  10. プロセッサと、
    前記プロセッサに結合され動き推定に基づきビデオのフレーム内のオブジェクトを検出するよう構成される動き推定及びオブジェクト検出ロジックであって、前記ビデオは第1のフレームと第2のフレームとを有し、前記動き推定は、前記第2のフレームの領域に対して、前記第2のフレームの前記領域と前記第1のフレームの対応する領域との間の絶対差和を用いて実行される、動き推定及びオブジェクト検出ロジックと、
    を有するシステム。
  11. 前記絶対差和は、前記第2のフレームの前記領域及び前記第1のフレームの前記対応する領域に含まれるマクロブロックに対して実行され、前記第2のフレームは前記第1のフレームの後続フレームである、請求項10に記載のシステム。
  12. 前記動き推定及びオブジェクト検出ロジックは、前記絶対差和と閾との比較に基づき、前記第2のフレームの前記領域内のオブジェクトを検出するか否かを決定するよう更に構成される、請求項11に記載のシステム。
  13. 前記第2のフレームの前記領域内のオブジェクトを検出するロジックは、前記絶対差和が前記閾より大きい場合に実行される、請求項12に記載のシステム。
  14. 前記第2のフレームの前記領域内のオブジェクトを検出するロジックは、前記絶対差和が前記閾より小さい又は等しい場合、且つ前記第2のフレームの前記領域のサンプルエリアが前記第1のフレームの前記対応する領域に含まれる場合に実行される、請求項13に記載のシステム。
  15. 前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より小さい又は等しい場合、且つ前記第2のフレームの前記領域のサンプルエリアが前記第1のフレームの前記対応する領域に含まれない場合に実行されない、請求項14に記載のシステム。
  16. 前記第2のフレームの前記領域内のオブジェクトを検出するために、前記第2のフレームの前記領域に対して分類関数を実行するロジック、を更に有する請求項15に記載のシステム。
  17. 前記第1のフレームの前記対応する領域の符号化情報は、前記第2のフレームの前記領域に対する前記オブジェクト検出が実行されない場合に、前記第2のフレームの前記領域のために再利用される、請求項16に記載のシステム。
  18. ビデオの第1のフレームに含まれるオブジェクトを検出するために、前記第1のフレームの複数の領域に対してオブジェクト検出を実行するステップと、
    前記ビデオの第2のフレームの領域に対して動き推定を実行するステップと、
    前記第2のフレームの前記領域に対する前記動き推定に基づき、前記第2のフレームの前記領域に対してオブジェクト検出を実行するか否かを決定するステップと、
    を有するコンピュータが実施する方法。
  19. 前記第2のフレームは、前記ビデオ内の前記第1のフレームの後に続き、前記オブジェクト検出を実行するステップは、分類関数を実行するステップを含む、請求項18に記載の方法。
  20. 前記第2のフレームの前記領域に対して前記動き推定を実行するステップは、前記第2のフレームの前記領域と前記第1のフレームの対応する領域との間の絶対差和を決定するステップを含む、請求項19に記載の方法。
  21. 前記第2のフレームの前記領域に対して前記オブジェクト検出を実行するか否かを決定するステップは、前記絶対差和を閾と比較するステップを有する、請求項20に記載の方法。
  22. 前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より大きい場合に実行される、請求項21に記載の方法。
  23. 前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より小さい又は等しい場合、且つ前記第2のフレームの前記領域のサンプルエリアが前記第1のフレームの前記対応する領域に含まれる場合に実行される、請求項22に記載の方法。
  24. 前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より小さい又は等しい場合、且つ前記第2のフレームの前記領域のサンプルエリアが前記第1のフレームの前記対応する領域に含まれない場合に実行されない、請求項23に記載の方法。
  25. 前記第1のフレームの前記対応する領域の符号化情報は、前記第2のフレームの前記領域に対する前記オブジェクト検出が実行されないときに、前記第2のフレームの前記領域のために再利用される、請求項24に記載の方法。
  26. プロセッサと、
    前記プロセッサに結合される外部電源と、
    前記プロセッサに結合され動き推定に基づきビデオのフレーム内のオブジェクトを検出するよう構成される動き推定及びオブジェクト検出ロジックであって、前記ビデオは第1のフレームと第2のフレームとを有し、前記動き推定は、前記第2のフレームの領域に対して、前記第2のフレームの前記領域と前記第1のフレームの対応する領域との間の絶対差和を用いて実行される、動き推定及びオブジェクト検出ロジックと、
    を有するシステム。
  27. 前記絶対差和は、前記第2のフレームの前記領域及び前記第1のフレームの前記対応する領域に含まれるマクロブロックに対して実行され、前記第2のフレームの前記領域内のオブジェクトを検出するために、前記第2のフレームの前記領域に対して分類関数を実行するロジック、を更に有する請求項26に記載のシステム。
  28. 前記第2のフレームは、前記第1のフレームの後続フレームであり、前記動き推定及びオブジェクト検出ロジックは、前記絶対差和と閾との比較に基づき、前記第2のフレームの前記領域内のオブジェクトを検出するか否かを決定するよう更に構成される、請求項27に記載のシステム。
  29. 前記第2のフレームの前記領域内のオブジェクトを検出するロジックは、前記絶対差和が前記閾より大きい場合に実行され、前記第2のフレームの前記領域に対する前記オブジェクト検出は、前記絶対差和が前記閾より小さい又は等しい場合に実行されず、前記第1のフレームの前記対応する領域の符号化情報は、前記第2のフレームの前記領域に対する前記オブジェクト検出が実行されない場合に、前記第2のフレームの前記領域のために再利用される、請求項28に記載のシステム。
JP2014549288A 2011-12-30 2011-12-30 動き推定を用いたオブジェクト検出 Expired - Fee Related JP5908605B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/CN2011/084991 WO2013097166A1 (en) 2011-12-30 2011-12-30 Object detection using motion estimation

Publications (2)

Publication Number Publication Date
JP2015507796A true JP2015507796A (ja) 2015-03-12
JP5908605B2 JP5908605B2 (ja) 2016-04-26

Family

ID=48696241

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014549288A Expired - Fee Related JP5908605B2 (ja) 2011-12-30 2011-12-30 動き推定を用いたオブジェクト検出

Country Status (6)

Country Link
US (1) US9525803B2 (ja)
EP (1) EP2798832A4 (ja)
JP (1) JP5908605B2 (ja)
CN (1) CN104012072B (ja)
TW (1) TWI568256B (ja)
WO (1) WO2013097166A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5908605B2 (ja) 2011-12-30 2016-04-26 インテル コーポレイション 動き推定を用いたオブジェクト検出
US10521086B1 (en) * 2013-12-17 2019-12-31 Amazon Technologies, Inc. Frame interpolation for media streaming
TWI638332B (zh) * 2016-11-29 2018-10-11 財團法人車輛研究測試中心 Hierarchical object detection system with parallel architecture and method thereof
TWI624793B (zh) * 2017-09-19 2018-05-21 財團法人成大研究發展基金會 物件偵測的適應系統與方法
CN107992100B (zh) * 2017-12-13 2021-01-15 中国科学院长春光学精密机械与物理研究所 基于可编程逻辑阵列的高帧频图像跟踪方法和系统
CN110930436B (zh) * 2019-11-27 2023-04-14 深圳市捷顺科技实业股份有限公司 一种目标跟踪方法及设备
CN111222509B (zh) * 2020-01-17 2023-08-18 北京字节跳动网络技术有限公司 目标检测方法、装置及电子设备
US11615537B2 (en) * 2020-11-02 2023-03-28 Qualcomm Incorporated Methods and apparatus for motion estimation based on region discontinuity

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750826A (ja) * 1993-07-15 1995-02-21 Tokyo Electric Power Co Inc:The 移動物体判定方法及び装置
JPH10241076A (ja) * 1997-02-24 1998-09-11 Kawasaki Heavy Ind Ltd 都市防災用監視装置
JP2003040016A (ja) * 2001-04-18 2003-02-13 Board Of Regents Of The Univ Of Wisconsin System 楕円形モデルおよびベイズの分類を用いた自動車乗員検出方法
JP2006236063A (ja) * 2005-02-25 2006-09-07 Kddi Corp 移動物体抽出装置
US20110075935A1 (en) * 2009-09-25 2011-03-31 Sony Corporation Method to measure local image similarity based on the l1 distance measure

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0166724B1 (ko) * 1993-05-08 1999-03-20 김광호 반화소정확도를 갖는 동벡터추정방법 및 그 장치
US6738423B1 (en) 2000-01-21 2004-05-18 Nokia Mobile Phones Ltd. Method for encoding and decoding video information, a motion compensated video encoder and a corresponding decoder
CN101022505A (zh) * 2007-03-23 2007-08-22 中国科学院光电技术研究所 复杂背景下运动目标自动检测方法和装置
US7929729B2 (en) 2007-04-02 2011-04-19 Industrial Technology Research Institute Image processing methods
EP1988502A1 (en) 2007-05-04 2008-11-05 Deutsche Thomson OHG Method and device for retrieving a test block from a blockwise stored reference image
US8488676B2 (en) 2007-05-14 2013-07-16 Himax Technologies Limited Motion estimation method
WO2011017823A1 (en) 2009-08-12 2011-02-17 Intel Corporation Techniques to perform video stabilization and detect video shot boundaries based on common processing elements
JP5908605B2 (ja) 2011-12-30 2016-04-26 インテル コーポレイション 動き推定を用いたオブジェクト検出

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0750826A (ja) * 1993-07-15 1995-02-21 Tokyo Electric Power Co Inc:The 移動物体判定方法及び装置
JPH10241076A (ja) * 1997-02-24 1998-09-11 Kawasaki Heavy Ind Ltd 都市防災用監視装置
JP2003040016A (ja) * 2001-04-18 2003-02-13 Board Of Regents Of The Univ Of Wisconsin System 楕円形モデルおよびベイズの分類を用いた自動車乗員検出方法
JP2006236063A (ja) * 2005-02-25 2006-09-07 Kddi Corp 移動物体抽出装置
US20110075935A1 (en) * 2009-09-25 2011-03-31 Sony Corporation Method to measure local image similarity based on the l1 distance measure

Also Published As

Publication number Publication date
TWI568256B (zh) 2017-01-21
CN104012072B (zh) 2018-01-30
US20140226865A1 (en) 2014-08-14
CN104012072A (zh) 2014-08-27
TW201342897A (zh) 2013-10-16
WO2013097166A1 (en) 2013-07-04
EP2798832A1 (en) 2014-11-05
JP5908605B2 (ja) 2016-04-26
US9525803B2 (en) 2016-12-20
EP2798832A4 (en) 2016-02-24

Similar Documents

Publication Publication Date Title
JP5908605B2 (ja) 動き推定を用いたオブジェクト検出
US11317052B2 (en) Techniques for video analytics of captured video content
US9860553B2 (en) Local change detection in video
US9363473B2 (en) Video encoder instances to encode video content via a scene change determination
TWI615807B (zh) 用於記錄在輸入幾何物件粒度上的可視度測試之結果的方法、設備及系統
KR101653158B1 (ko) 분산형 그래픽 처리
US9773477B2 (en) Reducing the number of scaling engines used in a display controller to display a plurality of images on a screen
EP3132608A1 (en) Fallback detection in motion estimation
US9019340B2 (en) Content aware selective adjusting of motion estimation
US9501830B2 (en) Blob detection in noisy images
KR20160019104A (ko) 저전력 비디오 압축 및 전송을 위한 기술
KR101277354B1 (ko) 메모리 대역폭 및 저장소를 감소시키기 위한 이미지 데이터의 지각적 무손실 압축
US9055177B2 (en) Content aware video resizing
US20140010302A1 (en) Detection, location, and processing of static pixels
US8903193B2 (en) Reducing memory bandwidth consumption when executing a program that uses integral images
US10334269B2 (en) Selectively bypassing intra prediction coding based on preprocessing error data
KR20130140922A (ko) 압축되지 않은 비디오 인터커넥트들 상의 송신을 위한 이미지 데이터의 지각적 무손실 압축

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150611

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150911

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160223

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160323

R150 Certificate of patent or registration of utility model

Ref document number: 5908605

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees