JP7529056B2 - 物体検出装置、方法、及びプログラム - Google Patents
物体検出装置、方法、及びプログラム Download PDFInfo
- Publication number
- JP7529056B2 JP7529056B2 JP2022581061A JP2022581061A JP7529056B2 JP 7529056 B2 JP7529056 B2 JP 7529056B2 JP 2022581061 A JP2022581061 A JP 2022581061A JP 2022581061 A JP2022581061 A JP 2022581061A JP 7529056 B2 JP7529056 B2 JP 7529056B2
- Authority
- JP
- Japan
- Prior art keywords
- unit
- frame
- detection
- index
- target frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 382
- 238000000034 method Methods 0.000 title description 56
- 239000013598 vector Substances 0.000 claims description 74
- 238000004364 calculation method Methods 0.000 claims description 49
- 230000001186 cumulative effect Effects 0.000 claims description 25
- 230000008859 change Effects 0.000 claims description 19
- 238000013527 convolutional neural network Methods 0.000 claims description 12
- 230000008569 process Effects 0.000 description 35
- 238000010586 diagram Methods 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/215—Motion-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
- G06T7/248—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Description
第1実施形態に係る物体検出装置は、物体検出の対象となる動画像のフレーム毎に動きベクトルを算出すると共に、動きベクトルを用いて、フレーム間の変化の大きさを示す指標を算出する。そして、物体検出装置は、指標が大きい場合は、物体検出モデルによる物体検出を行い、そうでない場合は、動きベクトル算出の基準とした参照フレームの物体検出結果の位置情報を補正して出力する。これにより、新たな物体の出現や物体の変形に対する物体検出の精度の低下を回避しつつ、効率的な処理を実現する。
-I(c,n-1,x-mvx(x,y),y-mvy(x,y))|
・・・(1)
=Σ_xΣ_y{|mvx(x,y)-mvx(x+sx,y)|
+|mvx(x,y)-mvx(x,y+sy)|
+|mvy(x,y)-mvy(x+sx,y)|
+|mvy(x,y)-mvy(x,y+sy)|}
・・・(2)
次に、第2実施形態について説明する。第2実施形態に係る物体検出装置は、フレームを複数に分割した各部分画像の物体検出結果と、フレーム全体を縮小した縮小画像の物体検出結果との統合、すなわち、フレームの分割と合成とを用いた物体検出を行う。第2実施形態に係る物体検出装置は、その中の部分画像毎の物体検出の処理において、第1実施形態と同様に、キーフレームと対象フレーム間の変化の大きさを示す指標を用いて、物体検出モデルを用いた物体検出の処理をスキップするか否かを判定する。
メモリと、
前記メモリに接続された少なくとも1つのプロセッサと、
を含み、
前記プロセッサは、
複数のフレームを含む動画像の各フレームを対象フレームとし、前記対象フレームの全体に亘って、参照フレームを基準とした動きベクトルを算出すると共に、前記動きベクトルを用いて表される、キーフレームと前記対象フレームとの間の変化の大きさを示す指標を算出し、
算出された指標が、予め定められた閾値以上か否かを判定し、
前記指標が前記閾値以上の場合に、物体検出モデルを用いて、前記対象フレームから物体を示す領域を検出し、
前記指標が前記閾値未満の場合に、前記参照フレームにおいて検出された領域の位置を、前記動きベクトルを用いて補正した前記対象フレーム上の領域を検出し、
前記対象フレームから検出された前記領域の情報を出力する
ように構成されている物体検出装置。
物体検出処理を実行するようにコンピュータによって実行可能なプログラムを記憶した非一時的記録媒体であって、
前記物体検出処理は、
複数のフレームを含む動画像の各フレームを対象フレームとし、前記対象フレームの全体に亘って、参照フレームを基準とした動きベクトルを算出すると共に、前記動きベクトルを用いて表される、キーフレームと前記対象フレームとの間の変化の大きさを示す指標を算出し、
算出された指標が、予め定められた閾値以上か否かを判定し、
前記指標が前記閾値以上の場合に、物体検出モデルを用いて、前記対象フレームから物体を示す領域を検出し、
前記指標が前記閾値未満の場合に、前記参照フレームにおいて検出された領域の位置を、前記動きベクトルを用いて補正した前記対象フレーム上の領域を検出し、
前記対象フレームから検出された前記領域の情報を出力する
ことを含む非一時的記録媒体。
11 CPU
12 ROM
13 RAM
14 ストレージ
15 入力部
16 表示部
17 通信I/F
19 バス
21、221 入力部
22、222 算出部
23 参照フレームバッファ
24 動きベクトルバッファ
25、225 判定部
26 画像形成部
226A 部分画像生成部
226B 縮小画像生成部
27、227 第1検出部
227-1~4 部分画像検出部
227B 縮小画像検出部
28、228 第2検出部
29 検出結果バッファ
30、230 出力部
Claims (8)
- 複数のフレームを含む動画像の各フレームを対象フレームとし、前記対象フレームの全体に亘って、前記動画像において時系列順にキーフレーム以降かつ前記対象フレームより前の参照フレームを基準とした動きベクトルを算出すると共に、前記動きベクトルを用いて表される、キーフレームと前記対象フレームとの間の変化の大きさを示す指標を算出する算出部と、
前記算出部により算出された指標が、予め定められた閾値以上か否かを判定する判定部と、
前記指標が前記閾値以上の場合に、物体検出モデルを用いて、前記対象フレームから物体を示す領域を検出する第1検出部と、
前記指標が前記閾値未満の場合に、前記参照フレームにおいて検出された領域の位置を、前記動きベクトルを用いて補正した前記対象フレーム上の領域を検出する第2検出部と、
前記第1検出部により検出された前記領域の情報、及び前記第2検出部により検出された前記領域の情報を出力する出力部と、
を含む物体検出装置。 - 前記キーフレームは、前記第1検出部により前記領域が検出されたフレームのうち、前記対象フレームの直近のフレームであり、
前記算出部は、前記キーフレームから前記対象フレームまでの各フレームで得られる前記指標の累積値を、前記判定部で前記閾値と比較するための指標として算出する
請求項1に記載の物体検出装置。 - 前記指標は、前記動きベクトルを用いた動き補償の予測誤差の大きさを示す指標、及び前記動きベクトルのばらつきの大きさを示す指標の少なくとも一方である請求項1又は請求項2に記載の物体検出装置。
- 前記対象フレームを複数の部分に分割した複数の部分画像を生成する部分画像生成部をさらに含み、
前記算出部は、前記部分画像毎に、前記指標を算出し、
前記判定部は、前記部分画像毎に、前記指標が前記閾値以上か否かを判定し、
前記第1検出部は、前記判定部により前記指標が前記閾値以上と判定された前記部分画像から、前記物体を示す領域を検出し、
前記第2検出部は、前記判定部により前記指標が前記閾値未満と判定された前記部分画像から、前記物体を示す領域を検出し、
前記出力部は、前記第1検出部により検出された領域と、前記第2検出部により検出された領域とを統合して、前記対象フレームにおける物体を示す領域の情報を出力する
請求項1~請求項3の何れか1項に記載の物体検出装置。 - 前記対象フレーム全体を縮小した縮小画像を生成する縮小画像生成部をさらに含み、
前記第1検出部は、さらに、前記縮小画像から前記物体を示す領域を検出する
請求項4に記載の物体検出装置。 - 前記物体検出モデルは、畳み込みニューラルネットワークである請求項1~請求項5の何れか1項に記載の物体検出装置。
- 算出部が、複数のフレームを含む動画像の各フレームを対象フレームとし、前記対象フレームの全体に亘って、前記動画像において時系列順にキーフレーム以降かつ前記対象フレームより前の参照フレームを基準とした動きベクトルを算出すると共に、前記動きベクトルを用いて表される、キーフレームと前記対象フレームとの間の変化の大きさを示す指標を算出し、
判定部が、前記算出部により算出された指標が、予め定められた閾値以上か否かを判定し、
第1検出部が、前記指標が前記閾値以上の場合に、物体検出モデルを用いて、前記対象フレームから物体を示す領域を検出し、
第2検出部が、前記指標が前記閾値未満の場合に、前記参照フレームにおいて検出された領域の位置を、前記動きベクトルを用いて補正した前記対象フレーム上の領域を検出し、
出力部が、前記第1検出部により検出された前記領域の情報、及び前記第2検出部により検出された前記領域の情報を出力する
物体検出方法。 - コンピュータを、請求項1~請求項6の何れか1項に記載の物体検出装置の各部として機能させるための物体検出プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2021/004839 WO2022172341A1 (ja) | 2021-02-09 | 2021-02-09 | 物体検出装置、方法、及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2022172341A1 JPWO2022172341A1 (ja) | 2022-08-18 |
JP7529056B2 true JP7529056B2 (ja) | 2024-08-06 |
Family
ID=82838406
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022581061A Active JP7529056B2 (ja) | 2021-02-09 | 2021-02-09 | 物体検出装置、方法、及びプログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US20240119605A1 (ja) |
EP (1) | EP4293611A1 (ja) |
JP (1) | JP7529056B2 (ja) |
WO (1) | WO2022172341A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117440162B (zh) * | 2023-12-19 | 2024-02-23 | 齐齐哈尔医学院 | 一种多媒体互动教学方法及系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015088092A (ja) | 2013-11-01 | 2015-05-07 | 富士通株式会社 | 移動量推定装置及び移動量推定方法 |
JP2020515983A (ja) | 2017-11-28 | 2020-05-28 | シェンチェン センスタイム テクノロジー カンパニー リミテッドShenzhen Sensetime Technology Co.,Ltd | 対象人物の検索方法および装置、機器、プログラム製品ならびに媒体 |
-
2021
- 2021-02-09 EP EP21925595.7A patent/EP4293611A1/en active Pending
- 2021-02-09 JP JP2022581061A patent/JP7529056B2/ja active Active
- 2021-02-09 WO PCT/JP2021/004839 patent/WO2022172341A1/ja active Application Filing
- 2021-02-09 US US18/275,786 patent/US20240119605A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015088092A (ja) | 2013-11-01 | 2015-05-07 | 富士通株式会社 | 移動量推定装置及び移動量推定方法 |
JP2020515983A (ja) | 2017-11-28 | 2020-05-28 | シェンチェン センスタイム テクノロジー カンパニー リミテッドShenzhen Sensetime Technology Co.,Ltd | 対象人物の検索方法および装置、機器、プログラム製品ならびに媒体 |
Also Published As
Publication number | Publication date |
---|---|
WO2022172341A1 (ja) | 2022-08-18 |
US20240119605A1 (en) | 2024-04-11 |
JPWO2022172341A1 (ja) | 2022-08-18 |
EP4293611A1 (en) | 2023-12-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8681870B2 (en) | Motion vector detection device | |
CN108702512B (zh) | 运动估计方法和装置 | |
US8331696B2 (en) | Update region detection device | |
US8629936B2 (en) | Moving region detection device | |
JP2001251632A (ja) | 動きベクトル検出方法および装置並びに動きベクトル検出プログラム | |
JP2009147807A (ja) | 画像処理装置 | |
US20140126818A1 (en) | Method of occlusion-based background motion estimation | |
JP7239050B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム | |
JP5979145B2 (ja) | 動画領域検出装置 | |
JP7529056B2 (ja) | 物体検出装置、方法、及びプログラム | |
US20120176536A1 (en) | Adaptive Frame Rate Conversion | |
JP4385077B1 (ja) | 動きベクトル検出装置および画像処理装置 | |
JP5938935B2 (ja) | 動画像符号化装置及び動画像符号化方法 | |
JP4525064B2 (ja) | 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム | |
CN106303545B (zh) | 用于在帧序列中执行运动估计的数据处理系统和方法 | |
JP4622264B2 (ja) | 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム | |
JP4622265B2 (ja) | 動きベクトル検出装置、および動きベクトル検出方法、並びにプログラム | |
JP4207764B2 (ja) | 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム | |
JP2004164479A (ja) | 画像変形情報生成装置、画像変形情報生成方法及び画像変形情報生成プログラム | |
JP2012118923A (ja) | 領域分割装置及び領域分割方法 | |
WO2024161616A1 (ja) | 推論装置、推論方法、及び推論プログラム | |
US20110194607A1 (en) | Information Processing Device, Information Processing Method, and Program | |
WO2024194951A1 (ja) | 物体検出装置、方法、及びプログラム | |
JP4207763B2 (ja) | 動きベクトル検出装置、および動きベクトル検出方法、並びにコンピュータ・プログラム | |
JP2006190176A (ja) | カメラワークパラメータ算出方法、この方法を実施する装置、プログラムおよびその記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230524 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240625 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240708 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7529056 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |