JP7327645B2 - 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム - Google Patents
画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム Download PDFInfo
- Publication number
- JP7327645B2 JP7327645B2 JP2022507120A JP2022507120A JP7327645B2 JP 7327645 B2 JP7327645 B2 JP 7327645B2 JP 2022507120 A JP2022507120 A JP 2022507120A JP 2022507120 A JP2022507120 A JP 2022507120A JP 7327645 B2 JP7327645 B2 JP 7327645B2
- Authority
- JP
- Japan
- Prior art keywords
- reliability
- tracking
- frame
- image processing
- hypothesis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
- G06T7/248—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments involving reference images or patches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/246—Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/20—Analysis of motion
- G06T7/277—Analysis of motion involving stochastic approaches, e.g. using Kalman filters
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/62—Extraction of image or video features relating to a temporal dimension, e.g. time-based feature extraction; Pattern tracking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/776—Validation; Performance evaluation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10016—Video; Image sequence
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30241—Trajectory
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Description
物体の時系列画像を用いて前記物体の画像特徴を出力する画像特徴算出手段と、
前記画像特徴と前記物体の追跡結果とを用いて前記物体を識別した識別結果を出力する物体識別手段と、
前記識別結果と前記追跡結果とに基づいて複数の運動モデルのうちから適切な運動モデルを選択する運動モデル選択手段と、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出する物体追跡手段と、
を備える。
物体の時系列画像を出力する時系列画像入出力装置と、
前記物体の時系列画像が入力する画像処理装置と、
前記物体ごとの運動モデルと物体情報とを紐づけて格納する運動モデル辞書と、
前記物体の識別結果を出力する識別結果出力装置と、
前記物体の追跡結果を出力する追跡結果出力装置と、
を備え、
前記画像処理装置は、
前記物体の前記時系列画像を用いて前記物体の画像特徴を出力する画像特徴算出手段と、
前記画像特徴と前記物体の前記追跡結果とを用いて前記物体を識別した前記識別結果を出力する物体識別手段と、
前記識別結果と前記追跡結果とに基づいて複数の前記運動モデルのうちから適切な運動モデルを選択する運動モデル選択手段と、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出する物体追跡手段と、を有する。
物体の時系列画像を用いて前記物体の画像特徴を出力することと、
前記画像特徴と前記物体の追跡結果とを用いて前記物体を識別した識別結果を出力することと、
前記識別結果と前記追跡結果とに基づいて複数の運動モデルのうちから適切な運動モデルを選択することと、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出することと、
を備える。
物体の時系列画像を用いて前記物体の画像特徴を出力することと、
前記画像特徴と前記物体の追跡結果とを用いて前記物体を識別した識別結果を出力することと、
前記識別結果と前記追跡結果とに基づいて複数の運動モデルのうちから適切な運動モデルを選択することと、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出することと、
をコンピュータに実行させる画像処理プログラムが格納される。
<構成>
実施の形態の構成を説明する。
図1は、実施の形態に係る画像処理装置の構成を例示するブロック図である。
図2は、実施の形態に係る画像処理システムの構成を例示するブロック図である。
図3は、実施の形態に係る物体位置予測手段の動作を説明する模式図である。
図4は、実施の形態に係る物体位置予測手段の動作を説明する模式図である。
図3の左側の図は、画像特徴算出手段201にて、t番目のフレームの物体候補の位置を検出した様子を示し、図3の右側の図は、物体位置予測手段2041にて、t番目のフレームの動きを、t-1番目のフレームの検出位置と運動モデルに基づいて予測した様子を示す。
図3に示す黒点と白点は、それぞれ異なる種類の物体情報を示す。
図3において、t番目のフレームには、画像特徴算出手段201にて画像特徴を算出した結果、複数個(合計7個)の物体候補が追跡の候補として検出されている様子を示す。
図5は、実施の形態に係る仮説生成手段の動作を説明する模式図である。
図5の左側の図は、t番目のフレームで検出された物体の動き(具体的には、t番目のフレームにおける領域Ctと領域Dt)を、t-1番目のフレームにて選択された運動モデルを用いて予測した結果を示す。ここで、領域Ctおよび領域Dtは、運動モデルを用いた結果、t番目のフレームで追跡対象が存在する確率が高いと算出された領域である。
図6は、実施の形態に係る仮説選択手段の動作を説明する模式図である。
図6の左側の図は、仮説生成手段2042により、予測された領域内にある検出対象を選択し、これらから、仮説(すなわち、軌跡の候補)を生成する様子を示す。
実施の形態の動作を説明する。
図7は、実施の形態に係る画像処理システムの動作を例示するフローチャートである。
実施の形態の効果を説明する。
実施の形態に係る画像処理装置20は、
物体の時系列画像を用いて物体の画像特徴を出力する画像特徴算出手段201と、
画像特徴と物体の追跡結果とを用いて物体を識別した識別結果を出力する物体識別手段202と、
識別結果と追跡結果とに基づいて複数の運動モデルのうちから適切な運動モデルを選択する運動モデル選択手段203と、
識別した物体から、時系列に物体を追跡して追跡結果を算出する物体追跡手段204と、を備える。
適切な運動モデルを用いて、対象となるフレームの前フレームにおける物体の位置から、対象となるフレームにおける物体の位置を予測する物体位置予測手段2041と、
予測された物体の位置から物体の軌跡の候補を仮説として生成する仮説生成手段2042と、
物体の識別結果における信頼度を物体信頼度として算出し、予測した物体の位置と、フレームにおける物体の検出位置と、の間の距離に応じた信頼度を、動き信頼度として算出し、物体信頼度と動き信頼度とを統合することで仮説の信頼度を算出する信頼度算出手段2043と、
所定のフレームでの仮説の信頼度を積算し、積算した累積信頼度が最も高い仮説を、複数の仮説のうちから、追跡結果として選択する仮説選択手段2044と、
を有する。
10S:画像処理システム
20:画像処理装置
21:運動モデル辞書
201:画像特徴算出手段
202:物体識別手段
203:運動モデル選択手段
204:物体追跡手段
2041:物体位置予測手段
2042:仮説生成手段
2043:信頼度算出手段
2044:仮説選択手段
30:識別結果出力装置
31:追跡結果出力装置
Pt-1、Pt:黒点
Qt-1:白点
Ct、Ct-1、Dt、:領域
Claims (6)
- 物体の時系列画像を用いて前記物体の画像特徴を出力する画像特徴算出手段と、
前記画像特徴と前記物体の追跡結果とを用いて前記物体を識別した識別結果を出力する物体識別手段と、
前記識別結果と前記追跡結果とに基づいて複数の運動モデルのうちから適切な運動モデルを選択する運動モデル選択手段と、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出する物体追跡手段と、
を備え、
前記物体追跡手段は、
前記適切な運動モデルを用いて、対象となるフレームの前フレームにおける前記物体の位置から、前記対象となるフレームにおける前記物体の位置を予測する物体位置予測手段と、
前記予測された前記物体の位置から前記物体の軌跡の候補を仮説として生成する仮説生成手段と、
前記物体の前記識別結果における信頼度を物体信頼度として算出し、前記予測した前記物体の位置と、前記フレームにおける前記物体の検出位置と、の間の距離に応じた信頼度を、動き信頼度として算出し、前記物体信頼度と前記動き信頼度とを統合することで仮説の信頼度を算出する信頼度算出手段と、
所定のフレームでの前記仮説の信頼度を積算し、前記積算した累積信頼度が最も高い前記仮説を、複数の前記仮説のうちから、前記追跡結果として選択する仮説選択手段と、
を有する、
画像処理装置。 - 前記物体位置予測手段は、
前記前フレームにおける前記物体の位置を、前記対象となるフレームにおける前記物体の位置から予測する、
請求項1に記載の画像処理装置。 - 前記運動モデル選択手段は、
前記識別結果である物体情報と前記追跡結果とに基づいて特徴ベクトルを算出し、
前記複数の運動モデルに紐づけられた特徴ベクトルのうち、前記算出した特徴ベクトルと最も近い距離にある特徴ベクトルに紐付いた運動モデルを、前記適切な運動モデルとして選択する、
請求項1または2に記載の画像処理装置。 - 物体の時系列画像を出力する時系列画像入出力装置と、
前記物体の時系列画像が入力する画像処理装置と、
前記物体ごとの運動モデルと物体情報とを紐づけて格納する運動モデル辞書と、
前記物体の識別結果を出力する識別結果出力装置と、
前記物体の追跡結果を出力する追跡結果出力装置と、
を備え、
前記画像処理装置は、
前記物体の前記時系列画像を用いて前記物体の画像特徴を出力する画像特徴算出手段と、
前記画像特徴と前記物体の前記追跡結果とを用いて前記物体を識別した前記識別結果を出力する物体識別手段と、
前記識別結果と前記追跡結果とに基づいて複数の前記運動モデルのうちから適切な運動モデルを選択する運動モデル選択手段と、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出する物体追跡手段と、を有し、
前記物体追跡手段は、
前記適切な運動モデルを用いて、対象となるフレームの前フレームにおける前記物体の位置から、前記対象となるフレームにおける前記物体の位置を予測する物体位置予測手段と、
前記予測された前記物体の位置から前記物体の軌跡の候補を仮説として生成する仮説生成手段と、
前記物体の前記識別結果における信頼度を物体信頼度として算出し、前記予測した前記物体の位置と、前記フレームにおける前記物体の検出位置と、の間の距離に応じた信頼度を、動き信頼度として算出し、前記物体信頼度と前記動き信頼度とを統合することで仮説の信頼度を算出する信頼度算出手段と、
所定のフレームでの前記仮説の信頼度を積算し、前記積算した累積信頼度が最も高い前記仮説を、複数の前記仮説のうちから、前記追跡結果として選択する仮説選択手段と、
を有する、
画像処理システム。 - 物体の時系列画像を用いて前記物体の画像特徴を出力することと、
前記画像特徴と前記物体の追跡結果とを用いて前記物体を識別した識別結果を出力することと、
前記識別結果と前記追跡結果とに基づいて複数の運動モデルのうちから適切な運動モデルを選択することと、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出することと、
を備え、
前記追跡結果を算出することは、
前記適切な運動モデルを用いて、対象となるフレームの前フレームにおける前記物体の位置から、前記対象となるフレームにおける前記物体の位置を予測することと、
前記予測された前記物体の位置から前記物体の軌跡の候補を仮説として生成することと、
前記物体の前記識別結果における信頼度を物体信頼度として算出し、前記予測した前記物体の位置と、前記フレームにおける前記物体の検出位置と、の間の距離に応じた信頼度を、動き信頼度として算出し、前記物体信頼度と前記動き信頼度とを統合することで仮説の信頼度を算出することと、
所定のフレームでの前記仮説の信頼度を積算し、前記積算した累積信頼度が最も高い前記仮説を、複数の前記仮説のうちから、前記追跡結果として選択することと、
を有する、
画像処理方法。 - 物体の時系列画像を用いて前記物体の画像特徴を出力することと、
前記画像特徴と前記物体の追跡結果とを用いて前記物体を識別した識別結果を出力することと、
前記識別結果と前記追跡結果とに基づいて複数の運動モデルのうちから適切な運動モデルを選択することと、
前記識別した前記物体から、時系列に前記物体を追跡して前記追跡結果を算出することと、
をコンピュータに実行させる画像処理プログラムであって、
前記追跡結果を算出することは、
前記適切な運動モデルを用いて、対象となるフレームの前フレームにおける前記物体の位置から、前記対象となるフレームにおける前記物体の位置を予測することと、
前記予測された前記物体の位置から前記物体の軌跡の候補を仮説として生成することと、
前記物体の前記識別結果における信頼度を物体信頼度として算出し、前記予測した前記物体の位置と、前記フレームにおける前記物体の検出位置と、の間の距離に応じた信頼度を、動き信頼度として算出し、前記物体信頼度と前記動き信頼度とを統合することで仮説の信頼度を算出することと、
所定のフレームでの前記仮説の信頼度を積算し、前記積算した累積信頼度が最も高い前記仮説を、複数の前記仮説のうちから、前記追跡結果として選択することと、
を有する、
画像処理プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/010853 WO2021181612A1 (ja) | 2020-03-12 | 2020-03-12 | 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラムが格納される非一時的なコンピュータ可読媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JPWO2021181612A1 JPWO2021181612A1 (ja) | 2021-09-16 |
JPWO2021181612A5 JPWO2021181612A5 (ja) | 2022-09-13 |
JP7327645B2 true JP7327645B2 (ja) | 2023-08-16 |
Family
ID=77670550
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022507120A Active JP7327645B2 (ja) | 2020-03-12 | 2020-03-12 | 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US20230107372A1 (ja) |
JP (1) | JP7327645B2 (ja) |
WO (1) | WO2021181612A1 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7310927B2 (ja) * | 2019-12-26 | 2023-07-19 | 日本電気株式会社 | 物体追跡装置、物体追跡方法及び記録媒体 |
US11858514B2 (en) | 2021-03-30 | 2024-01-02 | Zoox, Inc. | Top-down scene discrimination |
US11810225B2 (en) * | 2021-03-30 | 2023-11-07 | Zoox, Inc. | Top-down scene generation |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003141505A (ja) | 2001-10-30 | 2003-05-16 | Nippon Hoso Kyokai <Nhk> | 画像合成装置およびプログラム |
JP2013092876A (ja) | 2011-10-25 | 2013-05-16 | Nippon Telegr & Teleph Corp <Ntt> | 姿勢推定装置、姿勢推定方法及び姿勢推定プログラム |
WO2016114134A1 (ja) | 2015-01-14 | 2016-07-21 | 日本電気株式会社 | 移動状況推定装置、移動状況推定方法およびプログラム記録媒体 |
JP2019036009A (ja) | 2017-08-10 | 2019-03-07 | 富士通株式会社 | 制御プログラム、制御方法、及び情報処理装置 |
JP2019185210A (ja) | 2018-04-04 | 2019-10-24 | Kddi株式会社 | 物体追跡装置及び物体追跡方法 |
-
2020
- 2020-03-12 WO PCT/JP2020/010853 patent/WO2021181612A1/ja active Application Filing
- 2020-03-12 US US17/800,255 patent/US20230107372A1/en active Pending
- 2020-03-12 JP JP2022507120A patent/JP7327645B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003141505A (ja) | 2001-10-30 | 2003-05-16 | Nippon Hoso Kyokai <Nhk> | 画像合成装置およびプログラム |
JP2013092876A (ja) | 2011-10-25 | 2013-05-16 | Nippon Telegr & Teleph Corp <Ntt> | 姿勢推定装置、姿勢推定方法及び姿勢推定プログラム |
WO2016114134A1 (ja) | 2015-01-14 | 2016-07-21 | 日本電気株式会社 | 移動状況推定装置、移動状況推定方法およびプログラム記録媒体 |
JP2019036009A (ja) | 2017-08-10 | 2019-03-07 | 富士通株式会社 | 制御プログラム、制御方法、及び情報処理装置 |
JP2019185210A (ja) | 2018-04-04 | 2019-10-24 | Kddi株式会社 | 物体追跡装置及び物体追跡方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2021181612A1 (ja) | 2021-09-16 |
JPWO2021181612A1 (ja) | 2021-09-16 |
US20230107372A1 (en) | 2023-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xu et al. | Video anomaly detection and localization based on an adaptive intra-frame classification network | |
JP6525453B2 (ja) | オブジェクト位置推定システム、及びそのプログラム | |
JP7327645B2 (ja) | 画像処理装置、画像処理システム、画像処理方法、および画像処理プログラム | |
JP5459674B2 (ja) | 移動物体追跡システムおよび移動物体追跡方法 | |
JP7452016B2 (ja) | 学習データ生成プログラム、及び学習データ生成方法 | |
JPWO2018025831A1 (ja) | 人流推定装置、人流推定方法およびプログラム | |
JPWO2016114134A1 (ja) | 移動状況推定装置、移動状況推定方法およびプログラム | |
US11544926B2 (en) | Image processing apparatus, method of processing image, and storage medium | |
Hammam et al. | Real-time multiple spatiotemporal action localization and prediction approach using deep learning | |
CN113706481A (zh) | 精子质量检测方法、装置、计算机设备和存储介质 | |
CN113780145A (zh) | 精子形态检测方法、装置、计算机设备和存储介质 | |
KR101313879B1 (ko) | 기울기 히스토그램을 이용한 사람 검출 추적 시스템 및 방법 | |
Catruna et al. | Gaitpt: Skeletons are all you need for gait recognition | |
JP7538631B2 (ja) | 画像処理装置、画像処理方法、及びプログラム | |
US12080023B2 (en) | Trajectory linking apparatus, trajectory linking method, and non-transitory computer readable medium storing program | |
US20210287051A1 (en) | Methods and systems for recognizing object using machine learning model | |
JP7202995B2 (ja) | 時空間事象予測装置、時空間事象予測方法及び時空間事象予測システム | |
Mishra et al. | Automated detection of fighting styles using localized action features | |
JP2023168081A (ja) | 訓練データ生成プログラム、訓練データ生成方法及び訓練データ生成装置 | |
Grutschus et al. | Cutup and Detect: Human Fall Detection on Cutup Untrimmed Videos Using a Large Foundational Video Understanding Model | |
Shal’nov et al. | Estimation of the people position in the world coordinate system for video surveillance | |
JP7491462B2 (ja) | 因果相互作用検出装置、制御方法、及びプログラム | |
Kumar et al. | Object Detection Using SSD | |
Mehta et al. | An Automated Approach to Detect and Label Abandoned Objects from Videos using Generalized ROIs | |
JP2013114583A (ja) | 移動方向識別装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220720 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230425 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230623 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230717 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7327645 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |