JP2021144525A - 検出装置、検出方法およびプログラム - Google Patents
検出装置、検出方法およびプログラム Download PDFInfo
- Publication number
- JP2021144525A JP2021144525A JP2020043274A JP2020043274A JP2021144525A JP 2021144525 A JP2021144525 A JP 2021144525A JP 2020043274 A JP2020043274 A JP 2020043274A JP 2020043274 A JP2020043274 A JP 2020043274A JP 2021144525 A JP2021144525 A JP 2021144525A
- Authority
- JP
- Japan
- Prior art keywords
- time zone
- time
- correction
- likelihood
- feature amount
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 203
- 238000012937 correction Methods 0.000 claims abstract description 186
- 230000009471 action Effects 0.000 claims abstract description 121
- 230000007423 decrease Effects 0.000 claims description 2
- 238000000034 method Methods 0.000 description 47
- 230000006399 behavior Effects 0.000 description 36
- 230000008569 process Effects 0.000 description 31
- 238000004364 calculation method Methods 0.000 description 24
- 238000012545 processing Methods 0.000 description 22
- 238000010586 diagram Methods 0.000 description 16
- 230000006870 function Effects 0.000 description 13
- 238000000605 extraction Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 230000002123 temporal effect Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/98—Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/46—Extracting features or characteristics from the video content, e.g. video fingerprints, representative shots or key frames
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/44—Event detection
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Psychiatry (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Human Computer Interaction (AREA)
- Quality & Reliability (AREA)
- Computing Systems (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
- Closed-Circuit Television Systems (AREA)
Abstract
Description
第1の実施形態にかかる検出装置は、複数の時間帯候補の基準を持つ推定モデルによりカテゴリごとに適切な時間帯を算出する。これにより、時間帯検出の精度、および、行動のカテゴリ検出の精度を向上することができる。
(A1)棚から商品を取り出す動作
(A2)棚に商品を戻す動作
(A3)商品を買い物カゴに入れる動作
(A4)商品を買い物カゴから出す動作
(A5)商品を自分の服に隠す動作
・一定時間帯の開始時刻から、一定時間帯の50%までの時間帯、すなわち一定時間帯の前半に対応する時間帯候補301
・一定時間帯の開始時刻から一定時間の30%経過した時刻から70%経過した時刻まで、すなわち一定時間帯の中心40%分に対応する時間帯候補302
・一定時間帯の末尾の25%に対応する時間帯候補303
(R1)特徴量算出部102が出力する時系列の特徴量が、時間帯記憶部114に記憶された修正時間帯を含まなくなった。
(R2)推定部123が新規に算出した修正時間帯と、時間帯記憶部114に記憶された修正時間帯とが重複を持たない時刻が一定時間以上経過した。
(S1)時間帯記憶部114に記憶された推定結果のうち、行動カテゴリ尤度が低い推定結果を除外する処理
(S2)時間帯の重複が多い複数の修正時間帯を対象とし、これらの複数の修正時間帯のうち最も行動カテゴリ尤度の高い修正時間帯のみを残し、その他の修正時間帯に対応する推定結果を除外するノンマキシマムサプレッション(Non-Maximum Suppression)処理(以下、NMS処理)
第2の実施形態にかかる検出装置は、時間帯候補を調整する機能をさらに有する。図8は、第2の実施形態にかかる検出装置100−2の構成の一例を示すブロック図である。図8に示すように、検出装置100−2は、カメラ101と、画像記憶部111と、特徴量算出部102と、特徴量記憶部112と、出力部103と、記憶部113と、時間帯記憶部114と、制御部120−2と、を備えている。
例えば設定部122−2は、時間帯記憶部114に記憶されている複数の修正時間帯の開始時刻および終了時刻に対して統計的クラスタリング手法を適用し、開始時刻および終了時刻が相互に類似する修正時間帯を含む複数のクラスタを算出する。設定部122−2は、各クラスタに含まれる修正時間帯の開始時刻および終了時刻の代表値(平均値、中央値など)を算出する。設定部122−2は、代表値を、新たな時間帯候補の開始時刻および終了時刻とする。
例えば設定部122−2は、時間帯記憶部114に記憶されている複数の修正時間帯の開始時刻および終了時刻それぞれを近似するモデルを求める。設定部122−2は、求めたモデルから、モデルが示す値に応じて開始時刻および終了時刻をサンプリングし、サンプリングされた開始時刻および終了時刻により定められる時間帯候補を設定する。
設定部122−2は、最も頻度が大きい開始時刻および終了時刻を算出し、新たな時間帯候補の開始時刻および終了時刻としてもよい。
第1および第2の実施形態は、特徴量記憶部112に記憶される規定の長さの特徴量全てを用いて修正時間帯を算出した。このような方法によれば、規定の長さ全体に相当する大域的な特徴量に基づく行動の検出が可能となる。一方、一部の特徴量を用いれば、規定の長さより小さい局所的な特徴量(局所特徴量)に基づく行動の検出が可能となる。
101 カメラ
102 特徴量算出部
103 出力部
111 画像記憶部
112 特徴量記憶部
113 記憶部
114 時間帯記憶部
120、120−2、120−3 制御部
121 取得部
122、122−2 設定部
123、123−3 推定部
124 検出部
125 出力制御部
Claims (13)
- 予め定められた1以上の時間帯候補を設定する設定部と、
複数の時系列画像から求められる特徴量と、前記時間帯候補と、を入力し、検出対象として予め定められた1以上の行動それぞれが発生した尤度を示す1以上の第1尤度と、1以上の前記時間帯候補それぞれを修正した1以上の修正時間帯を求めるための修正情報と、を出力する第1モデルに、前記特徴量および前記時間帯候補を入力し、前記第1モデルが出力する前記第1尤度および前記修正情報を得る推定部と、
前記修正情報に基づいて求められる1以上の前記修正時間帯と、前記第1尤度とに基づいて、前記時系列画像に含まれる前記行動と、前記行動が発生した時間帯の開始時刻および終了時刻と、を検出する検出部と、
を備える検出装置。 - 前記推定部は、定期的に求められる複数の特徴量および前記時間帯候補を前記第1モデルに入力し、前記第1モデルが出力する複数の第1尤度および複数の修正情報を得て、
前記検出部は、複数の前記修正情報に基づいて求められる複数の前記修正時間帯のうち、対応する前記第1尤度が他の前記修正時間帯より大きい前記修正時間帯の開始時刻、終了時刻、および、対応する前記行動を検出する、
請求項1に記載の検出装置。 - 前記設定部は、複数の前記特徴量に対して求められた複数の前記修正時間帯に基づいて得られる1以上の時間帯を、新たな時間帯候補として追加する、
請求項2に記載の検出装置。 - 前記設定部は、前記修正時間帯と前記時間帯候補との差分が減少するように、前記時間帯候補を修正する、
請求項1に記載の検出装置。 - 前記第1モデルは、さらに、前記行動が発生しない尤度である第2尤度を出力し、
前記検出部は、前記修正時間帯と、前記第1尤度と、前記第2尤度と、に基づいて、前記時系列画像に含まれる前記行動と、前記行動が発生した時間帯の開始時刻および終了時刻と、を検出する、
請求項1に記載の検出装置。 - 前記設定部は、複数の時間帯候補から前記特徴量に応じた1以上の前記時間帯候補を選択し、選択した前記時間帯候補を設定する、
請求項1に記載の検出装置。 - 前記推定部は、
複数の時系列画像から求められる第1特徴量および前記時間帯候補を前記第1モデルに入力し、前記第1尤度および前記修正情報を得て、
特徴量を入力し、行動が発生した尤度の修正量を表す尤度修正量と、修正時間帯の修正量を表す時間帯再修正量と、を出力する第2モデルに、前記修正情報に基づいて求められる第1修正時間帯に対応する第2特徴量を入力し、前記第2モデルが出力する前記尤度修正量および前記時間帯再修正量を得て、
前記検出部は、前記第1修正時間帯と、前記第1修正時間帯を前記時間帯再修正量により修正した第2修正時間帯と、前記第1尤度と、前記第1尤度を前記尤度修正量により修正した第2尤度と、に基づいて、前記時系列画像に含まれる前記行動、前記開始時刻および前記終了時刻を検出する、
請求項1に記載の検出装置。 - 前記推定部は、
複数の時系列画像から求められる第1特徴量および前記時間帯候補を前記第1モデルに入力し、前記第1尤度および前記修正情報を得て、
特徴量を入力し、行動が発生した尤度の修正量を表す尤度修正量と、修正時間帯の修正量を表す時間帯再修正量と、を出力する第2モデルに、前記修正情報に基づいて求められる第1修正時間帯に対応する第2特徴量を入力し、前記第2モデルが出力する前記尤度修正量および前記時間帯再修正量を得て、
前記検出部は、前記第1修正時間帯を前記時間帯再修正量により修正した第2修正時間帯と、前記第1尤度を前記尤度修正量により修正した第2尤度と、に基づいて、前記時系列画像に含まれる前記行動、前記開始時刻および前記終了時刻を検出する、
請求項1に記載の検出装置。 - 前記推定部は、複数の時系列画像から求められる第1特徴量、および、前記第1特徴量を前記時間帯候補に対応するように修正した第2特徴量を前記第1モデルに入力し、前記第1モデルが出力する前記第1尤度および前記修正情報を得る、
請求項1に記載の検出装置。 - 前記推定部は、複数の時系列画像から求められる第1特徴量を前記時間帯候補に対応するように修正した第2特徴量を前記第1モデルに入力し、前記第1モデルが出力する前記第1尤度および前記修正情報を得る、
請求項1に記載の検出装置。 - 前記修正情報は、前記第1尤度が他の時間帯より大きくなる時間帯へ前記時間帯候補を修正する修正量、または、前記第1尤度が他の時間帯より大きくなる時間帯へ前記時間帯候補を修正した時間帯を示す、
請求項1に記載の検出装置。 - 予め定められた1以上の時間帯候補を設定する設定ステップと、
複数の時系列画像から求められる特徴量と、前記時間帯候補と、を入力し、検出対象として予め定められた1以上の行動それぞれが発生した尤度を示す1以上の第1尤度と、1以上の前記時間帯候補それぞれを修正した1以上の修正時間帯を求めるための修正情報と、を出力する第1モデルに、前記特徴量および前記時間帯候補を入力し、前記第1モデルが出力する前記第1尤度および前記修正情報を得る推定ステップと、
前記修正情報に基づいて求められる1以上の前記修正時間帯と、前記第1尤度とに基づいて、前記時系列画像に含まれる前記行動と、前記行動が発生した時間帯の開始時刻および終了時刻と、を検出する検出ステップと、
を含む検出方法。 - コンピュータに、
予め定められた1以上の時間帯候補を設定する設定ステップと、
複数の時系列画像から求められる特徴量と、前記時間帯候補と、を入力し、検出対象として予め定められた1以上の行動それぞれが発生した尤度を示す1以上の第1尤度と、1以上の前記時間帯候補それぞれを修正した1以上の修正時間帯を求めるための修正情報と、を出力する第1モデルに、前記特徴量および前記時間帯候補を入力し、前記第1モデルが出力する前記第1尤度および前記修正情報を得る推定ステップと、
前記修正情報に基づいて求められる1以上の前記修正時間帯と、前記第1尤度とに基づいて、前記時系列画像に含まれる前記行動と、前記行動が発生した時間帯の開始時刻および終了時刻と、を検出する検出ステップと、
を実行させるためのプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020043274A JP7247133B2 (ja) | 2020-03-12 | 2020-03-12 | 検出装置、検出方法およびプログラム |
US17/000,568 US11580739B2 (en) | 2020-03-12 | 2020-08-24 | Detection apparatus, detection method, and computer program product |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020043274A JP7247133B2 (ja) | 2020-03-12 | 2020-03-12 | 検出装置、検出方法およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021144525A true JP2021144525A (ja) | 2021-09-24 |
JP7247133B2 JP7247133B2 (ja) | 2023-03-28 |
Family
ID=77664966
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020043274A Active JP7247133B2 (ja) | 2020-03-12 | 2020-03-12 | 検出装置、検出方法およびプログラム |
Country Status (2)
Country | Link |
---|---|
US (1) | US11580739B2 (ja) |
JP (1) | JP7247133B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114640608A (zh) * | 2022-04-01 | 2022-06-17 | 上海商汤智能科技有限公司 | 测试方法及装置、电子设备及计算机可读存储介质 |
CN114664290B (zh) * | 2022-05-17 | 2022-08-19 | 深圳比特微电子科技有限公司 | 声音事件检测方法、装置及可读存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190114487A1 (en) * | 2017-10-12 | 2019-04-18 | Google Llc | Generating a video segment of an action from a video |
JP2019149154A (ja) * | 2018-02-27 | 2019-09-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109152555B (zh) * | 2016-03-18 | 2022-09-06 | 哈佛大学校长及研究员协会 | 自动分类动物行为 |
US20180218303A1 (en) * | 2017-02-01 | 2018-08-02 | Weather Build, Inc. | Systems and methods for analyzing weather event impacts on schedule activities |
US10522186B2 (en) * | 2017-07-28 | 2019-12-31 | Adobe Inc. | Apparatus, systems, and methods for integrating digital media content |
US10417500B2 (en) * | 2017-12-28 | 2019-09-17 | Disney Enterprises, Inc. | System and method for automatic generation of sports media highlights |
EP3750140A4 (en) * | 2018-02-09 | 2021-05-19 | Skydio Inc. | INTELLIGENT AIR VEHICLE LANDING |
US10719712B2 (en) * | 2018-02-26 | 2020-07-21 | Canon Kabushiki Kaisha | Classify actions in video segments using play state information |
WO2019167775A1 (ja) * | 2018-02-27 | 2019-09-06 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
US11663307B2 (en) * | 2018-09-24 | 2023-05-30 | Georgia Tech Research Corporation | RtCaptcha: a real-time captcha based liveness detection system |
US11200424B2 (en) * | 2018-10-12 | 2021-12-14 | Adobe Inc. | Space-time memory network for locating target object in video content |
KR102374448B1 (ko) * | 2018-11-02 | 2022-03-15 | 서울대학교산학협력단 | 사용자의 의도 예측 방법 및 이를 수행하기 위한 장치 |
CN110059661B (zh) * | 2019-04-26 | 2022-11-22 | 腾讯科技(深圳)有限公司 | 动作识别方法、人机交互方法、装置及存储介质 |
US11562170B2 (en) * | 2019-07-15 | 2023-01-24 | Microsoft Technology Licensing, Llc | Modeling higher-level metrics from graph data derived from already-collected but not yet connected data |
CN110650368B (zh) * | 2019-09-25 | 2022-04-26 | 新东方教育科技集团有限公司 | 视频处理方法、装置和电子设备 |
WO2021137671A1 (en) * | 2020-01-03 | 2021-07-08 | Samsung Electronics Co., Ltd. | Video generation apparatus and video generation method performed by the video generation apparatus |
JP7497223B2 (ja) * | 2020-06-16 | 2024-06-10 | キヤノン株式会社 | 画像処理装置、画像処理方法、及びプログラム |
-
2020
- 2020-03-12 JP JP2020043274A patent/JP7247133B2/ja active Active
- 2020-08-24 US US17/000,568 patent/US11580739B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20190114487A1 (en) * | 2017-10-12 | 2019-04-18 | Google Llc | Generating a video segment of an action from a video |
JP2019149154A (ja) * | 2018-02-27 | 2019-09-05 | キヤノン株式会社 | 情報処理装置、情報処理方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210287010A1 (en) | 2021-09-16 |
US11580739B2 (en) | 2023-02-14 |
JP7247133B2 (ja) | 2023-03-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6213843B2 (ja) | 画像処理システム、画像処理方法及びプログラム | |
CN110443833B (zh) | 对象跟踪方法和设备 | |
JP6973533B2 (ja) | 解析装置、解析方法及びプログラム | |
US11379993B2 (en) | Image processing apparatus, image processing method, and storage medium | |
EP3189469A1 (en) | A method for selecting frames from video sequences based on incremental improvement | |
JP7247133B2 (ja) | 検出装置、検出方法およびプログラム | |
US11080532B2 (en) | Highlight processing method using human pose based triggering scheme and associated system | |
US9396538B2 (en) | Image processing system, image processing method, and program | |
US20200311440A1 (en) | Image processing apparatus and image processing method for image analysis process | |
WO2021211226A1 (en) | Face clustering in video streams | |
JP7446060B2 (ja) | 情報処理装置、プログラム及び情報処理方法 | |
JP2014186547A (ja) | 移動物体追跡システム、方法及びプログラム | |
CN113706837B (zh) | 一种发动机异常状态检测方法和装置 | |
US10997398B2 (en) | Information processing apparatus, authentication system, method of controlling same, and medium | |
JPWO2017163283A1 (ja) | 監視装置及び監視システム | |
CN112927258A (zh) | 一种目标跟踪方法及装置 | |
US11716448B2 (en) | Information processing apparatus, information processing method, and storage medium | |
US11216667B2 (en) | Information processing apparatus, method for information processing, and storage medium | |
JP2010087937A (ja) | 映像検出装置、映像検出方法および映像検出プログラム | |
KR101994287B1 (ko) | 영상 백업 장치 및 방법 | |
JP5599228B2 (ja) | 繁忙検知システム及び繁忙検知プログラム | |
US20200293785A1 (en) | Information processing apparatus, information processing method, and medium | |
TW201431369A (zh) | 異常物體偵測方法與電子裝置 | |
JP5873415B2 (ja) | 前景検出装置、前景検出方法及びコンピュータプログラム | |
JPWO2006129622A1 (ja) | 特徴量の予測誤差に基づいて動画像のカット点を検出する装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220224 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230104 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230127 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230214 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230315 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7247133 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |