JP7485217B2 - 分類装置、分類方法及びプログラム - Google Patents
分類装置、分類方法及びプログラム Download PDFInfo
- Publication number
- JP7485217B2 JP7485217B2 JP2023523666A JP2023523666A JP7485217B2 JP 7485217 B2 JP7485217 B2 JP 7485217B2 JP 2023523666 A JP2023523666 A JP 2023523666A JP 2023523666 A JP2023523666 A JP 2023523666A JP 7485217 B2 JP7485217 B2 JP 7485217B2
- Authority
- JP
- Japan
- Prior art keywords
- classification
- video data
- unit
- category
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 40
- 238000004422 calculation algorithm Methods 0.000 claims description 47
- 238000012937 correction Methods 0.000 claims description 20
- 238000011156 evaluation Methods 0.000 claims description 20
- 238000007781 pre-processing Methods 0.000 claims description 15
- 230000004048 modification Effects 0.000 claims description 7
- 238000012986 modification Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 description 39
- 238000012545 processing Methods 0.000 description 25
- 230000009471 action Effects 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 20
- 238000013507 mapping Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000004364 calculation method Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 11
- 230000006870 function Effects 0.000 description 9
- 230000010365 information processing Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 241000282412 Homo Species 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 238000011867 re-evaluation Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 240000006829 Ficus sundaica Species 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/49—Segmenting video sequences, i.e. computational techniques such as parsing or cutting the sequence, low-level clustering or determining units such as shots or scenes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/20—Movements or behaviour, e.g. gesture recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Image Analysis (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本開示の実施の形態1を、図面を参照して以下に説明する。図1を参照すると、分類装置10は、生成部11、分類部12および修正部13を備える。分類装置10は、ビデオデータを扱うことができる様々なコンピュータ又は機械に適用されてもよい。例えば、分類装置10は、パーソナルコンピュータ、ビデオレコーダ、ロボット、機械、テレビ、携帯電話などとして設置されてもよい。
本開示の実施の形態2を、図面を参照して以下に説明する。図3を参照すると、制御装置14は、認識部15とコントローラ16とを備える。制御装置14は、例えば人間を支援するロボットといった、様々なコンピュータ又は機械に搭載された装置に適用されてもよい。
本開示の実施の形態3を、図面を参照して以下に説明する。実施の形態3は、実施の形態1の具体例である。
本開示の実施の形態4を、図面を参照して以下に説明する。
本開示の実施の形態5を、図面を参照して以下に説明する。この実施の形態は、意図検出システム30の特定用途を説明する。
(付記1)
所定のアルゴリズムに基づいてビデオデータの特定の時間領域を決定し、前記特定の時間領域において前記ビデオデータが抽出された部分ビデオデータを生成する生成手段と、
前記生成手段によって生成された前記部分ビデオデータを分類する分類手段と、
前記分類手段によって実行された分類の評価に基づいて、前記所定のアルゴリズムを修正する修正手段と、
を備える分類装置。
(付記2)
未加工のデータに含まれる情報を削減し、前記分類に関連する情報を含む前記ビデオデータを生成する前処理手段をさらに備える、
付記1に記載の分類装置。
(付記3)
前記修正手段は、同一のカテゴリに属することがすでに知られている要素を、前記分類手段が前記同一のカテゴリの一部としてどの程度良く分類しているかを示す指標、定義された問題に対する既定のカテゴリ数からの偏差を示す指標、及び、前記分類装置を含むシステムが全体的なタスクをどの程度達成しているかを示す指標のうち、少なくとも1つの指標を使用して前記分類を評価する、
付記1又は2に記載の分類装置。
(付記4)
前記分類手段は、前記部分ビデオデータを人間の動作の一種として分類する、
付記1から3のいずれか1項に記載の分類装置。
(付記5)
前記生成手段は、前記ビデオデータの強度信号を計算して前記特定の時間領域を決定し、前記強度信号は人の動作を示す、
付記4に記載の分類装置。
(付記6)
前記分類手段は、分類された前記部分ビデオデータをテキストラベルに割り当てる、
付記4または5に記載の分類装置。
(付記7)
分類された前記部分ビデオデータを用いて人間の意図を検出する意図検出手段をさらに備える、
付記4から6のいずれか1項に記載の分類装置。
(付記8)
前記意図検出手段によって検出された人間の意図に基づいて機械の動作を制御するコントローラをさらに備える、
付記7に記載の分類装置。
(付記9)
作業を含むビデオデータを認識し、それによって前記作業を決定する認識手段と、
決定された前記作業に応じて機械の動作を決定し、前記決定された作業に従って前記機械を制御するコントローラと、
を備える制御装置。
(付記10)
前記ビデオデータを分類し、分類された前記ビデオデータを前記認識手段に入力する分類手段をさらに備える、
付記9に記載の制御装置。
(付記11)
所定のアルゴリズムに基づいてビデオデータの特定の時間領域を決定し、前記特定の時間領域において前記ビデオデータが抽出された部分ビデオデータを生成する生成手段と、
前記分類手段によって実行された分類の評価に基づいて、前記所定のアルゴリズムを修正する修正手段と、をさらに備え、
前記部分ビデオデータは前記認識手段によって認識される、
付記10に記載の制御装置。
(付記12)
前記修正手段は、同一のカテゴリに属することがすでに知られている要素を、前記分類手段が前記同一のカテゴリの一部としてどの程度良く分類しているかを示す指標、定義された問題に対する既定のカテゴリ数からの偏差を示す指標、及び、前記分類装置を含むシステムが全体的なタスクをどの程度達成しているかを示す指標のうち、少なくとも1つの指標を使用して前記分類を評価する、
付記11に記載の制御装置。
(付記13)
前記分類手段は、前記ビデオデータを人間の動作の一種として分類する、
付記10から12のいずれか1項に記載の制御装置。
(付記14)
所定のアルゴリズムに基づいてビデオデータの特定の時間領域を決定し、前記特定の時間領域において前記ビデオデータが抽出された部分ビデオデータを生成することと、
前記部分ビデオデータを分類することと、
分類の評価に基づいて、前記所定のアルゴリズムを修正することと、
を含む分類方法。
(付記15)
作業を含むビデオデータを認識し、それによって前記作業を決定することと、
決定された前記作業に応じて機械の動作を決定し、前記決定された作業に従って前記機械を制御することと、
を含む制御方法。
(付記16)
所定のアルゴリズムに基づいてビデオデータの特定の時間領域を決定し、前記特定の時間領域において前記ビデオデータが抽出された部分ビデオデータを生成することと、
前記部分ビデオデータを分類することと、
分類の評価に基づいて、前記所定のアルゴリズムを修正することと、
をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体。
(付記17)
作業を含むビデオデータを認識し、それによって前記作業を決定することと、
決定された前記作業に応じて機械の動作を決定し、前記決定された作業に従って前記機械を制御することと、
をコンピュータに実行させるプログラムを格納する非一時的なコンピュータ可読媒体。
11 生成部
12 分類部
13 修正部
14 制御装置
15 認識部
16 コントローラ
20 分類システム
21 前処理部
22 生成部
23 分類部
24 マッピング部
25 修正部
26 計算部
27 信号分析部
28 決定部
29 サブシーケンス生成部
30 意図検出システム
31 人物対象分析部
32 意図検出部
40 機械
41 信号発生器
42 オプティマイザコントローラ
Claims (8)
- 所定のアルゴリズムに基づいてビデオデータの特定の時間領域を決定し、前記特定の時間領域において前記ビデオデータが抽出された部分ビデオデータを生成する生成手段と、
前記生成手段によって生成された前記部分ビデオデータを所定のカテゴリに分類する分類手段と、
前記分類手段によって実行された分類の評価に基づいて、前記所定のカテゴリが適切でないと判断した場合に、前記生成手段に対し、前記所定のアルゴリズムのうち前記所定のカテゴリに対応する部分を修正させる修正手段と、
を備える分類装置。 - 前記生成手段は、前記所定のアルゴリズムを用いて、前記ビデオデータの強度信号を計算し、前記強度信号を分析することで特徴点を決定し、前記特徴点を用いて前記部分ビデオデータを生成し、
前記修正手段は、前記所定のカテゴリに対応する部分として、前記強度信号を計算する方法を変更させる、
請求項1に記載の分類装置。 - 前記生成手段は、前記所定のアルゴリズムを用いて、前記ビデオデータの強度信号を計算し、前記強度信号を分析することで特徴点を決定し、前記特徴点を用いて前記部分ビデオデータを生成し、
前記修正手段は、前記所定のカテゴリに対応する部分として、前記特徴点を決定する方法を変更させる、
請求項1に記載の分類装置。 - 未加工のデータに含まれる情報を削減し、前記分類に関連する情報を含む前記ビデオデータを生成する前処理手段をさらに備える、
請求項1から3のいずれか1項に記載の分類装置。 - 前記修正手段は、同一のカテゴリに属することがすでに知られている要素を、前記分類手段が前記同一のカテゴリの一部としてどの程度良く分類しているかを示す指標、定義された問題に対する既定のカテゴリ数からの偏差を示す指標、及び、前記分類装置を含むシステムが全体的なタスクをどの程度達成しているかを示す指標のうち、少なくとも1つの指標を使用して前記分類を評価する、
請求項1から4のいずれか1項に記載の分類装置。 - 前記分類手段は、前記部分ビデオデータを人間の動作の一種として分類する、
請求項1から5のいずれか1項に記載の分類装置。 - 所定のアルゴリズムに基づいてビデオデータの特定の時間領域を決定し、前記特定の時間領域において前記ビデオデータが抽出された部分ビデオデータを生成することと、
前記部分ビデオデータを所定のカテゴリに分類することと、
分類の評価に基づいて、前記所定のカテゴリが適切でないと判断した場合に、前記所定のアルゴリズムのうち前記所定のカテゴリに対応する部分を修正することと、
を含む分類方法。 - 所定のアルゴリズムに基づいてビデオデータの特定の時間領域を決定し、前記特定の時間領域において前記ビデオデータが抽出された部分ビデオデータを生成することと、
前記部分ビデオデータを所定のカテゴリに分類することと、
分類の評価に基づいて、前記所定のカテゴリが適切でないと判断した場合に、前記所定のアルゴリズムのうち前記所定のカテゴリに対応する部分を修正することと、
をコンピュータに実行させるプログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2020/040660 WO2022091304A1 (en) | 2020-10-29 | 2020-10-29 | Categorization apparatus, control device, categorization method, control method and computer readable medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023546189A JP2023546189A (ja) | 2023-11-01 |
JP7485217B2 true JP7485217B2 (ja) | 2024-05-16 |
Family
ID=81382079
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023523666A Active JP7485217B2 (ja) | 2020-10-29 | 2020-10-29 | 分類装置、分類方法及びプログラム |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP7485217B2 (ja) |
WO (1) | WO2022091304A1 (ja) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202653A (ja) | 2004-01-15 | 2005-07-28 | Canon Inc | 動作認識装置及び方法、動物体認識装置及び方法、機器制御装置及び方法、並びにプログラム |
JP2009009413A (ja) | 2007-06-28 | 2009-01-15 | Sanyo Electric Co Ltd | 動作検知装置及び動作検知プログラム、並びに動作基本モデル生成装置及び動作基本モデル生成プログラム |
JP2020021421A (ja) | 2018-08-03 | 2020-02-06 | 株式会社東芝 | データ分割装置、データ分割方法およびプログラム |
WO2020050111A1 (ja) | 2018-09-03 | 2020-03-12 | 国立大学法人東京大学 | 動作認識方法及び装置 |
JP2020126144A (ja) | 2019-02-05 | 2020-08-20 | ソフトバンク株式会社 | システム、サーバ装置及びプログラム |
-
2020
- 2020-10-29 WO PCT/JP2020/040660 patent/WO2022091304A1/en active Application Filing
- 2020-10-29 JP JP2023523666A patent/JP7485217B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005202653A (ja) | 2004-01-15 | 2005-07-28 | Canon Inc | 動作認識装置及び方法、動物体認識装置及び方法、機器制御装置及び方法、並びにプログラム |
JP2009009413A (ja) | 2007-06-28 | 2009-01-15 | Sanyo Electric Co Ltd | 動作検知装置及び動作検知プログラム、並びに動作基本モデル生成装置及び動作基本モデル生成プログラム |
JP2020021421A (ja) | 2018-08-03 | 2020-02-06 | 株式会社東芝 | データ分割装置、データ分割方法およびプログラム |
WO2020050111A1 (ja) | 2018-09-03 | 2020-03-12 | 国立大学法人東京大学 | 動作認識方法及び装置 |
JP2020126144A (ja) | 2019-02-05 | 2020-08-20 | ソフトバンク株式会社 | システム、サーバ装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
WO2022091304A1 (en) | 2022-05-05 |
JP2023546189A (ja) | 2023-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10296102B1 (en) | Gesture and motion recognition using skeleton tracking | |
US20170232294A1 (en) | Systems and methods for using wearable sensors to determine user movements | |
US20150029092A1 (en) | Systems and methods of interpreting complex gestures | |
JP2021503662A (ja) | ニューラルネットワークのモデルの訓練 | |
JP2014137818A (ja) | 手の平開閉動作識別方法と装置、マン・マシン・インタラクション方法と設備 | |
CN104350509A (zh) | 快速姿势检测器 | |
Masood et al. | Measuring and reducing observational latency when recognizing actions | |
US11825278B2 (en) | Device and method for auto audio and video focusing | |
JP2011170711A (ja) | 移動物体追跡システムおよび移動物体追跡方法 | |
JP7192143B2 (ja) | オンライン学習を利用した物体追跡のための方法およびシステム | |
KR20140134803A (ko) | 다중 클래스 svm과 트리 분류를 이용한 제스처 인식 장치 및 방법 | |
JPWO2020026643A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
EP3379482A1 (en) | Information processing device calculating statistical information | |
US20210019547A1 (en) | System and a method for efficient image recognition | |
CN112668607A (zh) | 一种用于目标物体触觉属性识别的多标签学习方法 | |
US20190355479A1 (en) | Method and system for automated inclusion or exclusion criteria detection | |
Ponce-López et al. | Non-verbal communication analysis in victim–offender mediations | |
Li et al. | Recognizing hand gestures using the weighted elastic graph matching (WEGM) method | |
KR101287948B1 (ko) | 동작 인식 방법, 장치 및 이 방법을 수행하는 컴퓨터 판독 가능한 기록 매체 | |
JP7485217B2 (ja) | 分類装置、分類方法及びプログラム | |
KR20140140482A (ko) | 오브젝트의 움직임을 이용하여 사용자 입력을 처리하는 장치 및 방법 | |
Sen et al. | HGR-FYOLO: a robust hand gesture recognition system for the normal and physically impaired person using frozen YOLOv5 | |
Babu et al. | Controlling Computer Features Through Hand Gesture | |
Christensen et al. | An experience-based direct generation approach to automatic image cropping | |
Harini et al. | A novel static and dynamic hand gesture recognition using self organizing map with deep convolutional neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230418 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230418 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20231121 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240117 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240402 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240415 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7485217 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |