JP2020064568A - 映像解析システム、学習装置、及びその方法 - Google Patents
映像解析システム、学習装置、及びその方法 Download PDFInfo
- Publication number
- JP2020064568A JP2020064568A JP2018197678A JP2018197678A JP2020064568A JP 2020064568 A JP2020064568 A JP 2020064568A JP 2018197678 A JP2018197678 A JP 2018197678A JP 2018197678 A JP2018197678 A JP 2018197678A JP 2020064568 A JP2020064568 A JP 2020064568A
- Authority
- JP
- Japan
- Prior art keywords
- teacher
- target
- feature amount
- model
- modal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Image Analysis (AREA)
Abstract
Description
例えば、下記式(2)、(3)
251は識別データ選定部であり、この情報によりデータ入力部220はデータを取得する。以下、105、202、203、204、116,115,206の処理は、図4と同様なので省略する。そして、識別された結果を外部インターフェース252へ出力する。
Claims (13)
- 入力された教師マルチモーダルデータからそれぞれのモーダルの教師特徴量を抽出する教師特徴量抽出部と、
入力された標的モーダルデータから標的特徴量を抽出する標的特徴量抽出部と、
前記教師特徴量と前記標的特徴量を同じ特徴量空間へお互いに距離を縮めるように射影モデルを学習する共有特徴量空間射影モデル学習部と、
前記共有特徴量空間射影モデル学習部で教師モーダルごとに構築した教師射影モデルから射影した教師射影特徴量を用いて、教師識別モデルを基に、教師識別情報を計算する教師識別情報計算部と、
前記教師識別情報計算部で計算されたそれぞれのモーダルの前記教師識別情報をアンサンブルし教師識別情報を出力する教師識別情報アンサンブル処理部と、
前記共有特徴量空間射影モデル学習部で構築した標的射影モデルから射影した標的射影特徴量を用いて、標的識別モデルを基に、標的識別情報を計算する標的識別情報計算部と、
前記標的識別情報計算部によって計算された標的識別情報と前記教師識別情報アンサンブル処理部から出力された教師識別情報を基に、標的識別モデルと教師識別モデルのパラメータの更新度合いである学習コストを計算する識別モデル学習コスト計算部と、
該計算された学習コストを基に標的識別モデルを更新する標的識別モデル更新部と、
該計算された学習コストを基に教師識別モデルを更新する教師識別モデル更新部と、
更新済みの前記標的識別モデルと前記教師識別モデルを記憶する識別モデル記憶部と、
前記学習した射影モデルを記憶する共有特徴量空間射影モデル記憶部とを備えることを特徴とするマルチモーダル学習装置。 - 請求項1に記載のマルチモーダル学習装置で学習された前記標的識別モデルを基に、一部のモーダルを有する環境で識別を行う時に、前記標的モーダルのみを用いて、識別情報を計算し、識別結果を推定する識別結果推定部、を備えることを特徴とする標的モーダル識別装置。
- 入力されたデータから教師特徴量、標的特徴量を取得し、
1つの教師モデルごとに、
前記教師特徴量及び前記標的特徴量を共有特徴量空間に正射影し、正射影モデルから共有特徴量空間に射影された特徴量ペア間のペアワイズ距離Dを計算し、共有特徴量空間に射影された教師特徴量を元の教師特徴量の空間に逆射影し、逆射影された教師特徴量と元の教師特徴量間の距離D’を計算し、D+D’を最小化するように、正射影モデルと逆射影モデルを更新する処理を繰り返すことを特徴とする射影モデル学習方法。 - 入力されたデータから教師特徴量と標的特徴量を組として取得し、
入力データ組ごとに、
教師推定クラス確率分布と標的推定クラス確率分布を計算し、
標的射影特徴量と教師射影特徴量を基に、入力された特徴量を分類し、標的モーダルになる確率を出力し、
教師推定クラス確率分布と標的推定クラス確率分布を元に、教師誤差評価を算出し、
クラス真値分布と標的推定クラス確率分布を元に、推定誤差評価を算出し、
前記教師誤差評価と前記推定誤差評価と前記分類誤差評価の値と共有特徴量空間射影モデル学習部から出力された射影誤差とから、標的識別モデルと教師識別モデルのパラメータを更新する処理を繰り返すことを特徴とする識別モデル更新処理方法。 - 入力されたデータから標的モーダルデータ、教師モーダルデータからなる学習データ組を読み込み、
学習データ組ごとに、
入力された教師マルチモーダルデータから教師特徴量を抽出し、
入力された標的モーダルデータから標的特徴量を抽出し、
前記教師特徴量と前記標的特徴量を同じ特徴量空間へお互いに距離を縮めるように射影モデルを学習し、
前記教師モーダルごとに構築した教師射影モデルから射影した教師射影特徴量を用いて、教師識別モデルを基に、教師識別情報を計算し、
前記計算した教師識別情報をアンサンブルし教師識別情報を出力し、
前記標的射影モデルから射影した標的射影特徴量を用いて、標的識別モデルを基に、標的識別情報を計算し、
前記計算された標的識別情報と前記教師識別情報アンサンブル処理部から出力された教師識別情報を基に、標的識別モデルと教師識別モデルのパラメータの更新度合いである学習コストを計算し、
該計算された学習コストを基に標的識別モデルを更新し、
該計算された学習コストを基に教師識別モデルを更新し、
更新済みの前記標的識別モデルと前記教師識別モデルを記憶し、
前記学習した射影モデルを記憶する、処理を繰り返すことを特徴とするマルチモーダル学習方法。 - 請求項5に記載のマルチモーダル学習方法で学習された前記標的識別モデルを基に、一部のモーダルを有する環境で識別を行う時に、前記標的モーダルのみを用いて、識別情報を計算し、識別結果を推定することを特徴とする標的モーダル識別方法。
- 請求項1に記載のマルチモーダル学習装置に用いるマルチモーダルデータ収集装置であって、
眼鏡型ウェアラブル装置が有しているウェアラブルカメラ、加速度センサ、ジャイロセンサ、
または、スマートウォッチが有している加速度センサや心拍センサ、
または、スマートフォンが有している加速度センサ、ジャイロセンサ、マイクロフォン、WiFi通信器、
または、スマートシューズやスマートソールが有している、加速度センサ、ジャイロセンサ、圧感センサ、
のいずれかであることを特徴とするマルチモーダルデータ収集装置。 - 入力されたデータから画像及び映像である標的モーダルデータ、センサデータである教師モーダルデータからなる学習データ組を読み込み、
学習データ組ごとに、
前記画像から人物の位置を検出し、人物領域特徴量を抽出し、
前記映像から動的特徴量を抽出し、加速度特徴量を抽出し、
前記人物領域特徴量と前記動的特徴量と前記加速度特徴量を元に、それぞれのモーダルの射影モデルを学習し、
射影特徴量を用いて、標的識別モデルとなる画像識別モデルと映像識別モデルを学習する処理を繰り返すことを特徴とする細粒度行動認識モデルの学習方法。 - 請求項8に記載の細粒度行動認識モデルの学習方法で学習された前記標的識別モデルを基に、前記標的モーダルのみを用いて、識別情報を計算し、識別結果を推定することを特徴とする細粒度行動認識方法。
- 入力されたデータから画像及び映像である標的モーダルデータ、センサデータである教師モーダルデータからなる学習データ組を読み込み、
学習データ組ごとに、
前記画像から物体の位置を検出し、物体領域特徴量を抽出し、
前記映像から人物動線を検出し、動線変化の動線特徴量を抽出し、
前記センサデータから加速度特徴量を抽出し、心拍特徴量を算出し、
前記加速度特徴量と前記心拍特徴量のアンサンブル処理を行い1つの教師識別モデルを構築し、
前記物体領域特徴量と前記動線特徴量と前記教師識別モデルを元に、それぞれのモーダルの射影モデルを学習し、
射影特徴量を用いて、標的識別モデルとなる画像識別モデルと映像識別モデルを学習する処理を繰り返すことを特徴とする荷物重さ推定モデルの学習方法。 - 請求項10に記載の荷物重さ推定モデルの学習方法で学習された前記標的識別モデルを基に、前記標的モーダルのみを用いて、識別情報を計算し、識別結果を推定することを特徴とする荷物重さ推定方法。
- 入力されたデータから人物の画像データを読み込み、画像から人物位置を検出し、
人物ごとに、
画像から動作特徴量を抽出し、動作特徴量を共有空間に射影し、射影した際の画像射影特徴量を画像射影特徴量データベースに格納する処理を繰り返すことを特徴とする画像検索用データベース構築方法。 - 請求項12に記載の画像検索用データベース構築方法で構築された前記画像射影特徴量データベースを基に、センサデータのみを用いて、該センサデータの特徴量を抽出し、該センサデータの特徴量を共有空間に射影し、共有射影空間上で距離が近い前記画像射影特徴量データベースの画像の検索処理を行うことを特徴とする画像検索方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018197678A JP7171361B2 (ja) | 2018-10-19 | 2018-10-19 | データ解析システム、学習装置、及びその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018197678A JP7171361B2 (ja) | 2018-10-19 | 2018-10-19 | データ解析システム、学習装置、及びその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020064568A true JP2020064568A (ja) | 2020-04-23 |
JP7171361B2 JP7171361B2 (ja) | 2022-11-15 |
Family
ID=70387392
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018197678A Active JP7171361B2 (ja) | 2018-10-19 | 2018-10-19 | データ解析システム、学習装置、及びその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7171361B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114565826A (zh) * | 2022-04-28 | 2022-05-31 | 南京绿色科技研究院有限公司 | 一种农业病虫害识别诊断方法、系统及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011034342A (ja) * | 2009-07-31 | 2011-02-17 | Fujifilm Corp | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
CN107562812A (zh) * | 2017-08-11 | 2018-01-09 | 北京大学 | 一种基于特定模态语义空间建模的跨模态相似性学习方法 |
CN108595636A (zh) * | 2018-04-25 | 2018-09-28 | 复旦大学 | 基于深度跨模态相关性学习的手绘草图的图像检索方法 |
-
2018
- 2018-10-19 JP JP2018197678A patent/JP7171361B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011034342A (ja) * | 2009-07-31 | 2011-02-17 | Fujifilm Corp | 画像処理装置及び方法、データ処理装置及び方法、並びにプログラム |
CN107562812A (zh) * | 2017-08-11 | 2018-01-09 | 北京大学 | 一种基于特定模态语义空间建模的跨模态相似性学习方法 |
CN108595636A (zh) * | 2018-04-25 | 2018-09-28 | 复旦大学 | 基于深度跨模态相关性学习的手绘草图的图像检索方法 |
Non-Patent Citations (1)
Title |
---|
桂井 麻里衣,外1名: "「画像・テキスト・感情語の潜在的な相関に基づく画像の感情分類」", 第8回データ工学と情報マネジメントに関するフォーラム (第14回日本データベース学会年次大会) [O, JPN6022041613, JP, ISSN: 0004886727 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114565826A (zh) * | 2022-04-28 | 2022-05-31 | 南京绿色科技研究院有限公司 | 一种农业病虫害识别诊断方法、系统及装置 |
CN114565826B (zh) * | 2022-04-28 | 2022-07-22 | 南京绿色科技研究院有限公司 | 一种农业病虫害识别诊断方法、系统及装置 |
Also Published As
Publication number | Publication date |
---|---|
JP7171361B2 (ja) | 2022-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Sun et al. | Sequential human activity recognition based on deep convolutional network and extreme learning machine using wearable sensors | |
Dawar et al. | Action detection and recognition in continuous action streams by deep learning-based sensing fusion | |
US11429807B2 (en) | Automated collection of machine learning training data | |
JP5604256B2 (ja) | 人物動作検出装置およびそのプログラム | |
Fan et al. | Human fall detection using slow feature analysis | |
US10588517B2 (en) | Method for generating a personalized classifier for human motion activities of a mobile or wearable device user with unsupervised learning | |
Hnoohom et al. | Real-life human activity recognition with tri-axial accelerometer data from smartphone using hybrid long short-term memory networks | |
Jansi et al. | Detection of fall for the elderly in an indoor environment using a tri-axial accelerometer and Kinect depth data | |
KR102331126B1 (ko) | 연상 메모리와 결합된 모션 감지 장치를 이용해서 움직임을 식별하기 위한 시스템 및 방법 | |
US20150002389A1 (en) | Method for Recognizing a Performed Gesture, Device, User Terminal and Associated Computer Program | |
JPWO2017154655A1 (ja) | 群衆種類識別システム、群衆種類識別方法および群衆種類識別プログラム | |
Kumar et al. | 3D sign language recognition using spatio temporal graph kernels | |
Yao et al. | A fall detection method based on a joint motion map using double convolutional neural networks | |
JP6590477B2 (ja) | 情報処理装置、情報処理方法、プログラム | |
Liu et al. | A lightweight double-channel depthwise separable convolutional neural network for multimodal fusion gait recognition | |
Patua et al. | Gait-based person identification, gender classification, and age estimation: a review | |
JP2019082959A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP7171361B2 (ja) | データ解析システム、学習装置、及びその方法 | |
CN107665495B (zh) | 对象跟踪方法及对象跟踪装置 | |
WO2020207297A1 (zh) | 信息处理方法、存储介质及电子设备 | |
KR20160044858A (ko) | 얼굴 정보를 이용한 실종 가족 찾기 시스템 및 방법 그리고 이를 구현하는 프로그램을 기록한 기록 매체 | |
CN107203259B (zh) | 用于使用单和/或多传感器数据融合确定移动设备使用者的概率性内容感知的方法和装置 | |
JP2016099716A (ja) | システム、識別装置、識別モデル生成装置、情報処理方法及びプログラム | |
JP2019046278A (ja) | 情報処理装置、制御方法、コンピュータプログラム、記憶媒体、及びモデル作成装置 | |
Alman et al. | Pattern recognition of human activity based on smartphone data sensors using SVM multiclass |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191114 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210422 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220405 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220523 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221102 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7171361 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |