JP2020113055A - 画像認識装置、画像認識方法、及び画像認識プログラム - Google Patents
画像認識装置、画像認識方法、及び画像認識プログラム Download PDFInfo
- Publication number
- JP2020113055A JP2020113055A JP2019003597A JP2019003597A JP2020113055A JP 2020113055 A JP2020113055 A JP 2020113055A JP 2019003597 A JP2019003597 A JP 2019003597A JP 2019003597 A JP2019003597 A JP 2019003597A JP 2020113055 A JP2020113055 A JP 2020113055A
- Authority
- JP
- Japan
- Prior art keywords
- feature amount
- resolution
- image
- feature
- order
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 68
- 238000000605 extraction Methods 0.000 claims abstract description 81
- 238000012545 processing Methods 0.000 claims abstract description 81
- 238000006243 chemical reaction Methods 0.000 claims abstract description 19
- 230000009467 reduction Effects 0.000 claims abstract description 15
- 230000001174 ascending effect Effects 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims description 58
- 239000002131 composite material Substances 0.000 claims description 14
- 230000002194 synthesizing effect Effects 0.000 claims description 9
- 230000003321 amplification Effects 0.000 claims description 6
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 6
- 230000000694 effects Effects 0.000 description 31
- 238000012544 monitoring process Methods 0.000 description 24
- 238000001514 detection method Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 18
- 238000013527 convolutional neural network Methods 0.000 description 17
- 238000012800 visualization Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 14
- 230000006399 behavior Effects 0.000 description 11
- 230000008859 change Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 238000001914 filtration Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000011176 pooling Methods 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 239000003708 ampul Substances 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000004932 little finger Anatomy 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 239000000470 constituent Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 210000003811 finger Anatomy 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000003371 toe Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 210000000707 wrist Anatomy 0.000 description 1
Images
Landscapes
- Image Analysis (AREA)
Abstract
Description
図2は画像監視システム1の概略の構成を示すブロック図である。画像監視システム1は撮影部2、通信部3、記憶部4、画像処理部5、表示部6および操作入力部7からなる。
図3は画像監視システム1の概略の機能ブロック図であり、記憶部4がフィルタ係数記憶手段40および特徴量記憶手段41として機能し、画像処理部5が不審行動検知手段50、画像縮小手段51、関節推定手段52、特徴量可視化手段53およびフィルタ係数更新手段54として機能する。また、表示部6と通信部3とが表示手段60として機能し、操作入力部7と通信部3とがフィルタ係数入力手段70として機能する。
図8および図9は画像監視システム1の動作に関する概略のフロー図である。
(1)上記実施形態の画像監視システム1では本発明の画像認識の技術の例として、解像度が異なる3つの処理画像を用いる例を示したが、既に述べたように、処理画像の数(解像度の種類)は任意の複数とすることができ、例えば、2つの処理画像を用いる構成とすることもでき、または4以上の処理画像を用いる構成とすることもできる。処理画像を幾つとするかは、事前実験を通じ、認識対象と認識精度のバランスから選択される。
Claims (6)
- 入力画像に現れた所定対象を認識する画像認識装置であって、
前記入力画像の解像度以下の範囲において互いに分離して設定されたn個(nは2以上の自然数である。)の解像度区間を、低解像度の側から順に第1から第nの区間とし、
前記入力画像を縮小させて、n以下の各自然数kについて第kの前記区間に属する解像度を有する第kの処理画像を生成する画像縮小手段と、
前記第kの処理画像それぞれから、前記第kの区間内の解像度にて特徴量を抽出する処理を行って第kの特徴量を取得する特徴量抽出手段と、
第1の前記特徴量を0次合成特徴量とし、n−1以下の自然数jについて、j−1次合成特徴量の解像度を第j+1の前記特徴量の解像度に揃える変換処理と、当該変換後の前記j−1次合成特徴量と前記第j+1の特徴量とを合成してj次合成特徴量を生成する処理とを前記jの昇順に行い、生成されたn−1次合成特徴量から前記所定対象を認識する対象認識手段と、
を備えたことを特徴とする画像認識装置。 - 前記処理画像の局所領域ごとに当該局所領域に対応する前記特徴量の大きさに応じた画素値を設定した表示用画像を出力する可視化手段、
をさらに備えたことを特徴とする請求項1に記載の画像認識装置。 - 前記特徴量抽出手段が前記特徴量の抽出に用いるフィルタのフィルタ係数を記憶するフィルタ係数記憶手段と、
利用者からの前記フィルタ係数の更新値の入力を受け付けて、前記フィルタ係数記憶手段に記憶されている前記フィルタ係数を前記更新値で置き換えるフィルタ係数更新手段と、
をさらに備えたことを特徴とする請求項1又は請求項2に記載の画像認識装置。 - 前記特徴量抽出手段は、少なくとも1つの前記kについて前記第kの特徴量を抽出するための1又は複数の畳み込み層を含んで構成され、
前記対象認識手段は、少なくとも1つの前記kについての前記変換処理を行うためのアンプーリング層を含んで構成されること、
を特徴とする請求項1から請求項3のいずれか1つに記載の画像認識装置。 - 入力画像に現れた所定対象を認識する画像認識方法であって、
前記入力画像の解像度以下の範囲において互いに分離して設定されたn個(nは2以上の自然数である。)の解像度区間を、低解像度の側から順に第1から第nの区間とし、
前記入力画像を縮小させることにより、n以下の各自然数kについて第kの前記区間に属する解像度を有する第kの処理画像を生成する画像縮小ステップと、
前記第kの処理画像それぞれから、前記第kの区間内の解像度にて特徴量を抽出する処理を行って第kの特徴量を取得する特徴量抽出ステップと、
第1の前記特徴量を0次合成特徴量とし、n−1以下の自然数jについて、j−1次合成特徴量の解像度を第j+1の前記特徴量の解像度に揃える変換処理と、当該変換後の前記j−1次合成特徴量と前記第j+1の特徴量とを合成してj次合成特徴量を生成する処理とを前記jの昇順に行い、生成されたn−1次合成特徴量から前記所定対象を認識する対象認識ステップと、
を備えたことを特徴とする画像認識方法。 - コンピュータに、入力画像に現れた所定対象を認識する処理を行わせるための画像認識プログラムであって、
前記入力画像の解像度以下の範囲において互いに分離して設定されたn個(nは2以上の自然数である。)の解像度区間を、低解像度の側から順に第1から第nの区間とし、
当該コンピュータを、
前記入力画像を縮小させることにより、n以下の各自然数kについて第kの前記区間に属する解像度を有する第kの処理画像を生成する画像縮小手段、
前記第kの処理画像それぞれから、前記第kの区間内の解像度にて特徴量を抽出する処理を行って第kの特徴量を取得する特徴量抽出手段、及び、
第1の前記特徴量を0次合成特徴量とし、n−1以下の自然数jについてj−1次合成特徴量の解像度を第j+1の前記特徴量の解像度に揃える変換処理と、当該変換後の前記j−1次合成特徴量と前記第j+1の特徴量とを合成してj次合成特徴量を生成する処理とを前記jの昇順に行い、生成されたn−1次合成特徴量から前記所定対象を認識する対象認識手段、
として機能させることを特徴とする画像認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019003597A JP6801020B2 (ja) | 2019-01-11 | 2019-01-11 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019003597A JP6801020B2 (ja) | 2019-01-11 | 2019-01-11 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2020113055A true JP2020113055A (ja) | 2020-07-27 |
JP6801020B2 JP6801020B2 (ja) | 2020-12-16 |
Family
ID=71666313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019003597A Active JP6801020B2 (ja) | 2019-01-11 | 2019-01-11 | 画像認識装置、画像認識方法、及び画像認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6801020B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230064837A (ko) * | 2021-11-04 | 2023-05-11 | 중앙대학교 산학협력단 | 코스-투-파인 컨볼루션 뉴럴 네트워크 기반 다중 레이블 클래스 분류 방법 및 장치 |
JP7385681B2 (ja) | 2019-05-21 | 2023-11-22 | マジック リープ, インコーポレイテッド | 手姿勢推定 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014203135A (ja) * | 2013-04-01 | 2014-10-27 | キヤノン株式会社 | 信号処理装置、信号処理方法、及び、信号処理システム |
JP2017033529A (ja) * | 2015-03-06 | 2017-02-09 | パナソニックIpマネジメント株式会社 | 画像認識方法、画像認識装置およびプログラム |
JP2018010626A (ja) * | 2016-06-30 | 2018-01-18 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
JP2018181124A (ja) * | 2017-04-18 | 2018-11-15 | Kddi株式会社 | エンコーダデコーダ畳み込みニューラルネットワークにおける解像感を改善するプログラム |
JP2018534694A (ja) * | 2015-11-04 | 2018-11-22 | エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. | 物体検出のためのサブカテゴリ認識機能付き畳み込みニューラルネットワーク |
-
2019
- 2019-01-11 JP JP2019003597A patent/JP6801020B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2014203135A (ja) * | 2013-04-01 | 2014-10-27 | キヤノン株式会社 | 信号処理装置、信号処理方法、及び、信号処理システム |
JP2017033529A (ja) * | 2015-03-06 | 2017-02-09 | パナソニックIpマネジメント株式会社 | 画像認識方法、画像認識装置およびプログラム |
JP2018534694A (ja) * | 2015-11-04 | 2018-11-22 | エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. | 物体検出のためのサブカテゴリ認識機能付き畳み込みニューラルネットワーク |
JP2018010626A (ja) * | 2016-06-30 | 2018-01-18 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
JP2018181124A (ja) * | 2017-04-18 | 2018-11-15 | Kddi株式会社 | エンコーダデコーダ畳み込みニューラルネットワークにおける解像感を改善するプログラム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7385681B2 (ja) | 2019-05-21 | 2023-11-22 | マジック リープ, インコーポレイテッド | 手姿勢推定 |
KR20230064837A (ko) * | 2021-11-04 | 2023-05-11 | 중앙대학교 산학협력단 | 코스-투-파인 컨볼루션 뉴럴 네트워크 기반 다중 레이블 클래스 분류 방법 및 장치 |
WO2023080321A1 (ko) * | 2021-11-04 | 2023-05-11 | 중앙대학교 산학협력단 | 코스-투-파인 컨볼루션 뉴럴 네트워크 기반 다중 레이블 클래스 분류 방법 및 장치 |
KR102635607B1 (ko) | 2021-11-04 | 2024-02-08 | 중앙대학교 산학협력단 | 코스-투-파인 컨볼루션 뉴럴 네트워크 기반 다중 레이블 클래스 분류 방법 및 장치 |
Also Published As
Publication number | Publication date |
---|---|
JP6801020B2 (ja) | 2020-12-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020224403A1 (zh) | 分类任务模型的训练方法、装置、设备及存储介质 | |
CN112287940A (zh) | 一种基于深度学习的注意力机制的语义分割的方法 | |
CN109389552A (zh) | 一种基于上下文相关多任务深度学习的图像超分辨算法 | |
US20080123975A1 (en) | Abnormal Action Detector and Abnormal Action Detecting Method | |
JP6397379B2 (ja) | 変化領域検出装置、方法、及びプログラム | |
JP6265132B2 (ja) | 画像認識処理適性表示システム、方法およびプログラム | |
JP2018072938A (ja) | 目的物個数推定装置、目的物個数推定方法及びプログラム | |
CN110879982A (zh) | 一种人群计数系统及方法 | |
WO2020186385A1 (zh) | 图像处理方法、电子设备及计算机可读存储介质 | |
JP6801020B2 (ja) | 画像認識装置、画像認識方法、及び画像認識プログラム | |
WO2019102797A1 (ja) | ニューラルネットワークの学習方法、学習装置、学習済みモデル及びプログラム | |
CN116128883A (zh) | 一种光伏板数量统计方法、装置、电子设备及存储介质 | |
JP7001150B2 (ja) | 識別システム、モデル再学習方法およびプログラム | |
JP2016139397A (ja) | 画像処理装置、画像処理方法、画像表示装置およびコンピュータプログラム | |
US20220383616A1 (en) | Information processing apparatus and image processing method | |
CN115601684A (zh) | 突发事件预警方法、装置、电子设备及存储介质 | |
JP2020095526A (ja) | 画像処理装置、方法、及びプログラム | |
CN113240611A (zh) | 一种基于图片序列的异物检测方法 | |
CN109492755B (zh) | 图像处理方法、图像处理装置和计算机可读存储介质 | |
JP2016040731A (ja) | 画像検索装置、画像検索方法及びプログラム | |
CN111860323A (zh) | 一种基于yolov3算法识别监控画面中初期火灾的方法 | |
CN113034420A (zh) | 一种频率空间域特征的工业产品表面缺陷分割方法及系统 | |
CN114299375B (zh) | 融合YOLOv4与可变形卷积的水下群体目标检测方法 | |
WO2024048639A1 (ja) | 方法、学習モデル評価システム、及びプログラム | |
JP5836728B2 (ja) | 画像検索装置、画像検索方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190726 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200824 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200901 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201028 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201110 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201125 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6801020 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |