JP2017191458A - 画像識別システム - Google Patents
画像識別システム Download PDFInfo
- Publication number
- JP2017191458A JP2017191458A JP2016080476A JP2016080476A JP2017191458A JP 2017191458 A JP2017191458 A JP 2017191458A JP 2016080476 A JP2016080476 A JP 2016080476A JP 2016080476 A JP2016080476 A JP 2016080476A JP 2017191458 A JP2017191458 A JP 2017191458A
- Authority
- JP
- Japan
- Prior art keywords
- arithmetic
- image
- calculation
- amount
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Biodiversity & Conservation Biology (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】 第1の演算装置は、入力画像に対する識別処理における複数の演算処理のうち、使用するパラメータの量が、該パラメータを適用するデータの量に比して小さい演算処理を行う。第2の演算装置は、該複数の演算処理のうち、使用するパラメータの量が、該パラメータを適用するデータの量に比して大きい演算処理を行う。第2の演算装置は、第1の演算装置よりもメモリ容量が大きいメモリが使用可能である。
【選択図】 図1
Description
特許文献1では、2次元ニューラルネットワークを、2つの1次元ニューラルネットワークに分解して演算を実行することで結合数(パラメータ数)の削減を行っている。しかしながら、特許文献1で開示されている手法では、複数の演算特性を持つ演算から構成されている一連の演算を、それぞれの演算特性を考慮して分割し、それぞれの演算を好ましい処理プラットフォームにおいて処理するということは考慮されていない。つまり、これまで詳細に説明したように、畳み込みフィルタ演算と行列積演算とでは演算特性に違いがあるが、この演算特性に応じて処理プラットフォームを変えるようなことは考慮されてこなかった。
本実施形態では、演算量もパラメータ量も多大であるディープネットの処理を、低コスト且つ柔軟に実現するための画像識別システムの一例について説明する。また本実施形態では、一連のディープネットの処理を(上記非線形変換処理を除いて)、入力データの量(或いは入力データの量と比例関係にある演算量)とパラメータの量とで規定される演算特性の違いによって2種類の演算(第一、第二の演算)に分けている。そして、該2種類の演算を、それぞれの演算の演算特性(第一の演算特性、第二の演算特性)に応じた処理プラットフォームにて実行するようにしている。
本実施形態では、演算装置106に対して複数台の画像撮像装置102が通信可能に接続されており、該複数台の画像撮像装置102の各々から特徴量を演算装置106に対して送信する画像識別システムについて説明する。本実施形態を含め、以下の実施形態では、第1の実施形態との差分について重点的に説明し、以下で特に触れない限りは第1の実施形態と同様であるものとする。
第1、第2の実施形態では、第二の演算部で最終的な識別結果を算出していたが、第二の演算部で算出した結果を、再度第一の演算部に戻し、第一の演算部にて最終的な識別結果を算出してもよい。このように構成すると、個々の画像撮像装置固有の設定や、その画像撮像装置で画像を撮像した時の情報、或いは個々の画像撮像装置を操作するユーザの嗜好等を考慮に入れて最終的な識別結果を推定することが可能となる。また、ディープネットを用いた画像識別アプリケーションの幅が広がる。
・ 入力画像に対する識別処理における複数の演算処理のうち、使用するパラメータの量が、該パラメータを適用するデータの量に比して大きい演算処理を行う第2の演算装置
・ 第2の演算装置は、第1の演算装置よりもメモリ容量が大きいメモリが使用可能である
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (11)
- 入力画像に対する識別処理における複数の演算処理のうち、使用するパラメータの量が、該パラメータを適用するデータの量に比して小さい演算処理を行う第1の演算装置と、
前記複数の演算処理のうち、使用するパラメータの量が、該パラメータを適用するデータの量に比して大きい演算処理を行う第2の演算装置と
を備え、
前記第2の演算装置は、前記第1の演算装置よりもメモリ容量が大きいメモリが使用可能であることを特徴とする画像識別システム。 - 前記第1の演算装置は、前記入力画像のそれぞれの部分画像に対して同一の前記パラメータを適用する演算処理を行い、前記第2の演算装置は、同一のデータに対して前記パラメータのそれぞれの部分集合を適用する演算処理を行うことを特徴とする請求項1に記載の画像識別システム。
- 前記第1の演算装置が行う演算処理は、畳み込みフィルタ演算であり、前記第2の演算装置が行う演算処理は、行列積演算であることを特徴とする請求項1又は2に記載の画像識別システム。
- 前記第1の演算装置は、前記入力画像とフィルタカーネルとを用いて畳み込みフィルタ演算を行うことを特徴とする請求項3に記載の画像識別システム。
- 前記第2の演算装置は、前記第1の演算装置による演算結果と重み係数パラメータとを用いて行列積演算を行うことを特徴とする請求項3又は4に記載の画像識別システム。
- 前記第2の演算装置は、演算結果に基づいて前記入力画像中の人物を識別することを特徴とする請求項1乃至5の何れか1項に記載の画像識別システム。
- 前記第2の演算装置は、演算結果を前記第1の演算装置に対して出力し、前記第1の演算装置は、該演算結果に基づいて前記第1の演算装置のユーザの認証を行うことを特徴とする請求項1乃至5の何れか1項に記載の画像識別システム。
- 前記第1の演算装置は、ユーザの画像の特徴量を演算し、前記第2の演算装置は、該特徴量から高次の特徴量を演算し、前記第1の演算装置は、該高次の特徴量に基づいて前記ユーザの認証を行うことを特徴とする請求項7に記載の画像識別システム。
- 前記画像識別システムは複数の前記第1の演算装置を有し、
前記第2の演算装置は、複数の前記第1の演算装置による演算処理の結果を連結した結果を用いて演算を行うことを特徴とする請求項1乃至6の何れか1項に記載の画像識別システム。 - 前記第2の演算装置は、複数の前記第1の演算装置による演算処理の結果を連結した結果と重み係数パラメータとを用いて行列積演算を行うことを特徴とする請求項9に記載の画像識別システム。
- 前記第1の演算装置は、画像を撮像する画像撮像装置に組み込まれた組み込みデバイスであり、前記入力画像は該画像撮像装置によって撮像された画像であることを特徴とする請求項1乃至10の何れか1項に記載の画像識別システム。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016080476A JP6778010B2 (ja) | 2016-04-13 | 2016-04-13 | 画像識別システム、画像識別方法 |
| US15/483,501 US20170300776A1 (en) | 2016-04-13 | 2017-04-10 | Image identification system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016080476A JP6778010B2 (ja) | 2016-04-13 | 2016-04-13 | 画像識別システム、画像識別方法 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2017191458A true JP2017191458A (ja) | 2017-10-19 |
| JP2017191458A5 JP2017191458A5 (ja) | 2019-05-23 |
| JP6778010B2 JP6778010B2 (ja) | 2020-10-28 |
Family
ID=60038324
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016080476A Active JP6778010B2 (ja) | 2016-04-13 | 2016-04-13 | 画像識別システム、画像識別方法 |
Country Status (2)
| Country | Link |
|---|---|
| US (1) | US20170300776A1 (ja) |
| JP (1) | JP6778010B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3702959A2 (en) | 2019-02-08 | 2020-09-02 | Fujitsu Limited | Information processing apparatus, arithmetic processing device, and method of controlling information processing apparatus |
| KR102273585B1 (ko) * | 2020-05-18 | 2021-07-06 | 충북대학교 산학협력단 | 소형 카메라 모듈의 얼룩 불량 검사 방법 및 시스템 |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2019074967A (ja) * | 2017-10-17 | 2019-05-16 | キヤノン株式会社 | フィルタ処理装置およびその制御方法 |
| KR102928305B1 (ko) * | 2019-07-05 | 2026-02-13 | 엘지전자 주식회사 | 머신 러닝 시스템, 방법 및 장치 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015082195A (ja) * | 2013-10-22 | 2015-04-27 | 株式会社東芝 | 本人認証システム |
| WO2015066628A1 (en) * | 2013-11-04 | 2015-05-07 | Facebook, Inc. | Systems and methods for facial representation |
Family Cites Families (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5912720A (en) * | 1997-02-13 | 1999-06-15 | The Trustees Of The University Of Pennsylvania | Technique for creating an ophthalmic augmented reality environment |
| GB2471647B (en) * | 2009-06-16 | 2016-03-23 | Aptina Imaging Corp | Use of Z-order data in an image sensor |
| US8560004B1 (en) * | 2012-08-31 | 2013-10-15 | Google Inc. | Sensor-based activation of an input device |
| US20170026836A1 (en) * | 2015-07-20 | 2017-01-26 | University Of Maryland, College Park | Attribute-based continuous user authentication on mobile devices |
| US20170076195A1 (en) * | 2015-09-10 | 2017-03-16 | Intel Corporation | Distributed neural networks for scalable real-time analytics |
| JP6750203B2 (ja) * | 2015-10-20 | 2020-09-02 | 富士通株式会社 | 畳み込みニューラルネットワークの演算方法及び演算プログラム、情報処理装置 |
| US9904874B2 (en) * | 2015-11-05 | 2018-02-27 | Microsoft Technology Licensing, Llc | Hardware-efficient deep convolutional neural networks |
| CN107404381A (zh) * | 2016-05-19 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 一种身份认证方法和装置 |
| CN109478139B (zh) * | 2016-08-13 | 2024-01-23 | 英特尔公司 | 用于共享存储器中的访问同步的装置、方法和系统 |
-
2016
- 2016-04-13 JP JP2016080476A patent/JP6778010B2/ja active Active
-
2017
- 2017-04-10 US US15/483,501 patent/US20170300776A1/en not_active Abandoned
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2015082195A (ja) * | 2013-10-22 | 2015-04-27 | 株式会社東芝 | 本人認証システム |
| WO2015066628A1 (en) * | 2013-11-04 | 2015-05-07 | Facebook, Inc. | Systems and methods for facial representation |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP3702959A2 (en) | 2019-02-08 | 2020-09-02 | Fujitsu Limited | Information processing apparatus, arithmetic processing device, and method of controlling information processing apparatus |
| US11756289B2 (en) | 2019-02-08 | 2023-09-12 | Fujitsu Limited | Information processing apparatus, arithmetic processing device, and method of controlling information processing apparatus |
| KR102273585B1 (ko) * | 2020-05-18 | 2021-07-06 | 충북대학교 산학협력단 | 소형 카메라 모듈의 얼룩 불량 검사 방법 및 시스템 |
Also Published As
| Publication number | Publication date |
|---|---|
| US20170300776A1 (en) | 2017-10-19 |
| JP6778010B2 (ja) | 2020-10-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11645506B2 (en) | Neural network for skeletons from input images | |
| CN112446398B (zh) | 图像分类方法以及装置 | |
| US11222239B2 (en) | Information processing apparatus, information processing method, and non-transitory computer-readable storage medium | |
| Singh et al. | Single image dehazing for a variety of haze scenarios using back projected pyramid network | |
| DE112019005671T5 (de) | Bestimmen von assoziationen zwischen objekten und personen unter verwendung von maschinenlernmodellen | |
| JP7419080B2 (ja) | コンピュータシステムおよびプログラム | |
| Ke et al. | Human interaction prediction using deep temporal features | |
| Alam et al. | UAV based cost-effective real-time abnormal event detection using edge computing | |
| Sadgrove et al. | Real-time object detection in agricultural/remote environments using the multiple-expert colour feature extreme learning machine (MEC-ELM) | |
| CN109635770A (zh) | 活体检测方法、装置、存储介质及电子设备 | |
| WO2022052782A1 (zh) | 图像的处理方法及相关设备 | |
| CN110728188B (zh) | 图像处理方法、装置、系统和存储介质 | |
| CN113902995A (zh) | 一种多模态人体行为识别方法及相关设备 | |
| CN113065575A (zh) | 一种图像处理方法及相关装置 | |
| JP6778010B2 (ja) | 画像識別システム、画像識別方法 | |
| CN111626082A (zh) | 检测装置和方法及图像处理装置和系统 | |
| CN110222718A (zh) | 图像处理的方法及装置 | |
| JP7104546B2 (ja) | 情報処理装置、情報処理方法 | |
| Bhadra et al. | Mfemanet: an effective disaster image classification approach for practical risk assessment | |
| CN111444957A (zh) | 图像数据处理方法、装置、计算机设备和存储介质 | |
| CN114049491A (zh) | 指纹分割模型训练、指纹分割方法、装置、设备及介质 | |
| JP2024004972A (ja) | 監視システム、監視方法、及び、監視システム用の画像認識装置の学習方法 | |
| Klym et al. | Face detection using an implementation running in a web browser | |
| Benhamida et al. | Human action recognition using ST-GCNs for blind accessible theatre performances | |
| CN115514913B (zh) | 视频数据处理方法和装置、电子设备及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190411 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190411 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200703 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200824 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200911 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201009 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6778010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
