JP6778010B2 - 画像識別システム、画像識別方法 - Google Patents
画像識別システム、画像識別方法 Download PDFInfo
- Publication number
- JP6778010B2 JP6778010B2 JP2016080476A JP2016080476A JP6778010B2 JP 6778010 B2 JP6778010 B2 JP 6778010B2 JP 2016080476 A JP2016080476 A JP 2016080476A JP 2016080476 A JP2016080476 A JP 2016080476A JP 6778010 B2 JP6778010 B2 JP 6778010B2
- Authority
- JP
- Japan
- Prior art keywords
- calculation
- image
- result
- arithmetic unit
- identification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Description
特許文献1では、2次元ニューラルネットワークを、2つの1次元ニューラルネットワークに分解して演算を実行することで結合数(パラメータ数)の削減を行っている。しかしながら、特許文献1で開示されている手法では、複数の演算特性を持つ演算から構成されている一連の演算を、それぞれの演算特性を考慮して分割し、それぞれの演算を好ましい処理プラットフォームにおいて処理するということは考慮されていない。つまり、これまで詳細に説明したように、畳み込みフィルタ演算と行列積演算とでは演算特性に違いがあるが、この演算特性に応じて処理プラットフォームを変えるようなことは考慮されてこなかった。
撮像した画像を前記入力画像として入力し、該入力画像から特徴を抽出するための、第1パラメータを用いる畳み込みフィルタ演算を行う撮像装置である第1の演算装置と、
前記第1の演算装置と異なる第2の演算装置であって、
前記第1の演算装置から前記畳み込みフィルタ演算の結果である第1演算結果を取得する取得手段と、
前記第1演算結果に基づく前記特徴と、重み係数パラメータである第2パラメータから構成される行列と、の行列積を求める行列積演算であって、該第2パラメータを記憶するためのメモリ容量が前記第1パラメータを記憶するためのメモリ容量と比べて多い前記行列積演算を行う演算手段と
を有する前記第2の演算装置と、
前記行列積演算の結果である第2演算結果を用いて、前記識別処理において前記識別対象を識別する識別手段と
を備えることを特徴とする。
本実施形態では、演算量もパラメータ量も多大であるディープネットの処理を、低コスト且つ柔軟に実現するための画像識別システムの一例について説明する。また本実施形態では、一連のディープネットの処理を(上記非線形変換処理を除いて)、入力データの量(或いは入力データの量と比例関係にある演算量)とパラメータの量とで規定される演算特性の違いによって2種類の演算(第一、第二の演算)に分けている。そして、該2種類の演算を、それぞれの演算の演算特性(第一の演算特性、第二の演算特性)に応じた処理プラットフォームにて実行するようにしている。
本実施形態では、演算装置106に対して複数台の画像撮像装置102が通信可能に接続されており、該複数台の画像撮像装置102の各々から特徴量を演算装置106に対して送信する画像識別システムについて説明する。本実施形態を含め、以下の実施形態では、第1の実施形態との差分について重点的に説明し、以下で特に触れない限りは第1の実施形態と同様であるものとする。
第1、第2の実施形態では、第二の演算部で最終的な識別結果を算出していたが、第二の演算部で算出した結果を、再度第一の演算部に戻し、第一の演算部にて最終的な識別結果を算出してもよい。このように構成すると、個々の画像撮像装置固有の設定や、その画像撮像装置で画像を撮像した時の情報、或いは個々の画像撮像装置を操作するユーザの嗜好等を考慮に入れて最終的な識別結果を推定することが可能となる。また、ディープネットを用いた画像識別アプリケーションの幅が広がる。
・ 入力画像に対する識別処理における複数の演算処理のうち、使用するパラメータの量が、該パラメータを適用するデータの量に比して大きい演算処理を行う第2の演算装置
・ 第2の演算装置は、第1の演算装置よりもメモリ容量が大きいメモリが使用可能である
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (10)
- 複数の階層を有するニューラルネットワークを用いて、入力画像から識別対象を識別するための識別処理を行う画像識別システムであって、
撮像した画像を前記入力画像として入力し、該入力画像から特徴を抽出するための、第1パラメータを用いる畳み込みフィルタ演算を行う撮像装置である第1の演算装置と、
前記第1の演算装置と異なる第2の演算装置であって、
前記第1の演算装置から前記畳み込みフィルタ演算の結果である第1演算結果を取得する取得手段と、
前記第1演算結果に基づく前記特徴と、重み係数パラメータである第2パラメータから構成される行列と、の行列積を求める行列積演算であって、該第2パラメータを記憶するためのメモリ容量が前記第1パラメータを記憶するためのメモリ容量と比べて多い前記行列積演算を行う演算手段と
を有する前記第2の演算装置と、
前記行列積演算の結果である第2演算結果を用いて、前記識別処理において前記識別対象を識別する識別手段と
を備えることを特徴とする画像識別システム。 - 前記第1の演算装置は、前記入力画像のそれぞれの部分画像に対して同一の値である前記第1パラメータを適用する前記畳み込みフィルタ演算を行い、前記第2の演算装置は、同一のデータに対して前記行列におけるそれぞれの列ベクトルを適用する前記行列積演算を行うことを特徴とする請求項1に記載の画像識別システム。
- 前記第1の演算装置は、前記入力画像と、前記第1パラメータから構成されたフィルタカーネルと、を用いて前記畳み込みフィルタ演算を行うことを特徴とする請求項1または2に記載の画像識別システム。
- 前記演算手段は、前記第1演算結果である前記特徴と、前記行列と、の行列積を求める行列積演算を行うことを特徴とする請求項3に記載の画像識別システム。
- 前記識別手段は、前記入力画像中の人物を識別することを特徴とする請求項1乃至4の何れか1項に記載の画像識別システム。
- 前記第1の演算装置は、前記識別手段を有し、
前記第2の演算装置は、前記第2演算結果を前記第1の演算装置に対して出力し、
前記識別手段は、前記第2の演算装置から出力された前記第2演算結果に基づいて前記第1の演算装置のユーザの認証を行うことを特徴とする請求項1乃至5の何れか1項に記載の画像識別システム。 - 前記第2の演算装置は、前記特徴より高次の特徴である前記第2演算結果を前記第1の演算装置に対して出力し、
前記識別手段は、前記第2の演算装置から出力された前記第2演算結果に基づいて前記ユーザの認証を行うことを特徴とする請求項6に記載の画像識別システム。 - 前記画像識別システムは複数の前記第1の演算装置を有し、
前記演算手段は、複数の前記第1の演算装置による前記第1演算結果を連結した結果を用いて演算を行うことを特徴とする請求項1乃至7の何れか1項に記載の画像識別システム。 - 前記演算手段は、複数の前記第1の演算装置による前記第1演算結果を連結した結果と前記第2パラメータとを用いて前記行列積演算を行うことを特徴とする請求項8に記載の画像識別システム。
- 複数の階層を有するニューラルネットワークを用いて、入力画像から識別対象を識別するための識別処理を行う画像識別システムによる画像識別方法であって、
撮像装置である第1の演算装置が、撮像した画像を前記入力画像として入力し、該入力画像から特徴を抽出するための、第1パラメータを用いる畳み込みフィルタ演算を行い、
前記第1の演算装置と異なる第2の演算装置が、
前記第1の演算装置から前記畳み込みフィルタ演算の結果である第1演算結果を取得し、
前記第1演算結果に基づく前記特徴と、重み係数パラメータである第2パラメータから構成される行列と、の行列積を求める行列積演算であって、該第2パラメータを記憶するためのメモリ容量が前記第1パラメータを記憶するためのメモリ容量と比べて多い前記行列積演算を行い、
前記識別処理において前記識別対象が、前記行列積演算の結果である第2演算結果を用いて識別される
ことを特徴とする画像識別方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016080476A JP6778010B2 (ja) | 2016-04-13 | 2016-04-13 | 画像識別システム、画像識別方法 |
US15/483,501 US20170300776A1 (en) | 2016-04-13 | 2017-04-10 | Image identification system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016080476A JP6778010B2 (ja) | 2016-04-13 | 2016-04-13 | 画像識別システム、画像識別方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2017191458A JP2017191458A (ja) | 2017-10-19 |
JP2017191458A5 JP2017191458A5 (ja) | 2019-05-23 |
JP6778010B2 true JP6778010B2 (ja) | 2020-10-28 |
Family
ID=60038324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016080476A Active JP6778010B2 (ja) | 2016-04-13 | 2016-04-13 | 画像識別システム、画像識別方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20170300776A1 (ja) |
JP (1) | JP6778010B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019074967A (ja) * | 2017-10-17 | 2019-05-16 | キヤノン株式会社 | フィルタ処理装置およびその制御方法 |
JP7225876B2 (ja) | 2019-02-08 | 2023-02-21 | 富士通株式会社 | 情報処理装置、演算処理装置および情報処理装置の制御方法 |
KR20190087351A (ko) * | 2019-07-05 | 2019-07-24 | 엘지전자 주식회사 | 머신 러닝 시스템, 방법 및 장치 |
KR102273585B1 (ko) * | 2020-05-18 | 2021-07-06 | 충북대학교 산학협력단 | 소형 카메라 모듈의 얼룩 불량 검사 방법 및 시스템 |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5912720A (en) * | 1997-02-13 | 1999-06-15 | The Trustees Of The University Of Pennsylvania | Technique for creating an ophthalmic augmented reality environment |
GB2471647B (en) * | 2009-06-16 | 2016-03-23 | Aptina Imaging Corp | Use of Z-order data in an image sensor |
US8560004B1 (en) * | 2012-08-31 | 2013-10-15 | Google Inc. | Sensor-based activation of an input device |
JP6202983B2 (ja) * | 2013-10-22 | 2017-09-27 | 株式会社東芝 | 本人認証システム |
US10095917B2 (en) * | 2013-11-04 | 2018-10-09 | Facebook, Inc. | Systems and methods for facial representation |
US20170026836A1 (en) * | 2015-07-20 | 2017-01-26 | University Of Maryland, College Park | Attribute-based continuous user authentication on mobile devices |
US20170076195A1 (en) * | 2015-09-10 | 2017-03-16 | Intel Corporation | Distributed neural networks for scalable real-time analytics |
JP6750203B2 (ja) * | 2015-10-20 | 2020-09-02 | 富士通株式会社 | 畳み込みニューラルネットワークの演算方法及び演算プログラム、情報処理装置 |
US9904874B2 (en) * | 2015-11-05 | 2018-02-27 | Microsoft Technology Licensing, Llc | Hardware-efficient deep convolutional neural networks |
CN107404381A (zh) * | 2016-05-19 | 2017-11-28 | 阿里巴巴集团控股有限公司 | 一种身份认证方法和装置 |
CN109478139B (zh) * | 2016-08-13 | 2024-01-23 | 英特尔公司 | 用于共享存储器中的访问同步的装置、方法和系统 |
-
2016
- 2016-04-13 JP JP2016080476A patent/JP6778010B2/ja active Active
-
2017
- 2017-04-10 US US15/483,501 patent/US20170300776A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20170300776A1 (en) | 2017-10-19 |
JP2017191458A (ja) | 2017-10-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11645506B2 (en) | Neural network for skeletons from input images | |
KR102061408B1 (ko) | 가상 3차원 심층 신경망을 이용하는 영상 분석 장치 및 방법 | |
US8463025B2 (en) | Distributed artificial intelligence services on a cell phone | |
JP6778010B2 (ja) | 画像識別システム、画像識別方法 | |
KR102629380B1 (ko) | 실제 3차원 객체를 실제 객체의 2-차원 스푸프로부터 구별하기 위한 방법 | |
DE112019005671T5 (de) | Bestimmen von assoziationen zwischen objekten und personen unter verwendung von maschinenlernmodellen | |
CN112236779A (zh) | 基于卷积神经网络的图像处理方法和图像处理装置 | |
Ke et al. | Human interaction prediction using deep temporal features | |
CN112639828A (zh) | 数据处理的方法、训练神经网络模型的方法及设备 | |
JP6862584B2 (ja) | 画像処理システム及び画像処理方法 | |
CN107808111A (zh) | 用于行人检测和姿态估计的方法和装置 | |
CN108875517B (zh) | 视频处理方法、装置和系统及存储介质 | |
US20200242345A1 (en) | Detection apparatus and method, and image processing apparatus and system | |
JP7419080B2 (ja) | コンピュータシステムおよびプログラム | |
CN111626082A (zh) | 检测装置和方法及图像处理装置和系统 | |
CN110728188B (zh) | 图像处理方法、装置、系统和存储介质 | |
Abirami et al. | Gender and age prediction from real time facial images using CNN | |
Irfanullah et al. | Real time violence detection in surveillance videos using Convolutional Neural Networks | |
CN110222718A (zh) | 图像处理的方法及装置 | |
KR20220044828A (ko) | 얼굴 속성 인식 방법, 장치, 전자 기기 및 저장 매체 | |
CN111797881A (zh) | 图像分类方法及装置 | |
WO2022052782A1 (zh) | 图像的处理方法及相关设备 | |
CN114051630A (zh) | 多种杂草检测 | |
KR102126795B1 (ko) | 딥러닝 기반의 이미지 개인정보 가공장치 시스템, 장치 및 그 방법 | |
CN111695673A (zh) | 训练神经网络预测器的方法、图像处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190411 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190411 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200911 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201009 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6778010 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |