JP2019185548A - 情報処理装置、情報処理方法 - Google Patents
情報処理装置、情報処理方法 Download PDFInfo
- Publication number
- JP2019185548A JP2019185548A JP2018077796A JP2018077796A JP2019185548A JP 2019185548 A JP2019185548 A JP 2019185548A JP 2018077796 A JP2018077796 A JP 2018077796A JP 2018077796 A JP2018077796 A JP 2018077796A JP 2019185548 A JP2019185548 A JP 2019185548A
- Authority
- JP
- Japan
- Prior art keywords
- pixel array
- dimensional
- dimensional pixel
- information processing
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/161—Detection; Localisation; Normalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/211—Selection of the most significant subset of features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/30—Determination of transform parameters for the alignment of images, i.e. image registration
- G06T7/33—Determination of transform parameters for the alignment of images, i.e. image registration using feature-based methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/168—Feature extraction; Face representation
- G06V40/171—Local features and components; Facial parts ; Occluding parts, e.g. glasses; Geometrical relationships
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/16—Human faces, e.g. facial parts, sketches or expressions
- G06V40/172—Classification, e.g. identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2200/00—Indexing scheme for image data processing or generation, in general
- G06T2200/04—Indexing scheme for image data processing or generation, in general involving 3D image data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30196—Human being; Person
- G06T2207/30201—Face
Abstract
Description
先ず、本実施形態に係るシステムの構成例について、図1のブロック図を用いて説明する。図1に示す如く、本実施形態に係るシステムは、情報処理装置1と、カメラ2と、を有し、情報処理装置1とカメラ2とはネットワークを介して互いにデータ通信が可能なように構成されている。ネットワークは無線のネットワークであっても良いし、有線のネットワークであっても良いし、無線のネットワークと有線のネットワークとを組み合わせたネットワークであっても良い。
撮像画像から検出した顔の画像上の座標に基づいて、該撮像画像から顔画像を切り出す。このとき、切り出した顔画像に対する顔の位置が一定になるように該顔画像に対して画像正規化を施す。例えば、顔の両目をつなぐ線分の長さが、切り出す顔画像の幅に対して一定となるように拡大・縮小する。この線分が切り出す顔画像に対して水平になるように回転させる等の処理を施す。そして、撮像画像から検出されたそれぞれの顔画像について、以下のステップS1014〜S1018の処理が行われる。
ここでΣは、F(j,n)I(i−j)を全てのjについて加算することを示す。また、iは出力ベクトルのインデックス、nは出力ベクトル及び重み係数のチャンネル、jは重み係数のインデックスである。演算部125による畳み込み演算処理を模式的に示した図が図8である。
畳み込み処理部113は、畳み込み処理部111と同様の構成(図5)を有しており、プーリング処理部112による結果に対して畳み込み処理部111と同様の処理を行う。畳み込み処理部113が行う畳み込み演算処理は、入力データのサイズや重み係数が異なるだけで畳み込み処理部111と同様であるから、畳み込み処理部113に係る説明は省略する。プーリング処理部114は、畳み込み処理部113による畳み込み演算処理の結果に対して、プーリング処理部112と同様のプーリング処理を行う。
ここで、「x・y」は特徴ベクトル(特徴量)xと特徴ベクトル(特徴量)yとの内積演算を表し、|x|、|y|はそれぞれ、特徴ベクトルx、特徴ベクトルyの大きさを表し、Sは特徴ベクトルxと特徴ベクトルyとの間の類似度を表す。
第1の実施形態では、撮像画像をグレイスケールのシングルチャンネル画像として取得し、このような撮像画像から抽出した顔画像(グレイスケールのシングルチャンネル画像)に対する畳み込み演算処理を説明した。しかし、実際にはカラー画像のようにマルチチャンネル画像の撮像画像が入力される場合も多い。本実施形態では、マルチチャンネル画像の撮像画像から検出された顔画像(マルチチャンネル画像)に対する畳み込み演算処理について説明する。以下では第1の実施形態との差分について説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。本実施形態では、図6のフローチャートに従って以下のような処理が実行される。
第1,2の実施形態では、2次元画像に対する畳み込み演算処理について説明してきたが、より大きな次元の入力に対する畳み込み演算処理においても、上記の実施形態を適用することができる。例えば、以下の文献は3次元の入力データに対する畳み込み処理が開示されており、この例に上記の実施形態を適用することができる。
以下では第1の実施形態との差分について説明し、以下で特に触れない限りは、第1の実施形態と同様であるものとする。本実施形態では、1つの顔を撮像した複数フレームの撮像画像のそれぞれから検出された顔画像(グレイスケール画像)の時系列シーケンス(複数フレームの顔画像を積層した立体)の特徴量を求めるケースについて説明する。本実施形態では、図6のフローチャートに従って以下のような処理が実行される。
第1〜3の実施形態では、変換ベクトル(1次元画素配列、2次元画素配列)がどのような形状なのかを説明するために、いくつかの模式図と手順を用いて説明したが、必ずしもこの通りに処理しなくてもよい。最終的には、低次元のベクトルと重み係数の畳み込みに帰着されるため、変換したベクトルが上で述べたように、設定領域の重複部分の要素を共有する構造になっていればよい。
上記の実施形態では、カメラ2と情報処理装置1とを別個の装置として説明した。しかし、カメラ2と情報処理装置1とを一体化させて1つの装置としても良い。つまり、カメラ2が情報処理装置1の機能として上述した各機能を実行するように構成しても構わない。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (10)
- 入力データが規定する平面若しくは空間内に、少なくとも1組の隣り合う領域が部分的に重複するように設定される各領域内の要素配列をより低次元の要素配列である低次元要素配列に変換する変換手段と、
前記変換手段が変換したそれぞれの低次元要素配列における重複部分を共有するように該それぞれの低次元要素配列の一部若しくは全部を連結した連結要素を生成する生成手段と、
前記連結要素と重み係数との畳み込み演算に基づいて前記入力データの特徴量を求める計算手段と
を備えることを特徴とする情報処理装置。 - 前記入力データは2次元画像であり、
前記変換手段は、隣り合うそれぞれの領域が部分的に重複するように前記2次元画像上に2次元的に設定される各領域内の2次元画素配列を1次元画素配列に変換し、
前記生成手段は、前記2次元画像において第1方向に並ぶ着目領域列のうち一端の領域に後続する各後続領域の1次元画素配列から、前記着目領域列において前記一端側に該後続領域と隣り合う領域の1次元画素配列と重複しない部分を取得し、前記一端の領域に対応する1次元画素配列と、前記部分と、を連結した連結1次元画素配列を生成し、
前記計算手段は、前記連結1次元画素配列と重み係数との畳み込み演算に基づいて前記2次元画像の特徴量を求める
ことを特徴とする請求項1に記載の情報処理装置。 - 前記2次元画像はマルチチャンネル画像における各チャンネル画像であり、
前記生成手段は、各チャンネル画像の前記一端の領域に対応する1次元画素配列の同位置の要素をチャンネル画像順に並べた要素列と、各チャンネル画像に対応する前記部分において同位置の要素をチャンネル画像順に並べた要素列と、を連結した連結1次元画素配列を生成することを特徴とする請求項2に記載の情報処理装置。 - 前記計算手段は、
前記連結1次元画素配列と重み係数との畳み込み演算の結果に対してプーリング処理を行い、該プーリング処理の結果に対して前記畳み込み演算および前記プーリング処理を行うことで前記特徴量を求めることを特徴とする請求項2又は3に記載の情報処理装置。 - 前記入力データは、複数の2次元画像を積層した立体であり、
前記変換手段は、隣り合うそれぞれの領域が部分的に重複するように前記立体内に設定される各領域内の3次元画素配列を2次元画素配列に変換し、
前記生成手段は、前記立体において前記積層の方向と直交する第1方向に並ぶ着目領域列のうち一端の領域に後続する各後続領域の2次元画素配列から、前記着目領域列において前記一端側に該後続領域と隣り合う領域の2次元画素配列と重複しない部分を取得し、前記一端の領域に対応する2次元画素配列と、前記部分と、を連結した連結2次元画素配列を生成し、
前記計算手段は、前記連結2次元画素配列と重み係数との畳み込み演算に基づいて前記立体の特徴量を求める
ことを特徴とする請求項1に記載の情報処理装置。 - 前記情報処理装置は更に、前記特徴量と、ユーザにより入力された被写体に係る情報と、を登録辞書に登録する登録手段を備えることを特徴とする請求項1乃至5の何れか1項に記載の情報処理装置。
- 前記情報処理装置は更に、前記計算手段が求めた特徴量と、前記登録辞書に登録されている特徴量と、の類似度に基づいて、前記入力データに対する認証を行う認証手段を備えることを特徴とする請求項6に記載の情報処理装置。
- 前記情報処理装置は更に、前記認証手段による認証の結果を出力する出力手段を備えることを特徴とする請求項7に記載の情報処理装置。
- 情報処理装置が行う情報処理方法であって、
前記情報処理装置の変換手段が、入力データが規定する平面若しくは空間内に、少なくとも1組の隣り合う領域が部分的に重複するように設定される各領域内の要素配列をより低次元の要素配列である低次元要素配列に変換する変換工程と、
前記情報処理装置の生成手段が、前記変換工程で変換したそれぞれの低次元要素配列における重複部分を共有するように該それぞれの低次元要素配列の一部若しくは全部を連結した連結要素を生成する生成工程と、
前記情報処理装置の計算手段が、前記連結要素と重み係数との畳み込み演算に基づいて前記入力データの特徴量を求める計算工程と
を備えることを特徴とする情報処理方法。 - コンピュータを請求項1乃至8の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077796A JP7104546B2 (ja) | 2018-04-13 | 2018-04-13 | 情報処理装置、情報処理方法 |
US16/379,882 US10909353B2 (en) | 2018-04-13 | 2019-04-10 | Information processing apparatus, information processing method, non-transitory computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018077796A JP7104546B2 (ja) | 2018-04-13 | 2018-04-13 | 情報処理装置、情報処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2019185548A true JP2019185548A (ja) | 2019-10-24 |
JP2019185548A5 JP2019185548A5 (ja) | 2021-05-27 |
JP7104546B2 JP7104546B2 (ja) | 2022-07-21 |
Family
ID=68161769
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018077796A Active JP7104546B2 (ja) | 2018-04-13 | 2018-04-13 | 情報処理装置、情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10909353B2 (ja) |
JP (1) | JP7104546B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022190157A1 (ja) * | 2021-03-08 | 2022-09-15 | 株式会社日立国際電気 | 撮像装置及び映像処理システム |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10752253B1 (en) * | 2019-08-28 | 2020-08-25 | Ford Global Technologies, Llc | Driver awareness detection system |
CN113837923A (zh) * | 2021-09-26 | 2021-12-24 | 安徽寒武纪信息科技有限公司 | 数据处理装置、数据处理方法及相关产品 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001312729A (ja) * | 2000-04-28 | 2001-11-09 | Minolta Co Ltd | 画像処理装置,画像処理方法及び画像処理プログラムを記録した記録媒体 |
US20100014718A1 (en) * | 2008-04-17 | 2010-01-21 | Biometricore, Inc | Computationally Efficient Feature Extraction and Matching Iris Recognition |
JP2011086265A (ja) * | 2009-10-19 | 2011-04-28 | Canon Inc | 画像処理装置及び方法、プログラム及び記憶媒体 |
US20160162402A1 (en) * | 2014-12-04 | 2016-06-09 | Nvidia Corporation | Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5577135A (en) * | 1994-03-01 | 1996-11-19 | Apple Computer, Inc. | Handwriting signal processing front-end for handwriting recognizers |
US6408107B1 (en) * | 1996-07-10 | 2002-06-18 | Michael I. Miller | Rapid convolution based large deformation image matching via landmark and volume imagery |
US7634137B2 (en) | 2005-10-14 | 2009-12-15 | Microsoft Corporation | Unfolded convolution for fast feature extraction |
JP5364982B2 (ja) * | 2007-06-26 | 2013-12-11 | コニカミノルタ株式会社 | 情報処理システム |
JP5202037B2 (ja) | 2008-02-29 | 2013-06-05 | キヤノン株式会社 | 特徴点位置決定方法及び装置 |
US8160388B2 (en) | 2008-06-17 | 2012-04-17 | International Business Machines Corporation | Spatially selective transformation of a spatially varying optical characteristic of an image in an array of pixels |
US10067669B1 (en) * | 2017-07-13 | 2018-09-04 | King Fahd University Of Petroleum And Minerals | Online character recognition |
-
2018
- 2018-04-13 JP JP2018077796A patent/JP7104546B2/ja active Active
-
2019
- 2019-04-10 US US16/379,882 patent/US10909353B2/en active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001312729A (ja) * | 2000-04-28 | 2001-11-09 | Minolta Co Ltd | 画像処理装置,画像処理方法及び画像処理プログラムを記録した記録媒体 |
US20100014718A1 (en) * | 2008-04-17 | 2010-01-21 | Biometricore, Inc | Computationally Efficient Feature Extraction and Matching Iris Recognition |
JP2011086265A (ja) * | 2009-10-19 | 2011-04-28 | Canon Inc | 画像処理装置及び方法、プログラム及び記憶媒体 |
US20160162402A1 (en) * | 2014-12-04 | 2016-06-09 | Nvidia Corporation | Indirectly accessing sample data to perform multi-convolution operations in a parallel processing system |
Non-Patent Citations (3)
Title |
---|
ARJUN AGRAWAL ET AL.: ""Feature Based Iris Recognition System Functioning on Extraction of 2D Features"", 2012 6TH INTERNATIONAL CONFERENCE ON APPLICATON OF INFORMATION AND COMMUNICATION TECHNOLOGIES (AICT), JPN6022012136, 17 October 2012 (2012-10-17), US, pages 1 - 5, XP032293863, ISSN: 0004740227, DOI: 10.1109/ICAICT.2012.6398476 * |
斎藤 康毅, "ゼロから作るDEEP LEARNING", vol. 第1版, JPN6022012137, 28 September 2016 (2016-09-28), JP, pages 221 - 227, ISSN: 0004740226 * |
浅川 伸一, "PYTHONで体験する深層学習", vol. 第1版, JPN6022012138, 18 August 2016 (2016-08-18), JP, pages 99 - 119, ISSN: 0004740225 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022190157A1 (ja) * | 2021-03-08 | 2022-09-15 | 株式会社日立国際電気 | 撮像装置及び映像処理システム |
JP7448721B2 (ja) | 2021-03-08 | 2024-03-12 | 株式会社日立国際電気 | 撮像装置及び映像処理システム |
Also Published As
Publication number | Publication date |
---|---|
US20190318157A1 (en) | 2019-10-17 |
JP7104546B2 (ja) | 2022-07-21 |
US10909353B2 (en) | 2021-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11675943B2 (en) | Tool to create a reconfigurable interconnect framework | |
WO2021073493A1 (zh) | 图像处理方法及装置、神经网络的训练方法、合并神经网络模型的图像处理方法、合并神经网络模型的构建方法、神经网络处理器及存储介质 | |
US11610362B2 (en) | Data volume sculptor for deep learning acceleration | |
EP3346423B1 (en) | Deep convolutional network heterogeneous architecture system and device | |
WO2018174623A1 (ko) | 가상 3차원 심층 신경망을 이용하는 영상 분석 장치 및 방법 | |
KR101991763B1 (ko) | 조밀 탐색 방법 및 화상 처리 장치 | |
US11157764B2 (en) | Semantic image segmentation using gated dense pyramid blocks | |
EP3346425B1 (en) | Hardware accelerator engine and method | |
JP2022058173A (ja) | 画像分類方法及び機器 | |
JP7104546B2 (ja) | 情報処理装置、情報処理方法 | |
JP2018151748A (ja) | 画像処理装置、画像処理方法、テンプレート作成装置、物体認識処理装置及びプログラム | |
EP3346427B1 (en) | Configurable accelerator framework, system and method | |
WO2021012494A1 (zh) | 基于深度学习的人脸识别方法、装置及计算机可读存储介质 | |
JP6656988B2 (ja) | 画像処理装置、半導体装置、画像認識装置、移動体装置、及び画像処理方法 | |
US20130243330A1 (en) | Method and apparatus for constructing image blur pyramid, and an image feature extracting circuit | |
US11704894B2 (en) | Semantic image segmentation using gated dense pyramid blocks | |
JP5258506B2 (ja) | 情報処理装置 | |
WO2018106524A1 (en) | Feature detection in compressive imaging | |
Zhou et al. | Inceptr: micro-expression recognition integrating inception-CBAM and vision transformer | |
Chai et al. | Focal-plane processing architectures for real-time hyperspectral image processing | |
Ghazi et al. | Embedded implementation of a deep learning smile detector | |
WO2022179606A1 (zh) | 一种图像处理方法及相关装置 | |
Robila et al. | Considerations on parallelizing nonnegative matrix factorization for hyperspectral data unmixing | |
CN111797862A (zh) | 任务处理方法、装置、存储介质和电子设备 | |
WO2022183325A1 (zh) | 视频块处理方法及装置、神经网络的训练方法和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20210103 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210113 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210401 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210401 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220322 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220401 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220527 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220610 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220708 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7104546 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |