JP2021093144A - センサ特化イメージ認識装置及び方法 - Google Patents
センサ特化イメージ認識装置及び方法 Download PDFInfo
- Publication number
- JP2021093144A JP2021093144A JP2020184118A JP2020184118A JP2021093144A JP 2021093144 A JP2021093144 A JP 2021093144A JP 2020184118 A JP2020184118 A JP 2020184118A JP 2020184118 A JP2020184118 A JP 2020184118A JP 2021093144 A JP2021093144 A JP 2021093144A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- data
- image
- sensor
- layer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 44
- 238000000605 extraction Methods 0.000 claims abstract description 45
- 230000004044 response Effects 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims description 92
- 230000003287 optical effect Effects 0.000 claims description 23
- 239000000284 extract Substances 0.000 claims description 13
- 238000001914 filtration Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 abstract description 11
- 238000012795 verification Methods 0.000 description 29
- 238000013528 artificial neural network Methods 0.000 description 28
- 230000006870 function Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 5
- 238000013507 mapping Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 230000000644 propagated effect Effects 0.000 description 4
- 230000009471 action Effects 0.000 description 3
- 230000004913 activation Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 241000282412 Homo Species 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000013502 data validation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000012567 pattern recognition method Methods 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/7715—Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/217—Validation; Performance evaluation; Active pattern learning techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/10—Image acquisition
- G06V10/12—Details of acquisition arrangements; Constructional details thereof
- G06V10/14—Optical characteristics of the device performing the acquisition or on the illumination arrangements
- G06V10/147—Details of sensors, e.g. sensor lenses
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
- G06V10/44—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
- G06V10/443—Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components by matching or filtering
- G06V10/449—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters
- G06V10/451—Biologically inspired filters, e.g. difference of Gaussians [DoG] or Gabor filters with interaction between the filter responses, e.g. cortical complex cells
- G06V10/454—Integrating the filters into a hierarchical structure, e.g. convolutional neural networks [CNN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/80—Recognising image objects characterised by unique random patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Medical Informatics (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Biophysics (AREA)
- Mathematical Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biodiversity & Conservation Biology (AREA)
- Vascular Medicine (AREA)
- Image Analysis (AREA)
Abstract
Description
参考として、本明細書において、認識データの例示として主に検証スコアを説明するが、これに限定されることはない。認識データは、入力イメージに示されるオブジェクトがk個のクラスそれぞれに属する確率を指示する情報を含んでもよい。ここで、kは2以上の整数である。また、認識データを算出する演算として、代表的にソフトマックス演算について主に説明するが、これに限定されることなく、他の非線型マッピング関数(non−linear mapping function)が使用されてもよい。
は要素ごとの演算(例えば、要素ごとの積)を示す。イメージ認識装置は、汎用特徴マップ612Featgenericを完全接続レイヤ613に伝播して出力された値にソフトマックス演算614を適用して第1認識データ681を算出する。例示的に、特徴データx、汎用特徴マップ612Featgeneric、及び完全接続レイヤ613から出力されるデータの大きさ(例えば、32×32)は互いに同一であってもよい。
301 入力イメージ
309 認識結果
310 認識モデル
311 特徴抽出レイヤ
312 固定レイヤ
313 センサ特化レイヤ
321 固定マスク
322 可変マスク
1010 トレーニング装置
1100 イメージ認識装置
1200 コンピューティング装置
Claims (25)
- イメージセンサによって受信された入力イメージから特徴抽出レイヤを用いて特徴データを抽出するステップと、
前記抽出された特徴データに固定マスク及び可変マスクを適用することで、前記入力イメージに示されるオブジェクトに関する認識結果を出力するステップと、
を含み、
前記可変マスクは、前記抽出された特徴データに応答して調整される、イメージ認識方法。 - 前記認識結果を出力するステップは、
前記抽出された特徴データに前記固定マスクを適用することで、第1認識データを算出するステップと、
前記抽出された特徴データに前記可変マスクを適用することで、第2認識データを算出するステップと、
前記第1認識データ及び前記第2認識データに基づいて前記認識結果を決定するステップと、
を含む、請求項1に記載のイメージ認識方法。 - 前記第1認識データを算出するステップは、
前記抽出された特徴データに前記固定マスクを適用することで、オブジェクト関心領域に関する汎用特徴マップを生成するステップと、
前記汎用特徴マップから前記第1認識データを算出するステップと、
を含む、請求項2に記載のイメージ認識方法。 - 前記第2認識データを算出するステップは、
前記抽出された特徴データに対応する対象特徴マップに対して前記可変マスクを適用することで、前記イメージセンサの関心領域に関するセンサ特化特徴マップを生成するステップと、
前記センサ特化特徴マップから前記第2認識データを算出するステップと、
を含む、請求項2に記載のイメージ認識方法。 - 前記センサ特化特徴マップを生成するステップは、前記対象特徴マップの個別値に対して前記可変マスクにおいて対応する値を適用するステップを含む、請求項4に記載のイメージ認識方法。
- 前記抽出された特徴データから完全接続レイヤ及びソフトマックス関数を用いて第3認識データを算出するステップをさらに含み、
前記認識結果を決定するステップは、前記第1認識データ及び前記第2認識データと共に、前記第3認識データにさらに基づいて前記認識結果を決定するステップを含む、請求項2に記載のイメージ認識方法。 - 前記認識結果を出力するステップは、前記可変マスクを含むセンサ特化レイヤの少なくとも一部のレイヤを用いて、前記特徴データにより前記可変マスクの1つ以上の値を調整するステップを含む、請求項1に記載のイメージ認識方法。
- 前記可変マスクの1つ以上の値を調整するステップは、前記特徴データに対して畳み込みフィルタリングが適用された結果であるキー特徴マップ及び転置されたクエリ特徴マップ間の積結果から、ソフトマックス関数を用いて前記可変マスクの値を決定するステップを含む、請求項7に記載のイメージ認識方法。
- 前記認識結果を出力するステップは、前記固定されたマスクに基づいた第1認識データ及び前記可変マスクに基づいた第2認識データの加重和を前記認識結果として決定するステップを含む、請求項1に記載のイメージ認識方法。
- 前記加重和を前記認識結果として決定するステップは、前記第1認識データに適用される加重値よりも大きい加重値を前記第2認識データに適用するステップを含む、請求項9に記載のイメージ認識方法。
- アップデート命令に応答して、外部サーバから前記可変マスクを含むセンサ特化レイヤのパラメータを受信するステップと、
受信された前記パラメータをセンサ特化レイヤにアップデートするステップと、
をさらに含む、請求項1に記載のイメージ認識方法。 - 前記外部サーバに対して、前記イメージセンサの光学特性と同一又は類似の光学特性に対応するセンサ特化パラメータを要求するステップをさらに含む、請求項11に記載のイメージ認識方法。
- 前記センサ特化レイヤのパラメータをアップデートする間に、前記固定マスクの値を保持するステップをさらに含む、請求項11に記載のイメージ認識方法。
- 前記認識結果を出力するステップは、前記固定マスク及び複数の可変マスクに基づいて前記認識結果を算出するステップを含む、請求項1に記載のイメージ認識方法。
- 前記複数の可変マスクのうち、1つの可変マスクを含むセンサ特化レイヤのパラメータ及び他方の可変マスクを含む他のセンサ特化レイヤのパラメータは互いに異なる、請求項14に記載のイメージ認識方法。
- 前記認識結果を出力するステップは、前記オブジェクトがリアルオブジェクトであるか、又は、偽造オブジェクトであるかを指示する真偽情報を前記認識結果として生成するステップを含む、請求項1に記載のイメージ認識方法。
- 前記認識結果に基づいて権限を付与するステップと、
前記権限により電子端末の動作及び前記電子端末のデータのうち少なくとも1つに対するアクセスを許容するステップと、
をさらに含む、請求項1に記載のイメージ認識方法。 - 前記認識結果を出力するステップは、前記認識結果が生成された後、前記認識結果をディスプレイを介して可視化するステップを含む、請求項1に記載のイメージ認識方法。
- 請求項1〜請求項18のいずれか一項に記載の方法を実行するための命令語を含む1つ以上のコンピュータプログラムを格納したコンピュータで読み出し可能な記録媒体。
- 入力イメージを受信するイメージセンサと、
前記入力イメージから特徴抽出レイヤを用いて特徴データを抽出し、前記抽出された特徴データに固定マスク及び可変マスクを適用することで、前記入力イメージに示されるオブジェクトに関する認識結果を出力するプロセッサと、
を含み、
前記可変マスクは、前記抽出された特徴データに応答して調整される、イメージ認識装置。 - 前記プロセッサは、
前記抽出された特徴データに前記固定マスクを適用することで、前記抽出された特徴データから第1認識データを算出し、
前記抽出された特徴データに前記可変マスクを適用することで、前記抽出された特徴データから第2認識データを算出し、
前記第1認識データ及び前記第2認識データの和に基づいて前記認識結果を決定する、請求項20に記載のイメージ認識装置。 - 前記和は、前記第1認識データに適用される加重値よりも大きい加重値を前記第2認識データに適用することで決定される、請求項21に記載のイメージ認識装置。
- 前記プロセッサは、
前記抽出された特徴データに前記固定マスクを適用することで、オブジェクト関心領域に関する汎用特徴マップを生成し、
前記汎用特徴マップから前記第1認識データを算出し、
前記抽出された特徴データに対応する対象特徴マップに対して前記可変マスクを適用することで、前記イメージセンサの関心領域に関するセンサ特化特徴マップを生成し、
前記センサ特化特徴マップから前記第2認識データを算出する、請求項21に記載のイメージ認識装置。 - 受信された入力イメージから特徴抽出レイヤを用いて特徴データを抽出し、可変マスク及び固定されたマスクを前記抽出された特徴データに適用することで、前記入力イメージに示されるオブジェクトに関する認識結果を出力するイメージ認識装置と、
認識モデルのセンサ特化レイヤに対する追加トレーニング完了及びアップデート要求のうち少なくとも1つに応答して、前記イメージ認識装置に追加的にトレーニングされたセンサ特化レイヤのパラメータを配布するサーバを含み、
前記可変マスクは、前記イメージ認識装置の前記センサ特化レイヤに含まれて前記抽出された特徴データに応答して調整され、
前記イメージ認識装置は、配布された前記パラメータに基づいて前記イメージ認識装置の前記センサ特化レイヤをアップデートする、イメージ認識システム。 - 前記サーバは、前記イメージ認識装置のイメージセンサに類似していると判断されたイメージセンサを含む他のイメージ認識装置に前記追加的にトレーニングされたセンサ特化レイヤの前記パラメータを配布する、請求項24に記載のイメージ認識システム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2019-0161553 | 2019-12-06 | ||
KR1020190161553A KR20210071410A (ko) | 2019-12-06 | 2019-12-06 | 센서 특화 이미지 인식 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021093144A true JP2021093144A (ja) | 2021-06-17 |
JP7635495B2 JP7635495B2 (ja) | 2025-02-26 |
Family
ID=
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023188790A1 (ja) * | 2022-03-29 | 2023-10-05 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法、コンピュータプログラム |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023188790A1 (ja) * | 2022-03-29 | 2023-10-05 | ソニーグループ株式会社 | 情報処理装置及び情報処理方法、コンピュータプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20210174138A1 (en) | 2021-06-10 |
EP3832542A1 (en) | 2021-06-09 |
CN112926574A (zh) | 2021-06-08 |
KR20210071410A (ko) | 2021-06-16 |
US11354535B2 (en) | 2022-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102692671B1 (ko) | 이미지 생성 장치 및 방법과 생성 모델을 트레이닝시키는 장치 및 방법 | |
CN113056743B (zh) | 训练神经网络以用于车辆重新识别 | |
CN107529650B (zh) | 闭环检测方法、装置及计算机设备 | |
KR102308871B1 (ko) | 객체의 속성에 기반하여 객체를 인식 및 트레이닝하는 방법 및 장치 | |
JP6754619B2 (ja) | 顔認識方法及び装置 | |
CN111274916B (zh) | 人脸识别方法和人脸识别装置 | |
US11423702B2 (en) | Object recognition method and apparatus | |
US20180137395A1 (en) | Recognition and training method and apparatus | |
US20180157892A1 (en) | Eye detection method and apparatus | |
CN110647918A (zh) | 面向深度学习模型对抗攻击的拟态防御方法 | |
CN107341447A (zh) | 一种基于深度卷积神经网络和证据k近邻的人脸核实方法 | |
Soni et al. | Hybrid meta-heuristic algorithm based deep neural network for face recognition | |
CN109902667A (zh) | 基于光流引导特征块和卷积gru的人脸活体检测方法 | |
EP3674974A1 (en) | Apparatus and method with user verification | |
KR20200083119A (ko) | 사용자 인증 장치 및 방법 | |
WO2023072175A1 (zh) | 点云数据的处理方法、神经网络的训练方法以及相关设备 | |
JP2020107331A (ja) | 一般化されたユーザモデルを用いたユーザ認証方法及び装置 | |
CN111898561A (zh) | 一种人脸认证方法、装置、设备及介质 | |
CN113254927A (zh) | 一种基于网络防御的模型处理方法、装置及存储介质 | |
KR20170057118A (ko) | 오브젝트 인식 방법 및 장치, 인식 모델 학습 방법 및 장치 | |
Gona et al. | Transfer learning convolutional neural network with modified Lion optimization for multimodal biometric system | |
AL-Ghamdi et al. | Artificial Intelligence Techniques Based Learner Authentication in Cybersecurity Higher Education Institutions. | |
KR20200140571A (ko) | 데이터 인식 방법 및 장치 | |
US11354535B2 (en) | Device and method with sensor-specific image recognition | |
JP7635495B2 (ja) | センサ特化イメージ認識装置及び方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231101 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240821 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20241001 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20241220 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20250114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20250123 |