JP5777367B2 - パターン識別装置、パターン識別方法及びプログラム - Google Patents
パターン識別装置、パターン識別方法及びプログラム Download PDFInfo
- Publication number
- JP5777367B2 JP5777367B2 JP2011072239A JP2011072239A JP5777367B2 JP 5777367 B2 JP5777367 B2 JP 5777367B2 JP 2011072239 A JP2011072239 A JP 2011072239A JP 2011072239 A JP2011072239 A JP 2011072239A JP 5777367 B2 JP5777367 B2 JP 5777367B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- feature
- sub
- sampling
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Description
以下、本発明の第1の実施形態の動作について図面を参照しながら説明する。
図1は、本実施形態に係るパターン識別装置の論理的な構成例を示す図である。本実施形態では、画像中の顔や特定の物体等の特定のパターンを検出する場合の例について説明する。
input(x,y):座標(x、y)での参照画素値
output(x,y):座標(x、y)での演算結果
weight(column, row):座標(x+column、y+row)での重み係数
columnSize, rowSize:フィルタサイズ(フィルタタップ数)
value(x,y,i):座標(x、y)での前階層特徴面iの参照画素値
output(x,y,):座標(x、y)での演算結果
weight(column, row,i):座標(x+column、y+row)での前階層特徴面iに対する重み係数
columnSize, rowSize:フィルタサイズ(フィルタタップ数)
feature:前階層の特徴面番号
501は画像入力部である。画像入力部501は光学系デバイス、光電変換デバイス及びセンサーを制御するドライバー回路/ADコンバーター/各種画像補正を司る信号処理回路/フレームバッファ等により構成する。504はCPU(Central Processing Unit)であり、本実施形態に係る主要な処理を実行すると共に本装置全体の動作を制御する。505はROM(Read Only Memory)であり、CPU504の動作を規定する命令やデータを格納する。
第1の実施形態では、サブサンプリングの無い状態で学習したCNN演算器に所定のサブサンプリングパターンによるサブサンプリングを実施する場合に説明した。本実施形態では、サブサンプリング処理を組み込んだCNN演算器を更に再学習する場合について説明する。なお、本実施形態に係るパターン識別装置の構成例は図5と同様であるため、説明は省略する。
第1の実施形態ではCNNに適用する場合について説明したが、本実施形態では、これ以外に適用する例について説明する。
図8は本実施形態のパターン識別装置の構成例を説明するブロック図である。本実施形態のパターン識別装置は一般的な複数の特徴抽出器とその結果に基づく判別器とからなる。
800は識別対象となる画像データである。801a〜cは特徴抽出器であり、画像データから所望の特徴を抽出する。例えば特定の方向のエッジを抽出する、或いは特定の小パターンを抽出する等を目的とする特徴抽出器である。
第1〜第3の実施形態では、画像データから特定のパターンを抽出する場合について説明したが、これに限るわけではない。例えば、人物の行動認識等においては連続する複数の画像データから抽出した特徴に基づいて所定の行動パターンを識別する場合がある。この場合、識別の対象となるデータは時間軸も加えた3次元データとなる。3次元データから特徴を抽出する際にも高速化のためサブサンプリングを実施する。その際、特徴抽出器の結果分布が3次元座標の各座標軸に対して偏りを有する場合、第1の実施形態と同様に、各座標軸に対して非対称なサブサンプリングが有効である。本実施形態では、このような場合の例について説明する。
900は識別対象データであり、複数の画像データをまとめて3次元データとして表現したものである。座標系のxは画像データの水平方向、yは垂直方向、tは時間方向である。901は垂直方向にサブサンプリングして特徴抽出した場合のサブサンプリングパターンであり、902は水平方向にサブサンプリングして特徴抽出した場合のサブサンプリングパターンである。また、903は時間軸方向にサブサンプリングして特徴抽出した場合のサブサンプリングパターンである。
第1の実施形態では、特徴面の出力分布に基づいてサブサンプリングパターンを決定する手法について説明したが、本実施形態では、特徴量抽出性能に基づいて決定する例について説明する。この場合、図6に対してステップS604のみが異なる。具体的には、候補となる全てのサブサンプリングパターンで特徴面をサブサンプリングし、ステップS604に代わる処理で、それぞれ特徴量抽出性能を判定した上で最も良い性能を示すサブサンプリングパターンを選択する。特徴量抽出性能の判断は、単純なしきい値処理としきい値を超えた値の数の総和等の簡単な手法で実現することができる。
まず、ステップS1001では、候補となるサブサンプリングパターンを選択する。そして、ステップS1002では、選択したサブサンプリングパターンを用いて識別処理を実行し、その識別性能を評価する。識別性能の評価は、評価用のデータセットを用いて評価する。なお、サブサンプリングによって後続(上位の階層)の処理が影響を受ける場合、ここで後続の処理の学習やパラメータの変更を行う。
前述した各実施形態では、多次元のデータに対する処理について説明したが、音声信号などの1次元信号に対しても同様に適用可能である。また、前述した各実施形態では特徴毎にサブサンプリングパターンを変える場合について説明したが、階層毎に変える方法でも良い。その場合、各階層の特徴面のサイズが同一となるため、上位層でそのサイズを意識して処理する必要がない。また、サブサンプリングパターンは、複数の特徴面の出力分布の平均を使用する、或いは重要度の高い特徴面の出力分布に基づいてする等の手法により決定する。また、第5の実施形態で説明した様にパターン識別性能に基づいて判定しても良い。
Claims (5)
- 学習用画像データについて複数種類の特徴量のそれぞれの分布を判定する分布判定手段と、
前記複数種類の特徴量のそれぞれの分布に基づいて、当該特徴量の種類毎に、該特徴量を算出すべき位置を指定する走査パターンを決定する決定手段と、
識別用画像データにおいて、前記複数種類の特徴量のそれぞれを、当該特徴量の種類毎に決定された前記走査パターンにより指定された位置から算出する算出手段と、
算出された前記複数種類の特徴量に基づいて、前記識別用画像データにおける所定パターンの位置を判定する位置判定手段とを有することを特徴とするパターン識別装置。 - 前記算出手段は、算出の処理を階層的に行い、
前記決定手段は、階層毎に前記走査パターンを決定することを特徴とする請求項1に記載のパターン識別装置。 - 前記走査パターンは、一定方向について所定の間隔で走査するパターンであり、
前記決定手段は、前記分布判定手段により判定された分布が特定の方向性を有する場合に、当該方向性と類似する方向について所定の間隔で走査するパターンを前記走査パターンに決定することを特徴とする請求項1に記載のパターン識別装置。 - 学習用画像データについて複数種類の特徴量のそれぞれの分布を判定する分布判定工程と、
前記複数種類の特徴量のそれぞれの分布に基づいて、当該特徴量の種類毎に、該特徴量を算出すべき位置を指定する走査パターンを決定する決定工程と、
識別用画像データにおいて、前記複数種類の特徴量のそれぞれを、当該特徴量の種類毎に決定された前記走査パターンにより指定された位置から算出する算出工程と、
算出された前記複数種類の特徴量に基づいて、前記識別用画像データにおける所定パターンの位置を判定する位置判定工程とを有することを特徴とするパターン識別方法。 - 請求項4に記載のパターン識別方法の各工程をコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011072239A JP5777367B2 (ja) | 2011-03-29 | 2011-03-29 | パターン識別装置、パターン識別方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011072239A JP5777367B2 (ja) | 2011-03-29 | 2011-03-29 | パターン識別装置、パターン識別方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012208597A JP2012208597A (ja) | 2012-10-25 |
JP5777367B2 true JP5777367B2 (ja) | 2015-09-09 |
Family
ID=47188303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011072239A Active JP5777367B2 (ja) | 2011-03-29 | 2011-03-29 | パターン識別装置、パターン識別方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5777367B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108734673A (zh) * | 2018-04-20 | 2018-11-02 | 平安科技(深圳)有限公司 | 去网纹系统训练方法、去网纹方法、装置、设备及介质 |
US10755126B2 (en) | 2016-11-07 | 2020-08-25 | Samsung Electronics Co., Ltd. | Convolutional neural network processing method and apparatus |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6137916B2 (ja) * | 2013-04-01 | 2017-05-31 | キヤノン株式会社 | 信号処理装置、信号処理方法、及び、信号処理システム |
CN105981008B (zh) * | 2014-05-27 | 2019-05-28 | 北京旷视科技有限公司 | 学习深度人脸表示 |
KR101563569B1 (ko) | 2014-05-28 | 2015-10-28 | 한국과학기술원 | 학습형 다이내믹 시각 이미지 패턴 인식 시스템 및 방법 |
JP6414458B2 (ja) * | 2014-12-17 | 2018-10-31 | 株式会社デンソー | 演算処理装置 |
CN106156807B (zh) | 2015-04-02 | 2020-06-02 | 华中科技大学 | 卷积神经网络模型的训练方法及装置 |
CN108229666A (zh) * | 2017-11-03 | 2018-06-29 | 东南大学 | 基于费马数变换的卷积神经网络硬件加速架构 |
KR102161690B1 (ko) * | 2018-02-05 | 2020-10-05 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
CN109117753B (zh) * | 2018-07-24 | 2021-04-20 | 广州虎牙信息科技有限公司 | 部位识别方法、装置、终端及存储介质 |
JP7324086B2 (ja) * | 2019-08-15 | 2023-08-09 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001331799A (ja) * | 2000-03-16 | 2001-11-30 | Toshiba Corp | 画像処理装置および画像処理方法 |
US7194134B2 (en) * | 2001-01-02 | 2007-03-20 | Microsoft Corporation | Hierarchical, probabilistic, localized, semantic image classifier |
JP2002358523A (ja) * | 2001-05-31 | 2002-12-13 | Canon Inc | パターン認識処理装置及びその方法、画像入力装置 |
-
2011
- 2011-03-29 JP JP2011072239A patent/JP5777367B2/ja active Active
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10755126B2 (en) | 2016-11-07 | 2020-08-25 | Samsung Electronics Co., Ltd. | Convolutional neural network processing method and apparatus |
US11508146B2 (en) | 2016-11-07 | 2022-11-22 | Samsung Electronics Co., Ltd. | Convolutional neural network processing method and apparatus |
CN108734673A (zh) * | 2018-04-20 | 2018-11-02 | 平安科技(深圳)有限公司 | 去网纹系统训练方法、去网纹方法、装置、设备及介质 |
WO2019200702A1 (zh) * | 2018-04-20 | 2019-10-24 | 平安科技(深圳)有限公司 | 去网纹系统训练方法、去网纹方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
JP2012208597A (ja) | 2012-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5777367B2 (ja) | パターン識別装置、パターン識別方法及びプログラム | |
KR102319177B1 (ko) | 이미지 내의 객체 자세를 결정하는 방법 및 장치, 장비, 및 저장 매체 | |
US10510148B2 (en) | Systems and methods for block based edgel detection with false edge elimination | |
CN110322453B (zh) | 基于位置注意力和辅助网络的3d点云语义分割方法 | |
US11087169B2 (en) | Image processing apparatus that identifies object and method therefor | |
CN107301402B (zh) | 一种现实场景关键帧的确定方法、装置、介质及设备 | |
CN107025660B (zh) | 一种确定双目动态视觉传感器图像视差的方法和装置 | |
JP6192271B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP2016505186A (ja) | エッジ保存・ノイズ抑制機能を有するイメージプロセッサ | |
CN109064505B (zh) | 一种基于滑动窗口张量提取的深度估计方法 | |
JP2005190400A (ja) | 顔画像検出方法及び顔画像検出システム並びに顔画像検出プログラム | |
WO2018147059A1 (ja) | 画像処理装置、および画像処理方法、並びにプログラム | |
CN112580434A (zh) | 一种基于深度相机的人脸误检优化方法、系统及人脸检测设备 | |
CN112926667B (zh) | 深度融合边缘与高层特征的显著性目标检测方法及装置 | |
JP5791373B2 (ja) | 特徴点位置決定装置、特徴点位置決定方法及びプログラム | |
JP5335554B2 (ja) | 画像処理装置及び画像処理方法 | |
KR20080079443A (ko) | 영상으로부터의 객체 검출 방법 및 장치 | |
CN113569896A (zh) | 基于图像和深度数据进行对象3d定位的计算机实现方法 | |
CN110766609B (zh) | 一种针对ToF相机的景深图超分辨率重建方法 | |
RU2647645C1 (ru) | Способ устранения швов при создании панорамных изображений из видеопотока кадров в режиме реального времени | |
CN111630569B (zh) | 双目匹配的方法、视觉成像装置及具有存储功能的装置 | |
KR20180012638A (ko) | 누적 채널 특징점을 이용한 영상 인식에서의 객체 검출 방법 및 장치 | |
EP4036795A1 (en) | Method for verifying the identity of a user by identifying an object within an image that has a biometric characteristic of the user and separating a portion of the image comprising the biometric characteristic from other portions of the image | |
KR100576942B1 (ko) | 방향 필터링을 이용한 스테레오 영상의 정합 시스템 및 그방법 | |
KR102452192B1 (ko) | 반려 동물의 식별을 위한 객체의 이미지를 필터링하기 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20140328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20141212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150113 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20150316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20150609 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20150707 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5777367 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |