JP5865043B2 - 情報処理装置、情報処理方法 - Google Patents
情報処理装置、情報処理方法 Download PDFInfo
- Publication number
- JP5865043B2 JP5865043B2 JP2011267256A JP2011267256A JP5865043B2 JP 5865043 B2 JP5865043 B2 JP 5865043B2 JP 2011267256 A JP2011267256 A JP 2011267256A JP 2011267256 A JP2011267256 A JP 2011267256A JP 5865043 B2 JP5865043 B2 JP 5865043B2
- Authority
- JP
- Japan
- Prior art keywords
- code
- bit
- reliability
- value
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/74—Image or video pattern matching; Proximity measures in feature spaces
- G06V10/75—Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
- G06V10/751—Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/22—Character recognition characterised by the type of writing
- G06V30/224—Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks
Description
前記符号の各ビットに対する信頼度を計算する計算手段と、
前記符号において前記信頼度が所定値以下のビットまたは前記信頼度の和が所定の合計値以下となるビットの組の少なくとも1つのビットを反転させた類似符号を生成する生成手段と、
前記符号化手段が生成した符号と、前記生成手段が生成した類似符号と、に基づいて前記入力画像パターンを認識する認識手段と
を備えることを特徴とする。
先ず、情報処理装置として機能する、本実施形態に係るパターン認識装置の構成例について、図1のブロック図を用いて説明する。なお、図1に示した構成は、以下に説明する各処理を実現するための構成の一例に過ぎない。
・ 認識部112
・ 符号化部115
・ 辞書照合部116
・ 結果集計部117
・ 類似符号算出部118
・ 信頼度算出部119
以下では、これらの各部を処理の主体として説明するが、実際には、CPU101がこれらの各部に相当するコンピュータプログラムを実行することで、これらの各部が行うものとして後述する各処理を実行することになる。
本実施形態に係るパターン認識装置が行う学習処理について、同処理のフローチャートを示す図2を用いて説明する。ここでは説明を簡単にするために、図2を用いた以下の説明では、一つの分類木を学習して分類木113を生成する過程について説明する。この処理が学習処理の手順の主要な部分である。後述するように、学習部111は、図2で説明する分類木生成手順を複数回繰り返して複数の分類木を生成し、生成した複数の分類木を結合して辞書114を生成する。複数の分類木をまとめて一つの辞書にする処理の詳細については後述する。
L2=IMG(id)[x2(b)、y2(b)]
次に、ステップS803では、符号化部115は、ステップS802で取得した画素値L1と画素値L2とを用いて下記の式を計算することで、符号121のbビット目のビット値bit(b)を求める。
=0 (L1−L2≦0の場合)
ステップS804では、符号化部115は、メモリ106内に設定されている符号121を構成する各ビットのうち、bビット目のビット値を、bit(b)の値に更新する。
次に、本実施形態に係るパターン認識装置が行う認識処理について、同処理のフローチャートを示す図7を用いて説明する。なお、図7のフローチャートに従った処理を開始する時点で、入力画像124はメモリ106に格納されているものとする。この入力画像124は、ディジタルカメラなどの撮像装置により撮像された画像をメモリ106に入力画像124として格納したものであっても良いし、その入力形態については特定の形態に限るものではない。
ここでSは、符号iと関連づけて類似符号リスト126に登録されている類似度1003である。この算出方法は、符号の類似度の重みによって得点を算出するものである。式中のS/ΣSは、類似度による重みづけを行っており、1/Npは、1つの符号に対して複数のパターン識別子が対応していた場合の得点の分配を表している。なお、認識得点の算出方法は、この式を用いた方法に限るものではなく、他の方法を用いて認識得点を算出しても良い。
この式で求められる類似度Sは、信頼度が0であるビットを反転させた類似符号に対して1となり、信頼度が閾値Cthであるビットを反転させた類似符号に対しては0となる。すなわち、信頼度が低いビットを反転させてつくった類似符号は元の符号との類似度が高い、ということを表している。信頼度が閾値Cthと同じであるような、すなわち、処理の対象となる信頼度の中で最も信頼度が高いビットを反転して作った類似符号は、類似度がゼロになる。符号121中のあるビットの信頼度が低いということは、そのビットが0であるか1であるかの信頼性が少ないということで、わずかな撮影条件の違いでたやすく別の結果になりえる可能性が高い、ということである。したがって、そのようなビットが反転した類似符号は元の符号との類似度が高くなるように評価する。これに対して、信頼度が高いビットのビット値は、少々のノイズや照明条件のわずかな違いがあっても値が反転する可能性は低い。したがってそのようなビットを反転して生成した類似符号は元の符号との類似度が低いと評価する。以上述べたように、同じ1ビットの相違であっても、そのビットの信頼度によって類似度に重みを付ける。
ここで、Σcは、複数のビットのそれぞれの信頼度の和であり、閾値Cthを超えないものとする。さらに、反転させるビットの数の多さで類似度を下げるようにしてもよい。例えば、反転させるビットの数をkc(kcは1以上の自然数)、重みパラメタをW(Wは0.0以上1.0未満の実数)として、以下の式のようにすればよい。
上式のようにすることで、複数の組み合わせのビットの反転によって類似度の値が同じになった場合にも、反転させるビットが少ないほうの類似度が高い、とすることができる。
ここで、Diは、画素値差125中のi番目の配列要素に格納されている値(画素値の差分)である。Dmaxは、画素値の差分として取り得る最大の値である。この式で算出される信頼度Ciは、Diが小さいほど0に近づき、Diが大きいほど1に近づく値である。たとえば、画素値が0〜255の整数である場合を考えると、Dmaxは255であり、Diが0だったときはCiは0となり、Diが255だったときにCiは1となる。
第1の実施形態では、入力画像として輝度画像を用いていた(然るに第1の実施形態では画素値は輝度値であった)。本実施形態では、入力画像として距離画像を用いる。距離画像とは、カメラなどの撮像装置から撮影対象までの距離を画像として表現したものである。距離画像を生成するための距離計測方法は多数知られており、代表的なものとして光切断法、ステレオ法などがある。
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
Claims (10)
- 入力画像パターンを複数のビットの符号に符号化する符号化手段と、
前記符号の各ビットに対する信頼度を計算する計算手段と、
前記符号において前記信頼度が所定値以下のビットまたは前記信頼度の和が所定の合計値以下となるビットの組の少なくとも1つのビットを反転させた類似符号を生成する生成手段と、
前記符号化手段が生成した符号と、前記生成手段が生成した類似符号と、に基づいて前記入力画像パターンを認識する認識手段と
を備えることを特徴とする情報処理装置。 - 前記符号化手段は、前記入力画像パターン上の複数の特徴量の値の差に基づいて符号化を行い、前記計算手段は、前記入力画像パターンに対する前記特徴量の値の差に基づいて前記符号の各ビットに対する信頼度を計算することを特徴とする請求項1に記載の情報処理装置。
- 前記符号化手段は、前記入力画像パターン上で画素の規定数のペアを設定し、該規定数のペアのそれぞれについて、該ペア中の画素同士の画素値の大小関係を示すビット値を求めることで、前記入力画像パターンを前記規定数のビットの符号に符号化し、
前記計算手段は、前記符号の各ビットに対して、該ビットのビット値を計算するために用いたペア中の2画素の画素値から該ビットに対する信頼度を求めることを特徴とする請求項1に記載の情報処理装置。 - 前記計算手段は、前記符号の各ビットに対して、該ビットのビット値を計算するために用いたペア中の画素同士の画素値の差分を、該ビットに対する信頼度として求めることを特徴とする請求項3に記載の情報処理装置。
- 前記生成手段は、信頼度が所定値以下のビットのうち信頼度がより低いビットから順にビット値を反転させ、該反転のたびに得られるビット列を前記類似符号として生成することを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
- 前記認識手段は、
複数の学習用画像パターンのそれぞれを前記符号化手段により符号化した符号のうち、前記入力画像パターンから前記符号化手段により求めた符号若しくは前記生成手段が求めた類似符号と一致する符号を特定する特定手段と、
前記特定手段が特定した符号の生成元である学習用画像パターンに関する情報を出力する出力手段と
を備えることを特徴とする請求項1乃至5の何れか1項に記載の情報処理装置。 - 前記特定手段は、前記複数の学習用画像パターンのそれぞれを前記符号化手段により符号化した符号のうち、前記入力画像パターンから前記符号化手段により求めた符号若しくは前記生成手段が求めた類似符号のそれぞれと一致する符号に対して得点を与え、
前記出力手段は、得点が高い順に1以上の符号について、該符号の生成元である学習用画像パターンに関する情報を出力する
ことを特徴とする請求項6に記載の情報処理装置。 - 前記認識手段は、前記入力画像パターンを前記符号化手段により符号化した符号と該符号から生成された前記類似符号との類似度を算出し、該符号及び該類似符号を辞書と照合し、該照合の結果に対して前記類似度によって重みづけをして、前記入力画像パターンを認識することを特徴とする請求項1乃至7の何れか1項に記載の情報処理装置。
- 情報処理方法であって、
入力画像パターンを複数のビットの符号に符号化する符号化工程と、
前記符号の各ビットに対する信頼度を計算する計算工程と、
前記符号において前記信頼度が所定値以下のビットまたは前記信頼度の和が所定の合計値以下となるビットの組の少なくとも1つのビットを反転させた類似符号を生成する生成工程と、
前記符号化工程で生成した符号と、前記生成工程で生成した類似符号と、に基づいて前記入力画像パターンを認識する認識工程と
を備えることを特徴とする情報処理方法。 - コンピュータを、請求項1乃至8の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011267256A JP5865043B2 (ja) | 2011-12-06 | 2011-12-06 | 情報処理装置、情報処理方法 |
US13/687,629 US9189693B2 (en) | 2011-12-06 | 2012-11-28 | Information processing apparatus and information processing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011267256A JP5865043B2 (ja) | 2011-12-06 | 2011-12-06 | 情報処理装置、情報処理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2013120451A JP2013120451A (ja) | 2013-06-17 |
JP2013120451A5 JP2013120451A5 (ja) | 2015-01-29 |
JP5865043B2 true JP5865043B2 (ja) | 2016-02-17 |
Family
ID=48524052
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011267256A Active JP5865043B2 (ja) | 2011-12-06 | 2011-12-06 | 情報処理装置、情報処理方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US9189693B2 (ja) |
JP (1) | JP5865043B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5812599B2 (ja) * | 2010-02-25 | 2015-11-17 | キヤノン株式会社 | 情報処理方法及びその装置 |
US10904073B2 (en) * | 2017-10-27 | 2021-01-26 | Hewlett Packard Enterprise Development Lp | Reassign standby user anchor controllers |
KR102516366B1 (ko) | 2018-05-30 | 2023-03-31 | 삼성전자주식회사 | 특징 데이터 획득 방법 및 장치 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2742192B2 (ja) | 1993-02-04 | 1998-04-22 | 日本電信電話株式会社 | 経路算出装置 |
JP3367170B2 (ja) | 1993-11-05 | 2003-01-14 | 株式会社豊田中央研究所 | 障害物検出装置 |
JP3634574B2 (ja) * | 1997-07-11 | 2005-03-30 | キヤノン株式会社 | 情報処理方法及び装置 |
US8224078B2 (en) * | 2000-11-06 | 2012-07-17 | Nant Holdings Ip, Llc | Image capture and identification system and process |
JP3831232B2 (ja) * | 2001-11-07 | 2006-10-11 | 独立行政法人科学技術振興機構 | 画像処理方法 |
US7577297B2 (en) | 2002-12-16 | 2009-08-18 | Canon Kabushiki Kaisha | Pattern identification method, device thereof, and program thereof |
EP3358501B1 (en) | 2003-07-18 | 2020-01-01 | Canon Kabushiki Kaisha | Image processing device, imaging device, image processing method |
ATE443297T1 (de) | 2003-12-16 | 2009-10-15 | Canon Kk | Musteridentifikationsverfahren, vorrichtung und programm |
JP5008269B2 (ja) | 2005-04-08 | 2012-08-22 | キヤノン株式会社 | 情報処理装置、情報処理方法 |
JP2009086749A (ja) | 2007-09-27 | 2009-04-23 | Canon Inc | パターン識別手法、識別用パラメータ学習方法、及び装置 |
US8509571B2 (en) * | 2008-06-11 | 2013-08-13 | Panasonic Corporation | Pattern recognition apparatus, pattern recognition method, image processing apparatus, and image processing method |
JP5254893B2 (ja) | 2009-06-26 | 2013-08-07 | キヤノン株式会社 | 画像変換方法及び装置並びにパターン識別方法及び装置 |
JP5675214B2 (ja) | 2010-08-18 | 2015-02-25 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP5706647B2 (ja) | 2010-09-03 | 2015-04-22 | キヤノン株式会社 | 情報処理装置、およびその処理方法 |
US8824772B2 (en) * | 2012-10-23 | 2014-09-02 | Ensenta Inc. | System and method for improved remote deposit image handling |
-
2011
- 2011-12-06 JP JP2011267256A patent/JP5865043B2/ja active Active
-
2012
- 2012-11-28 US US13/687,629 patent/US9189693B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2013120451A (ja) | 2013-06-17 |
US20130142430A1 (en) | 2013-06-06 |
US9189693B2 (en) | 2015-11-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108875522B (zh) | 人脸聚类方法、装置和系统及存储介质 | |
US10878269B2 (en) | Data extraction using neural networks | |
US11074434B2 (en) | Detection of near-duplicate images in profiles for detection of fake-profile accounts | |
JP6397144B2 (ja) | 画像からの事業発見 | |
US11669739B2 (en) | Name and face matching | |
US8243988B1 (en) | Clustering images using an image region graph | |
CN110928992B (zh) | 文本搜索方法、装置、服务器及存储介质 | |
JP2018165926A (ja) | 類似画像検索装置 | |
Cheng et al. | A simple visual-textual baseline for pedestrian attribute recognition | |
US20210350122A1 (en) | Stroke based control of handwriting input | |
CN115578735B (zh) | 文本检测方法和文本检测模型的训练方法、装置 | |
JP6365024B2 (ja) | サービス提供装置、方法、及びプログラム | |
KR20220004009A (ko) | 키 포인트 검출 방법, 장치, 전자 기기 및 저장 매체 | |
CN111598149B (zh) | 一种基于注意力机制的回环检测方法 | |
CN110210480A (zh) | 文字识别方法、装置、电子设备和计算机可读存储介质 | |
Nasri et al. | A novel approach for dynamic hand gesture recognition using contour-based similarity images | |
JP5865043B2 (ja) | 情報処理装置、情報処理方法 | |
KR20200020107A (ko) | 기계학습을 이용한 획 기반 수기 서명 인증 방법 및 시스템 | |
Roy et al. | Offline signature verification system: a graph neural network based approach | |
CN109961103B (zh) | 特征提取模型的训练方法、图像特征的提取方法及装置 | |
JP2021051589A5 (ja) | ||
JP6541226B2 (ja) | 情報端末装置及びプログラム | |
JP2021051589A (ja) | 情報処理装置、情報処理方法 | |
JP5500404B1 (ja) | 画像処理装置及びそのプログラム | |
Moreno-García et al. | Obtaining the consensus of multiple correspondences between graphs through online learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20141208 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141208 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150828 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150907 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151106 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151130 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151225 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 5865043 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |