JP5865043B2 - 情報処理装置、情報処理方法 - Google Patents

情報処理装置、情報処理方法 Download PDF

Info

Publication number
JP5865043B2
JP5865043B2 JP2011267256A JP2011267256A JP5865043B2 JP 5865043 B2 JP5865043 B2 JP 5865043B2 JP 2011267256 A JP2011267256 A JP 2011267256A JP 2011267256 A JP2011267256 A JP 2011267256A JP 5865043 B2 JP5865043 B2 JP 5865043B2
Authority
JP
Japan
Prior art keywords
code
bit
reliability
value
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2011267256A
Other languages
English (en)
Other versions
JP2013120451A (ja
JP2013120451A5 (ja
Inventor
奥野 泰弘
泰弘 奥野
裕輔 御手洗
裕輔 御手洗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011267256A priority Critical patent/JP5865043B2/ja
Priority to US13/687,629 priority patent/US9189693B2/en
Publication of JP2013120451A publication Critical patent/JP2013120451A/ja
Publication of JP2013120451A5 publication Critical patent/JP2013120451A5/ja
Application granted granted Critical
Publication of JP5865043B2 publication Critical patent/JP5865043B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/22Character recognition characterised by the type of writing
    • G06V30/224Character recognition characterised by the type of writing of printed characters having additional code marks or containing code marks

Description

本発明は、パターン認識技術に関するものである。
従来から、分類木の集合(アンサンブル)を用いた手法が提案されている。これは、分類木をL個(Lは2以上の定数)作成し、それら全部を用いることによって、より高い認識性能を実現する技術である。
以下にあげる非特許文献1では、分類木の集合(アンサンブル)を用いた手法をコンピュータビジョンに応用した例が開示されており、この開示されている手法は、以下のような手法である。
まず、1つの登録画像に対して、微小な変形やノイズの付加などを行って、登録画像のバリエーション画像を作る。すなわち、1つの種別の登録画像に対して複数のバリエーション画像を生成する。
次に、画像上の2か所の参照点位置を示す参照点ペアをランダムにN個生成する(以下、参照点ペア列と呼ぶ)。次に、参照点ペア列における画像輝度値を比較し、その大小の結果の列を0/1のビット列であらわすことにより、一つの画像と一つの参照点ペア列からN桁ビットのバイナリコードを算出する。
そして、バリエーション画像それぞれについて前述のようにN桁のバイナリコードを算出し、バイナリコードに対応する登録画像種別との確率を学習する。これが一つの分類木に相当する。このようなN桁バイナリコードによる学習を、参照点ペア列をL回変えて学習する。すなわち、L個の分類木を作成する。
検出時には、入力画像に対して、学習時に定めたN個の参照点ペアの位置に従って入力画像からN桁のバイナリコードを算出する。これを学習時に定めたL個の異なる参照点ペア列すべてに対して行う。得られたL個のバイナリコードに関連付けられた登録画像の確率の積をとり、最も確率の高い登録画像種別を検出結果とする。
この方法によれば、検出時の処理においては、入力画像の参照点ペアの画素値比較によるバイナリコード化、および、バイナリコードによる辞書テーブル参照、という高速な手法で実施できる。そのため、古典的な分類木による認識処理に比べて非常に高速にできる。また、認識精度も十分高いという報告が論文の中でされている。
Mustafa Ozuysal, Pascal Fua, Vincent Lepetit, "Fast Keypoint Recognition in Ten Lines of Code," cvpr, pp.1-8, 2007 IEEE Conference on Computer Vision and Pattern Recognition, 2007
従来の技術によれば、学習のために一つの登録画像に対して複数のバリエーション画像を作る必要があり、学習時の作業手順・処理負荷がかかるという問題があった。また、バリエーション数を増やしたことにより学習結果の情報(辞書)のサイズが増大し、メモリを圧迫する、という問題があった。辞書のサイズは、登録する画像の種別数とそのバリエーション数の積に従って増大するため、登録画像の種別数が多い場合にはことさら問題があった。
また、辞書サイズを小さく維持するためにバリエーション数を制限すると、数少ない学習画像だけで学習されることとなり、検出性能が低下する、という問題があった。たとえば、上記の例で示したような、参照点ペア2点の画素比較結果による特徴量は、照明変動・姿勢変動・ノイズによって容易に変わってしまう。したがって、認識をロバストにするためには1つのパターン種別について十分に多いバリエーション画像を学習する必要があり、辞書サイズが増大するという課題があった。
本発明はこのような問題に鑑みてなされたものであり、学習時の処理において学習パターンに対するバリエーションを多数生成しなくても認識処理のロバスト性を向上させることができる技術を提供することを目的とする。
本発明の目的を達成するために、例えば、本発明の情報処理装置は、入力画像パターンを複数のビットの符号に符号化する符号化手段と、
前記符号の各ビットに対する信頼度を計算する計算手段と、
前記符号において前記信頼度が所定値以下のビットまたは前記信頼度の和が所定の合計値以下となるビットの組の少なくとも1つのビットを反転させた類似符号を生成する生成手段と、
前記符号化手段が生成した符号と、前記生成手段が生成した類似符号と、に基づいて前記入力画像パターンを認識する認識手段と
を備えることを特徴とする。
本発明の構成によれば、学習時の処理において学習パターンに対するバリエーションを多数生成しなくても認識処理のロバスト性を向上させることができる。また、多数のバリエーションを学習する必要がないために、学習処理が高速・単純となる。また、学習によって生成される辞書のサイズを少なくすることができる。
パターン認識装置の構成例を示すブロック図。 パターン認識装置が行う学習処理のフローチャート。 参照2点位置リスト120の構成例を示す図。 符号・種別対応テーブル122の構成例を示す図。 分類木113の構成例を示す図。 辞書114の構成例を示す図。 パターン認識装置が行う認識処理のフローチャート。 ステップS207における処理の詳細を示すフローチャート。 ステップS706における処理のフローチャート。 類似符号リスト126の構成例を示す図。 ステップS901における処理のフローチャート。 信頼度128の構成例を示す図。 認識結果リスト127の構成例を示す図。 ステップS1101における処理のフローチャート。 信頼度算出部119が行う処理のフローチャート。 ステップS901で行う処理の具体例を示す図。
以下、添付図面を参照し、本発明の好適な実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の例を示すもので、特許請求の範囲に記載の構成の具体的な実施例の1つである。
[第1の実施形態]
先ず、情報処理装置として機能する、本実施形態に係るパターン認識装置の構成例について、図1のブロック図を用いて説明する。なお、図1に示した構成は、以下に説明する各処理を実現するための構成の一例に過ぎない。
CPU101は、メモリ105やメモリ106に格納されているコンピュータプログラムやデータを用いて処理を実行することで、パターン認識装置全体の動作制御を行うと共に、パターン認識装置が行うものとして後述する各処理を実行する。
出力装置103は、パターン認識装置による処理結果を出力するためのもので、図1ではCRTや液晶画面などにより構成される表示装置が示されているが、他の機器であっても良い。例えば、LANやインターネットなどのネットワークを介して外部装置に対して出力する装置であっても良い。
入力装置104は、キーボードやマウスなどにより構成されており、ユーザが操作することで、各種の指示をCPU101に対して入力することができる。なお、出力装置103を表示装置とした場合に、出力装置103と入力装置104とを一体化させることで、タッチパネル画面を構成しても良い。また、入力装置104には、後述する様々な画像を取得するための撮像装置を含めるようにしても良い。
メモリ105,106には、後述する様々なコンピュータプログラムやデータが格納されている。なお、メモリ105,106はそれぞれ別個のメモリであっても良いし、1つのメモリ内における別個のメモリ領域であっても良い。
メモリ105には、学習用画像ファイル110が格納されている。この学習用画像ファイル110には、認識対象となるパターン(画像)、或いは、画像に対してエッジ抽出処理、エッジ強調処理、その他の各種特徴抽出処理、を行うことで得られる特徴量画像(エッジ強度マップなど)、が複数格納されている。以下では説明を簡単にするために、学習用画像ファイル110には、認識対象となるパターンの1つの種別につき1つの画像が格納されているものとする。なお、本実施形態は、学習するパターンのバリエーションが少なくても、ロバストな検出を可能にするという趣旨のものであるが、1つのパターン種別につき複数のバリエーションの画像があっても支障はない。
学習用画像ファイル110中の各画像には、該画像の種別(パターン種別)を表す情報が関連づけられている。関連づける方法には様々な方法が考えられ、如何なる方法を採用しても良い。以下では一例として、1から始まり連続するユニークな数字からなる識別子によって画像の種別を表すことにし、その識別子を該画像のファイル名にすることでその画像とパターン種別との関連付けを行っておく。たとえば、パターン種別の識別子が000001であるようなパターンを表す画像のファイルは「000001.bmp」というファイル名で格納するものとする。
学習用画像ファイル110以外にメモリ105,106に格納されているそれぞれについては、以下の説明で触れるが、次に列挙する各部は何れも、コンピュータプログラムとしてメモリ105に格納されているものとする。
・ 学習部111
・ 認識部112
・ 符号化部115
・ 辞書照合部116
・ 結果集計部117
・ 類似符号算出部118
・ 信頼度算出部119
以下では、これらの各部を処理の主体として説明するが、実際には、CPU101がこれらの各部に相当するコンピュータプログラムを実行することで、これらの各部が行うものとして後述する各処理を実行することになる。
また、メモリ105,106に格納されているもののうち、これら各部以外については、データ、ファイル、変数として格納されているものである。もちろん、それぞれのデータ、ファイル、変数は適宜統合しても良いし、別個のものとしても良い。これは、上記のコンピュータプログラムについても同様である。
なお、CPU101、出力装置103、入力装置104、メモリ105、メモリ106は何れもバス102に接続されており、このバス102を介して互いに通信を行うことができる。
次に、本実施形態におけるパターン認識処理の詳細について説明する。機械学習によるパターン認識手法では、パターンを学習する学習過程と、入力される新規パターンを認識する認識過程の2つの過程が存在する。ここでは、はじめに学習過程について説明し、そのあとで認識過程について説明する。
<学習処理>
本実施形態に係るパターン認識装置が行う学習処理について、同処理のフローチャートを示す図2を用いて説明する。ここでは説明を簡単にするために、図2を用いた以下の説明では、一つの分類木を学習して分類木113を生成する過程について説明する。この処理が学習処理の手順の主要な部分である。後述するように、学習部111は、図2で説明する分類木生成手順を複数回繰り返して複数の分類木を生成し、生成した複数の分類木を結合して辞書114を生成する。複数の分類木をまとめて一つの辞書にする処理の詳細については後述する。
ステップS201では、学習部111は、認識するパターンの種別の数(図2のフローチャートにおいて用いる画像の数)Nid、符号化のビット数Nb(規定数)を設定する。設定方法は、例えば、ユーザが入力装置104を操作して入力した種別の数、ビット数をそれぞれ変数Nid、Nbに設定するようにしても良いし、予め定められた値をNid、Nbに設定するようにしても良い。なお、ビット数Nbは、後述する方法により符号化されるパターンが互いに識別可能、すなわち、異なるパターンは異なる符号で表されるような値とすることが好ましい。
次に、ステップS202では、学習部111は、メモリ106内に、Nbビットのビット列である符号121を設定する。この符号121を構成するNb個のビットのそれぞれのビット値は所定値(例えば0)に初期化されているものとする。また、学習部111は、Nid×2の要素から成るテーブルである符号・種別対応テーブル122をメモリ106内に設定する。このテーブル中の各要素についても適当な値で初期化しているものとする。
次に、ステップS203では、学習部111は、画像上に設定する2点の座標位置(参照点位置)のペアをNb個生成し、生成したNb個のペアを参照2点位置リスト120としてメモリ106内に登録する。Nb個のペアの生成方法については、特定の方法に限るものではない(規定の方法に従って生成しても良いしランダムに生成しても良い)が、例えば、非特許文献1に開示されている方法を採用しても良い。
参照2点位置リスト120の構成例を図3に示す。図3では、参照2点位置リスト120には、2つの座標位置(x1(1),y1(1))及び(x2(1),y2(1))のペアが1つ目のペアとして登録されている。また、(x1(2),y1(2))及び(x2(2),y2(2))のペアが2つ目のペアとして登録されている。このようにして、(x1(1),y1(1))及び(x2(1),y2(1))のペア〜(x1(Nb),y1(Nb))及び(x2(Nb),y2(Nb))のペア、即ちNb個のペアが参照2点位置リスト120に登録されている。
次に、ステップS204では、学習部111は、これから学習するパターンの種別を表す変数である変数idを1に初期化する。ステップS205では、学習部111は、変数idの値がNidの値以下であるか否かを判断する。この判断の結果、変数idの値がNidの値以下である場合には、処理はステップS206に進み、変数idの値がNidの値よりも大きい場合は、処理はステップS210に進む。ステップS210では、学習部111は、分類木113を生成してメモリ105に格納する。ステップS210における処理の詳細については後述する。
一方、ステップS206では、学習部111は、変数idの値をファイル名とする画像を学習用画像ファイル110から読み出し、画像123としてメモリ106に格納する。例えば、変数idの値が「1」であれば、「000001.bmp」というファイル名を有する画像を学習用画像ファイル110から読み出して、画像123としてメモリ106に格納する。
ステップS207では、符号化部115は、メモリ106に格納されている参照2点位置リスト120を用いて画像123を符号化し、該符号化の結果を符号121としてメモリ106に格納する。上記の通り、符号121は、Nbビットのビット列である。
ステップS207における処理の詳細について、図8のフローチャートを用いて説明する。符号化部115においては図2におけるNb(符号化するビットの桁数)がアクセスできるものとする。符号化部115の処理を実行する際に処理の引数として渡すなどすればよい。
ステップS801では、符号化部115は、符号化するビットのビット位置を表す変数bの値を1に初期化する。ステップS802では、符号化部115は、参照2点位置リスト120から、(x1(b),y1(b))及び(x2(b),y2(b))のペアを読み出す。そして符号化部115は、画像123上の座標位置(x1(b),y1(b))における画素の画素値L1、座標位置(x2(b),y2(b))における画素の画素値L2を取得する。ここで、画像123(ファイル名はid)上の画素位置(x、y)における画素値LをL=IMG(id)[x、y]と表記する場合、L1,L2は下記の式で表される。
L1=IMG(id)[x1(b)、y1(b)]
L2=IMG(id)[x2(b)、y2(b)]
次に、ステップS803では、符号化部115は、ステップS802で取得した画素値L1と画素値L2とを用いて下記の式を計算することで、符号121のbビット目のビット値bit(b)を求める。
bit(b)=1 (L1−L2>0の場合)
=0 (L1−L2≦0の場合)
ステップS804では、符号化部115は、メモリ106内に設定されている符号121を構成する各ビットのうち、bビット目のビット値を、bit(b)の値に更新する。
ステップS805では、符号化部115は、|L1−L2|の値を計算し、計算した値を、Nb個の配列要素を有する配列である画素値差125におけるb番目の配列要素に格納する。図1に示す如く、この画素値差125は、メモリ106内に格納されている。
ステップS806では、符号化部115は、変数bの値を1つインクリメントする。ステップS807では、符号化部115は、b≦Nbであるか否かを判断する。この判断の結果、b≦Nbであれば、処理はステップS802に戻り、b>Nbであれば、処理は図2のステップS208に進む。
即ち、図8のフローチャートに従った処理を行うことで、画像123からNbビットのビット列である符号121と、Nb個の配列要素を有する画素値差125と、を完成させることができる。
即ち、画像上で2画素から成るペアをNb(Nbは2以上の自然数)個設定し、Nb個のペアのそれぞれについて、該ペア中の画素同士の輝度値の大小関係を示すビット値を求めることで、Nbビットから成るビット列を符号121として求める。また、画素値差125中のb番目の配列要素には、符号121におけるbビット目のビットに対応する|L1−L2|の値が格納されている。
図2に戻って、次に、ステップS208では、学習部111は、変数idの値と、符号121と、を関連づけて、符号・種別対応テーブル122に登録する。符号・種別対応テーブル122の構成例を図4に示す。バイナリ符号401として符号121を登録し、パターン識別子402として、変数idの値を登録する。図4の場合、パターン識別子402が「000002」である画像からは、「10010110」というバイナリ符号401が得られたことになる。符号・種別対応テーブル122に登録されるバイナリ符号とパターン識別子のセットは、画像の数、即ち、認識するパターンの種別の数Nid個ある。図4にはNb=8とした例を記載している。
次に、ステップS209では、学習部111は、変数idの値を1つインクリメントする。そして処理はステップS205に進む。このようにして、各画像に対するパターン識別子とバイナリ符号とのセットが登録された符号・種別対応テーブル122を完成させる。
次に、ステップS210における処理について説明する。ステップS210では、図3に例示した参照2点位置リスト120と、図4に例示した符号・種別対応テーブル122と、から分類木113を構成してメモリ105に格納する。
分類木113の構成例を図5に示す。分類木113の先頭部分には、パターン種別数501、符号ビット数502、参照2点位置リスト503が格納されており、これらはそれぞれ、上記のNid、Nb、参照2点位置リスト120、である。なお、全ての分類木においてNid、Nbが等しい場合には、この2つの情報は辞書114に1つだけ格納すればよい。ここでは分類木ごとにこれらの情報が異なる場合を鑑み、分類木ごとにこれらの情報を格納している。
つづく部分には、0から(2Nb−1)までのバイナリビット列(符号504)と、該バイナリビット列に対応するパターン種別情報506へのポインタであるパターン種別ポインタ505と、のセットを格納している。一つの符号に対して複数のパターン種別情報が対応する可能性があるので、一つの符号とパターン種別情報へのポインタとの対応テーブルになっている。符号504の種類はNbビットのビット列の種類だけあるので、このセットは、2Nb個ある。なお、符号504は、昇順にソートされているものとする。
符号504に対応するパターン種別ポインタ505は、符号504を求めた画像のパターン種別情報506が格納されている格納位置を示すオフセット(509)である。パターン種別情報506には、符号504を求めた画像の数であるパターン個数507と、符号504を求めたそれぞれの画像のパターン識別子508が含まれている。分類木113を上記のような構成とすることにより、符号504をキーとして、それに対応する複数のパターン識別子508のリストにアクセスすることができる。
ステップS210では、メモリ106中に格納されている符号・種別対応テーブル122の内容を解析し、以上説明したデータ構造になるようにパターン種別情報506に書きだす。符号とパターン種別との対応関係は図4の符号・種別対応テーブル122に記載されているので、この処理は容易に実行できる。以下、データ末尾まで、符号・種別対応テーブル122にある情報の分だけのパターン種別情報506が書き出される。
ここで、学習処理の過程で、学習用画像ファイル110内のすべての画像を符号化しても、あり得るすべての符号が出現するわけではなく、符号504によっては、対応するパターン識別子がない場合もある。このような場合は、メモリ106中の符号・種別対応テーブル122中にはその符号がバイナリ符号401の部分に登録されないことになる。その場合は、符号に対応するパターン識別子は存在しないので、ステップS210では、図5におけるパターン種別ポインタ505の部分にはNULLをセットする。以上の処理により、学習用画像ファイル110を学習した分類木113がメモリ105中に記録された。
先に述べたように、図2で説明した処理は、分類木を1つだけ学習する処理である。学習部111は、符号化するための参照点位置を変えて複数の分類木を生成し、生成した複数の分類木を結合して辞書を生成するものである。以下に、その処理を説明する。
複数の分類木を学習するためには、毎回参照点位置を変えて図2で説明した「1つの分類木を生成する処理」を行えばよい。もちろん、ステップS203における参照2点位置リスト120の生成は、複数回繰り返しても同じものにはならないものとする。繰り返すたびに参照2点位置リスト120の内容が変わるので、同じ画像123に対して異なる符号121が算出され、結果として異なる分類木113が複数生成される。図1では、メモリ105には1つの分類木113しか示していないが、複数個の分類木113を生成するためには、複数個の分類木113を格納するためのエリアをメモリ105内に確保する必要がある。
然るに学習部111は、このようにして生成される複数個の分類木113を結合して1つの辞書114を生成する。辞書114の構成例を図6に示す。図6に示す如く、辞書114には、辞書114中に格納される分類木数601と、辞書114内におけるそれぞれの分類木のデータ格納位置を示すオフセット602と、該それぞれの分類木のデータ603と、が格納されている。前述したように、分類木が複数生成される場合には、分類木情報が複数格納されているものとする。
なお、ここでは、複数の分類木を学習する例について説明した。しかし、一つの分類木のみを学習するようにしてもよい。即ち、学習する分類木の数についてはここでの本質ではない。
辞書114に含まれる分類木のデータ構造は、昇順に並んだ符号121をキーとしたテーブルであり、符号に対応するパターン種別を高速に照合できるという特徴がある。以下で説明する認識手法とは異なる認識手法としては、画像を多次元ベクトルで表し、多次元ベクトル空間上で入力画像と辞書画像の距離が最も近くなる辞書画像を総当たり的に照合しパターンを検出する手法がある。そのような手法に比べると、本手法は一回のテーブル参照のみでパターン検出ができるため非常に高速である。
<認識処理>
次に、本実施形態に係るパターン認識装置が行う認識処理について、同処理のフローチャートを示す図7を用いて説明する。なお、図7のフローチャートに従った処理を開始する時点で、入力画像124はメモリ106に格納されているものとする。この入力画像124は、ディジタルカメラなどの撮像装置により撮像された画像をメモリ106に入力画像124として格納したものであっても良いし、その入力形態については特定の形態に限るものではない。
先ず、ステップS701では、認識部112は、分類木に対するインデックスとして用いる変数tを1に初期化する。次にステップS702では、認識部112は、辞書114に分類木数601として格納されている、辞書114に格納されている分類木の数を読み出し、読み出した数を変数Ntに代入する。
ステップS703では、認識部112は、辞書114に格納されている分類木のうち先頭からt番目に格納されている分類木(分類木t)に対して、該分類木へのオフセットを用いてアクセスする。そして分類木tから、パターン種別数501、符号ビット数502を読み出し、それぞれ変数Nid、Nbに代入する。
ステップS704では、認識部112は、分類木tから、参照2点位置リスト503を読み出し、読み出した参照2点位置リスト503を参照2点位置リスト120としてメモリ106に格納する。
ステップS705では、符号化部115は、ステップS704で読み出した参照2点位置リスト120を用いて、入力画像124に対して、図8のフローチャートに従った処理を行う。これにより、入力画像124からNbビットから成るビット列である符号121と、Nb個の配列要素を有する配列である画素値差125と、を生成する。
ステップS706では、辞書照合部116は、ステップS705で生成された符号121をキーとして辞書114との照合を行う。辞書照合部116における処理に対しては変数tが引数として与えられるものとする。ステップS706における処理の詳細については後述する。
ステップS707では、認識部112は、t≦Ntであるか否かを判断する。この判断の結果、t≦Ntであれば、処理はステップS710に進み、t>Ntであれば、処理はステップS708に進む。ステップS710では、認識部112は、変数tの値を1つインクリメントし、処理はステップS703に戻る。一方、ステップS708では、結果集計部117は、認識結果の集計と認識結果の出力とを行う。ステップS708における処理の詳細については後述する。
次に、上記のステップS706における処理の詳細について、図9のフローチャートを用いて説明する。本処理にはステップS706より分類木の番号を表す変tが渡されてくる。
ステップS901では、類似符号算出部118及び信頼度算出部119により、入力画像124から生成した符号121から類似符号を生成する。そして類似符号算出部118は、符号121及び該生成した類似符号のそれぞれを対象符号列とし、該対象符号と符号121との類似度を求め、該対象符号と、該対象符号と符号121との類似度と、を関連づけて類似符号リスト126に登録する。類似符号リスト126の構成例を図10に示す。
図10に示す如く、類似符号リスト126には、類似符号リスト126に登録する対象符号の数(1個(符号121)+類似符号の数)1001と、対象符号1002と、該対象符号と符号121との類似度1003と、が登録されている。ステップS901における処理の詳細については後述する。
ステップS902では、CPU101は、類似符号リスト126に登録した全ての類似度の総和ΣSを求める。ステップS903では、類似符号算出部118は、以下の処理で用いる変数iの値を1に初期化する。
ステップS904では、CPU101は、辞書114を参照して、類似符号リスト126中のi番目(例えば上からi番目)の符号(符号i)と一致する符号を符号504から特定し、特定した符号に対応するパターン種別ポインタ505を読み出す。
ステップS905では、CPU101は、ステップS904で読み出したパターン種別ポインタ505がNULLであるか否かを判断する。この判断の結果、ステップS904で読み出したパターン種別ポインタ505がNULLである場合には、処理はステップS913に進み、ステップS904で読み出したパターン種別ポインタ505がNULLではない場合は、処理はステップS906に進む。ステップS913では、CPU101は、変数iの値を1つインクリメントし、処理はステップS904に進む。
一方、ステップS906では、CPU101は、ステップS904で読み出したパターン種別ポインタ505が指し示すパターン種別情報506中のパターン個数507を読み出し、読み出したパターン個数507を変数Npに設定する。
ステップS907では、CPU101は、ステップS904で読み出したパターン種別ポインタ505が指し示すパターン種別情報506中のそれぞれのパターン識別子508を特定し、該特定したパターン識別子508に与える認識得点Pを計算する。認識得点Pの計算方法には様々な方法が考え得る。例えば、以下の式を用いて認識得点Pを計算しても良い。
P=S/(Np×ΣS)
ここでSは、符号iと関連づけて類似符号リスト126に登録されている類似度1003である。この算出方法は、符号の類似度の重みによって得点を算出するものである。式中のS/ΣSは、類似度による重みづけを行っており、1/Npは、1つの符号に対して複数のパターン識別子が対応していた場合の得点の分配を表している。なお、認識得点の算出方法は、この式を用いた方法に限るものではなく、他の方法を用いて認識得点を算出しても良い。
例えば、類似度に対する指数関数的な認識得点を与えてもよい。または、認識得点算出に類似度を用いず、常にP=1.0/Npとするなどしてもよい。その場合は、上記の類似度1003は求めなくても良い。
次に、ステップS908では、CPU101は、以下の処理で用いる変数jを1に初期化する。ステップS909でCPU101は、ステップS904で読み出したパターン種別ポインタ505が指し示すパターン種別情報506中のパターン識別子508のうちj番目のパターン識別子と、上記認識得点と、を対応づけて認識結果リスト127に登録する。認識結果リスト127の構成例を図13に示す。
図13に示す如く、認識結果リスト127は、パターン識別子1301と、パターン識別子1301に対して求めた認識得点1302と、を対応づけて管理する為のものである。
ここで、ステップS909で上記j番目のパターン識別子を認識結果リスト127に登録しようとしたときに、このj番目のパターン識別子がすでに認識結果リスト127に登録されていたとする。この場合、当然ながら、このj番目のパターン識別子に対してはすでに認識得点が関連づけて登録されていることになる。この場合、ステップS909では、すでに登録されている認識得点に、ステップS907で求めた認識得点を加算することで、このすでに登録されている認識得点を更新する。もちろん、j番目のパターン識別子がまだ認識結果リスト127に登録されていない場合は、j番目のパターン識別子と認識得点とを認識結果リスト127に新規登録する。
ステップS910でCPU101は、j≧Npであるか否かを判断する。この判断の結果、j≧Npであれば、処理はステップS911に進み、j<Npであれば、処理はステップS912に進む。ステップS912では、CPU101は、変数jの値を1つインクリメントし、処理はステップS909に進む。
ステップS911では、CPU101は、変数iの値が、類似符号リスト126に登録されている符号数1001以上であるか否かを判断する。この判断の結果、変数iの値が符号数1001以上である場合には、処理はステップS707に進み、変数iの値が符号数1001よりも小さい場合には、処理はステップS913に進む。
次に、上記のステップS901における処理について説明する。はじめに模式的な説明をし、続いて具体的な処理手順を説明する。そもそも、ステップS901における処理の意図は以下のようなものである。
L1とL2との差が比較的小さい場合に、これらL1とL2とから生成されたビット値は、わずかなノイズや撮影条件変動によってその値でなくなる可能性が高い。したがって、差が比較的小さいL1及びL2から生成されたビット値の信頼度は低いといえる。然るに、符号121において信頼度が低いビット値を反転させて得られる符号については、符号121との類似度は高いとする。
一方、L1とL2との差が比較的大きい場合に、これらL1とL2とから生成されたビット値は、少々の変動要因では容易に反転し得ないので、このようなビット値の信頼度は高いといえる。然るに、符号121において信頼度が高いビット値を反転させて得られる符号については、符号121との類似度は低いとする。このような前提に基づいてステップS901で行う処理について、図16に示した具体例を用いて説明する。
図16において符号1601は、入力画像124から生成した符号であり、上記の符号121に相当する。画素値差1602は、符号1601の各ビットに対応する|L1−L2|を保持する配列であり、上記の画素値差125に相当する。
信頼度算出部119は、画素値差1602の各配列要素(|L1−L2|)から、符号1601の各ビットに対する信頼度1603を求める。信頼度を求める方法については後述する。
そして、類似符号算出部118は、符号1601において閾値よりも低い信頼度のビットを反転させた符号を、類似符号として生成する。図16では、符号1601において最も信頼度の低いビットを反転させた符号を、類似符号1604として生成している。また、符号1601において信頼度が2番目に低いビットを反転させた符号を、類似符号1605として生成している。
次に、ステップS901にて行う処理について、同処理のフローチャートを示す図11を用いて説明する。ステップS1101では、信頼度算出部119は、符号121の各ビットに対して信頼度を算出し、各ビットについて算出した信頼度を信頼度128としてメモリ106に格納する。信頼度とは上述の通り、符号121の各ビットが認識処理にとってどの程度信頼できるか、の度合いを示すものである。信頼度が低いビットに対しては、同じパターン種別の画像であってもノイズその他の理由によりそのビット桁が反転しやすい、ということを表している。
信頼度128の構成例を図12に示す。図12に示す如く、信頼度128には、符号121の各ビット位置を示す桁番号1201と、該ビット位置に対する信頼度の値1202と、が対応づけて管理されている。例えば、桁番号が1のビットに対する信頼度としてC1が登録されており、桁番号が2のビットに対する信頼度としてC2が登録されており、桁番号がNbのビットに対する信頼度としてCNbが登録されている。信頼度算出部119による各ビットに対する信頼度の算出処理の詳細については後述する。
次に、ステップS1102では、類似符号算出部118は、メモリ106中の、図10に例示した類似符号リスト126を初期化する。この初期化では、符号数1001を1に初期化し、対象符号1002と類似度1003のセットから成るリストを初期化する。その際、対象符号1002と類似度1003のセットから成るリストの最上段には、符号121と類似度「1」のセットを登録する。
ステップS1103では、類似符号算出部118は、信頼度128中の信頼度C1〜CNbを検索し、最も低い信頼度Cxを最低信頼度として特定する。そして、変数cに最低信頼度Cxの値を設定すると共に、変数bnに最低信頼度Cxを有するビットのビット位置を示すxの値を設定する。なお、最低信頼度として特定された信頼度は、次回からは検索対象から除外する。この場合、次回以降の検索では、信頼度C1〜CNbのうちCx以外の信頼度から最低信頼度を特定する。
ステップS1104では、類似符号算出部118は、c≦予め定められた閾値Cthであるか否かを判断する。この判断の結果、c>Cthであれば、処理はステップS902に進み、c≦Cthであれば、処理はステップS1105に進む。
なお、この閾値Cthは、予め定められた値としているが、信頼度の分布によって適応的に閾値Cthを定めたり、N番目に低い信頼度を閾値Cthとするなどとしてもよい。本ステップでは、変数cが閾値Cthを超えていれば処理を終了する。すなわち、信頼度が閾値Cthを超えているビットを反転させるような類似符号算出の処理は行わない。以下のステップでは、変数cは最大でも閾値Cthであることが保証される。
ステップS1105では、類似符号算出部118は、符号121においてbn番目のビットのビット値を反転させた符号を類似符号として生成する。ステップS1106では、類似符号算出部118は、ステップS1105で生成した類似符号と、符号121との類似度を算出する。この類似度を算出する方法には、変数cに応じて指数的に類似度を変化させる算出方法など、様々な方法が考え得るが、例えば、以下の式を計算してこの類似度を求めるようにしても良い。
S=(Cth−c)/Cth
この式で求められる類似度Sは、信頼度が0であるビットを反転させた類似符号に対して1となり、信頼度が閾値Cthであるビットを反転させた類似符号に対しては0となる。すなわち、信頼度が低いビットを反転させてつくった類似符号は元の符号との類似度が高い、ということを表している。信頼度が閾値Cthと同じであるような、すなわち、処理の対象となる信頼度の中で最も信頼度が高いビットを反転して作った類似符号は、類似度がゼロになる。符号121中のあるビットの信頼度が低いということは、そのビットが0であるか1であるかの信頼性が少ないということで、わずかな撮影条件の違いでたやすく別の結果になりえる可能性が高い、ということである。したがって、そのようなビットが反転した類似符号は元の符号との類似度が高くなるように評価する。これに対して、信頼度が高いビットのビット値は、少々のノイズや照明条件のわずかな違いがあっても値が反転する可能性は低い。したがってそのようなビットを反転して生成した類似符号は元の符号との類似度が低いと評価する。以上述べたように、同じ1ビットの相違であっても、そのビットの信頼度によって類似度に重みを付ける。
ステップS1107では、類似符号算出部118は、ステップS1105で生成した類似符号と、ステップS1106で求めた類似度と、を対応づけて、メモリ106内の類似符号リスト126に登録すると共に、符号数1001を1つインクリメントする。そして、処理はステップS1103に戻る。
なお、ここにあげた例では説明を簡単にするために、ステップS1103において信頼度が低いビットを一つ検索し、検索したビットが反転した類似符号をステップS1105において生成したが、類似符号の生成方法は必ずしもこの方法を用いる必要はない。
他の例としては以下のような処理もあり得る。すなわち、ステップS1103では、複数のビットの信頼度の和であって他の組み合わせの複数の信頼度の和と比べて最小となるような値を変数cに格納し、変数bnにはその和の算出に用いたすべてのビットの桁番号をリストとして格納する。そしてステップS1105では、変数bnのリストに格納されたすべての桁番号に対応するビットを反転させた類似符号を生成する。このようにすることで、複数のビットを反転させた類似符号を作ることができる。複数のビットを反転させて類似符号を生成する場合、類似度の算出式は以下のようになる。
S=(Cth−Σc)/Cth
ここで、Σcは、複数のビットのそれぞれの信頼度の和であり、閾値Cthを超えないものとする。さらに、反転させるビットの数の多さで類似度を下げるようにしてもよい。例えば、反転させるビットの数をkc(kcは1以上の自然数)、重みパラメタをW(Wは0.0以上1.0未満の実数)として、以下の式のようにすればよい。
S=((Cth−Σc)/Cth)×(W^(kc−1))
上式のようにすることで、複数の組み合わせのビットの反転によって類似度の値が同じになった場合にも、反転させるビットが少ないほうの類似度が高い、とすることができる。
次に、信頼度算出部119による信頼度を求める処理について、説明する。符号121を構成する各ビットのビット値は、上記の通り、画素値L1と画素値L2との大小関係に基づいて決まっていた。この時、画素値L1と画素値L2との差分が大きくても小さくても、大小関係が同じであれば、同じビット値となる。しかし、わずかな差でL1−L2>0になった場合と、大きな差でL1−L2>0になった場合とでは、その信頼度が異なると考えられる。つまり、わずかな差でL1−L2>0になったが故にビット値が「1」となったビットは、照明・姿勢・ノイズのわずかな変動によってL1−L2≦0になり得てビット値が反転し得るため、その信頼度は低いといえる。然るに、本実施形態では、信頼度は、画素値差125に基づいて決まるものとする。
上記のステップS1101における、符号121を構成する各ビットに対する信頼度を求め、求めたそれぞれの信頼度を信頼度128に格納する処理について、同処理のフローチャートを示す図14を用いて説明する。
ステップS1401では、信頼度算出部119は、メモリ106中の信頼度128を初期化する。上記の通り、この信頼度128は、図12に示す如く、符号121の各ビット位置を示す桁番号1201と、該ビット位置に対する信頼度の値1202と、を対応づけて管理するためのものであるため、このような配列を信頼度リストとして初期化する。
ステップS1402では、信頼度算出部119は、以下の処理で用いる変数iの値を1に初期化する。ステップS1403では、信頼度算出部119は、符号121を構成する各ビットのうちi番目のビットに対する信頼度Ciを以下の式を計算することで求める。
Ci=Di/Dmax
ここで、Diは、画素値差125中のi番目の配列要素に格納されている値(画素値の差分)である。Dmaxは、画素値の差分として取り得る最大の値である。この式で算出される信頼度Ciは、Diが小さいほど0に近づき、Diが大きいほど1に近づく値である。たとえば、画素値が0〜255の整数である場合を考えると、Dmaxは255であり、Diが0だったときはCiは0となり、Diが255だったときにCiは1となる。
次に、ステップS1404では、信頼度算出部119は、信頼度128中のi番目の桁番号1201に「i」を登録すると共に、i番目の信頼度の値1202に、ステップS1403で求めた信頼度Ciを登録する。
ステップS1405では、信頼度算出部119は、i≦Nbであるか否かを判断する。この判断の結果、i≦Nbである場合には、処理はステップS1406に進み、i>Nbである場合には、処理はステップS1102に進む。ステップS1406では、信頼度算出部119は、変数iの値を1つインクリメントし、処理はステップS1403に進む。
なお、信頼度の計算方法は、特定の方法に限るものではなく、認識処理における入力画像の符号121の各ビットが照明・姿勢・ノイズなどの変動要因によってどの程度変わり得るか、どの程度信頼できるか、が定義できればよい。信頼度算出に関するその他の例については第2の実施形態でも説明する。
次に、ステップS708で行う、認識結果の集計と認識結果の出力処理について説明する。ステップS708では、メモリ106に格納された認識結果リスト127中に登録されている各認識得点に基づいて、認識結果リスト127から読み出すパターン識別子を決定する。そして決定したパターン識別子を読み出し、読み出したパターン識別子を出力する。
例えば、認識得点の高い順に上位N(Nは1以上の整数)個のパターン識別子を読み出して、出力装置103に表示しても良い。もちろん、表示するものはパターン識別子に限るものではなく、パターン識別子によって特定される画像そのものを表示しても良いし、該画像に関する様々な情報を表示しても良い。このNは、予め定めた値であっても良いし、認識得点の分布に応じて決めても良い。
以上の説明により、本実施形態によれば、1つのパターン種別に関して1つもしくは少数のパターンを用いて学習を行いながらも、認識処理において入力画像を符号化した符号の各ビットの信頼度にもとづいた類似符号を算出する。これにより、認識のロバスト性を向上できるという効果がある。
なお、本実施形態に係るパターン認識装置に適用可能な情報処理装置の構成は、下記の構成の一例に過ぎない。先ず、入力画像上で2画素から成るペアをNb(Nbは2以上の自然数)個設定し、Nb個のペアのそれぞれについて、該ペア中の画素同士の画素値の大小関係を示すビット値を求めることで、Nbビットから成るビット列を求める(第1の計算)。
そして、このビット列を構成する各ビットに対して、該ビットのビット値を計算するために用いたペア中の2画素の画素値から該ビットに対する信頼度を求める(第2の計算)。
そして、このビット列を構成する各ビットのうち該各ビットの信頼度に応じて決まるビットのビット値を反転させた類似ビット列を生成する。そして、入力画像から求めたビット列及び類似ビット列を対象ビット列とし、複数の学習用画像のそれぞれについて予め第1の計算によって求めたビット列のうち対象ビット列と一致するビット列を特定する。そして、この特定したビット列の生成元である学習用画像に関する情報を出力する。
[第2の実施形態]
第1の実施形態では、入力画像として輝度画像を用いていた(然るに第1の実施形態では画素値は輝度値であった)。本実施形態では、入力画像として距離画像を用いる。距離画像とは、カメラなどの撮像装置から撮影対象までの距離を画像として表現したものである。距離画像を生成するための距離計測方法は多数知られており、代表的なものとして光切断法、ステレオ法などがある。
それぞれの距離計測方法において、距離を計測するとともに計測された距離の値の信頼度を距離画像の画素ごとに定義することが可能である。例えば、「特登録02742192 経路算出装置 日本電信電話株式会社」には、光切断法において、投光したスリット光の反射光の受信レベルの大小によって距離画像の画素ごとに値の信頼度が算出できることが述べられている。本実施形態における距離値の信頼度とは、この文献で述べられている距離値の信頼度のこととすればよい。
また、「特登録03367170 障害物検出装置 株式会社豊田中央研究所」では、ステレオ法において、複数画像間の対応する小領域の相関の状態を調べることによって、距離画像の画素ごとに距離値の信頼度が算出できることが述べられている。本実施形態における距離値の信頼度とは、この文献で述べられている距離値の信頼度のこととすればよい。
本実施形態における処理の流れについては概ね第1の実施形態と同様であるが、入力画像として距離画像を取り扱う点、信頼度算出部119による信頼度算出処理では距離値の信頼度を用いて符号121の各ビットに対する信頼度を算出する点、が異なっている。以下、この2点に関して説明する。
まず、入力画像が距離画像である点について説明する。距離計測装置を用いて距離画像を生成する方法は従来から知られている。然るに、メモリ106に入力画像124としてこの距離画像を入力することができるのであれば、如何なる構成を採用しても良い。例えば、ネットワークなどを介して外部装置から送信された距離画像を受信し、受信した距離画像を入力画像124としてメモリ106に格納するようにしても良い。また例えば、このような距離計測装置を図1の構成に加え、この距離計測装置によって生成された距離画像をメモリ106に格納するようにしても良い。
また、取り扱う画像としては距離画像を用いるが、第1の実施形態で用いた入力画像124と同様に扱ってかまわない。また、図1の学習用画像ファイル110、画像123、入力画像124が距離画像となる。符号化部115による処理では、画素値が距離値となる点以外は第1の実施形態と同様である。
また、前述した従来の技術によって、入力画像124として距離画像を取得する際に、距離画像の各画素(画素値が距離値)とその信頼度とを対応づけた信頼度マップを作成することが可能である。信頼度マップとは、たとえば、距離画像の縦横幅と同じサイズで値が距離値の信頼度であるような2次元配列として表現したものである。このマップによって、距離画像上の参照位置が得られればその参照位置における距離値の信頼度が得られることになる。距離値の信頼度マップは、入力画像124として距離画像を取得した際に作成し、メモリ106に格納しておくものとする。
次に、本実施形態に係る信頼度算出部119が行う処理について、同処理のフローチャートを示す図15を用いて説明する。なお本実施形態では、この時点ですでに、距離画像としての入力画像124はメモリ106に格納されているものとする。
ステップS1501では、信頼度算出部119は、第1の実施形態と同様にして、メモリ106中の信頼度128を初期化する。ステップS1502では、信頼度算出部119は、以下の処理で用いる変数iの値を1に初期化する。ステップS1503では、信頼度算出部119は、参照2点位置リスト120から、(x1(i),y1(i))及び(x2(i),y2(i))のペアを読み出す。
ステップS1504では、信頼度算出部119は、上記の信頼度マップから、(x1(i),y1(i))及び(x2(i),y2(i))のそれぞれの画素位置における信頼度を取得する。
ステップS1505では、信頼度算出部119は、ステップS1504で取得した2つの信頼度のうち、低い方の信頼度を、信頼度128中のi番目の信頼度の値1202に登録すると共に、信頼度128中のi番目の桁番号1201に「i」を登録する。
なお、ここでは、2つの信頼度のうち低い方を信頼度128に登録しているが、これに限るものではない。例えば、この2つの信頼度からなる何らかの関数によって算出した信頼度を信頼度128に登録するようにしても良い。
また、距離値に対する信頼度が距離値に対する誤差分布として得られる場合などは、2点の比較結果が逆転しない確率を計算し、それを符号121における該ビットの信頼度としてもよい。
ステップS1506では、信頼度算出部119は、i≦Nbであるか否かを判断する。この判断の結果、i≦Nbである場合には、処理はステップS1507に進み、i>Nbである場合には、処理はステップS902に進む。ステップS1507では、信頼度算出部119は、変数iの値を1つインクリメントし、処理はステップS1503に進む。
以上の説明により、本実施形態によれば、入力パターンの値の信頼度が与えられている入力データに関しては、入力データの信頼度から符号の各ビットの信頼度を算出することができるようになる。入力パターンを取得した際の値の信頼度が分かっている場合に有効である。また、第1の実施形態、第2の実施形態の構成は適宜切り替えて用いるようにしてもかまわない。
(その他の実施例)
また、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。

Claims (10)

  1. 入力画像パターンを複数のビットの符号に符号化する符号化手段と、
    前記符号の各ビットに対する信頼度を計算する計算手段と、
    前記符号において前記信頼度が所定値以下のビットまたは前記信頼度の和が所定の合計値以下となるビットの組の少なくとも1つのビットを反転させた類似符号を生成する生成手段と、
    前記符号化手段が生成した符号と、前記生成手段が生成した類似符号と、に基づいて前記入力画像パターンを認識する認識手段と
    を備えることを特徴とする情報処理装置。
  2. 前記符号化手段は、前記入力画像パターン上の複数の特徴量の値の差に基づいて符号化を行い、前記計算手段は、前記入力画像パターンに対する前記特徴量の値の差に基づいて前記符号の各ビットに対する信頼度を計算することを特徴とする請求項1に記載の情報処理装置。
  3. 前記符号化手段は、前記入力画像パターン上で画素の規定数のペアを設定し、該規定数のペアのそれぞれについて、該ペア中の画素同士の画素値の大小関係を示すビット値を求めることで、前記入力画像パターンを前記規定数のビットの符号に符号化し、
    前記計算手段は、前記符号の各ビットに対して、該ビットのビット値を計算するために用いたペア中の2画素の画素値から該ビットに対する信頼度を求めることを特徴とする請求項1に記載の情報処理装置。
  4. 前記計算手段は、前記符号の各ビットに対して、該ビットのビット値を計算するために用いたペア中の画素同士の画素値の差分を、該ビットに対する信頼度として求めることを特徴とする請求項3に記載の情報処理装置。
  5. 前記生成手段は、信頼度が所定値以下のビットのうち信頼度がより低いビットから順にビット値を反転させ、該反転のたびに得られるビット列を前記類似符号として生成することを特徴とする請求項1乃至4の何れか1項に記載の情報処理装置。
  6. 前記認識手段は、
    複数の学習用画像パターンのそれぞれを前記符号化手段により符号化した符号のうち、前記入力画像パターンから前記符号化手段により求めた符号若しくは前記生成手段が求めた類似符号と一致する符号を特定する特定手段と、
    前記特定手段が特定した符号の生成元である学習用画像パターンに関する情報を出力する出力手段と
    を備えることを特徴とする請求項1乃至の何れか1項に記載の情報処理装置。
  7. 前記特定手段は、前記複数の学習用画像パターンのそれぞれを前記符号化手段により符号化した符号のうち、前記入力画像パターンから前記符号化手段により求めた符号若しくは前記生成手段が求めた類似符号のそれぞれと一致する符号に対して得点を与え、
    前記出力手段は、得点が高い順に1以上の符号について、該符号の生成元である学習用画像パターンに関する情報を出力する
    ことを特徴とする請求項に記載の情報処理装置。
  8. 前記認識手段は、前記入力画像パターンを前記符号化手段により符号化した符号と該符号から生成された前記類似符号との類似度を算出し、該符号及び該類似符号を辞書と照合し、該照合の結果に対して前記類似度によって重みづけをして、前記入力画像パターンを認識することを特徴とする請求項1乃至の何れか1項に記載の情報処理装置。
  9. 情報処理方法であって、
    入力画像パターンを複数のビットの符号に符号化する符号化工程と、
    前記符号の各ビットに対する信頼度を計算する計算工程と、
    前記符号において前記信頼度が所定値以下のビットまたは前記信頼度の和が所定の合計値以下となるビットの組の少なくとも1つのビットを反転させた類似符号を生成する生成工程と、
    前記符号化工程で生成した符号と、前記生成工程で生成した類似符号と、に基づいて前記入力画像パターンを認識する認識工程と
    を備えることを特徴とする情報処理方法。
  10. コンピュータを、請求項1乃至の何れか1項に記載の情報処理装置の各手段として機能させるためのコンピュータプログラム。
JP2011267256A 2011-12-06 2011-12-06 情報処理装置、情報処理方法 Active JP5865043B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2011267256A JP5865043B2 (ja) 2011-12-06 2011-12-06 情報処理装置、情報処理方法
US13/687,629 US9189693B2 (en) 2011-12-06 2012-11-28 Information processing apparatus and information processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011267256A JP5865043B2 (ja) 2011-12-06 2011-12-06 情報処理装置、情報処理方法

Publications (3)

Publication Number Publication Date
JP2013120451A JP2013120451A (ja) 2013-06-17
JP2013120451A5 JP2013120451A5 (ja) 2015-01-29
JP5865043B2 true JP5865043B2 (ja) 2016-02-17

Family

ID=48524052

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011267256A Active JP5865043B2 (ja) 2011-12-06 2011-12-06 情報処理装置、情報処理方法

Country Status (2)

Country Link
US (1) US9189693B2 (ja)
JP (1) JP5865043B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5812599B2 (ja) * 2010-02-25 2015-11-17 キヤノン株式会社 情報処理方法及びその装置
US10904073B2 (en) * 2017-10-27 2021-01-26 Hewlett Packard Enterprise Development Lp Reassign standby user anchor controllers
KR102516366B1 (ko) 2018-05-30 2023-03-31 삼성전자주식회사 특징 데이터 획득 방법 및 장치

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2742192B2 (ja) 1993-02-04 1998-04-22 日本電信電話株式会社 経路算出装置
JP3367170B2 (ja) 1993-11-05 2003-01-14 株式会社豊田中央研究所 障害物検出装置
JP3634574B2 (ja) * 1997-07-11 2005-03-30 キヤノン株式会社 情報処理方法及び装置
US8224078B2 (en) * 2000-11-06 2012-07-17 Nant Holdings Ip, Llc Image capture and identification system and process
JP3831232B2 (ja) * 2001-11-07 2006-10-11 独立行政法人科学技術振興機構 画像処理方法
US7577297B2 (en) 2002-12-16 2009-08-18 Canon Kabushiki Kaisha Pattern identification method, device thereof, and program thereof
EP3358501B1 (en) 2003-07-18 2020-01-01 Canon Kabushiki Kaisha Image processing device, imaging device, image processing method
ATE443297T1 (de) 2003-12-16 2009-10-15 Canon Kk Musteridentifikationsverfahren, vorrichtung und programm
JP5008269B2 (ja) 2005-04-08 2012-08-22 キヤノン株式会社 情報処理装置、情報処理方法
JP2009086749A (ja) 2007-09-27 2009-04-23 Canon Inc パターン識別手法、識別用パラメータ学習方法、及び装置
US8509571B2 (en) * 2008-06-11 2013-08-13 Panasonic Corporation Pattern recognition apparatus, pattern recognition method, image processing apparatus, and image processing method
JP5254893B2 (ja) 2009-06-26 2013-08-07 キヤノン株式会社 画像変換方法及び装置並びにパターン識別方法及び装置
JP5675214B2 (ja) 2010-08-18 2015-02-25 キヤノン株式会社 情報処理装置、情報処理方法およびプログラム
JP5706647B2 (ja) 2010-09-03 2015-04-22 キヤノン株式会社 情報処理装置、およびその処理方法
US8824772B2 (en) * 2012-10-23 2014-09-02 Ensenta Inc. System and method for improved remote deposit image handling

Also Published As

Publication number Publication date
JP2013120451A (ja) 2013-06-17
US20130142430A1 (en) 2013-06-06
US9189693B2 (en) 2015-11-17

Similar Documents

Publication Publication Date Title
CN108875522B (zh) 人脸聚类方法、装置和系统及存储介质
US10878269B2 (en) Data extraction using neural networks
US11074434B2 (en) Detection of near-duplicate images in profiles for detection of fake-profile accounts
JP6397144B2 (ja) 画像からの事業発見
US11669739B2 (en) Name and face matching
US8243988B1 (en) Clustering images using an image region graph
CN110928992B (zh) 文本搜索方法、装置、服务器及存储介质
JP2018165926A (ja) 類似画像検索装置
Cheng et al. A simple visual-textual baseline for pedestrian attribute recognition
US20210350122A1 (en) Stroke based control of handwriting input
CN115578735B (zh) 文本检测方法和文本检测模型的训练方法、装置
JP6365024B2 (ja) サービス提供装置、方法、及びプログラム
KR20220004009A (ko) 키 포인트 검출 방법, 장치, 전자 기기 및 저장 매체
CN111598149B (zh) 一种基于注意力机制的回环检测方法
CN110210480A (zh) 文字识别方法、装置、电子设备和计算机可读存储介质
Nasri et al. A novel approach for dynamic hand gesture recognition using contour-based similarity images
JP5865043B2 (ja) 情報処理装置、情報処理方法
KR20200020107A (ko) 기계학습을 이용한 획 기반 수기 서명 인증 방법 및 시스템
Roy et al. Offline signature verification system: a graph neural network based approach
CN109961103B (zh) 特征提取模型的训练方法、图像特征的提取方法及装置
JP2021051589A5 (ja)
JP6541226B2 (ja) 情報端末装置及びプログラム
JP2021051589A (ja) 情報処理装置、情報処理方法
JP5500404B1 (ja) 画像処理装置及びそのプログラム
Moreno-García et al. Obtaining the consensus of multiple correspondences between graphs through online learning

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141208

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20141208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150828

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151106

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151130

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151225

R151 Written notification of patent or utility model registration

Ref document number: 5865043

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151