JP2006344242A - カラー画像認識方法および装置 - Google Patents
カラー画像認識方法および装置 Download PDFInfo
- Publication number
- JP2006344242A JP2006344242A JP2006230955A JP2006230955A JP2006344242A JP 2006344242 A JP2006344242 A JP 2006344242A JP 2006230955 A JP2006230955 A JP 2006230955A JP 2006230955 A JP2006230955 A JP 2006230955A JP 2006344242 A JP2006344242 A JP 2006344242A
- Authority
- JP
- Japan
- Prior art keywords
- color image
- extracted
- histogram
- image
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
【解決手段】カラー画像信号から対象物を抽出する対象物抽出部51と、カラー画像信号をベクトル量子化するベクトル量子化処理部55を並列に実行する。対象物認識部61は、対象物抽出部51で抽出された対象物と予め作成された辞書64とのマッチングを行い、対象物か否かを判定する。
【選択図】図16
Description
(1)対象物から特徴を抽出後にベクトル量子化しているので、認識対象物の情報量が失われることなく、処理データ量を圧縮することができると共に辞書をコンパクトに構成することができ、さらに特定画像を精度よく認識することができる。
実施例1:
図1は、本発明の実施例1の構成を示す。図1において、入力されたカラー画像信号(RGB)1から得られたカラー画像を小領域(メッシュ)に分割するメッシュ分割部2と、小領域内のカラー画像データから特徴量を抽出する特徴量抽出部3と、抽出した特徴量を格納する特徴量メモリ4と、抽出した特徴量を予め作成してあるコードブック5と比較することによりベクトル量子化を行うベクトル量子化部6と、ベクトル量子化値を保持するベクトル量子化値メモリ7と、該メモリと識別対象物の辞書9とを照合して認識処理を行う認識部8と、メモリ管理やマッチング処理の距離計算などの全体の画像認識処理における各段階の制御を行う制御部10とから構成されている。
Pr=256*R/(R+G+B)
Pg=256*G/(R+G+B)
ここで、R、G、Bは入力された各8ビットのカラー画像信号である。なお、Pr、Pgを256倍しているのはPr、Pgも8ビットで表現するためである。
上記した実施例1では全画素を用いて色度ヒストグラムを作成しているが、これでは処理量が膨大になる。そこで、実施例2では、図6に示すように、色度ヒストグラムを求める画素をM画素間隔で間引いて行う。間引きの方法としては、例えば8画素間隔でサンプルして色度を求める画素を選択する方法を採る。また、M画素間隔で間引くとき、周囲の画素の画素値の平均を求め、この値を該間引き画素値としてもよい(この処理によって雑音が軽減される)。
実施例1において、色度ヒストグラム作成時に、r、g各8ビットでヒストグラムを作成すると、512次元の特徴量になり、メモリ容量も増大し、マッチング処理にも時間がかかる。
Pr’=0 (Pr≦64)
=(Pr−64)/4 (64<Pr≦192)
=31 (192<Pr)
Pg’=32 (Pg≦64)
=(Pg−64)/4+32 (64<Pg≦192)
=63 (192<Pg)
図7は、本発明の実施例4の構成を示す。この実施例4の構成は、図1の構成に変換圧縮テーブル15を付加して、データ量をテーブル変換によって変換圧縮する。つまり本実施例4は、実施例3のように変換式による演算処理を行うことなく効率的にデータ圧縮するものである。変換圧縮テーブル15は、後述するように、特徴量抽出部3によって抽出された特徴量を変換圧縮する。また、特徴量メモリ4は圧縮された特徴量を保持し、ベクトル量子化部6は圧縮された特徴量を予め作成してあるコードブック5と比較することによりベクトル量子化を行う点が、図1の構成と若干異なる。他の構成要素は図1で説明したものと同様であるので説明を省略する。
(VQ値)として割り当て、ベクトル量子化値メモリ7に保持する。
上記した実施例4では、入力画像の全ての画素に対して特徴量のヒストグラムを作成してコードブックとの比較処理を行っている。本実施例5は、小領域毎に生成された特徴量のヒストグラム情報に基づいてコードブックとの比較処理を変更して、画像認識に必要のない地肌部(背景部)やノイズ画像の認識処理を制御するもので、これにより認識率と処理速度の向上を図る。
上記した実施例4におけるコードブックは、認識対象画像を多数入力し、同様の条件で色度ヒストグラムのデータを大量に作成し、これらをクラスタリングすることによって作成しているので、入力画像が認識対象の画像以外の場合には、どのコードブックからも距離が離れる場合がある。
本実施例7は、実施例1、4において辞書とのマッチングを行う際、有効距離の閾値を設定しておき、求めた距離と閾値との比較を行い、距離が閾値以下ならばその辞書内の識別対象物を識別候補にするが、閾値より大きい場合には、識別候補にしないようにする。これにより、マッチングした結果、識別候補がない場合には入力カラー画像に認識対象の画像が存在しないと判定できるようになる。
本実施例8は、実施例7における前記閾値を各識別対象物毎に設定し、求めた距離と各識別対象物毎の閾値の比較を行い、距離が閾値以下ならばその識別対象物を識別候補にするが、閾値より大きい場合にはその識別対象物を識別候補にしないようにする。これにより、複数の対象物を識別する際に、対象物の特性を活かしたマッチング処理が可能になる。より具体的にいえば、ある対象物kが対象物k以外の原稿jと間違え易い場合には、この対象物kの閾値を低くすることで、対象物kと原稿jとを高精度に識別することができ、誤認識を防止することが可能となる。
図10は、本発明の対象物抽出方法に係る実施例9の構成を示す。図10において、2値画像信号21から黒連結成分の外接矩形を抽出する矩形抽出部22と、抽出された矩形データを格納する矩形メモリ23と、予め設定された閾値と抽出矩形の幅、高さを比較し、抽出すべき対象物が長方形か否かを判定する候補矩形判定部24と、候補矩形データを格納する候補矩形メモリ25と、対象物が回転しているか否かを判定する回転判定部26と、対象物の短辺、長辺を測定する辺長測定部27と、短辺、長辺の長さと予め設定された閾値とを比較して対象物か否かを判定する対象物判定部28と、対象物矩形データを格納する対象物矩形メモリ29と、全体を制御する制御部30とから構成されている。
本実施例10では、入力画像をカラー画像信号(R,G,B)とし、以下のような明度(L)を求め、所定の閾値(Th1)以下の明度を持つ画素を黒とし、閾値(Th1)より大きい画素を白とするような2値画像を作成してから、実施例1と同様の処理を行う。
L=R+G+B
L≦Th1ならば黒画素
L>Th1ならば白画素
本実施例11では、入力画像をカラー画像信号(R,G,B)とし、以下のような明度(L)を求め、所定の閾値(Th2)以上の明度を持つ画素を黒とし、閾値(Th2)より小さい画素を白とするような2値画像を作成してから、実施例1と同様の処理を行う。
L=R+G+B
L≧Th2ならば黒画素
L<Th2ならば白画素
図15は、実施例12の全体構成を示す。図において、対象物抽出部42がカラー画像信号41から対象物を抽出して、対象物矩形メモリ43に格納する部分は、前述した図14に示す構成と全く同一のものである。
2 メッシュ分割部
3 特徴量抽出部
4 特徴量メモリ
5 コードブック
6 ベクトル量子化部
7 ベクトル量子化値メモリ
8 認識部
9 辞書
10 制御部
Claims (7)
- 入力カラー画像信号から特定画像を認識する処理と、前記入力カラー画像信号から所定形状の対象物を抽出する処理を並列に実行し、前記対象物の抽出結果に応じて、前記対象物について認識処理することを特徴とするカラー画像認識方法。
- 前記入力画像信号中から所定形状の対象物を抽出する処理は、前記入力された2値画像信号から黒連結成分の外接矩形を抽出し、該抽出された外接矩形と黒連結成分との接点情報に基づいて、前記対象物を抽出する処理であることを特徴とする請求項1記載のカラー画像認識方法。
- 前記抽出される対象物は、所定の辺長を有する矩形であることを特徴とする請求項1または2記載のカラー画像認識方法。
- 前記抽出される対象物は、スキャンラインに対して傾いている対象物を含むことを特徴とする請求項1または2記載のカラー画像認識方法。
- 前記入力画像信号がカラー画像信号であるとき、前記カラー画像信号から明度を求め、該明度と複数の閾値とを比較することにより複数の2値画像を生成し、該複数の2値画像からそれぞれ前記外接矩形を抽出することを特徴とする請求項2記載のカラー画像認識方法。
- 前記抽出される第1の外接矩形と、第2の外接矩形との包含関係を調べ、一方の外接矩形が他方の外接矩形を含むとき、一方の外接矩形と黒連結成分との接点情報に基づいて、前記対象物を抽出することを特徴とする請求項5記載のカラー画像認識方法。
- 入力カラー画像信号から特定画像を認識する第1の処理手段と、前記入力カラー画像信号から所定形状の対象物を抽出する第2の処理手段と、前記対象物の抽出結果に応じて、前記対象物について認識処理する手段とを備え、前記第1の処理手段と第2の処理手段を並列に実行することを特徴とするカラー画像認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006230955A JP4458429B2 (ja) | 1993-12-10 | 2006-08-28 | カラー画像認識方法および装置 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31069693 | 1993-12-10 | ||
JP31069493 | 1993-12-10 | ||
JP1859194 | 1994-02-15 | ||
JP5228694 | 1994-03-23 | ||
JP2006230955A JP4458429B2 (ja) | 1993-12-10 | 2006-08-28 | カラー画像認識方法および装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003198874A Division JP2004005715A (ja) | 1993-12-10 | 2003-07-18 | カラー画像認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006344242A true JP2006344242A (ja) | 2006-12-21 |
JP4458429B2 JP4458429B2 (ja) | 2010-04-28 |
Family
ID=37641108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006230955A Expired - Lifetime JP4458429B2 (ja) | 1993-12-10 | 2006-08-28 | カラー画像認識方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4458429B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010017274A (ja) * | 2008-07-09 | 2010-01-28 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
WO2010103849A1 (ja) * | 2009-03-13 | 2010-09-16 | 日本電気株式会社 | 画像識別子抽出装置 |
JP4935960B2 (ja) * | 2009-03-13 | 2012-05-23 | 日本電気株式会社 | 画像識別子抽出装置 |
JP4935961B2 (ja) * | 2009-04-14 | 2012-05-23 | 日本電気株式会社 | 画像識別子抽出装置 |
-
2006
- 2006-08-28 JP JP2006230955A patent/JP4458429B2/ja not_active Expired - Lifetime
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2010017274A (ja) * | 2008-07-09 | 2010-01-28 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
US8532401B2 (en) | 2008-07-09 | 2013-09-10 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method, and computer-readable medium and computer data signal |
WO2010103849A1 (ja) * | 2009-03-13 | 2010-09-16 | 日本電気株式会社 | 画像識別子抽出装置 |
JP4935960B2 (ja) * | 2009-03-13 | 2012-05-23 | 日本電気株式会社 | 画像識別子抽出装置 |
JP5045845B2 (ja) * | 2009-03-13 | 2012-10-10 | 日本電気株式会社 | 画像識別子抽出装置 |
US8744193B2 (en) | 2009-03-13 | 2014-06-03 | Nec Corporation | Image signature extraction device |
US10133956B2 (en) | 2009-03-13 | 2018-11-20 | Nec Corporation | Image signature extraction device |
JP4935961B2 (ja) * | 2009-04-14 | 2012-05-23 | 日本電気株式会社 | 画像識別子抽出装置 |
Also Published As
Publication number | Publication date |
---|---|
JP4458429B2 (ja) | 2010-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1158453B1 (en) | Image extraction method and apparatus, and image recognition method and apparatus, for extracting/recognizing specific image from input image signal | |
JP3345350B2 (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
US5563403A (en) | Method and apparatus for detection of a skew angle of a document image using a regression coefficient | |
US8548241B2 (en) | Enhanced multilayer compression of image files using OCR systems | |
US6373981B1 (en) | Method and apparatus for segmenting data to create mixed raster content planes | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US6865290B2 (en) | Method and apparatus for recognizing document image by use of color information | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
JPH07121656A (ja) | 画像像域分離装置 | |
JP4100885B2 (ja) | 帳票認識装置、方法、プログラムおよび記憶媒体 | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
JP4458429B2 (ja) | カラー画像認識方法および装置 | |
EP0949580B1 (en) | Classification-driven thresholding of a normalized grayscale image | |
US6487311B1 (en) | OCR-based image compression | |
JP3496893B2 (ja) | カラー画像認識方法および装置 | |
JP2004005715A (ja) | カラー画像認識方法および装置 | |
EP0715274B1 (en) | An optical character recognition apparatus and a method for selecting an operational mode thereof | |
JPH07160886A (ja) | 対象物抽出方法およびカラー画像認識方法 | |
JP3113769B2 (ja) | 文字認識装置 | |
JPH07262373A (ja) | カラー画像認識方法 | |
JP2001291056A (ja) | 文書画像認識装置及び記録媒体 | |
JP2002279345A (ja) | 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体 | |
JP4231375B2 (ja) | パターン認識装置、パターン認識方法、パターン認識プログラムおよびパターン認識プログラムを記録した記録媒体。 | |
JP3759349B2 (ja) | 画像解析装置と画像解析方法 | |
JPH07160885A (ja) | カラー画像認識方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091021 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140219 Year of fee payment: 4 |
|
EXPY | Cancellation because of completion of term |