JP4458429B2 - カラー画像認識方法および装置 - Google Patents
カラー画像認識方法および装置 Download PDFInfo
- Publication number
- JP4458429B2 JP4458429B2 JP2006230955A JP2006230955A JP4458429B2 JP 4458429 B2 JP4458429 B2 JP 4458429B2 JP 2006230955 A JP2006230955 A JP 2006230955A JP 2006230955 A JP2006230955 A JP 2006230955A JP 4458429 B2 JP4458429 B2 JP 4458429B2
- Authority
- JP
- Japan
- Prior art keywords
- color image
- vector quantization
- image signal
- input color
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Image Analysis (AREA)
Description
(1)対象物から特徴を抽出後にベクトル量子化しているので、認識対象物の情報量が失われることなく、処理データ量を圧縮することができると共に辞書をコンパクトに構成することができ、さらに特定画像を精度よく認識することができる。
実施例1:
図1は、本発明の実施例1の構成を示す。図1において、入力されたカラー画像信号(RGB)1から得られたカラー画像を小領域(メッシュ)に分割するメッシュ分割部2と、小領域内のカラー画像データから特徴量を抽出する特徴量抽出部3と、抽出した特徴量を格納する特徴量メモリ4と、抽出した特徴量を予め作成してあるコードブック5と比較することによりベクトル量子化を行うベクトル量子化部6と、ベクトル量子化値を保持するベクトル量子化値メモリ7と、該メモリと識別対象物の辞書9とを照合して認識処理を行う認識部8と、メモリ管理やマッチング処理の距離計算などの全体の画像認識処理における各段階の制御を行う制御部10とから構成されている。
Pr=256*R/(R+G+B)
Pg=256*G/(R+G+B)
ここで、R、G、Bは入力された各8ビットのカラー画像信号である。なお、Pr、Pgを256倍しているのはPr、Pgも8ビットで表現するためである。
上記した実施例1では全画素を用いて色度ヒストグラムを作成しているが、これでは処理量が膨大になる。そこで、実施例2では、図6に示すように、色度ヒストグラムを求める画素をM画素間隔で間引いて行う。間引きの方法としては、例えば8画素間隔でサンプルして色度を求める画素を選択する方法を採る。また、M画素間隔で間引くとき、周囲の画素の画素値の平均を求め、この値を該間引き画素値としてもよい(この処理によって雑音が軽減される)。
実施例1において、色度ヒストグラム作成時に、r、g各8ビットでヒストグラムを作成すると、512次元の特徴量になり、メモリ容量も増大し、マッチング処理にも時間がかかる。
Pr’=0 (Pr≦64)
=(Pr−64)/4 (64<Pr≦192)
=31 (192<Pr)
Pg’=32 (Pg≦64)
=(Pg−64)/4+32 (64<Pg≦192)
=63 (192<Pg)
図7は、本発明の実施例4の構成を示す。この実施例4の構成は、図1の構成に変換圧縮テーブル15を付加して、データ量をテーブル変換によって変換圧縮する。つまり本実施例4は、実施例3のように変換式による演算処理を行うことなく効率的にデータ圧縮するものである。変換圧縮テーブル15は、後述するように、特徴量抽出部3によって抽出された特徴量を変換圧縮する。また、特徴量メモリ4は圧縮された特徴量を保持し、ベクトル量子化部6は圧縮された特徴量を予め作成してあるコードブック5と比較することによりベクトル量子化を行う点が、図1の構成と若干異なる。他の構成要素は図1で説明したものと同様であるので説明を省略する。
(VQ値)として割り当て、ベクトル量子化値メモリ7に保持する。
上記した実施例4では、入力画像の全ての画素に対して特徴量のヒストグラムを作成してコードブックとの比較処理を行っている。本実施例5は、小領域毎に生成された特徴量のヒストグラム情報に基づいてコードブックとの比較処理を変更して、画像認識に必要のない地肌部(背景部)やノイズ画像の認識処理を制御するもので、これにより認識率と処理速度の向上を図る。
上記した実施例4におけるコードブックは、認識対象画像を多数入力し、同様の条件で色度ヒストグラムのデータを大量に作成し、これらをクラスタリングすることによって作成しているので、入力画像が認識対象の画像以外の場合には、どのコードブックからも距離が離れる場合がある。
本実施例7は、実施例1、4において辞書とのマッチングを行う際、有効距離の閾値を設定しておき、求めた距離と閾値との比較を行い、距離が閾値以下ならばその辞書内の識別対象物を識別候補にするが、閾値より大きい場合には、識別候補にしないようにする。これにより、マッチングした結果、識別候補がない場合には入力カラー画像に認識対象の画像が存在しないと判定できるようになる。
本実施例8は、実施例7における前記閾値を各識別対象物毎に設定し、求めた距離と各識別対象物毎の閾値の比較を行い、距離が閾値以下ならばその識別対象物を識別候補にするが、閾値より大きい場合にはその識別対象物を識別候補にしないようにする。これにより、複数の対象物を識別する際に、対象物の特性を活かしたマッチング処理が可能になる。より具体的にいえば、ある対象物kが対象物k以外の原稿jと間違え易い場合には、この対象物kの閾値を低くすることで、対象物kと原稿jとを高精度に識別することができ、誤認識を防止することが可能となる。
図10は、本発明の対象物抽出方法に係る実施例9の構成を示す。図10において、2値画像信号21から黒連結成分の外接矩形を抽出する矩形抽出部22と、抽出された矩形データを格納する矩形メモリ23と、予め設定された閾値と抽出矩形の幅、高さを比較し、抽出すべき対象物が長方形か否かを判定する候補矩形判定部24と、候補矩形データを格納する候補矩形メモリ25と、対象物が回転しているか否かを判定する回転判定部26と、対象物の短辺、長辺を測定する辺長測定部27と、短辺、長辺の長さと予め設定された閾値とを比較して対象物か否かを判定する対象物判定部28と、対象物矩形データを格納する対象物矩形メモリ29と、全体を制御する制御部30とから構成されている。
本実施例10では、入力画像をカラー画像信号(R,G,B)とし、以下のような明度(L)を求め、所定の閾値(Th1)以下の明度を持つ画素を黒とし、閾値(Th1)より大きい画素を白とするような2値画像を作成してから、実施例1と同様の処理を行う。
L=R+G+B
L≦Th1ならば黒画素
L>Th1ならば白画素
本実施例11では、入力画像をカラー画像信号(R,G,B)とし、以下のような明度(L)を求め、所定の閾値(Th2)以上の明度を持つ画素を黒とし、閾値(Th2)より小さい画素を白とするような2値画像を作成してから、実施例1と同様の処理を行う。
L=R+G+B
L≧Th2ならば黒画素
L<Th2ならば白画素
図15は、実施例12の全体構成を示す。図において、対象物抽出部42がカラー画像信号41から対象物を抽出して、対象物矩形メモリ43に格納する部分は、前述した図14に示す構成と全く同一のものである。
2 メッシュ分割部
3 特徴量抽出部
4 特徴量メモリ
5 コードブック
6 ベクトル量子化部
7 ベクトル量子化値メモリ
8 認識部
9 辞書
10 制御部
Claims (2)
- 入力カラー画像信号を複数の領域に分割する分割工程と、前記分割された領域内の入力カラー画像信号から特徴量を抽出する特徴量抽出工程と、前記抽出された特徴量を、予め作成されたコードブックと比較することによりベクトル量子化し、前記入力カラー画像信号のベクトル量子化値を生成するベクトル量子化工程とからなるベクトル量子化処理工程と、
前記入力カラー画像信号から黒連結成分の外接矩形を抽出する矩形抽出工程と、前記抽出された外接矩形の内、高さ、幅が所定の範囲内にある矩形を所定形状の対象物として判定する判定工程とからなる対象物抽出工程と、
前記対象物抽出工程が前記所定形状の対象物を抽出したとき、前記生成された入力カラー画像信号のベクトル量子化値を参照して、前記所定形状の対象物の範囲に相当するベクトル量子化値のヒストグラムを作成するヒストグラム作成工程と、前記作成された所定形状の対象物のヒストグラムと辞書とを照合することにより、前記入力カラー画像信号中に、前記辞書に登録された対象物が存在するか否かを判定処理するマッチング工程とを備え、
前記ベクトル量子化処理工程と前記対象物抽出工程を並列に実行することを特徴とするカラー画像認識方法。 - 入力カラー画像信号を複数の領域に分割する分割手段と、前記分割された領域内の入力カラー画像信号から特徴量を抽出する特徴量抽出手段と、前記抽出された特徴量を、予め作成されたコードブックと比較することによりベクトル量子化し、前記入力カラー画像信号のベクトル量子化値を生成するベクトル量子化手段とからなるベクトル量子化処理手段と、
前記入力カラー画像信号から黒連結成分の外接矩形を抽出する矩形抽出手段と、前記抽出された外接矩形の内、高さ、幅が所定の範囲内にある矩形を所定形状の対象物として判定する判定手段とからなる対象物抽出手段と、
前記対象物抽出手段が前記所定形状の対象物を抽出したとき、前記生成された入力カラー画像信号のベクトル量子化値を参照して、前記所定形状の対象物の範囲に相当するベクトル量子化値のヒストグラムを作成するヒストグラム作成手段と、前記作成された所定形状の対象物のヒストグラムと辞書とを照合することにより、前記入力カラー画像信号中に、前記辞書に登録された対象物が存在するか否かを判定処理するマッチング手段とを備え、
前記ベクトル量子化処理手段と前記対象物抽出手段を並列に実行することを特徴とするカラー画像認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006230955A JP4458429B2 (ja) | 1993-12-10 | 2006-08-28 | カラー画像認識方法および装置 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP31069493 | 1993-12-10 | ||
JP31069693 | 1993-12-10 | ||
JP1859194 | 1994-02-15 | ||
JP5228694 | 1994-03-23 | ||
JP2006230955A JP4458429B2 (ja) | 1993-12-10 | 2006-08-28 | カラー画像認識方法および装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003198874A Division JP2004005715A (ja) | 1993-12-10 | 2003-07-18 | カラー画像認識方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006344242A JP2006344242A (ja) | 2006-12-21 |
JP4458429B2 true JP4458429B2 (ja) | 2010-04-28 |
Family
ID=37641108
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006230955A Expired - Lifetime JP4458429B2 (ja) | 1993-12-10 | 2006-08-28 | カラー画像認識方法および装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4458429B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5581574B2 (ja) | 2008-07-09 | 2014-09-03 | 富士ゼロックス株式会社 | 画像処理装置及び画像処理プログラム |
JP4935960B2 (ja) * | 2009-03-13 | 2012-05-23 | 日本電気株式会社 | 画像識別子抽出装置 |
CN102349092B (zh) | 2009-03-13 | 2015-08-12 | 日本电气株式会社 | 图像签名提取设备 |
KR101355299B1 (ko) * | 2009-04-14 | 2014-01-23 | 닛본 덴끼 가부시끼가이샤 | 이미지 시그니처 추출 장치 |
-
2006
- 2006-08-28 JP JP2006230955A patent/JP4458429B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2006344242A (ja) | 2006-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1158453B1 (en) | Image extraction method and apparatus, and image recognition method and apparatus, for extracting/recognizing specific image from input image signal | |
JP3345350B2 (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
US6373981B1 (en) | Method and apparatus for segmenting data to create mixed raster content planes | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
JP3373008B2 (ja) | 画像像域分離装置 | |
US6865290B2 (en) | Method and apparatus for recognizing document image by use of color information | |
US8548241B2 (en) | Enhanced multilayer compression of image files using OCR systems | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
JP4100885B2 (ja) | 帳票認識装置、方法、プログラムおよび記憶媒体 | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
JP4458429B2 (ja) | カラー画像認識方法および装置 | |
EP0933719A2 (en) | Image processing method and apparatus | |
EP0949580B1 (en) | Classification-driven thresholding of a normalized grayscale image | |
US6487311B1 (en) | OCR-based image compression | |
JP3496893B2 (ja) | カラー画像認識方法および装置 | |
JP4217969B2 (ja) | 画像処理装置及びプログラム | |
JP2004005715A (ja) | カラー画像認識方法および装置 | |
RU2571510C2 (ru) | Метод и устройство, использующие увеличение изображения для подавления визуально заметных дефектов на изображении | |
EP0715274B1 (en) | An optical character recognition apparatus and a method for selecting an operational mode thereof | |
JPH07160886A (ja) | 対象物抽出方法およびカラー画像認識方法 | |
JPH08123901A (ja) | 文字抽出装置及び該装置を用いた文字認識装置 | |
JP3113769B2 (ja) | 文字認識装置 | |
JPH09204525A (ja) | 画像像域分離装置及びその方法 | |
JPH07262373A (ja) | カラー画像認識方法 | |
JP4193687B2 (ja) | 画像処理装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060927 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20091015 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091021 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091215 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100203 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100204 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130219 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140219 Year of fee payment: 4 |
|
EXPY | Cancellation because of completion of term |