JP4396376B2 - 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 - Google Patents
図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 Download PDFInfo
- Publication number
- JP4396376B2 JP4396376B2 JP2004126675A JP2004126675A JP4396376B2 JP 4396376 B2 JP4396376 B2 JP 4396376B2 JP 2004126675 A JP2004126675 A JP 2004126675A JP 2004126675 A JP2004126675 A JP 2004126675A JP 4396376 B2 JP4396376 B2 JP 4396376B2
- Authority
- JP
- Japan
- Prior art keywords
- color
- image
- graphic
- main
- main color
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 72
- 238000000605 extraction Methods 0.000 title claims description 44
- 239000003086 colorant Substances 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 39
- 238000000354 decomposition reaction Methods 0.000 claims description 11
- 241000287463 Phalacrocorax Species 0.000 claims 2
- 230000007717 exclusion Effects 0.000 claims 2
- 238000010586 diagram Methods 0.000 description 24
- 238000003384 imaging method Methods 0.000 description 12
- 239000011159 matrix material Substances 0.000 description 11
- 239000000284 extract Substances 0.000 description 10
- 238000013461 design Methods 0.000 description 7
- 230000000694 effects Effects 0.000 description 5
- 238000005286 illumination Methods 0.000 description 4
- 230000002411 adverse Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 2
- 230000008030 elimination Effects 0.000 description 2
- 238000003379 elimination reaction Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/18—Extraction of features or characteristics of the image
- G06V30/18105—Extraction of features or characteristics of the image related to colour
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
- G06V20/625—License plates
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Character Input (AREA)
Description
その例として、特許文献1に記載される「ナンバープレート認識装置」や、特許文献2に記載される「ナンバー読取り装置」がある。これらの装置は、グレースケールの画像を用いてその図形である文字を認識する方法である。
また、特許文献4に記載される「画像分割方法及び装置」もある。この特許文献に記載される技術は、画像の領域を色に基づいて過分割し、過分割された領域を統合して文字領域と背景領域を得て影やハイライトに影響されず、安定して文字領域を抽出するものである。
ナンバープレートの表示形式は、比較的に単純であるが、ライセンスプレートは、ナンバープレートに比べると、その表示形式が複雑である。ライセンスプレートの表示形式を具体的に言えば、その背景に使われる色や模様等のデザインやフォーマットが多種多様であると同時に、文字に使用されるフォントやその色も多種多様である。
この図に示すようにライセンスプレートの上半分は、紺色のグラデーションが掛かった背景を持ち、そのグラデーションはライセンスプレート上部から中心部に向かって次第に白い色に変化しており、下半分は、赤のグラデーションが掛かかり、その下部から中心部に向かって次第に白い色に変化している。
すなわち、非常に多様な色が用いられているライセンスプレートに特許文献3の技術を採用して文字認識処理を行おうとするとき、文字にどのような色が用いられているかを予め登録することは困難である。
そのため、予め登録されている色を抽出することにより文字領域を得る方法では、ライセンスプレートから精度良く文字領域と背景領域とを分離できず、ライセンス番号の自動読み取りは困難であった。
例えば、背景が水色で文字が紺色のライセンスプレートである場合に、夕方の西日で照らされた状態でライセンスプレートを撮像すると、画像全体が赤の成分が非常に強くなるので、そのライセンスプレートを昼に撮像するとき青色の成分が最も強くなる部分であったとしても、赤色成分が最も強くなってしまう場合が考えられる。
つまり、ライセンスプレートから文字領域を抽出する際に、どのような色がその文字領域の文字に用いられているかは判らないので、予め登録された色の成分をカラー画像から抽出する方法では安定して文字領域を抽出することは困難であるという技術的課題がある。
上述のように、屋外環境においては、ライセンスプレート上に掛かる影やハイライトの影響で文字領域が複数の色成分に分かれてしまい、安定して文字領域を抽出するのをさらに悪化させる。
この技術によると、画像の領域を色に基づいて過分割し、過分割された領域を統合することにより、影やハイライトに影響されることなく文字領域を安定して抽出することが可能とはなる。
しかし、特許文献4の技術によると、道路標識のように予め定められた色と形状で構成される撮像体については、予め記憶されている色と形状の辞書と比較することによって統合すべきか否かを判断することが可能であるが、多様な色とデザインを持つライセンスプレートに対して上記技術の適用を試みた場合、膨大な色と形状のデータを記憶する必要があり、現実的でない。
それ故、特許文献4の技術における文字認識の基準とは、必ずしも、一致しない基準によって抽出された領域しか文字の候補として抽出されないので、文字領域を精度良く抽出するのが困難であり、したがって、ライセンス番号を精度良く自動的に読み取り難いという技術的課題がなお残っている。
この効果が得られることから、図形領域の抽出を上記因子の影響の排除に寄与し得る最も望ましい基準で行うことができ、図形認識精度の向上となる。
主要色抽出手段14は、カラー画像内の主要色を抽出する手段である。
主要色とは、入力された画像毎に出現頻度の大きな色成分として抽出された色を言う。主要色は、通常、画像毎に複数得られる。各主要色に近い色を持つ画素の値を“1”とし、その他の画素を“0”とした画素を主要色画像と呼ぶ。
図形領域抽出手段18は、主要色抽出手段14で抽出された主要色画像と組合せ作成手段16で作成された組合せ画像とから認識すべき図形を含む図形領域の各々を、それぞれ図形領域候補として抽出する。
図形認識手段20は、図形領域抽出手段18で抽出された図形領域候補の各々に対して図形認識処理を施す手段である。
すなわち、これら各手段は、図2に示す各手段対応の処理(その詳細は後述する)を行うプログラムがコンピュータ等に接続されるハードディスク、ROM等の記憶装置に記憶されており、コンピュータ等が起動されて図形読み取り処理が開始されると、上記記憶装置からコンピュータ等のメモリに順次読み込まれ、コンピュータ等でそのプログラムが実行されて上記各手段対応の処理を遂行するようにして構成されている。
図形読み取り装置10が起動されて画像入力手段12から従来公知の技法、例えば、CCDカメラにより被撮像体、例えば、ライセンスプレートが撮像されてメモリにその画像を取り込み、主要色抽出手段14に読み込まれる(図2の画像入力処理S1)。
主要色抽出手段14における処理(図2の主要色抽出処理S2)の詳細を順を追って説明する。
先ず初めに、読み込まれた画像について、そのRGBの三次元空間を、例えば、16×16×16の小領域に分割し、読み込まれた画像の色ヒストグラムを作成する。
色ヒストグラムの作成は、例えば、以下の手順で行う。
次に、或る画素に着目して当該画素が持つ各原色成分の値がどの値範囲に属するかを判定し、属していると判定された値範囲のヒストグラム値に1を加える。
この処理手順をすべての画素について行うことにより、色ヒストグラムを作成することができる。
また、色ヒストグラムの局所的なピークを検出する際に、着目している値範囲のヒストグラム値が、隣接するすべての値範囲のヒストグラム値よりも大きかったならば、着目している値範囲を局所的なピークであるとすることができる。
図3及び図4に示す例は、256階調で表された各原色成分を16等分の値範囲に分割した場合である。そして、この例は、本来三次元のRGB空間で表示されるべきであるが、ここでは説明の簡略化のため、RとGの軸だけの二次元の平面で示してある。
また、図4において、着目している値範囲(右上がりの斜線で表示されている)の一辺がR軸上にあったとすると、右下がりの斜線で表された値範囲が隣接する値範囲となり、これら2つの領域のヒストグラム値を比較することにより、着目している値範囲が局所的なピークであるか否かを判定することができる。
この2つの例から了解できるように、ヒストグラム値が最小の値範囲と最大の値範囲からはみ出した部分については、ヒストグラム値の比較を行わなければよい。
図5は、図3に示す原色成分の値範囲への分割例において、着目した値範囲が局所的なピークであり、かつ、予め与えられたしきい値以上のヒストグラム値であった例で、値範囲の中心を黒円で示してある。その黒円におけるRの値は40で、Gの値は24となり、この黒円が1つの仮の主要色中心となる。
マハラノビス距離を求める際に用いる共分散行列は、予め学習によって得られる共分散行列を用いることができる。
例えば、共分散行列の学習には、被撮像体について予め得られたすべての色ヒストグラムの値範囲の中心点に対応する色成分を、塗られた球状又は立方体の物体を複数の照明条件で撮像して得られた画素値から共分散行列を作成することができる。
このようにして作れた共分散行列は、それぞれ、対応する色ヒストグラムの値範囲に適用することができる。また、すべての値範囲に対して予め定められた1つの共分散行列を適用することもできる。
これら両図は、簡略化のため、二次元で書き表されている。図6は、実線で囲まれた範囲が色ヒストグラムの局所的なピークの値範囲で、かつ、予め定められたしきい値以上のヒストグラム値を持つ値範囲である。
実線で囲まれた範囲の×印が仮の主要色中心を表しており、黒丸の点は実際の画像で得られた画素のヒストグラム値を表している。
図7の×印は図6の場合に比して仮の主要色中心の近傍における実際の画素の平均に、より近づいている。図7では黒丸の点の大きさが図6よりも小さく描かれているが、これは図の見易さのためである。
仮の主要色中心を求める上記処理、すなわち、仮の主要色中心の補正処理は、図6の×印で示すように、真のピークからずれている可能性のある仮の主要色中心をその近傍で補正し、図7の×印で示すように、より真の局所的なピークに近い値を主要色中心として抽出するのを可能にする機能を有する。
この処理には、仮の主要色中心から主要色中心を求める際に用いた共分散行列をそのまま用いることができる。
このようにして作成された共分散行列は、それぞれ対応する色ヒストグラムの値範囲の主要色に適用することができる。
また、すべての主要色に対して予め定められた1つの共分散行列を用いることもできる。
すなわち、夕方の撮影で全体的に赤みがかった画像として撮影されたり、雨の日の撮影で全体的に青みがかった画像として撮影されたりして照明条件が大きく異なった場合でも、照明条件によらずライセンスプレートの画像上における大きな色の差を保ちつつ、似たような色を1つの色として適応的に纏める効果が得られるので、文字に使われている色と背景に使われている色とを良好に分離可能である。
入力画像から抽出された主要色の個数分だけの、主要色に対応した画像を準備し、着目した画素が或る主要色に属すると判定された場合には当該画素と同じ座標の画素値を1とし、着目した画素が或る主要色に属すると判定されない場合にはその画素と同じ座標の画素値を0とする。この処理を準備した画像内のすべての画素について行う。
このようにして作成される画像を主要色画像と呼ぶ。
また、入力された画像が図12のような画像であった場合には、主要色画像としては、図13(赤)、図14(白)、図15(暗い赤)、図16(灰色)のような主要色画像の各々に分解される。
また、入力画像内の画素が、複数の主要色に属する画素になる可能性もあるが、主要色抽出処理後の処理に進む。
組合せ画像の作成は、組合せ作成手段16で行われるが、その処理(図2の組合せ作成処理S3)は、以下に説明する主要色画像の組合せのアルゴリズムによって行われる。
例えば、上述の入力画像が図12の画像である例においては、得られる主要色画像は、上述したように、図13(赤)、図14(白)、図15(暗い赤)、図16(灰色)の4種類の主要色画像であるから、組合せ画像の作成において作成される組合せ画像は、6種類、すなわち、赤と白、赤と暗い赤、赤と灰色、白と暗い赤、白と灰色、暗い赤と灰色の組合せ画像である。
これらの組合せ画像の作成は、組み合わせようとする主要色画像上の画素座標において、どちらかの画素値が1であった場合に、組合せ画像の画素値を1にし、そうでなかった場合には、その画素値を0にするようにして作成する。
しかし、組合せ作成手段16において、図13(赤)及び図15(暗い赤)とを組み合わせることによって、図17に示す組合せ画像を得ることができる。
図形領域抽出手段18における処理(図3の図形領域抽出処理S4)は、入力される主要色画像及び組合せ画像から認識しようとする図形領域、例えば、文字(ライセンス番号)の領域を図形領域候補として抽出する。以下、そのアルゴリズムを説明する。
図形領域抽出手段18の処理において、例えば、主要色画像や組合せ画像の画素値が1の部分から縦方向のラン及び横方向のランのいずれか一方又は双方を抽出して長すぎるランをノイズ成分として除去することによって、ライセンスプレートの枠等、文字として使われる可能性の低い領域を除去することができる。
例えば、図18に示すような組合せ画像が、組合せ作成手段16から図形領域抽出手段18に入力されたとすると、上記条件の下でその組合せ画像の縦及び横に長すぎるランを除去すると、図19に示すような画像となる。
例えば、認識すべき文字は、一般に、入力画像の中心部に位置しているから、極端に画像の縁近くに位置している連結部分は認識すべき文字であるとは考え難いので、ノイズ成分であるとして除去することができる。その例を図20の参照の下に説明する。
その結果、図20に示す画像内の連結部分は除去されて図21に示す画像が得られる。
例えば、連結部分が入力画像の上下の端側にある部分で入力画像の高さの15%に相当する部分や、入力画像の左右の端側にある部分で入力画像の幅の10%に相当する部分に連結部分の中心が位置していて、かつ、連結部分の高さと幅との比が、予め定められた範囲から外れている場合に、その連結部分をノイズ成分として除去すれば良い。
上記連結部分の高さと幅との比が、例えば、0.9以上から10.0以下の場合に、その部分は文字である可能性があるとし、それ以外の値であるときはノイズ成分として除去すれば良い。
例えば、図形領域候補が図21に示すようなものであるとき、その中央のやや上にあるギザギザ状の連結部分の幅w1及び高さh1のいずれか一方又は双方と入力画像の幅W及び高さHのいずれか一方又は双方と比較してその割合が予め定められた値より大きいとき、文字の連結部分としては大き過ぎる連結部分であると判断することができる。
具体的には、上記連結部分の幅w1が入力画像の幅Wの30%を超えているか、又は、その高さh1が入力画像の高さHの70%を超えている場合には、そのような連結部分は大き過ぎると判断できる。
具体的には、上記連結部分の幅w2が入力画像の幅Wの5%以下であるか、又は、その高さh2が入力画像の高さHの20%以下である場合には、そのような連結部分は小さ過ぎると判断できる。
先ず、残っている連結部分が複数の行を構成しているかどうかを判定し、もし複数行を構成していると判定された場合は行毎に領域を抽出する。
次に、個別の文字部分に対応する領域を行毎に分類する。
ここでの行抽出には、例えば、樋口他により信学技報、PRMU98−207に記載される「手書き文書画像からの周期的な罫線の除去及び行切り出し」を用いることができる。また、通常の行抽出アルゴリズムを用いることもできる。
このような場合に、この発明では、抽出された各行に対して、図22の中に示す座標系のように、横軸の右方向にx軸を取り、縦軸の上方向にy軸を取って表される座標内に存在する各連結成分の中心座標(Cx、Cy)としたとき、2Cx−Cyの値の小さい順に分類する。
この分類方法に従うと、図22に示す各連結成分は、「AB123」の順番に並べ替えられることになる。
図形認識手段20では、入力される図形領域候補の各々に対して図形認識処理を施す。例えば、文字図形を対象とした図形認識に対しては、通常の文字認識方法を用いることができ、その際に認識結果の確からしさを示す指標である信頼度も同時に出力することができる。
また、信頼度の算出方法としては、例えば、石寺他により信学技報PRMU98−16に記載される「住所読み取りにおける文字認識結果の評価方式」を用いることができる。また、他の認識信頼度算出方法を用いることもできる。
この図形認識処理において、すべての画像に対する図形、例えば、文字であるライセンス番号の読み取り結果を順位付けすることにより、ライセンス番号読み取り結果の候補をその信頼性の高さを表す順位で得ることができる。
例えば、画像毎にすべての文字領域候補に対する文字認識信頼度の平均値を求め、その平均値の高い順番にライセンス番号読み取り結果の候補とすることができる。このような順位付け処理を行えば、文字認識処理において認識対象外とされた文字領域候補については文字認識を行うことなく、他の文字領域候補について文字認識処理を行うようにすることができる。
また、画像毎にすべての文字領域候補に対する文字認識信頼度の平均値を計算し、最も良い値を持つ認識結果を最終的なライセンス番号の読み取り結果として出力することができる。
この効果が得られることから、文字領域の抽出を上記因子の影響の排除に寄与し得る最も望ましい基準で行うことができ、文字認識精度の向上となる。
例えば、上記実施例においては、RGB値の色空間を例にして説明しているが、必ずしもRGB空間だけに限られるものではなく、その他の表色系、例えば、CMY系(シアン、マゼンタ及びイエローから成る表示系)の色空間を用いることも可能であるし、グレースケールで行うことも可能である。
また、分割される領域のうちの一部領域又はすべての領域が互いに重なり合っていてもよいし、一度作成されたヒストグラムにスムージングを施してもよい。
さらには、値範囲は、必ずしも、等分でなくてもよい。
また、いずれの場合であっても、値範囲は固定でなく、所定の条件の下で可変的に変更されてもよい。
また、しきい値は固定でなく、所定の条件の下で可変的に変更されてもよい。
また、いずれの場合であっても、しきい値は固定でなく、所定の条件の下で可変的に変更されてもよい。
また、主要色中心に基づいての主要色の抽出には、マハラノビス距離だけでなく、ユークリッド距離を用いても良いし、シティブロック距離を用いても良い。但し、ユークリッド距離やシティブロック距離を用いた場合、しきい値は10乃至128の範囲に設定することが望ましい。
また、いずれの場合であっても、しきい値は固定でなく、所定の条件の下で可変的に変更されてもよい。
さらには、特開2001−201953号公報に開示される方法を主要色の抽出に適用することも可能である。
また、すべての組合せの数だけの組合せ画像を作成する例について説明したが、これに限られるものではない。例えば、組み合わせようとする主要色の色合いの近さを評価し、あまりにも色合いが異なるような組合せ画像は作成しないようにすることもできる。
この場合の判定に用いるしきい値としては、色度を用いる場合0乃至2までの任意の実数を用いることができ、256階調のRGB空間における距離を用いる場合には0乃至350までの任意の値を用いることができる。
また、上記パーセンテージは固定でなく、所定の条件の下で可変的に変更されてもよい。
また、上記パーセンテージは固定でなく、所定の条件の下で可変的に変更されてもよい。
また、連結部分が小いさ過ぎると判断する条件として、除去しようとする連結部分の幅が入力画像の幅の5%以下であるか、又はその連結部分の高さが入力画像の高さの20%以下である例を説明したが、上記パーセンテージに限られるものではなく、それぞれ、入力画像の幅及び高さの1%乃至99%の範囲で自由に設定可能である。
また、上記のいずれのパーセンテージも固定でなく、所定の条件の下で可変的に変更されてもよい。
また、森他により信学技報PRMU98−154に記載される「画質劣化にロバストな映像中テロップ文字認識」を用いることができる。
また、この発明は、文字に限られず、図形一般の読み取りにおいて実施することも可能である。
また、組合せ画像の作成は、ビデオ画像中のキャプションにクラデーションが掛かっている場合や、キャプションの色がストライプ状に複数で表示されている場合にも適用可能である。また、写真の画像にも適用可能である。
したがって、ビデオキャプション等の文字、図形の読み取りに利用可能である。
12 画像入力手段
14 主要色抽出手段(画像分解手段、評価手段、分割手段、仮主要色中心決定手段、主要色中心決定手段、抽出手段)
16 組合せ作成手段(画像組合せ手段、入力手段、主要色画像出力手段)
18 図形領域抽出手段(図形読み取り手段の一部)
20 図形認識手段(図形読み取り手段の残部)
Claims (12)
- 入力画像毎に、当該入力画像を構成する画素との関係で出現頻度の高い複数の色成分を主要色として抽出し、
前記入力画像を抽出された前記主要色毎の複数の主要色画像に分解し、
分解された前記複数の主要色画像の中から、互いに異なる複数を組み合わせて、単数又は複数の組合せ画像を作成し、
分解された前記主要色画像と作成された前記組合せ画像とに基づいて図形の読み取りを行うことを特徴とする図形読み取り方法。 - 前記主要色の抽出は、前記入力画像を表す表色系の2以上の色成分について当該色成分を所定数に分割し、
分割された第1の色成分区間の色成分値が隣接する第2の色成分区間の色成分値に対してピークとなっており、かつ、予め決められた第1のしきい値以上にあるとき第1の前記色成分区間の中心を仮の主要色中心とし、
仮の前記主要色中心を中心として分布する前記色成分のうちの、前記色成分間の色の近さを示す値が予め決められた第2のしきい値より大きい前記色成分の平均値を求めて主要色中心とし、
前記主要色中心を中心として分布する前記色成分のうちの、前記色成分間の色の近さを示す値が予め決められた第3のしきい値より大きい前記色成分の各々を含めて行うことを特徴とする請求項1記載の図形読み取り方法。 - 前記入力画像から前記主要色画像への分解は、前記入力画像を構成する画素が前記主要色に属するとき当該画素を第1の画素値とし、属しないとき当該画素を第2の画素値として行うことを特徴とする請求項1又は2記載の図形読み取り方法。
- 前記図形の読み取りは、分解された前記主要色画像及び作成された前記組合せ画像から図形領域候補を抽出し、
抽出されたすべての前記図形領域候補に対して図形認識処理を行い、
前記図形認識処理の結果に基づいて行うことを特徴とする請求項1、2又は3記載の図形読み取り方法。 - 前記図形領域候補の抽出は、分解された前記主要色画像及び作成された前記組合せ画像を表す画素値が横方向及び又は縦方向に連続する前記図形領域候補のうちの、前記画素値が横方向及び又は縦方向に連続する数が、前記入力画像の横方向画素数及び縦方向画素数の予め決められた割合より大きい前記図形領域候補を前記図形領域候補から除外し、
除外されていない前記図形領域候補の中心となる座標における前記画素値が横方向及び又は縦方向に連続する数が、前記入力画像の横方向画素数及び縦方向画素数と比較し、
該比較結果に基づいて除外されていない前記図形領域候補を前記図形領域候補とするか否かを判定して行うことを特徴とする請求項4記載の図形読み取り方法。 - 入力画像毎に、当該入力画像を構成する画素との関係で出現頻度の高い複数の色成分を主要色として抽出する主要色抽出手段と、
前記入力画像を前記主要色抽出手段により抽出された前記主要色毎の複数の主要色画像に分解する画像分解手段と、
該画像分解手段により分解された前記複数の主要色画像の中から、互いに異なる複数を組み合わせて、単数又は複数の組合せ画像を作成する画像組合せ手段と、
前記画像分解手段により分解された前記主要色画像と前記画像組合せ手段により作成された前記組合せ画像とに基づいて図形の読み取りを行う図形読み取り手段とを備えたことを特徴とする図形読み取り装置。 - 前記主要色抽出手段は、前記入力画像を表す表色系の2以上の色成分について当該色成分を所定数に分割する分割手段と、
該分割手段により分割された第1の色成分区間の色成分値が隣接する第2の色成分区間の色成分値に対してピークとなっており、かつ、予め決められた第1のしきい値以上にあるとき第1の前記色成分区間の中心を仮の主要色中心と決定する仮主要色中心決定手段と、
該仮主要色中心決定手段により決定された仮の前記主要色中心を中心として分布する前記色成分のうちの、前記色成分間の色の近さを示す値が予め決められた第2のしきい値より大きい前記色成分の平均値を求めて主要色中心と決定する主要色中心決定手段と、
該主要色中心決定手段により決定された前記主要色中心を中心として分布する前記色成分のうちの、前記色成分間の色の近さを示す値が予め決められた第3のしきい値より大きい前記色成分の各々を含めた前記色成分を主要色として抽出する抽出手段とから成ることを特徴とする請求項6記載の図形読み取り装置。 - 前記画像分解手段は、前記入力画像を構成する画素が前記主要色に属するとき当該画素を第1の画素値にし、属しないとき当該画素を第2の画素値にして前記主要色画像を作成することを特徴とする請求項6又は7記載の図形読み取り装置。
- 前記図形読み取り手段は、前記画像分解手段により分解された前記主要色画像及び前記画像組合せ手段により作成された前記組合せ画像から図形領域候補を抽出する候補抽出手段と、
該候補抽出手段により抽出されたすべての前記図形領域候補に対して図形認識処理を行う認識処理手段と、
該認識処理手段で得られた前記図形認識処理の結果に基づいて図形を読み取る読み取り手段とから成ることを特徴とする請求項6、7又は8記載の図形読み取り装置。 - 前記候補抽出手段は、前記画像分解手段により分解された前記主要色画像及び前記画像組合せ手段により作成された前記組合せ画像を表す画素値が横方向及び又は縦方向に連続する前記図形領域候補のうちの、前記画素値が横方向及び又は縦方向に連続する数が、前記入力画像の横方向画素数及び縦方向画素数の予め決められた割合より大きい前記図形領域候補を前記図形領域候補から除外する候補除外手段と、
該候補除外手段により除外されていない前記図形領域候補の中心となる座標における前記画素値が横方向及び又は縦方向に連続する数が、前記入力画像の横方向画素数及び縦方向画素数と比較する比較手段と、
該比較手段による比較の結果に基づいて除外されていない前記図形領域候補を前記図形領域候補とするか否かを判定する判定手段とを含むことを特徴とする請求項9記載の図形読み取り装置。 - コンピュータに請求項1乃至請求項5のいずれか一に記載の図形読み取り方法を実行させるための制御プログラム。
- コンピュータに請求項6乃至請求項10のいずれか一に記載の図形読み取り装置の各手段として機能させるための制御プログラム。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004126675A JP4396376B2 (ja) | 2004-04-22 | 2004-04-22 | 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 |
US11/110,892 US7522766B2 (en) | 2004-04-22 | 2005-04-21 | Picture reading method, program and device, principal color extracting method, program and device, and image dividing method, program and device |
CA002505159A CA2505159A1 (en) | 2004-04-22 | 2005-04-22 | Picture reading method, program and device, principal color extracting method, program and device, and image dividing method, program and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2004126675A JP4396376B2 (ja) | 2004-04-22 | 2004-04-22 | 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005309819A JP2005309819A (ja) | 2005-11-04 |
JP4396376B2 true JP4396376B2 (ja) | 2010-01-13 |
Family
ID=35136475
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004126675A Expired - Fee Related JP4396376B2 (ja) | 2004-04-22 | 2004-04-22 | 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US7522766B2 (ja) |
JP (1) | JP4396376B2 (ja) |
CA (1) | CA2505159A1 (ja) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1779295A4 (en) * | 2004-07-26 | 2012-07-04 | Automotive Systems Lab | SYSTEM FOR PROTECTING USERS OF THE ROAD IN A DANGER SITUATION |
US7664318B2 (en) | 2004-09-17 | 2010-02-16 | Nec Software Chubu, Ltd. | Figure reading apparatus, method and program |
JP4791295B2 (ja) * | 2006-08-31 | 2011-10-12 | 富士通株式会社 | 罫線抽出プログラム、罫線抽出装置、罫線抽出方法 |
US8131018B2 (en) * | 2008-02-08 | 2012-03-06 | Tk Holdings Inc. | Object detection and recognition system |
JP5029412B2 (ja) * | 2008-02-20 | 2012-09-19 | 富士通株式会社 | テロップ文字パターン抽出プログラム、テロップ文字パターン抽出装置、およびテロップ文字パターン抽出方法 |
JP2009265751A (ja) * | 2008-04-22 | 2009-11-12 | Oki Electric Ind Co Ltd | 文字認識装置、光学式文字認識システム及び文字認識プログラム |
CN102210162B (zh) * | 2008-11-12 | 2014-01-29 | 富士通株式会社 | 反射式字幕移动处理装置、方法 |
TWI381321B (zh) * | 2009-04-30 | 2013-01-01 | Ind Tech Res Inst | 重組多張影像與辨識方法以及影像擷取與辨識系統 |
US9047674B2 (en) * | 2009-11-03 | 2015-06-02 | Samsung Electronics Co., Ltd. | Structured grids and graph traversal for image processing |
US8693743B1 (en) | 2010-02-19 | 2014-04-08 | Olive Tree Media, LLC | Analysis and display of multiple biomarker co-expression in cells and tissues |
CN101894268B (zh) * | 2010-07-16 | 2012-05-23 | 西安理工大学 | 一种可消除底单干扰的印鉴真伪识别方法 |
JP5775294B2 (ja) * | 2010-12-15 | 2015-09-09 | キヤノン株式会社 | 画像形成装置、画像処理装置、画像処理方法、及びプログラム |
US9857868B2 (en) | 2011-03-19 | 2018-01-02 | The Board Of Trustees Of The Leland Stanford Junior University | Method and system for ergonomic touch-free interface |
US8792682B2 (en) * | 2011-04-21 | 2014-07-29 | Xerox Corporation | Method and system for identifying a license plate |
US8840466B2 (en) | 2011-04-25 | 2014-09-23 | Aquifi, Inc. | Method and system to create three-dimensional mapping in a two-dimensional game |
US8854433B1 (en) | 2012-02-03 | 2014-10-07 | Aquifi, Inc. | Method and system enabling natural user interface gestures with an electronic system |
US8934675B2 (en) | 2012-06-25 | 2015-01-13 | Aquifi, Inc. | Systems and methods for tracking human hands by performing parts based template matching using images from multiple viewpoints |
US8836768B1 (en) | 2012-09-04 | 2014-09-16 | Aquifi, Inc. | Method and system enabling natural user interface gestures with user wearable glasses |
US9129155B2 (en) | 2013-01-30 | 2015-09-08 | Aquifi, Inc. | Systems and methods for initializing motion tracking of human hands using template matching within bounded regions determined using a depth map |
US9298266B2 (en) | 2013-04-02 | 2016-03-29 | Aquifi, Inc. | Systems and methods for implementing three-dimensional (3D) gesture based graphical user interfaces (GUI) that incorporate gesture reactive interface objects |
US9507417B2 (en) | 2014-01-07 | 2016-11-29 | Aquifi, Inc. | Systems and methods for implementing head tracking based graphical user interfaces (GUI) that incorporate gesture reactive interface objects |
US9589202B1 (en) | 2014-06-27 | 2017-03-07 | Blinker, Inc. | Method and apparatus for receiving an insurance quote from an image |
US10733471B1 (en) | 2014-06-27 | 2020-08-04 | Blinker, Inc. | Method and apparatus for receiving recall information from an image |
US9892337B1 (en) | 2014-06-27 | 2018-02-13 | Blinker, Inc. | Method and apparatus for receiving a refinancing offer from an image |
US9760776B1 (en) | 2014-06-27 | 2017-09-12 | Blinker, Inc. | Method and apparatus for obtaining a vehicle history report from an image |
US9600733B1 (en) | 2014-06-27 | 2017-03-21 | Blinker, Inc. | Method and apparatus for receiving car parts data from an image |
US9594971B1 (en) | 2014-06-27 | 2017-03-14 | Blinker, Inc. | Method and apparatus for receiving listings of similar vehicles from an image |
US9754171B1 (en) | 2014-06-27 | 2017-09-05 | Blinker, Inc. | Method and apparatus for receiving vehicle information from an image and posting the vehicle information to a website |
US9558419B1 (en) | 2014-06-27 | 2017-01-31 | Blinker, Inc. | Method and apparatus for receiving a location of a vehicle service center from an image |
US9589201B1 (en) | 2014-06-27 | 2017-03-07 | Blinker, Inc. | Method and apparatus for recovering a vehicle value from an image |
US9607236B1 (en) | 2014-06-27 | 2017-03-28 | Blinker, Inc. | Method and apparatus for providing loan verification from an image |
US9563814B1 (en) | 2014-06-27 | 2017-02-07 | Blinker, Inc. | Method and apparatus for recovering a vehicle identification number from an image |
US9779318B1 (en) | 2014-06-27 | 2017-10-03 | Blinker, Inc. | Method and apparatus for verifying vehicle ownership from an image |
US10867327B1 (en) | 2014-06-27 | 2020-12-15 | Blinker, Inc. | System and method for electronic processing of vehicle transactions based on image detection of vehicle license plate |
US10515285B2 (en) | 2014-06-27 | 2019-12-24 | Blinker, Inc. | Method and apparatus for blocking information from an image |
US10579892B1 (en) | 2014-06-27 | 2020-03-03 | Blinker, Inc. | Method and apparatus for recovering license plate information from an image |
US10540564B2 (en) | 2014-06-27 | 2020-01-21 | Blinker, Inc. | Method and apparatus for identifying vehicle information from an image |
US9818154B1 (en) | 2014-06-27 | 2017-11-14 | Blinker, Inc. | System and method for electronic processing of vehicle transactions based on image detection of vehicle license plate |
US10572758B1 (en) | 2014-06-27 | 2020-02-25 | Blinker, Inc. | Method and apparatus for receiving a financing offer from an image |
US9773184B1 (en) | 2014-06-27 | 2017-09-26 | Blinker, Inc. | Method and apparatus for receiving a broadcast radio service offer from an image |
CN106326898B (zh) * | 2016-08-04 | 2019-09-20 | 安凯 | 一种车牌图像提取方法 |
CN108182691B (zh) * | 2018-01-02 | 2020-08-28 | 北京汽车集团有限公司 | 识别限速标志的方法、装置及车辆 |
WO2019186583A2 (en) * | 2018-03-26 | 2019-10-03 | Videonetics Technology Private Limited | System and method for automatic real-time localization of license plate of vehicle from plurality of images of the vehicle |
CN108391602B (zh) * | 2018-04-25 | 2023-06-06 | 中国农业科学院农业信息研究所 | 一种雏鸡性别识别系统及其识别方法 |
CN111508017B (zh) * | 2020-04-08 | 2023-11-03 | 中导光电设备股份有限公司 | 一种弱对比度定位标记中心的方法和系统 |
CN112509068B (zh) * | 2020-10-29 | 2024-08-16 | 北京达佳互联信息技术有限公司 | 图像主色识别方法、装置、电子设备及存储介质 |
CN114120002A (zh) * | 2021-10-26 | 2022-03-01 | 北京达佳互联信息技术有限公司 | 图像颜色提取方法、装置、电子设备及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2576336B2 (ja) | 1992-06-26 | 1997-01-29 | 日本電気株式会社 | 画像分割方法、及び装置 |
US5787192A (en) * | 1994-09-27 | 1998-07-28 | Kabushikaisha Equos Research | Image data compression apparatus and image data communication system |
JP2000251016A (ja) | 1999-03-02 | 2000-09-14 | Hitachi Ltd | ナンバープレート認識装置 |
JP2001222680A (ja) | 2000-02-08 | 2001-08-17 | Mitsubishi Electric Corp | ナンバー読取り装置 |
JP2003085535A (ja) | 2001-09-07 | 2003-03-20 | Zenrin Co Ltd | 道路案内標識の位置認識方法 |
-
2004
- 2004-04-22 JP JP2004126675A patent/JP4396376B2/ja not_active Expired - Fee Related
-
2005
- 2005-04-21 US US11/110,892 patent/US7522766B2/en active Active
- 2005-04-22 CA CA002505159A patent/CA2505159A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
US20050238229A1 (en) | 2005-10-27 |
US7522766B2 (en) | 2009-04-21 |
CA2505159A1 (en) | 2005-10-22 |
JP2005309819A (ja) | 2005-11-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4396376B2 (ja) | 図形読み取り方法及びその装置並びに主要色抽出方法及びその装置 | |
WO2016054802A1 (en) | Hierarchical interlinked multi-scale convolutional network for image parsing | |
KR101461233B1 (ko) | 화상 처리 장치, 화상 처리 방법 및 기록 매체 | |
US9171224B2 (en) | Method of improving contrast for text extraction and recognition applications | |
US20070122037A1 (en) | Image processing apparatus and image processing method | |
CN107066972B (zh) | 基于多通道极值区域的自然场景文本检测方法 | |
CN101334836A (zh) | 一种融合色彩、尺寸和纹理特征的车牌定位方法 | |
CN108090459B (zh) | 一种适用于车载视觉系统的交通标志检测识别方法 | |
CN107659799B (zh) | 摄像装置、图像处理方法和存储介质 | |
CN105139011B (zh) | 一种基于标识物图像的车辆识别方法及装置 | |
JP6890427B2 (ja) | 車番認識装置 | |
KR101549495B1 (ko) | 문자 추출 장치 및 그 방법 | |
JP3851742B2 (ja) | 帳票処理方法及び装置 | |
CN114782953A (zh) | 一种印章智能识别方法 | |
JP2011248702A (ja) | 画像処理装置、画像処理方法、画像処理プログラム及びプログラム記憶媒体 | |
CN102521610B (zh) | 图片过滤方法和装置 | |
CN111666811A (zh) | 一种提取交通场景图像中交通标志牌区域方法及系统 | |
US10496894B2 (en) | System and method for text localization in images | |
JP4336755B2 (ja) | カラー画像を用いた看板の認識方法 | |
Herwanto et al. | Zoning feature extraction for handwritten Javanese character recognition | |
JP2002042055A (ja) | カラー文書画像からの文字抽出方法 | |
Wu et al. | Extracting road signs using the color information | |
Cika et al. | Vehicle license plate detection and recognition using symbol analysis | |
JP2013178732A (ja) | 画像処理装置及び画像処理方法 | |
JP5337844B2 (ja) | 領域検出装置、領域検出方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060817 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090610 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090623 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090929 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091012 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121030 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4396376 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131030 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |