JPH06290302A - 画像処理装置 - Google Patents

画像処理装置

Info

Publication number
JPH06290302A
JPH06290302A JP5074250A JP7425093A JPH06290302A JP H06290302 A JPH06290302 A JP H06290302A JP 5074250 A JP5074250 A JP 5074250A JP 7425093 A JP7425093 A JP 7425093A JP H06290302 A JPH06290302 A JP H06290302A
Authority
JP
Japan
Prior art keywords
color
image
character
data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP5074250A
Other languages
English (en)
Other versions
JP3258122B2 (ja
Inventor
Yoshiaki Kurosawa
由明 黒沢
Bunpei Irie
文平 入江
Hideo Horiuchi
秀雄 堀内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP07425093A priority Critical patent/JP3258122B2/ja
Priority to DE69430685T priority patent/DE69430685T2/de
Priority to EP94105154A priority patent/EP0618545B1/en
Publication of JPH06290302A publication Critical patent/JPH06290302A/ja
Priority to US08/594,372 priority patent/US6035059A/en
Application granted granted Critical
Publication of JP3258122B2 publication Critical patent/JP3258122B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1429Identifying or ignoring parts by sensing at different wavelengths
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/1444Selective acquisition, locating or processing of specific regions, e.g. highlighted text, fiducial marks or predetermined fields
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/15Cutting or merging image elements, e.g. region growing, watershed or clustering-based techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Color Image Communication Systems (AREA)

Abstract

(57)【要約】 【目的】本発明は精度の高い文字認識を実現できる画像
処理装置を提供する。 【構成】入力画像データについて暫定的な色分離を行う
ことにより得られたブロックa、x、y、z、wについ
て、これらブロックa、x、y、z、wが構成する画素
の幾何学的な情報と、これら各ブロックa、x、y、
z、wおよびこれらのバックグラウンドの濃度情報を併
用して最終的な色分離を決定するようにしている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、伝票などに印刷された
文字の認識に用いられる文字認識装置に適用される画像
処理装置に関するものである。
【0002】
【従来の技術】従来、伝票のように罫線・空白などによ
り文字の並びが区切られている表形式帳票に印刷されて
いる文字の認識を行うような場合、画像入力時の際に、
ドロップ・アウトカラーと称する帳票のフォーム部分を
構成する色を光学的フィルター処理により落し、認識対
象となる原画像からフォーム部分を消去して画像入力を
行なう事により文字認識を行うようにしている。
【0003】このため、従来技術ではドロップ・アウト
カラーとは異なる色の帳票を扱うことはできず、もちろ
ん、バックグラウンドカラーが白で無いものも扱えなか
った。また多色刷りのものや、記載文字がドロップ・ア
ウトカラーであるものも扱うことができず、当然の事な
がら、記載文字の色が特定されないものも読み取ること
ができなかった。
【0004】そこで、従来、特開昭61−15285号
公報によりドロップ・アウトカラーでない色で印刷され
た帳票に対応できる文字認識装置が提案されているが、
この公報のものには、色分離技術が含まれていない為に
文字枠と文字の分離が色分離技術ではなく、文字枠と文
字の分離技術のみによって実施されている。この為、認
識制度の点で限界があった。
【0005】一方、特開昭62−5485号公報、特開
昭62−154181号公報、特開平2−67689号
公報、特開平2−135584号公報、特開平2−12
3488号公報、特開平3−14077号公報、特開平
3−223987号公報、特開平4−39789号公
報、特開平4−160486号公報、特開平4−354
083号公報では、あらかじめ設定されている方法によ
り入力画像の色分離を行ない、その結果を用いて文字認
識を行う装置が開示されている。
【0006】
【発明が解決しようとする課題】しかしながら、これら
の文字認識装置によると、帳票色や記入色、帳票フォー
ム部分や文字部分の印刷方法、文字記入方法等に対する
制限などを緩やかにして運用すると、例えば、乱雑に記
入文字を記入欄に記載した場合などに、文字を正確に認
識する事ができないことがあり、また色ずれを起こして
いる様なケースにも対応できなかった。
【0007】また、これら従来の文字認識装置では、ド
ロップ・アウトカラーを使う事のできない運用形態の時
に、画像をカラー・データで読み込み、何らかの色分離
処理を行ない、これら色分離されたデータから文字認識
を行なうことなどが提案されているだけであり、現実
に、文字認識のシステムを構成する場合に考慮しなけれ
ばいけない種々の問題について何ら解決策を提示してい
ない。
【0008】この為、従来技術のみでは実際に前述した
ような現実に存在している帳票読み取りの運用形態が実
施された場合には、文字認識手段として有効なものとは
いえなかった。一例として、赤い枠に赤い文字で印刷さ
れている部分と、赤い枠に黒い文字で記入された部分が
同居するような帳票については、具体的にどのような手
段で読み取るか問題になるが、従来のものでは、これら
の問題は解決され得ない。
【0009】本発明は、上記事情に鑑みてなされたもの
で、精度の高い文字認識を実現することができる画像処
理装置を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、入力画像デー
タについて暫定的な色分離を行うとともに、該暫定的に
色分離された各部分を構成する画素の幾何学的な情報
と、これら各部分およびバックグラウンドの濃度情報を
併用して最終的な色分離を決定するようにしている。
【0011】また、本発明は、予め書式情報に部分領域
の定義と該領域毎に実行される色分離に関する情報を用
意し、これら情報に基づいて所定の領域での色分離を実
行するようにしている。
【0012】また、本発明は、帳票の入力画像データに
ついて特定色を分離し、この分離された特定の色に対応
する書式情報を選択し、該選択された書式情報に対する
認識処理を実行するようにしている。
【0013】また、本発明は、画像データから抽出され
る複数の代表色をランレングス表現し、これらランレン
グス表現データを指し示すポインターにより構成される
ポインタ・テーブルを生成し、該ポインタ・テーブルの
ポインターにより特定のデータ部分を参照可能にしてい
る。
【0014】また、本発明は、画像の色表現形式である
色情報、濃淡情報、2値情報に対応して各処理ユニット
を用意し、入力された画像の色表現形式に応じた処理ユ
ニットを使用するようにしている。
【0015】また、本発明は、入力画像がそのままある
いは色分離されて蓄積されるカラー画像バッファ、カラ
ー画像から得られるか、直接入力されるグレー画像を格
納するグレイ画像バッファ少なくとも一方を有し、且つ
グレー画像またはカラー画像から生成される2値画像を
格納する2値画像バッファを有し、2値画像を対象とし
た処理において、入力画像の特定部分を再チェックする
場合に、前記カラー画像バッファおよびグレイ画像バッ
ファの少なくとも一方の前記特定部分の対応部分を参照
可能にしている。
【0016】また、本発明は、入力画像データが色分離
され、印鑑の色に相当する部分と記入文字の色部分に分
けられ、該記入色の画像データに対して文字認識または
取り消し判定が行われ該取り消し部分と判定されると、
この取り消し部分の位置に対応する印鑑色の画像データ
の位置部分を取り出して、その部分に印鑑色が存在する
か調べるとともに、その存在の有無を出力する2重線取
消し処理機能を有している。
【0017】また、本発明は、入力された画像データか
ら帳票のフォーム・イメージを取り出し、該帳票上の文
字を認識するとともに、少なくともその文字の存在位置
を記憶し、帳票のフォーム・イメージの色に類似する色
によってフォーム・イメージを画像表示するときに、前
記認識された文字をその文字が存在していた位置に重ね
て表示するようにしている。
【0018】また、本発明は、入力画像データに対し修
正に必要な修正パラメータを属性データとして付与して
おき、その後前記属性データに基づいて修正パラメータ
を再現し該修正パラメータにより画像データを修正して
該修正画像データについて画像処理を実行するようにし
ている。
【0019】
【作用】この結果、本発明によれば、帳票色や記入色、
帳票フォーム部分や文字部分の印刷方法、文字記入方法
等に対する制限を緩く運用した場合や、乱雑に記入文字
を記入欄に記載した場合などにあっても、高精度の文字
認識を実現することができるようになる。
【0020】
【実施例】以下、本発明の一実施例を図面に従い説明す
る。
【0021】図1は、同実施例を文字認識装置に適用し
た場合の概略構成を示している。図において、1は画像
入力部で、この画像入力部1には、画像データが入力さ
れる。この場合、入力画像データとしては、例えば、R
GB(赤、緑、青)の3色からなり、それぞれ多値表現
されたものが用いられる。勿論、これ以外の表現形式の
ものでも良い。
【0022】そして、画像入力部1では、例えば、色ず
れ補正処理、色の偏り補正処理、色変換などを行うよう
にしている。
【0023】画像入力部1からの出力は、色分離部2に
送られる。色分離部2は、入力画像データから特定の色
部分の色画像を分離抽出するもので、これら分離した色
部分をバッファ3の各色画像バッファ31、32、…3
nに格納する。
【0024】バッファ3の各色画像バッファ31、3
2、…3nからの出力は、画像処理部4に送られ。この
画像処理部4は後述するランレングス処理などを行うも
のである。
【0025】そして、この画像処理部4からの出力は、
文字切り出し部5に送られる。文字切り出し部5は、バ
ッファ3から読み出された画像データから文字の切り出
し処理を行うようにしている。
【0026】そして、この文字切り出し部5での切り出
し処理結果は、文字認識部6に送られる。文字認識部6
は、文字切り出し部5より切り出された文字について認
識処理を行うものである。そして、この文字認識部6で
認識された結果は、読み取り結果修正部7に送られ、オ
ペレータにより修正されて最終的な認識結果として出力
される。
【0027】このように構成において、画像入力部1に
は、画像データが入力される。この場合、入力画像デー
タは、例えば、RGB(赤、緑、青)の3色で、それぞ
れ多値表現されたものである。
【0028】そして、画像入力部1により、入力画像に
対するずれ修正、色の偏り補正の処理、色変換などが行
われる。
【0029】ここで、色ずれ修正は、色ずれ修正パラメ
ータとして、例えば、RGBの各色に対してシフトする
量を記述したものが考えられ、その修正は、それらのシ
フト量を各色について行なう事により実現される。
【0030】また、色の偏り補正処理は、例えば、RG
Bの各色に対して色の濃度を変換する事により行なわれ
る。ここで色の濃度を変換する方式には、ガンマ変換と
呼ばれる1個の色の濃度からその色の濃度の変換を行う
方式を採用して色の偏り補正処理を実現しても良いし、
RGBすべての色の濃度から、それぞれの色の濃度を決
めるような関数を用意するようにしても良い。ここでの
色の偏り補正パラメータは、それらの関数を決める様な
数値データであっても良いし、変換関数そのものであっ
ても良い。
【0031】本装置では、これら色ずれ修正パラメータ
や色の偏り補正パラメータを保持していて、これらに基
づいて色ずれ修正と色偏り補正処理を行なう。すなわ
ち、文字認識や特徴抽出、線分抽出、2値化処理などの
実際の文字認識処理や画像処理作業の途中で、認識不能
や抽出失敗が多くなったり、何等かの異常、矛盾が生じ
たときに修正パラメータによらない色ずれ修正を行い、
新たな修正パラメータを得、この結果と修正パラメータ
ガ異なるときにパラメータを新しく書き換えることによ
ってパラメータを更新する。
【0032】この更新は定期的に行なっても良いし、オ
ペレータの指示によって行なっても良い。また、色修正
(補正)パラメータは複数の画像入力部1に対応できる
ように複数個用意されていても良い。この場合、各画像
入力部1に対応してそれぞれの色修正(補正)パラメー
タによる色修正、及びパラメータのアップデートを行な
うようになる。
【0033】色ずれ修正パラメータは、帳票などでの黒
い部分に基づく色分析によって求められる。この黒い部
分は、入力画像中から自動的に抽出されても良いし、あ
らかじめ設定されている書式情報に従ってその存在場所
や大きさ形が決められていても良い。
【0034】あらかじめ決められた形のパターンが帳票
上に設定されている場合は、帳票中の特定部分に色ずれ
の修正用の模様やマーク、例えば十字形をセットしてお
いて、それに基づいて処理を行なうようになる。これら
模様、マークはその位置や形状等の情報が書式情報に登
録されていても良い。また、この模様部分を帳票番号を
記載する文字枠などとして、他の用途と共用する事もで
きる。
【0035】一方、色ずれ修正を行うための色ずれ分析
は、黒い部分の上下と左右の両側について、補色の関係
にある色がどの位存在しているかによって計測される。
このような計測は、複数の場所で行い、この結果のアベ
レージをとって全画面に共通の色ずれ量としても良い
し、それらをそれぞれの場所での色ずれ量だと見なして
も良い。後者のケースでは全画面で色ずれが一様でない
場合に対応できる。
【0036】図2は、色ずれの測定の方法を説明するも
のである。この場合、図に示すように黒部分の両側に2
重のにじみ、つまり2重のはみだしがあるとすると、各
色の切れ目はA1〜A6で表される。この場合、A1〜
A2のエリアとA4〜A5のエリアが補色の関係にあ
り、またA2〜A3のエリアとA5〜A6のエリアが補
色の関係にある事を条件に、A1からA2までの距離、
A1からA3までの距離が、それぞれ赤信号に対する緑
と青の色ずれ量と判定される。
【0037】ここで、補色の関係とは、両者の和がバッ
クグラウンドカラーA1〜A6の外側、この例では白に
なることか、またはそれに近くなることである。この考
え方は中央の領域A3〜A4が消失している場合でも同
様に適用する事ができる。
【0038】この場合、2重のはみ出しでなく、1重の
はみ出しでも適用できる。1重の場合には2つの色のず
れ量は同じものとすれば良い。この例ではRGBの順に
ずれている例を示したが、どの順にずれているかは各エ
リアの色から判断する事が出来る。
【0039】帳票中で黒で無い部分についても上述の考
え方が適用できる。この場合は、隣接する部分での色の
変化に基づいて色ずれ修正パラメータを決定する。つま
り、バックグラウンドの色のRGBの濃度値をR0、G
0、B0とし、対象部分の色をR1、G1、B1とする
と、色ずれを生じている所の色の変化は図3に示すよう
に表すことができ、この表から色ずれが起きているかど
うかと、色ずれ量を判定できる。
【0040】この場合、A1〜A2のエリアとA4〜A
5のエリアの和をとると、それはA3〜A4のエリアの
色とバックグラウンドの色を加えたものとなり、またA
2〜A3のエリアとA5〜A6のエリアについても同様
の事が言えれば、この例の場合はA1とA2の距離、A
1とA3の距離がそれぞれ赤信号に対する緑と青の色ず
れ量と判定される。また、仮にA3〜A4のエリアが消
失していたり、2重のはみ出しでなく1重のはみ出しの
場合でも、各エリアの色の状態からR0、G0、B0、
R1、G1、B1を決定できるので、上述した考え方を
使用してやはり色ずれ量を求める事ができる。
【0041】一方、図4に示すようなカラー印刷された
マークを検出し、その中にある赤、緑、青の各色のずれ
を調べる事により色ずれ量を検出する事ができる。
【0042】また、この様なマークの各色から色の偏り
補正処理を実行する事もできる。すなわち、画像入力部
1から得られるマークの色情報と本来期待されるべき色
情報の差に基づいて色の偏り補正の為のパラメータまた
は関数を決定する事ができる。
【0043】また、画像入力部1に入力される画像デー
タを生成するスキャナーのスキャンされる面上の特定部
分に色ずれの修正用のパターンを設定し、これから作ら
れる入力画像中の模様に基づいて色ずれ修正や色の偏り
補正を行なっても良い。
【0044】図5(a)(b)は、さらに異なる色ずれ
量を求める方法を示している。この方法は、赤、緑、青
の各色の濃度値が変化している部分で、各色の波形をず
らしながらマッチング、すなわち重ね合わせを行ない、
それらが最も重なる位置で各色のずらし量を求めるよう
になる。ここでのマッチングの方法はパターン認識の分
野で良く使われているマッチング技術を使用する事が出
来る。
【0045】色ずれ修正の作業は、図5に示す様な各色
の変化部分だけで実行するようにして、バックグラウン
ド部分や印刷部分や記載部分などの色ずれの影響の無い
部分は色ずれ処理を施さないように構成しても良い。こ
れらの部分では各色をずらしても結果が変わらないから
である。これにより色ずれ修正の高速化がはかれる。入
力画像の色ずれがはっきりわかる部分や特定位置を拡大
表示する機能により、色ずれ状態をオペレータが確認し
やすくする事ができる。
【0046】色ずれ修正において、入力画像を1画素単
位よりも細かい単位でずらすのは、例えば補間を使う事
によって可能となる。この場合、移動すべき位置の濃度
値を、その位置の近傍の画素の濃度値から補間計算して
決定する。
【0047】なお、上述で述べた事は、色のボケ方が違
うケースにも適用する事が出来る。図6は、黒の両端に
赤が出現している例であるが、この様なケースは赤に対
して緑と青の焦点がずれてボケている事を示している。
【0048】この様に、補色ではなく同色が両側にある
場合にはボケ修正用パラメータを得る事ができ、これに
より各色のボケ程度をそろえる事ができる。
【0049】また、上記の各種の補正、修正作業は、前
もって行なわず、後で述べる文字抽出プロセスや文字認
識プロセスの中の処理でそれらの補正や修正用パラメー
タを考慮して当該処理を実行する様にしても良い。
【0050】そして、この様にして色ずれ補正、色偏り
補正された画像入力部1からの出力は、色分離部2に送
られる。
【0051】次に、色分離部2での色分離の方法を述べ
る。
【0052】ここでは、帳票色登録機能について述べる
と、OCRに帳票(記入済みでも未記入でも)を入力し
た時に、その画像から色分析をして、その帳票が何色を
しているか、すなわちどの部分がどの様な色をしている
かを調べ、それに基づいて書式情報に色情報を登録す
る。登録データとしては、単に色の種類数と色データ
(RGB)というものから実際の帳票イメージまで登録
してしまう手段が可能である。
【0053】勿論、この時、インタラクティブにオペレ
ータが登録内容を修正できる。これは例えば、テスト的
に入力した帳票の画像に対して、様々な色についての色
抜き出し(消去)をトライアンドエラーで行ない、うま
く帳票の印刷部分を抜き出せる(消せる)色を書式情報
に登録するなどの手段である。
【0054】また、画面上に人工的な色データ、または
帳票の入力画像を表示し、その上のある位置を指示する
事によりその場所のRGBやVSHや色名称を出力し、
オペレータが登録色を決定するのに分かり易いようにす
る事もできる。
【0055】このような処理について、ズーム機能によ
ってオペレータが画像の一部分を拡大縮小するようなこ
とができれば便利である。
【0056】このようにして作られた書式情報に基づい
て、ある特定の色を分離抽出する処理が実行される。
【0057】書式情報に登録された色情報(背景色、記
入色を含み、それぞれ複数の可能性を持っていて良い)
に基づいて、消去すべき部分を取り除き、認識すべき部
分を抽出して認識する。
【0058】この場合、消去すべき部分を書式情報によ
らず、入力画像から得られる色情報のみから自動的に決
定する様にも構成出来る。たとえば簡単な例では特定の
色のみを消去したり、あるいは、帳票のフォームを構成
する線らしさや、その色から自動手的にフォーム部分の
色を決定できる。認識すべき部分についても同様であ
る。
【0059】色分離は、RGBから明度、彩度、色相
(VSH)に変換し、それに基づいて行なう事も出来
る。また、RGB、またはVSHの空間で距離を定義
し、それに基づいて色を分離する事も有効である。
【0060】色の名称を定義し、それに基づいて色を分
離する方法はマンマシン・インタフェースを考慮に入れ
ると有力な方式である。この場合、書式情報における定
義などもこの色名称によって行なわれる。
【0061】この様なシステムでは各色の名称と、RG
BやVSHなどの色表現データとが対応づいて登録され
ている。従って、書式情報などに登録された色名称はR
GBやVSHなどの色表現データに変換されて使用さ
れ、また逆にRGBやVSHなどの色表現データがオペ
レータに提示される時は、それはもっともそれに近い色
名称に逆変換されてオペレータに知らされる。
【0062】次に、色分離の一般的な方法について述べ
る。
【0063】ここでは簡単のためにグレイ画像の例で説
明する。グレイ画像の濃度値の頻度分布をとった例を図
7(a)(b)(c)に示している。この場合、0で
黒、1で白、中間部分が暗い灰色から明るい灰色として
いる。そして、Aの分布は図8に示すの画像の頻度分布
を取ったものである。この図では灰色で書かれた数字
「5」(Aの部分)の真ん中に明るい灰色の直線(Bの
部分)が貫通している例である。これらの頻度分布がそ
れぞれ図7のAとBに対応している。この時、直線部の
一部分bは暗くなっており、頻度分布のbに対応して数
字「5」の一部分aは明るくなっており、頻度分布aに
対応している。これらにより全体の頻度分布はCとな
る。この頻度分布から色分離に対応する濃度分離を行う
と、頻度を濃度値mで区切ってXとYのエリアに分けら
れることになる。
【0064】ところが、この分離法で画像を分離する
と、図9(a)(b)に示すようにaやbの部分がノイ
ズとして残ってしまう。また直線は数字「5」によって
分断されてしまう。
【0065】データが濃度情報だけでなく例えばRGB
の3色の色情報の場合は、前に説明した例と同様に、1
次元だったものを3次元に拡張して考えればよい。3次
元空間の中である領域の色を同一色と見做して色分離す
ればよい。
【0066】しかしながら、このような濃度の色空間内
における領域分割だけで、色分離するのでは、前に述べ
たように正しい色分離はできない。この場合、Aの部分
は直線であるとか、Bの部分は数字「5」であるなど各
画素の幾何学的な情報、すなわち位相情報を濃度情報と
併用しない限り、正しい色分離は論理的に不可能である
ことはこれまでの説明で明らかである。
【0067】これを更に詳しく述べると、いま、図9
(a)に示す結果が得られたとする。ここで、それぞれ
のブロックa、x、y、z、wについて、それらの各組
についてそれらが直線の一部であることをチェックす
る。この結果、例えばxとyの間のエリアでは濃度値が
暗くなっているので、これらの間には何か黒い線が可能
性があることになり、xとyは直線の一部である可能性
ありとなる。同様なことがyとz、zとwについてもい
え、また、x、y、z、wの全体としても直線性が肯定
的となる。これらを各ブロックの輪郭線を延長すること
により接続して、図10に示すような1つの直線として
得ることができる。
【0068】また、例えばaとyは輪郭線の延長がマッ
チしないことや、間にバックグラウンドカラーが存在す
るなどの理由により、接続不可能である。従って、aは
孤立したブロックであり、ノイズとして除去される。逆
にbの凹みは輪郭線を追跡することにより発見される
が、その凹み部分の濃度値が暗いながらもその輪郭線が
xyz全体を直線と見做したときの輪郭線と一致するこ
とから、bは直線の一部と判断され、最終的に図11に
示すような直線を得ることができる。
【0069】図9(b)に示す数字「5」についても同
様で、曲線らしさや文字の形状に関する情報から正しく
数字「5」を抜き出すことができる。
【0070】すなわち、本発明では、暫定的な色分離の
後、暫定的に文字切り出し処理、文字認識処理、線分抽
出処理、フオーム構造理解処理などを施し、それらの結
果を用いることにより最終的な色分離結果を決定すると
いうものである。すなわち、認識、抽出、理解などの処
理途中やその結果で色分離が疑わしいと判断される場所
があれば、フィードバックを行って、当該部分の色分離
についてその結果を使いながら、分離処理のやり直しを
実行するように構成すると言う事である。
【0071】他の例として、例えば直線部分を多く含
み、また必要な場合にはそれらの並びを調べることによ
って、それらが帳票のフォーム部分(未記入帳票画面)
を構成していることが判明した時に、それらをなす色を
自動的に帳票のフォーム部分の色として決定することが
できる。
【0072】また、文字程度の大きさの塊が連続してい
る場合には、それらの色を文字の記入色、印刷色として
決定できる。
【0073】このように、本発明では、書式情報に登録
された色情報や書式情報そのものがないときでも、入力
された帳票から色分析して自動的に帳票を構成する複数
の代表色を分離することが可能である。勿論、書式情報
に色情報や書式情報が定義されているときは、もっと容
易に上記の目的が達せられることはいうまでもない。次
に、図12は領域a、b、cからなる直線の近くにノイ
ズdが存在する例である。そして、a、cの色をC1、
領域b,dの色をC2とし、C2はC1とバックグラウ
ンドカラーの中間的な色であるとする。
【0074】このような画像に対して、ある任意の点を
領域の種としてそこから始めて徐々に領域を拡大してい
く。この領域拡大については、その領域の色と同一の色
と見做せる画素で、当該領域に接続している画素をその
領域に取り込むことによって拡大していく。どの領域に
も属さなくなるまでこれを繰り返すことにより、同図に
示す4個の領域a、b、c、dが抽出される。
【0075】このような領域抽出法は、画像処理分野で
知られている領域セグメンテーションの方式で、これは
領域成長法と呼ばれる手法の1つである。この他に、ス
プリット・マージやリラキゼーションなどの様々な方式
が可能である。
【0076】次に、各領域部分について前に述べたと同
様な方法で直線性の判断からbを直線一部、すなわちb
の部分の色をC1として分離し、dの部分をノイズ、す
なわちC2の色として分離する。
【0077】一般的にいえば、本発明は領域セグメンテ
ーションを行っての領域の代表色を決め、それらを総合
的に判断して全体における代表色を決めるというもので
ある。また、必要に応じてこれら代表色の情報から色分
離を行う。
【0078】領域セグメンテーションに色の近さの情報
を導入することによっても本発明による正しい色分離を
行うことができる。例えば成長法で行っている時に同一
色であるとの判断を緩めておけば、a,b,cが1領域
として検出されるようにも設定できる。すなわち成長の
過程で接触している輪郭部分の多い領域についてその両
者の色が近いとしたときに、具体的にはC1とC2が近
いと判断されたとして、これらをマージして1つの大き
な領域にする。こうすればdに大きく接触するC2に近
い色は無いかまたはそれはバックグラウンドカラーなの
で、それはいずれにせよノイズとして無視されてしまう
一方bの領域は直線の一部として正しく領域抽出され
る。
【0079】このような本方式では色情報の他に画素の
位相情報、すなわち各画素の幾何学的関係を使っている
ので、従来の単に色の統計的な情報だけに基づいて代表
色を決めたり色分離する方式よりも、高精度な代表色決
定や色分離が可能となる。
【0080】ある特定の色を分離抽出する為に、画像の
色情報と画像内で表現されているもの、すなわち図形、
直線、曲線、文字などの形状情報の両者を用いる事は有
効である。図13(a)(b)はその例を示したもので
ある。131は青い直線の途中が青緑に変性しているも
のである。これから単純に青色を分離すると132に示
すように直線はかすれてしまう。また、であるからと言
って青緑の部分も青と見倣してしまうと、例えば、13
3に示すように青い直線に青緑のゴミが付着している様
なケースでは134に示す様なゴミの付着したままのイ
メージが色分離されてしまう。
【0081】そこで、本発明では、まず青い部分につい
て形状分析を行ない、PとRの部分が直線である事を認
識し、次いでかすれ部分とみなされるQの部分をしら
べ、P、Q、Rの色が近い事、またP、Q、R全体で直
線とみなされる形状を持っている事を条件として、P、
Q、R全部を青色エリアとみなして色分離する。この様
にすれば133に示す様なケースでもゴミのエリアAが
誤って青色に色分離される事はなくなる。
【0082】図14は、青い線と赤い線がオーバーラッ
プしている様子を示している。A1、C、A2は青い
線、B1、C、B2は赤い線である。Cはオーバーラッ
プエリアで紫色をしている。
【0083】この場合、通常の方法で赤を抜き出しても
青を抜き出してもCを抜き出す事はできない。また、赤
を抜き出す時に常に紫を抜き出す様にすると真に紫色を
している部分で抜いてはいけない所まで抜いてしまう事
があり、不都合である。そこで例えば青を抜くケースで
は、まず、青に接触しているエリアを観察し、そこに当
該青色とは別の色の混色である可能性のある色が存在し
ている時、さらにその混色エリアの近傍を調べて該混色
をなすもう一方の色が存在するエリアがある時には、そ
の混色エリアも青のエリアとして抜き出すこととする。
この時、この青のエリアA1、A2の形状が直線を表し
ておりまた、混色をなすもう一方の色であるB1、B2
のエリアも直線を表しており、Cのエリアもそれらの直
線に矛盾しない事をチェックする様にすれば、より一層
精度の高い色分離が可能となる。
【0084】この場合の形状チェックは直線だけでな
く、曲線や、図形、文字形状ないし文字である確からし
さ、などのチェックによっても良い。
【0085】図15は別の例である。エリアCが赤みが
かった黒であれば上記とほぼ同様な処理で色分離ができ
るが、赤と黒の混色が黒であるとすればxとz、yとw
を接続することによって赤の色分離が可能となる。また
B2エリアが存在しない時でもxとzを接続する曲線を
エリアB1の形状から推定する事により、赤の色分離が
可能となる。
【0086】線幅情報と色情報の両者を使う事によって
色分離を行なう方法は効果的である。この場合書式情報
に色分離にかんする指定を記載するとすれば、色分離す
べきものの色に関する情報に付加して線幅のしきい値
や、ハッチングの場合には線のピッチなどの情報を設定
する。
【0087】図16は帳票上に観測される線161上の
ある部分に設定された円領域162を示すものである。
例えば、その中の黒がその重心位置からN方向に黒がそ
の存在を調べて、その黒画素の連続する長さが最小にな
る方向の長さを持って線幅と見做す方式が知られてい
る。また別の手段としては、縦横の黒画素ののランレン
グスから線幅の推定値を求める方法も考えられる。いず
れにしても、このようにして部分的な線幅情報を得る方
法は公知である。
【0088】これにより、その部分が特定の色をしてい
るのか、または特定の色でないかという事実と、その部
分に決められた線幅以下の部分であるかどうかという事
実の両者を使うことによって効果的な色分離を行うこと
ができる。
【0089】上記の手法で、例えば帳票上で図17のよ
うなハッチングが施された領域から、同一色で線幅の広
い文字部分171を抜き出すことができる。また、この
時、仮に線幅が狭くても、色の違う部分は例えば、17
2の様な部分はハッチング部分を消去した後でも分離し
て残す事ができる。
【0090】ところで、具体的な色分離の指定方法には
次に示すものが主要なものである。特定の色を分離する
場合、特定の色以外を分離する場合、無彩色を分離する
場合、有彩色を分離する場合、白を分離する場合、黒を
分離する場合、またはそれらの組合せである。
【0091】特定の色の分離する場合は、色相(H)の
値を主に基準として判別する。無彩色、有彩色の分離の
場合は、彩度(S)の値を主に基準として判別する。白
や黒を分離する場合は彩度(S)の値が小さいものの中
から明度(V)の大小で判定を行なう。
【0092】色分離した後の結果から、帳票の中でバッ
クグラウンドカラーである可能性のもっとも高いもの、
例えば、もっとも支配的な代表色を選ぶ事ができる。す
なわち、各代表色の中で総面積の最大の色を選ぶのであ
る。この結果を認識結果に付加して出力する事は有用で
ある。すなわち自動的に推定されたバックグラウンドカ
ラーを認識結果に付加して出力するのである。
【0093】また、認識された帳票のフォーム部分の色
や、帳票上の特定部分の色を出力する事も有用である。
【0094】また、認識結果として得られる文字コード
にその文字の帳票上での色やその文字の記載された位置
のバックグラウンドの色や、その文字を囲む文字枠の色
などを付加して出力することも有用である。
【0095】また、フォーム部分の色情報は罫線情報な
どと共に帳票判別に用いる事も可能である。
【0096】これら抽出された色情報に基づいて、オペ
レータにアラームを出したり、その旨を表示する様にも
構成できる。また、その色情報に基づいて修正画面表示
を変える様にも構成できる。
【0097】帳票上の各部分領域ごとに色分離手段を変
えることは非常に重要な手段である。
【0098】まず、あらかじめ書式情報には部分領域の
定義とそのエリア内で通常の2値化処理を行うか、また
は色分離処理を行うかが記載されている。実際の処理が
行われる時点で、例えば図18に示す帳票が入力された
とする。この帳票において、認識すべきエリアは181
で、画像のみを取り出して、その画像データをそのまま
出力すべきエリアが182である。書式情報にはそのよ
うに記載されているとする。この場合エリア181で
は、文字枠を示すプレプリントの部分を取り除いて文字
を認識する必要がある。一方、エリア182では文字枠
や項目名などのプレプリント部分は消去してはいけない
ので、それらの色は取り除かれない。もし、この場合に
それらを一様に色分離してしまうと不都合を生じる。
【0099】この場合の具体的な処理は次の様にして行
なわれる。エリア181に関しては書式情報に基づきカ
ラーデータで画像を入力する。一方、182に関しては
2値で画像を入力する。また182に関しては入力され
たカラーデータに対してRGBの平均値を計算してモノ
クロ画像を得、それを2値か処理して2値画像を得るよ
うにしてもよい。次に、書式情報に基づきエリア181
では文字枠の色を分離して消去する。そしてこれに対し
て文字認識が実行される。182についてはそのまま画
像データが出力される。
【0100】こうすることによって、処理時間のかかる
色分離作業を帳票上の一部分だけに限定することができ
る。通常の2値か処理は短時間で実行できるので、色分
離作業を一部分に限定することにより、全体的な処理時
間の向上を図ることができる。
【0101】上記の例は、色分離するかどうかを部分領
域ごとに変える方式であるが、色分離手段を複数の方式
から選択する方式も可能である。
【0102】例えば、エリア182の印鑑部の領域に於
いては、赤または橙の色分離を行うように設定された色
分離プロセスを起動し、またエリア181においては黒
色を分離するようなプロセスを起動するように書式情報
を登録することによって文字認識と印鑑抽出を高速に行
うことができる。こうすれば、すべての領域についてす
べての代表色を色分離するというような、従来の方式、
例えば特開平3−14077号公報などの方式に比べ
て、高速に処理を行うことができる。
【0103】本発明では、これらの指定に附属して、そ
の領域における文字の切り出し手段、文字認識手段、文
字認識後処理手段などを複数の方式の中から特定のもの
を選択できるような指定を行なえる様にしても良い。
【0104】帳票の特定部分において特定の色を色分離
し、その部分にその色が存在するかどうかを判定し、存
在すればその色の対象物を認識し、その認識結果を出力
する機構は便利である。当該色の認識対象物が無いと判
断された時は、その旨出力する。またこの時、その部分
に記載された対象物の色を出力するように構成しても良
い。もちろん、この時に認識対象物を認識することな
く、これらの判定結果や色情報のみを出力するように構
成しても良い。
【0105】この時、印鑑判定部を本装置に組込むこと
により当該部分に印鑑が存在するかどうかや、その印鑑
がどの種類のものであるかを判定し、その結果を認識結
果として出力する事ができる。たとえば、印鑑がない時
や、所定の印鑑が押されていない時にそれを自動的にオ
ペレータに知らせたり、警告するようにシステムを構成
できる。すなわち、これら抽出された印鑑情報に基づい
て、オペレータにアラームを出したり、その旨を表示す
る様にも構成できる。また、その印鑑情報に基づいて修
正画面表示を変える様にも構成できる。
【0106】印鑑判定部は例えば、特定の色、例えば赤
で色分離した画像から、当該色の対象部分が存在してい
る事、またその部分の外側の輪郭形状がたとえば丸や楕
円である事、また内部形状がある程度複雑である事実等
から判定できる。
【0107】また、印鑑の形状の類似性の判定は、パタ
ーン認識等で良く用いられているパターンマッチング処
理などにより行なう事ができる。
【0108】帳票の色分離を行なう事によって得られる
結果や、さらにそれらに何らかの処理を施した結果を画
面に表示し、オペレータの確認を待って次の処理に進む
様にも構成できる。この場合、オペレータが処理結果に
不満であれば、処理結果を直接修正できる様な機構を設
けても良いし、また何らかのパラメータを変更してもう
一度当該処理をやり直しさせられる様にも構成して良
い。
【0109】また色分離時に判定困難な色が発見された
時に、それを必要な場合にはその周囲の状態と共に表示
して、オペレータに正解入力を促す様にも構成できる。
以降、この正解データに基づいて色分離処理を行なうよ
うにも構成できる。
【0110】まず、記入欄に対応する部分に第1の特定
色、例えば黒に色分離される部分があり、それらが文字
列として認識されれば、それを認識結果として出力す
る。同様に、必要であれば第Nの特定色まで同様の処理
を繰り返しても良い。これらに関してはこの特定色が帳
票のフォーム色と同一でなければ、色分離された画像デ
ータの中では、文字枠や記入欄は消去されていると見倣
され、文字認識には「枠なし文字認識方式」が適用され
る。また逆にこれらが同一であるときは「枠あり文字認
識方式」が適用される。記入欄のどこにも何も存在しな
いと見倣された時には空白を出力する。
【0111】またこれとは別に次の様にもできる。帳票
のフォームの色と同一色でない色として分離された部分
がその記入欄に存在して、それらが文字列として認識さ
れれば、それらを出力する。この場合には文字枠や記入
欄は消去されていると見倣されて、文字認識に「枠なし
文字認識方式」が適用される。そしてその記入欄で、フ
ォームと同一色の存在範囲が小さければ、記入欄の文字
はフォームと同一色で記載されていると見倣されて、文
字認識には「枠あり文字認識方式」が適用される。記入
欄のどこにも何も存在しないと見倣された時は空白を出
力する。これらの処理はどちらが先に行なわれても良
い。
【0112】「枠なし文字認識方式」とは、文字枠が存
在しないと仮定して文字の切り出しと文字認識を行なう
もので、さまざまな方式が知られている。
【0113】「枠あり文字認識方式」とは、文字枠が存
在すると仮定して文字の切り出しと文字認識を行なうも
のである。これにはあらかじめ文字枠の位置や形状が書
式情報などから与えられている「既知形状文字枠あり文
字認識方式」と、そうではない「未知形状文字枠あり文
字認識方式」の2種類がある。これらは、それぞれ書式
情報の内容によってどちらかが採用される。
【0114】またいずれの方式においても、「罫線接触
あり文字認識方式」と「罫線接触なし文字認識方式」が
あり、実際のパターンの状態からどちらかの方式が選択
される。
【0115】これらは次に示す手順で実行される。最初
に文字枠推定処理が行なわれ、文字枠位置、またはその
候補が決定される。次に文字部分を推定し、文字と文字
枠の接触の度合を調べる。もし、ここで接触が少ないか
無ければ、「罫線接触なし文字認識」が選択される。も
ちろん、接触か非接触かで方式を分けない様に構成する
ことも可能である。次に、求められた罫線位置情報に基
づきながら文字の切り出しと文字認識を行なって行く。
罫線接触がある場合には、適切な文字と罫線の切り離し
処理が行なわれる。
【0116】これら罫線切り離し技術や、接触文字の切
り離し処理を伴う様な文字の切り出し処理や文字認識処
理については、そうでない場合も含めて従来技術として
知られているものを使う事ができる。
【0117】この様に構成する事によって、常に同一の
方式で文字認識するよりも格段に精度の良い認識系を構
成する事ができる。
【0118】なお、色分離と色ずれ修正を同時に行なう
事ができる。色の偏り補正や色のボケ具合をそろえる補
正処理なども同時に行なえる。例えば黒い部分を分離す
る場合、もし、あらかじめ色ずれ修正パラメータが判明
している時には、RGB各色のシフトと色分離(特定の
色を取り出す作業)を同時に行なえば良い。また、もし
あらかじめ色ずれ修正パラメータが決まっていない時で
も、黒い部分の両側に補色関係の色があれば、それらか
ら色ずれを推定して、その結果に基づいてRGB各色を
シフトしたと見なした上での黒部分を分離すれば良い。
他の色についても同様の処理が可能である。
【0119】次に、画像処理部4での色の表現について
説明する。
【0120】画像処理部4では、色分離することにより
得られた複数の代表色、すなわち微妙な色の違いを無視
して選ばれた色について、または、入力された画像デー
タについてこれらを画像の1ライン毎にランレングスと
して表し、この1ライン分の表現に対してポインターを
作り、このポインター列からなるテーブルを作成して、
このポインター列と該代表色ランレングス表現からなる
データを画像データとして格納する。そして、このよう
な画像表現を入力として、色表現に基づいて画像処理ま
たは文字認識を行う。
【0121】まず、色ランレングス表現の画像からその
中の一部分をもとのビットマップデータに変換して文字
認識や画像処理を行うことができる。色別のランレング
ス表現や色別のポインターになっていないと、一部分の
データを復号化することができず、画像全体を復号化し
なければならなかった。またポインター表現されたテー
ブルと白黒ランレングスデータ表現を組み合わせた形式
の画像表現に対して文字認識を行う方式も知られている
が、このままではカラー画像を扱うことができなかった
(USP4426731)。ある部分のある特定の色部
分をビットマップデータに変換したい場合、その部分に
対応するラインのポインターから色表現されたランレン
グスデータを参照して特定の色に関するものだけでビッ
トマップを変換するか、またはその部分の特定の色のポ
インターだけを参照してそのポインターが指し示すラン
レングスデータからビットマップデータを得るようにす
れば、高速に特定部分の特定色のみを抽出することがで
きて、それに基づいて文字認識や画像処理を行うことが
できる。これにより全画面を復号化して前記処理を行う
よりもはるかに高速な処理が可能になる。また、復号化
せずに直接ランレングス表現に対して処理を行うように
すれば一層高速な処理が可能になる。
【0122】帳票に現れる代表色について、それらはあ
らかじめ書式情報に記載されていて、それに基づいて抽
出されたり、そうでなくて自動的に抽出されたりする
が、それら代表色に基づいて画像を次の様に表現する。
【0123】この場合、代表色を表すコードCと、その
色が連続する長さ、またはそれを符合化したものをLと
すると、それらの組CLを求め、これらの連続によって
1行分の画像を表現する。図19は、コード化の一例を
示している。これはランレングス表現のカラー化であ
る。
【0124】また、各代表色ごとにランレングス符合化
する方法も使用できる。この場合、図20(a)の20
0に示すように1ラインごとに各代表色のランレングス
表現をまとめておく表現方法と図20(b)の201に
示すように全画面分のランレングス表現をまとめておく
表現方法があり、また、各ラインのランレングス表現の
先頭を指すポインターの設定方法にも、図20(c)の
202に示すように1ラインごとに各代表色のポインタ
ーをまとめておく方法と図20(d)の203に示すよ
うに各代表色の全画面分のポインターをまとめておく方
法がある。
【0125】また、RGB各色を量子化して、各RGB
ごとに同様のランレングスコーディングする事もでき
る。これらのコード化は隣あう画素間の少しの色の違い
をノイズと見なして無視する事によって、それらを代表
色や量子化濃度で近似する事により実現される。
【0126】ランレングス表現の画像に対して直接、画
像処理を施す例は、例えば特開昭62−246138号
公報、特開昭62−307615号公報などに開示され
ている。これらはすべて白黒ランレングスデータに対す
る画像処理方式であるが、これを各色のランレングス表
現に当てはめて実行することができる。また、これらの
画像処理技術に基づいて文字認識を実行することも可能
である。
【0127】例えば、特定領域内の特定色の長い直線を
検出する場合は、その特定領域を指し示すポインターを
参照して該領域を含む部分の特定色の表すンレングスデ
ータを得、そのうち、ランの長さが長くて該部分領域に
含まれるものを得て、隣り合う長いランを統合すること
によって直線を検出することができる。
【0128】別の例として色ランレングス表現の画像に
対して直接、画像処理を行う例を下記に示す。この場合
の画像処理の例は、色ずれ修正処理である。
【0129】これらのコード化された情報に基づいて画
像処理、文字切出し、文字認識を行なう事により、例え
ばRGB画像に対して処理するよりも処理速度を速める
事ができ、また画像を表現するデータ量を圧縮する事が
できる。
【0130】色ランレングスで表現されたデータに対し
て色ずれ修正を行なう事もできる。たとえば画像をRG
Bに分離してラン表現を作っている時(図20(d)の
203)は各行の先頭ランの長さを変更するだけ1画素
単位のシフトは簡単に実現できる。
【0131】1画素単位以下のシフトの場合は次の様な
処理で実現される。まず各ランの境界部分の画素の値を
調べて、その濃度値から各ランの長さを整数から実数に
変換する。境界画素におけるその色の濃度が高いほどラ
ンの長さを長く、低い程短くするように各ランの長さを
変更する。この時、各ランの総合計は変えないようにす
る。
【0132】次に、先頭ランの長さをシフト量に従って
変更する。1行のラン表現が左から右に行なわれている
場合には左シフトの時は先頭ランをその分短くする。右
シフトの時はその分長くする。その後、各ランの総合計
を変えないように各ランの長さを整数化する。これで、
ラン表現上での画像のシフトが実現される。
【0133】たとえば画像を色コード+ランレングス表
現で表している時(図20(b)の201)は、各1行
ラン表現の中で3個または4個のランの連続を調べる。
この連続したランの両はじのランにはさまれたランの色
と長さが色ずれによって生ずる可能性があるかどうか
を、シフト量と量はじのランの色から判断し、色ずれが
原因の場合はそのランを消滅させ、各色のシフトがあっ
たとして変更されるべき両はじのランの長さを変更す
る。または、各ランを例えばRGBに色分解して事実上
図20(d)の203と同様な表現にかえて色ずれシフ
トを行ない、また元の表現(図20(b)の201)に
戻す手段も可能である。
【0134】いずれにしても、この様な手段で色ラン表
現の各色を直接原画像に戻す事なくずらす事ができる。
【0135】なお、上述の色分離を2段階に別けて行う
ことにより、処理の高速化を図ることができる。第1段
階で細かな色の違いを余り無視しないようにして色分離
を行い、その結果に基づいて第1の色のランレングス表
現を作り、次にこのランレングス表現のデータに基づい
て第2の色分離を行う。そして必要があれば第2の色分
離の結果に基づいて第2の色ランレングス・データ表現
を作成し、これを画像処理や文字認識処理の入力データ
とする。
【0136】一般に色分離は、処理時間が掛かるので、
第1の色分離に簡単で高速な方式を用いて粗く色分離を
行っておき、これに対して処理時間のかかる第2の色分
離を行って精密な代表色野決定を行うようにすれば、直
接原画像に対して第2の色分離処理を行うよりも高速で
分離処理を行うことができる。
【0137】第2の色分離手段としては、上述した各方
式が考えられ、これらは処理時間を要する色分離手段で
ある。一方、特開平4−160486号公報に示される
ものは、単純で高速なので、第1の色分離に適してい
る。
【0138】RGBの値は、明度(V)、彩度(C)、
色相(H)に変換してこれらの空間の中で色処理した方
が良いし、また色の指定もこれらの値によって行なった
方が便利である。これらの変換はたとえば次の様にして
実現される。
【0139】まず、明度(V)はRGBの濃度値の平均
値として定義できる。次に彩度(C)は最小の濃度値に
基づいて定義できる。すなわち、最小の濃度が0に近い
ほど彩度は高い値をとる。なぜなら、この場合は濃度値
の高い色と濃度値の低い色の濃度値の差が大きいので鮮
やかな色が得られるからである。色相(H)を定義する
ためには、まずRGBの各色に対応する数値を定める。
例えばRを0、Gを128、Bを192とし、BからR
へ至る色の変化を表すときは、Rを256として扱う。
次に最大の濃度値の色を示す数値と次の濃度値の色を表
す数値の間の数値をそれらの濃度値の比で求めそれを入
力色の数値すなわち色相とする。
【0140】具体的には次の手順で求めることができ
る。r、g、bをそれぞれRGBの濃度値、h、s、v
をそれぞれHSVの値として、変換の手順をC言語で記
述すると、下記のようになる。
【0141】 v=r+g+b; if(v=0){c=0;h=0;} else { r=(r*255)/v; g=(g*255)/v; b=(b*255)/v; if(r>g) { if(g>b) {/*r>g>b*/s= 255−b*3;h= ((g−b)*129)/(r+g−2*b); } else if(b>r) {/*b>r>g*/s= 255−b*3;h= ((r−g)*65 )/(b+r−2*b)+192;} else {/*r>=b>g*/s= 255−g*3;h= ((r−g)*65)/(r+b−2*b)+192;} } else { if(r>b) {/*g>=r>b*/s= 255−b*3;h= ((g−b)*129)/(g+r−2*b); } else if(b>g) {/*b>g>=r*/s= 255−r*3;h= ((b−r)*65)/(b+g−2*r)+128;} else if((g>b)‖(b>r)) {/*g>=b>=r*/s= 255−r*3;h = ((b−r)*65)/(g+b−2*b)+128;} else {/*g=b=r*/s=0;h=0;} } } if(h>255)h=0; if(s>=128)s=(s−128)/4+224; else s=(s*224)/128; v=v/3; ) このような変換は、上記に限られるものではないが、こ
れらの値をテーブルルックアップによって求める様にし
ても良い。すなわちRGBの値を量子化し、各色をN
R、NG、NBビットで表現し、アドレス空間がNR+
NG+NBビットのテーブルを用意して、このテーブル
内のRGBの値に対応するアドレスにそのRGBが表す
色に対応するHSVの値を格納するようにすれば良い。
また画像入力部1からの入力画像の色表現がHSVであ
っても良い。
【0142】また、これらの変換を色の偏り補正と同時
に行なっても良いし、これらの変換を色ずれ修正と同時
に行なっても良い。
【0143】ところで、画像の表現には3種類あり、こ
れらは各画素が色情報を保持している場合(C)、濃淡
情報を保持している場合(G)、2値化されている場合
(B)である。
【0144】前者はより高度な認識処理に向いている
が、後者は高速処理に向いている。高度な認識処理を必
要としない部分にカラーデータを割り当てる事や高度な
認識処理を必要とする部分に2値データを割り当てる事
はシステムパフォーマンスを向上させる観点からは望ま
しくない。そこで、帳票上の各部分ごとにデータ表現形
式を指定する機構を導入する事は重要である。具体的に
は書式情報などに領域指定とその領域における画像表現
形式を記載できるようにする。
【0145】画像入力部1が前記CGBのいずれの画像
を出力するのかは、1種類に限定されている訳ではな
い。そこで、本発明装置では(C)に対応して文字認識
する機構、(G)に対応して文字認識する機構、(B)
に対応して文字認識する機構のうち少なくとも複数の機
構を備えていて、入力画像の種類に応じて処理を行なう
様にする。
【0146】図21は、上述の手段を具体化するための
構成で、画像入力部211からの出力をそれぞれカラー
画像バッファ212、グレイ画像バッファ213、2値
画像バッファ214に各別に取り込み、それぞれについ
て認識部215〜217において文字認識を行い、これ
らの認識結果を読取り結果修正部218を介して出力す
るようになる。
【0147】読み取り対象帳票によって、それぞれCG
Bのいずれで画像入力したら良いかがあるので、書式情
報等には入力すべき画像の画像表現に関する指定ができ
るようになっていると便利である。この書式情報の画像
表現に関する指定に従って画像入力装置に指定の画像表
現の出力をリクエストする。画像入力部1はそれに応じ
た画像を送ってくるので、本装置はそれに対応する処理
を行なう。
【0148】しかし、画像入力部1がリクエストに応じ
られない場合や、本装置からリクエストしない場合に
は、あらかじめ分かっている画像表現のデータが送られ
て来る訳ではないので、この場合には画像データに付随
しているか、あらかじめ設定されている画像表現データ
の種類に応じて認識処理などを行なう様にする。
【0149】また画像入力の対象が画像ファイル、すな
わち、磁気ディスクなどに蓄えられたデータの時には、
そのファイルにはデータの画像表現形式を判定できるデ
ータが付加されており、それが、画像データと共に本装
置に入力される。FAXなどの通信回線を通して送られ
る画像データについても同様であることは前にも述べ
た。
【0150】本機能は文字認識を行なうシステムと複数
の端末と複数の画像入力装置をネットワークで接続した
ようなシステム構成の時に有効である。何故なら、ネッ
トワークに接続された画像入力部1には各種のものが存
在する可能性があり、それらに自由に対応できるからで
ある。
【0151】次に、このようにして色表現された画像
(C)、濃淡表現された画像(G)に対する文字認識処
理について述べる。
【0152】まず、CまたはGの画像を2値化して、そ
の2値画像を認識対象とする。文字の検出切出しや文字
認識の際にかすれや潰れ、輪郭乱れなどの疑いのある場
所が発生した時に、CまたはGの画像の当該部分に対応
する部分を調べる。従って、本装置では、2値化の後も
CまたはG画像が保持されている。
【0153】図22はブロック図である。この場合、入
力されたカラー画像はそのままかあるいは色分離されて
カラー情報としてカラー画像バッファ221に蓄えられ
る。この時、そのままのカラー情報と、色分離後のカラ
ー情報を別々のバッファに格納してもよい。次に、カラ
ー情報からグレイ画像が例えばRGBの濃度値の平均値
を計算するなどして得、グレイ画像バッファ222に格
納する。入力画像がグレイの時は、それは直接このバッ
ファに入力されてカラー画像バッファは省略される。次
にグレイ画像に対して2値化処理を施すことによって2
値画像を生成し、2値画像バッファ223に格納する。
次に2値画像バッファ223のデータから1文字分の画
像データを取り出し、これに対して文字切出し部224
で文字切り出しを行い、文字認識部225で文字認識を
行う。例えば図23(a)(b)(c)に示すようにA
やBのパターンが辞書パターンとして記憶されているも
のだとして、これらと入力パターンのXのマッチングが
取られる。例えば、テンプレートマッチングのような手
法によってマッチングする。その結果、AとBのマッチ
ング程度が同じくらいでどちらか判定がつかなかったと
すると、この時辞書パターンAとBの組には、詳細認識
判定プロセスが付属しており、このような判定不能時に
起動されるものとする。この詳細認識判定プロセスで
は、入力パターンの特定部分について調べるような指定
がしてある。この場合、入力パターンのYの領域部分に
ついて穴が開いているかどうか調べるという指定があ
る。そこで、この領域に対応するグレー画像バッファ2
22を参照してそこの濃度値を調査する。その濃度値が
周囲の濃度よりもバックグラウンドの濃度値に近けれ
ば、穴が開いていると判断して入力文字は「8」と判定
される。その逆の時は「9」と判定される。
【0154】グレー画像の変わりにカラー画像バッファ
221を参照するときも同様である。文字切出し部22
4においても同様にグレー画像バッファ222やカラー
画像バッファ221を参照することがもきる。
【0155】例えば、図24は2個の文字が接触してい
る例である。この画像を縦方向に射影成分、すなわち黒
画素数を計算すると、同図のAのようになる。この射影
成分分析から、例えばこの射影成分の最小点、この場合
はBとCを文字の切り出し候補点とする。そこで、これ
らの切り出し候補点に基づいて切断箇所を求め、bと
c,そこの部分に対応するグレー画像またはカラー画像
の該当箇所を参照する。その結果、その部分が、バック
グラウンドの色に近いか、または濃度値に近いと判定さ
れたときには、その部分の切り出し候補の優先順位を上
げることができる。bとcの場合、射影成分の値からは
bの方が切り出し点としての優先順位が高いと判定され
ているので、cの部分の濃度値やバックグラウンドに近
いことが判明すれば、cの部分を正しい切り出し点とし
て優先順位を上げることができ、結果として誤読を防ぐ
ことができる。
【0156】勿論、切り出し方式は、前記方式に限定さ
れるものでない。この他に輪郭情報や切り出したときの
文字の幅やそのほかの特徴を使ったり、それらを併用し
てもよいことはいうまでもない。
【0157】以上の考え方を一般的に述べると、認識プ
ロセスから決められる再チェックが必要な場所が決めら
れたときに、後段の処理をフィードバックする事によ
り、その場所におけるパターンの色や濃淡データを参照
しする事によって、かすれ、潰れ、輪郭乱れなどを修正
し、線分抽出、レイアウト理解、フォーム理解、検出切
出し、文字認識等を行なう。
【0158】次に、文字認識における2重線取消処理に
ついて述べる。
【0159】入力画像は色分離され、印鑑の色に相当す
る部分の記入文字の色に分けられる。そして、記入色の
画像データに対して文字認識が行われる。この時、文字
記載部分に、長い横線が2本、また1本発見された時
は、取り消し部分と判定される。長い横線は、例えば長
い横線ラインを見付け出すなどして検出することができ
る。その長さが十分でない時には、それらが1文字かま
たは接触文字である可能性も合わせて調べるように構成
する。そのような文字切り出しや文字認識が失敗すれば
それは取り消しである可能性が高くなる。この結果か
ら、取り消しであると判断されて、近傍に訂正文字があ
ればそれは訂正文字として認識され、当然そのときは、
該取り消し部分が真に取り消されている可能性が高いと
判断される。
【0160】次に、この取り消し部分の位置に対応する
印鑑色の画像データの一部分を取り出して、その部分に
十分な印鑑色が存在するかどうかを調べる。もし存在し
なければ装置を使用しているオペレータに警告を発生す
るようにする。また、その警告をフラグとして、または
存在有無などを文字認識結果に付随して出力するように
する。
【0161】印鑑の判定については、印鑑判定部を有
し、取り消し部分に印鑑が存在するかどうかを印鑑色の
画像データの形状から判定するようにしても良い。ま
た、印鑑の形状の類似性を判定できる印鑑判定部を導入
することにより、どの種類の印鑑が発見されたかを認識
結果に付随して出力することもできる。
【0162】通常、印鑑の色と記入色は異なるので色分
離により印鑑の色部分のみを取り出して、印鑑判定を行
なえば精度の良い判定ができる。記入部分と印鑑の重な
り部分も上述の色分離で説明した方法や、また記入部分
に印鑑が押されている可能性があるとして印鑑の判定や
照合を行なう様に構成して良い。
【0163】また、文字認識における文字種を同定する
場合について述べる。
【0164】この場合、文字線が太いことなどは、文字
がプレプリントされたものである事を示しており、その
様な証拠が多く発見された時はプレプリント用の文字切
り出し、文字認識手段を適用する。または、それを優先
的に適用するようになる。
【0165】最後に、修正画面の構成について述べる。
【0166】入力された画像データから、例えば色分離
処理によって帳票のフォーム・イメージを取り出す。フ
ォーム・イメージは、色のみから分離されても良いが、
罫線抽出処理を特定の色に対して行うようにして抽出し
ても良い。フォーム・イメージは、ビットパターンで取
り出されても良いし、また、ヘクトルデータすなわち始
点座標と終点座標の組からなる線分データの組み合わせ
として表現されていても良い。
【0167】次に、帳票上の文字を色分離した画像デー
タなどから認識する。この時認識した文字の存在位置や
大きさなどの情報を記憶しておく。
【0168】ここで色分析により得られた帳票のフォー
ム・イメージの色に類似している色によってフォーム・
イメージを表示する。その時に、認識結果の文字をその
文字が存在していた位置に重ねて表示する。この時、記
入色に対応する色で文字を表示しても良い。
【0169】前記で類似している色とは、予め決められ
た対応関係によって対応する色であっても良いし、計算
によって求められる近い色であっても良い。
【0170】これらの表示の全体や一部は、現画像表示
の全体や一部に隣接して、それらの位置関係が対応付く
ように表示しても良い。
【0171】なお、図1に示す実施例では、外部より与
えられる画像データを入力画像としてそのまま処理する
場合を述べたが、送信されてくる画像データや記憶装置
に蓄えられている画像データを入力画像とすることもで
きる。
【0172】この場合、画像データのみを送信や蓄積す
ると、該画像を処理する側で色補正を行う手掛かりを得
られないという不都合が生じる。
【0173】図25は、通信システムに適用した例を示
すもので、送信部251に画像入力部2511、修正パ
ラメータ付加部2512、通信回線出力部2513を有
し、受信部252に通信回線入力部2521、修正パラ
メータ解釈部2522、色修正部2523、文字認識部
/画像処理部2524を有している。
【0174】そして、スキャナから読み込まれる画像は
例えばRGB3色の多値表現カラー画像データとして画
像入力部2511から入力される。すると、修正パラメ
ータ付加部2512によりスキャナの形式、通し番号を
表すコード、入力装置名、ID番号、機種などや色ずれ
修正に必要な修正パラメータ、または色ずれ修正済みか
どうかのフラグなど、色ずれ修正プロセスを特定できる
データが、入力した画像に属性データとして付与され
て、通信回線出力部2513より通信回線253を通じ
て文字認識機能を有する受信部252に送られる。
【0175】受信部252では、通信回線入力部252
1よりデータを受け取ると、修正パラメータ解釈部25
22により属性データがスキャナの型式や通し番号を表
すものであるときは、本装置に予め登録してある型式や
通し番号と色ずれ修正パラメータの対応表を参照して色
ずれ修正パラメータを解釈する。この時、対応表に修正
パラメータがないときには、エラー処理とするか、また
は自動的に色ずれ修正パラメータを得るプロセスを用い
て色ずれ修正パラメータを採用する。
【0176】受信したデータに直接、修正パラメータが
付属している場合は、この修正パラメータを用いる。も
し、受信データに修正パラメータを特定できる属性デー
タが付属していないときは、エラー処理とするか、また
は自動的に自動的に色ずれ修正パラメータを得るプロセ
スを用いて色ずれ修正パラメータを得る。
【0177】属性データが色ずれ修正ずみかどうかを表
すフラグを有していて、それが色ずれを表していれば、
色ずれ修正は行わない。
【0178】このようにして色ずれ修正されたデータは
文字認識部/画像処理部2524に送られ処理される。
【0179】なお、システムが画像蓄積装置を有してい
る場合は、前記した色ずれ修正を特定するための属性デ
ータを入力した画像データに付属させて蓄積し、その後
に蓄積されたデータを読み出して上述と同様な処理を行
うようになる。
【0180】この場合、本装置では、色ずれ修正だけで
なく、各色のボケ程度を揃える修正や、色の偏り補正な
どについても同様な処理を行うことができる。
【0181】その他、本発明は上記実施例に限定される
ものでは無い。要するに本発明はその要旨を逸脱しない
範囲で種々変形して用いる事ができる。
【0182】
【発明の効果】本発明によれば、帳票色や記入色、帳票
フォーム部分や文字部分の印刷方法、文字記入方法等に
対する制限を緩く運用した時や、乱雑に記入文字を記入
欄に記載した時などでも、高精度で文字を認識する事が
できる。
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成を示す図。
【図2】黒い部分が色ずれした時のRGB信号の様子を
示す図。
【図3】一般に色ずれがあった時のRGB信号の様子を
示す図。
【図4】色ずれ検出用マークを示す図。
【図5】RGB信号の変化点を合わせる事により色ずれ
修正を行なう方法を説明する図。
【図6】色のボケ方が一様でない時のRGB信号の様子
を示す図。
【図7】グレイ画像の濃度値の頻度分布を示す図。
【図8】数字「5」に直線が貫通している例を示す図。
【図9】図8の例の色分離を説明する示す図。
【図10】図8の例の色分離を説明する示す図。
【図11】図8の例の色分離を説明する示す図。
【図12】直線の近くにノイズが存在する例を示す図。
【図13】直線の一部が若干変色している例と、直線に
その色に近い色のノイズが付着している例を示す図。
【図14】異なる色の線分が交わっている状態を示す
図。
【図15】黒い線分と何らかの色を持った線分が交わっ
ている状態を示す図。
【図16】直線の部分的太さを検出する例を示す図。
【図17】文字とハッチング部分を分離する手法を示す
図。
【図18】色分離処理を一部分のみに限定して行なう処
理を説明する図。
【図19】色を表現できるランレングス表現方法を説明
する図。
【図20】色を表現できるランレングス・データのフォ
ーマット定義の方法を説明する図。
【図21】入力画像の種類に応じて処理を行う例を示す
図。
【図22】かすれ、潰れ、輪郭乱れなどが生じた場合の
処理例を示す図。
【図23】文字の一部分がループなのかどうか疑わしい
ケースを説明する図。
【図24】2個の文字が接触している例を示す図。
【図25】通信システムに適用した例を示す図。
【符号の説明】
1…画像入力部、2…色分離部、3…バッファ、31、
32、3n…色画像バッファ、4…画像処理部、5…文
字切り出し部、6…文字認識部、7…読み取り結果修正
部。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力画像データの各部分を構成する画素
    の幾何学的な情報と、これら各部分およびバックグラウ
    ンドの色情報を併用して入力画像データの色分離を決定
    することを特徴とする画像処理装置。
  2. 【請求項2】 予め書式情報に部分領域の定義と該領域
    毎に実行される色分離に関する情報を用意し、これら情
    報に基づいて所定の領域での色分離を実行することを特
    徴とする画像処理装置。
  3. 【請求項3】 帳票の入力画像データについて特定色を
    分離し、この分離された特定の色に対応する認識処理方
    式を書式情報から選択し、該選択された認識処理を実行
    することを特徴とする文字認識装置。
  4. 【請求項4】 画像データから抽出される複数の代表色
    をランレングス表現し、これらランレングス表現データ
    を指し示すポインターにより構成されるポインタ・テー
    ブルを生成し、該ポインタ・テーブルのポインターによ
    り特定のデータ部分を参照可能にしたことを特徴とする
    画像処理装置。
  5. 【請求項5】 画像の色表現形式である色情報、濃淡情
    報、2値情報に対応して各処理ユニットを用意し、入力
    された画像の色表現形式に応じた処理ユニットを使用す
    ることを特徴とする画像処理装置。
  6. 【請求項6】 入力画像がそのままあるいは色分離され
    て蓄積されるカラー画像バッファ、カラー画像から得ら
    れるか、直接入力されるグレー画像を格納するグレイ画
    像バッファの少なくとも一方を有し、且つグレー画像ま
    たはカラー画像から生成される2値画像を格納する2値
    画像バッファを有し、2値画像を対象とした処理におい
    て、入力画像の特定部分を再チェックする場合に、前記
    カラー画像バッファおよびグレイ画像バッファの少なく
    とも一方の前記特定部分の対応部分を参照可能にしたこ
    とを特徴とする画像処理装置。
  7. 【請求項7】 入力画像データが色分離され、印鑑の色
    に相当する部分と記入文字の色部分に分けられ、該記入
    色の画像データに対して文字認識または取り消し判定が
    行われ該取り消し部分と判定されると、この取り消し部
    分の位置に対応する印鑑色の画像データの位置部分を取
    り出して、その部分に印鑑色が存在するか調べるととも
    に、その存在の有無を出力する2重線取消し処理機能を
    有する文字認識装置。
  8. 【請求項8】 入力された画像データから帳票のフォー
    ム・イメージを取り出し、該帳票上の文字を認識すると
    ともに、少なくともその文字の存在位置を記憶し、帳票
    のフォーム・イメージの色に類似する色によってフォー
    ム・イメージを画像表示するときに、前記認識された文
    字をその文字が存在していた位置に重ねて表示すること
    を特徴とする文字認識装置。
  9. 【請求項9】 入力画像データに対し修正に必要な修正
    パラメータを属性データとして付与しておき、その後前
    記属性データに基づいて修正パラメータを再現し該修正
    パラメータにより画像データを修正して該修正画像デー
    タについて画像処理を実行することを特徴とする画像処
    理装置。
JP07425093A 1993-03-31 1993-03-31 画像処理装置 Expired - Fee Related JP3258122B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP07425093A JP3258122B2 (ja) 1993-03-31 1993-03-31 画像処理装置
DE69430685T DE69430685T2 (de) 1993-03-31 1994-03-31 Zur Erkennung farbiger Zeichen geeignetes Bildverarbeitungssystem
EP94105154A EP0618545B1 (en) 1993-03-31 1994-03-31 Image processing system suitable for colored character recognition
US08/594,372 US6035059A (en) 1993-03-31 1996-01-30 Image processing system suitable for colored character recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07425093A JP3258122B2 (ja) 1993-03-31 1993-03-31 画像処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2001331572A Division JP3615179B2 (ja) 2001-10-29 2001-10-29 文字認識装置及び文字認識方法

Publications (2)

Publication Number Publication Date
JPH06290302A true JPH06290302A (ja) 1994-10-18
JP3258122B2 JP3258122B2 (ja) 2002-02-18

Family

ID=13541732

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07425093A Expired - Fee Related JP3258122B2 (ja) 1993-03-31 1993-03-31 画像処理装置

Country Status (4)

Country Link
US (1) US6035059A (ja)
EP (1) EP0618545B1 (ja)
JP (1) JP3258122B2 (ja)
DE (1) DE69430685T2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009005005A (ja) * 2007-06-20 2009-01-08 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム

Families Citing this family (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3411472B2 (ja) * 1997-05-30 2003-06-03 富士通株式会社 パターン抽出装置
JP3092576B2 (ja) * 1998-01-22 2000-09-25 日本電気株式会社 文字認識装置
US6975425B1 (en) * 1998-02-26 2005-12-13 Canon Kabushiki Kaisha Information processing apparatus and information processing method
GB9806767D0 (en) * 1998-03-31 1998-05-27 Philips Electronics Nv Pixel colour valve encoding and decoding
US6295371B1 (en) * 1998-10-22 2001-09-25 Xerox Corporation Method and apparatus for image processing employing image segmentation using tokenization
US6381363B1 (en) * 1999-03-15 2002-04-30 Grass Valley (U.S.), Inc. Histogram-based segmentation of images and video via color moments
JP4127594B2 (ja) * 2000-03-23 2008-07-30 理想科学工業株式会社 画像処理方法および装置
US6876765B2 (en) * 2000-03-30 2005-04-05 Ricoh Company, Ltd. Character recognition method and computer-readable storage medium
DE10017081A1 (de) * 2000-04-06 2001-10-11 Cgk Comp Ges Konstanz Mbh Verfahren und Vorrichtung zur automatischen Zeichenerkennung
JP4631133B2 (ja) * 2000-06-09 2011-02-16 コニカミノルタビジネステクノロジーズ株式会社 文字認識処理のための装置、方法及び記録媒体
GB2364417B (en) * 2000-06-30 2004-10-06 Post Office Image processing
GB2364416B (en) 2000-06-30 2004-10-27 Post Office Image processing for clustering related text objects
US6999619B2 (en) * 2000-07-12 2006-02-14 Canon Kabushiki Kaisha Processing for accurate reproduction of symbols and other high-frequency areas in a color image
US7043053B1 (en) * 2000-08-17 2006-05-09 Eastman Kodak Company Matching image characteristics of stamps and personal images to aesthetically fit into a personal postal product
JP3733310B2 (ja) 2000-10-31 2006-01-11 キヤノン株式会社 文書書式識別装置および識別方法
JP4366011B2 (ja) * 2000-12-21 2009-11-18 キヤノン株式会社 文書処理装置及び方法
US6999204B2 (en) * 2001-04-05 2006-02-14 Global 360, Inc. Document processing using color marking
JP2003005931A (ja) * 2001-06-20 2003-01-10 Fuji Xerox Co Ltd 画像処理装置
JP4596219B2 (ja) * 2001-06-25 2010-12-08 ソニー株式会社 画像処理装置および方法、記録媒体、並びにプログラム
DE60109278T2 (de) * 2001-06-26 2006-03-30 Nokia Corp. Verfahren und Gerät zur Lokalisierung von Schriftzeichen in Bildern aus einer Digitalkamera
GB2384640B (en) 2002-01-29 2004-04-14 Simpleware Ltd Image processing method
US7158675B2 (en) * 2002-05-14 2007-01-02 Microsoft Corporation Interfacing with ink
US7020328B2 (en) * 2002-09-04 2006-03-28 Eastman Kodak Company Electronic color dropout utilizing spatial context to enhance accuracy
US7260624B2 (en) * 2002-09-20 2007-08-21 American Megatrends, Inc. Systems and methods for establishing interaction between a local computer and a remote computer
JP4310993B2 (ja) * 2002-10-28 2009-08-12 富士ゼロックス株式会社 画像処理装置
US7262884B2 (en) * 2002-11-22 2007-08-28 Kabushiki Kaisha Toshiba Image processing apparatus and image processing method
JP2004287664A (ja) * 2003-03-20 2004-10-14 Fuji Xerox Co Ltd 課金システムおよびその方法
JP4254285B2 (ja) * 2003-03-20 2009-04-15 富士ゼロックス株式会社 データ処理システムおよびその方法
US7418141B2 (en) * 2003-03-31 2008-08-26 American Megatrends, Inc. Method, apparatus, and computer-readable medium for identifying character coordinates
US20040234104A1 (en) * 2003-05-19 2004-11-25 Quen-Zong Wu Method of automatic container number recognition by color discrimination and reorganization
US20040234105A1 (en) * 2003-05-19 2004-11-25 Quen-Zong Wu Method of automatic vehicle licence plate recognition by color discrimination and reorganization
US7412625B2 (en) * 2003-05-27 2008-08-12 American Megatrends, Inc. Method and system for remote software debugging
US7546584B2 (en) 2003-06-16 2009-06-09 American Megatrends, Inc. Method and system for remote software testing
US7543277B1 (en) 2003-06-27 2009-06-02 American Megatrends, Inc. Method and system for remote software debugging
US7827258B1 (en) * 2004-03-01 2010-11-02 American Megatrends, Inc. Method, system, and apparatus for communicating with a computer management device
JP4603807B2 (ja) * 2004-03-10 2010-12-22 富士通株式会社 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体
EP1605402A2 (en) * 2004-06-10 2005-12-14 Sony Corporation Image processing device and method, recording medium, and program for blur correction
US7519749B1 (en) 2004-08-25 2009-04-14 American Megatrends, Inc. Redirecting input and output for multiple computers
US7570403B2 (en) * 2005-03-16 2009-08-04 Kabushiki Kaisha Toshiba Color image processing apparatus
US7630544B1 (en) * 2005-04-06 2009-12-08 Seiko Epson Corporation System and method for locating a character set in a digital image
JP2007133383A (ja) * 2005-10-12 2007-05-31 Matsushita Electric Ind Co Ltd オンスクリーン信号処理装置、および放送受信装置
US8010843B2 (en) * 2005-12-14 2011-08-30 American Megatrends, Inc. System and method for debugging a target computer using SMBus
US7783799B1 (en) * 2006-08-31 2010-08-24 American Megatrends, Inc. Remotely controllable switch and testing methods using same
US20080098480A1 (en) * 2006-10-20 2008-04-24 Hewlett-Packard Development Company Lp Information association
US20090046938A1 (en) * 2007-08-15 2009-02-19 Lockheed Martin Corporation Character contour correction
WO2009021996A2 (en) * 2007-08-15 2009-02-19 I.R.I.S. S.A. Method for fast up-scaling of color images and method for interpretation of digitally acquired documents
JP4909311B2 (ja) * 2008-03-31 2012-04-04 富士通フロンテック株式会社 文字認識装置
US8325796B2 (en) 2008-09-11 2012-12-04 Google Inc. System and method for video coding using adaptive segmentation
JP2010211466A (ja) * 2009-03-10 2010-09-24 Canon Inc 画像処理装置および画像処理方法及びプログラム
JP5300534B2 (ja) * 2009-03-10 2013-09-25 キヤノン株式会社 画像処理装置および画像処理方法及びプログラム
JP2010232736A (ja) * 2009-03-25 2010-10-14 Fuji Xerox Co Ltd 画像処理装置、画像形成装置およびプログラム
CN101599122B (zh) * 2009-07-02 2013-06-19 阿里巴巴集团控股有限公司 一种图像识别方法及装置
JP5678584B2 (ja) * 2009-12-16 2015-03-04 株式会社リコー 画像処理装置、画像処理方法、およびプログラム
US9020043B2 (en) 2010-05-10 2015-04-28 Google Inc. Pathway indexing in flexible partitioning
JP2012199652A (ja) * 2011-03-18 2012-10-18 Fujitsu Ltd 画像処理装置、方法及びプログラム
US8891627B1 (en) 2011-04-18 2014-11-18 Google Inc. System and method for coding video using color segmentation
JP5270770B2 (ja) * 2012-01-13 2013-08-21 東芝テック株式会社 情報処理装置及びプログラム
GB2515510B (en) 2013-06-25 2019-12-25 Synopsys Inc Image processing method
US9392272B1 (en) 2014-06-02 2016-07-12 Google Inc. Video coding using adaptive source variance based partitioning
US9578324B1 (en) 2014-06-27 2017-02-21 Google Inc. Video coding using statistical-based spatially differentiated partitioning
JP6903966B2 (ja) * 2017-03-16 2021-07-14 富士フイルムビジネスイノベーション株式会社 情報処理装置、情報処理システム及びプログラム
CN108176603A (zh) * 2017-12-25 2018-06-19 江苏宏宝锻造股份有限公司 发动机连杆多代号识别方法及其自动分拣设备

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU456705B2 (en) * 1970-12-09 1975-01-09 Nippon Electric Co. Ltd. Electrooptical device for discriminating predetermined patterns from others
SE448922B (sv) * 1980-10-21 1987-03-23 Ibm Svenska Ab Metod for behandling av videodata vid ett optiskt teckenidentifieringssystem jemte en anordning for teckenidentifiering i en optisk dokumentlesare
JPS61276080A (ja) * 1985-05-31 1986-12-06 Toshiba Corp 上下判定装置
JPH0738681B2 (ja) * 1987-03-20 1995-04-26 富士ゼロックス株式会社 領域認識装置
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
JPH02123488A (ja) * 1988-11-02 1990-05-10 Toshiba Corp 光学的文字読取装置
JP2854307B2 (ja) * 1988-11-16 1999-02-03 富士通株式会社 色識別回路
US5335292A (en) * 1988-12-21 1994-08-02 Recognition International Inc. Document processing system and method
US5003613A (en) * 1988-12-21 1991-03-26 Recognition Equipment Incorporated Document processing system and method
US5140650A (en) * 1989-02-02 1992-08-18 International Business Machines Corporation Computer-implemented method for automatic extraction of data from printed forms
JP3100391B2 (ja) * 1990-08-15 2000-10-16 株式会社リコー カラー画像の領域分離装置
US5579407A (en) * 1992-04-21 1996-11-26 Murez; James D. Optical character classification

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009005005A (ja) * 2007-06-20 2009-01-08 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム

Also Published As

Publication number Publication date
EP0618545A3 (en) 1995-02-22
EP0618545A2 (en) 1994-10-05
DE69430685D1 (de) 2002-07-04
JP3258122B2 (ja) 2002-02-18
US6035059A (en) 2000-03-07
DE69430685T2 (de) 2003-01-02
EP0618545B1 (en) 2002-05-29

Similar Documents

Publication Publication Date Title
JP3258122B2 (ja) 画像処理装置
US6701010B1 (en) Color image processing apparatus and pattern extracting apparatus
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
KR100625755B1 (ko) 문자 인식 장치, 문자 인식 방법, 매체 처리 방법 및 문자 인식 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체
JP2002142128A (ja) 画像処理装置及び記録媒体
US20040179717A1 (en) Printing system, method of inspecting print data, method of classifying print inspection result and program
JP2002077658A (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP3871040B2 (ja) ランレングス符号化された画像データの形式で存在する印刷頁の色境界にトラッピングフレームを発生するための方法
US20230316697A1 (en) Association method, association system, and non-transitory computer-readable storage medium
JP3615179B2 (ja) 文字認識装置及び文字認識方法
JP4127691B2 (ja) 文字認識装置及びその方法
JP2005134601A (ja) 地図画像の解析装置
JP4370950B2 (ja) 画像処理装置
JP4217969B2 (ja) 画像処理装置及びプログラム
JP2006031245A (ja) ディジタル画像の輪郭追跡による画像処理方法並びに画像処理装置
JP3073837B2 (ja) 画像領域分離装置及び画像領域分離方法
JP4182891B2 (ja) 画像処理装置
US9619901B2 (en) Image processing apparatus, image processing method, and non-transitory computer readable medium using an elimination color to determine color processing for a document image
JP4259310B2 (ja) 画像処理装置及びプログラム
JPH01280969A (ja) 画像処理装置
JP2871570B2 (ja) 文字認識装置およびその方法
JPH0916714A (ja) 多色文字画像読取装置
JP4311183B2 (ja) 画像処理装置及びプログラム
JP2005184402A (ja) 画像処理装置
JPH0495173A (ja) 特徴識別装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071207

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081207

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091207

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091207

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101207

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111207

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121207

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees