JPH05217019A

JPH05217019A - ビジネスフォーム識別システム及び画像処理システム

Info

Publication number: JPH05217019A
Application number: JP4203531A
Authority: JP
Inventors: Pizano Aatouroo; ピザノアートウロー; In Tan Mei; インタンメイ; Ganbo Naoto; ガンボナオト
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1991-08-06
Filing date: 1992-07-30
Publication date: 1993-08-27
Also published as: US5293429A

Abstract

(57)【要約】【目的】多様なビジネスフォームの適正なる自動的分
類を可能とすること。【構成】ビジネスフォームが罫線の存在を特徴とする
点に着目し、１つ又はそれ以上のビジネスフォームのテ
ンプレート１２の特徴を保存するための手段１８と、１
つ又はそれ以上の実際のビジネスフォーム２２を走査し
てこれを表す走査データを生成するための手段２４と、
走査したビジネスフォーム２２上の垂直及び水平の線パ
ターンのみを認識する手段を有して前記走査データを認
識するためのパターン認識手段２６と、認識したデータ
を予め保存されたフォームと照合して実際のビジネスフ
ォーム２２の様式の特定を提供するための手段２８と、
前記実際のビジネスフォーム２２を線毎に走査すること
によってこれを表す黒画素データと白画素データを形成
する手段と、隣接する前記黒画素の１つを識別してＸ成
分及びＹ成分を有する接続した要素を認識するための手
段とによりシステム構成した。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、多様なビジネスフォー
ムを自動的に分類するためのビジネスフォーム識別シス
テム及び画像処理システムに関する。

【０００２】

【従来の技術】ビジネスフォームは、通常、データの収
集又は配分に用いられる文書の特殊クラスである。これ
の用途は産業界から官庁まで広汎に渡り、業務を遂行す
る上で必要とされる書類上の作業の極めて大きな部分を
占める。本発明は、このような多様なフォーム様式を同
時に作成する能力を有する画像処理システムの開発の基
盤を提供するフォーム識別機構に関する。

【０００３】文書画像を取込んで管理するためのデジタ
ル機器の使用は、ここ数年で大幅に普及した。これらの
画像の走査、処理、表示、又は保存の能力を有する多様
なシステムが現在では商業的に入手可能となっている。
これらは単純なスキャナと数メガバイトの補助メモリを
備えたスタンドアロン型パーソナルコンピュータから高
速スキャナとギガバイト単位の光記憶装置を備えたワー
クステーションとメインフレームの広域ネットワークま
で範囲が広い。

【０００４】こうした文書画像管理システム（Ｄocumen
t Ｉmage Ｍanagement Ｓystems ＝ＤＩＭＳ）と称する
システムの大半は、均一な文書、例えば取消した小切
手、保険請求、又はクレジットカードの伝票などのバッ
チ処理を行なうように設計されている。

【０００５】

【発明が解決しようとする課題】この方法は今日の大量
の文書操作には充分であるが、新しいアプリケーション
は異種の文書グループを処理しなければならないように
思われる。主要な文書形式が存在しないが、様式の仕分
けを要する郵便室、生産フロア、又は人事部などの部門
を含む組織の全領域にＤＩＭＳの使用が広がる場合、こ
れは特にあてはまると思われる。しかして、本発明は、
多様なビジネスフォームを自動的に分類するための方法
の改良を含むシステムを提供することを目的とする。本
発明によるビジネスフォーム識別システムは、均一なビ
ジネスフォームの流れを自動的に分類するための手段及
びこれに対応する方法を提供するものであり、この能力
は多様式文書処理アプリケーションの開発に必須とな
る。

【０００６】

【課題を解決するための手段】請求項１記載の発明で
は、１つ又はそれ以上のビジネスフォームのテンプレー
トの特徴を保存するための手段と、１つ又はそれ以上の
実際のビジネスフォームを走査してこれを表す走査デー
タを生成するための手段と、走査したビジネスフォーム
上の垂直及び水平の線パターンのみを認識する手段を有
して前記走査データを認識するためのパターン認識手段
と、認識したデータを予め保存されたフォームと照合し
て実際のビジネスフォームの様式の特定を提供するため
の手段と、前記実際のビジネスフォームを線毎に走査す
ることによってこれを表す黒画素データと白画素データ
を形成する手段と、隣接する前記黒画素の１つを識別し
てＸ成分及びＹ成分を有する接続した要素を認識するた
めの手段とによりシステム構成した。

【０００７】これに加えて、請求項２記載の発明では、
接続した要素が長い線分を形成するかを調べるための手
段を含むものとし、これに加えて、請求項３記載の発明
では、２つ又はそれ以上の連続した線分がビジネスフォ
ーム上の同一の線の部分をなしているか調べるための手
段と、前記同一の線の部分をなすと見做された前記線分
を併合するための手段を含むものとし、これに加えて、
請求項４記載の発明では、雑音又は歪曲情報を排除する
ための後処理手段を含むものとし、これに加えて、請求
項５記載の発明では、走査した画像の中で発見された全
ての線の長さを加算してキー値を生成するためのインデ
ックス付き辞書アクセス手段を含むものとし、これに加
えて、請求項６記載の発明では、テンプレート及び実際
のフォームからの線情報を、線と交点のカウント又は線
の長さの和などの単一のスカラー値に縮合して候補リス
トからテンプレートを破棄するようにした集合弁別手段
を含むものとした。さらに、これに加えて、請求項７記
載の発明では、２つ又はそれ以上の線のパターンの間の
空間的類似性を調べるための交点弁別手段を含むものと
し、これに加えて、請求項８記載の発明では、走査した
画像の中の線の配置を測定して、投影情報を前記画像の
所定領域内の線の存在を表現する２進数の値に縮合する
ための類似性弁別手段を含むものとし、これに加えて、
請求項９記載の発明では、線の長さと線間の距離を比較
するための投影弁別手段を含むものとし、これに加え
て、請求項１０記載の発明では、実際のフォーム及びテ
ンプレートのフォーム内の前記線のパターンを分析する
ためのウインドウ照合手段を含むものとし、これに加え
て、請求項１１記載の発明では、実際のビジネスフォー
ムの様式を調べるための決定関数手段を含むものとし
た。

【０００８】また、請求項１記載の発明において、請求
項１２記載の発明では、保存するための手段が階層的方
法でテンプレートの特徴を構成するための手段を含むも
のとし、請求項１３記載の発明では、適合処理の部分的
結果を表示するための手段を含むものとした。

【０００９】請求項１４記載の発明では、これらをより
一般化した多様なビジネスフォームを自動的に識別し、
又は分類するための画像処理システムであって、１つ又
はそれ以上のビジネスフォームのテンプレートの特徴を
保存するための手段と、１つ又はそれ以上の実際のビジ
ネスフォームを走査するための手段と、実際のビジネス
フォームから特徴を抽出するための手段と、保存された
テンプレートの特徴と前記抽出した特徴を逐次的に照合
するための手段とにより構成するが、特徴を抽出するた
めの手段は、前記実際のビジネスフォームを線毎に走査
してこれを表す黒画素データと白画素データを構成する
ための手段と、隣接する前記黒画素の１つを識別して接
続した要素を認識するための手段と、前記接続した要素
が長い線分を形成するか調べるための手段と、２つ又は
それ以上の連続する線分が同一の線の部分をなすかを調
べるための手段と、前記同一の線の部分と見做された前
記線分を併合するための手段とを含むものとし、照合す
るための手段は、縦及び横の線を識別するための手段
と、前記走査した画像の中に発見された全ての線の長さ
を加算してキー値を生成するための手段と、前記テンプ
レート及び実際のフォームからの線情報を、線及び交点
のカウント又は線の長さの和などの単一のスカラー値に
縮合して候補リストからテンプレートを破棄するように
した手段と、２つ又はそれ以上の線のパターンの間の空
間的類似性を調べるための手段と、前記走査された画像
の中の線の配置を測定して、投影情報を前記画像の所定
の領域内の線の存在を表す２進値に縮合するための手段
と、線の長さと線間の距離を比較するための手段と、前
記実際のフォーム及びテンプレートのフォーム内の前記
線のパターンを分析するための手段と、前記実際のビジ
ネスフォームの様式を調べるための手段とを含むものと
した。

【００１０】

【作用】ビジネスフォームは使用可能な空間を区切る垂
直線（又は、縦線）と水平線（又は、横線）の存在を特
徴としており、罫線と称されるこれらの線を２レベルの
デジタル化画像で識別し、特徴抽出に適用する以前に、
文字がグラフィックスから分離されることになる。つま
り、既存のベクトル化、線抽出及び文字・グラフィック
ス分離法によるものと異なり、専ら垂直線及び水平線の
識別に注目したものである。これにより、多様なビジネ
スフォームの適正なる自動的分類が可能となる。

【００１１】

【実施例】以下、本発明の好適な一実施例を図面を参照
して説明する。本発明は、好適な一実施例との関連にお
いて詳述されることになるが、本発明はこれらの実施例
に限定されることを意図していないことは理解されよ
う。むしろ、本発明は特許請求の範囲に示したように代
替、変更、同等のものを包括することを意図し、これら
は本発明の精神と範囲に含まれ得るものである。

【００１２】なお、本実施例は、以下の各章に分類して
順次説明するものとする。１．方法２．特徴抽出３．照合４．フォーム辞書５．性能の評価６．結論７．接続した要素の識別８．実装と試験９．結論

【００１３】１．方法この章では、フォーム識別システムの開発のために選択
した方法を詳述する。本方法は典型的なパターン認識法
に従っており、ここで注目しているオブジェクトから特
徴が抽出され、パターンのクラスを特徴付けるテンプレ
ート群の特徴と照合される。より詳細には、ビジネスフ
ォーム識別システムは次の２段階よりなる。１．準備−この間にアプリケーションのドメインにある
フォームのクラスを表わすテンプレートが走査され、こ
れの特徴が抽出され、結果がフォーム辞書内に編成され
る。２．分類−この間に合致が発見されるか、又は「未知の
フォーム」の決定に到達するまで、実際の作成フォーム
の特徴が辞書のテンプレートの特徴と系統的に比較され
る。

【００１４】システム構成を図１に示す。同図に示す部
材は走査モジュールを除き、以下の章で詳述する。図１
のシステム部材には適当な走査部１４を備える特徴抽出
部１６への入力であるテンプレートフォーム１２を含
む。特徴抽出部１６はフォーム辞書１８内に保存される
テンプレートの特徴を提供する。実際のビジネスフォー
ム２２は適切な走査部２４を介して走査され、特徴抽出
部２６への画像を提供する。フォームの特徴は後述する
ように抽出され、照合部２８でテンプレートの特徴とフ
ォームの特徴との正確な照合を行なってフォーム識別が
出力に提供される。

【００１５】２．特徴抽出この章では、水平及び垂直の線をフォームの認識のため
の特徴として使用することを詳述する。また、既存の線
分抽出技術の限界を簡単に詳解し、より高速な識別を可
能にするためにビジネスフォームの特定の属性を使用す
る改良した方法を概説する。

【００１６】ビジネスフォーム３２は、図２に例示する
ように、データを入力し得るようになした所定のフィー
ルドの存在が特徴である。このようなフィールドは、通
常使用可能な空白部分を限定する水平線と垂直線との組
合せによって識別される。たいていの場合、これらの線
はフォームを個別に識別するパターンを提供しており、
そのためフォームの区別に使用することができる。本章
の残りではこれら罫線と称する線の識別を行なうアルゴ
リズムを概説する。２つのフォームが同一の線の構成を
共有している状況では、フォームを区別するフォーム識
別番号（ＩＤ）又はロゴがたいてい存在している。これ
らのオブジェクトは曖昧さの解消に使用し得る一方で、
ここで実装しているシステムは排他的に線を使用する。

【００１７】ラスター画像をベクトルに変換するアルゴ
リズムを詳述した論文は多数存在する。これらの手法で
は元の画像データをアプリケーションレベルで操作する
のにさらに好適な高レベルの画像記述子へ変換してい
る。これらは光学文字認識システム（Optical Characte
r Recognition System）［文献１，２］で文字間を識別
するため、又はグラフィックスプログラム上で使用し得
るように元々紙上に製作された線画の走査画像をベクト
ル化するために使用される［文献３，４，５，６］。

【００１８】ここに、文献１Ｓ．Ｍori and Ｔ．Ｓakura，“線の抽出と手書き漢字
の字画への用途”，第７回パターン認識国際会議抄録、
３６６−３６９ページ、１９８４年文献２Ｐavlidis，Ｔ．，“文書認識のためのベクトル化装置
と特徴抽出装置”，Ｃomputer Ｖision，Ｇraphics， a
nd Ｉmage Ｐrocessing誌、３５巻、１１１−１２７ペ
ージ、１９８６年文献３Ｈ．Ｂunke，“回路図中の文字とグラフィックスの自動
的解釈”，パターン認識理論の応用、Ｊ．Ｋittler，
Ｋ．Ｓ．Ｆu and Ｌ．Ｆ．Ｐau編、Ｄ．Ｒeidel社、Ｂ
oston，２９７−３１０ページ、１９８２年文献４Ｍ．Ｋarima，Ｋ．Ｓ．Ｓadahl， and Ｔ．Ｏ．ＭcNei
l，“設計図からコンピュータ支援設計へ”，ＩＥＥＥ
コンピュータ・グラフィックスと応用、２４−３９ペー
ジ、１９８５年２月文献５Ｌ．Ａ．Ｆletcher and Ｒ．Ｋatsuri， “文字列とグ
ラフィックスへの２進画像の分割”，ＳＰＩＥ７８６
号人工知能の応用，５３３−５４０ページ、１９８７
年文献６Ｃ．Ｃ．Ｓhih，Ｒ．Ｋatsuri， “グラフィックス認識
用の線記述ファイルの生成”，ＳＰＩＥ９３７号人
工知能の応用，５６８−５７５ページ、１９８８年である。

【００１９】基本的に上記に列挙した複数のアルゴリズ
ムは、フォーム画像の罫線の識別に適用することができ
る。しかし、これらは線の方向又は寸法には関係なくあ
らゆる線と曲線を識別するように設計されていることか
ら、最も有効な方法で業務を遂行することはできない。
例えば、上記文献５に記載の画像分解アルゴリズムは、
ハック変換を用いて同一線上にある線分をグループ化し
ている。線分の方向が任意であるためこの操作は必要で
ある。逆に、本方法で用いた要素識別技術は、画像の軸
に平行な線分だけを区別しているため、２つのオブジェ
クトの最も近い端部の間の距離についての簡単なテスト
を用いて、２つのオブジェクトのグループ化を実行する
ことができる。先の例では、罫線の属性に関する特定の
知識を用いるより効率的な罫線識別アルゴリズムを設計
することが可能であることを示唆している。この知識は
次のように要約することができる。１．罫線は画像の軸と平行している。これによって同一
行又は同一列内に位置する黒い接続画素のシーケンスに
アルゴリズムが合焦できる。２．９０度の角度に注目している。画像が線毎に走査さ
れる間に水平線を検索することは、画像が列毎に走査さ
れる間に、垂直線を検索することと等価である。そのた
め、次のような単純なアルゴリズム (１) 走査線と平行の線の発見に排他的に注目する (２) どちらの方向にも独立して動作可能であるを有する設計が可能になる。

【００２０】これらの知見は、新しい線の抽出用アルゴ
リズムの設計で勘案されたものであり、そのアルゴリズ
ムは次の４段階で識別を行なっている。段階１：接続した要素の識別この段階では、フォーム画像は隣接する黒い画素の組が
識別されながら、行毎（列毎）に走査される。これらの
組は“接続した要素”と称し、線の識別で基本的構成ブ
ロックを提供する。段階２：オブジェクトの選択接続した要素が識別された後、その高さと幅が検査され
てこれらが“線の部分”でありそうか決定される。長い
形状、即ち、幅が高さより大幅に大きい（水平線）か、
又はその逆（垂直線）の状態にある線分だけが許容され
る。段階３：併合（マージ）薄く接続した要素の組が識別されると、次の段階は２つ
の連続した線分が同一の線の部分をなし得るか決定する
ことである。この検査に合格した場合、その線分は併合
（マージ）され、それ以外の場合では別個のオブジェク
トと見做される。併合処理後に残る細い線分は線と見做
される。段階４：識別後の処理最後の段階では、画像内の雑音又は歪曲によって、線と
して誤って識別されたパターンをアルゴリズムが除外す
る。典型的なビジネスフォームに見られる線のパターン
の形式を記述する一連の規則がこの目的で使用される。

【００２１】このアルゴリズムを実行した実験によれ
ば、より詳細な方法より有意に高速であることが示され
ている。例えば、前述した文献２の結果からは２０４８
×２０４８画素の画像を処理するために約３分かかるこ
とが示されている。一方、新しい識別アルゴリズムは典
型的なフォーム（１６７２×２１７６画素）を３秒以内
で処理可能である。これらの測定結果は直接比較すべき
ものではないが、各々の例で実行した動作の差が与えら
れれば、方法を特定化したことで得られた長所が一層明
示される。アルゴリズムについては以下で詳述する。

【００２２】３．照合本発明で開示したフォーム識別の形式は、アプリケーシ
ョンのドメインで発見されるべき文書のクラスを表現す
るテンプレートを含む辞書の存在を前提としている。こ
の章では、実際の製作フォーム又は単にフォームが属す
るクラスを決定するため、フォーム辞書１８を系統的に
検索する照合アルゴリズムについて概説する。

【００２３】罫線は、２章でフォーム識別の第１の手段
として識別されている。しかし、罫線の提供する情報の
レベルは非常に詳細であり、必ずしもあるフォームがあ
るクラスに属していないと決定するのに必要とされな
い。例えば、実際のフォームで検出された線数が３５
で、テンプレートが１５０線を有する場合、このフォー
ムがこのクラスに属する見込みは極めて低い。よって、
実際の線の位置又はこれらの長さの比較は不要である。

【００２４】一般に、フォームの照合処理はシステム
が、まず、初期候補群を構成し、次に、一連の判定用関
数を適用して、実際のフォームと適合しそうにないテン
プレートを除外するといった段階的な方法で実行し得
る。照合処理過程を図３に示す。処理は、幾つかの候補
に絞られるまで継続して、その時点で決定関数が適用さ
れ、又は候補リストが空であれば「未知」の決定に到達
する。各々の段階を次に詳述する。

【００２５】３．１インデックス付き辞書アクセス図３を参照すると、フォーム辞書１８内のテンプレート
は機能抽出処理で取得した線情報から派生する数値キー
に従って配列している。インデックス付き辞書アクセス
３４の段階の間、システムは実際のフォームから同じ値
を導出し、次のようなフォーム辞書１８の検索に使用す
る。 retrieve templates from dictionary where template．key ＞ actual．key*MIN KEY DIS
C RATIO and template．key ＞ actual．key*MAX KEY DIS
C RATIO なお、“MIN KEY DISC RATIO”と“MAX KEY DISC RATI
O”は調節可能な閾値である。

【００２６】ここで、実装しているアルゴリズムは、画
像中で発見された全ての線の長さを加算し、これをキー
値として使用するものである。この式を選択する際に用
いた基準は計算の簡単さと、明らかに異なる線のパター
ンからフォームを分離する能力である。

【００２７】３．２集合の弁別集合を基盤とする弁別（集合弁別手段３６）では、テン
プレートと実際のフォームからの線情報を単一のスカラ
ー値、例えば、線数と交点数、又は線長の和に集約す
る。これらの値の比又は絶対差分を用いて候補リストか
らテンプレートを排除する。集合の弁別は、単純な算術
及び幾何計算によるものであって実際のフォームと最も
異なるテンプレートの排除を行なう安価な方法を提供し
ている。弁別式としてここで用いている集合値には、次
のような (１) 線数 (２) 「長い」線の数 (３) フォームの中心を横断する線数が含まれる。これらの関数が選択されたのは線のパター
ンの異なる属性を測定しており、また、計算が安価なた
めである。よって、例えば、２つのフォームの線数が極
めて近接しているとしても、実際の長さの何らかの差が
全体としての線の比重に反映されることになる。同様
に、２つのフォームが同一の線比重を有している場合で
も、線の位置の差がどちらかのフォーム中心を横断する
線数に反映される。第１の２つの集合の計算にはありふ
れた算術操作が必要である。第３の例ではある線がフォ
ーム中心を横断しているか検査する必要がある。全ての
線が一定していることから、この検査は次のような記述
を評価することへ縮小される。 line.Ｘmin ＜ ROW LENGTH/2 ＜ line.Ｘmax (水平線) line.Ｙmin ＜ LINES/2 ＜ line.Ｙmax (垂直線) なお、{(Ｘmin，Ｙmin)，(Ｘmax，Ｙmax)}は線の端部の
座標である。

【００２８】３．３交点の弁別集合の弁別は、線のパターンの全体属性を測定するが、
フォーム中での線の位置は考慮していない。交点弁別手
段３８による交点弁別はその名で示されるように空間的
位置関係を用いて２つの線のパターンの間の類似性を検
出するものである。これは、水平と垂直の線が交わる点
を発見することに関係する。この検査は、交点の個数の
みを使用しその位置は使用しないことから、事実上新し
い形態の集合弁別である。しかし、その計算がより高価
である(Ｏ(Ｎ² )に対してＯ(Ｎ))ことから別個であると
見做し、そのため、集合の弁別に合格したフォームにつ
いてのみ実行されるべきものである。

【００２９】線のパターンにおける交点を計算するため
には、線識別機構が線の位置を近似することを場合によ
っては考慮する必要がある。よって、実際のフォームに
おいて実際に抵触する線は識別後に分離されることがあ
る。以下の検査はこうした状況を勘案したものである。交点の検査：ＨＬを水平線、{(ＨＬ.ｘ₁，ＨＬ.ｙ₁)，
(ＨＬ.ｘ₂，ＨＬ.ｙ₂)}を端部の座標とする。同様にＨ
Ｖと{(ＨＶ.ｘ₁，ＨＶ.ｙ₁)，(ＨＶ.ｘ₂，ＨＶ.ｙ₂)｝
を各々縦線とその座標とする。Ｗを次のようにＨＬの周
囲に作る方形として、Ｗ.ｘ₁=ＨＬ.ｘ₁−INTER HOR WIN SIZE Ｗ.ｘ₂=ＨＬ.ｘ₂−INTER HOR WIN SIZE Ｗ.ｙ₁=ＨＬ.ｙ₁−INTER VER WIN SIZE Ｗ.ｙ₂=ＨＬ.ｙ₂−INTER VER WIN SIZE ＨＬとＨＶはＷとＨＶが交差する場合のみ交差する。

【００３０】図４に図示した検査は、交差しないが抵触
する線が交差として計数されるようになしている。“IN
TER HOR WIN SIZE”と“INTER VER WIN SIZE”は調節可
能なパラメータの値である。ここで、実装しているアル
ゴリズムは各々の交点の位置を記録している。これらの
値は将来より詳細な交点を基盤とした弁別に使用するこ
とができる。

【００３１】３．４類似性の弁別この章で議論する方法は、本システムで使用される２つ
の投影を基盤とする方法のうちの一つである。これらの
方法は、識別した線をフォームのデカルト軸（Ｙ軸上の
水平線、Ｘ軸上の垂直線）に配当した後、この方法で生
成されたパターンを比較してこれらの類似性（近似性）
を判定する。この処理は類似性弁別手段４０で行なわれ
る。図５にこの処理のための線の投影を示す。線の位置
を考慮しない集合弁別とは異なり、投影法の結果は線の
位置に影響される。計算は高価になるが、正確度は向上
し、なおかつ、識別した線の詳細な比較は回避されてい
る。

【００３２】近似法では、画像内の線の配置を測定す
る。これは投影情報を所定の画像領域内における線の存
在を反映する一連の２進数に縮合する。これらの領域は
投影軸をＮ個のバケットに分割することによって得られ
る。図６に近似法の処理結果を示す。あるバケットに属
する値は次の公式ｂ_i ＝１：領域Ｎ_i が１線以上を含む場合ｂ_i ＝０：それ以外から計算する。値｛ｂ_i ｝の組は、文字列で構成され、
線のパターンを区別する際に用いられる新しい特徴を提
供する。

【００３３】本来、２つのフォームの間の類似性は対応
する文字列の直接的比較によってもたらされ得る。しか
し、実際には画像内のフォーム位置のわずかな変化であ
っても線を別のバケットへ配当することになるため実施
されない。その代わり、以下の検査でテンプレートが候
補リスト内に残っているか又は破棄されたかを知ること
ができる。段階１ＴとＡをテンプレートと実際のフォームとし、Ｂ(Ｔ)＝｛ｂ_i(Ｔ)｝とＢ(Ａ)＝｛ｂ_i(Ａ)｝を各々の水
平２進数列（同様のことを垂直線にも行なう）とし、Ｓ(Ｂ(Ｔ))＝Σｂ_i(Ｔ) Ｓ(Ｂ(Ａ))＝Σｂ_i(Ｔ) をＢ(Ｔ)とＢ(Ａ)での１の和とする。｜Ｓ(Ｂ(Ｔ))−Ｓ(Ｂ(Ａ))｜＞Ｔ_i であればＴを破棄し、それ以外では段階２へ進む。段階２Ｍ(Ｂ(Ｔ))とＭ(Ｂ(Ａ))をＢ(Ｔ)とＢ(Ａ)内の
１の配置の中央の点とし、｜Ｍ(Ｂ(Ｔ))−Ｍ(Ｂ(Ａ))｜＞Ｔ₂ であればＴを破棄し、それ以外では段階３へ進む。段階３Ｂ₁(Ｔ)とＢ₂(Ｔ)をＢ(Ｔ)の左と右のＮ／２値
として、同様にＡ₁(Ｔ)とＡ₂(Ｔ)を決定する。｜Ｓ(Ｂ₁(Ｔ))−Ｓ(Ｂ₁(Ａ))｜＞Ｔ₃ 又は｜Ｓ(Ｂ₂(Ｔ))−Ｓ(Ｂ₂(Ａ))｜＞Ｔ₃ 又は｜Ｍ(Ｂ₁(Ｔ))−Ｍ(Ｂ₁(Ａ))｜＞Ｔ₄ 又は｜Ｍ(Ｂ₂(Ｔ))−Ｍ(Ｂ₂(Ａ))｜＞Ｔ₄ であればＴを破棄し、それ以外であればこれを許容す
る。これらの検査は線のパターンの異なる属性を測定
し、また、２進数列にあるわずかな差を許容するように
設計された。

【００３４】３．５投影の弁別投影弁別手段４２による投影の弁別も、フォームの線を
画像の軸に配当した結果得られたヒストグラム風の構造
を用いる。しかし、線がバケットの範囲内に存在するか
ということだけに依存する近似法と異なり、投影法は投
影された画像内に出現する線の１：１の比較を実行す
る。この比較は、線の長さと線間の距離の双方に関係す
る。考慮されない唯一の知見は平行する軸に対する線の
位置である。例えば、ある列の左手側に位置する１１０
画素の線は同一の線長であるが列の右手側に位置してい
る線と全く同一の方法で配当される。

【００３５】本方法では、図７に示すように、線の投影
のネットワーク表現を用いており、ここで節は線とその
長さを表わし、これらを隔てる距離を弧で結んでいる。
アルゴリズムは実際のフォームとテンプレートのネット
ワークを同時に検索して可能な限り多くの節と弧を照合
させようとする。フォーム内で観察された線の長さと距
離に多少の変動が存在することから、照合は閾値に対す
る差分の比較によって行なわれる。さらに、アルゴリズ
ムは一連の規則を用いて実際のフォームの節とテンプレ
ートのネットワークの間の関連性が多数：１になる場合
を判別する。こうした場合は、実際のフォームのパター
ンが、画像内の雑音又は歪曲によって生成されて寸断し
ている線又は署名、印証、又はテンプレートには存在し
なかった文章に由来する過剰な線を含む場合に発生す
る。図８には、実際のフォームとテンプレートの節との
多数：多数の相関関係を示す。

【００３６】３．６ウインドウの照合ウインドウ照合手段４４でのウインドウの照合検査は、
実際のフォームとテンプレートのフォームにある線のパ
ターンの詳細な分析を実行する。識別された線から利用
し得る全ての情報がここでは考慮される。よって、これ
はフォームを比較する最も正確な方法を提供するもので
あるが、同時に最も高価でもある。照合処理において、
このレベルに到達する候補は極めて類似した線のパター
ンを有していると推定される。

【００３７】この章で詳述した方法は「ウインドウの照
合」の概念に基づいている。テンプレートのフォームの
線を包囲する方形として定義されるこれらのウインドウ
は、２つの線のパターンの間の類似性の度合を決定する
ために使用される。ウインドウはフォーム識別の準備段
階の間に作成され、識別段階の間に使用するためフォー
ム辞書１８内に保存される。処理を次に詳述する。水平
線について議論を進めるが、垂直線にも等しく応用し得
るものである。以下の定義を本論を通して使用する。Ｔ：テンプレートフォームＡ：実際のフォームＨＬines(Ｔ)：Ｔの水平線パターンＨＬines(Ａ)：Ａの水平線パターン hli(Ｔ)＝(ｘ₁，ｘ₂，ｙ) ＨＬines(Ｔ)のｉ番目ＨＷＳ水平方向のウインドウ寸法ＶＷＳ垂直方向のウインドウ寸法

【００３８】ウインドウはシステムが準備されていると
きに定義される。この処理の間に線の組ＨＬines(Ｔ)が
アルゴリズムに渡され、多角形の集合ＨＰolygons(Ｔ)
とスカラー値の組ＨＳcore(Ｔ)が次のように生成され
る。図９を参照して説明する。段階１：ウインドウの生成各々の線ｈｌ_i(Ｔ) について方形のウインドウを生成す
る。ｈｗ_i(Ｔ)＝（ｘ₁−ＨＷＳ，ｘ₂＋ＨＷＳ，ｙ−ＶＷ
Ｓ，ｙ＋ＶＷＳ，)図９(ｂ)参照。段階２：ウインドウの併合ウインドウｈｗ_i(Ｔ)とｈｗ_j(Ｔ)の対の各々についてｈｗ_i(Ｔ) ∩ ｈｗ_j(Ｔ)≠０ならば多角形を生成しｈｐ_m(Ｔ)＝ｈｗ_i(Ｔ) ∪ ｈｗ_j(Ｔ) 交差する全ての方形のウインドウが多角形に取り込まれ
るまでこの段階を反復する（図９(ｃ)参照）。ＨＰolyg
ons(Ｔ)＝｛ｈｐ_m(Ｔ)｝を得られた組とする。段階３：テンプレートの点数化ｌｈｓ_mk(Ｔ)をｈｐ_m(Ｔ)内での可視のｈｌ_k(Ｔ)の部分
とし、ｌｌ_mk(Ｔ)をこれの長さとする（図１０参照）。
各ウインドウの点数は次のように求まる。ｈｓ_m(Ｔ)＝Σｌｌ_mk(Ｔ) 辞書準備処理の点数化段階は組ＨＳcore(Ｔ)＝｛ｈｓ
_m(Ｔ)｝の計算を行ないデータ辞書内でこれを点数化す
る。

【００３９】ｌｌ_mk(Ｔ)の評価には、ある線とある多角
形の交差を計算する必要がある。これは従来からの公式
を介して実行され得るが、各々の多角形ウインドウがこ
れを生成した方形によって記述され得ることによって計
算は簡略化される。例えば、ｈｐ_m(Ｔ)がｈｗ_i(Ｔ)とｈ
ｗ_j(Ｔ) の交差である場合、得られる多角形は次のよう
に記述できる。｛ｈｗ_i(Ｔ) ∪ ｈｗ_j(Ｔ)｝ − ｛ｈｗ_i(Ｔ) ∩ ｈｗ_j
(Ｔ)｝この等式を次のように線の全長の計算に使用することが
できる。ｌｌ_mk(Ｔ)＝ＬＲＩntersect（ｈｌ_k(Ｔ)，ｈｗ_i(Ｔ)）
＋ＬＲＩntersect（ｈｌ_k(Ｔ)，ｈｗ_j(Ｔ)）＋ＬＲＩnt
ersect（ｈｌ_k(Ｔ)，ｈｗ_i(Ｔ）∩ ｈｗ_j(Ｔ)) ここで、ＬＲＩntersectは、(１) ある方形に交差する
線の線分を決定し、 (２) その長さを評価する関数である。線と方形の双方
とも常に一定であるからこれは簡単な関数である。

【００４０】３つ又はそれ以上の方形が交差する場合に
対するこの式の拡張は次の等式によって可能である。ｈｐ_m(ｔ)＝∪｛ｈｗ_j(Ｔ)｝−∪｛ｈｗ_i(Ｔ）∩ ｈｗ_j
(Ｔ)｝＋∪｛ｈｗ_i(Ｔ）∩ ｈｗ_j(Ｔ）∩ ｈｗ_k(Ｔ))｝
−＋…

【００４１】照合段階の間、ＨＰolygons(Ｔ)内の多角
形はＨＬines(Ａ) に上書きされて点数ＨＳcore(Ａ)が
得られる。ＡとＴの類似性はＨＳcore(Ｔ)とＨＳcore
(Ａ)の値の差で決定される。より詳細には、二つのフォ
ームの間の差は次の式で測定される。Ｄiff(Ａ，Ｔ)＝√｛Σ(ｈｓ_m(Ｔ)−ｈｓ_m(Ａ))² ／ Σ
(ｈｓ_m(Ｔ))² ｝この関数の値は常に範囲［０．０，１．０］にある。こ
こで、“０”は完全に一致、“１”は完全に不一致であ
る。Ｔ₁は値Ｄiff(Ａ，Ｔ₁) が所定の許容域値以下であ
る場合のみ許容される。

【００４２】３．７決定関数この章では、決定関数手段４６による適合処理の最終段
階を詳述する。この段階では、弁別検査の部分的結果を
用いる。これらの値は、識別されたフォームにテンプレ
ートがどの程度まで一致しているかを表しており、検査
される値のフォーム対テンプレート比から１を減算した
後、これの絶対値をとることによって計算される。例え
ば、行カウントに基づいたテンプレートの除外はテンプ
レート内の行数、例えばＬＣ_t を実際のフォーム内の行
数、例えばＬＣ_a で除算して行なう。この検査のエラー
は｜１−ＬＣ_t ／ＬＣ_a｜である。１の比は完全一致で
あり０に等しいエラー値が得られる。

【００４３】決定関数は得られるエラーの重み付け平均
をとり、これらの値に従って候補を順序付け、その後、
リストの最上位の候補を選択する。関係するエラー値は
次のようなものがある。ＬＣＥ：線カウント比エラーＷＬＥ：線重み比エラーＦＣＣＥ：フォーム中心交差比エラーＩＣＥ：交差カウント比エラーＡＰＰＥ：近似比エラーＰＲＯＪＥ：投影比エラーＷＩＮＥ：ウインドウエラーこれらの量は次のように重み付けされる。Ｗ₁（ＬＣＥ＋ＬＷＥ＋ＦＣＣＥ＋ＩＣＥ）＋
Ｗ₂ＡＰＰＲＲ＋Ｗ₃ＰＲＯＪＲ＋Ｗ₄ＷＩＮＥここで｛Ｗ₁｝は定数の組で、ΣＷ₁＝１などである。
これらの値はシステムの能力を調節するために任意に設
定でき、ウインドウ検査はより詳細であることからＷ₄
の値が他より重み付けされると推測される。同様に次の
関係もＷ₃＞Ｗ₂＞Ｗ₁ に保持されることになる。

【００４４】４．フォーム辞書フォーム辞書１８は、適合処理を支援するために必要と
される情報を保存する部分である。その内容及び構造
は、適合アルゴリズムの必要性によって記述されること
になる。一般に、辞書は階層状に構成され、集合値は前
もって利用可能なヘッダに配置される。より詳細な情
報、例えば投影法又は線を基盤とする方法で必要とされ
る情報などは階層をさらに下って配置され、必要な場合
にのみ呼び出される。辞書準備の処理はクラスを表すフ
ォームを集め、走査し、特徴を抽出することからなる。
この動作はクラス名又はキーを決定することになる利用
者の監督下に実行すべきものである。

【００４５】５．性能の評価この章では、正確度を測定する目的で、フォーム識別シ
ステムで実行したテストの結果を示す。テストの環境を
簡単に解説してから、システム内の基幹パラメータと有
効性にかかわる影響について議論する。

【００４６】議論してきたフォーム識別システムは株式
会社リコーのソフトウェア研究センター（Ｒicoh Ｃorp
oration's Ｓoftware Ｒesearch Ｃenter）でＵＮＩＸ
／Ｃ環境に実装された。本システムの主プログラムは、 (１) フォーム画像とフォーム辞書を与えてフォーム識
別番号又はＮＯＭＡＴＣＨフラグを返す分類プログラ
ム (２) テンプレートフォームの特徴を所定の辞書に追加
する準備プログラムからなる。２つの補助プログラムがシステムを補完す
る。一方はフォーム辞書内で必要な構造を生成し、他方
はデバッグ又はパラメータの設定を目的として適合処理
の部分的結果を表示する対話型ツールである。

【００４７】走査された画像フォームが識別される方法
に影響する４種類の特性は、 (１) 歪曲又は回転 (２) ２進化処理で用いる閾値（コントラスト） (３) 走査機構の不純物によって生成された背景雑音 (４) 文章及び／又は署名の存在である。一方、システムの動作を調整するために使用し
得るパラメータが幾つか存在する。次に詳述する検査方
法は、システム内の基幹域値とその最も適切な値を認識
するために使用された。

【００４８】フォーム識別システムは１５０文字の大き
さのテンプレートフォームを文献７（Ｒ．Ｌ．Ａdams，
１０秒間ビジネスフォーム，Ｂob Ａdams社，Ｂoston，
１９８７年）から複写し、２００ｄｐｉで走査した２１
７６線×１６７２画素を用いて検査した。システムは最
初に手書きで埋めた２００枚のフォームでテストした。
しかし、綿密にシステムを評価するためには注目してい
る特性を統合した一連の検査用フォームを作成する必要
があった。これらのフォームは辞書内に保存したテンプ
レートと画像にオブジェクトと雑音を付加する画像処理
関数を用いて自動的に生成した。

【００４９】表１は処理内で用いた変数を示したもので
ある。全ての組合せを考慮したが、次のような２つの種
類に分類した。分類回転転写コントラスト１ＤＣ，Ｄ，ＥＣ２Ｂ、Ｃ、Ｅ、ＦＢ、Ｃ、Ｅ、ＦＢ、Ｄグループ化した目的は、原本から（分類１）また第１の
複写（分類２）から取得した画像を模倣することであ
る。

【００５０】

【表１】

【００５１】これらの分類の元で行なった検査の結果
は、各々９９．７８％、９７．３２％であった。さら
に、同一のフォームにビジネスフォームで一般的に見ら
れる印章（即ち、「送信済み」、「支払い可」、「部外
秘」など）を含むように変更した。こうした異質のオブ
ジェクトの存在は、システムの正確度に重大な衝撃を与
え、観察された正確度は、各々９６．２５％と９０．３
８％へ減少した。この低下の原因は、印章自体の中に線
が存在したことと、実際の文書の線上に上書きした場合
に生成された雑音によるものである。これらの検査で用
いたパラメータ値は、異なるパラメータ群の感度を分析
した一連の経験によって得られたものである。

【００５２】システムの速度は、異なる容量の辞書と組
合せて１００枚のフォームを読込ませた検査の別々のグ
ループで測定した。結果を図１１に示す。図中で各フォ
ームに要した平均時間は２つの部分に分割してある。１
つは線の識別に対応し、他方は照合に対応する部分であ
る。平均線識別時間は個別に測定した。時間はサンマイ
クロシステムズ社（Ｓun Ｍicrosystems）のＳparcＳta
tion １で測定した。

【００５３】最後に、照合処理の各段階で破棄されたフ
ォームの比率の研究から下記に示すような結果が得られ
た。これらの数値は別個に勘案した場合の各方法の効率
の指標を与えるものである。個々の弁別比初期弁別３７．６３％集合弁別４８．１８％交差弁別５８．４８％近似弁別７０．９４％投影弁別８４．７２％最良候補の選択８４．７７％ウインドウの一致９９．５７％

【００５４】６．結論フォーム識別システムは、異なるフォーム様式を同時に
取扱う必要のある文書画像化システムの開発に使用する
ことができる。本システムは各種条件の下で試験を行な
い、５章に示したように、その性能は満足すべきもので
あると証明された。プロジェクトの次の段階は本アルゴ
リズムの弱点の理解を深める目的でパラメータ感度のさ
らに詳細な分析を進めることである。

【００５５】さらなる研究に関して、次の段階は本シス
テムをタイプ打ち又は手書き何れかとＯＣＲとを組合せ
てフォームの分類をなすだけではなく、個別に識別する
ようになすことである。こうした技術のうまく行った組
合せは文書画像管理システム用の強力かつ柔軟な検索機
構をもたらすはずである。

【００５６】７．接続した要素の識別接続した要素の識別は、連続した黒い画素を組としてグ
ループ化することによる。２つの画素が８つの接続を有
している場合、これらは連続していると言う。図１２に
この例を示す。接続した要素を検出するために使用した
技術は画像を線毎に走査して、黒い画素をオブジェクト
に「併合」し「成長させる」ことよりなる。この処理
は、図１３に示すような次の例で良く述解されている。

【００５７】いま、図１３(ａ)に示すような２進数の行
列を考え、これがある画像の画素配列を表すと仮定す
る。接続した要素の識別処理はマーカーのアレイを用い
て画素とオブジェクトの関連性を追跡する。このアレイ
は各々のピクセルにある組を識別する整数を付随させ
る。マーク付け処理の間、画像は線毎に左から右へ読込
まれる。前方に画素が存在せず、ある画素の接続性が決
定されるのはそれのＷ、ＮＷ、ＮＥの隣に対してだけで
ある。マーク付け値は次のように決定する。１全ての白い画素は０にマーク付けされる。２黒い画素が周辺部へ接続していない場合、これには
新しいマーク番号が割当てられる。図１３(ｂ)には最初
の線が走査された後のマーク付け値を示す。３黒い画素が同一マークの付いた黒い画素の一つ又は
それ以上に接続している場合、この画素には同一の番号
が付けられる。図１３(ｃ)には１０番目の線の後のマー
ク付け値を示す。４黒い画素が異なるマーク番号の２つの要素に接続し
ている場合、オブジェクトを併合する。この処理の間、
要素に付けられた最大の番号を有するマークは最低の番
号に変更される。図１３(ｄ)はマーク１，２の併合を示
す。全ての線が走査された後で得られるマーク付けの行列
は、画像内の全ての接続した要素を記述する（図１３
(ｅ)参照）。

【００５８】７．１画像の圧縮上述したアルゴリズムの複雑さは、Ｎ行で行当りＭ画素
の画像が与えられた場合、即ち、Ｎ×Ｍの場合である。
これはランタイムとメモリ要求の双方に適用される。本
章ではこの後、この基本的考案への変更により２ＭＢの
メモリセルしか必要とせず、ランタイムの複雑さが１／
１６のアルゴリズムが得られるようにすることについて
詳述する。

【００５９】アルゴリズムのランタイムの複雑さは、画
像が画素毎ではなくバイト毎に走査された場合減少し得
る点にある。この圧縮は処理されるべき要素の数をＮ＊
Ｍ／８へ減少させる。また、既存のプロセッサにおい
て、大半のＩ／Ｏ及びメモリ管理命令はバイトレベルで
動作していることから、アルゴリズムのさらに効果的な
実装が可能になる。バイトレベルでの作業には連続した
８画素で利用可能な情報が単一の値に縮小される必要が
ある。この応用の目的で、各々の可能なバイト値（０か
ら２５５）が０と１のパターンを表現する。このような
ビットのパターンを線分が「１」とし、残りが「０」と
して、最も発見され易くなるように割当てることによっ
て圧縮が完了する。

【００６０】どのビットパターンが１に割当てられどれ
が０になるかの決定は処理する画像の形式によって変化
する。画像が明解で歪曲していなければ、８つ連続した
１を含むバイト（１０進値で２５５）だけが選択されれ
ばよい。逆に雑音が多いか又は歪曲を有する画像の線は
孔が開くことになり、ある程度０を含むビットパターン
を許容する必要がある。

【００６１】本アルゴリズムの現在のバージョンでは、
次式ＳelectＢyte(ｂ)＝１０の数＜４で連続する０の数
≦１の場合ＳelectＢyte(ｂ)＝０それ以外 ………………………………(１) に従ってバイト値を配当している。

【００６２】この規則は、鮮鋭度と歪曲が様々な画像に
ついて行なった実験の結果として選択した。実験の間、
黒い画素の数にだけ基づいたパターンの選択は雑音の多
い画像の場合、品質の悪い結果となり、この場合、線が
「虫食いだらけ」の状態となり易いことが判った。一
方、２つ又はそれ以上の連続する０のパターンが１に割
当てられる場合では、連続する文字要素が間違えて線と
して識別される状況が発生した。

【００６３】典型的なフォームの線の長さが２バイトを
超過すると推定されるので（画像が２００ｄｐｉで走査
された場合１／１２インチ）、連続する２バイトを単一
の値に割当てることでさらにアルゴリズムを高速化する
ことが可能である。この割当ては次式ＳelectＢytes(ｂ₁，ｂ₂)＝ＳelectＲightＢyte(ｂ₁) ＡＮＤＳelectＬeftＢyte(ｂ₂) ………………………………（２）で定義される。ここで、ＳelectＲightＢyte(ｂ)とＳel
ectＬeftＢyte(ｂ)は、(１)式のｂの１０進値に割当て
られる。さらに、パターンの組｛0000111，0001111，00
11111｝と｛11100000，11110000，11111100｝は各々Ｓe
lectＲightＢyteとＳelectＬeftＢyte によって１に割
当てられる。選択した組へこれらのパターンを追加する
ことで歪曲した線での識別の正確度が向上する。完全な
割当てテーブルを表２に示す。

【００６４】

【表２】

【００６５】７．１．２接続した要素の表本章の冒頭で述べた方法は、接続した要素の組の全ての
画素を追跡するためのマーク付け行列に頼るものであ
る。この方法では各オブジェクトの正確な表現が提供さ
れるが、この記述には箇条データがまだ含まれており、
従って有用性が制限される。この章では、別の接続した
要素の表現を導入し、その計算のためのアルゴリズムを
提示する。

【００６６】画像内の接続した要素を記述する一般的な
方法は、その組の全ての画素を含む最小の四角形の座標
を介している。この表現は、注目している特徴が始点だ
けであることから、線の記述に特に適合している。この
動作の目的では、四角形を最小の閉じた方形（Ｍinimum
Ｅncosing Ｒectangles＝ＭＥＲ）と称し（図１４参
照）、フォーム（minＸ，maxＸ，minＹ，maxＹ）の組と
して記述することにする。接続した要素を記述するため
のＭＥＲの使用でＭ×Ｎのマーク付け行列の必要がなく
なる。その代わり、現在と直前の画像列中と識別したオ
ブジェクトについてのＭＥＲ座標を含む接続した要素の
表のマーク付け値の追跡を行なうために２Ｎの行列を有
すれば充分である。次のＣ風（Ｃ‐like）の構造体はこ
の表を記述したものである。 typedef struct ｛ short id； short minＸ； short maxＸ； short minＹ； short maxＹ； u char obj； u char thin； u char line；｝ＣＣomponent；最後の３行の用途は本章で後述する。

【００６７】ＭＥＲ座標は、画像カーソルの現在の位置
と表内に保存された値を比較することによって線毎に更
新される。処理は次のように進められる。(ｘ，ｙ)を画
像カーソルの現在の位置とし、カーソルが(２)式を満足
させるバイトの組を指していると仮定する。また、近隣
の４つ（Ｗ，ＮＷ，Ｎ，Ｅ）のうちの１つがＭＥＲ(min
Ｘ(ｉ)，maxＸ(ｉ)，minＹ(ｉ)，maxＹ(ｉ))で記述され
る接続した要素ｉに属すると仮定する。ｉの新しいＭＥ
Ｒ座標は次のように計算される。 minＸ(ｉ）＝ min(ｘ，minＸ(ｉ)) maxＸ(ｉ）＝ max(ｘ，maxＸ(ｉ)) minＹ(ｉ）＝ min(ｙ，minＹ(ｉ)) maxＹ(ｉ）＝ max(ｙ，maxＹ(ｉ)) ……………………………(３)

【００６８】(ｘ，ｙ)の近隣が２つの異なる接続した要
素、例えばｉとｊに関連している場合、オブジェクトは
併合される必要がある。（minＸ(ｉ)，maxＸ(ｉ)，min
Ｙ(ｉ)，maxＹ(ｉ)）と（minＸ(ｊ)，maxＸ(ｊ)，minＹ
(ｊ)，maxＹ(ｊ)）が各々のＭＥＲとして、id(ｉ)＜id
(ｊ)だと仮定すると、併合処理中には次の計算が実行さ
れる。 id(ｊ) ＝ id(ｉ) minＸ(ｉ) ＝ min(minＸ(ｉ)，minＸ(ｊ)) maxＸ(ｉ) ＝ max(maxＸ(ｉ)，maxＸ(ｊ)) minＹ(ｉ) ＝ min(minＹ(ｉ)，minＹ(ｊ)) maxＹ(ｉ) ＝ max(maxＹ(ｉ)，maxＹ(ｊ)) …………………………（４）ｊのＭＥＲの値は変更されず、id(ｉ)でも同じことが行
なわれることに注意されたい。

【００６９】この章は図１５に示した併合の例で終りと
する。図１５は、接続した要素の表の中の選択した点で
画像の処理中に発生する変化を示している。この画像は
既に圧縮されているものと仮定している。

【００７０】７．１．３線の分離この章では、周辺のオブジェクトから水平線を分離する
ための圧縮メカニズムの能力について議論する。(１)式
と(２)式で定義されたバイト配当基準で典型的な縦線と
文字の特徴である細いストロークの大半を排除する。そ
の結果、画像内の水平線はパターンが接触しているよう
な場合であっても自動的に他のオブジェクトから分離さ
れる。図１６(ａ)に元の画像を示し、同図(ｂ)に圧縮後
の画像を示す。

【００７１】殆どの場合で分離が行なわれるが、ロゴや
大きな文字、又は枠を含むフォームでは黒いがその太い
パターンが圧縮段階の間に排除対象から外れてしまう。
図１７を参照して説明する。この場合、(２)式の選択基
準を変更して、接続した要素の識別段階で線分と思われ
る細くて長いオブジェクトだけを捉えるようにする必要
がある。この変更は次の規則に反映されている。規則１：(２)式を満たしているバイトの対ｐ１が、同様
に(２)式を満たしているバイトの対ｐ２に８つ接続して
いると、ｐ２に関連するオブジェクトの長さがｐ１の追
加によって増加する場合に限って圧縮処理中に１へ割当
てられる。

【００７２】この規則の目的は、線の総延長に関係する
線分、例えば図１７(ａ)で位置（３，０)−(３，７）及
び（８，０)−(８，７）にあるバイトを単に厚みに追加
されるだけの線分、例えば（０，０)−(０，２）、
（０，４)−(０，６）及び（０，８）と明確に区別する
ことである。図１７(ｃ)はこの規則が圧縮機構に組込ま
れた場合に得られる画像を示す。この規則によって水平
線を構成する全ての画素を追跡することはもはや不可能
であることに注意を要する。しかし、次の章で説明する
ように充分に引き替え可能ではある。

【００７３】７．２細いオブジェクトの選択前章で提示した接続した要素の分析結果は、画像内のオ
ブジェクトを記述する最小の閉じた方形の集まりであ
る。本章では、この組から線分を分離するために用いた
選択基準を説明する。

【００７４】細いオブジェクトの選択は、接続した要素
の高さ、幅、及び高さと幅の比を測定して、これらの値
を所定の域値と比較することよりなる。実行する検査
は、線が水平の場合は、（height ＜ MAX THICKNES AND ratio ＞ MIN RATIO）又は（width ＞ HOR SEG LEN） ……………………………(５) 又は、線が垂直の場合は、（width ＜ MAX THICKNES AND ratio ＞ MIN RATIO）又は (height ＞ VER SEG LEN） ……………………………(６) である。これらの条件のうち、第１の部分は選択したオ
ブジェクトが細長い形状を有していることを確認するよ
うに設計してある。第２の部分は大きな文字、ロゴ、又
は雑音によって生成される小さな線分に対応する接続し
た要素を排除することを意図している。

【００７５】(５)式と(６)式を満たす接続した要素は線
分と見做される。このことは、接続した要素内の「薄
さ」変数の値を１に設定することによって記録される。

【００７６】現在実装しているアルゴリズムで用いるパ
ラメータ値の議論は第４章に譲る。

【００７７】７．３線の併合細長いオブジェクトの選択処理の後、接続した要素の表
は画像内の線分を記述する最小の閉じた方形の集まりを
含むことになる。原理的には、これらのオブジェクトは
画像内の線と一致する。しかし、雑音又は歪曲の存在に
より、しばしば線が単一の要素として識別されないこと
になる。本章では、隣接する線分のグループを分析し、
これらが同一線の部分をなすかを調べる併合アルゴリズ
ムについて記述する。

【００７８】本方法に関連する検査は、近接性と連続性
の２つが存在する。近接性検査の目的は、同一の線の部
分であると見做すには離間し過ぎている線分を排除する
ことである。これは、２つの連続した線分の間の水平距
離を計算して閾値と比較することよりなる。線がこの検
査に合格した場合、併合処理が連続性検査を実行し、そ
れ以外では線分は別の線であると見做される。Ｍ_i＝ａｂｓ（(maxＸ(ＬＳ_i) − minＸ(ＬＳ_i))／２）
かつＭ_j＝ａｂｓ（(maxＸ(ＬＳ_j) − minＸ(ＬＳ_j))／２）を２つの線分ＬＳ_iとＬＳ_jの中央点とする。以下の式を
用いて近接性検査を実行することができる。ＷithinＳearchＲange(ＬＳ_i，ＬＳ_j)＝ＴＲＵＥ
ａｂｓ((Ｍ_i−Ｍ_j)／２）＜MAX DISTANCEの場合ＦＡＬＳＥそれ以外 ………………………(７)

【００７９】連続性の検査は、２つの隣接する線分をよ
り詳細に観察し、これらが実際に同一線の部分をなすか
検証する。この検査では、併合するための候補の最も左
の点と最も右の点が同一の隣接部分に位置しているかを
検査することからなる。全ての２つの線分について、考
慮すべき「最も左の点／最も右の点」の組合せが２つ存
在することに注意を要する。検査は、最も近い対につい
て実行されるべきものである。次のアルゴリズムは、連
続性検査を実行するものである（図１８参照）。

【００８０】アルゴリズム名：連続性検査定義：ＬＳ_i及びＬＳ_jを２つの線分とし、一般性を逸失
しないようにＬＳ_i がＬＳ_jの左側にあると仮定する。Ｌ_i ＝minＸ(ＬＳ_i) Ｒ_i ＝maxＸ(ＬＳ_i) Ｍ_i ＝(maxＹ(ＬＳ_i)−minＹ(ＬＳ_i))／２Ｌ_j ＝minＸ(ＬＳ_j) Ｒ_j ＝maxＸ(ＬＳ_j) Ｍ_j ＝(maxＹ(ＬＳ_j)−minＹ(ＬＳ_j))／２とする。段階１次のように（Ｒ_i，Ｍ_i）の周囲にウインドウＷ
を生成する。 minＸ(Ｗ) ＝Ｒ_i − ＸＳＥＰ maxＸ(Ｗ) ＝Ｒ_i − ＸＳＥＰ minＹ(Ｗ) ＝Ｍ_i − ＸＳＥＰ maxＹ(Ｗ) ＝Ｍ_i − ＸＳＥＰ段階２（Ｌ_j，Ｍ_j)がＷ内部にあるか無いかを調べて
検査を実行する。Ｃontiguous（ＬＳ_i，ＬＳ_j）＝ＴＲＵＥＬ_j ＞ maxＸ(Ｗ) ／＊右外側＊／又はＬ_j ＜ minＸ(Ｗ) ／＊左外側＊／又はＭ_j ＞ minＹ(Ｗ) ／＊上外側＊／又はＭ_j ＜ minＹ(Ｗ) ／＊下外側＊／の場合ＦＡＬＳＥそれ以外 …………………………………(８)

【００８１】以下に完全な併合アルゴリズムを概説す
る。アルゴリズム名：線分の併合定義：ＬＳ＝｛ＬＳ_i ｝を線分の組とし、ＮをＬＳの基
本部分とする。段階１縦方向中央点の値に従ってＬＳを並べ替える。段階２以下の計算を実行する。ｉ＝０；ｊ＝１；merge count＝０； while (ｉ＜Ｎ) ｛ while (ＷithinＳearchＲange (ＬＳ_i，ＬＳ_j)）｛ｉｆ (Ｃontiguous(ＬＳ_i，ＬＳ_i)) ＣombineＳegments(ＬＳ_i，ＬＳ_i)； merge count＝＋１； j＝+1 } i＝+1； } 段階３ merge count＝０なら終了；それ以外では、Ｎ
＝Ｎ−merge countとして段階２へ戻る。関数Ｃombine
Ｓegmentsは次の計算を実行する。 id(ＬＳ_j) ＝id(ＬＳ_i) minＸ(ＬＳ_i) ＝min(minＸ(ＬＳ_i)，minＸ(ＬＳ_j)) maxＸ(ＬＳ_i) ＝max(maxＸ(i)，maxＸ(ＬＳ_j) minＹ(ＬＳ_i) ＝min(minＹ(ＬＳ_i)，minＹ(ＬＳ_j)) maxＹ(ｉ) ＝max(maxＹ(ＬＳ_i)，maxＹ(ＬＳ_j))

【００８２】７．４後処理この章では、併合処理において識別された線に適用し
て、典型的なビジネスフォームに見られる属性を満たし
ているか調べるための一連の規則について詳述する。こ
れらの規則の目的は、間違えて線として識別された画像
のオブジェクトを排除することである。このようなオブ
ジェクトは画像の雑音の結果として、又はロゴ又は大き
な文字に出現することがある。

【００８３】併合処理から得られた線の表について実行
される検査は３種類ある。これらは次の基準 (１) 線の最小長さ (２) 線の最小分離 (３) 線の交差に従っている。

【００８４】線の最小長さの検査は、図１９に例示する
ように、大きな文字又はロゴから抽出された短い線を排
除するために使用される。これは、線の長さと閾値（MI
NHOR LINE LEN）との単純な比較よりなる。この検査は
大半のビジネスフォームの設計で罫線を用いてデータを
書込むことができる空間を位置決めしているか、又は、
文書を構成する領域を際立たせているという知見に基づ
いている。これらは人間の肉眼で充分識別し得るだけ長
いはずである。

【００８５】線の最小分離検査は、２つの連続した水平
線のＹ座標（線が垂直であればＸ座標）の間の距離を測
定し、これを閾値（MIN LINE SEPARATION）と比較する
ことからなる。この基準に合致している場合、又は、線
が少なくとも MIN OVERLAP単位で重複している場合、２
つの線の短い方が破棄される。この検査の目的は、強い
コントラストで走査された画像の文字部分に見られる雑
音によって生成された画像を排除することである。この
検査はビジネスフォーム内の線が主としてフィールドデ
リミタ（フィールド区切り）として用いられ、よって、
データがこれらの間に書込めるように最小限の分離を維
持しているはずであるとのことに基づいている。

【００８６】雑音によって生成された線の排除を行なう
もう一つの方法は、交差試験によるものである。この検
査では、全ての線は線の最小長さ（MIN HOR LINE LENGT
H）より長いが第２の長さ基準（MIN NO INTERSECTION L
ENGTH）よりは短く、少なくとも垂直な線１本と交差す
るか、又は交点を形成する必要がある。識別された線が
実際に接触しないが実際のフォームでは接触していると
仮定するに充分なだけ近い場合に対応するため、本試験
は同一の隣接部分内で線が存在する長さが長いほど満た
される。ここで、隣接部分は水平線の辺縁の周囲で決定
される（図２０参照）。

【００８７】８．実装と試験この章では、アルゴリズムの実装中に集積した知見を詳
解する。開発環境について簡単に解説した後、現在まで
に実行した質的量的検査の結果を提示する。

【００８８】８．１環境本報告で詳述した線識別アルゴリズムは、株式会社リコ
ーのカリフォルニア研究センター（Ｒicoh's Ｃaliforn
ia Ｒesearch Ｃenter）でフォーム識別システムのモジ
ュールの一つとして実装された。lrRecognizeLinesと呼
ばれる本モジュールの主要な機能はビジネスフォームの
デジタル化画像にポインタをとり、発見した罫線の座標
を含む構造体を返すことである。これらのルーチンの詳
細な説明と使用するデータ構造は、例えば文献８（Ｗ．
Ｋ．Ｐratt，デジタル画像処理，Ｗiley社，Ｎew Ｙor
k，５２３−５２５ページ、１９７８年）や文献９
（Ａ．pizano，“ビジネスフォーム処理用の線識別アル
ゴリズム”，テクニカルレポート SRC901101，リコー
ソフトウェア研究センター、Ｓanta Ｃlara，ＣＡ，１
９９０年１１月）中に示されている。線識別モジュール
の動作は、２つのモードよりなる。通常モードでは本プ
ログラムは線を識別して何らの出力も生成することなく
得られた表を作成する。デバッグモードでは、アルゴリ
ズムの中間段階の結果を示すメッセージの集合をライブ
ラリ呼出しが生成する。図２１にプログラム出力の見本
として、同図(ａ)には元の画像を示し、同図(ｂ)には認
識した線を示す。このような実際の画像に適用した場合
の本アルゴリズムの動作を、表３〜表６に示す。表３、
表４は接続した成分に関するもので、表５は選択された
細いオブジェクトに関するもので、表６は細いオブジェ
クトの順序に関する。

【００８９】

【表３】

【００９０】

【表４】

【００９１】

【表５】

【００９２】

【表６】

【００９３】また、第１の反復に関する併合処理手順を
表７〜表９に順に示し、第１の反復後の細いオブジェク
トの順序を表１０に示す。

【００９４】

【表７】

【００９５】

【表８】

【００９６】

【表９】

【００９７】

【表１０】

【００９８】さらに、第２の反復に関する併合処理手順
を表１１〜表１３に順に示し、併合後に識別した線に関
する結果を表１４に示し、後処理後に識別した線に関す
る結果を表１５に示す。

【００９９】

【表１１】

【０１００】

【表１２】

【０１０１】

【表１３】

【０１０２】

【表１４】

【０１０３】

【表１５】

【０１０４】通常モードはライブラリがフォーム識別シ
ステム内に統合されている場合に選択され、デバッグモ
ードはＸ−Ｗindow 表示システムとともにアルゴリズム
によって生成された線の視覚表現を生成するため広汎に
使用された。ソースコードのデバッグをする補助である
ことを別として、このツールの最も重要な用途はアルゴ
リズムの基幹パラメータを識別するように実験を進める
ことにある。これらの実験結果を次に解説する。

【０１０５】８．２試験罫線が識別される方法に影響する走査画像の特徴は４つ
である。それは、 (１) 歪曲又は回転 (２) ２進化処理中に用いる閾値（コントラスト） (３) 走査機構中の不純物によって生成された背景雑音 (４) 文字及び／又は署名の存在である。同様に、これらの変数を取扱う上で調節可能な
パラメータが幾つか存在する。このような線識別パラメ
ータに関して、下記に示す。

【０１０６】試験段階の主目的は、これらのパラメータ
のうちでどれが重要かを決定し、適切な値を求めること
だった。本章は、この後、この処理の間に収集した知見
を詳述する。線識別パラメータ MAX THICKNES ７．２節 MIN RATIO 〃 MIN HOR SEG LEN 〃 MIN VER SEG LEN 〃 MAX DISTANCE ７．３節 HOR X SEP 〃 HOR Y SEP 〃 VER X SEP 〃 VER Y SEP 〃 MIN HOR LINE LEN ７．３節 MIN VER LINE LEN 〃 MIN NO INTERSECTION WIDTH 〃 MIN NO INTERSECTION HEIGHT 〃

【０１０７】本プロジェクトの実験段階は、上に示した
画像特性が識別処理で有する可能性のある影響の直感的
な分析から開始した。この分析では、回転の度合が小さ
くとも線が分断されることがあると示された。画像のコ
ントラストが薄すぎる場合にも同じ問題が発生し、線パ
ターンの不連続が生成してしまう。逆に、濃いフォーム
は暗い文字領域に、又は署名が出現した場合に線を生成
する傾向にある。

【０１０８】これらの仮定を確認するため、またアルゴ
リズムの感度を求めてパラメータ値を変更するために、
注目している特性を統合した一連の検査フォームを作成
する必要があった。このフォームは文書から直接走査し
たテンプレートフォームを用い、さらに画像処理関数を
経由して雑音（回転、文字、背景雑音、コントラスト）
を付加して自動的に生成された。

【０１０９】生成したフォームは全部で２５枚である。
この数字は５段階の回転レベル（−２，−１，０，＋
１，＋２）と５段階のコントラスト分類（極めて薄い、
薄い、普通、濃い、極めて濃い）の組合せから得た。

【０１１０】検査処理の最初の段階は、システムを較正
してテンプレートフォーム中の線を識別させるようにす
ることからなる。下記に正しい結果を得たパラメータ値
を示す。初期パラメータ値 MAX THICKNES 3 MIN RATIO 23.0 MIN HOR SEG LEN 33 MIN VER SEG LEN 33 MAX DISTANCE 48 HOR X SEP 16 HOR Y SEP 4 VER X SEP 16 VER Y SEP 3 MIN HOR LINE LEN 65 MIN VER LINE LEN 65 MIN NO INTERSECTION WIDTH 192 MIN NO INTERSECTION HEIGHT 192 この例では、線数は水平４１、垂直２０である。

【０１１１】これらの値を残りのフォームに適用して、
表１６に示すような結果を得た。予測した通り、「薄
い」フォームから識別した線数は先に示した値を大幅に
超過していた。この実験では歪曲の度合より画像のコン
トラストに対してシステムの感度が高いことが示され
た。この知見は各々の例で発見された水平線の線数を表
示した図２２で一層明らかである。

【０１１２】

【表１６】

【０１１３】表１６から得られるもう一つの知見は、垂
直線の数が全ての例で予測した数に近いことで、垂直線
は歪曲とコントラストによる影響が小さいことが示され
る。この事実は、画像中に出現する水平及び垂直方向の
オブジェクト（文字と陰影領域を含めて）の数の差で説
明し得るものである。歪曲と極めて濃いコントラストの
複合した試験例で識別された線を詳細に見ると、フォー
ムの陰影領域又は文字の中に多くの余分な線が発見され
たことが判る。

【０１１４】濃いフォームの分析で発見した接続した要
素の検討では、HOR SEG LEN の値が小さい線分を許容し
たために剰余線が抽出された領域が存在したことが明ら
かだった。これらの線分は併合した際に余分な線を生成
した。表１７はHOR SEG LENを３３から１７へ変更した
結果を示す。予想された通り、これらのフォームで識別
された線数は予想された数の１０％以内まで減少した。
しかし、この変化は薄いフォームで発見された線数には
逆に影響した。

【０１１５】

【表１７】

【０１１６】９．結論本論では、ビジネスフォームからの特徴抽出に使用され
る新しい線識別アルゴリズムを開示した。本方法は、排
他的に罫線にのみ注目していることから他の線抽出法よ
り効果的である。また、ここではビジネスフォームの構
造に関する特有の知見も使用している。評価試験の結果
は、その正確度が満足し得るものであることを示してい
る。本システムのさらなる試験は、本アルゴリズムの上
に構築されたフォーム識別システムの評価中に行なわれ
ることになる。

【０１１７】本発明の好適な一実施例にかかる前述の説
明は、図示と説明とを目的として提示したものである。
これは、余すところなく、又は開示した特定の形態に本
発明を制限することを意図するものではなく、また、上
述の教示に鑑みて数多くの変更や変化が可能であると理
解すべきである。好適な実施例は本発明の原理と実際に
側した応用を最も良く説明することを目的として選択又
は詳述され、これによって当業者が企図する特定用途に
適合するように本発明と各種の実施例を各種の変更と共
に最も好適に使用し得るようになすものである。本発明
の範囲は特許請求の範囲及びそれに等価なもので定める
ことを意図している。

【０１１８】

【発明の効果】本発明は、上述したように、所定のテン
プレートの組に従ってビジネスフォームのデジタル化画
像を分類する認識システムに関し、処理は、テンプレー
トフォームの画像を走査し、分析し、データ辞書内に保
存する準備段階と、実際のフォームを辞書内のテンプレ
ートと比較して文書が所属するクラスを決定するための
識別段階よりなるものとし、この際、ビジネスフォーム
が使用可能な空間を区切る水平と垂直の線の存在を特徴
としている点に着目し、罫線と称するこれらの線を２レ
ベルのデジタル化画像で識別して、光学文字認識装置又
はフォーム識別システムの特徴抽出装置に適用する以前
に文字をグラフィックスから分離するようにしたので、
既存のベクトル化、線抽出、及び文字・グラフィックス
分離法とは異なり、専ら水平及び垂直の線の識別に注目
したものであり、多様なビジネスフォームの適正なる自
動的分類が可能となる。

【図面の簡単な説明】

【図１】本発明の好適な一実施例を示すビジネスフォー
ム識別システムのブロック図である。

【図２】ビジネスフォームのサンプルを示す略図であ
る。

【図３】適合処理を示すブロック図である。

【図４】線の交差の計算時に使用される模式図である。

【図５】線の投影処理を示す模式図である。

【図６】近似法処理を示す模式図である。

【図７】線の投影のネットワーク表現を示す模式図であ
る。

【図８】実際のフォームとテンプレートの節の相関関係
を示す模式図である。

【図９】ウインドウ生成処理を順に示す模式図である。

【図１０】ウインドウの点数化処理を示す模式図であ
る。

【図１１】識別時間を示す特性図である。

【図１２】８つの接続した近隣部の様子を示す模式図で
ある。

【図１３】接続した要素の識別処理を順に示す模式図で
ある。

【図１４】最小の閉じた方形を示す模式図である。

【図１５】マージ中の要素テーブルの変更手順を順に示
す模式図である。

【図１６】圧縮中の水平線分離の様子を示す模式図であ
る。

【図１７】厚みのある垂直方向の要素の処理の様子を示
す模式図である。

【図１８】連続性テストの様子を示す模式図である。

【図１９】大きな文字又はロゴ中に見つかった線のサン
プル例を示す模式図である。

【図２０】交点ウインドウを示す模式図である。

【図２１】プログラム出力例の見本を示す模式図であ
る。

【図２２】初期テスト中に識別された線の数の様子を示
す特性図である。

【符号の説明】

１２テンプレート１８保存手段２２実際のビジネスフォーム２４走査手段２６パターン認識手段２８提供手段３４インデックス付き辞書アクセス手段３６集合弁別手段３８交点弁別手段４０類似性弁別手段４２投影弁別手段４４ウインドウ照合手段４６決定関数手段

Claims

【特許請求の範囲】

【請求項１】１つ又はそれ以上のビジネスフォームの
テンプレートの特徴を保存するための手段と、１つ又は
それ以上の実際のビジネスフォームを走査してこれを表
す走査データを生成するための手段と、走査したビジネ
スフォーム上の垂直及び水平の線パターンのみを認識す
る手段を有して前記走査データを認識するためのパター
ン認識手段と、認識したデータを予め保存されたフォー
ムと照合して実際のビジネスフォームの様式の特定を提
供するための手段と、前記実際のビジネスフォームを線
毎に走査することによってこれを表す黒画素データと白
画素データを形成する手段と、隣接する前記黒画素の１
つを識別してＸ成分及びＹ成分を有する接続した要素を
認識するための手段とよりなることを特徴とするビジネ
スフォーム識別システム。
【請求項２】接続した要素が長い線分を形成するかを
調べるための手段を含むことを特徴とする請求項１記載
のビジネスフォーム識別システム。
【請求項３】２つ又はそれ以上の連続した線分がビジ
ネスフォーム上の同一の線の部分をなしているか調べる
ための手段と、前記同一の線の部分をなすと見做された
前記線分を併合するための手段を含むことを特徴とする
請求項２記載のビジネスフォーム識別システム。
【請求項４】雑音又は歪曲情報を排除するための後処
理手段を含むことを特徴とする請求項３記載のビジネス
フォーム識別システム。
【請求項５】走査した画像の中で発見された全ての線
の長さを加算してキー値を生成するためのインデックス
付き辞書アクセス手段を含むことを特徴とする請求項４
記載のビジネスフォーム識別システム。
【請求項６】テンプレート及び実際のフォームからの
線情報を、線と交点のカウント又は線の長さの和などの
単一のスカラー値に縮合して候補リストからテンプレー
トを破棄するようにした集合弁別手段を含むことを特徴
とする請求項５記載のビジネスフォーム識別システム。
【請求項７】２つ又はそれ以上の線のパターンの間の
空間的類似性を調べるための交点弁別手段を含むことを
特徴とする請求項６記載のビジネスフォーム識別システ
ム。
【請求項８】走査した画像の中の線の配置を測定し
て、投影情報を前記画像の所定領域内の線の存在を表現
する２進数の値に縮合するための類似性弁別手段を含む
ことを特徴とする請求項７記載のビジネスフォーム識別
システム。
【請求項９】線の長さと線間の距離を比較するための
投影弁別手段を含むことを特徴とする請求項８記載のビ
ジネスフォーム識別システム。
【請求項１０】実際のフォーム及びテンプレートのフ
ォーム内の前記線のパターンを分析するためのウインド
ウ照合手段を含むことを特徴とする請求項９記載のビジ
ネスフォーム識別システム。
【請求項１１】実際のビジネスフォームの様式を調べ
るための決定関数手段を含むことを特徴とする請求項１
０記載のビジネスフォーム識別システム。
【請求項１２】保存するための手段が階層的方法でテ
ンプレートの特徴を構成するための手段を含むことを特
徴とする請求項１記載のビジネスフォーム識別システ
ム。
【請求項１３】適合処理の部分的結果を表示するため
の手段を含むことを特徴とする請求項１記載のビジネス
フォーム識別システム。
【請求項１４】多様なビジネスフォームを自動的に識
別し、又は分類するための画像処理システムであって、１つ又はそれ以上のビジネスフォームのテンプレートの
特徴を保存するための手段と、１つ又はそれ以上の実際のビジネスフォームを走査する
ための手段と、前記実際のビジネスフォームを線毎に走査してこれを表
す黒画素データと白画素データを構成するための手段
と、隣接する前記黒画素の１つを識別して接続した要素
を認識するための手段と、前記接続した要素が長い線分
を形成するか調べるための手段と、２つ又はそれ以上の
連続する線分が同一の線の部分をなすかを調べるための
手段と、前記同一の線の部分と見做された前記線分を併
合するための手段とを含んで前記実際のビジネスフォー
ムから特徴を抽出するための手段と、縦及び横の線を識別するための手段と、前記走査した画
像の中に発見された全ての線の長さを加算してキー値を
生成するための手段と、前記テンプレート及び実際のフ
ォームからの線情報を、線及び交点のカウント又は線の
長さの和などの単一のスカラー値に縮合して候補リスト
からテンプレートを破棄するようにした手段と、２つ又
はそれ以上の線のパターンの間の空間的類似性を調べる
ための手段と、前記走査された画像の中の線の配置を測
定して、投影情報を前記画像の所定の領域内の線の存在
を表す２進値に縮合するための手段と、線の長さと線間
の距離を比較するための手段と、前記実際のフォーム及
びテンプレートのフォーム内の前記線のパターンを分析
するための手段と、前記実際のビジネスフォームの様式
を調べるための手段とを含んで前記保存されたテンプレ
ートの特徴と前記抽出した特徴を逐次的に照合するため
の手段とよりなることを特徴とする画像処理システム。