JP2930460B2

JP2930460B2 - 手書き及びマシン印字テキストの区分化方法

Info

Publication number: JP2930460B2
Application number: JP3324241A
Authority: JP
Inventors: エスブルームバーグダン
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1990-12-13
Filing date: 1991-12-09
Publication date: 1999-08-03
Anticipated expiration: 2014-08-03
Also published as: KR920013188A; MX9102508A; EP0490687A2; CA2057243A1; BR9105295A; EP0490687A3; DE69132206D1; EP0490687B1; CA2057243C; US5181255A; JPH07114618A; KR100251600B1; DE69132206T2

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、画像処理の分野に係
る。更に詳しくは、本発明は、画像内のマシン印字（プ
リント）されたテキストと手書きの注釈を識別及び／又
は分離する方法に係る。

【０００２】

【従来の技術】多数の文書及びそれらの画像は、マシン
プリントされたテキスト及び手書きの注釈の両方を含ん
でいる。手書きの注釈に対応する走査画像の領域を識別
できることが有用である。例えば、現在のＯＣＲシステ
ムは、手書き部分が個人個人で違っているため、画像内
の手書きの注釈を正確に識別することができない。この
ようなテキストが従来のＯＣＲシステムに送られると、
かかるシステムは使用不能の結果をしばしば生じる。こ
のようなシステムの性能は、手書き領域を識別してその
手書き領域をＯＣＲで処理するのを回避できれば、改善
することができよう。

【０００３】一方、文書上にある手書きの注釈を識別し
そして検索することは、あるときには重要である。例え
ば、画像のファイリングシステムは、手書きの注釈（及
びその座標データ）を、ビットマップデータとしてセー
ブし、用途に適したやり方でユーザにフィードバックす
ることができる。

【０００４】

【発明が解決しようとする課題】手書きの注釈及びマシ
ン印字されたテキストを分離する公知の方法は、ある程
度の成功を収めているが、種々の制約がある。公知のあ
るものは、高価で、複雑で、及び／又は信頼性が低い装
置を必要とし、一方、他の技術は、著しい量のコンピュ
ータメモリ、コンピュータ時間、等を必要とする。ある
方法は、手書きの注釈の検出及び分離の信頼性が低い。

【０００５】そこで、手書きの注釈の存在を検出し、そ
してもし存在すれば、それを文書又は画像内のマシン印
字されたテキストから分離する改良された方法及び装置
が所望される。

【０００６】

【課題を解決するための手段】本願は、画像又は文書内
の手書きの注釈とマシン印字されたテキストとを識別
し、光学的に分離する方法及び装置について以下に開示
する。本発明の方法によれば、比較的限られた量のコン
ピュータメモリ及び処理時間しか必要としない一方、信
頼性の高い結果を生じると共に、比較的安価なハードウ
ェアしか必要としない。

【０００７】本発明は、デジタル処理手段において、手
書きの注釈領域と、マシンプリントされたテキスト領域
とを有する入力画像のうちの手書きの注釈領域を識別す
る方法を提供し、この方法は、複数の手書き及びマシン
プリントされた文字を有する上記入力画像の領域を、モ
ルフォロジーを用いて処理する段階を含み、このモルフ
ォロジー処理によって、実質的にマシンプリントされた
テキストか又は手書きの注釈領域のみを識別するための
マスク画像を形成することを特徴とする。

【０００８】本発明の特徴及び効果は、添付図面を参照
した以下の詳細な説明より理解されよう。

【０００９】

【実施例】

目次Ａ．定義と用語Ｂ．発明の全体的な説明Ｃ．発明の詳細な説明１．第１実施例２．第２実施例Ｅ．スレッシュホールドによる画像の高速縮小（及び拡
大）Ｆ．ソフトウェアの説明Ｇ．発明の例１．第１実施例２．第２実施例Ｈ．結論

【００１０】Ａ．定義と用語以下、２値画像について説明する。この説明の中で、
“画像”という用語は、ピクセルから成る二次元データ
構造体の表示を意味する。２値画像とは、所与のピクセ
ルが“オン”又は“オフ”である画像を意味する。２値
画像は、出力画像に１つ以上の入力画像をマップする多
数のオペレーションに従って処理される。このようなオ
ペレーションの結果を一般的に画像と称する。処理過程
の起点にある画像は、場合によりオリジナル画像と称す
ることもある。

【００１１】ピクセルは、通常、黒ならば“オン”、白
ならば“オフ”と定義する。黒をオンと表し、白をオフ
と表すことは、ほとんどの文書が黒の前景と白の背景を
持っているという事実を示している。本発明の技術はネ
ガテイブ画像にも適用できる。白地に黒について説明す
るが、オン又はオフという用語は、反転した画像にも等
しく適用でき、この場合、これら２つの状態の役割が互
いに逆になる。ある場合には“ドント・ケア(don't ca
re) ”ピクセルについても説明するが、これはオン又は
オフのいずれかのピクセルである。本発明は、グレイス
ケール画像に対しても同様に適用できるが、ここでは説
明を簡略化する目的で２値画像のみに限定して説明す
る。グレイスケール画像の場合には、オンはスレッシュ
ホールドより上のピクセルを、オフはスレッシュホール
ドの下のピクセルを表す。

【００１２】“モルフォロジーを用いた処理又はオペレ
ーション”とは、ピクセルマップ画像（“入力”画像）
に対して行う処理又はオペレーションを意味し、これ
は、各ピクセルにおいて、以下に示す“膨張”や“エロ
ション”や“オープン”や“クローズ”等の個別の処理
又はオペレーションを、以下に示す“構成要素（Ｓ
Ｅ）”を用いて実行し、別のピクセルマップ画像すなわ
ち“マスク画像”を形成するものである。上記のマスク
画像は、実行すべき所望のモルフォロジー処理の形式
と、選択された“構成要素（ＳＥ）”とによって決ま
る。なお、このモルフォロジー処理又はオペレーション
について紹介する以下の論文がある。Haralick et al,.
「Image Analysis Using Mathematical Morphology」,
IEEETransactions On Pattern Analysis And Machine I
ntelligence, Vol. PAMI-9,No. 4, 1987年 7月, p. 532
-550。

【００１３】画像の“塗り潰し領域”とは、多数のピク
セルが一次元的又は二次元的に延びている領域であっ
て、その中の実質的に全てのピクセルがオンであるよう
な領域を指す。

【００１４】画像の“織り目状（テクスチャ状）領域”
とは、オンピクセル及びオフピクセルの比較的微細な粒
状パターンを含む領域を指す。織り目状領域の例は、ハ
ーフトーン領域或いは点画状の領域である。

【００１５】ＡＮＤ、ＯＲ又はＸＯＲは、２つの画像の
間でピクセルごとに行われる論理演算であり、ＡＮＤは
アンド、ＯＲはオア、ＸＯＲは排他的オアである。

【００１６】ＮＯＴは、単一の画像に対してピクセルご
とに実行される論理演算である。

【００１７】“拡大”とは、倍率Ｎを特徴とする倍率オ
ペレーションであり、入力画像の各ピクセルは、オリジ
ナルのピクセルと全て同じ値を有するＮｘＮ個のピクセ
ルの方形となる。

【００１８】“縮小”とは、倍率Ｎ及びスレッシュホー
ルドレベルＭを特徴とする倍率オペレーションである。
倍率Ｎでの縮小は、ソース画像をＮｘＮ個のピクセルの
方形に分割し、ソース画像内のこのような各方形を出力
画像上の単一ピクセルへとマッピングすることを含む。
出力画像におけるピクセルの値は、スレッシュホールド
レベルＭによって決定され、これは、１とＮ²との間の
数である。ピクセル方形におけるオンピクセルの数がＭ
に等しいか又はそれより大きい場合には、出力画像のピ
クセルがオンであり、小さい場合には、オフである。

【００１９】“サブサンプリング”とは、入力画像をそ
れより小さい（典型的には方形の）エレメントに細分化
しそして入力画像内の各エレメントを出力画像内のより
小さなエレメントにマッピングするオペレーションを意
味する。出力画像の各エレメントのピクセル値は、入力
画像エレメントにおけるピクセルの選択されたサブセッ
トによって決められる。典型的に、サブサンプリングで
は、出力先ピクセルの値を入力画像エレメントからの選
択されたピクセルと同じにして単一ピクセルへとマッピ
ングすることを含む。選択は、予め定められたものでも
よいし（例えば、左上のピクセル）又はランダムであっ
てもよい。

【００２０】“４連結”とは、オンピクセルのセットで
あって、そのセット内の任意の２つのピクセル間に経路
を見出せるようになっていて、この経路は、（１）その
セット内に完全に存在しそして（２）その段が４つの水
平又は垂直方向のいずれかにおける一連の１ピクセル段
で構成されるものをいう。

【００２１】“８連結”とは、オンピクセルのセットで
あって、そのセット内の任意の２つのピクセル間に経路
を見出せるようになっていて、この経路は、（１）その
セット内に完全に存在しそして（２）その段が８つの水
平、垂直又は対角方向のいずれかにおける一連の１ピク
セル段で構成されるものをいう。

【００２２】“手書きの注釈”とは、人間がペンや鉛筆
等を用いて書くことによって最初に形成された文書又は
画像の部分をいうが、このように書いたものを機械で再
現したもの、例えば、ゼロックス複写、プリント再現、
等も意味する。これにより得られる画像は、マシンプリ
ントしたテキストの７０％、８０％、９０％、９５％、
９７％、９９％或いはそれ以上の部分をオリジナル画像
から除去して大部分の手書きの注釈を残すようにしたと
きに、実質的に手書きの注釈のみを含む。

【００２３】“マシンプリントしたテキスト”とは、例
えば、コンピュータのプリンタや印刷機等のプリンタに
よってしばしば発生される非常に規則的な文字及びスペ
ースを含む文書又は画像のプリント部分を指す。画像
は、手書きの注釈の７０％、８０％、９０％、９５％、
９７％、９９％或いはそれ以上の部分をオリジナル画像
から除去して大部分のマシンプリントテキストを残すよ
うにしたときに、実質的にマシンプリントしたテキスト
のみを含む。

【００２４】“線隣接グラフ”（ＬＡＧ）とは、一般的
に３レベルのハイアラーキ構成であるツリーの形態を有
している２値画像を表すデータ構造体である。３つのレ
ベルとは、（１）１本の走査線における隣接オンピクセ
ルの連続体、（２）これらの連続体を繋いだものより成
るストローク、及び（３）これらのストロークを繋いだ
ものより成るアイソレートされたマーク（例えば、文
字）である。

【００２５】“構成要素すなわちＳＥ”とは、典型的に
は（必ずしもそうではないが）サイズが小さくそして形
状が簡単な画像オブジェクト（典型的にはピクセルの集
合体）であって、入力画像を検知し、選択したモルフォ
ロジー処理によって入力画像から種々の形式の情報を抽
出するような画像オブジェクトをいう。最も典型的な構
成要素（ＳＥ）は、ピクセルの小さいブロックであり、
入力画像の各ピクセルに重ね合わせて入力画像を検知す
る。各図面において、塗り潰した円（黒丸）が“ヒッ
ト”であり、開いた円（白丸）が“ミス”である。構成
要素（ＳＥ）の中心位置は十字によって表されている。
ＳＥが、入力画像の現在検知されたピクセルに重ね合わ
されると、十字でマークされたＳＥのピクセルが、検知
された入力画像のピクセルに重なる。次に、入力画像の
中の検知したピクセルを囲むピクセルは、ＳＥの他のピ
クセルに重なる。塗り潰した円すなわち黒丸で示した、
ＳＥのピクセルと重なる入力画像のピクセルは、ＳＥを
「ヒット」するという。開いた円すなわち白丸で示し
た、ＳＥのピクセルと重なる入力画像のピクセルは、Ｓ
Ｅを「ミス」するという。塗り潰した円も開いた円もも
たない四角が“ドント・ケア”であり、画像の値（オン
又はオフ）は検知されない。２値のＳＥは、入力２値画
像に対して作用して出力２値画像を形成するモルフォロ
ジー処理において２値画像を検知するのに用いられる。
又、２値ＳＥはグレースケール画像を検知するのにも使
用でき、この場合、入力画像の全ての場所にシフトされ
る移動ウインドウとして観察される。構成要素すなわち
ＳＥは、中心位置と、多数のピクセル位置とによって定
められ、各ピクセル位置は、定められた値（オン又はオ
フ）を有している。ＳＥを定めるピクセルが互いに隣接
する必要はない。中心位置は、パターンの形態上の中心
にある必要はなく、パターンの内側にある必要もない。
“塗り潰した”ＳＥは、その周囲内の全てのピクセルが
オンであるようなＳＥをいう。例えば、塗り潰した２ｘ
２ＳＥは、オンピクセルの２ｘ２の四角である。塗り潰
したＳＥは長方形である必要はない。水平のＳＥは一般
に１行のオンピクセルであり、そして垂直のＳＥは一般
に１列の選択されたサイズのオンピクセルである。

【００２６】“ヒット−ミス”ＳＥとは、少なくとも１
つのオンピクセルと、少なくとも１つのオフピクセルと
を特定するＳＥをいう。

【００２７】“エロション”とは、モルフォロジー処理
又はオペレーションの１つであり、構成要素（ＳＥ）の
中心を入力画像の対応するピクセル位置に重ね合わせた
結果、構成要素（ＳＥ）の全てのオンピクセル及びオフ
ピクセルがその下の入力画像のピクセルと一致するとい
う結果を得た場合にのみ、（得られる）出力画像の所与
のピクセルをオンにするオペレーションである。エロシ
ョンは、前記の一致が得られるたびに出力画像に１ピク
セルを与える。即ち、エロションは、各ピクセルにおい
て、構成要素すなわちＳＥ（シフトされてそのピクセル
に中心定めされた）がオリジナル画像に完全に含まれた
場合に１を出力し、それ以外は０を出力する。

【００２８】“膨張(dilation)”とは、モルフォロジー
処理又はオペレーションの１つであり、オンである入力
画像のピクセルによって、構成要素（ＳＥ）の中心が出
力画像の対応する位置にあるように、構成要素（ＳＥ）
が、その出力画像に書き込まれるオペレーションをい
う。膨張に用いる構成要素すなわちＳＥは、典型的に
は、オフピクセルをもたない。膨張は、入力画像におけ
る各ピクセルごとに、ＳＥを出力画像においてピクセル
のセットとして描くものである。従って、出力画像は、
オリジナル画像の全ての１のピクセルにおいて並進移動
したＳＥのシフトした全部のものを合体したものとな
る。

【００２９】“オープン”とは、エロションの次に膨張
が続くモルフォロジー処理又はオペレーションである。
その結果、入力画像において一致が得られる毎に出力画
像において構成要素（ＳＥ）が複製される。膨張は、各
一致のたびに出力画像にＳＥを複製する。

【００３０】“クローズ”とは、膨張の後にエロション
が続くモルフォロジー処理又はオペレーションである。

【００３１】“フィル８”とは、長方形の境界ボックス
に塗りつぶす画像オペレーションである。

【００３２】“フィルクリップ”とは、シードピクセル
がクリッピング画像（“クリッピングマスク”と称す
る）に装填（フィル）されるモルフォロジー処理又はオ
ペレーションである。

【００３３】“マスク”とは、オリジナル画像から導出
される画像であり、典型的には該オリジナル画像の関係
領域に対応するオンピクセルの領域を含んでいる画像を
指す。但し、クリッピングマスクにおいては、オンピク
セルの一定の領域には、シードピクセルが含まれていな
い。

【００３４】上記した種々のオペレーションは、名詞、
形容詞及び動詞の形態で説明することもある。例えば、
膨張（名詞形態）を説明する場合、画像を膨張する又は
画像が膨張されている（動詞の形態）、又は画像が膨張
オペレーションを受けている（形容詞の形態）等々とな
る。意味の相違はない。

【００３５】Ｂ．実施例の全体的な説明図１は、本発明を実施する画像分析システム１のブロッ
ク図である。システム１００の基本的な動作は、文書１
０２、この場合は手書きのテキスト又はマシンプリント
されたテキストのある特性部分を抽出又は削除するか或
いは単にその有無を識別することである。このために、
システムは、ピクセルベースで文書をデジタル化してそ
れにより得たデータ構造体を供給するスキャナ１０３を
備えている。使用目的にもよるが、このスキャナは、２
値画像（ピクセル当たり単一ビット）を供給することも
できるし、グレースケール画像（ピクセル当たり複数の
ビット）を供給することもできる。このデータ構造体
は、文書の生の内容をスキャナの分解精度で含んでい
る。このデータ構造体は、典型的に画像と称するが、メ
モリ１０４に送られてもよいし、又はディスクや他の大
量記憶装置であるファイル記憶ユニットにファイルとし
て記憶されてもよい。

【００３６】プロセッサ１０６はデータの流れを制御し
そして画像の処理を実行する。プロセッサ１０６は、汎
用コンピュータであってもよいし、画像処理オペレーシ
ョンを最適に行うようにされた特殊目的のコンピュータ
であってもよいし、或いは汎用コンピュータと補助的な
特殊目的ハードウェアとの組み合わせであってもよい。
ファイル記憶ユニットを使用する場合には、画像が処理
の前にメモリ１０４に転送される。又、メモリ１０４
は、中間のデータ構造体及びおそらくは最終的に処理さ
れたデータ構造体を記憶するのに使用してもよい。

【００３７】画像処理（本発明がその一部分を構成す
る）の結果は、導出された画像であるか、数字データで
あるか（例えば、画像の顕著な特徴の座標）、或いはそ
の組み合わせである。この情報は、プリンタ、ディスプ
レイ、光学文字認識システム、グラフィック認識装置、
電子複製装置等の用途に特定のハードウェア１０８へ送
られてもよいし、或いは同じ又は異なったファイル記憶
ユニット１０５へ書き戻されてもよい。

【００３８】本発明は、特殊な縮小手順及びモルフォロ
ジー処理又はオペレーションを使用し、それらのテクス
チャに基づいて領域を変換し、画像の手書き部分又はマ
シンプリントされた部分を識別及び／又は除去するよう
にする。好ましい実施例では、マシンプリントされた領
域が識別され、最終的に、塗り潰された又はほぼ塗り潰
されたオンピクセルの分離マスクへ合体される。従っ
て、画像の手書き部分を除去してマシンプリントされた
テキストを保持することもできるし、或いは逆に、マシ
ンプリントされたテキストを除去して手書きの注釈を保
持することもできる。もちろん、ある実施例では、マシ
ンプリントされたテキスト又は手書きの注釈の有無を単
に識別することが所望される。

【００３９】好ましい実施例においては、画像の塗り潰
した大きなオン領域（即ち、オンピクセルの延びる長さ
が画像内のテキスト又はグラフィックより相当に大きな
距離に及ぶような領域）と、微細な織り状（テクスチャ
状）領域（例えば、ハーフトーン又は点描領域）が最初
に画像から除去される。このような領域を除去する方法
としては種々のものが利用できるが、好ましい実施例で
は、このような領域は、本発明の譲受人に譲渡され参考
としてここに取り上げる米国特許第５０６５４３７号及
び同第５１３１０４９号に開示された方法の１つに基づ
いて除去される。残りの画像は、主として又はもっぱら
手書き及び／又はマシンプリントされたテキストを含
む。もちろん、このような除去段階は、特に処理される
べき画像が塗り潰した黒の領域、点描状の領域又は微細
な織り状の領域を含むことが予想されないときには、任
意のものとなる。

【００４０】図２及び３は、微細な織り状の領域が好ま
しくは上記方法によって除去されている入力２値画像又
はグレースケール画像を処理するのに使用される２つの
特定の実施例を示す全体的なフローチャートである。図
２を参照すれば、好ましい実施例において、プロセスは
１つ以上の任意の縮小段階１で開始される。本発明は、
ここでは、主として縮小オペレーションによって説明す
る。というのは、縮小オペレーションは効率的に動作
し、そして手書きのテキストとマシンプリントされたテ
キストを容易に分離するからである。もちろん、本発明
は、縮小スケールで作用する必要はなく、フルスケール
で作用することもできる。ある実施例では、個別の縮小
を行って、フィルクリップマスク及びテキストシードを
形成し、異なったスレッシュホールドを使用するように
してもよい。

【００４１】段階３では、例えば、実質的にマシンプリ
ントされた領域のみにおいて比較的まばらなピクセル密
度を有するノイズを減少したテキストシードが形成され
る。テキストシードは、好ましい実施例では、画像をモ
ルフォロジー処理して手書きの注釈又はマシンプリント
されたテキストの特徴をもつ領域を識別することにより
形成される。

【００４２】段階５では、システムは、オリジナル画像
から段階７で形成されたクリッピングマスクへテキスト
シードをフィルクリップする。クリッピングマスクは、
手書きの注釈及びマシンプリントされたテキストの両方
をカバーするオンピクセルの実質的に塗り潰した領域を
含む画像である。段階５におけるフィルクリップオペレ
ーションの結果は、所望のテキストマスクであり、シス
テムはこれを用いて、段階９で所望のマシンプリントさ
れたテキスト又は手書きの注釈を抽出し、これは、例え
ば、抽出された（例えば、段階８で）マスクのバージョ
ンとオリジナル画像とのアンドをとるか又はマスクの縮
小バージョンと縮小されたオリジナル画像とのアンドを
とることによって行われる。

【００４３】図３は、本発明の第２の実施例を示してい
る。画像は、第１の実施例の場合と同様に、段階１にお
いて縮小され、そして段階２では、オリジナル画像が適
当な構成要素（ＳＥ）を用いて処理されて、マシンプリ
ントされたフォーマットでも手書きのフォーマットでも
ない画像の部分にあるピクセルの大部分、及び／又はマ
シンプリントされたフォーマット又は手書きのフォーマ
ットである画像の合体部分が除去される。第１の実施例
と同様に、システムは、特徴が背景“ノイズ”レベルよ
り量的に大きく存在する領域を選択することにより、マ
シンプリントテキスト又は手書きの注釈を識別する。本
書に示す実施例によれば、システムは、両側のオフピク
セルによって横方向の境界が定められた領域を選択的に
識別するための構成要素（ＳＥ）を用いて、マシンプリ
ントされたテキスト領域を識別する。

【００４４】段階４では、段階２からの出力が処理され
て、残りのオンピクセルが所望の領域に合体されると共
に、残りの領域においてオンピクセルが除去されて、マ
スクが形成される。マスクは、主として、マシンプリン
トされたテキスト又は手書きの注釈のいずれかである所
望のフォーマットの領域にあるオンピクセルのエリアで
構成される。次いで、マスクは段階８において元のスケ
ールに拡大されて戻され、任意の段階６において、所望
のマシンプリントテキスト又は手書きの注釈を含むオリ
ジナル画像の部分のみを抽出するようにマスクが使用さ
れる。この段階は、例えば、オリジナル画像とマスクと
のアンド演算を使用する。段階６の出力は、マシンプリ
ントされたフォーマット又は手書きフォーマットである
画像の一部分である。

【００４５】本発明は、多数の文字を含む画像の領域に
対してモルフォロジーを用いた画像処理を使用するもの
である。最も好ましい実施例では、画像に含まれたほと
んど又は全てのピクセルを処理する方法が使用される
（もちろん、画像が全文書の画像の一部分のみで構成さ
れる場合）。それ故、全文書画像（又はその実質的な部
分）の迅速且つ信頼性のある処理が達成される。

【００４６】Ｃ．実施例の詳細な説明本発明は、マシンプリントされたテキスト及び手書きの
注釈の形状及び／又は織り状態の相違を利用して、この
ようなマシンプリントされたテキスト及び／又は手書き
の注釈を識別する。“形状”とは、手書き又はマシンプ
リントフォーマットにおける文字、語、及び／又は語群
の輪郭形状を意味するものとする。“織り状態”とは、
マシンプリントされたテキスト又は手書きの注釈の領域
内におけるオンピクセル及びオフピクセルのパターンを
意味するものである。

【００４７】このようなテキストを分離するための技術
としては多数のものがある。例えば、種々の方向におけ
るオンピクセルの線の“密度”を用いて、手書きの注釈
又はマシンプリントされたテキストのいずれかに対して
テキストを最初に遮蔽してもよく、手書きの注釈は、垂
直からの種々のスキュー角において線の密度が相当に大
きなものである。或いは又、システムは、画像内の接続
された成分の“サイズ”を用いて、テキスト、即ち実質
的に小さな接続成分を有するマシンプリントされたテキ
ストの初期遮蔽を行うことができる。

【００４８】上記例では適度な結果が得られるが、本発
明の好ましい実施例は織り状態の相違を利用するもので
ある。特に、システムがマシンプリントされたテキスト
及び手書きの注釈を含む画像を、例えば、３８ピクセル
／インチの分解能まで縮小するときには、２つの形式の
書き込みが織り方的にはかなり異なったものとなる。本
発明の好ましい実施例では、モルフォロジー処理によ
る、織り状選別オペレーションを用いてこれらの相違が
抽出されて増幅される。

【００４９】１．第１の実施例図２に示すように、本発明の好ましい実施例は、テキス
トシード及びクリッピングマスクシステムを形成し、ク
リッピングマスクの境界までテキストシードを装填す
る。

【００５０】図４は、段階７で示すようにフィルクリッ
プマスク（すなわちクリッピングマスク）の形成を示し
ている。オリジナル画像は、段階２０２及び２０４にお
いてスレッシュホールドＬＥＶＥＬ＝１を用いて２回縮
小される。それ故、１５０ピクセル／インチの入力画像
がここでは約３８ピクセル／インチの大きさになる。次
いで、システムは、段階２０６において、大きな、例え
ば、水平方向に１０個のピクセルをもつ構成要素（Ｓ
Ｅ）すなわち大きな水平ＳＥ（＝１０ｈ）を用いて、画
像をクローズし、次いで、段階２０８において大きな水
平ＳＥ（例えば、１５ｈすなわち水平方向に１５個のピ
クセルをもつ構成要素）を用いて、画像をオープンす
る。クローズは、個別のワードを合体し、オープンは、
小さな垂直方向の“フィラメントすなわち繊維状のも
の”を除去しており、後に、このマスクに、図２の段階
３で得られたシードを装填（フィル）する場合、マシン
プリントされたテキスト領域から手書きの注釈領域へ漏
れが生じないようにしている。

【００５１】図５は、段階３に示すようにテキストシー
ドを構成すると共にノイズを除去するプロセスを示して
いる。段階３０２において、オリジナル画像はスレッシ
ュホールドＬＥＶＥＬ＝２を用いて任意に縮小される。
次いで、画像は段階３０４においてＬＥＶＥＬ＝２を用
いて再び任意に縮小される。それ故、１５０ピクセル／
インチの入力画像がここでは約３８ピクセル／インチと
なる。

【００５２】段階３０６において、縮小画像は、２ｈＳ
Ｅを用いてクローズされる。段階３０８において、クロ
ーズへの入力及びそこからの出力は、段階３０８におい
て排他的オアされ、その出力は、手書きの注釈エリアに
比較的少数のピクセルをそしてマシンプリントされたテ
キストエリアに比較的多数のピクセルを有する画像とな
る。というのは、１ピクセル巾の水平ギャップがあるエ
リアのみを識別するように画像が処理されているからで
ある。特定の実施例、特に、ギャップが１ピクセルより
大きい非縮小画像には他のＳＥが使用されることを理解
されたい。

【００５３】手書きの注釈エリアにオンピクセルがまだ
含まれているような領域では、これらの領域が１ピクセ
ルのみの高さとなる傾向であり（３８ピクセル／インチ
の特定の分解能において）、従って、段階３１０におい
て小さな垂直ＳＥ（例えば、垂直方向に２つのピクセル
を持つ構成要素（ＳＥ）すなわちＳＥ＝２ｖ）でクロー
ズされ、次いで、段階３１２において若干大きな垂直Ｓ
Ｅ（例えば、３ｖ）でオープンされる。

【００５４】これにより得られた画像は、一般に、この
段階において手書きの注釈領域に数個の水平に分離され
たピクセルを含むだけであり、これらはここで実質的に
除去される。これは、水平のクローズ／オープンを実行
することにより行われる。例えば、段階３１４におい
て、画像は例えば１０ｈのＳＥでクローズされ、次い
で、例えば、３ｈのＳＥでオープンされる（段階３１
６）。それにより得られた画像は、マシンプリントされ
たテキスト領域にオンピクセルのグループを含み、手書
きの注釈領域に比較的少数のオンピクセルを含むか又は
全く含まないものとなる。

【００５５】図６は、図２の段階５のフィルクリップオ
ペレーションを詳細に示している。段階４０２におい
て、シード画像が記憶される。次いで、システムは、段
階４０４において、例えば、３ｘ３の構成要素（ＳＥ）
を使用して画像を膨張させる。段階４０４の結果は、段
階４０６において、段階２０８（図４参照）から得られ
るマスク画像とアンドされる。

【００５６】このアンドの結果は、段階４０８におい
て、例えばＸＯＲ（排他的オア）を用いてコピーされた
画像と比較され、もし画像がその前の繰り返し時から変
化していない場合には、装填（フィル）されたシードが
テキストマスクとして出力される。画像が手前の繰り返
し操作から変化した場合には、最後の繰り返し操作をコ
ピーしそして膨張段階４０４において最後の繰り返し操
作を使用してプロセスが繰り返される。

【００５７】画像の変化が停止した後の出力は、所望の
テキストを除去するように処理することのできるマスク
が出力となり、段階４１０で拡大して任意に元のスケー
ルに復帰することができる。好ましくは、その拡大の前
に膨張４０９を行い、マスクがオリジナル画像の所望の
ピクセルをカバーするようにする。

【００５８】２．第２の実施例図７ないし１０は、図３に示すオペレーションの一実施
例を詳細に示している。特に、図７は、任意の縮小段階
１の好ましい実施例を詳細に示している。特定の入力画
像は、ここでは、１５０ピクセル／インチの分解能であ
る。それより高い分解能の画像は、比例的に大きな縮小
を必要とし、一方、それより低い分解能の画像はより小
さな縮小でよいか又は適当な倍率の構造エレメントを使
用しなければならない。段階５０２において、システム
は第１のスレッシュホールド縮小を実行する。最も好ま
しい実施例によれば、第１のスレッシュホールド縮小
は、倍率２ｘ及びスレッシュホールドレベル２で行われ
る。その後、システムは、好ましくは、倍率２ｘ及びス
レッシュホールド２で第２の縮小５０４を実行し、ある
実施例においては、倍率２ｘ及びスレッシュホールドレ
ベル２で第３の縮小５０６を実行する。

【００５９】図８は段階２を詳細に示しており、所望の
テキスト部分、この場合はマシンプリントされたテキス
トが選択的に投射されそして不所望な部分が実質的に除
去される。段階５０８において、システムは、図の右側
部分に例示したＳＥを使用して縮小画像をクローズす
る。この特定例のＳＥは、長さが２の水平ＳＥである
（ＳＥの中心は十字マークで示されている）。このＳＥ
を用いて画像がクローズされると（第１の実施例と同様
に）、左及び右の両方に横に隣接する少なくとも１つの
オンピクセルをもつ全てのオフピクセルがオンにされ
る。次いで、オリジナル画像とのＸＯＲ（排他的オア）
により、クローズオペレーションによってオンにされた
ピクセルのみが残される。すなわち、段階５１０におい
て、段階５０８からの出力が段階５０８への入力と排他
的オアされ、手書きの注釈よりも実質的に大きく且つ高
密度のオンピクセル領域がマシンプリントされたテキス
トのエリアに生じる。

【００６０】或いは又、ヒット−ミスＳＥ（構成要素）
によりオリジナル画像に対してヒット−ミスオペレーシ
ョンを行うことにより上記と同じピクセルセットが抽出
され、このオペレーションは、２つの段階５０８及び５
１０に取って代わることができる。このＳＥを用いたヒ
ット−ミスオペレーションにより、１つのオフピクセル
が横方向の両側にオンピクセルを持つ位置にだけ、オン
ピクセルをもつ画像が形成される。もちろん、他のモル
フォロジーオペレーションを用いることができ、この場
合は、システムは、複数のオフピクセルが両側のオンピ
クセルによって境界定めされている領域を識別する。例
えば、図７の下部に示すように、オフピクセルが中心に
あってその両側に隣接したオンピクセルがあるヒット−
ミスＳＥが、上記と同じ機能を実行する。

【００６１】図９は、段階４に示すように所望の特徴を
合体すると共にマスクを形成するプロセスを詳細に示し
ている。段階５１０から出力される画像は、手書き領域
において水平方向に密度が薄くそして垂直方向にほとん
どの場合約１ピクセルの高さに過ぎない。それ故、段階
５１２において、段階５１０からの出力は、図示された
ＳＥ、即ち高さが２の垂直ＳＥ（２ｖ・ＳＥ）でクロー
ズされる。その後、段階５１４において、好ましくは先
行のクローズより大きな高さをもつ垂直ＳＥ、例えば、
３ｖ・ＳＥで画像がオープンされる。段階５１２のクロ
ーズは、画像のマシンプリントされたテキスト部分には
多数のピクセルがあってそれらが垂直方向に整列されそ
してその幾つかが単一ピクセルギャップによって分離さ
れる傾向にあるという点を利用している。それ故、この
ようなピクセルは、オープン動作を実行する前に互いに
合体されて、この合体された集合体は、そのオープン動
作によっては除去されない。

【００６２】その後、段階５１６において、システム
は、テキストのマシンプリントされた部分にオンピクセ
ルの長い水平線を形成するオペレーションを実行する。
図９に示す特定の実施例では、オペレーションが２０ｈ
（２０個の水平オンピクセル）ＳＥによるクローズであ
る。その後、段階５１８において、手書き部分のマップ
にある残りの数個のオンピクセルが、３ｈＳＥによるオ
ープンオペレーションを用いることにより除去される。

【００６３】図１０は、マスクを形成するのに必要な残
りの段階を示している。段階５２０において、システム
は、例えば１のスレッシュホールドを用いて画像を任意
に縮小する（２ｘ）。１５０ピクセル／インチの入力画
像を用いると、画像はここで約１９ピクセル／インチの
スケールとなる。その後、段階５２２において、画像は
大きな塗り潰した水平ＳＥ（この例では長さが５０の）
でオープンされ、その後、段階５２４において、長さが
３０の塗り潰した水平ＳＥで膨張される。

【００６４】次いで、段階５２６において、高さが６の
垂直ＳＥで画像がクローズされる。マスクを更に装填す
るためには、長さ１０のＳＥで水平の膨張が段階５２８
において実行され、その後に、高さ３のＳＥで垂直の膨
張が段階５３０において行われる。次いで、システム
は、段階５３２において拡大オペレーションを用いて１
５０ピクセル／インチの元の分解能までマスクを８倍に
拡大する。

【００６５】図１１は、システムが画像から所望のテキ
スト（この場合はマシンプリントされたテキスト）を抽
出する段階６の一実施例を示している。段階６０２にお
いて、マスクはオリジナルのビットマップ画像とアンド
される。出力は、実質的に又は完全にマシンプリントさ
れたテキストとなる。

【００６６】図１２は、手書きの注釈を抽出する技術を
示している。このプロセスによれば、段階６０２の出力
からのマシンプリントされたテキスト画像は、段階６０
４において、オリジナルビットマップ画像と排他的オア
される。このオペレーションの出力は実質的に又は完全
に手書きの注釈である。

【００６７】Ｅ．画像の高速スレッシュホールド縮小（及び拡大）効率的なセグメント化の１つの要件は、スレッシュホー
ルド縮小を迅速に実行しなければならないことである。
本発明の譲受人に譲渡され参考としてここに取り上げる
米国特許出願第０７／４４９，２６３には、画像の高速
縮小及び拡大を実行する好ましい方法及び装置が開示さ
れている。

【００６８】Ｆ．ソフトウェアの説明本書の図面の簡単な説明の前に掲載された表１〜表６に
はソフトウェアを示すプログラムが既述されている。こ
こで、表１、２及び３（版権１９９１、ゼロックス社）
は、ここに開示する本発明の第１の実施例を実現するプ
ログラムスクリプトであり、そして表４及び５（版権１
９９１、ゼロックス社）は、ここに開示する本発明の第
２の実施例を実現するプログラムスクリプトを示してい
る。これらのプログラムスクリプトは、“Ｃ”言語で書
かれた手順によって画像の変換を実行するインタープリ
テータにより逐次に実行される。表６は、スクリプトの
呼び出しに基づいてＣコンピュータプログラムで行われ
る動作を示している。ここに使用する特定のオペレーシ
ョン、例えば、クローズ、オープン、等についてのルー
チンは、参考としてここに取り上げる米国特許第０７／
４４９，２６３に開示されている。

【００６９】これらのプログラムはサン・ワークステー
ションにおいてデモンストレーションされているが、本
発明の範囲から逸脱せずに本明細書の開示に基づいて種
々のプログラミング言語及びハードウェア構成を容易に
使用できることが当業者に明らかであろう。更に、ここ
では、本発明を主としてプログラム式デジタルコンピュ
ータでの実施について説明したが、他の実施も容易に明
らかであろう。例えば、本発明は、個別ハードウェアコ
ンポーネントや、又はハードウェアコンポーネントとソ
フトウェアコンポーネントとの組み合わせのような他の
デジタル処理システムにおいて実施するすることもでき
る。

【００７０】Ｇ．種々の実施例１．第１の実施例図１３ないし２３は、本発明の第１の実施例のオペレー
ションを示している。図１３は、マシンプリントされた
テキスト領域及び種々の手書きを含むオリジナル画像で
ある。手書きは一般に小さな文字であり、これは、手書
き資料を見掛け上機械文字に類似させることが予想され
る。又、画像は、５つの異なった形態の手書きを含んで
いる。上部の手書きの部分は、プリントと手書きの混合
である。上から２番目のサンプルにおいては、完全な筆
記体の手書きが含まれている。上から３番目の手書き領
域では、マシンプリントされたテキスト付近の小さなブ
ランクスペースに手書きがプリントされている。上から
４番目の手書き領域では、文字がごちゃごちゃのブロッ
ク頭文字で最初にプリントされそして非常にきれいなブ
ロック頭文字でプリントされている。最後の手書きサン
プル（下部）では、手書きが適度に分かれた文字でより
きれいに手書きされている。

【００７１】デモンストレーションに使用した画像の分
解能は、１５０ピクセル／インチである。これは、１５
０ピクセル／インチで走査するか又は３００ピクセル／
インチで走査して倍率２で縮小することにより形成する
ことができる。図１３に示す特定の画像は、倍率２で且
つスレッシュホールドレベル２のスレッシュホールド縮
小を使用して得ている。

【００７２】図１４は、縮小段階３０２及び３０４の後
のシードのフォーマットで示している。図示されたよう
に、手書きの注釈は、両側でオフピクセルによって横方
向に境界定めされた低密度のオンピクセルを含む傾向で
ある。図１５は、クローズ／排他的オア段階３０６及び
３０８の後の画像を示している。この画像は、ここで
は、手書きの注釈領域に比較的少数のオンピクセルを含
んでいる。

【００７３】図１６は、クローズ／オープン段階３１０
及び３１２の後の画像を示しており、これらは、高さが
約１ピクセル以下のピクセルグループを除去することに
より手書きの注釈における残りのピクセルのほとんどを
除去するのに使用される。ここでは、画像は手書きの注
釈エリアに非常に少数のピクセルしか含まない。

【００７４】図１７は、次の段階３１２及び３１４の後
の画像を示している。このクローズ／オープンは、手書
きの注釈領域にある残りのピクセルを除去しそしてオン
ピクセルのグループを塗り潰し、シードとして使用され
る画像を生じる傾向である。

【００７５】図１８は、段階２０２ないし２０８でクリ
ッピングマスクを形成した後の画像を示している。図示
されたように、画像は、手書きの注釈及びマシンプリン
トテキストの両方をカバーするオンピクセルの大きな領
域を含む。

【００７６】図１９は、シードをフィルクリップマスク
にフィルクリップすることにより形成されたセグメント
化マスク（膨張４０９の前）を示している。図示された
ように、セグメント化マスクは、所望のマシンプリント
領域をカバーするオンピクセルを主として含んでいる。
図２０に示すように、その後の膨張により、これら領域
が実質的に完全にカバーされる。

【００７７】図２１は、図１１に示すようにマシンプリ
ントテキストを抽出した後の画像を示している。図示さ
れたように、手書きの注釈は残されていない。図２２
は、図１２に示すように形成された手書きの注釈画像を
示している。図示されたように、プロセスは手書きの注
釈のみを抽出するようにほぼ完全に作用する。“１．”
及び“２．Background”は、効果的な分離を行うにはお
そらくシード資料が不充分な密度であった（それらのサ
イズが比較的大きいことにより）。図２３は、識別され
たマシンプリントテキストの輪郭がセグメント化マスク
で示された画像を示している。

【００７８】２．第２の実施例図２４は、段階５０２ないし５０６に示すように２分の
１に縮小された同じオリジナル画像を示している。各々
の縮小において、スレッシュホールド２のスレッシュホ
ールド縮小が使用された。手書きの注釈は、この分解能
ではマシンプリントされたテキストとは著しく異なる織
り状態を有している。この相違が利用される。特に、マ
シンプリントされたテキストは、その左側及び右側にお
いてオンピクセルにより取り囲まれたオフピクセルの密
度が手書きの注釈より大きい。

【００７９】この相違に基づいてピクセルを抽出するた
めに、画像が長さ２の水平ＳＥでクローズされ、次い
で、その結果がオリジナルの縮小画像と排他的オアされ
る。それにより得られた画像が図２５に示されている。
図２５から明らかなように、実際に、ピクセルは、マシ
ンプリントされた部分においてかなり高密度でありそし
て手書きの部分において非常に希薄である。特に注目す
べきことは、図２５の手書き部分内のピクセルは、水平
方向に希薄であり、そして垂直方向には典型的に１ピク
セルの高さしかない。

【００８０】次の２つのオペレーションを実行すること
により、残りの手書きピクセルのほとんどが除去され
て、図２６の画像が形成される。１．高さ２の垂直ＳＥでクローズする。２．高さ３の垂直ＳＥでオープンする。

【００８１】最初にクローズを実行する理由は、マシン
プリントされた部分には多数のピクセルがあって垂直方
向に整列されているが単一ピクセルギャップで分離され
ているからである。オープンを実行する前にこれらのピ
クセルを一緒に接合することが重要である。

【００８２】図２６は、ＩＢＭカードのパンチマークの
ようである。この図について重要なことは、手書き領域
に非常に僅かなピクセルしかないことである。更に、マ
シンプリントされたテキスト領域のピクセルは、カバー
マスクを構成するに充分なほど高密度である。

【００８３】図２７は、次の一連の段階後の画像を示し
ている。これは、大きな水平方向クローズを行い（長さ
２０のＳＥを用いて）、その後、小さな水平方向オープ
ンを行う（長さ３のＳＥを用いて）ことにより形成され
たものである。クローズは、マシンプリントされた領域
内に長い水平の線を形成し、そしてオープンは、手書き
領域内に存在する最終的な少数のピクセルを除去する。

【００８４】ここで、画像はもう一度縮小されるが、こ
のときにはスレッシュホールド１を用いて１９ピクセル
／インチの分解能まで縮小される。これに続いて、非常
に大きなＳＥでモルフォロジーオペレーションが行われ
る。大きなＳＥを使用する理由は、図２７のピクセルで
スタートして、全てのマシンプリントテキストをカバー
するマスクを形成する必要があるからである。大きな水
平ＳＥ（長さ５０の）でオープンした後に、長さ３０の
水平ＳＥで膨張することにより行われる。その結果が図
２８に示されており、ピクセルは約１９ピクセル／イン
チの“ビッグピクセル”表示とされ、オリジナルにおけ
る１９ピクセル／インチのサンプリング密度を表す。

【００８５】この画像は、ここで垂直方向にクローズし
なければならず、これは、高さ６の垂直ＳＥでクローズ
することによって行われる。更にマスクに装填するため
に、長さ１０のＳＥで水平の膨張が次に行われ、その
後、高さ３のＳＥで垂直の膨張が行われる。これによ
り、図２９に示したマスクが得られる。この場合も、図
示されたピクセルは、オリジナルにおける１９ピクセル
／インチのサンプリング密度に対応し、これらはほぼ同
じ密度で再現され、その結果がほぼオリジナルのサイズ
で現れる。図２８及び２９の下部では数本のピクセル線
がカットされていることに注意されたい。

【００８６】図２９のマスクは、次いで、８倍に拡大さ
れ、１５０ピクセル／インチのオリジナル分解能とな
る。図３０は、このマスクとオリジナルをアンドし、オ
リジナルからのマシンプリントされたテキストのほとん
どを、手書きの注釈の僅かなものと共に抽出したときに
得られる結果を示している。図３１に示す手書きの注釈
は、図３０と図１の排他的オアをとることにより形成さ
れる。図２９は、本発明の有効性を更に説明するため
に、オリジナル画像と拡大されたマスクとの重畳を示し
ている。

【００８７】Ｈ．結論手書きの注釈をマシンプリントされたテキストからいか
に分離するかについて説明した。この分離は、次の２つ
の段階で行われる。即ち、１）２つの形式の筆跡間にお
ける織り状特性の相違を用いて、マシンプリントテキス
トがあった領域にオンピクセルのみを有する画像を形成
し、そして２）この画像を処理してこれら領域上に塗り
潰しマスクを形成する。

【００８８】好ましい実施例では、モルフォロジー処理
又はオペレーション及びスレッシュホールド縮小が使用
された。更に、好ましい実施例では、画像の全ての又は
相当の部分が実質的に同時に処理される。ここで使用す
るモルフォロジー処理又はオペレーションは、適当な画
像処理技術の設計に容易に使用できるようにする多数の
特殊な特性を有している。まず、第１に、これらは実質
上変換的には不変である。変換前の画像の側部へのシフ
トは、結果を変更しないが、それをシフトする。変換的
に不変なオペレーションは、画像の各点が同じルールを
用いて処理されるという点で高度な平行性で実施するこ
とができる。

【００８９】上記説明は、本発明を解説するためのもの
であって、これに限定するものではない。上記説明か
ら、本発明の種々の変更が当業者に明らかであろう。例
えば、特定のモルフォロジー処理又はオペレーション、
ＳＥ、及び倍率について説明したが、他のシーケンス、
及び構造エレメントの他のサイズ及び形状でも適度に良
好な結果をもたらす。上記方法は、当業者によって実施
できる変形態様を示すものである。それ故、本発明の範
囲は、上記の説明に限定されず、特許請求の範囲によっ
て限定されるものとする。

【図面の簡単な説明】

【図１】本発明の全体的なブロック図で、本発明を実施
する１つのハードウェアシステムを示すブロック図であ
る。

【図２】本発明の動作を示す全体的なフローチャートで
ある。

【図３】本発明の動作を示す全体的なフローチャートで
ある。

【図４】フィルクリップマークを形成する方法を示す図
である。

【図５】マシンプリントされたテキストシードの形成を
示す図である。

【図６】シードをフィルクリップマスクにフィルクリッ
ピングするところを示す図である。

【図７】マスク形成の別の実施例を示す図である。

【図８】マスク形成の別の実施例を示す図である。

【図９】マスク形成の別の実施例を示す図である。

【図１０】マスク形成の別の実施例を示す図である。

【図１１】マシンプリントされたテキスト及び手書きの
注釈画像を形成するところを示す図である。

【図１２】マシンプリントされたテキスト及び手書きの
注釈画像を形成するところを示す図である。

【図１３】本発明の第１実施例のオペレーション例を示
す図である。

【図１４】本発明の第１実施例のオペレーション例を示
す図である。

【図１５】本発明の第１実施例のオペレーション例を示
す図である。

【図１６】本発明の第１実施例のオペレーション例を示
す図である。

【図１７】本発明の第１実施例のオペレーション例を示
す図である。

【図１８】本発明の第１実施例のオペレーション例を示
す図である。

【図１９】本発明の第１実施例のオペレーション例を示
す図である。

【図２０】本発明の第１実施例のオペレーション例を示
す図である。

【図２１】本発明の第１実施例のオペレーション例を示
す図である。

【図２２】本発明の第１実施例のオペレーション例を示
す図である。

【図２３】本発明の第１実施例のオペレーション例を示
す図である。

【図２４】本発明の第２実施例のオペレーション例を示
す図である。

【図２５】本発明の第２実施例のオペレーション例を示
す図である。

【図２６】本発明の第２実施例のオペレーション例を示
す図である。

【図２７】本発明の第２実施例のオペレーション例を示
す図である。

【図２８】本発明の第２実施例のオペレーション例を示
す図である。

【図２９】本発明の第２実施例のオペレーション例を示
す図である。

【図３０】本発明の第２実施例のオペレーション例を示
す図である。

【図３１】本発明の第２実施例のオペレーション例を示
す図である。

【図３２】本発明の第２実施例のオペレーション例を示
す図である。

【符号の説明】

１００システム１０２文書１０３スキャナ１０５ファイル記憶ユニット１０６プロセッサ１０８ハードウェア

───────────────────────────────────────────────────── フロントページの続き (56)参考文献中村納外３名，「欧文テキスト画像における文字領域の抽出アルゴリズム」電子通信学会論文誌 ’83／４Ｖｏｌ．Ｊ66−ＤＮｏ．４，ｐ．437− 444 ＨＡＲＡＬＩＣＫｅｔａｌ．, 「ＩｍａｇｅＡｎａｌｙｓｉｓＵｓｉｎｇＭａｔｈｅｍａｔｉｃａｌＭｏｒｐｈｏｌｏｇｙ」，ＩＥＥＥＴＲＡＮＳＡＣＴＩＯＮＳＯＮＰＡＴＴＥＲＮＡＮＡＬＹＳＩＳＡＮＤＭＡＣＨＩＮＥＩＮＴＥＬＬＩＧＥＮＣＥ，ＶＯＬ．ＰＡＭＩ−９，ＮＯ．４, 1987年７月，ｐ．532−550

Claims

(57)【特許請求の範囲】

【請求項１】デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記処理段階は、前記マシンプリントされたテキストを
選択的に識別する構成要素を用いて、前記マシンプリン
トされたテキスト領域を、第１の中間画像を形成するよ
うに識別する段階を含んでおり、前記識別段階は、ａ）２つの水平に隣接するオンピクセルを有する構成要
素を用いて、前記第１の中間画像を、第２の中間画像を
生成するようにクローズ処理する段階と、ｂ）前記入力画像と前記第２の中間画像との排他的オア
をとる段階とを備えていることを特徴とする方法。
【請求項２】デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記処理段階は、前記マシンプリントされたテキストを
選択的に識別する構成要素を用いて、前記マシンプリン
トされたテキスト領域を、第１の中間画像を形成するよ
うに識別する段階を含んでおり、更に、ａ）少なくとも２つの垂直方向に隣接したオンピクセル
を有する構成要素を用いて前記第１の中間画像をクロー
ズ処理する段階と、ｂ）少なくとも２つの垂直方向に隣接したオンピクセル
を有する構成要素を用いて前記第１の中間画像をオープ
ン処理する段階と含んでいることを特徴とする方法。
【請求項３】デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記処理段階は、前記マシンプリントされたテキストを
選択的に識別する構成要素を用いて、前記マシンプリン
トされたテキスト領域を、第１の中間画像を形成するよ
うに識別する段階を含んでおり、更に、複数の横方向に隣接するオンピクセルを有する構成要素
を用いて、前記第１中間画像を、第２の中間画像を生成
するようにクローズ処理し及びオープン処理することに
より、該第１中間画像からマスクを形成する段階を含ん
でいることを特徴とする方法。
【請求項４】請求項３に記載の方法において、更に、ａ）前記第２の中間画像のスレッシュホールド縮小を実
行する段階と、ｂ）前記段階ａ）の出力を水平の構成要素を用いてオー
プン処理する段階と、ｃ）前記段階ｂ）の出力を水平の構成要素を用いて膨張
処理する段階と、ｄ）前記段階ｃ）の出力を垂直の構成要素を用いてクロ
ーズ処理する段階と、ｅ）前記段階ｄ）の出力を水平の構成要素を用いて膨張
処理する段階と、ｆ）前記段階ｅ）の出力を垂直の構成要素を用いて膨張
処理する段階とを含むことを特徴とする方法。
【請求項５】デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、前記マスクは、ａ）実質的に前記マシンプリントされたテキスト領域の
みにおけるシードピクセルを抽出する段階と、ｂ）前記マシンプリントされたテキスト領域上のオンピ
クセルの実質的に塗り潰し領域から構成されるクリッピ
ングマスクを形成する段階を含んでいて、該クリッピン
グマスクに前記シードピクセルをフィルする段階とによ
って形成され、前記クリッピングマスクを形成する段階は、ｉ）前記段階ａ）の出力を水平の構成要素を用いてクロ
ーズ処理する段階と、ｉｉ）前記段階ｂ）の出力を水平の構成要素を用いてオ
ープン処理するする段階とを含むことを特徴とする方
法。
【請求項６】請求項５に記載の方法において、前記入
力画像を縮小する段階を先に行うことを特徴とする方
法。
【請求項７】請求項５に記載の方法において、前記ク
ローズ処理段階及びオープンする処理段階を、３以上の
隣接オンピクセルをもつ水平の構成要素を使用して行う
ことを特徴とする方法。
【請求項８】デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、前記マスクは、実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを、各側縁がオンピクセルによっ
て境界付けられたオフピクセルを有する前記画像の領域
を識別することによって、抽出する段階と、前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階とに
よって形成されることを特徴とする方法。
【請求項９】請求項８に記載の方法において、更に、
前記抽出段階の前に前記入力画像を縮小する段階が設け
られることを特徴とする方法。
【請求項１０】デジタル処理手段において、手書きの
注釈領域と、マシンプリントされたテキスト領域とを有
する入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、前記マスクは、実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを抽出する段階であって、ａ）前
記入力画像をクローズ処理する段階と、ｂ）前記段階
ａ）の出力と前記入力画像との排他的オアをとる段階と
を含むピクセル抽出段階と、前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階とに
よって形成されることを特徴とする方法。
【請求項１１】デジタル処理手段において、手書きの
注釈領域と、マシンプリントされたテキスト領域とを有
する入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、前記マスクは、実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを、前記画像をヒット−ミス構成
要素を用いて処理することにより、抽出する段階と、前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階と、によって形成されることを特徴とする方法。
【請求項１２】デジタル処理手段において、手書きの
注釈領域と、マシンプリントされたテキスト領域とを有
する入力画像の手書きの注釈領域を識別する方法であっ
て、複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、前記マスクは、実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを抽出する段階と、前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階とか
ら形成され、前記フィル段階は、ａ）入力画像を記憶する段階と、ｂ）前記入力画像を膨張処理する段階と、ｃ）前記段階ｂ）の出力と前記クリッピングマスクとの
アンドをとる段階と、ｄ）前記段階ｃ）の出力を、前記段階ａ）の記憶画像と
比較する段階と、ｅ）前記段階ａ）の記憶画像と前記段階ｃ）の出力との
違いが所定量以下である場合には、前記段階ｃ）の出力
をマスクとして出力し、前記段階ａ）の記憶画像と前記
段階ｃ）の出力が所定量を越えて異なる場合には、前記
段階ａ）の出力を前記入力画像として用いて段階ａ）へ
戻す段階とから成ることを特徴とする方法。