JP2930460B2 - 手書き及びマシン印字テキストの区分化方法 - Google Patents
手書き及びマシン印字テキストの区分化方法Info
- Publication number
- JP2930460B2 JP2930460B2 JP3324241A JP32424191A JP2930460B2 JP 2930460 B2 JP2930460 B2 JP 2930460B2 JP 3324241 A JP3324241 A JP 3324241A JP 32424191 A JP32424191 A JP 32424191A JP 2930460 B2 JP2930460 B2 JP 2930460B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- machine
- mask
- area
- printed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/24—Character recognition characterised by the processing or recognition method
- G06V30/242—Division of the character sequences into groups prior to recognition; Selection of dictionaries
- G06V30/244—Division of the character sequences into groups prior to recognition; Selection of dictionaries using graphical properties, e.g. alphabet type or font
- G06V30/2455—Discrimination between machine-print, hand-print and cursive writing
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Character Input (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
【0001】
【産業上の利用分野】本発明は、画像処理の分野に係
る。更に詳しくは、本発明は、画像内のマシン印字(プ
リント)されたテキストと手書きの注釈を識別及び/又
は分離する方法に係る。
る。更に詳しくは、本発明は、画像内のマシン印字(プ
リント)されたテキストと手書きの注釈を識別及び/又
は分離する方法に係る。
【0002】
【従来の技術】多数の文書及びそれらの画像は、マシン
プリントされたテキスト及び手書きの注釈の両方を含ん
でいる。手書きの注釈に対応する走査画像の領域を識別
できることが有用である。例えば、現在のOCRシステ
ムは、手書き部分が個人個人で違っているため、画像内
の手書きの注釈を正確に識別することができない。この
ようなテキストが従来のOCRシステムに送られると、
かかるシステムは使用不能の結果をしばしば生じる。こ
のようなシステムの性能は、手書き領域を識別してその
手書き領域をOCRで処理するのを回避できれば、改善
することができよう。
プリントされたテキスト及び手書きの注釈の両方を含ん
でいる。手書きの注釈に対応する走査画像の領域を識別
できることが有用である。例えば、現在のOCRシステ
ムは、手書き部分が個人個人で違っているため、画像内
の手書きの注釈を正確に識別することができない。この
ようなテキストが従来のOCRシステムに送られると、
かかるシステムは使用不能の結果をしばしば生じる。こ
のようなシステムの性能は、手書き領域を識別してその
手書き領域をOCRで処理するのを回避できれば、改善
することができよう。
【0003】一方、文書上にある手書きの注釈を識別し
そして検索することは、あるときには重要である。例え
ば、画像のファイリングシステムは、手書きの注釈(及
びその座標データ)を、ビットマップデータとしてセー
ブし、用途に適したやり方でユーザにフィードバックす
ることができる。
そして検索することは、あるときには重要である。例え
ば、画像のファイリングシステムは、手書きの注釈(及
びその座標データ)を、ビットマップデータとしてセー
ブし、用途に適したやり方でユーザにフィードバックす
ることができる。
【0004】
【発明が解決しようとする課題】手書きの注釈及びマシ
ン印字されたテキストを分離する公知の方法は、ある程
度の成功を収めているが、種々の制約がある。公知のあ
るものは、高価で、複雑で、及び/又は信頼性が低い装
置を必要とし、一方、他の技術は、著しい量のコンピュ
ータメモリ、コンピュータ時間、等を必要とする。ある
方法は、手書きの注釈の検出及び分離の信頼性が低い。
ン印字されたテキストを分離する公知の方法は、ある程
度の成功を収めているが、種々の制約がある。公知のあ
るものは、高価で、複雑で、及び/又は信頼性が低い装
置を必要とし、一方、他の技術は、著しい量のコンピュ
ータメモリ、コンピュータ時間、等を必要とする。ある
方法は、手書きの注釈の検出及び分離の信頼性が低い。
【0005】そこで、手書きの注釈の存在を検出し、そ
してもし存在すれば、それを文書又は画像内のマシン印
字されたテキストから分離する改良された方法及び装置
が所望される。
してもし存在すれば、それを文書又は画像内のマシン印
字されたテキストから分離する改良された方法及び装置
が所望される。
【0006】
【課題を解決するための手段】本願は、画像又は文書内
の手書きの注釈とマシン印字されたテキストとを識別
し、光学的に分離する方法及び装置について以下に開示
する。本発明の方法によれば、比較的限られた量のコン
ピュータメモリ及び処理時間しか必要としない一方、信
頼性の高い結果を生じると共に、比較的安価なハードウ
ェアしか必要としない。
の手書きの注釈とマシン印字されたテキストとを識別
し、光学的に分離する方法及び装置について以下に開示
する。本発明の方法によれば、比較的限られた量のコン
ピュータメモリ及び処理時間しか必要としない一方、信
頼性の高い結果を生じると共に、比較的安価なハードウ
ェアしか必要としない。
【0007】本発明は、デジタル処理手段において、手
書きの注釈領域と、マシンプリントされたテキスト領域
とを有する入力画像のうちの手書きの注釈領域を識別す
る方法を提供し、この方法は、複数の手書き及びマシン
プリントされた文字を有する上記入力画像の領域を、モ
ルフォロジーを用いて処理する段階を含み、このモルフ
ォロジー処理によって、実質的にマシンプリントされた
テキストか又は手書きの注釈領域のみを識別するための
マスク画像を形成することを特徴とする。
書きの注釈領域と、マシンプリントされたテキスト領域
とを有する入力画像のうちの手書きの注釈領域を識別す
る方法を提供し、この方法は、複数の手書き及びマシン
プリントされた文字を有する上記入力画像の領域を、モ
ルフォロジーを用いて処理する段階を含み、このモルフ
ォロジー処理によって、実質的にマシンプリントされた
テキストか又は手書きの注釈領域のみを識別するための
マスク画像を形成することを特徴とする。
【0008】本発明の特徴及び効果は、添付図面を参照
した以下の詳細な説明より理解されよう。
した以下の詳細な説明より理解されよう。
【0009】
目次 A.定義と用語 B.発明の全体的な説明 C.発明の詳細な説明 1.第1実施例 2.第2実施例 E.スレッシュホールドによる画像の高速縮小(及び拡
大) F.ソフトウェアの説明 G.発明の例 1.第1実施例 2.第2実施例 H.結論
大) F.ソフトウェアの説明 G.発明の例 1.第1実施例 2.第2実施例 H.結論
【0010】A.定義と用語 以下、2値画像について説明する。この説明の中で、
“画像”という用語は、ピクセルから成る二次元データ
構造体の表示を意味する。2値画像とは、所与のピクセ
ルが“オン”又は“オフ”である画像を意味する。2値
画像は、出力画像に1つ以上の入力画像をマップする多
数のオペレーションに従って処理される。このようなオ
ペレーションの結果を一般的に画像と称する。処理過程
の起点にある画像は、場合によりオリジナル画像と称す
ることもある。
“画像”という用語は、ピクセルから成る二次元データ
構造体の表示を意味する。2値画像とは、所与のピクセ
ルが“オン”又は“オフ”である画像を意味する。2値
画像は、出力画像に1つ以上の入力画像をマップする多
数のオペレーションに従って処理される。このようなオ
ペレーションの結果を一般的に画像と称する。処理過程
の起点にある画像は、場合によりオリジナル画像と称す
ることもある。
【0011】ピクセルは、通常、黒ならば“オン”、白
ならば“オフ”と定義する。黒をオンと表し、白をオフ
と表すことは、ほとんどの文書が黒の前景と白の背景を
持っているという事実を示している。本発明の技術はネ
ガテイブ画像にも適用できる。白地に黒について説明す
るが、オン又はオフという用語は、反転した画像にも等
しく適用でき、この場合、これら2つの状態の役割が互
いに逆になる。ある場合には“ドント・ケア(don't ca
re) ”ピクセルについても説明するが、これはオン又は
オフのいずれかのピクセルである。本発明は、グレイス
ケール画像に対しても同様に適用できるが、ここでは説
明を簡略化する目的で2値画像のみに限定して説明す
る。グレイスケール画像の場合には、オンはスレッシュ
ホールドより上のピクセルを、オフはスレッシュホール
ドの下のピクセルを表す。
ならば“オフ”と定義する。黒をオンと表し、白をオフ
と表すことは、ほとんどの文書が黒の前景と白の背景を
持っているという事実を示している。本発明の技術はネ
ガテイブ画像にも適用できる。白地に黒について説明す
るが、オン又はオフという用語は、反転した画像にも等
しく適用でき、この場合、これら2つの状態の役割が互
いに逆になる。ある場合には“ドント・ケア(don't ca
re) ”ピクセルについても説明するが、これはオン又は
オフのいずれかのピクセルである。本発明は、グレイス
ケール画像に対しても同様に適用できるが、ここでは説
明を簡略化する目的で2値画像のみに限定して説明す
る。グレイスケール画像の場合には、オンはスレッシュ
ホールドより上のピクセルを、オフはスレッシュホール
ドの下のピクセルを表す。
【0012】“モルフォロジーを用いた処理又はオペレ
ーション”とは、ピクセルマップ画像(“入力”画像)
に対して行う処理又はオペレーションを意味し、これ
は、各ピクセルにおいて、以下に示す“膨張”や“エロ
ション”や“オープン”や“クローズ”等の個別の処理
又はオペレーションを、以下に示す“構成要素(S
E)”を用いて実行し、別のピクセルマップ画像すなわ
ち“マスク画像”を形成するものである。上記のマスク
画像は、実行すべき所望のモルフォロジー処理の形式
と、選択された“構成要素(SE)”とによって決ま
る。なお、このモルフォロジー処理又はオペレーション
について紹介する以下の論文がある。Haralick et al,.
「Image Analysis Using Mathematical Morphology」,
IEEETransactions On Pattern Analysis And Machine I
ntelligence, Vol. PAMI-9,No. 4, 1987年 7月, p. 532
-550。
ーション”とは、ピクセルマップ画像(“入力”画像)
に対して行う処理又はオペレーションを意味し、これ
は、各ピクセルにおいて、以下に示す“膨張”や“エロ
ション”や“オープン”や“クローズ”等の個別の処理
又はオペレーションを、以下に示す“構成要素(S
E)”を用いて実行し、別のピクセルマップ画像すなわ
ち“マスク画像”を形成するものである。上記のマスク
画像は、実行すべき所望のモルフォロジー処理の形式
と、選択された“構成要素(SE)”とによって決ま
る。なお、このモルフォロジー処理又はオペレーション
について紹介する以下の論文がある。Haralick et al,.
「Image Analysis Using Mathematical Morphology」,
IEEETransactions On Pattern Analysis And Machine I
ntelligence, Vol. PAMI-9,No. 4, 1987年 7月, p. 532
-550。
【0013】画像の“塗り潰し領域”とは、多数のピク
セルが一次元的又は二次元的に延びている領域であっ
て、その中の実質的に全てのピクセルがオンであるよう
な領域を指す。
セルが一次元的又は二次元的に延びている領域であっ
て、その中の実質的に全てのピクセルがオンであるよう
な領域を指す。
【0014】画像の“織り目状(テクスチャ状)領域”
とは、オンピクセル及びオフピクセルの比較的微細な粒
状パターンを含む領域を指す。織り目状領域の例は、ハ
ーフトーン領域或いは点画状の領域である。
とは、オンピクセル及びオフピクセルの比較的微細な粒
状パターンを含む領域を指す。織り目状領域の例は、ハ
ーフトーン領域或いは点画状の領域である。
【0015】AND、OR又はXORは、2つの画像の
間でピクセルごとに行われる論理演算であり、ANDは
アンド、ORはオア、XORは排他的オアである。
間でピクセルごとに行われる論理演算であり、ANDは
アンド、ORはオア、XORは排他的オアである。
【0016】NOTは、単一の画像に対してピクセルご
とに実行される論理演算である。
とに実行される論理演算である。
【0017】“拡大”とは、倍率Nを特徴とする倍率オ
ペレーションであり、入力画像の各ピクセルは、オリジ
ナルのピクセルと全て同じ値を有するNxN個のピクセ
ルの方形となる。
ペレーションであり、入力画像の各ピクセルは、オリジ
ナルのピクセルと全て同じ値を有するNxN個のピクセ
ルの方形となる。
【0018】“縮小”とは、倍率N及びスレッシュホー
ルドレベルMを特徴とする倍率オペレーションである。
倍率Nでの縮小は、ソース画像をNxN個のピクセルの
方形に分割し、ソース画像内のこのような各方形を出力
画像上の単一ピクセルへとマッピングすることを含む。
出力画像におけるピクセルの値は、スレッシュホールド
レベルMによって決定され、これは、1とN2 との間の
数である。ピクセル方形におけるオンピクセルの数がM
に等しいか又はそれより大きい場合には、出力画像のピ
クセルがオンであり、小さい場合には、オフである。
ルドレベルMを特徴とする倍率オペレーションである。
倍率Nでの縮小は、ソース画像をNxN個のピクセルの
方形に分割し、ソース画像内のこのような各方形を出力
画像上の単一ピクセルへとマッピングすることを含む。
出力画像におけるピクセルの値は、スレッシュホールド
レベルMによって決定され、これは、1とN2 との間の
数である。ピクセル方形におけるオンピクセルの数がM
に等しいか又はそれより大きい場合には、出力画像のピ
クセルがオンであり、小さい場合には、オフである。
【0019】“サブサンプリング”とは、入力画像をそ
れより小さい(典型的には方形の)エレメントに細分化
しそして入力画像内の各エレメントを出力画像内のより
小さなエレメントにマッピングするオペレーションを意
味する。出力画像の各エレメントのピクセル値は、入力
画像エレメントにおけるピクセルの選択されたサブセッ
トによって決められる。典型的に、サブサンプリングで
は、出力先ピクセルの値を入力画像エレメントからの選
択されたピクセルと同じにして単一ピクセルへとマッピ
ングすることを含む。選択は、予め定められたものでも
よいし(例えば、左上のピクセル)又はランダムであっ
てもよい。
れより小さい(典型的には方形の)エレメントに細分化
しそして入力画像内の各エレメントを出力画像内のより
小さなエレメントにマッピングするオペレーションを意
味する。出力画像の各エレメントのピクセル値は、入力
画像エレメントにおけるピクセルの選択されたサブセッ
トによって決められる。典型的に、サブサンプリングで
は、出力先ピクセルの値を入力画像エレメントからの選
択されたピクセルと同じにして単一ピクセルへとマッピ
ングすることを含む。選択は、予め定められたものでも
よいし(例えば、左上のピクセル)又はランダムであっ
てもよい。
【0020】“4連結”とは、オンピクセルのセットで
あって、そのセット内の任意の2つのピクセル間に経路
を見出せるようになっていて、この経路は、(1)その
セット内に完全に存在しそして(2)その段が4つの水
平又は垂直方向のいずれかにおける一連の1ピクセル段
で構成されるものをいう。
あって、そのセット内の任意の2つのピクセル間に経路
を見出せるようになっていて、この経路は、(1)その
セット内に完全に存在しそして(2)その段が4つの水
平又は垂直方向のいずれかにおける一連の1ピクセル段
で構成されるものをいう。
【0021】“8連結”とは、オンピクセルのセットで
あって、そのセット内の任意の2つのピクセル間に経路
を見出せるようになっていて、この経路は、(1)その
セット内に完全に存在しそして(2)その段が8つの水
平、垂直又は対角方向のいずれかにおける一連の1ピク
セル段で構成されるものをいう。
あって、そのセット内の任意の2つのピクセル間に経路
を見出せるようになっていて、この経路は、(1)その
セット内に完全に存在しそして(2)その段が8つの水
平、垂直又は対角方向のいずれかにおける一連の1ピク
セル段で構成されるものをいう。
【0022】“手書きの注釈”とは、人間がペンや鉛筆
等を用いて書くことによって最初に形成された文書又は
画像の部分をいうが、このように書いたものを機械で再
現したもの、例えば、ゼロックス複写、プリント再現、
等も意味する。これにより得られる画像は、マシンプリ
ントしたテキストの70%、80%、90%、95%、
97%、99%或いはそれ以上の部分をオリジナル画像
から除去して大部分の手書きの注釈を残すようにしたと
きに、実質的に手書きの注釈のみを含む。
等を用いて書くことによって最初に形成された文書又は
画像の部分をいうが、このように書いたものを機械で再
現したもの、例えば、ゼロックス複写、プリント再現、
等も意味する。これにより得られる画像は、マシンプリ
ントしたテキストの70%、80%、90%、95%、
97%、99%或いはそれ以上の部分をオリジナル画像
から除去して大部分の手書きの注釈を残すようにしたと
きに、実質的に手書きの注釈のみを含む。
【0023】“マシンプリントしたテキスト”とは、例
えば、コンピュータのプリンタや印刷機等のプリンタに
よってしばしば発生される非常に規則的な文字及びスペ
ースを含む文書又は画像のプリント部分を指す。画像
は、手書きの注釈の70%、80%、90%、95%、
97%、99%或いはそれ以上の部分をオリジナル画像
から除去して大部分のマシンプリントテキストを残すよ
うにしたときに、実質的にマシンプリントしたテキスト
のみを含む。
えば、コンピュータのプリンタや印刷機等のプリンタに
よってしばしば発生される非常に規則的な文字及びスペ
ースを含む文書又は画像のプリント部分を指す。画像
は、手書きの注釈の70%、80%、90%、95%、
97%、99%或いはそれ以上の部分をオリジナル画像
から除去して大部分のマシンプリントテキストを残すよ
うにしたときに、実質的にマシンプリントしたテキスト
のみを含む。
【0024】“線隣接グラフ”(LAG)とは、一般的
に3レベルのハイアラーキ構成であるツリーの形態を有
している2値画像を表すデータ構造体である。3つのレ
ベルとは、(1)1本の走査線における隣接オンピクセ
ルの連続体、(2)これらの連続体を繋いだものより成
るストローク、及び(3)これらのストロークを繋いだ
ものより成るアイソレートされたマーク(例えば、文
字)である。
に3レベルのハイアラーキ構成であるツリーの形態を有
している2値画像を表すデータ構造体である。3つのレ
ベルとは、(1)1本の走査線における隣接オンピクセ
ルの連続体、(2)これらの連続体を繋いだものより成
るストローク、及び(3)これらのストロークを繋いだ
ものより成るアイソレートされたマーク(例えば、文
字)である。
【0025】“構成要素すなわちSE”とは、典型的に
は(必ずしもそうではないが)サイズが小さくそして形
状が簡単な画像オブジェクト(典型的にはピクセルの集
合体)であって、入力画像を検知し、選択したモルフォ
ロジー処理によって入力画像から種々の形式の情報を抽
出するような画像オブジェクトをいう。最も典型的な構
成要素(SE)は、ピクセルの小さいブロックであり、
入力画像の各ピクセルに重ね合わせて入力画像を検知す
る。各図面において、塗り潰した円(黒丸)が“ヒッ
ト”であり、開いた円(白丸)が“ミス”である。構成
要素(SE)の中心位置は十字によって表されている。
SEが、入力画像の現在検知されたピクセルに重ね合わ
されると、十字でマークされたSEのピクセルが、検知
された入力画像のピクセルに重なる。次に、入力画像の
中の検知したピクセルを囲むピクセルは、SEの他のピ
クセルに重なる。塗り潰した円すなわち黒丸で示した、
SEのピクセルと重なる入力画像のピクセルは、SEを
「ヒット」するという。開いた円すなわち白丸で示し
た、SEのピクセルと重なる入力画像のピクセルは、S
Eを「ミス」するという。塗り潰した円も開いた円もも
たない四角が“ドント・ケア”であり、画像の値(オン
又はオフ)は検知されない。2値のSEは、入力2値画
像に対して作用して出力2値画像を形成するモルフォロ
ジー処理において2値画像を検知するのに用いられる。
又、2値SEはグレースケール画像を検知するのにも使
用でき、この場合、入力画像の全ての場所にシフトされ
る移動ウインドウとして観察される。構成要素すなわち
SEは、中心位置と、多数のピクセル位置とによって定
められ、各ピクセル位置は、定められた値(オン又はオ
フ)を有している。SEを定めるピクセルが互いに隣接
する必要はない。中心位置は、パターンの形態上の中心
にある必要はなく、パターンの内側にある必要もない。
“塗り潰した”SEは、その周囲内の全てのピクセルが
オンであるようなSEをいう。例えば、塗り潰した2x
2SEは、オンピクセルの2x2の四角である。塗り潰
したSEは長方形である必要はない。水平のSEは一般
に1行のオンピクセルであり、そして垂直のSEは一般
に1列の選択されたサイズのオンピクセルである。
は(必ずしもそうではないが)サイズが小さくそして形
状が簡単な画像オブジェクト(典型的にはピクセルの集
合体)であって、入力画像を検知し、選択したモルフォ
ロジー処理によって入力画像から種々の形式の情報を抽
出するような画像オブジェクトをいう。最も典型的な構
成要素(SE)は、ピクセルの小さいブロックであり、
入力画像の各ピクセルに重ね合わせて入力画像を検知す
る。各図面において、塗り潰した円(黒丸)が“ヒッ
ト”であり、開いた円(白丸)が“ミス”である。構成
要素(SE)の中心位置は十字によって表されている。
SEが、入力画像の現在検知されたピクセルに重ね合わ
されると、十字でマークされたSEのピクセルが、検知
された入力画像のピクセルに重なる。次に、入力画像の
中の検知したピクセルを囲むピクセルは、SEの他のピ
クセルに重なる。塗り潰した円すなわち黒丸で示した、
SEのピクセルと重なる入力画像のピクセルは、SEを
「ヒット」するという。開いた円すなわち白丸で示し
た、SEのピクセルと重なる入力画像のピクセルは、S
Eを「ミス」するという。塗り潰した円も開いた円もも
たない四角が“ドント・ケア”であり、画像の値(オン
又はオフ)は検知されない。2値のSEは、入力2値画
像に対して作用して出力2値画像を形成するモルフォロ
ジー処理において2値画像を検知するのに用いられる。
又、2値SEはグレースケール画像を検知するのにも使
用でき、この場合、入力画像の全ての場所にシフトされ
る移動ウインドウとして観察される。構成要素すなわち
SEは、中心位置と、多数のピクセル位置とによって定
められ、各ピクセル位置は、定められた値(オン又はオ
フ)を有している。SEを定めるピクセルが互いに隣接
する必要はない。中心位置は、パターンの形態上の中心
にある必要はなく、パターンの内側にある必要もない。
“塗り潰した”SEは、その周囲内の全てのピクセルが
オンであるようなSEをいう。例えば、塗り潰した2x
2SEは、オンピクセルの2x2の四角である。塗り潰
したSEは長方形である必要はない。水平のSEは一般
に1行のオンピクセルであり、そして垂直のSEは一般
に1列の選択されたサイズのオンピクセルである。
【0026】“ヒット−ミス”SEとは、少なくとも1
つのオンピクセルと、少なくとも1つのオフピクセルと
を特定するSEをいう。
つのオンピクセルと、少なくとも1つのオフピクセルと
を特定するSEをいう。
【0027】“エロション”とは、モルフォロジー処理
又はオペレーションの1つであり、構成要素(SE)の
中心を入力画像の対応するピクセル位置に重ね合わせた
結果、構成要素(SE)の全てのオンピクセル及びオフ
ピクセルがその下の入力画像のピクセルと一致するとい
う結果を得た場合にのみ、(得られる)出力画像の所与
のピクセルをオンにするオペレーションである。エロシ
ョンは、前記の一致が得られるたびに出力画像に1ピク
セルを与える。即ち、エロションは、各ピクセルにおい
て、構成要素すなわちSE(シフトされてそのピクセル
に中心定めされた)がオリジナル画像に完全に含まれた
場合に1を出力し、それ以外は0を出力する。
又はオペレーションの1つであり、構成要素(SE)の
中心を入力画像の対応するピクセル位置に重ね合わせた
結果、構成要素(SE)の全てのオンピクセル及びオフ
ピクセルがその下の入力画像のピクセルと一致するとい
う結果を得た場合にのみ、(得られる)出力画像の所与
のピクセルをオンにするオペレーションである。エロシ
ョンは、前記の一致が得られるたびに出力画像に1ピク
セルを与える。即ち、エロションは、各ピクセルにおい
て、構成要素すなわちSE(シフトされてそのピクセル
に中心定めされた)がオリジナル画像に完全に含まれた
場合に1を出力し、それ以外は0を出力する。
【0028】“膨張(dilation)”とは、モルフォロジー
処理又はオペレーションの1つであり、オンである入力
画像のピクセルによって、構成要素(SE)の中心が出
力画像の対応する位置にあるように、構成要素(SE)
が、その出力画像に書き込まれるオペレーションをい
う。膨張に用いる構成要素すなわちSEは、典型的に
は、オフピクセルをもたない。膨張は、入力画像におけ
る各ピクセルごとに、SEを出力画像においてピクセル
のセットとして描くものである。従って、出力画像は、
オリジナル画像の全ての1のピクセルにおいて並進移動
したSEのシフトした全部のものを合体したものとな
る。
処理又はオペレーションの1つであり、オンである入力
画像のピクセルによって、構成要素(SE)の中心が出
力画像の対応する位置にあるように、構成要素(SE)
が、その出力画像に書き込まれるオペレーションをい
う。膨張に用いる構成要素すなわちSEは、典型的に
は、オフピクセルをもたない。膨張は、入力画像におけ
る各ピクセルごとに、SEを出力画像においてピクセル
のセットとして描くものである。従って、出力画像は、
オリジナル画像の全ての1のピクセルにおいて並進移動
したSEのシフトした全部のものを合体したものとな
る。
【0029】“オープン”とは、エロションの次に膨張
が続くモルフォロジー処理又はオペレーションである。
その結果、入力画像において一致が得られる毎に出力画
像において構成要素(SE)が複製される。膨張は、各
一致のたびに出力画像にSEを複製する。
が続くモルフォロジー処理又はオペレーションである。
その結果、入力画像において一致が得られる毎に出力画
像において構成要素(SE)が複製される。膨張は、各
一致のたびに出力画像にSEを複製する。
【0030】“クローズ”とは、膨張の後にエロション
が続くモルフォロジー処理又はオペレーションである。
が続くモルフォロジー処理又はオペレーションである。
【0031】“フィル8”とは、長方形の境界ボックス
に塗りつぶす画像オペレーションである。
に塗りつぶす画像オペレーションである。
【0032】“フィルクリップ”とは、シードピクセル
がクリッピング画像(“クリッピングマスク”と称す
る)に装填(フィル)されるモルフォロジー処理又はオ
ペレーションである。
がクリッピング画像(“クリッピングマスク”と称す
る)に装填(フィル)されるモルフォロジー処理又はオ
ペレーションである。
【0033】“マスク”とは、オリジナル画像から導出
される画像であり、典型的には該オリジナル画像の関係
領域に対応するオンピクセルの領域を含んでいる画像を
指す。但し、クリッピングマスクにおいては、オンピク
セルの一定の領域には、シードピクセルが含まれていな
い。
される画像であり、典型的には該オリジナル画像の関係
領域に対応するオンピクセルの領域を含んでいる画像を
指す。但し、クリッピングマスクにおいては、オンピク
セルの一定の領域には、シードピクセルが含まれていな
い。
【0034】上記した種々のオペレーションは、名詞、
形容詞及び動詞の形態で説明することもある。例えば、
膨張(名詞形態)を説明する場合、画像を膨張する又は
画像が膨張されている(動詞の形態)、又は画像が膨張
オペレーションを受けている(形容詞の形態)等々とな
る。意味の相違はない。
形容詞及び動詞の形態で説明することもある。例えば、
膨張(名詞形態)を説明する場合、画像を膨張する又は
画像が膨張されている(動詞の形態)、又は画像が膨張
オペレーションを受けている(形容詞の形態)等々とな
る。意味の相違はない。
【0035】B.実施例の全体的な説明 図1は、本発明を実施する画像分析システム1のブロッ
ク図である。システム100の基本的な動作は、文書1
02、この場合は手書きのテキスト又はマシンプリント
されたテキストのある特性部分を抽出又は削除するか或
いは単にその有無を識別することである。このために、
システムは、ピクセルベースで文書をデジタル化してそ
れにより得たデータ構造体を供給するスキャナ103を
備えている。使用目的にもよるが、このスキャナは、2
値画像(ピクセル当たり単一ビット)を供給することも
できるし、グレースケール画像(ピクセル当たり複数の
ビット)を供給することもできる。このデータ構造体
は、文書の生の内容をスキャナの分解精度で含んでい
る。このデータ構造体は、典型的に画像と称するが、メ
モリ104に送られてもよいし、又はディスクや他の大
量記憶装置であるファイル記憶ユニットにファイルとし
て記憶されてもよい。
ク図である。システム100の基本的な動作は、文書1
02、この場合は手書きのテキスト又はマシンプリント
されたテキストのある特性部分を抽出又は削除するか或
いは単にその有無を識別することである。このために、
システムは、ピクセルベースで文書をデジタル化してそ
れにより得たデータ構造体を供給するスキャナ103を
備えている。使用目的にもよるが、このスキャナは、2
値画像(ピクセル当たり単一ビット)を供給することも
できるし、グレースケール画像(ピクセル当たり複数の
ビット)を供給することもできる。このデータ構造体
は、文書の生の内容をスキャナの分解精度で含んでい
る。このデータ構造体は、典型的に画像と称するが、メ
モリ104に送られてもよいし、又はディスクや他の大
量記憶装置であるファイル記憶ユニットにファイルとし
て記憶されてもよい。
【0036】プロセッサ106はデータの流れを制御し
そして画像の処理を実行する。プロセッサ106は、汎
用コンピュータであってもよいし、画像処理オペレーシ
ョンを最適に行うようにされた特殊目的のコンピュータ
であってもよいし、或いは汎用コンピュータと補助的な
特殊目的ハードウェアとの組み合わせであってもよい。
ファイル記憶ユニットを使用する場合には、画像が処理
の前にメモリ104に転送される。又、メモリ104
は、中間のデータ構造体及びおそらくは最終的に処理さ
れたデータ構造体を記憶するのに使用してもよい。
そして画像の処理を実行する。プロセッサ106は、汎
用コンピュータであってもよいし、画像処理オペレーシ
ョンを最適に行うようにされた特殊目的のコンピュータ
であってもよいし、或いは汎用コンピュータと補助的な
特殊目的ハードウェアとの組み合わせであってもよい。
ファイル記憶ユニットを使用する場合には、画像が処理
の前にメモリ104に転送される。又、メモリ104
は、中間のデータ構造体及びおそらくは最終的に処理さ
れたデータ構造体を記憶するのに使用してもよい。
【0037】画像処理(本発明がその一部分を構成す
る)の結果は、導出された画像であるか、数字データで
あるか(例えば、画像の顕著な特徴の座標)、或いはそ
の組み合わせである。この情報は、プリンタ、ディスプ
レイ、光学文字認識システム、グラフィック認識装置、
電子複製装置等の用途に特定のハードウェア108へ送
られてもよいし、或いは同じ又は異なったファイル記憶
ユニット105へ書き戻されてもよい。
る)の結果は、導出された画像であるか、数字データで
あるか(例えば、画像の顕著な特徴の座標)、或いはそ
の組み合わせである。この情報は、プリンタ、ディスプ
レイ、光学文字認識システム、グラフィック認識装置、
電子複製装置等の用途に特定のハードウェア108へ送
られてもよいし、或いは同じ又は異なったファイル記憶
ユニット105へ書き戻されてもよい。
【0038】本発明は、特殊な縮小手順及びモルフォロ
ジー処理又はオペレーションを使用し、それらのテクス
チャに基づいて領域を変換し、画像の手書き部分又はマ
シンプリントされた部分を識別及び/又は除去するよう
にする。好ましい実施例では、マシンプリントされた領
域が識別され、最終的に、塗り潰された又はほぼ塗り潰
されたオンピクセルの分離マスクへ合体される。従っ
て、画像の手書き部分を除去してマシンプリントされた
テキストを保持することもできるし、或いは逆に、マシ
ンプリントされたテキストを除去して手書きの注釈を保
持することもできる。もちろん、ある実施例では、マシ
ンプリントされたテキスト又は手書きの注釈の有無を単
に識別することが所望される。
ジー処理又はオペレーションを使用し、それらのテクス
チャに基づいて領域を変換し、画像の手書き部分又はマ
シンプリントされた部分を識別及び/又は除去するよう
にする。好ましい実施例では、マシンプリントされた領
域が識別され、最終的に、塗り潰された又はほぼ塗り潰
されたオンピクセルの分離マスクへ合体される。従っ
て、画像の手書き部分を除去してマシンプリントされた
テキストを保持することもできるし、或いは逆に、マシ
ンプリントされたテキストを除去して手書きの注釈を保
持することもできる。もちろん、ある実施例では、マシ
ンプリントされたテキスト又は手書きの注釈の有無を単
に識別することが所望される。
【0039】好ましい実施例においては、画像の塗り潰
した大きなオン領域(即ち、オンピクセルの延びる長さ
が画像内のテキスト又はグラフィックより相当に大きな
距離に及ぶような領域)と、微細な織り状(テクスチャ
状)領域(例えば、ハーフトーン又は点描領域)が最初
に画像から除去される。このような領域を除去する方法
としては種々のものが利用できるが、好ましい実施例で
は、このような領域は、本発明の譲受人に譲渡され参考
としてここに取り上げる米国特許第5065437号及
び同第5131049号に開示された方法の1つに基づ
いて除去される。残りの画像は、主として又はもっぱら
手書き及び/又はマシンプリントされたテキストを含
む。もちろん、このような除去段階は、特に処理される
べき画像が塗り潰した黒の領域、点描状の領域又は微細
な織り状の領域を含むことが予想されないときには、任
意のものとなる。
した大きなオン領域(即ち、オンピクセルの延びる長さ
が画像内のテキスト又はグラフィックより相当に大きな
距離に及ぶような領域)と、微細な織り状(テクスチャ
状)領域(例えば、ハーフトーン又は点描領域)が最初
に画像から除去される。このような領域を除去する方法
としては種々のものが利用できるが、好ましい実施例で
は、このような領域は、本発明の譲受人に譲渡され参考
としてここに取り上げる米国特許第5065437号及
び同第5131049号に開示された方法の1つに基づ
いて除去される。残りの画像は、主として又はもっぱら
手書き及び/又はマシンプリントされたテキストを含
む。もちろん、このような除去段階は、特に処理される
べき画像が塗り潰した黒の領域、点描状の領域又は微細
な織り状の領域を含むことが予想されないときには、任
意のものとなる。
【0040】図2及び3は、微細な織り状の領域が好ま
しくは上記方法によって除去されている入力2値画像又
はグレースケール画像を処理するのに使用される2つの
特定の実施例を示す全体的なフローチャートである。図
2を参照すれば、好ましい実施例において、プロセスは
1つ以上の任意の縮小段階1で開始される。本発明は、
ここでは、主として縮小オペレーションによって説明す
る。というのは、縮小オペレーションは効率的に動作
し、そして手書きのテキストとマシンプリントされたテ
キストを容易に分離するからである。もちろん、本発明
は、縮小スケールで作用する必要はなく、フルスケール
で作用することもできる。ある実施例では、個別の縮小
を行って、フィルクリップマスク及びテキストシードを
形成し、異なったスレッシュホールドを使用するように
してもよい。
しくは上記方法によって除去されている入力2値画像又
はグレースケール画像を処理するのに使用される2つの
特定の実施例を示す全体的なフローチャートである。図
2を参照すれば、好ましい実施例において、プロセスは
1つ以上の任意の縮小段階1で開始される。本発明は、
ここでは、主として縮小オペレーションによって説明す
る。というのは、縮小オペレーションは効率的に動作
し、そして手書きのテキストとマシンプリントされたテ
キストを容易に分離するからである。もちろん、本発明
は、縮小スケールで作用する必要はなく、フルスケール
で作用することもできる。ある実施例では、個別の縮小
を行って、フィルクリップマスク及びテキストシードを
形成し、異なったスレッシュホールドを使用するように
してもよい。
【0041】段階3では、例えば、実質的にマシンプリ
ントされた領域のみにおいて比較的まばらなピクセル密
度を有するノイズを減少したテキストシードが形成され
る。テキストシードは、好ましい実施例では、画像をモ
ルフォロジー処理して手書きの注釈又はマシンプリント
されたテキストの特徴をもつ領域を識別することにより
形成される。
ントされた領域のみにおいて比較的まばらなピクセル密
度を有するノイズを減少したテキストシードが形成され
る。テキストシードは、好ましい実施例では、画像をモ
ルフォロジー処理して手書きの注釈又はマシンプリント
されたテキストの特徴をもつ領域を識別することにより
形成される。
【0042】段階5では、システムは、オリジナル画像
から段階7で形成されたクリッピングマスクへテキスト
シードをフィルクリップする。クリッピングマスクは、
手書きの注釈及びマシンプリントされたテキストの両方
をカバーするオンピクセルの実質的に塗り潰した領域を
含む画像である。段階5におけるフィルクリップオペレ
ーションの結果は、所望のテキストマスクであり、シス
テムはこれを用いて、段階9で所望のマシンプリントさ
れたテキスト又は手書きの注釈を抽出し、これは、例え
ば、抽出された(例えば、段階8で)マスクのバージョ
ンとオリジナル画像とのアンドをとるか又はマスクの縮
小バージョンと縮小されたオリジナル画像とのアンドを
とることによって行われる。
から段階7で形成されたクリッピングマスクへテキスト
シードをフィルクリップする。クリッピングマスクは、
手書きの注釈及びマシンプリントされたテキストの両方
をカバーするオンピクセルの実質的に塗り潰した領域を
含む画像である。段階5におけるフィルクリップオペレ
ーションの結果は、所望のテキストマスクであり、シス
テムはこれを用いて、段階9で所望のマシンプリントさ
れたテキスト又は手書きの注釈を抽出し、これは、例え
ば、抽出された(例えば、段階8で)マスクのバージョ
ンとオリジナル画像とのアンドをとるか又はマスクの縮
小バージョンと縮小されたオリジナル画像とのアンドを
とることによって行われる。
【0043】図3は、本発明の第2の実施例を示してい
る。画像は、第1の実施例の場合と同様に、段階1にお
いて縮小され、そして段階2では、オリジナル画像が適
当な構成要素(SE)を用いて処理されて、マシンプリ
ントされたフォーマットでも手書きのフォーマットでも
ない画像の部分にあるピクセルの大部分、及び/又はマ
シンプリントされたフォーマット又は手書きのフォーマ
ットである画像の合体部分が除去される。第1の実施例
と同様に、システムは、特徴が背景“ノイズ”レベルよ
り量的に大きく存在する領域を選択することにより、マ
シンプリントテキスト又は手書きの注釈を識別する。本
書に示す実施例によれば、システムは、両側のオフピク
セルによって横方向の境界が定められた領域を選択的に
識別するための構成要素(SE)を用いて、マシンプリ
ントされたテキスト領域を識別する。
る。画像は、第1の実施例の場合と同様に、段階1にお
いて縮小され、そして段階2では、オリジナル画像が適
当な構成要素(SE)を用いて処理されて、マシンプリ
ントされたフォーマットでも手書きのフォーマットでも
ない画像の部分にあるピクセルの大部分、及び/又はマ
シンプリントされたフォーマット又は手書きのフォーマ
ットである画像の合体部分が除去される。第1の実施例
と同様に、システムは、特徴が背景“ノイズ”レベルよ
り量的に大きく存在する領域を選択することにより、マ
シンプリントテキスト又は手書きの注釈を識別する。本
書に示す実施例によれば、システムは、両側のオフピク
セルによって横方向の境界が定められた領域を選択的に
識別するための構成要素(SE)を用いて、マシンプリ
ントされたテキスト領域を識別する。
【0044】段階4では、段階2からの出力が処理され
て、残りのオンピクセルが所望の領域に合体されると共
に、残りの領域においてオンピクセルが除去されて、マ
スクが形成される。マスクは、主として、マシンプリン
トされたテキスト又は手書きの注釈のいずれかである所
望のフォーマットの領域にあるオンピクセルのエリアで
構成される。次いで、マスクは段階8において元のスケ
ールに拡大されて戻され、任意の段階6において、所望
のマシンプリントテキスト又は手書きの注釈を含むオリ
ジナル画像の部分のみを抽出するようにマスクが使用さ
れる。この段階は、例えば、オリジナル画像とマスクと
のアンド演算を使用する。段階6の出力は、マシンプリ
ントされたフォーマット又は手書きフォーマットである
画像の一部分である。
て、残りのオンピクセルが所望の領域に合体されると共
に、残りの領域においてオンピクセルが除去されて、マ
スクが形成される。マスクは、主として、マシンプリン
トされたテキスト又は手書きの注釈のいずれかである所
望のフォーマットの領域にあるオンピクセルのエリアで
構成される。次いで、マスクは段階8において元のスケ
ールに拡大されて戻され、任意の段階6において、所望
のマシンプリントテキスト又は手書きの注釈を含むオリ
ジナル画像の部分のみを抽出するようにマスクが使用さ
れる。この段階は、例えば、オリジナル画像とマスクと
のアンド演算を使用する。段階6の出力は、マシンプリ
ントされたフォーマット又は手書きフォーマットである
画像の一部分である。
【0045】本発明は、多数の文字を含む画像の領域に
対してモルフォロジーを用いた画像処理を使用するもの
である。最も好ましい実施例では、画像に含まれたほと
んど又は全てのピクセルを処理する方法が使用される
(もちろん、画像が全文書の画像の一部分のみで構成さ
れる場合)。それ故、全文書画像(又はその実質的な部
分)の迅速且つ信頼性のある処理が達成される。
対してモルフォロジーを用いた画像処理を使用するもの
である。最も好ましい実施例では、画像に含まれたほと
んど又は全てのピクセルを処理する方法が使用される
(もちろん、画像が全文書の画像の一部分のみで構成さ
れる場合)。それ故、全文書画像(又はその実質的な部
分)の迅速且つ信頼性のある処理が達成される。
【0046】C.実施例の詳細な説明 本発明は、マシンプリントされたテキスト及び手書きの
注釈の形状及び/又は織り状態の相違を利用して、この
ようなマシンプリントされたテキスト及び/又は手書き
の注釈を識別する。“形状”とは、手書き又はマシンプ
リントフォーマットにおける文字、語、及び/又は語群
の輪郭形状を意味するものとする。“織り状態”とは、
マシンプリントされたテキスト又は手書きの注釈の領域
内におけるオンピクセル及びオフピクセルのパターンを
意味するものである。
注釈の形状及び/又は織り状態の相違を利用して、この
ようなマシンプリントされたテキスト及び/又は手書き
の注釈を識別する。“形状”とは、手書き又はマシンプ
リントフォーマットにおける文字、語、及び/又は語群
の輪郭形状を意味するものとする。“織り状態”とは、
マシンプリントされたテキスト又は手書きの注釈の領域
内におけるオンピクセル及びオフピクセルのパターンを
意味するものである。
【0047】このようなテキストを分離するための技術
としては多数のものがある。例えば、種々の方向におけ
るオンピクセルの線の“密度”を用いて、手書きの注釈
又はマシンプリントされたテキストのいずれかに対して
テキストを最初に遮蔽してもよく、手書きの注釈は、垂
直からの種々のスキュー角において線の密度が相当に大
きなものである。或いは又、システムは、画像内の接続
された成分の“サイズ”を用いて、テキスト、即ち実質
的に小さな接続成分を有するマシンプリントされたテキ
ストの初期遮蔽を行うことができる。
としては多数のものがある。例えば、種々の方向におけ
るオンピクセルの線の“密度”を用いて、手書きの注釈
又はマシンプリントされたテキストのいずれかに対して
テキストを最初に遮蔽してもよく、手書きの注釈は、垂
直からの種々のスキュー角において線の密度が相当に大
きなものである。或いは又、システムは、画像内の接続
された成分の“サイズ”を用いて、テキスト、即ち実質
的に小さな接続成分を有するマシンプリントされたテキ
ストの初期遮蔽を行うことができる。
【0048】上記例では適度な結果が得られるが、本発
明の好ましい実施例は織り状態の相違を利用するもので
ある。特に、システムがマシンプリントされたテキスト
及び手書きの注釈を含む画像を、例えば、38ピクセル
/インチの分解能まで縮小するときには、2つの形式の
書き込みが織り方的にはかなり異なったものとなる。本
発明の好ましい実施例では、モルフォロジー処理によ
る、織り状選別オペレーションを用いてこれらの相違が
抽出されて増幅される。
明の好ましい実施例は織り状態の相違を利用するもので
ある。特に、システムがマシンプリントされたテキスト
及び手書きの注釈を含む画像を、例えば、38ピクセル
/インチの分解能まで縮小するときには、2つの形式の
書き込みが織り方的にはかなり異なったものとなる。本
発明の好ましい実施例では、モルフォロジー処理によ
る、織り状選別オペレーションを用いてこれらの相違が
抽出されて増幅される。
【0049】1.第1の実施例 図2に示すように、本発明の好ましい実施例は、テキス
トシード及びクリッピングマスクシステムを形成し、ク
リッピングマスクの境界までテキストシードを装填す
る。
トシード及びクリッピングマスクシステムを形成し、ク
リッピングマスクの境界までテキストシードを装填す
る。
【0050】図4は、段階7で示すようにフィルクリッ
プマスク(すなわちクリッピングマスク)の形成を示し
ている。オリジナル画像は、段階202及び204にお
いてスレッシュホールドLEVEL=1を用いて2回縮
小される。それ故、150ピクセル/インチの入力画像
がここでは約38ピクセル/インチの大きさになる。次
いで、システムは、段階206において、大きな、例え
ば、水平方向に10個のピクセルをもつ構成要素(S
E)すなわち大きな水平SE(=10h)を用いて、画
像をクローズし、次いで、段階208において大きな水
平SE(例えば、15hすなわち水平方向に15個のピ
クセルをもつ構成要素)を用いて、画像をオープンす
る。クローズは、個別のワードを合体し、オープンは、
小さな垂直方向の“フィラメントすなわち繊維状のも
の”を除去しており、後に、このマスクに、図2の段階
3で得られたシードを装填(フィル)する場合、マシン
プリントされたテキスト領域から手書きの注釈領域へ漏
れが生じないようにしている。
プマスク(すなわちクリッピングマスク)の形成を示し
ている。オリジナル画像は、段階202及び204にお
いてスレッシュホールドLEVEL=1を用いて2回縮
小される。それ故、150ピクセル/インチの入力画像
がここでは約38ピクセル/インチの大きさになる。次
いで、システムは、段階206において、大きな、例え
ば、水平方向に10個のピクセルをもつ構成要素(S
E)すなわち大きな水平SE(=10h)を用いて、画
像をクローズし、次いで、段階208において大きな水
平SE(例えば、15hすなわち水平方向に15個のピ
クセルをもつ構成要素)を用いて、画像をオープンす
る。クローズは、個別のワードを合体し、オープンは、
小さな垂直方向の“フィラメントすなわち繊維状のも
の”を除去しており、後に、このマスクに、図2の段階
3で得られたシードを装填(フィル)する場合、マシン
プリントされたテキスト領域から手書きの注釈領域へ漏
れが生じないようにしている。
【0051】図5は、段階3に示すようにテキストシー
ドを構成すると共にノイズを除去するプロセスを示して
いる。段階302において、オリジナル画像はスレッシ
ュホールドLEVEL=2を用いて任意に縮小される。
次いで、画像は段階304においてLEVEL=2を用
いて再び任意に縮小される。それ故、150ピクセル/
インチの入力画像がここでは約38ピクセル/インチと
なる。
ドを構成すると共にノイズを除去するプロセスを示して
いる。段階302において、オリジナル画像はスレッシ
ュホールドLEVEL=2を用いて任意に縮小される。
次いで、画像は段階304においてLEVEL=2を用
いて再び任意に縮小される。それ故、150ピクセル/
インチの入力画像がここでは約38ピクセル/インチと
なる。
【0052】段階306において、縮小画像は、2hS
Eを用いてクローズされる。段階308において、クロ
ーズへの入力及びそこからの出力は、段階308におい
て排他的オアされ、その出力は、手書きの注釈エリアに
比較的少数のピクセルをそしてマシンプリントされたテ
キストエリアに比較的多数のピクセルを有する画像とな
る。というのは、1ピクセル巾の水平ギャップがあるエ
リアのみを識別するように画像が処理されているからで
ある。特定の実施例、特に、ギャップが1ピクセルより
大きい非縮小画像には他のSEが使用されることを理解
されたい。
Eを用いてクローズされる。段階308において、クロ
ーズへの入力及びそこからの出力は、段階308におい
て排他的オアされ、その出力は、手書きの注釈エリアに
比較的少数のピクセルをそしてマシンプリントされたテ
キストエリアに比較的多数のピクセルを有する画像とな
る。というのは、1ピクセル巾の水平ギャップがあるエ
リアのみを識別するように画像が処理されているからで
ある。特定の実施例、特に、ギャップが1ピクセルより
大きい非縮小画像には他のSEが使用されることを理解
されたい。
【0053】手書きの注釈エリアにオンピクセルがまだ
含まれているような領域では、これらの領域が1ピクセ
ルのみの高さとなる傾向であり(38ピクセル/インチ
の特定の分解能において)、従って、段階310におい
て小さな垂直SE(例えば、垂直方向に2つのピクセル
を持つ構成要素(SE)すなわちSE=2v)でクロー
ズされ、次いで、段階312において若干大きな垂直S
E(例えば、3v)でオープンされる。
含まれているような領域では、これらの領域が1ピクセ
ルのみの高さとなる傾向であり(38ピクセル/インチ
の特定の分解能において)、従って、段階310におい
て小さな垂直SE(例えば、垂直方向に2つのピクセル
を持つ構成要素(SE)すなわちSE=2v)でクロー
ズされ、次いで、段階312において若干大きな垂直S
E(例えば、3v)でオープンされる。
【0054】これにより得られた画像は、一般に、この
段階において手書きの注釈領域に数個の水平に分離され
たピクセルを含むだけであり、これらはここで実質的に
除去される。これは、水平のクローズ/オープンを実行
することにより行われる。例えば、段階314におい
て、画像は例えば10hのSEでクローズされ、次い
で、例えば、3hのSEでオープンされる(段階31
6)。それにより得られた画像は、マシンプリントされ
たテキスト領域にオンピクセルのグループを含み、手書
きの注釈領域に比較的少数のオンピクセルを含むか又は
全く含まないものとなる。
段階において手書きの注釈領域に数個の水平に分離され
たピクセルを含むだけであり、これらはここで実質的に
除去される。これは、水平のクローズ/オープンを実行
することにより行われる。例えば、段階314におい
て、画像は例えば10hのSEでクローズされ、次い
で、例えば、3hのSEでオープンされる(段階31
6)。それにより得られた画像は、マシンプリントされ
たテキスト領域にオンピクセルのグループを含み、手書
きの注釈領域に比較的少数のオンピクセルを含むか又は
全く含まないものとなる。
【0055】図6は、図2の段階5のフィルクリップオ
ペレーションを詳細に示している。段階402におい
て、シード画像が記憶される。次いで、システムは、段
階404において、例えば、3x3の構成要素(SE)
を使用して画像を膨張させる。段階404の結果は、段
階406において、段階208(図4参照)から得られ
るマスク画像とアンドされる。
ペレーションを詳細に示している。段階402におい
て、シード画像が記憶される。次いで、システムは、段
階404において、例えば、3x3の構成要素(SE)
を使用して画像を膨張させる。段階404の結果は、段
階406において、段階208(図4参照)から得られ
るマスク画像とアンドされる。
【0056】このアンドの結果は、段階408におい
て、例えばXOR(排他的オア)を用いてコピーされた
画像と比較され、もし画像がその前の繰り返し時から変
化していない場合には、装填(フィル)されたシードが
テキストマスクとして出力される。画像が手前の繰り返
し操作から変化した場合には、最後の繰り返し操作をコ
ピーしそして膨張段階404において最後の繰り返し操
作を使用してプロセスが繰り返される。
て、例えばXOR(排他的オア)を用いてコピーされた
画像と比較され、もし画像がその前の繰り返し時から変
化していない場合には、装填(フィル)されたシードが
テキストマスクとして出力される。画像が手前の繰り返
し操作から変化した場合には、最後の繰り返し操作をコ
ピーしそして膨張段階404において最後の繰り返し操
作を使用してプロセスが繰り返される。
【0057】画像の変化が停止した後の出力は、所望の
テキストを除去するように処理することのできるマスク
が出力となり、段階410で拡大して任意に元のスケー
ルに復帰することができる。好ましくは、その拡大の前
に膨張409を行い、マスクがオリジナル画像の所望の
ピクセルをカバーするようにする。
テキストを除去するように処理することのできるマスク
が出力となり、段階410で拡大して任意に元のスケー
ルに復帰することができる。好ましくは、その拡大の前
に膨張409を行い、マスクがオリジナル画像の所望の
ピクセルをカバーするようにする。
【0058】2.第2の実施例 図7ないし10は、図3に示すオペレーションの一実施
例を詳細に示している。特に、図7は、任意の縮小段階
1の好ましい実施例を詳細に示している。特定の入力画
像は、ここでは、150ピクセル/インチの分解能であ
る。それより高い分解能の画像は、比例的に大きな縮小
を必要とし、一方、それより低い分解能の画像はより小
さな縮小でよいか又は適当な倍率の構造エレメントを使
用しなければならない。段階502において、システム
は第1のスレッシュホールド縮小を実行する。最も好ま
しい実施例によれば、第1のスレッシュホールド縮小
は、倍率2x及びスレッシュホールドレベル2で行われ
る。その後、システムは、好ましくは、倍率2x及びス
レッシュホールド2で第2の縮小504を実行し、ある
実施例においては、倍率2x及びスレッシュホールドレ
ベル2で第3の縮小506を実行する。
例を詳細に示している。特に、図7は、任意の縮小段階
1の好ましい実施例を詳細に示している。特定の入力画
像は、ここでは、150ピクセル/インチの分解能であ
る。それより高い分解能の画像は、比例的に大きな縮小
を必要とし、一方、それより低い分解能の画像はより小
さな縮小でよいか又は適当な倍率の構造エレメントを使
用しなければならない。段階502において、システム
は第1のスレッシュホールド縮小を実行する。最も好ま
しい実施例によれば、第1のスレッシュホールド縮小
は、倍率2x及びスレッシュホールドレベル2で行われ
る。その後、システムは、好ましくは、倍率2x及びス
レッシュホールド2で第2の縮小504を実行し、ある
実施例においては、倍率2x及びスレッシュホールドレ
ベル2で第3の縮小506を実行する。
【0059】図8は段階2を詳細に示しており、所望の
テキスト部分、この場合はマシンプリントされたテキス
トが選択的に投射されそして不所望な部分が実質的に除
去される。段階508において、システムは、図の右側
部分に例示したSEを使用して縮小画像をクローズす
る。この特定例のSEは、長さが2の水平SEである
(SEの中心は十字マークで示されている)。このSE
を用いて画像がクローズされると(第1の実施例と同様
に)、左及び右の両方に横に隣接する少なくとも1つの
オンピクセルをもつ全てのオフピクセルがオンにされ
る。次いで、オリジナル画像とのXOR(排他的オア)
により、クローズオペレーションによってオンにされた
ピクセルのみが残される。すなわち、段階510におい
て、段階508からの出力が段階508への入力と排他
的オアされ、手書きの注釈よりも実質的に大きく且つ高
密度のオンピクセル領域がマシンプリントされたテキス
トのエリアに生じる。
テキスト部分、この場合はマシンプリントされたテキス
トが選択的に投射されそして不所望な部分が実質的に除
去される。段階508において、システムは、図の右側
部分に例示したSEを使用して縮小画像をクローズす
る。この特定例のSEは、長さが2の水平SEである
(SEの中心は十字マークで示されている)。このSE
を用いて画像がクローズされると(第1の実施例と同様
に)、左及び右の両方に横に隣接する少なくとも1つの
オンピクセルをもつ全てのオフピクセルがオンにされ
る。次いで、オリジナル画像とのXOR(排他的オア)
により、クローズオペレーションによってオンにされた
ピクセルのみが残される。すなわち、段階510におい
て、段階508からの出力が段階508への入力と排他
的オアされ、手書きの注釈よりも実質的に大きく且つ高
密度のオンピクセル領域がマシンプリントされたテキス
トのエリアに生じる。
【0060】或いは又、ヒット−ミスSE(構成要素)
によりオリジナル画像に対してヒット−ミスオペレーシ
ョンを行うことにより上記と同じピクセルセットが抽出
され、このオペレーションは、2つの段階508及び5
10に取って代わることができる。このSEを用いたヒ
ット−ミスオペレーションにより、1つのオフピクセル
が横方向の両側にオンピクセルを持つ位置にだけ、オン
ピクセルをもつ画像が形成される。もちろん、他のモル
フォロジーオペレーションを用いることができ、この場
合は、システムは、複数のオフピクセルが両側のオンピ
クセルによって境界定めされている領域を識別する。例
えば、図7の下部に示すように、オフピクセルが中心に
あってその両側に隣接したオンピクセルがあるヒット−
ミスSEが、上記と同じ機能を実行する。
によりオリジナル画像に対してヒット−ミスオペレーシ
ョンを行うことにより上記と同じピクセルセットが抽出
され、このオペレーションは、2つの段階508及び5
10に取って代わることができる。このSEを用いたヒ
ット−ミスオペレーションにより、1つのオフピクセル
が横方向の両側にオンピクセルを持つ位置にだけ、オン
ピクセルをもつ画像が形成される。もちろん、他のモル
フォロジーオペレーションを用いることができ、この場
合は、システムは、複数のオフピクセルが両側のオンピ
クセルによって境界定めされている領域を識別する。例
えば、図7の下部に示すように、オフピクセルが中心に
あってその両側に隣接したオンピクセルがあるヒット−
ミスSEが、上記と同じ機能を実行する。
【0061】図9は、段階4に示すように所望の特徴を
合体すると共にマスクを形成するプロセスを詳細に示し
ている。段階510から出力される画像は、手書き領域
において水平方向に密度が薄くそして垂直方向にほとん
どの場合約1ピクセルの高さに過ぎない。それ故、段階
512において、段階510からの出力は、図示された
SE、即ち高さが2の垂直SE(2v・SE)でクロー
ズされる。その後、段階514において、好ましくは先
行のクローズより大きな高さをもつ垂直SE、例えば、
3v・SEで画像がオープンされる。段階512のクロ
ーズは、画像のマシンプリントされたテキスト部分には
多数のピクセルがあってそれらが垂直方向に整列されそ
してその幾つかが単一ピクセルギャップによって分離さ
れる傾向にあるという点を利用している。それ故、この
ようなピクセルは、オープン動作を実行する前に互いに
合体されて、この合体された集合体は、そのオープン動
作によっては除去されない。
合体すると共にマスクを形成するプロセスを詳細に示し
ている。段階510から出力される画像は、手書き領域
において水平方向に密度が薄くそして垂直方向にほとん
どの場合約1ピクセルの高さに過ぎない。それ故、段階
512において、段階510からの出力は、図示された
SE、即ち高さが2の垂直SE(2v・SE)でクロー
ズされる。その後、段階514において、好ましくは先
行のクローズより大きな高さをもつ垂直SE、例えば、
3v・SEで画像がオープンされる。段階512のクロ
ーズは、画像のマシンプリントされたテキスト部分には
多数のピクセルがあってそれらが垂直方向に整列されそ
してその幾つかが単一ピクセルギャップによって分離さ
れる傾向にあるという点を利用している。それ故、この
ようなピクセルは、オープン動作を実行する前に互いに
合体されて、この合体された集合体は、そのオープン動
作によっては除去されない。
【0062】その後、段階516において、システム
は、テキストのマシンプリントされた部分にオンピクセ
ルの長い水平線を形成するオペレーションを実行する。
図9に示す特定の実施例では、オペレーションが20h
(20個の水平オンピクセル)SEによるクローズであ
る。その後、段階518において、手書き部分のマップ
にある残りの数個のオンピクセルが、3hSEによるオ
ープンオペレーションを用いることにより除去される。
は、テキストのマシンプリントされた部分にオンピクセ
ルの長い水平線を形成するオペレーションを実行する。
図9に示す特定の実施例では、オペレーションが20h
(20個の水平オンピクセル)SEによるクローズであ
る。その後、段階518において、手書き部分のマップ
にある残りの数個のオンピクセルが、3hSEによるオ
ープンオペレーションを用いることにより除去される。
【0063】図10は、マスクを形成するのに必要な残
りの段階を示している。段階520において、システム
は、例えば1のスレッシュホールドを用いて画像を任意
に縮小する(2x)。150ピクセル/インチの入力画
像を用いると、画像はここで約19ピクセル/インチの
スケールとなる。その後、段階522において、画像は
大きな塗り潰した水平SE(この例では長さが50の)
でオープンされ、その後、段階524において、長さが
30の塗り潰した水平SEで膨張される。
りの段階を示している。段階520において、システム
は、例えば1のスレッシュホールドを用いて画像を任意
に縮小する(2x)。150ピクセル/インチの入力画
像を用いると、画像はここで約19ピクセル/インチの
スケールとなる。その後、段階522において、画像は
大きな塗り潰した水平SE(この例では長さが50の)
でオープンされ、その後、段階524において、長さが
30の塗り潰した水平SEで膨張される。
【0064】次いで、段階526において、高さが6の
垂直SEで画像がクローズされる。マスクを更に装填す
るためには、長さ10のSEで水平の膨張が段階528
において実行され、その後に、高さ3のSEで垂直の膨
張が段階530において行われる。次いで、システム
は、段階532において拡大オペレーションを用いて1
50ピクセル/インチの元の分解能までマスクを8倍に
拡大する。
垂直SEで画像がクローズされる。マスクを更に装填す
るためには、長さ10のSEで水平の膨張が段階528
において実行され、その後に、高さ3のSEで垂直の膨
張が段階530において行われる。次いで、システム
は、段階532において拡大オペレーションを用いて1
50ピクセル/インチの元の分解能までマスクを8倍に
拡大する。
【0065】図11は、システムが画像から所望のテキ
スト(この場合はマシンプリントされたテキスト)を抽
出する段階6の一実施例を示している。段階602にお
いて、マスクはオリジナルのビットマップ画像とアンド
される。出力は、実質的に又は完全にマシンプリントさ
れたテキストとなる。
スト(この場合はマシンプリントされたテキスト)を抽
出する段階6の一実施例を示している。段階602にお
いて、マスクはオリジナルのビットマップ画像とアンド
される。出力は、実質的に又は完全にマシンプリントさ
れたテキストとなる。
【0066】図12は、手書きの注釈を抽出する技術を
示している。このプロセスによれば、段階602の出力
からのマシンプリントされたテキスト画像は、段階60
4において、オリジナルビットマップ画像と排他的オア
される。このオペレーションの出力は実質的に又は完全
に手書きの注釈である。
示している。このプロセスによれば、段階602の出力
からのマシンプリントされたテキスト画像は、段階60
4において、オリジナルビットマップ画像と排他的オア
される。このオペレーションの出力は実質的に又は完全
に手書きの注釈である。
【0067】 E.画像の高速スレッシュホールド縮小(及び拡大) 効率的なセグメント化の1つの要件は、スレッシュホー
ルド縮小を迅速に実行しなければならないことである。
本発明の譲受人に譲渡され参考としてここに取り上げる
米国特許出願第07/449,263には、画像の高速
縮小及び拡大を実行する好ましい方法及び装置が開示さ
れている。
ルド縮小を迅速に実行しなければならないことである。
本発明の譲受人に譲渡され参考としてここに取り上げる
米国特許出願第07/449,263には、画像の高速
縮小及び拡大を実行する好ましい方法及び装置が開示さ
れている。
【0068】F.ソフトウェアの説明 本書の図面の簡単な説明の前に掲載された表1〜表6に
はソフトウェアを示すプログラムが既述されている。こ
こで、表1、2及び3(版権1991、ゼロックス社)
は、ここに開示する本発明の第1の実施例を実現するプ
ログラムスクリプトであり、そして表4及び5(版権1
991、ゼロックス社)は、ここに開示する本発明の第
2の実施例を実現するプログラムスクリプトを示してい
る。これらのプログラムスクリプトは、“C”言語で書
かれた手順によって画像の変換を実行するインタープリ
テータにより逐次に実行される。表6は、スクリプトの
呼び出しに基づいてCコンピュータプログラムで行われ
る動作を示している。ここに使用する特定のオペレーシ
ョン、例えば、クローズ、オープン、等についてのルー
チンは、参考としてここに取り上げる米国特許第07/
449,263に開示されている。
はソフトウェアを示すプログラムが既述されている。こ
こで、表1、2及び3(版権1991、ゼロックス社)
は、ここに開示する本発明の第1の実施例を実現するプ
ログラムスクリプトであり、そして表4及び5(版権1
991、ゼロックス社)は、ここに開示する本発明の第
2の実施例を実現するプログラムスクリプトを示してい
る。これらのプログラムスクリプトは、“C”言語で書
かれた手順によって画像の変換を実行するインタープリ
テータにより逐次に実行される。表6は、スクリプトの
呼び出しに基づいてCコンピュータプログラムで行われ
る動作を示している。ここに使用する特定のオペレーシ
ョン、例えば、クローズ、オープン、等についてのルー
チンは、参考としてここに取り上げる米国特許第07/
449,263に開示されている。
【0069】これらのプログラムはサン・ワークステー
ションにおいてデモンストレーションされているが、本
発明の範囲から逸脱せずに本明細書の開示に基づいて種
々のプログラミング言語及びハードウェア構成を容易に
使用できることが当業者に明らかであろう。更に、ここ
では、本発明を主としてプログラム式デジタルコンピュ
ータでの実施について説明したが、他の実施も容易に明
らかであろう。例えば、本発明は、個別ハードウェアコ
ンポーネントや、又はハードウェアコンポーネントとソ
フトウェアコンポーネントとの組み合わせのような他の
デジタル処理システムにおいて実施するすることもでき
る。
ションにおいてデモンストレーションされているが、本
発明の範囲から逸脱せずに本明細書の開示に基づいて種
々のプログラミング言語及びハードウェア構成を容易に
使用できることが当業者に明らかであろう。更に、ここ
では、本発明を主としてプログラム式デジタルコンピュ
ータでの実施について説明したが、他の実施も容易に明
らかであろう。例えば、本発明は、個別ハードウェアコ
ンポーネントや、又はハードウェアコンポーネントとソ
フトウェアコンポーネントとの組み合わせのような他の
デジタル処理システムにおいて実施するすることもでき
る。
【0070】G.種々の実施例 1.第1の実施例 図13ないし23は、本発明の第1の実施例のオペレー
ションを示している。図13は、マシンプリントされた
テキスト領域及び種々の手書きを含むオリジナル画像で
ある。手書きは一般に小さな文字であり、これは、手書
き資料を見掛け上機械文字に類似させることが予想され
る。又、画像は、5つの異なった形態の手書きを含んで
いる。上部の手書きの部分は、プリントと手書きの混合
である。上から2番目のサンプルにおいては、完全な筆
記体の手書きが含まれている。上から3番目の手書き領
域では、マシンプリントされたテキスト付近の小さなブ
ランクスペースに手書きがプリントされている。上から
4番目の手書き領域では、文字がごちゃごちゃのブロッ
ク頭文字で最初にプリントされそして非常にきれいなブ
ロック頭文字でプリントされている。最後の手書きサン
プル(下部)では、手書きが適度に分かれた文字でより
きれいに手書きされている。
ションを示している。図13は、マシンプリントされた
テキスト領域及び種々の手書きを含むオリジナル画像で
ある。手書きは一般に小さな文字であり、これは、手書
き資料を見掛け上機械文字に類似させることが予想され
る。又、画像は、5つの異なった形態の手書きを含んで
いる。上部の手書きの部分は、プリントと手書きの混合
である。上から2番目のサンプルにおいては、完全な筆
記体の手書きが含まれている。上から3番目の手書き領
域では、マシンプリントされたテキスト付近の小さなブ
ランクスペースに手書きがプリントされている。上から
4番目の手書き領域では、文字がごちゃごちゃのブロッ
ク頭文字で最初にプリントされそして非常にきれいなブ
ロック頭文字でプリントされている。最後の手書きサン
プル(下部)では、手書きが適度に分かれた文字でより
きれいに手書きされている。
【0071】デモンストレーションに使用した画像の分
解能は、150ピクセル/インチである。これは、15
0ピクセル/インチで走査するか又は300ピクセル/
インチで走査して倍率2で縮小することにより形成する
ことができる。図13に示す特定の画像は、倍率2で且
つスレッシュホールドレベル2のスレッシュホールド縮
小を使用して得ている。
解能は、150ピクセル/インチである。これは、15
0ピクセル/インチで走査するか又は300ピクセル/
インチで走査して倍率2で縮小することにより形成する
ことができる。図13に示す特定の画像は、倍率2で且
つスレッシュホールドレベル2のスレッシュホールド縮
小を使用して得ている。
【0072】図14は、縮小段階302及び304の後
のシードのフォーマットで示している。図示されたよう
に、手書きの注釈は、両側でオフピクセルによって横方
向に境界定めされた低密度のオンピクセルを含む傾向で
ある。図15は、クローズ/排他的オア段階306及び
308の後の画像を示している。この画像は、ここで
は、手書きの注釈領域に比較的少数のオンピクセルを含
んでいる。
のシードのフォーマットで示している。図示されたよう
に、手書きの注釈は、両側でオフピクセルによって横方
向に境界定めされた低密度のオンピクセルを含む傾向で
ある。図15は、クローズ/排他的オア段階306及び
308の後の画像を示している。この画像は、ここで
は、手書きの注釈領域に比較的少数のオンピクセルを含
んでいる。
【0073】図16は、クローズ/オープン段階310
及び312の後の画像を示しており、これらは、高さが
約1ピクセル以下のピクセルグループを除去することに
より手書きの注釈における残りのピクセルのほとんどを
除去するのに使用される。ここでは、画像は手書きの注
釈エリアに非常に少数のピクセルしか含まない。
及び312の後の画像を示しており、これらは、高さが
約1ピクセル以下のピクセルグループを除去することに
より手書きの注釈における残りのピクセルのほとんどを
除去するのに使用される。ここでは、画像は手書きの注
釈エリアに非常に少数のピクセルしか含まない。
【0074】図17は、次の段階312及び314の後
の画像を示している。このクローズ/オープンは、手書
きの注釈領域にある残りのピクセルを除去しそしてオン
ピクセルのグループを塗り潰し、シードとして使用され
る画像を生じる傾向である。
の画像を示している。このクローズ/オープンは、手書
きの注釈領域にある残りのピクセルを除去しそしてオン
ピクセルのグループを塗り潰し、シードとして使用され
る画像を生じる傾向である。
【0075】図18は、段階202ないし208でクリ
ッピングマスクを形成した後の画像を示している。図示
されたように、画像は、手書きの注釈及びマシンプリン
トテキストの両方をカバーするオンピクセルの大きな領
域を含む。
ッピングマスクを形成した後の画像を示している。図示
されたように、画像は、手書きの注釈及びマシンプリン
トテキストの両方をカバーするオンピクセルの大きな領
域を含む。
【0076】図19は、シードをフィルクリップマスク
にフィルクリップすることにより形成されたセグメント
化マスク(膨張409の前)を示している。図示された
ように、セグメント化マスクは、所望のマシンプリント
領域をカバーするオンピクセルを主として含んでいる。
図20に示すように、その後の膨張により、これら領域
が実質的に完全にカバーされる。
にフィルクリップすることにより形成されたセグメント
化マスク(膨張409の前)を示している。図示された
ように、セグメント化マスクは、所望のマシンプリント
領域をカバーするオンピクセルを主として含んでいる。
図20に示すように、その後の膨張により、これら領域
が実質的に完全にカバーされる。
【0077】図21は、図11に示すようにマシンプリ
ントテキストを抽出した後の画像を示している。図示さ
れたように、手書きの注釈は残されていない。図22
は、図12に示すように形成された手書きの注釈画像を
示している。図示されたように、プロセスは手書きの注
釈のみを抽出するようにほぼ完全に作用する。“1.”
及び“2.Background”は、効果的な分離を行うにはお
そらくシード資料が不充分な密度であった(それらのサ
イズが比較的大きいことにより)。図23は、識別され
たマシンプリントテキストの輪郭がセグメント化マスク
で示された画像を示している。
ントテキストを抽出した後の画像を示している。図示さ
れたように、手書きの注釈は残されていない。図22
は、図12に示すように形成された手書きの注釈画像を
示している。図示されたように、プロセスは手書きの注
釈のみを抽出するようにほぼ完全に作用する。“1.”
及び“2.Background”は、効果的な分離を行うにはお
そらくシード資料が不充分な密度であった(それらのサ
イズが比較的大きいことにより)。図23は、識別され
たマシンプリントテキストの輪郭がセグメント化マスク
で示された画像を示している。
【0078】2.第2の実施例 図24は、段階502ないし506に示すように2分の
1に縮小された同じオリジナル画像を示している。各々
の縮小において、スレッシュホールド2のスレッシュホ
ールド縮小が使用された。手書きの注釈は、この分解能
ではマシンプリントされたテキストとは著しく異なる織
り状態を有している。この相違が利用される。特に、マ
シンプリントされたテキストは、その左側及び右側にお
いてオンピクセルにより取り囲まれたオフピクセルの密
度が手書きの注釈より大きい。
1に縮小された同じオリジナル画像を示している。各々
の縮小において、スレッシュホールド2のスレッシュホ
ールド縮小が使用された。手書きの注釈は、この分解能
ではマシンプリントされたテキストとは著しく異なる織
り状態を有している。この相違が利用される。特に、マ
シンプリントされたテキストは、その左側及び右側にお
いてオンピクセルにより取り囲まれたオフピクセルの密
度が手書きの注釈より大きい。
【0079】この相違に基づいてピクセルを抽出するた
めに、画像が長さ2の水平SEでクローズされ、次い
で、その結果がオリジナルの縮小画像と排他的オアされ
る。それにより得られた画像が図25に示されている。
図25から明らかなように、実際に、ピクセルは、マシ
ンプリントされた部分においてかなり高密度でありそし
て手書きの部分において非常に希薄である。特に注目す
べきことは、図25の手書き部分内のピクセルは、水平
方向に希薄であり、そして垂直方向には典型的に1ピク
セルの高さしかない。
めに、画像が長さ2の水平SEでクローズされ、次い
で、その結果がオリジナルの縮小画像と排他的オアされ
る。それにより得られた画像が図25に示されている。
図25から明らかなように、実際に、ピクセルは、マシ
ンプリントされた部分においてかなり高密度でありそし
て手書きの部分において非常に希薄である。特に注目す
べきことは、図25の手書き部分内のピクセルは、水平
方向に希薄であり、そして垂直方向には典型的に1ピク
セルの高さしかない。
【0080】次の2つのオペレーションを実行すること
により、残りの手書きピクセルのほとんどが除去され
て、図26の画像が形成される。 1.高さ2の垂直SEでクローズする。 2.高さ3の垂直SEでオープンする。
により、残りの手書きピクセルのほとんどが除去され
て、図26の画像が形成される。 1.高さ2の垂直SEでクローズする。 2.高さ3の垂直SEでオープンする。
【0081】最初にクローズを実行する理由は、マシン
プリントされた部分には多数のピクセルがあって垂直方
向に整列されているが単一ピクセルギャップで分離され
ているからである。オープンを実行する前にこれらのピ
クセルを一緒に接合することが重要である。
プリントされた部分には多数のピクセルがあって垂直方
向に整列されているが単一ピクセルギャップで分離され
ているからである。オープンを実行する前にこれらのピ
クセルを一緒に接合することが重要である。
【0082】図26は、IBMカードのパンチマークの
ようである。この図について重要なことは、手書き領域
に非常に僅かなピクセルしかないことである。更に、マ
シンプリントされたテキスト領域のピクセルは、カバー
マスクを構成するに充分なほど高密度である。
ようである。この図について重要なことは、手書き領域
に非常に僅かなピクセルしかないことである。更に、マ
シンプリントされたテキスト領域のピクセルは、カバー
マスクを構成するに充分なほど高密度である。
【0083】図27は、次の一連の段階後の画像を示し
ている。これは、大きな水平方向クローズを行い(長さ
20のSEを用いて)、その後、小さな水平方向オープ
ンを行う(長さ3のSEを用いて)ことにより形成され
たものである。クローズは、マシンプリントされた領域
内に長い水平の線を形成し、そしてオープンは、手書き
領域内に存在する最終的な少数のピクセルを除去する。
ている。これは、大きな水平方向クローズを行い(長さ
20のSEを用いて)、その後、小さな水平方向オープ
ンを行う(長さ3のSEを用いて)ことにより形成され
たものである。クローズは、マシンプリントされた領域
内に長い水平の線を形成し、そしてオープンは、手書き
領域内に存在する最終的な少数のピクセルを除去する。
【0084】ここで、画像はもう一度縮小されるが、こ
のときにはスレッシュホールド1を用いて19ピクセル
/インチの分解能まで縮小される。これに続いて、非常
に大きなSEでモルフォロジーオペレーションが行われ
る。大きなSEを使用する理由は、図27のピクセルで
スタートして、全てのマシンプリントテキストをカバー
するマスクを形成する必要があるからである。大きな水
平SE(長さ50の)でオープンした後に、長さ30の
水平SEで膨張することにより行われる。その結果が図
28に示されており、ピクセルは約19ピクセル/イン
チの“ビッグピクセル”表示とされ、オリジナルにおけ
る19ピクセル/インチのサンプリング密度を表す。
のときにはスレッシュホールド1を用いて19ピクセル
/インチの分解能まで縮小される。これに続いて、非常
に大きなSEでモルフォロジーオペレーションが行われ
る。大きなSEを使用する理由は、図27のピクセルで
スタートして、全てのマシンプリントテキストをカバー
するマスクを形成する必要があるからである。大きな水
平SE(長さ50の)でオープンした後に、長さ30の
水平SEで膨張することにより行われる。その結果が図
28に示されており、ピクセルは約19ピクセル/イン
チの“ビッグピクセル”表示とされ、オリジナルにおけ
る19ピクセル/インチのサンプリング密度を表す。
【0085】この画像は、ここで垂直方向にクローズし
なければならず、これは、高さ6の垂直SEでクローズ
することによって行われる。更にマスクに装填するため
に、長さ10のSEで水平の膨張が次に行われ、その
後、高さ3のSEで垂直の膨張が行われる。これによ
り、図29に示したマスクが得られる。この場合も、図
示されたピクセルは、オリジナルにおける19ピクセル
/インチのサンプリング密度に対応し、これらはほぼ同
じ密度で再現され、その結果がほぼオリジナルのサイズ
で現れる。図28及び29の下部では数本のピクセル線
がカットされていることに注意されたい。
なければならず、これは、高さ6の垂直SEでクローズ
することによって行われる。更にマスクに装填するため
に、長さ10のSEで水平の膨張が次に行われ、その
後、高さ3のSEで垂直の膨張が行われる。これによ
り、図29に示したマスクが得られる。この場合も、図
示されたピクセルは、オリジナルにおける19ピクセル
/インチのサンプリング密度に対応し、これらはほぼ同
じ密度で再現され、その結果がほぼオリジナルのサイズ
で現れる。図28及び29の下部では数本のピクセル線
がカットされていることに注意されたい。
【0086】図29のマスクは、次いで、8倍に拡大さ
れ、150ピクセル/インチのオリジナル分解能とな
る。図30は、このマスクとオリジナルをアンドし、オ
リジナルからのマシンプリントされたテキストのほとん
どを、手書きの注釈の僅かなものと共に抽出したときに
得られる結果を示している。図31に示す手書きの注釈
は、図30と図1の排他的オアをとることにより形成さ
れる。図29は、本発明の有効性を更に説明するため
に、オリジナル画像と拡大されたマスクとの重畳を示し
ている。
れ、150ピクセル/インチのオリジナル分解能とな
る。図30は、このマスクとオリジナルをアンドし、オ
リジナルからのマシンプリントされたテキストのほとん
どを、手書きの注釈の僅かなものと共に抽出したときに
得られる結果を示している。図31に示す手書きの注釈
は、図30と図1の排他的オアをとることにより形成さ
れる。図29は、本発明の有効性を更に説明するため
に、オリジナル画像と拡大されたマスクとの重畳を示し
ている。
【0087】H.結論 手書きの注釈をマシンプリントされたテキストからいか
に分離するかについて説明した。この分離は、次の2つ
の段階で行われる。即ち、1)2つの形式の筆跡間にお
ける織り状特性の相違を用いて、マシンプリントテキス
トがあった領域にオンピクセルのみを有する画像を形成
し、そして2)この画像を処理してこれら領域上に塗り
潰しマスクを形成する。
に分離するかについて説明した。この分離は、次の2つ
の段階で行われる。即ち、1)2つの形式の筆跡間にお
ける織り状特性の相違を用いて、マシンプリントテキス
トがあった領域にオンピクセルのみを有する画像を形成
し、そして2)この画像を処理してこれら領域上に塗り
潰しマスクを形成する。
【0088】好ましい実施例では、モルフォロジー処理
又はオペレーション及びスレッシュホールド縮小が使用
された。更に、好ましい実施例では、画像の全ての又は
相当の部分が実質的に同時に処理される。ここで使用す
るモルフォロジー処理又はオペレーションは、適当な画
像処理技術の設計に容易に使用できるようにする多数の
特殊な特性を有している。まず、第1に、これらは実質
上変換的には不変である。変換前の画像の側部へのシフ
トは、結果を変更しないが、それをシフトする。変換的
に不変なオペレーションは、画像の各点が同じルールを
用いて処理されるという点で高度な平行性で実施するこ
とができる。
又はオペレーション及びスレッシュホールド縮小が使用
された。更に、好ましい実施例では、画像の全ての又は
相当の部分が実質的に同時に処理される。ここで使用す
るモルフォロジー処理又はオペレーションは、適当な画
像処理技術の設計に容易に使用できるようにする多数の
特殊な特性を有している。まず、第1に、これらは実質
上変換的には不変である。変換前の画像の側部へのシフ
トは、結果を変更しないが、それをシフトする。変換的
に不変なオペレーションは、画像の各点が同じルールを
用いて処理されるという点で高度な平行性で実施するこ
とができる。
【0089】上記説明は、本発明を解説するためのもの
であって、これに限定するものではない。上記説明か
ら、本発明の種々の変更が当業者に明らかであろう。例
えば、特定のモルフォロジー処理又はオペレーション、
SE、及び倍率について説明したが、他のシーケンス、
及び構造エレメントの他のサイズ及び形状でも適度に良
好な結果をもたらす。上記方法は、当業者によって実施
できる変形態様を示すものである。それ故、本発明の範
囲は、上記の説明に限定されず、特許請求の範囲によっ
て限定されるものとする。
であって、これに限定するものではない。上記説明か
ら、本発明の種々の変更が当業者に明らかであろう。例
えば、特定のモルフォロジー処理又はオペレーション、
SE、及び倍率について説明したが、他のシーケンス、
及び構造エレメントの他のサイズ及び形状でも適度に良
好な結果をもたらす。上記方法は、当業者によって実施
できる変形態様を示すものである。それ故、本発明の範
囲は、上記の説明に限定されず、特許請求の範囲によっ
て限定されるものとする。
【図1】本発明の全体的なブロック図で、本発明を実施
する1つのハードウェアシステムを示すブロック図であ
る。
する1つのハードウェアシステムを示すブロック図であ
る。
【図2】本発明の動作を示す全体的なフローチャートで
ある。
ある。
【図3】本発明の動作を示す全体的なフローチャートで
ある。
ある。
【図4】フィルクリップマークを形成する方法を示す図
である。
である。
【図5】マシンプリントされたテキストシードの形成を
示す図である。
示す図である。
【図6】シードをフィルクリップマスクにフィルクリッ
ピングするところを示す図である。
ピングするところを示す図である。
【図7】マスク形成の別の実施例を示す図である。
【図8】マスク形成の別の実施例を示す図である。
【図9】マスク形成の別の実施例を示す図である。
【図10】マスク形成の別の実施例を示す図である。
【図11】マシンプリントされたテキスト及び手書きの
注釈画像を形成するところを示す図である。
注釈画像を形成するところを示す図である。
【図12】マシンプリントされたテキスト及び手書きの
注釈画像を形成するところを示す図である。
注釈画像を形成するところを示す図である。
【図13】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図14】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図15】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図16】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図17】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図18】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図19】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図20】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図21】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図22】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図23】本発明の第1実施例のオペレーション例を示
す図である。
す図である。
【図24】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図25】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図26】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図27】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図28】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図29】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図30】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図31】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
【図32】本発明の第2実施例のオペレーション例を示
す図である。
す図である。
100 システム 102 文書 103 スキャナ 105 ファイル記憶ユニット 106 プロセッサ 108 ハードウェア
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 中村 納 外3名,「欧文テキスト画 像における文字領域の抽出アルゴリズ ム」電子通信学会論文誌 ’83/4 V ol.J66−D No.4,p.437− 444 HARALICK et al., 「Image Analysis Us ing Mathematical M orphology」,IEEE TR ANSACTIONS ON PATT ERN ANALYSIS AND M ACHINE INTELLIGENC E,VOL.PAMI−9,NO.4, 1987年7月,p.532−550
Claims (12)
- 【請求項1】 デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、 前記処理段階は、前記マシンプリントされたテキストを
選択的に識別する構成要素を用いて、前記マシンプリン
トされたテキスト領域を、第1の中間画像を形成するよ
うに識別する段階を含んでおり、 前記識別段階は、 a)2つの水平に隣接するオンピクセルを有する構成要
素を用いて、前記第1の中間画像を、第2の中間画像を
生成するようにクローズ処理する段階と、 b)前記入力画像と前記第2の中間画像との排他的オア
をとる段階とを備えていることを特徴とする方法。 - 【請求項2】 デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、 前記処理段階は、前記マシンプリントされたテキストを
選択的に識別する構成要素を用いて、前記マシンプリン
トされたテキスト領域を、第1の中間画像を形成するよ
うに識別する段階を含んでおり、更に、 a)少なくとも2つの垂直方向に隣接したオンピクセル
を有する構成要素を用いて前記第1の中間画像をクロー
ズ処理する段階と、 b)少なくとも2つの垂直方向に隣接したオンピクセル
を有する構成要素を用いて前記第1の中間画像をオープ
ン処理する段階と含んでいることを特徴とする方法。 - 【請求項3】 デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、 前記処理段階は、前記マシンプリントされたテキストを
選択的に識別する構成要素を用いて、前記マシンプリン
トされたテキスト領域を、第1の中間画像を形成するよ
うに識別する段階を含んでおり、更に、 複数の横方向に隣接するオンピクセルを有する構成要素
を用いて、前記第1中間画像を、第2の中間画像を生成
するようにクローズ処理し及びオープン処理することに
より、該第1中間画像からマスクを形成する段階を含ん
でいることを特徴とする方法。 - 【請求項4】 請求項3に記載の方法において、更に、 a)前記第2の中間画像のスレッシュホールド縮小を実
行する段階と、 b)前記段階a)の出力を水平の構成要素を用いてオー
プン処理する段階と、 c)前記段階b)の出力を水平の構成要素を用いて膨張
処理する段階と、 d)前記段階c)の出力を垂直の構成要素を用いてクロ
ーズ処理する段階と、 e)前記段階d)の出力を水平の構成要素を用いて膨張
処理する段階と、 f)前記段階e)の出力を垂直の構成要素を用いて膨張
処理する段階とを含むことを特徴とする方法。 - 【請求項5】 デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、 前記マスクは、 a)実質的に前記マシンプリントされたテキスト領域の
みにおけるシードピクセルを抽出する段階と、 b)前記マシンプリントされたテキスト領域上のオンピ
クセルの実質的に塗り潰し領域から構成されるクリッピ
ングマスクを形成する段階を含んでいて、該クリッピン
グマスクに前記シードピクセルをフィルする段階とによ
って形成され、 前記クリッピングマスクを形成する段階は、 i)前記段階a)の出力を水平の構成要素を用いてクロ
ーズ処理する段階と、 ii)前記段階b)の出力を水平の構成要素を用いてオ
ープン処理するする段階とを含むことを特徴とする方
法。 - 【請求項6】 請求項5に記載の方法において、前記入
力画像を縮小する段階を先に行うことを特徴とする方
法。 - 【請求項7】 請求項5に記載の方法において、前記ク
ローズ処理段階及びオープンする処理段階を、3以上の
隣接オンピクセルをもつ水平の構成要素を使用して行う
ことを特徴とする方法。 - 【請求項8】 デジタル処理手段において、手書きの注
釈領域と、マシンプリントされたテキスト領域とを有す
る入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、 前記マスクは、 実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを、各側縁がオンピクセルによっ
て境界付けられたオフピクセルを有する前記画像の領域
を識別することによって、抽出する段階と、 前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階とに
よって形成されることを特徴とする方法。 - 【請求項9】 請求項8に記載の方法において、更に、
前記抽出段階の前に前記入力画像を縮小する段階が設け
られることを特徴とする方法。 - 【請求項10】 デジタル処理手段において、手書きの
注釈領域と、マシンプリントされたテキスト領域とを有
する入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、 前記マスクは、 実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを抽出する段階であって、a)前
記入力画像をクローズ処理する段階と、b)前記段階
a)の出力と前記入力画像との排他的オアをとる段階と
を含むピクセル抽出段階と、 前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階とに
よって形成されることを特徴とする方法。 - 【請求項11】 デジタル処理手段において、手書きの
注釈領域と、マシンプリントされたテキスト領域とを有
する入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、 前記マスクは、 実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを、前記画像をヒット−ミス構成
要素を用いて処理することにより、抽出する段階と、 前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階と、 によって形成されることを特徴とする方法。 - 【請求項12】 デジタル処理手段において、手書きの
注釈領域と、マシンプリントされたテキスト領域とを有
する入力画像の手書きの注釈領域を識別する方法であっ
て、 複数の手書き及びマシンプリントされた文字を有する前
記入力画像の領域を、実質的に前記マシンプリントされ
たテキスト領域のみを識別するマスク画像を生成するよ
うに、モルフォロジーを用いて処理する段階を含んでお
り、前記マスク画像は、実質的に前記マシンプリントさ
れたテキスト領域のみの上にあるマスクであり、 前記マスクは、 実質的に前記マシンプリントされたテキスト領域のみに
おけるシードピクセルを抽出する段階と、 前記シードピクセルを、前記マシンプリントされたテキ
スト領域上のオンピクセルの実質的に塗り潰し領域から
構成されるクリッピングマスクに、フィルする段階とか
ら形成され、 前記フィル段階は、 a)入力画像を記憶する段階と、 b)前記入力画像を膨張処理する段階と、 c)前記段階b)の出力と前記クリッピングマスクとの
アンドをとる段階と、 d)前記段階c)の出力を、前記段階a)の記憶画像と
比較する段階と、 e)前記段階a)の記憶画像と前記段階c)の出力との
違いが所定量以下である場合には、前記段階c)の出力
をマスクとして出力し、前記段階a)の記憶画像と前記
段階c)の出力が所定量を越えて異なる場合には、前記
段階a)の出力を前記入力画像として用いて段階a)へ
戻す段階とから成ることを特徴とする方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US627284 | 1990-12-13 | ||
US07/627284 | 1990-12-13 | ||
US07/627,284 US5181255A (en) | 1990-12-13 | 1990-12-13 | Segmentation of handwriting and machine printed text |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07114618A JPH07114618A (ja) | 1995-05-02 |
JP2930460B2 true JP2930460B2 (ja) | 1999-08-03 |
Family
ID=24514020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3324241A Expired - Fee Related JP2930460B2 (ja) | 1990-12-13 | 1991-12-09 | 手書き及びマシン印字テキストの区分化方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5181255A (ja) |
EP (1) | EP0490687B1 (ja) |
JP (1) | JP2930460B2 (ja) |
KR (1) | KR100251600B1 (ja) |
BR (1) | BR9105295A (ja) |
CA (1) | CA2057243C (ja) |
DE (1) | DE69132206T2 (ja) |
MX (1) | MX9102508A (ja) |
Families Citing this family (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5253307A (en) * | 1991-07-30 | 1993-10-12 | Xerox Corporation | Image analysis to obtain typeface information |
KR0186025B1 (ko) * | 1991-10-09 | 1999-05-15 | 이헌조 | 후보 문자 분류 방법 |
JP3516269B2 (ja) * | 1991-11-19 | 2004-04-05 | ゼロックス コーポレイション | 文書イメージの処理装置 |
US5201011A (en) * | 1991-11-19 | 1993-04-06 | Xerox Corporation | Method and apparatus for image hand markup detection using morphological techniques |
CA2077274C (en) * | 1991-11-19 | 1997-07-15 | M. Margaret Withgott | Method and apparatus for summarizing a document without document image decoding |
US5418865A (en) * | 1992-03-20 | 1995-05-23 | Xerox Corporation | Mark sensing on a form |
US5521985A (en) * | 1992-08-13 | 1996-05-28 | International Business Machines Corporation | Apparatus for recognizing machine generated or handprinted text |
US5825919A (en) * | 1992-12-17 | 1998-10-20 | Xerox Corporation | Technique for generating bounding boxes for word spotting in bitmap images |
JP2904671B2 (ja) * | 1993-03-03 | 1999-06-14 | 大日本スクリーン製造株式会社 | 多階調画像の修正装置 |
US5920694A (en) * | 1993-03-19 | 1999-07-06 | Ncr Corporation | Annotation of computer video displays |
DE69519323T2 (de) * | 1994-04-15 | 2001-04-12 | Canon Kk | System zur Seitensegmentierung und Zeichenerkennung |
US5710839A (en) * | 1994-04-20 | 1998-01-20 | Eastman Kodak Company | Method and apparatus for obscuring features of an image |
US6178431B1 (en) * | 1994-10-05 | 2001-01-23 | International Business Machines Corporation | Method and system for providing side notes in word processing |
US5917464A (en) * | 1994-10-18 | 1999-06-29 | Xerox Corporation | Combination of 2-D detector array with display for image processing |
JPH08179748A (ja) * | 1994-12-26 | 1996-07-12 | Canon Inc | 画像処理装置及び方法 |
US6351321B1 (en) | 1995-02-14 | 2002-02-26 | Eastman Kodak Company | Data scanning and conversion system for photographic image reproduction |
US5852676A (en) * | 1995-04-11 | 1998-12-22 | Teraform Inc. | Method and apparatus for locating and identifying fields within a document |
US6044165A (en) * | 1995-06-15 | 2000-03-28 | California Institute Of Technology | Apparatus and method for tracking handwriting from visual input |
US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
US5655027A (en) * | 1996-05-22 | 1997-08-05 | Dunn; Harold P. | Continuous extraction and processing of document fields |
US5761686A (en) * | 1996-06-27 | 1998-06-02 | Xerox Corporation | Embedding encoded information in an iconic version of a text image |
DE19648272A1 (de) * | 1996-11-21 | 1998-05-28 | Emitec Emissionstechnologie | Verfahren und Vorrichtung zur Bestimmung einer Zelldichte eines Wabenkörpers, insbesondere für einen Abgaskatalysator |
US6253061B1 (en) * | 1997-09-19 | 2001-06-26 | Richard J. Helferich | Systems and methods for delivering information to a transmitting and receiving device |
US6546151B1 (en) * | 1998-01-22 | 2003-04-08 | Matsushita Electric Industrial Co., Ltd | Information processing apparatus and information equipment using the information processing apparatus |
US6301386B1 (en) * | 1998-12-09 | 2001-10-09 | Ncr Corporation | Methods and apparatus for gray image based text identification |
US6343139B1 (en) * | 1999-03-12 | 2002-01-29 | International Business Machines Corporation | Fast location of address blocks on gray-scale images |
US6330357B1 (en) * | 1999-04-07 | 2001-12-11 | Raf Technology, Inc. | Extracting user data from a scanned image of a pre-printed form |
US6561422B1 (en) * | 1999-05-03 | 2003-05-13 | Hewlett-Packard Development Company | System and method for high-contrast marking and reading |
US6587895B1 (en) * | 1999-08-03 | 2003-07-01 | Xerox Corporation | Method for accepting a freeform input containing message with time reference thereupon providing an alert message according to the time reference |
JP3708768B2 (ja) * | 1999-11-22 | 2005-10-19 | シャープ株式会社 | 読取り装置及びデータ処理システム |
US7123768B2 (en) * | 2000-04-26 | 2006-10-17 | Minolta Co., Ltd. | Apparatus and method for detecting a pattern |
US7051271B1 (en) * | 2000-05-31 | 2006-05-23 | Fuji Xerox Co., Ltd. | Method, system and article of manufacture for linking a video to a scanned document |
US6909805B2 (en) * | 2001-01-31 | 2005-06-21 | Matsushita Electric Industrial Co., Ltd. | Detecting and utilizing add-on information from a scanned document image |
US6940617B2 (en) * | 2001-02-09 | 2005-09-06 | Matsushita Electric Industrial Co., Ltd. | Printing control interface system and method with handwriting discrimination capability |
DE60204066T2 (de) * | 2001-02-22 | 2006-02-02 | Oce Print Logic Technologies S.A. | Automatische Lokalisierung von Tabellen in Dokumenten |
US20030004991A1 (en) * | 2001-06-29 | 2003-01-02 | Keskar Dhananjay V. | Correlating handwritten annotations to a document |
US7013029B2 (en) * | 2001-06-29 | 2006-03-14 | Intel Corporation | Incorporating handwritten notations into an electronic document |
KR100872983B1 (ko) * | 2001-12-22 | 2008-12-08 | 주식회사 포스코 | 슬래브의 문자인식 및 확인용 장치 |
US7120299B2 (en) | 2001-12-28 | 2006-10-10 | Intel Corporation | Recognizing commands written onto a medium |
US7137077B2 (en) * | 2002-07-30 | 2006-11-14 | Microsoft Corporation | Freeform encounter selection tool |
US20040037475A1 (en) * | 2002-08-26 | 2004-02-26 | Avinash Gopal B. | Method and apparatus for processing annotated screen capture images by automated selection of image regions |
US7899245B2 (en) * | 2002-12-30 | 2011-03-01 | Lockheed Martin Corporation | Morphological based segmenter |
US7072514B1 (en) * | 2003-02-06 | 2006-07-04 | The United States Of America As Represented By The National Security Agency | Method of distinguishing handwritten and machine-printed images |
US7475061B2 (en) * | 2004-01-15 | 2009-01-06 | Microsoft Corporation | Image-based document indexing and retrieval |
US7729538B2 (en) * | 2004-08-26 | 2010-06-01 | Microsoft Corporation | Spatial recognition and grouping of text and graphics |
US7574048B2 (en) * | 2004-09-03 | 2009-08-11 | Microsoft Corporation | Freeform digital ink annotation recognition |
JP2006092027A (ja) * | 2004-09-21 | 2006-04-06 | Fuji Xerox Co Ltd | 文字認識装置、文字認識方法および文字認識プログラム |
US20060170951A1 (en) * | 2005-01-31 | 2006-08-03 | Hewlett-Packard Development Company, L.P. | Method and arrangement for inhibiting counterfeit printing of legal tender |
US7570816B2 (en) * | 2005-03-31 | 2009-08-04 | Microsoft Corporation | Systems and methods for detecting text |
US7526129B2 (en) * | 2005-06-23 | 2009-04-28 | Microsoft Corporation | Lifting ink annotations from paper |
EP1910976A4 (en) * | 2005-07-29 | 2013-08-21 | Ernst & Young U S Llp | METHOD AND APPARATUS FOR PROVIDING A UNIFIED DRAFTING SYSTEM |
US20070065003A1 (en) * | 2005-09-21 | 2007-03-22 | Lockheed Martin Corporation | Real-time recognition of mixed source text |
JP4771804B2 (ja) * | 2005-12-20 | 2011-09-14 | 富士通株式会社 | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 |
US7796309B2 (en) * | 2006-11-14 | 2010-09-14 | Microsoft Corporation | Integrating analog markups with electronic documents |
US8649600B2 (en) | 2009-07-10 | 2014-02-11 | Palo Alto Research Center Incorporated | System and method for segmenting text lines in documents |
US8452086B2 (en) * | 2009-07-10 | 2013-05-28 | Palo Alto Research Center Incorporated | System and user interface for machine-assisted human labeling of pixels in an image |
US8442319B2 (en) * | 2009-07-10 | 2013-05-14 | Palo Alto Research Center Incorporated | System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking |
US8832853B2 (en) * | 2009-12-07 | 2014-09-09 | Dst Technologies, Inc. | Managed virtual point to point communication service having verified directory, secure transmission and controlled delivery |
EP2515257A4 (en) * | 2009-12-15 | 2016-12-07 | Fujitsu Frontech Ltd | METHOD, DEVICE AND PROGRAM FOR CHARACTER RECOGNITION |
US8824785B2 (en) * | 2010-01-27 | 2014-09-02 | Dst Technologies, Inc. | Segregation of handwritten information from typographic information on a document |
US8600173B2 (en) * | 2010-01-27 | 2013-12-03 | Dst Technologies, Inc. | Contextualization of machine indeterminable information based on machine determinable information |
US8948535B2 (en) * | 2010-01-27 | 2015-02-03 | Dst Technologies, Inc. | Contextualizing noisy samples by substantially minimizing noise induced variance |
US9681016B2 (en) | 2014-02-26 | 2017-06-13 | Xerox Corporation | Methods and systems for capturing, sharing, and printing annotations |
US9934212B2 (en) | 2014-02-26 | 2018-04-03 | Xerox Corporation | Methods and systems for capturing, sharing, and printing annotations |
US9965588B2 (en) * | 2014-03-06 | 2018-05-08 | Ricoh Co., Ltd. | Film to DICOM conversion |
US9432671B2 (en) | 2014-05-22 | 2016-08-30 | Xerox Corporation | Method and apparatus for classifying machine printed text and handwritten text |
KR20170037424A (ko) * | 2015-09-25 | 2017-04-04 | 엘지전자 주식회사 | 이동 단말기 및 그 제어방법 |
JP7107138B2 (ja) * | 2018-09-27 | 2022-07-27 | 大日本印刷株式会社 | 情報処理装置、情報処理方法及びプログラム |
US10846553B2 (en) * | 2019-03-20 | 2020-11-24 | Sap Se | Recognizing typewritten and handwritten characters using end-to-end deep learning |
JP7282314B2 (ja) * | 2019-08-29 | 2023-05-29 | 京セラドキュメントソリューションズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
US11495039B2 (en) | 2020-10-19 | 2022-11-08 | Accenture Global Solutions Limited | Processing digitized handwriting |
JP2022092119A (ja) * | 2020-12-10 | 2022-06-22 | キヤノン株式会社 | 画像処理装置、画像処理方法およびプログラム |
CN118235128A (zh) | 2021-11-29 | 2024-06-21 | 三星电子株式会社 | 电子装置和用于对电子装置中的书写信息进行掩蔽或去掩蔽的方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3634822A (en) * | 1969-01-15 | 1972-01-11 | Ibm | Method and apparatus for style and specimen identification |
US3611291A (en) * | 1969-10-30 | 1971-10-05 | Scan Data Corp | Character recognition system for reading a document edited with handwritten symbols |
US3709525A (en) * | 1969-11-10 | 1973-01-09 | Scan Data Corp | Character recognition |
JPS57157379A (en) * | 1981-03-24 | 1982-09-28 | Ricoh Co Ltd | Discriminating device of kind of image |
US4634148A (en) * | 1981-06-24 | 1987-01-06 | Greene Edwin B | Negotiable instrument |
JPS5837779A (ja) * | 1981-08-31 | 1983-03-05 | Ricoh Co Ltd | 文書処理装置 |
JPS58103266A (ja) * | 1981-12-15 | 1983-06-20 | Toshiba Corp | 文字画像処理装置 |
US4499499A (en) * | 1982-12-29 | 1985-02-12 | International Business Machines Corporation | Method for identification and compression of facsimile symbols in text processing systems |
US4588211A (en) * | 1983-11-17 | 1986-05-13 | Greene Edwin B | Machine readable document |
US4724309A (en) * | 1984-04-09 | 1988-02-09 | Greene Edwin B | Machine readable document and method for processing |
US4741046A (en) * | 1984-07-27 | 1988-04-26 | Konishiroku Photo Industry Co., Ltd. | Method of discriminating pictures |
DE3538639A1 (de) * | 1984-10-31 | 1986-04-30 | Canon K.K., Tokio/Tokyo | Bildverarbeitungssystem |
JPS6227887A (ja) * | 1985-07-30 | 1987-02-05 | Fujitsu Ltd | 文字種分離方式 |
US4821333A (en) * | 1986-08-22 | 1989-04-11 | Environmental Research Inst. Of Michigan | Machine learning procedures for generating image domain feature detector structuring elements |
JPS63155386A (ja) * | 1986-12-19 | 1988-06-28 | Ricoh Co Ltd | 帳票デ−タ読取装置 |
US4817169A (en) * | 1987-04-14 | 1989-03-28 | Nippon Sheet Glass Co., Ltd. | Page segmentor |
JPS63261486A (ja) * | 1987-04-20 | 1988-10-28 | Nec Corp | 書体識別装置 |
JPH0290869A (ja) * | 1988-09-28 | 1990-03-30 | Konica Corp | 画像処理装置 |
US5048109A (en) * | 1989-12-08 | 1991-09-10 | Xerox Corporation | Detection of highlighted regions |
-
1990
- 1990-12-13 US US07/627,284 patent/US5181255A/en not_active Expired - Lifetime
-
1991
- 1991-12-06 CA CA002057243A patent/CA2057243C/en not_active Expired - Fee Related
- 1991-12-07 KR KR1019910022370A patent/KR100251600B1/ko not_active IP Right Cessation
- 1991-12-09 JP JP3324241A patent/JP2930460B2/ja not_active Expired - Fee Related
- 1991-12-09 BR BR919105295A patent/BR9105295A/pt not_active IP Right Cessation
- 1991-12-11 MX MX9102508A patent/MX9102508A/es not_active IP Right Cessation
- 1991-12-12 DE DE69132206T patent/DE69132206T2/de not_active Expired - Fee Related
- 1991-12-12 EP EP91311579A patent/EP0490687B1/en not_active Expired - Lifetime
Non-Patent Citations (2)
Title |
---|
HARALICK et al.,「Image Analysis Using Mathematical Morphology」,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE,VOL.PAMI−9,NO.4,1987年7月,p.532−550 |
中村 納 外3名,「欧文テキスト画像における文字領域の抽出アルゴリズム」電子通信学会論文誌 ’83/4 Vol.J66−D No.4,p.437−444 |
Also Published As
Publication number | Publication date |
---|---|
EP0490687A3 (en) | 1993-11-10 |
US5181255A (en) | 1993-01-19 |
KR100251600B1 (ko) | 2000-04-15 |
EP0490687B1 (en) | 2000-05-17 |
DE69132206T2 (de) | 2000-09-28 |
JPH07114618A (ja) | 1995-05-02 |
DE69132206D1 (de) | 2000-06-21 |
CA2057243A1 (en) | 1992-06-14 |
MX9102508A (es) | 1992-06-01 |
CA2057243C (en) | 1996-11-12 |
EP0490687A2 (en) | 1992-06-17 |
BR9105295A (pt) | 1992-08-18 |
KR920013188A (ko) | 1992-07-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2930460B2 (ja) | 手書き及びマシン印字テキストの区分化方法 | |
JP3086702B2 (ja) | テキスト又は線図形を識別する方法及びデジタル処理システム | |
US5402504A (en) | Segmentation of text styles | |
US5048109A (en) | Detection of highlighted regions | |
US5619592A (en) | Detection of highlighted regions | |
US5201011A (en) | Method and apparatus for image hand markup detection using morphological techniques | |
JP3372282B2 (ja) | 2進入力イメージを縮小する方法 | |
US5065437A (en) | Identification and segmentation of finely textured and solid regions of binary images | |
JP2880572B2 (ja) | 中間調領域用分離マスクの構成方法 | |
US5129014A (en) | Image registration | |
JP2940936B2 (ja) | 表領域識別方法 | |
EP1147485A1 (en) | Video stream classifiable symbol isolation method and system | |
JP3516269B2 (ja) | 文書イメージの処理装置 | |
KR0186025B1 (ko) | 후보 문자 분류 방법 | |
Li | An implementation of ocr system based on skeleton matching | |
JP3072126B2 (ja) | 書体を識別する方法及び装置 | |
Sauvola et al. | Predictive coding for document layout characterization | |
JP2612383B2 (ja) | 文字認識処理方式 | |
Xingyuan et al. | Skeletonizing by compressed line adjacency graph in two directions | |
Messelodi et al. | Detection of polygonal frames in complex document images | |
Agarwal | Understanding paper documents | |
Man | Toward a robust and accurate vision system which recognizes character images | |
JPS60150189A (ja) | パタ−ン読取方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 19980309 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990420 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |