JP3516269B2 - 文書イメージの処理装置 - Google Patents

文書イメージの処理装置

Info

Publication number
JP3516269B2
JP3516269B2 JP32491492A JP32491492A JP3516269B2 JP 3516269 B2 JP3516269 B2 JP 3516269B2 JP 32491492 A JP32491492 A JP 32491492A JP 32491492 A JP32491492 A JP 32491492A JP 3516269 B2 JP3516269 B2 JP 3516269B2
Authority
JP
Japan
Prior art keywords
image
unit
short
pixel
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP32491492A
Other languages
English (en)
Other versions
JPH05242300A (ja
Inventor
エス.ブルームバーグ ダン
ダブリュー.トゥキー ジョン
ウィスゴット エム.マーガレット
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH05242300A publication Critical patent/JPH05242300A/ja
Application granted granted Critical
Publication of JP3516269B2 publication Critical patent/JP3516269B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、スキャンされた文書イ
メージ(document image)を処理するための改善された方
法と装置に関し、さらに詳しくは、スキャンされた文書
をまず最初に文字コード(character codes) に変換する
ことなしに、スキャンされた文書中の機能語(function
words)を検出するための改善された方法と装置に関す
る。 【0002】 【従来の技術】コンピュータに基づいた文書処理での一
般的な問題は、文書検索(document retrieval)および文
書拾い読み(document browsing) のような応用のために
内容語(content words) を機能語と識別することであ
る。機能語は、話題の情報を伝達する名詞(nouns) や動
詞(verbs) のような語(word)と対照したものとして、限
定詞(determiners) 、前置詞(prepositions)、不変化詞
(particles) 、および、主として文法規則の役をなすそ
の他の語を含む。機能語は言語において最も頻繁に現れ
る辞書項目(lexical items) であるとともに、それらは
文書の内容を限定するよりむしろ修飾するので、これら
の語の範疇を識別することは語の頻度に頼る方法にとっ
て重要なことである。 【0003】典型的には、機能語は、単に予め定義され
た機能語のリストであるストップ・リスト(stop-list)
を用いて取り出される。しかしながら、機能語を識別す
ることの問題が、イメージ・データ(原文を表現する例
えばASCIIのような文字コードの代わりに)を取り
扱うコンピュータに基づいた文書処理の応用において表
面化する。例えば、1つの語自体の長さは、機能語かあ
るいは非機能語かの状態を決定しないのである。 【0004】米国特許第2,905,927 号は、識別すべき語
の特性( すなわち、パターン )を決定するのに3回のス
キャンを用いた語を認識する方法と装置を記述してい
る。下部のスキャンが基準線(base line) の下に伸長す
る記号(symbol)を指示する情報を提供するとともに、上
部スキャンが完全な高さの記号の数と位置を指示する情
報を得る。中央のスキャンが語の中の記号の数と記号の
間隔とに関する情報を得るのである。 【0005】 【発明が解決しようとする課題】したがって、本発明の
目的は、文書イメージあるいはそれの一部をまず最初に
文字コードに変換することなく、スキャンされた文書イ
メージ中の機能語を検出する方法と装置を提供すること
である。 【0006】本発明のさらなる目的は、形態学上のイメ
ージ処理技法(morphological imageprocessing techniq
ues) を用いた、速いそして費用効果のある、スキャン
された文書イメージ中の機能語を検出する方法と装置を
提供することである。 【0007】本発明のもう1つの目的は、語の大きな下
位分類(subclass)を取り出すこと、つまり、非内容語(n
on-content) に基づいたイメージ・ユニット(image uni
t)の認識を用いた機能語の取り出し、を提供することで
ある。使用される形態学上のイメージ処理は、非常に速
いそして費用効果のある方法でイメージを変形するのに
効果的である。例えば、処理の前のイメージの縮小は計
算時間を短縮するのに特に効果的である。さらに、本発
明は大文字のみ、あるいは数字のみを含むイメージ・ユ
ニットを定義する。 【0008】したがって、本発明は、光学的な文字認識
を用いることなくイメージ・ユニットを検査し、イメー
ジ・ユニットの予め定義された特性と機能語の既知の特
性とを比較する。機能語の状態を決定する特性の一致が
発生したとき、そのイメージ・ユニットは機能語として
識別される。逆に、適切な特性の一致が発生しないとき
は、そのイメージ・ユニットは非機能語(non-function
word) として識別される。 【0009】 【課題を解決するための手段】本発明の文書イメージの
処理装置は、文字コードを用いずに機能語を識別する文
書イメージの処理装置であって、文書イメージをスキャ
ンするためのイメージスキャン装置と、前記イメージを
イメージ・ユニットにセグメント化し、各イメージ・ユ
ニットの長さと高さを決定し、長さが3文字以下のイメ
ージ・ユニットをショート・イメージ・ユニットとして
決定し、ショート・イメージ・ユニットとして決定され
ていないイメージ・ユニットをイメージから削除し、水
平方向にイメージをぼやけさせて、ぼやかされたイメー
ジを形成し、構造要素と一致する1組のアセンダーおよ
びディセンダーを用いてイメージを浸食して2つの浸食
されたイメージを形成し、該2つの浸食されたイメージ
の和をとり、種を満たす操作を実行して少なくとも1つ
のアセンダーでショート・イメージ・ユニットを満たさ
れたショート・イメージ・ユニット・マスクと、少なく
とも1つのディセンダーでショート・イメージ・ユニッ
トを満たされたショート・イメージ・ユニット・マスク
と、を提供し、これら満たされたショート・イメージ・
ユニット・マスクに対応するイメージ・ユニットを機能
語として識別する、処理手段と、前記識別されたイメー
ジ・ユニットを出力する出力装置と、を含む。ここで、
種を満たす操作は、具体的には、フィルクリップ操作の
ことをいい、上記2つの浸食されたイメージの和を拡張
し、拡張された該浸食されたイメージの和と、ショート
・イメージ・ユニットと、を論理的AND演算すること
により実行される。なお、上記マスクは通常の意味とは
異なるものである。ところで、アセンダーやデセンダー
のない機能語や、アセンダーやデセンダーのある内容語
も存在するが、本発明は必ずも完全に機能語を内容語か
ら区別できるというわけではなく、長さが3文字以下の
イメージ・ユニットをショート・イメージ・ユニットと
して決定し、ショート・イメージ・ユニットについて、
ぼやかし、浸食、浸食されたイメージの和、種を満たす
操作を実行して得たショート・イメージ・ユニット・マ
スクに対応するイメージ・ユニットを機能語として識別
するものである。 【0010】 【実施例】形態学上のイメージ処理に関しての次の前置
きと定義は当業者によって理解され、そしてこの明細書
に記述される本発明を完全に理解する助けとなるであろ
う。 【0011】ここでの論議はバイナリー・イメージを取
り扱う。このような関係において、”イメージ”という
用語は画素からなる2次元データ構造の表現を示す。バ
イナリー・イメージは与えられた画素が”オン”か”オ
フ”のいずれかであるイメージのことである。バイナリ
ー・イメージは、少なくとも1つのソース・イメージが
デスティネーション・イメージに対応付けられる(mappe
d)一群の操作によって処理される。そのような操作の結
果が一般にイメージと言われる。処理の開始点であるよ
うなイメージはオリジナル・イメージあるいはソース・
イメージと呼ばれることもある。 【0012】”形態学上の操作(morphological operati
on) ”はピクセルマップ・イメージ(pixelmap image)す
なわち”ソース”・イメージへの操作を意味し、それ
は、それぞれの画素に特定の場所に関する規則を用いて
他のピクセルマップ・イメージつまり”デスティネーシ
ョン”・イメージを生成する。この規則は実行すること
が望まれる操作だけでなく選択された”構造要素”との
両方に依存する。 【0013】画素はそれらが黒のときはオンであり白の
ときはオフであると定義される。黒をオンとし白をオフ
とする指定は対象とするほとんどの文書が黒の前景と白
の背景を有する事実を反映していることに注意された
い。本発明の技法は白黒が反対のイメージにも同様に適
用することができる。論議は白の上の黒に関してなされ
るが、オンかあるいはオフかの言及は反転されたイメー
ジに対しても同様にうまく適用され、したがって、これ
らの2つの状態の規則は正反対のものにされる。いくつ
かの場合において、論議はオン状態の画素あるいはオフ
状態の画素のいずれでもよい”無意義(don't care)”イ
メージに言及する。 【0014】”構造要素(structuring element : SE)”
は、ソース・イメージを検査し選択された形態学上の操
作を経てソース・イメージから種々の種類の情報を抽出
する一般には(必ずしもではないが)小さいサイズのそ
して簡単な形状のイメージ・オブジェクトのことを意味
する。SEを示す添付の図面において、黒の円(solidci
rcle)、即ち、中実円、は”ヒット(hit) ”であり、白
の円(open circle) 、即ち、中空円、は”ミス(miss)”
である。中央の位置(location)が十字で示される。黒の
円あるいは白の円いずれをも有しない区画は”無意義”
であり、イメージの中のそれらの値(オンあるいはオ
フ)は検査されない。入力バイナリ・イメージを操作し
出力バイナリ・イメージを生成するバイナリの形態学上
の操作において、バイナリのSEがバイナリ・イメージ
を検査するのに使用される。中央の位置と、通常はそれ
ぞれが定義された値(オンあるいはオフ)を持つ多くの
画素の位置と、によってSEが定義される。SEを定義
する画素はお互いに隣接しなくともよい。中央の位置は
パターンの幾何学的な中央である必要はなく、実際にま
た、パターンの内側である必要もない。”中実(solid)
”SEはその内部のすべての画素がオンである周囲を
有するSEを意味する。例えば、2×2の中実SEはオ
ン状態の画素の2×2の正方形である。中実SEは長方
形である必要はない。水平SEは、一般に、オン状態の
画素の1つの行であり、垂直SEは、一般に、選択され
たサイズのオン状態の画素の1つの列である。”ヒット
─ミス”SEは、少なくとも1つのオン状態の画素およ
び少なくとも1つのオフ状態の画素を指定するSEを意
味する。 【0015】AND、OR、そして、XOR、は2つの
イメージ間で画素ごとに実行される論理演算である。 【0016】NOTは単一のイメージでの画素ごとに実
行される論理演算である。 【0017】" 拡大(EXPANSION)" はスケール要素Nに
よって特徴づけられるスケール演算であり、ここで、ソ
ース・イメージでのそれぞれの画素は元の画素と同一の
値を持つN×Nの正方形の画素となる。 【0018】" 縮小(REDUCTION)"はスレッショルド(し
きい値)・レベルMでのスケール要素Nによって特徴づ
けられるスケール演算である。スケール=Nによる縮小
はソース・イメージをN×Nの正方形の画素に分割する
ことを伴い、ソース・イメージのそれぞれのそのような
正方形をデスティネーション・イメージ上の単一の画素
にマッピングする。デスティネーション・イメージでの
その画素に対する値はスレッショルド・レベルMによっ
て決定され、そのMは1からN2 の間の数である。正方
形の画素でのオン状態の画素の数がMより大きいかある
いは等しければ、デスティネーション・イメージの画素
はオンであり、もしそうでなければ、オフである。 【0019】" 浸食( EROSION)" は形態学上の操作であ
り、SEの中央をソース・イメージの対応する画素の位
置に重ねた結果が、SEでのすべてのオン状態およびオ
フ状態の画素とソース・イメージでのその下にある画素
との間で一致すれば、かつ一致する場合のみ、デスティ
ネーション・イメージでの与えられた1つの画素がオン
状態にされる。浸食の操作は一致するたびにデスティネ
ーション・イメージでの1つの画素を与える。このこと
は、それぞれの画素に対して、SE(その画素にシフト
されかつ中央に置かれた)が完全にオリジナル・イメー
ジの前景の内側に含まれれば1を出力し、そうでなけれ
ば0を出力する。浸食は、普通は、ヒットのみを有する
SEを用いた操作を意味するが、さらに一般的には、ヒ
ットとミスの両方を有する比較操作(しばしば”ヒット
─ミス変換”と呼ばれる)を意味することに注意された
い。浸食という用語は、ここでは、ヒットとミスの両方
を有する比較操作を包含するために使用されるので、ヒ
ット─ミス変換は、ここで使用される浸食の特殊な形態
である。 【0020】”拡張(DILATION)”は形態学上の操作であ
り、ソース・イメージの与えられた画素がオン状態であ
ることが、デスティネーション・イメージでの対応する
位置にSEの中央を置くとともに、SEがデスティネー
ション・イメージに書き込まれることの原因となる。拡
張に使用されるSEは、典型的には、オフ状態の画素を
持たない。拡張は、ソース・イメージでのそれぞれの画
素に対して、デスティネーション・イメージでの1組の
画素としてSEを描く。したがって、出力イメージは、
オリジナル・イメージのすべての1画素に対して書き換
えられたSEのシフトされたもののすべての結合であ
る。 【0021】”フィルクリップ(FillClip)" は形態学上
の操作であり、1つの画素が種として使用され形態学的
に成長せしめられ、別のイメージ(second image)へのそ
れぞれの成長段階でそれを刈り取る。例えば、フィルク
リップは、拡張の操作とそれに続いての拡張の結果と他
のイメージを論理的にAND演算することとを包含す
る。 【0022】”オープニング(OPENING) ”はイメージと
構造要素を用いた形態学上の操作であり、浸食とそれに
続く拡張からなる。結果は、ソース・イメージでのそれ
ぞれの比較に対してデスティネーション・イメージでの
構造要素の模写となる。 【0023】”クロージング(CLOSING) ”はイメージと
構造要素を用いる形態学上の操作である。拡張とそれに
続く構造要素によるイメージの浸食とを包含する。イメ
ージのクローズ(CLOSE) は背景でのオープン(OPEN)のビ
ット反転に等価である。 【0024】”和(UNION) ”は2つのイメージの間での
ビット単位(bitwise) のOR演算である。”交差(inter
section)”は2つのイメージの間でのビット単位のAN
D演算である。 【0025】”ぼやかし(Blurring)”は少なくとも2つ
のヒットからなる1つの(あるいは複数の)構造要素に
よるイメージの拡張である。 【0026】”マスク(mask)”は、オリジナル・イメー
ジつまりソース・イメージから正常に得られる、オリジ
ナル・イメージでの関係する領域に対応したオン状態の
画素の中実領域(solid regions) を実質的に含むイメー
ジを意味する。マスクはまた関係する領域に対応しない
オン状態の画素の領域も包含する。 【0027】上で定義された種々の操作は、以下の本文
中で時々、名詞、形容詞、および、動詞、の形態で引用
される。例えば、拡張(DILATION : 名詞の形態) の引用
は、”DILATING the image(イメー
ジを拡張すること)”あるいは”the image
being DILATED(イメージが拡張されるこ
と)”(動詞の形態) 、あるいは”the image
being su−bjected to a DI
LATION operation(イメージが拡張操
作されること)”(形容詞の形態) のようなものであ
る。意味に差異がないようにするものである。 【0028】形態学上の操作は、適切な処理手順の設計
においてそれらが使用されることを簡単化するいくつか
の独特の特性を有する。まず第1に、それらは平行移動
的には不変である。処理結果をさらにシフトさせること
を除いて、変換する前のイメージの横方向へのシフトは
処理結果を変化させない。イメージのそれぞれの点が同
じ規則を用いて処理される点で、平行移動的に不変であ
る操作は高い平行度で実行される。加えて、形態学上の
操作はそれらの幾何学的な動作を目に見えるものにする
ことを容易にする2つの特性を満足する。まず第1に、
浸食(EROSION)、拡張(DILATION)、オープン(OPEN)、お
よび、クローズ(CLOSE) 、は”増加しており”、そのこ
とは、もしイメージ1がイメージ2に含まれれば、イメ
ージ1でのこれらの形態学上のどのような操作もイメー
ジ2での形態学上の操作に含まれることを意味する。第
2に、クローズは拡大的なものであり、オープンは反拡
大的なものである。このことは、オリジナル・イメージ
はクローズによって変換されたイメージに含まれ、オー
プンによって変換されたイメージはオリジナル・イメー
ジに含まれることを意味する。構造要素の中央がヒット
に位置せしめられれば、拡張と浸食の操作もまたそれぞ
れ拡大的そして反拡大的なものである。 【0029】オープンとクローズの操作もまた以下の2
つのより形態学上の特性を満足する。 (1) 操作の結果が構造要素の中央の位置に依存しない。 (2) 操作はベキ等元(idempotent)である。このことは、
オープンおよびクローズを結果としてのイメージに再度
適用してもそのイメージを変化させないことを意味す
る。 【0030】”イメージ・ユニット”は、確実に抽出さ
れ語根となる言語構造を持った語、数値、文字、グラ
フ、あるいは他のユニットのような識別できるイメージ
のセグメントを意味する。 【0031】”意義のある(significant) ”という用語
とその派生語は、ここでの記載においては、イメージ・
ユニットの特定の特性の重要性を指示するために用いら
れる。意義のある特性を有するイメージ・ユニットは、
文書イメージをさらに処理するために使用することので
きる大きな意味を持つ情報を含む意義のあるイメージ・
ユニットとなる。イメージ・ユニットの意義のある特性
は、長さ、幅、紙面での文書イメージの位置、フォント
(font)、書体(typeface)、そして、制限されずに以下の
パラメータを含めたその他のパラメータによる度量、の
ような多様な分類子(classifier)を含む。 ・ ボックス(box) の少なくとも1つの断面(断面はオ
ン状態とオフ状態の一連の画素である)。 ・ イメージ・ユニットに関連したアセンダーの数。 ・ イメージ・ユニットに関連したディセンダーの数。 ・ イメージ・ユニットでの平均画素密度。 ・ 山(peaks) と谷(troughs) を含む、イメージ・ユニ
ットのトップ(頂部)ライン輪郭(topline contour) の
長さ。 ・ 山と谷を含む、イメージ・ユニットのベース(基
部)輪郭(base contouring) の長さ。 ・ 隣あったイメージ・ユニットに関してのイメージ・
ユニットの位置、すなわち、垂直位置およびイメージ・
ユニット間の水平距離。 【0032】図1は、まず最初に文書イメージを文字コ
ードに変換することなしにスキャンされた文書イメージ
の機能語を検出するための、本発明による方法の好まし
い実施例のフロー・チャートである。文書紙面のイメー
ジがステップ2でスキャンされ、そのイメージがステッ
プ4においてイメージ・ユニットにセグメント化され
る。セグメント化は、例えば、まず第1に、Huttenloch
erその他による同時出願の米国特許「Method for Deter
mining Boundaries of Words in Text(テキストの語の
境界決定方法)」(米国特許出願番号 07/794,392 )に
記載されるように、イメージ・ユニットの基準線を決定
よってする技法を用いて実現され、そして第2に、Hutt
enlocherその他による同時出願の米国特許「A Method o
f Deriving Wordshapes for Subsequent Comparison
(引き続く比較のために語形を得る方法)」(米国特許
出願番号 07/794,391 )に記載されるように、イメージ
・ユニットの周囲の境界ボックス(bounding boxes)を提
供する技法を用いて実現される。ステップ6において、
イメージでのそれぞれのイメージ・ユニットの長さと高
さが決定され、ステップ8において、好ましくは長さが
3文字あるいはそれ以下の、予め定義された文字数以下
のイメージ・ユニットのようなショート・イメージ・ユ
ニットが決定される。ステップ10において、ショート
・イメージ・ユニットではないイメージ・ユニットがイ
メージから削除される。ステップ12において、イメー
ジ・ユニットがともに不鮮明にされる(smeared) ことは
ないが、水平方向にそのイメージがぼやけさせられある
いは不鮮明にされる。このことは、例えば、図5に示す
ような長さが5の構造要素(すなわち、5つの画素)の
ような水平の構造要素でイメージを拡張することによっ
て実現される。イメージでのエかつエックスハイト(x
高さ)文字(x-height characters) をぼやけさせるため
に使用される水平の構造要素の長さは使用される文字の
活字書体(character type)の幅に依存するのである。さ
らに、同様の不鮮明な効果を得るために、拡張操作にお
いて構造要素の他の形態が用いられてもよい。しかしな
がら、エックスハイト文字を不鮮明にするための最も効
率的かつ効果的な方法は上述したような水平の構造要素
を用いることである。 【0033】ステップ14において、図3(A−1)、
図3(A−2)、図3(B−1)、図3(B−2)、図
3(C−1)、図3(C−2)に示されるような構造要
素に一致する1組のアセンダーおよび図4(A−1)、
図4(A−2)、図4(B−1)、図4(B−2)、図
4(C−1)、図4(C−2)に示されるような構造要
素に一致する1組のディセンダーとを用いて、イメージ
に浸食の和(UNION) が施される。ステップ14で施され
る和は選択ノイズ除去フィルタを提供し、その和は、ス
テップ16のフィルクリップ操作のような後に続く種を
満たす操作において、ショート・イメージ・ユニット・
マスクを満たすための種を提供する。ステップ14の和
はイメージに残存するすべてのイメージ・ユニット(す
なわち、この場合はショート・イメージ・ユニットだ
け)に関して作用し、浸食の和は、構造要素に一致する
1組のアセンダーと構造要素に一致する1組のディセン
ダーとを用いて施されるので、満たされるべきイメージ
・ユニットはアセンダー文字及び/又はディセンダー文
字を含むイメージ・ユニットすなわち機能語である。ス
テップ18において、その機能語はショート・イメージ
・ユニット・マスクを満たされたイメージ・ユニットと
して識別される。 【0034】ステップ20において、文書の最後のペー
ジがスキャンされたかどうかを決定する検査がなされ
る。もし最後のページがスキャンされたのであればステ
ップ24において本方法は終了し、そうでなければ、ス
テップ22においてページがめくられ、めくられた次の
ページがステップ2においてスキャンされ、ここでその
次のページのイメージがスキャンされ本方法の上述した
それぞれのステップが再度実行される。もちろん、上述
した機能語識別手順の実行に先立って、すべてのページ
がスキャンされ、そしてメモリーにビット・マップ・イ
メージとして格納されてもよい。さらにまた、本発明の
実行に先立って、イメージのセグメント化のステップが
実行され(かつ、セグメント化されたイメージがメモリ
ーに格納され)てもよい。なぜなら、セグメント化は本
発明とは異なった手順の有用性(utility) を持つからで
ある。 【0035】図2は、まず最初に文書イメージを文字コ
ードに変換することなくスキャンされた文書イメージ中
の機能語を検出する装置50の本発明による好ましい実
施例の概略図である。装置50は、例えば、少なくとも
1つの(光学的なまたは電気的な)イメージ・スキャ
ナ、キー・ボード、タッチ・スクリーン、マウス、など
を含むユーザ入力装置52を備える。イメージ・スキャ
ナは、単独の(stand-alone) 装置、または、ファクシミ
リ装置の一部、あるいは、文書複写装置(コピー装置)
の一部、であってもよい。処理装置56が入力装置52
に接続されて、文書イメージをイメージ・ユニットにセ
グメント化するために文書イメージを処理し、それぞれ
のイメージ・ユニットの長さと高さを決定し、好ましく
は長さが多くとも3文字のイメージ・ユニットとしてシ
ョート・イメージ・ユニットを決定し、ショート・イメ
ージ・ユニットではないイメージ・ユニットをイメージ
から削除し、イメージを水平方向にぼやけさせ、構造要
素と一致する1組のアセンダーとディセンダーを用いて
イメージの浸食の和をとり、イメージをフィルクリップ
して、少なくとも1つのアセンダーでショート・イメー
ジ・ユニットを満たされたショート・イメージ・ユニッ
ト・マスクと、少なくとも1つのディセンダーでショー
ト・イメージ・ユニットを満たされたショート・イメー
ジ・ユニット・マスクと、を提供し、ショート・イメー
ジ・ユニット・マスクが満たされたイメージ・ユニット
として機能語を識別する。処理装置56は、リード・オ
ンリー・メモリ(RAM)60から読み込まれた操作プ
ログラムに従って、そしてランダム・アクセス・メモリ
(RAM)62を用いることによって、これらの機能を
実行するように動作する。文書はファイル64に格納さ
れあるいはファイル64から再生され、処理の結果とユ
ーザ入力情報がCRTディスプレイ・モニタ54に表示
される。処理装置56が文書イメージの処理を完了した
後に、その結果が出力装置58に出力され、その出力装
置58は、例えば、記憶手段(ハード・ディスクあるい
はフロッピー・ディスク)、プリンタ、光学的コピー装
置、ファクシミリ装置、あるいは、CRTディスプレ
イ、を含んでもよい。 【0036】 【発明の効果】本発明によれば、文書イメージあるいは
それの一部をまず最初に文字コードに変換することな
く、スキャンされた文書イメージ中の機能語を検出する
ことができる。
【図面の簡単な説明】 【図1】文書イメージをまず最初に文字コードに変換す
ることなく、スキャンされた文書イメージの中の機能語
を検出する本発明による方法の好ましい実施例のフロー
・チャートを示す。 【図2】文書イメージをまず最初に文字コードに変換す
ることなく、スキャンされた文書イメージの中の機能語
を検出する本発明による装置の好ましい実施例のブロッ
ク図を示す。 【図3】(A−1)乃至(C−2)は3組の文字アセン
ダーの構造要素を示す。(A−1)及び(A−2)は高
さが3で長さが5である構造要素の1組の文字アセンダ
ーを示し、(A−1)は、最下位の行と最も右の列とに
沿ってオン状態の画素と、好ましくはオン状態の画素か
ら分離された残りの位置にある1つあるいはそれ以上の
オフ状態の画素と、を有する構造要素を示し、(A−
2)最下位の行と最も左の列とに沿ってオン状態の画素
と、好ましくはオン状態の画素から分離された残りの位
置にある1つあるいはそれ以上のオフ状態の画素と、を
有する構造要素を示す。(B−1)及び(B−2)は高
さが4で長さが5である構造要素の1組の文字アセンダ
ーを示し、(B−1)は、最下位の行と最も右の列とに
沿ってオン状態の画素と、好ましくはオン状態の画素か
ら分離された残りの位置にある1つあるいはそれ以上の
オフ状態の画素と、を有する構造要素を示し、(B−
2)は、最下位の行と最も左の列とに沿ってオン状態の
画素と、好ましくはオン状態の画素から分離された残り
の位置にある1つあるいはそれ以上のオフ状態の画素
と、を有する構造要素を示す。(C−1)及び(C−
2)は高さが5で長さが5である構造要素の1組の文字
アセンダーを示し、(C−1)は、最下位の行と最も右
の列とに沿ってオン状態の画素と、好ましくはオン状態
の画素から分離された残りの位置にある1つあるいはそ
れ以上のオフ状態の画素と、を有する構造要素を示し、
(C−2)は、最下位の行と最も左の列とに沿ってオン
状態の画素と、好ましくはオン状態の画素から分離され
た残りの位置にある1つあるいはそれ以上のオフ状態の
画素と、を有する構造要素を示す。 【図4】(A−1)乃至(C−2)は3組の文字ディセ
ンダーの構造要素を示す。(A−1)及び(A−2)は
高さが3で長さが5である構造要素の1組の文字ディセ
ンダーを示し、(A−1)は、最上位の行と最も右の列
とに沿ってオン状態の画素と、好ましくはオン状態の画
素から分離された残りの位置にある1つあるいはそれ以
上のオフ状態の画素と、を有する構造要素を示し、(A
−2)は、最上位の行と最も左の列とに沿ってオン状態
の画素と、好ましくはオン状態の画素から分離された残
りの位置にある1つあるいはそれ以上のオフ状態の画素
と、を有する構造要素を示す。(B−1)及び(B−
2)は高さが4で長さが5である構造要素の1組の文字
ディセンダーを示し、(B−1)は、最上位の行と最も
右の列とに沿ってオン状態の画素と、好ましくはオン状
態の画素から分離された残りの位置にある1つあるいは
それ以上のオフ状態の画素と、を有する構造要素を示
し、(B−2)は、最上位の行と最も左の列とに沿って
オン状態の画素と、好ましくはオン状態の画素から分離
された残りの位置にある1つあるいはそれ以上のオフ状
態の画素と、を有する構造要素を示す。(C−1)及び
(C−2)は高さが5で長さが5である構造要素の1組
の文字ディセンダーを示し、(C−1)は、最上位の行
と最も右の列とに沿ってオン状態の画素と、好ましくは
オン状態の画素から分離された残りの位置にある1つあ
るいはそれ以上のオフ状態の画素と、を有する構造要素
を示し、(C−2)は、最上位の行と最も左の列とに沿
ってオン状態の画素と、好ましくはオン状態の画素から
分離された残りの位置にある1つあるいはそれ以上のオ
フ状態の画素と、を有する構造要素を示す。 【図5】長さが5の水平方向の構造要素を示す。 【符号の説明】 50・・・文書イメージ中の機能語を検出する装置 40・・・リード・オンリー・メモリ 42・・・ランダム・アクセス・メモリ 52・・・ユーザ入力装置 54・・・モニター 56・・・処理装置 58・・・出力装置 64・・・記憶装置
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジョン ダブリュー.トゥキー アメリカ合衆国 08543−2043 ニュー ジャージー州 プリンセトン ポスト オフィス ボックス 2043 (72)発明者 エム.マーガレット ウィスゴット アメリカ合衆国 94022 カリフォルニ ア州 ロス アルトス キャリッジ コ ート 11

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 文字コードを用いずに機能語を識別する
    文書イメージの処理装置であって、 文書イメージをスキャンするためのイメージスキャン装
    置と、 前記イメージをイメージ・ユニットにセグメント化し、
    各イメージ・ユニットの長さと高さを決定し、長さが3
    文字以下のイメージ・ユニットをショート・イメージ・
    ユニットとして定し、ショート・イメージ・ユニット
    として定されていないイメージ・ユニットをイメージ
    から削除し、水平方向にイメージをぼやけさせて、ぼや
    かされたイメージを形成し、構造要素と一致する1組の
    アセンダーおよびディセンダーを用いてイメージを浸食
    して2つの浸食されたイメージを形成し、該2つの浸食
    されたイメージの和をとり、種を満たす操作を実行して
    少なくとも1つのアセンダーでショート・イメージ・ユ
    ニットを満たされたショート・イメージ・ユニット・マ
    スクと、少なくとも1つのディセンダーでショート・イ
    メージ・ユニットを満たされたショート・イメージ・ユ
    ニット・マスクと、を提供し、これら満たされたショー
    ト・イメージ・ユニット・マスクに対応するイメージ・
    ユニットを機能語として識別する、処理手段と、 前記識別されたイメージ・ユニットを出力する出力装置
    と、 を含む文書イメージの処理装置
JP32491492A 1991-11-19 1992-11-10 文書イメージの処理装置 Expired - Fee Related JP3516269B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US79419091A 1991-11-19 1991-11-19
US794190 1991-11-19

Publications (2)

Publication Number Publication Date
JPH05242300A JPH05242300A (ja) 1993-09-21
JP3516269B2 true JP3516269B2 (ja) 2004-04-05

Family

ID=25161955

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32491492A Expired - Fee Related JP3516269B2 (ja) 1991-11-19 1992-11-10 文書イメージの処理装置

Country Status (2)

Country Link
US (1) US5455871A (ja)
JP (1) JP3516269B2 (ja)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3986098B2 (ja) * 1994-08-16 2007-10-03 富士通株式会社 文字列検索方法及び文字列検索装置
US5729637A (en) 1994-08-31 1998-03-17 Adobe Systems, Inc. Method and apparatus for producing a hybrid data structure for displaying a raster image
US5625711A (en) * 1994-08-31 1997-04-29 Adobe Systems Incorporated Method and apparatus for producing a hybrid data structure for displaying a raster image
CA2154952A1 (en) * 1994-09-12 1996-03-13 Robert M. Ayers Method and apparatus for identifying words described in a page description language file
DE69525401T2 (de) * 1994-09-12 2002-11-21 Adobe Systems Inc Verfahren und Gerät zur Identifikation von Wörtern, die in einem portablen elektronischen Dokument beschrieben sind
US5689585A (en) * 1995-04-28 1997-11-18 Xerox Corporation Method for aligning a text image to a transcription of the image
US6275610B1 (en) 1996-10-16 2001-08-14 Convey Corporation File structure for scanned documents
US6094484A (en) * 1996-10-16 2000-07-25 Convey Corporation Isomorphic pattern recognition
WO1998016897A1 (en) * 1996-10-16 1998-04-23 Convey Corporation Isomorphic pattern recoginition
US6038351A (en) * 1997-10-28 2000-03-14 Cash Management Solutions Apparatus and method for multi-entity, mixed document environment document identification and processing
US6064767A (en) * 1998-01-16 2000-05-16 Regents Of The University Of California Automatic language identification by stroke geometry analysis
US7310769B1 (en) 2003-03-12 2007-12-18 Adobe Systems Incorporated Text encoding using dummy font
US7706613B2 (en) * 2007-08-23 2010-04-27 Kaspersky Lab, Zao System and method for identifying text-based SPAM in rasterized images
US7711192B1 (en) * 2007-08-23 2010-05-04 Kaspersky Lab, Zao System and method for identifying text-based SPAM in images using grey-scale transformation
US9003531B2 (en) * 2009-10-01 2015-04-07 Kaspersky Lab Zao Comprehensive password management arrangment facilitating security

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2905927A (en) * 1956-11-14 1959-09-22 Stanley F Reed Method and apparatus for recognizing words
US4773098A (en) * 1980-05-27 1988-09-20 Texas Instruments Incorporated Method of optical character recognition
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4918740A (en) * 1985-10-01 1990-04-17 Palantir Corporation Processing means for use in an optical character recognition system
JPH07104909B2 (ja) * 1987-03-04 1995-11-13 シャープ株式会社 文字認識方法
US5144682A (en) * 1987-03-05 1992-09-01 Ricoh Company, Ltd. Method and an apparatus for isolating an area corresponding to a character or word
WO1990001198A1 (en) * 1988-07-20 1990-02-08 Fujitsu Limited Character recognition apparatus
US5131049A (en) * 1989-12-08 1992-07-14 Xerox Corporation Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask
US5181255A (en) * 1990-12-13 1993-01-19 Xerox Corporation Segmentation of handwriting and machine printed text
US5172422A (en) * 1991-05-13 1992-12-15 Eastman Kodak Company Fast character segmentation of skewed text lines for optical character recognition
US5307422A (en) * 1991-06-25 1994-04-26 Industrial Technology Research Institute Method and system for identifying lines of text in a document

Also Published As

Publication number Publication date
US5455871A (en) 1995-10-03
JPH05242300A (ja) 1993-09-21

Similar Documents

Publication Publication Date Title
JP2930460B2 (ja) 手書き及びマシン印字テキストの区分化方法
US5201011A (en) Method and apparatus for image hand markup detection using morphological techniques
US5570435A (en) Segmentation of text styles
JP3051182B2 (ja) ハイライト領域検出方法
JP3516269B2 (ja) 文書イメージの処理装置
US5491760A (en) Method and apparatus for summarizing a document without document image decoding
US5369714A (en) Method and apparatus for determining the frequency of phrases in a document without document image decoding
US5272764A (en) Detection of highlighted regions
US5390259A (en) Methods and apparatus for selecting semantically significant images in a document image without decoding image content
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US5434953A (en) Use of fast textured reduction for discrimination of document image components
US5131049A (en) Identification, characterization, and segmentation of halftone or stippled regions of binary images by growing a seed to a clipping mask
US5430808A (en) Image segmenting apparatus and methods
JP3051183B2 (ja) テクスチャ領域と非テクスチャ領域との分割方法
US5892843A (en) Title, caption and photo extraction from scanned document images
Bloomberg Multiresolution morphological approach to document image analysis
US5828771A (en) Method and article of manufacture for determining whether a scanned image is an original image or fax image
US5384863A (en) Methods and apparatus for automatic modification of semantically significant portions of a document without document image decoding
JPH11120293A (ja) 文字認識/修正方式
JP2000194850A (ja) ユ―ザ囲み領域の抽出装置及び抽出方法
US20050238235A1 (en) Run length based connected components and contour following for enhancing the performance of circled region extraction algorithm
US11100355B1 (en) Document image content protection in the context of noise reduction
JP3852218B2 (ja) 画像処理方法および画像処理装置
JP3072126B2 (ja) 書体を識別する方法及び装置
JP4079411B2 (ja) 画像処理方法、画像処理装置、画像処理プログラムおよび画像処理プログラムが格納されたコンピュータ読み取り可能な記憶媒体

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010710

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040114

LAPS Cancellation because of no payment of annual fees