JPH05189607A - 紙文書画像処理装置 - Google Patents

紙文書画像処理装置

Info

Publication number
JPH05189607A
JPH05189607A JP4005285A JP528592A JPH05189607A JP H05189607 A JPH05189607 A JP H05189607A JP 4005285 A JP4005285 A JP 4005285A JP 528592 A JP528592 A JP 528592A JP H05189607 A JPH05189607 A JP H05189607A
Authority
JP
Japan
Prior art keywords
paper document
region
area
black
binary image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4005285A
Other languages
English (en)
Other versions
JP3074210B2 (ja
Inventor
Toshiyuki Yoshitake
敏幸 吉武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP04005285A priority Critical patent/JP3074210B2/ja
Publication of JPH05189607A publication Critical patent/JPH05189607A/ja
Application granted granted Critical
Publication of JP3074210B2 publication Critical patent/JP3074210B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 紙文書画像処理装置に関し、紙文書2値画像
に対するラベリングにより抽出される連結領域の分類精
度を上げることを目的とする。 【構成】 画像入力部3と、この出力である2値画像の
黒画素間に挟まれる白画素が所定長以下のときこれらを
黒画素に変換して拡大2値画像を作成する黒画素融合部
7と、この拡大2値画像から黒画素同士が繋がった連結
領域を抽出するラベリング部4と、連結領域の各黒画素
から背景画素までの最短の距離値を求める距離変換部5
と、連結領域ごとに、この距離値のデ−タ群の特徴を示
す指標とあらかじめ定められた基準値との関係に基づい
てその「太さ」を判定することにより、図形・表に対応
した「最も細い連結領域」,文字に対応した「次に細い
連結領域」および写真に対応した「太い連結領域」とに
分類する領域分類部とを備え、前記連結領域の分類基準
としてそれぞれの「太さ」を用いるように構成する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、紙文書画像処理装置に
関し、特にイメージスキャナなどで入力した紙文書画像
を有意画素と背景画素からなる2値画像に変換し、続い
てラベリングによりこの2値画像中の有意画素が繋がっ
た部分である連結領域を個々に特定し、この連結領域の
それぞれの種別、すなわち紙文書中の文字,図形・表,
写真のどれに対応した連結領域であるかの分類を行うよ
うにした紙文書画像処理装置に関する。
【0002】近年、ワードプロセッサやパーソナルコン
ピュータなどの普及により、各種デ−タをCDーRO
M,磁気ディスクなどの電子文書に蓄積してデ−タの追
加,削除,修正などの編集処理を容易にすることが広く
行われており、また、これらの蓄積デ−タはデ−タベー
ス化されてコンピュータ検索に供されている。
【0003】そして、このデ−タベースの品質を高める
には、すでに紙文書として保存されている膨大な量の紙
文書デ−タ(画像)を電子文書化することが必要とな
り、この電子文書化のための入力処理を自動的に、また
迅速・正確に行うことができる紙文書画像処理装置の実
現が望まれている。
【0004】そして、このような紙文書画像処理装置で
は、紙文書をイメージスキャナなどで読み取ることによ
り求めた画素単位の紙文書画像(2値画像)から有意画
素、例えば黒画素が互いに繋がった連結領域を抽出し、
この連結領域を単位とした処理を行なって元の紙文書中
の写真、文字,図形,表などを個々に電子文書化してい
るが、このとき、先に抽出した連結領域がどの種別であ
るかの判定を正確に行うことが電子文書データの精度を
高める上で特に重要となっている。
【0005】
【従来の技術】一般に、画素単位の紙文書画像(2値画
像)から、有意画素が互いに繋がった連結領域を抽出す
る際にはラベリング、すなわち図6に示すように、例え
ば一定値以上の濃度を持つ黒画素を有意画素として、こ
の有意画素が互いに繋がっている部分を連結領域として
抽出し、有意画素のそれぞれに連結領域ごとの符号を付
与するといった処理をおこなっている。
【0006】ここで抽出した連結領域は、元の紙文書中
の写真,文字,図形,表などに対応したもので、続い
て、 すべての連結領域に対して文字認識処理を行ない、文
字認識が出来ない場合にはその連結領域は文字以外の部
分に対応したものと判断する 連結領域の高さ,幅に基づいてその大きさを計測して
(図7参照)、これがあらかじめ定められた基準値より
も大きい場合には写真,図形,表のいずれかに対応した
連結領域であると判断し、また、その大きさが前記基準
値よりも小さい場合には文字に対応した連結領域である
と判断する のどちらかの処理を実行することにより電子文書化を行
っていた。
【0007】
【発明が解決しようとする課題】このような従来の電子
文書化処理では、 の場合、すべての連結領域に対する文字認識処理を行
うようになるため処理効率が悪くなるといった問題点が
あり、 の場合、連結領域の高さと幅の長い部分(連結領域に
外接する長方形領域)に着目してその大きさを判断して
いるため、文字などではその連結領域の形状と前記長方
形領域のそれとの違いが著しくなって、比較的大きな文
字に対応した連結領域や比較的小さな写真,図形,表な
どに対応した連結領域などの分類精度が悪くなるという
問題点があった(図7参照)。
【0008】そこで、本発明では、紙文書の2値画像、
さらには文字の場合のようにその有意画素同士間に挟ま
れている所定長以下の背景画素を有意画素に変換して作
成した膨張2値画像から連結領域を抽出し、この連結領
域ごとに、有意画素のそれぞれについてそこから背景画
素にいたるまでの最短の距離値(以下単に「距離値」と
いう)を求めていき、次に、この距離値のデータ群の特
徴を示す指標(データ群の分布状況や平均値)とあらか
じめ定められた基準値との関係に基づいて当該連結領域
の「太さ」を判定し、この判定結果にしたがった分類を
行うことにより、各連結領域の分類精度を高めることを
目的とする。
【0009】
【課題を解決するための手段】本発明は、紙文書の2値
画像に対するラベリングにより抽出した連結領域ごと
に、その構成要素である有意画素のそれぞれについての
背景画素までの距離値を算出し、このデータ群の分布状
況や平均値から当該連結領域の「太さ」を判定し、この
「太さ」を基準にして各連結領域を分類するようにした
紙文書画像処理装置である。
【0010】図1は本発明の原理説明図である。図にお
いて、1は、紙文書であり、その中の文字,図形,表や
写真などの意味ある情報が電子文書化の対象となる。2
は、紙文書画像処理装置であり、イメージスキャナなど
で入力した紙文書画像(2値画像)から抽出される各連
結領域を、その「太さ」を基準にして、文書中の文字,
図形,表や写真などのそれぞれに対応した連結領域に分
類している。3は、画像入力部であり、紙文書をイメー
ジスキャナなどで画像入力し、有意画素(例えば一定値
以上の濃度を持つ黒画素)と背景画素とからなる2値画
像8に変換している。なお、有意画素として一定値以下
の濃度を持つ白画素を用いるようにしてもよい。4は、
ラベリング部であり、画像入力部3で求めた2値画像8
から有意画素同士が繋がった部分を連結領域として抽出
し、これら各連結領域を構成する画素のそれぞれに対し
て連結領域ごとの記号(A,B,Cなど)を付与してい
る。なお、この記号は画像デ−タとして記憶され、ラベ
ル画像9を構成する。5は、距離変換部であり、有意画
素のそれぞれについて、その画素から背景画素までの距
離値、例えば背景画素に至るまでに経由する有意画素の
数などを算出している。なお、この有意画素数算出の際
の経路設定方向としては、上下左右方向および斜方向を
用いている。6は、領域分類部であり、連結領域ごとの
前記距離値のデ−タ群の特徴を示す指標を算出し、この
指標と、あらかじめ定められた閾値とを比較して各連結
領域の「太さ」を判定することにより、それぞれの連結
領域を、紙文書中の文字および図形・表などの線図形に
対応した「細い連結領域」と、紙文書中の写真に対応し
た「太い連結領域」とに分類している。なお、指標とし
ては、前記デ−タ群の分布状況や平均値を用いている。
【0011】
【作用】本発明は、このように、紙文書の2値画像から
抽出した連結領域のそれぞれについて、その構成要素で
ある有意画素から背景画素までの距離値を算出し(図2
参照)、続いてこの距離値のデ−タ群のヒストグラムで
の距離値の分布状況や、この距離値のデ−タ群の平均値
などに基づく「太さ」を基準にしてその連結領域を、少
なくとも前記線図形に対応した「細い連結領域」と、写
真に対応した「太い連結領域」との二つに分類してい
る。
【0012】また、後述のように、画像入力部3の出力
側に設けた有意画素(黒画素)融合部において所定の背
景画素を有意画素に変換した後で、前記のラベリング,
距離値算出,連結領域の分類といった処理を行うことに
より、先の「細い連結領域」を紙文書中の図形・表に対
応した「最も細い連結領域」と、紙文書中の文字に対応
した「次に細い領域」とにさらに分けて、先の「太い連
結領域」との三つに分類することもできる。
【0013】そして、前記ヒストグラムを用いた分類基
準の一例としては、それぞれの連結領域について、あら
かじめ定められた基準値以下の距離値を示す有意画素数
の全有意画素数に対する割合が用いられ、例えば「2」
以下の距離値を持つ有意画素数が全体の90%以上を占め
る連結領域については文字,図形,表などの線図形に対
応した「細い連結領域」に分類し、そうでない連結領域
については写真に対応した「太い連結領域」に分類する
といった具合である。
【0014】図2で示した連結領域をこの基準で分類す
ると、距離値が「2」以下の有意画素数の全有意画素数
に対する割合は約81%となって「太い連結領域」に分類
され、また図3で示した連結領域は、有意画素の距離値
はすべて「1」で前記割合は100%となって「細い連結
領域」に分類されることになる。
【0015】また、前記ヒストグラムを用いずに、連結
領域ごとにその距離値のデ−タ群の平均値を求め、これ
があらかじめ定められた基準値より小さい連結領域につ
いては「細い連結領域」に分類し、また大きい連結領域
については「太い連結領域」に分類するようにしてもよ
い。
【0016】
【実施例】図4〜図5を参照して本発明の実施例を説明
する。図4は、紙文書中の線図形に対応した「細い連結
領域」を、文字に対応したものと図形・表に対応したも
のとに細分類する機能を備えた紙文書画像処理装置を示
す説明図であり、構成的には、図1の紙文書画像処理装
置の画像入力部3とラベリング部4との間に有意画素融
合部7を設けたものである。なお、この実施例では黒画
素を有意画素としている。
【0017】この有意画素融合部7は近接する黒画素同
士間の融合処理を行うもので、図5に示すように、2値
画像の黒画素同士間の距離値(白画素の数)を求めてこ
の値が所定長以下の場合には当該黒画素に挟まれた白画
素の部分を黒画素に変換して黒画素領域を広げた状態の
膨張2値画像を作成するものである。
【0018】例えば、文字の2値画像のように、近接す
る黒画素間の間隔が比較的短い部分はこの黒画素融合処
理を受けるのに対して、図形・表の2値画像のように、
近接する黒画素間の間隔が比較的長い部分はこの黒画素
融合処理を受けない。なお、図5の実施例では、前記所
定長として1画素の長さを選択したが、実際には3〜5
画素の長さに設定した状態で黒画素融合処理を行うこと
が多い。
【0019】また、前記したように、紙文書中の写真は
文字図形・表などにくらべてもともと「密な画像」とな
っているため、有意画素融合部7で得られる拡大2値画
像に対してラベリングを行なう場合でも、文字のよう
に、黒画素融合処理を受けて拡大した2値画像部分の連
結領域が、通常このような処理を受けることのない写真
のそれよりも太くなるといったことはなく、したがって
このラベリング後の各連結領域の「太さ」は、図形・表
に対応した連結領域,文字に対応した連結領域および写
真に対応した連結領域の順に太くなる傾向を示す。
【0020】そして、領域分類部6において、前記距離
値のヒストグラムに基づいて各連結領域を先の3領域に
分ける際に用いられる分類基準は、例えば、 先ず、あらかじめ定められた第1の基準値L1 以下の
距離値が一定以上の割合であるかどうかを判断して、
「YES」の場合はその連結領域を紙文書の図形・表に対
応した「最も細い連結領域」として分類し、「NO」の場
合は次のの判断を行う。 あらかじめ定められた第2の基準値L2 (L2
1 )以下の距離値が一定以上の割合であるかどうかを
判断して、「YES」の場合はその連結領域を紙文書の文
字に対応した「次に細い連結領域」として分類し、「N
O」の場合はその連結領域を紙文書の文字に対応した
「次に細い連結領域」として分類する、といったもの
で、図1の紙文書画像処理装置で用いた基準値(L2
相当)とは別の基準値(L1 が相当)を新たに用いてい
る。
【0021】ここで、第1の基準値L1 に「1」、第2
の基準値L2 に「2」、また一定以上の割合として「90
%」を用いて分類処理を行うと、 ・図5(a) の拡大2値画像から抽出される連結領域は、
距離値が「1」の黒画素数の全黒画素数に対する割合は
約85%、また距離値が「2」以下の黒画素数の全黒画素
数に対する割合は 100%となって「次に細い連結領域」
に分類され(先の,の分類基準)、 ・図5(b) の拡大2値画像から抽出される連結領域は、
距離値が「1」の黒画素数の全黒画素数に対する割合は
約94%となって「最も細い連結領域」に(先のの分類
基準)に分類される。なお、○に斜線を入れた部分は距
離値が「2」となる黒画素を示している。
【0022】先の分類基準によれば、「最も細い連結領
域」,「次に細い連結領域」,「太い連結領域」の順で
分類されることになるが、これに限定されることなく、
2 以上の距離値が一定以上の割合であるかどうかを調
べることにより先ず「太い連結領域」への分類判断を行
なったり、L1 〜L2 の間の距離値が一定以上の割合で
あるかどうかを調べることにより先ず「次に細い連結領
域」への分類判断を行なうようなものでもよい。
【0023】また、第1,第2の基準値L2 として、一
定範囲の距離値を示す黒画素数と連結領域の全黒画素数
との割合を用いるような判定基準、例えば距離値が
「1」の黒画素数の占める割合が90%以上のときは「最
も細い連結領域」に、80〜90%のときは「次に細い連結
領域」に、そして80%未満のときは「太い連結領域」に
それぞれ分類するといったものでもよい。
【0024】
【発明の効果】本発明は、このように、紙文書の2値画
像,拡大2値画像から抽出した各連結領域について、そ
の構成要素である有意画素のそれぞれから背景画素まで
の最短の距離値を算出し、続いてこの距離値のデ−タ群
のヒストグラムでの距離値の分布状況や、この距離値の
デ−タ群の平均値などから求めた「連結領域の太さ」を
基準にしてその連結領域が、紙文書の文字,図形・表お
よび写真のどれに対応するかを分類しているため、従来
の「連結領域の高さ,幅」を基準にした分類に比べて、
連結領域の形状をより正確に認識した上での分類処理が
行われることになり分類精度の向上を図ることができ
る。
【図面の簡単な説明】
【図1】本発明の原理説明図である。
【図2】本発明の、連結領域の分類状況を示す説明図
(その1)である。
【図3】本発明の、連結領域の分類状況を示す説明図
(その2)である。
【図4】本発明の、有意画素融合部(黒画素融合部)を
備えた紙文書画像処理装置を示す説明図である。
【図5】本発明の、黒画素融合の様子を示す説明図であ
る。
【図6】一般的な、ラベリングの様子を示す説明図であ
る。
【図7】従来の、連結領域の分類基準として用いられる
「連結領域の大きさ」を示す説明図である。
【符号の説明】
1・・・紙文書 2・・・紙文書画像処理装置 3・・・画像入力部 4・・・ラベリング部 5・・・距離変換部 6・・・領域分類部 7・・・有意画素融合部(黒画素融合部) 8・・・2値画像 9・・・ラベル画像

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】 紙文書の画像を自動入力し、この紙文書
    画像を画素単位で2値化する画像入力部と、 この2値画像の、有意画素同士が繋がった部分を連結領
    域として抽出し、当該有意画素のそれぞれに対して連結
    領域ごとの記号を付与するラベリング部と、 前記連結領域を構成する各有意画素について、そこから
    背景画素にいたるまでの最短の距離値を求める距離変換
    部と、 前記連結領域ごとに、当該距離値のデ−タ群の特徴を示
    す指標と、あらかじめ定められた基準値との関係に基づ
    いて各連結領域の「太さ」を判定することにより、それ
    ぞれの連結領域を、前記紙文書中の文字および図形・表
    などの線図形に対応した「細い連結領域」と前記紙文書
    中の写真に対応した「太い連結領域」とに分類する領域
    分類部とを備え、 前記連結領域を、その「太さ」を基準にして、少なくと
    もこれらの「細い連結領域」と「太い連結領域」とに自
    動的に分類するようにしたことを特徴とする紙文書画像
    処理装置。
  2. 【請求項2】 前記画像入力部の出力側に、前記2値画
    像の有意画素に挟まれた背景画素部分の距離値が所定長
    以下の場合にはこの背景画素を有意画素に変換して膨張
    2値画像を生成する有意画素融合部を設け、 前記ラベリング部は、この膨張2値画像から前記連結領
    域の抽出を行い、 前記領域分類部は、前記「細い連結領域」を、前記図形
    ・表に対応した「最も細い連結領域」と前記文字に対応
    した「次に細い領域」とにさらに分類するための新たな
    基準値を併用するようにしたことを特徴とする請求項1
    記載の紙文書画像処理装置。
  3. 【請求項3】 前記指標として、前記連結領域ごとの前
    記距離値のデ−タ群の分布状況を用いるようにしたこと
    を特徴とする請求項1又は2記載の紙文書画像処理装
    置。
  4. 【請求項4】 前記指標として、前記連結領域ごとの前
    記距離値のデ−タ群の平均値を用いるようにしたことを
    特徴とする請求項1又は2記載の紙文書画像処理装置。
JP04005285A 1992-01-16 1992-01-16 紙文書画像処理装置 Expired - Lifetime JP3074210B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP04005285A JP3074210B2 (ja) 1992-01-16 1992-01-16 紙文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP04005285A JP3074210B2 (ja) 1992-01-16 1992-01-16 紙文書画像処理装置

Publications (2)

Publication Number Publication Date
JPH05189607A true JPH05189607A (ja) 1993-07-30
JP3074210B2 JP3074210B2 (ja) 2000-08-07

Family

ID=11606972

Family Applications (1)

Application Number Title Priority Date Filing Date
JP04005285A Expired - Lifetime JP3074210B2 (ja) 1992-01-16 1992-01-16 紙文書画像処理装置

Country Status (1)

Country Link
JP (1) JP3074210B2 (ja)

Also Published As

Publication number Publication date
JP3074210B2 (ja) 2000-08-07

Similar Documents

Publication Publication Date Title
Santosh et al. Overlaid arrow detection for labeling regions of interest in biomedical images
US8442319B2 (en) System and method for classifying connected groups of foreground pixels in scanned document images according to the type of marking
US9710704B2 (en) Method and apparatus for finding differences in documents
JP5050075B2 (ja) 画像判別方法
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
US8249343B2 (en) Representing documents with runlength histograms
Xi et al. A video text detection and recognition system
US7035463B1 (en) Document image processor, method for extracting document title, and method for imparting document tag information
JPH01253077A (ja) 文字列検出方法
JP2007172077A (ja) 画像検索システム及び方法及びプログラム
US11935314B2 (en) Apparatus for generating a binary image into a white pixel, storage medium, and method
JPH05225378A (ja) 文書画像の領域分割システム
US20060078204A1 (en) Image processing apparatus and method generating binary image from a multilevel image
CN114581928A (zh) 一种表格识别方法及系统
EP1202213B1 (en) Document format identification apparatus and method
JP5929282B2 (ja) 画像処理装置及び画像処理プログラム
CN113496115A (zh) 文件内容比对方法和装置
EP3639203B1 (en) Out-of-bounds detection of a document in a live camera feed
KR100957508B1 (ko) 광학 문자 인식 시스템 및 방법
JPH05189607A (ja) 紙文書画像処理装置
JP2001034763A (ja) 文書画像処理装置、その文書タイトル抽出方法及び文書タグ情報付与方法
JPH11191135A (ja) 文書画像の日本語英語判定方法、文書認識方法および記録媒体
Maity et al. An approach for detecting circular callouts in architectural, engineering and constructional drawing documents
JP3220226B2 (ja) 文字列方向判別方法
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000523