JPH05174179A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH05174179A
JPH05174179A JP3344705A JP34470591A JPH05174179A JP H05174179 A JPH05174179 A JP H05174179A JP 3344705 A JP3344705 A JP 3344705A JP 34470591 A JP34470591 A JP 34470591A JP H05174179 A JPH05174179 A JP H05174179A
Authority
JP
Japan
Prior art keywords
blank area
constituent elements
input document
input
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3344705A
Other languages
English (en)
Inventor
Hiroyuki Mizutani
博之 水谷
Shuichi Tsujimoto
修一 辻本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP3344705A priority Critical patent/JPH05174179A/ja
Publication of JPH05174179A publication Critical patent/JPH05174179A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】本発明は、入力文書の構成要素の空白領域を用
いて段組位置を検出するようにしている。 【構成】入力文書を画像データとして入力する画像入力
部1より入力された画像データより入力文書の構成要素
を構成要素抽出手段21で抽出し、この構成要素抽出手
段21で抽出された構成要素について空白領域検出手段
22により入力文書の文字列方向で隣接する構成要素を
決定するとともに、これら構成要素間の空白領域を定義
し、この定義された構成要素間の空白領域について段組
位置決定手段23により文字列方向と垂直方向の他の構
成要素間の空白領域との連続性を解析し段組位置を決定
するようにしている。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力文書の段組位置を
決定する機能を有する文字画像処理装置に関するもので
ある。
【0002】
【従来の技術】従来、紙面上に記された文字を例えば光
学的なパターン認識で読取り、これをコード化してコン
ピュータに入力するものとして、光学文字認識装置(O
CR)が広く用いられている。このようなOCRの利用
分野としては、郵便物の仕分け業務での郵便番号の読取
りを始めとして、銀号や保険会社などでの伝票処理に実
用化されている。
【0003】また、このようなOCRは、その技術的な
進歩と社会的要請から、読取り対象も印刷文字から手書
き文字に、また数字から仮名・漢字へと拡大し、また、
取扱い文書についても最近は大幅な制限緩和の方向に進
んで、これまでの例えば伝票のように予め決められた領
域中の文字を認識するだけのものから、新聞やマニアル
などの一般文書に対する文字認識へと変化してきてい
る。
【0004】ところで、OCRの読取り対象を伝票のよ
うな定型的なものから新聞などの一般文書に拡大する場
合、入力文書の書式を事前に知る必要がある。つまり、
伝票のような定型的なものでは、読み取るべき文字列の
記載位置を予め特定することができるが、一般文書の場
合には、読み取るべき文字列の記載位置はそれぞれ異な
ることから、入力文書の画像を解析するなどして文字列
の記載位置などを抽出する必要がある。
【0005】しかして、従来では、一般の文書画像は白
/黒の画素で表現されることから、まず、黒画素の連結
性を調べて文字を抽出し、次いで、入力文書を構成する
段組位置を決定し、各段組内において文字列方向に隣接
する文字を統合することにより文字列を定義するように
している。
【0006】図7は、従来の入力文書の段組位置を決定
する方法を説明するためのもので、この場合、最初に入
力文書画像について連結した黒画素成分を文字として抽
出し、これらを同図(a)に示すように最小矩形71の
集まりとして表現し、次いで、文字列方向と考えられる
方向と垂直な方向に最小矩形の先頭位置を投影し、その
周辺分布を解析することで同図(b)に示すようなピー
ク72を検出し、このピーク72の位置に段組位置を与
えるようにしている。
【0007】ところが、このような方法を採ると、例え
ば図8に示すように文字行が数行に及び、同図(a)に
示すように、本来段組位置であるものが、各最小矩形7
1の垂直方向の先頭位置に不揃いの部分があると、この
部分で周辺分布がピーク74を取らないことがあり、ま
た、逆に同図の(b)に示すように本来段組位置でない
ものが、各最小矩形の垂直方向の先頭位置が揃った部分
があると、この部分で周辺分布がピーク73を取ること
があり、これらが段組位置の誤検出の原因になる欠点が
あった。
【0008】
【発明が解決しようとする課題】このように従来の入力
文書の段組位置を決定する方法では、文字を表す各最小
矩形の先頭位置の状態によっては段組位置を誤検出する
ことがあり、正確に文字列を定義することができない欠
点があった。
【0009】本発明は、上記事情に鑑みてなされたもの
で、段組を構成する文字行数の大小にかかわらず、段組
位置を正確に決定することができる段組位置決定機能を
有する文書画像処理装置を提供することを目的とする。
【0010】
【課題を解決するための手段】本発明は、入力文書を画
像データとして入力する画像入力手段、画像入力手段よ
り入力された画像データより前記入力文書の構成要素を
抽出する構成要素抽出手段、構成要素抽出手段により抽
出された構成要素について入力文書の文字列方向で隣接
する構成要素を決定するとともに、これら構成要素間の
空白領域を定義する空白領域検出手段、空白領域検出手
段で定義された構成要素間の空白領域について文字列方
向と垂直方向に位置する他の構成要素間の空白領域との
連続性を解析し入力文書の段組位置を決定する段組位置
決定手段とにより構成されている。
【0011】
【作用】この結果、本発明によれば入力文書の各構成要
素間の空白領域に注目し、文字列方向と垂直方向に位置
する他の構成要素間の空白領域との連続性を検出すると
ともに、この状態を解析することで、段組を構成する文
字行の段組位置を高精度に決定できるようになる。
【0012】
【実施例】以下、本発明の一実施例を図面に従い説明す
る。
【0013】図1は同実施例の概略構成を示している。
図において、1は画像入力部で、この画像入力部1は入
力文書が入力されると、この入力文書を画像データとし
て出力するようにしている。この場合、画像入力部1と
してはスキャナなどが用いられる。ここで、スキャナ
は、原画像をラスタスキャンして原画像データとして2
値画像データを出力するようにしている。以下述べる処
理では、この2値画像データを直接用いてもよいが、符
号化して符号化データに変換し、これを処理の対象とし
てもよい。符号化の方法としては、同じ色の画素の連な
り(ラン)の長さを符号化するランレングス符号化法な
どが用いられる。
【0014】画像入力部1より出力される画像データ
は、制御部2を介して画像メモリ3に格納される。ここ
で、制御部2は、構成要素抽出手段21、空白領域検出
手段22、段組位置決定手段23を有している。構成要
素抽出手段21は、画像データを解析し入力文書の構成
要素、例えば文字、罫線、図表、写真、ノイズなどを抽
出するものである。
【0015】空白領域検出手段22は、構成要素抽出手
段21で抽出された構成要素に対して各構成要素の隣接
関係および各構成要素に付加された属性に基づき、空白
領域を定義検出するものである。段組位置決定手段23
は、空白領域検出手段22で定義された空白領域を解析
して段組位置を決定するものである。そして、制御部2
の段組位置決定手段23で決定された段組位置は、出力
部4より外部に出力されるようになっている。次に、以
上のように構成した実施例の動作を説明する。
【0016】いま、画像入力部1に入力文書が入力され
ると、スキャナによるラスタスキャンにより入力文書
は、2値の画像データとして出力され、制御部2を介し
て画像メモリ3に格納される。
【0017】この状態で制御部2は、構成要素抽出手段
21により画像データを解析し入力文書の構成要素を抽
出する。この場合、構成要素抽出手段21は、図2に示
すように、画像データが入力されると、ステップS21
で画像データから構成要素として黒連結成分を抽出する
黒連結成分抽出処理を行い、この黒連結成分に基づいて
ステップS22で属性決定処理を行い属性を決定するよ
うにしている。この場合の属性決定処理は、各黒連結成
分をそれを取り囲む最小の矩形で代表し、その黒連結成
分矩形の大きさ、およびその矩形内に含まれる黒領域の
割合に基づいて属性を決定する。その一例を図3に示し
ている。この場合、黒連結成分矩形の横幅をW、縦幅を
H、黒領域の割合(密度)をMとすると、黒連結成分に
ついて、まずステップS31で縦幅Hがしきい値TH1
より小さいか判断し、ここでNOならば、ステップS3
2で縦幅Hと横幅Wの比がしきい値TH4より大きいか
判断し、ここでYESならば垂直直線と判断し、NOな
らば、ステップS33で密度Mがしきい値TH6より大
きいか判断し、ここでYESならば写真と判断し、NO
ならば図形と判断する。一方、ステップS31でYES
ならば、ステップS34で縦幅Hがしきい値TH2より
小さいか判断し、ここでNOならば、ステップS35で
密度Mがしきい値TH5より大きいか判断し、ここでY
ESならば文字と判断し、NOならば、ステップS36
で縦幅Hと横幅Wの比がしきい値TH4より大きいか判
断し、ここでYESならば水平直線、NOならば文字と
判断する。また、ステップS34でYESならば、ステ
ップS37で横幅Wがしきい値TH3より小さいか判断
し、YESならばノイズと判断し、NOならばステップ
S38で縦幅Hと横幅Wの比がしきい値TH4より大き
いか判断し、ここでYESならば水平直線、NOならば
ノイズと判断する。
【0018】そして、構成要素抽出手段21で抽出され
た構成要素が空白領域検出手段22に与えられ、各構成
要素の隣接関係および各構成要素に付加された属性に基
づき空白領域が定義検出される。
【0019】空白領域検出手段22では、まず、各構成
要素に対して空白領域を定義するためのペアを決定す
る。この場合、各構成要素Ki(i=1〜N:N=構成
要素の数)に対して文字列の方向と垂直方向(y軸方
向)で重なりをもつ構成要素Kjを検出する。これは次
式により求められる(ただし、ここでは文字列の方向が
水平方向とする。)。 yi2>yj1かつyi1<yj2 ただし、yi1( yj1) :構成要素Ki(Kj)のy座標
の最小値 yi2( yj2) :構成要素Ki(Kj)のy座標の最大値 従って、図4に示す例では、構成要素1に対して構成要
素2、3が垂直方向に重なりを持つことになる。
【0020】次に、これら重なり関係を持つ構成要素の
うちで最も文字列の方向(x軸方向)で隣接するものを
求め、これを構成要素Kiに対するペアとする。つま
り、これには、 min(xj1−xi2) ただし、xi1( xj1) :構成要素Ki(Kj)のx座標
の最小値 xi2( xj2) :構成要素Ki(Kj)のx座標の最大値 なる構成要素Kjを求めることである。従って、図4に
示す例では、構成要素1に対して構成要素2がペアとし
て決定されることになる。
【0021】なお、文字列の方向に関しては、処理に先
立ってオペレータが指示を与えてもよいし、構成要素の
水平、垂直方向への周辺分布を求めるといった何等かの
適切な方法によって与えることも可能である。
【0022】次に、各構成要素のペアに対して空白領域
を定義する。この場合、図4に示す構成要素1、2のペ
アを考えると、構成要素1は(x11、y11)(x12、y
12)、構成要素2は(x21、y21)(x22、y22)で、
(x11<x21)の関係が与えられる。従って、これら構
成要素1、2の間に存在する空白領域Sは、構成要素
1、2のそれぞれの属性により次のようにして決定され
る。図5(a)は構成要素1、2の属性がともに文字の
場合を示しており、この場合の空白領域Sは、 Sx1=x12 Sx2=x21 Sy1=min(y11、y21) Sy2=max(y12、y22) で決定される。
【0023】また、図5(b)は構成要素1の属性が文
字で、構成要素2の属性が図表あるいは写真の場合、ま
たは構成要素1の属性が図表あるいは写真で、構成要素
2の属性が文字の場合を示しており、この場合の空白領
域Sは、 Sx1=x12 Sx2=x21 Sy1=max(y11、y21) Sy2=min(y12、y22) で決定される。なお、min(a、b)はa、bの小さ
いほうの、またmax(a、b)はa、bの大きいほう
値を取るものとする。
【0024】このようにして空白領域Sの矩形は、(S
x1、Sy1) (Sx2、Sy2)で定義され、空白領域Sは、
いかなる構成要素の間において定義されたものかが明示
されることになる。なお、この場合、上述以外の組み合
わせを持つ構成要素間には、空白領域は定義されない。
次に、上記のように定義された空白領域Sを段組位置決
定手段23により解析し、段組位置を決定するようにな
る。
【0025】この場合、最初に文字間で定義された空白
領域についてその平均値Ave_widthを求める。
次に、各文字間で定義された空白領域の内で、その矩形
幅が平均値Ave_widthより大きな値を持つ空白
領域および文字−図形(写真)間で定義された空白領域
を検出し、これらを種空白領域とする。この状態を図6
(a)に示している。図面では、隣接する構成要素であ
る文字間の空白領域を種空白領域S1に設定されてい
る。
【0026】次に、このような種空白領域S1に対して
検索領域Rを決定する。この場合、種空白領域S1 を
(S1x1、S1y1) 、(S1x2、S1y2)とすると、検
索領域Rは、 R=[S1x1、S1y1]X[S1x2、S1y2+search-l
ength ] で与えられる。ここで、search-length は、各空白領域
の高さの平均値を基に決められるもので、search-lengt
h =Th0*空白領域の高さの平均値で与えられる。
【0027】次に、種空白領域S1により決定された検
索領域Rを垂直方向に下ろし、他の文字間の空白領域と
の重なりを検出する。いま、図6(b)に示すように種
空白領域S1により決定された検索領域Rを垂直方向に
下ろしたところ、他の空白領域S2との重なり連続性を
持つような場合、種空白領域S1は、[max(S1x
1、S2x1)、S1y1]X[min(S1x2、S2x
2)、S2y1]のように拡張される。
【0028】以下、同様にして検索領域Rを垂直方向に
下ろし他の文字間の空白領域との重なりを判断しながら
その連続性を検出し、これらに連続性があったならば種
空白領域S1を順次拡張していく。
【0029】その後、図6(c)に示すように検索領域
Rが他の文字間の空白領域と重なりを持たないものがあ
ると、種空白領域S1の拡張は終了し、ここまで得られ
た種空白領域S1を段組の候補とする。
【0030】そして、このように最終的に得られた種空
白領域S1(S1x1、S1y1) 、(S1x2、S1y2)に
対して、統合された種空白領域Sの数N、種空白領域S
1の縦幅H(=S1y2−S1y1)、横幅W(=S1x2−
S1x1)により、段組として決定するか否かを判断す
る。この場合、例えば、しきい値th1、th2、th
3を用いて、N>th1、H>th2、W>th3なら
ば段組と判断し、この結果を出力部4より出力するよう
になる。
【0031】従って、このようにすれば、従来では、入
力文書中の各文字行の先頭位置が文字行と垂直方向に揃
っていることに着目して段組位置の検出が行われるた
め、垂直方向に揃っている文字行の数が少なかったり、
段組位置以外の場所で文字行が偶然に揃ったような場合
に誤検出をすることがあったが、本発明では、入力文書
の各構成要素の間に存在する空白領域に注目し、この空
白領域の文字列方向と垂直方向に位置する他の構成要素
間の空白領域との連続性を解析して段組位置を決定する
ようになるので、段組を構成する文字行数の大小にかか
わらず、高性能な段組位置検出を実現することができ
る。
【0032】なお、本発明は上記実施例にのみ限定され
ず、要旨を変更しない範囲で適宜変形して実施できる。
例えば、上述した実施例では入力画像の空白領域に着目
する段組位置の検出であったが、上述した実施例より得
られる段組位置と従来技術により得られた段組位置ある
いは垂直直線の位置とを総合的に判定して段組位置を決
定することもできる。ここで、垂直直線が段組位置検出
に用いられるのは、垂直直線は、段組位置を示すフィー
ルドセパレータとしての役割を果たすことが多いからで
ある。
【0033】
【発明の効果】本発明によれば、入力文書において構成
要素の間の空白領域に注目したことにより、段組を構成
する文字行の数の大小に関係なく、それぞれの段組位置
を正確に検出することができる。
【図面の簡単な説明】
【図1】本発明の一実施例の概略構成を示すブロック
図。
【図2】図1に示す実施例の構成要素抽出手段での動作
を説明するための図。
【図3】図1に示す実施例の構成要素抽出手段での属性
設定処理を説明するための図。
【図4】図1に示す実施例の空白領域検出手段での動作
を説明するための図。
【図5】図1に示す実施例の空白領域検出手段での動作
を説明するための図。
【図6】図1に示す実施例の段組位置決定手段での動作
を説明するための図。
【図7】従来の段組位置を決定する方法を説明するため
の図。
【図8】従来の段組位置を決定する方法を説明するため
の図。
【符号の説明】
1…画像入力部、2…制御部、21…構成要素抽出手
段、22…空白領域検出手段、23…段組位置決定手
段、3…画像メモリ、4…出力部。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力文書を画像データとして入力する画
    像入力手段と、 この画像入力手段より入力された画像データより前記入
    力文書の構成要素を抽出する構成要素抽出手段と、 この構成要素抽出手段により抽出された構成要素につい
    て前記入力文書の文字列方向で隣接する構成要素を決定
    するとともにこれら構成要素間の空白領域を定義する空
    白領域検出手段と、 この空白領域検出手段で定義された構成要素間の空白領
    域について前記文字列方向と垂直方向に位置する他の構
    成要素間の空白領域との連続性を解析し前記入力文書の
    段組位置を決定する段組位置決定手段とを具備したこと
    を特徴とする文書画像処理装置。
  2. 【請求項2】 構成要素抽出手段は、画像データより構
    成要素として黒連結成分を抽出するとともに、該黒連結
    成分の大きさおよび複雑さに基づいて属性を決定する手
    段を有することを特徴とする請求項1記載の文書画像処
    理装置。
  3. 【請求項3】 空白領域検出手段は、前記構成要素の隣
    接関係とそれぞれの構成要素の属性に基づいて構成要素
    間の空白領域を定義することを特徴とする請求項2記載
    の文書画像処理装置。
JP3344705A 1991-12-26 1991-12-26 文書画像処理装置 Pending JPH05174179A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3344705A JPH05174179A (ja) 1991-12-26 1991-12-26 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3344705A JPH05174179A (ja) 1991-12-26 1991-12-26 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPH05174179A true JPH05174179A (ja) 1993-07-13

Family

ID=18371345

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3344705A Pending JPH05174179A (ja) 1991-12-26 1991-12-26 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPH05174179A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0861842A4 (en) * 1995-06-08 2000-01-12 Kyorin Seiyaku Kk NOVEL WATER-SOLUBLE DERIVATIVE OF FLUOROETHYLCAMPTOTHECIN AND PROCESS FOR PRODUCING THE SAME
US6332046B1 (en) 1997-11-28 2001-12-18 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0861842A4 (en) * 1995-06-08 2000-01-12 Kyorin Seiyaku Kk NOVEL WATER-SOLUBLE DERIVATIVE OF FLUOROETHYLCAMPTOTHECIN AND PROCESS FOR PRODUCING THE SAME
US6332046B1 (en) 1997-11-28 2001-12-18 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program
US6577763B2 (en) 1997-11-28 2003-06-10 Fujitsu Limited Document image recognition apparatus and computer-readable storage medium storing document image recognition program

Similar Documents

Publication Publication Date Title
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
US6411733B1 (en) Method and apparatus for separating document image object types
US7805022B2 (en) Image processing apparatus, image processing method and computer program
US8412705B2 (en) Image processing apparatus, image processing method, and computer-readable storage medium
JP4574503B2 (ja) 画像処理装置、画像処理方法およびプログラム
JPH01253077A (ja) 文字列検出方法
CN102722729A (zh) 通过用字符的形状特征来比较字符而检测文档变化的方法
US8229214B2 (en) Image processing apparatus and image processing method
JPH09311905A (ja) 行検出方法および文字認識装置
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
JPH05174179A (ja) 文書画像処理装置
JP2007081882A (ja) 原稿読取装置および原稿読取方法
Sherkat et al. Use of colour for hand-filled form analysis and recognition
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0291789A (ja) 文字認識方法
JPH0916713A (ja) 画像領域分割方法
JP7532124B2 (ja) 情報処理装置、情報処理方法及びプログラム
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2747136B2 (ja) 文字認識装置
JPS5949671A (ja) 光学的文字読取装置
JP2715930B2 (ja) 線分検出方法
JP2923004B2 (ja) 画像生成装置
JPH05274472A (ja) 画像認識装置
JPH08297718A (ja) 文字切り出し装置及び文字認識装置