JPH0728934A - 文書画像処理装置 - Google Patents

文書画像処理装置

Info

Publication number
JPH0728934A
JPH0728934A JP5192745A JP19274593A JPH0728934A JP H0728934 A JPH0728934 A JP H0728934A JP 5192745 A JP5192745 A JP 5192745A JP 19274593 A JP19274593 A JP 19274593A JP H0728934 A JPH0728934 A JP H0728934A
Authority
JP
Japan
Prior art keywords
layout information
document
area
layout
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5192745A
Other languages
English (en)
Inventor
Naohiro Amamoto
直弘 天本
Sadamasa Hirogaki
節正 広垣
Yoshitaka Hamaguchi
佳孝 濱口
Makoto Torigoe
真 鳥越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5192745A priority Critical patent/JPH0728934A/ja
Publication of JPH0728934A publication Critical patent/JPH0728934A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【目的】 同一のレイアウトの文書を複数処理する場合
の処理効率を高める。 【構成】 同一のレイアウトの複数の文書を処理する際
に読取部1で最初の文書を読み取り、レイアウト情報作
成部2で領域分割を行ない、レイアウト情報を作成す
る。このレイアウト情報は、文書中の各分割領域につい
てその領域内の情報が文字、図形、写真等のいずれかを
示す情報である。このレイアウト情報は、レイアウト情
報格納部3に格納しておく。そして、それ以降の文書に
ついて領域分割を行なう場合はそのレイアウト情報を参
照して領域分割を行なう。これにより、複数の文書につ
いて各々領域分割を最初から繰り返すのではなく、最初
の領域分割の結果を利用した効率的な領域分割を行な
う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識装置(OC
R)やファクシミリ等に使用される文書画像処理装置に
関するものである。
【0002】
【従来の技術】文字のほかに絵や写真等を含む文書中の
文字を認識する場合、文書画像中から文字の部分だけを
取り出さなければならない。このような文書画像の処理
を行なう装置が文書画像処理装置である。
【0003】図2は、従来の文書画像処理の一例の説明
図である。文書画像から文字列領域及び枠領域を抽出
し、これらの領域の相関を求める。文字列領域と枠領域
との相関には、図2に示すようなものがある。図2にお
いて、文字列領域を実線の枠で示し、枠領域を破線の枠
で示す。例えば、図2(a)は、枠内に1つの文字列が
含まれる関係を示す。また、図2(b)は、枠内に複数
の文字列が含まれる関係を示す。図2(c)、(d)、
(e)は、複数の枠に文字列がまたがる関係を示す。図
2(f)は、枠のみの場合を示す。図2(g)は、文字
列のみの場合を示す。これらの領域の相関を予め定義さ
れているモデルの領域の相関と比較する。これにより、
特定のモデルを選び、そのモデルから文字認識を行なう
領域を決定する。そして、この文字認識を行なう領域の
照合の度合いによって帳票の種類を識別する。ここで、
照合の度合いとは、文字認識を行なう領域を文字列領域
とするモデルが複数ある場合、それらのモデルの数によ
って示される(例えば、特開平4−104385号公報
参照)。
【0004】図3、図4は、文書画像処理の他の例の説
明図である。図3に示すように、2値化された画像デー
タから文字、図形等の領域を自動的に抽出する。このた
め、この画像データから、図4(a)、(b)に示すよ
うに、予め定められた閾値以上の長さと幅を持つ空白帯
域を水平及び垂直方向のそれぞれに検出する。そして、
図4(c)に示すように、検出された空白帯域を追跡し
て領域を検出し、これらの領域を矩形の組み合わせとし
て格納する(例えば、特開平4−120678号公報参
照)。
【0005】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術には、次のような問題があった。図2に示
す第1の従来技術では、枠と文字とで構成されない文書
に関しては、処理することができなかった。例えば、論
文誌のような文書においては、文書のレイアウトはだい
たい決まっているが、そのレイアウトの制限内で文章と
図、文章と写真の組み合わせといったように構成要素が
さまざまとなる。従って、このような文書については、
文書画像処理を行なうことができないという問題があっ
た。図3及び図4に示す第2の従来技術では、レイアウ
トがある程度決まっている場合にも、レイアウトが未知
の文書と同様の処理を行なうので、同じ処理が繰り返し
行なわれて処理効率が悪いという問題があった。また、
同じような文書画像処理であっても、そのすべてが正常
に行なわれるとは限らず、エラーが生じる場合がある。
その場合、更に処理効率が悪くなるという問題があっ
た。
【0006】本発明は、以上の点に着目してなされたも
ので、同様のレイアウトの文書を複数処理する場合の処
理効率を高めるようにした文書画像処理装置を提供する
ことを目的とするものである。
【0007】
【課題を解決するための手段】本発明の文書画像処理装
置は、文字及び文字以外の情報の双方を含む複数の文書
のうちの一部の文書から当該文書中の文字の領域及び文
字以外の領域の配置状態を表わすレイアウト情報を作成
するレイアウト情報作成部と、当該レイアウト情報作成
部により作成した前記レイアウト情報を格納するレイア
ウト情報格納部と、当該レイアウト情報格納部に格納さ
れた前記レイアウト情報に基づいて前記複数の文書中の
文字の領域を抽出する領域抽出部とを備えたことを特徴
とするものである。
【0008】
【作用】本発明の文書画像処理装置においては、同一の
レイアウトの複数の文書を処理する際に最初の文書を読
み取り、領域分割を行ない、レイアウト情報を作成す
る。このレイアウト情報は、文書中の各分割領域につい
てその領域内の情報が文字、図形、写真等のいずれかを
示す情報である。このレイアウト情報は、所定の格納部
に格納しておく。そして、それ以降の文書について領域
分割を行なう場合はそのレイアウト情報を参照して領域
分割を行なう。これにより、複数の文書について各々領
域分割を最初から繰り返すのではなく、最初の領域分割
の結果を利用した効率的な領域分割を行なう。
【0009】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。図1は、本発明の文書画像処理装置の一実
施例のブロック図である。図示の装置は、読取部1、文
書画像処理装置10、画像データ格納部12、文字認識
部13、認識結果格納部14から成る。読取部1は、C
CDラインセンサ等から成り、処理対象となる文書を主
走査方向には電気的に走査し、副走査方向には機械的に
走査して読み取る。この読取部1には、例えば、周知の
シートフィーダ(図示省略)が設けられている。このシ
ートフィーダにより第1ページ目の文書が読取部1に送
り込まれたとき、読取部1により読み取られた画像デー
タがレイアウト情報作成部2に入力される。一方、第2
ページ目以降の文書が読取部1に送り込まれたとき、読
取部1により読み取られた画像データが領域抽出部11
に入力される。
【0010】文書画像処理装置10は、レイアウト情報
作成部2、レイアウト情報格納部3、領域抽出部11か
ら成る。レイアウト情報作成部2は、例えば、前述した
図3、図4に示す従来の方法により文字領域、図形領域
等を抽出する。そして、例えば、これらの領域の黒画素
の濃度を検出し、その濃度が濃い領域は写真の領域、薄
い領域は図形の領域等の判定を行ない、その結果をレイ
アウト情報格納部3に格納する。尚、装置の操作者が各
領域が文字、図形、写真等のいずれの領域かを目で確認
してその結果をキーボード等から入力するようにしても
よい。また、装置の操作者が各領域を設定するようにし
てもよい。領域抽出部11は、レイアウト情報格納部3
に格納されているレイアウト情報に従って、読取部1で
読み取られた文書画像のデータから文字、図形、写真等
の領域を抽出し、これらの画像データを画像データ格納
部12に格納する。そして、これらの画像データのう
ち、文字の部分の画像データを文字認識部13に送る。
【0011】文字認識部13は、領域抽出部11から送
られた文字の部分の画像データを予め用意された辞書デ
ータと比較することにより文字認識を行なう。そして、
文字認識の結果得られた文字コードを認識結果格納部1
4に格納する。図5は、本発明の処理対象となる文書の
一例を示す図である。図示の文書は、第1欄51と、第
2欄52とから成る。第1欄51の上側には、文書が記
載されており、下側には、写真が示されている。また、
第2欄52の上側には、図形が示されており、下側には
文書が記載されている。
【0012】図6は、レイアウト情報の一例を示す図で
ある。図6において、xs、ysは、文書中の矩形領域
の左上の点の座標を示す。また、xe、yeは、文書中
の矩形領域の右下の座標を示す。そして、flagは、その
領域の属性を示す。flagの値の“1”は文字(横書
き)、“2”は文字(縦書き)、“4”は図形、“8”
は写真、“16”は罫線、“32”は表を示す。そし
て、例えば、flagの値が“13”というのは、“1+4
+8”を意味する。即ち、“1”、“4”、“8”のビ
ットが“1”で他のビットが“0”であることを意味す
る。これは、当該領域に、文字(横書き)、図形、写真
が含まれることを示す。また、例えば、flagの値が“3
7”というのは、“1+4+32”を意味する。即ち、
“1”、“4”、“32”のビットが“1”で他のビッ
トが“0”であることを意味する。これは、当該領域
に、文字(横書き)、図形、表が含まれることを示す。
【0013】次に、上述した装置の動作を説明する。ま
ず、読取部1で読み取った第1ページ目の文書の画像か
らレイアウト情報作成部2でレイアウト情報を作成し、
レイアウト情報格納部3に格納する。次に、読取部1に
より第2ページ目以降の文書を読み取り、読み取った画
像データについて領域抽出部11でレイアウト情報格納
部3に格納されているレイアウト情報を参照して領域の
抽出を行なう。例えば、図6に示す例では、(xs,y
s,xe,ye)=(50,100,1600,460
0)の領域には、文字(横書き)、図形、写真のみが含
まれていることが、flagの値“13”によって示されて
いる。従って、この領域から文字(横書き)、図形、写
真のいずれかのデータを抽出する処理を行なう。これに
より、文書の全体について抽出処理を行なう必要がな
く、また、表などの他の構成要素を考慮する必要がな
く、抽出の際のエラーが少なくなる。
【0014】尚、このようなレイアウト情報は、レイア
ウト情報作成部2で自動的に作成されたものを、必要に
応じてキーボードやマウス等により手動で修正したもの
でもよい。
【0015】また、同様に、図6に示す例では、(x
s,ys,xe,ye)=(1650,100,330
0,4600)の領域には、文字(横書き)、図形、表
のみが含まれていることが、flagの値“37”によって
示されている。従って、この領域から文字(横書き)、
図形、表のいずれかのデータを抽出する処理を行なう。
そして、図や写真の領域の画像データは、画像データ格
納部12に格納する。また、文字の領域の画像データ
は、文字認識部13で文字認識を行ない、認識結果とし
て得られる文字コードを認識結果格納部14に格納す
る。その後、読取部1で、次の文書を読み取る。この動
作は、読取部1のシートフィーダにより自動的に行なわ
れる。
【0016】図7は、領域抽出部の処理手順を示すフロ
ーチャートである。まず、ステップS1では、レイアウ
ト情報を参照して領域分割の対象となる領域を求める。
次に、ステップS2では、ステップS1で求めた領域の
外接矩形を求め、この外接矩形をブロックとして抽出す
る。そして、ステップS3でステップS2で抽出したブ
ロックの属性(文字、図形、写真等)を判別する。この
属性の判別には、装置の操作者が介在するようにしても
よい。最後に、ステップS4では、文字ブロックから文
字領域を作成する。
【0017】図8は、図7のステップS1の分割対象領
域作成処理の内容の説明図である。第1ページ目の文書
を読み取って得られるレイアウト情報と、第2ページ目
以降の文書を読み取って得られる読取画像との間には、
読取部1の誤差により、図8(a)に示すように、ずれ
が生じる。従って、図7のステップS1では、読取画像
とレイアウト情報とのずれを補正する処理を行なう。即
ち、図6に示すようなレイアウト情報に登録されている
矩形枠の各辺ごとに画像メモリ等に格納された画像デー
タを走査する。そして、走査ライン上に黒画素が1つで
も存在すれば、その枠を広げる方向に走査ラインを変更
する。この処理を繰り返すことにより、図8(b)に示
すように、走査ライン上に黒画素が存在しなくなるよう
にする。
【0018】もし、走査ライン上に黒画素が1つも存在
しない場合は枠を狭める方向に走査ラインを変更する。
そして、走査ライン上に黒画素が現われるまで処理を繰
り返す。以上の処理を矩形枠の4辺すべてについて行な
う。
【0019】図9は、図7のステップS2のブロック抽
出処理の結果の説明図である。まず、読取画像と同じ大
きさで分割対象領域を黒く塗りつぶした(ブロック画
像)を用意する。次に、読取画像の各分割対象領域内を
縦及び横方向に走査し、空白部分を捜し出す。そして、
所定の閾値よりも長い空白部分が存在すれば、ブロック
画像でその空白部分に対応する部分を白くする。このブ
ロック画像において空白部分により囲まれた黒画素の集
合を1つのブロックとする。そして、各ブロックの外接
矩形を求める。
【0020】また、図7のステップS3の属性判別処理
では、ブロック抽出処理で求めた各ブロックの属性を判
別する。この判別のとき、レイアウト情報に登録されて
いない属性を持つブロックが存在した場合は、読取画像
とレイアウト情報が一致しないことを示している。従っ
て、その読取画像をリジェクトし、アラーム等により警
告する。例えば、第1ページ目の文書により図6の上側
に示すレイアウト情報が得られ、第2ページ目以降のい
ずれかの文書中に表であると判別されるブロックが存在
する場合、第1ページ目の文書と違う種類の文書が混入
されている。従って、この場合は読取文書をリジェクト
し、アラーム等により警告する。
【0021】図10は、図7のステップS4の文字領域
作成処理の処理例の説明図である。図7のステップS4
の文字領域作成処理では、レイアウト情報のflagの文字
フラグが“1”になっている領域についてのみ処理を行
なう。分割対象領域に文字以外のブロックが存在する場
合はこのブロックと文字ブロックの座標値を比較する。
これにより、文字以外のブロックに対して文字ブロック
がその上下左右のいずれに位置しているかの判定を行な
う。そして、同じ位置に存在する文字ブロックをすべて
統合し、文字領域とする。
【0022】次に、上述した処理で得られた文字領域に
文字以外のブロックが存在するか否かを判定し、存在す
ればこの文字領域について上記と同様の処理を繰り返
す。そして、文字領域に文字以外の領域が存在しなくな
るまでこの処理を繰り返す。また、分割対象領域に文字
ブロックのみが存在する場合は分割対象領域を文字領域
として出力する。ここで、文字以外の画像データは、画
像データ格納部12に格納する。図7のステップS4の
文字領域作成処理で作成された文字領域は、文字認識部
13で1文字単位に切り出され、文字認識を行なった
後、その結果として得られる文字コードが認識結果格納
部14に格納される。
【0023】以上のようにして、第1ページ目の文書に
ついて、文書画像処理を行なった結果得られたレイアウ
ト情報を参照して、第2ページ目以降の文書についての
文書画像処理を行なうことにより、同種の文書を処理す
る場合の処理効率を向上させることができる。尚、上述
した実施例においては、第1ページ目の文書のみに基づ
いてレイアウト情報を作成するようにしたが、本発明は
これに限定されるものではなく、第1ページ目から2ペ
ージ分あるいは3ページ分等、複数の文書の一部につい
てレイアウト情報を作成し、他の文書についてこのレイ
アウト情報を用いた文書画像処理を行なうすべての場合
について適用される。
【0024】
【発明の効果】以上説明したように、本発明の文書画像
処理装置によれば、文書のレイアウトが一定の複数の文
書についての文書画像処理を連続して行なう場合、最初
に処理した文書により作成したレイアウト情報を参照し
て以後の文書を処理するようにしたので、次のような効
果がある。レイアウトが未知の場合の文書を処理する場
合と比較してより処理効率がよく、エラーが少なく、確
実な処理が可能となる。また、レイアウト情報に示され
ている矩形枠の各辺ごとに画像データを走査し、走査ラ
イン上の黒画素の有無によって走査ラインを変更するこ
とにより、読取部の誤差による読取画像とレイアウト情
報とのずれを補正することができる。更に、レイアウト
情報格納部に格納されたレイアウト情報と異なるレイア
ウトの文書を検出したときは、アラーム等により警告す
るようにすることにより、同種の文書の検出において、
異種の文書が混入された場合に、これを検出することが
できる。
【図面の簡単な説明】
【図1】本発明の文書画像処理装置の一実施例のブロッ
ク図である。
【図2】従来の文書画像処理の一例の説明図である。
【図3】文書画像処理の他の例の説明図(その1)であ
る。
【図4】文書画像処理の他の例の説明図(その2)であ
る。
【図5】本発明の処理対象となる文書の一例の説明図で
ある。
【図6】レイアウト情報の一例の説明図である。
【図7】領域抽出部の処理手順を説明するフローチャー
トである。
【図8】分割対象領域作成処理の内容の説明図である。
【図9】ブロック抽出処理の結果の説明図である。
【図10】文字領域作成処理の処理例の説明図である。
【符号の説明】
1 読取部 2 レイアウト情報作成部 3 レイアウト情報格納部 10 文書画像処理装置 11 領域抽出部 12 画像データ格納部 13 文字認識部 14 認識結果格納部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 鳥越 真 東京都港区虎ノ門1丁目7番12号 沖電気 工業株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字及び文字以外の情報の双方を含む複
    数の文書のうちの一部の文書から当該文書中の文字の領
    域及び文字以外の領域の配置状態を表わすレイアウト情
    報を作成するレイアウト情報作成部と、 当該レイアウト情報作成部により作成した前記レイアウ
    ト情報を格納するレイアウト情報格納部と、 当該レイアウト情報格納部に格納された前記レイアウト
    情報に基づいて前記複数の文書中の文字の領域を抽出す
    る領域抽出部とを備えたことを特徴とする文書画像処理
    装置。
  2. 【請求項2】 前記領域抽出部は、前記レイアウト情報
    が示す矩形枠の各辺ごとの画像データを走査し、走査ラ
    イン上に黒画素が存在するときは、その黒画素が存在し
    なくなるまで枠を広げる方向に走査ラインを変更し、走
    査ライン上に黒画素が存在しないときは、黒画素が現わ
    れるまで枠を狭める方向に走査ラインを変更することを
    特徴とする請求項1記載の文書画像処理装置。
  3. 【請求項3】 前記領域抽出部は、前記複数の文書のい
    ずれかのレイアウトが前記レイアウト情報が示すレイア
    ウトと異なる場合は、当該文書を排除し、レイアウトが
    異なる文書が混入していることを警告することを特徴と
    する請求項1記載の文書画像処理装置。
JP5192745A 1993-07-07 1993-07-07 文書画像処理装置 Pending JPH0728934A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5192745A JPH0728934A (ja) 1993-07-07 1993-07-07 文書画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5192745A JPH0728934A (ja) 1993-07-07 1993-07-07 文書画像処理装置

Publications (1)

Publication Number Publication Date
JPH0728934A true JPH0728934A (ja) 1995-01-31

Family

ID=16296355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5192745A Pending JPH0728934A (ja) 1993-07-07 1993-07-07 文書画像処理装置

Country Status (1)

Country Link
JP (1) JPH0728934A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009238045A (ja) * 2008-03-27 2009-10-15 Just Syst Corp 手書き入力方法、手書き入力プログラムおよび手書き入力装置
CN103198310A (zh) * 2012-01-06 2013-07-10 富士施乐株式会社 图像处理装置和图像处理方法
JP2017204270A (ja) * 2016-05-10 2017-11-16 凸版印刷株式会社 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009238045A (ja) * 2008-03-27 2009-10-15 Just Syst Corp 手書き入力方法、手書き入力プログラムおよび手書き入力装置
CN103198310A (zh) * 2012-01-06 2013-07-10 富士施乐株式会社 图像处理装置和图像处理方法
JP2013143595A (ja) * 2012-01-06 2013-07-22 Fuji Xerox Co Ltd 画像処理装置及びプログラム
CN103198310B (zh) * 2012-01-06 2018-06-01 富士施乐株式会社 图像处理装置和图像处理方法
JP2017204270A (ja) * 2016-05-10 2017-11-16 凸版印刷株式会社 文字列領域・文字矩形抽出装置、文字列領域・文字矩形抽出方法、およびプログラム

Similar Documents

Publication Publication Date Title
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US8428356B2 (en) Image processing device and image processing method for generating electronic document with a table line determination portion
JP3302147B2 (ja) 文書画像処理方法
US6035061A (en) Title extracting apparatus for extracting title from document image and method thereof
US7039235B1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US7454060B2 (en) Image processor for character recognition
JP3278471B2 (ja) 領域分割方法
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JPH0713995A (ja) 自動テキスト特徴決定装置
JPH0668301A (ja) 文字認識方法及び装置
JPH03260787A (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
JPH03122773A (ja) 画像形成装置
US7149352B2 (en) Image processing device, program product and system
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JPH0728934A (ja) 文書画像処理装置
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP3187895B2 (ja) 文字領域抽出方法
JPH0728935A (ja) 文書画像処理装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JPH09288714A (ja) 表認識方法および装置
JP3024234B2 (ja) 文書画像の罫線抽出装置
Amano et al. Character string detection algorithm using horizontal boundaries, and its application to a part number entry system
JP4230478B2 (ja) 文書処理装置、方法およびプログラム
JPH0728933A (ja) 文字認識装置