JPH08272900A - 文書読取装置 - Google Patents

文書読取装置

Info

Publication number
JPH08272900A
JPH08272900A JP7096051A JP9605195A JPH08272900A JP H08272900 A JPH08272900 A JP H08272900A JP 7096051 A JP7096051 A JP 7096051A JP 9605195 A JP9605195 A JP 9605195A JP H08272900 A JPH08272900 A JP H08272900A
Authority
JP
Japan
Prior art keywords
area
data
character
analysis
layout
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7096051A
Other languages
English (en)
Other versions
JP3157414B2 (ja
Inventor
Tetsuo Nakamura
哲夫 中村
Megumi Tsujita
恵 辻田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP09605195A priority Critical patent/JP3157414B2/ja
Publication of JPH08272900A publication Critical patent/JPH08272900A/ja
Application granted granted Critical
Publication of JP3157414B2 publication Critical patent/JP3157414B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 表内に、更に文字データを含む表があった場
合でもその文字データを読み取ることのできる装置を得
る。 【構成】 レイアウト解析部21は、表と文字とを含む
任意の文書の画像データから、表領域と、文字領域とを
識別して解析すると共に、解析した表領域中に、更に表
領域が存在した場合は、領域中に表領域が含まれなくな
るまで、領域解析を行う。レイアウトデータ確認・修正
部23は、解析した表領域と文字領域とが識別可能に、
かつ、各領域の認識順序が識別可能に表示されるよう制
御すると共に、表示された領域または認識順序に対して
変更指示があった場合は、その領域または認識順序を変
更する。認識部22は、レイアウト解析部21で解析し
た文字領域中の文字を認識する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書上に記録された表
と文字とイメージ(文字以外の図形、絵、写真および罫
線等)を読み取る文書読取装置に関する。
【0002】
【従来の技術】従来より、表を含む文書上の文字を読み
取るための文書読取装置が開発されている。これらの読
取装置では、文書内の表の文字部分のみを認識してい
た。つまり、表内に文字以外の表、イメージがあって
も、文字のみを読み取っていた。
【0003】
【発明が解決しようとする課題】しかし、以上述べた従
来の装置では、表内の文字以外の表、イメージを読み取
ることができなかった。例えば、表中に更に表が存在
し、その表中に文字があった場合、その文字を読み取る
ことはできなかった。このような点から、表内に、更に
文字データを含む表があった場合でもその文字データを
読み取ることのできる文書読取装置を実現が望まれてい
た。
【0004】
【課題を解決するための手段】本発明の文書読取装置
は、表と文字とを含む任意の文書の画像データから、表
領域と、文字領域とを識別して解析すると共に、解析し
た前記表領域中に、更に表領域が存在した場合は、その
領域中に表領域が含まれなくなるまで、領域解析を行う
レイアウト解析部と、このレイアウト解析部で解析した
文字領域中の文字を認識する認識部とを備えたものであ
る。
【0005】
【作用】本発明の文書読取装置においては、先ず、レイ
アウト解析部は、領域全体の表解析を行う。そして、解
析した表領域中に、更に表領域が存在した場合は、その
領域中に表領域が含まれなくなるまで、領域解析を行
う。表領域中に文字領域が存在した場合、認識部は文字
認識を行う。
【0006】
【実施例】以下、本発明の実施例を図面を用いて詳細に
説明する。
【0007】《実施例1》 〈実施例1の構成〉図1は、本発明の文書読取装置の構
成を示すブロック図である。図の装置は、画像入力部
1、制御部2、表示部3、操作部4、メモリ5、出力部
6からなる。
【0008】画像入力部1は、読取対象の文書を光学的
に走査し、文書上に記録された文字とイメージを光電変
換により画像信号に変換し、更にこの画像信号を二値の
画像データに変換するものである。
【0009】制御部2は、画像入力部1〜プリンタ7の
制御を司るプロセッサであり、レイアウト解析部21と
認識部22とレイアウトデータ確認・修正部23を構成
している。
【0010】レイアウト解析部21は、後述する画像メ
モリ51内の画像データから黒画素の周辺分布ヒストグ
ラム等を利用して領域を抽出し、それぞれの領域の幾何
学的特徴等により領域を表、文字、およびイメージに識
別する機能を有している。即ち、表領域は罫線、周辺分
布ヒストグラム黒ブロック情報等を利用して表内のセル
を抽出し、この各セルを領域解析する。そして、前記の
各領域解析で抽出した文字領域は黒画素の周辺分布ヒス
トグラム等を利用して行を切り出し、各行から文字を切
り出す。更に、表領域と文字領域、行、文字、および表
内のセルの読み取りの順序を解析するといった機能を備
えている。
【0011】尚、レイアウトデータは以上の領域、行、
文字、セル、およびその読み取り順序等で構成するもの
である。
【0012】認識部22は、レイアウトメモリ52のレ
イアウトデータを読み出して、このレイアウトデータに
従い、認識部22内にある認識辞書(標準的な文字の認
識特徴を記憶した認識辞書)と照合するパターンマッチ
ング等の手法を用い、画像メモリ11から読み出した画
像データの文字画像を文字認識して文字コード(認識デ
ータ)に変換する機能を有している。
【0013】レイアウトデータ確認・修正部23は、後
述する画像メモリ51から画像データを、レイアウトメ
モリ52からレイアウトデータを読み出し、表示部3に
この画像データとレイアウトデータを重ねて表示させ、
操作部4より修正指示が行われた場合は、修正後のレイ
アウトデータをレイアウトメモリ52に記憶させる機能
を有している。
【0014】表示部3は、CRT等からなり、また、操
作部4は、キーボード、マウス等からなるものである。
これら表示部3および操作部4は、画像入力部1、レイ
アウト解析部21、認識部22、レイアウトデータ確認
・修正部23および出力部6の処理の開始指示、処理結
果(画像データ、レイアウトデータ、および認識デー
タ)の表示およびその確認・修正等オペレータとのイン
タフェースをとるための入出力を行うために設けられて
いる。
【0015】メモリ5は、RAM等の半導体メモリであ
り、その領域として画像メモリ51、レイアウトメモリ
52、認識メモリ53を備えている。画像メモリ51
は、画像入力部1から出力される二値の画像データを記
憶するメモリであり、レイアウトメモリ52は、レイア
ウト解析部21およびレイアウトデータ確認・修正部2
3から出力されるレイアウトデータを記憶するメモリ、
また、認識メモリ53は、認識部22から出力される認
識データを記憶するためのメモリである。
【0016】出力部6は、文書データを記憶する磁気デ
ィスク装置、または文書データを印刷するプリンタ等か
らなるもので、制御部2が、画像メモリ51から画像デ
ータ、レイアウトメモリ52からレイアウトデータ、お
よび認識メモリ53から認識データを読出し、この認識
データと画像データをレイアウトデータに従い、任意の
フォーマットの文書データに変換する等の処理を行った
データを出力するものである。
【0017】〈実施例1の動作〉図2は、本発明の実施
例1の動作を示すフローチャートである。先ず、画像を
入力する(ステップS1)。即ち、画像入力部1によ
り、読み取り対象の文書を走査し、文書上に記録された
表、文字、およびイメージを光電変換により画像信号に
変換し、更にこの画像信号を二値の画像データに変換す
る。そして、制御部2は、この画像データを画像メモリ
51に記憶させ、また、表示部3に表示させる。
【0018】画像入力が終了すると、レイアウト解析部
21によりレイアウトを解析する(ステップS2〜ステ
ップS8)。このレイアウト解析は、先ず、領域を解析
する(ステップS2)。即ち、レイアウト解析部21
は、画像メモリ51内の画像データを読み出し、この画
像データから領域を黒画素の周辺分布ヒストグラムを利
用して領域の外接枠(領域枠)を抽出し、この領域の種
類をそれぞれの領域の幾何学的特徴により表、文字、お
よびイメージに識別する。
【0019】更に、文字領域はその黒画素の周辺分布ヒ
ストグラムを利用して縦書きか横書きかを判別する。こ
の判別結果で縦書きが多い場合、領域に右上から左下に
向かって読み取り順序を付ける。一方、横書きが多い場
合、領域に左上から右下に向かって読み取り順序を付け
る(文字領域がない場合、横書きが多い場合と同様に領
域に左上から右下に向かって読み取り順序を付ける)。
ここで、領域枠、領域種類、文字領域の縦/横書き、お
よび読み取り順序を領域データとする。
【0020】領域解析が終了すると、領域データ内に表
領域がある場合、表解析(ステップS4)に進み、表領
域がない場合、行切り出し(ステップS7)に進む(ス
テップS3)。表解析(ステップS4)は、領域データ
内の表領域に対応する画像データの罫線、周辺分布ヒス
トグラム、黒ブロック情報を作成して表内のセルの外接
枠(セル枠)を抽出し、セルの読み取り順序を左上から
右下に向かって付ける。これらセル枠、読み取り順序を
表データとする。
【0021】表解析を終了すると、前記各セルに対応す
る画像データを領域解析する(ステップS5)。動作は
ステップS2と同様である。各セルの領域解析が終了す
ると、各セルの領域データ内に表領域がある場合、表解
析(ステップS4)に進み、文字領域がない場合、行切
り出し(ステップS7)に進む(ステップS6)。即
ち、領域データに表領域がある限り、ステップS4〜S
6を繰り返す。
【0022】行切り出し(ステップS7)は、前記領域
データ内の全文字領域について、この文字領域に対応す
る画像データから、前記文字領域の領域データの縦/横
書きに従い、周辺分布ヒストグラムを利用して行の外接
枠(行枠)を抽出し、この行の読み取り順序を縦書きの
場合に右から左に、横書きの場合に上から下に向かって
付ける。前記行枠、読み取り順序を行データとする。
【0023】行切り出しを終了すると、前記全行データ
について文字切り出しを行う(ステップS8)。文字切
り出しは、行データに対応する画像データから、前記文
字領域の領域データの縦/横書きに従い、周辺分布ヒス
トグラムを利用して文字の外接枠(文字枠)を抽出し、
この文字の読み取り順序を縦書きの場合に上から下に、
横書きの場合に左から右に向かって付ける。前記文字
枠、読み取り順序を文字データとする。
【0024】前記領域データ、表データ、行データ、お
よび文字データを合わせてレイアウトデータとし、この
レイアウトデータをレイアウトメモリ52に記憶する。
次に、前述したレイアウト解析(領域解析、表解析)の
具体例を図面を用いて更に説明する。
【0025】図3および図4は、領域解析、表解析結果
の具体例の説明図である。また、図5は、領域解析、表
解析で作成したレイアウトデータの構成説明図である。
【0026】先ず、図3の(a)に示すような画像デー
タL1があるとする。そして、この画像データL1を領
域解析する(ステップS2)と、図3の(b)の領域解
析結果を得る。ここで、図中のL21は表領域、L22
は文字領域、L23はイメージ領域であり、また、読み
取り順序は、L21→L22→L23で、このときのレ
イアウトデータは図5の(b)領域データである。
【0027】この図5の(b)領域データに、図3に示
した表領域L21があるので、ステップS3の判断で、
ステップS4の表解析に進み、その表領域L21に対応
する画像データを表解析すると、図4の(c)の表解析
結果を得る。図4のL31,L32,L33,L34が
セルで、この読み取り順序は、L31→L32→L33
→L34で、このときのレイアウトデータは図5の
(c)表データである。
【0028】次に、各セルに対応する画像データを領域
解析する(ステップS5)と、図4の(d)の領域解析
結果を得る。図4のL41は表領域、L421は文字領
域、L422はイメージ領域、L43,L44は文字領
域で、セルL31,L33,L34は一つの領域なので
読み取り順序は特になし、セルL32の読み取り順序は
L421→L422で、このときのレイアウトデータは
図5の(d)領域データである。この図5の(d)領域
データに図4の表領域L41があるので、ステップS6
の判断で、ステップS4の表解析に進む。
【0029】図4の表領域L41に対応する画像データ
を表解析する(ステップS4)と、図4の(e)の表解
析結果を得る。図4のL51,L52がセルで、この読
み取り順序はL51→L52で、このときのレイアウト
データは図5の(e)表データである。次に各セルに対
応する画像データを領域解析する(ステップS5)と、
図4の(f)の領域解析結果を得る。図4のL61,L
62は文字領域で、セルL51,L52は一つの領域な
ので読み取り順序は特になしで、このときのレイアウト
データは図5の(f)領域データである。この図5の
(f)領域データには表領域が存在しないため、ステッ
プS6では、次の行切り出し(ステップS7)に進む。
【0030】行切り出し(ステップS7)、文字切り出
し(ステップS8)は、ステップS2〜S6で作成した
文字領域に対応する画像データから行と文字を切り出す
処理であり、この動作例を図3の文字領域L22を例と
して次に説明する。
【0031】図6は、行切り出しと文字切り出し結果の
説明図である。図7は、行切り出し、文字切り出しで作
成したレイアウトデータの構成説明図である。
【0032】先ず、図6(a)の文字領域L22(図3
の文字領域L22と同一)に対応する画像データを行切
り出しする(ステップS7)と、図6(b)の行切り出
し結果の行枠K1、K2、この読み取り順序のK1→K
2を作成し、このときのレイアウトデータは図7の
(b)行データである。次に、図6(b)の行K1、K
2に対応する画像データを文字切り出しする(ステップ
S8)と、図6(c)の文字切り出し結果の文字K1
1,K12,K21,K22,K23,K24、行K1
の文字読み取り順序のK11→K12、行K2の文字読
み取り順序のK21→K22→K23→K24を作成
し、このときのレイアウトデータは図7の(c)文字デ
ータである。
【0033】このように、他の全文字領域に対しても同
様な行切り出し、文字切り出しを行ってレイアウト解析
を終了する。
【0034】レイアウト解析が終了すると、レイアウト
データの確認・修正を行う(ステップS9)。即ち、レ
イアウトデータ確認・修正部23は、画像メモリ51か
ら画像データ、レイアウトメモリ52からレイアウトデ
ータを読み出し、表示部3にこの画像データとレイアウ
トデータを重ねて表示させる。オペレータはこの表示を
見て、レイアウトデータで修正が必要な部分を操作部4
を使って修正する。これにより、レイアウトデータ確認
・修正部23は、修正後のレイアウトデータをレイアウ
トメモリ52に記憶させる。
【0035】レイアウトデータの確認・修正が終了する
と、認識部22により文字認識を行う(ステップS1
0)。即ち、認識部22は、レイアウトメモリ52から
レイアウトデータ、画像メモリ51から画像データを読
み出し、このレイアウトデータに従い画像データの文字
画像を認識部22内にある認識辞書を用いたパターンマ
ッチングにより文字コードに変換する。そして、この文
字コードを認識データとする。また、この認識データを
認識メモリ53に記憶する。
【0036】認識が終了すると、認識部22は、認識デ
ータの確認・修正を行う(ステップS11)。即ち、認
識メモリ53から認識データ、レイアウトメモリ52か
らレイアウトデータ、および画像メモリ51から画像デ
ータを読み出し、認識データの文字コードに対応した文
字と、画像データそのものの文字画像(イメージ)と
を、表示部3の画面上に表示させる。そして、オペレー
タは、この表示を見て、認識結果が正しいか否かを確認
し、誤りが有った場合は、操作部4から正解文字を入力
する等、認識データの確認・修正を行う。この修正後の
認識データは認識メモリ53に記憶される。
【0037】認識データの確認・修正が終了すると、出
力部6で、上記の認識、レイアウト、および画像データ
を変換して出力する(ステップS12)。出力部6は、
画像メモリ51から画像データ、レイアウトメモリ52
からレイアウトデータ、および認識メモリ53から認識
データを読み出し、この認識データと画像データをレイ
アウトデータに従い、任意のフォーマットの文書データ
に変換し、出力部内にある出力装置に出力する。尚、こ
の出力装置は、上述したように、文書データを記憶する
磁気ディスク装置または文書データを印刷するプリンタ
である。
【0038】以上のように、図3に示した画像データL
1のように、表内に文字以外の表、イメージが記録され
た複雑な表を含む文書であっても、表解析→領域解析の
処理を領域データに表領域がある限り繰り返すことによ
って、文字読取を行うことができる。
【0039】《実施例2》 〈実施例2の構成〉この実施例2においては、図面上の
構成は同様であるため、その図示は省略するが、レイア
ウト解析部21およびレイアウトデータ確認・修正部2
3の機能が異なっている。即ち、実施例2のレイアウト
解析部21は、領域全体の解析から文字領域解析までの
解析結果の各レベルのウインドウを表示部3に順次表示
させると共に、任意のレベルのウインドウを含む画面に
は、そのレベルより上位レベルのウインドウを同時に表
示させる機能を備えている。
【0040】また、レイアウトデータ確認・修正部23
は、解析した表領域と文字領域とイメージ領域が識別可
能に、かつ、各領域の認識順序が識別可能に表示される
よう表示部3に対して制御を行うと共に、表示部3に表
示された領域または認識順序に対して操作部4より変更
指示があった場合は、領域または認識順序を変更し、そ
の変更データをレイアウトメモリ52に記憶させる機能
を備えている。
【0041】〈実施例2の動作〉ここでは、実施例2と
実施例1の異なる部分を述べる。ここで説明しない部分
は、実施例1と同一である。
【0042】図8、図9は、実施例2のレイアウト解析
動作のフローチャートであり、これは、実施例1の図2
のステップS2〜S9に相当するものである。
【0043】画像入力が終了すると、領域を解析する
(ステップT1)。これは実施例1のステップS2と同
様である。そして、解析した領域データをレイアウトメ
モリ52に記憶する。
【0044】領域解析が終了すると、レイアウトデータ
確認・修正部23はこの領域データの確認・修正を行う
(ステップT2)。この確認・修正処理とは、表示部3
に、画像メモリ51から読み出した画像データとレイア
ウトメモリ52から読み出した領域枠を枠として、ま
た、読み取り順序を領域枠の近くに数字で、画像データ
と重ねて表示するものである。オペレータはこの表示を
見て、領域データで修正が必要な部分があれば、その部
分を操作部4を使って修正する。また、読み取り順序で
修正が必要であれば、その修正を操作部4より行う。そ
して、修正後の領域データはレイアウトメモリ52に記
憶される。
【0045】領域解析の確認・修正が終了し、次にステ
ップT3の領域データ内に表領域があるか否かの判断に
おいて、表領域があった場合は、次の表解析(ステップ
T4)に進み、表領域がない場合は、行、文字切り出し
(ステップT12以降)へ進む。
【0046】ステップT4の表解析は、実施例1の図2
のステップS4と同様であり、ここで解析した表データ
をレイアウトメモリ52に記憶する。表解析が終了する
と、表データの確認・修正を行う(ステップT5)。即
ち、表示部3に、画像メモリ51から読み出した画像デ
ータと、レイアウトメモリ52から読み出したセル枠を
枠として、また、読み取り順序をセル枠の近くに数字
で、画像データと重ねて表示する。オペレータはこの表
示を見て、表データで修正が必要な部分があればその部
分を操作部4によって修正する。そして、修正後の表デ
ータをレイアウトメモリ52に記憶する。
【0047】次に、各セルについての領域解析を行う
(ステップT6、T7)。この動作は前記ステップT1
と同様である。続いて、ステップT7で解析した領域デ
ータの確認・修正を行う(ステップT8)。この動作は
ステップT2と同様である。ステップT9では、ステッ
プT7、T8で処理したセルが、そのセルが属する表の
最終セルで有るか否かを判断し、最終セルの場合はステ
ップT11へ進み、最終セルでない場合はKの値を+1
して(ステップT10)、次のセルの処理(ステップT
7、T8)へ進む。即ち、最終セルとなるまでステップ
T7〜T10を繰り返す。
【0048】ステップT11では、ステップT2、T8
で確認・修正した領域データに表領域が有るか否かを判
断し、表領域が無い場合はステップT12へ進み、表領
域が有る場合はステップT4に戻る。即ち、領域データ
から表領域が無くなるまで、上記各処理を実行する。
【0049】ステップT12〜T21では、前記ステッ
プT1〜T11で得た領域データのうち、文字領域につ
いて行、文字を切り出し、確認・修正を行う。
【0050】先ず、文字領域についてその読み取り順序
に従い、領域解析で判別した縦書き/横書きから、文字
領域の黒画素の周辺分布ヒストグラムを用いて行切り出
しを行う(ステップT12、T13)。更に、行を、縦
書きの場合は右から左に、横書きの場合は上から下に向
かって読み取り順序を付け、この行データをレイアウト
メモリ52に記憶する。
【0051】次に、この行データを確認・修正する(ス
テップT14)。即ち、表示部3に、画像メモリ51か
ら読み出した画像データと、レイアウトメモリ52から
読み出した行枠を枠として、また、読み取り順序を行枠
の近くに数字で、画像データと重ねて表示する。オペレ
ータはこの表示を見て、行データで修正が必要な部分を
操作部4を使って修正する。そして、修正後の行データ
はレイアウトメモリ52に記憶される。
【0052】そして、行についてその読み取り順序に従
い、領域解析で判別した縦書き/横書きに従って、行の
黒画素の周辺分布ヒストグラムを用いて文字切り出しを
行う(T15、T16)。更に、文字を縦書きの場合は
上から下に、横書きの場合は左から右に向かって読み取
り順序を付け、この文字データをレイアウトメモリ52
に記憶する。
【0053】次に、この文字データの確認・修正を行う
(ステップT17)。即ち、この確認・修正処理は、上
述したように、表示部3に、画像メモリ51から読み出
した画像データと、レイアウトメモリ52から文字枠を
枠として、また、読み取り順序を文字枠の近くに数字
で、画像データと重ねて表示する。オペレータはこの表
示を見て、文字データで修正が必要な部分を操作部4を
使って修正する。修正後の文字データをレイアウトメモ
リ52に記憶する。
【0054】そして、文字切り出しした行がその属する
領域の最終行か否かを判断する(ステップT18)。最
終行の場合、ステップT20の処理へ進み、最終行でな
い場合、行の値nを+1して(ステップT19)、次の
行の文字切り出し(ステップT16)に戻る。ステップ
T20では、ステップT13〜T19で行切り出し、文
字切り出しした文字領域が最終文字領域か否かを判断す
る。最終文字領域の場合、文字認識へ進み、最終文字領
域でない場合、文字領域の値mを+1して(ステップT
21)、次の文字領域の行切り出し(ステップT13)
に戻る。
【0055】次に、上記のステップT2、T5、T8、
T14およびステップT17の確認・修正処理につい
て、具体例を用いて更に説明する。
【0056】図10〜図12は、実施例2における具体
例の説明図である。例えば、図10の(a)に示す画像
データG1を読み取る場合を説明する。領域解析(ステ
ップT1)が終了すると、領域ウインドウG2を表示す
る{図10(b)}。この領域ウインドウG2には、画
像データG1に重ねて表領域枠G21、文字領域枠G2
2、イメージ領域枠G23が表示されていると共に、こ
れらの枠上(左上)に、領域読み取り順序G24、G2
5、G26、文字領域の縦/横書きG27が表示されて
いる。また、表領域枠G21、文字領域枠G22、およ
びイメージ領域枠G23は、それぞれ表示色、枠線種を
変えて区別する。
【0057】オペレータは、この表示を見て領域枠の位
置・大きさ、領域の種類(表、文字、イメージ)、領域
の読み取り順序(G24、G25、G26で示す番
号)、文字領域の縦/横書き(G27で示す「縦」
「横」の文字)等を、操作部4を使って確認・修正する
(ステップT2)。
【0058】ステップT3では、領域G21があるので
表解析(ステップT4)に進み、表解析が終了すると、
表ウインドウG3を表示する。表領域G21に対応する
画像データに重ねてセル枠G31、G33、G34、セ
ル読み取り順序G35、G36、G37、G38を表示
部3に表示する{図11の(c)}。オペレータはこの
表示を見て、セル枠の位置・大きさや、セルの読み取り
順序(G35、G36、G37、G38で示す番号)等
を操作部4を用いて確認・修正する(ステップT5)。
【0059】次に、セルG31の領域解析を行う(ステ
ップT7)。領域解析が終了すると、領域ウインドウG
41を表示する。セルG31に対応する画像データに重
ねて表領域枠G411、領域読み取り順序G412を、
表示部3に領域ウインドウG2と同様に表示し、操作部
4を使って領域データの確認・修正を行う。以下、セル
G32、G33、G34について上記と同様に領域ウイ
ンドウG42、G43、G44を表示し{図11の
(d)}、領域データの確認・修正を行う。
【0060】上記の領域データには表領域G411があ
るのでステップT4に戻る。この表領域G411に対し
て、上記表ウインドウG3と同様に表ウインドウG5を
表示し{図12の(e)}、ここで、表データを、領域
ウインドウG41(G42、G43、G44)と同様
に、領域ウインドウG61、G62{図12の(f)}
で、領域データを確認・修正する。
【0061】上記領域解析の確認・修正で得た文字領域
G22、G421、G431、G441、G611、G
621について行を切り出し(ステップT13)、この
行データを確認・修正し(ステップT14)、更に、文
字を切り出し(ステップT16)、この文字データを確
認・修正する(ステップT17)。
【0062】図13は、文字領域G22についての行、
文字データの確認・修正処理画面の説明図である。文字
領域G22の行切り出しが終了すると、文字領域G22
の行ウインドウG22Lを表示し、文字領域G22に対
応する画像データに重ねて行枠H1、H2、行読み取り
順序H3、H4を表示部3に表示する{図13
(b)}。オペレータは、この表示を見て行枠の位置・
大きさ、行の読み取り順序(H3、H4で示す番号)等
を操作部4を用いて確認・修正する(ステップT1
4)。
【0063】行データの確認・修正が終了すると、行H
1の文字を切り出し(ステップT16)、文字ウインド
ウG22C1を表示する。行H1に対応する画像データ
に重ねて文字枠H11、H12、文字読み取り順序H1
3、H14を表示部3に表示する{図13(c)}。オ
ペレータは、この表示を見て文字枠の位置・大きさ、文
字の読み取り順序(H13、H14で示す番号)等を操
作部4を使って確認・修正する(ステップT17)。行
H2に対しても、文字ウインドウG22C2を使って文
字データの確認・修正をする。
【0064】図14は、以上説明した各ウインドウの表
示順序の説明図である。このとき、下位ウインドウがど
の部分の処理をしているかオペレータに知らせるため、
下位ウインドウの表示時には上位ウインドウを表示した
ままとする。ここで、文字領域G421、G431、G
441、G611、G621に対する行ウインドウはG
421L、G431L、G441L、G611L、G6
21L、文字ウインドウはG421C1、G431C1
とG431C2、G441C1とG441C2、G61
1C1、G621C1である。
【0065】図15は、この一例を示す説明図である。
この例は、複数レベルのウインドウを同時表示する例
(図14の表示順序の11)を示している。尚、この例
は、一画面上にウインドウの重なりを無くした表示方法
であるが、ウインドウG2、G3といった各ウインドウ
の重なりを許した表示方法であっても良い。
【0066】以上のレイアウトデータの確認・修正で
は、処理対象を領域、表、行、および文字の全部としな
くてもよい。例えば、文字切り出しは間違うことがない
場合、確認・修正を、領域、表、行のみとして文字は確
認・修正しないといった構成とすることも可能である。
【0067】以上のように、上記実施例2では、表を含
む文書に対しても、レイアウトデータ(解析結果)の確
認・修正画面を、領域解析、表解析、行切り出しおよび
文字切り出しの各レベル毎に分離することにより、オペ
レータによる確認・修正操作が簡単になる。また、各レ
ベル毎に適切な拡大率で表示できるので、拡大率の切り
替えが不要で、操作が簡単になる。
【0068】しかも、各画面を分離することによる下位
レベルの画面と上位レベルの画面との関連性の理解低下
も、下位レベルのウインドウを表示するときは、必ずそ
の上位レベルのウインドウを同時に表示するので避けら
れる。更に、全部のレイアウトデータを順番に確認・修
正するので、漏れがなくなり、また、上位のレベルを確
認・修正してから下位のレベルを処理するので、再処理
が不要である。
【0069】《実施例3》 〈実施例3の構成〉この実施例3においても、図面上の
構成は同様であるため、その図示は省略するが、レイア
ウト解析部21とレイアウトデータ確認・修正部23の
機能が異なっている。即ち、実施例3のレイアウト解析
部21は、領域全体の解析から文字領域解析までの解析
結果の各レベルを表示部3に同時に表示させる機能を備
えている。
【0070】また、レイアウトデータ確認・修正部23
は、表示された各レベルの解析結果から任意のレベルが
選択された場合、そのレベルの修正指示画面を表示部3
に表示させ、表示されたレベルの領域または認識順序に
対して変更指示があった場合は、その領域または認識順
序を変更する機能を備えたものである。
【0071】〈実施例3の動作〉ここでは、実施例3と
実施例1の異なる部分を述べる。ここで説明しない部分
は、実施例1と同一である。
【0072】図16および図17は、実施例3の動作フ
ローチャートであり、これは、実施例1の図2のステッ
プS9に相当する部分の動作を示すものである。
【0073】先ず、レイアウトデータを表示部3に表示
する(ステップE1)。図18は、画像データG1のレ
イアウト解析後の表示例を示す説明図である。オペレー
タは、この画面を見て確認・修正が必要な部分を見つけ
る(ステップE2)。確認・修正が必要ない場合は認識
へ進む。必要な場合はステップE3へ進む。
【0074】ステップE3は、確認・修正が必要なレベ
ルを領域全体(文書画像全体の領域データが処理対
象)、領域セル(表内セルの領域データが処理対象)、
表、行、または文字から一つ指定するステップである。
これは、表示部3の画面上に表示されたメニューから選
択することで指定する。図19は、このメニュー画面の
説明図であり、ここでは、領域全体を指定した例を示し
ている。
【0075】ステップE3において、領域全体を指定し
た場合はステップE4、領域セルを指定した場合はステ
ップE9、表を指定した場合はステップE10、行を指
定した場合はステップE14、文字を指定した場合はス
テップE18へ進む。
【0076】ステップE4では、領域データの確認・修
正を行う(図8のステップT2と同じ)。次にその修正
があったか否かを判定し(ステップE5)、修正があっ
た場合はその領域の種類を判定する(ステップE6)。
このステップE6において、表領域データに修正があっ
た場合、この修正によりセル、領域、行、文字データが
修正前と違ったものとなるため再処理する(ステップE
7)。また、この時、表の中に表が有る場合は再帰的に
処理する。ステップE6で文字領域に修正があった場
合、この修正により行、文字切り出しが修正前と違った
ものとなるため、再切り出しを行う(ステップE8)。
また、イメージの場合はそのまま次のステップに進む。
【0077】上記ステップE3において、領域セルを指
定した場合、ステップE9では、レイアウトデータを表
示している表示部3と操作部4を用いてオペレータが確
認・修正が必要な領域を含むセル枠を指定する。そし
て、このセル内の領域データの確認・修正を行う(図8
のステップT8と同じ)。その後は、上記ステップE5
〜E8と同一処理を行う。
【0078】上記ステップE3において、表を指定した
場合、ステップE10では、レイアウトデータを表示し
ている表示部3と操作部4を用いてオペレータが確認・
修正が必要なセルを含む表領域枠を指定する。そして、
この表内の表データの確認・修正を行う(ステップE1
1:図8のステップT5と同じ)。次に、表データに修
正があったか否かを調べ(ステップE12)、修正があ
った場合、この修正により領域、行、文字データが修正
前と違ったものとなるため再処理する(ステップE1
3)。
【0079】上記ステップE3において、行を指定した
場合、ステップE14では、レイアウトデータを表示し
ている表示部3と操作部4とを用いてオペレータが確認
・修正が必要な行を含む文字領域枠を指定する。その
後、この文字領域内の行データの確認・修正を行う(ス
テップE15:図8のステップT14と同じ)。次に、
行データに修正があった場合、この修正により文字デー
タが修正前と違ったものとなるため、再切り出しを行う
(ステップE16、E17)。
【0080】上記ステップE3において、文字を指定し
た場合、ステップE18では、レイアウトデータを表示
している表示部3と操作部4を用いてオペレータが確認
・修正が必要な文字を含む行枠を指定する。その後、こ
の行枠内の文字データの確認・修正を行う(ステップE
19:図9のステップT17と同じ)。そして、このス
テップE19および、上記ステップE5、E12、E1
6で修正がなかった場合は、ステップE2に戻る。
【0081】一方、上記ステップE7、E8、E13、
E17の処理後およびステップE20で修正があった場
合はステップE21に進み、変更したレイアウトデータ
をレイアウトメモリ52に書き込み、このレイアウトデ
ータ51を、ステップE1に戻って表示する。
【0082】以上のレイアウトデータの確認・修正で
は、処理対象を領域、表、行、および文字の全部としな
くてもよい。例えば、文字切り出しは間違うことがない
場合、確認・修正を領域、表、行のみとして文字は確認
・修正しないといった構成であってもよい。
【0083】以上のように上記実施例3によれば、確認
・修正が必要な部分を指定できるので、全部のレイアウ
トデータを確認・修正せずに、確認・修正が必要な部分
だけで済み、処理を軽減することができる。
【0084】《実施例4》 〈実施例4の構成〉この実施例4においては、図面上の
構成は同様であるため、その図示は省略するが、レイア
ウトデータ確認・修正部23の機能が、上記実施例2や
実施例3とは異なっている。即ち、実施例4のレイアウ
トデータ確認・修正部23は、領域全体の解析から文字
領域解析までの解析結果の任意のレベルのウインドウを
表示部3に表示させる場合、上位レベルのウインドウ
中、対象となるレベルのデータが属するデータを他のデ
ータとは異なる表示とする機能を備えたものである。
【0085】〈実施例4の動作〉上述した実施例2およ
び実施例3と同様であるが、特に、レイアウトデータ確
認・修正部23がレイアウトデータの確認・修正ウイン
ドウを表示するとき、そのウインドウの上位レベルのウ
インドウで、そのデータが属するデータを他のデータと
異なる表示とする。この表示としては、枠のブリンク、
枠内の色の変更、網掛け、反転表示等がある。
【0086】図20および図21は、その表示例であ
り、図20は実施例2に適用した場合、図21は実施例
3に適用した場合の説明図である。即ち、図20の場合
は、各々のウインドウの上位ウインドウは矢印のように
なっている。尚、ここで、領域ウインドウと行ウインド
ウが共に「表読取」と網掛けされているが、これは表内
の文字が1行しかないためであり、複数行がある場合の
行ウインドウは、その内のいずれかの行が網掛けされ
る。
【0087】また、図21の場合は、レイアウトデータ
を表示したウインドウC1において、レベル指定で
「表」を指定して表C2を選択し、表ウインドウC3を
表示したものである。
【0088】以上のように、上記実施例4によれば、オ
ペレータに対して異なるレベル間の従属関係が明確とな
り、確認・修正の誤りが少なくなる。
【0089】尚、上記実施例2〜4では、枠の左上に、
読み取り順序や縦書き/横書きを表示するようにした
が、これに限定されるものではなく、枠を識別できる位
置であれば他の位置に表示するよう構成してもよい。
【0090】
【発明の効果】以上説明したように、本発明の文書読取
装置によれば、表内に表が含まれている場合は、その領
域に表が含まれなくなるまで表解析と領域解析を繰り返
すようにしたので、表内に、更に文字データを含む表が
あった場合でもその文字データを読み取ることのでき
る。
【図面の簡単な説明】
【図1】本発明の文書読取装置の構成図である。
【図2】本発明の文書読取装置における実施例1の動作
フローチャートである。
【図3】本発明の文書読取装置における実施例1の解析
結果の具体例の説明図(その1)である。
【図4】本発明の文書読取装置における実施例1の解析
結果の具体例の説明図(その2)である。
【図5】本発明の文書読取装置における実施例1の領域
解析、表解析で作成したレイアウトデータの構成説明図
である。
【図6】本発明の文書読取装置における実施例1の行切
り出しと文字切り出し結果の説明図である。
【図7】本発明の文書読取装置における実施例1の行切
り出し、文字切り出しで作成したレイアウトデータの構
成説明図である。
【図8】本発明の文書読取装置における実施例2のレイ
アウト解析動作のフローチャート(その1)である。
【図9】本発明の文書読取装置における実施例2のレイ
アウト解析動作のフローチャート(その2)である。
【図10】本発明の文書読取装置における実施例2の具
体例の説明図(その1)である。
【図11】本発明の文書読取装置における実施例2の具
体例の説明図(その2)である。
【図12】本発明の文書読取装置における実施例2の具
体例の説明図(その3)である。
【図13】文字領域G22についての行、文字データの
確認・修正処理画面の説明図である。
【図14】本発明の文書読取装置における実施例2の各
ウインドウの表示順序の説明図である。
【図15】本発明の文書読取装置における実施例2の表
示例を示す説明図である。
【図16】本発明の文書読取装置における実施例3の動
作フローチャート(その1)である。
【図17】本発明の文書読取装置における実施例3の動
作フローチャート(その2)である。
【図18】本発明の文書読取装置における実施例3の表
示例の説明図である。
【図19】本発明の文書読取装置における実施例3のメ
ニュー画面の説明図である。
【図20】本発明の文書読取装置における実施例4の表
示例の説明図(その1)である。
【図21】本発明の文書読取装置における実施例4の表
示例の説明図(その2)である。
【符号の説明】
3 表示部 4 操作部 21 レイアウト解析部 22 認識部 23 レイアウトデータ確認・修正部 51 画像メモリ 52 レイアウトメモリ 53 認識メモリ

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 表と文字とを含む任意の文書の画像デー
    タから、表領域と、文字領域とを識別して解析すると共
    に、解析した前記表領域中に、更に表領域が存在した場
    合は、当該領域中に表領域が含まれなくなるまで、領域
    解析を行うレイアウト解析部と、 前記レイアウト解析部で解析した文字領域中の文字を認
    識する認識部とを備えたことを特徴とする文書読取装
    置。
  2. 【請求項2】 請求項1に記載の文書読取装置におい
    て、 解析結果を表示する表示部と、 指示入力を行う操作部と、 解析した表領域と文字領域とが識別可能に、かつ、各領
    域の認識順序が識別可能に表示されるよう前記表示部に
    対して制御を行うと共に、当該表示部に表示された領域
    または認識順序に対して前記操作部より変更指示があっ
    た場合は、当該領域または認識順序を変更するレイアウ
    トデータ確認・修正部とを備えたことを特徴とする文書
    読取装置。
  3. 【請求項3】 請求項2に記載の文書読取装置におい
    て、 領域全体の解析から文字領域解析までの解析結果の各レ
    ベルのウインドウを表示部に順次表示させると共に、任
    意のレベルのウインドウを含む画面には、当該レベルよ
    り上位レベルのウインドウを同時に表示させるレイアウ
    ト解析部とを備えたことを特徴とする文書読取装置。
  4. 【請求項4】 請求項2に記載の文書読取装置におい
    て、 領域全体の解析から文字領域解析までの解析結果の各レ
    ベルを表示部に同時に表示させるレイアウト解析部と、 前記表示された各レベルの解析結果から任意のレベルが
    選択された場合、当該レベルの修正指示画面を前記表示
    部に表示させ、前記表示されたレベルの領域または認識
    順序に対して変更指示があった場合は、当該領域または
    認識順序を変更するレイアウトデータ確認・修正部とを
    備えたことを特徴とする文書読取装置。
  5. 【請求項5】 請求項3または4に記載の文書読取装置
    において、 領域全体の解析から文字領域解析までの解析結果の任意
    のレベルのウインドウを表示部に表示させる場合、上位
    レベルのウインドウ中、対象となるレベルのデータが属
    するデータを他のデータとは異なる表示とするレイアウ
    トデータ確認・修正部を備えたことを特徴とする文書読
    取装置。
JP09605195A 1995-03-29 1995-03-29 文書読取装置 Expired - Fee Related JP3157414B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09605195A JP3157414B2 (ja) 1995-03-29 1995-03-29 文書読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09605195A JP3157414B2 (ja) 1995-03-29 1995-03-29 文書読取装置

Publications (2)

Publication Number Publication Date
JPH08272900A true JPH08272900A (ja) 1996-10-18
JP3157414B2 JP3157414B2 (ja) 2001-04-16

Family

ID=14154670

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09605195A Expired - Fee Related JP3157414B2 (ja) 1995-03-29 1995-03-29 文書読取装置

Country Status (1)

Country Link
JP (1) JP3157414B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312231A (ja) * 1998-04-28 1999-11-09 Omron Corp データ処理プログラムを記録した記録媒体、データ処理装置およびデータ処理方法
JP2002352191A (ja) * 2001-02-09 2002-12-06 Matsushita Electric Ind Co Ltd 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法
JP2011004356A (ja) * 2009-06-22 2011-01-06 Kyocera Mita Corp 画像形成装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7006009B2 (ja) 2017-08-15 2022-01-24 富士フイルムビジネスイノベーション株式会社 画像識別装置及び画像形成プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11312231A (ja) * 1998-04-28 1999-11-09 Omron Corp データ処理プログラムを記録した記録媒体、データ処理装置およびデータ処理方法
JP2002352191A (ja) * 2001-02-09 2002-12-06 Matsushita Electric Ind Co Ltd 手書き判別能力を持つプリンティング制御インターフェースシステムとその方法
JP2011004356A (ja) * 2009-06-22 2011-01-06 Kyocera Mita Corp 画像形成装置

Also Published As

Publication number Publication date
JP3157414B2 (ja) 2001-04-16

Similar Documents

Publication Publication Date Title
USRE36581E (en) Character reader and recognizer with a specialized editing function
US5280544A (en) Optical character reading apparatus and method
JP3157414B2 (ja) 文書読取装置
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH08329187A (ja) 文書読取装置
JP2004502258A (ja) 1対1比較による漢字の校正システム
JPH08335248A (ja) 文書読取装置
JPH117493A (ja) 文字認識処理装置
JP2788506B2 (ja) 文字認識装置
JP5619111B2 (ja) 画像判定装置およびプログラム
JPH05303661A (ja) イメージデータ部分取得表示装置
JPH0473192B2 (ja)
JP2683711B2 (ja) 文字・記号データの認識・修正方法
JP3484274B2 (ja) 類似文書の領域分割方法
JPH07160811A (ja) 文字認識装置
JPH04156694A (ja) 文字認識方式
JPH05120471A (ja) 文字認識装置
JP3221969B2 (ja) 文字認識装置
JPS61198375A (ja) 光学的文字読取装置
JPH0363882A (ja) 画像処理装置
JPH0554178A (ja) 文字認識装置及び修正用帳票
JPH05120472A (ja) 文字認識装置
CN114782941A (zh) 一种视频osd字符识别方法、装置及介质
JPH05143776A (ja) 文字認識装置
JPS59200382A (ja) 文字認識方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090209

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090209

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100209

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees