JP3157534B2 - 表認識方法 - Google Patents

表認識方法

Info

Publication number
JP3157534B2
JP3157534B2 JP09337791A JP9337791A JP3157534B2 JP 3157534 B2 JP3157534 B2 JP 3157534B2 JP 09337791 A JP09337791 A JP 09337791A JP 9337791 A JP9337791 A JP 9337791A JP 3157534 B2 JP3157534 B2 JP 3157534B2
Authority
JP
Japan
Prior art keywords
scanning direction
character
frame
line
lines
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP09337791A
Other languages
English (en)
Other versions
JPH04303277A (ja
Inventor
吾朗 別所
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP09337791A priority Critical patent/JP3157534B2/ja
Publication of JPH04303277A publication Critical patent/JPH04303277A/ja
Application granted granted Critical
Publication of JP3157534B2 publication Critical patent/JP3157534B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書や帳票等の2値画
像中の表領域の認識処理に関する。
【0002】
【従来の技術】一般に文字認識装置において文書あるい
は帳票を処理する場合、その画像を文字領域、イメージ
領域(写真、図等)、表領域に分割し、それぞれの領域
に別の処理を行なうことが多い。表領域に関しては、表
領域の2値画像より黒画素連結矩形として主走査方向及
び副走査方向の罫線を認識し、主走査方向と副走査方向
の罫線で囲まれた枠領域を抽出し、各枠内の文字画像を
切り出し文字認識を行なっている。このような処理の一
例は、本出願人による特願平2−134876号特許願
に添付の明細書及び図面に述べられている。
【0003】
【発明が解決しようとする課題】文字認識装置の用途に
よっては、文書のフォーマットを忠実に再現したいこと
があるが、このような場合、表中の文字の認識結果を得
られるだけでは不十分で、表を構成している罫線の再現
のための情報も得られなければならない。しかし、従来
の表領域に対する処理においては、文字認識に主眼を置
いており、表の罫線の再現に関しては考慮がされていな
かったため、文字認識装置で入力した文書のフォーマッ
トを、表のフォーマットを含め忠実に再現することが困
難であった。
【0004】本発明の目的は、表を含む文書等の忠実な
フォーマット再現を可能とするための表認識方法を提供
することにある。
【0005】
【課題を解決するための手段】本発明によれば、表領域
の2値画像に対して、主走査方向及び副走査方向の罫線
で囲まれた枠を切り出し、各枠内の行切り出し及び文字
切り出しによって表中の文字認識を行なうが、さらに各
枠内の行数及び1行当たり文字数の計数を行ない、計数
した行数及び文字数と文字サイズに基づいて表の主走査
方向及び副走査方向の罫線の座標値を求め、これを文字
認識結果とともに表認識結果として出力する。
【0006】
【作用】表領域画像上の黒画素連結矩形の中には、罫線
以外の線分が含まれる可能性があり、また原稿のスキュ
ーなどによって罫線が太り座標も正確を期し難いたい。
さらに、最終的には罫線と文字とを組み合わせて表を再
現することになるが、その時の文字サイズと原稿上の文
字サイズとが必ずしも一致するわけでもない。したがっ
て、画像から抽出した罫線の座標値をそのまま罫線デー
タとして出力したのでは、表を含む文書のフォーマット
の忠実再現は難しい場合が多い。
【0007】これに対し、本発明のように表領域の枠内
の行数と1行当たり文字数を基準として罫線座標値を決
定するならば、罫線と文字列との相対的位置関係を一意
的に保って罫線座標値を決定することができ、さらに再
現する場合の文字サイズを指定するか、あるいはデフォ
ルトとして定めておくことによって、その文字サイズに
最適な罫線座標値を得ることができる。したがって、本
発明の表認識方法によって得られる文字認識結果と罫線
座標値を用い、文字列と罫線の相対的関係を適切に再現
することが可能となり、その結果として表を含む文書等
のフォーマットの忠実再現が可能となる。
【0008】
【実施例】図1は本発明の一実施例に係る処理装置のブ
ロック図、図2は処理のフロー図である。
【0009】2値画像入力部1において、スキャナ等に
より文書画像の2値データを入力し2値イメージメモリ
2に格納する(処理ステップ100)。表領域認識部3
において、2値イメージメモリ2内のイメージデータに
対して表領域を自動的に認識するか、あるいはマウス等
を用いて人手により領域指定をすることによって表領域
を認識し、表領域のイメージデータを切り出して表領域
イメージメモリ4に格納する(処理ステップ102)。
【0010】次に主走査方向罫線抽出部5において、表
領域イメージデータに対し、主走査方向に連結した黒画
素を追跡して、主走査方向の罫線を抽出し、その始点と
終点の座標を主走査方向罫線メモリ6に格納する(処理
ステップ104)。同様の罫線抽出処理を副走査方向に
ついて副走査方向罫線抽出部7で行ない、副走査方向罫
線の始点と終点の座標を副走査方向罫線メモリ8に格納
する(処理ステップ106)。
【0011】枠認識部9において、主,副走査方向罫線
メモリ6,8内の罫線座標データを参照し、主走査方向
と副走査方向の罫線の組み合わせにより、罫線で囲まれ
た表の枠領域を認識し、各枠の座標(対角頂点の座標)
と、それを構成する罫線の番号を枠座標メモリ10に格
納する(処理ステップ108)。次に枠領域抽出部11
において、枠座標メモリ10内の情報を参照することに
より、各枠内のイメージデータを表領域イメージメモリ
4内のイメージデータより切り出して枠イメージメモリ
12に格納する(処理ステップ110)。
【0012】行切り出し部13において、枠イメージメ
モリ12内のデータより、例えば主走査方向の射影を利
用する方法によって、行(文字列)のイメージデータを
切り出し、それを行イメージメモリ14に格納し、また
各枠内の行数を計数して行数メモリ15に格納する(処
理ステップ112,114)。
【0013】次に文字切り出し部16において、行イメ
ージメモリ14から各枠の行イメージデータを読み込
み、例えば副走査方向の射影を利用する方法によって文
字イメージを切り出して文字認識部18へ送るととも
に、各行の文字数を計数して文字数メモリ17に格納す
る(処理ステップ116,118)。
【0014】文字認識部18においては、文字切り出し
部16より入力した文字イメージデータの特徴量を求
め、それとパターン辞書とのマッチングを行なって文字
認識し、認識結果を出力する(処理ステップ120,1
22)。
【0015】他方、罫線座標決定部19において、枠座
標メモリ10から罫線番号を、行数メモリ15から枠内
行数を、文字数メモリ17から枠内文字数をそれぞれ読
み込む。そして、同一の罫線で構成されている枠の中
で、主走査方向の長さは最大文字数の枠を基準とし、副
走査方向の長さは最大行数の枠を基準として、表の罫線
の最適な座標を決定し、それを罫線データとして出力す
る(処理ステップ124,126)。なお、罫線の座標
値は、行数及び文字数を単位として表現することもでき
るが、本発明においては文字サイズを用いて数値として
の座標値を計算し出力する。ここで用いられる文字サイ
ズはフォント、ポイント数によって可変としておき、デ
フォルトの文字サイズも予め用意する。
【0016】処理ステップ124について図3から図6
を用いて説明する。ここでは図5に示す出力結果が得ら
れる場合を例として用いる。図5中の*印は文字を意味
している。また、この例において、罫線と枠領域を図6
のように示すものとするが、x1〜x5は主走査方向罫
線の番号、y1〜y4は副走査方向罫線の番号であり、
(i,j)は第i行第j列の枠領域である。罫線の座標
値は(x1,y1)を原点とする相対座標で表わすが、
x1,y1の座標値としては罫線抽出で求められた座標
値を用いるか、あるいは外部より指定した座標値を用い
る。
【0017】まず、図3に示すような処理によって、
(i,1)から(i,3)までの各枠について計数され
た行数の最大値を、表の第i行(i=1〜4)の行数と
して求める。すなわち、同一行の枠中の最大の行数の枠
を基準として用いる。ここでは図5に示されるように、
i=1では行数=1、i=2では(2,3)を基準とし
て行数=2、i=3では行数=1、i=4では行数=1
となる。このようにして求めた表の各行の行数と、文字
サイズとから各行の上下の主走査方向罫線の間隔を計算
することによって、x2〜x5の主走査方向罫線の原点
に対する相対座標(副走査方向座標)を求める。x1の
座標値はそのまま用いる。また、この座標決定によっ
て、副走査方向罫線の副走査方向座標も決まる。
【0018】同様に図4に示すような処理によって、
(1,j)から(4,j)までの枠の文字数の最大値
を、表の第j列(j=1〜3)の文字数として求める。
この例ではJ=1で文字数=5、j=2で文字数=1
0、j=3で文字数=8となる。このようにして求めた
表の各列の文字数と、文字サイズとから各列の左右の副
走査方向罫線の間隔を計算することによって、表を構成
する副走査方向罫線の原点に対する相対座標(主走査方
向座標)を求める。y1の座標値はそのまま用いる。ま
た、この座標決定によって、主走査方向罫線の主走査方
向座標も決まる。かくして、表を構成する罫線の座標値
が確定する。なお、座標値決定に用いる文字サイズを変
更することによって、自動的に様々な文字サイズに適切
な罫線座標値を出力させることができる。
【0019】
【発明の効果】以上説明した如く、本発明によれば、表
領域の2値画像に対して、主走査方向及び副走査方向の
罫線で囲まれた枠を切り出し、各枠内の行切り出し及び
文字切り出しによって表中の文字認識を行なうが、さら
に各枠内の行数及び1行当たり文字数の計数を行ない、
計数した行数及び文字数と文字サイズに基づいて表の主
走査方向及び副走査方向の罫線の座標値を求め、これを
文字認識結果とともに表認識結果として出力するため、
その出力データを用いて表のフォーマットの忠実な再
現、表を含む文書等のフォーマットの忠実な再現が可能
となり、また文字サイズの変更に容易に対応可能とな
る。
【図面の簡単な説明】
【図1】本発明の一実施例に係る処理装置のブロック図
である。
【図2】表認識処理全体のフロー図である。
【図3】表の各行における行数を求める処理のフロー図
である。
【図4】表の各列における文字数を求める処理のフロー
図である。
【図5】表の出力結果例の説明図である。
【図6】同出力結果例に対応した表の罫線及び枠領域の
説明図である。
【符号の説明】
1 2値画像入力部 2 イメージメ
モリ 3 表領域認識部 4 表領域イメ
ージメモリ 5 主走査方向罫線抽出部 6 主走査方向
罫線メモリ 7 副走査方向罫線抽出部 8 副走査方向
罫線メモリ 9 枠認識部 10 枠座標メモ
リ 11 枠領域抽出部 12 枠イメー
ジメモリ 13 行切り出し部 14 行イメー
ジメモリ 15 行数メモリ 16 文字切り
出し部 17 文字数メモリ 18 文字認識
部 19 罫線座標決定部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G06K 9/20 G06F 17/21 G06K 9/00

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】 文書等の表領域の2値画像に対して、主
    走査方向及び副走査方向の罫線で囲まれた枠を切り出
    し、各枠内の行切り出し及び文字切り出し並びに行数及
    び1行当たり文字数の計数を行ない、切り出した文字を
    認識するとともに、計数した行数及び文字数と文字サイ
    に基づいて表の主走査方向及び副走査方向の罫線の座
    標値を求め、表認識結果として文字認識結果及び罫線座
    標値を出力することを特徴とする表認識方法。
JP09337791A 1991-03-29 1991-03-29 表認識方法 Expired - Fee Related JP3157534B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP09337791A JP3157534B2 (ja) 1991-03-29 1991-03-29 表認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP09337791A JP3157534B2 (ja) 1991-03-29 1991-03-29 表認識方法

Publications (2)

Publication Number Publication Date
JPH04303277A JPH04303277A (ja) 1992-10-27
JP3157534B2 true JP3157534B2 (ja) 2001-04-16

Family

ID=14080617

Family Applications (1)

Application Number Title Priority Date Filing Date
JP09337791A Expired - Fee Related JP3157534B2 (ja) 1991-03-29 1991-03-29 表認識方法

Country Status (1)

Country Link
JP (1) JP3157534B2 (ja)

Also Published As

Publication number Publication date
JPH04303277A (ja) 1992-10-27

Similar Documents

Publication Publication Date Title
JP2812982B2 (ja) 表認識方法
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JPH04270485A (ja) 印刷文字認識装置
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP3157534B2 (ja) 表認識方法
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH07121734A (ja) 文字画像編集装置
JP3122476B2 (ja) 自動文書清書装置
JP2931041B2 (ja) 表内文字認識方法
JP3373068B2 (ja) 光学式文字認識装置
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JP3613356B2 (ja) 楽譜認識装置
JPH05159062A (ja) 文書認識装置
JP2933947B2 (ja) 画像処理方法及び装置
JPH1049602A (ja) 帳票認識方法
JP2954218B2 (ja) 画像処理方法及び装置
JPH0433079A (ja) 表処理方式
JPH04167194A (ja) 表処理方式
JPH05128305A (ja) 領域分割方法
JPH0417086A (ja) 文字切り出し方法
JPH08202824A (ja) 文書画像認識装置
JPS6327751B2 (ja)
JP2010011316A (ja) 画像処理装置、画像処理方法、画像処理プログラム及びこれが記録された記録媒体
JP2002032713A (ja) 文字認識処理方法
JPH0289193A (ja) パターン変換方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080209

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090209

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100209

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110209

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees