JPH05159062A - 文書認識装置 - Google Patents

文書認識装置

Info

Publication number
JPH05159062A
JPH05159062A JP32437391A JP32437391A JPH05159062A JP H05159062 A JPH05159062 A JP H05159062A JP 32437391 A JP32437391 A JP 32437391A JP 32437391 A JP32437391 A JP 32437391A JP H05159062 A JPH05159062 A JP H05159062A
Authority
JP
Japan
Prior art keywords
image
area
document
character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP32437391A
Other languages
English (en)
Inventor
Tatatomi Aso
忠臣 麻生
Yumiko Ikemure
由美子 池牟禮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP32437391A priority Critical patent/JPH05159062A/ja
Publication of JPH05159062A publication Critical patent/JPH05159062A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 文書データの圧縮率を高め、かつその2次利
用を容易にする。 【構成】 画像読み取り部1により文書画像はデジタル
データに変換され、画像メモリ2に保存され、保存され
た画像データは前処理部3によって不要なノイズなどを
除去され、レイアウト認識部4においては文書画像を認
識し、文字部、画像部、表部、図形部に各々領域分割さ
れる。認識された領域はそれぞれ文字認識部5、画像圧
縮部6、表認識部7、図形認識部8によって認識を行
い、その領域の属性に応じた書式に変換される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はDTPや電子ファイリン
グシステムなどで利用できる文書認識装置に関し、さら
に詳しくは、そのデータの二次利用と格納の効率化に関
するものである。
【0002】
【従来の技術】今日、多くの情報を整理し、検索を可能
とするために、様々な情報が電子ファイル化されるよう
になってきた。これまで電子ファイル化する方法とし
て、原稿をスキャナで読み込みイメージファイル化する
方法が多く採られてきた。しかしこの方法では、ファイ
ルサイズの増大を招くと言う問題があった。そこで、文
字の部分を認識することによって文字コードに変換する
必要が生じてきた。しかし文書には文字の他に、写真等
の画像や、イラストや図面などの線画、表などが混在し
ており、これまでの方法では、文書と画像(表・画像、
図形を含む)とに分離したり、図形についてはベクトル
化して線画に変換する、等が考えられていた。
【0003】
【発明が解決しようとする課題】しかし、表については
表と認識せずに画像データ、または画像データに変換さ
れていたので、十分な圧縮が行われず、また、表形式に
なったデータを、表計算アプリケーションなどで再利用
することができなかった。
【0004】本発明は、文書に含まれている文章を構成
する文字、写真等の画像、イラストや図面などの図形、
表などをそれぞれ最適な書式に変換するとともにデータ
サイズの圧縮を可能にする文書認識装置の提供を目的と
する。
【0005】
【課題を解決するための手段】本発明の文書認識装置は
上記目的を達成するために、文書画像を読み取ってデジ
タルデータに変換する画像読み取り部と、読み取った文
書を保存する画像メモリと、前記画像メモリの文書画像
の空白部により画像を分割する領域分割部、前記領域分
割部で分割された領域が文字・画像・表・図形のいずれ
であるかを認識する領域属性認識部よりなるレイアウト
認識部と、前記レイアウト認識部で認識された領域ごと
に、文字領域の文字の認識を行う文字認識部と、同じく
画像領域の画像の圧縮を行う画像圧縮部と、同じく表領
域の表認識を行う表認識部と、同じく図形領域の図形認
識を行う図形認識部とから構成されている。
【0006】
【作用】本発明は、上記の構成により、1頁分の文書の
画像データから、文字部、画像部、表部、図形部の各領
域に分割し、その各々について認識を行いその各々の最
適な書式に変換し、その各々のデータの再利用を可能に
する。
【0007】
【実施例】図1は本発明の一実施例の文書認識装置の構
成図である。以下図に基づいて本発明の処理の流れを説
明する。画像読み取り部1により文書画像はデジタルデ
ータに変換され、画像メモリ2に保存される。保存され
た画像データは前処理部3によって不要なノイズなどを
除去される。レイアイト認識部4においては文書画像を
認識し、文字部、画像部、表部、図形部に領域を分割さ
れる。認識された領域はそれぞれ文字認識部5、画像圧
縮部6、表認識部7、図形認識部8の認識装置によって
認識を行い、それぞれの領域の属性に応じた書式に変換
される。
【0008】つぎに本発明の中心部であるレイアウト認
識部4について詳細な説明を行う。レイアウト認識部は
大きく2つの部分に分かれている。まず、入力された画
像をいくつかの領域に分割する、領域分割部4aと、分
割された領域が、文字、図形、画像、表のどれであるか
を認識する領域属性認識部4bである。最初に領域分割
部4aにおける分割方法についてのべる。図2(a)に
一般的な文書画像の例を示す。領域分割を行うための基
本的な方法は領域を分割している空白を探すことであ
る。図3が空白の検出アルゴリズムを示すフローチャー
トである。以下図3により、そのアルゴリズムの説明を
行う。
【0009】(1)ステップ1(S1) 文書画像を左端から水平方向に連続する白画素の個数が
しきい値NH以上の座標点を探す。いまその座標点の開
始点を(xss,ys)、終了点を(xes,ys)と
する。
【0010】(2)ステップ2(S2) 次のライン(ys+1)の(xss,ys)から(xe
s,ys)までの白画素の個数がしきい値Nよりも小さ
くなるまで繰り返し、その時の白画素の開始点を(xs
e,ye)、終了点を(xee,ye)とする。
【0011】(3)ステップ3(S3) もし次の条件を満たすとき、検出した空白は領域を分割
する。|ye−ys|>NV(NVはしきい値) (4)ステップ4(S4) 以上の処理を全てラインが終了するまで繰り返す。
【0012】(5)ステップ5(S5)(図示せず) S1からS4までと同様の操作を垂直方向についてもお
こなう。図2(a)の文書から空白部分を抽出した結果
が図2(b)である。その後空白で囲まれる部分を領域
として分割抽出した結果が図2(c)である。
【0013】つぎに領域属性認識部4bについて詳しく
説明する。図4に示す領域の属性の判定アルゴリズムに
基づいて詳しく説明する。
【0014】(1)ステップ1(S1) 領域内の画素について、 D = (黒画素数)/(全体の画素数) とすると、 D > DD(DDはしきい値) を満たすとき、その領域内は画像である。
【0015】(2)ステップ2(S2) 領域内の連結された黒画素を囲む最小の外接矩形を求め
る。
【0016】(3)ステップ3(S3) 求めた外接矩形の中で最も長い横の辺の長さLYと縦の
辺の長さLTとを求める。
【0017】(4)ステップ4(S4) いま、LY>LLY、LT>LLT(LLY、LLTは
しきい値)のどちらかを満たすとき、領域内は図形また
は表である。また、それ以外の場合には文字である。
(図5) (5)ステップ5(S5) 領域内で長い水平線を調べる。そのためには水平方向の
ヒストグラムをとる。図6のように水平方向に表の一部
である水平線がある場合にはヒストグラムの山ができ
る。したがって、 (ヒストグラムの最大値)/(領域の横幅)> LL を満たすとき、領域に長い水平線を含むことになり、表
であると判断する。
【0018】
【発明の効果】以上説明したように本発明の文書認識装
置により、文字、図形、表、画像データを自動的に判別
して認識できることからこれまでの作業の効率化が図
れ、また、上記4つの領域に分割してそれぞれに対して
認識を行うことにより、それぞれの領域に最適なコード
変換を行うことが可能となり、大幅なデータ圧縮と、そ
れぞれのアプリケーションによるデータの2次加工が可
能となる。
【図面の簡単な説明】
【図1】本発明の一実施例の文書認識装置の構成図
【図2】(a)同じくその認識すべき文書画像の例 (b)同じくその各領域間の空白を抽出した結果を示す
説明図 (c)同じく各領域に分割抽出した結果を示す説明図
【図3】同じく空白の検出アルゴリズムを示すフローチ
ャート
【図4】領域の属性の判定アルゴリズムを示すフローチ
ャート
【図5】同じく外接矩形を説明する説明図
【図6】同じく表領域のヒストグラムをとった例を示す
説明図
【符号の説明】
1 画像読み取り部 2 画像メモリ 3 前処理部 4 レイアウト認識部 4a 領域分割部 4b 領域属性認識部 5 文字認識部 6 画像圧縮部 7 表認識部 8 図形認識部

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】文書画像を読み取ってデジタルデータに変
    換する画像読み取り部と、読み取った文書を保存する画
    像メモリと、前記画像メモリの文書画像の空白部により
    画像を分割する領域分割部、前記領域分割部で分割され
    た領域が文字・画像・表・図形のいずれであるかを認識
    する領域属性認識部よりなるレイアイト認識部と、前記
    レイアウト認識部で認識された領域ごとに、文字領域の
    文字の認識を行う文字認識部と、同じく画像領域の画像
    の圧縮を行う画像圧縮部と、同じく表領域の表認識を行
    う表認識部と、同じく図形領域の図形認識を行う図形認
    識部とよりなる文書認識装置
JP32437391A 1991-12-09 1991-12-09 文書認識装置 Pending JPH05159062A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32437391A JPH05159062A (ja) 1991-12-09 1991-12-09 文書認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32437391A JPH05159062A (ja) 1991-12-09 1991-12-09 文書認識装置

Publications (1)

Publication Number Publication Date
JPH05159062A true JPH05159062A (ja) 1993-06-25

Family

ID=18165069

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32437391A Pending JPH05159062A (ja) 1991-12-09 1991-12-09 文書認識装置

Country Status (1)

Country Link
JP (1) JPH05159062A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315159A (ja) * 1995-05-18 1996-11-29 Canon Inc 画像処理装置及び画像処理方法
WO2004068368A1 (en) * 2003-01-31 2004-08-12 Canon Kabushiki Kaisha Image processing method, system, program, program storage medium and information processing apparatus
EP1605348A3 (en) * 2004-06-10 2007-05-30 Canon Kabushiki Kaisha Image processing apparatus control method therefor and program
WO2011112738A2 (en) * 2010-03-11 2011-09-15 Microsoft Corporation Page layout determination of an image undergoing optical character recognition

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08315159A (ja) * 1995-05-18 1996-11-29 Canon Inc 画像処理装置及び画像処理方法
WO2004068368A1 (en) * 2003-01-31 2004-08-12 Canon Kabushiki Kaisha Image processing method, system, program, program storage medium and information processing apparatus
US7664321B2 (en) 2003-01-31 2010-02-16 Canon Kabushiki Kaisha Image processing method, system, program, program storage medium and information processing apparatus
EP1605348A3 (en) * 2004-06-10 2007-05-30 Canon Kabushiki Kaisha Image processing apparatus control method therefor and program
US7593120B2 (en) 2004-06-10 2009-09-22 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and program
US8174724B2 (en) 2004-06-10 2012-05-08 Canon Kabushiki Kaisha Image processing apparatus, control method therefor, and program
WO2011112738A2 (en) * 2010-03-11 2011-09-15 Microsoft Corporation Page layout determination of an image undergoing optical character recognition
WO2011112738A3 (en) * 2010-03-11 2011-12-22 Microsoft Corporation Page layout determination of an image undergoing optical character recognition
US8594422B2 (en) 2010-03-11 2013-11-26 Microsoft Corporation Page layout determination of an image undergoing optical character recognition
US9785849B2 (en) 2010-03-11 2017-10-10 Microsoft Technology Licensing, Llc Page layout determination of an image undergoing optical character recognition

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
US5033104A (en) Method for detecting character strings
JP4031210B2 (ja) 文字認識装置、文字認識方法、及び記録媒体
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
JP3062382B2 (ja) 画像処理装置及び方法
JPH05342408A (ja) 文書画像ファイリング装置
JPH05159062A (ja) 文書認識装置
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JPH0656618B2 (ja) 画像情報の文字・図形分離方法
Mitchell et al. Document page segmentation based on pattern spread analysis
JP2000090194A (ja) 画像処理方法および画像処理装置
JPH08237404A (ja) 光学文字認識モードの選択方法
JP4040231B2 (ja) 文字抽出方法及び装置並びに記憶媒体
JP3565310B2 (ja) 一般の文書画像から罫線を抽出する罫線抽出装置および方法
JP2968284B2 (ja) 文字認識装置およびその文字領域分離方法
JP3140079B2 (ja) 罫線認識方法及び表処理方法
JP3406942B2 (ja) 画像処理装置及び方法
JP3162414B2 (ja) 罫線認識方法及び表処理方法
JPH1049676A (ja) 罫線認識方法
JP3142950B2 (ja) 線分認識方式
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP2917396B2 (ja) 文字認識方式
JPH03268181A (ja) 文書読み取り装置
JPH0728934A (ja) 文書画像処理装置
JP3074210B2 (ja) 紙文書画像処理装置