JP2890306B2 - 表領域分離装置および表領域分離方法 - Google Patents

表領域分離装置および表領域分離方法

Info

Publication number
JP2890306B2
JP2890306B2 JP63171729A JP17172988A JP2890306B2 JP 2890306 B2 JP2890306 B2 JP 2890306B2 JP 63171729 A JP63171729 A JP 63171729A JP 17172988 A JP17172988 A JP 17172988A JP 2890306 B2 JP2890306 B2 JP 2890306B2
Authority
JP
Japan
Prior art keywords
image
line segment
coordinates
coordinate
image memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63171729A
Other languages
English (en)
Other versions
JPH02210586A (ja
Inventor
昇 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP63171729A priority Critical patent/JP2890306B2/ja
Publication of JPH02210586A publication Critical patent/JPH02210586A/ja
Application granted granted Critical
Publication of JP2890306B2 publication Critical patent/JP2890306B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は人間による認識のためのマーク付け等が行な
われていない一般の文書を認識するための文書画像認識
において、文字、図、表、写真などが混在する文書から
表領域を分離する装置に関するものである。
(従来の技術) 従来の文字・図形分離処理は、文字と図形を分離する
のみである。つまり第2図に示すように、表を含んだ文
書画面70に対しては表の線と文字(表領域外の文字(本
文文字と見出し文字など)と表領域内の文字の両方を含
む)を分離して、文字画像71と線画像72とに分離抽出す
るのみで、表内の文字を含んだ表領域を分離して、文字
領域画像73と表領域画像74とに分離抽出することはでき
なかった。
このような従来技術においては、表内の文字を含んだ
表領域を抽出できないことによって、以下のような問題
点があった。
文書画像認識では、文字認識の際に本文領域と表内の
文字が区別できないために、文脈を用いた効率的な文字
認識を行なうことができない。
表においては、同一行(列)には同じ文字、同じ意味
の文字、あるいは反対の意味の文字などが使用されるこ
とが多いが、このような表の構造的な意味を用いて効率
的に文字認識を行なうことはできない。
文書編集では、表の線のみに対する編集ができるのみ
で、意味を持つ表領域に対する編集ができない。
(発明が解決しようとする課題) 本発明は、文書画像認識や文書編集を効率的に行なう
のに文字をも含んだ表領域の抽出ができるようにするこ
とを目的とするものである。
(課題を解決するための手段) 本発明は、表を含む画像をデジタル化して入力する画
像入力手段と、前記画像入力手段により入力された画像
を記憶する第1のイメージメモリと、前記第1のイメー
ジメモリに記憶されている画像から水平または垂直方向
に予め定めた一定の閾値以上にわたり連続する黒画素列
を抽出する線分抽出手段と、前記線分抽出手法手段によ
り抽出された黒画素列を格納する第2のイメージメモリ
と、前記第2のイメージメモリに格納した水平方向の黒
画素列からなる水平方向線分の始点、終点の座標および
垂直方向の黒画素列からなる垂直方向線分の始点、終点
の座標をそれぞれ求め、それらの座標に基づいて他の線
分と交差している線分を求め、さらに、交差している線
分のみについて水平方向線分の始点で最小のx座標x0
水平方向線分の終点で最大のx座標x1、直方向線分の終
点で最小のy座標y0、直方向線分の始点で最大のy座標
y1を求め、これらの座標を表領域を表す矩形の座標とし
て検出する矩形座標検出手段とを備えた表領域分離装置
である。
また、本発明の他の態様は、表を含む画像をデジタル
化して入力する画像入力手段と、前記画像入力手段によ
り入力された画像を記憶する第1のイメージメモリと、
前記第1のイメージメモリに記憶されている画像から水
平方向に予め定めた一定の閾値以上にわたり連続する黒
画素列を抽出する第1の線分抽出手段と、前記第1のイ
メージメモリに記憶されている画像を90度回転する画像
回転手段と、画像回転手段により90度回転された画像か
ら水平方向に予め定めた一定の閾値以上にわたり連続す
る黒画素列を抽出する第2の線分抽出手段と、前記第1
の線分抽出手段および第2の線分抽出手段により抽出さ
れた黒画素列を格納する第2のイメージメモリと、前記
第2のイメージメモリに格納した黒画素列からなる線分
の始点、終点の座標に基づいて表領域を表す矩形の座標
を検出する矩形座標検出手段を備えている。
本発明の表領域分離方法は、表を含む画像をデジタル
化して入力する画像入力手段と、画像を記憶する第1の
イメージメモリと、画像を記憶する第2のイメージメモ
リとを備える表領域分離装置において、前記画像入力手
段により入力された画像を第1のイメージメモリに記憶
し、前記第1のイメージメモリ2記憶されている画像か
ら水平または垂直方向に予め定めた一定の閾値以上にわ
たり連続する黒画素列を抽出し、抽出された黒画素列を
第2のイメージメモリに格納し、前記第2のイメージメ
モリに格納した水平方向の黒画素列からなる水平方向線
分の始点、終点の座標および垂直方向の黒画素列からな
る垂直方向線分の始点、終点の座標を求め、それらの座
標に基づいて他の線分と交差している線分を求め、交差
している線分のみについて水平方向線分の始点で最小の
x座標x0、水平方向線分の終点で最大のx座標x1、垂直
方向線分の終点で最小のy座標y0、直方向線分の始点で
最大のy座標y1を求め、前記座標x0、座標x1、座標y0
座標y1により表領域を表す矩形の座標を検出する。
(作用) 本発明は、画像入力手段から表を含む一般文書すなわ
ち人間による処理のためのマーク付け等が行なわれてい
ない文書をデジタル入力し、その原画像を第1のイメー
ジメモリに格納しておき、その原画像に対して線分抽出
手段により水平方向または垂直方向に長く連続する黒画
素列を抽出し、その抽出した黒画像素列つまり水平方向
線分のみになった画像と垂直方向線分のみになった画像
を第2のイメージメモリに格納し、矩形座標検出手段に
おいて両画像に存在する各線分の始点と終点を検出し、
表領域の有無を他の線分との交差の有無により確認し、
そして、表領域を表わす対角座標を求め、次に表領域抽
出手段において矩形座標検出手段からの表領域を表す前
記座標を用い、第1イメージメモリに格納されている原
画像から表領域画像と文字領域画像(表領域外の画像)
を分離する。
(実施例) 第1図は本発明の一実施例を示すもので、この表領域
分離装置は、画像入力部1、第1のイメージメモリ2、
長ランレングス抽出部3、イメージメモリ4、矩形座標
検出部5、および表領域抽出部6からなっている。
画像入力部1は、本文文字や表を含む画文書画像を入
力する。たとえば、第2図(a)原画像70を2値デジタ
ルデータとして入力する。
第1のイメージメモリ2は、入力した2値デジタルデ
ータを記憶しておく。
長ランレングス抽出部3は、第1のイメージメモリ内
の予め定めた一定の閾値以上の長ランレングス(=長く
連続する黒画素列)を水平および垂直方向走査すること
により、取り出す。
水平方向の長ランレングスの黒画素列の取り出し方法
を第3図を用いて説明する。第3図(a)は原画像の一
部分であり、四角の一個が1ドットに対応し、斜線部分
が黒画像、白い部分が白画素、縦の太線がメモリ内のバ
イト単位を示している。この画像に対して、水平方向に
走査し、閾値(この例では10ドット)以上の黒ランを取
り出す。結果は第3図(b)のようになる。垂直方向の
長ランレングスの黒画素列の取り出し方法を第4図を用
いて示す。第4図(a)は、原画像の一部である。本実
施例におけるメモリはバイト単位でアクセスを行なうも
のを用いたので、垂直方向に走査するには第4図(a)
のままでは水平方向の走査と違い、1ドットの読み出し
毎にそのドットを含む1バイト全体が読み出されること
になる。つまり、水平方向の走査では8ドットを1回の
アクセスで読み出すことができるのに対し、第4図
(a)の配列のままで垂直方向の走査を行なうと8ドッ
トの読み出しにメモリに対し8回のアクセスが必要とな
り、走査に時間を要することになる。そこで、垂直方向
の走査も水平方向の走査と同じようにできるように、第
4図(b)に示すとおり原画像を90度回転した画像をメ
モリ上に作成する。その90度回転した画像に対して、水
平方向と同じ処理を行なう。
この処理によって、第2のイメージメモリ4には、第
5図に示すように水平方向線分のみの画像(a)と垂直
方向線分のみの画像(b)が2面できあがる。ただし、
垂直方向線分のみの画像は90度回転したままの画像であ
る。
第2のイメージメモリ4内の2つの画像に対して、矩
形座標検出部5では、表の対角座標(左上座標と右下座
標または右上座標と左下座標)を検出する。具体的に
は、まず、第5図(a)に示すような水平方向のみの画
像に対して、同図77の走査方向(ここでは77の方向とす
る。逆でもよい。)で、走査して水平方向線分75の始
点、終点のx、y座標を求める。第5図(b)に示すよ
うな垂直方向のみの画像に対しても同様に、77の走査方
向で線分76の始点、終点のx、y座標を求める。ただ
し、この際の座標系は第5図(b)のように90度回転し
たものとなっている。
水平/垂直方向線分のx,y座標から、線分75と76が互
いに交差することを確認(この確認はアンダーライン等
の表を構成していない線分を取り除くためである)し、
交差している線分のみについて、水平方向線分の始点で
最小のx座標x0と、終点で最大のx座標x1を求め、垂直
方向線分の終点で最小のy座標y0と、始点で最大のy座
標y1を求める。これによって、表の左上座標(x0
y0)、右下座標(x1、y1)が求まる。ここで、左上座標
と右上座標を簡易に線群75の最初にみつかった水平線の
始点のx、y座標と、最後に見つかった水平線の終点の
x、y座標から求めなかったのは、第6図のように開い
ている表(周りが水平/垂直線で囲まれていない表)に
も対処できるようにしたためである。
表領域抽出部6では、矩形座標検出部5より渡された
左上座標(x0、y0)と右上座標(x1、y1)から、その座
標に対応する第1のイメージメモリ2の矩形領域を切り
出し、第2図(e)のような表内の文字を含んだ表領域
74を抽出できる。また、矩形座標内を白く塗りつぶすこ
とによって第2図(d)のような表領域外の画像外73を
得ることができる。
本発明の上記実施例においては、バイト単位でアクセ
ス可能なメモリを用い、長ランレングス抽出部3で画像
を90度回転させることによって、垂直方向も効率よく走
査しているが、これをビット単位でのアクセスが可能な
メモリを用いることによって、第5図(b)のように回
転した座標系を用いなくても垂直方向も水平方向と同じ
に効率よく走査することができる。
また、抽出の対象とする表の構造を規定すること、た
とえば、表はかならず水平/垂直線で閉じていることな
どを限定することによって、垂直方向の線分取り出しを
省略してしまうなどの簡略化を行なうことができる。た
とえば、アンダーラインがなく、閉じた表を対象とする
ならば、1番上にある水平線の始点のx、y座標と1番
下にある水平線の終点のx、y座標を求めることのみに
よって、表領域の抽出が可能である。
(発明の効果) 以上のように、本発明は、長い黒画素列を抽出するこ
とによって表の要素である線分を抽出し、各線分の始点
と終点の座標を検出し、それらの座標から交差する線分
を求め、その交差する線分を基に表領域を表す矩形の対
角座標を決定し、その対角座標により表領域を抽出する
ように構成したので、従来技術のように表の線分のみを
抽出するのとは異なり、表内の文字をも含む表領域全体
を抽出することが可能である。従って、本発明を文書画
像認識の前処理に用いた場合には、文書画像の認識を高
効率に行なうために必要な条件を備えた分離された表領
域と文字領域を提供でき、極めて有用である。
また、本発明は、長い黒画素列を抽出し、各黒画素列
のその始点と終点の座標を検出し比較するという簡易な
演算処理によって表領域を抽出するので、装置の構成を
簡単にすることができると共に、処理の高速化を実現す
ることができる。
また、本願発明の一態様では、垂直方向の連続する黒
画素列を求めるのに、原画像を画像回転手段により90度
回転させた画像に対して水平方向に走査するようにし
て、水平方向にのみ走査することによって線分を抽出し
ているので、メモリのアクセス単位での処理が可能とな
ることにより、垂直方向に走査するよりも走査時間が短
くてすむ。
【図面の簡単な説明】
第1図は、本発明の一実施例を示すブロック図である。 第2図は文字と表の分離の態様を説明するための図であ
り、同図(a)は原入力画像、(b)は従来手法による
文字画像、(c)は従来手法による線画像、(d)は文
字領域画像、(e)は表領域画像の例を示す図である。 第3図は、水平方向に長い黒画素列を取り出すための説
明図である。 第4図(a)および(b)は垂直方向に長い黒画素列を
取り出すための説明図である。 第5図は、長い黒画素列から表領域の矩形座標を抽出す
るための説明図である。 第6図は、開いた表(表の四方が水平/垂直線で囲まれ
ていない表)の一例を示す図である。 1……画像入力部、2……第1のイメージメモリ、3…
…長ランレングス抽出部、4……第2のイメージメモ
リ、5……矩形座標検出部、6……表領域抽出部、70…
…原画像、71……従来手法による文字画像、72……従来
手法による線画像、73……本発明による文字領域画像、
74……本発明による表領域画像、75……水平方向線分、
76……垂直方向線分、77……走査方向。

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】表を含む画像をデジタル化して入力する画
    像入力手段と、 前記画像入力手段により入力された画像を記憶する第1
    のイメージメモリと、 前記第1のイメージメモリに記憶されている画像から水
    平または垂直方向に予め定めた一定の閾値以上にわたり
    連続する黒画素列を抽出する線分抽出手段と、 前記線分抽出手段により抽出された黒画素列を格納する
    第2のイメージメモリと、 前記第2のイメージメモリに格納した水平方向の黒画素
    列からなる水平方向線分の始点、終点の座標および垂直
    方向の黒画素列からなる垂直方向線分の始点、終点の座
    標をそれぞれ求め、それらの座標に基づいて他の線分と
    交差している線分を求め、さらに、交差している線分の
    みについて水平方向線分の始点で最小のx座標x0、水平
    方向線分の終点で最大のx座標x1、垂直方向線分の終点
    で最小のy座標y0、垂直方向線分の始点で最大のy座標
    y1を求め、これらの座標を表領域を表す矩形の座標とし
    て検出する矩形座標検出手段と を備えたことを特徴とする表領域分離装置。
  2. 【請求項2】前記矩形座標検出手段により検出された表
    領域を表す矩形の座標により第1のイメージメモリから
    表領域を抽出する表領域抽出手段をさらに具備すること
    を特徴とする請求項1記載の表領域分離装置。
  3. 【請求項3】表を含む画像をデジタル化して入力する画
    像入力手段と、 前記画像入力手段により入力された画像を記憶する第1
    のイメージメモリと、 前記第1のイメージメモリに記憶されている画像から水
    平方向に予め定めた一定の閾値以上にわたり連続する黒
    画素列を抽出する第1の線分抽出手段と、 前記第1のイメージメモリに記憶されている画像を90度
    回転する画像回転手段と、 画像回転手段により90度回転された画像から水平方向に
    予め定めた一定の閾値以上にわたり連続する黒画素列を
    抽出する第2の線分抽出手段と、 前記第1の線分抽出手段および第2の線分抽出手段によ
    り抽出された黒画素列を格納する第2のイメージメモリ
    と、 前記第2のイメージメモリに格納した黒画素列からなる
    線分の始点、終点の座標に基づいて表領域を表す矩形の
    座標を検出する矩形座標検出手段 を備えたことを特徴とする表領域分離装置。
  4. 【請求項4】表を含む画像をデジタル化して入力する画
    像入力手段と、画像を記憶する第1のイメージメモリ
    と、画像を記憶する第2のイメージメモリとを備える表
    領域分離装置において、 前記画像入力手段により入力された画像を第1のイメー
    ジメモリに記憶し、 前記第1のイメージメモリ2記憶されている画像から水
    平または垂直方向に予め定めた一定の閾値以上にわたり
    連続する黒画素列を抽出し、 抽出された黒画素列を第2のイメージメモリに格納し、 前記第2のイメージメモリに格納した水平方向の黒画素
    列からなる水平方向線分の始点、終点の座標および垂直
    方向の黒画素列からなる垂直方向線分の始点、終点の座
    標を求め、 それらの座標に基づいて他の線分と交差している線分を
    求め、 交差している線分のみについて水平方向線分の始点で最
    小のx座標x0、水平方向線分の終点で最大のx座標x1
    垂直方向線分の終点で最小のy座標y0、垂直方向線分の
    始点で最大のy座標y1を求め、 前記座標x0、座標x1、座標y0、座標y1により表領域を表
    す矩形の座標を検出する ことを特徴とする表領域分離方法。
JP63171729A 1988-07-12 1988-07-12 表領域分離装置および表領域分離方法 Expired - Fee Related JP2890306B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63171729A JP2890306B2 (ja) 1988-07-12 1988-07-12 表領域分離装置および表領域分離方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63171729A JP2890306B2 (ja) 1988-07-12 1988-07-12 表領域分離装置および表領域分離方法

Publications (2)

Publication Number Publication Date
JPH02210586A JPH02210586A (ja) 1990-08-21
JP2890306B2 true JP2890306B2 (ja) 1999-05-10

Family

ID=15928595

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63171729A Expired - Fee Related JP2890306B2 (ja) 1988-07-12 1988-07-12 表領域分離装置および表領域分離方法

Country Status (1)

Country Link
JP (1) JP2890306B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6650775B1 (en) * 1999-08-23 2003-11-18 Xerox Corporation Method and apparatus for implementing a streaming two-dimensional digital image segmentation
JP5262778B2 (ja) 2009-02-05 2013-08-14 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
JP5267364B2 (ja) 2009-07-10 2013-08-21 富士ゼロックス株式会社 画像処理装置およびプログラム
JP5505182B2 (ja) 2010-08-09 2014-05-28 富士ゼロックス株式会社 画像判定装置及びプログラム
JP6874387B2 (ja) 2017-01-26 2021-05-19 株式会社リコー 画像処理装置、画像処理方法およびプログラム
CN113343815B (zh) * 2021-05-31 2022-06-07 北森云计算有限公司 一种pdf等版式文档中识别表格的方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57211674A (en) * 1981-06-23 1982-12-25 Ricoh Co Ltd Frame recognizing method

Also Published As

Publication number Publication date
JPH02210586A (ja) 1990-08-21

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JP2926066B2 (ja) 表認識装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH06187489A (ja) 文字認識装置
JPH0548510B2 (ja)
JPS615383A (ja) 文字パタ−ン分離装置
JPS62121589A (ja) 文字切出し方法
JPS63304387A (ja) 文書読取装置
JP3153439B2 (ja) 文書画像傾き検出方法
JPH0697470B2 (ja) 文字列抽出装置
JPH0564396B2 (ja)
JPH05346973A (ja) ストロークに基づくシンボルからのストロークの逐次的抽出方法及びその装置
JP2803736B2 (ja) 文字認識方式
JPH07160810A (ja) 文字認識装置
JPH03142691A (ja) 表形式文書認識方式
JP2571826B2 (ja) 文字列パターン切り出し装置
JPH0343879A (ja) 文字認識装置およびその文字領域分離方法
JP2507949B2 (ja) 文字/図形領域判定装置
JPS61235990A (ja) 文字認識装置
JP2954218B2 (ja) 画像処理方法及び装置
JPH01149184A (ja) 文字領域抽出方式
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH0433079A (ja) 表処理方式
JPH0334081A (ja) 図面読取装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees