JPH039489A - 表領域識別方法 - Google Patents

表領域識別方法

Info

Publication number
JPH039489A
JPH039489A JP1143456A JP14345689A JPH039489A JP H039489 A JPH039489 A JP H039489A JP 1143456 A JP1143456 A JP 1143456A JP 14345689 A JP14345689 A JP 14345689A JP H039489 A JPH039489 A JP H039489A
Authority
JP
Japan
Prior art keywords
rectangle
run
table area
memory
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1143456A
Other languages
English (en)
Other versions
JP2940936B2 (ja
Inventor
Michiyoshi Tachikawa
道義 立川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP1143456A priority Critical patent/JP2940936B2/ja
Priority to US07/533,346 priority patent/US5048107A/en
Publication of JPH039489A publication Critical patent/JPH039489A/ja
Application granted granted Critical
Publication of JP2940936B2 publication Critical patent/JP2940936B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • G06V30/18076Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections by analysing connectivity, e.g. edge linking, connected component analysis or slices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置等において、文書等の入力画像
上の表領域を識別する方法に関する。
〔従来の技術及び発明が解決しようとする課題〕一般の
文書は、文字の領域のほかに図、写真、表等の領域があ
る。このような文書を文字認識装置において認識処理す
る場合1文字領域は文字認識をし、図や写真の領域は画
像のまま保存し、あるいは再度デイザ法を用いて擬似2
値画像で読み取って保存し、表領域は表の罫線を枠とし
て認識し、その枠の内部の画像についてだけ文字認識を
するというように、領域別に処理内容を変える必要があ
る。
このような領域別の処理を行うには、その前提として領
域識別が必要となる。この領域識別の中で、表領域につ
いては1例えば特開昭57−104363号公報に記載
の″枠パターン識別方法″を行うことも可能である。し
かし、縦方向および横方向の長線分(枠線候補)を抽出
し、縦横の長線分による枠の形成の判定を行うには、処
理がかなり複雑になり、高速処理が難しいという問題が
あった。
よって本発明の目的は、処理が簡便で高速の表領域識別
が可能な表領域識別方法を提供することにある。
〔課題を解決するための手段〕
本発明においては、原稿の画像またはその圧縮画像上の
黒画素のランを抽出し、接したランを矩形統合し、統合
した矩形のうちで所定以上のサイズの矩形について、そ
の内部の一定以上の長さのランを統合することにより罫
線を抽出し、その個数に基づいて表領域であるか否かを
判定することによって、表領域を識別する。
〔作 用〕
このようにラン統合矩形のサイズから表領域候補を見つ
け、その枠内の罫線の個数により表領域であるか否かを
判定する方法であるため、閉じた枠のパターンを認識す
る方法に比べ、処理アルゴリズムが単純で高速処理が可
能である。
〔実施例〕
以下、図面により本発明の幾つかの実施例について説明
する。
第1図は本発明の各実施例に係る装置構成を示す概略ブ
ロック図である。1はOCRであり、この部分に表領域
識別手段が設けられている。2は処理対象の原稿の画像
を読み取るためのスキャナである。
0CRLにおいて、制御部3からスキャナ2に読取りの
命令を与えて原稿画像の入力を実行させ、その画像デー
タ(または圧縮画像データ)を画像メモリ4に蓄積させ
る。ラン抽出部5は1画像メモリ4から1ラインずつ画
像データを読出し、黒画素のラン(黒画素の連結)の始
点と終点の座標を検出し、それをラン番号(検出順番)
とともにランメモリ6に書き込む。
矩形統合部7では、抽出されたランの始点及び終点の座
標を比較することにより、矩形メモリ8に登録されたど
の矩形に統合すべきか、あるいは新規の矩形に統合すべ
きかを判定し、矩形メモリ8のデータを更新する。なお
、矩形メモリ8内の矩形データは、矩形番号と、矩形の
左上角および右下角の座標よりなる。
表領域候補判定部9では、矩形メモリ8に登録された各
矩形のサイズをチエツクし1表領域の候補としての矩形
を検出し、その矩形の番号を制御部3へ送る。制御部3
では、表領域候補の矩形番号を表領域判定部1oへ送る
表領域判定部10では、矩形メモリ8内の指定された番
号の矩形データを参照し、その矩形を構成するランのデ
ータをランメモリ6より得て、矩形内の一定以上の長さ
のランを統合することにより罫線を抽出し、その罫線の
個数から表領域であるか否かを判定し、その結果を制御
部3へ送る。
ランデータバッファ11は、罫線統合のためのランデー
タの記憶に用いられる。
以上説明した処理のより具体的な内容について、実施例
毎に説明する。
寒胤涯↓ 処理全体の流れは第2図の通りである。処理ブロック2
1で原稿の画像データを画像メモリ4に取り込むが、こ
れは制御部3の制御によってスキャナ2によりなされる
処理ブロック22は、入力画像上のランの抽出と、その
矩形統合を行う部分で、これはラン抽出部5および矩形
統合部7の役割である。具体例を第3図および第4図に
よって説明する。
入力画像上に第3図(a)に示すようなパターンが存在
する場合、ラン抽出部5は画像の1ラインずつをラスタ
ースキャンし、黒連結のラン1からラン5を順に抽出し
、それぞれのランの抽出順序に艷ったラン番号を付け、
それぞれの始点(左端)と終点(右端)の座標をランメ
モリ6に書き込む。第3図(a)の例では、ランメモリ
6の内容は第3図(b)に示す如くになる。
また、矩形統合部7では、抽出されたランの始点および
終点の座標とを比較し、接しているランを矩形に統合す
る。第3図(a)に示すような5個のランが抽出された
段階では、第4図(a)に示すように、ラン1とラン3
は矩形1に統合され、ラン2、ラン4及びラン5は矩形
2に統合される結果、矩形メモリ8には第4図(c)に
示すような矩形データが書き込まれることになる。
より詳しく説明すると、ラン1が抽出されたときには矩
形は一つも登録されていないので、ラン1と始点(左上
角)および終点(右下角)が一致する矩形1が新規に登
録される0次のラン2が抽出されたときは、このラン2
はラン1と接していないので、ラン2と始点および終点
が一致する矩形2が新規に登録される。次のラン3が抽
出されると、これは矩形1を構成するラン1と接するの
で、ラン3は矩形1に統合され、矩形1の始点はそのま
まであるが、終点はラン3の終点座標に変更される。ラ
ン4およびラン5も同様に矩形2に統合され、矩形2の
終点のY座標はラン5のY座標に変更される。
その後、第4図(b)に示すようにラン6が抽出される
と、このラン6はこれまでに登録された矩形1に統合さ
れたランにも矩形2に統合されたランにも接していない
ので、新しい矩形3が登録される。その結果、矩形メモ
リ8のデータは第4図(d)に示す如くに更新される。
再び第2図において、処理ブロック23は表領域候補判
定部9の処理部分であり、矩形メモリ8に登録された各
矩形のX、Y方向の大きさを所定の閾値THRxtTH
Ryと比較し、これら閾値の両方を越える大きさの矩形
を表領域の候補と判定し、その矩形番号を制御部3に通
知する。
次の処理ブロック24は表領域判定部9による処理部分
である。まず、制御部3より指定された表領域候補の矩
形内のランより閾値THT以上の長さのランで接したも
のを統合することにより罫線(ここでは横書き文書を想
定しているので、横罫線)の候補を得る。これが″ラン
データバッファの作成″である。そして、ランデータバ
ッファ11上に得られた罫線候補の中より、矩形の幅に
近い長さ以上のものを罫線として抽出し、その個数をカ
ウントする。これが″罫線のカウント″である。そして
、罫線のカウント値を所定の閾値と比較し、その閾値を
越える場合に当該矩形を表領域と判定し、その矩形番号
を制御部3へ通知する。
これが゛表領域の判定″′である。
ここで、罫線候補の統合すなわち″ランデータバッファ
(RB)の作成″について説明する。ランデータバッフ
ァRBは、表領域候補矩形の各ラインに1対1に対応し
た始点および終点のX座標の記憶エリアを持ち、最初は
全エリアがクリアされている。
矩形の第1ラインより、一定以上の長さのランを捜し、
あるライン(@ライン)で一定以上のランが見つかると
、そのランの始点および終点のX座標とランデータバッ
ファRBの前ラインのエリアに記憶されているX座標と
を比較し、1画素でも接続していればランデータバッフ
ァRBの現ラインのエリアに、始点座標として、前ライ
ンと現ラインの始点のX座標の小さいほうの座標値を書
込み、また終点座標として、前ラインと現ラインの終点
のX座標の大きいほうの座標値を書き込む。
このような処理の繰り返しにより、罫線の候補となり得
るようなラン群の最後のランの存在するラインにおいて
、罫線候補の全体の始点と終点のX座標がランデータバ
ッファRBの対応エリアに保存される。
なお、縦罫線のランは横罫線のランに比べ一般に十分短
いので、罫線候補の統合の対象から除外されるため、ラ
インデータバッファRBの対応エリアはクリアされたま
まになる。
第5図は、前記処理ブロック23および処理ブロック2
4の詳細フローチャートである。この図において、■の
部分が処理ブロック23に対応し。
■、■および■の部分がそれぞれ処理ブロック24の″
ランデータバッファの作成″′、″罫線のカウント″お
よび“表領域の判定″の各処理に対応する。
なお、第5図における記号の意味は次の通りである。
i  :矩形番号 j  :矩形内のラン番号 k  :ランデータバッファのデータ番号IRWi  
 :番号iの矩形の幅 ITHi   :番号iの矩形の高さ THRx’  :表領域候補判定のための幅の閾値TH
Ry   :表領域候補判定のための高さの閾値IRi
jw  :矩形i内のランjの幅IRijxs:矩形i
内のランjの始点X座標IRijxe:矩形i内のラン
jの終点X座標THT    :罫線のランの判定のた
めの閾値RBsk   :ランデータバツファのに番目
の始点のX座標RBek   :ランデータバッファの
に番目の終点のX座標THL    :罫線判定のため
の閾値THC:罫線の個数の閾値 なお、■の処理部分において、各罫線候補として統合さ
れたライン数をカウントし、そのカウント値をチエツク
することにより、一定の高さを越えて統合されたときに
■の処理部へ分岐し、他の領域と判定するようにしても
よい、このようなチエツクを追加すれば、写真領域等を
表領域と誤識することがより確実に回避できる。
叉産貫主 前記実施例1とは″罫線のカウント′″(第2図)の処
理が異なる。すなわち1本実施例においては、矩形の幅
に近い罫線候補を無条件に罫線としてカウントするので
はなく、矩形の幅に近い罫線候補でも連続して出現する
ものは無視し、独立に出現する罫線候補のみを罫線とし
てカウントし、そのカウント値を“表領域の判定″に用
い表領域の判定精度の向上を図っている。
第6図は本実施例の処理の概略フローチャートであり、
各記号は第5図中の記号と対応している。
この図で■の部分がパ罫線のカウント″の処理部分(第
6図の■に対応)である。■の処理部分において、cn
tlは罫線候補の連続/独立の判定のために導入された
フラグである。
失五ガニ 本実施例の処理の概略フローチャートを第7図に示す、
処理ブロック31,33,34,35は前記各実施例の
対応処理ブロックと同様の処理ブロックである。処理ブ
ロック32が本実施例で追加された部分である。ここで
入力画像データに圧縮(縮小)処理を施し、その圧縮(
縮小)画像について処理ブロック33以下の処理を実行
する。
なお、この圧縮処理の手段は第1図に示されていない。
すなわち本実施例においては、処理すべき画像データ量
を大幅に削減することにより、処理時間の短縮と、ラン
メモリ6および矩形メモリ8の容量削減を図っている。
なお、実験によれば、400d p iの画像に対し8
分の1程度のデータ圧縮を行っても、表領域の判定能力
は現画像で処理した場合と殆ど違いがないことが確認さ
れている。
〔発明の効果〕
以上実施例により説明した如く、本発明によれば、文書
等の表領域を高精度に識別することができ、その処理ア
ルゴリズムも簡便であって高速処理が可能である。
【図面の簡単な説明】
第1図は本発明の実施例に係る装置構成の概略ブロック
図、第2図は本発明の一実施例における処理全体の流れ
を示すフローチャート、第3図はラン抽出とランメモリ
のデータの説明のための図、第4図はランの矩形統合と
矩形メモリのデータを説明するための図、第5図は表領
域候補矩形判定および表領域判定の詳細フローチャート
、第6図は本発明の他の実施例の処理を示すフローチャ
ート、第7図は本発明のさらに他の実施例の処理を示す
フローチャートである。 1・・・0CR12・・・スキャナ、 3・・・制御部
、4・・・画像メモリ、 5・・・ラン抽出部、6・・
・ランメモリ、 7・・・矩形統合部、8・・・矩形メ
モリ、 9・・・表領域候補判定部、1o・・・表領域
判定部、 11・・・ランデータバッファ。 第3図 C尖) (シ9 第6図

Claims (1)

    【特許請求の範囲】
  1. (1)原稿の画像またはその圧縮画像上の黒画素のラン
    を抽出し、接したランを矩形統合し、統合した矩形のう
    ちで所定以上のサイズの矩形について、その内部の一定
    以上の長さのランを統合して罫線を抽出し、その罫線の
    個数に基づいて表領域であるか否かを判定することを特
    徴とする表領域識別方法。
JP1143456A 1989-06-06 1989-06-06 表領域識別方法 Expired - Lifetime JP2940936B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1143456A JP2940936B2 (ja) 1989-06-06 1989-06-06 表領域識別方法
US07/533,346 US5048107A (en) 1989-06-06 1990-06-05 Table region identification method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1143456A JP2940936B2 (ja) 1989-06-06 1989-06-06 表領域識別方法

Publications (2)

Publication Number Publication Date
JPH039489A true JPH039489A (ja) 1991-01-17
JP2940936B2 JP2940936B2 (ja) 1999-08-25

Family

ID=15339125

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1143456A Expired - Lifetime JP2940936B2 (ja) 1989-06-06 1989-06-06 表領域識別方法

Country Status (2)

Country Link
US (1) US5048107A (ja)
JP (1) JP2940936B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030058239A (ko) * 2001-12-29 2003-07-07 윤상호 교반기
KR100498249B1 (ko) * 2002-04-12 2005-07-01 주식회사 가이아 음식물 또는 유기성 폐기물 처리용 교반기

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5191612A (en) * 1990-03-13 1993-03-02 Fujitsu Limited Character recognition system
US5566255A (en) * 1991-03-05 1996-10-15 Ricoh Company, Ltd. Segmenting a page of a document into areas which are text and areas which are halftone
JP3278471B2 (ja) * 1991-11-29 2002-04-30 株式会社リコー 領域分割方法
JPH05250357A (ja) * 1992-03-05 1993-09-28 Ricoh Co Ltd 画像読取修正装置および修正画像形成装置
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
DE69333694T2 (de) * 1992-09-11 2005-10-20 Canon K.K. Verfahren und Anordnung zur Bildverarbeitung
US6005976A (en) * 1993-02-25 1999-12-21 Fujitsu Limited Image extraction system for extracting patterns such as characters, graphics and symbols from image having frame formed by straight line portions
JP2951814B2 (ja) * 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
US5588072A (en) * 1993-12-22 1996-12-24 Canon Kabushiki Kaisha Method and apparatus for selecting blocks of image data from image data having both horizontally- and vertically-oriented blocks
JPH0887495A (ja) * 1994-09-16 1996-04-02 Ibm Japan Ltd 表データのカット・アンド・ペースト方法及びデータ処理システム
US5848186A (en) * 1995-08-11 1998-12-08 Canon Kabushiki Kaisha Feature extraction system for identifying text within a table image
US5898795A (en) * 1995-12-08 1999-04-27 Ricoh Company, Ltd. Character recognition method using a method for deleting ruled lines
JP3814320B2 (ja) * 1995-12-14 2006-08-30 キヤノン株式会社 画像処理方法及び装置
JP3814334B2 (ja) * 1996-04-19 2006-08-30 キヤノン株式会社 画像処理装置及びその方法
US5893127A (en) * 1996-11-18 1999-04-06 Canon Information Systems, Inc. Generator for document with HTML tagged table having data elements which preserve layout relationships of information in bitmap image of original document
US6512848B2 (en) 1996-11-18 2003-01-28 Canon Kabushiki Kaisha Page analysis system
US6226402B1 (en) 1996-12-20 2001-05-01 Fujitsu Limited Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US6021220A (en) * 1997-02-11 2000-02-01 Silicon Biology, Inc. System and method for pattern recognition
US6006240A (en) * 1997-03-31 1999-12-21 Xerox Corporation Cell identification in table analysis
US6173073B1 (en) 1998-01-05 2001-01-09 Canon Kabushiki Kaisha System for analyzing table images
US6711292B2 (en) 1998-12-30 2004-03-23 Canon Kabushiki Kaisha Block selection of table features
US20020178183A1 (en) * 2001-04-10 2002-11-28 Uwe Meding Data extraction method and apparatus
JP4651407B2 (ja) * 2005-02-21 2011-03-16 株式会社リコー 画像処理装置およびコンピュータプログラムおよび記憶媒体
US8000535B2 (en) * 2007-06-18 2011-08-16 Sharp Laboratories Of America, Inc. Methods and systems for refining text segmentation results
JP5361574B2 (ja) * 2009-07-01 2013-12-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7006009B2 (ja) 2017-08-15 2022-01-24 富士フイルムビジネスイノベーション株式会社 画像識別装置及び画像形成プログラム
US10614345B1 (en) 2019-04-12 2020-04-07 Ernst & Young U.S. Llp Machine learning based extraction of partition objects from electronic documents
US11113518B2 (en) 2019-06-28 2021-09-07 Eygs Llp Apparatus and methods for extracting data from lineless tables using Delaunay triangulation and excess edge removal
US11915465B2 (en) 2019-08-21 2024-02-27 Eygs Llp Apparatus and methods for converting lineless tables into lined tables using generative adversarial networks
US10810709B1 (en) 2019-11-21 2020-10-20 Eygs Llp Systems and methods for improving the quality of text documents using artificial intelligence
US11625934B2 (en) 2020-02-04 2023-04-11 Eygs Llp Machine learning based end-to-end extraction of tables from electronic documents
US11599711B2 (en) * 2020-12-03 2023-03-07 International Business Machines Corporation Automatic delineation and extraction of tabular data in portable document format using graph neural networks

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4723298A (en) * 1985-03-27 1988-02-02 Fingermatrix, Inc. Image compression technique
JPS63155386A (ja) * 1986-12-19 1988-06-28 Ricoh Co Ltd 帳票デ−タ読取装置
US4932065A (en) * 1988-11-16 1990-06-05 Ncr Corporation Universal character segmentation scheme for multifont OCR images
US4901365A (en) * 1988-12-19 1990-02-13 Ncr Corporation Method of searching binary images to find search regions in which straight lines may be found

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030058239A (ko) * 2001-12-29 2003-07-07 윤상호 교반기
KR100498249B1 (ko) * 2002-04-12 2005-07-01 주식회사 가이아 음식물 또는 유기성 폐기물 처리용 교반기

Also Published As

Publication number Publication date
US5048107A (en) 1991-09-10
JP2940936B2 (ja) 1999-08-25

Similar Documents

Publication Publication Date Title
JPH039489A (ja) 表領域識別方法
US7949157B2 (en) Interpreting sign language gestures
JP2001266068A (ja) 表認識方法と表認識装置と文字認識装置及び表認識プログラムを記録した記憶媒体
Ghorpade et al. Extracting text from video
CN114332866A (zh) 一种基于图像处理的文献曲线分离与坐标信息提取方法
JP2890306B2 (ja) 表領域分離装置および表領域分離方法
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP4159071B2 (ja) 画像処理方法,画像処理装置および該処理方法を実現させるためのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2803735B2 (ja) 罫線を含んだ文字認識装置
JPH09128478A (ja) 画像処理装置
JP2968284B2 (ja) 文字認識装置およびその文字領域分離方法
JPH03142691A (ja) 表形式文書認識方式
JPH03126188A (ja) 文字認識装置
JPH04195694A (ja) 表領域判定方法
JP2963474B2 (ja) 類似文字識別方法
JPH05298487A (ja) 英文字認識装置
JPH03219384A (ja) 文字認識装置
JPS63131287A (ja) 文字認識方式
JPH0264781A (ja) 表領域抽出方式
JP2004240500A (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JPH0433080A (ja) 表内文字認識方法
JPH03160582A (ja) 文書画像データに於ける罫線と文字の分離方法
JPH05128305A (ja) 領域分割方法
JPH04291479A (ja) 罫線認識方法及び表処理方法
JPH0728933A (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080618

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090618

Year of fee payment: 10

EXPY Cancellation because of completion of term