JPH01196657A - 文書構造認識方法 - Google Patents

文書構造認識方法

Info

Publication number
JPH01196657A
JPH01196657A JP63021743A JP2174388A JPH01196657A JP H01196657 A JPH01196657 A JP H01196657A JP 63021743 A JP63021743 A JP 63021743A JP 2174388 A JP2174388 A JP 2174388A JP H01196657 A JPH01196657 A JP H01196657A
Authority
JP
Japan
Prior art keywords
document
line segment
character
line
detect
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63021743A
Other languages
English (en)
Inventor
Sueji Miyahara
末治 宮原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP63021743A priority Critical patent/JPH01196657A/ja
Publication of JPH01196657A publication Critical patent/JPH01196657A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は文書処理装置において、文書上のレイアウトと
罫線や表、枠取りなどの線分構造を自動的に検出する文
書構造認識方法に関する。
〔従来の技術〕
従来、文書を走査し、光電変換して得られる白黒2値の
文書画像データから文字・図・表など物理的性質の異な
るものを検出する方法としては、画像データ内の黒画素
で、長い直線性を示すもので、かつ黒画素のつながりを
トレースして閉ループを示すものを表の桝目として検出
する方法(中野他″文字認識と協調した表形式の理解″
信学論(D) 、J69−D、3.昭和61年3月)や
、線分を示す黒画素の芯線を水平や垂直方向にトレース
して罫線を検出する方法(原品゛罫線付き不定ピッチ活
字漢字文章の読取り″、電子通信学会全国総合大会、1
534.昭和61年)などが提案されている。
〔発明が解決しようとする課題〕
上記方法は、いずれも単純な表や罫線の検出方法であり
、一般に出回っている既存文書に現われる複雑な構造を
持つものや、活版印刷のように線分の交差点が存在しな
いような表や、表の外周に線分が存在しないようなオー
プン形の表など、種々の線分構造を認識するものではな
い。
本発明の目的は、文字・図・表など物理的性質の異なる
ものが混在する文書から、罫線や表や枠取りなどの線分
情報を精度よく検出して、文書上の文字が、どの物理的
性質を有するものに属す、るのかを自動的に決定する文
書構造認識方法を提供することにある。
〔課題を解決するための手段〕
上記目的を達成するために、本発明においては、文書画
像データを縦と横とに各ラインごとに走査して、方向別
の黒画素のランレングスを検出し、求められた方向別の
ランレングス値を予め求められた線分検出用閾値と比較
して方向別の線分を検出する線分検出処理と、縦方向と
横方向との線分の相互の接続関係から線分の交点や端点
の状態を検出するとともに、検出された交点や端点の形
状や、交点相互の距離の近さによって罫線や表、枠取り
などの領域を分離抽出する線分構造検出処理と、検出さ
れた表や枠取りにより文書上からレイアウト的に一つの
まとまりを示す文字領域を検出する文字領域検出処理と
を具備する。
〔作 用〕
文書画像データ上の線分を検出するために、黒画素のラ
ンレングスを各ラインごとに縦方向と横方向とについて
求め、各ラインのランレングスの最大値を各ランレング
ス値とする。一方、文書画像データ上の黒画素の連結成
分を求め、その外接四角形の大きさ(高さと幅とのそれ
ぞれについて)頻度分布から文字の平均的な大きさを求
め、その文字の平均的な文字の大きさを一定倍した値を
線分検出用の閾値として、各ラインのランレングス値と
比較し、ランレングス値が線分検出用の閾値より大きけ
れば線分候補とする。つぎに、縦方向(X軸上)と横方
向(Y軸上)との線分候補について、その位置にクロス
形のマスクを当てはめ。
黒画素の周辺分布の大きさがマスクの大きさの中の一定
割合以上であれば、その方向に線分が存在するものと判
断して、線分候補の位置や長さ線幅。
交点の形状を検出する。つぎに線分相互の関係を線分の
構造規則を用いて調べ線分の構造を認識するとともに、
その内容すなわち、罫線や表、枠取りがどのように構成
されているが、またどの領域を占有するかを検出する。
つぎに個々の桝目を検出し、桝目内に存在する文字や桝
目外に存在する文字を区別するとともに、区別された領
域ごとに黒画素の周辺分布を求め、文字列や個々の文字
を切出す。
〔実施例〕
以下1本発明の一実施例について図面により説明する。
第1図は、本発明の一実施例のブロック図であって、1
1は入力端子、12は文書画像データメモリ、13は連
結成分抽出部、14は文字の大きさ検出部、15はラン
レングス検出部、16は線分検出部、17は線分構造検
出部、171は線分構造検出規則部、18は文字領域抽
出部、19は文字切出し部、20は出力端子である。以
下、各部の動作を説明する。
紙面上の文字を光電変換装置(図示せず)により白黒2
値の文書画像データに変換し、これを入力端子11を介
して1文書画像データメモリ12に一旦蓄える。
連結成分抽出部13では、該文書画像データメモリ12
上の画像データに対し、黒画素の連結成分を求め、その
外接四角形の大きさ、すなわち高さと幅とを抽出して、
文字の大きさを検出部14に送出する。文字の大きさ検
出部14では、送られて来た文字の大きさの高さ、およ
び幅の頻度分布から縦方向と横方向それぞれの線分検出
用閾値α1.α、を求める6線分検出用閾値α0.α、
の値は、頻度分布の最大値を平均的な文字の大きさとみ
なして、この値をh倍したものや、頻度分布において複
数の山を示す場合は大きい方の山を文字の平均的な文字
の大きさとみなして、この値をに倍としたものを用いる
。一方、ランレングス検出部15では、画像データメモ
リ12を縦および横に走査する際に、各ラインごとにラ
ンレングスの最大値を求め、その値をラインのランレン
グス値として線分検出部16に送出する。
線分検出部16では、送られて来たランレングス値と、
線分検出用閾値α8.α、とを比較し、この閾値より大
きいものを線分候補とする。さらに、縦方向および横方
向ごとに線分の長さと幅とを調べ、単独線分であれば罫
線とみなして罫線情報テーブルに、その外接四角形のア
ドレス値を記憶する。また、これと同時に隣接線分の距
離を算出して、第2図に示すような交点形状検出用のク
ロス形マスクの大きさを決めて、縦・横の線分候補が交
わる交差点に当てはめ、マスク内における縦方向と横方
向との黒画素の周辺分布の大きさから線分の交差状態(
線分の伸びている方向とその線幅)を検出し、第3図の
ような交差点情報161を後続の処理へ送出する。
第2図の(a)は交差点の状態を検出するためのマスク
であり、(b)の“0101 ”および(c)の“「″
はそれらをコード化したものとその略省記号を示す6第
3図は、交差点の状態を表わす交差点情報テーブルの内
容を示したものであり、交差点の座標値、線分方向、文
字線幅などが記録される。なお、第2図及び第3図は、
右方と下方に線分が伸びている例である。
次に、線分構造検出部17では、送られて来た線分情報
や交差点情報を構造検出規則に従って処理し、枠取り線
分か表線分かを判定するとともにその個数、およびその
形態を検出する。ここで用いる構造検出規則には以下の
ようなものを用いる。
なお、ここで線分とは、線幅が一定値Q以下であり、端
点から端点、端点から交点、交点から交点などの線を意
味し、枠取りとは交点から伸びた線分が外周のみから成
るもの、クローズ形の表とは第4図(a)に示すように
端点を保有しない表、オープン形の表とは第4図(b)
に示すように端点を保有する表である。
線分構造検出規則部171の内容は次に示す如きもので
ある。
■ 交点から線分が伸びた方向には、線分が入り込む交
点が存在する。
■ 第4図(b)に示すオープン形表には仮想線分を付
与し、第4図(a)のクローズ形表にして処理する。
■ 線分の端点間隔が近く、かつ端点を結ぶ直線上の周
囲に、余白部が存在すれば、連続した線分とみなす。
■ 表や枠取りは始点“「″と終点LLJH1および対
となる始点゛「”あるいは終点Jljの最短距離を成す
もので構成され、この個数が、表や枠取りの包含関係を
示すとともに表、枠取りの存在個数を示す情報とする。
■ 表の桝目は交差始点“十″と交差終点at + u
とが最短距離を示すもので構成される。
文字領域検出部18では、転送された情報が罫線の場合
の罫線の情報、すなわち罫線の外接区形のアドレス情報
を基に、罫線の長手方向で分割された領域を抽出し、表
や枠取りの場合は、それらの内部領域と外部領域とに領
域を区分し、内部領域については、他の表や枠取りとの
包含関係と桝目領域を文書画像データのアドレス情報か
ら検出する。文字切出し部19では、罫線や表、枠取り
、桝目などで区分された領域ごとに黒画素の周辺分布を
求め、文字列を検出した後1個別文字の切出しを行なう
。なお、文字切出し部19の処理については、すでに報
告されているので、ここでは詳述しない。文字切出し部
19で切出された文字は出力端子20から出力される。
第5図に本発明の方法によって検出された表の具体例を
示す。第5図において、(a)は原文書、(b)は検出
された表、(C)は表の桝目内から検出した文字列、(
d)は文字列から文字パターンを検出した文字候補であ
る。
〔発明の効果〕
以上説明したように、ボ発明によれば、ランレングスの
情報から線分としての可能性があるものを線分の候補と
して検出し、それらを詳細に検査することによって、文
書内の線分構造を精度よく検出することができるから、
既存文書や新らたに作成された文書からの文字読取りが
可能となり、データベース作成等のデータ入力作成に対
し省力化が期待できる。
また1表の構造や線分の線幅等を知ることによって詳細
な線分構造を知ることができ、予め用意した線分構造内
の知識と整合をとれば、文書処理装置の文字認識精度を
高めることができる。
【図面の簡単な説明】
第1図は本発明の一実施例のブロック図、第2図は交点
形状の検出を説明する図、第3図は交点情報テーブルの
一例を−示す図、第4図は表形式を示す図、第5図は本
発明による構造認識の具体的処理結果を示す図である。 11・・・入力端子、 12・・・文書画像データメモリ、 13・・・連結成分抽出部、 14・・・文字の大きさ検出部、 15・・・ランレングス検出部、 16・・・線分検出部、 17・・・線分構造検出部。 18・・・文字領域検出部。 19・・・文字切出し部、 20・・・出力端子、17
1・・・線分構造検出、規則部。 ヤ 第2図 第0図 第4図 (^)(b) 手続補正書(方式) 昭和63年5月26日 1、事件の表示  昭和63年特許願第21743号2
、発明の名称  文書構造認識方法 3、補正をする者 事件との関係  出願人 住所  東京都千代田区内幸町1丁目1番6号名称  
(422)  日本電信電話株式会社代表者     
  真 藤    恒4、代理人 住所 〒151東京都渋谷区代々木2丁目38番12号
錦鶏ビル201号 5、補正命令の日付 昭和63年3月31日(全送日昭和63年4月26日)
8、補正の内容 第5図(a)〜(d)を別紙の通り再提出する。 9、添付書類の目録

Claims (1)

    【特許請求の範囲】
  1. (1)文書を走査して得られる白黒2値の文書画像デー
    タから文書のレイアウトを検出しつゝ、文書内の文字を
    認識する文書処理装置において、縦と横とに各ラインご
    とに文書画像データを走査して、方向別の黒画素のラン
    レングスを検出し、求められた方向別のランレングス値
    を予め求られた線分検出用閾値と比較して方向別の線分
    を検出する線分検出処理と、 縦方向と横方向との線分の相互の接続関係から線分の交
    点や端点の状態を検出するとゝもに、検出された交点や
    端点の形状や交点相互の距離の近さによって罫線や表、
    枠取りなどの領域を分離抽出する線分構造検出処理と、 検出された表や枠取りなどにより文書上から一つのまと
    まりを示す文字領域を検出する文字領域検出処理とを有
    することを特徴とする文書構造認識方法。
JP63021743A 1988-02-01 1988-02-01 文書構造認識方法 Pending JPH01196657A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63021743A JPH01196657A (ja) 1988-02-01 1988-02-01 文書構造認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63021743A JPH01196657A (ja) 1988-02-01 1988-02-01 文書構造認識方法

Publications (1)

Publication Number Publication Date
JPH01196657A true JPH01196657A (ja) 1989-08-08

Family

ID=12063554

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63021743A Pending JPH01196657A (ja) 1988-02-01 1988-02-01 文書構造認識方法

Country Status (1)

Country Link
JP (1) JPH01196657A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009070242A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 領域分割方法及び装置、並びにプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57211673A (en) * 1981-06-23 1982-12-25 Ricoh Co Ltd Character cutting method
JPS62290979A (ja) * 1986-06-10 1987-12-17 Canon Inc 枠線構成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57211673A (en) * 1981-06-23 1982-12-25 Ricoh Co Ltd Character cutting method
JPS62290979A (ja) * 1986-06-10 1987-12-17 Canon Inc 枠線構成装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009070242A (ja) * 2007-09-14 2009-04-02 Ricoh Co Ltd 領域分割方法及び装置、並びにプログラム

Similar Documents

Publication Publication Date Title
CN110050277A (zh) 用于将手写文本转换成数字墨水的方法和系统
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
Dori et al. Segmentation and recognition of dimensioning text from engineering drawings
JPH01196657A (ja) 文書構造認識方法
Saitoh et al. Document image segmentation and layout analysis
JP3095470B2 (ja) 文字認識装置
JPS6172374A (ja) 文字認識装置
JPH07160810A (ja) 文字認識装置
JP2024055628A (ja) 作業支援装置、作業支援方法および作業支援システム
JPH0822507A (ja) 文書認識装置
JPH0564396B2 (ja)
JPS62154079A (ja) 文字認識方式
JPH0545991B2 (ja)
JPH05274472A (ja) 画像認識装置
JP2918363B2 (ja) 文字分類方法及び文字認識装置
JPH0436432B2 (ja)
JPH0576673B2 (ja)
JPH04260980A (ja) 図形認識装置
JPS6019287A (ja) 文字認識方法
JPH06282682A (ja) 文字認識方法
JPS6057474A (ja) 特徴抽出方法
JPS6019285A (ja) ストロ−ク抽出方法
JPH11134434A (ja) 網がけ領域の抽出方法及び装置
JPS6278690A (ja) 文字認識装置
JPH05174114A (ja) 情報処理装置及びそれを用いた文字認識装置