JPS59788A - 文字領域と図形領域とを区別する図形処理方式 - Google Patents

文字領域と図形領域とを区別する図形処理方式

Info

Publication number
JPS59788A
JPS59788A JP57110966A JP11096682A JPS59788A JP S59788 A JPS59788 A JP S59788A JP 57110966 A JP57110966 A JP 57110966A JP 11096682 A JP11096682 A JP 11096682A JP S59788 A JPS59788 A JP S59788A
Authority
JP
Japan
Prior art keywords
character
section
region
total length
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP57110966A
Other languages
English (en)
Other versions
JPH0211946B2 (ja
Inventor
Kazunari Kubota
一成 久保田
Hiroki Arakawa
荒川 弘▲き▼
Osamu Iwaki
岩城 修
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57110966A priority Critical patent/JPS59788A/ja
Publication of JPS59788A publication Critical patent/JPS59788A/ja
Publication of JPH0211946B2 publication Critical patent/JPH0211946B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の属する分野の説明 本発明は図形処理方式、特に文字および図形を共に含む
図面9文書あるいは帳票等の画面領域を文字領域と図形
領域とに区別するための画像処理方式に関するものであ
る。
(2)従来の技術の説明 通信装置または情報処理装置に電気信号として入力され
る画像情報から文字領域と図形領域とを区別して9文字
認識9図形認識または伝送信号の帯域圧縮等を行う技術
が考えられている。このためには画像情報から文字領域
と図形領域とを正しく区別することが必要である。
従来、この種の方法としては1画像情報を記憶装置に蓄
積し1例えば黒連結成分の境界線追跡を行い、その黒連
結成分の幾何学的な大きさを測定しその値に従って文字
と図形を分離させる処理が知られているが、このよう力
方法は、蓄積された画像情報にアクセスすることによっ
て処理を行うようにしていたので9画像情報が膨大であ
ることから処理量が大きくカリ処理時間が長いあるいは
処理効率が悪いといった欠点があった。また入力画面全
体を蓄積することから大きなメモリ容量を必要とし装置
価格を高価にものにするといった欠点があった。
また文字領域と図形領域とを区別するために用いる特微
量には、従来9紙面の周辺分布、二次元フーリエスペク
トル成分等を用いた例があシいずれも文字の持つ矩形性
、連続性9反復性を利用した処理法であるが文字の大き
さが一定でない場合や文字のピッチが一定でないような
対象画像には適用することが困難であった。
(3)発明の目的 本発明は、ラインバッファを用いて逐次的に線図形を水
平成分と垂直成分とに変換させ、その水平・垂直成分を
用いて連結集合の長さの総延長を求めその総延長を文字
と図形とを区別する特微量に用いることを特徴とし、そ
の目的は1画像入力と並行して水平・垂直成分に変換す
る処理を行って処理効率を向上させ、さらに文字は一文
字ずつ独立して画像中に存在するという文字個有の特徴
を総延長という特微量で表現して区別を行うことにある
(4)発明の構成および作用の説明 第1図は本発明の実施例であって全体の構成図である。
図中、1は画像入力部、2は整形・コマンド化部、3は
連結集合形成部、4は総延長判別部、5は文字・図形領
域切シ出し部である。画像入力部1から整形・コマンド
化部2へは画像の入力と並行して走査線単位で画像情報
が送られる。
整形・コマンド化部2から連結集合形成部3へは水平成
分、垂直成分を表わすコマンド情報が送られる。連結集
合形成部3から総延長判別部4へは連結集合内の水平成
分と垂直成分との総延長情報が送られる。総延長判別部
4から文字図形領域切υ出し部5へは文字・図形位置情
報が送られる。
画像入力部1から文字図形領域切り出し部5には入力画
像全体の画像情報が送られる。
これを動作するには以下のようにおこなう。画像入力部
1では走査線単位で画像を入力し9画像を蓄積すると同
時に走査線単位の画像情報を整形・コマンド化部2に送
る。整形・コマンド化部2では入力された画像に含まれ
る線図形を水平及び垂直からなる図形に整形し、それと
同時に例えば(始点座標、終点座標)のような形の水平
、垂直成分を表すコマンドを生成する。整形化処理は少
なくとも3ラインのラインノ(ソファメモリと1ライン
分の補助メモリとを用いて行う。新たに1ラインの走査
線が入力されると整形コマンド化部のラインバッファメ
モリは新しい1ラインを付は加えて書き替えられ、ライ
ンバッファに含まれるデータと1ライン分の補助メモリ
に含まれるデータとを用いて処理を行々う。以下これを
繰り返すことによって1画面の入力が終了した時点では
最終の処理のみを残し、その後わずかな遅延で画像入力
終了直後に整形・コマンド化処理が終了する。
連結集合形成部3では整形コマンド化部2で得られた水
平成分と垂直成分とのコマンド情報から1組の水平成分
と垂直成分とが交点を持つかどうかを調べて、交点を持
つ場合には双方の成分に同一の連結集合番号を与え、以
下、全ての水平成分及び垂直成分を網羅するような順序
で、連結集合番号を与える処理を繰υ返すことにより連
結する水平成分と垂直成分とから々る連結集合を形成す
る。
続いて連結集合の大きさを表わす変数情報例えば連結集
合に含まれる総ての成分のストローク長の総和である総
延長情報を求め、あらかじめ与えられた閾値とを比較す
る。総延長が閾値よりも大きい場合は線図形部分である
と判断し、総延長が閾値よりも小さい場合は線図形部分
とは接触していがい文字部分であると判断し、その連結
集合に含まれる成分の位置情報から水平・垂直座標の最
大値及び最小値を求め、それを文字領域の位置情報とす
る。回路図面では一般に線図形部分を構成する図形要素
は配線等の線分たよって互いに接続している。一方文字
は図形部分とはなれて存在し。
−文字ずつ独立しているため、水平・垂直成分の総延長
も短い。回路図面等では図形部分の総延長と1文字部分
の総延長の差異は大きく、従って閾値の設定マージンも
広いため、安定な区別を行うことができる。文字図形領
域切シ出し部5では総延長判別部4から文字・図形位置
情報を得て、また画像入力部から一画面の入力画面情報
を得て。
文字位置情報に従って入力画面情報の中から文字領域だ
けを切り出す。文字領域を除いた画面は図形領域とする
このような構成となっているからその効果としては9文
字と図形の水平・垂直成分の総延長の差違により文字領
域と図形領域を区別することから閾値の設定マージンが
広く安定な区別が可能である。また3ライン程度のライ
ンバッファを用いて整形・コマンド化を行うため1画面
の入力終了後わずかな時間で整形・コマンド化が終了し
、処理時間を短縮できる。また、連結集合形成部3及び
総延長判別部4では、コマンド情報化された水平成分・
垂直成分を扱うため画面情報による処理に比べて大きく
処理を削減することができる。
第2図は本発明による処理結果例であって(α)(b)
(a) (d) (s) (1)の6枚の画面から成る
。(α)は入力画像例である。(6)は整形化画像であ
る。(1)は整形化画像中の文字である。(d)は整形
化画像中の図形である。
(1)は入力画像中の文字領域であわ、(f)は入力画
像中の図形領域である。
(α)は一般的な論理回路図面であって1図形部分は互
いに接続しておシ9文字部分は図形に接してイカい。(
b)は整形化画像であって整形・コマンド化部2から出
力された水平・垂直成分コマンドをもとに再構成された
画像である。(1)は連結集合のうち総延長が閾値上り
も短いものを表わした画像であシ、整形化画像中の文字
である。(d)は(1)とは反対に総延長が閾値よシ長
いものを表わした画像であり、整形化画像中の図形であ
る。(1)は総延長判別部4の文字・図形位置情報をも
とに文字・図形領域切シ出し部5で切シ出した文字領域
であり。
文字図形領域切り出し部5の出力である。(Aは(−)
と同様9文字・図形領域切り出し部5で切り出した図形
領域であシ、5の出力である。第2図からは1文字と図
形の水平・垂直成分の総延長の差違を用いて文字領域と
図形領域との区別が可能であることが解る。
(5)効果の説明 以上説明したように1本発明によれば文字と図形との水
平・垂直成分の総延長の差違によυ文字領域と図形領域
とを区別するようにしている。このために、論理回路図
面のよう力文字が図形に接触せず1図形を構成する線分
の総延長が長いような対象図面に対して文字領域と図形
領域を区別することができる。また処理時間を短縮でき
ることから大きい入力画面の処理の実現性を高めること
ができる。文字領域と図形領域とを区別することによシ
1文字領域は文字認識処理が可能となり。
図形領域では論理記号認識等の変換処理を行うことによ
多回路図面の計算機入力の自動化が可能になるという利
点がおる。
【図面の簡単な説明】
第1図は本発明の一実施例全体構成図、第2図は(α)
ないしく/)は本発明による処理の状態の一例を示す。 1・・・画像入力部、2・・・整形・コマンド化部。 3・・・連結集合形成部、4・・・総延長判別部、5・
・・文字・図形領域切り出し部。 (Q)                  (b)(
C)                  (d)千2
図 達2目

Claims (1)

    【特許請求の範囲】
  1. 走査型の画像入力装置から入力された走査線を逐次的に
    蓄積するラインバッファを備え、入力された線図形を水
    平、垂直な線分からなる図形に整形するようガ画像の変
    換装置をそなえた図形処理方式において、上記変換装置
    を用いて得られた水平成分と垂直成分とについて、その
    連結関係を調べて連結集合を構成させ、連結集合の全て
    の成分の長さの総延長とあらかじめ与えられた閾値とを
    比較して、その総延長が閾値よりも大きい場合を図形、
    小さい場合を文字と決定し、それぞれの領域の位置情報
    を得ることを特徴とする文字領域と図形領域とを区別す
    る図形処理方式。
JP57110966A 1982-06-28 1982-06-28 文字領域と図形領域とを区別する図形処理方式 Granted JPS59788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP57110966A JPS59788A (ja) 1982-06-28 1982-06-28 文字領域と図形領域とを区別する図形処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57110966A JPS59788A (ja) 1982-06-28 1982-06-28 文字領域と図形領域とを区別する図形処理方式

Publications (2)

Publication Number Publication Date
JPS59788A true JPS59788A (ja) 1984-01-05
JPH0211946B2 JPH0211946B2 (ja) 1990-03-16

Family

ID=14549017

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57110966A Granted JPS59788A (ja) 1982-06-28 1982-06-28 文字領域と図形領域とを区別する図形処理方式

Country Status (1)

Country Link
JP (1) JPS59788A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60181878A (ja) * 1984-02-29 1985-09-17 Toshiba Corp パタ−ン認識装置
JPS60204089A (ja) * 1984-03-28 1985-10-15 Hitachi Ltd 手書き文字・図形認識装置の認識モ−ド指定方式
JPS6255778A (ja) * 1985-09-05 1987-03-11 Mitsubishi Electric Corp 文章読取装置
JPS62196778A (ja) * 1986-02-25 1987-08-31 Oki Electric Ind Co Ltd 図形分離装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60181878A (ja) * 1984-02-29 1985-09-17 Toshiba Corp パタ−ン認識装置
JPS60204089A (ja) * 1984-03-28 1985-10-15 Hitachi Ltd 手書き文字・図形認識装置の認識モ−ド指定方式
JPS6255778A (ja) * 1985-09-05 1987-03-11 Mitsubishi Electric Corp 文章読取装置
JPS62196778A (ja) * 1986-02-25 1987-08-31 Oki Electric Ind Co Ltd 図形分離装置

Also Published As

Publication number Publication date
JPH0211946B2 (ja) 1990-03-16

Similar Documents

Publication Publication Date Title
Ascher et al. A means for achieving a high degree of compaction on scan-digitized printed text
US4969201A (en) Method of recognizing a circular arc segment for an image processing apparatus
US5222158A (en) Pattern recognition apparatus
JPH04104324A (ja) プログラム作成装置
US9275279B2 (en) Image processing apparatus and image processing method
JPH10143604A (ja) パタン抽出装置
CN111368695A (zh) 一种表格结构提取方法
CN112118449B (zh) 一种图像压缩与解压缩的方法及装置
JPS59788A (ja) 文字領域と図形領域とを区別する図形処理方式
JP2002099911A (ja) ラスタ像のベクトル化のコンピュータ自動化による方法
JP3342373B2 (ja) マーカー領域獲得方法及び装置、及び領域分割装置
JP3774494B2 (ja) データ記憶装置
JP3624013B2 (ja) 画像処理方法及び装置
JP2968284B2 (ja) 文字認識装置およびその文字領域分離方法
JP3378108B2 (ja) 二値イメージ出力装置
JPH0564396B2 (ja)
US20040066971A1 (en) Picture image processing method, processing apparatus and recording medium
JPH05159062A (ja) 文書認識装置
KR100334624B1 (ko) 클러스터링기반문서영상분할방법
CN117407455A (zh) 素材渲染处理方法、装置、电子设备及存储介质
JP3031565B2 (ja) 表領域判定方法
CN113808225A (zh) 一种图像的无损编码方法
JPH0245229B2 (ja)
JPH01268350A (ja) 符号化装置
JPS642315B2 (ja)