JPS62274480A - 文字列領域抽出装置 - Google Patents

文字列領域抽出装置

Info

Publication number
JPS62274480A
JPS62274480A JP61119723A JP11972386A JPS62274480A JP S62274480 A JPS62274480 A JP S62274480A JP 61119723 A JP61119723 A JP 61119723A JP 11972386 A JP11972386 A JP 11972386A JP S62274480 A JPS62274480 A JP S62274480A
Authority
JP
Japan
Prior art keywords
character string
character
area
areas
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61119723A
Other languages
English (en)
Inventor
Mayumi Daikuya
大工谷 まゆみ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP61119723A priority Critical patent/JPS62274480A/ja
Publication of JPS62274480A publication Critical patent/JPS62274480A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 3、発明の詳細な説明 産業上の利用分野 本発明は、線図形と任意角方向の文字列が混在する図面
から、任意角方向の文字列領域を高速に抽出する文字列
領域抽出装置に関するものである。
従来の技術 従来、図形と文字が混在する図面中から水平及び垂直の
2方向の文字列領域を抽出する手法としては、矩形で抽
出された個々の文字領域を図面全体に渡って、水平ある
いは垂直方向にソートし、ソートした上記文字領域にお
いて隣接する文字領域の位置の差が閾値内である。連続
した文字領域を同一文字列に属するとみなして、文字列
領域を抽出する手法、あるいは、文字領域中の黒画素を
水平及び垂直の2方向に投影加算して周辺分布(ヒスト
ダラム)を得、上記周辺分布に表われる特徴量に注目し
て文字領域を抽出する手法がある。
第3図、第4図は、第1の従来例である。第3図におい
て水平方向の文字列領域の抽出方法を示す。まず文字領
域を垂直方向にソートする。次に個々の文字領域の垂直
方向の高さの情報から文字の高さを推定する。次に、前
記ソートした文字領域で、隣接する文字領域間の垂直方
向の距離を算出する。ここで同一文字列を構成する文字
領域のY座標の差は、前記文字の高さよシ隔たることは
ないという条件を用い、第4図のように水平方向の文字
列領域を抽出している。同様に、文字領域を水平(X軸
)方向にソートすることで、垂直方向の文字列領域を抽
出する。例えば「図表領域中の文字の認識」電子通信学
会技術研究報告84−50)。
第5図、第6図は第2の従来例である。まず、水平及び
垂直方向に文字領域中の黒画素を投影し周辺分布を得、
周期的に表われる文字ピッチ、文字列ピッチ等の特徴量
に注目して、文字列領域を抽出する(例えば、「周辺分
布を用いた手書き文字切り出しの検討」、昭和60年度
電子通信学会総合全国大会)。
発明が解決しようとする問題点 しかしながら上記2例の従来例では、任意角方向の文字
列抽出には適用されない。第7図に示すように、第1の
従来例では本来側々である文字列を誤って同一文字列と
して抽出してしまう。また第8図に示すように第2の従
来例では、周辺分布上に文字ピッチあるいは文字列ピッ
チの特徴が表われないために、任意角方向の文字列抽出
は出来ない。また、上記第2の従来例では、画素単位に
アクセスしなければならず、処理時間が増大するという
問題点がある。
本発明は、上記問題点に鑑み、図面を複数のブロックに
分割し、各ブロック別に文字領域の位置情報を登録する
ことによって、文字領域間の位置情報の検証回数を減少
させ、任意角方向の文字列領域を抽出できる文字列領域
抽出装置を提供するものである。
問題点を解決するための手段 上記問題点を解決するために本発明は、線図形と文字が
混在する図面を複数のブロックに分割し、抽出された文
字領域の情報を用いて各ブロックに属する前記文字領域
を登録する文字領域ブロック登録部と、各ブロック内で
近接する文字領域を統合し文字列領域候補を作成する文
字列領域候補作成部と、ブロック別に前記文字列領域候
補を登録する文字列領域候補ブロック登録部と、隣接す
るブロック内より近接する前記文字列領域候補を検出す
る近接文字列領域候補検出部と、検出した前記近接文字
列領域候補を構成する個々の文字領域間の位置関係を検
証し、前記文字列領域候補を統合し文字列領域を抽出す
る文字列領域抽出部という構成を備えたものである。
作用 本発明は上記構成により、文字領域ブロック登録部にお
いて、各ブロック内に属する文字領域の情報を得、文字
列領域候補作成部において、ブロック内の前記文字領域
の情報を用いることで、図面中の全ての文字領域にアク
セスすることなく高速に近接する任意角文字領域を検出
することが可能になり、前記近接する文字領域を統合し
て文字列領域候補を作成し、文字列領域候補ブロック登
録部において、作成された前記文字列領域候補をそれぞ
れが属するブロックに登録し、近接文字列領域候補検出
部において、隣接するブロック内の前記文字列領域候補
の位置関係の情報を用いることで、図面中の全ての文字
列領域候補にアクセスすることなく互いに近接する任意
角方向の文字列領域候補を検出することが可能になり、
文字列領域抽出部において、検出された前記近接する文
字列領域候補を構成する個々の文字領域の位置情報を詳
細に検証することによって、任意角方向の文字列領域を
抽出する。
実施例 以下本発明の一実施例について図面を参照しながら説明
する。第1図は本発明の一実施例における任意角方向の
文字列領域抽出装置のブロック図を示すものである。第
1図において、1は線図形と任意角方向に書かれた文字
が混在する図面全体をブロック分割し、抽出済みの文字
領域情報によって各ブロックに属する文字領域の情報を
登録する文字領域ブロック登録部、2はブロックの前記
文字領域の情報を用いて注目するブロック内で近接する
任意角方向の文字領域を統合し文字列領域候補を作成す
る文字列領域候補作成部、3は前記文字列領域候補が属
するブロックに前記文字列領域候補の情報を登録する文
字列領域候補ブロック登録部、4はブロックの前記文字
列領域候補の情報を用いて注目するブロックと隣接する
ブロック内の文字列領域候補の位置関係を検証すること
によって近接する任意角方向の文字列領域候補を検出す
る近接文字列領域候補検出部、5は検出され定前記近接
文字列領域候補について近接文字列領域候補を構成する
個々の文字領域の位置関係を検証し隣接ブロック間にわ
たる文字列領域候補を統合することにより、あらたな文
字列領域候補を抽出し、最終的に任意角方向の文字列領
域を抽出する文字列領域抽出部である。
第2図は本発明の一実施例における文字列領域抽出の処
理の流れを示すものである。第2図においてム〜Gは図
面中に実際に書かれた文字であ久龜〜gは前記文字に対
する文字領域であり、81〜B4はブロックであり、8
1〜S4は文字列領域候補および文字列領域である。
以下第1図および第2図を用いてその動作を説明する。
まず、文字領域ブロック登録部1では、文字領域a、b
、cの位置情報等をブロックB1に登録する。同様にブ
ロックB2には文字領域r。
gを、ブロックB4には文字領域d、eをそれぞれ登録
する。文字列領域候補作成部2では、ブロック81内の
文字領域a、b、c間の水平および垂直方向の距離を検
証したうえで、文字領域a。
b、cで構成される文字列領域候補S1を作成する。ブ
ロックB2.B4においても同様にして文字列領域候補
S2. S31作成する。文字例領域候補ブロック登録
部3では、文字列領域候補31゜82、S3′frそれ
ぞれブロックBi、B21 B4に登録する。
近接文字領域候補検出部4では、隣接するブロックB1
〜B4内の文字領域候補811g2.83の位置関係か
ら、互いの水平および垂直方向の距@を検証することで
、文字列領域候補S1とS3およびS2とS3が互いに
近接することを検出する0 文字列領域抽出部5では、まず一方の近接文字列領域候
補S1内の文字領域a、b、cと、他方の近接文字列領
域候補S3内の文字領域d、eとの間の水平および垂直
方向の距離を検証することによって、近接文字列領域候
補S1内の文字領域Cと近接文字列領域候補83内の文
字領域dが近接することを検出し、文字列領域候補S1
と83を統合して、文字列領域候補S4を作成する(た
だし本例では、文字列領域候補S4は最終的には文字列
領域S4になる)0 次に、統合し作成された前記文字列領域候補S4を構成
する文字領域a −eと、他方の近接文字列領域候補S
2を構成する文字領域r1gとの間の、水平および垂直
方向の個々の位置関係を検証することによって、一方の
近接文字列領域候補S4内の文字領域1〜θはそれぞれ
他方の近接文字列領域候補S2内の文字領域f’s g
のいずれとも近接していないと判定し、文字列領域候補
S4と文字列領域候補S2は統合せず、最終的に文字領
域S4およびS2を抽出する。
以上のように本実施例によれば、ブロックに登録された
情報を用いて、文字列領域候補作成、近接文字列領域候
補検出および文字列抽出の段階を経ることによって、隣
接しない離れたブロックの文字領域間において、文字領
域同士の位置関係の検証を避けることによって高速な処
理が可能となる。また、近接する文字列領域候補の間で
各文字領域についての位置関係を詳細に検証することに
よって、文字列領域候補を誤って統合することなく、最
終的に全ての近接文字列領域候補の検証が終了した段階
で、任意角方向の文字列領域を抽出することができる。
なお、第2図において例にあげた図面には文字のみしか
存在しないが、図面には線図形および文字領域が混在し
てもよい。その場合、線図形部分に対して、文字領域部
分は比較的短かい線要素がせまい領域に集中しているこ
とから領域切出しが可能で、結果的に第2図の原画に相
当する情報が得られる。
発明の効果 以上のように本発明においては、文字領域および文字列
領域候補のブロック登録、文字列領域候補作成、近接文
字列領域候補検出および文字列抽出という過程を経るこ
とで、任意角方向の文字列領域を高速に抽出することが
できる。
【図面の簡単な説明】
第1図は本発明の一実施例における文字列領域抽出装置
の全体構成を示すブロック図、第2図は同装置の文字列
領域抽出の流れを説明したパターン図、第3図は第1の
従来例の文字抽出装置における処理の流れを示すフロー
チャート図、第4図は同装置における結果を示すパター
ン図、第5図は第2の従来例の文字抽出装置の全体構成
を示すブロック図、第6図は同装置における結果を示す
パターン図、第7図は第1の従来例の問題点を示すパタ
ーン図、第8図は第2の従来例の問題点を示すパターン
図である。 1・・・・・・文字列領域ブロック登録部、2・・・・
・・文字列領域候補作成部、3・・・・・・文字列領域
候補ブロック登録部、4・・・・・・近接文字列領域候
補検出部、5・・・・・・文字列領域抽出部0 代理人の氏名 弁理士 中 尾 敏 男 ほか1名第1
図 文γ領域也報 文子Jll領域 第3図 第4図 第5図 第6図 第7図 第8図

Claims (1)

    【特許請求の範囲】
  1. 線図形と文字が混在する図面を複数のブロックに分割し
    、抽出された文字領域の情報を用いて、各ブロックに属
    する前記文字領域を登録する文字領域ブロック登録部と
    、各ブロック内で近接する文字領域を統合し文字列領域
    候補を作成する文字列領域候補作成部と、各ブロック別
    に前記文字列領域候補を登録する文字列領域候補ブロッ
    ク登録部と、隣接するブロック内より近接する前記文字
    列領域候補を検出する近接文字列領域候補検出部と、検
    出した前記近接文字列領域候補を構成する個々の文字領
    域間の位置関係を検証し、前記文字列領域候補を統合し
    文字列領域を抽出する文字列領域抽出部を具備し、任意
    角方向の文字列領域を高速に抽出することを特徴とする
    文字列領域抽出装置。
JP61119723A 1986-05-23 1986-05-23 文字列領域抽出装置 Pending JPS62274480A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61119723A JPS62274480A (ja) 1986-05-23 1986-05-23 文字列領域抽出装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61119723A JPS62274480A (ja) 1986-05-23 1986-05-23 文字列領域抽出装置

Publications (1)

Publication Number Publication Date
JPS62274480A true JPS62274480A (ja) 1987-11-28

Family

ID=14768525

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61119723A Pending JPS62274480A (ja) 1986-05-23 1986-05-23 文字列領域抽出装置

Country Status (1)

Country Link
JP (1) JPS62274480A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0214384A (ja) * 1988-07-01 1990-01-18 Nippon Telegr & Teleph Corp <Ntt> 文字・図形領域抽出方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0214384A (ja) * 1988-07-01 1990-01-18 Nippon Telegr & Teleph Corp <Ntt> 文字・図形領域抽出方法

Similar Documents

Publication Publication Date Title
US5668892A (en) Table recognition apparatus
US4813078A (en) Character recognition apparatus
US7106904B2 (en) Form identification method
CN110443295A (zh) 改进的图像匹配与误匹配剔除算法
CN105678737A (zh) 一种基于Radon变换的数字图像角点检测方法
CN114708186A (zh) 一种电子签章定位方法及装置
EP0062665A1 (en) Segmentation system and method for optical character scanning
JPS62274480A (ja) 文字列領域抽出装置
CN103235951A (zh) 一种矩阵式二维条码的初步定位方法
Hirayama A block segmentation method for document images with complicated column structures
Tang et al. Text line segmentation based on matched filtering and top-down grouping for handwritten documents
JPH07220081A (ja) 画像認識装置の図形の切出し方法
Elrajubi et al. Angle features extraction of handwritten signatures
JPH0244486A (ja) 文書画像処理方法
JPS63158669A (ja) 図面認識装置
JPH0418749B2 (ja)
JP2964594B2 (ja) マーク検査方法
JPS58161086A (ja) 図形認識装置
JPS603676B2 (ja) 交差点抽出方式
JPS63276671A (ja) 図面の認識方式
JPH0434794B2 (ja)
JP3009237B2 (ja) 特徴抽出方法
JPH0512438A (ja) ハフ変換による線分抽出方法
JPH01108691A (ja) キャラクタ画像処理方法
JPS60120479A (ja) 交差点屈折点抽出装置