JPS6165378A - 文字図形認識方法及び装置 - Google Patents

文字図形認識方法及び装置

Info

Publication number
JPS6165378A
JPS6165378A JP59185398A JP18539884A JPS6165378A JP S6165378 A JPS6165378 A JP S6165378A JP 59185398 A JP59185398 A JP 59185398A JP 18539884 A JP18539884 A JP 18539884A JP S6165378 A JPS6165378 A JP S6165378A
Authority
JP
Japan
Prior art keywords
character
recognition
image data
factors
predetermined
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP59185398A
Other languages
English (en)
Other versions
JPH0434794B2 (ja
Inventor
Atsushi Yugawa
敦司 湯川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59185398A priority Critical patent/JPS6165378A/ja
Publication of JPS6165378A publication Critical patent/JPS6165378A/ja
Publication of JPH0434794B2 publication Critical patent/JPH0434794B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 本発明は電子計算機による文字1図形認識方法及び装置
に関する。
〔発明の技術的背景とその問題点〕
現在、文字2図形等を電子計算機で認識処理する場合、
その入力画面はある決められた桝目の中に書かれたパタ
ーンのみが対象である。従って、同とHは、既に桝目の
中にかかれた線の本数によって結果が判別できる。しか
し一般の図面中に任意に書かれた文字9図形等は、位置
が定まらないためにNとHは他の情報がない限り区別す
るのが困難である。すなわち、Nは「刊が2本並んでい
るだけかもしれない。現在アルファベットの中にもある
複数の要素で構成される文字(例えば[刊とrOJが各
々1要素でそれらの要素が集まって「0」になる文字等
)を認識する手法は一部の大学で研究されている程度で
まだ実用化の城に達していない。従来の技術でこれを実
現しようとすると位置関係の多様性、記憶容量、処理速
度の面から認識コストが高くなる。すなわちゆ」を認識
するのみでも既存の文字図形認識装置を機能アップしな
いと実現できない。また、文字の抽出を文字列として抽
出して、その情報を利用して各要素の統合をするのは、
前記方法よりまた一段と認識コストが高くなるという問
題がある。
〔発明の目的〕
本発明は上記問題点に鑑みてなされたもので、図面中の
任意の位置に書かれた多要素から構成されている文字9
図形(以下、分離図形9文字と記す)を、既存の文字図
形認識装置を利用して、低コストで認識可能な文字図形
認識方法及び装置を提供することを目的とする。
〔発明の概要〕
一般に分離図形1文字等を分析すると、それらは極めて
簡単な既存の図形2文字等の要素によって構成されてい
る。これらの要素は、その要素毎に抽出され、認識され
る。
本発明ではその認識結果の要素からその要素1つだけで
文字9図形となる要素(例f&J 、 rBJ 、 r
cjetc )と、他の要素と組み合わせて異なる文字
図形となる要素(例「刊+ rlJ + roJ et
c )を区別する。
そして、その後者に対しては認識結果と、組合せ要素の
位置関係を検知して認識する。
すなわち、本発明は、文字図形の画像を二値化し九画偉
データとして入力し、この画像データを予め画像パター
ンを記憶した辞書と照合して所定の文字図形を判定する
文字図形認識方法において、前記画像データの任意の位
置の所定の小領域内の孤立した文字図形の第1の要素を
位置情報を付加して抽出し、前記第1の要素を既存の文
字図形認識手段により認識し、その認識された第1の要
素の中から予め定められた所定の要素(例えば「刊。
Ill 、 rOJ 、・・・等)の組合せで別の分離
文字図形と成る第2の要素を選択し、前記第2の要素と
して選択されなかった前記第1の要素は前記認識を最終
認識として出力し、選択された前記第2の要素はそれら
の位置関係が検出され前記所定の要素の位置関係を予め
記憶した分離文字図形認識辞書と照合して最終認識とし
て出力し、図面中の任意の位置の多要素で構成された文
字図形を高速で認識で〔発明の実施例〕 本発明の文字図形認識方法及び装置を実施例を用いて以
下に説明する。第3図は本発明のハードウェアの主要構
成を示す一実施例である。同図において、11はCCD
スキャナー等の図面(画像データ)入力部、12は二値
化された画像データを記憶する画像用メモリ、13はA
MD2903等の画像処理プロセッサ、14は任意画面
の切出しを制御するアドレスコントロールハードウェア
、15ハ共有メモリ、16は既存の文字図形認識装置、
17は分離図形文字認識装置で本発明の特徴部をなす部
分である。
第1図は本発明の機能構成を示すブロック図で、画像デ
ータ入力手段21は入力画像を図面入力部11ドアトレ
スコント四−ルハードウェア14により二値化した画像
データに変換するもので、例えばA3サイズの図面の入
力画像を約8百万(2000X4000)画素の二値化
した画像データに変換する。これらの画像データは画像
メモリ2等の画像データ記憶手段22に蓄えられる。入
力画像は文字1図形に限らず線分、その他の要素が含ま
れており、その中から文字2図形の候補となる孤立図形
の画像データを画像処理プロセッサエ3及びコントロー
ルハードウェア14による小領域連結画像データ抽出手
段23により抽出する。これは入力画像の任意の位置の
所定の小領域内で孤立して他の図形と連結していない文
字9図形の画像データを抽出する。すなわち、第4図の
ような入力画像の場合、■〜■に示す小規模孤立図形の
画像データを要素としで抽出し、■に示した線分は抽出
しない。また、このとき同時に各要素の位置情報が付加
して抽出される。抽出された各要素は既存の文字図形認
識手段24により認識される。その認識された要素の中
から分離図形・文字選択手段25によりあらかじめ定め
られた複数の要素(例えばr−J 、 rlJ 、 r
OJ等)の組合せで新たな1つの図形・文字となる分離
図形文字の要素を判別する。分離図形・文字の要素とし
て判別されなかったものは、文字認識手段24で認識さ
れた文字として認識結果出力手段28へ送出される。ま
だ、分離図形・文字の要素として判別されたものは位置
関係検出手段26によりそれぞれの要素に付加されてい
る位置情報から2次元的位置関係を検出する。例えばa
HBhらば匝」の要素の上にHの要素がある。または「
刊の要素の下にゆ」の要素がある。′と云う位置関係を
検出しその情報をそれぞれの要素に付加する。その後、
分離図形・文字認識辞1.照合手段27により分離図形
・文字の認識が行われる。ここで辞書とは複数の要素の
組合せで図形・文字となるものの組合せパターンとその
図形・文字との対応表である。すなわち、同じ喝」でも
「−」が左寄りのもの(rOJ)と右寄りのもの(ro
b)等、伺種類かの可能性が存在するので、このような
場合は単にIN印」の上にHがある”と云うパターン部
を照合の対象とし口と認識する。このようにして複数の
要素の組合せとして1つの新しい図形・文字が認識され
新図形・文字データを生成して認識結果出力手段あへ送
出される。また、分離図形・文字認識辞書照合手段27
で新しい図形・文字として認識されなかった要素は各々
文字データの認識結果として認識結果出力手段路へ送出
される。
以下、分離図形・文字認識の方法について具体例を用い
て説明する。入力画像として第5図(a)に示す■〜■
の画像があるとすると、分離図形・文字選択手段25に
は各要素データとして第1表に示すようにアスキーコー
ド等による認識結果と位置情報が入力される。この位置
情報は各画像のX、Y軸lこ添った外接四角形(ウィン
ド)の対角点(xL。
YL) l (X、 、YH)の給体座標が付加されて
いる。この位置情報はウィンドサイズと呼ばれる。
第1表 分離図形・文字選択手段25には複数の要素の組合せで
1つの図形・文字となる分離図形・文字の要素(例えば
0.−.1等)を判別する機能を有し、位置関係検出手
段26、分離図形・文字認識辞書照合手段27を介して
第2表に示すように入力画像■。
■は単独要素で認識し、入力画像■■■は3つの要素の
組合せで1つの文字と認識する。
第  2  表 (但し、iは3+4−5のいずれが1つ)入力画像が分
離図形・文字と判断されたとき、その要素を単独で認識
するか複数の要素の組合せで認識すべきかの判断は第2
図1こ示す手順によって行なう。先づ、手順31により
入力された要素のウィンドの周囲を所定の値△だけ拡大
する。次1こ手順321こよりウィンドの重なるものと
重ならないものを区別し、手順33によりウィンドの重
ならないものはその要素単独と判断して最終認識とする
(以下余白) 第  3  表 ウィンドの重なった要素は手順34により全て抽出して
それぞれの要素のウィンドの中心座標を求め、手順35
により各要素を縦・横の方向に並べかえ、手順36によ
り縦・横1こ並びが見られた各要素の中心座標の並びパ
ターンと辞書とを照合して新たlこ1つの図形・文字を
認識する。第5図中)1こ示したウィンド41〜45は
手順31により拡大されたウィンドの様子を示したもの
で、ウィンド41.42Lt他のいずれのウィンドにも
重ならないので単独要素でrOj 、 Illと認識さ
れる。ウィンド43.44.45はすべて重なっている
のでそれらの要素の縦・横の並びパターンが辞書と照合
されて闇と認識される。
第  4  表 なお、上記照合は縦・横のいずれが一方のみにしてもよ
い。
本発明は文字認識と文字列認識の間fこ挿入された部分
にあり、ある程度文字列を意識した文字認識を行ってい
る。
また、既存の文字図形認識装置、ハードウェア等を利用
して、必要に応じて分離文字図形の認識を行うようにす
ることができ、独立性の良い文字図形認識装置の構成と
することができる。
[発明の効果〕 本発明1こよれば図面等の任意の位置の多要素で構成さ
れた文字図形を高速で認識することが可能となり、必要
に応じて既存の文字図形認識装置1こ分離文字図形認識
手段を付加することが可能なので独立性の良い認識シス
テムを構築することが可能となり、認識コストの安価な
文字図形認識方法及び装置を提供することができる。
【図面の簡単な説明】
第1図は本発明の図形文字認識装置の機能ブロック構成
図、第2図は本発明の詳細な説明するA・二めの流れ図
、第3図は本発明のハードウェアの−・実施例を示した
主要構成図、第4図は小規模孤立図形の抽出を説明する
ための入力画像の一例を示した図、第5図は本発明によ
る分離図形文字認識装置の判断機能を説明するだめの入
力画像とそのウィンドサイズの一例を示した図である。 11・・・図面入力部   12・・・画像用メモリ1
3・・・画像処理プロセッサ 14・・・コントロール
ハードウェア15・・・共有メモリ 16・・・既存の文字図形認識装置 17・・・分離図形文字認識装置 21・・・画像データ入力手段 22・・・画像データ記憶手段 :、、、23・・・小領域連結画像データ抽出手段24
・・・文字認識手段 25・・・分離図形文字認識手段 26・・・位置関係検出手段 27・・・分離図形文字認識辞書照合手段あ・・・認識
結果出力手段 (7317)  代理人弁理士 則 近 憲 佑 (は
が1名)第1図 第2図 第3図 第4図 第5図 tcL)

Claims (2)

    【特許請求の範囲】
  1. (1)文字図形の画像を二値化した画像データとして入
    力し、この画像データを予め画像パターンを記憶した辞
    書と照合して所定の文字図形を判定する文字図形認識方
    法において、前記画像データの任意の位置の所定の小領
    域内の弧立した文字図形の第1の要素を位置情報を付加
    して抽出し、前記第1の要素を既存の文字図形認識手段
    により認識し、その認識された第1の要素の中から予め
    定められた所定の要素(例えば「−」、「1」、[0」
    、…等)の組合せで別の分離文字図形と成る第2の要素
    を選択し、前記第2の要素として選択されなかった前記
    第1の要素は前記認識を最終認識として出力し、選択さ
    れた前記第2の要素はそれらの位置関係が検出され前記
    所定の要素の位置関係を予め記憶した分離文字図形認識
    辞書と照合して最終認識として出力することを特徴とし
    た文字図形認識方法。
  2. (2)文字図形の画像を二値化した画像データとして入
    力する画像データ入力手段と、この画像データを予め画
    像パターンを記憶した辞書と照合して所定の文字図形を
    判定する文字図形認識手段を備えた装置において、前記
    画像データの任意の位置の所定の小領域内の孤立した文
    字図形の第1の要素を位置情報を付加して抽出する小領
    域連結画像データ抽出手段と、前記第1の要素を認識す
    る既存の文字図形認識手段と、その認識された第1の要
    素の中から予め定められた所定の要素(例えば「−」、
    「1」、「0」、…等)の組合せで別の分離文字図形と
    成る第2の要素を選択する分離文字図形選択手段と、前
    記第2の要素として選択された前記第1の要素の位置関
    係を検出する位置関係検出手段と、前記位置関係を前記
    所定の要素の位置関係を予め記憶した分離文字図形認識
    辞書と照合して最終認識として出力する分離文字図形認
    識辞書照合手段を備えたことを特徴とした文字図形認識
    装置。
JP59185398A 1984-09-06 1984-09-06 文字図形認識方法及び装置 Granted JPS6165378A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59185398A JPS6165378A (ja) 1984-09-06 1984-09-06 文字図形認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59185398A JPS6165378A (ja) 1984-09-06 1984-09-06 文字図形認識方法及び装置

Publications (2)

Publication Number Publication Date
JPS6165378A true JPS6165378A (ja) 1986-04-03
JPH0434794B2 JPH0434794B2 (ja) 1992-06-09

Family

ID=16170099

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59185398A Granted JPS6165378A (ja) 1984-09-06 1984-09-06 文字図形認識方法及び装置

Country Status (1)

Country Link
JP (1) JPS6165378A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01320171A (ja) * 1988-05-30 1989-12-26 Ind Technol Res Inst 枠字処理方法
JPH03291781A (ja) * 1990-04-09 1991-12-20 Glory Ltd 文字認識装置
JP2009169911A (ja) * 2008-01-21 2009-07-30 Sharp Corp 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01320171A (ja) * 1988-05-30 1989-12-26 Ind Technol Res Inst 枠字処理方法
JPH03291781A (ja) * 1990-04-09 1991-12-20 Glory Ltd 文字認識装置
JP2009169911A (ja) * 2008-01-21 2009-07-30 Sharp Corp 文字認識装置、文字認識方法、文字認識プログラムおよびコンピュータ読取り可能な記録媒体

Also Published As

Publication number Publication date
JPH0434794B2 (ja) 1992-06-09

Similar Documents

Publication Publication Date Title
US5799115A (en) Image filing apparatus and method
US4531231A (en) Method for distinguishing between complex character sets
JP2007148677A (ja) 画像処理装置、画像処理方法
JP7297910B2 (ja) 文字認識装置及び文字認識装置による文字認識方法
US4769849A (en) Method and apparatus for separating overlapping patterns
KR102102394B1 (ko) 문자 인식을 위한 영상 전처리 장치 및 방법
KR102542174B1 (ko) 디지털 참고서 제공 시스템 및 그 방법
JPS6165378A (ja) 文字図形認識方法及び装置
JP6310155B2 (ja) 文字認識装置、文字認識方法及び文字認識プログラム
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JP3792759B2 (ja) 文字認識方法とその装置
JPH0247788B2 (ja)
KR102673900B1 (ko) 표 데이터 추출 시스템 및 그 방법
WO2023029116A1 (zh) 文本图像的排版方法、装置、电子设备及存储介质
JPH0449148B2 (ja)
JPH07160810A (ja) 文字認識装置
JP3541093B2 (ja) 文書画像の傾き検出方法および装置
JPH0586585B2 (ja)
JPH053631B2 (ja)
JP3903540B2 (ja) 画像抽出方法及び装置並びに画像抽出プログラムが記録された記録媒体、情報入出力/選択方法及び装置並びに情報入出力/選択処理プログラムが記録された記録媒体
JPH07168911A (ja) 文書認識装置
JPH0833924B2 (ja) 図面読取方法
JP2001126030A (ja) パターン認識方法及びパターン認識装置
JPH0628520A (ja) 文字認識装置
JPH03219384A (ja) 文字認識装置