JPS6172374A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS6172374A
JPS6172374A JP59192665A JP19266584A JPS6172374A JP S6172374 A JPS6172374 A JP S6172374A JP 59192665 A JP59192665 A JP 59192665A JP 19266584 A JP19266584 A JP 19266584A JP S6172374 A JPS6172374 A JP S6172374A
Authority
JP
Japan
Prior art keywords
character
characters
character string
vertical
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59192665A
Other languages
English (en)
Inventor
Naruyoshi Shimotsuji
下辻 成佳
Takashi Tsunekawa
尚 恒川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP59192665A priority Critical patent/JPS6172374A/ja
Publication of JPS6172374A publication Critical patent/JPS6172374A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の技術分野〕 この発明は、文字読取装置に関し、特に図面等に書かれ
る文字の位置が設定されておらず、文字の方向も横方向
、縦方向の両方向の文字が混在する図面から文字を読取
る文字読取方式に関するものである。
〔発明の技術的背景とその問題点〕
従来の文字読取装置では、書かれた文字の位置が規定さ
れ文字の方向も一定のものにしか適用できない。これに
対し図面等に書かれた文字を認識する装置においては、
位置の任意性、横方向、縦方向の文字の混在という問題
があり図面中のどの部分が1つの文字をあられし、その
方向が横又は縦かを決定するには、認識しようとする文
字に注目するのみでは不可能な事さえある。たとえば、
「11」などはその典型的な例であって、これを縦方向
の文字として認識すれば「11」と2文字として認識さ
れるが、横方向の文字として認識すれば「二」と認識さ
れる。すなわち、従来提案されている文字認識方式を利
用するのみでは、図面等に書かれた文字を正確に認識す
ることは困難である。
〔発明の目的〕
この発明は、図面より抽出される文字相互の位置関係を
利用することにより、文字を正確に認識する方式を提案
することを目的とする。
〔発明の概要〕
設計図面等においては、文書中の文字のように一方向の
みではなく、縦横両方向の文字が混在する。これらの文
字を認識する際、各文字のみに注目して認識を行うと、
縦、横どの方向の文字か不明であるため、縦横両方向の
認識用辞書をもったとしても、その認識率の低下はまぬ
がれない。そこで、この発明では、図面中より文字列(
単語)を検出することにより各文字の方向を決定し、こ
の情報を認識に用いることにより、各文字のコードを求
める。
〔発明の効果〕
Δ   この発明により図面等の文字を書く位置、及び
方向が規定されていない画像においても正確に文字を認
識することが可能となる。
〔発明の実施例〕
第1図は、この発明の一実施例を示すプロ、り図である
。まず、入力装置12において図面11を2値の二次元
・ぐターンとしてメモリへ入力する。
次に連結領域抽出部13においてこの入力された2値画
像データの中から連結領域を抽出する。文字は一般に、
ある閾値以下の大きさをもつ連結領域より構成されるの
で、文字抽出部14において入力画像データより求めた
連結領域のうち、この外接長方形が閾値以下の領域を文
字領域として抽出する。この抽出された領域の画像・ぐ
ターンを文字認識部15へ送シ形状の認別を行う。この
形状の認別に際しては、この文字が縦書きと仮定した場
合と、横書きと仮定した場合の二通りについて認識処理
を行う。これらの処理の結果を文字列抽出部16におい
て、第4図のようなテーブルの形で記述する。すなわち
文字認識部15で記載される各文字に対するデータは、
文字の画像・ぐターンの外接長方形の位置(X軸方向の
最大座原値Xrrlax1最小座標値Xrnin、y軸
方向の最大座漂値Ymax1最小座標値Ymin ) 
、縦方向と仮定した際の認識結果(文字コード)CRL
とその確がらしさ、FRL ”l横方向と仮定した際の
認識結果(文字コード)CUDとその確からしさFUD
の8データである。
ここで、文字領域に外接する長方形、すなわち、外接長
方形について説明すると、第2図(、)のように1その
位置をXm、n、Xm、x、Ymln、Ymaxで表わ
すことかできる。
文字抽出部16においては、文字列を構成する文字の大
きさはほぼ一定であシ、互いの文字間隔の距離は小さく
、文字列方向と推定される方向の文字のずれも小さいと
いう性質を利用して文字列抽出を行う。
いま、第2図(b)に基づいて文字c1とC2について
考えてみると、第2図(b)から明らかなようにCとC
2のX方向の間隙は、 mtn(lx、、−x2□l ’ 1x21−x、□l
 )で表わすことができ、また同様にしてclとC2の
X方向のずれ(底部、頂部、中心部)の一番車さいとこ
ろの間隙は、 ”n(ly、 I ”−Y;N I ’ IY22””
’+21’ 2 + (YN+Y42”21+Y22]
 )で表わすことができる。
そこで、文字C1と文字C2の距fiaを次のような形
で定義する。
d=dis(P+ 、 P2. P31 P4)ただし
、文字C1と文字C2が横方向の文字列を構成すると仮
定した場合、 文字C〜と文字C2が縦方向の文字列を構成すると仮定
した場合 ここでX11:文字C8の外接長方形の最小X座漂値X
i2:文字C1の外接長方形の最大X座漂直Yil:文
字Ciの外接長方形の最小Y座標値Y12:文字C,の
外接長方形の最大Y座標値F1UD:文字C1を縦方向
の文字と仮定した際の認識結果の確からしさ ”Hu、’文字Ciを横方向の文字と仮定した際の認識
結果の確からしさ また、ここで文字C1と02の位置関係を表わすdls
 (P + l P2 r P3 r P4 )はノク
ラメータP1〜P4にばよい。
一例を第3図に示す。第3図ではP1〜P4を1〜5に
量子化し、disを dls (dlsl(7、p2) l dts2(P3
 r P4 ) )の形で表現したものである。
これにより、たとえば図面の仕様がかわり、文字列を構
成する文字間隔等の値が変更になったとしても第3図の
テーブルdisを変更するだけで対応できる。
文字列抽出に際しては、各文字間の距離を求め比較する
必要がある。今、ある文字に対して、最小の距離にちる
文字を求める操作をすべての文字について単純に行うと
、全体の文字数がnだと仮定すればn(n−1)/2回
、文字間の距離計算を要する。しかし、もともとある程
度以上はなれた文字に対しては明らかに文字列を構成す
る事はない。
したがって、まず、注目している文字の近傍にある文字
を抽出し、これらの文字間で距離を計算し、文字列を求
める。
文字列を構成する文字は、文字テーブル(第4図)間の
表で表現し、各文字列が持つ情報については、第5図の
ようなテーブルの形で記載する。
文字列が持つ情報とは、この実施例においては、文字列
を構成する文字数、文字列の外接長方形の座像、文字列
の方向(縦/横)、先頭文字(縦方向の文字ならば、最
上に位置する文字、横方向ならば最左の文字)の文字テ
ーブル(第4図)への2インクである。なお、第4図の
PU + Pl、 + PRrPLはそれぞれ特定の文
字に対する文字列のつながシを表わすポインタである。
この実施例での文字列処理は、3つの処理からなる。1
つは、すべての文字を縦方向と仮定し、縦方向の文字列
を求める処理、第2は、すべての文字を横方向と仮定し
横方向の文字列を求める処理、第3は、1つの文字が先
の処理で縦、横双方の文字列・の構成要素と判定された
際に、どちらの方向か、一方に決定する処理である。
第1.第2の処理では、各文字に対し注目する文字(C
1とする)がどの文字列にも属していない場合には、こ
の文字の近傍領域に位置する文字(この文字セットを特
とする請求め、今注目している文字との距離を求め、最
も近い左右又は、上下の文字C2を求める。次に、この
求めた文字C2に対し、左右又は上下に位置する文字を
Sから求める。この処理をくり返し文字列を構成する文
字を検出する。ここで文字が求まらない場合には、新し
くどの文字列にも属していない文字を求め、上記処理を
行い順次文字列を求める。第3の処理は、1つの文字が
、先の1,2の処理で縦、横双方の文字列と解釈された
文字に対し、どちらの方向の文字かを決定する処理であ
る。ここでは、左右、上下の隣接する文字との距離: 
(IL+ dR+ dU+dDに対し、dL+dR2d
U+doの小さい方の方向を選択する。
以上の文字列抽出処理を行った結果、第1図に示す総合
判定部17において、縦方向の文字列を構成する文字と
判定された文字に対しては、縦方向の認識結果を、同様
に、横方向と判定された文字に対しては、横方向の認識
結へ理して各々の文字の総括的認識結果とし、第1図の
コード部18で文字コードを求めることになる。
〔発明の他の実施例〕
この実施例では、1連結領域1文字として処理が行なわ
れるが、文字列抽出処理で、各文字列の巾を推定し、こ
の第3処理で、この中白にある縦横双方の文字列を構成
する文字は、1文字がいくつかの連結領域から構成され
ると判定することにより、分離文字の認識も可能となる
また、前記池の実施例では、文字認識舶来を全ての文字
列抽出で利用しているが、まず、文字列抽出を各文字の
位置情報のみから文字列を抽出し、縦、横の文字が近接
している部分にのみ、縦横双方の文字認識を行い、その
結果と、文字の位置とにより、文字列を抽出し、この結
果を利用して、文字の方向をきめることも可能である。
さら顛また、縦、横方向以外の線にそってかかれた文字
に対しても、その線分方向の文字列を抽出することによ
り、開織可能である。すなわち、文字の近傍に線が存在
するならば、その方向を求め、その方向に、その文字を
含む文字列が存在するか否かを判別し、文字列が存在す
る際は、その各文字を線分方向の角度だけ回転し縦又は
横書きの文字に変換した後、文字認識部へわたすことに
より認識可能となる。
【図面の簡単な説明】
第1図はこの発明の一実施例の文字認識の流れイ  を
示すブロック図、第2図(a) 、 (b)はこの発明
の一実施例における文字の位置を表わす説明図、第3図
はこの発明の一実施例に用いる各文字間の距離を定義す
る表、第4図はこの発明の一実施例で用いる文字に関す
る情報を表わす表、第5図はこの発明の一実施例で用い
る文字列に関する情報を表わす表である。 11・・・図面、     15・・・文字認識部、1
2・・・入力装置、   16・・・文字列抽出部、1
3・・・連結領域抽出部、 14・・・文字抽出部、  17・・・総合判定部、1
8・・・文字コード部。 代理人  弁理士 1)北 嵩 晴 第1図 第2図 OXptjパ   1sax            
’        Xn    Xl、A2’    
”第3図 第4図 第5図

Claims (1)

    【特許請求の範囲】
  1. 記入位置及び方向が規定されていない文字が記載されて
    いる図面等をメモリに画像として入力する手段と、この
    入力された画像より文字を抽出し、その相互の位置関係
    、大きさ等の情報を出力する手段と、抽出された文字に
    ついて、各文字が縦書きとした場合及び横書きとした場
    合の各方向について認識した文字コードとその確からし
    さを出力する手段と、これらの文字の位置関係、大きさ
    の情報及び前記認識結果を用いて文字の並びを求める手
    段と、この求められた文字の並びより文字の方向を決定
    し、総括認識判定の処理をし、文字のコードを求める手
    段とを具備することを特徴とする文字認識装置。
JP59192665A 1984-09-17 1984-09-17 文字認識装置 Pending JPS6172374A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59192665A JPS6172374A (ja) 1984-09-17 1984-09-17 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59192665A JPS6172374A (ja) 1984-09-17 1984-09-17 文字認識装置

Publications (1)

Publication Number Publication Date
JPS6172374A true JPS6172374A (ja) 1986-04-14

Family

ID=16295005

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59192665A Pending JPS6172374A (ja) 1984-09-17 1984-09-17 文字認識装置

Country Status (1)

Country Link
JP (1) JPS6172374A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6331470U (ja) * 1986-08-19 1988-03-01
JPS63173188A (ja) * 1987-01-13 1988-07-16 Fujitsu Ltd 文字処理方式
JPS63204486A (ja) * 1987-02-20 1988-08-24 Mitsubishi Electric Corp 文字入力装置
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JPH01175084A (ja) * 1987-12-29 1989-07-11 Fujitsu Ltd 孤立領域間隔抽出方式

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55127678A (en) * 1979-03-22 1980-10-02 Nec Corp Character array direction detector

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS55127678A (en) * 1979-03-22 1980-10-02 Nec Corp Character array direction detector

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6331470U (ja) * 1986-08-19 1988-03-01
JPS63173188A (ja) * 1987-01-13 1988-07-16 Fujitsu Ltd 文字処理方式
JPS63204486A (ja) * 1987-02-20 1988-08-24 Mitsubishi Electric Corp 文字入力装置
JPH0420506B2 (ja) * 1987-02-20 1992-04-03 Mitsubishi Electric Corp
JPS63268081A (ja) * 1987-04-17 1988-11-04 インタ−ナショナル・ビジネス・マシ−ンズ・コ−ポレ−ション 文書の文字を認識する方法及び装置
JPH01175084A (ja) * 1987-12-29 1989-07-11 Fujitsu Ltd 孤立領域間隔抽出方式

Similar Documents

Publication Publication Date Title
TWI536277B (zh) Form identification method and device
CN110050277A (zh) 用于将手写文本转换成数字墨水的方法和系统
JP2933801B2 (ja) 文字の切り出し方法及びその装置
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
JP4443576B2 (ja) パターン分離抽出プログラム、パターン分離抽出装置及びパターン分離抽出方法
JP2002324236A (ja) 帳票識別方法及び帳票登録方法
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
CN112364834A (zh) 一种基于深度学习和图像处理的表格识别的还原方法
CN105590112B (zh) 一种图像识别中倾斜文字判断方法
JPS6172374A (ja) 文字認識装置
CN116259062A (zh) 基于多通道及注意力机制的cnn笔迹鉴别方法
CN115965987A (zh) 基于异构架构的表格文字结构化识别方法
JP2009223612A (ja) 画像認識装置及びプログラム
JPH07182459A (ja) 表構造抽出装置
JPH0573718A (ja) 領域属性識別方式
JP3329528B2 (ja) ドキュメント読取り装置
JP2004046528A (ja) 文書方向推定方法および文書方向推定プログラム
JPH1021332A (ja) 非線形正規化方法
JP3088088B2 (ja) 図面記号認識方法
JPH05108882A (ja) 文字認識装置
JPH0776980B2 (ja) 文字認識方法
JPH0586585B2 (ja)
JPH11250256A (ja) 図形認識処理方法及びそのプログラムを記録した記録媒体
CN115294096A (zh) 基于cnn多尺度特征提取和分层融合的图像篡改检测方法
Onuma et al. An on-line handwritten Japanese text recognition system free from line direction and character orientation constraints