JPS59200382A - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JPS59200382A
JPS59200382A JP58074656A JP7465683A JPS59200382A JP S59200382 A JPS59200382 A JP S59200382A JP 58074656 A JP58074656 A JP 58074656A JP 7465683 A JP7465683 A JP 7465683A JP S59200382 A JPS59200382 A JP S59200382A
Authority
JP
Japan
Prior art keywords
feature
character
circuit
interpolation
features
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58074656A
Other languages
English (en)
Inventor
Shunkichi Tada
多田 俊吉
Takahiko Kawatani
隆彦 川谷
Toshio Tsutsumida
敏夫 堤田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP58074656A priority Critical patent/JPS59200382A/ja
Publication of JPS59200382A publication Critical patent/JPS59200382A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)  発明の属する分野の説明 本発明は、手書き文字および印字文字を走査・光電変換
して文字バタンの特徴を抽出することによって文字を認
識する光学式文字読取装置において、文字バタンの寸法
を正規化してカテゴリを識別する文字認識方式に関する
ものである。
(2) 従来の技術の説明 第1図は、従来の光学式文字読取装置の1例であり、1
は帳票、2は走査・光電変換部、3は文字バタンメモリ
、4は特徴抽出部、41は特徴抽出回路、42は特徴バ
タンメモリ、5は特徴計数テーブル、6は計数レジスタ
、7は文字識別部である。この装置は、帳票1の走査を
行ない、帳票上の文字バタンの特徴を抽出して文字バタ
ン上に集積し、集積された特徴数を計数し、文字識別部
7の辞書の指示する特徴の種類とその数とを入力文字バ
タンから抽出した結果と比較することにより、一致する
文字カテゴリを判定するものである。
第2図は、特徴抽出部において各点に集積する特徴の例
を示したものであり、42は第1図の特徴バタンメモリ
に対応する。第2図中のH(水平点)、■(垂直点)、
S(斜め点)、■(内部点)は各々文字ストローク上の
点(黒点)に集積した当該黒点自身の特徴コードであシ
、白点(文字・くタンの背景)との隣接関係によって決
定されるものである。特徴抽出処理では、これらの特徴
コードに周囲の字形情報を加えたものを特徴コードとし
て扱うのが一般的であシ、〔特願昭51−85708文
字読取方式〕などに詳述されている。ただし、本発明の
趣旨を理解するためには不要であるので、周囲の字形情
報をマスク(後述)シタ特徴コード群としてH,V、S
、Iを規定し、以下これらを特徴と呼び説明を進める。
同じく第2図のx: y、zなどは、白点に集積した特
徴(特徴コード群)であシ、例えばXは周囲4方向を文
字ストロークで囲まれた点であること、Yは上下と右方
向を文字ストロークで囲まれた点でおることなどが各特
徴の意味である。集積した特徴の計数過程では、特徴計
数テーブル5の内容を文字バタンか入力する毎にクリヤ
し、特徴の出現数すなわち、同一の特徴を有する点を数
え、その結果を計数テーブルに登録する。計数の手順は
、特徴の存在を検出し、各特徴毎に指定された計数テー
ブル5のアドレスの内容に計数レジスタ6の保持する一
定の値(例えば1)を加算することによって実現される
一般に手番き文字は、所定の文字記入枠内に記入するよ
うになっているが、記入者の個人性による筆圧や筆記用
具に依存して文字の大きさと太さがまちまちとなるため
、従来は手書きの字形変形に加え、種々の大きさや太さ
の文字が読めるように辞書を用意していた。このため読
取れない文字を減らすための辞書拡張が繁雑で、辞書の
容量が著しく増大することが避けられないという欠点が
あった。この欠点を緩和するため、入力文字を正規化し
た後に特徴抽出する方法が採用されているが、正規化の
ため専用かつ大規模なハードウェアを必要としていた。
(8)  発明の目的 本発明は、上記の欠点を解決するためになされたもので
、その目的は文字バタンから抽出した字形情報を活用し
て、該文字バタンから抽出した特徴を計数する処理の過
程で各画素の位置と特徴コードの種類とに応じ、加算値
の設定と特徴コードの変換を行なうことによって、文字
バタンの拡大。
縮小処理と等価な機能を実現することである。
(a 発明の構成および作用の説明 。
第3図は、本発明の1実施例であって、l、2゜・・・
・7は、それぞれ第1図に対応する。51は座標検出回
路、52は特徴計数制御回路、53は特徴変換回路、5
21は特徴識別回路、522はアドレス選択回路、52
3は座標情報演算回路。
524は加算値決定回路である。第4図は、座標検出回
路51の処理する内容を示したものである。
座標検出回路51は、公知の方法、即ち白点(文字の背
景点)、黒点(文字ストローク上の点)を弁別していく
方法によって、2値量子化されている文字バタンの外接
4辺の座標(PT :上辺のX座標、PB:下辺のX座
標、PL:左辺のX座標。
PR:右辺のX座標)を求め、その結果から文字パータ
ンの寸法HT(高さ)=PB−PT、WH(幅)=P几
−PLを算出する。これらの値は、特徴計数制御回路5
2に出方される。特徴計数制御回路52では、座標検出
回路51の出方値をもとに文字バタンの拡大または縮小
倍率を決定する。
まず座標情報演算回路523において、以下のパラメー
タを求める。
縦方向に対する拡大/縮小(行走査線の補間/間引き)
の選択指定情報。
P = f(PT、 PB、 PL、 PR,、HT、
 WH)補間または間引きの行間隔:F=HT/α(補
間)。
F−β/HT(間引きン 1≦F≦M  (Mは文字バ
タンメモリの縦方向画素数) 横方向に対する拡大/縮小(列走査線の補間/間引き)
の選択指定情報: Q = f (FT、 PB、 PL、 PR,HT、
 WH)補間または間引きの列間隔: G = WH/
r (補間几G=δ/WH(間引き) 1≦G≦N  
(Nは文字バタンメモリの横方向画素数) P、Qは、各々〔補間間引き不要〕、〔補間〕。
〔間引き〕の3値であシ、P、Qを導く関数f。
tは、文字種毎に設定されるべきものである。例えば、
数字や英字では、縦横比(HT/WH)  とHT。
WHの絶対値のみでfおよび?の値を決めることができ
る。しかしカタカナでは拡大不要のカテゴリ(濁点2反
濁点など)があるので、PTやFBを拡大禁止パラメー
タとして使用する必要があるし、特殊記号(c、 1.
 r)])などを含む場合には、さらIcPL、PR,
も拡大、縮小の禁止パラメータとして規定する必要があ
る。なおf、tの内容は本発明の対象外であるので、こ
こでは説明を省略する。
いづれにしても、パラメータP、Q、F、Gは、座標検
出回路51の出力と予め決められた値(L0L+βなど
)との四則演算によって得られるものであシ、F、Gは
アドレス選択回路522に、またP。
Qは加算値決定回路524に出力される。
第5図は、規定した走査行と列の例を示したものであシ
、同図のX方向走査においてa1’、 a2.・・・・
・・、eLm  の走査線(行)を補間または間引きの
対象とする(縦方向7の補間または間引きに対応)。
ま7’CY方向については、bl、 b2.−・、 b
nの走査線(列)が対象となっている。すなわち、対象
となる走査線の数771.  nが多いほど文字パタン
の拡大または縮小の倍率が増大するものである。
特徴抽出部4は、文字パタンの外接4辺内の点に集積し
た特徴を、マスク走査によって点の並び順に逐次特徴計
数制御回路52へ出力する。このとき、特徴識別回路5
21には特徴そのものが、またアドレス選択回路522
にはラス°り走査の走査線アドレスが出力される。特徴
識別回路521は、特徴抽出部4から入力した特徴の、
種類を識別し、特徴の種類そのものによって規定される
計数制御情報を出力する。アドレス選択回路522では
当該走査線アドレスを知シ、F、Gをもとに走査線の位
置によって決まる補間または間引き制御情報を出力する
。加算値決定回路524では、P、Qによって当該文字
パタンか走査線補間の対象であるか間引きの対象である
かなどがわかっているので、521と522の出力を見
て現在計数しようとしている特徴の加算値を決定する。
また、場合によっては該特徴と置換する他の特徴を求め
、その加算値を決定する。
特徴計数制御回路52(加算値決定回路524)の出力
は、計数レジスタ6への加算定数および特徴変換回路5
3のアドレスである。加算定数は、当該文字パタンの当
該走査線上の当該特徴に対する加算値を指定するもので
あり、特徴の計数加算値0,1.2などの各定数である
。これら定数の値は、計数の加算値として計数レジスタ
6に書込まれる。この値が1であるときは、従来の方法
と同様に該特徴に対応する特徴計数テーブル5のアドレ
スの内容に1が加算される。この値が2以上であれば、
当該時点で入力した特徴に対応する特徴計数テーブル5
0カウントアツプ値が通常よシ大きくなる。またこの値
が0であれば、当該特徴の計数は行われない。同様に0
未満とすれば、特徴計数テーブル5の内容を減少させる
こともできる。
一方、特徴変換回路53は、加算値決定回路524の出
力を基に、コード化されている特徴を他の特徴コードに
変換する機能を持つ。すなわち、特徴抽出回路41の出
力とじて得た特徴コードが指示する特徴計数テーブル5
のアドレスを、他のアドレスに変換することによって特
徴の置換が実現される。具体的には、例えば特徴Hの入
力に対して通常ならHに対応する特徴コードの指示する
アドレスに1が加算されるものをHに1.特徴工に1を
それぞれ加算するような処理に相当する。
なお従来の方法に関する説明で述べたように、特徴S、
Hなどは、文字パタンの各点固有の特徴コードであり、
一般的には8+A十B+・叩のようにその点周囲の字形
情報A、BなどとSとを合成した集積特徴を特徴コード
として記述する。従って8.Hなどは特徴コードの一部
を表すものとすれば、該特徴コードのSやHに相当する
部分のみに着目した加算制御を行なうことによって、周
囲の字形情報をマスクした走査線の補間または間引きが
可能である。またAやBのみに着目した加算制御、8.
A、Bを合成した加算制御なども実現可能であり、周囲
の字形情報を集積した特徴の場合にも適用できることは
明らかである。
このような構成になっているので、文字パタンの寸法を
参照しながら、特徴計数テーブル5に登録する特定の走
査線上の特定の特徴のみの計数量を修正していくことが
でき、特徴を数える過程で文字パタンの大きさの正規化
を行える。
本発明は、文字バタン上のラスク走査によって、集積し
た特徴の計数処理を行なうことを前提とするが、文字バ
タン上に集積した特徴の内容には依呑しないので種々の
特徴抽出方式に対して適用できる。ここでは、従来の方
法についての説明に用いた特徴(H,V、8など)の計
数をよシ具体的な実施例として説明する。
第6図は、第5図に示される行2列のal、a2、・・
・・、al、・・、arILおよびbl、b2、・・・
・、bj。
・・・・、bルを、水平方向の走査のみによって同時に
補間または間引くための、加算値決定回路524内に用
意するテーブルの内容の一例である。同図の記述内容は
、以下のとおシである。
処理項目゛(補間1間引き)は、パラメータPまたはQ
によって規定され、ai、  bjはバラメニタFおよ
びGによって規定されるものである。今、処理項目゛が
補間モードであシ、入力特徴が特徴1として解読された
場合、第6図の第1行目の欄に示す加算値の変更が行な
われる。すなわち当該座標が補間対象となる81行かつ
bj列であるときには、値4を計数レジスタ6に出力j
る。当該座標が81行でbj列以外であるとき、および
ai行界外でbj列であるときには同様に値2を出力す
る。また81行でもbj列でもなければ、値1が選択さ
れ、通常の計数加算が進行する。
補間モードにおいて、特徴Vの場合には、第6図の第2
行目の欄に示す加算値の変更が行なわれる。当該座標が
11行かつ6j列の場合、計数レジスタに対して値2を
出力するが、特徴Vに対する加算終了後、特徴変換回路
53に対してコードIを出力して特徴1に対応する特徴
計数テーブル5の内容にも値2を加算する。11行でh
hbj列以外であれば、特徴■に対する加算値を2とす
るのみである。以下同様に、例えば特徴Sの入力に、対
して81行かつbj列であれば、特徴変換回路53への
出力を切り替えなからS、 V’、 H,、Iの各特徴
に対して、各々値1を加算する。
一方間引きモードでは、第6図内に値Oが記述されてい
る条件のとき、計数レジスタ6への出カケOとして加算
を行なわないようにする。また特徴変換回路53にはア
クセスを行なわない。
以上のように、補間9間引きの対象となる行(ai)、
:列(b j )が交差する点で畔、4やθなどを指定
することによって行と列に対応する補間また゛は間引き
を同時に実行する。また白点と隣接する黒点上の特徴(
H,V、8)を補間する場合には、行または列の条件に
よって内部点Iや他の隣接点特徴を補間する。この理由
は、文字ノくタン上の特徴が持つ意味を保存しつつ補間
を実行するためであシ、第7図によって具体的に説明す
る。
第7図は、81行における補間処理と間引き処理を文字
バタン上で示した説明図である。同図より、補間処理で
はbj列上のIまたは11行上のXVc対しては、その
特徴゛そのものを、al 行かつbj列上のVに対して
はVとIを、bj列上のVに対しては■を補間する必然
性のあることがわがる。また間引きに対しては、VやH
を単純に間引くと文字バタン上の特徴の持つ意味が保存
できなくなるので、bj列上のVのように特定の行およ
び列において間引きの禁止条件を設定している。
次に具体的な文字パタンを例に、寸法の正規化処理につ
いて説明する。第8図の81.82は、各々入力文字パ
タンの例である。また83i、1.5倍に拡大後の文字
パタン81を、84.85は同じく2/3に縮小後の文
字パタン82を想定したものである。拡大、縮小のルー
ルは、第6図の例によるものであシ、第8図の[、]は
白点コード々 を、[/]は削除された点を宍わす。また85は、84
のパタンから[/〕を除去した上で、文字・々タン平面
上の位相幾何学的な関係が保存できるように黒点を並べ
変えたものである。以下各文字・くタンの構成画素(点
)に、その点の周囲の黒点と白点の位置関係を記述した
特徴が集積され、座標情報が抽出された後の処理につい
て説明する。
まず座標検出回路51の出力によって両大学バタンのW
H,HTなどが検出されているので、座標情報演算回路
523内では81については補間モードで処理を行ない
、82については間引きモードで処理を行なうように判
定することができる。
またHT、WHによって81の文字バタンに対しては補
間周期(間隔)F、Gが、82のバタンに対しては間引
き周期(間隔)F、Gが決まるのでアドレス選択回路5
22において第8図に示す行アドレス(a?、 a2.
・・・・)および列アドレス(bl。
b2.・・・・)が決定される。その後は、第6図に従
い各特徴毎に加算値決定回路524の処理が進行し、8
1.82の文字パタンに対して83.84の文字パタン
を処理したのと同一の特徴計数結果が得られる。以上が
特徴計数制御回路52で行われる処理の概要であシ、8
1のバタンについては拡大と等価な処理が成され、82
のバタンについては縮小と等価な特徴計数処理が進行す
る。83゜850文字バタンから明らかなように、特徴
コードに下線を付した83のH点、85の8点および/
(無視すべき点)を除けば文字パタンの位相幾何学的な
関係を保存しつつ、極めて自然な拡大。
縮小が実現されている。
(5)  効果の説明 以上説明したように本方式は、従来文字読取装置の前処
理部に専用のハードウェアを置き、特徴抽出の前段階と
して行われていた文字パタンの拡大、縮小処理を、特徴
計数の段階で実行するものである。従って拡大゛、縮小
処理のための回路および処理量を低減できる利点がある
。また抽出した特徴から得た情報が拡大、縮小の要否判
定のパラメータとして活用できるため、幾何学的な拡大
縮小に比べてよシ確実かつ自然な字形の成形が可能とな
るほか、文字パタンの部分的な強調にも適用できる利点
がある。さらに文字の識別に用意する辞書では、文字の
大小をカバーするための論理を低減することができるた
め、辞書容量が節約でき、かつ性能向上のための改版も
容易となる。
【図面の簡単な説明】
第1図は従来の装置のブロック図、第2図は文字パタン
の一特徴の説明図、第3図は本発明装置の1実施例のブ
ロック図、第4図は文字パタンの座標情報を表わす説明
図、第5図は補間または間引き対象の走査線を示した説
明図、第6図は補間または間引き処理における加算値を
与えるテーブルの説明図、第7図は走査線補間の具体的
な処理を表す説明図、第8図は拡大、縮小処理の対象と
なる文字パタンの例を表す説明図である。 図中、1は帳票、2は走査・光電変換部、3は文字バタ
ンメモリ、4は特徴抽出部、5は特徴計数テーブル、6
は計数・レジスタ、7は文字識別部。 41は特徴抽出回路、42は特徴バタンメモリ。 51は座標検出回路、52は特徴計数制御回路。 53は特徴変換回路、521は特徴識別回路。 522はアドレス選択回路、523は座標情報演算回路
、524は加算値決定回路、81,82゜83.84.
85は文字バタン例を示す。 5 ’、t−+c 2 弁

Claims (1)

    【特許請求の範囲】
  1. 走査・光電変換によって文字ノくタンを入力し、該文字
    バタンの各イメージ構成画素上に字形の特徴をコード化
    し、ラスク走査によって該文字ノくタン上に出現した特
    徴コードの種類毎にその数を計数し、各特徴の計数結果
    を識別辞書と比較することによって入力文字ノくタンの
    カテコ°りを判定する文字読取装置において、入力文字
    ノくタンの縦幅、横幅から拡大または縮小すべき倍率を
    決定する手段と、該倍率から補間または間引きを行なう
    走査線の行および列を決定する手段と、特徴コードの種
    類と存在位置に応じ、該特徴コードの置換と計数の加算
    値を制御する手段とを備えたことを特徴とする文字認識
    方式。
JP58074656A 1983-04-27 1983-04-27 文字認識方式 Pending JPS59200382A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58074656A JPS59200382A (ja) 1983-04-27 1983-04-27 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58074656A JPS59200382A (ja) 1983-04-27 1983-04-27 文字認識方式

Publications (1)

Publication Number Publication Date
JPS59200382A true JPS59200382A (ja) 1984-11-13

Family

ID=13553488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58074656A Pending JPS59200382A (ja) 1983-04-27 1983-04-27 文字認識方式

Country Status (1)

Country Link
JP (1) JPS59200382A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63251875A (ja) * 1987-04-08 1988-10-19 Fujitsu Ltd パターン認識装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63251875A (ja) * 1987-04-08 1988-10-19 Fujitsu Ltd パターン認識装置

Similar Documents

Publication Publication Date Title
US5373566A (en) Neural network-based diacritical marker recognition system and method
US5434953A (en) Use of fast textured reduction for discrimination of document image components
EP0063454B1 (en) Method for recognizing machine encoded characters
US5668892A (en) Table recognition apparatus
EP0649113B1 (en) Multifont optical character recognition using a box connectivity approach
JPS6159568A (ja) 文書処理装置
US5235653A (en) Document analysis system
US5502777A (en) Method and apparatus for recognizing table and figure having many lateral and longitudinal lines
JPH04315272A (ja) 図形認識装置
US6983071B2 (en) Character segmentation device, character segmentation method used thereby, and program therefor
JPS59200382A (ja) 文字認識方式
JP2000076378A (ja) 文字認識方法
JP2788506B2 (ja) 文字認識装置
JP2789622B2 (ja) 文字/図形領域判定装置
JPH11120291A (ja) パタン認識システム
JPH08272900A (ja) 文書読取装置
KR20010083265A (ko) 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법
JP2612383B2 (ja) 文字認識処理方式
CN114140785A (zh) 一种复杂文档图像倾斜校正方法
JPS622382A (ja) 画像処理方法
JP3277977B2 (ja) 文字認識方法
JPS59205682A (ja) 文字認識方式
JPH08315079A (ja) 文字認識装置及び文字認識方法
JPH06119491A (ja) 帳票理解システム
JPH0896078A (ja) 文字認識装置