JP2963321B2 - 文字認識における枠切り処理方法 - Google Patents

文字認識における枠切り処理方法

Info

Publication number
JP2963321B2
JP2963321B2 JP5303614A JP30361493A JP2963321B2 JP 2963321 B2 JP2963321 B2 JP 2963321B2 JP 5303614 A JP5303614 A JP 5303614A JP 30361493 A JP30361493 A JP 30361493A JP 2963321 B2 JP2963321 B2 JP 2963321B2
Authority
JP
Japan
Prior art keywords
frame
character
sensor
characters
inclination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5303614A
Other languages
English (en)
Other versions
JPH07160808A (ja
Inventor
友宏 砂崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
PII EFU YUU KK
Original Assignee
PII EFU YUU KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by PII EFU YUU KK filed Critical PII EFU YUU KK
Priority to JP5303614A priority Critical patent/JP2963321B2/ja
Publication of JPH07160808A publication Critical patent/JPH07160808A/ja
Application granted granted Critical
Publication of JP2963321B2 publication Critical patent/JP2963321B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】OCR用紙等の枠に書き込まれた
文字、数字、記号等(以下、これらをまとめて「文字」
と表現する)をイメージ情報として読み取り、読み取っ
たイメージ情報から文字パターンを切り出して文字認識
を行う文字認識処理が種々の分野で行われている。
【0002】上記文字認識処理においては、文字を書き
込む枠の位置が特定されないと文字パターンを切り出す
ことができず、また、読み取った文字が傾いていると正
確な文字の切り出しができず文字認識率が低下する。本
発明は、文字を書き込む枠の位置が特定されていない用
紙に書き込まれた文字をスキャナー等で読み取り認識処
理を行う文字認識処理において、枠の位置を見つけ出
し、文字パターンの切り出しを行う枠切り処理方法に関
し、特に、本発明は、文字枠の角の4点を見つけ出し、
文字枠の傾き補正を行うことにより、正しい向きで文字
を切り出し、高い文字認識率を得ることができる文字認
識における枠切り処理方法に関するものである。
【0003】
【従来の技術】OCR用紙には、通常、文字を記入する
ための文字記入枠が設けられ、また、用紙の周辺部に文
字記入枠の位置を識別するための位置情報マークが記録
されている。そして、文字は予め定められた上記文字記
入枠に書ま込れる。図13は上記したOCR用紙の一例
を示す図であり、同図に示すように、OCR用紙100
には文字を書き込む枠101と位置情報マーク102が
記録されている。
【0004】そして、記入された文字を読み取る場合に
は、位置情報マーク102に基づき枠101の位置を算
定して枠101内の文字を切り出し、文字認識処理を行
っている。上記のような従来の方式においては、OCR
用紙のように文字を書く位置が特定された用紙を用いな
ければ文字を切り出すことができず、枠が特定の位置に
設けられていない通常の用紙に書き込まれた文字を切り
出し、認識することは困難であった。
【0005】特に位置情報マークが付せられていない通
常の用紙をスキャナー等で読み取る場合には、用紙の傾
きを判定することができないので、用紙が斜めに読み取
られ枠が傾いている場合には、文字が書き込まれた枠の
位置が用紙上で特定されていたとしても、正しい向きで
文字を切り出すことができず、文字の認識率が低下す
る。
【0006】
【発明が解決しようとする課題】本発明は上記した従来
技術の問題点を解決するためになされたものであって、
本発明の第1の目的は、文字を書き込む枠の位置が特定
されていない用紙に書き込まれた文字を高い認識率で認
識することができる文字認識における枠切り処理方法を
提供することである。
【0007】本発明の第2の目的は、用紙の枠の位置を
探索して枠の傾きを求めて補正することにより、枠が傾
いて読み取られた場合であっても、文字を正しい向きで
切り出すことができる文字認識における枠切り処理方法
を提供することである。
【0008】
【課題を解決するための手段】図1は本発明の原理図で
あり、同図において、1は文字、数字、記号等を書き込
む枠を備えた用紙、2は用紙1に記録された枠、,
, , は探索して求めた枠2の角4点、3はイメー
ジ情報から切り出した文字、数字、記号等のパターンで
ある。
【0009】上記課題を解決するため、図1に示すよう
に、本発明の請求項1の発明は、文字、数字、記号等を
書き込む枠2を備え、該枠2に文字、数字、記号等が記
入された用紙1からイメージ情報を読み取り、読み取っ
たイメージ情報から文字、数字、記号等のパターン3を
切り出して文字認識を行う、文字認識における枠切り処
理方法において、上記イメージ情報を探索して枠2の一
部を見つけ、見つけた枠2をたどって、枠の角4点,
, , を見つけ出し、枠の角4点, ,, の
情報に基づき用紙上の枠2の位置を求め、求めた枠2内
の文字、数字、記号等のパターン3を切り出すようにし
たものである。
【0010】本発明の請求項2の発明は請求項1の発明
において、見つけた枠の角4点,, , の情報か
ら枠2の傾きを求め、求めた傾きに基づき枠2を回転補
正し、上記回転補正された枠2から文字、数字、記号等
のパターン3を切り出すようにしたものである。
【0011】
【作用】図1において、該枠2に文字、数字、記号等が
記入された用紙1からイメージ情報を読み取り、イメー
ジ情報の下(もしくは上)の設定位置から同図矢印に示
すように枠2を探索する。枠2を発見すると、枠2をた
どって枠2の角4点,, , を見つける。
【0012】求めた角4点, , , から枠2の位
置と傾きを求め、枠2の傾きを回転補正する。ついで、
回転補正された枠から文字、数字、記号等のパターンを
切り出し、文字認識を行う。本発明の請求項1の発明に
おいては、上記のように、イメージ情報を探索して枠2
の一部を見つけ、見つけた枠2をたどって、枠の角4点
, , , を見つけ出し、枠の角4点, , ,
の情報に基づき用紙上の枠2の位置を求めるようにし
たので、文字を書き込む枠の位置が特定されていない用
紙に書き込まれた文字であっても、文字パターンを正確
に切り出すことができ、高い認識率で文字を認識するこ
とができる。
【0013】本発明の請求項2の発明においては、請求
項1の発明において、見つけた枠の角4点, , ,
の情報から枠2の傾きを求め、求めた傾きに基づき枠
2を回転補正するようにしたので、枠が傾いて読み取ら
れた場合であっても、文字を正しい向きで切り出すこと
ができ、文字認識率を向上することができる。
【0014】
【実施例】図2は本発明の実施例のシステムの全体構成
を示す図であり、同図において、11はスキャナ、11
aは光学的に用紙に記録されたイメージ情報を読み取る
CCD等の光学センサ、12は光学センサ11aにより
読み取ったイメージ情報を量子化する量子化部、13は
量子化された情報をイメージ画像データとして記憶する
画像メモリ、14は後述する枠探索部であり、枠探索部
14は読み取ったイメージ情報における枠の位置を探索
し、その傾きを求める。
【0015】15は傾き補正部であり、枠探索部14に
より求めた枠の傾きに基づき枠の傾きを補正する。16
は枠から文字パターンの部分を切り出すための切り出し
処理部、17は切り出した各文字パターンについて文字
認識を行う文字認識部である。同図において、スキャナ
ー11の光学センサ11aは用紙の任意の位置に設けら
れた枠に記入された文字をイメージ情報として読み取
る。読み取られたイメージ情報は量子化部12でデジタ
ル信号に変換されイメージ画像データとして画像メモリ
13に蓄積される。
【0016】枠探索部14は、後述するセンサにより、
画像メモリに蓄積されたイメージ画像データにおける枠
の位置をサーチする。そして、枠の一部を発見すると、
枠をたどって枠の4角を見つけ枠の傾きを求める。傾き
補正部15は枠探索部14において求めた枠の傾きに基
づき枠の傾きを回転補正する。図3は上記した枠探索部
14と傾き補正部15における枠探索と傾き補正処理の
概念を示す図であり、枠探索部14は同図(a)に示す
ように、枠探索開始点Aから同図矢印に示すように枠探
索を開始し、同図ので枠の一部を発見すると、に示
すように枠をたどり、において枠の最初の角を見つけ
る。
【0017】以下同様にして、枠を→→→→
→の順序で枠をたどり4角を見つける。そして、求め
た角の位置から文字枠の位置と枠の傾きを求め、同図
(b)に示すように傾きを回転補正する。切り出し処理
部16は傾き補正部15において傾きが補正された枠か
ら文字パターンを切り出し、切り出した文字パターンか
らさらに一文字毎の文字パターンを切り出す。文字認識
部17は、切り出し処理部16により切り出した各文字
パターンについて文字認識を行う。
【0018】図4,図5は本実施例における文字認識処
理のフローチャートを示す図であり、同図により、本実
施例における文字認識処理を説明する。図4のステップ
S1,S2において、イメージ画像データ内の枠と同じ
データを探索し、枠の一部を発見した場合には、ステッ
プS3において、枠の傾き具合(たどり角という)によ
り枠線のある場所を推定し、たどり角を平均化しながら
枠をたどっていく。
【0019】ステップS4において、たどった方向に枠
と同じデータがなくなったら、一つめの角を発見したと
して、ステップS5において、垂直方向に方向変換して
再び枠をたどっていく。ステップS6において、たどっ
た方向に枠と同じデータがなくなったら、二つめの角を
発見したとして、ステップS7において、上記と同様、
垂直方向に方向変換して再び枠をたどっていく。
【0020】図5のステップS8において、上記と同
様、たどった方向に枠と同じデータがなくなったら、三
つめの角を発見したとして、ステップS9において、垂
直方向に方向変換して再び枠をたどっていく。ステップ
S10において、たどった方向に枠と同じデータがなく
なったら、ステップS11において、求めた4点が枠と
しての4角形の条件(辺の長さ、縦横比)を満たしてい
るか否かを判定し、満たしていない場合には、ステップ
S1に戻り上記処理を繰り返す。
【0021】条件を満たしている場合には、ステップS
12に行き、枠の傾きを求めて、枠を回転補正するた
め、アフィン変換を行う。ついで、ステップS13にお
いて、回転補正した枠の角4点に基づき文字を切り出
し、ステップS14において切り出した文字パターンに
ついて文字認識処理を行う。
【0022】図6は枠を探索するセンサおよびセンサに
よる枠探索の様子を示す図、図7〜図8は枠の一部を発
見する処理(1) を示す図、図9〜図12は枠をたどる処
理(2) 、および、枠の角を発見する処理(3) を示す図で
あり、図7,図8、図10〜図12はイメージ画像デー
タをドットレベルに拡大した図である。次に上記枠探索
部14における枠探索処理の実施例について、図6〜図
12により説明する。 (1) 枠の一部を発見する処理 図6(a)は「枠の一部を発見するためのセンサ」を示
す図であり、センサにおけるセンサ・ビットはそれぞれ
イメージ画像データの1ドットに対応しており、本実施
例におけるセンサ・ビットの幅は同図に示すように1バ
イト幅である。
【0023】上記センサにより枠を探索するには、セン
サ・ビット位置におけるイメージ画像データのドットを
判定する。その際、センサ・ビットは、そのドットのデ
ータが枠と同じデータの場合に反応する。例えば、枠が
黒の場合には、センサ・ビット位置におけるイメージ画
像データのドットが同じ黒のとき、センサ・ビットは反
応する。
【0024】なお、センサ・ビットの幅は処理速度、ゴ
ミとの識別能力等に関係し、センサ・ビットの幅が1バ
イト幅という大きさは処理スピードに貢献するととも
に、小さなゴミを枠と勘違いしにくくするのに適当であ
るが、イメージ画像データ内の枠のサイズによってはセ
ンサビットの幅を変更することもできる。図6(b)は
センサによる枠発見処理を示す図であり、同図に示すよ
うに、センサをイメージ画像データの下(もしくは上)
の設定位置から一段づつ動かして枠をサーチしていく。
【0025】そして、左もしくは右のセンサ・ビットが
枠と同じデータになったら、反応したセンサ・ビットを
進行方向へ、枠と同じデータがなくなるまで動かしてい
き、その間のビット数を計算し、予め定められた線幅条
件範囲と比較する〔図7(a)参照〕。すなわち、枠の
線幅の許容差に入っているか否かを確認する。次に、反
応していない方のセンサ・ビット〔図7(a)において
は右側のビット〕を反応したセンサ・ビットの反応した
高さから進行方向に設定量分動かしてサーチし、センサ
・ビットに反応があれば、上記と同様にドット数を計算
して線幅条件範囲と比較する〔図7(b)参照〕。
【0026】そして、さらに左と右のドット数(線幅)
の差を予め定められた左右線幅誤差条件範囲と比較す
る。計算したドット数が線幅条件範囲をクリアし、か
つ、その差が左右線幅誤差条件範囲をクリアすれば、左
右のセンサ・ビットの反応順により枠の傾きを予想し、
左と右のセンサ・ビットの反応点のドット差より傾き具
合(たどり角という)を得る〔図8参照〕。また、左右
の線幅の平均線幅を求めておく。
【0027】そして、センサ・ビットが反応したデータ
が枠のデータの可能性有ということで、データをたどり
始める。上記処理を行うことにより、ゴミ(ノイズ)に
反応しにくく、比較的早い処理スピードで枠の一部を発
見することができ、その枠の特徴を予想することができ
る。 (2) 枠をたどる処理 枠の一部を発見したのち、枠の傾きによりたどる方向を
決定する。図9は枠の傾きとたどる方向との関係を示す
図であり、同図において、○は枠の一部を発見した点、
●は枠の角を発見した点である。
【0028】図9に示すように枠の傾きが左下がりなら
反時計回り、右下がりなら時計回りで枠をたどらせる。
すなわち、枠の外側のゴミに影響を減らすためにたどる
方向を定める。次に、たどり角が上記(1) で用いたセン
サの大きさに対する値であることを考慮して、「枠をた
どるためのセンサ」の大きさを決める。なお、「枠をた
どるためのセンサ」の大きさは「枠の一部を発見するた
めのセンサ」と同じ大きさが好ましい。
【0029】図10は上記センサとイメージ画像データ
の関係を示す図であり、同図に示すように、「枠をたど
るためのセンサ」のセンサ・ビットはたどる方向の端に
設けられ、そのセンサ・ビットは、「枠の一部を発見す
るためのセンサ」のセンサ・ビットと同様、イメージ画
像データのドットが枠と同じデータであるときに反応す
る。
【0030】枠をたどる際、センサは、図11(a)に
示すように、たどる方向とたどり角により枠線のある場
所を推定し、その内側と外側を設定量だけ探索する。セ
ンサ・ビットが反応したら、前記(1) の場合と同様、線
幅を計算し、(1) で求めた平均線幅の許容誤差内であれ
ば〔図11(b)参照〕、枠線の一部と認めその線幅を
平均線幅にフィードバックさせる。さらに現在のセンサ
が反応した点とその一つ前の反応点のドット差をたどり
角にフィードバックし、次の探索に進む。 (3) 枠の角を発見する処理 枠線をたどり、センサを動かしていき推定した場所の探
索範囲に反応がなくなったら、角が存在範囲に入ったと
考え、現在のセンサ位置のセンサ・ビットの反対の方か
ら1ビットづつセンサ・ビットを動かして、たどり角、
線幅の条件を元に前記と同様に、枠線をたどる。そして
反応がなくなった位置を角とする〔図12参照〕。
【0031】上記のようにして角を見つけ、角を見つけ
る度に探索の方向を直角に方向変換して、平均線幅、た
どり角をフィードバックさせながら(2) 、(3) に示した
処理をあと3回行う。そして、4つの角を見つけたら枠
の縦長さ、横長さを計算し、そのサイズ、比率等を予め
設定されている条件と比較し、満足していれば枠を認識
したとする。
【0032】以上の(2) 、(3) の処理を行うことによ
り、外側のゴミの影響を比較的受けることなく、枠のた
どり角を発見して、安定に枠を認識することが可能とな
る。
【0033】
【発明の効果】以上説明したように、本発明において
は、イメージ情報を探索して枠の一部を見つけ、見つけ
た枠をたどって、枠の角4点を見つけ出し、用紙上の枠
の位置を求めるようにしたので、文字を書き込む枠の位
置が特定されていない用紙に書き込まれた文字であって
も、文字パターンを正確に切り出すことができ、高い認
識率で文字を認識することができる。
【0034】また、見つけた枠の角4点の情報から枠の
傾きを求め、求めた傾きに基づき枠を回転補正すること
により、枠が傾いて読み取られた場合であっても、文字
を正しい向きで切り出すことができ、文字認識率を向上
することができる。
【図面の簡単な説明】
【図1】本発明の原理図である。
【図2】本発明の実施例のシステムの全体構成を示す図
である。
【図3】実施例における枠探索と傾き補正処理の概念を
示す図である。
【図4】本発明の実施例のフローチャートである。
【図5】本発明の実施例のフローチャート(続き)であ
る。
【図6】枠を探索するセンサおよびセンサによる枠探索
の様子を示す図である。
【図7】枠の一部を発見する処理を示す図である。
【図8】枠の一部を発見する処理を示す図(続き)であ
る。
【図9】枠をたどる処理を示す図である。
【図10】枠をたどる処理を示す図(続き)である。
【図11】枠をたどる処理を示す図(続き)である。
【図12】枠の角を発見する処理を示す図である。
【図13】従来のOCR用紙の一例を示す図である。
【符号の説明】
1 用紙 2 枠 3 切り出した文字、数字、記号等のパ
ターン 11 スキャナ 11a 光学センサ 12 量子化部 13 画像メモリ 14 枠探索部 15 傾き補正部 16 切り出し処理部 17 文字認識部

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 文字、数字、記号等を書き込む枠(2) を
    備え、該枠(2) に文字、数字、記号等が記入された用紙
    (1) からイメージ情報を読み取り、読み取ったイメージ
    情報から文字、数字、記号等のパターン(3) を切り出し
    て文字認識を行う、文字認識における枠切り処理方法に
    おいて、 上記イメージ情報を探索して枠(2) の一部を見つけ、見
    つけた枠(2) をたどって、枠の角4点( , , ,
    ) を見つけ出し、 上記枠の角4点( , , , ) の情報に基づき用紙
    上の枠(2) の位置を求め、求めた枠(2) 内の文字、数
    字、記号等のパターン(3) を切り出すことを特徴とする
    文字認識における枠切り処理方法。
  2. 【請求項2】 見つけた枠の角4点( , , , )
    の情報から枠(2) の傾きを求め、求めた傾きに基づき枠
    (2) を回転補正し、 上記回転補正された枠(2) から文字、数字、記号等のパ
    ターン(3) を切り出すことを特徴とする請求項1の文字
    認識における枠切り処理方法。
JP5303614A 1993-12-03 1993-12-03 文字認識における枠切り処理方法 Expired - Fee Related JP2963321B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5303614A JP2963321B2 (ja) 1993-12-03 1993-12-03 文字認識における枠切り処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5303614A JP2963321B2 (ja) 1993-12-03 1993-12-03 文字認識における枠切り処理方法

Publications (2)

Publication Number Publication Date
JPH07160808A JPH07160808A (ja) 1995-06-23
JP2963321B2 true JP2963321B2 (ja) 1999-10-18

Family

ID=17923115

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5303614A Expired - Fee Related JP2963321B2 (ja) 1993-12-03 1993-12-03 文字認識における枠切り処理方法

Country Status (1)

Country Link
JP (1) JP2963321B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018190248A (ja) * 2017-05-09 2018-11-29 富士通株式会社 画像処理プログラム、画像処理方法及び画像処理装置

Also Published As

Publication number Publication date
JPH07160808A (ja) 1995-06-23

Similar Documents

Publication Publication Date Title
EP1033864B1 (en) Document-inclination detector
JP2963321B2 (ja) 文字認識における枠切り処理方法
EP0766193A2 (en) Optical character reader with skew correction
JP3230334B2 (ja) 画像処理装置
JPS6033332B2 (ja) フアクシミリを用いた情報入力方式
JP3022655B2 (ja) 文字認識装置
US6999635B1 (en) Method of reducing background noise by tracking character skew
JPH07192087A (ja) 光学文字読取装置
JP3005729B2 (ja) 光学的文字読取装置
JP2004241827A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記憶媒体
JPH04111651U (ja) 伝送帳票
JPH0778821B2 (ja) 画像認識方法
JP3334369B2 (ja) 選択項目認識装置
JPS5864575A (ja) 光学式文字読取装置
JPH039506B2 (ja)
JP2542628B2 (ja) マ−ク読取装置
JP3236898B2 (ja) 画像処理装置およびその処理方法
JP3356819B2 (ja) マーク認識装置
JPS58195982A (ja) マ−ク読取り方式
JPH0615150U (ja) 光学式文字読取装置
JPH07282188A (ja) ファクシミリocr装置
JPH0461395B2 (ja)
JPH0483467A (ja) 読み取り画像の傾斜補正方式
JPH0221385A (ja) プリンタ装置
JPS5860381A (ja) スキユ−検出方式

Legal Events

Date Code Title Description
S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313532

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees