JP2785438B2 - 文字認識方式 - Google Patents

文字認識方式

Info

Publication number
JP2785438B2
JP2785438B2 JP2106645A JP10664590A JP2785438B2 JP 2785438 B2 JP2785438 B2 JP 2785438B2 JP 2106645 A JP2106645 A JP 2106645A JP 10664590 A JP10664590 A JP 10664590A JP 2785438 B2 JP2785438 B2 JP 2785438B2
Authority
JP
Japan
Prior art keywords
character
contour
line segment
character pattern
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2106645A
Other languages
English (en)
Other versions
JPH045781A (ja
Inventor
直人 信太
徹 宮前
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2106645A priority Critical patent/JP2785438B2/ja
Publication of JPH045781A publication Critical patent/JPH045781A/ja
Application granted granted Critical
Publication of JP2785438B2 publication Critical patent/JP2785438B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字認識方式に関し、特に文字認識装置に
おいて、文字認識精度を向上するのに好適な文字認識方
式に関するものである。
(従来の技術) 従来、文字認識装置における文字認識方式には種々の
方式が提案されている。英数字、カタカナを対象とした
文字の認識法としては、ストロークアナリシス法やパタ
ーンマッチング法が多用されており、さらに文字の変形
をより吸収する方法としてパターンの線構造を解析する
方法や背景構造を解析する方法等がある。
(発明が解決しようとする課題) しかしながら、上記従来の方式では、例えばストロー
クアナリシス法の場合、各文字の特徴を変形までも含め
て辞書に記述するため、辞書が膨大となり、処理時間が
長くなるという問題がある。一方、処理時間を短くしよ
うとするとハードウェア規模が大きくなり、簡易的な用
途には向かないという問題がある。
また、上記従来の背景構造を解析する方法では、文字
の背景部に着目し、文字線のループ、あるいは凹、凸形
状などの特徴を抽出することにより文字を識別するので
あるが、白黒点判定等の処理方法が複雑であるという問
題がある。
本発明の目的は、このような従来の問題を解決し、文
字認識装置において、辞書容量を大きくすることなく、
ハードウェア規模も大きくすることなく、文字認識精度
を向上させる文字認識方式を提供することにある。
(課題を解決するための手段) 上記目的を達成するため、本発明の文字認識方式は、
帳票上の文字を読取って、2値化した文字パターンのデ
ータを格納する手段と、該データより文字パターンの輪
郭を抽出する手段とを有する文字認識装置において、上
記抽出手段により抽出した文字パターンの輪郭データよ
り線分の方向を判別する手段と、該判別した方向別に輪
郭線分の所定の基準点からの相対位置よりなる特徴量の
算出を行う手段と、予め格納されている特徴量と上記算
出手段による算出結果の特徴量とを比較する手段とを有
し、入力文字パターンの線分の分布位置を線分の方向別
に識別することにより文字を認識することに特徴があ
る。
(作用) 本発明においては、上記抽出手段により抽出した文字
パターンの輪郭データより線分の方向を判別する手段
と、該判別した方向別に輪郭線分の所定の基準点からの
相対位置よりなる特徴量の算出を行う手段と、予め格納
されている特徴量と上記算出手段による算出結果の特徴
量とを比較する手段とを有し、入力文字パターンの線分
の分布位置を線分の方向別に識別することにより文字を
認識する。これにより、文字認識力を高めることができ
る。
(実施例) 以下、本発明の実施例を、図面により詳細に説明す
る。
第1図は、本発明の一実施例を示す文字認識方式を説
明するための図である。これは、本実施例の文字認識方
式を適用した文字認識装置のブロック図である。
第1図において、1は2値化された文字パターンを格
納するパターンレジスタ、2はパターンレジスタ1の内
容により文字パターンの輪郭を抽出する輪郭抽出部、3
は輪郭抽出部2で抽出されたx、y輪郭座標より線分を
8方向 に判別する方向判別部、4は方向判別部3で判別した方
向別文字パターンの線分の相対位置よりなる特徴量を算
出する特徴量算出部、5は文字パターンを識別する識別
部である。
パターンレジスタ1には帳票上の文字を読み取って、
2値化された文字パターンが図示しない文字パターン入
力部によって入力されている。ここでは、第2図に示す
文字パターン“A"が格納されているものとする。輪郭抽
出部2はパターンレジスタ1の内容から、第3図に示す
ように、座標(9,32)及び(11,24)を開始点として輪
郭追跡を行い、輪郭特徴を抽出する。輪郭の抽出法は、
種々の輪郭抽出法があるが、本実施例ではこの公知の輪
郭抽出法を用いて行うものとし、詳細については省略す
る。なお、輪郭追跡開始点はどの点であっても良いもの
とする。
次に方向判別部3は輪郭抽出部2で抽出されたx,y輪
郭座標より線分の方向を判別する。ここで、判別する方
向は第4図に示される如く、8方向に判別する。すなわ
ち、 の各条件を判定する。この上記各条件を判定することに
より各線分の方向が判別される。
第5図に文字パターンのx、y座標と方向を示す。第
5図の方向(傾き)の項で“→”は0度方向、 は45度方向、“↑”は90度方向、 は135度方向、“←”は180度方向、 は225度方向、“↓”は270度方向、 は315度方向を示している。
特徴量算出部4は方向判別部3で判別された方向別に
x、y輪郭座標より線分の相対位置よりなる特徴量の算
出を行う。この特徴量算出について以下詳細に説明す
る。
ここでは、特徴量として、各線分が存在する位置を用
いる。存在する位置としてある線分が、x,y方向のどの
場所に存在するかをx,y成分別に数値化する。
まず、0度方向(→)の線分について考える。
x軸上での相対位置は、 y軸上での相対位置は、 ここで、( )内の計算は0度方向の成分についてのみ
行い、他方向成分の時は値を0として計算する。また、
Hx、Hyは文字パターンの文字幅を示している。
同様にして、方向成分ごとの式を求めると以下の様に
示される。
90度方向(↑)については、 180度方向(←)については、 270度方向(↓)については、 の式より求まる。
上記Q1x〜Q8x及びQ1y〜Q8yは、文字パターンに外接す
る長方形の左下(第3図中、座標(1,1))を原点とす
る座標系により演算を行う。これにより、各線分のx,y
成分の存在する位置は、y軸上の位置については下にく
るほど、x軸上の位置については左にくるほど、その特
徴量が小さくなる。また、本実施例の方法では全線分の
位置に関わる重みを全て加算するため、原点に近い部分
での線分の変化が小さな差となって表われ、文字パター
ンに外接する長方形上での右上の部分での線分の変化に
より左右されることとなる。したがって、文字パターン
に外接する長方形の右上(第3図中、座標(22,32))
を原点とする座標系での上記Q1x〜Q8x、Q1y〜Q8yに関す
る演算を行い、その結果をそれぞれQ9x〜Q16x、Q9y〜Q
16yとする。
以上説明したQ1x〜Q16x、Q1y〜Q16yの式を用いて第5
図に示されたx、y座標及び方向データにより演算を行
う。すなわち、第5図(a)に示した外縁輪郭、(b)
に示した内縁輪郭に関して各々演算を行い、結果は外縁
輪郭と外縁輪郭との和としてQ1x〜Q16x、Q1y〜Q16yが求
められる。このように、上記の演算は、複数の内縁があ
る文字に対しては、その全線分に関して演算を行う。
識別部5には認識対象文字毎のQ1x〜Q16x、Q1y〜Q16y
の特徴量が格納されている。識別部5は特徴量算出部4
で算出された入力文字パターンの特徴量Q1x〜Q16x、Q1y
〜Q16yと識別部5に格納されている標準パターンの特徴
量Q* 1x〜Q* 16x、Q* 1y〜Q* 16yとをマッチングさせる。こ
れらのマッチングにおける差をマッチング距離とし、こ
の算出を識別部5に格納されている認識対象文字全てに
ついて行い、マッチング距離による並べ替えを行う。
この並べ替え結果に従って、マッチング距離の最小の
文字が認識結果として選択される。
(発明の効果) 以上説明したように、本発明によれば、文字を図形と
してとらえ、線分の方向を考慮した方向別の特徴量抽出
を行うこととしたので、ハードウェア構成を増加するこ
となく文字認識装置における文字認識精度を向上させる
ことができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示す文字認識方式を説明す
るための図、 第2図は文字パターン例を示す図、 第3図は文字パターンの輪郭抽出図、 第4図は線分の方向を示す図、 第5図は座標と方向を示す輪郭特徴図である。 1:パターンレジスタ、2:輪郭抽出部、3:方向判別部、4:
特徴量抽出部、5:識別部。
フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/48 G06K 9/62 630 G06K 9/46

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】帳票上の文字を読取って、2値化した文字
    パターンのデータを格納する手段と、該データより文字
    パターンの輪郭を抽出する手段とを有する文字認識装置
    において、 上記抽出手段により抽出した文字パターンの輪郭データ
    より線分の方向を判別する手段と、 該判別した方向別に輪郭線分の所定の基準点からの相対
    位置よりなる特徴量の算出を行う手段と、 予め格納されている特徴量と上記算出手段による算出結
    果の特徴量とを比較する手段とを有し、 入力文字パターンの線分の分布位置を線分の方向別に識
    別することにより文字を認識することを特徴とする文字
    認識方式。
JP2106645A 1990-04-24 1990-04-24 文字認識方式 Expired - Fee Related JP2785438B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2106645A JP2785438B2 (ja) 1990-04-24 1990-04-24 文字認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2106645A JP2785438B2 (ja) 1990-04-24 1990-04-24 文字認識方式

Publications (2)

Publication Number Publication Date
JPH045781A JPH045781A (ja) 1992-01-09
JP2785438B2 true JP2785438B2 (ja) 1998-08-13

Family

ID=14438862

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2106645A Expired - Fee Related JP2785438B2 (ja) 1990-04-24 1990-04-24 文字認識方式

Country Status (1)

Country Link
JP (1) JP2785438B2 (ja)

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2658136B2 (ja) * 1988-03-11 1997-09-30 沖電気工業株式会社 文字認識方式

Also Published As

Publication number Publication date
JPH045781A (ja) 1992-01-09

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
CN111046735B (zh) 一种车道线点云提取方法、电子设备及存储介质
US8027978B2 (en) Image search method, apparatus, and program
JPH06348896A (ja) 文字の切り出し方法及びその装置
US5001765A (en) Fast spatial segmenter for handwritten characters
JP2005148987A (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
JP4704601B2 (ja) 文字認識方法,プログラム及び記録媒体
Boles et al. Personal identification using images of the human palm
JP2785438B2 (ja) 文字認識方式
CN112464753B (zh) 图像中关键点的检测方法、检测装置及终端设备
JP2658136B2 (ja) 文字認識方式
JP4416204B2 (ja) 帳票認識装置、帳票認識方法、及び記憶媒体
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
JP3077929B2 (ja) 文字切出し方式
JP3817281B2 (ja) 情報処理装置及び方法
JPH01231189A (ja) 文字認識方式
JP2658153B2 (ja) 文字識別方式
JP2671984B2 (ja) 情報認識装置
JPH07302338A (ja) テンプレートマッチング方法およびこの方法を用いたパターン認識装置
JP2001060250A (ja) 文字認識方法および装置
JP2658154B2 (ja) 文字識別方式
JP3285837B2 (ja) 文字列の切り出し装置および方法
JP3329528B2 (ja) ドキュメント読取り装置
JPS622382A (ja) 画像処理方法
JP2832035B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080529

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090529

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees