JPH026113B2 - - Google Patents

Info

Publication number
JPH026113B2
JPH026113B2 JP56121615A JP12161581A JPH026113B2 JP H026113 B2 JPH026113 B2 JP H026113B2 JP 56121615 A JP56121615 A JP 56121615A JP 12161581 A JP12161581 A JP 12161581A JP H026113 B2 JPH026113 B2 JP H026113B2
Authority
JP
Japan
Prior art keywords
pattern
line segment
midpoint
stroke
straight line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP56121615A
Other languages
English (en)
Other versions
JPS5822479A (ja
Inventor
Keiji Kobayashi
Masataka Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Basic Technology Research Association Corp
Original Assignee
Computer Basic Technology Research Association Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Basic Technology Research Association Corp filed Critical Computer Basic Technology Research Association Corp
Priority to JP56121615A priority Critical patent/JPS5822479A/ja
Publication of JPS5822479A publication Critical patent/JPS5822479A/ja
Publication of JPH026113B2 publication Critical patent/JPH026113B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/168Smoothing or thinning of the pattern; Skeletonisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 この発明は直線線分の多い文字を認識する文字
認識装置に関するものであり、更に詳しくは手書
き漢字を認識する文字認識装置に関するものであ
る。
従来、漢字を認識する場合、特に印刷漢字を認
識する装置ではパターンマツチング法が用いられ
ていた。印刷漢字のように字形が一定のものに
は、この方法が有効であつた。
しかし、第1図に示すように、記入枠1内の基
準文字パターン2に対して、入力文字パターン3
が少しでも傾いている場合、両者の類似度は小さ
くなる。また第2図に示すように基準文字パター
ン4に対して、入力文字パターン5の線幅が異な
る場合も両者の類似度は小さくなる。従つて、手
書き漢字のように各ストロークが基準文字パター
ンに対して傾いていたり、線幅が一定でない文字
に対しては、パターンマツチング法を適用しても
高い認識率が得られないという欠点があつた。
この発明は、これらの欠点を除去するため、入
力文字パターンから直線線分(以後、ストローク
と呼ぶ)を抽出し、ストロークの中点パターンを
用いて認識を行うことを特徴とし、その目的は高
い認識精度の文字認識装置を実現することにあ
る。
以下図面を用いて詳細に説明する。
第3図は、この発明の実施例の構成図である。
まず帳票6上の入力文字を走査手段7で走査し、
得られた入力文字パターンを前処理手段8により
細線化する。次にストローク抽出手段9によつ
て、細線化された文字パターンからストロークを
抽出し、その中心位置からストローク中点パター
ンを作成して決定手段10に送る。決定手段10
では、上記ストローク中点パターンと、あらかじ
め記憶されている基準文字のストローク中点パタ
ーンとの類似度を求め、入力文字が何であるかを
決定する。
第4図は、漢字“金”を上記前処理手段8によ
り細線化した例を示すものであり、細線化された
入力文字パターンの文字部11を“1”で示して
いる。
第5図は、上記細線化された入力文字パターン
の文字部11から、上記ストローク抽出手段9に
より端点、分岐点、屈曲点等の特徴点を求め、特
徴点間を結んだ基本線分を抽出した結果を示した
ものであり、各特徴点を“※”で示し、各基本線
分を“A”〜“N”で示している。例えば、特徴
点12に連結している基本線分は“E”で示され
る基本線分13、“F”で示される基本線分14、
“G”で示される基本線分15、“H”で示される
基本線分16である。
ストローク抽出手段9では、端点以外の特徴点
を共有する基本線分対(2本の基本線分)の方向
を調べ、方向がほぼ等しい基本線分対を結合する
ことによつてストロークを抽出するが、具体的に
は以下のようにして抽出する。まず、ある特徴点
Piに連結している基本線分対について、特徴点Pi
を終点として他端Pjを始点とした第1の基本線分
の方向ベクトルPjPi――→と、特徴点Piを始点とし
他端Pkを終点とした第2の基本線分の方向ベク
トルPik――→を求める。特徴点Piにおける第1の基
本線分と第2の基本線分の方向ベクトルとなす角
をθとしたとき、上記2本の基本線分の方向の一
致度をcosθで定義し、特徴点Piに連結したすべて
の基本線分の中から一致度が最大、かつ所定の閾
値以上の基本線分対を結合してストロークとす
る。更に、上記基本線分対を除いた基本線分につ
いて上記ストロークを求める処理を繰り返す。最
後に2つの端点間を結ぶ基本線分及び上記処理で
結合されずに残つた基本線分をそれぞれ1本のス
トロークとして抽出する。
第6図は、ストローク抽出手段9によつて上記
の方法で決めたストロークを示す図である。
即ち、基本線分13と15が結合されて“D”
で示されるストローク17が抽出され、基本線分
14と16が結合されて“E”で示されるストロ
ーク18が抽出される。同様にして残りの各スト
ローク“A”〜“C”、“F”〜“H”が抽出され
る。
次に、これら各ストロークからストローク中点
を求める。ストローク中点の座標は、ストローク
の始点の座標を(X1、Y1)、終点の座標を(X2
Y2)とすると、((X1+X2)/2、(Y1+Y2)/
2)で表わされる。
第7図は上記処理によつて抽出した入力文字パ
ターンのストローク中点パターン19〜26を示
す図であり、ストローク中点には第6図のストロ
ーク番号に対応した番号を付している。
第8図は同様の処理で得られた漢字“金”の基
準文字のストローク中点パターン27〜34を示
す図である。決定手段10においては、上記入力
文字のストローク中点パターン19〜26と、決
定手段10に格納されている基準文字のストロー
ク中点パターン27〜34とから類似度を求めて
入力文字が何であるかを決定する。
具体訂には、まず基準文字の各ストローク中点
に対して入力文字の各ストローク中点のうち距離
の最も近い点を対応付ける。この例では、ストロ
ーク中点19〜26が基準文字のストローク中点
27〜34に対応付けられる。
次に、上記対応付けられた2点間の距離を加算
し、その逆数を基準文字に対する入力文字の類似
度とする。最後に、類似度が最も大きい値を持つ
基準文字を認識文字として決定する。このよう
に、安定なストローク中点を利用して認識してい
るので、従来に比較して高い認識精度を得ること
ができる。
「特に、漢字などのようにストロークの方向や
長さが安定している文字を読み取る場合には、ス
トロークの方向や長さの情報をストロークの中点
の情報に加えることにより更に高い認識精度を得
ることができる。次に、これらの情報を用いたも
う一つ別の実施例を第6図、第9図〜第25図を
用いて説明する。
まず上記ストローク抽出手段9で抽出した第6
図に示すストロークからストロークの方向と長さ
と中点を求める。即ちストロークの始点の座標を
(X1、Y1)終点の座標を(X2、Y2)とすると、
ストロークの方向角θは θ=tan-1〔(Y2−Y1)/(X2−X1)〕 で表わされ、これを第9図に示すように4つの方
向にコード化する。すなわち、−πθ<−7/8 π、−π/8θ<π/8、7/8πθ<πのとき方
向を “0”、−7/8πθ<−5/8π、π/8θ<3
/8πの とき方向を“1”、−5/8πθ<−3/8π、3/
8π θ<5/8πのとき方向を“2”、−3/8πθ<
− π/8、5/8πθ<7/8πのとき方向を“3”と
す る。第10図は、上記ストローク抽出手段9で求
めたストロークの方向を示したものであり、方向
“0”のストロークには“0”、方向“1”のスト
ロークには“1”、方向“2”のストロークには
“2”、方向“3”のストロークには“3”を付し
ている。
ストロークの長さは、始点から終点までの細線
化パターン上の点を順次追跡した時の経路の長さ
とする。ストロークの長さが決まると、予め定め
ておいた長さを閾値としてストロークを長さ別の
数個のグループに分類する。第11図は上記スト
ローク抽出手段9で求めたストロークをその長さ
によつて3つのグループに分類したものを示して
おり、長さlが、1l6、7l12、l
13のストロークをそれぞれ“4”、“5”、“6”で
表わしている。
またストロークの中点座標は上述した如く
〔(X1+X2)/2、(Y1+Y2)/2)〕で求める。
第12図は、上記処理によつて抽出した入力文字
パターンの方向“0”のストロークの中点パター
ンを示した図である。また第13図は方向“1”、
第14図は方向“2”、第15図は方向“3”の
ストロークの中点パターンを示した図である。第
16図は長さ1l6のストロークの中点パタ
ーンを示した図である。また第17図は長さ7
l12、第18図は長さl13のストロークの中
点パターンを示した図である。ストロークの中点
には、第6図のストローク記号A〜Hに対応した
記号を付けている。
第19図〜第25図は、同様の処理で得られた
漢字“金”の基準文字の方向“0”、方向“1”、
方向“2”、方向“3”、長さ1l6、長さ7
l12、長さl13の各ストロークの中点パタ
ーンを示した図である。
決定手段10においては、入力文字の方向別の
ストローク中点パターンと決定手段10に格納さ
れている基準文字の方向別中点パターンとから第
1の類似度と、入力文字の長さ別のストローク中
点パターンと決定手段10に格納されている基準
文字の長さ別中点パターンとから第2の類似度を
求め、この両者の類似度を使つて入力文字の文字
名を決定するが、そのためにはまずストロークの
対応づけを行う。具体的には第12図に示す方向
“0”の入力文字のストロークの中点35〜37
の各々について、第19図に示す基準文字の方向
“0”のストロークの中点38〜40のうちから
最も距離の近い点を選んで対応付ける。この例で
は、35〜37がそれぞれ38〜40に対応付け
られる。
方向“1”については、第13図に示す入力文
字のストロークの中点41〜42が第20図に示
す基準文字のストロークの中点43〜44に対応
付けられる。
方向“2”については、第14図に示す入力文
字のストロークの中点45が第21図に示す基準
文字のストロークの中点46に対応付けられる。
方向“3”についても、第15図に示す入力文
字のストロークの中点47,48が、第22図に
示す基準文字のストロークの中点49,50に対
応付けられる。
長さ1<l<6については、第16図に示す入
力文字のストロークの中点51,52,53が、
第23図に示す基準文字のストロークの中点5
4,55,56に対応付けられる。
長さ7<l<12については、第17図に示す入
力文字のストロークの中点57,58,59,6
0が、第24図に示す基準文字のストロークの中
点61,62,63,64に対応付けられる。
長さ13<lについては、第18図に示す入力文
字のストロークの中点65が、第25図に示す基
準文字のストロークの中点66に対応付けられ
る。
次に、上記方向別のストロークの対応付けで、
対応付けられた2点間の距離を加算し、その逆数
を基準文字に対する入力文字の第1の類似度とす
る。また、上記長さ別のストロークの対応付け
で、対応付けられた2点間の距離を加算し、その
逆数を基準文字に対する入力文字の第2の類似度
とする。
最後に、上記第1の類似度と第2の類似度を加
算して総合類似度を求め、この総合類似度が最も
大きい値を持つ基準文字を認識文字として決定す
る。
このように、方向別のストロークと長さ別のス
トロークの中点パターンを用いて認識しているの
で高い認識精度を得ることができる。」 なお、以上は手書き漢字を認識する場合につい
て説明したが、この発明は直線の多い文字、例え
ば手書きカタカナ文字等の認識に使用してもよ
い。
また、決定手段の決定方法として入力文字のス
トローク中点パターンと基準文字のストローク中
点パターンとを対応付け、その距離から類似度を
求めて決定する方法について説明したが、これに
限らず基準文字の予め重み付けられたストローク
の中点パターンと入力文字のストローク中点パタ
ーンを直接重ね合せて類似度を求めることによつ
て決定する方法を使用してもよい。
さらに、ストロークの長さについては、始点、
終点間の経路の長さを用いる場合について説明し
たが、これに限らず、始点、終点間のユークリツ
ド距離を使用してもよい。
以上のように、この発明によれば細線化した後
に抽出したストロークの中点パターンを用いて認
識しているので、線分の傾きの小さな変動や線幅
の変動に対しても安定であると共に、端点や分岐
点等の特徴点を特徴とする方法の欠点である文字
線の結合や分離に影響されにくいので高い精度で
手書き文字を認識できるという利点がある。
【図面の簡単な説明】
第1図及び第2図は入力文字パターンの変動
例、第3図はこの発明による装置の構成図、第4
図は細線化された入力文字パターンの例、第5図
は基本線分を抽出した入力文字パターンの例、第
6図はストロークを抽出した入力文字パターンの
例、第7図は入力文字パターンのストローク中点
パターンの例、第8図は基準文字のストローク中
点パターンの例、第9図は方向の種類、第10図
はストロークの方向を抽出した入力文字パターン
の例、第11図はストロークの長さを抽出した入
力文字パターンの例、第12図〜第15図は、入
力文字の方向別ストローク中点パターンの例、第
16図〜第18図は入力文字の長さ別中点パター
ンの例、第19図〜第22図は、基準文字の方向
別ストローク中点パターンの例、第22図〜第2
5図は、基準文字の長さ別ストローク中点パター
ンの例である。 図中7は走査手段、8は前処理手段、9はスト
ローク抽出手段、10は決定手段である。なお図
中、同一あるいは相当部分には同一符号を付して
示してある。

Claims (1)

  1. 【特許請求の範囲】 1 帳票などの記録媒体に記録された文字を認識
    する文字認識装置において、上記文字を走査して
    光電変換する走査手段と、この走査手段で得られ
    た入力文字パターンを細線化する前処理手段と、
    上記細線化された入力文字パターンから直線線分
    を抽出するストローク抽出手段と、このストロー
    ク抽出手段で得られた直線線分の中点パターンを
    用いて文字を決定する決定手段とを具備してな
    り、上記前処理手段において細線化された入力文
    字パターンから、上記ストローク抽出手段におい
    て端点、分岐点および屈折点などの特徴点を抽出
    してこれらを結ぶ線分を求め、この線分から端点
    以外の特徴点に連結している方向が等しい線分の
    対を結合することにより直線線分を抽出し、上記
    直線線分の中点パターンと、上記決定手段内にあ
    らかじめ格納されている基準文字パターンの直線
    線分の中点パターンとの類似度を用いて文字を認
    識することを特徴とする文字認識装置。 2 上記決定手段において、上記直線線分の方向
    別中点パターンと、決定手段内に予め格納されて
    いる基準文字パターンの直線線分の方向別中点パ
    ターンとの類似度を算出し、この類似度を用いて
    文字を認識することを特徴とする特許請求の範囲
    第1項記載の文字認識装置。 3 上記決定手段において、上記直線線分の長さ
    別中点パターンと、決定手段内に予め格納されて
    いる基準文字パターンの直線線分の長さ別中点パ
    ターンとの類似度を算出し、この類似度を用いて
    文字を認識することを特徴とする特許請求の範囲
    第1項記載の文字認識装置。 4 上記決定手段において、上記直線線分の方向
    別中点パターンと決定手段内に予め格納されてい
    る基準文字パターンの直線線分の方向別中点パタ
    ーンとの第1の類似度と、上記直線線分の長さ別
    中点パターンと決定手段内に予め格納されている
    基準文字パターンの直線線分の長さ別中点パター
    ンとの第2の類似度を算出し、この第1の類似度
    と第2の類似度を用いて文字を認識することを特
    徴とする特許請求の範囲第1項記載の文字認識装
    置。
JP56121615A 1981-08-03 1981-08-03 文字認識装置 Granted JPS5822479A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56121615A JPS5822479A (ja) 1981-08-03 1981-08-03 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56121615A JPS5822479A (ja) 1981-08-03 1981-08-03 文字認識装置

Publications (2)

Publication Number Publication Date
JPS5822479A JPS5822479A (ja) 1983-02-09
JPH026113B2 true JPH026113B2 (ja) 1990-02-07

Family

ID=14815633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56121615A Granted JPS5822479A (ja) 1981-08-03 1981-08-03 文字認識装置

Country Status (1)

Country Link
JP (1) JPS5822479A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010218128A (ja) * 2009-03-16 2010-09-30 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラム及び記録媒体

Also Published As

Publication number Publication date
JPS5822479A (ja) 1983-02-09

Similar Documents

Publication Publication Date Title
US5077805A (en) Hybrid feature-based and template matching optical character recognition system
JPH026113B2 (ja)
CN111160290A (zh) 一种提取手掌静脉有效区域的方法
JP2000076378A (ja) 文字認識方法
CN113642573B (zh) 一种基于栅格的图片分离方法
JP3095470B2 (ja) 文字認識装置
JP3622347B2 (ja) 帳票認識装置
JPH0246988B2 (ja)
JP2959054B2 (ja) パターン認識装置における線種判別方式
JP2930996B2 (ja) 画像認識方法および画像認識装置
JP4046907B2 (ja) オンライン文字認識装置及びオンライン文字認識方法
KR20050062748A (ko) 지문 정보를 이용한 사용자 인증방법 및 그 장치
JPS5850078A (ja) 文字認識装置
JPS61169968A (ja) 図形処理装置
JP2974396B2 (ja) 画像処理方法及び装置
JP2677007B2 (ja) 線判別システム
JP2925303B2 (ja) 画像処理方法及び装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JPH0215388A (ja) 文字認識装置
JP2001060250A (ja) 文字認識方法および装置
JP2963474B2 (ja) 類似文字識別方法
JP3084833B2 (ja) 特徴抽出装置
JP2002334301A (ja) 2値イメージの特徴点抽出方法及び特徴点抽出プログラム
JP4048716B2 (ja) オンライン文字認識装置
JPS61198385A (ja) 文字認識方式