JP2681599B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JP2681599B2
JP2681599B2 JP5224936A JP22493693A JP2681599B2 JP 2681599 B2 JP2681599 B2 JP 2681599B2 JP 5224936 A JP5224936 A JP 5224936A JP 22493693 A JP22493693 A JP 22493693A JP 2681599 B2 JP2681599 B2 JP 2681599B2
Authority
JP
Japan
Prior art keywords
character
information
contour
recognition
angle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP5224936A
Other languages
English (en)
Other versions
JPH0714003A (ja
Inventor
典弘 加藤
Original Assignee
典弘 加藤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 典弘 加藤 filed Critical 典弘 加藤
Priority to JP5224936A priority Critical patent/JP2681599B2/ja
Publication of JPH0714003A publication Critical patent/JPH0714003A/ja
Application granted granted Critical
Publication of JP2681599B2 publication Critical patent/JP2681599B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的読み取り手段に
より入力された、印刷文字、あるいは手書き文字の認識
装置に関する。
【0002】
【従来の技術】文字認識法の一つである輪郭追跡法に関
して、輪郭追跡そのものについては、これまでに特公昭
59−22994号広報や特開昭63−188286号
広報のような方法が公表されているが、輪郭を追跡した
上で、更にどのような特徴量を抽出し、正確な文字認識
に結びつけるかという点になると、これまで輪郭追跡法
で考案されてきた方法では、認識率に限界があった。
【0003】すなわち、従来の輪郭の特徴量の抽出方法
を大きく2つに分類すると、その方法の1つは、(A)
特開昭63−293691号広報のように、文字枠を縦
・横に何分割かし、それぞれのサブ文字枠に存在する方
向コードの数を特徴量とする方法があり、もう1つは、
(B)輪郭線をいくつかのセグメントに分割して、そこ
から簡単な特徴量を抽出し、これを特定手段に役立てる
という方法があった。
【0004】うち、(B)についての代表的な方法は、
特開昭59−22174号広報のように、輪郭線をある
閾値以上の屈折度を持つ凸部,凹部,あるいは直線部に
分類し、特徴量としてセグメントごとの曲率,セグメン
トの中心位置情報を用いる方 法であった。
【0005】
【発明が解決しようとする課題】しかし、(A)法にせ
よ、(B)法にせよ、輪郭追跡から抽出する特徴量を余
りに少ない情報にまとめ過ぎるため、入力された文字イ
メージの持つ微妙な特徴まで十分に反映して抽出できな
い欠点を有した。中でも(B)法は、曲率を用いて構造
解析しており、(A)法より高い認識率が期待されると
思われるが、曲率がある一定の閾値を超えるものを凸部
ないし凹部と定めている点で、曲率の評価を定性的にし
ている欠点がある。実際に存在する文字イメージの認識
の際には、一定の閾値をもって凸部や直線部に区別でき
ない微妙な形も存在することが多く、これらのイメージ
に対して定性的に評価するのでは、認識率にどうしても
限界を生じてしまう。また、輪郭線を凸,凹等の特徴で
数個の領域に絞ってまとめること自体、文字イメージの
評価を粗なものにしてしまっている。
【0006】従って、従来の方法では、例えば「5」と
「S」は、印刷文字で画質がよければ区別できるが、画
質が悪くて文字がつぶれたり、手書き文字である場合な
どは区別が難しかった。また、図2に示すような「a」
という文字について、特徴抽出の段階で、(1),
(2),(3)間の字体を同じ文字としてではなく、別
の文字として評価することもあり得た。
【0007】このように従来の方法では、文字イメージ
の持つ微妙な特徴まで反映することができないため、異
なるフォント間の近似性の評価と、似ているが異なる文
字の違いの区別などの問題を同時に解決できず、その認
識率には限界があった。
【0008】それに対し、文字イメージの持つ微妙な特
徴まで認識に反映させ、近似性の評価と、違いの区別の
問題を同時に解決する、柔軟性のある認識アルゴリズム
を実現したのが今回の発明である。
【0009】
【課題を解決するための手段】輪郭追跡法により得られ
る、文字イメージの輪郭点の位置情報,角度,角度変化
率を、単純にまとめてしまわず、その文字の特徴情報と
してそのまま用いる。特に角度変化率は文字イメージの
特徴を最もよく反映する重要な情報であるが、これを従
来のように、凸部,凹部,直線部等に定性的には評価せ
ず、あくまでも定量的に認識に利用する。
【0010】すなわち、認識対象となる文字情報と参照
情報のそれぞれ対応する点の間の2次元の位置情報(通
常、x,y),角度(θ),角度変化率(dθ)からな
る4次元の距離を算出し、これを全ての輪郭点について
加算してゆき、その値の最も小さくなる参照情報を認識
結果として特定するという、特徴抽出・特定手段を用い
る。
【0011】ただし、ここで言う輪郭点とは、後で実施
例の所で述べているように、一定の数に圧縮・平均化処
理された輪郭点のことをさす。
【0012】
【作用】入力された文字イメージから、文字の輪郭情報
を抽出して1次元の文字情報に展開し、その輪郭情報
(2次元の位置情報,角度,角度変化率)から求められ
る、被認識側と参照側の間の4次元の距離を認識に使う
ことにより、柔軟な高い認識率を実現する。
【0013】
【実施例】図1に本発明の文字認識装置に関する処理ブ
ロック図を示す。
【0014】まず図3に文字輪郭の追跡の実際を図示す
る。図4は、追跡のアルゴリズムの1例を具体的に示し
たフローチャートである。入力された画像のうちの文字
イメージを構成する画素を着目画素とし、その回りの画
素を一定の方向に走査する(図3−a)。これを多数の
文字イメージ構成画素に拡大して応用したのが図3−b
である。走査時、背景を構成する画素はやり過ごし、文
字イメージ構成画素にあたったら着目画素をその文字イ
メージ構成画素に移して同様の走査を行う。これを繰り
返して行くと、文字イメージ構成画素の輪郭を1回りし
てもとに戻って走査は終了する。この結果、1つの認識
の対象になる図形に対して、1つの閉鎖された直列の輪
ができあがる。この際、着目画素の動きより、着目画素
のたどったx座標、y座標、着目点の動きの方向、つま
り角度(θ)、更に角度変化率(dθ)を算出する。た
だし、角度(θ)及び角度変化率(dθ)は図5のよう
に求められ、以下の式で算出される。(単位:度)dx
>0の時:
【数1】 θ=tan-1(dy/dx) dx<0かつdy≧0の時:
【数2】 θ=tan-1(dy/dx)+180 dx<0かつdy<0の時:
【数3】 θ=tan-1(dy/dx)+180 dx=0かつdy>0の時:θ=90 dx=0かつdy<0の時:0=−90
【数4】 dθ=θi−θi-1 これで人間が認識するのに必要な、文字の形に関する全
ての情報を含んでいる。つまり、線の終点、交わり、微
妙なカーブであるか直線かは角度変化率(dθ)で表現
され、それらの位置に関する情報も得られる。この方式
の利点はまず、輪郭追跡法に共通することであるが、
雑な2次元の文字の形を、機械で処理し易い簡単な1次
元の情報に圧縮・変換できることにある。更に本法固有
の利点は、構造解析法のように線の端点など、定性的に
形に関する情報を記述せずに、あくまで角度変化率(d
θ)で定量的に表現することにより、柔軟性を保つこと
にある。
【0015】ただし、ここでは着目画素は1点で走査は
右回りとして説明したが、着目画素を2点、4点、叉は
斑状に設定しても良いし、走査も、左回りでも同じであ
る。また、座標系に関しても、x,y座標に限らず、
r,θ系を利用してもよい。x,y座標系の原点は、文
字を構成する画素の平均値つまり重心、または輪郭線上
の画素の平均値を用いて、そこを原点とする方法があ
る。平均値の代わりに中央値を用いても良いが、平均値
を原点とする方が認識率が良い。また、文字イメージの
輪郭の追跡法は、上に示したように一度に一回りする方
法だけでなく、いくつかの部分叉は細片にして分けて追
跡したものを後でつなぎ合わせて、上記のような1次元
の文字情報を作り上げる方法もある。
【0016】実際の文字認識の例として、「6」の例を
図6に示す。まず文字イメージ構成画素を探索し、文字
イメージ構成画素にぶつかったら上記の走査を開始する
(図6−a)。文字情報の閉じた一次元情報は、「6」
の場合2つできる。すなわち、外側の輪郭を追跡した情
報(ライン1)と、「6」のうち閉じた輪の形になって
いる下の部分の内側の輪郭を追跡した情報(ライン2)
である。ただし、閉じた輪の内側をこの方式で走査する
と、図6−a,bに示すように、外側の輪郭のときの逆
回り(ここでは左回り)となる。つまり角度(θ)が逆
になり、平行して走る輪郭線が、外側のものなのか、内
側なのかの区別ができる。これも本法を始め、いくつか
の輪郭追跡法に共通する利点の1つではある。このよう
にして得られた文字輪郭の追跡情報は、上記の如く、2
次元の位置情報(x,y),角度(θ),角度変化率
(dθ)の情報からなる(図6−c)。この文字情報
は、このままでは追跡した輪郭の点の数だけあり、文字
の大きさに比例して点の数が増えるので、比較認識のた
め、また処理時間の節約のため、文字の大きさの情報
(1例として、1つの文字を構成する点の集合の平均値
と標準偏差)を利用して、文字情報の長さ、つまり点の
数、が同じになるように、文字輪郭の情報を数十個の点
に圧縮・平均化処理を施す。これを辞書に登録し、ある
いは被認識データとして利用する。こうして大きさの違
う文字でも、純粋にその形のみから比較することができ
るようになる。
【0017】さらに、図7に本法の利点を示す。これは
「8」の認識例であるが、図7−aは、完全な形をし
た、「8」である。ところが実際問題として、光学的読
み取り装置で読み込んだ画像データに完全な形の「8」
のみということは皆無に近く、図7−bのように文字線
がかすれて切れてしまった不良データが必ずと言ってい
いほど存在し、こういった不良画像にも対応しないと実
用性はない。本方式では、このように文字線が切れてし
まっても、「8」の開かれてしまった内側の線の追跡方
向は、図7−aと同じであり、図7−bの「8」と、図
7−aの「8」の近似性が保たれる。同時に図7−bの
「8」は、文字線の切れてしまったところでの角度変化
率(dθ)の変化を示し、図7−aの完全な形の「8」
との違いについても記述されており、文字の形の近似
性、と同時に微妙な違いに関する詳細な情報も含まれ
る。
【0018】図8に、上記の方法によって得られた文字
情報を使った、認識の実際を示す。図8−aは「2」と
「3」を比較しているところである。「2」が辞書側、
「3」が被認識文字とすると、まず、辞書側「2」の輪
郭上にある、位置情報(x,y),角度(θ),角度変
化率(dθ)の情報を含む数十個の点のうちの、第一番
目の点(着目点と呼ぶ)から比較走査が始まる。被認識
側の「3」の輪郭上のやはり同様の情報を含む点を順次
走査して行き、その辞書側の点と被認識側の点の間の、
xの差:Δx,yの差:Δy,θの差:Δθ,dθの
差:Δdθの4項目について考慮した、4次元の距離D
iが算出される(図8−b)。式1:
【数5】 Di=√{Δx2+Δy2+Δθ2+Δdθ2} 被認識側「3」の輪郭上の点のうち、このDiの最も小
さくなる点(Di−min)が、先ほどの辞書側「2」
の着目点に対応する点ということになる。この操作を辞
書側「2」の1番目の点から最後の点まで順次施行し、
式2:
【数6】 Score=ΣDi−min のようにDi−minの総和をもって、Scoreとし
て計算する。このScoreの小さい時には、比較した
2つの字形が似ていることを示し、Scoreが大きい
ときは、2つの字形が異なる可能性が高いことを意味す
る。
【0019】ただし認識時間の節約のために式1,2で
√をかけず、Diの2乗を使ってScoreの計算をし
ても良い。また、上記の説明では、辞書側から、被認識
側を見る形で認識をしているが、逆に被認識側から辞書
側を見る形で認識をしても同じである。また、4次元の
距離Diを求める際に
【数7】 Di=√{c1Δx2+c2Δy2+c3Δθ2+c4Δdθ2} の様に定数をかけて重みづけする方法もある。実験結果
では、Δdθの2乗に重みづけすると認識率が良かっ
た。
【0020】
【発明の効果】本発明によれば、文字イメージの持つ微
妙な特徴まで認識に反映させ、文字の近似性と微妙な違
いを同時に評価することができて、柔軟な認識が可能で
あり、印刷文字はもちろん、手書き文字に対しても、実
用的な高い認識率を実現する。
【0021】
【図面の簡単な説明】
【図1】本発明の文字認識装置の処理ブロック図。
【図2】文字認識の例。
【図3】文字輪郭の追跡の実際(基本図)。
【図4】文字輪郭の追跡のアルゴリズムを示したフロー
チャート。
【図5】角度及び角度変化率の算出法。
【図6】文字輪郭の追跡の実際(応用図)。
【図7】本発明における認識の有利な点の解説図。
【図8】認識の実際。
【符号の説明】
10: 特徴抽出手段 11: 文字イメージ輪郭追跡部 12: 位置情報,角度,角度変化率算出部 20: 特定手段 30: 参照情報 301:着目画素 500:文字イメージ構成画素の探索走査 501:ライン1 502:ライン2

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された文字イメージの輪郭の位置情
    報,角度,角度変化率を求めて文字を認識する文字認識
    装置において、文字情報を複数の参照情報の何れか1つ
    に特定する特定手段は、入力された文字情報及び参照情
    報のそれぞれの対応する点の間の、2次元の位置情報,
    角度,角度変化率を考慮した、4次元の距離に対応する
    数値を計算し、これを全ての点について加算し、その値
    の最も小さくなる参照情報を特定する手段からなること
    を特徴とする文字認識装置。
JP5224936A 1993-06-26 1993-06-26 文字認識装置 Expired - Fee Related JP2681599B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5224936A JP2681599B2 (ja) 1993-06-26 1993-06-26 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5224936A JP2681599B2 (ja) 1993-06-26 1993-06-26 文字認識装置

Publications (2)

Publication Number Publication Date
JPH0714003A JPH0714003A (ja) 1995-01-17
JP2681599B2 true JP2681599B2 (ja) 1997-11-26

Family

ID=16821512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5224936A Expired - Fee Related JP2681599B2 (ja) 1993-06-26 1993-06-26 文字認識装置

Country Status (1)

Country Link
JP (1) JP2681599B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5922174A (ja) * 1982-07-28 1984-02-04 Toshiba Corp 図形認識装置
JPH061504B2 (ja) * 1987-05-27 1994-01-05 富士電機株式会社 特徴抽出回路

Also Published As

Publication number Publication date
JPH0714003A (ja) 1995-01-17

Similar Documents

Publication Publication Date Title
Madhvanath et al. Chaincode contour processing for handwritten word recognition
Cheung et al. An Arabic optical character recognition system using recognition-based segmentation
Cao et al. Text/graphics separation in maps
CN109446895B (zh) 一种基于人体头部特征的行人识别方法
Hori et al. Raster-to-vector conversion by line fitting based on contours and skeletons
JP3830998B2 (ja) 罫線除去方法及びこれを用いた文字認識装置
CN108009538A (zh) 一种汽车发动机缸体序列号智能识别方法
US6937765B2 (en) Method for contour extraction for object representation
CN103279770A (zh) 基于笔画片段和轮廓特征的笔迹识别方法
Steinherz et al. Offline loop investigation for handwriting analysis
Elliman Tif2vec, an algorithm for arc segmentation in engineering drawings
Wang et al. Detection of curved and straight segments from gray scale topography
CN110378337B (zh) 金属切削刀具图纸标识信息视觉输入方法及系统
JP2681599B2 (ja) 文字認識装置
JP4543675B2 (ja) 文字・図形の認識方法
CN107067009B (zh) 一种实时杆号识别方法
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
Omachi et al. Structure extraction from decorated characters using multiscale images
Di Mauro et al. Active Shape Model Search using Pairwise Geometric Histograms.
JP3164835B2 (ja) 人物画像認識における前処理方法および後処理方法
JP2871590B2 (ja) 画像抽出方式
Bushofa et al. Segmentation and Recognition of Printed Arabic Characters.
RU2163394C2 (ru) Способ идентификации материальных объектов
Kleber et al. Document reconstruction by layout analysis of snippets
JP3077929B2 (ja) 文字切出し方式

Legal Events

Date Code Title Description
R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees