JPH0773275A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0773275A
JPH0773275A JP5218280A JP21828093A JPH0773275A JP H0773275 A JPH0773275 A JP H0773275A JP 5218280 A JP5218280 A JP 5218280A JP 21828093 A JP21828093 A JP 21828093A JP H0773275 A JPH0773275 A JP H0773275A
Authority
JP
Japan
Prior art keywords
curvature
character
feature value
directive
directional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5218280A
Other languages
English (en)
Inventor
Akiko Konno
章子 紺野
Yasuo Hongo
保夫 本郷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP5218280A priority Critical patent/JPH0773275A/ja
Publication of JPH0773275A publication Critical patent/JPH0773275A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 特徴量の次元数,辞書容量または認識時間の
増大を抑えながら、文字認識精度の向上を図る。 【構成】 従来と同様に、4または8方向の方向特徴量
を符号1,2,4〜9,14〜17の各部によって求め
る一方、符号10〜13の各部で曲率特徴量,直線度を
求め、これらを総合類似度計算部18で総合することに
より、曲線を多く含む文字も高精度に認識し得るように
する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、方向性特徴を用いて
文字を認識する文字認識装置に関する。
【0002】
【従来の技術】光学式文字認識装置(OCR)による文
字認識手法には、原パターンを正規化したものを特徴量
とする方式、方向性の微分を行なった結果の画像を特徴
量とする方式、定位置に配置したセルから各ストローク
への方向・距離を特徴量とする方式、ストローク構造を
解析する方式など様々な手法がある。その中の1つとし
て、文字パターンと背景の境界部分の方向性を特徴量と
し、特徴間のマッチング度合いを2つのパターンの特徴
ベクトル空間の相関値から求めた類似度cosθで計測
する方法がある。
【0003】
【発明が解決しようとする課題】この2次元特徴相関法
は文字のストローク、または背景を4または8方向の方
向性微分画像を特徴量とすることにより表現したもので
あるが、比較的直線成分が多い明朝体やゴシック体の印
刷漢字については効果があることが確認されている。し
かし、印刷漢字でもゆるやかな曲線成分を多く含む平仮
名や教科書体の文字に対しては、このような4方向また
は8方向の方向性特徴だけでは対応できず、認識精度が
低下するという問題がある。
【0004】また、手書き文字に対しても、限られた方
向の方向性特徴だけでは認識精度に限界がある。これを
解決するためには、方向の刻みを16,32と増加させ
る方法もあるが、もとの画像の並びが格子状であること
から、8方向を越える方向に対しては方向性特徴量自体
の精度が低下するだけでなく、特徴量の次元数,辞書容
量,認識時間などが増加するという問題がある。したが
って、この発明の課題は特徴量の次元数,辞書容量,認
識時間などの増大を抑えながら認識精度を向上させるこ
とにある。
【0005】
【課題を解決するための手段】このような課題を解決す
るため、この発明では、方向性特徴量を用いて文字の認
識を行なう文字認識装置において、1文字単位で切り出
された文字画像から文字の縦横のサイズを抽出する文字
サイズ抽出手段と、文字画像の線密度から文字の複雑度
を算出する複雑度算出手段と、4または8方向の2次元
方向性特徴量を抽出する方向性特徴量抽出手段と、前記
文字サイズと複雑度から輪郭画素の平滑化条件を決定す
る平滑化条件決定手段と、決定された平滑化条件で輪郭
画素の曲率を求め、その絶対値の大きい部分を特徴量と
して抽出する曲率特徴量抽出手段と、この曲率値の分散
から文字を構成するストロークの直線度を計算する直線
度算出手段と、前記方向性特徴量,曲率特徴量を用いて
未知パターンと辞書パターンとの間の各相関値を求め、
これらに前記直線度による重み係数をそれぞれ掛けて加
算することにより総合類似度を求める総合類似度演算手
段とを設け、この総合類似度から文字の認識を行なうこ
とを特徴としている。
【0006】
【作用】従来の方向性特徴量に加え、境界成分の曲率を
特徴量として導入する。この境界成分の曲率はそのまま
では誤差が大きく、特徴量として使用できないので、ま
ず線密度等によって文字の複雑度を計測し、文字のサイ
ズと複雑度に応じて曲率の平滑化係数を変える。そし
て、このようにして求めた方向性特徴と曲率特徴を総合
して文字認識を行なう。この場合の方向性特徴と曲率特
徴の重みは未知パターンから求めた直線度により、パタ
ーンが直線を多く含む場合は方向性特徴の比重を重く
し、一方、曲線が多い場合は曲率特徴の比重を重くして
それぞれ認識を行なう。
【0007】
【実施例】図1はこの発明の実施例を示すブロック図で
ある。同図において、1はOCRに入力される文書、2
は画像入力装置としてのイメージスキャナを示し、3は
OCR全体を示す。4は文字画像入力部でイメージスキ
ャナ2を制御し、文書画像を画像メモリに格納する。5
は行切出し部で、文書画像からテキストの書かれた行を
抽出する。6は文字切出し部で、1文字ずつの画像を切
り出す。
【0008】7は1文字認識ブロックであり、6で切り
出された1文字画像について認識を行なう。8は文字画
像からノイズを除去する部分、9はノイズ除去された文
字画像から文字サイズおよび線密度を計測するサイズ・
複雑度計測部である。10はこの複雑度と文字画像から
輪郭線の曲率特徴量を算出する曲率特徴量算出部、11
はこれを規定のサイズに正規化する正規化部、13は認
識対象の各文字についての曲率特徴量を格納している辞
書、12は11で正規化された入力パターンの曲率特徴
と、13の曲率特徴量辞書との相関演算を行ない、曲率
類似度を求める相関演算部である。
【0009】14は従来と同様の方法により、4方向ま
たは8方向の方向性微分により方向性特徴量を算出する
方向性特徴量算出部、15はこの特徴量のサイズを正規
化する正規化部、16はこうして得られた方向性特徴量
と、方向性特徴量辞書17に記憶されている認識対象の
文字についての方向性特徴量との相関値を求める相関演
算部である。18は曲率類似度と方向性類似度とに適当
な重み係数を掛け合わせて加算することにより、総合類
似度を求める総合類似度計算部である。19は総合類似
度の大きい順にソーティングを行ない、文字認識結果を
出力するソーティング部、20は文字単位の認識結果に
対して、知識処理等により後処理を施す後処理部であ
り、21が最終的に得られた認識結果を示す。
【0010】図2は図1における認識手順を説明するた
めのフローチャートである。まず、入力パターンについ
てノイズの除去を行ない(ステップS1)、ついでステ
ップS2で文字サイズ(高さ,幅)、ステップS3で複
雑度Fをそれぞれ計測する。その後、一方では方向性特
徴の抽出(ステップS4)、他方では輪郭画素の曲率特
徴抽出,パターンの直線度αpの計算(ステップS6)
を行ない、それぞれ正規化した後(ステップS5,S
7)、各辞書カテゴリとの方向性特徴量の相関値Djを
計算し(ステップS9)、他方では各辞書カテゴリとの
曲率特徴量相関値Cjを計算する(ステップS10)。
これらに対し、入力パターンの直線度αpによる重み付
けをして加算することにより、総合類似度Tjを求める
(ステップS11)。総合類似度の大きい順にソーティ
ングを行ない(ステップS12〜14)、ステップS1
5で認識結果を出力する。
【0011】図3は図1における辞書作成手順を説明す
るためのフローチャートである。まず、カテゴリ内の第
1番目(i=1)のパターンから順に、ノイズ除去,文
字サイズ(高さ,幅)の計測および文字の複雑度Fの計
測を行なう(ステップS1〜4)。その後は、並列に2
つの特徴量の計算を行なう。一方では、従来と同様に方
向性特徴量の抽出,サイズの正規化を行ない、得られた
特徴量di1 〜di8 を辞書領域へ足し込む(ステップ
S5〜7)。もう一方では、文字のサイズに比例し、複
雑度に反比例するような平滑化区間を設定し、輪郭画素
の曲率画像を求める(ステップS8)。これについて
も、同様にサイズの正規化を行ない、得られた特徴量c
+ 〜ci- を、それぞれ辞書C+ ,C- に足し込む
(ステップS9,10)。これをカテゴリ内の全パター
ンに対して行なった後正規化し、1つのカテゴリに対す
る辞書作成を終了する(ステップS11〜13)。
【0012】以下、具体的に説明する。図4に、文字画
像例を示す。これは、教科書体の漢字「乙」の例であ
る。この文字は直線と曲線とからなっているが、字体に
よって曲線の曲がり方が異なり、平仮名の「て」として
誤読されることも多い。なお、この文字の複雑度Fは、
例えば次の数1〜数5で示されるような、線の立ち上が
りをカウントする関数から求めることができる。
【0013】
【数1】
【数2】
【数3】
【数4】
【数5】
【0014】図4に示す文字画像から求まる複雑度は、
次のようになる。 Fx=1.38 Fy=2.67 F =2.04
【0015】図4に示す文字画像から、従来方式により
8方向の方向性特徴(ストローク)を抽出する方法につ
いて、説明する。図5は8方向を説明するための説明
図、図6は方向性特徴を抽出するための3×3の局部メ
モリ構成図、図7は方向性特徴を抽出するための方向性
微分オペレータ例を示す説明図、図8は図4に対応する
微分画像例である。なお、図7(イ),(ロ)は良く知
られているSobelオペレータの例であるが、方向性
の抽出が可能な他のオペレータで代用することができ
る。
【0016】まず、図6の局部領域に図7(イ),
(ロ)に示すSobelオペレータを掛け合わせて次の
数6,数7のように微分値∇x(x,y),∇y(x,
y)を求める。図4に対する微分画像例を図8に示す。
さらに、これを用いて数8のように境界成分の方向θ
(x,y)、すなわち角度を算出する。
【数6】
【数7】
【数8】 以上のようにして求めた境界成分の方向θ(x,y)
を、境界成分の輪郭順に並べた結果を図9に示す。
【0017】曲率は、或る点I(x,y)での方向θ
(x,y)の変化量(角度の変化量)として表わすこと
ができる。ここでは、曲率K(x,y)を次の数9によ
り求める。ただし、数9の(xi,yi)は輪郭点列の
座標を示し、iの順に境界成分が並んでいることを示し
ている。また、図4の画像について、下記数9により求
めた曲率K(x,y)を図10に示す。この図10では
平滑化区間をw=4としたが、この平滑化係数wは前に
求めた文字のサイズにほぼ比例し、文字の複雑度に反比
例するものである。
【数9】
【0018】この曲率値を正規化し、絶対値が或るしき
い値(ここでは、π/2)以上の値を持つ画素だけを+
面(曲率>0)と−面(曲率<0)に分けて、画像の形
に戻したものを図11(イ),(ロ)に示し、これを曲
率特徴量とする。この曲率特徴量が出ている点は輪郭の
方向の変化が大きい点であり、同(イ)の+面は凸の
面、同(ロ)の−面は凹の面を示しており、黒塗りの部
分が曲率の大きい頂点部分である。また、同(イ)の矢
印は画像の追跡方向を示している。
【0019】ここで、未知パターンの正規化された方向
性特徴量ベクトルをd1 〜d8 、同じく正規化された曲
率特徴量ベクトルをc+ ,c- とし、辞書jの方向性特
徴量ベクトルをdj1 〜dj8 、同じく正規化された曲
率特徴量ベクトルをcj+ ,cj- とすると、未知パタ
ーンと辞書の方向性特徴相関値Dj、および曲率特徴相
関値Cjは、次の数10,数11および数12により求
められる。なお、Nkは特徴量ベクトルDkの次元数を
示す。また、a・bはベクトルaとベクトルbの内積を
示し、符号を二重線で囲んでそのノルムを表わす。
【0020】
【数10】
【数11】
【数12】
【0021】また、曲率特徴量ベクトルから曲線の分散
に比例する直線度αpが求められるので、方向性特徴相
関値Djおよび曲率特徴相関値Cjに直線度αpを掛け
て、総合相関値Tjを次の数13により求める。
【数13】
【0022】
【発明の効果】この発明によれば、従来の方向性特徴量
に加えて輪郭画素の曲率特徴量を導入し、直線を多く含
むパターンは従来の方向性特徴量の比重を重くし、曲線
を多く含むパターンに対しては方向性特徴量の比重を少
なくし、曲率特徴量を主体に曲率変化点位置(頂点等)
を特徴として認識するようにしたので、曲線の多いパタ
ーンに対しても高精度の認識が可能となる利点が得られ
る。
【図面の簡単な説明】
【図1】この発明の実施例を示すブロック図である。
【図2】図1における認識手順を説明するためのフロー
チャートである。
【図3】図1における辞書作成手順を説明するためのフ
ローチャートである。
【図4】文字画像例を示す説明図である。
【図5】方向の定義を説明するための説明図である。
【図6】局部メモリを説明するための説明図である。
【図7】微分オペレータの例を説明するための説明図で
ある。
【図8】図4に対する微分画像例を説明するための説明
図である。
【図9】輪郭画像の方向(角度)を説明するための説明
図である。
【図10】輪郭画像の曲率を説明するための説明図であ
る。
【図11】曲率特徴量を説明するための説明図である。
【符号の説明】
1…文書、2…イメージスキャナ、3…文字認識装置、
4…文字画像入力部、5…行切出し部、6…文字切出し
部、7…1文字認識ブロック、8…ノイズ除去部、9…
サイズ・複雑度計測部、10…曲率特徴量算出部、1
1,15…正規化部、12,16…相関演算部、13…
曲率特徴量辞書、14…方向性特徴量算出部、18…総
合類似度計算部、19…ソーティング部、20…後処理
部、21…認識結果。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】 方向性特徴量を用いて文字の認識を行な
    う文字認識装置において、 1文字単位で切り出された文字画像から文字の縦横のサ
    イズを抽出する文字サイズ抽出手段と、 文字画像の線密度から文字の複雑度を算出する複雑度算
    出手段と、 4または8方向の2次元方向性特徴量を抽出する方向性
    特徴量抽出手段と、 前記文字サイズと複雑度から輪郭画素の平滑化条件を決
    定する平滑化条件決定手段と、 決定された平滑化条件で輪郭画素の曲率を求め、その絶
    対値の大きい部分を特徴量として抽出する曲率特徴量抽
    出手段と、 この曲率値の分散から文字を構成するストロークの直線
    度を計算する直線度算出手段と、 前記方向性特徴量,曲率特徴量を用いて未知パターンと
    辞書パターンとの間の各相関値を求め、これらに前記直
    線度による重み係数をそれぞれ掛けて加算することによ
    り総合類似度を求める総合類似度演算手段と、 を設け、この総合類似度から文字の認識を行なうことを
    特徴とする文字認識装置。
JP5218280A 1993-09-02 1993-09-02 文字認識装置 Pending JPH0773275A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5218280A JPH0773275A (ja) 1993-09-02 1993-09-02 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5218280A JPH0773275A (ja) 1993-09-02 1993-09-02 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0773275A true JPH0773275A (ja) 1995-03-17

Family

ID=16717384

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5218280A Pending JPH0773275A (ja) 1993-09-02 1993-09-02 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0773275A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012147844A1 (ja) * 2011-04-27 2012-11-01 日本電気株式会社 物体又は形状の認識又は検索方法およびそのシステムおよびそのプログラム
CN116612483A (zh) * 2023-07-19 2023-08-18 广州宏途数字科技有限公司 一种智能笔手写矢量的识别方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012147844A1 (ja) * 2011-04-27 2012-11-01 日本電気株式会社 物体又は形状の認識又は検索方法およびそのシステムおよびそのプログラム
CN116612483A (zh) * 2023-07-19 2023-08-18 广州宏途数字科技有限公司 一种智能笔手写矢量的识别方法及装置
CN116612483B (zh) * 2023-07-19 2023-09-29 广州宏途数字科技有限公司 一种智能笔手写矢量的识别方法及装置

Similar Documents

Publication Publication Date Title
JP3027321B2 (ja) 拘束のない手書き英数字のオンライン認識の方法及び装置
JP3453134B2 (ja) 複数の記号ストリングの等価性を判定する方法
US9418283B1 (en) Image processing using multiple aspect ratios
KR100658119B1 (ko) 문자 인식 장치 및 방법
Liu et al. Handwriting recognition: soft computing and probabilistic approaches
US8588529B2 (en) Method and system for detecting text in raster images
EP2534612B1 (en) Efficient scale-space extraction and description of interest points
US20120002867A1 (en) Feature point generation system, feature point generation method, and feature point generation program
JPH06348896A (ja) 文字の切り出し方法及びその装置
JP4300098B2 (ja) オブジェクト識別方法とその装置、プログラム及び記録媒体
CN111444907A (zh) 文字识别的方法、装置、设备及存储介质
Mohammadpoor et al. A novel method for persian handwritten digit recognition using support vector machine
CN105844299A (zh) 一种基于词袋模型的图像分类方法
JPH0773275A (ja) 文字認識装置
Saon Cursive word recognition using a random field based hidden Markov model
US20240104890A1 (en) Image processing device, recording medium, and image processing method
JP2770849B2 (ja) 画像処理装置
Lattner et al. A combination of machine learning and image processing technologies for the classification of image regions
JP2909604B2 (ja) ファジイパターン認識方法及び装置
JP2576350B2 (ja) 文字列抽出装置
Sadri et al. Statistical characteristics of slant angles in handwritten numeral strings and effects of slant correction on segmentation
Chen et al. Independent component analysis segmentation algorithm
KR940007935B1 (ko) 문자 인식을 위한 후보 분류 방법
Mahmood et al. Surface Patch Detection of 3D Point Cloud Using Local Shape Descriptor
JPH08315155A (ja) 図形前処理装置