JPH03229388A - 文字認識装置及び文字認識方法 - Google Patents

文字認識装置及び文字認識方法

Info

Publication number
JPH03229388A
JPH03229388A JP2024940A JP2494090A JPH03229388A JP H03229388 A JPH03229388 A JP H03229388A JP 2024940 A JP2024940 A JP 2024940A JP 2494090 A JP2494090 A JP 2494090A JP H03229388 A JPH03229388 A JP H03229388A
Authority
JP
Japan
Prior art keywords
curvature
image
point
code
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2024940A
Other languages
English (en)
Inventor
Ryoichi Yushimo
良一 湯下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2024940A priority Critical patent/JPH03229388A/ja
Publication of JPH03229388A publication Critical patent/JPH03229388A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は2値画像の形状解析を行うことによって文字の
認識を行なう文字認識装置に関するものである。
従来の技術 近年、文字認識装置や図形認識装置などをコンピュータ
等の入力装置として利用しようとする要求が高まってい
る。文字認識装置や図形認識装置といった画像認識シス
テムでは入力された画像の形状の特徴を安定かつ効率的
に抽出する画像解析装置をもつことがシステムの性能向
上にとって不可欠である。
従来、文字認識装置の、形状特徴の抽出方法として、画
素列がどの方向にどのくらいの角度で向きを変えている
かという曲率コードを求め、この曲率コードを数画素お
きに平滑化することにより局所的な形状の変化の影響を
最小限に抑え、大局的な形状の変化に注目して、画素列
が直線を形成している部分を直線部、右回りの曲線を形
成している部分を右回り曲線部、左回りの曲線を形成し
ている部分を左回り曲線部として、画素列を区分し、ど
のようなストローク成分で画像が構成されているかを知
る事により、大局的な形状特徴を抽出するという方法が
あった。この方法では画素列が形成する形状について直
線と曲線の区別しか行っていなかった。
発明が解決しようとする課U 上記で説明したように従来の文字認識装置は、画素列が
形成する形状を曲線の曲率によって区別しており文字の
認識のための特徴量としては不十分であった。
課題を解決するための手段 この課題を解決するために本発明は、読み取った身事パ
ターンを線分に分割した後、各線分に対して曲率を検出
する手段を設けるとともに、この曲率検出手段によって
検出された曲率に基づいて、各線分に屈曲点があるか否
かを検出する区点検出手段を設け、各線分に曲率と屈曲
点とを文字パターンの特徴量として、文字の認識を行な
うようにする。
作用 この構成によって、読み取った文字パターンの特徴とし
て線分に分割した各線分の曲率と、屈曲点の有無とを用
いて文字の認識を行なう。
実施例 以下、本発明の一実施例における文字認識装置を示す添
付図面とともに説明する。
第1図は本実施例の構成を示すブロック図である。第1
図において、1は原画像として2値画像データを入力し
、画像メモリに記憶する画像入力部、2は入力された2
値画像を画像メモリから取り出し、画素の連結関係を維
持したまま細線化処理を行い細線画像を細線画像記憶メ
モリに記憶する細線化処理部、3は細線化処理が施され
た細線画像を細線画像記憶メモリから取り出し交点や分
岐点を含まない画像に変換し分割画像記憶メモリに記憶
する画像分割処理部、4は画像分割処理が施された分割
画像を分割画像記憶メモリから取り出し画素の連結方向
の変化をコード化して曲率コードを生成し曲率コード記
憶メモリに記憶する曲率コード生成部、5は曲率コード
を曲率コード記憶メモリから取り出し曲率コードにより
線分が屈折している点、すなわち加点を求める屈点検田
部、6は曲率コード及び加点における角度、両側の加点
までの距離により注目する加点の属性コード付与する加
点属性コード付与部、7は各屈点間の距離及び各加点の
属性コードにより形状コードを生成する形状コード生成
部、8は原画像を記憶する画像メモリ、9は細線画像を
記憶する細線画像記憶メモリ、10は分割画像を記憶す
る分割画像記憶メモリ、11は曲率コードを記憶する曲
率コード記憶メモリ、12は各加点の座標及び属性コー
ドを記憶する加点情報記憶メモリ、13は図形特徴記憶
メモリ、14は1から13の各部をつなぐ内部バスであ
る。
以上のように構成された本実施例の文字認識装置につい
て、第2図に全体の処理の流れ図を示すとともに、文字
「5」を原画像としたときを例に、以下その動作を説明
する。
文字「5」のイメージ画像を画像入力部にて2値画像と
して入力し、これを原画像として画像メモリに記憶する
。入力された原画像を第3図に示す。
原画像は、細線化処理部にて画像メモリから取り出され
、線幅が1となる様に8連結型の細線化処理を行い処理
結果を細線画像として細線画像記憶メモリに記憶する。
細線化は画素の連結関係を維持したまま行い、第4図の
様な結果を得る。
細線画像は、画像分割処理部により取り出され第5図の
ような1画素当り4ビツトの構成の分割画像記憶メモリ
のbit3に白画素は01黒画素は1として蓄えられ、
画像分割処理が施される。
第6図に画像分割記憶処理の流れ図を例として示し、以
下説明する。
画像分割処理部ではまず分割画像記憶メモリに記憶され
た細線画像に対して端点、交点、分岐点の検出が行われ
る。その検出はある黒画素を注目し周囲の画素との連結
数が1つのときその画素を端点、2つのとき分岐点、3
つのとき交差点とし、注目する画素を画像の左上端から
右下端に向かって移動、すなわちテレビジョン走査を行
い画像中の全ての端点、交点、分岐点を見つけ出し、画
像メモリ中の属性エリア(bitl、bito)に分岐
点のときはく1.1)、交点のときは(1,0)、端点
のときは、(0,1)、分岐点、交点、端点のいずれで
も無いときは(0,O)を書き込むことにより行われる
つぎに上記で求めた端点、交点、分岐点を基にしてラベ
リング処理を行う。ラベリング処理は端点、交点、分岐
点と他の黒画素との連結関係を調べるために行い、端点
、交点、分岐点に連結している黒画素すべてにラベルを
付与する。ラベルの付与は分割画像メモリ中のラベリン
グエリアに「1」を書き込むことにより行われ、ラベル
付けされた画素と付けられていない画素が隣接する事が
無くなるまで行う。ラベリング処理の後、分割処理を行
う。分割処理は交点、分岐点にて線分を分割するもので
、第7図に示すように交点、分岐点を黒画素から白画素
に反転させ隣接し7ていた黒画素を新しく端点とし、分
割画像メモリ中の属性エリア(bitl、bito)に
端点コード(0゜1)を書き込むことにより行われる。
分割処理の後、ラベルが付いてない黒画素を検索する。
検索の結果、見つかればその画素は端点、交点、分岐点
のいずれも持たない画素列、すなわち独立したループを
構成する画素ということになる。このような画素により
構成された画素列を独立閉ループと呼び、独立閉ループ
がある場合には、独立閉ループに対して以下の処理を行
う。
分割画像メモリに対してテレビジョン走査をし、ラベリ
ングエリアが「0」の画素、すなわち独立閉ループを構
成する画素を見つけ、最初に見つけた画素を黒画素から
白画素に反転させ隣接していた黒画素を新しく端点とし
、画像メモリ中の属性エリアに端点コードを書き込む。
その後、独立閉ループが無くなるまで前述のラベリング
処理以降の操作を繰り返し、無くなれば次の処理に移る
以上が画像分割処理であり、交点、分岐点を含む複雑な
細線画像が交点、分岐点、ループを含まない単純な線分
で構成された画像に変換される。
以上の処理を施し分割した結果を第8図、第9図及び第
10図に示す。実際にはこれらのデータは1つのメモリ
上に展開される。
上記の画像分割処理を施された細線画像は、曲率コード
生成部により取り呂され、曲率コード生成処理が施され
る。第11図に曲率コード生成処理の流れ図を例として
示し、以下説明する。
コード化する為には開始点及び終点を求める必要がある
。開始点は未だ曲率コード生成処理が施されていない端
点を見つける事により求められ、分割画像記憶メモリの
ラベリングエリアが曲率コード生成処理が既に施された
かどうかを表わすために使用される。従って曲率コード
生成処理を行う前に分割画像記憶メモリ中の全ての画素
のラベリングエリアに「0」を書き込み、1画素毎の曲
率コードを求める度にその画素のラベリングエリアに処
理済マークとして「1」を書き込む。
以上を前提として、以下の処理を開始する。
まず、分割画像メモリに対してテレビジョン走査をし、
最初(こ見つけた未処理の端点を開始点としてその反対
倒の端点を終点とする。
曲率コード生成処理は画素列がどの方向にどのくらいの
角度で向きを変えているかを第12図に示す様な曲率コ
ードにより表わそうとするもので、端点以外のすべての
画素での前後の画素のつながりについて考える。端点に
おける曲率コードはOとする。
進行方向に向かって左方向に向きを変えている場合の符
号をプラス、右方向に向きを変えている場合の符号をマ
イナスとして、方向の変化角度が0度のとき0.45度
のとき1.−1.90度のとき2.−2.135度のと
き3.−3とする。
以下、第8図、第9図及び第10図の線分をそれぞれ線
分1、線分2、線分3として説明を続ける。線分1を例
にとり曲率コード算8方法について述べる。第13図の
ように始点から終点に向かって各画素に(1)から(2
1)までの番号をつけ、n番目の画素の番号をnとする
。また、第14図のように画素nの8近傍の画素に1か
ら8までの番号をつける。曲率コードは注目する画素n
の8近傍の画素により求められ、今(n−1)、(n+
1)の画素の位置番号をそれぞれP(n−1)、P’(
n+1)とすると下式のように表わせる。下式において
DはP(n−1)からP (n+1)を減じたもの、V
はDの絶対値、FはDをVで除算したもの、Cは求める
べき曲率コードでありVからFに4を乗じたものを減じ
たものである。
D  =  P(n−1)  −P (n+1)V、=
D F=D/V C=D−F  *  4 上式に各画素における前後の画素の位置番号を代入する
ことにより各画素での曲率コードを得ることができる。
1本の線分の曲率コード算−出処理が終了すると再び他
の開始点を見つけ、処理を繰り返す。以上の処理を開始
点が見つからなくなるまで行い、全ての線分の曲率コー
ドを求める。結局、第8図、第9図及び第10図中の線
分の(1)が開始点、(2)が終点となり処理が行われ
る。
線分1、線分2及び線分3について曲率コードを求めた
結果を第1表から第3表に示す。
第1表(線分1曲率コード計算結果) 第2表 (線分2曲率コード計算結果) 第3表(線分3曲率コード計算結果) 以上の過程で求められた曲率コードは一旦曲率コードg
己憶メモリ11にJ記憶される。
曲率コード記憶メモリ11に記憶された曲率コードは原
点検出部5により取り出され、加点検出処理が施される
。ここで述べる加点とは、線分を構成する画素列の連結
方向がある一定以上変化している角のことであり、検出
された加点を頂点として注目している線分を多角形に近
似する。
第15図に加点検出処理の流れ図を例として示すととも
に、加点検出処理の過程について説明する。まず曲率コ
ードに対して平滑化処理を行う。
平滑化は曲率コードを数画素単位で平均することにより
行われ、注目画素の前後数画素の画素における曲率コー
ドとの平均をとる。尚、平均は母数が同一であることよ
り実際には除算は行わず、総和を平均の値としてよい。
本例題においては前後1画素として処理し、第4表から
第6表に示す様な平滑結果を得た。
第4表(線分1曲率コード平滑結果) 第5表(線分2曲率コード平滑結果) 第6表(線分3曲率コード平滑結果) 次に平滑化された曲率コードの値の変化を線分の始点か
ら終点に向かって見ていき、線分全体の曲率コードの総
和がO未満の時は曲率コードが減少方向から増加方向に
変化している点、総和が0以上の時は曲率コードが増加
方向から減少方向に変化している点を原点候補とする。
第15図において、ku点が原点候補である。また、求
められた各原点候補とその両側の原点候補とを結ぶ線1
こより囲まれる角の角度を求め、その角度がある角度(
本例題に於ては170度とした〉より小さければその点
を加点とし、大きければ無視する。
以上の操作により加点が求められ、線分は多角形に近似
された事になる。第15図において、AlB、’C,D
、E、F、Gが加点となりその座標情報が照点情報記憶
メモリに記憶される。
照点情報記憶メモリに記憶された屈点情報は照点属性コ
ード付与部により取り出され、各加点が「鋭角に曲がっ
た角なのか緩やかに曲がった角なのか」という情報によ
り加点に属性を付ける。今、L8、Ll、LNを次の様
に定義し、 La:  注目する加点から始点に向かって曲率コード
を見て曲率コードがOまたは減少した点を変曲点とした
時注目点から変曲点までの距離。
Ll;  注目する加点から終点に向かって曲率コード
を見て曲率コードが0または減少した点を変曲点とした
時注目点から変曲点までの距離。
LN:  明かな屈折点である為の両側の辺の長さく本
例題に於ては線分の長さの8分の1とした)以下のよう
な条件に基づいて照点属性コード011を各加点に付与
する。
照点属性コードO:  Le;6<LN  以上 かつ
Ll  が LN  以上 照点属性コード1 : 上記以外 屈点属性コード01屈点属性コード1はそれぞれ注目す
る加点が、「鋭角に曲がった角の頂点」、「緩やかに曲
がった角の頂点」である事を表わし、第17図に照点属
性コードを付与した結果を示す。
尚、kL kl  はそれぞれ原点属性コード0、原点
属性コード1である。
次に形状コード生成部にて以上の処理にて求められた加
点情報をもとに形状コードを生成する。
本例題に於ては線分の形状を第18図に示すように特徴
的な形である3種類の形状に分類し、それぞれ形状コー
ド011.2とした。形状コード011.2の条件を以
下に記す。
形状コードO:屈点が無い場合 形状コード1 :原点属性コードOの屈点が1個だけあ
る場合 形状コード2 :原点属性コード0及び1の屈点が2個
2上ある場合 この条件により各線分の形状コードを求める。
線分1 : 原点属性コード0の屈点が1個あり、他に
屈点が無い為、形状コード1となる。
線分2 : 屈点が無い為、形状コード0となる。
線分3 : 原点属性コード1の屈点が6個ある為形状
コード2となる。
これにより、文字「5」のイメージ画像は、形状コード
Oの線分と形状コード1の線分と形状コード2の線分に
より構成されている事が分かる。
各線分について、線分の形状を表わす形状コードを形状
記憶メモリに記憶し、原画像の図形特徴とする。
発明の詳細 な説明したようにこの発明によって、原画像を構成する
線分より曲率コードを求め、その曲率コードの変化を見
て線分が屈折している点を見つけることにより線分を多
角形近似し、各線分の曲率と、屈曲点の有無とを文字の
特徴量として文字の識別を行なうので文字を認識する際
に参照パラメータが多くなり、文字認識を正確に行なう
ことが可能になる。また、多角形の各頂点の角度及び辺
の長さ、また各頂点の周辺の曲率コードによりいくつか
の特徴的な形状を表す形状コードを求め、どのような形
状の線分で画像が構成されているかを知る事により、大
局的な形状特徴を抽出する為、安定した解析結果が得ら
れ、また画像を単純な線分に分割するため複雑な図形に
おいても完全な解析が行える。尚、画像を構成する線分
の形状を形状コードに当てはめて図形特徴とする為、特
徴を記憶するメモリ容量の軽減が図れる。
【図面の簡単な説明】 第1図は本発明の一実施例における文字認識装置の構成
図、第2図は本実施例の処理の全体の流れ図、第3図は
文字「5」のイメージ画像図、第4図は第3図における
文字「5」のイメージ画像の細線画像図、第5図は分割
画像メモリの構造を示す概念図、第6図は画像分割処理
の流れ図、第7図は画像分割処理の過程を示す概念図、
第8図及び第9図及び第10図は第4図の細線画像に対
して画像分割処理を施した後の各線分を示す図、第11
図は曲率コード生成処理の流れ図、第12第15図は照
点検出処理の流れ図、第16図は照点候補を示す図、第
17図は各線分の屈点の原点属性コードを示す図、第1
8図は形状コードが表す形状を示す図である。 ■・・・画像入力部、2・・・細線化処理部、3・・・
画像分割処理部、4・・・曲率コード生成部、5・・・
照点検出部、6・・・原点属性コード付与部、7・・・
形状コード生成部、8・・・画像メモリ、9・・・細線
画像記憶メモリ、10・・・分割画像記憶メモリ、11
・・・曲率コード記憶メモリ、12・・・曲率コードテ
ーブル、13・・・照点情報記憶メモリ、14・・・形
状コード記憶メモリ

Claims (1)

  1. 【特許請求の範囲】 読み取った文字パターンを記憶する記憶手段と、前記記
    憶手段に記憶された文字パターンを線分に分割する分割
    手段と、 前記分割手段によって分割された各線分に対して端点か
    ら端点までの各画素における曲率を検出する曲率検出手
    段と、 前記曲率検出手段によって検出された曲率から各線分の
    屈曲点の有無を検出する屈点検出手段と、前記曲率検出
    手段によって検出された曲率と前記屈点検出手段によっ
    て検出された屈点の有無とを前記記憶手段に記憶された
    文字パターンの特徴として文字の判別を行なう文字認識
    手段と、を有することを特徴とする文字認識装置。
JP2024940A 1990-02-02 1990-02-02 文字認識装置及び文字認識方法 Pending JPH03229388A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2024940A JPH03229388A (ja) 1990-02-02 1990-02-02 文字認識装置及び文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2024940A JPH03229388A (ja) 1990-02-02 1990-02-02 文字認識装置及び文字認識方法

Publications (1)

Publication Number Publication Date
JPH03229388A true JPH03229388A (ja) 1991-10-11

Family

ID=12152046

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2024940A Pending JPH03229388A (ja) 1990-02-02 1990-02-02 文字認識装置及び文字認識方法

Country Status (1)

Country Link
JP (1) JPH03229388A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020463A (ja) * 2008-07-09 2010-01-28 Dainippon Screen Mfg Co Ltd 線画処理装置、線画処理方法およびプログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020463A (ja) * 2008-07-09 2010-01-28 Dainippon Screen Mfg Co Ltd 線画処理装置、線画処理方法およびプログラム

Similar Documents

Publication Publication Date Title
US4771469A (en) Means and method of representing an object shape by hierarchical boundary decomposition
US5465304A (en) Segmentation of text, picture and lines of a document image
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
US7860313B2 (en) Methods and apparatuses for extending dynamic handwriting recognition to recognize static handwritten and machine generated text
JP2005523530A (ja) 取り込み画像データから文字列を識別して抜出するシステムおよび方法
CN109740542B (zh) 基于改进型east算法的文本检测方法
US6937765B2 (en) Method for contour extraction for object representation
Ntzios et al. An old greek handwritten OCR system based on an efficient segmentation-free approach
Lau et al. Stroke extraction and stroke sequence estimation on signatures
JPH03229388A (ja) 文字認識装置及び文字認識方法
CN112085816B (zh) 一种字形曲线生成方法及装置
CN110349111B (zh) 一种包含二维码图像的矫正方法和装置
JPH03168889A (ja) 文字認識装置
JP2580976B2 (ja) 文字切出し装置
JPH07193716A (ja) エッジ強調装置
CN113780040B (zh) 唇部关键点的定位方法及装置、存储介质、电子设备
JP2001092924A (ja) パターン認識方法および装置
JPH02264373A (ja) 図形認識装置
Sarfraz Outline representation of fonts using genetic approach
JP3687999B2 (ja) 文字認識装置
Salameh et al. hyper recognition techniques for English digits using statistical analysis of nodes and Fuzzy Logic for pattern recognition
Zhang et al. Graphic matching based on constrained Voronoi diagrams
JP2881080B2 (ja) 特徴抽出方法
Shimotsuji et al. A High Speed Raster-to-Vector Conversion Using Special Hardware for Contour Tracking.
Xingyuan et al. Skeletonizing by compressed line adjacency graph in two directions