JPH11154200A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH11154200A
JPH11154200A JP9320873A JP32087397A JPH11154200A JP H11154200 A JPH11154200 A JP H11154200A JP 9320873 A JP9320873 A JP 9320873A JP 32087397 A JP32087397 A JP 32087397A JP H11154200 A JPH11154200 A JP H11154200A
Authority
JP
Japan
Prior art keywords
pattern
sub
character
matrix
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP9320873A
Other languages
English (en)
Inventor
Masaharu Nagata
政晴 永田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP9320873A priority Critical patent/JPH11154200A/ja
Publication of JPH11154200A publication Critical patent/JPH11154200A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字の特徴マトリクスを抽出して該文字の識
別を行う文字認識装置において、ノイズに影響されない
該特徴マトリクスを作成し、文字認識率を向上させる。 【解決手段】 光電変換部10を介して文字パタンがパ
タンレジスタ11に格納され、該文字パタンを各所定方
に走査した複数のサブパタンがサブパタン抽出部13に
よって抽出されてサブパタン記憶部14に記憶される。
AQ計数部15は、各サブパタンにノイズが含まれてい
るか否かを示すための該各サブパタンの黒点数等の値を
計数する。マトリクス抽出部16は、AQ計数部15の
計数結果に基づき、各サブパタンにおけるノイズを除去
した状態での特徴マトリクスを作成する。識別部17に
より、その特徴マトリクスと辞書部18に予め格納され
た標準文字を表すマトリクスとの比較が行われ、文字が
識別される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字パタンにおけ
る特徴抽出を行い、この特徴抽出で得られた特徴と標準
パタンの特徴との比較照合により、該文字パタンの文字
認識を行う文字認識装置に関するものである。
【0002】
【従来の技術】従来、このような分野の技術としては、
例えば、次のような文献に記載されるものがあった。 文献;特公昭60−38755号公報。 一般的な文字認識装置では、読取対象の文書が記載され
た帳票等の媒体上の文字パタンを光電変換して入力し、
その入力文字パタンから特徴抽出を行い、該特徴抽出で
得られた特徴と予め用意した標準パタンの特徴との照合
を行い文字パタンを認識している。上記文献には、処理
の増加や処理の複雑化を防止した文字認識装置が示され
ている。この文字認識装置は、文字パタンを入力する光
電変換部と、入力文字の線幅を計算する線幅計算部と、
入力文字パタンを格納するパタンレジスタと、該入力文
字パタンから複数のサブパタンを抽出するサブパタン抽
出部と、複数のサブパタンから特徴マトリクスを作成す
る特徴マトリクス抽出部とを備えている。この方式の文
字認識装置では、入力文字パタンの線幅Wを線幅計算部
で算出しておき、入力文字パタンを水平、垂直、斜めの
3方向に走査して、線幅W×N(Nは、定数)の閾値を
用い、該各方向に毎に、文字のストローク成分を表すサ
ブパタンを生成する。そして、特徴マトリクス抽出部で
特徴マトリクスを作成し、該特徴マトリクスに対する標
準パタンとの照合で文字認識を行っている。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
文字認識装置では、次のような課題があった。例えば、
光電変換部における特性変動及び量子化誤差、またはノ
イズ等の影響により、入力文字パタンの文字線エッジに
凹凸が生じ、これがサブパタンにおけるノイズになっ
て、特徴抽出が不安定となる。特徴抽出が不安定となる
と、その後の認識工程に悪影響を与え、誤読や不読等の
文字認識率が低下する原因になっていた。このような誤
読や不読を抑えるために、ノイズを考慮した辞書を追加
して備えることも考えられるが、これでは文字認識装置
の辞書容量が大きくなり、コストが上昇することにな
る。
【0004】
【課題を解決するための手段】前記課題を解決するため
に、本発明の第1及び第2の発明は、ストロークの線で
形成された文字を光学的に取得して電気信号に変換する
光電変換部と、前記光電変換部から与えられた電気信号
を入力して前記文字に対応する文字パタンとして格納す
るパタンレジスタと、前記文字の線幅を計算する線幅計
算部と、前記文字パタンを所定方向にそれぞれ走査し、
該所定方向に垂直な方向に関して黒画素が連続する長さ
を求め、該長さが前記線幅に対応する値を越える部分を
抽出して前記ストロークの該所定方向に関する成分を表
すサブパタンを抽出する処理を、複数の異なる方向に対
して行うサブパタン抽出部と、前記各サブパタンを記憶
するサブパタン記憶部と、前記各サブパタンごとに前記
ストロークの特徴を表す特徴マトリクスを作成するマト
リクス抽出部と、前記特徴マトリクスと予め用意された
標準文字の特徴を表す標準マトリクスとの比較を行って
前記文字を識別する識別部とを、備えた文字認識装置に
おいて、次のような構成にしている。即ち、前記各サブ
パタンにおける黒画素の数を計数すると共に、該各サブ
パタンをa×b画素の大きさ(但し、a,bは正の整
数)の窓で走査し、該a×b画素がすべて黒画素になる
窓の数を計数する評価値計数手段を設けている。そし
て、前記マトリクス抽出部は、前記黒画素の数と前記窓
の数を用いて前記各サブパタンに残ったノイズの有無を
判断し、該ノイズを除去した状態で前記特徴マトリクス
を作成する構成にしている。
【0005】第1から第2の発明によれば、以上のよう
に文字認識装置を構成したので、文字は、光電変換部に
よって電気信号化され、パタンレジスタに文字パタンと
して格納される。その文字の線幅が線幅計算部によって
求めれ、該線幅に基づいて文字パタンを各所定方に走査
した複数のサブパタンがサブパタン抽出部によって抽出
され、サブパタン記憶部に記憶される。ここで、各サブ
パタンにノイズが残っていても、評価値計数手段によ
り、各サブパタンにおける黒画素の数と窓の数がそれぞ
れ計数される。マトリクス抽出部は、その黒画素数と窓
の数を用いて各サブパタンに残ったノイズの有無を判断
する。このマトリクス抽出部により、ノイズを除去した
状態での特徴マトリクスが作成され、該特徴マトリクス
と予め用意された標準文字の特徴を表す標準マトリクス
との比較が識別部により行われ、文字が識別される。従
って、前記課題を解決できるのである。
【0006】
【発明の実施の形態】第1の実施形態 図1は、本発明の第1の実施形態を示す文字認識装置の
構成図である。この文字認識装置は、帳票等の読取り対
象の文字が記載された媒体上を光学的に走査し、該文字
を電気信号に変換する光電変換部10を備えると共に、
該光電変換部10には、その電気信号に変換された文字
を文字パタンとして格納するパタンレジスタ11が接続
されている。パタンレジスタ11には、線幅計算部12
が接続されると共に、サブパタン抽出部13が接続され
ている。線幅計算部12は、パタンレジスタ11に格納
された文字パタンの線幅Wを計算するものであり、該計
算結果がサブパタン抽出部13に入力される構成になっ
ている。サブパタン抽出部13は、文字イメージと線幅
計算部12により算出された線幅Wを基に、複数のサブ
パタンを抽出する機能を有している。
【0007】サブパタン抽出部13の出力側には、サブ
パタン記憶部14が接続されている。サブパタン記憶部
14には、該サブパタン記憶部14に記憶されたサブパ
タンの黒点数A1 と後述する窓数Q1 とを求めて出力す
る評価値計算手段であるAQ計数部15と、該AQ計数
部15から与えられた黒点数Aと窓数Qとを用いてサブ
パタン記憶部14に格納された複数のサブパタンに対応
する特徴マトリクスをそれぞれ作成するマトリクス抽出
部16とが、接続されている。マトリクス抽出部16
は、内部に図示しない複数のカウンタを有している。マ
トリクス抽出部16の出力側には、識別部17が接続さ
れている。この識別部17には、予め用意された標準パ
タンの特徴マトリクスが格納された辞書部18が接続さ
れている。認識部18の出力側に、ディスプレイ等で構
成された結果表示部19が接続されている。
【0008】図1の文字認識装置は、光電変換部11か
ら入力された文字パタンに対する文字認識を行って結果
表示部19から出力するものであり、図2〜図9を参照
しつつ、図1の文字認識装置の動作を説明する。光電変
換部10は、帳票等の媒体上の文字を光学的に走査して
電気信号に変換し、パタンレジスタ11に文字パタンと
して格納する。線幅計算部12は、パタンレジスタ11
に格納されている文字パタンの線幅Wを、以下のように
な4黒点法等を用いて計算する。4黒点法では、線幅計
算部12がパタンレジスタ11中の文字パタンを、大き
さが例えば(2×2)画素の窓を用いて走査した時に、
該窓のすべての画素が黒になる(4黒点)窓の数mと文
字パタンの全黒点数nを計数し、次の(1)式によって
線幅Wを算出する。算出された線幅Wは、パタンレジス
タ11の格納する文字パタンと共に、サブパタン抽出部
13に入力される。 W=n/(n−m) ・・・(1) 図2(a)〜(c)は、文字パタンのストロークを示す
図であり、図3(a)〜(d)は、文字パタンの文字線
部を示す図である。図3(a)のような文字パタン20
は、図3(b)〜(d)のような複数のストローク21
で構成されている。サブパタン抽出部13は、入力した
文字パタン20から垂直方向、水平方向及び斜め方向に
関する複数のサブパタンを抽出することによって、それ
らのストローク21のパタンを求める。
【0009】例えば、パタンレジスタ11の文字パタン
をある方向に走査して得られる当該走査方向で黒ビット
が連続した長さ(文字パタンの文字線部分の長さ)を
L、ストローク21の長さをSとすると、図2(a)の
ような水平方向のストローク211 ではL=Wの関係、
図2(b)のような垂直方向のストローク212 ではL
=Sの関係、図2(c)のように斜め(45度)のスト
ローク213 ではL=√2Wの関係が設立する。そのた
め、図3(a)の文字パタン20に対して、垂直方向の
走査を全面について行い、S≧N・W(Nは定数)と仮
定して、L≧N・Wを満足しない文字線部分を文字パタ
ン20から除去することにより、図3(b)の垂直なス
トローク211 が抽出される。このストローク211
含むパタンが、サブパタン抽出部13が抽出する垂直サ
ブパタン31であり、該サブパタン31がサブパタン記
憶部14に記憶される。垂直方向の走査と同様に、文字
パタン20を水平走査すると、図3(c)の水平サブパ
タン32が抽出でき、斜め45度に走査を行えば図3
(d)の斜めサブパタンが抽出33できる。これらの各
サブパタン32,33も、サブパタン31と同様にサブ
パタン記憶部14に記憶される。図4はノイズの無い文
字パタン、図5はノイズのある文字パタン、及び図6は
点を含む文字パタンを示す図である。
【0010】図7は、図4の水平サブパタンを示す図で
あり、図8は、図5の水平サブパタンを示す図であり、
及び図9は、図6の水平サブパタンを示す図である。例
えば図5のように、文字パタン20の文字線部のエッジ
に、光電変換部10の特性変動や量子化誤差、ノイズ等
の影響による凸部22が発生すると、これによって、サ
ブパタン抽出部13が水平サブパタン32を抽出したと
きに、定数Nの値によっては、図8のように、凸部22
が水平サブパタン32にノイズ34として残る場合があ
る。このノイズ34の有無を判定するために、AQ計数
部15は、サブパタン記憶部14に記憶された垂直、水
平及び斜めの各サブパタン31〜33について、各サブ
パタン31〜33を大きさが(a×b)画素の窓で走査
した時に、a×bの画素がすベて黒になる窓の数Q
1 と、サブパタンにおける全黒点数A1 とを計数する。
【0011】マトリクス抽出部16は、AQ計数部15
から与えられた窓数Q1 と全黒点数A1 とを用い、次の
(2)式により各サブパタン31〜33の評価値Dをそ
れぞれ計算する。 D=Q1 /A1 ・・・(2) 例えば前述のa及びbを2とし、図7のノイズ34の無
いサブパタン32についてDを求めると、A1 =48及
びQ1 =22となり、D=0.46になる。同様に、図
8のノイズ34のあるサブパタン32についてDを求め
ると、A1 =60及びQ1 =22となり、D=0.37
になる。また、図9の「玉」の点35のある文字パタン
20に対応するサブパタン32についてDを求めると、
1 =70及びQ1 =35となり、D=0.45にな
る。マトリクス抽出部16は次の(3)式により、これ
らの評価値Dに対して閾値THLとの比較を行う。 D<THL ・・・(3) さらに、マトリクス抽出部16は、パタンレジスタ11
内の文字枠に対応する各サブパタン31〜33の領域
を、それぞれ[j×k]個に分割する。例えば、文字枠
に対応する領域が100×100画素であるとすると、
j=k=5の場合には、各分割領域が20×20画素の
大きさになる。マトリクス抽出部16は、各サブパタン
31〜33に関して、分割領域ごとの特徴をそれぞれ抽
出する。
【0012】ここで、水平サブパタン32を例にとった
特徴の抽出を説明する。マトリクス抽出部16は、(j
×k)個のカウンタを各分割領域にそれぞれ対応させ、
そのカウンタの各値を“0”に設定しておき、各分割領
域について主走査方向(この場合は水平方向)に対して
垂直に上から下へ走査する。そして、走査列単位に、白
画素から黒画素に変化したときの黒画素の座標位置(X
n ,Ywb)と、黒画素から白画素へと変化したときの黒
画素の座標位置(Xn ,Ybw)を検出し、その中点座標
値(Xn ,Ys )を、次の(4)で計算する。なお、前
記(3)式を満足せず、かつ、次の(5)式を満足しな
い場合、その中点座標値(Xn ,Ys )は存在しないも
のとする。 Ys =(Ywb+Ybw )/2 ・・・(4) |Ywb−Ybw|≧gW ・・・(5) ただし、gは定数で、例えば1に設定されている。マト
リクス抽出部16は、各分割領域内の走査で中点座標値
(Xn ,Ys )を得る毎に、対応するカウンタの内容を
インクリメントする。例えば、(3)式での閾値THL
を0.40とすると、図4の凸部22が無い文字パタン
20から抽出した図7の水平サブパタン32は評価値D
=0.46となり、(3)式を満足する。よって、マト
リクス抽出部16は(5)式にかかわらず、中点座標値
(Xn ,Ys )が得られたときに、対応するカウンタを
インクリメントする図5の凸部22がある文字パタン2
0から抽出された図8の水平サブパタン32では、閾値
THLが0.40の(3)式を満足しないので、(5)
式を満足しない場合には中点座標値(Xn ,Ys )は存
在しないものとし、対応するカウンタの値をインクリメ
ントしない。これにより、図8のサブパタン32に残る
ノイズ34の成分が除去されることになる。
【0013】図6の「玉」の文字のように点がある文字
パタン20から抽出された図9の水平サブパタン32で
は、(5)式は満足しないが、(2)式のDが0.45
となって(3)式を満足するので、(5)式がかかわら
ず、中点座標値(Xn ,Ys)を得る毎に、対応するカ
ウンタの内容をインクリメントする。マトリクス抽出部
16は、以上の処理を文字枠全体に対して行う。各分割
領域毎に設けた各カウンタの値がそれぞれ線長要素とな
り、水平サブパタン32の[j×k]次元の線長マトリ
クスが得られる。同様の処理が、垂直サブパタン31及
び斜めサブパタン33に対して行われる。但し、垂直サ
ブパタン31では、主走査方向(垂直方向)を水平に右
から左に走査する。斜めサブパタン33では、主走査方
向(斜め)を垂直に上から下へ、副走査方向を水平に左
から右へ走査する。さらに、マトリクス抽出部16は、
抽出した各線長要素を文字の大きさで正規化し、特徴マ
トリクスを作成する。
【0014】その正規化方法は、正規化前の線長要素を
ik、正規化後の線長要素をRjk、文字枠の水平方向の
長さをΔx及び垂直方向の長さをΔyとし、次の(i)
〜(iii)の計算で各Rjkをそれぞれ求める。 (i)垂直サブパタン31のマトリクスの場合 Rjk=rik/Δy ・・・(6) (ii)水平サブパタン32の場合 Rjk=rik/Δx ・・・(7) (iii)斜めサブパタン33の場合 Rjk=rik/√(Δx2 +Δy2 ) ・・・(8) これらの(i)〜(iii)での計算により、マトリクス抽
出部16は、最終的に文字パタン20を表現する{(j
×k)×3}次元の正規化された特徴マトリクスf1を
作成する。
【0015】識別部17は、辞書部18に予め用意され
ている標準文字に対してマトリクス抽出を行った標準マ
トリクスfm と、マトリクス抽出部16で作成した特徴
マトリクスf1 との距離dを次の(9)式で求め、該距
離dが最小となる標準マトリクスfm の文字名を識別結
果として出力する。結果表示部19は、識別部17から
与えられた識別結果を外部に表示する。 d=√{Σ(fm −f1 2 } ・・・(9) 以上のように、この第1の実施形態では、各サブパタン
31〜33における黒点数A1 と窓の数Q1 を計数する
AQ計数部15と、各サブパタン31〜33の(j×
k)個の分割領域に対応する(j×k)カウンタを有す
るマトリクス抽出部16とを設け、黒点数A1 と窓の数
1 に基づき、各サブパタン31〜33におけるノイズ
34の有無を判定し、ノイズ34を除去した状態で文字
の文字線部を表す線長を抽出して特徴マトリクス化して
いる。そのため、入力文字パタン20に凸部22があっ
てサブパタン31〜33にノイズ34が残っても、ノイ
ズ34の影響が少ない安定した特徴マトリクスf1を抽
出できる。よって、サブパタン31〜33のノイズ34
を考慮した標準マトリクスを用意する必要が無くなり、
文字認識装置をコストダウンできる。
【0016】第2の実施形態 図10は、本発明の第2の実施形態を示す文字認識装置
の構成図であり、第1の実施形態を示す図1中の要素と
共通の要素には共通の符号が付されている。この文字認
識装置は、第1の実施形態におけるマトリクス抽出部1
6を、マトリクス抽出部40に置換えたものであり、他
の部分は、図1と同様の構成になっている。次に、図2
〜図9を参照しつつ、図10の文字認識装置の動作を説
明する。光電変換部10が文字パタンを取得してから、
各方向のサブパタン31〜33がサブパタン記憶部14
に記憶されるまでの動作、及びAQ計数部15が黒点数
1 と窓数Q1 を求めるまでの動作は、第1の実施形態
と同様である。
【0017】マトリクス抽出部40は、AQ計数部から
与えられた黒点数A1 及び窓数Q1から(2)式の評価
値Dを求めて(3)式の比較を行う。マトリクス抽出部
40は、パタンレジスタ11内の文字枠に対応する領域
を、各サブパタン31〜33について第1の実施形態と
同様に分割し、次のように各分割領域における黒点数B
ikを計数して特徴マトリクスを抽出する。例えば水平サ
ブパタン32に対し、マトリクス抽出部16は、各分割
領域について水平の主走査方向に対して垂直に上から下
へ走査する。そして、走査列単位に、黒画素が連続する
数Bをそれぞれ計数し、次の(10)式を満足せず、且
つ、(3)式を満足しないを場合を除いて数Bを累積加
算し、この累積結果を黒点数Bikとする。なお、(1
0)式のCは定数であり、例えばC=1とすると、該
(10)式では、サブパタン31〜33中におけるパタ
ンの幅に相当する数Bが、線幅W以上に相当するかどう
かを見ることになる。 B≧C・W ・・・(10) (3)式での閾値THLを0.40とすると、図4のよ
うに凸部22が無い文字パタン20から抽出した図7の
水平サブパタン32は評価値D=0.46となり、
(3)式を満足する。よって、マトリクス抽出部40
は、(10)式にかかわらず、分割領域内の黒点の連続
する数Bが得られた毎に、それを黒点数Bjkに累積加算
する。
【0018】図5のように凸部22がある文字パタン2
0から抽出された図8の水平サブパタン32では、閾値
THLが0.40の(3)式を満足しないので、(1
0)式を満足する数Bが得られたときにそれを黒点数B
jkに累積加算するが、(10)式を満足しない数Bが得
られたときには、それは累積加算しない。これにより、
図8のサブパタン32に残るノイズ34の成分は、線幅
Wに対して狭いので、特徴マトリクスを抽出するときに
除去されることになる。図6の「玉」の文字のように点
がある文字パタン20から抽出された図9の水平サブパ
タン31では、(10)式は満足しないが、(2)式の
Dが0.45となって(3)式を満足するので、(1
0)式を満足しないかかわらず、数Bが得られたとき
に、それを黒点数Bjkに累積加算して集計する。マトリ
クス抽出部16は、以上の処理を水平サブパタン32の
文字枠全体に対して行い、さらに、各サブパタン31,
33の文字枠全体に対しても同様に行う。続いて、マト
リクス抽出部16は、各分割領域に関して求めた黒点数
jkを、線幅計算部12で算出した線幅Wを用いた次の
(11)でそれぞれ正規化し、{(j×k)×3}次元
の特徴マトリクスf2を作成する。 Sjk=Bjk/W ・・・(11) 識別部17と結果表示部19とは、辞書部18を参照し
て第1の実施形態と同様に動作し、識別結果を外部に表
示する。
【0019】以上のように、この第2の実施形態では、
各サブパタン31〜33における黒点数A1 と窓の数Q
1 を計数するAQ計数部15と、黒点数A1 と窓数Q1
とに基づき、ノイズ34の有無を判定し、該ノイズ34
以外の該黒画素Bjkを累積加算して集計し、この集計に
よりノイズ34を除去し、集計値を前記線幅に対応する
幅で正規化してストロークに対応する成分を抽出するマ
トリクス抽出部40とを設けている。そのため、文字パ
タン20に凸部22があってサブパタン31〜33にノ
イズ34が残っても、ノイズ34の影響が少ない安定し
た特徴マトリクスf2を抽出できる。よって、サブパタ
ン31〜33のノイズ34を考慮した標準マトリクスを
用意する必要が無くなり、文字認識装置をコストダウン
できる。なお、本発明は、上記実施形態に限定されず種
々の変形が可能である。その変形例としては、例えば次
のようなものがある。 (1) 線幅計算部12は、(2×2)画素の窓を用い
た4黒点法で線幅Wを求めているが、(2×2)画素以
外の大きさの窓を用いて線幅Wを計算することも可能で
あり、さらに、他の方法で求めてもよい。 (2) サブパタン31〜33は、垂直、水平及び斜め
方向の3要素に関するパタンとしたが、これらに限定さ
れるものではなく、他のいかなる方向成分に関するパタ
ンでもよい。
【0020】
【発明の効果】以上詳細に説明したように、第1及び第
2の発明によれば、特徴マトリクスと予め用意された標
準文字の特徴を表す標準マトリクスとの比較を行い、文
字を識別する文字認識装置に、各サブパタンにおける黒
画素の数を計数すると共に、該各サブパタンをa×b画
素の大きさの窓で走査し、該a×b画素がすべて黒画素
になる窓の数を計数する評価値計数手段を設け、マトリ
クス抽出部がその黒画素の数と窓の数を用いて各サブパ
タンに残ったノイズの有無を判断し、該ノイズを除去し
た状態で特徴マトリクスを作成する構成にしたので、各
サブパタンに残るノイズに影響されない特徴マトリクス
が作成でき、ノイズを考慮した標準パタンを用意せずと
も、文字認識率を向上させることができる。よって、文
字認識装置をコストダウンできる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示す文字認識装置の
構成図である。
【図2】文字パタンのストロークを示す図である。
【図3】文字パタンの文字線部を示す図である。
【図4】ノイズの無い文字パタンを示す図である。
【図5】ノイズのある文字パタンを示す図である。
【図6】点を含む文字パタンを示す図である
【図7】図4の水平サブパタンを示す図である。
【図8】図5の水平サブパタンを示す図である。
【図9】図6の水平サブパタンを示す図である。
【図10】本発明の第2の実施形態を示す文字認識装置
の構成図である。
【符号の説明】
10 光電変換部 11 パタンレジスタ 12 線幅計算部 13 サブパタン抽出部 14 サブパタン記憶部 15 AQ計数部(評価値計数手段) 16,40 マトリクス抽出部 17 識別部 18 辞書部 19 結果表示部

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 ストロークの線で形成された文字を光学
    的に取得して電気信号に変換する光電変換部と、 前記光電変換部から与えられた電気信号を入力して前記
    文字に対応する文字パタンとして格納するパタンレジス
    タと、 前記文字の線幅を計算する線幅計算部と、 前記文字パタンを所定方向にそれぞれ走査し、該所定方
    向に垂直な方向に関して黒画素が連続する長さを求め、
    該長さが前記線幅に対応する値を越える部分を抽出して
    前記ストロークの該所定方向に関する成分を表すサブパ
    タンを抽出する処理を、複数の異なる方向に対して行う
    サブパタン抽出部と、 前記各サブパタンを記憶するサブパタン記憶部と、 前記各サブパタンごとに前記ストロークの特徴を表す特
    徴マトリクスを作成するマトリクス抽出部と、 前記特徴マトリクスと予め用意された標準文字の特徴を
    表す標準マトリクスとの比較を行って前記文字を識別す
    る識別部とを、備えた文字認識装置において、 前記各サブパタンにおける黒画素の数を計数すると共
    に、該各サブパタンをa×b画素(但し、a,bは正の
    整数)の大きさの窓で走査し、該a×b画素がすべて黒
    画素になる窓の数を計数する評価値計数手段を設け、 前記マトリクス抽出部は、前記黒画素の数と前記窓の数
    を用いて前記各サブパタンに残ったノイズの有無を判断
    し、該ノイズを除去した状態で前記特徴マトリクスを作
    成する構成にしたことを特徴とする文字認識装置。
  2. 【請求項2】 前記マトリクス抽出部は、 前記ノイズが無いと判断したサブパタンに対して前記各
    所定方向に垂直な方向に並ぶ黒画素の列の中点座標を求
    める処理を該各所定方向について行い、該中点座標の軌
    跡から前記成分を抽出し、 前記ノイズがあると判断したサブパタンに対して前記各
    所定方向に対して垂直な方向に並ぶ黒画素の列のうち該
    列幅が前記線幅に対応する長さを持たないものを除外し
    て前記中点座標を求める処理を該各所定方向について行
    い、該中点座標の軌跡に基づき前記成分を抽出して前記
    ノイズの除去を行い、 前記抽出した成分に基づき前記特徴マトリクスを作成す
    る構成にしたことを特徴とする請求項1記載の文字認識
    装置。
  3. 【請求項3】 前記マトリクス抽出部は、 前記ノイズが無いと判断したサブパタンに対して前記各
    所定方向に垂直な方向に並ぶ黒画素の数を求める処理を
    該各所定方向について行い、該黒画素の集計値を前記線
    幅に対応する幅で正規化して前記成分を抽出し、 前記ノイズがあると判断したサブパタンに対して前記各
    所定方向に対して垂直な方向に並ぶ黒画素の列のうち該
    列幅が前記線幅に対応する長さを持たないものは除外し
    て該黒画素の数を求める処理を該各所定方向について行
    い、該黒画素の集計値を前記線幅に対応する幅で正規化
    して前記成分を抽出して前記ノイズの除去を行い、 前記抽出した成分に基づき前記特徴マトリクスを作成す
    る構成にしたことを特徴とする請求項1記載の文字認識
    装置。
JP9320873A 1997-11-21 1997-11-21 文字認識装置 Withdrawn JPH11154200A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9320873A JPH11154200A (ja) 1997-11-21 1997-11-21 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9320873A JPH11154200A (ja) 1997-11-21 1997-11-21 文字認識装置

Publications (1)

Publication Number Publication Date
JPH11154200A true JPH11154200A (ja) 1999-06-08

Family

ID=18126222

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9320873A Withdrawn JPH11154200A (ja) 1997-11-21 1997-11-21 文字認識装置

Country Status (1)

Country Link
JP (1) JPH11154200A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268186A (zh) * 2015-05-28 2021-08-17 三菱电机株式会社 输入显示装置和显示方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113268186A (zh) * 2015-05-28 2021-08-17 三菱电机株式会社 输入显示装置和显示方法

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JPH11338976A (ja) 文書画像認識装置、その方法、及び記録媒体
EP0482187A1 (en) Row-by-row segmentation and thresholding for optical character recognition (system and method)
US20100054587A1 (en) Image processing apparatus and image processing method
JPH04270485A (ja) 印刷文字認識装置
EP1469418A2 (en) Device and method for extending character region in image
JPH11154200A (ja) 文字認識装置
JP2868134B2 (ja) 画像処理方法及び装置
JP2963508B2 (ja) 文字切出し装置
JP2795860B2 (ja) 文字認識装置
JP2708604B2 (ja) 文字認識方法
JP2747136B2 (ja) 文字認識装置
JP3127413B2 (ja) 文字認識装置
JPH05128306A (ja) 文章画像の属性判別方法
JP3210224B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JPH11175659A (ja) 文字認識装置
JP3277977B2 (ja) 文字認識方法
JPH01152586A (ja) 文字図形認識方法
JPH05282489A (ja) 文章画像の属性判別方法
JPH03276380A (ja) 文字認識装置
JPH0452886A (ja) 文字認識装置
JPH06223225A (ja) 文字認識方法
JP2000268131A (ja) 文字認識装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050201