JP2902904B2 - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JP2902904B2 JP2902904B2 JP5140747A JP14074793A JP2902904B2 JP 2902904 B2 JP2902904 B2 JP 2902904B2 JP 5140747 A JP5140747 A JP 5140747A JP 14074793 A JP14074793 A JP 14074793A JP 2902904 B2 JP2902904 B2 JP 2902904B2
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- sub
- unit
- line width
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Discrimination (AREA)
Description
【0001】
【産業上の利用分野】この発明は、一部がかすれたよう
な局所的に線幅の異なる文字パタンに対処した高精度な
文字認識装置に関するものである。
な局所的に線幅の異なる文字パタンに対処した高精度な
文字認識装置に関するものである。
【0002】
【従来の技術】従来、入力文字パタンの特徴を抽出し、
予め用意した辞書との照合によって、認識結果を出力す
る文字認識装置としては、例えば特公昭60−3875
6に開示されるものがあった。この文字認識装置による
処理の概要について以下に説明する。
予め用意した辞書との照合によって、認識結果を出力す
る文字認識装置としては、例えば特公昭60−3875
6に開示されるものがあった。この文字認識装置による
処理の概要について以下に説明する。
【0003】先ず、入力文字パタンの各セルの明るさを
光電変換によって、量子化された電気信号である2値画
像に変換し、パタンレジスタに格納しておく。そして前
記パタンレジスタ内の文字パタンの外接枠を検出し、外
接枠内の文字パタンの線幅を計算する。次に外接枠内の
文字パタンに対して、水平、垂直、右斜め、左斜め方向
に走査し、前記線幅を閾値とする連続黒画素成分を検出
することによって、該入力文字パタンに対する4種のサ
ブパタンを抽出する。また、前記パタンレジスタの外接
枠内の文字パタンに対して、各分割領域内の黒画素数が
同数になるようにN×M個の格子状の部分領域に非線形
分割する。次に4種のサブパタンのそれぞれについて、
分割された部分領域内における該サブパタンの黒画素数
を計数し、これを文字パタンの大きさで正規化すること
によって、各方向における文字線の分布状態を反映する
N×M×4次元の特徴マトリクスを抽出する。この特徴
マトリクスと予め用意された複数の標準文字の特徴マト
リクスである辞書とを照合し、該照合結果より該入力文
字パタンの認識結果を出力する。
光電変換によって、量子化された電気信号である2値画
像に変換し、パタンレジスタに格納しておく。そして前
記パタンレジスタ内の文字パタンの外接枠を検出し、外
接枠内の文字パタンの線幅を計算する。次に外接枠内の
文字パタンに対して、水平、垂直、右斜め、左斜め方向
に走査し、前記線幅を閾値とする連続黒画素成分を検出
することによって、該入力文字パタンに対する4種のサ
ブパタンを抽出する。また、前記パタンレジスタの外接
枠内の文字パタンに対して、各分割領域内の黒画素数が
同数になるようにN×M個の格子状の部分領域に非線形
分割する。次に4種のサブパタンのそれぞれについて、
分割された部分領域内における該サブパタンの黒画素数
を計数し、これを文字パタンの大きさで正規化すること
によって、各方向における文字線の分布状態を反映する
N×M×4次元の特徴マトリクスを抽出する。この特徴
マトリクスと予め用意された複数の標準文字の特徴マト
リクスである辞書とを照合し、該照合結果より該入力文
字パタンの認識結果を出力する。
【0004】
【発明が解決しようとする課題】しかし、前記文字認識
装置においては、以下のような問題点があった。即ち、
従来技術では、入力された文字パタンの外接枠内の2値
画像に対して、水平、垂直、右斜め、左斜めの4方向に
それぞれ走査し、当該文字パタンの平均線幅の2倍を閾
値として、連続した黒画素よりなるストロ−クを抽出
し、それらの分布を表わす4種のサブパタンを抽出して
いた。しかし、従来のサブパタンの抽出方法では、当然
ながら前記線幅の2倍より小さい連続黒画素数を持つス
トロ−ク成分は、抽出されない。従って、一部がかすれ
たような文字パタン、即ち、局所的な線幅が他の部分と
比較して極めて小さくなっている文字パタン等は、その
かすれた部分がサブパタン及びサブパタンに基づいて抽
出される特徴マトリクスに反映されず、その結果、認識
性能の低下の一因を為していたという問題点があった。
装置においては、以下のような問題点があった。即ち、
従来技術では、入力された文字パタンの外接枠内の2値
画像に対して、水平、垂直、右斜め、左斜めの4方向に
それぞれ走査し、当該文字パタンの平均線幅の2倍を閾
値として、連続した黒画素よりなるストロ−クを抽出
し、それらの分布を表わす4種のサブパタンを抽出して
いた。しかし、従来のサブパタンの抽出方法では、当然
ながら前記線幅の2倍より小さい連続黒画素数を持つス
トロ−ク成分は、抽出されない。従って、一部がかすれ
たような文字パタン、即ち、局所的な線幅が他の部分と
比較して極めて小さくなっている文字パタン等は、その
かすれた部分がサブパタン及びサブパタンに基づいて抽
出される特徴マトリクスに反映されず、その結果、認識
性能の低下の一因を為していたという問題点があった。
【0005】このような場合の例を図4及び図6(a)
に示す。図4では、アルファベットの「Q」の字のひげ
の部分、即ち波線401で囲まれた領域内のセグメント
がかすれて3つに分裂してしまった場合を表している。
このかすれたひげの部分は、本来ならば、左斜め方向の
走査によって、ストロ−クの一部として検出されるわけ
であるが、この例では、いかなる方向の走査においても
サブパタンの一部としては検出されない。従って、ひげ
の部分は特徴に反映されず、ひげのない類似文字、例え
ば、「O」等に誤読する確率が増大することになる。
に示す。図4では、アルファベットの「Q」の字のひげ
の部分、即ち波線401で囲まれた領域内のセグメント
がかすれて3つに分裂してしまった場合を表している。
このかすれたひげの部分は、本来ならば、左斜め方向の
走査によって、ストロ−クの一部として検出されるわけ
であるが、この例では、いかなる方向の走査においても
サブパタンの一部としては検出されない。従って、ひげ
の部分は特徴に反映されず、ひげのない類似文字、例え
ば、「O」等に誤読する確率が増大することになる。
【0006】また図6(a)では、漢字の「因」の字を
扱っている。この場合、「因」を構成する要素の内、外
側の部分である「口」に対し、内側の部分である「大」
が通常より小さく書かれ、文字全体の平均線幅の2倍以
下の大きさしか持たないため、平均線幅を用いた走査で
は、図6(b)、図6(c)、図6(d)、図6(e)
に示したように「大」の字がどのサブパタンにも反映さ
れないといった事態が生じ、大きな問題点となる。
扱っている。この場合、「因」を構成する要素の内、外
側の部分である「口」に対し、内側の部分である「大」
が通常より小さく書かれ、文字全体の平均線幅の2倍以
下の大きさしか持たないため、平均線幅を用いた走査で
は、図6(b)、図6(c)、図6(d)、図6(e)
に示したように「大」の字がどのサブパタンにも反映さ
れないといった事態が生じ、大きな問題点となる。
【0007】また、上述のように一部がかすれたり、小
さく書かれたりした文字パタンではないときでも、一部
がつぶれたことにより平均線幅の値が非常に大きくな
り、その結果、通常のストロ−クが走査によってサブパ
タンとして検出されず、故に特徴マトリクスに反映され
ず、認識性能の低下をもたらすという問題点があった。
このような場合の例を図5に示す。図5は、数字の
「5」において、下部がル−プを作りつぶれてしまった
例であるが、このとき、文字全体の平均線幅は大きな値
となり、その結果、例えば、波線501で示されたよう
な通常に書かれたストロ−クの部分等は線幅の2倍以下
の大きさとなってしまい、結局、サブパタンとして抽出
されなくなる。従って、波線501が示すストロ−クが
ないパタンとして、特徴抽出されるので、例えば「6」
等に極めて類似してくることになり、「6」に誤読する
確率が増大する。
さく書かれたりした文字パタンではないときでも、一部
がつぶれたことにより平均線幅の値が非常に大きくな
り、その結果、通常のストロ−クが走査によってサブパ
タンとして検出されず、故に特徴マトリクスに反映され
ず、認識性能の低下をもたらすという問題点があった。
このような場合の例を図5に示す。図5は、数字の
「5」において、下部がル−プを作りつぶれてしまった
例であるが、このとき、文字全体の平均線幅は大きな値
となり、その結果、例えば、波線501で示されたよう
な通常に書かれたストロ−クの部分等は線幅の2倍以下
の大きさとなってしまい、結局、サブパタンとして抽出
されなくなる。従って、波線501が示すストロ−クが
ないパタンとして、特徴抽出されるので、例えば「6」
等に極めて類似してくることになり、「6」に誤読する
確率が増大する。
【0008】本発明は、前記従来のサブパタン抽出方法
において、文字を構成する各ストロ−ク成分の線幅が平
均線幅に近いところで分布する場合には、有効な特徴抽
出となり得る一方、局所的なストロ−クの線幅が他の部
分の線幅と大きな差がある場合、即ち、一部がつぶれて
いたり、かすれていたりするような文字パタンに対して
は、適切な特徴抽出ができず認識性能の低下をもたらす
といった問題点を除去し、局所線幅の異なる各ストロ−
ク成分のそれぞれに対して、最適な閾値で各方向から走
査してサブパタンを抽出し、該サブパタンに基づいた特
徴抽出、認識処理を行うことによって、局所的な線幅に
大きなばらつきのある品質の良くない文字パタンに対し
ても、高精度で、安定な認識性能の得られる文字認識装
置を提供することを目的とする。
において、文字を構成する各ストロ−ク成分の線幅が平
均線幅に近いところで分布する場合には、有効な特徴抽
出となり得る一方、局所的なストロ−クの線幅が他の部
分の線幅と大きな差がある場合、即ち、一部がつぶれて
いたり、かすれていたりするような文字パタンに対して
は、適切な特徴抽出ができず認識性能の低下をもたらす
といった問題点を除去し、局所線幅の異なる各ストロ−
ク成分のそれぞれに対して、最適な閾値で各方向から走
査してサブパタンを抽出し、該サブパタンに基づいた特
徴抽出、認識処理を行うことによって、局所的な線幅に
大きなばらつきのある品質の良くない文字パタンに対し
ても、高精度で、安定な認識性能の得られる文字認識装
置を提供することを目的とする。
【0009】
【課題を解決するための手段】本発明は、前記課題を解
決するために、帳票等に記入された文字パタンを光学的
に走査して、量子化された電気信号である2値画像に変
換する光電変換部と、前記2値画像に変換された文字パ
タンを格納するパタンレジスタと、前記パタンレジスタ
内の文字パタンの外接枠を検出する外接枠検出部と、前
記パタンレジスタの外接枠内の文字パタンの線幅を算出
する文字パタン線幅計算部と、前記パタンレジスタの外
接枠内の文字パタンに対して、各々、水平、垂直、右斜
め、左斜め方向に走査して得られた黒画素の連続数が前
記線幅に基づいて定められた閾値を超えた場合にストロ
−クとして検出し、これらのストロ−クの分布を表わす
サブパタンを各方向毎に4種類抽出するサブパタン抽出
部と、前記パタンレジスタの外接枠内の2値画像及び前
記4種類のサブパタンより、文字パタンを構成する黒画
素の中で、前記4種類のサブパタンのいずれにも属さな
い黒画素をかすれパタンとして抽出するかすれパタン抽
出部と、前記かすれパタンを構成する各々独立したセグ
メントのうち、微小セグメントを除去する微小セグメン
ト除去部と、前記かすれパタンの線幅を算出するかすれ
パタン線幅計算部と、微小セグメントを除去したかすれ
パタンについてサブパタンの抽出の必要が有りと判定さ
れた場合に、前記かすれパタンの線幅に基づいてかすれ
パタンのストロ−クの分布を表わすかすれサブパタンを
前記同様に各走査方向毎に4種類抽出するかすれサブパ
タン抽出部と、前記サブパタン或は前記サブパタンとか
すれサブパタンを各走査方向毎に合成した合成サブパタ
ンの何れか一方のサブパタンを特徴抽出部に出力する制
御部と、前記サブパタン或は合成サブパタンの特徴マト
リクスを抽出する特徴抽出部と、前記特徴マトリクスと
予め用意された辞書マトリクスとを照合した結果に基づ
き認識結果を出力する識別部とを有することを特徴とす
る。
決するために、帳票等に記入された文字パタンを光学的
に走査して、量子化された電気信号である2値画像に変
換する光電変換部と、前記2値画像に変換された文字パ
タンを格納するパタンレジスタと、前記パタンレジスタ
内の文字パタンの外接枠を検出する外接枠検出部と、前
記パタンレジスタの外接枠内の文字パタンの線幅を算出
する文字パタン線幅計算部と、前記パタンレジスタの外
接枠内の文字パタンに対して、各々、水平、垂直、右斜
め、左斜め方向に走査して得られた黒画素の連続数が前
記線幅に基づいて定められた閾値を超えた場合にストロ
−クとして検出し、これらのストロ−クの分布を表わす
サブパタンを各方向毎に4種類抽出するサブパタン抽出
部と、前記パタンレジスタの外接枠内の2値画像及び前
記4種類のサブパタンより、文字パタンを構成する黒画
素の中で、前記4種類のサブパタンのいずれにも属さな
い黒画素をかすれパタンとして抽出するかすれパタン抽
出部と、前記かすれパタンを構成する各々独立したセグ
メントのうち、微小セグメントを除去する微小セグメン
ト除去部と、前記かすれパタンの線幅を算出するかすれ
パタン線幅計算部と、微小セグメントを除去したかすれ
パタンについてサブパタンの抽出の必要が有りと判定さ
れた場合に、前記かすれパタンの線幅に基づいてかすれ
パタンのストロ−クの分布を表わすかすれサブパタンを
前記同様に各走査方向毎に4種類抽出するかすれサブパ
タン抽出部と、前記サブパタン或は前記サブパタンとか
すれサブパタンを各走査方向毎に合成した合成サブパタ
ンの何れか一方のサブパタンを特徴抽出部に出力する制
御部と、前記サブパタン或は合成サブパタンの特徴マト
リクスを抽出する特徴抽出部と、前記特徴マトリクスと
予め用意された辞書マトリクスとを照合した結果に基づ
き認識結果を出力する識別部とを有することを特徴とす
る。
【0010】
【作用】この発明によれば、原文字パタンの平均線幅に
基づいた文字のストロークの分布状態を表わすサブパタ
ンが各走査方向毎に4種類抽出され、更に抽出されたサ
ブパタンの何れにも属さないパタンから成るかすれパタ
ンが抽出される。このかすれパタンから微小セグメント
を除去した残りのパタンに対しサブパタンの抽出の必要
の有無が判定され、抽出の必要有りと判定された場合に
は当該かすれパタンの平均線幅に基づいたかすれサブパ
タンが抽出される。その後、前記サブパタン或はかすれ
サブパタンが抽出された場合には前記サブパタンとかす
れサブパタンとの合成サブパタンの何れか一方が制御部
の制御の下に特徴抽出部に出力されて当該文字パタンに
関する特徴抽出が行われ、この特徴が辞書の特徴と照合
されることにより文字認識がおこなわれる。従って、文
字パタンを構成するストローク成分で文字認識に本質的
な役割を果たすものの一部がかすれたり或は小さくなっ
たような場合でもかすれサブパタンとして救済し抽出す
ることが可能となるため局所的な線幅にばらつきの有る
ような低品質の文字パタンに対し他も高精度で、安定し
た認識性能を得ることが可能となる。
基づいた文字のストロークの分布状態を表わすサブパタ
ンが各走査方向毎に4種類抽出され、更に抽出されたサ
ブパタンの何れにも属さないパタンから成るかすれパタ
ンが抽出される。このかすれパタンから微小セグメント
を除去した残りのパタンに対しサブパタンの抽出の必要
の有無が判定され、抽出の必要有りと判定された場合に
は当該かすれパタンの平均線幅に基づいたかすれサブパ
タンが抽出される。その後、前記サブパタン或はかすれ
サブパタンが抽出された場合には前記サブパタンとかす
れサブパタンとの合成サブパタンの何れか一方が制御部
の制御の下に特徴抽出部に出力されて当該文字パタンに
関する特徴抽出が行われ、この特徴が辞書の特徴と照合
されることにより文字認識がおこなわれる。従って、文
字パタンを構成するストローク成分で文字認識に本質的
な役割を果たすものの一部がかすれたり或は小さくなっ
たような場合でもかすれサブパタンとして救済し抽出す
ることが可能となるため局所的な線幅にばらつきの有る
ような低品質の文字パタンに対し他も高精度で、安定し
た認識性能を得ることが可能となる。
【0011】
【実施例】以下に本発明による文字認識装置の実施例1
及び実施例2を説明するが、ここでは例えば図4の40
1,図5の501及び図6(a)の「因」を構成する要
素「大」等は、便宜上、かすれパタンという名称で一括
して呼称する。また実施例1では、図6(a)の漢字
「因」という字の2値画像に対して、本実施例を適用し
た例について併せて説明していく。
及び実施例2を説明するが、ここでは例えば図4の40
1,図5の501及び図6(a)の「因」を構成する要
素「大」等は、便宜上、かすれパタンという名称で一括
して呼称する。また実施例1では、図6(a)の漢字
「因」という字の2値画像に対して、本実施例を適用し
た例について併せて説明していく。
【0012】図1は、本発明による文字認識装置の実施
例1を示すブロック図である。ここで、101は、文字
パタンをスキャナで走査して得られた光信号入力、10
2は光電変換部、103はパタンレジスタ、104は外
接枠検出部、105は文字パタン線幅計算部、106は
水平方向走査部、107は水平サブパタン1メモリ、1
08は垂直方向走査部、109は垂直サブパタン1メモ
リ、110は右斜め方向走査部、111は右斜めサブパ
タン1メモリ、112は左斜め方向走査部、113は左
斜めサブパタン1メモリ、114はかすれパタン抽出
部、115はかすれパタンメモリ、116はかすれパタ
ン線幅計算部、117は水平方向走査部、118は水平
かすれサブパタンメモリ、119は垂直方向走査部、1
20は垂直かすれサブパタンメモリ、121は右斜め方
向走査部、122は右斜めかすれサブパタンメモリ、1
23は左斜め方向走査部、124は左斜めかすれサブパ
タンメモリ、125は水平サブパタン合成部、126は
水平サブパタン2メモリ、127は垂直サブパタン合成
部、128は垂直サブパタン2メモリ、129は右斜め
サブパタン合成部、130は右斜めサブパタン2メモ
リ、131は左斜めサブパタン合成部、132は左斜め
サブパタン2メモリ、133は出力制御部、134は線
幅判定部、135は特徴抽出部、136は識別部、13
7は辞書メモリ、138は認識結果、139は微小セグ
メント除去部である。
例1を示すブロック図である。ここで、101は、文字
パタンをスキャナで走査して得られた光信号入力、10
2は光電変換部、103はパタンレジスタ、104は外
接枠検出部、105は文字パタン線幅計算部、106は
水平方向走査部、107は水平サブパタン1メモリ、1
08は垂直方向走査部、109は垂直サブパタン1メモ
リ、110は右斜め方向走査部、111は右斜めサブパ
タン1メモリ、112は左斜め方向走査部、113は左
斜めサブパタン1メモリ、114はかすれパタン抽出
部、115はかすれパタンメモリ、116はかすれパタ
ン線幅計算部、117は水平方向走査部、118は水平
かすれサブパタンメモリ、119は垂直方向走査部、1
20は垂直かすれサブパタンメモリ、121は右斜め方
向走査部、122は右斜めかすれサブパタンメモリ、1
23は左斜め方向走査部、124は左斜めかすれサブパ
タンメモリ、125は水平サブパタン合成部、126は
水平サブパタン2メモリ、127は垂直サブパタン合成
部、128は垂直サブパタン2メモリ、129は右斜め
サブパタン合成部、130は右斜めサブパタン2メモ
リ、131は左斜めサブパタン合成部、132は左斜め
サブパタン2メモリ、133は出力制御部、134は線
幅判定部、135は特徴抽出部、136は識別部、13
7は辞書メモリ、138は認識結果、139は微小セグ
メント除去部である。
【0013】帳票等に手書きまたは印刷された文字パタ
ンをスキャナで走査して得られた光信号101は、光電
変換部102において、電気信号に変換され、さらに量
子化れて2値の信号からなる2値画像に変換されパタン
レジスタ103に格納される。
ンをスキャナで走査して得られた光信号101は、光電
変換部102において、電気信号に変換され、さらに量
子化れて2値の信号からなる2値画像に変換されパタン
レジスタ103に格納される。
【0014】外接枠検出部104は、パタンレジスタ1
03に蓄えられた2値画像に対し、水平走査により前記
2値画像の上端及び下端を検出し、垂直走査により前記
2値画像の左端及び右端を検出し、その結果、当該入力
文字パタンに外接する矩形である外接枠を得る。そし
て、外接枠に関する座標値を文字パタン線幅計算部10
5、水平方向走査部106、垂直方向走査部108、右
斜め方向走査部110、左斜め方向走査部112及びか
すれパタン抽出部114に出力し、文字パタンの領域を
指定する。以下の処理において、パタンレジスタ103
の2値画像を用いる場合は、全て外接枠内にある2値画
像を対象とする。
03に蓄えられた2値画像に対し、水平走査により前記
2値画像の上端及び下端を検出し、垂直走査により前記
2値画像の左端及び右端を検出し、その結果、当該入力
文字パタンに外接する矩形である外接枠を得る。そし
て、外接枠に関する座標値を文字パタン線幅計算部10
5、水平方向走査部106、垂直方向走査部108、右
斜め方向走査部110、左斜め方向走査部112及びか
すれパタン抽出部114に出力し、文字パタンの領域を
指定する。以下の処理において、パタンレジスタ103
の2値画像を用いる場合は、全て外接枠内にある2値画
像を対象とする。
【0015】文字パタン線幅計算部105では、当該文
字パタンの平均線幅が計算される。ここで、平均線幅の
求め方の一つの例として、本実施例では、次の方法を採
用した。即ち、パタンレジスタ103の外接枠内の文字
パタンの2値画像の黒画素数をA、4黒画素数をQとし
た時、平均線幅Wrを次式で計算する方法である。 Wr = A / (A − Q) (1) 但し、4黒画素とは、2値画像を2×2の窓で走査した
時に2×2の窓の全てが黒画素となる点であり、4黒画
素数Qとは、そのような4黒画素を計数したものであ
る。
字パタンの平均線幅が計算される。ここで、平均線幅の
求め方の一つの例として、本実施例では、次の方法を採
用した。即ち、パタンレジスタ103の外接枠内の文字
パタンの2値画像の黒画素数をA、4黒画素数をQとし
た時、平均線幅Wrを次式で計算する方法である。 Wr = A / (A − Q) (1) 但し、4黒画素とは、2値画像を2×2の窓で走査した
時に2×2の窓の全てが黒画素となる点であり、4黒画
素数Qとは、そのような4黒画素を計数したものであ
る。
【0016】次にパタンレジスタ103の外接枠内の文
字パタンに対して、水平方向走査部106において水平
方向に、垂直方向走査部108において垂直方向に、右
斜め方向走査部110において右斜め方向に、左斜め方
向走査部112において左斜め方向に、それぞれ走査
し、前記線幅に基づいた値を閾値として、連続した黒画
素であるストロ−クを検出していき、それらの分布状態
を反映するサブパタンを生成する。この時、その連続し
た黒画素がサブパタンを構成するストロ−ク成分である
ことの条件は、連続黒画素数をLとしたとき、次式で与
えられる。 L > 2 × Wr (2) ここで、Wrは前述の平均線幅である。即ち、それぞれ
の方向の走査において平均線幅の2倍を超える長さを持
つストロ−クが当該方向のサブパタンを構成するストロ
−クとして抽出されるのである。以上のように検出され
た外接枠内における連続黒画素としてのストロ−クの分
布状態は、各々の走査方向毎に、水平サブパタン1、垂
直サブパタン1、右斜めサブパタン1、左斜めサブパタ
ン1として、それぞれ水平サブパタン1メモリ107、
垂直サブパタン1メモリ109、右斜めサブパタン1メ
モリ111、左斜めサブパタン1メモリ113に格納さ
れる。
字パタンに対して、水平方向走査部106において水平
方向に、垂直方向走査部108において垂直方向に、右
斜め方向走査部110において右斜め方向に、左斜め方
向走査部112において左斜め方向に、それぞれ走査
し、前記線幅に基づいた値を閾値として、連続した黒画
素であるストロ−クを検出していき、それらの分布状態
を反映するサブパタンを生成する。この時、その連続し
た黒画素がサブパタンを構成するストロ−ク成分である
ことの条件は、連続黒画素数をLとしたとき、次式で与
えられる。 L > 2 × Wr (2) ここで、Wrは前述の平均線幅である。即ち、それぞれ
の方向の走査において平均線幅の2倍を超える長さを持
つストロ−クが当該方向のサブパタンを構成するストロ
−クとして抽出されるのである。以上のように検出され
た外接枠内における連続黒画素としてのストロ−クの分
布状態は、各々の走査方向毎に、水平サブパタン1、垂
直サブパタン1、右斜めサブパタン1、左斜めサブパタ
ン1として、それぞれ水平サブパタン1メモリ107、
垂直サブパタン1メモリ109、右斜めサブパタン1メ
モリ111、左斜めサブパタン1メモリ113に格納さ
れる。
【0017】図6を例にとると、走査前の原2値画像が
図6(a)に、水平サブパタン1が図6(b)に、垂直
サブパタン1が図6(c)に、右斜めサブパタン1が図
6(d)に、左斜めサブパタン1が図6(e)に各々表
されている。前述したように「因」を構成する要素
「大」は、平均線幅の2倍以下のスケ−ルであるため各
サブパタンには全く反映されていないことがわかる。
図6(a)に、水平サブパタン1が図6(b)に、垂直
サブパタン1が図6(c)に、右斜めサブパタン1が図
6(d)に、左斜めサブパタン1が図6(e)に各々表
されている。前述したように「因」を構成する要素
「大」は、平均線幅の2倍以下のスケ−ルであるため各
サブパタンには全く反映されていないことがわかる。
【0018】次のかすれパタン抽出部114は、パタン
レジスタ103の外接枠内の2値画像及び水平サブパタ
ン1、垂直サブパタン1、右斜めサブパタン1、左斜め
サブパタン1とを用いて、サブパタンとして抽出されな
かったストロ−ク成分の分布状態をかすれパタンとして
抽出する。図3はかすれパタン抽出部の構成例を示すブ
ロック図であり、点線で示された枠内がかすれパタン抽
出部114の内部を表している。301はOR回路部、
302はメモリ、303はNOT回路部、304は文字
パタンメモリ、305はAND回路部である。
レジスタ103の外接枠内の2値画像及び水平サブパタ
ン1、垂直サブパタン1、右斜めサブパタン1、左斜め
サブパタン1とを用いて、サブパタンとして抽出されな
かったストロ−ク成分の分布状態をかすれパタンとして
抽出する。図3はかすれパタン抽出部の構成例を示すブ
ロック図であり、点線で示された枠内がかすれパタン抽
出部114の内部を表している。301はOR回路部、
302はメモリ、303はNOT回路部、304は文字
パタンメモリ、305はAND回路部である。
【0019】図3に示されたかすれパタン抽出部114
における各ブロックの機能及び処理の流れについて以下
で説明する。先ず、各方向のサブパタンメモリ107,
109,111,113に格納された水平サブパタン
1、垂直サブパタン1、右斜めサブパタン1及び左斜め
サブパタン1は、OR回路部301に入力される。OR
回路部301では、各サブパタンの黒画素を1、白画素
を0としたとき、外接枠で囲まれたサブパタン領域の画
素1つ1つについて、4つのサブパタン1の画素値のO
R論理演算が実行され、当該演算結果が、予めメモリ3
02に用意されたサブパタン領域と同じ句形領域の対応
する画素についてそれぞれ出力されていき、最終的に
は、4つのサブパタン1の和集合であるパタンがメモリ
302上に生成される。このパタンは、当該領域の各画
素において、4つのサブパタンの内、少なくとも1つの
サブパタンの画素値が1、即ち、黒画素である時に、黒
画素であり、4つのサブパタン1のいずれも画素値が
0、即ち、白画素である時に白画素となっている。従っ
て、このサブパタンの和集合のパタンの白画素部分は、
もともと文字パタンの2値画像で白画素であったか或い
は、2値画像では黒画素であるがサブパタンとしては抽
出されなかったかのどちらかである。
における各ブロックの機能及び処理の流れについて以下
で説明する。先ず、各方向のサブパタンメモリ107,
109,111,113に格納された水平サブパタン
1、垂直サブパタン1、右斜めサブパタン1及び左斜め
サブパタン1は、OR回路部301に入力される。OR
回路部301では、各サブパタンの黒画素を1、白画素
を0としたとき、外接枠で囲まれたサブパタン領域の画
素1つ1つについて、4つのサブパタン1の画素値のO
R論理演算が実行され、当該演算結果が、予めメモリ3
02に用意されたサブパタン領域と同じ句形領域の対応
する画素についてそれぞれ出力されていき、最終的に
は、4つのサブパタン1の和集合であるパタンがメモリ
302上に生成される。このパタンは、当該領域の各画
素において、4つのサブパタンの内、少なくとも1つの
サブパタンの画素値が1、即ち、黒画素である時に、黒
画素であり、4つのサブパタン1のいずれも画素値が
0、即ち、白画素である時に白画素となっている。従っ
て、このサブパタンの和集合のパタンの白画素部分は、
もともと文字パタンの2値画像で白画素であったか或い
は、2値画像では黒画素であるがサブパタンとしては抽
出されなかったかのどちらかである。
【0020】次にメモリ302上に生成された前記パタ
ンについて、NOT回路部303によるNOT演算が実
行される。NOT回路部303では、メモリ302上の
パタンを構成する画素の一つ一つについて、順次、画素
値0の画素を画素値1に、画素値1の画素を画素値0に
変換し、即ち、白画素を黒画素に、黒画素を白画素に変
換するNOT演算を実行し、当該演算結果をメモリ30
2における当該画素上に出力する。以上のようにして、
メモリ302上には、OR回路部301によって生成さ
れたサブパタンの和集合であるパタンを白黒反転させた
パタンが生成される。
ンについて、NOT回路部303によるNOT演算が実
行される。NOT回路部303では、メモリ302上の
パタンを構成する画素の一つ一つについて、順次、画素
値0の画素を画素値1に、画素値1の画素を画素値0に
変換し、即ち、白画素を黒画素に、黒画素を白画素に変
換するNOT演算を実行し、当該演算結果をメモリ30
2における当該画素上に出力する。以上のようにして、
メモリ302上には、OR回路部301によって生成さ
れたサブパタンの和集合であるパタンを白黒反転させた
パタンが生成される。
【0021】一方、上述の処理とは独立に、パタンレジ
スタ103の2値画像の内、外接枠検出部104によっ
て検出された外接枠内の2値画像のみが文字パタンメモ
リ304に転送される。
スタ103の2値画像の内、外接枠検出部104によっ
て検出された外接枠内の2値画像のみが文字パタンメモ
リ304に転送される。
【0022】次にメモリ302上のパタンと文字パタン
メモリ304上の文字パタンに対して、AND回路部3
05によって、AND演算が実行される。AND回路部
305では、パタン領域内の個々の画素について、メモ
リ302上のパタンの画素値と該画素に対応する文字パ
タンメモリ304上の文字パタンの画素値とのAND演
算、即ち、両者の画素値が1であったときのみに、画素
値1を出力し、少なくともどちらかが0であったとき
は、画素値0を出力する演算を実行していき、当該演算
結果をかすれパタンとして、かすれパタンメモリ115
に出力する。
メモリ304上の文字パタンに対して、AND回路部3
05によって、AND演算が実行される。AND回路部
305では、パタン領域内の個々の画素について、メモ
リ302上のパタンの画素値と該画素に対応する文字パ
タンメモリ304上の文字パタンの画素値とのAND演
算、即ち、両者の画素値が1であったときのみに、画素
値1を出力し、少なくともどちらかが0であったとき
は、画素値0を出力する演算を実行していき、当該演算
結果をかすれパタンとして、かすれパタンメモリ115
に出力する。
【0023】このかすれパタンは、上述の説明で理解で
きるように、文字パタンを構成する黒画素の中で、4つ
のサブパタン1の黒画素のいずれにも所属しないものを
抽出してできたものである。即ち、かすれパタンは、例
えば、図4の401が示すようにストロ−クの一部がか
すれ、いくつかのセグメントに分裂してできたストロ−
クや図5の501が示すように元々孤立したストロ−ク
であって、式(2)で示された平均線幅の2倍という閾
値に達しないもの等から構成されている。尚、このかす
れパタン抽出部の処理を図6(a)の原2値画像に適用
すると、図6(a)から図6(b),(c),(d),
(e)の各サブパタンの黒画素を全て除去することにな
り、従って、図6(f)のように、サブパタンとして抽
出されなかった要素「大」だけからなるかすれパタンが
得られる。
きるように、文字パタンを構成する黒画素の中で、4つ
のサブパタン1の黒画素のいずれにも所属しないものを
抽出してできたものである。即ち、かすれパタンは、例
えば、図4の401が示すようにストロ−クの一部がか
すれ、いくつかのセグメントに分裂してできたストロ−
クや図5の501が示すように元々孤立したストロ−ク
であって、式(2)で示された平均線幅の2倍という閾
値に達しないもの等から構成されている。尚、このかす
れパタン抽出部の処理を図6(a)の原2値画像に適用
すると、図6(a)から図6(b),(c),(d),
(e)の各サブパタンの黒画素を全て除去することにな
り、従って、図6(f)のように、サブパタンとして抽
出されなかった要素「大」だけからなるかすれパタンが
得られる。
【0024】かすれパタン抽出部114で抽出されたか
すれパタンは、かすれパタンメモリ115に格納されて
いるが、必要に応じて、このかすれパタンにおける微小
セグメントを除去するための微小セグメント除去部13
9を設置することも可能である。例えば、この微小セグ
メント除去部139による微小セグメントの除去ル−ル
として、次のものが考えられる。即ち、かすれパタンを
構成する各セグメントの輪郭を構成する輪郭黒画素数ま
たは、各セグメントの全黒画素数が、所定の閾値、例え
ば、当該入力文字パタンの線幅Wrのβ倍(β>0)以
下であったとき、微小セグメントとみなすというル−ル
である。ここで微小と判定されたセグメントは、かすれ
パタンメモリ上で消去されるか、あるいは処理の対象外
とされる。以上のように微小セグメントが消去されるこ
とによって、それに起因する認識性能の低下を未然に防
止することができる。
すれパタンは、かすれパタンメモリ115に格納されて
いるが、必要に応じて、このかすれパタンにおける微小
セグメントを除去するための微小セグメント除去部13
9を設置することも可能である。例えば、この微小セグ
メント除去部139による微小セグメントの除去ル−ル
として、次のものが考えられる。即ち、かすれパタンを
構成する各セグメントの輪郭を構成する輪郭黒画素数ま
たは、各セグメントの全黒画素数が、所定の閾値、例え
ば、当該入力文字パタンの線幅Wrのβ倍(β>0)以
下であったとき、微小セグメントとみなすというル−ル
である。ここで微小と判定されたセグメントは、かすれ
パタンメモリ上で消去されるか、あるいは処理の対象外
とされる。以上のように微小セグメントが消去されるこ
とによって、それに起因する認識性能の低下を未然に防
止することができる。
【0025】かすれパタン線幅計算部116において
は、かすれパタンの線幅が計算される。この線幅の計算
方法としては、例えば、文字パタン線幅計算部105で
使用した式(1)に基づく方法が用いられる。
は、かすれパタンの線幅が計算される。この線幅の計算
方法としては、例えば、文字パタン線幅計算部105で
使用した式(1)に基づく方法が用いられる。
【0026】次にかすれパタンメモリ115内のかすれ
パタンに対して、水平方向走査部117、垂直方向走査
部119、右斜め方向走査部121及び左斜め方向走査
部123によって、それぞれ水平、垂直、右斜め、左斜
め方向に走査され、所定の閾値を超えて連続した黒画素
がストロ−クとして検出されていく。その結果、今度は
かすれパタンのサブパタン、即ち、かすれサブパタンが
抽出され、それぞれ水平かすれサブパタンメモリ11
8、垂直かすれサブパタンメモリ120、右斜めかすれ
サブパタンメモリ122及び左斜めかすれサブパタンメ
モリ124に格納される。尚、ここで、サブパタンを構
成するストロ−ク成分であるための条件は、式(2)で
与えられるのではなく、連続した黒画素数をLとしたと
き、次式で与えられる。
パタンに対して、水平方向走査部117、垂直方向走査
部119、右斜め方向走査部121及び左斜め方向走査
部123によって、それぞれ水平、垂直、右斜め、左斜
め方向に走査され、所定の閾値を超えて連続した黒画素
がストロ−クとして検出されていく。その結果、今度は
かすれパタンのサブパタン、即ち、かすれサブパタンが
抽出され、それぞれ水平かすれサブパタンメモリ11
8、垂直かすれサブパタンメモリ120、右斜めかすれ
サブパタンメモリ122及び左斜めかすれサブパタンメ
モリ124に格納される。尚、ここで、サブパタンを構
成するストロ−ク成分であるための条件は、式(2)で
与えられるのではなく、連続した黒画素数をLとしたと
き、次式で与えられる。
【0027】
【数1】
【0028】但し、Wsは、かすれパタン線幅計算部1
16によって計算されたかすれパタンの線幅値である。
また(4)式で、γ=2としなかったのは、通常より小
さな領域で線幅を計算すること等に由来する誤差を考慮
したからであり、γに補正因子が乗じられているとみな
す。この補正因子は、経験的に求められるが、勿論、通
常はγ=2として閾値を設定してもよい。
16によって計算されたかすれパタンの線幅値である。
また(4)式で、γ=2としなかったのは、通常より小
さな領域で線幅を計算すること等に由来する誤差を考慮
したからであり、γに補正因子が乗じられているとみな
す。この補正因子は、経験的に求められるが、勿論、通
常はγ=2として閾値を設定してもよい。
【0029】かすれサブパタンの抽出処理を図6を例に
とって説明する。先ず、「因」の字からかすれパタンと
して抽出された部分パタン「大」は図6(f)に示され
ており、このかすれパタンに対して、水平、垂直、右斜
め、左斜め方向に走査して得られたかすれサブパタン
が、それぞれ、図6(g)、(h)、(i)、(j)に
示されている。前述したように、当該走査における閾値
は、図6(a)の原2値画像「因」の線幅ではなく、図
6(f)のかすれパタン「大」の線幅に基づいて決定さ
れる。従って、図6(a)の原2値画像の走査時では、
線幅値が大きかったため抽出されなかった「大」の字の
サブパタンが、好適な線幅値による走査によって適切に
抽出されていることがわかる。
とって説明する。先ず、「因」の字からかすれパタンと
して抽出された部分パタン「大」は図6(f)に示され
ており、このかすれパタンに対して、水平、垂直、右斜
め、左斜め方向に走査して得られたかすれサブパタン
が、それぞれ、図6(g)、(h)、(i)、(j)に
示されている。前述したように、当該走査における閾値
は、図6(a)の原2値画像「因」の線幅ではなく、図
6(f)のかすれパタン「大」の線幅に基づいて決定さ
れる。従って、図6(a)の原2値画像の走査時では、
線幅値が大きかったため抽出されなかった「大」の字の
サブパタンが、好適な線幅値による走査によって適切に
抽出されていることがわかる。
【0030】次に、原2値画像に対する走査によって抽
出された水平サブパタン1、垂直サブパタン1、右斜め
サブパタン1、左斜めサブパタン1と、かすれパタンに
対する走査によって抽出された水平かすれサブパタン、
垂直かすれサブパタン、右斜めかすれサブパタン、左斜
めかすれサブパタンとをそれぞれ合成する処理を行う。
この合成処理は、各方向のサブパタンに対して、それぞ
れ独立に水平サブパタン合成部125、垂直サブパタン
合成部127、右斜めサブパタン合成部129、左斜め
サブパタン合成部131によって実行される。合成され
たパタンは、それぞれ水平サブパタン2、垂直サブパタ
ン2、右斜めサブパタン2、左斜めサブパタン2とし
て、各々、水平サブパタン2メモリ126、垂直サブパ
タン2メモリ128、右斜めサブパタン2メモリ13
0、左斜めサブパタンメモリ132に格納される。
出された水平サブパタン1、垂直サブパタン1、右斜め
サブパタン1、左斜めサブパタン1と、かすれパタンに
対する走査によって抽出された水平かすれサブパタン、
垂直かすれサブパタン、右斜めかすれサブパタン、左斜
めかすれサブパタンとをそれぞれ合成する処理を行う。
この合成処理は、各方向のサブパタンに対して、それぞ
れ独立に水平サブパタン合成部125、垂直サブパタン
合成部127、右斜めサブパタン合成部129、左斜め
サブパタン合成部131によって実行される。合成され
たパタンは、それぞれ水平サブパタン2、垂直サブパタ
ン2、右斜めサブパタン2、左斜めサブパタン2とし
て、各々、水平サブパタン2メモリ126、垂直サブパ
タン2メモリ128、右斜めサブパタン2メモリ13
0、左斜めサブパタンメモリ132に格納される。
【0031】ここで前記合成部におけるパタンの合成
は、例えば、2つのサブパタンの個々の画素についてO
R演算を行う方法等が用いられる。つまり、2つの2値
パタンを合成する場合、各々を構成する個々の画素にお
いて、少なくともどちらかが、画素値1、即ち、黒画素
であれば画素値1を出力し、両者ともに画素値0、即
ち、白画素であったときに画素値0を出力するという方
法で合成パタンを作成する。図6の例の場合、原2値画
像のサブパタンとして、それぞれ、図6(b)、
(c)、(d)、(e)が与えられ、かすれパタンのサ
ブパタンとしてはそれぞれ図6(g)、(h)、
(i)、(j)が与えられているときに前記合成部によ
って、合成されたサブパタン2は、各々図6(k)、
(l)、(m)、(n)となる。これらの合成されたサ
ブパタン2は、原2値画像のサブパタンと比較して、局
所的なスケ−ルの小さい部分が正確に反映されているの
で、そのサブパタンに基づいて計算される特徴マトリク
スにも当然それが反映され、従って、従来のサブパタン
抽出にともなう情報劣化による誤読等が防止できる。
は、例えば、2つのサブパタンの個々の画素についてO
R演算を行う方法等が用いられる。つまり、2つの2値
パタンを合成する場合、各々を構成する個々の画素にお
いて、少なくともどちらかが、画素値1、即ち、黒画素
であれば画素値1を出力し、両者ともに画素値0、即
ち、白画素であったときに画素値0を出力するという方
法で合成パタンを作成する。図6の例の場合、原2値画
像のサブパタンとして、それぞれ、図6(b)、
(c)、(d)、(e)が与えられ、かすれパタンのサ
ブパタンとしてはそれぞれ図6(g)、(h)、
(i)、(j)が与えられているときに前記合成部によ
って、合成されたサブパタン2は、各々図6(k)、
(l)、(m)、(n)となる。これらの合成されたサ
ブパタン2は、原2値画像のサブパタンと比較して、局
所的なスケ−ルの小さい部分が正確に反映されているの
で、そのサブパタンに基づいて計算される特徴マトリク
スにも当然それが反映され、従って、従来のサブパタン
抽出にともなう情報劣化による誤読等が防止できる。
【0032】さて、上述の方法により作成されたサブパ
タンは、特徴抽出部135においてさらに圧縮された特
徴に変換されるわけであるが、本実施例では、出力制御
部133の制御の下に特徴抽出部135に入力させるサ
ブパタンを選択できるようにしている。この出力制御部
133は、前記微小セグメント除去部139においてか
すれパタンを構成する各セグメントが全て微小であると
判定された場合に、それ以降のかすれパタンに対する処
理を中止させ、原2値画像から得られた各方向のサブパ
タン1をそれぞれのメモリ107、109、111、1
13から読取り、特徴抽出部135に出力する。また、
前記かすれパタン線幅計算部116で計算されたかすれ
パタンの線幅は、常時、線幅判定部134で判定されて
おり、前記線幅が所定の閾値以下であると判定された場
合、その判定結果は出力制御部133に伝達される。こ
の時、前記線幅に対する閾値としては、例えば、次式が
与えられる。 Ws < δ × Wr (5) 0 < δ 《 1 (6) 但し、Wsはかすれパタンの平均線幅、Wrは原2値画
像の平均線幅であって、式(5)及び式(6)の条件が
満たされる時は、WsがWrに比べて極端に小さいこと
を意味している。
タンは、特徴抽出部135においてさらに圧縮された特
徴に変換されるわけであるが、本実施例では、出力制御
部133の制御の下に特徴抽出部135に入力させるサ
ブパタンを選択できるようにしている。この出力制御部
133は、前記微小セグメント除去部139においてか
すれパタンを構成する各セグメントが全て微小であると
判定された場合に、それ以降のかすれパタンに対する処
理を中止させ、原2値画像から得られた各方向のサブパ
タン1をそれぞれのメモリ107、109、111、1
13から読取り、特徴抽出部135に出力する。また、
前記かすれパタン線幅計算部116で計算されたかすれ
パタンの線幅は、常時、線幅判定部134で判定されて
おり、前記線幅が所定の閾値以下であると判定された場
合、その判定結果は出力制御部133に伝達される。こ
の時、前記線幅に対する閾値としては、例えば、次式が
与えられる。 Ws < δ × Wr (5) 0 < δ 《 1 (6) 但し、Wsはかすれパタンの平均線幅、Wrは原2値画
像の平均線幅であって、式(5)及び式(6)の条件が
満たされる時は、WsがWrに比べて極端に小さいこと
を意味している。
【0033】前記線幅判定部134からWsがWrに比
べて極端に小さい場合には出力制御部133はかすれパ
タンに対する走査を中止させ、原2値画像に対する走査
によって得られた各方向のサブパタン1をそれぞれのメ
モリ107、109、111、113から読取り、特徴
抽出部135に出力する。以上の出力制御部133の処
理は、以下に述べる問題点に鑑みてなされたものであ
る。
べて極端に小さい場合には出力制御部133はかすれパ
タンに対する走査を中止させ、原2値画像に対する走査
によって得られた各方向のサブパタン1をそれぞれのメ
モリ107、109、111、113から読取り、特徴
抽出部135に出力する。以上の出力制御部133の処
理は、以下に述べる問題点に鑑みてなされたものであ
る。
【0034】かすれサブパタンを原2値画像の走査によ
って得られたサブパタン1に合成することは、除去され
た重要な情報を回復させる一方でストロ−クのノイズ的
な成分をもつけ加えてしまうおそれがある。従って本実
施例では、非本質的なストロ−ク成分の除去を目指すた
めに、前述したように先ず、微小セグメント除去部13
9においてかすれパタン内の微小セグメントを除去し、
また当然のことながら全てのセグメントが微小と判定さ
れた場合には、原2値画像に対する走査によって得られ
たサブパタン1だけを特徴抽出部135に出力するよう
にしたのである。さらに線幅判定部134を設け、かす
れパタンの線幅が所定の閾値に達しない場合にも当該か
すれパタンは、認識上、非本質的であると判定すること
にして、かかる場合にかすれパタンの走査を実行せず、
サブパタン1のみを特徴抽出部135に出力するように
したものである。このようにすることで、非本質的なス
トロ−ク成分はサブパタンから除去され、それによる誤
読等を未然に防止することが可能となる。
って得られたサブパタン1に合成することは、除去され
た重要な情報を回復させる一方でストロ−クのノイズ的
な成分をもつけ加えてしまうおそれがある。従って本実
施例では、非本質的なストロ−ク成分の除去を目指すた
めに、前述したように先ず、微小セグメント除去部13
9においてかすれパタン内の微小セグメントを除去し、
また当然のことながら全てのセグメントが微小と判定さ
れた場合には、原2値画像に対する走査によって得られ
たサブパタン1だけを特徴抽出部135に出力するよう
にしたのである。さらに線幅判定部134を設け、かす
れパタンの線幅が所定の閾値に達しない場合にも当該か
すれパタンは、認識上、非本質的であると判定すること
にして、かかる場合にかすれパタンの走査を実行せず、
サブパタン1のみを特徴抽出部135に出力するように
したものである。このようにすることで、非本質的なス
トロ−ク成分はサブパタンから除去され、それによる誤
読等を未然に防止することが可能となる。
【0035】特徴抽出部135では、入力された原2値
画像のサブパタンあるいは合成されたサブパタン4種に
基づいた特徴抽出を行うが、この特徴抽出を行う前に、
予め前記パタンレジスタ103の外接枠内の文字パタン
に対して、例えば各分割領域内の黒画素数が同数になる
ように垂直方向、水平方向に格子状となるN×M個の部
分領域に非線形分割しておく。次に前記4種のサブパタ
ンのそれぞれについて、前記分割された部分領域内にお
ける該サブパタンの黒画素数を計数し、これを文字パタ
ンの大きさで正規化することによって、各方向における
文字線の分布状態を反映するN×M×4次元の特徴マト
リクスを抽出し、識別部136に出力する。
画像のサブパタンあるいは合成されたサブパタン4種に
基づいた特徴抽出を行うが、この特徴抽出を行う前に、
予め前記パタンレジスタ103の外接枠内の文字パタン
に対して、例えば各分割領域内の黒画素数が同数になる
ように垂直方向、水平方向に格子状となるN×M個の部
分領域に非線形分割しておく。次に前記4種のサブパタ
ンのそれぞれについて、前記分割された部分領域内にお
ける該サブパタンの黒画素数を計数し、これを文字パタ
ンの大きさで正規化することによって、各方向における
文字線の分布状態を反映するN×M×4次元の特徴マト
リクスを抽出し、識別部136に出力する。
【0036】識別部136では、入力された前記特徴マ
トリクスと辞書メモリ137に予め格納しておいた複数
の標準文字の特徴マトリクスとを照合し、該照合結果か
ら判断して、最終的に一つの候補カテゴリを該入力文字
パタンの認識結果138として出力する。以上が本発明
による文字認識装置の実施例1である。
トリクスと辞書メモリ137に予め格納しておいた複数
の標準文字の特徴マトリクスとを照合し、該照合結果か
ら判断して、最終的に一つの候補カテゴリを該入力文字
パタンの認識結果138として出力する。以上が本発明
による文字認識装置の実施例1である。
【0037】ここで実施例1は、文字や図形を構成する
ストロ−クの局所線幅が2つに分類できるときに極めて
有効な方法であった。しかし、通常の簡単な文字は、2
種類の線幅による走査でもサブパタンにほぼ反映できる
とみなせる一方、3種類以上のスケ−ルのストロ−クか
ら構成される複雑な図形や漢字等では、2段階の走査で
もとらえきれないストロ−ク成分がある場合が有り得
る。実施例2は、このような問題点に対処し得るもので
あり、実施例1が2段階の線幅による走査であったのに
対し、実施例2は、これをさらに一般化し、N段階(N
≧2)の走査が可能となっている。この実施例2につい
て以下に説明する。
ストロ−クの局所線幅が2つに分類できるときに極めて
有効な方法であった。しかし、通常の簡単な文字は、2
種類の線幅による走査でもサブパタンにほぼ反映できる
とみなせる一方、3種類以上のスケ−ルのストロ−クか
ら構成される複雑な図形や漢字等では、2段階の走査で
もとらえきれないストロ−ク成分がある場合が有り得
る。実施例2は、このような問題点に対処し得るもので
あり、実施例1が2段階の線幅による走査であったのに
対し、実施例2は、これをさらに一般化し、N段階(N
≧2)の走査が可能となっている。この実施例2につい
て以下に説明する。
【0038】図2は本発明による実施例2を示すブロッ
ク図である。ここで、201は光信号入力、202は光
電変換部、203はパタンレジスタ、204は外接枠検
出部、205はレジスタ、206は線幅計算部、207
は水平方向走査部、208は水平パタンメモリ、209
は垂直方向走査部、210は垂直パタンメモリ、211
は右斜め方向走査部、212は右斜めパタンメモリ、2
13は左斜め方向走査部、214は左斜めパタンメモ
リ、215はかすれパタン抽出部、216は微小セグメ
ント除去部、217は線幅判定部、218は水平パタン
合成部、219は水平合成パタンメモリ、220は垂直
パタン合成部、221は垂直合成パタンメモリ、222
は右斜めパタン合成部、223は右斜め合成パタンメモ
リ、224は左斜めパタン合成部、225は左斜め合成
パタンメモリ、226はル−プカウンタ、227は出力
制御部、228は特徴抽出部、229は識別部、230
は辞書メモリ、231は認識結果である。
ク図である。ここで、201は光信号入力、202は光
電変換部、203はパタンレジスタ、204は外接枠検
出部、205はレジスタ、206は線幅計算部、207
は水平方向走査部、208は水平パタンメモリ、209
は垂直方向走査部、210は垂直パタンメモリ、211
は右斜め方向走査部、212は右斜めパタンメモリ、2
13は左斜め方向走査部、214は左斜めパタンメモ
リ、215はかすれパタン抽出部、216は微小セグメ
ント除去部、217は線幅判定部、218は水平パタン
合成部、219は水平合成パタンメモリ、220は垂直
パタン合成部、221は垂直合成パタンメモリ、222
は右斜めパタン合成部、223は右斜め合成パタンメモ
リ、224は左斜めパタン合成部、225は左斜め合成
パタンメモリ、226はル−プカウンタ、227は出力
制御部、228は特徴抽出部、229は識別部、230
は辞書メモリ、231は認識結果である。
【0039】ここでは、主として実施例1との相違点に
ついて説明する。先ず、201、202、203、20
4は実施例1に準じ、パタンレジスタ203の2値画像
のうち、外接枠内のデ−タだけが、レジスタ205に転
送される。後述するようにこのレジスタ205には、文
字パタンの2値デ−タだけでなく、かすれパタンも順
次、上書きされる。線幅計算部206はこのレジスタ2
05内のデ−タに対し、線幅の計算を行う。今は、文字
パタンの2値デ−タが格納されているので、文字パタン
の平均線幅が計算される。この線幅の算出も実施例1の
方法を準用する。
ついて説明する。先ず、201、202、203、20
4は実施例1に準じ、パタンレジスタ203の2値画像
のうち、外接枠内のデ−タだけが、レジスタ205に転
送される。後述するようにこのレジスタ205には、文
字パタンの2値デ−タだけでなく、かすれパタンも順
次、上書きされる。線幅計算部206はこのレジスタ2
05内のデ−タに対し、線幅の計算を行う。今は、文字
パタンの2値デ−タが格納されているので、文字パタン
の平均線幅が計算される。この線幅の算出も実施例1の
方法を準用する。
【0040】次に、実施例1と同様に、このレジスタ2
05内の2値デ−タに対して、水平方向走査部207、
垂直方向走査部209、右斜め方向走査部211、左斜
め方向走査部213により、それぞれ水平、垂直、右斜
め、左斜め方向に走査し、前記線幅を閾値として、サブ
パタンを抽出し、各々、水平サブパタンメモリ208、
垂直サブパタンメモリ210、右斜めサブパタンメモリ
212、左斜めサブパタンメモリ214に格納する。
05内の2値デ−タに対して、水平方向走査部207、
垂直方向走査部209、右斜め方向走査部211、左斜
め方向走査部213により、それぞれ水平、垂直、右斜
め、左斜め方向に走査し、前記線幅を閾値として、サブ
パタンを抽出し、各々、水平サブパタンメモリ208、
垂直サブパタンメモリ210、右斜めサブパタンメモリ
212、左斜めサブパタンメモリ214に格納する。
【0041】次に、かすれパタン抽出部215におい
て、レジスタ205の文字パタンの2値デ−タとメモリ
208、210、212、214に格納されたサブパタ
ンより、かすれパタンを抽出し、レジスタ205に転送
する。この時、かすれパタンの抽出は、実施例1の図3
に示した方法によって行い、このかすれパタンを便宜
上、かすれパタン1としておく。そして、微小セグメン
ト除去部216でかすれパタン1の微小セグメントの除
去を行い、残ったセグメント数等をチェックした後、線
幅計算部206においてかすれパタン1の線幅の計算を
行い、さらに線幅判定部217で、前記線幅値に基づい
てかすれパタン1の走査を行うか否かを判定する。但
し、微小セグメント除去部216または線幅判定部21
7の判定は、実施例1に準用する。ここでかすれパタン
1について、走査をする必要はないと判定されると、メ
モリ208、210、212、214に格納されたサブ
パタンは、出力制御部227を通じて特徴抽出部228
に出力され、また走査する必要ありと判定された場合に
は、各々、水平合成サブパタンメモリ219、垂直合成
サブパタンメモリ221、右斜め合成サブパタンメモリ
223、左斜め合成サブパタンメモリ225に転送され
る。次に実施例1と同様に、レジスタ205内のかすれ
パタン1に対して、各方向の走査部207、209、2
11、213により再度走査され、かすれパタン1の線
幅に基づいて、かすれパタン1のサブパタン、即ち、か
すれサブパタン1が抽出され、各々、メモリ208、2
10、212、214に格納される。
て、レジスタ205の文字パタンの2値デ−タとメモリ
208、210、212、214に格納されたサブパタ
ンより、かすれパタンを抽出し、レジスタ205に転送
する。この時、かすれパタンの抽出は、実施例1の図3
に示した方法によって行い、このかすれパタンを便宜
上、かすれパタン1としておく。そして、微小セグメン
ト除去部216でかすれパタン1の微小セグメントの除
去を行い、残ったセグメント数等をチェックした後、線
幅計算部206においてかすれパタン1の線幅の計算を
行い、さらに線幅判定部217で、前記線幅値に基づい
てかすれパタン1の走査を行うか否かを判定する。但
し、微小セグメント除去部216または線幅判定部21
7の判定は、実施例1に準用する。ここでかすれパタン
1について、走査をする必要はないと判定されると、メ
モリ208、210、212、214に格納されたサブ
パタンは、出力制御部227を通じて特徴抽出部228
に出力され、また走査する必要ありと判定された場合に
は、各々、水平合成サブパタンメモリ219、垂直合成
サブパタンメモリ221、右斜め合成サブパタンメモリ
223、左斜め合成サブパタンメモリ225に転送され
る。次に実施例1と同様に、レジスタ205内のかすれ
パタン1に対して、各方向の走査部207、209、2
11、213により再度走査され、かすれパタン1の線
幅に基づいて、かすれパタン1のサブパタン、即ち、か
すれサブパタン1が抽出され、各々、メモリ208、2
10、212、214に格納される。
【0042】次に水平サブパタン合成部218、垂直サ
ブパタン合成部220、右斜めサブパタン合成部22
2、左斜めサブパタン合成部224において、メモリ2
08、210、212、214に格納されたかすれサブ
パタン1とメモリ219、221、223、225に格
納されたサブパタンとが合成され、合成サブパタン1と
して、再び、メモリ219、221、223、225に
出力される。
ブパタン合成部220、右斜めサブパタン合成部22
2、左斜めサブパタン合成部224において、メモリ2
08、210、212、214に格納されたかすれサブ
パタン1とメモリ219、221、223、225に格
納されたサブパタンとが合成され、合成サブパタン1と
して、再び、メモリ219、221、223、225に
出力される。
【0043】前記合成サブパタン1は、実施例1におい
て、2度のサブパタン抽出の結果合成されたものと同一
のものであるが、実施例2では、さらにかすれパタン抽
出部215において、現時点でレジスタ205に格納さ
れたかすれパタン1とメモリ208、210、212、
214に格納されたかすれサブパタン1とを用いて、2
度目の走査によっても検出されなかったストロ−ク成分
を抽出し、これをかすれパタン2としてレジスタ205
に格納する。ここで、図3において、メモリ107、1
09、111、113は、図2におけるメモリ208、
210、212、214に相当し、文字パタンメモリ3
04は、レジスタ205に相当する。
て、2度のサブパタン抽出の結果合成されたものと同一
のものであるが、実施例2では、さらにかすれパタン抽
出部215において、現時点でレジスタ205に格納さ
れたかすれパタン1とメモリ208、210、212、
214に格納されたかすれサブパタン1とを用いて、2
度目の走査によっても検出されなかったストロ−ク成分
を抽出し、これをかすれパタン2としてレジスタ205
に格納する。ここで、図3において、メモリ107、1
09、111、113は、図2におけるメモリ208、
210、212、214に相当し、文字パタンメモリ3
04は、レジスタ205に相当する。
【0044】次にかすれパタン2に対しても、かすれパ
タン2の線幅を閾値とした走査によってかすれサブパタ
ン2を求め、合成部218、220、222、224に
おいて、メモリ219、221、223、225に格納
された合成サブパタン1との合成を行い、再びメモリ2
19、221、223、225に合成サブパタン2とし
て出力する。全く同様にして、かすれパタンKに対し
て、かすれパタンKの線幅を閾値とした走査によってか
すれサブパタンKを求め、合成部218、220、22
2、224において、メモリ219、221、223、
225に格納された合成サブパタンK−1との合成を行
い、再びメモリ219、221、223、225に合成
サブパタンKとして出力する。
タン2の線幅を閾値とした走査によってかすれサブパタ
ン2を求め、合成部218、220、222、224に
おいて、メモリ219、221、223、225に格納
された合成サブパタン1との合成を行い、再びメモリ2
19、221、223、225に合成サブパタン2とし
て出力する。全く同様にして、かすれパタンKに対し
て、かすれパタンKの線幅を閾値とした走査によってか
すれサブパタンKを求め、合成部218、220、22
2、224において、メモリ219、221、223、
225に格納された合成サブパタンK−1との合成を行
い、再びメモリ219、221、223、225に合成
サブパタンKとして出力する。
【0045】ル−プカウンタ226は、サブパタンの合
成回数Kをカウントし、Kが所定の閾値Mに達した場
合、出力制御部227にそのことを伝達する。その時、
出力制御部227では、メモリ219、221、22
3、225に格納されていた合成サブパタンMを特徴抽
出部228に転送する。尚、合成回数KがMに達しない
場合でも、微小セグメント除去部216または線幅判定
部217において、かすれパタンKを走査する必要がな
いと判定された場合は、その時点の合成サブパタンKが
特徴抽出部228に転送される。
成回数Kをカウントし、Kが所定の閾値Mに達した場
合、出力制御部227にそのことを伝達する。その時、
出力制御部227では、メモリ219、221、22
3、225に格納されていた合成サブパタンMを特徴抽
出部228に転送する。尚、合成回数KがMに達しない
場合でも、微小セグメント除去部216または線幅判定
部217において、かすれパタンKを走査する必要がな
いと判定された場合は、その時点の合成サブパタンKが
特徴抽出部228に転送される。
【0046】以下、特徴抽出部228、識別部229、
辞書メモリ230、認識結果231は、全て実施例1と
同様であるので、ここでは説明を省略する。
辞書メモリ230、認識結果231は、全て実施例1と
同様であるので、ここでは説明を省略する。
【0047】以上、実施例2によれば、M回の走査によ
って、それぞれ線幅の異なるM種のストロ−ク成分を反
映したサブパタンが作成でき、従って、M種の線幅のス
トロ−クからなる複雑な漢字や図形等に対しても高精度
な認識性能を安定に維持できる。また、実施例1は、実
施例2においてM=1としたものと同等であり、実施例
2の特殊な場合に相当している。
って、それぞれ線幅の異なるM種のストロ−ク成分を反
映したサブパタンが作成でき、従って、M種の線幅のス
トロ−クからなる複雑な漢字や図形等に対しても高精度
な認識性能を安定に維持できる。また、実施例1は、実
施例2においてM=1としたものと同等であり、実施例
2の特殊な場合に相当している。
【0048】尚、実施例1及び実施例2は、上述した例
のみに限定されるものではない。例えば、かすれパタン
抽出部114または215におけるかすれパタン抽出手
段は図3に示された方法だけでなく、OR、NOR、A
ND,NAND、NOT回路等を組み合わせることによ
って、また原2値画像と4種のサブパタンの黒画素を画
素毎にカウントし、そのカウント数が1のものを抽出し
ていくことによって同一の結果を出力する方法がいくつ
か考えられるが、如何なる方法であっても本実施例で定
義されたかすれパタンを抽出できれば、それらは全て本
発明に属する。
のみに限定されるものではない。例えば、かすれパタン
抽出部114または215におけるかすれパタン抽出手
段は図3に示された方法だけでなく、OR、NOR、A
ND,NAND、NOT回路等を組み合わせることによ
って、また原2値画像と4種のサブパタンの黒画素を画
素毎にカウントし、そのカウント数が1のものを抽出し
ていくことによって同一の結果を出力する方法がいくつ
か考えられるが、如何なる方法であっても本実施例で定
義されたかすれパタンを抽出できれば、それらは全て本
発明に属する。
【0049】また非本質的なストロ−ク成分を除去する
方法として、微小セグメントの除去や線幅による判定等
を用意したが、これらの条件式及び閾値の設定等は、本
発明の範囲内で任意に変更できる。尚、線幅判定部13
4及び微小セグメント除去部139は、かすれパタンと
して残された部分が文字の本質的特徴を表わすものであ
るか否かを、かすれパタンのセグメントの大きさや線幅
という特徴を用いて判定するという点では両者とも同様
な機能を持つので、いづれか一方のみを実施してもよ
い。更に前記特徴以外の特徴、例えばセグメントの分布
状態や黒画素密度等を用いて前記判定と同様な効果が得
られる手段であれば全て本発明に属する。また、入力す
る文字が高品質であり局所線幅が一定であるということ
が予め判っている場合にはかすれパタンの抽出を行わ
ず、逆に文字品質が低品質であり、かすれ文字が多いと
いうことが予め判っている場合には、常に、或は前記判
定を実施しながらかすれパタンの抽出、合成を行うとい
う具合いに、トップダウン的に行う実施例も本発明に属
する。
方法として、微小セグメントの除去や線幅による判定等
を用意したが、これらの条件式及び閾値の設定等は、本
発明の範囲内で任意に変更できる。尚、線幅判定部13
4及び微小セグメント除去部139は、かすれパタンと
して残された部分が文字の本質的特徴を表わすものであ
るか否かを、かすれパタンのセグメントの大きさや線幅
という特徴を用いて判定するという点では両者とも同様
な機能を持つので、いづれか一方のみを実施してもよ
い。更に前記特徴以外の特徴、例えばセグメントの分布
状態や黒画素密度等を用いて前記判定と同様な効果が得
られる手段であれば全て本発明に属する。また、入力す
る文字が高品質であり局所線幅が一定であるということ
が予め判っている場合にはかすれパタンの抽出を行わ
ず、逆に文字品質が低品質であり、かすれ文字が多いと
いうことが予め判っている場合には、常に、或は前記判
定を実施しながらかすれパタンの抽出、合成を行うとい
う具合いに、トップダウン的に行う実施例も本発明に属
する。
【0050】またパタンレジスタや各メモリの構成、線
幅の計算方法、特徴マトリクスの抽出方法、外接枠分割
方法等も本発明の範囲内で適宜変更可能である。さらに
図1のブロック図において、各構成部分に分担された処
理や動作、入出力信号の流れ、設置個数、位置その他の
条件も任意好適に変更可能である。
幅の計算方法、特徴マトリクスの抽出方法、外接枠分割
方法等も本発明の範囲内で適宜変更可能である。さらに
図1のブロック図において、各構成部分に分担された処
理や動作、入出力信号の流れ、設置個数、位置その他の
条件も任意好適に変更可能である。
【0051】
【発明の効果】以上、詳細に説明したように、本発明に
よれば、入力文字パタンを2値画像に変換し、この2値
画像の外接枠内の2値画像の線幅を計算し、外接枠内の
2値画像に対して水平、垂直、右斜め、左斜め方向に走
査して、前記線幅に基づくストロ−クの分布状態を反映
する4種類のサブパタンを抽出し、前記外接枠内の2値
画像及び前記サブパタン4種とを用いて、サブパタンと
して抽出されなかった画素部分から構成されるかすれパ
タンを検出し、このかすれパタンの線幅を計算する。更
にかすれパタンに対して、その線幅に基づいて設定され
た閾値を用いて、水平、垂直、右斜め、左斜め方向に走
査し、検出されたストロ−クの分布状態を反映する4種
類のかすれサブパタンを抽出し、前記サブパタン及び前
記かすれサブパタンとをそれぞれの種類毎に合成するこ
とによって、合成サブパタンを作成し、前記合成サブパ
タンに基づいて特徴マトリクスを抽出し、前記特徴マト
リクスと辞書とを照合した結果より、認識結果を出力す
るようにしたので、文字パタンを構成するストロ−クで
あって、認識に本質的な役割を果たすものの一部が、他
の部分との局所線幅と比較して小さくなった場合でも、
サブパタンの一部として抽出され、従って、局所線幅に
大きな相違のある品質の悪い文字パタンや様々なスケ−
ルのストロ−クから構成される複雑な漢字文字や図形等
に対しても高精度な認識性能を安定に維持できる文字認
識装置が実現可能となる。
よれば、入力文字パタンを2値画像に変換し、この2値
画像の外接枠内の2値画像の線幅を計算し、外接枠内の
2値画像に対して水平、垂直、右斜め、左斜め方向に走
査して、前記線幅に基づくストロ−クの分布状態を反映
する4種類のサブパタンを抽出し、前記外接枠内の2値
画像及び前記サブパタン4種とを用いて、サブパタンと
して抽出されなかった画素部分から構成されるかすれパ
タンを検出し、このかすれパタンの線幅を計算する。更
にかすれパタンに対して、その線幅に基づいて設定され
た閾値を用いて、水平、垂直、右斜め、左斜め方向に走
査し、検出されたストロ−クの分布状態を反映する4種
類のかすれサブパタンを抽出し、前記サブパタン及び前
記かすれサブパタンとをそれぞれの種類毎に合成するこ
とによって、合成サブパタンを作成し、前記合成サブパ
タンに基づいて特徴マトリクスを抽出し、前記特徴マト
リクスと辞書とを照合した結果より、認識結果を出力す
るようにしたので、文字パタンを構成するストロ−クで
あって、認識に本質的な役割を果たすものの一部が、他
の部分との局所線幅と比較して小さくなった場合でも、
サブパタンの一部として抽出され、従って、局所線幅に
大きな相違のある品質の悪い文字パタンや様々なスケ−
ルのストロ−クから構成される複雑な漢字文字や図形等
に対しても高精度な認識性能を安定に維持できる文字認
識装置が実現可能となる。
【図1】本発明による文字認識装置の実施例1を示すブ
ロック図である。
ロック図である。
【図2】本発明による文字認識装置の実施例2を示すブ
ロック図である。
ロック図である。
【図3】かすれパタン抽出部の構成を示すブロック図で
ある。
ある。
【図4】かすれ部分の存在するパタンの一例である。
【図5】つぶれによりサブパタンとして抽出されない部
分があるパタンの一例である。
分があるパタンの一例である。
【図6】本発明の適用例の一例を示す図である。
101 光信号 102 光電変換部 103 パタンレジスタ 104 外接枠検出部 105 文字パタン線幅計算部 106 水平方向走査部 107 水平サブパタン1メモリ 108 垂直方向走査部 109 垂直サブパタン1メモリ 110 右斜め方向走査部 111 右斜めサブパタン1メモリ 112 左斜め方向走査部 113 左斜めサブパタン1メモリ 114 かすれパタン抽出部 115 かすれパタンメモリ 116 かすれパタン線幅計算部 117 水平方向走査部 118 水平かすれサブパタンメモリ 119 垂直方向走査部 120 垂直かすれサブパタンメモリ 121 右斜め方向走査部 122 右斜めかすれサブパタンメモリ 123 左斜め方向走査部 124 左斜めかすれサブパタンメモリ 125 水平サブパタン合成部 126 水平サブパタン2メモリ 127 垂直サブパタン合成部 128 垂直サブパタン2メモリ 129 右斜めサブパタン合成部 130 右斜めサブパタン2メモリ 131 左斜めサブパタン合成部 132 左斜めサブパタン2メモリ 133 出力制御部 134 線幅判定部 135 特徴抽出部 136 識別部 137 辞書メモリ 138 認識結果 139 微小セグメント除去部
Claims (1)
- 【請求項1】 帳票等に記入された文字パタンを光学的
に走査して、量子化された電気信号である2値画像に変
換する光電変換部と、 前記2値画像に変換された文字パタンを格納するパタン
レジスタと、 前記パタンレジスタ内の文字パタンの外接枠を検出する
外接枠検出部と、 前記パタンレジスタの外接枠内の文字パタンの線幅を算
出する文字パタン線幅計算部と、 前記パタンレジスタの外接枠内の文字パタンに対して、
各々、水平、垂直、右斜め、左斜め方向に走査して得ら
れた黒画素の連続数が前記線幅に基づいて定められた閾
値を超えた場合にストロ−クとして検出し、これらのス
トロ−クの分布を表わすサブパタンを各方向毎に4種類
抽出するサブパタン抽出部と、 前記パタンレジスタの外接枠内の2値画像及び前記4種
類のサブパタンより、文字パタンを構成する黒画素の中
で、前記4種類のサブパタンのいずれにも属さない黒画
素をかすれパタンとして抽出するかすれパタン抽出部
と、 前記かすれパタンを構成する各々独立したセグメントの
うち、微小セグメントを除去する微小セグメント除去部
と、 前記かすれパタンの線幅を算出するかすれパタン線幅計
算部と、 微小セグメントを除去したかすれパタンについてサブパ
タンの抽出の必要が有りと判定された場合に、前記かす
れパタンの線幅に基づいてかすれパタンのストロ−クの
分布を表わすかすれサブパタンを前記同様に各走査方向
毎に4種類抽出するかすれサブパタン抽出部と、 前記サブパタン或は前記サブパタンとかすれサブパタン
を各走査方向毎に合成した合成サブパタンの何れか一方
のサブパタンを特徴抽出部に出力する制御部と、 前記サブパタン或は合成サブパタンの特徴マトリクスを
抽出する特徴抽出部と、 前記特徴マトリクスと予め用意された辞書マトリクスと
を照合した結果に基づき認識結果を出力する識別部とを
有することを特徴とする文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5140747A JP2902904B2 (ja) | 1993-06-11 | 1993-06-11 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5140747A JP2902904B2 (ja) | 1993-06-11 | 1993-06-11 | 文字認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH06348899A JPH06348899A (ja) | 1994-12-22 |
JP2902904B2 true JP2902904B2 (ja) | 1999-06-07 |
Family
ID=15275795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5140747A Expired - Lifetime JP2902904B2 (ja) | 1993-06-11 | 1993-06-11 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2902904B2 (ja) |
-
1993
- 1993-06-11 JP JP5140747A patent/JP2902904B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH06348899A (ja) | 1994-12-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US20030063802A1 (en) | Image processing method, apparatus and system | |
JP4232800B2 (ja) | ラインノイズ除去装置、ラインノイズ除去方法、ラインノイズ除去プログラム | |
CN112861865A (zh) | 一种基于ocr技术的辅助审计方法 | |
US20100054587A1 (en) | Image processing apparatus and image processing method | |
US9076225B2 (en) | Image processing device, an image processing method and a program to be used to implement the image processing | |
JP4749879B2 (ja) | 顔判別方法および装置並びにプログラム | |
JPH04270485A (ja) | 印刷文字認識装置 | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
JP2902904B2 (ja) | 文字認識装置 | |
JP2902905B2 (ja) | 文字認識装置 | |
JP3268552B2 (ja) | 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置 | |
JPH02293989A (ja) | 文字認識装置 | |
JPH07230525A (ja) | 罫線認識方法及び表処理方法 | |
JPH0728948A (ja) | 文字認識装置 | |
JPH076205A (ja) | 文字認識装置 | |
JP3210224B2 (ja) | 文字認識装置 | |
JP2995818B2 (ja) | 文字切り出し方法 | |
JP2708604B2 (ja) | 文字認識方法 | |
JP3197464B2 (ja) | 文字認識方法および文字認識装置 | |
JPH0916715A (ja) | 文字認識装置および方法 | |
JP3277977B2 (ja) | 文字認識方法 | |
JP3687999B2 (ja) | 文字認識装置 | |
JP2747136B2 (ja) | 文字認識装置 | |
JP2973892B2 (ja) | 文字認識方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 19990309 |