JPH11296618A - 文字認識装置および字種判定装置 - Google Patents

文字認識装置および字種判定装置

Info

Publication number
JPH11296618A
JPH11296618A JP10093510A JP9351098A JPH11296618A JP H11296618 A JPH11296618 A JP H11296618A JP 10093510 A JP10093510 A JP 10093510A JP 9351098 A JP9351098 A JP 9351098A JP H11296618 A JPH11296618 A JP H11296618A
Authority
JP
Japan
Prior art keywords
character
characters
unit
dictionary
handwritten
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10093510A
Other languages
English (en)
Inventor
Ryoji Ohira
良司 大平
Hirohisa Goto
裕久 後藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10093510A priority Critical patent/JPH11296618A/ja
Publication of JPH11296618A publication Critical patent/JPH11296618A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 認識対象の文字列が手書き文字列か活字文字
列かを新規な方法で判定する。 【解決手段】 以下の機能を有した字種判定・辞書選択
部19を具える。文字列中の任意の複数の文字毎の、左
斜め方向成分と右斜め方向成分との差分又は比を、それ
ぞれ求める。該差分又は比を閾値と比較して、前記複数
の文字それぞれが手書き文字か活字文字かを判定する。
また、手書き文字と判定された文字数および活字文字と
判定された文字数をそれぞれ計数する。これら文字数を
比較して、文字数の多い方の字種で、前記文字列は書か
れていると判定する。この判定結果に従い、手書き文字
認識辞書部21または活字文字認識辞書部23を選択す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、手書き文字およ
び活字文字が混在している帳票、または、手書き文字で
書かれた帳票および活字文字で書かれた帳票が混在する
帳票群について文字を認識する際に好適な、文字認識装
置に関するものである。
【0002】
【従来の技術】一般に、振込帳票などでは、その金額欄
に手書文字で金額を記入する場合と、活字文字で金額が
予め印刷されている場合とがある。このような手書き文
字で書かれた帳票と活字文字で書かれた帳票とが混在す
る帳票群を文字認識する場合、認識精度を向上させる意
味で、手書き文字で書かれた帳票については手書き文字
用の認識辞書を用い、活字文字で書かれた帳票について
は活字文字用の認識辞書を用いるのが良い。
【0003】帳票上の文字が手書き文字なのか活字文字
なのかを判定(字種判定)し、それに応じて手書き文字
用の認識辞書または活字文字用の認識辞書を選択して、
該選択した辞書で文字認識を行う従来の文字認識装置と
して、例えば、特開昭57−111679号公報に開示
された装置、または特開平5−189604号公報に開
示された装置があった。
【0004】前者の装置は、文字の配列ピッチのバラツ
キに基づいて、媒体上の文字が手書き文字か活字文字か
を判定し、これに応じて辞書を選択する装置である。す
なわち、活字文字は文字の配列ピッチのバラツキが手書
き文字の場合より小さいことに着目して字種判定および
辞書選択をする装置である。後者の装置は、各文字の高
さのバラツキに基づいて、媒体上の文字が手書き文字か
活字文字かを判定し、これに応じて辞書を選択する装置
である。すなわち、活字文字は文字高さのバラツキが手
書き文字の場合より小さいことに着目して字種判定およ
び辞書選択をする装置である。
【0005】
【発明が解決しようとする課題】しかしながら、手書き
文字列であっても、文字配列ピッチや文字高さのバラツ
キが小さい文字列もある。例えば、図21に示したよう
に、文字記入枠1が用意されている帳票に丁寧に手書き
で記入された文字列の場合は、文字配列ピッチや文字高
さのバラツキは、活字文字と遜色のない程度に小さくな
る場合がある。従って、このように丁寧な手書き文字列
であると、上述した従来の文字認識は、活字文字用の認
識辞書を選択してこの辞書を用いて文字認識をしてしま
う。しかし、文字自体は手書き文字であるため、活字文
字と異なる字形を持つことが多い。例えば図21に示し
たような傾斜した字形等である場合がある。すると、活
字文字用の辞書を用いた場合、この辞書中の特徴データ
は活字文字用であるため、高精度に文字認識を行うこと
は困難である。
【0006】従って、文字配列ピッチや文字高さのバラ
ツキが活字文字と遜色のない様な手書き文字であって
も、手書き文字として認識できる新規な文字認識装置が
望まれる。
【0007】
【課題を解決するための手段】(1)そこで、この出願
の文字認識装置の第1の発明によれば、媒体から文字単
位に文字パタンを切り出す文字切り出し部と、手書き文
字認識辞書部と、活字文字認識辞書部と、認識対象の文
字が手書き文字か活字文字かを判定し、その結果により
前記2つの辞書部のいずれかを選択する字種判定・辞書
選択部と、該選択された辞書部を用いて文字認識をする
文字認識部とを具える。そして、この第1の発明の文字
認識装置の字種判定・辞書選択部は、前記媒体上の任意
の文字列中の任意の複数の文字毎の、左斜め方向成分と
右斜め方向成分との差分又は比を、それぞれ求め、該差
分又は比に基づいて前記複数の文字それぞれが手書き文
字か活字文字かを判定すると共に、手書き文字と判定さ
れた文字数および活字文字と判定された文字数をそれぞ
れ計数し、該計数結果に基づいて前記2つの辞書部のい
ずれかを前記文字列を文字認識するための辞書部として
選択する字種判定・辞書選択部であることを特徴とす
る。
【0008】(2)また、この出願の文字認識装置の第
2の発明によれば、媒体から文字単位に文字パタンを切
り出す文字切り出し部と、手書き文字認識辞書部と、活
字文字認識辞書部と、認識対象の文字が手書き文字か活
字文字かを判定し、その結果により前記2つの辞書部の
いずれかを選択する字種判定・辞書選択部と、該選択さ
れた辞書部を用いて文字認識をする文字認識部とを具え
る。そして、この第2の発明の文字認識装置の字種判定
・辞書選択部は、前記媒体上の任意の文字列中の任意の
複数の文字毎の、左斜め方向成分と右斜め方向成分との
差分又は比をそれぞれ求め、さらに、該差分の総和又は
比の総和を求め、該総和に基づいて前記文字列が手書き
文字列か活字文字列かを判定し、この判定結果に基づい
て前記2つの辞書部のいずれかを前記文字列を文字認識
するための辞書部として選択する字種判定・辞書選択部
であることを特徴とする。
【0009】(3)これら第1の発明および第2の発明
の文字認識装置それぞれでは、文字の左斜め方向成分と
右斜め方向成分との差分又は比に着目するため、文字の
左右対称性を判定することができる。
【0010】ここで、手書き文字と活字文字とを比べた
場合、一般に、活字文字の方が左右対称性の良い文字が
多い。そのため、これら第1および第2の文字認識装置
それぞれでは、文字の左右対象性という新たな観点から
字種を判定し、その結果に基づいて辞書を選択できる。
【0011】従って、文字配列ピッチや文字高さのバラ
ツキが小さい手書き文字列の場合でも、手書き文字列で
あると判定できる確率が高まる。その結果、手書き文字
および活字文字が混在する媒体、または、手書き文字媒
体と活字文字媒体が混在する媒体群の文字認識に当た
り、手書き文字用認識辞書および活字文字認識辞書のう
ちの適正な辞書を選択することができる。
【0012】なお、第1の発明の文字認識装置の場合
は、文字列の各文字毎に左斜め方向成分と右斜め方向成
分との差分又は比に基づいて手書き文字か活字文字かを
判定すると共に、手書き文字と判定された文字数と活字
文字と判定された文字数とを計数する。そして、この計
数結果に基づいて、該任意の文字列が手書き文字列か活
字文字列かを判定する。
【0013】一方、第2の発明の文字認識装置の場合
は、文字列の各文字毎に左斜め方向成分と右斜め方向成
分との差分又は比を求めた後、これら複数の文字それぞ
れの前記差分の総和又は比の総和を求め、該総和に基づ
いて、該任意の文字列が手書き文字列か活字文字列かを
判定する。
【0014】上記のように構成が相違する第1の発明お
よび第2の発明の、作用・効果の違いとして、例えば、
以下のようなことを挙げることができる。
【0015】図22に示したように、媒体上の任意の文
字列中のある文字部分に、ゴミ3が存在していたり、か
すれが存在している場合(図示せず)等を考える。この
ような場合、差分の総和又は比の総和に基づいて手書き
文字か活字文字かを判定する第2の発明では、この総和
に、上記のゴミやかすれが影響する。そのため、文字列
が手書き文字列であるか活字文字列であるかの判定に、
上記のゴミやかすれの影響が大きく影響する。ところ
が、文字毎に文字種を判定すると共に手書き文字数と活
字文字数との計数値に基づいて文字列が手書き文字列か
活字文字列かを判定する第1の発明では、上記のゴミや
かすれの影響は1文字分の文字種判定に影響するのみで
済む。そのため、第1の発明の文字認識装置の方が、第
2の発明の文字認識装置に比べて、ゴミやかすれの影響
を吸収し易いという利点が得られる。
【0016】なお、これら第1および第2の発明におい
て、媒体とは、帳票をはじめとして、文字認識の対象で
ある種々のものをいう。また、任意の文字列とは、認識
対象の文字列であるが、媒体上の全文字列の場合、媒体
上の一部の文字列の場合いずれの場合でも良い。また、
任意の文字列中の任意の複数の文字とは、任意の文字列
中の全文字の場合でも良いし、任意の文字列中の一部の
文字の場合(連続する場合、飛び飛びの場合)でも良
い。
【0017】また、左斜め方向成分および右斜め方向成
分は、これら方向成分が反映されたものであれば、任意
のものと出来る。例えば、後述する各方向のサブパタン
中の黒画素数でも良いし、また、実施の形態で説明する
ように、サブパタンから抽出された特徴マトリクスの各
要素値の和などのように、サブパタンに何らかの処理を
施したものでも良い。
【0018】また、左斜めとは、垂直および水平方向を
除く任意の左斜めの角度である。ただし、好ましくは、
例えば、30〜60度の角度、より好ましくは45度若
しくはその近傍の角度で規定される左斜めとすることが
できる。
【0019】また、右斜めとは、垂直および水平方向を
除く任意の右斜めの角度である。ただし、好ましくは、
例えば、30〜60度の角度、より好ましくは45度若
しくはその近傍の角度で規定される右斜めとすることが
できる。
【0020】(4)また、これら第1発明および第2発
明を実施するに当たり、以下の様なサブパタン抽出部を
具えるのが好適である。すなわち、文字パタンについて
水平、垂直、左斜めおよび右斜めの各方向に走査して、
これら走査方向に沿って所定の長さ以上連続する黒画素
を、水平、垂直、左斜めおよび右斜めの各方向成分とし
て抽出するサブパタン抽出部であって、前記字種判定・
辞書選択部で用いる左斜め方向成分および右斜め方向成
分の抽出と、前記文字認識部で用いる水平、垂直、左斜
めおよび右斜めの各方向成分の抽出とで兼用されるサブ
パタン抽出部を具える構成とするのが好適である。こう
すると、字種判定・辞書選択部で必要とされる方向成分
と、文字認識部で必要とされる方向成分とを1つのサブ
パタン抽出部によって得ることができる。そのため、字
種判定・辞書選択部と、文字認識部とで別々に方向成分
を抽出する構成に比べて、文字認識装置のハードウエア
規模およびソフトウエア規模を簡略化することができ
る。
【0021】(5)また、この出願の字種判定装置の発
明によれば、媒体上の任意の文字列中の任意の複数の文
字毎の、左斜め方向成分と右斜め方向成分との差分又は
比を、それぞれ求め、該差分又は比に基づいて前記複数
の文字それぞれが手書き文字か活字文字かを判定すると
共に、手書き文字と判定された文字数および活字文字と
判定された文字数をそれぞれ計数し、該計数結果に基づ
いて前記文字列が手書き文字列か活字文字列かを判定す
ることを特徴とする。
【0022】また、この出願の字種判定装置の別の発明
によれば、媒体上の任意の文字列中の任意の複数の文字
毎の、左斜め方向成分と右斜め方向成分との差分又は比
をそれぞれ求め、さらに、これら差分又は比の総和を求
め、該差分の総和又は比の総和に基づいて前記文字列が
手書き文字列か活字文字列かを判定することを特徴とす
る。
【0023】これら字種判定装置の発明によれば、媒体
上の文字列の字種が手書き文字か活字文字かの判定を、
文字の左右対称性に基づいて判定できる。
【0024】
【発明の実施の形態】以下、この出願の文字認識装置の
各発明の実施の形態についてそれぞれ説明する。なお、
この説明をいくつかの図を参照して行う。しかし、説明
に用いる各図は、この発明を理解できる程度に概略的に
示してあるにすぎない。また、各図において、同様な構
成成分については同一の番号を付して示し、その重複す
る説明を省略することもある。
【0025】1.第1の発明の実施の形態 1−1.装置の構成の説明 図1は、第1の発明の実施の形態の文字認識装置10を
示したブロック図である。この実施の形態の文字認識装
置10は、領域抽出部11と、文字切り出し部13と、
サブパタン抽出部15と、特徴マトリクス抽出部17
と、字種判定・辞書選択部19と、手書き文字認識辞書
部21と、活字文字認識辞書部23と、文字認識部25
と、制御部27とを具える。これら各部は、典型的に
は、コンピュータによって構成できる。以下、各部につ
いて説明する。
【0026】領域抽出部11は、帳票から文字認識領域
を抽出する。文字切り出し部13は、領域抽出部11が
抽出した領域から一文字単位に文字パタンを切り出す。
【0027】また、サブパタン抽出部15は、前記切り
出された文字パタンを複数の方向に走査し、各方向毎の
サブパタンを抽出する。この実施の形態の場合は、水
平、垂直、左斜め、右斜めの各走査線上で所定の長さ以
上連続する黒画素をそれぞれ検出する。そして、該黒画
素を各方向の成分とした、各方向毎のサブパタンを抽出
する。
【0028】また、特徴マトリクス抽出部17は、サブ
パタン抽出部15で抽出された各方向のサブパタンそれ
ぞれから特徴マトリクスを抽出する。この実施の形態の
場合は、各サブパタンそれぞれに対し、文字パタンに外
接する枠に相当する領域を設定する。そして、この領域
をM×N(M,Nは任意好適な自然数。互いは同じでも
異なっても良い。)の領域に分割する。そして、各分割
領域内の特徴量のマトリクスで表される特徴マトリクス
を、各サブパタン毎に得る。従って、この実施の形態の
場合は、水平特徴マトリクスH、垂直特徴マトリクス
V、左斜め特徴マトリクスLおよび右斜め特徴マトリク
スRがそれぞれ得られる。
【0029】また、字種判定・辞書選択部19は、媒体
上の任意の文字列中の任意の複数の文字毎の、左斜め方
向成分と右斜め方向成分との差分を、それぞれ求める。
さらに、この求めた差分に基づいて前記複数の文字それ
ぞれが手書き文字か活字文字かを判定すると共に、手書
き文字と判定された文字数および活字文字と判定された
文字数をそれぞれ計数する。さらに、この計数結果に基
づいて、手書き文字認識辞書部21および活字文字認識
辞書部23のうちのいずれかを、前記文字列を文字認識
するための辞書部として選択する。
【0030】この実施の形態では、字種判定・辞書選択
部19を、以下の第1の手段〜第5の手段で構成してあ
る。
【0031】第1の手段は、媒体上の任意の文字列の任
意の複数の文字毎の左斜め方向成分と右斜め方向成分と
の差分をそれぞれ計算する。
【0032】第2の手段は、第1の手段が算出した前記
差分を閾値と比較して前記複数の文字それぞれが手書き
文字か活字文字かを判定する。
【0033】第3の手段は、第2の手段で活字文字と判
定された文字数を計数する第1カウンタ(図示せず)お
よび手書き文字と判定された文字数を計数する第2カウ
ンタ(図示せず)を有する。
【0034】第4の手段は、第3の手段内の第1カウン
タおよび第2カウンタの値同士を比較する。
【0035】第5の手段は、第4の手段の比較結果に基
づいて前記手書き文字認識辞書部21および活字文字認
識辞書部23のいずれか1つを選択する。
【0036】この実施の形態の場合、図1に示したよう
に、上記の第1の手段を、演算部(ΣL・ΣR計算部1
9aという)で構成している。また、上記の第2の手段
および第4の手段を、比較部19bで構成している。ま
た、上記の第3の手段を、カウンタ部(カウント特徴格
納部19cという)で構成している。また、上記の第5
の手段を好適なセレクタ(認識辞書選択部19dとい
う)で構成している。なお、これら各部19a〜19d
それぞれは、制御部27と相俟って、目的とする機能を
それぞれ発現する。
【0037】また、手書き文字認識辞書部21は、手書
き文字の認識に好適なデータを格納している。また、活
字文字認識辞書部23は、活字文字の認識に好適なデー
タを格納している。これら各辞書部21,23は、それ
ぞれ、手書きの標準文字または活字の標準文字を用いて
予め作成されている。
【0038】また、文字認識部25は、手書き文字認識
辞書部21および活字文字認識辞書部23のうちの、字
種判定・辞書選択部19で選択された辞書部を、認識辞
書として用いて、文字を認識する。文字認識部25をど
のような文字認識方式のものとするかは、任意とでき
る。
【0039】また、制御部27は、領域抽出部11、文
字切り出し部13、サブパタン抽出部15、特徴マトリ
クス抽出部17、字種判定・辞書選択部19および文字
認識部25それぞれに接続されていて、これら各部を制
御する。
【0040】1−2.装置の動作の説明 次に、この第1の発明の文字認識装置10の理解をより
深めるために、この文字認識装置10の動作を説明す
る。
【0041】図2は、文字認識装置10の、特に辞書部
を選択する動作の概略を説明するフローチャートであ
る。また、図3は、文字認識装置10の、文字認識動作
の概略を説明するフローチャートである。また、図4〜
図11は、媒体上の文字列が手書き文字か活字文字か
を、文字認識装置10で判定する処理の説明図である。
【0042】先ず、図4に示したような、活字文字で書
かれた帳票30上の文字列「13579」が手書き文字
列か活字文字列かを判定する例を説明する。
【0043】領域抽出部11は、帳票30の画像イメー
ジデータから、文字領域に相当する領域を抽出する(図
2のステップ101)。
【0044】次に、文字切り出し部13は、領域抽出部
11が抽出した領域から、一文字ずつ文字パタンを切り
出す(図2のステップ102)。なお、この文字切り出
し部は、この実施の形態では、文字列の左端の文字パタ
ンから順次に文字パタンを切り出す。もちろんこれは一
例である。さらにこの実施の形態では、この切り出され
た文字パタンに、切り出された順番を示す番号が与えら
れる構成としてある。この番号を、各文字パタンの管理
番号として使用する。例えば、方向成分やそれを用いた
計算結果等を、この管理番号単位で管理することができ
る。
【0045】次に、サブパタン抽出部15は、文字切り
出し部13が切り出した文字パタンを、水平、垂直、左
斜めおよび右斜めの各方向毎に走査する。そして、走査
線上で所定の長さ以上連続する黒画素を検出して、該連
続する黒画素部分を、水平、垂直、左斜め及び右斜めの
各方向成分として、すなわち各方向のサブパタンとし
て、それぞれ抽出する(図2のステップ103)。
【0046】図5は、図4に示した帳票30上の文字列
「13579」中の、「1」の文字から抽出された文字
パタンを示した図である。また、図6(A)〜(D)
は、図5に示した「1」という文字パタンから抽出され
た水平、垂直、左斜めおよび右斜めサブパタンをそれぞ
れ示した図である。
【0047】次に、特徴マトリクス抽出部17は、上記
の各サブパタンから、特徴マトリクスをそれぞれ抽出す
る(図2のステップ104)。この実施の形態では、上
記の各サブパタンの、前記文字パタンの外接枠(図5の
「1」に外接した枠参照)に対応する領域を、M×N個
(M,Nは任意好適な自然数)の領域に分割する。そし
て、これら分割領域それぞれの特徴量(これを要素値と
もいう)で表される特徴マトリクスを得る。この要素値
は、任意好適なものとでき、例えば、各分割内の黒画素
数または該黒画素数に所定処理を施した値などとでき
る。
【0048】図7(A)〜(D)は、上記の特徴マトリ
クスの一例を説明する図である。この図7の場合、水
平、垂直、左斜めおよび右斜め各サブパタンを、5×5
の領域に分割し、さらに各分割領域内の特徴量(要素
値)を抽出して、水平、垂直、左斜めおよび右斜めの各
特徴マトリクスを得た例を示している。
【0049】次に、字種判定・辞書選択部19は、帳票
30の文字列「13579」が手書き文字列か、活字文
字列かを、以下のように判断する。さらに、手書き文字
認識辞書部21および活字文字認識辞書部23のうち
の、該文字列の文字認識に適正な辞書部を、以下のよう
に選択する。
【0050】先ず、帳票30上の文字列「13579」
の文字毎の、左斜め方向成分と右斜め方向成分との差分
を、それぞれ求める。ここで、左斜め方向成分および右
斜め方向成分は、これら方向成分が反映されたものであ
れば、任意のものと出来る。ただし、この実施の形態の
場合は、左斜め特徴マトリクスの要素値の和を、左斜め
方向成分とし、右斜め特徴マトリクスの要素値の和を、
右斜め方向成分としている(図2のステップ105)。
【0051】従って、この実施の形態の場合は、文字毎
の左斜め方向成分と、右斜め方向成分との差分は、下記
の(1)式で与えられる。
【0052】 dlri =|ΣLi −ΣRi | ・・・(1) ただし、(1)式中の、dlri とは、文字列中の第i
番目の文字の左斜め方向成分と右斜め方向成分との差分
であり、また、ΣLi とは、i番目の文字の左特徴マト
リクス中の、要素値の和であり、ΣRi とは、i番目の
文字の右斜め特徴マトリクス中の、要素値の和である。
【0053】図4に示した帳票30上における「135
79」の文字列の左から1番目の文字パタン「1」の、
左斜め方向成分は、この場合は、図7(C)に示した左
斜め特徴マトリクスの要素値の和であるので、68にな
る。また、この文字パタン「1」の、右斜め方向成分
は、この場合は、図7(D)に示した右斜め特徴マトリ
クスの要素値の和であるので、67になる。従って、こ
の文字パタン「1」の、左斜め方向成分と右斜め方向成
分との差分dlr1 は、 dlr1 =|68−67|=1 になる。
【0054】なお、この要素値の和ΣLi 、ΣRi
よび差分dlr1 は、ΣL・ΣR計算部19aによって
計算できる。
【0055】上記と同様にして、帳票30の文字列の第
2番目から第5番目の各文字「3579」それぞれの、
左斜め方向成分と右斜め方向成分との差分dlr2 〜d
lr5 を、求める。その結果は、次のようである。
【0056】文字パタン「3」についての差分dlr2
は、dlr2 =|133−144|=11になる。
【0057】文字パタン「5」についての差分dlr3
は、dlr3 =|158−179|=21になる。
【0058】文字パタン「7」についての差分dlr4
は、dlr4 =|34−190|=156になる。
【0059】文字パタン「9」についての差分dlr5
は、dlr5 =|185−198|=13になる。
【0060】次に、各文字パタンの上記差分に基づいて
各文字パタンを得た文字が手書き文字なのか活字文字な
のかを判定する。この判定をこの場合では、上記差分
を、予め定めた閾値Th1と比較する。これは、比較部
19bによって行える。そして、下記の(2)式を満た
す場合は、その文字は活字文字であると判定すると共
に、カウント特徴格納部19c内の第1のカウンタを1
だけカウントアップする。一方、下記の(3)式を満た
す場合は、その文字は手書き文字であると判定すると共
に、カウント特徴格納部19c内の第2のカウンタを1
だけカウントアップする(図2のステップ106)。
【0061】 dlri <Th1 ・・・(2) dlri ≧Th1 ・・・(3) なお、この閾値Th1は、例えば実験による統計的デー
タから予め定めた値である。これに限られないが、この
実施の形態では、この閾値Th1を100と定めた。
【0062】すると、上記の判定処理では、帳票30上
の文字列「13579」のうちの、文字「1」、
「3」、「5」、「9」それぞれは、活字文字と判定さ
れ、文字「7」は手書き文字と判定される。従って、活
字文字と判定された文字数をカウントする第1のカウン
タの値は4になり、手書き文字と判定された文字数をカ
ウントする第2のカウンタの値は1になる。
【0063】文字種の判定対象の文字列の行末の文字ま
で文字種の判定が済むと(図2のステップ107)、次
に、手書き文字認識辞書部21および活字文字認識辞書
部23のうちの、いずれかを選択する。この実施の形態
では、活字文字と判定された文字の数を計数する第1の
カウンタの計数値fcntと、手書き文字と判定された
文字の数を計数する第2のカウンタの計数値hcntと
を比較する(図2のステップ108)。これは、比較部
19bにより行える。
【0064】次に、認識辞書選択部19dは、上記fc
ntとhcntとの比較において、下記(4)式を満た
す場合は、帳票の文字列は活字文字列であると判定し、
辞書部として活字文字認識辞書部23を選択する。一
方、上記fcntとhcntとの比較において、下記
(5)式を満たす場合は、帳票の文字列は手書き文字列
であると判定し、辞書部として手書き文字認識辞書部2
1を選択する(図2のステップ109)。
【0065】 fcnt≧hcnt ・・・(4) fcnt<hcnt ・・・(5) すると、この帳票30の場合は、fcnt=4、hcn
t=1であったので、上記の(4)式を満たすことにな
るから、認識辞書選択部19dは、上記文字列を活字文
字列と判定し、辞書部として活字文字認識辞書部23を
選択する。
【0066】次に、文字認識部25は、帳票30上の文
字列「13579」の領域抽出、各文字パタンの切り出
し、各文字パタンからのサブパタン抽出、各サブパタン
からの特徴マトリクス抽出を行う(図3のステップ10
1〜104)。なお、これら領域抽出、文字パタンの切
り出し、サブパタンの抽出、特徴マトリクスの抽出は、
文字列が手書き文字列か活字文字列かを判定するための
処理で得たデータをそのまま利用出来る場合はそうする
のが好ましい。こうすれば、文字認識装置のハードウエ
アおよびソフトウエアそれぞれの規模を簡略化できる等
の利点が得られるからである。
【0067】次に、文字認識部25は、認識辞書選択部
19dが選択した辞書部中の標準文字特徴と、帳票30
上の文字から特徴マトリクス抽出部17が上記の如く抽
出した特徴とを照合して、帳票30上の各文字について
文字認識をする(図3のステップ105,106)。そ
して、認識結果を出力する(図3のステップ107)。
【0068】次に、帳票が、例えば図8に示したような
手書き文字帳票40である場合の、この第1の発明の文
字認識装置10の動作について、説明する。
【0069】手書き文字帳票40上の文字列「1357
9」の各文字について、文字パタンの切り出し、サブパ
タンの抽出、特徴マトリクスの抽出、各文字の左斜め成
分と右斜め成分との差分の算出が、上記の活字文字帳票
30に対する処理と同様に行われる。
【0070】すると、手書き文字帳票40の文字列「1
3579」の中の例えば文字「1」からは、図9に示し
たような文字パタンが切り出される。さらに、この文字
パタンからは、図10(A)〜(D)に示したような水
平、垂直、左斜めおよび右斜めの各サブパタンがそれぞ
れ抽出される。さらに、図11(A)〜(D)に示した
ような水平、垂直、左斜めおよび右斜めの特徴マトリク
スがそれぞれ抽出される。
【0071】また、この手書き文字「1」の左斜め方向
成分としての左斜め特徴マトリクスの要素値の和は、0
になる。また、この手書き文字「1」の右斜め方向成分
としての右斜め特徴マトリクスの要素値の和は、150
になる。
【0072】従って、この手書き文字「1」の、左斜め
方向成分と右斜め方向成分との差分dlr1 は、dlr
1 =|0−150|=150になる。
【0073】残りの文字「3579」それぞれの、左斜
め方向成分と右斜め方向成分との差分dlr2 〜dlr
5 それぞれは、以下のようになる。
【0074】文字パタン「3」についての差分dlr2
は、dlr2 =|121−97|=24になる。
【0075】文字パタン「5」についての差分dlr3
は、dlr3 =|121−87|=34になる。
【0076】文字パタン「7」についての差分dlr4
は、dlr4 =|33−199|=166になる。
【0077】文字パタン「9」についての差分dlr5
は、dlr5 =|66−185|=119になる。
【0078】次に、各文字パタンの上記差分に基づいて
各文字パタンを得た文字が手書き文字なのか活字文字な
のかを、上記の活字文字帳票30での処理と同様に判定
する。すなわち、上記の(2)式及び(3)式に従う判
定をする。そして、その判定に応じて、カウント特徴格
納部19c内の第1のカウンタまたは第2のカウンタを
1だけカウントアップする。
【0079】すると、この場合は、帳票40上の文字列
「13579」のうちの、文字「1」、「7」、「9」
それぞれは、手書き文字と判定され、文字「3」、
「5」は活字文字と判定される。従って、活字文字と判
定された文字数をカウントする第1のカウンタの値fc
ntは2となり、手書き文字と判定された文字数をカウ
ントする第2のカウンタの値hcntは3となる。
【0080】次に、比較部19bは、上記のfcntと
hcntとを比較する。
【0081】次に、認識辞書選択部19dは、上記fc
ntとhcntとの比較において、上記の(4)式を満
たす場合は、帳票の文字列は活字文字列であると判定
し、辞書部として活字文字認識辞書部23を選択する。
一方、上記fcntとhcntとの比較において、上記
の(5)式を満たす場合は、帳票の文字列は手書き文字
列であると判定し、辞書部として手書き文字認識辞書部
21を選択する。
【0082】すると、この手書き帳票40の場合は、f
cnt=2、hcnt=3であったので、上記の(5)
式を満たすことになるから、認識辞書選択部19dは、
上記文字列は手書き文字列と判定し、辞書部として手書
き文字認識辞書部21を選択する。
【0083】その後は、この選択された辞書を用いて、
文字認識部25は、手書き帳票40上の各文字を文字認
識する。
【0084】2.第2の発明の実施の形態 2−1.装置の構成の説明 図12は、第2の発明の実施の形態の文字認識装置50
を示したブロック図である。この実施の形態の文字認識
装置50は、領域抽出部11と、文字切り出し部13
と、サブパタン抽出部15と、特徴マトリクス抽出部1
7と、字種判定・辞書選択部51と、手書き文字認識辞
書部21と、活字文字認識辞書部23と、文字認識部2
5と、制御部27とを具える。これら各部は、典型的に
は、コンピュータによって構成できる。以下、各部につ
いて説明する。
【0085】まず、領域抽出部11、文字切り出し部1
3、サブパタン抽出部15、特徴マトリクス抽出部1
7、手書き文字認識辞書部21、活字文字認識辞書部2
3および文字認識部25それぞれは、この実施の形態の
場合、第1の発明と同様な構成としてある。そのため、
これらの説明はここでは省略する。
【0086】また、字種判定・辞書選択部51は、媒体
上の任意の文字列中の任意の複数の文字毎の、左斜め方
向成分と右斜め方向成分との差分をそれぞれ求める。さ
らに、該差分の総和を求める。さらに、該差分の総和に
基づいて前記文字列が手書き文字列か活字文字列かを判
定する。さらに、この判定結果に基づいて前記2つの辞
書部のいずれかを、前記文字列を文字認識するための辞
書部として選択する。
【0087】この実施の形態では、字種判定・辞書選択
部51を、以下の手段A〜手段Eで構成してある。
【0088】手段Aは、媒体上の任意の文字列の任意の
複数の文字毎の、前記左斜め方向成分と前記右斜め方向
成分との差分をそれぞれ計算する。
【0089】手段Bは、手段Aで計算された差分を格納
する。
【0090】手段Cは、前記複数の文字分の差分の総和
を算出する。
【0091】手段Dは、手段Cが算出した総和を閾値と
比較する。
【0092】手段Eは、手段Dの比較結果に基づいて前
記手書き文字認識辞書部および活字文字認識辞書部のい
ずれか1つを選択する。
【0093】この実施の形態の場合、図12に示したよ
うに、上記の手段Aおよび手段Cを、演算部(ΣL・Σ
R計算部51aという)で構成している。また、上記の
手段Bを、記憶部(文字特徴格納部51bという)で構
成している。また、上記の手段Dを比較部51cで構成
している。また、上記の手段Eを好適なセレクタ(認識
辞書選択部51dという)で構成している。なお、これ
ら各部51a〜51dそれぞれは、制御部27と相俟っ
て、目的とする機能をそれぞれ発現する。
【0094】また、制御部27は、領域抽出部11、文
字切り出し部13、サブパタン抽出部15、特徴マトリ
クス抽出部17、字種判定・辞書選択部51および文字
認識部25それぞれに接続されていて、これら各部を制
御する。
【0095】2−2.装置の動作の説明 次に、この第2の発明の文字認識装置50の理解をより
深めるために、この文字認識装置50の動作を説明す
る。
【0096】先ず、図13に示したような、活字文字に
より書かれた帳票60上の文字列が手書き文字列か活字
文字列かを判定する例を説明する。
【0097】領域抽出部11は、帳票60の画像イメー
ジデータから、文字領域に相当する領域を抽出する。
【0098】次に、文字切り出し部13は、領域抽出部
11が抽出した領域から、一文字ずつ文字パタンを切り
出す。なお、この文字切り出し部を、この実施の形態で
は、文字列の左端の文字パタンから順次に文字パタンを
切り出す。もちろんこれは一例である。さらにこの実施
の形態では、この切り出された文字パタンに、切り出さ
れた順番を示す番号が与えられる構成としてある。この
番号を、各文字パタンの管理番号として使用する。例え
ば、方向成分やそれを用いた計算結果等を、この管理番
号単位で管理することができる。
【0099】次に、サブパタン抽出部15は、文字切り
出し部13が切り出した文字パタンを、水平、垂直、左
斜めおよび右斜めの各方向毎に走査する。そして、走査
線上で所定の長さ以上連続する黒画素を検出して、該連
続する黒画素部分を、水平、垂直、左斜め及び右斜めの
各方向成分として、すなわち各方向のサブパタンとし
て、それぞれ抽出する。
【0100】図14は、図13に示した文字列「987
65」中の、「9」の文字から抽出された文字パタンを
示した図である。また、図15(A)〜(D)は、図1
4に示した「9」という文字パタンから抽出された水
平、垂直、左斜めおよび右斜めサブパタンをそれぞれ示
した図である。
【0101】次に、特徴マトリクス抽出部17は、上記
の各サブパタンから、特徴マトリクスをそれぞれ抽出す
る。この実施の形態では、上記の各サブパタンの、前記
文字パタンの外接枠(図14の「9」に外接した枠参
照)に対応する領域を、M×N個(M,Nは任意好適な
自然数)の領域に分割する。そして、これら分割領域そ
れぞれの特徴量(要素値ともいう)で表される特徴マト
リクスを得る。この要素値は、任意好適なものとでき、
例えば、各分割内の黒画素数または該黒画素数に所定処
理を施した値などとできる。
【0102】図16(A)〜(D)は、上記の特徴マト
リクスの一例を説明する図である。この図16の場合、
水平、垂直、左斜めおよび右斜め各サブパタンを、5×
5の領域に分割し、さらに各分割領域内の特徴量(要素
値)を抽出して、水平、垂直、左斜めおよび右斜めの各
特徴マトリクスを得た例を示している。
【0103】次に、字種判定・辞書選択部51は、帳票
60の文字列「98765」が手書き文字列か、活字文
字列かを、以下のように判断する。さらに、手書き文字
認識辞書部21および活字文字認識辞書部23のうち
の、該文字列の文字認識に適正な辞書部を、以下のよう
に選択する。
【0104】先ず、帳票60上の文字列「98765」
の文字毎の、左斜め方向成分と右斜め方向成分との差分
をそれぞれ求める。
【0105】ここで、左斜め方向成分および右斜め方向
成分は、これら方向成分が反映されたものであれば、任
意のものと出来る。ただし、この実施の形態の場合は、
左斜め特徴マトリクスの要素値の和を、左斜め方向成分
とし、右斜め特徴マトリクスの要素値の和を、右斜め方
向成分としている。
【0106】従って、この実施の形態の場合は、文字毎
の左斜め方向成分と、右斜め方向成分との差分は、下記
の(6)式で与えられる。
【0107】 dlri =|ΣLi −ΣRi | ・・・(6) ただし、(6)式中の、dlri とは、文字列中の第i
番目の文字の左斜め方向成分と右斜め方向成分との差分
であり、また、ΣLi とは、i番目の文字の左特徴マト
リクス中の、要素値の和であり、ΣRi とは、i番目の
文字の右斜め特徴マトリクス中の、要素値の和である。
【0108】図13に示した「98765」の文字列の
左から1番目の文字パタン「9」の、左斜め方向成分
は、この場合は、図16(C)に示した左斜め特徴マト
リクスの要素値の和であるので、190である。また、
この文字パタン「9」の、右斜め方向成分は、この場合
は、図16(D)に示した右斜め特徴マトリクスの要素
値の和であるので、198である。従って、この文字パ
タン「9」の、左斜め方向成分と右斜め方向成分との差
分dlr1 は、 dlr1 =|190−198|=8 になる。
【0109】なお、この要素値の和ΣLi 、ΣRi およ
び差分dlr1 は、ΣL・ΣR計算部51aによって計
算できる。
【0110】文字「9」について上記のようにして計算
された差分8は、文字特徴格納部51bに格納される。
【0111】上記と同様にして、帳票60の文字列の第
2番目から第5番目の各文字「8765」それぞれの、
左斜め方向成分と右斜め方向成分との差分dlr2 〜d
lr5 を、求める。その結果は、次のようである。
【0112】文字パタン「8」についての差分dlr2
は、dlr2 =|192−204|=12になる。
【0113】文字パタン「7」についての差分dlr3
は、dlr3 =|82−145|=63になる。
【0114】文字パタン「6」についての差分dlr4
は、dlr4 =|191−193|=2になる。
【0115】文字パタン「5」についての差分dlr5
は、dlr5 =|158−179|=21になる。
【0116】これら各文字パタンの差分も文字特徴格納
部51bにそれぞれ格納される。
【0117】文字列の行末の文字まで上記の差分を計算
し終えたら、この文字列の各文字の差分の総和を、ΣL
・ΣR計算部51aは求める。すなわち、下記の(7)
式に基づいて、各文字の差分dlri の総和dlrを求
める。ただし、Nは、上記の差分を求めた最終番目の文
字番号である。
【0118】
【数1】
【0119】すると、この実施の形態の場合の文字列
「98765」の場合は、上記の差分の総和dlrは、
dlr=8+12+63+2+21=106になる。
【0120】次に、この差分の総和dlrに基づいて、
帳票60上の文字列「98765」が手書き文字列か活
字文字列かを判定し、この判定結果に基づいて前記2つ
の辞書部のいずれかを選択する。
【0121】帳票60の文字列「98765」が活字文
字列か手書き文字列かの判定を、この実施の形態では、
上記の差分の総和dlrと予め定めた閾値Th2とを比
較することで行う。この比較は、比較部51cにより行
われる。そして、下記の(8)式を満たした場合は、文
字列は活字文字列であると判定する。一方、下記の
(9)式を満たした場合は、文字列は手書き文字列であ
ると判定する。
【0122】 dlr<Th2 ・・・(8) dlr≧Th2 ・・・(9) なお、この閾値Th2は、例えば実験による統計的デー
タから予め定めた値である。これに限られないが、この
場合閾値Th2を200としている。
【0123】すると、この実施の形態の場合は、差分の
総和が上記の通り106であるので、(8)式を満たす
ことになる。よって、認識辞書選択部51dは、この文
字列の認識用辞書として、活字文字認識辞書部23を選
択する。
【0124】次に、文字認識部25は、認識辞書選択部
51dが選択した辞書を用いて、帳票60上の文字列の
各文字を文字認識する。なお、この文字認識は、第1の
発明の文字認識装置10での処理と同様に行うことが出
来るので、ここではその説明を省略する。
【0125】次に、帳票が、例えば図17に示したよう
な手書き文字帳票70である場合の、この第2の発明の
文字認識装置50の動作について、説明する。
【0126】手書き文字帳票70上の文字列「9876
5」の各文字について、文字パタンの切り出し、サブパ
タンの抽出、特徴マトリクスの抽出、各文字の左斜め方
向成分と右斜め方向成分との差分の算出、該差分の文字
特徴格納部51bへの格納が、上記の活字文字帳票60
に対する処理と同様に行われる。
【0127】すると、手書き文字帳票70の文字列「9
8765」の中の例えば文字「9」からは、図18に示
したような文字パタンが切り出される。さらに、この文
字パタンからは、図19(A)〜(D)に示したような
水平、垂直、左斜めおよび右斜めの各サブパタンがそれ
ぞれ抽出される。さらに、図20(A)〜(D)に示し
たような水平、垂直、左斜めおよび右斜めの特徴マトリ
クスがそれぞれ抽出される。
【0128】また、この手書き文字「9」の左斜め方向
成分としての左斜め特徴マトリクスの要素値の和は、7
1になる。また、この手書き文字「9」の右斜め方向成
分としての右斜め特徴マトリクスの要素値の和は、18
7になる。
【0129】従って、この手書き文字「9」の、左斜め
方向成分と右斜め方向成分との差分dlr1 は、dlr
1 =|71−187|=116になる。
【0130】残りの文字「8765」それぞれの、左斜
め方向成分と右斜め方向成分との差分dlr2 〜dlr
5 それぞれは、以下のようになる。
【0131】文字パタン「8」についての差分dlr2
は、dlr2 =|153−206|=53になる。
【0132】文字パタン「7」についての差分dlr3
は、dlr3 =|33−199|=166になる。
【0133】文字パタン「6」についての差分dlr4
は、dlr4 =|87−166|=79になる。
【0134】文字パタン「5」についての差分dlr5
は、dlr5 =|121−87|=34になる。
【0135】次に、各文字パタンの上記差分の総和dl
rを、ΣL・ΣR計算部51aは計算する。このdlr
は448になる。
【0136】この求めたdlrと、閾値Th2とを比較
部51cは比較する。ここでは、上記の如く、Th2は
200であるので、dlr>Th2となるから、手書き
帳票70上の文字列は手書き文字列と判定される。する
と、認識辞書選択部51dは、辞書部として手書き文字
認識辞書部21を選択する。
【0137】その後は、この選択された辞書を用いて、
文字認識部25は、手書き帳票70上の各文字を文字認
識する。
【0138】上述においては、この出願の各発明の実施
の形態についてそれぞれ説明した。しかし、これらの発
明は上述の各実施の形態に何ら限定されるものではな
く、多くの変形又は変更を行うことができる。
【0139】例えば、上述の実施例では左斜め方向成分
と右斜め方向成分との差分に基づいて字種判定及び辞書
選択をする例を説明した。しかし、左斜め方向成分と右
斜め方向成分との比に基づいて字種判定及び辞書選択を
しても、実施の形態と同様な効果を得ることができる。
比を用いる場合は、上述の実施の形態において、差分を
求める代わりに比を求め、また、閾値Th1やTh2を
好適な値に変更する手当をすればよい。
【0140】また、上述の実施の形態では、文字認識対
象の文字を、振り込み帳票等の金額欄の数字としたが、
この発明はこれに限定されるものではなく、任意の文字
認識に適用出来る。手書きおよび活字印刷のどちらでも
書かれることが多い記入欄、例えば帳票の例えば住所、
氏名欄の文字などにも適用できる。
【0141】
【発明の効果】上述した説明から明らかなように、この
出願の第1の発明の文字認識装置によれば、文字列中の
任意の複数の文字毎の、左斜め方向成分と右斜め方向成
分との差分又は比を、それぞれ求め、該差分又は比に基
づいて前記複数の文字それぞれが手書き文字か活字文字
かを判定すると共に、手書き文字と判定された文字数お
よび活字文字と判定された文字数をそれぞれ計数し、該
計数結果に基づいて前記文字列を文字認識するための辞
書部を決める字種判定・辞書選択部を具える。
【0142】また、この出願の第2の発明の文字認識装
置によれば、文字列中の任意の複数の文字毎の、左斜め
方向成分と右斜め方向成分との差分又は比をそれぞれ求
め、さらに、該差分の総和又は比の総和を求め、該総和
に基づいて前記文字列が手書き文字列か活字文字列かを
判定し、この判定結果に基づいて前記文字列を文字認識
するための辞書部を決める字種判定・辞書選択部を具え
る。
【0143】そのため、これら第1の発明および第2の
発明の文字認識装置それぞれでは、文字の左右対称性を
判定することができる。手書き文字と活字文字とを比べ
た場合、一般に、活字文字の方が左右対称性の良い文字
が多い。そのため、これら第1および第2の文字認識装
置それぞれでは、文字の左右対象性という新たな観点か
ら字種を判定し、その結果に基づいて辞書を選択でき
る。
【0144】従って、文字配列ピッチや文字高さのバラ
ツキが小さい手書き文字列の場合でも、手書き文字列で
あると判定できる確率が高まる。その結果、手書き文字
および活字文字が混在する媒体、または、手書き文字媒
体と活字文字媒体が混在する媒体群の文字認識に当た
り、手書き文字用認識辞書および活字文字認識辞書のう
ちの適正な辞書を選択することができる。
【0145】また、第1の発明の文字認識装置は、文字
の左斜め方向成分と右斜め方向成分との差分又は比に基
づいて、文字毎に手書き文字か活字文字かを判定する。
そして、手書き文字が多いか活字文字が多いかを基準
に、文字列が手書き文字列か活字文字列かを判定する。
一方、第2の発明の文字認識装置は、文字毎にその左斜
め方向成分と右斜め方向成分との差分又は比を求めた
後、該差分又は比の複数文字分の総和を求め、この総和
に基づいて、文字列が手書き文字列か活字文字列かを判
定する。すると、媒体上の文字列中のある文字部分に、
ゴミが存在していたり、かすれが存在している場合、第
1の発明ではゴミやかすれの影響を1文字分のみにとど
めることができる。しかし、第2の発明の場合、ゴミや
かすれの影響が上記の総和に影響する。すなわち、第1
の発明の文字認識装置は、第2の発明の文字認識装置に
比べて、ゴミやかすれの影響を吸収し易いという利点を
持つ。
【0146】また、この出願の字種判定装置の発明によ
れば、媒体上の文字列の字種が手書き文字か活字文字か
の判定を、文字の左右対称性に基づいて判定できる。従
って、新規な字種判定装置が実現される。これら字種判
定装置によれば、例えば、手書き帳票と活字帳票とを選
別する新規な装置を実現することができる。
【図面の簡単な説明】
【図1】第1の発明の実施の形態を説明する図である。
【図2】辞書部選択動作を説明する図であり、その動作
の概略的な流れを示すフローチャートである。
【図3】文字認識動作を説明する図であり、その動作の
概略的な流れを示すフローチャートである。
【図4】活字文字帳票の説明図である。
【図5】活字文字パタンの説明図である。
【図6】活字文字パタン『1』のサブパタン抽出の説明
図である。
【図7】活字文字パタンの特徴マトリクスの説明図であ
る。
【図8】手書き文字帳票の説明図である。
【図9】手書き文字パタンの説明図である。
【図10】手書き文字パタン『1』のサブパタン抽出の
説明図である。
【図11】手書き文字パタンの特徴マトリクスの説明図
である。
【図12】第2の発明の実施の形態を説明する図であ
る。
【図13】活字文字帳票の説明図である。
【図14】活字文字パタンの説明図である。
【図15】活字文字パタン『9』のサブパタン抽出の説
明図である。
【図16】活字文字パタンの特徴マトリクスの説明図で
ある。
【図17】手書き文字帳票の説明図である。
【図18】手書き文字パタンの説明図である。
【図19】手書き文字パタン『9』のサブパタン抽出の
説明図である。
【図20】手書き文字パタンの特徴マトリクスの説明図
である。
【図21】課題を説明するための図である。
【図22】第1の発明と第2の発明との相違を説明する
図である。
【符号の説明】
10:第1の発明の実施の形態の文字認識装置 11:領域抽出部 13:文字切り出し部 15:サブパタン抽出部 17:特徴マトリクス抽出部 19:字種判定・辞書選択部 19a:第1の手段(ΣL・ΣR計算部) 19b:第2の手段および第4の手段(比較部) 19c:第3の手段(カウント特徴格納部) 19d:第5の手段(認識辞書選択部) 21:手書き文字認識辞書部 23:活字文字認識辞書部 25:文字認識部 27:制御部 50:第2の発明の実施の形態の文字認識装置 51:字種判定・辞書選択部 51a:手段Aおよび手段C(ΣL・ΣR計算部) 51b:手段B(文字特徴格納部) 51c:手段D(比較部) 51d:手段E(認識辞書選択部)

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 媒体から文字単位に文字パタンを切り出
    す文字切り出し部と、手書き文字認識辞書部と、活字文
    字認識辞書部と、認識対象の文字が手書き文字か活字文
    字かを判定し、その結果により前記2つの辞書部のいず
    れかを選択する字種判定・辞書選択部と、該選択された
    辞書部を用いて文字認識をする文字認識部とを具える文
    字認識装置において、 前記字種判定・辞書選択部は、 前記媒体上の任意の文字列中の任意の複数の文字毎の、
    左斜め方向成分と右斜め方向成分との差分又は比を、そ
    れぞれ求め、 該差分又は比に基づいて前記複数の文字それぞれが手書
    き文字か活字文字かを判定すると共に、手書き文字と判
    定された文字数および活字文字と判定された文字数をそ
    れぞれ計数し、 該計数結果に基づいて前記2つの辞書部のいずれかを前
    記文字列を文字認識するための辞書部として選択する字
    種判定・辞書選択部であることを特徴とする文字認識装
    置。
  2. 【請求項2】 請求項1に記載の文字認識装置におい
    て、 前記字種判定・辞書選択部は、 前記複数の文字毎の前記左斜め方向成分と前記右斜め方
    向成分との差分又は比をそれぞれ計算する第1の手段
    と、 該差分又は比を閾値と比較して前記複数の文字それぞれ
    が手書き文字か活字文字かを判定する第2の手段と、 該第2の手段で活字文字と判定された文字数を計数する
    第1カウンタおよび手書き文字と判定された文字数を計
    数する第2カウンタを有した第3の手段と、 前記第1カウンタおよび第2カウンタの値同士を比較す
    る第4の手段と、 該第4の手段の比較結果に基づいて前記手書き文字認識
    辞書部および活字文字認識辞書部のいずれか1つを選択
    する第5の手段とを具えたことを特徴とする文字認識装
    置。
  3. 【請求項3】 請求項1に記載の文字認識装置におい
    て、 文字パタンについて水平、垂直、左斜めおよび右斜めの
    各方向に走査して、これら走査方向に沿って所定の長さ
    以上連続する黒画素を、水平、垂直、左斜めおよび右斜
    めの各方向成分として抽出するサブパタン抽出部であっ
    て、 前記字種判定・辞書選択部で用いるための左斜め方向成
    分および右斜め方向成分と、前記文字認識部で用いるた
    めの水平、垂直、左斜めおよび右斜めの各方向成分との
    抽出で兼用されるサブパタン抽出部を具えることを特徴
    とする文字認識装置。
  4. 【請求項4】 媒体から文字単位に文字パタンを切り出
    す文字切り出し部と、手書き文字認識辞書部と、活字文
    字認識辞書部と、認識対象の文字が手書き文字か活字文
    字かを判定し、その結果により前記2つの辞書部のいず
    れかを選択する字種判定・辞書選択部と、該選択された
    辞書部を用いて文字認識をする文字認識部とを具える文
    字認識装置において、 前記字種判定・辞書選択部は、 前記媒体上の任意の文字列中の任意の複数の文字毎の、
    左斜め方向成分と右斜め方向成分との差分又は比をそれ
    ぞれ求め、さらに、これら差分又は比の総和を求め、 該差分の総和又は比の総和に基づいて前記文字列が手書
    き文字列か活字文字列かを判定し、この判定結果に基づ
    いて前記2つの辞書部のいずれかを前記文字列を文字認
    識するための辞書部として選択する字種判定・辞書選択
    部であることを特徴とする文字認識装置。
  5. 【請求項5】 請求項4に記載の文字認識装置におい
    て、 前記字種判定・辞書選択部は、 前記複数の文字毎の前記左斜め方向成分と前記右斜め方
    向成分との差分又は比をそれぞれ計算する手段Aと、 該手段Aで計算された差分又は比を格納する手段Bと、 前記複数の文字分の差分の総和又は比の総和を算出する
    手段Cと、 該手段Cが算出した総和を閾値と比較する手段Dと、 該手段Dの比較結果に基づいて前記手書き文字認識辞書
    部および活字文字認識辞書部のいずれか1つを選択する
    手段Eとを具えたことを特徴とする文字認識装置。
  6. 【請求項6】 請求項4に記載の文字認識装置におい
    て、 文字パタンについて水平、垂直、左斜めおよび右斜めの
    各方向に走査して、これら走査方向に沿って所定の長さ
    以上連続する黒画素を、水平、垂直、左斜めおよび右斜
    めの各方向成分として抽出するサブパタン抽出部であっ
    て、 前記字種判定・辞書選択部で用いるための左斜め方向成
    分および右斜め方向成分と、前記文字認識部で用いるた
    めの水平、垂直、左斜めおよび右斜めの各方向成分との
    抽出で兼用されるサブパタン抽出部を具えることを特徴
    とする文字認識装置。
  7. 【請求項7】 媒体上の任意の文字列中の任意の複数の
    文字毎の、左斜め方向成分と右斜め方向成分との差分又
    は比を、それぞれ求め、 該差分又は比に基づいて前記複数の文字それぞれが手書
    き文字か活字文字かを判定すると共に、手書き文字と判
    定された文字数および活字文字と判定された文字数をそ
    れぞれ計数し、 該計数結果に基づいて前記文字列が手書き文字列か活字
    文字列かを判定することを特徴とする字種判定装置。
  8. 【請求項8】 媒体上の任意の文字列中の任意の複数の
    文字毎の、左斜め方向成分と右斜め方向成分との差分又
    は比をそれぞれ求め、さらに、これら差分又は比の総和
    を求め、 該差分の総和又は比の総和に基づいて前記文字列が手書
    き文字列か活字文字列かを判定することを特徴とする字
    種判定装置。
JP10093510A 1998-04-06 1998-04-06 文字認識装置および字種判定装置 Withdrawn JPH11296618A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10093510A JPH11296618A (ja) 1998-04-06 1998-04-06 文字認識装置および字種判定装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10093510A JPH11296618A (ja) 1998-04-06 1998-04-06 文字認識装置および字種判定装置

Publications (1)

Publication Number Publication Date
JPH11296618A true JPH11296618A (ja) 1999-10-29

Family

ID=14084355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10093510A Withdrawn JPH11296618A (ja) 1998-04-06 1998-04-06 文字認識装置および字種判定装置

Country Status (1)

Country Link
JP (1) JPH11296618A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017068433A (ja) * 2015-09-29 2017-04-06 シャープ株式会社 画像処理装置及び画像処理プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017068433A (ja) * 2015-09-29 2017-04-06 シャープ株式会社 画像処理装置及び画像処理プログラム

Similar Documents

Publication Publication Date Title
US7054485B2 (en) Image processing method, apparatus and system
US6917706B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
EP0063454B1 (en) Method for recognizing machine encoded characters
US6385338B1 (en) Image processing method and apparatus
US7336813B2 (en) System and method of determining image skew using connected components
CN100559387C (zh) 图像处理装置和方法,图像形成装置
US20080212877A1 (en) High speed error detection and correction for character recognition
EP0810542A2 (en) Bitmap comparison apparatus and method
US5561720A (en) Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch
US5271067A (en) Optical character recognition apparatus
JPH11296618A (ja) 文字認識装置および字種判定装置
JP4244692B2 (ja) 文字認識装置及び文字認識プログラム
JP2000090194A (ja) 画像処理方法および画像処理装置
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
JP2747136B2 (ja) 文字認識装置
JP3462960B2 (ja) 画像処理方法
JP3848792B2 (ja) 文字列認識方法及び記録媒体
JP2995818B2 (ja) 文字切り出し方法
JP3196291B2 (ja) 文字認識方法および装置
JPH11316797A (ja) 文書画像の領域識別方法および装置
JP3104355B2 (ja) 特徴抽出装置
JP3127413B2 (ja) 文字認識装置
JP2005071243A (ja) 画像処理装置、方法およびプログラム
JP2000293632A (ja) 文字列認識装置および文字列認識方法
JPH11232392A (ja) 文字認識装置と文字認識方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050607