JPH10162103A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH10162103A
JPH10162103A JP8324177A JP32417796A JPH10162103A JP H10162103 A JPH10162103 A JP H10162103A JP 8324177 A JP8324177 A JP 8324177A JP 32417796 A JP32417796 A JP 32417796A JP H10162103 A JPH10162103 A JP H10162103A
Authority
JP
Japan
Prior art keywords
character
dictionary
character recognition
information
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8324177A
Other languages
English (en)
Inventor
Hirohisa Goto
裕久 後藤
Koichi Higuchi
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP8324177A priority Critical patent/JPH10162103A/ja
Publication of JPH10162103A publication Critical patent/JPH10162103A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 この発明は、帳票等において手書きされた文
字や活字文字を高速かつ良好な文字認識率を有する文字
認識装置を提供することを目的とする。 【解決手段】 入力された個々の文字の特徴量情報を算
出し、予め格納されている基準特徴量情報と照合するこ
とにより、入力文字の文字種類を決定する文字認識装置
において(1)複数の文字コードのそれぞれに対応する
基準特徴量情報と、文字コードとを格納しており、複数
の文字書体のそれぞれに対応する複数の手段と(2)文
字書体が不定な入力文字の特徴量情報を、2以上の文字
認識辞書手段に格納されている基準特徴量情報と照合し
て、使用すべき文字認識辞書を決定する手段と(3)決
定された文字認識辞書に格納されている基準特徴量情報
と、入力された文字の特徴量情報との照合結果に基づい
て、入力された文字種類を決定する手段とを有すること
を特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、文字認識装置に
関するものであり、特に、入力文字列が複数の文字書体
に渡っている可能性があるものを処理するものに適用で
きるものである。
【0002】
【従来の技術】文字認識装置は、帳票あるいは文書上に
手書きされた又は印刷された複数の文字を全領域から個
々の文字ごとに切り出し、切り出された個々の文字に対
して、特徴抽出を行ない、特徴量情報(以下、特徴ベク
トルという)を算出し、その特徴ベクトルと辞書に含ま
れる基準特徴ベクトルとの比較を行ない、最も類似して
いる基準特徴ベクトルの文字カテゴリ(文字種類)の文
字コードを認識結果として出力するものである。
【0003】ところで、金額などの数字を記入する欄が
設けられている帳票には、手書きで数字が記入されたも
のや、プリンタ等によって印字されたものがある。
【0004】手書きによって記入された、あるいはプリ
ンタ等によって印字された帳票が混在する場合、手書文
字認識用の辞書しか有しない文字認識装置によって、こ
れらの帳票を認識させたとき、プリンタ等によって印字
された文字に対する認識率が悪く、一方、活字文字認識
用の辞書しか有しない文字認識装置によって、これらの
帳票を認識させたとき、手書きによって記入された文字
に対する認識率が悪いという問題があった。
【0005】そのために、手書き文字用の認識辞書と活
字文字用の認識辞書との両方を用いる文字認識装置があ
る。この文字認識装置は、認識対象である文字の特徴ベ
クトルと、上記2つの認識辞書が保有する基準特徴ベク
トルとを照合し、上記2つの認識辞書において、認識対
象の文字の特徴ベクトルと最も類似する基準特徴ベクト
ルの文字コードを認識結果として出力するものである。
従って、2つの認識辞書を有する文字認識装置には、正
確に認識できる入力文字が多いという特徴がある。
【0006】
【発明が解決しようとする課題】しかし、手書き文字用
の認識辞書と活字文字用の認識辞書とを有する文字認識
装置は、2つの文字認識辞書の基準特徴ベクトルと比較
するため、文字認識の処理速度が遅くなるという課題が
あり、文字数の多い文字列を処理する場合には、文字認
識に要する処理時間は無視できないものとなる。
【0007】さらに、文字によっては、手書きされた文
字を活字文字の他の文字と誤認識したり、逆に、活字文
字を手書きの他の文字と誤認識したりする場合もあり、
このような課題がまだ残されている。
【0008】なお、例えば、明朝体文字用の認識辞書と
ゴシック体文字用の認識辞書とを備えた文字認識装置に
おいても、上記と同様に、処理時間が長くなるととも
に、複数の書体辞書を備えながら認識率の十分な向上が
図れないという課題が残されている。
【0009】従って、入力文字の書体が一義的に決まっ
ていない場合であっても、入力文字を高速かつ正確に認
識できる文字認識装置が求められていた。
【0010】なお、この明細書で文字書体とは、手書き
文字と活字文字とのように、また、活字文字について
は、明朝体とゴシック体とのように、異なった観点によ
って分類された文字を意味する。
【0011】
【課題を解決するための手段】かかる課題を解決するた
めに、第1の発明の文字認識装置は、入力された文字列
から個々の文字の特徴量情報を算出し、予め格納されて
いる基準特徴量情報と照合することにより、入力された
文字の文字種類を決定する文字認識装置において(1)
複数の文字コードのそれぞれに対応する基準特徴量情報
と、文字コードとを格納しており、複数の文字書体のそ
れぞれに対応する複数の文字認識辞書手段と(2)文字
書体が不定な入力された文字の特徴量情報を、2以上の
文字認識辞書手段に格納されている基準特徴量情報と照
合して、使用すべき文字認識辞書を決定する使用辞書決
定手段と(3)決定された文字認識辞書に格納されてい
る基準特徴量情報と、入力された文字の特徴量情報との
照合結果に基づいて、入力された文字種類を決定する文
字認識手段とを有することを特徴とする。
【0012】また、第2の発明の文字認識装置は、入力
された文字列から個々の文字の特徴量情報を算出し、予
め格納されている基準特徴量情報と照合することによ
り、入力された文字の文字種類を決定する文字認識装置
において(1)複数の文字コードのそれぞれに対応する
基準特徴量情報と、文字コードとを格納しており、複数
の文字書体のそれぞれに対応する複数の文字認識辞書手
段と(2)入力された文字列が存在する画像の領域ごと
に、その領域内に存在する文字の照合に使用する文字認
識辞書を指定する情報を格納している領域別使用辞書情
報格納手段と、(3)入力された文字が存在する領域に
ついて、領域別使用辞書情報格納手段が示す文字認識辞
書を、使用すべき文字認識辞書として指定する使用辞書
指定手段と(4)指定された文字認識辞書に格納されて
いる基準特徴量情報と、入力された当該領域の文字の特
徴量情報との照合結果に基づいて、その文字の文字種類
を決定する文字認識手段とを有することを特徴とする。
【0013】
【発明の実施の形態】
(A)第1の実施形態 以下、この発明による文字認識装置の第1の実施形態に
ついて図面を参照しながら詳述する。この実施形態の文
字認識装置は、手書き文字と活字文字とが混在している
可能性がある帳票等に記載されている文字を認識の対象
としている。
【0014】(A−1)第1の実施形態の構成 図1は、この実施形態の文字認識装置の機能的構成図で
ある。図1において、この実施形態の文字認識装置は、
スキャナ部1と、画像記憶部2と、文字切出部3と、特
徴抽出部4と、領域属性格納部5と、照合辞書情報判定
部6と、距離計算部7と、手書文字認識辞書部71と、
活字文字認識辞書部72と、結果修正部8と、判定結果
格納部9とで構成されている。
【0015】スキャナ部1は、文字の書かれた帳票や文
書などの認識対象を光学的に読みとり、認識対象を白黒
2値の画像データとするものである。
【0016】画像記憶部2は、スキャナ部1で読み取ら
れた画像データを保存し、これを文字切出部3へ出力
し、一方、後述する特徴抽出部4から出力された文字画
像識別子に対応する文字画像データを上記画像データか
ら検索し、これを特徴抽出部4へ出力するものである。
【0017】具体的には、画像記憶部2は、内部保存す
る画像データを文字切出部3へ出力する。文字切出部3
では、後述するように、当該画像データから文字画像部
分を検出し、各文字画像のそれぞれに対して文字画像識
別子を与え、上記画像データにおける各文字画像の大き
さと位置とを位置大きさ情報として出力する。画像記憶
部2は、文字画像識別子と位置大きさ情報とを入力し、
上記画像データとともに内部に保存する。一方、画像記
憶部2は、特徴抽出部4から出力された文字画像識別子
が入力されるごとに、文字画像識別子と位置大きさ情報
とから該当する文字画像データを当該画像データから検
索し、これを特徴抽出部4へ出力する。
【0018】文字切出部3は、画像記憶部2から出力さ
れた画像データを入力とし、画像データにおいて、文字
が並んでいる領域(以下、この領域を文字領域という)
とそれ以外の領域とに画像データを分割し、文字領域に
ついては、文字領域から文字列を検出し、文字列から個
々の文字画像を検出し、個々の文字画像が含まれていた
文字列と各文字列が含まれていた文字領域とを示す文字
領域情報と、各文字領域に含まれる文字の数と、各文字
列に含まれる文字の数とを示す文字領域内文字数集計テ
ーブルとを出力するものである。
【0019】具体的には、文字切出部3は、文字が記載
された帳票等の画像データを入力とし、内部保有するフ
ォーマット情報に従って、当該画像データを各文字領域
ごとに分割し、各文字領域の画像データである領域画像
データを検出する。
【0020】なお、フォーマット情報とは、認識対象で
ある帳票等の画像データにおいて、一つの意味のまとま
り(例えば、銀行名を記す記入欄)ごとに、1又は複数
の文字領域を設定したものである。例えば、図3は、こ
の実施形態の文字認識装置の認識対象である帳票の一例
を示した図2についてのフォーマット情報である。この
フォーマット情報は、上記帳票の各記載欄に対応する文
字領域を示したものであり、この例では6つの文字領域
が示されている。
【0021】図4は、図3に示したフォーマット情報に
従って、図2に示された画像データを各文字領域ごとに
分割し、各文字領域の画像データである領域画像データ
を検出した例を示したものである。図4によると、文字
領域1には領域画像1が、文字領域2には領域画像2
が、文字領域3には領域画像3が、文字領域4には領域
画像4が、文字領域5には領域画像5が、含まれること
を示している。また、領域画像1には「凸凹銀行」(活
字文字)が、領域画像2には「八王子支店」(活字文
字)が、領域画像3には「○×産業株式会社」(活字文
字)が、領域画像4には「オキタロウ」(手書き文字)
が、領域画像5には「沖 太郎」(手書き文字)が、領
域画像6には「10000」(手書き文字)が、各々対
応することを示している。
【0022】次に、各領域画像データごとに、文字画像
を構成する文字画素の横方向の黒点数を計数し、当該黒
点数の縦方向の分布において、所定のしきい値を超える
部分を文字列画像と定義して文字列を検出する。
【0023】図5は、図2の文字領域1の画像である
「凸凹銀行」の文字列画像の黒点の分布状態と、分布状
態により得られた文字列の画像である文字列画像1(す
なわち、「凸凹銀行」)とを示したものである。図5で
は、文字領域1の画像である「凸凹銀行」は、文字列画
像1(以下、文字列1という)として検出されたことが
示される。
【0024】さらに、各文字列画像ごとに、文字列画像
の縦方向の黒点数を計数し、当該黒点数の横方向の分布
において、所定のしきい値を超える部分を文字画像と定
義し、文字列画像を構成する文字画像を一文字画像単位
で検出する。このとき、文字切出部3は、各文字に対し
てユニークな値である文字画像識別子を付与する。
【0025】図6は、上記文字列1の黒点の分布状態
と、分布状態により得られた文字画像1〜文字列画像4
を示したものである。図6では、文字列1の「凸凹銀
行」から、文字画像1(すなわち、文字「凸」)〜文字
画像4(すなわち、文字「行」)が切り出されたことを
示している。
【0026】また、文字切出部3は、文字領域から文字
列を検出するとき当該文字列が属する文字領域を示すた
めの情報と、文字列から文字を検出するとき当該文字が
属する文字列を示すための情報と、当該文字に付与され
た文字画像識別子とでなる文字領域情報を生成する。
【0027】図7(1)は、図2の文字領域1に含まれ
る文字についての文字領域情報を示したものである。図
7(1)は、文字領域1の画像である「文字列画像1」
(すなわち、「凸凹銀行」)は、文字列1に含まれ、領
域1に含まれることを示している。そして、図7(1)
は、文字画像1(すなわち、凸凹銀行の「凸」)〜文字
画像4(すなわち、凸凹銀行の「行」)は、文字領域1
の文字列1に属していることを示し、文字画像1(すな
わち、文字「凸」)の文字識別子が「文字1」、文字画
像2(すなわち、文字「凹」)の文字識別子が「文字
2」、文字画像3(すなわち、文字「銀」)の文字識別
子が「文字3」、文字画像4(すなわち、文字「行」)
の文字識別子が「文字4」であることを示している。
【0028】その後、文字切出部3は、各文字領域にお
ける文字列ごとの文字数と、当該領域での文字数とを集
計した領域内文字数集計テーブルを作成する一方、上記
各文字画像の大きさと、画像データでの当該文字画像の
位置とを示す位置大きさ情報を作成する。
【0029】そして、文字切出部3は、位置大きさ情報
を画像記憶部2に、文字画像識別子を特徴抽出部4に、
文字領域情報と領域内文字数集計テーブルとを照合辞書
情報判定部6に出力する。
【0030】なお、文字切出部3で行なう、文字列と文
字画像データとの検出については、上記の方法の他にピ
ッチ推定を用いても良く、またピッチ推定と上記の方法
を組み合わせて用いても良い。
【0031】特徴抽出部4は、文字切出部3から出力さ
れた文字画像識別子に対応する文字画像の特徴ベクトル
を算出し、これを文字画像識別子とともに出力するもの
である。
【0032】具体的には、特徴抽出部4は、文字切出部
3から文字画像識別子が入力されるごとに、文字画像識
別子を画像記憶部2に出力し、当該文字画像識別子に対
応する文字画像を画像記憶部2から取り込む。そして、
特徴抽出部4は、入力された上記文字画像に対応する特
徴ベクトルを作成し、この特徴ベクトルを文字画像識別
子とともに照合辞書情報判定部6へ出力する。
【0033】なお、特徴抽出部4は、対象となる文字画
像の文字の高さと、横幅と、線幅と、水平成分と垂直成
分とを用いて、特徴ベクトルを作成する。但し、上記以
外にも、その特徴が数値化できるような物理量を用いて
特徴パラメータを作成しても良い。また、特徴ベクトル
については、1次元ベクトルでも良く、それ以上の次元
を有しても良い。
【0034】領域属性格納部5は、領域属性情報を格納
し、領域属性情報を照合辞書情報判定部6へ出力するも
のである。
【0035】領域属性情報とは、フォーマット情報で設
定された文字領域と、各文字領域に対応する文字属性と
領域属性とでなり、フォーマット情報で設定された文字
領域において、その文字領域(例えば、銀行名を記す記
入欄)が、手書き文字で記載されるか、活字文字で記載
されるか、若しくは手書き活字の両方の文字で記載され
るかのいずれか(以下、手書き文字や活字文字のことを
文字属性という)を示すとともに、各文字属性を数値と
対応づけた(これを領域属性という)ものである。例え
ば、図9は、図2に示した帳票の領域属性情報である。
この領域属性情報は、文字領域1〜文字領域3が活字文
字で記載される領域であることを示し、文字領域4と文
字領域5とが手書き文字と活字文字とが混在して記載さ
れる可能性のある領域であることを示し、文字領域6が
手書き文字で記載される領域であることを示している。
【0036】手書文字認識辞書部71は、標準的な手書
き文字の特徴を表わす特徴ベクトルであって、複数種類
の手書き文字に対応する特徴ベクトルを納めたものであ
り、距離計算部7に特徴ベクトルとこの特徴ベクトルに
対応する文字コードとを出力するものである。
【0037】手書文字認識辞書部71が有する手書き文
字の特徴ベクトルは、同じ文字コードを有する文字(す
なわち、同じ文字)を、手書きによって複数個作成し、
作成したそれぞれの文字パタン画像に対応する特徴ベク
トルを平均することによって得られる。なお、特徴ベク
トルの作成に際して、特徴抽出部4で用いられたのと同
様の方法で各文字パタン画像に対応する特徴ベクトルを
算出する。ただし、辞書には、一つの文字コードに対し
て異なる値を有する特徴ベクトルが複数あってもかまわ
ないが、一つの特徴ベクトルにつき一つの文字コードが
与えられなければならない。
【0038】活字文字認識辞書部72は、標準的な活字
の特徴を表わす特徴ベクトルであって、複数種類の活字
に対応する特徴ベクトルを納めたものであり、距離計算
部7に特徴ベクトルとこの特徴ベクトルに対応する文字
コードとを出力するものである。
【0039】活字文字認識辞書部72が有する活字の特
徴ベクトルは、同じ文字コードを有する複数の活字画像
に対応する特徴ベクトルを平均することによって得られ
る。なお、特徴ベクトルの作成に際して、特徴抽出部4
で用いられたのと同様の方法で各文字パタン画像に対応
する特徴ベクトルを算出する。ただし、辞書には、一つ
の文字コードに対して異なる値を有する特徴ベクトルが
複数あってもかまわないが、一つの特徴ベクトルにつ
き、一つの文字コードが与えられなければならない。
【0040】なお、手書文字認識辞書部71と活字文字
認識辞書部72とが有する特徴ベクトルについては、上
記以外の方法を用いて作成して良い。例えば、複数の文
字パタン画像を重ね合わせた後に、特徴抽出部4で用い
た方法によって特徴ベクトルを作成したり、また、一つ
の文字コードに対して一つの画像パタンのみを作成し、
その特徴べクトルをそのまま上記辞書の特徴ベクトルと
しても良い。
【0041】照合辞書情報判定部6は、文字切出部3か
ら出力された文字領域情報と領域内文字数集計テーブル
と、特徴抽出部4から出力された特徴ベクトルとそれに
対応する文字画像識別子と、領域属性格納部5から出力
された領域属性情報と、後述する判定結果格納部9から
出力された判定結果情報とから、後述する距離計算部7
において、上記特徴ベクトルとの類似度を比較するため
に必要となる認識辞書を指定し、これを辞書指定信号と
して上記特徴ベクトルとそれに対応する文字画像識別子
とともに、距離計算部7へ出力し、一方、距離計算部7
から出力された照合辞書情報と距離計算結果とを入力
し、当該文字領域の文字属性を判定し、これを判定結果
情報として、判定結果格納部9へ出力し、判定結果情報
と距離計算結果と各照合辞書情報とを結果修正部8へ出
力するものである。
【0042】具体的には、照合辞書情報判定部6は、入
力された文字画像識別子と文字領域情報とから、当該文
字画像識別子が付与された入力文字が属する文字領域を
検索し、領域属性格納部5に格納されている領域属性情
報から、当該文字領域の文字属性を得る。
【0043】その結果、当該文字領域の文字属性が明確
な場合、照合辞書情報判定部6は、上記文字属性に対応
する認識辞書を指定し、これを辞書指定信号として、入
力された特徴ベクトルとそれに対応する文字画像識別子
とともに後述する距離計算部7へ出力する。
【0044】また、当該文字領域が、手書き文字と活字
文字の両方の文字によって記載される可能性のある領域
の場合、照合辞書情報判定部6は、判定結果格納部9か
ら判定結果情報を取り込む。そして、判定結果情報を参
照することによって、認識辞書を指定できるとき、照合
辞書情報判定部6は、判定結果情報が示す認識辞書を指
定し、これを辞書指定信号として、入力された特徴ベク
トルと文字画像識別子とともに距離計算部7へ出力す
る。また、判定結果情報を参照しても、認識辞書を指定
できないとき、照合辞書情報判定部6は、手書文字認識
辞書部71と活字文字認識辞書部72との両方の認識辞
書を指定し、これを辞書指定信号として、入力された特
徴ベクトルと文字画像識別子とともに距離計算部7へ出
力する。
【0045】一方、照合辞書情報判定部6は、照合辞書
情報と距離計算結果とが距離計算部7から入力されるた
びに、照合辞書情報中の文字画像識別子を検索し、当該
文字画像識別子と文字領域情報とから、文字画像識別子
に対応する文字が属していた文字領域を検出する。そし
て、当該文字領域に属する各文字についての照合辞書情
報と距離計算結果とが距離計算部7から入力された回数
と、領域内文字数集計テーブルから得られた当該文字領
域の文字数とが一致したとき、当該文字領域の全ての文
字についての照合辞書情報と距離計算結果とが得られた
として、次の処理を行なう。
【0046】まず、照合辞書情報判定部6は、さきに、
特徴ベクトルとともに出力した辞書指定信号が手書文字
認識辞書部71又は活字文字認識辞書部72のいずれか
を指定していたときは、当該文字領域の距離計算結果を
認識結果としてそのまま出力する。
【0047】次に、照合辞書情報判定部6は、特徴ベク
トルとともに出力した辞書指定信号が手書文字認識辞書
部71と活字文字認識辞書部72とを指定していたとき
は、当該文字領域の各照合辞書情報において、最も類似
度の高い文字コードを出力した認識辞書名を各照合辞書
情報の代表辞書名とする。そして、それぞれの照合辞書
情報を比較し、当該文字領域の文字属性(全ての文字が
手書き文字又は活字文字のいずれで書かれたものか)
を、最も多くの数を占める代表辞書によって判定し、こ
れを判定結果情報として判定結果格納部9へ出力し、判
定結果情報と当該文字領域の距離計算結果と各照合辞書
情報とを結果修正部8へ出力する。ただし、同数の代表
辞書が複数ある場合、当該文字領域の文字は、手書き文
字と活字文字との両方の文字で書かれたものと判定し、
当該文字領域の距離計算結果を認識結果としてそのまま
出力する。
【0048】先に示した図2を用いて照合辞書情報判定
部6の機能をより具体的に説明する。図2の文字領域1
の文字「凸」に対応する特徴パラメータが入力される
と、照合辞書情報判定部6は、文字「凸」に対応する文
字画像識別子と文字領域情報とにより文字「凸」は、文
字領域1に含まれる文字と判定する。その後、領域属性
情報から当該文字領域1の文字属性は「活字」であるこ
とを得る。そして、活字文字認識辞書部72を指定する
辞書選択信号を出力する。
【0049】また、文字領域4の文字「オ」に対応する
特徴パラメータが入力されると、照合辞書情報判定部6
は、文字「オ」に対応する文字画像識別子と文字領域情
報とにより文字「オ」が、文字領域4に含まれる文字と
判定する。そして、領域属性情報から当該文字領域4の
文字属性は「活字又は手書き」であることを得、その
後、判定結果格納部9から判定結果情報を取り込む。し
かし、図2に示された帳票において、「活字又は手書
き」で認識される文字領域は文字領域4以前にはないの
で、判定結果情報を参照しても、認識辞書を指定するこ
とができない。そこで、照合辞書情報判定部6は、手書
文字認識辞書部71と活字文字認識辞書部72とを指定
する辞書選択信号を出力する。
【0050】図7(2)は、図2の文字領域4の文字
「オキタロウ」について、距離計算部7によって得られ
た照合辞書情報の例を示したものである。
【0051】文字画像識別子「文字1」〜「文字5」に
対応する各特徴ベクトルは、手書文字認識辞書部71
(これは、図7(2)では、「辞書1」に対応する)の
特徴ベクトルとの類似度と、活字文字認識辞書部72
(これは、図7(2)では、「辞書2」に対応する)の
特徴ベクトルとの類似度とが計算され、各識別子につい
て、その識別子に対応する特徴ベクトルと最も良く類似
する特徴ベクトルを有する文字コードを出力した認識辞
書名が記されている。図7(2)において、代表辞書名
の数は、「辞書1」が4つ、「辞書2」が1つであり、
照合辞書情報判定部6によって、領域4の全て文字は、
辞書1(すなわち、手書文字認識辞書部71)のみによ
って認識可能であり、領域4に記載された文字は全て手
書き文字と判定される。
【0052】なお、前述したように、この判定結果は判
定結果情報として判定結果格納部9へ出力され、判定結
果情報と当該文字領域の距離計算結果と照合辞書情報と
は、結果修正部8へ出力される。従って、図2に示した
文字領域5の文字認識にあたっては、照合辞書情報判定
部6は、上記判定結果情報により、手書文字認識辞書部
71を指定する辞書選択信号を出力する。
【0053】判定結果格納部9は、照合辞書情報判定部
6で判定された文字属性の判定結果を判定結果情報とし
て格納するものである。なお、判定結果情報は、異なる
フォーマット情報を有する帳票等が読み込まれるごとに
リセットされる。
【0054】距離計算部7は、特徴ベクトルと、文字画
像識別子と、辞書指定信号とを入力し、辞書指定信号で
指定された認識辞書を用いて、当該認識辞書内の特徴ベ
クトルと当該特徴ベクトルとの類似度を計算するもので
ある。
【0055】具体的には、距離計算部7は、文字画像の
特徴ベクトルと文字画像識別子と、当該特徴ベクトルと
の類似度の比較の対象である認識辞書を指定した辞書指
定信号とを入力とする。そして、辞書指定信号で指定さ
れた認識辞書を用いて、当該認識辞書内の特徴ベクトル
と当該特徴ベクトルとの類似度を計算する。
【0056】そして、当該特徴ベクトルと類似する認識
辞書内の特徴ベクトルの文字コードを1つ又は複数個選
択し、これら文字コードを類似度の高い順から並べ、こ
れら文字コードに照合辞書情報判定部6より入力された
文字画像識別子を付して、これを距離計算結果として出
力する。一方、上記各文字コードを有する認識辞書名を
照合辞書情報判定部6より入力された文字画像識別子と
ともに、照合辞書情報として出力する。上記距離計算結
果と照合辞書情報とは、照合辞書情報判定部6に出力さ
れる。
【0057】なお、類似度の計算を行なうにあたって、
特徴ベクトルの幾つかを論理演算に使い、幾つかを距離
計算に使うなどの方法を用いて良い。また、距離計算を
行なうにあたって、ユークリッド距離や、いわゆる市街
区距離(シティブロック距離)などを用いて良い。
【0058】結果修正部8は、判定結果情報と距離計算
結果と照合辞書情報とを入力とし、文字領域の各照合辞
書情報内での辞書名の順位と、当該文字領域の各距離計
算結果内での文字コードの順位とを、判定結果情報に従
って入れ替えるものである。
【0059】すなわち、結果修正部8は、文字領域の全
ての文字について、上記判定結果情報の示す認識辞書名
が上位に位置するように、各文字に対応した照合辞書情
報内の認識辞書名を入れ替える。そして、この認識辞書
名の入れ替えに対応して、上記判定結果情報が示す認識
辞書名に含まれる文字コードが上位に位置するように、
各文字に対応した距離計算結果内の文字コードの入れ替
えをも行なう。上記入れ替え終了後、距離計算結果が、
認識結果として出力される。なお、上記入れ替えの際、
同一の認識辞書に含まれる文字コード相互の順位関係は
保存しておく。従って、同一認識辞書に含まれる文字コ
ードについて着目すると、文字コード相互の順位関係は
変化していないことになる。
【0060】図8(1)は、文字画像識別子「文字2」
(すなわち、「オキタロウ」の「キ」)に対応する特徴
ベクトルと認識辞書(手書文字認識辞書部71と活字文
字認識辞書部72)との類似度の計算結果である照合辞
書情報を、図8(2)は、文字画像識別子「文字2」に
対応する特徴ベクトルと認識辞書との類似度の計算結果
である距離計算結果を、そして図8(3)は、結果修正
部8によって得られた認識結果を示したものである。
【0061】図8(2)に示すように計算結果の文字コ
ードは先頭から「2331」と、「2332」と、「2
333」と、「2334」となっている。図8(1)と
図8(2)とから、「2331」は活字文字認識辞書部
72から、「2332」は手書文字認識辞書部71か
ら、「2333」は活字文字認識辞書部72から、「2
334」は手書文字認識辞書部71からそれぞれ検索さ
れたものであることがわかる。照合辞書情報判定部6に
よって、図2の文字領域4の「オキタロウ」は手書き文
字と判断されていたので、結果修正部8によって、手書
文字認識辞書部71から検索された「2332」と「2
334」とは活字文字認識辞書部72から検索された
「2331」と「2334」とより上位に順位が変更さ
れて、図8(3)に示された認識結果が得られる。
【0062】(A−2)第1の実施形態の動作 以上の構成を有するこの実施形態の文字認識装置の動作
を以下説明する。
【0063】文字の書かれた帳票や文書などの認識対象
は、スキャナ部1によって光学的に読みとられ、白黒2
値の画像データとなる。
【0064】スキャナ部1で読み取られた画像データ
は、画像記憶部2によって保存され、文字切出部3へ出
力される。
【0065】文字切出部3では、フォーマット情報に従
って、入力された帳票等の画像データから文字領域検出
され、文字領域から文字列が、文字列から個々の文字が
それぞれ検出される。さらに、文字切出部3は、文字列
から文字を検出するとき、検出された各文字は、それぞ
れユニークな値である文字画像識別子が付与される。そ
して、文字切出部3は、帳票等の1画像データから個々
の文字が検出される際、当該文字が属する文字列と当該
文字列が属する文字領域とを特定するための情報と、当
該文字に対応する文字画像識別子とを文字領域情報とし
て、各文字領域における文字の数を領域内文字数集計テ
ーブルとして、画像データにおける、上記各文字画像の
大きさと位置を位置大きさ情報として出力する。
【0066】特徴抽出部4へ入力された文字画像識別子
は、画像記憶部2へ出力され、当該文字画像識別子に対
応する文字画像が入力される。そして、特徴抽出部4に
よって、当該文字画像の特徴ベクトルが算出され、当該
特徴ベクトルと当該文字画像識別子とが照合辞書情報判
定部6へ出力される。
【0067】照合辞書情報判定部6では、文字画像識別
子が付与された文字が属する文字領域の領域属性を得
る。その結果、当該文字領域の領域属性が明確な場合、
照合辞書情報判定部6は、文字属性に対応した認識辞書
を指定し、辞書指定信号として、入力された特徴ベクト
ルとそれに対応する文字画像識別子とともに後述する距
離計算部7へ出力する。
【0068】一方、当該文字領域が、手書き活字の両方
の文字で記載される可能性がある領域の場合、照合辞書
情報判定部6は、判定結果格納部9から判定結果情報を
取り込む。そして、判定結果情報を参照することによ
り、認識辞書を指定できるとき、照合辞書情報判定部6
は、判定結果情報が指定する認識辞書を指定し、辞書指
定信号として、入力された特徴ベクトルとそれに対応す
る文字画像識別子とともに距離計算部7へ出力する。ま
た、判定結果情報を参照しても、認識辞書を指定できな
いとき、照合辞書情報判定部6は、手書文字認識辞書部
71と活字文字認識辞書部72との両方を指定し、辞書
指定信号として、入力された特徴ベクトルとそれに対応
する文字画像識別子とともに距離計算部7へ出力する。
【0069】距離計算部7は、辞書指定信号で指定され
た認識辞書を用いて、当該認識辞書内の特徴ベクトルと
当該特徴ベクトルとの類似度を計算し、距離計算結果と
照合辞書情報とを照合辞書情報判定部6に出力する。
【0070】照合辞書情報判定部6は、文字領域の全て
の文字についての照合辞書情報と距離計算結果とが入力
されたとき、当該文字領域についての処理を以下のとお
り行なう。
【0071】まず、当該文字領域の辞書指定信号が、手
書文字認識辞書部71又は活字文字認識辞書部72のい
ずれかを指定していたときは、当該文字領域の距離計算
結果をそのまま認識結果として出力する。
【0072】次に、当該文字領域の辞書指定信号が、手
書文字認識辞書部71と活字文字認識辞書部72とを指
定していたときは、当該文字領域の照合辞書情報を比較
し、当該領域の文字属性を、代表辞書の数によって判定
し、これを判定結果情報として判定結果格納部9へ出力
し、判定結果情報と当該文字領域の距離計算結果と各照
合辞書情報とを結果修正部8へ出力する。ただし、同数
の代表辞書が複数あった場合、当該文字領域の文字は、
手書文字と活字文字との両方で書かれたものと判定し、
距離計算結果を認識結果として出力する。
【0073】結果修正部8では、入力された判定結果情
報から、当該文字領域の全ての文字が、手書文字と活字
文字とのいずれかで書かれたものである場合、上記判定
結果情報の示す認識辞書名が上位に位置するように、各
文字に対応した照合辞書情報内の認識辞書名が入れ替え
られる。この入れ替えに伴って、上記判定結果情報の示
す認識辞書名を有する文字コードが上位に位置するよう
に、各文字に対応した距離計算結果内の文字コードも入
れ替えられる。その後、距離計算結果は、認識結果とし
て出力される。
【0074】(A−3)第1の実施形態の効果 この実施形態の文字認識装置によれば、領域属性格納部
と照合辞書情報判定部とを有し、帳票等の文字領域にお
いて、記載される文字の文字属性が予めわかっていると
きは、その文字属性に対応する認識辞書を指定し、記載
される文字の文字属性が不明なときは、全ての認識辞書
を指定し、その後、当該文字領域の文字属性を決定し、
その決定結果である判定結果情報は、その後の他の文字
領域の文字属性の判断に利用されるので、類似度の計算
で要する時間を短縮させることができ、その結果、認識
速度の大幅な向上が図られると同時に認識率が向上す
る。
【0075】(B)第2の実施形態 以下、この発明による文字認識装置の第2の実施形態に
ついて図面を参照しながら詳述する。この第2の実施形
態の文字認識装置は、第1の実施形態の文字認識装置と
異なり、帳票等に記載される文字の文字属性が予めわか
らないものを認識の対象とする。
【0076】(B−1)第2の実施形態の構成 図10は、この実施形態の文字認識装置の機能的構成図
である。図10において、この第2の実施形態の文字認
識装置は、スキャナ部1と、画像記憶部2と、文字切出
部3と、特徴抽出部4と、照合辞書情報判定部61と、
距離計算部7と、手書文字認識辞書部71と、活字文字
認識辞書部72と、結果修正部8と、判定結果格納部9
とで構成されている。なお、この第2の実施形態を構成
する上記各部において、スキャナ部1〜特徴抽出部4
と、距離計算部7〜判定結果格納部9と、手書文字認識
辞書部71と、活字文字認識辞書部72とについては、
第1の実施形態において説明したのと同様の機能を有す
るので、ここでは、照合辞書情報判定部61の機能のみ
を説明する。
【0077】照合辞書情報判定部61は、判定結果格納
部9から出力された判定結果情報とから、距離計算部7
において特徴抽出部4から出力された特徴ベクトルとの
類似度を比較するために必要となる認識辞書を指定し、
これを辞書指定信号として上記特徴ベクトルとそれに対
応する文字画像識別子とともに、距離計算部7へ出力
し、一方、距離計算部7から出力された照合辞書情報と
距離計算結果とを入力し、当該文字領域の文字属性を判
定し、これを判定結果情報として、判定結果格納部9へ
出力し、一方、判定結果情報と距離計算結果と各照合辞
書情報とを結果修正部8へ出力するものである。
【0078】具体的には、照合辞書情報判定部61は、
判定結果格納部9から判定結果情報を取り込む。そし
て、判定結果情報を参照することによって、認識辞書を
指定できるとき、照合辞書情報判定部61は、判定結果
情報が示す認識辞書を指定し、これを辞書指定信号とし
て、入力された特徴ベクトルと文字画像識別子とともに
距離計算部7へ出力する。一方、判定結果情報を参照し
ても、認識辞書を指定できないとき、照合辞書情報判定
部61は、手書文字認識辞書部71と活字文字認識辞書
部72との両方の認識辞書を指定し、これを辞書指定信
号として、入力された特徴ベクトルと文字画像識別子と
ともに距離計算部7へ出力する。
【0079】一方、照合辞書情報判定部6は、照合辞書
情報と距離計算結果とが距離計算部7から入力されるた
びに、照合辞書情報中の文字画像識別子を検索し、当該
文字画像識別子と文字領域情報とから、文字画像識別子
に対応する文字が属していた文字列を検出する。そし
て、当該文字列に属する各文字についての照合辞書情報
と距離計算結果とが距離計算部7から入力された回数
と、領域内文字数集計テーブルから得られた当該文字列
の文字数とが一致したとき、当該文字列の全ての文字に
ついての照合辞書情報と距離計算結果とが得られたとし
て、次の処理を行なう。
【0080】まず、照合辞書情報判定部61は、さき
に、特徴ベクトルとともに出力した辞書指定信号が手書
文字認識辞書部71又は活字文字認識辞書部72のいず
れかを指定していたときは、当該文字列の距離計算結果
を認識結果としてそのまま出力する。
【0081】次に、照合辞書情報判定部61は、特徴ベ
クトルとともに出力した辞書指定信号が手書文字認識辞
書部71と活字文字認識辞書部72とを指定していたと
きは、当該文字列の各照合辞書情報において、最も類似
度の高い文字コードを出力した認識辞書名を各照合辞書
情報の代表辞書名とする。そして、それぞれの照合辞書
情報を比較し、当該文字列の文字属性を、最も多くの数
を占める代表辞書によって判定し、これを判定結果情報
として判定結果格納部9へ出力し、一方、判定結果情報
と当該文字列の距離計算結果と各照合辞書情報とを結果
修正部8へ出力する。ただし、同数の代表辞書が複数あ
った場合、当該文字列の文字は、手書き文字と活字文字
との両方の文字で書かれたものと判定し、当該文字列の
距離計算結果を認識結果としてそのまま出力する。
【0082】照合辞書情報判定部61の機能を例を用い
て説明する。図11(1)は、活字文字の記入欄の一例
であり、図11(2)は、手書き文字の記入欄の一例で
あり、各欄とも数字とアルファベットの組が商品番号
を、漢字とひらがなの組が商品名を表わす。
【0083】照合辞書情報判定部61は、まず、商品番
号部分の文字列の認識を行なう際に、当該文字列の文字
属性を判定し、判定結果を判定結果情報として判定結果
格納部9に格納する。具体的には、活字文字で記入され
た図11(1)の「YZ−30401」の部分まで一文
字づつの認識を行う。次に、商品名の文字列を認識する
とき、判定結果格納部に格納されている判定結果に基づ
いて、認識辞書を指定して文字認識を行なう。すなわ
ち、手書き文字と判定されていれば、手書文字認識辞書
部71を指定し、活字文字と判定されていれば、活字文
字認識辞書部72を指定する。また、手書き文字と活字
文字との両方と判定されていれば、手書文字認識辞書部
71と活字文字認識辞書部72とを指定する。すなわ
ち、図11(1)の「YZ−30401」の部分の判定
結果が活字文字であると判定されたことで、「自動鉛筆
削り機」の部分は、活字文字認識辞書部72で認識され
る。同様に図11(2)の文字列に対しても、商品番号
部分の文字列「AX−3302」の判定結果(手書き文
字と判定)に基づいて商品名「消しゴムセット」を手書
文字認識辞書部71を用いて認識する。
【0084】(B−2)第2の実施形態の動作 以上の構成を有するこの第2の実施形態の文字認識装置
の動作を以下説明する。なお、前述したとおり、スキャ
ナ部1〜特徴抽出部4と、距離計算部7〜判定結果格納
部9と、手書文字認識辞書部71と活字文字認識辞書部
72とについては、第1の実施形態において説明したの
と同様の動作を行なうので、ここでは、照合辞書情報判
定部61の動作のみを説明する。
【0085】照合辞書情報判定部61では、判定結果格
納部9から判定結果情報を取り込む。そして、判定結果
情報を参照することによって、認識辞書を指定できると
き、照合辞書情報判定部61は、判定結果情報が示す認
識辞書を指定し、辞書指定信号として、入力された特徴
ベクトルとそれに対応する文字画像識別子とともに距離
計算部7へ出力する。また、判定結果情報を参照して
も、認識辞書を指定できないとき、照合辞書情報判定部
6は、手書文字認識辞書部71と活字文字認識辞書部7
2との両方を指定し、辞書指定信号として、入力された
特徴ベクトルとそれに対応する文字画像識別子とともに
距離計算部7へ出力する。
【0086】照合辞書情報判定部61は、文字列の全て
の文字についての照合辞書情報と距離計算結果とが入力
されたとき、当該文字列についての処理を以下のとおり
行なう。
【0087】まず、当該文字領域の辞書指定信号が、手
書文字認識辞書部71又は活字文字認識辞書部72のい
ずれかを指定していたときは、当該文字列の距離計算結
果をそのまま認識結果として出力する。
【0088】次に、当該文字列の辞書指定信号が、手書
文字認識辞書部71と活字文字認識辞書部72とを指定
していたときは、当該文字列の照合辞書情報を比較し、
当該文字列の全ての文字が手書文字又は活字文字のいず
れで書かれたものかを、代表辞書の数によって判定し、
これを判定結果情報として判定結果格納部9へ出力し、
判定結果情報と当該文字列の距離計算結果と各照合辞書
情報とを結果修正部8へ出力する。ただし、同数の代表
辞書が複数あった場合、当該文字列の文字は、手書文字
と活字文字との両方で書かれたものと判定し、距離計算
結果を認識結果として出力する。
【0089】(B−3)第2の実施形態の効果 この実施形態の文字認識装置によれば、照合辞書情報判
定部において、判定結果格納部に格納されている判定結
果情報とに基づいて、特徴パラメータとの類似度を距離
計算部で計算するのに必要となる認識辞書を指定する機
能を有するので、距離計算部において、類似度の計算で
要する時間を短縮させることができ、その結果、認識速
度の向上が図られる。
【0090】(C)その他の実施形態 なお、第1と第2の実施形態では、手書き文字と活字文
字とを認識する文字認識装置に、この発明を適用したも
のを示したが、この発明は上記手書き文字と活字文字と
を認識する文字認識装置のみに適用されるものではな
い。すなわち、この発明は、活字文字と手書き文字と、
数字とアルファベットと、右上がりの癖のある手書き文
字と左上がりの癖のある手書き文字と、明朝体の文字と
ゴシック体の文字などのように、異なった観点によって
分類された文字(文字書体)を認識する文字認識装置に
適用されるものである。
【0091】従って、第1と第2の実施形態では、手書
文字認識辞書と活字文字認識辞書とを具備することとし
たが、例えば、明朝体文字認識辞書とゴシック体文字認
識辞書とを具備する構成としても、もちろん良い。
【0092】また、第1と第2の実施形態では、2つの
認識辞書を有する構成としたが、3つ以上の認識辞書に
よって構成し、認識辞書数に対応する数の文字書体が混
在する可能性のある文字で記載された帳票等の文字認識
装置に、この発明を適用しても良い。
【0093】さらに、第1のと第2の実施形態では、1
つの文字領域が1行のみならなる帳票例を示し、機能や
動作の説明を行った。しかし、この発明の認識対象とな
る文書は、その文書の1つの文字領域が複数の行で形成
されていても良い。
【0094】さらにまた、第1のと第2の実施形態で
は、帳票に記載された文字を認識の対象として説明した
が、帳票以外の他の文書に記載された文字の認識に、こ
の発明を適用できることはもちろんである。
【0095】
【発明の効果】以上のように、第1の発明によれば、入
力された文字の特徴量情報を、2以上の文字認識辞書手
段に格納されている基準特徴量情報と照合して、使用す
べき文字認識辞書が決定されるので、文字認識辞書に格
納されている基準特徴量情報と入力された文字の特徴量
情報との照合において必要となる時間が削減でき、その
結果、文字認識速度の向上が図られる。
【0096】また、第2の発明によれば、入力された文
字列が存在する画像の領域ごとに、その領域内に存在す
る文字の照合に使用する文字認識辞書を指定する情報か
ら、入力された文字について、使用すべき文字認識辞書
が指定されるので、文字認識辞書に格納されている基準
特徴量情報と入力された文字の特徴量情報との照合にお
いて必要となる時間が大幅に削減でき、その結果、さら
に大幅な文字認識速度の向上が図られる。
【図面の簡単な説明】
【図1】第1の実施形態の機能的ブロック図である。
【図2】認識対象の例である。
【図3】フォーマット情報の例である。
【図4】各文字領域と領域画像と認識させた例である。
【図5】文字列画像抽出の例である。
【図6】文字抽出の例である。
【図7】文字領域情報例と、照合辞書情報の例である。
【図8】照合辞書情報と、対応する距離計算結果と、対
応する認識結果との例である。
【図9】領域属性情報の例である。
【図10】第2の実施形態の機能的ブロック図である。
【図11】認識対象の例である。
【符号の説明】
5…領域属性格納部、6,61…照合辞書情報判定部、
7…距離計算部、8…結果修正部、71…手書文字認識
辞書部、72…活字文字認識辞書部。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 入力された文字列から個々の文字の特徴
    量情報を算出し、予め格納されている基準特徴量情報と
    照合することにより、入力された文字の文字種類を決定
    する文字認識装置において、 複数の文字コードのそれぞれに対応する基準特徴量情報
    と、文字コードとを格納しており、複数の文字書体のそ
    れぞれに対応する複数の文字認識辞書手段と、 文字書体が不定な入力された文字の特徴量情報を、2以
    上の文字認識辞書手段に格納されている基準特徴量情報
    と照合して、使用すべき文字認識辞書を決定する使用辞
    書決定手段と、 決定された文字認識辞書に格納されている基準特徴量情
    報と、入力された文字の特徴量情報との照合結果に基づ
    いて、入力された文字種類を決定する文字認識手段とを
    有することを特徴とする文字認識装置。
  2. 【請求項2】 上記使用辞書決定手段は、入力された複
    数の文字のそれぞれに対応する照合結果において、第1
    候補として順位付けられた文字種類の照合結果を導出さ
    せた基準特徴量情報を最も多く格納している文字認識辞
    書を、使用すべき文字認識辞書と決定することを特徴と
    する請求項1に記載の文字認識装置。
  3. 【請求項3】 上記使用辞書決定手段は、入力された文
    字列の一部の文字列についての照合結果によって、入力
    された他の文字列について使用すべき文字認識辞書を決
    定することを特徴とする請求項1又は2に記載の文字認
    識装置。
  4. 【請求項4】 上記使用辞書決定手段は、入力された複
    数の文字のそれぞれに対応する照合結果から使用すべき
    文字認識辞書を一義的に確定できない場合に、全ての文
    字認識辞書を、使用すべき認識辞書とすることを特徴と
    する請求項1〜3のいずれかに記載の文字認識装置。
  5. 【請求項5】 上記文字認識手段は、上記使用辞書決定
    手段が文字認識辞書の決定のために用いた一部の文字列
    については、上記使用辞書決定手段が使用すべき文字認
    識辞書を決定するために照合を行った際に、決定された
    文字認識辞書を用いて得た照合結果中、候補順位に従っ
    て文字種類を決定することを特徴とする請求項3又は4
    のいずれかに記載の文字認識装置。
  6. 【請求項6】 入力された文字列から個々の文字の特徴
    量情報を算出し、予め格納されている基準特徴量情報と
    照合することにより、入力された文字の文字種類を決定
    する文字認識装置において、 複数の文字コードのそれぞれに対応する基準特徴量情報
    と、文字コードとを格納しており、複数の文字書体のそ
    れぞれに対応する複数の文字認識辞書手段と、 入力された文字列が存在する画像の領域ごとに、その領
    域内に存在する文字の照合に使用する文字認識辞書を指
    定する情報を格納している領域別使用辞書情報格納手段
    と、 入力された文字が存在する領域について、領域別使用辞
    書情報格納手段が示す文字認識辞書を、使用すべき文字
    認識辞書として指定する使用辞書指定手段と、 指定された文字認識辞書に格納されている基準特徴量情
    報と、入力された当該領域の文字の特徴量情報との照合
    結果に基づいて、その文字の文字種類を決定する文字認
    識手段とを有することを特徴とする文字認識装置。
  7. 【請求項7】 上記領域別使用辞書情報格納手段は、領
    域内に存在する文字の照合に使用する文字認識辞書とし
    て、2以上の文字認識辞書の指定情報も許容しているこ
    とを特徴とする請求項6に記載の文字認識装置。
  8. 【請求項8】 上記使用辞書指定手段は、2以上の文字
    認識辞書が指定された領域の文字列に対しては、文字の
    特徴量情報を、2以上の文字認識辞書手段に格納されて
    いる基準特徴量情報と照合して、使用すべき文字認識辞
    書を決定することを特徴とする請求項7に記載の文字認
    識装置。
  9. 【請求項9】 上記複数の文字認識辞書手段が、手書き
    文字の認識のための文字認識辞書手段と、活字文字の認
    識のための活字文字認識辞書手段とであることを特徴と
    する請求項1〜8のいずれかに記載の文字認識装置。
JP8324177A 1996-12-04 1996-12-04 文字認識装置 Pending JPH10162103A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8324177A JPH10162103A (ja) 1996-12-04 1996-12-04 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8324177A JPH10162103A (ja) 1996-12-04 1996-12-04 文字認識装置

Publications (1)

Publication Number Publication Date
JPH10162103A true JPH10162103A (ja) 1998-06-19

Family

ID=18162953

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8324177A Pending JPH10162103A (ja) 1996-12-04 1996-12-04 文字認識装置

Country Status (1)

Country Link
JP (1) JPH10162103A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character
JP2009015876A (ja) * 2008-10-23 2009-01-22 Fujitsu Ltd 文字認識方法
CN111368902A (zh) * 2020-02-28 2020-07-03 北京三快在线科技有限公司 一种数据标注的方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6643401B1 (en) 1998-12-16 2003-11-04 Fujitsu Limited Apparatus and method for recognizing character
JP2009015876A (ja) * 2008-10-23 2009-01-22 Fujitsu Ltd 文字認識方法
CN111368902A (zh) * 2020-02-28 2020-07-03 北京三快在线科技有限公司 一种数据标注的方法及装置

Similar Documents

Publication Publication Date Title
US5583949A (en) Apparatus and method for use in image processing
Spitz Determination of the script and language content of document images
US6341176B1 (en) Method and apparatus for character recognition
KR100658119B1 (ko) 문자 인식 장치 및 방법
KR100324847B1 (ko) 수신인명 리드장치와 우편물등 구분기 및 문자열 인식방법
JP2973944B2 (ja) 文書処理装置および文書処理方法
US5119437A (en) Tabular document reader service
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US6549662B1 (en) Method of recognizing characters
JP2000315247A (ja) 文字認識装置
US5119441A (en) Optical character recognition apparatus and method using masks operation
JPH10162103A (ja) 文字認識装置
JP3142986B2 (ja) 文書情報検索装置
Koga et al. Segmentation of Japanese handwritten characters using peripheral feature analysis
JPH10134141A (ja) 文書照合装置および方法
JP3457376B2 (ja) 光学式読み取り装置における文字修正方法
Leishman Shape-free statistical information in optical character recognition
JP2529421B2 (ja) 文字認識装置
JP2000207491A (ja) 文字列読取方法及び装置
JP2851102B2 (ja) 文字切出し方法
JP3595081B2 (ja) 文字認識方法
JPH03150690A (ja) 文字認識装置
JPH06223221A (ja) 文字認識装置
JP2578768B2 (ja) 画像処理方法
JP2578767B2 (ja) 画像処理方法