JP2751865B2 - 文字列認識装置 - Google Patents

文字列認識装置

Info

Publication number
JP2751865B2
JP2751865B2 JP7090584A JP9058495A JP2751865B2 JP 2751865 B2 JP2751865 B2 JP 2751865B2 JP 7090584 A JP7090584 A JP 7090584A JP 9058495 A JP9058495 A JP 9058495A JP 2751865 B2 JP2751865 B2 JP 2751865B2
Authority
JP
Japan
Prior art keywords
character
unit
image
pattern
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP7090584A
Other languages
English (en)
Other versions
JPH08287188A (ja
Inventor
俊史 山内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP7090584A priority Critical patent/JP2751865B2/ja
Publication of JPH08287188A publication Critical patent/JPH08287188A/ja
Application granted granted Critical
Publication of JP2751865B2 publication Critical patent/JP2751865B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】帳票や郵便物に書かれた文字列を
自動認識する方法に関し、特に文字枠等の記入上の制限
がない帳票に書かれた文字列や郵便物に書かれた住所・
氏名等のような、自由書式(不定ピッチ)で筆記された
文字列を自動認識する方法に関する。
【0002】
【従来の技術】文字枠等の記入上の制限のある帳票を読
み取り対象とする文字列認識装置においては、隣接した
文字が接触する場合は少なく、文字の切り出しは比較的
容易である。これに対して、文字枠等の記入上の制限の
ない帳票や郵便物に書かれた住所・氏名等を認識する自
由書式の文字列認識装置においては、隣接した文字の接
触や文字同士の入り組み等により、1文字の領域を正し
く推定することは難しく、文字切り出しが困難な場合が
多く発生する。したがって自由書式を対象とした文字列
認識装置においては、これらの文字の接触や入り組みに
よる文字切り出しの困難性に対応させる必要がある。
【0003】従来の自由書式の文字列認識方法として
は、以下の2つの方法がある。
【0004】第1の方法は、文字列の切り出しの組み合
わせを複数通り求め、知識情報との整合によって適当な
切り出しの組み合わせを選択する方法である。この方法
は、「言語情報を利用した手書き文字列からの文字切り
出しと認識」(村瀬他、電子通信学会論文誌、86/
9,Vol.J69−D,No.9,pp1292−1
301、1986年9月)、および「文字連接情報を利
用した手書き文字列認識」(小林他、電子情報通信学会
技術報告、PRU−91−67,pp39−46、19
91年10月)に記載されている。
【0005】具体的には、文字列を過分割に切り出した
基本ブロックを求め、基本ブロックの組み合わせとし
て、複数通りの文字切り出しの組み合わせを得る。次に
各々の文字切り出しの組み合わせに対応する統合ブロッ
ク(基本ブロックの組み合わせ)について個別文字認識
を行う。最後に知識処理部において、各統合ブロックに
対応する個別文字認識の出力である認識候補文字と、読
み取り対象の文字に関する知識情報とを整合し、最も整
合性の高い候補を読み取り結果とする。
【0006】第2の方法は、文字列から文字を切り出す
処理はひと通りの候補のみについてしか行わないが、文
字の接触または文字同士の入り組みの可能性のある文字
列については、あらかじめ接触または入り組んだ文字パ
タンの特徴データを認識辞書として登録しておき、2文
字以上の単語単位でまとめ読みを行う方法である。
【0007】
【発明が解決しようとする課題】第1の方法において
は、文字列を過分割に切り出した基本ブロックを求める
段階において、必ずしも正しい切り出し結果が含まれな
い場合がある。
【0008】例えば、「大塚」という文字列の「大」と
「塚」とが接触している場合には、文字を認識して初め
て文字列が2文字から成っていると判断することがで
き、2文字として切り出すことが可能となる。しかし、
第1の方法においては文字を認識する前に文字列から基
本ブロックを求めているので、文字列が接触している場
合には強制切り出し点を求めるのが困難である。したが
って、必ずしも「大」と「塚」を切り出した組み合わせ
を基本ブロックとして抽出することはできない。この場
合には、正しい切り出し結果が含まれないことになる。
【0009】このように、第1の方法においては基本ブ
ロック数を増加させることによって正しい切り出し結果
を含む確率を高めることはできるが、正しい切り出し結
果を含む確率を完全に1とすることは困難である。また
基本ブロック数を増加させた場合には、基本ブロックの
組み合わせである統合ブロックの数は指数関数的に増大
する。このため、全ての統合ブロックについて個別文字
認識を行い、さらに各統合ブロックの組み合わせについ
て知識処理を行うことは、処理量がきわめて大きくなっ
てしまうという問題点がある。
【0010】また、第2の方法においては、全ての接触
する文字の組み合わせを登録することは現実的ではな
い。特に、3文字以上が接触する場合には、文字の組み
合わせ数が膨大になり、登録数が膨大になるという問題
点がある。
【0011】このような点に鑑み本発明は、文字の接触
や文字同士の入り組みがある自由書式で筆記されている
文字列を、高速かつ高精度に自動認識することが可能な
文字列認識装置を提供することを目的とする。
【0012】
【課題を解決するための手段】本発明の文字列認識装置
は、自由書式で筆記されている読み取り対象の文字列の
画像を入力する画像入力部と、入力された前記画像の中
から文字列領域を抽出し、文字列が縦書きであるか横書
きであるかの方向を示す書式情報を判定する書式判定部
と、前記書式判定部によって抽出された前記文字列領域
の画像から所定の文字数単位で文字パタンを切り出す文
字切り出し部と、前記文字切り出し部によって切り出さ
れた前記文字パタンの各々に文字サイズに応じた正規化
処理を行う正規化部と、前記正規化部によって得られた
入力文字の正規化パタンの文字特徴を抽出して入力文字
の特徴パタンを生成する特徴抽出部と、前記入力文字の
特徴パタンと認識辞書メモリに格納されている参照パタ
ンとの間の対応付けを行い、対応付けの結果に基づいて
認識候補文字を出力する照合部と、前記認識候補文字と
知識辞書メモリに格納されている読み取り対象の文字の
知識辞書データとの整合をとり、整合のとれない部分に
ついて望ましいと推定される文字カテゴリを出力する知
識処理部と、1つの文字カテゴリに1つの文字画像を記
憶している文字画像メモリに格納されている文字画像デ
ータを用いて、前記知識処理部から出力された前記文字
カテゴリに対応する文字画像を生成する文字生成部と、
前記文字生成部によって生成された前記文字画像に正規
化処理を行って生成文字の正規化パタンを得、該生成文
字の正規化パタンの文字特徴を抽出して生成文字の特徴
パタンを得、該生成文字の特徴パタンと前記入力文字の
特徴パタンとを照合して認識候補文字列を得る第1の手
段と、照合した結果として得られる前記認識候補文字列
と前記知識辞書データとの整合をとり、最も整合性の高
い文字列を文字列認識結果として出力する第2の手段と
を有する。
【0013】上記本発明の文字列認識装置は、前記第1
の手段が、前記正規化部と、前記特徴抽出部と、前記照
合部とを備えることができる。
【0014】また、上記本発明の文字列認識装置は、前
記第2の手段が、前記知識処理部を備えることができ
る。
【0015】
【作用】このように構成された本発明は、入力文字の認
識処理を行った後、整合のとれない文字についてのみ、
望ましいと推定される文字カテゴリから、複数文字が接
触している文字画像、1文字を分割した文字画像、また
は両者を組み合せた文字画像を生成し、入力文字画像と
照合するので、無駄な処理を行うことなく、文字の接触
や文字同士の入り組みがある自由書式で筆記されている
文字列を高速かつ高精度に自動認識することが可能とな
る。
【0016】また、3文字以上が接触している場合や、
文字が横方向に並んでいる場合でも、文字画像を生成し
て入力文字画像と照合することが可能となり、文字の接
触や文字同士の入り組みがある自由書式で筆記されてい
る文字列を高速かつ高精度に自動認識することが可能と
なる。
【0017】
【実施例】以下に、図面を参照して本発明の実施例につ
いて説明する。
【0018】図1は、本発明の一実施例における構成を
示すブロック図である。本実施例においては、1文字単
位で認識処理を行う場合について説明する。
【0019】図1の構成を説明する。図1は、画像入力
部1と、書式判定部2と、文字切り出し部3と、正規化
部4と、特徴抽出部5と、照合部6と、認識辞書メモリ
7と、知識処理部8と、知識辞書メモリ9と、文字生成
部10と、文字画像メモリ11とを有する構成となって
いる。
【0020】画像入力部1は、読み取り対象の帳票や郵
便物の、自由書式で筆記された文字列12の画像を入力
して、画像データを生成する処理を行う。具体的には、
光源から照射された光の反射光をCCD(Charge
Coupled Device)等の撮像素子によっ
て結像して、これを走査して電気信号に変換する。次
に、変換した電気信号を量子化することによって、多値
レベルの全面画像データ13を生成する。
【0021】書式判定部2は、画像入力部1において生
成された全面画像データ13中の黒画素塊について、外
接する矩形特徴や黒画素の縦軸・横軸のヒストグラム特
徴等を求める。そして、これらの特徴の分布によって、
文字列の縦書き・横書きの方向を示す書式情報22を判
定するとともに、文字列領域画像14を生成する。
【0022】文字切り出し部3は、書式判定部2におい
て生成された文字列領域画像14について、外接する矩
形特徴や黒画素の縦軸・横軸のヒストグラム特徴等を求
めて1文字領域を推定し、入力文字画像15として切り
出す処理を行う。ただし、文字枠のない帳票や郵便物上
の住所・氏名のような自由書式で筆記された文字列12
の文字切り出し処理においては、必ずしも正確に1文字
領域を推定できるとは限らない。一般的な例としては、
2文字以上の領域を誤って1文字領域として推定する場
合や、1文字より小さい領域を誤って1文字領域として
推定する場合がある。本実施例における入力文字画像1
5は、1文字領域として推定して切り出した領域の画像
として定義する。したがって入力文字画像15は、1文
字領域を正確に切り出している場合もあれば、切り出し
誤りが発生している場合もある。
【0023】正規化部4は、文字切り出し部3において
切り出された入力文字画像15および後述する生成文字
画像23の文字画像サイズを揃える正規化処理を行う。
画像サイズを揃える正規化処理の方法としては、縦方向
または横方向に等比率で拡大または縮小する線形正規化
方法や、領域によって拡大または縮小する比率を変更す
る非線形正規化方法等がある。本実施例においては、い
ずれの正規化方法も適用することが可能である。
【0024】特徴抽出部5は、正規化部4において生成
された正規化した入力文字画像16および正規化した生
成文字画像24の文字特徴を抽出する。抽出する文字特
徴としては、文字のエッジの方向特徴、文字ストローク
密度特徴、構造解析的特徴等がある。本実施例において
は、任意の特徴抽出方法を適用することが可能である。
【0025】照合部6は、入力文字画像の特徴パタン1
7と認識辞書メモリ7に登録されている参照パタン19
との間の対応付けを行い、距離値、類似度、または参照
パタン19に属する特徴成分が入力文字画像の特徴パタ
ン17に存在するか否かのチェック、入力文字画像の特
徴パタン17に属する特徴成分が参照パタン19に存在
するか否かのチェック等により、照合の度合を判定し
て、認識候補文字18を出力する。この処理を第1回目
の照合処理と定義する。
【0026】認識辞書メモリ7は、学習文字画像データ
を入力として、正規化部4で用いた正規化方法によって
正規化処理を行い、特徴抽出部5で用いた特徴抽出方法
によって抽出した特徴パタンと学習文字画像データの属
するカテゴリコード対とを、参照パタン19として登録
している。
【0027】知識処理部8は、照合部6において求めら
れた認識候補文字18を入力データとして、文字列領域
画像14の中での入力文字画像15の位置に基づいて、
認識候補文字18を並べ、認識候補文字列を生成する。
あらかじめ知識辞書メモリ9には、読み取り対象の知識
データベースが登録されている。知識データベースとし
ては、住所、氏名、会社名、商品名、部品名等のさまざ
まな知識があるが、本実施例においては、住所知識デー
タベースを用いた場合について説明する。知識処理部8
においては、認識候補文字列を、読み取り対象の知識デ
ータベースに登録されている知識データ20に基づいて
検索する。
【0028】文字切り出し部3における文字切り出し
と、正規化部4における正規化と、特徴抽出部5におけ
る特徴抽出と、照合部6における照合と、知識処理部8
における知識処理とを行った結果、読み取り対象の知識
データ20と整合のとれない部分について、知識処理部
8から望ましいと考えられる文字カテゴリ21を出力す
る。
【0029】文字生成部10は、文字画像メモリ11に
記憶されている文字画像と書式判定部2から出力された
書式情報22とに基づいて、知識処理部8から出力され
た文字カテゴリ21に対応する文字画像を生成して生成
文字画像23として出力する。
【0030】文字生成部10から出力された生成文字画
像23は正規化部4に入力され、正規化した生成文字画
像24が得られる。次に、特徴抽出部5において正規化
した生成文字画像24の特徴抽出が実行され、生成文字
画像の特徴パタン25が得られる。
【0031】次に、照合部6において再度照合処理が行
われる。入力文字画像の特徴パタン17と生成文字画像
の特徴パタン25との間の対応付けを行い、距離値、類
似度、または生成文字画像の特徴パタン25に属する特
徴成分が入力文字画像の特徴パタン17に存在するか否
かのチェック、入力文字画像の特徴パタン17に属する
特徴成分が生成文字画像の特徴パタン25に存在するか
否かのチェック等により、照合の度合を判定して、認識
候補文字18を出力する。この処理を第2回目の照合処
理と定義する。
【0032】また、照合部6は、第1回目の照合処理結
果と第2回目の照合処理結果とを比較する手段を有して
いる。これは、第1回目の照合処理において、入力文字
画像の特徴パタン17と認識辞書メモリ7の中の最も整
合の良い参照パタン19との整合の度合と、入力文字画
像の特徴パタン17と生成文字画像の特徴パタン25と
の整合の度合とを比較して、整合の度合の良い認識候補
文字18を出力する機能である。具体的な照合処理結果
の比較方法としては、第1回目の距離値の平均値と第2
回目の距離値の平均値とを比較して、距離値の平均値の
小さい方の認識候補文字18を出力する方法や、第1回
目の類似度の平均値と第2回目の類似度の平均値とを比
較して、類似度の平均値の大きい方の認識候補文字18
を出力する方法等がある。
【0033】知識処理部8は、照合部6において第1回
目の照合処理結果と第2回目の照合処理結果とを比較し
て得られた、整合の度合の良い認識候補文字18を入力
データとして、再度、認識候補文字列を読み取り対象の
知識データベースに登録されている知識データ20に基
づいて検索して、知識データ20と最も整合のとれた結
果を文字列認識結果26として出力する。
【0034】図2は、本発明の一実施例における処理手
順を説明する図であり、「川越市大塚新田」という文字
列が入力されている場合を示している。また、読み取り
対象の知識としては、住所データベースを用いている。
住所データベースの中には、住所データとして、「川越
市砂新田」、「川越市天沼新田」、「川越市大塚新田」
があると仮定する。また、認識辞書メモリ7の中には、
「川」「越」「市」「砂」「新」「田」「天」「沼」
「大」「塚」「壌」「右」「小」の13種類の参照パタ
ン19があると仮定する。
【0035】図2を用いて、図1の構成における動作を
説明する。図2においては、入力文字列のうちの2文字
「大」と「塚」とが接触しているので、文字切り出し部
3においては「大」「塚」の2文字として分離すること
は難しく、入力文字画像15は「大塚」の1文字として
切り出される。したがって、文字切り出し部3で生成さ
れる入力文字画像15は、6つの文字ブロック31〜3
6となる。
【0036】正規化部4、特徴抽出部5、および照合部
6から成る文字認識部においては、6つの文字ブロック
31〜36について認識する。照合部6においては、入
力文字画像の特徴パタン17と認識辞書メモリ7の13
種類の参照パタン19とについて照合処理を行い、「川
越市壌新田」という認識候補文字18が得られる。とこ
ろが、住所データベースの中の川越市の住所には、「砂
新田」、「天沼新田」、「大塚新田」等の地名はある
が、「壌新田」という地名はない。したがって、知識処
理部8の知識データ20によって、文字ブロック34の
文字として望ましいと考えられる文字カテゴリ21は、
「砂」、「天沼」、「大塚」のいずれかであると推定さ
れる。
【0037】文字生成部10は、文字コードに対応した
文字画像を生成する。書式判定部2の縦書きであるとい
う情報から、「天」「沼」が縦に並んでいる生成文字画
像37、および「大」「塚」が縦に並んでいる生成文字
画像38が得られる。「砂」の1文字画像については、
第1回目の照合段階において照合済みであるので、再度
生成して照合する必要はない。
【0038】次に、正規化部4において、生成文字画像
37、38の正規化を行い、正規化した生成文字画像3
9、40が得られる。特徴抽出部5において、正規化し
た生成文字画像39、40を特徴抽出して、生成文字画
像の特徴パタン25が得られる。
【0039】その後、照合部6において、文字ブロック
34を正規化して特徴抽出した特徴パタンと、正規化し
た生成文字画像39、40の特徴パタンとの間の、第2
回目の照合処理が行われる。また照合部6においては、
第1回目の照合処理結果と第2回目の照合処理結果とを
比較して、整合の度合の良い結果が認識候補文字18と
して得られる。
【0040】図2においては、第2回目の照合処理結果
である「大塚」を正規化した生成文字画像40と文字ブ
ロック34との間の整合が、第1回目の照合処理結果で
ある参照パタン「壌」との整合よりも整合性が良いと判
定して、認識候補文字18として「川越市大塚新田」が
得られる。
【0041】知識処理部8においては、住所データベー
スの中に「大塚新田」という住所データが存在している
ことから、文字列認識結果26として「川越市大塚新
田」が得られる。
【0042】図3は、本発明の一実施例における処理手
順を説明する図であり、「川越市砂新田」という文字列
が入力されている場合を示している。また、読み取り対
象の知識としては、図2と同様に、住所データベースを
用いている。住所データベースの中には、住所データと
して、「川越市砂新田」、「川越市天沼新田」、「川越
市大塚新田」があると仮定する。また、認識辞書メモリ
7の中には、「川」「越」「市」「砂」「新」「田」
「天」「沼」「大」「塚」「壌」「右」「小」の13種
類の参照パタン19があると仮定する。
【0043】図4は、図1の構成における文字画像メモ
リ内のデータを示す図である。図4に示すように、文字
画像メモリ11には、文字カテゴリ80と文字画像デー
タ83とが対応付けられて格納されている。また、各文
字画像データ83〜87に属性情報81、82を付加す
ることも可能である。図4においては、文字画像データ
83〜87が縦方向に分離しているか、横方向に分離し
ているかを示す属性情報81、82を付加した場合を示
している。例えば、「台」は縦方向には「ム」と「ロ」
との2つの部分パタンに分離するが、横方向には分離し
ないので、(縦,横)=(1,0)となる。ところが、
「沼」は横方向には「シ」と「召」との2つの部分パタ
ンに分離するが、縦方向には分離しないので、(縦,
横)=(0,1)となる。また、この属性情報81、8
2としてはさらに、縦分離位置、横分離位置等を付加す
ることも可能であるが、図4に示すように、単純に1文
字の半分の位置に分離位置86を設定するように部分パ
タンを配置した場合について説明する。
【0044】図3を用いて、図1の構成における動作を
説明する。図3においては、入力文字列のうちの1文字
「砂」が2つの文字ブロックに分離しており、2つの文
字ブロックが離れて存在しているので、文字切り出し部
3においては「砂」の1文字として統合することは難し
く、入力文字画像15は「右」「小」の2文字として切
り出される。したがって、文字切り出し部3で生成され
る入力文字画像15は、7つの文字ブロック51〜57
となる。
【0045】正規化部4、特徴抽出部5、および照合部
6から成る文字認識部においては、7つの文字ブロック
51〜57について認識する。照合部6においては、正
規化した入力文字画像66、67の特徴パタンと認識辞
書メモリ7の13種類の参照パタン19とについて照合
処理を行う。図3には、「大」「塚」の参照パタン6
4、65と正規化した入力文字画像66、67との照合
処理を示している。照合処理の結果、正規化した入力文
字画像66と最も整合の良い参照パタンは「右」、正規
化した入力文字画像67と最も整合の良い参照パタンは
「小」となり、「川越市右小新田」という認識候補文字
18が得られる。ところが、住所データベースの中の川
越市の住所には、「砂新田」、「天沼新田」、「大塚新
田」等の地名はあるが、「右小新田」という地名はな
い。したがって、知識処理部8の知識データ20によっ
て、文字ブロック54、55の文字として望ましいと考
えられる文字カテゴリ21は、「砂」、「天沼」、「大
塚」のいずれかであると推定される。
【0046】文字生成部10は、文字コードに対応した
文字画像を生成する。「大」「塚」および「天」「沼」
の2文字画像については、第1回目の照合段階において
照合済みであるので、再度照合する必要はない。「砂」
の1文字画像については照合していないので、書式判定
部2の横書きであるという情報から、生成文字画像
「砂」59を横方向に分割した2つの生成文字画像
「石」「少」が得られる。
【0047】次に、正規化部4において、分割した2つ
の生成文字画像の正規化を行ない、正規化した生成文字
画像60、61が得られる。特徴抽出部5において、正
規化した生成文字画像60、61を特徴抽出して、生成
文字画像の特徴パタン25が得られる。
【0048】その後、照合部6において、文字ブロック
54、55を正規化して特徴抽出した特徴パタンと、正
規化した生成文字画像60、61の特徴パタンとの間
の、第2回目の照合処理が行なわれる。また照合部6に
おいては、第1回目の照合処理結果と第2回目の照合処
理結果とを比較して、整合の度合の良い結果が認識候補
文字18として得られる。
【0049】図3においては、第2回目の照合処理結果
である「石」「少」を正規化した生成文字画像60、6
1と正規化した入力文字画像66、67との間の整合
が、第1回目の照合処理結果である参照パタン「右」
「小」との整合よりも整合性が良いと判定して、認識候
補文字18として「川越市砂新田」が得られる。
【0050】知識処理部8においては、住所データベー
スの中に「砂新田」という住所データが存在しているこ
とから、文字列認識結果26として「川越市砂新田」が
得られる。
【0051】
【発明の効果】以上説明したように本発明は、入力文字
の認識処理を行った後、整合のとれない文字についての
み望ましいと推定される文字カテゴリから文字画像を生
成して、入力文字画像と照合することによって、無駄な
処理を行うことなく、文字の接触や文字同士の入り組み
がある自由書式で筆記されている文字列を高速かつ高精
度に自動認識することができるという効果を有する。
【0052】また、3文字以上が接触している場合や、
文字が横方向に並んでいる場合でも、文字画像を生成し
て入力文字画像と照合することができ、文字の接触や文
字同士の入り組みがある自由書式で筆記されている文字
列を高速かつ高精度に自動認識することができるという
効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施例における構成を示すブロック
【図2】本発明の一実施例における処理手順を説明する
【図3】本発明の一実施例における処理手順を説明する
【図4】図1の構成における文字画像メモリ内のデータ
を示す図
【符号の説明】
1 画像入力部 2 書式判定部 3 文字切り出し部 4 正規化部 5 特徴抽出部 6 照合部 7 認識辞書メモリ 8 知識処理部 9 知識辞書メモリ 10 文字生成部 11 文字画像メモリ 12 自由書式で筆記された文字列 13 全面画像データ 14 文字列領域画像 15 入力文字画像 16 正規化した入力文字画像 17 入力文字画像の特徴パタン 18 認識候補文字 19 参照パタン 20 知識データ 21 文字カテゴリ 22 書式情報 23 生成文字画像 24 正規化した生成文字画像 25 生成文字画像の特徴パタン 26 文字列認識結果 31、32、33、34、35、36 文字ブロック 37、38 生成文字画像 39、40 正規化した生成文字画像 51、52、53、54、55、56、57 文字ブ
ロック 58、62、63 知識処理結果の文字列 59 生成文字画像 60、61 正規化した生成文字画像 64、65 参照パタン 66、67 正規化した入力文字画像 80 文字カテゴリ 81、82 属性情報 83、84、85、87 文字画像データ 86 分離位置
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.6,DB名) G06K 9/72 G06K 9/62 特許ファイル(PATOLIS) JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 自由書式で筆記されている読み取り対象
    の文字列の画像を入力する画像入力部と、 入力された前記画像の中から文字列領域を抽出し、文字
    列が縦書きであるか横書きであるかの方向を示す書式情
    報を判定する書式判定部と、 前記書式判定部によって抽出された前記文字列領域の画
    像から所定の文字数単位で文字パタンを切り出す文字切
    り出し部と、 前記文字切り出し部によって切り出された前記文字パタ
    ンの各々に文字サイズに応じた正規化処理を行う正規化
    部と、 前記正規化部によって得られた入力文字の正規化パタン
    の文字特徴を抽出して入力文字の特徴パタンを生成する
    特徴抽出部と、 前記入力文字の特徴パタンと認識辞書メモリに格納され
    ている参照パタンとの間の対応付けを行い、対応付けの
    結果に基づいて認識候補文字を出力する照合部と、 前記認識候補文字と知識辞書メモリに格納されている読
    み取り対象の文字の知識辞書データとの整合をとり、整
    合のとれない部分について望ましいと推定される文字カ
    テゴリを出力する知識処理部と、 1つの文字カテゴリに1つの文字画像を記憶している文
    字画像メモリに格納されている文字画像データを用い
    て、前記知識処理部から出力された前記文字カテゴリに
    対応する文字画像を生成する文字生成部と、 前記文字生成部によって生成された前記文字画像に正規
    化処理を行って生成文字の正規化パタンを得、該生成文
    字の正規化パタンの文字特徴を抽出して生成文字の特徴
    パタンを得、該生成文字の特徴パタンと前記入力文字の
    特徴パタンとを照合して認識候補文字列を得る第1の手
    段と、 照合した結果として得られる前記認識候補文字列と前記
    知識辞書データとの整合をとり、最も整合性の高い文字
    列を文字列認識結果として出力する第2の手段とを有す
    る、文字列認識装置。
  2. 【請求項2】 前記第1の手段が、前記正規化部と、前
    記特徴抽出部と、前記照合部とを備える、請求項1に記
    載の文字列認識装置。
  3. 【請求項3】 前記第2の手段が、前記知識処理部を備
    える、請求項1または2に記載の文字列認識装置。
JP7090584A 1995-04-17 1995-04-17 文字列認識装置 Expired - Lifetime JP2751865B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7090584A JP2751865B2 (ja) 1995-04-17 1995-04-17 文字列認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7090584A JP2751865B2 (ja) 1995-04-17 1995-04-17 文字列認識装置

Publications (2)

Publication Number Publication Date
JPH08287188A JPH08287188A (ja) 1996-11-01
JP2751865B2 true JP2751865B2 (ja) 1998-05-18

Family

ID=14002504

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7090584A Expired - Lifetime JP2751865B2 (ja) 1995-04-17 1995-04-17 文字列認識装置

Country Status (1)

Country Link
JP (1) JP2751865B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3569138B2 (ja) 1998-10-29 2004-09-22 富士通株式会社 単語認識装置および方法
JP4280355B2 (ja) * 1999-05-06 2009-06-17 富士通株式会社 文字認識装置
JP2000353215A (ja) 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体
KR100707943B1 (ko) * 2005-04-27 2007-04-18 최철규 광학문자인식 기능을 활용한 재무제표인식 방법 및 그시스템
CN100555308C (zh) * 2005-07-29 2009-10-28 富士通株式会社 地址识别装置和方法

Also Published As

Publication number Publication date
JPH08287188A (ja) 1996-11-01

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
Cattoni et al. Geometric layout analysis techniques for document image understanding: a review
US9633257B2 (en) Method and system of pre-analysis and automated classification of documents
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US8224092B2 (en) Word detection method and system
US6327386B1 (en) Key character extraction and lexicon reduction for cursive text recognition
US5787197A (en) Post-processing error correction scheme using a dictionary for on-line handwriting recognition
US20110188759A1 (en) Method and System of Pre-Analysis and Automated Classification of Documents
JP3452774B2 (ja) 文字認識方法
Andreeva et al. Comparison of scanned administrative document images
US20090252417A1 (en) Unsupervised writer style adaptation for handwritten word spotting
JP2751865B2 (ja) 文字列認識装置
JPH0430070B2 (ja)
Kumar et al. Line based robust script identification for indianlanguages
Agarwal et al. Bank check analysis and recognition by computers
Slavin et al. Matching Digital Copies of Documents Based on OCR
JPH11328315A (ja) 文字認識装置
Mirzaian A minimum separation algorithm for river routing with bounded number of jogs
JP2906758B2 (ja) 文字読取装置
Medhat et al. TMIXT: A process flow for Transcribing MIXed handwritten and machine-printed Text
JP2972443B2 (ja) 文字認識装置
JP3151866B2 (ja) 英文字認識方法
JP3428504B2 (ja) 文字認識装置
JPH0256086A (ja) 文字認識の後処理方法
JP2963474B2 (ja) 類似文字識別方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080227

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090227

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100227

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100227

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110227

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110227

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120227

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130227

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140227

Year of fee payment: 16

EXPY Cancellation because of completion of term