JPH11328309A - 光学的文字読み取り方法とその装置 - Google Patents

光学的文字読み取り方法とその装置

Info

Publication number
JPH11328309A
JPH11328309A JP10156295A JP15629598A JPH11328309A JP H11328309 A JPH11328309 A JP H11328309A JP 10156295 A JP10156295 A JP 10156295A JP 15629598 A JP15629598 A JP 15629598A JP H11328309 A JPH11328309 A JP H11328309A
Authority
JP
Japan
Prior art keywords
character
unit
category
output
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10156295A
Other languages
English (en)
Other versions
JP3370934B2 (ja
Inventor
Keiichi Miyazaki
崎 桂 一 宮
Masato Minami
正 人 南
Toshiyuki Koda
田 敏 行 香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP15629598A priority Critical patent/JP3370934B2/ja
Priority to EP99304385A priority patent/EP0965943A3/en
Priority to US09/325,546 priority patent/US6636631B2/en
Publication of JPH11328309A publication Critical patent/JPH11328309A/ja
Application granted granted Critical
Publication of JP3370934B2 publication Critical patent/JP3370934B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 従来の統計的特徴による認識方法をベース
に、構造的特徴は類似カテゴリの分離に必要なものを中
心に限定して抽出することにより、辞書作成を効率化
し、統計的特徴による認識方法で誤りやすい類似カテゴ
リの識別を構造的特徴を利用して行うことにより、類似
カテゴリの認識性能を向上させる。 【解決手段】 統計的特徴と構造的特徴共通の基本特徴
を抽出する基本特徴抽出部2と、統計的特徴を抽出する
統計的特徴抽出部3と、統計的特徴に基づく認識を実行
する認識部4と、認識部4の認識傾向に応じて類似カテ
ゴリの分離特徴を中心に抽出する第1の構造的特徴抽出
部5と、手書きと活字を分離する字種判定部6と、認識
部4の認識結果に応じて適切な構造的特徴を用いて最終
的なカテゴリ判断を行う第1の構造識別部7とを設ける
ことにより、辞書作成の効率化と類似カテゴリの認識性
能の向上が可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票あるいは、文書上
の手書き、印刷文字を読み取る光学的文字読み取り方法
とその装置に関するものである。
【0002】
【従来の技術】従来の光学的文字読み取り装置における
類似度算出方式としては、距離尺度に基づく類似度算出
法が一般的である。距離尺度は、大きく分けるとパター
ンベクトルの個々の次元に着目した距離尺度と、次元全
体の分布を考慮した距離尺度とに分類され、電子情報通
信学会論文誌D−IIVol.J79-D-II No.1 pp.45 - 52「改
良型マハラノビス距離を用いた高精度な手書き文字認
識」に示されているように、後者の次元全体の分布を考
慮した距離尺度に基づく類似度算出方式の方が有効であ
ることが知られている。中でも、複合類似度法は、既に
実用化された一般的な類似度算出方式の1つである。
【0003】複合類似度法の類似度算出方式は、ある1
つの文字カテゴリについて、それに含まれる学習用文字
パターンが作り出すパターン空間内の分布について主成
分分析を行い、その主成分としてえられるN個の固有ベ
クトルψi(i= 1,2,....,N)をそのカテゴ
リの辞書として、以下で定義される複合類似度Sに基づ
いて入力文字パターンベクトルfに対する類似度を算出
する。
【数1】 ここで、λi は、固有値である。認識結果としては、大
きい方から2番目の類似度と最大類似度の比の大きさに
より、リジェクトの有無を判定し、リジェクト出ない場
合は、最大類似度のカテゴリを認識結果とするのが一般
的である。
【0004】従来の光学的文字読み取り装置における構
造特徴を用いた認識方式としては、東芝レビュー、Vol.
41, No.12, pp.1012-1015(1986) 「自由手書き文字認
識」に示されている輪郭構造マッチング方が知られてい
る。
【0005】この方式によれば、8方向にコード化され
たフリーマン・コード・チェインを最初の段階の特徴量
として抽出し、平滑化後曲率により分割される。分割さ
れた部分輪郭はセグメントと呼ばれ凸、直線、凹の三種
類に分類され、各セグメントには、長さ、曲率、位置、
方向等の属性情報が与えられる。
【0006】一方、辞書には同様の輪郭セグメントのシ
ーケンスが記述されており、これらには前記属性情報に
関して、その値の上限、下限の値がセットされている。
入力パターンと辞書に記述されている属性情報を比較す
ることにより、入力パターンのセグメントと辞書セグメ
ントの対応関係を調べ認識が実行される。
【0007】
【発明が解決しようとする課題】しかしながら、従来の
光学的文字読み取り装置では、主成分分析によって得ら
れた統計的特徴のみを用いているために人間の認識特性
とのずれが生じ、文字形状の構造的な相違点を反映でき
ないために、人間には容易に分離できる類似カテゴリ
が、統計的特徴を用いた認識方法では分離が困難である
という課題があった。また、構造的特徴のみを用いる認
識方法では、辞書作成の効率が悪いという課題があっ
た。
【0008】また、枠線(非ドロップアウト)を有する
帳票等に書かれた文字を対象にする場合、文字が枠線と
接触または、枠をはみ出し・金額等の訂正により、枠線
の1部が文字に結合したり、文字の一部がかけたり、訂
正部分や訂正印の一部が文字として切り出されるなどの
文字切りだしエラーが発生しやすく、それらのパターン
を認識し類似度の比のみでリジェクトを判定するとリジ
ェクトされずに、誤読となることが多いと言う課題もあ
った。
【0009】本発明は、前記従来の問題点に鑑み、従来
の統計的特徴による認識方法をベースに、構造的特徴は
類似カテゴリの分離に必要なものを中心に限定して抽出
することにより辞書作成を効率化し、また統計的特徴に
よる認識方法で誤りやすい類似カテゴリの識別を構造的
特徴を利用して行うことにより、類似カテゴリの分離能
力すなわち認識性能を向上させると共に、文字パターン
の類似度の比だけではなく、類似度の大きさも併用する
事で文字切りだしエラー文字を効率的にリジェクトする
ようにした光学的文字読み取り方法とその装置を提供す
ることを目的とする。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、光電変換された文字枠線を含む文字列デ
ータに対して、文字枠線と文字列パターンを分離し、分
離された文字列パターンから個々の文字パターンを切り
出し、個々の文字パターンに対する外接矩形の大きさと
外接矩形に囲まれた切り出し文字画像を出力する文字切
り出し手段と、前記文字切り出し手段で切り出された個
々の切り出し文字画像に対する輪郭情報と背景構造情報
を求める基本特徴抽出手段と、前記基本特徴抽出手段か
ら出力された輪郭方向成分と背景距離に基づいて少なく
とも一種類の統計的特徴を求める統計的特徴抽出手段
と、前記基本特徴抽出手段から出力された基本特徴に基
づいて少なくとも一種類の構造的特徴を求める構造的特
徴抽出手段と、前記統計的特徴抽出手段から出力された
統計的特徴から切り出し文字画像の各カテゴリに対する
類似度を求め、類似度の大きい順に選んだ少なくとも1
つのカテゴリの類似度と、同じ順に選んだ少なくとも一
つのカテゴリを出力する認識手段と、前記認識手段から
出力されたカテゴリと前記カテゴリに対する類似度と前
記構造的特徴抽出手段から出力された構造的特徴とに基
づいて最終的な文字パターンの属するカテゴリを判定す
る第1の構造識別手段とを備えたものである。
【0011】この構成により、基本特徴抽出手段におい
て統計的特徴と構造的特徴の両方に利用できるような基
本特徴を抽出して構成の共通化を図り、構造的特徴抽出
手段では認識手段で識別が困難な類似カテゴリを分離す
るのに有効な構造的特徴を中心に限定して抽出すること
により、辞書作成を効率化し、統計的特徴を用いた認識
手段の認識結果に基づいて、構造識別手段において類似
カテゴリの分離に必要な特徴を選択して最終的なカテゴ
リの決定を行うことにより、効率的な処理と類似カテゴ
リの認識性能の向上の両方を可能にする。
【0012】
【発明の実施の形態】本発明の請求項1に記載の発明
は、光電変換された文字枠線を含む文字列データに対し
て、文字枠線と文字列パターンを分離し、分離された文
字列パターンから個々の文字パターンを切り出し、個々
の文字パターンに対する外接矩形の大きさと外接矩形に
囲まれた切り出し文字画像を求め、前記切り出された個
々の切り出し文字画像に対する輪郭情報と背景構造情報
とを基本特徴として抽出し、前記抽出された基本特徴に
基づいて少なくとも一種類の統計的特徴を抽出し、前記
切り出された個々の切り出し文字画像と前記抽出された
基本特徴に基づいて少なくとも一種類の構造的特徴を抽
出し、前記抽出された統計的特徴から前記切り出し文字
画像の各カテゴリに対する類似度を求め、前記類似度が
最大のカテゴリを個々の文字パターンの属するカテゴリ
と判定し、前記判定された文字パターンの属するカテゴ
リと前記カテゴリに対する類似度と前記抽出されたた構
造的特徴とに基づいて最終的な文字パターンの属するカ
テゴリを判定する各ステップを備えたことを特徴とする
光学的文字読み取り方法である。
【0013】この構成により、統計的特徴と構造的特徴
の両方に利用できるような基本特徴を抽出することによ
り構成の共通化が可能になり、統計的特徴による認識処
理では識別が困難な類似カテゴリの分離に有効な構造的
特徴を中心に限定して抽出することにより辞書作成を効
率化し、統計的特徴を用いて識別を行う認識手段から出
力された認識結果に基づいて、構造識別手段において必
要な構造的特徴を選択し最終的なカテゴリを決定するこ
とによって処理の効率化と類似カテゴリの認識性能の向
上が可能になるという作用を有する。
【0014】本発明の請求項2に記載の発明は、光電変
換された文字枠線を含む文字列データに対して、文字枠
線と文字列パターンを分離し、分離された文字列パター
ンから個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさと外接矩形に囲まれた切
り出し文字画像を求め、前記切り出された個々の切り出
し文字画像に対する輪郭情報と背景構造情報とを基本特
徴として抽出し、前記抽出された基本特徴に基づいて少
なくとも一種類の統計的特徴を抽出し、前記切り出され
た個々の切り出し文字画像と前記抽出された基本特徴に
基づいて少なくとも一種類の構造的特徴を抽出し、前記
抽出された統計的特徴から前記切り出し文字画像の各カ
テゴリに対する類似度を求め、前記類似度が最大のカテ
ゴリを個々の文字パターンの属するカテゴリと判定し、
前記切り出された個々の文字パターンに対する外接矩形
の大きさと前記判定された文字パターンの属するカテゴ
リと前記抽出された構造的特徴との少なくとも一つに基
づいて前記類似度を修正し、修正後の類似度に基づいて
最終的な文字パターンの属するカテゴリを判定する各ス
テップを備えたことを特徴とする光学的文字読み取り方
法である。
【0015】この構成により、前記切り出し文字画像の
各カテゴリに対する類似度の微妙な差を最終的なカテゴ
リ決定に反映させることができ、また、構造的特徴の検
出結果を定量的に類似度の修正値に反映させることがで
きるため、認識性能が向上するという作用を有する。
【0016】本発明の請求項3に記載の発明は、前記切
り出された文字パターンに対する外接矩形の大きさに基
づいて活字または手書きの字種判定を行い、前記字種判
定の結果と前記切り出された文字パターンに対する外接
矩形の大きさと前記判定された文字パターンの属するカ
テゴリと前記カテゴリに対する類似度と前記抽出された
構造的特徴の少なくとも一つに基づいて最終的な文字パ
ターンの属するカテゴリを判定する各ステップを備えた
ことを特徴とする請求項1または2記載の光学的文字読
み取り方法である。
【0017】この構成により、字種に応じて専門化処理
を行うことにより活字・手書き特有の構造的特徴を混同
することなく利用して、類似カテゴリ間の認識性能を高
め、処理の効率化が図れるという作用を有する。
【0018】本発明の請求項4に記載の発明は、前記切
り出された文字パターンに対する外接矩形の大きさと前
記判定されたカテゴリに対する類似度と前記抽出された
構造的特徴との少なくとも一つに基づいて切り出しエラ
ーを判定し、切り出しエラーと判定された場合に文字パ
ターンの再切り出しを行う各ステップを備えたことを特
徴とする請求項1または2または3記載の光学的文字読
み取り方法である。
【0019】この構成により、外接矩形が他の文字の外
接矩形と大きく相違していたり規定の外接矩形から外れ
ている場合や、類似度が他の文字の類似度に比べて極端
に低い場合や、第1位の類似度と第2位以下の類似度と
の差が少ない場合などに切り出しエラーがあると判定し
再切り出しを行うことにより、切り出し誤りを減らし、
切り出し誤りに起因する誤認識を減少させることができ
るという作用を有する。
【0020】本発明の請求項5に記載の発明は、前記切
り出された文字パターンの最大類似度、2番目の類似度
と最大類似度の比の値、前記切り出された文字パターン
の背景の複雑度に基づいて、前記判定された文字パター
ンの属するカテゴリの信頼度が低い場合にはリジェクト
処理を行い、それ以外の場合は前記判定された文字パタ
ーンの属するカテゴリを最終的な認識結果とする各ステ
ップを備えたことを特徴とする請求項1から4のいずれ
かに記載の光学的文字読み取り方法である。
【0021】この構成により、最大類似度の大きさ及び
背景複雑度もリジェクト判定に利用する事により、類似
度の比だけではリジェクト困難な前処理エラー文字を効
率よくリジェクトできるという作用を有する。
【0022】本発明の請求項6に記載の発明は、光電変
換された文字枠線を含む文字列データに対して、文字枠
線と文字列パターンを分離し、分離された文字列パター
ンから個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさと外接矩形に囲まれた切
り出し文字画像を出力する文字切り出し手段と、前記文
字切り出し手段で切り出された個々の切り出し文字画像
に対する基本特徴として輪郭情報と背景構造情報を求め
る基本特徴抽出手段と、前記基本特徴抽出手段から出力
された基本特徴に基づいて少なくとも一種類の統計的特
徴を求める統計的特徴抽出手段と、前記文字切り出し手
段で切出された個々の切り出し文字画像と前記基本特徴
抽出手段から出力された基本特徴に基づいて少なくとも
一種類の構造的特徴を求める構造的特徴抽出手段と、前
記統計的特徴抽出手段から出力された統計的特徴から切
り出し文字画像の各カテゴリに対する類似度を求め、類
似度の大きい順に選んだ少なくとも1つのカテゴリの類
似度と、同じ順に選んだ少なくとも一つのカテゴリとを
出力する認識手段と、前記認識手段から出力されたカテ
ゴリと前記カテゴリに対する類似度と前記構造的特徴抽
出手段から出力された構造的特徴とに基づいて最終的な
文字パターンの属するカテゴリを判定する第1の構造識
別手段とを備えたことを特徴とする光学的文字読み取り
装置である。
【0023】この構成により、基本特徴抽出手段では統
計的特徴と構造的特徴の両方に利用できるような基本特
徴を抽出することにより構成の共通化が可能になり、ま
た構造的特徴抽出手段では認識手段では識別が困難な類
似カテゴリの分離に有効な構造的特徴を中心に限定して
抽出することにより辞書作成を効率化し、統計的特徴を
用いて識別を行う認識手段から出力された認識結果に基
づいて、構造識別手段において必要な構造的特徴を選択
し最終的なカテゴリを決定することによって、処理の効
率化と類似カテゴリの認識性能の向上が可能になるとい
う作用を有する。
【0024】本発明の請求項7に記載の発明は、前記第
1の構造識別手段が、前記認識手段から出力されたカテ
ゴリに基づいて、前記構造特徴抽出手段から出力された
少なくとも一つの構造的特徴の中から有効な構造的特徴
を選択する認識依存特徴選択手段と、選択された構造的
特徴に基づいてカテゴリを判定する選択構造的特徴識別
手段とを備えたことを特徴とする請求項6記載の光学的
文字読み取り装置である。
【0025】この構成により、統計的特徴を用いて識別
を行う認識手段から出力された認識結果に基づいて、構
造識別手段において必要な構造的特徴を選択し最終的な
カテゴリを決定することによって、更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になるという作
用を有する。
【0026】本発明の請求項8に記載の発明は、前記文
字切り出し手段から出力された外接矩形の大きさに基づ
き活字または手書きの判定を行う字種判定手段を備え、
前記第1の構造識別手段が、前記字種判定手段で活字と
判定された文字に対して、個々の文字パターンが属する
カテゴリを判定する第1の活字処理手段と、前記字種判
定手段で手書きと判定された文字に対して、個々の文字
パターンが属するカテゴリを判定する第1の手書き処理
手段とを備えたことを特徴とする請求項6または7記載
の光学的文字読み取り装置である。
【0027】この構成により、字種に応じて専門化処理
を行うことにより活字・手書き特有の構造的特徴を混同
することなく利用して、類似カテゴリ間の認識性能を高
め、処理の効率化が図れるという作用を有する。
【0028】本発明の請求項9に記載の発明は、前記第
1の活字処理手段が、前記文字切り出し手段から出力さ
れた外接矩形の大きさと認識手段から出力されたカテゴ
リに基づいて構造的特徴抽出手段から出力された少なく
とも一つの構造的特徴の中から有効な構造的特徴を選択
する認識依存特徴選択手段と、認識依存特徴選択手段で
選択された構造的特徴に基づいてカテゴリ判定を行う選
択構造的特徴識別手段とを備えたことを特徴とする請求
項8記載の光学的文字読み取り装置である。
【0029】この構成により、統計的特徴を用いて識別
を行う認識手段から出力された認識結果に基づいて、構
造識別手段において必要な構造的特徴を選択し最終的な
カテゴリを決定することによって、更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になるという作
用を有する。
【0030】本発明の請求項10に記載の発明は、前記
第1の活字処理手段が、前記文字切り出し手段から出力
された外接矩形の大きさと認識手段から出力されたカテ
ゴリに基づいて一部のカテゴリに対する最終的なカテゴ
リ判定を行う外接矩形カテゴリ判定手段と、外接矩形カ
テゴリ判定手段で判定できない文字に対して認識手段か
ら出力されたカテゴリに基づいて構造的特徴抽出手段か
ら出力された少なくとも一つの構造的特徴の中から有効
な構造的特徴を選択する認識依存特徴選択手段と、前記
認識依存特徴選択手段で選択された構造的特徴に基づい
てカテゴリ判定を行う選択構造的特徴識別手段とを備え
たことを特徴とする請求項8記載の光学的文字読み取り
装置である。
【0031】この構成により、外接矩形カテゴリ判定手
段で外接矩形の大きさだけで判別可能なカテゴリを最初
に判定することで効率的にカテゴリを分離し、認識依存
特徴選択手段で認識手段の結果に応じて類似カテゴリ分
離に必要な構造的特徴を選択して、選択構造的特徴識別
手段で選択した構造的特徴に応じて最終カテゴリ判断を
行うことで、効率的かつ効果的な類似カテゴリ分離が可
能であるという作用を有する。
【0032】本発明の請求項11に記載の発明は、前記
第1の手書き処理手段が、前記文字切り出し手段から出
力された外接矩形の大きさと認識手段から出力されたカ
テゴリに基づいて構造的特徴抽出手段から出力された少
なくとも一つの構造的特徴の中から有効な構造的特徴を
選択する認識依存特徴選択手段と、前記認識依存特徴選
択手段で選択された構造的特徴に基づいてカテゴリ判定
を行う選択構造的特徴識別手段とを備えたことを特徴と
する請求項8記載の光学的文字読み取り装置である。
【0033】この構成により、統計的特徴を用いて識別
を行う認識手段から出力された認識結果に基づいて、構
造識別手段において必要な構造的特徴を選択し最終的な
カテゴリを決定することによって、更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になるという作
用を有する。
【0034】本発明の請求項12に記載の発明は、前記
第1の手書き処理手段が、前記文字切り出し手段から出
力された外接矩形の大きさと認識手段から出力されたカ
テゴリに基づいて一部のカテゴリに対する最終的なカテ
ゴリ判定を行う外接矩形カテゴリ判定手段と、外接矩形
カテゴリ判定手段で判定できない文字に対して認識手段
から出力されたカテゴリに基づいて構造的特徴抽出手段
から出力された少なくとも一つの構造的特徴の中から有
効な構造的特徴を選択する認識依存特徴選択手段と、前
記認識依存特徴選択手段で選択された構造的特徴に基づ
いてカテゴリ判定を行う選択構造的特徴識別手段とを備
えたことを特徴とする請求項8記載の光学的文字読み取
り装置である。
【0035】この構成により、外接矩形カテゴリ判定手
段で外接矩形の大きさだけで判別可能なカテゴリを最初
に判定することで効率的にカテゴリを分離し、認識依存
特徴選択手段で認識手段の結果に応じて類似カテゴリ分
離に必要な構造的特徴を選択して、選択構造的特徴識別
手段で選択した構造的特徴に応じて最終カテゴリ判断を
行うことで効率的かつ効果的な類似カテゴリ分離が可能
であるという作用を有する。
【0036】本発明の請求項13に記載の発明は、光電
変換された文字枠線を含む文字列データに対して、文字
枠線と文字列パターンを分離し、分離された文字列パタ
ーンから個々の文字パターンを切り出し、個々の文字パ
ターンに対する外接矩形の大きさと外接矩形に囲まれた
切り出し文字画像を出力する文字切り出し手段と、前記
文字切り出し手段で切り出された個々の切り出し文字画
像に対する基本特徴として輪郭情報と背景構造情報を求
める基本特徴抽出手段と、前記基本特徴抽出手段から出
力された基本特徴に基づいて少なくとも一種類の統計的
特徴を求める統計的特徴抽出手段と、前記文字切り出し
手段で切出された個々の切り出し文字画像と前記基本特
徴抽出手段から出力された基本特徴に基づいて少なくと
も一種類の構造的特徴を求める構造的特徴抽出手段と、
前記統計的特徴抽出手段から出力された統計的特徴から
切り出し文字画像の各カテゴリに対する類似度を求め、
類似度の大きい順に選んだ少なくとも1つのカテゴリの
類似度と、同じ順に選んだ少なくとも一つのカテゴリを
出力する認識手段と、前記文字切り出し手段から出力さ
れた文字パターンの外接矩形の大きさと前記認識手段か
ら出力されたカテゴリと前記構造的特徴抽出手段から出
力された構造的特徴との少なくとも一つに基づいて前記
認識手段から出力された類似度を修正し、修正後の類似
度に基づいて文字パターンが属するカテゴリを最終的に
判定する第2の構造識別手段とを備えたことを特徴とす
る光学的文字読み取り装置である。
【0037】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。
【0038】本発明の請求項14に記載の発明は、前記
第2の構造識別手段が、前記文字切り出し手段から出力
された文字パターンの外接矩形の大きさと前記認識手段
から出力された少なくとも一つのカテゴリと前記構造的
特徴抽出手段から出力された構造的特徴に基づいて、前
記認識手段から出力された類似度を修正する類似度修正
手段と、前記認識手段から出力された少なくとも一つの
カテゴリの類似度と前記類似度修正手段により修正され
た類似度と加算して修正類似度を算出する加算器と、前
記加算器から出力された修正類似度から個々の文字パタ
ーンが属するカテゴリを決定する修正カテゴリ判定手段
とを備えたことを特徴とする請求項13記載の光学的文
字読み取り装置である。
【0039】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。
【0040】本発明の請求項15に記載の発明は、前記
文字切り出し手段から出力された外接矩形の大きさに基
づき活字または手書きの判定を行う字種判定手段を備
え、前記第2の構造識別手段が、前記字種判定手段で活
字と判定された文字に対して、個々の文字パターンが属
するカテゴリを判定する第2の活字処理手段と、前記字
種判定手段で手書きと判定された文字に対して、個々の
文字パターンが属するカテゴリを判定する第2の手書き
処理手段とを備えたことを特徴とする請求項13または
14記載の光学的文字読み取り装置である。
【0041】この構成により、字種に応じて専門化処理
を行うことにより活字・手書き特有の構造的特徴を混同
することなく利用して、類似カテゴリ間の認識性能を高
め、処理の効率化が図れるという作用を有する。
【0042】本発明の請求項16に記載の発明は、前記
第2の活字処理手段が、前記文字切り出し手段から出力
された文字パターンの外接矩形の大きさと前記認識手段
から出力された少なくとも一つのカテゴリと前記構造的
特徴抽出手段から出力された構造的特徴に基づいて、前
記認識手段から出力された類似度を修正する類似度修正
手段と、前記認識手段から出力された少なくとも一つの
カテゴリの類似度と前記類似度修正手段により修正され
た類似度と加算して修正類似度を算出する加算器と、前
記加算器から出力された修正類似度から個々の文字パタ
ーンが属するカテゴリを決定する修正カテゴリ判定手段
とを備えたことを特徴とする請求項15記載の光学的文
字読み取り装置である。
【0043】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。
【0044】本発明の請求項17に記載の発明は、前記
第2の手書き処理手段が、前記文字切り出し手段から出
力された文字パターンの外接矩形の大きさと前記認識手
段から出力された少なくとも一つのカテゴリと前記構造
的特徴抽出手段から出力された構造的特徴に基づいて、
前記認識手段から出力された類似度を修正する類似度修
正手段と、前記認識手段から出力された少なくとも一つ
のカテゴリの類似度と前記類似度修正手段により修正さ
れた類似度と加算して修正類似度を算出する加算器と、
前記加算器から出力された修正類似度から個々の文字パ
ターンが属するカテゴリを決定する修正カテゴリ判定手
段とを備えたことを特徴とする請求項15記載の光学的
文字読み取り装置である。
【0045】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。
【0046】本発明の請求項18に記載の発明は、前記
基本特徴抽出手段が、 前記文字切り出し手段から出力
される切り出し画像中の文字パターンの輪郭点を抽出す
る輪郭点抽出手段と、前記輪郭点抽出手段から出力され
た個々の輪郭点の隣接関係から画素単位の輪郭方向成分
を算出する輪郭方向算出手段と、前記輪郭点抽出手段か
ら出力された輪郭点の位置に基づいて文字パターンの外
接矩形の各々の辺から文字パターンまでの背景距離を求
める背景距離算出手段と前記文字切り出し手段から出力
された切り出し画像を水平及び垂直方向のライン毎に走
査し、一定画素以上連続する白画素(背景)の連続する
長さ・位置情報とその背景の走査方向に沿った発生順番
である背景次数を算出する背景情報算出手段とを備えた
ことを特徴とする請求項6、8、13、15のいずれか
に記載の光学的文字読み取り装置である。
【0047】この構成により、輪郭方向算出部における
輪郭方向成分の算出、背景距離算出部における外接矩形
の各々の辺から文字パターンまでの背景距離の算出、背
景情報算出部における背景情報算出のための共通の前処
理として輪郭点抽出部で文字パターンの輪郭点を抽出す
ることにより、基本特徴抽出の効率が向上する。また、
基本特徴として輪郭点、輪郭方向成分、背景距離、背景
情報を抽出する事により統計的特徴だけでなく、文字構
造を反映した構造特徴量にも流用が可能になり特徴抽出
処理の効率化が図れるという作用を有する。
【0048】本発明の請求項19に記載の発明は、前記
統計的特徴抽出手段が、前記文字切り出し手段から出力
された切り出し画像を水平・垂直両方向で複数のブロッ
クに分割する両方向ブロック分割手段と、前記両方向ブ
ロック分割手段で分割したブロック単位で、前記基本特
徴抽出手段の輪郭方向算出手段から出力された輪郭方向
成分について輪郭方向毎の個数を集計する輪郭方向集計
手段と、輪郭方向集計手段から出力されたブロック単位
の輪郭方向毎の輪郭方向成分の個数をブロックの大きさ
で割ることで得られる輪郭方向毎の輪郭統計特徴量を求
める輪郭方向正規化手段と、前記文字切り出し手段から
出力された切り出し画像を水平方向で複数のブロックに
分割する水平方向ブロック分割手段と、前記文字切り出
し手段から出力された切り出し画像を垂直方向で複数の
ブロックに分割する垂直方向ブロック分割手段と、前記
基本特徴抽出手段から出力された輪郭方向成分に基づい
て、前記水平方向ブロック分割部及び垂直方向ブロック
分割手段で分割したブロック単位で、ブロック分割境界
線に垂直な外接矩形の辺からブロック分割境界線に平行
方向に走査して最初に存在する文字パターンを構成する
画素の輪郭方向毎の輪郭方向成分の個数である外郭方向
成分の個数を集計する外郭方向集計手段と、外郭方向集
計手段から出力されたブロック単位の輪郭方向毎の外郭
方向成分の個数をブロックの大きさで割ることで得られ
る輪郭方向毎の外郭統計特徴量を求める外郭方向正規化
手段と、前記基本特徴抽出手段の背景距離算出手段から
出力された背景距離に基づいて、前記水平方向ブロック
分割部及び垂直方向ブロック分割部で分割したブロック
単位でブロック分割方向の背景距離を合計する背景距離
合計手段と、背景距離集計手段から出力されたブロック
単位の集計背景距離をブロックの大きさで割ることで得
られる背景距離特徴量を求める背景距離正規化手段とを
備えたことを特徴とする請求項6、8、13、15のい
ずれかに記載の光学的文字読み取り装置である。
【0049】この構成により、両方向ブロック分割手
段、水平方向ブロック分割部及び垂直方向ブロック分割
手段によって文字パターンを複数のブロックに分割し、
輪郭方向集計手段、外郭方向集計手段及び背景距離集計
手段で各々のブロック全体の特徴量を加算集計すること
により、基本特徴抽出手段で抽出した基本特徴からブロ
ックの統計的特徴を抽出することでき、さらに輪郭方向
正規化手段、外郭方向正規化手段、及び背景距離正規化
手段でブロックの統計的特徴を正規化することにより、
認識対象の変化に影響されにくい特徴を抽出できるとい
う作用を有する。
【0050】本発明の請求項20に記載の発明は、前記
構造的特徴抽出手段が、前記基本特徴抽出手段の背景距
離算出手段から出力された背景距離に基づいて局所的な
背景距離特徴を抽出する局所背景特徴抽出手段と、前記
基本特徴抽出手段の輪郭方向算出手段から出力された輪
郭方向成分に基づいて局所的なストローク方向の変化を
抽出する局所ストローク形状抽出手段と、 前記文字切
り出し手段から出力された切り出し文字画像と前記基本
特徴抽出手段の輪郭方向算出手段から出力された輪郭方
向成分に基づいて文字パターンのループを抽出する第1
のループ抽出手段と、前記基本特徴抽出手段の背景情報
算出手段で算出した背景情報に基づいて背景次数毎に隣
接する背景画素の塊を背景ブロックとして求めると共
に、その大きさ情報と位置情報を算出する背景ブロック
抽出手段と、前記基本特徴抽出手段の背景情報算出手段
で算出した背景情報に基づいて隣接する白画素の塊を背
景ラベルとして求めラベル番号を付与すると共に、その
大きさ、位置、その背景ラベルが外接矩形のどの辺と接
するかを表わすラベル情報を算出する背景ラベル抽出手
段と、前記基本特徴抽出手段の背景情報算出手段で算出
した背景情報に基づいて文字パターンを構成するストロ
ークの端点と交点と抽出する端点・交点抽出手段と、前
記基本特徴抽出手段の背景情報算出手段で算出した背景
情報と前記端点・交点抽出手段で抽出された端点と交点
とに基づいて直線を抽出する直線抽出手段とを備えたこ
とを特徴とする請求項6、8、13、15のいずれかに
記載の光学的文字読み取り装置である。
【0051】この構成により、基本特徴抽出部で抽出さ
れた基本特徴に基づいて、局所背景特徴抽出部におい
て、特定のカテゴリ間の識別に有効である背景部の部分
的な凹凸情報を抽出し、局所ストローク形状抽出部にお
いて普遍性の高い類似カテゴリ間のストロークの屈曲方
向や直線性の相違を抽出し、第1のループ抽出部におい
て普遍性の高い特徴であるストロークのループ数を抽出
し、背景ブロック抽出部において文字背景部の構造を抽
出し、背景ラベル抽出部において文字背景部の大きさ、
外接矩形との位置関係を抽出し、端点・交点抽出部にお
いて端点・交点の情報を抽出し、直線抽出部で直線を抽
出することにより、文字の構造的な特徴をより明示的に
表す構造的特徴の効率的な抽出が可能で、これらの構造
的特徴を用いることにより統計的特徴量のみを利用する
識別方法では識別が困難な類似カテゴリ間の認識性能の
向上が可能であるという作用を有する。
【0052】本発明の請求項21に記載の発明は、前記
構造的特徴抽出部が、前記基本特徴抽出手段の背景距離
算出手段から出力された背景距離に基づいて局所的な背
景距離特徴を抽出する局所背景特徴抽出手段と、前記基
本特徴抽出手段の輪郭方向算出手段から出力された輪郭
方向成分に基づいて局所的なストローク方向の変化を抽
出する局所ストローク形状抽出手段と、前記基本特徴抽
出手段の背景情報算出手段で算出した背景情報から、背
景次数毎に隣接する背景画素の塊を背景ブロックとして
求めると共に、その大きさ情報と位置情報を算出する背
景ブロック抽出手段と、前記基本特徴抽出手段の背景情
報算出手段で算出した背景情報から、隣接する白画素の
塊を背景ラベルとして求めラベル番号を付与すると共
に、その大きさ、位置、その背景ラベルが外接矩形のど
の辺と接するかを表わすラベル情報を算出する背景ラベ
ル抽出手段と、前記基本特徴抽出手段の背景情報算出手
段で算出した背景情報に基づいて文字パターンを構成す
るストロークの端点と交点と抽出する端点・交点抽出手
段と、前記基本特徴抽出手段の背景情報算出手段で算出
した背景情報と前記端点・交点抽出手段で抽出された端
点と交点とに基づいて直線を抽出する直線抽出手段と、
前記背景ラベル抽出手段で算出したラベル情報に基づい
て文字パターンのループを抽出する第2のループ抽出手
段とを備えたことを特徴とする請求項6、8、13、1
5のいずれかに記載の光学的文字読み取り装置である。
【0053】この構成により、基本特徴抽出部で抽出さ
れた基本特徴に基づいて、局所背景特徴抽出部において
特定のカテゴリ間の識別に有効である背景部の部分的な
凹凸情報を抽出し、局所ストローク形状抽出部において
普遍性の高い類似カテゴリ間のストロークの屈曲方向や
直線性の相違を抽出し、背景ブロック抽出部において文
字背景部の構造を抽出し、背景ラベル抽出部において文
字背景部の大きさ、外接矩形との位置関係を抽出し、端
点・交点抽出部において端点・交点の情報を抽出し、直線
抽出部で直線を抽出し、第2のループ抽出部において普
遍性の高い特徴であるストロークのループ数を抽出する
ことにより、文字の構造的な特徴をより明示的に表す構
造的特徴の効率的な抽出が可能で、これらの構造的特徴
を用いることにより統計的特徴量のみを利用する識別方
法では識別が困難な類似カテゴリ間の認識性能の向上が
可能であるという作用を有する。また、ループ数をラベ
ル情報のみに基づいて抽出することにより、処理の効率
化が図れるという作用を有する。
【0054】本発明の請求項22に記載の発明は、前記
端点・交点抽出手段が、前記背景情報算出手段から出力
された垂直及び水平方向の各ラインの背景情報に基づき
文字パターンの端点及び交点の候補を抽出する端点・交
点候補抽出手段と、前記抽出された端点及び交点候補の
個々の位置関係を比較することにより不適切な端点及び
交点候補を除去して適切な端点及び交点を抽出する端点
・交点判定手段とを備えたことを特徴とする請求項20
または21記載の光学的文字読み取り装置である。
【0055】この構成により、端点・交点抽出手段にお
いて、基本特徴抽出手段の背景情報で予め抽出した背景
情報を利用することにより隣接するラインの背景情報を
比較して相違を調べるだけの簡単な処理により端点及び
交点の候補を抽出することができ、端点・交点判定部に
おいて、端点と交点候補の位置関係に基づき他の端点ま
たは交点候補との距離が近すぎる端点または交点候補を
除去することにより、ノイズによる端点または交点の誤
抽出を減少させ、カテゴリ2とカテゴリ3のような類似
カテゴリの分離に効果的な端点及び交点の情報をより高
精度に抽出できるという作用を有する。
【0056】本発明の請求項23に記載の発明は、前記
直線抽出手段が、前記背景情報算出手段から出力された
垂直及び水平方向の各ラインの背景情報に基づき黒画素
が予め定められた閾値よりも長く連続する領域を抽出す
る黒画素連続領域抽出手段と、前記黒画素連続領域抽出
手段から出力された黒画素連続領域に基づき垂直及び水
平方向の直線候補を抽出する直線候補抽出手段と、前記
端点・交点抽出手段から出力された端点及び交点の位置
情報に基づき前記直線候補抽出手段から出力された直線
候補の中から直線でないものを除去し、残った直線候補
の中から近傍の線との接続状態に応じて種類を判定する
直線判定手段とを備えたことを特徴とする請求項20ま
たは21記載の光学的文字読み取り装置である。
【0057】この構成により、黒画素連続領域抽出手段
及び直線候補抽出手段において、基本特徴抽出手段の背
景情報算出手段で予め抽出した背景情報を利用して、黒
画素の連続度及び複数ラインへの連続度を調べるだけの
簡単な処理により直線候補を抽出することができ、また
直線判定部において端点及び交点の位置情報を用いて線
の合流や分岐に伴なって発生する誤った直線候補を除去
し、残った直線候補を近傍の線との接続状態に応じて分
類することにしたことにより、水平方向の短い直線に特
徴のあるカテゴリ¥のようなカテゴリを分離に効果的な
直線を高精度に抽出できるという作用を有する。
【0058】本発明の請求項24に記載の発明は、前記
文字切り出し手段から出力された文字パターンの外接矩
形の大きさ、前記認識手段から出力された少なくとも一
つの類似度、前記背景情報算出手段で算出した背景情報
に基づく背景複雑度の中の少なくとも一つに基づいて切
り出しエラーを判定し、前記文字切り出し手段に再切り
出しの指示を与えるエラー判定手段を備えたことを特徴
とする請求項6、8、13、15、24のいずれかに記
載の光学的文字読み取り装置である。
【0059】この構成により、外接矩形が他の文字の外
接矩形と大きく相違していたり規定の外接矩形から外れ
ている場合や、類似度が他の文字の類似度に比べて極端
に低い場合や、第1位の類似度と第2位以下の類似度と
の差が少ない場合などに切り出しエラーがあると判定し
再切り出しを行うことにより、切り出し誤りを減らし、
切り出し誤りに起因する誤認識を減少させることができ
るという作用を有する。
【0060】本発明の請求項25に記載の発明は、前記
認識手段で算出されたカテゴリ類似度の大きい方から2
つのカテゴリ類似度を選択し、2番目の類似度と最大類
似度の比の値が予め設定されている閾値aより大きい
か、または最大類似度が予め設定されている閾値bより
小さいか、または前記背景情報算出手段で算出した背景
情報に基づく背景複雑度が予め設定されている閾値cよ
り大きい場合にリジェクト信号を出力し、それ以外の場
合は認識結果として最大類似度のカテゴリを出力する第
1の認識結果算出手段を備えたことを特徴とする請求項
6、8、13、15、24のいずれかに記載の光学的文
字読み取り装置である。
【0061】この構成により、最大類似度の大きさ及び
背景複雑度もリジェクト判定に利用する事により、類似
度の比だけではリジェクト困難な前処理エラー文字を効
率よくリジェクトできるという作用を有する。
【0062】本発明の請求項26に記載の発明は、複数
の文字パターンに対して、予め大きい方から2番目の類
似度と最大類似度の比、最大類似度、前記背景情報算出
手段で算出した背景情報に基づく背景複雑度、前記認識
手段が出力する認識結果を算出し、前記類似度比と前記
最大類似度と前記背景複雑度の少なくとも1つを入力と
し、前記認識結果が不正解の場合は、リジェクト信号を
出力し、正解の場合はリジェクト信号を出力しないよう
に予め学習させた階層型ニューラルネットワークで構成
した第2の認識結果算出手段を備えたことを特徴とする
請求項6、8、13、15、24のいずれかに記載の光
学的文字読み取り装置である。
【0063】この構成により、類似度の比と最大類似度
と背景複雑度の少なくとも1つを軸とした空間上でのリ
ジェクト領域と非リジェクト領域の非線形な境界を、予
め階層型ニューラルネットワークに学習させてあるの
で、より高精度なリジェクト判定処理が可能になるとい
う作用を有する。
【0064】本発明の請求項27に記載の発明は、枠罫
線と文字を含む帳票を読み取って2値画像に変換し、前
記2値画像を画像メモリに記憶し、前記2値画像から枠
罫線を抽出し、前記抽出された枠罫線から前記帳票の特
徴を表わす枠構造特徴を抽出し、予め個々の帳票の枠構
造特徴およびこの枠構造特徴を有する帳票に記載される
少なくとも1つの候補文字列を登録する枠構造参照テー
ブルを参照し、前記枠構造特徴を照合することにより前
記帳票の種別をおおまかに分類し、前記帳票内の文字読
取対象領域を検出し、前記文字読取対象領域に基づき、
前記画像メモリから文字領域を切り出し、切り出された
文字を認識し、少なくとも1つの認識結果と前記枠構造
参照テーブルに登録された候補文字列とを照合し、最終
認識結果とすることを特徴とする光学的文字読み取り方
法であり、枠構造特徴により帳票をおおまかに分類し、
その形式の帳票に記載される可能性のある候補文字列と
認識結果とを照合するという2段階の処理を行うことに
より、高速、高精度に帳票上に記載された文字を認識す
るという作用を有する。
【0065】本発明の請求項28に記載の発明は、枠罫
線と文字を含む帳票を読み取って2値画像に変換する画
像入力手段と、前記2値画像を記憶する画像メモリと、
前記2値画像から枠罫線を抽出する枠罫線抽出手段と、
前記抽出された枠罫線から前記帳票の特徴を表わす枠構
造特徴を抽出する枠構造特徴抽出手段と、予め個々の帳
票の枠構造特徴およびこの枠構造特徴を有する帳票に記
載される少なくとも1つの候補文字列を登録する枠構造
参照テーブルと、前記枠構造参照テーブルを参照し、前
記枠構造特徴を照合することにより前記帳票の種別をお
おまかに分類し、前記帳票内の文字読取対象領域を検出
する枠構造照合手段と、前記文字読取対象領域に基づ
き、前記画像メモリから文字領域を切り出す文字切り出
し手段と、切り出された文字を認識する文字認識手段と
を備えた光学的文字読み取り装置であり、枠構造特徴に
より帳票をおおまかに分類し、その形式の帳票に記載さ
れる可能性のある候補文字列と認識結果とを照合すると
いう2段階の処理を行うことにより、高速、高精度に帳
票上に記載された文字を認識するという作用を有する。
【0066】本発明の請求項29に記載の発明は、前記
文字認識手段より出力される少なくとも1つの認識結果
と前記枠構造参照テーブルに登録された候補文字列とを
照合して最終認識結果とする後処理手段を備えた請求項
28記載の光学的文字読み取り装置であり、前記文字認
識手段による認識結果が間違いがあっても、候補文字列
の中から最も確からしい文字列を選択できるという作用
を有する。
【0067】本発明の請求項30に記載の発明は、搬送
されてくる帳票に記載された文字列を請求項28または
29記載の帳票文書認識装置により認識する帳票文書認
識手段と、前記帳票文書認識手段により認識された文字
列を識別コード変換テーブルを参照し、識別コードに変
換する識別コード変換手段と、前記識別コードを前記帳
票上に印字する識別コード印字手段と、前記識別コード
に従って前記帳票を処理する処理手段とを備えた光学的
文字読み取り装置であり、帳票の仕訳を効率的に行える
という作用を有する。
【0068】本発明の請求項31に記載の発明は、前記
識別コードに代えて、または前記識別コードとともに、
前記識別コードに対応するバーコードを印字する手段を
備えた請求項30記載の光学的文字読み取り装置であ
り、バーコードシステムに対応できるという作用を有す
る。
【0069】(実施の形態1)以下、本発明の第1の実
施の形態を図面に基づいて説明する。図1は本発明の第
1の実施の形態における光学的文字読取装置のブロック
図を示すものである。図1において、1は文字切り出し
部で、文字枠線を含む文字列データを入力して、文字枠
線と文字列パターンを分離し、分離された文字列パター
ンから個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさを経路11を経由して出
力し、切り出し文字画像を経路12を経由して出力す
る。2は基本特徴抽出部(図2参照)で、第1の文字切
り出し部1から経路12を経由して出力された各文字の
切り出し画像に基づいて、文字パターンの輪郭方向成
分、外接矩形の各辺から文字パターンまでの背景距離、
水平及び垂直ライン毎の文字部以外の白画素の連続であ
る背景情報を求め、輪郭方向成分を経路13、背景距離
を経路14、背景情報を経路15を経由して出力して出
力する。3は統計的特徴抽出部(図3参照)で、第1の
文字切り出し部1から経路12を経由して出力した文字
パターンの切り出し画像と、基本特徴抽出部2から経路
13を経由して出力した輪郭方向成分及び経路14を経
由して出力した背景距離に基づいて統計的特徴量を求め
る。4は認識部で、統計的特徴抽出部3から出力した統
計的特徴量に基づいて、文字パターンの各カテゴリに対
する類似度を求め、類似度の大きい順に複数のカテゴリ
類似度と少なくとの1つのカテゴリを出力する。5は第
1の構造的特徴抽出部(図4参照)で、基本特徴抽出部
2から経路13を経由して出力した輪郭方向成分、経路
14を経由して出力した背景距離、経路15を経由して
出力した背景情報に基づいて、構造的特徴を求める。6
は字種判定部で、文字切り出し部1から経路12を経由
して出力した外接矩形の大きさに基づいて、字種が手書
きか活字であるかを判定する。7は第1の構造識別部7
(図5参照)で、文字切り出し部1から出力された文字
パターンの外接矩形の大きさ、認識部4から出力したカ
テゴリ、第1の構造的特徴抽出部5から出力した構造的
特徴、及び字種判定部6から出力した字種判定結果に基
づいて文字パターンの属する最終的なカテゴリを決定す
る。
【0070】図2は基本特徴抽出部2の構成を具体的に
示すブロック図である。21は輪郭点抽出部で、文字切
り出し部1から経路11を経由して出力した外接矩形の
大きさと文字切り出し部1から経路12を経由して出力
した切り出し画像から文字パターンの輪郭点を抽出す
る。22は輪郭方向算出部で、輪郭点抽出部21から出
力した文字パターンの輪郭点の隣接関係に基づいて各輪
郭点の輪郭方向成分を求める。23は背景距離算出部
で、輪郭点抽出部21から出力した文字パターンの輪郭
点の位置に基づいて文字パターンの外接矩形の各辺から
文字パターンまでの背景距離を求める。24は背景情報
算出部で、輪郭点抽出部21から出力した文字パターン
の輪郭点の位置に基づいて、水平及び垂直方向のライン
毎に一定画素以上連続する白画素の連続(背景)する長
さ・位置情報とその背景の走査方向に沿った発生順番で
ある背景次数を算出する。
【0071】図3は統計的特徴抽出部3の構成を具体的
に示すブロック図である。31は両方向ブロック分割部
で、文字切り出し部1から経路11を経由して出力した
切り出し画像に基づいて切り出し領域全体を水平・垂直
の両方向で分割する。32は水平方向ブロック分割部
で、文字切り出し部1から経路11を経由して出力した
切り出し画像に基づいて切り出し領域を水平方向で分割
する。33は垂直方向ブロック分割部で、文字切り出し
部1から経路11を経由して出力した切り出し画像に基
づいて切り出し領域を垂直方向で分割する。34は輪郭
方向集計部で、両方向ブロック分割部31で分割したブ
ロック毎かつ輪郭方向毎に、基本特徴抽出部2から経路
13を経由して出力した各画素の輪郭方向成分の個数を
集計する。35は輪郭方向正規化部で、両方向ブロック
分割部31で分割したブロック毎に、輪郭方向集計部3
4でブロック内で集計した輪郭方向成分をブロックの大
きさで割って正規化して、統計的輪郭方向統計量を求め
る。36は外郭方向集計部で、水平方向ブロック分割部
32で分割したブロック毎と垂直方向ブロック分割部3
3で分割したブロック毎の両方について、ブロック分割
境界線に垂直な外接矩形の辺から、基本特徴抽出部2か
ら経路13を経由して出力した輪郭方向成分の中で、ブ
ロック分割境界線に平行に走査して最初に存在する文字
パターン画素の輪郭方向成分毎の輪郭方向成分の個数を
集計する。37は外郭方向正規化部で、水平方向ブロッ
ク分割部32で分割したブロック毎と垂直方向ブロック
分割部33で分割したブロック毎の両方について、外郭
方向集計部36で集計した輪郭方向成分(外郭方向成
分)をブロックの大きさで割って正規化して、統計的外
郭方向統計量を求める。38は背景距離集計部で、水平
方向ブロック分割部32で分割した各々のブロックの、
ブロック分割境界線に垂直な外接矩形の各々の辺と垂直
方向ブロック分割部33で分割した各々のブロックのブ
ロック分割境界線に垂直な外接矩形の各々の辺につい
て、基本特徴抽出部2から経路14を経由して出力した
背景距離の中で、前記外接矩形の各々の辺からブロック
分割境界線に平行な方向に計測した背景距離を選択して
集計する。39は背景距離正規化部で、背景距離集計部
38で集計した背景距離をブロック境界線に垂直な外接
矩形の辺の長さで割って正規化して、統計的背景距離特
徴を求める。
【0072】図4は第1の構造的特徴抽出部5の構成を
具体的に示すブロック図である。41は局所背景特徴抽
出部で、基本特徴抽出部2から経路13を経由して出力
した背景距離に基づいて、類似カテゴリを識別するため
の局所的な背景距離の変化と距離の相違を抽出する。4
2は局所ストローク形状抽出部で、基本特徴抽出部2か
ら経路14を経由して出力した輪郭方向成分に基づい
て、類似カテゴリを識別するための局所的なストローク
の傾きの変化を抽出する。43はループ抽出部で、第1
の文字切り出し部1から出力した切り出し画像と基本特
徴抽出部2から経路14を経由して出力した輪郭方向成
分に基づいて、文字パターンのストロークによって発生
するループを抽出する。44は端点・交点抽出部で、基
本特徴抽出部2から経路15を経由して出力した背景情
報に基づいて、垂直と水平方向の両方について、隣接す
るラインの背景情報の相違から、文字パターンを構成す
るストロークの端点と交点を抽出する。45は直線抽出
部で、基本特徴抽出部2から経路15を経由して出力し
た背景情報に基づいて、文字パターンを構成する直線候
補を抽出し、端点・交点抽出部44から出力した端点と
交点の位置情報を利用して、直線候補の種類を判定す
る。46は背景ブロック抽出部で、前記基本特徴抽出部
2の背景情報算出部24で算出し経路15を経由して出
力した背景情報に基づいて、背景次数毎に隣接する背景
画素の塊を背景ブロックとして求めると共に、その大き
さ情報と位置情報を算出する。47は背景ラベル抽出部
で、前記基本特徴抽出部2の背景情報算出部24で算出
し経路15を経由して出力した背景情報に基づいて、隣
接する白画素の塊を背景ラベルとして求めラベル番号を
付与すると共に、その大きさ、位置、その背景ラベルが
外接矩形のどの辺と接するかを表わすラベル情報を算出
する。
【0073】図5は第1の構造識別部7の構成を具体的
に示すブロック図である。51は第1の活字処理部(図
6参照)で、字種判定部6において文字パターンが活字
と判定された場合に、第1の文字切り出し部から出力さ
れた文字パターンに対する外接矩形の大きさと認識部4
で判定したカテゴリに基づいて第1の構造的特徴抽出部
5で抽出した構造的特徴を選択して最終的なカテゴリを
判定する。52は第1の手書き処理部(図7参照)で、
字種判定部6において文字パターンが手書きと判定され
た場合に、第1の文字切り出し部から出力された文字パ
ターンに対する外接矩形の大きさと認識部4で判定した
カテゴリに基づいて第1の構造的特徴抽出部5で抽出し
た構造的特徴を選択して最終的なカテゴリを判定する。
【0074】図6は第1の活字処理部51の構成を具体
的に示すブロック図である。61は第1の外接矩形カテ
ゴリ判定部で、文字切り出し部1から出力された外接矩
形の大きさによってある1つのカテゴリに判定できる可
能性が高い場合に、前記カテゴリが認識部4から出力さ
れたカテゴリの中に含まれている場合は、前記カテゴリ
に決定する。62は第1の認識依存特徴選択部で、第1
の外接矩形カテゴリ判定部61でカテゴリ判定できなか
った文字に対して、認識部4から出力されたカテゴリに
基づいて第1の構造的特徴抽出部5から出力された複数
の構造的特徴の中で有効な構造的特徴を選択する。63
は第1の選択構造的特徴識別部で、第1の認識依存特徴
選択部62で選択した構造的特徴を利用して最終的なカ
テゴリ判定を行う。
【0075】図7は第1の手書き処理部52の構成を具
体的に示すブロック図である。71は第2の外接矩形カ
テゴリ判定部で、文字切り出し部1から出力された外接
矩形の大きさによってある1つのカテゴリに判定できる
可能性が高い場合に、前記カテゴリが認識部4から出力
されたカテゴリの中に含まれている場合は、前記カテゴ
リに決定する。72は第2の認識依存特徴選択部で、第
2の外接矩形カテゴリ判定部71でカテゴリ判定できな
かった文字に対して、認識部4から出力されたカテゴリ
に基づいて第1の構造的特徴抽出部5から出力された複
数の構造的特徴の中で有効な構造的特徴を選択する。7
3は第2の選択構造的特徴識別部で、認識依存特徴選択
部72で選択した構造的特徴を利用して最終的なカテゴ
リ判定を行う。
【0076】図8は端点・交点抽出部44の構成を具体
的に示すブロック図である。81は端点・交点候補抽出
部で、背景情報算出部23から出力される垂直および水
平方向の各ラインの白画素連続領域情報に基づいて文字
パターンの端点および交点の候補を抽出する。82は端
点・交点判定部で、端点・交点候補抽出部81から出力
される端点および交点の候補の個々の位置関係を比較し
て、端点と別の端点あるいは端点と交点の距離が近い場
合は、端点と交点を除去する。
【0077】図9は直線抽出部45の構成を具体的に示
すブロック図である。91は黒画素連続領域抽出部で、
背景情報算出部23から出力される垂直および水平方向
の各ラインの白画素連続領域情報に基づいて、黒画素が
予め定められた閾値より長く連続する領域を求め、領域
の始点と終点を記憶する。92は直線候補抽出部で、黒
画素連続領域抽出部91から出力される黒画素連続領域
に基づいて垂直および水平方向の直線候補を抽出する。
93は直線判定部で、直線候補抽出部92から出力され
る直線候補と端点・交点抽出部44から出力される端点
および交点の位置情報とを照合して、直線候補から直線
ではないものを除去し、残った直線候補から近傍の線と
の接続状態に応じて直線の種類を判定する。
【0078】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。以下では、
認識対象が主に数字の場合について説明しているが、実
際の認識対象は数字以外の文字でも構わない。まず、文
字切り出し部1では、図10に示すように、複数の枠線
と文字文字列データで構成される多値の原画像におい
て、枠線と文字列を分離し文字列を抽出した後、1文字
単位に切り出し、各文字の外接矩形で囲まれた切り出し
画像と外接矩形の幅と高さを求め、外接矩形の幅と高さ
を経路11を経由して出力し、白黒に2値化した切り出
し画像を経路12を経由して出力する。基本特徴抽出部
2の輪郭点抽出部21では、図11に示すように、文字
切り出し部1から出力した切り出し文字画像から輪郭点
を抽出し、輪郭画像を求める。具体的な輪郭点抽出方法
としては、任意の黒画素に対して縦横斜方向に隣接する
画素が全て黒の場合に、前記任意の黒画素を白に置換
し、最終的に残った黒画素を輪郭点とする方法がある。
【0079】輪郭方向算出部22では、輪郭方向を図1
2のように符号化して、輪郭点抽出部21で抽出した輪
郭画像に対して、図13に示すようなマスクパターンと
のマッチングによって中心画素の輪郭点の方向を決定す
る。例えば、図13(a)(b)の3×3マスクにおいて灰色
で示した画素は白画素もしくは黒画素のどちらでも構わ
ず、その他の白や黒で示した画素は必ず同一の色にマッ
チングする必要があるマッチング方法では、輪郭画像の
任意の3×3領域で図13(a) の3×3マスクと同一の
パターンが存在する場合は、前記3×3領域の中央画素
を7に符号化し、図13(b) と同一の場合は、4に符号
化する。なお、輪郭方向の符号化数は8以外でも良く、
4や16でも構わない。また、輪郭方向を決定するパタ
ーンマッチングのマスクの大きさも3×3以外でも良
く、輪郭方向の符号化数に応じて2×2や5×5でも構
わない。
【0080】背景距離算出部23では、輪郭点抽出部2
1で抽出した輪郭画像に対して、図14(a) に示すよう
に外接矩形の左辺の地点を原点として、画像の各行につ
いて右方向に走査して最初に発見される輪郭画素までの
距離と、図14(b) に示すように外接矩形の右辺の地点
を原点として、画像の各行について左方向に走査して最
初に発見される輪郭画素までの距離と、図14(c) に示
すように外接矩形の上辺の地点を原点として、画像の各
列について下方向に走査して最初に発見される輪郭画素
までの距離と、図14(d) に示すように外接矩形の下辺
の地点を原点として、画像の各列について上方向に走査
して最初に発見される輪郭画素までの距離を全て求め
る。
【0081】背景情報算出部24では、輪郭点抽出部2
1で抽出した輪郭画像に対して、図15に示すように外
接矩形の左辺から水平方向に走査し白画素の連続である
文字背景を検出する。ラインaの場合は、外接矩形左端
と1番目の輪郭点、1番目の輪郭点と2番目の輪郭点、
2番目の輪郭点と外接矩形右端に挟まれる白画素の連続
をそれぞれ0次背景、1次背景とし、それぞれの連続長
(x、y)、位置情報としての開始点、終了点を算出す
る。ラインbの場合のように、外接矩形端と輪郭点に挟
まれる領域については、白画素の連続が0であっても背
景と見なし、この場合背景次数は2(背景数は3)とな
る。同様にして、水平方向の外接矩形右端からの走査、
垂直方向の外接矩形上・下端からの走査についても同様
である。ここで、輪郭点に挟まれる背景の検出時に、一
定以上白画素が連続する場合のみ背景と見なし背景次数
にカウントするという制限を設け背景のノイズ除去を行
っても良い。
【0082】次に統計距離特徴抽出部3の両方向ブロッ
ク分割部31では、文字切り出し部1から入力される切
り出し画像を複数の領域に分割する。具体的には図16
に示すように、重心分割を行って各領域に含まれる黒画
素数が均等になるように水平・垂直方向に複数の領域に
分割する。なお、領域分割方法としては重心分割以外で
も良く、重心分割以外の不均等分割方法や均等分割方法
でも構わない。水平方向ブロック分割部32や垂直方向
ブロック分割部33でも同様の方法で分割を行う。な
お、両方向ブロック分割部31における水平方向の分割
位置と水平方向ブロック分割部32における分割位置を
同一にし、両方向ブロック分割部31における垂直方向
の分割位置と垂直方向ブロック分割部33における分割
位置を同一にしても構わない。
【0083】輪郭方向集計部34では、基本特徴抽出部
2から経路13を経由して出力した輪郭方向成分につい
て、両方向ブロック分割部31で分割したブロック単位
かつ輪郭方向毎の個数を計算する。例えば図17(a) の
輪郭方向画像において、太線をブロック境界とし、その
中の各々の数字は各画素の輪郭方向成分の符号を表すも
のとすると、ブロック単位かつ輪郭方向毎に数を集計し
た結果は図17(b) 〜(e) のようになる。
【0084】輪郭方向正規化部35では、輪郭方向集計
部34で集計したブロック毎かつ輪郭方向毎の輪郭方向
成分の個数を、両方向ブロック分割部から出力した輪郭
方向集計対象のブロックの大きさで割って正規化して、
輪郭方向統計特徴量を求める。ブロックの大きさを表す
ものとしては、高さまたは幅のどちらか長い方や、高さ
と幅から求められる面積がある。なお、正規化の前に隣
接する輪郭方向成分の個数を重み付けして統合しても構
わない。
【0085】外郭方向集計部36では、基本特徴抽出部
2から経路13を経由して出力した輪郭方向成分につい
て、水平方向ブロック分割部32及び垂直方向ブロック
分割部33で分割したブロック毎に、ブロック分割境界
線に平行に走査して最初に存在する文字パターン画素の
輪郭方向成分(外郭方向成分)毎の輪郭方向成分の個数
を計算する。例えば水平方向ブロック分割部32で分割
された、あるブロックの輪郭方向画像である図18にお
いて、各々の数字は各画素の輪郭方向成分の符号を表す
ものとし、符号−は輪郭点でない画素とし、走査方向を
矢印の通り左端から右方向とすると、ブロック分割境界
線に平行に走査して最初に存在する文字パターン画素は
網掛けされた画素であり、前記網掛けされた画素全体の
輪郭方向成分(外郭方向成分)の個数を輪郭方向毎(例
では0〜3)に集計する。水平方向ブロック分割部で分
割されたブロックにおいては、左端から右方向と、右端
から左方向の二方向で走査し、垂直方向ブロック分割部
で分割されたブロックにおいては、上端から下方向と、
下端から上方向の二方向で走査する。
【0086】外郭方向正規化部37では、外郭方向集計
部36で集計したブロック毎かつ輪郭方向毎の外郭方向
成分の個数を、水平方向ブロック分割部32または垂直
方向ブロック分割部33から出力した外郭方向集計対象
のブロックの大きさで割って正規化して、外郭方向統計
特徴量を求める。
【0087】背景距離合計部38では、基本特徴抽出部
2から経路14を経由して出力した背景距離について、
水平方向ブロック分割部32で分割したブロックでは、
左端から右方向への背景距離の合計と、右端から左方向
への背景距離の合計を計算し、垂直方向ブロック分割部
33で分割したブロックでは、上端から下方向への背景
距離の合計と、下端から上方向への背景距離の合計を計
算する。
【0088】背景距離正規化部39では、背景距離合計
部38から出力したブロック毎の合計四方向の背景距離
の合計を、水平方向ブロック分割部32または垂直方向
ブロック分割部33から出力した外郭方向集計対象のブ
ロックの大きさで割って正規化して、背景距離統計特徴
量を求める。
【0089】次に認識部4では、統計的特徴抽出部3で
求めた輪郭方向統計特徴量と外郭方向統計特徴量と背景
距離統計特徴量に基づいて、文字パターンが属するカテ
ゴリを求める。図19では、学習完了後の階層型ニュー
ラルネットワークを用いて認識部4を構成する場合を示
している。第1層のニューロンに輪郭方向統計特徴量、
外郭方向統計特徴量、及び背景距離統計特徴量を入力
し、中間層を経由して最終層へ信号を流すことによって
各々の最終層ニューロンから各カテゴリの類似度に相当
する出力信号が発生するようになっており、出力信号の
大きい方から、出力値とそのカテゴリが認識部4から出
力される。図19の例では、出力カテゴリ数を2とする
と、左端の最終層ニューロン出力が最大で、右端の最終
層ニューロン出力が2番目であるため、認識部4から
は、それらの出力値とカテゴリ(カテゴリ0、2)が出
力される。なお、認識部4を、図19以外の階層型ニュ
ーラルネットワークや、階層型ニューラルネットワーク
以外の統計的特徴量を利用して識別カテゴリを出力でき
る認識手段で構成しても構わない。
【0090】次に第1の構造的特徴抽出部5の局所特徴
抽出部41では、基本特徴抽出部2から経路13を経由
して出力した背景距離に基づいて、類似カテゴリを分離
するための局所的な特徴を求める。図20(a) では、網
掛け領域(中央領域)において外接矩形の左端から見た
背景距離の外接矩形幅に対する比率が第1の閾値より大
きくなる回数を計数し、最終的にその回数が第2の閾値
を超えた場合は、中央左背景が凸であると判定する。類
似カテゴリであるカテゴリ0、カテゴリ6、カテゴリ
8、カテゴリ9では中央左背景が凸であるとは通常は判
定されないため、中央左背景が凸であるという構造的特
徴はカテゴリ3の分離に有効である。同様の抽出方法を
用いることで、図20(b) では、カテゴリ6(及びカテ
ゴリ5)の有力な抽出材料である上部右背景の凸を判定
し、図20(c) では、カテゴリ9(及びカテゴリ5)の
有力な抽出材料である下部左背景の凸を判定することを
示している。なお、実際の場合の凸背景の抽出領域・方
向は、認識部4の誤りを分析して、その誤りを減少する
ものを採用しても構わない。また、上記の方法以外に
も、例えば近傍の背景距離の変化の大きさから外側スト
ロークの曲線性(直線性)を判定するという方法があ
り、例えば図20(d) は背景距離の変化の大きさが一定
に近いために、上部ストロークは直線として判定され、
図20(e) は背景距離の変化の大きさが場所によってか
なり異なるため、上部ストロークは曲線として判定され
るので、カテゴリ5とカテゴリ6の分離に有効な構造的
特徴を抽出できる。また、第1の構造識別部7で効果的
なカテゴリ判定を行わせるために、抽出する構造的特徴
を手書き用、活字用、手書き・活字兼用に分けても構わ
ない。
【0091】局所ストローク形状抽出部42では、基本
特徴抽出部2から経路14を経由して出力した輪郭方向
成分から、局所領域中の輪郭線を追跡して、追跡してい
る輪郭線上の輪郭方向成分の分布を調べることで、類似
カテゴリを分離するための局所的な構造的特徴を求め
る。図21は、中央網掛け領域中の輪郭線上の輪郭方向
成分から輪郭線を追跡して、輪郭線の形状が上に凸か下
に凸であるかを調べることで、カテゴリ6とカテゴリ8
の分離に有効な構造的特徴を抽出することを表してい
る。図21の例では、図21(a) のカテゴリ6では上下
輪郭線の形状は両方とも上に凸であり、図21(b) のカ
テゴリ8では上の輪郭線の形状は下に凸であり、下の輪
郭線の形状は上に凸であると判定される。具体的な輪郭
線形状の判定方法の例としては、輪郭方向成分を表す符
号として図12の符号を用いると、局所領域の左側で
5、6、7、中央で0、1、7、右側で1、2、3の輪
郭方向成分符号が多く存在する場合は、輪郭線の形状が
上に凸であると判定し、左側で1、2、3、中央で0、
1、7、右側で5、6、7が多く存在する場合は、輪郭
線の形状が下に凸であると判定するという方法がある。
【0092】第1のループ抽出部43では、文字切り出
し部1から出力した切り出し画像と基本特徴抽出部2か
ら経路14を経由して出力した輪郭方向成分に基づい
て、文字パターンのストロークによって発生するループ
を抽出する。具体的な抽出方法は、輪郭方向成分を持つ
画素から輪郭線を追跡して、最終的に追跡開始地点に戻
ったものを輪郭線ループとし、次に切り出し画像を参照
して、輪郭線ループの内部に白画素が存在すればストロ
ークのループとして抽出する。図22の例において、数
字は図12で示した輪郭方向成分符号、符号−は白画
素、符号+は黒画素とすると、図22(a) の網掛けされ
た符号−がストロークのループとして抽出され、図22
(b) は輪郭線ループの内側に符号−が存在しないためス
トロークのループが存在しないことになる。ここで、一
定以上白画素が存在する場合のみループとして抽出する
という制限を設けノイズ除去を行っても良い。
【0093】端点・交点抽出部44の端点・交点候補抽
出部81では、基本特徴抽出部2から経路15を経由し
て出力した垂直および水平方向の各ラインの背景情報に
基づいて、隣接するラインの白画素連続領域の数や位置
関係を比較して、端点として図24(a) のような発生点
や図24(b) のような消滅点を、交点として図24(c)
のような合流点や図24(d) のような分岐点を抽出
し、端点・交点判定部82において、端点および交点候
補の各々の位置関係から不適切な端点および交点候補を
除去して、最終的な端点および交点を得る。端点・交点
候補抽出部81における具体的な端点および交点候補の
抽出方法を以下に説明する。図24(a) のように前ライ
ンでは白画素の領域に後ラインでは黒画素が発生してい
る場合は「発生」とし、図24(b) のように、前のライ
ンでは黒画素の領域が後ラインでは全て白画素になって
いる場合は「消滅」とする。また、図24(c) のよう
に、あるライン(前ライン)上の2個の黒画素連続領域
が後ライン上で1個に合流している場合は「合流」と
し、逆に図24(d) のように、1個の黒画素連続領域が
2個に分岐している場合は「分岐」とする。以上の「合
流」「分岐」「発生」「消滅」に分類された点を、端点
および交点候補とし、垂直方向ラインの走査と水平方向
ラインの走査に分けて出力する。
【0094】同じ端点・交点抽出部44の端点・交点判
定部82では、端点・交点候補抽出部81から出力され
る同一方向の走査で得られた端点および交点候補の各々
の位置関係を調べ、端点候補と端点候補、および端点候
補と交点候補の距離が近い場合は、端点や交点の候補を
除去する。例えば、外接矩形が大きい(例:高さ・幅が
50画素以上)文字パターンについて、図25(a) のよ
うにある端点候補と別の同じ種類の端点候補(「発生」
ならば「発生」、「消滅」ならば「消滅」)の距離が非
常に近く、その2点の間に交点候補が存在(端点が「発
生」なら「合流」、「消滅」なら「分岐」)する場合
や、図25(b) のようにある端点候補の近傍かつすぐ隣
のラインに交点候補があり、その2点の間に別の種類の
端点(「発生」ならば「消滅」、「消滅」ならば「発
生」)がない場合は、端点および交点を除去する。残っ
た端点候補を端点、交点候補を交点と決定する。
【0095】直線抽出部45において、黒画素連続領域
抽出部91では、基本特徴抽出部2から経路15を経由
して出力した垂直および水平方向の各ラインの背景情報
に基づいて、黒画素がライン上で予め定められた閾値
(黒画素ライン上連続閾値)以上連続して存在している
場合は、その始点および終点の座標を記録する。例え
ば、黒画素ライン上連続閾値を10とすると、図26
(a)では2行目〜4行目が閾値以上である。
【0096】直線候補抽出部92では、黒画素連続領域
抽出部91から出力される黒画素連続領域の始点および
終点の座標から、黒画素連続領域が予め定められた閾値
以上のライン数(連続ライン数閾値)で連続している場
合を直線と判定する。例えば、黒画素ライン上連続閾値
を10、連続ライン数閾値を3とすると、図26(a)は
(水平方向の)直線と判定され、図26(b) は直線と判
定されない。連続ライン数閾値を導入して判定を行うこ
とによって、手書きの線の太さを考慮し、図26(b) の
ような枠やノイズ等による本来の線以外の直線による影
響を除くことができる。
【0097】背景ブロック抽出部46では、背景情報算
出部24で算出されたライン毎の背景情報から、隣接す
る同一次数の背景を結合することにより背景ブロックを
検出する。外接矩形左端から走査した場合、図23に示
すように、0次背景については第1ブロックと、第2ブ
ロックが検出され、1次背景については、第1ブロック
が検出される。このとき、背景ブロックの大きさ情報と
して背景ブロックを構成する画素数、位置情報として背
景ブロックに外接する矩形の左上と右下の座標が算出さ
れる。
【0098】背景ラベル抽出部47では、背景情報算出
部24で算出されたライン毎の背景情報から、隣接する
白画素を結合することにより背景ラベルを検出する。外
接矩形左端から走査した場合、図32に示すように、4
つの背景ラベルが検出されラベル番号が付与される。こ
のとき、ラベル情報として背景ラベルを構成する画素
数、位置情報として背景ラベルに外接する矩形の左上と
右下の座標、文字外接矩形の各辺との接触の有無が算出
される。
【0099】次に字種判定部6では、文字切り出し部1
から経路11を経由して出力した文字パターンの外接矩
形の幅と高さの内、高さのばらつきの大きさで字種が手
書きか活字かを判定する。具体的には、振り込み伝票の
場合は同一欄に記入された文字は基本的に同一字体であ
るため、同一欄に記入された文字全体の高さのばらつき
を調べ、高さのばらつきが大きい場合は全て手書き文字
と判定し、ばらつきが小さい場合は全て活字文字と判定
する。また、その他の場合は伝票の同一欄に相当する領
域に存在する文字全体の高さのばらつきを調べ、同様の
判定を行う。伝票の同一欄に相当する領域の例として
は、文書や郵便葉書住所欄の一行分(あるいは一列分)
がある。
【0100】次に第1の構造識別部7の第1の活字処理
部51の第1の外接矩形カテゴリ判定部61では、文字
切り出し部1から出力された外接矩形の大きさによって
ある1つのカテゴリに判定できる可能性が高い場合に、
前記カテゴリが認識部4から出力されたカテゴリの中に
含まれている場合は、前記カテゴリに決定する。具体的
な例を挙げると、図27(a) に示すようなカテゴリ1
は、図27(b) のカテゴリ5に比べると外接矩形の横幅
が非常に狭く、また他のカテゴリの数字も図27(b) と
同程度の横幅であるため、外接矩形の幅が極端に狭い数
字はカテゴリ1に強制的に修正する方法がある。
【0101】第1の認識依存特徴選択部62では、第1
の外接矩形カテゴリ判定部61で判定できない文字に対
して認識部4から出力されたカテゴリに基づいて第1の
構造的特徴抽出部5から出力された複数の構造的特徴の
中で有効な構造的特徴を選択する。具体的な例として、
図28の右上部背景が閉じる寸前のカテゴリ6は統計的
特徴を用いた認識方法ではカテゴリ8に誤認識される傾
向が強いため、認識部4で第1位がカテゴリ8であると
判定された場合は、局所ストローク形状抽出部42及び
ループ抽出部43で抽出される構造的特徴を選択し、更
に局所ストローク特徴42で抽出される複数の構造的特
徴の中から図21の構造的特徴を選択する。また、認識
部4で認識上位から順番にカテゴリ3及びカテゴリ9が
出力された場合は、局所背景特徴抽出部41から出力さ
れた構造的特徴の中で図20(a)(b)(c)を選択する。
【0102】第1の選択構造的特徴識別部63では、第
1の認識依存特徴選択部で選択された構造的特徴に基づ
いて最終的なカテゴリ判定を行う。具体的な例として、
図28の文字に関しては、選択された図21の局所スト
ローク特徴とループ特徴を用い、以下の 1 2 の両方の
判定方法でカテゴリを判定することにより判定の信頼性
を高める。両方の判定方法で判定結果が同一の場合はそ
のカテゴリに決定し、逆に判定結果が異なっていた場合
は、認識部4で判定されたカテゴリに決定する。 1 ループ特徴を用い、ループ数が0なら、カテゴリ3
と推定。ループ数が1なら、ループ位置が中央より上に
あればカテゴリ9に、中央より下にあればカテゴリ6と
推定。ループ数が2なら、カテゴリ8と推定。 2 局所ストローク特徴を用い、中央部の上下ストロー
クが共に上に凸なら、カテゴリ6と推定。上ストローク
が下に凸、下ストロークが上に凸なら、カテゴリ3かカ
テゴリ8と推定。上下ストロークが共に下に凸なら、カ
テゴリ9と推定。
【0103】また、図20(a)(b)(c) の文字に対して
は、まず図20(a) の中央左背景が凸という特徴が第1
の構造的特徴抽出部5で抽出されているかどうかを調べ
る。抽出されていた場合はカテゴリ3に最終決定し、そ
うでない場合は、次に図20(c) の下部左背景の凸が
抽出されているかどうかを調べる。抽出されていた場合
はカテゴリ9に最終決定し、そうでない場合は次に図2
0(b) についても同様の調査を行う。図20(b) の特徴
が抽出されていた場合はカテゴリ6に、そうでない場合
はカテゴリ8に最終決定する。また、認識最上位から順
番にカテゴリ5及びカテゴリ6の場合は、図20(c) の
下部左背景の凸や図20(d) の上部ストロークの直線性
が抽出されているかを調べて、最終的なカテゴリを決定
する。他のカテゴリについても同様に認識部4から出力
されたカテゴリに基づいて第1の構造的特徴抽出部5で
抽出される特徴を選択して、最終的なカテゴリを決定す
る。
【0104】なお、認識部4から出力されるカテゴリに
よっては第1の活字処理部51で処理を行わず、認識部
4から出力された認識結果のカテゴリをそのまま最終的
なカテゴリとして構わない。また、認識部4から認識保
留信号が出力され、かつ第1の活字処理部51でどの構
造的特徴にも当てはまらないことが判明した場合は、最
終的なカテゴリを決定せず、リジェクト(読み取り拒
否)としても構わない。
【0105】次に第1の構造識別部7の第1の手書き処
理部52の第2の外接矩形カテゴリ判定部71では、文
字切り出し部1から出力された外接矩形の大きさによっ
てある1つのカテゴリに判定できる可能性が高い場合
に、前記カテゴリが認識部4から出力されたカテゴリの
中に含まれている場合は、前記カテゴリに決定する。第
1の手書き処理部52の第2の認識依存特徴選択部72
では字種判定部6において文字パターンが手書きと判定
された場合に、認識部4から出力されたカテゴリに基づ
いて第1の構造的特徴抽出部5から出力された複数の構
造的特徴の中で有効な構造的特徴を選択する。具体的な
例として、手書きのカテゴリ3は統計的特徴を用いた認
識方法ではカテゴリ8に誤認識する傾向が強いため、認
識部4で第1候補(最大類似度のカテゴリ)がカテゴリ
8で、第2候補(類似度が2番目のカテゴリ)がカテゴ
リ3であると判定された場合は、背景ブロック抽出部4
6及びループ抽出部43で抽出される構造的特徴を選択
する。また、ループ個数、大きさ、位置から判断して認
識結果が明らかに矛盾する場合は、第1のループ抽出部
43で抽出される構造的特徴を選択する。第2の選択構
造的特徴識別部73では、第2の認識依存特徴選択部7
2で選択された構造的特徴に基づいて最終的なカテゴリ
判定を行う。
【0106】具体的な例として、図29(a)(b)に代表さ
れる手書きのカテゴリ2とカテゴリ3の文字は、お互い
に混同される可能性が高く、認識部4の認識結果の第1
位がカテゴリ2で第2位がカテゴリ3、またはその反対
になっていることが多い。このような認識結果でかつ字
種判定部6で手書き判定されている場合は、端点・交点
抽出部44から出力される水平方向の発生点(端点)の
数や位置の違いによって判定する。例えば、上下領域に
それぞれ1個、合計2個の発生点がある場合はカテゴリ
2に決定し、上中下領域にそれぞれ1個、合計3個の発
生点がある場合はカテゴリ3に決定する。また、図30
(a) の形状の手書きのカテゴリ¥、図30(b) の形状の
手書きのカテゴリ7、図30(c) の形状の手書きのカテ
ゴリ9が多く見られ、これらの形状が類似しているた
め、認識部4では図30(a) のカテゴリ¥はカテゴリ7
やカテゴリ9に誤って認識されていることが多い。この
ような誤りに対しては、直線抽出部45でカテゴリ¥の
中央部に存在する2本の水平線を抽出することで、カテ
ゴリ7やカテゴリ9と分離することが可能である。ま
た、図28の右上部背景が閉じる寸前のカテゴリ6は、
統計的特徴を用いた認識方法ではカテゴリ8に誤認識さ
れる傾向が強いため、認識部4で第1位がカテゴリ8で
あると判定された場合は、局所ストローク形状抽出部4
2及びループ抽出部43で抽出される構造的特徴を選択
し、更に局所ストローク特徴42で抽出される複数の構
造的特徴の中から図21の構造的特徴を選択する。ま
た、認識部4で認識上位から順番にカテゴリ3及びカテ
ゴリ9が出力される場合は、局所背景特徴抽出部41か
ら出力される構造的特徴の中で図20(a)(b)(c) を選択
する。
【0107】また、図31(a)に示すようなカテゴリ
3の認識結果がカテゴリ8になっているような場合は、
前記選択された構造的特徴量からループ数、水平0次背
景ブロックの大きさ、最大水平0次背景長に注目し、以
下の(1)(2)(3)(4)の条件を満たす場合は、
認識結果を第2候補のカテゴリ3に修正し最終認識結果
とする。 (1)認識結果の第1候補が8、第2候補が3 (2)ループ数が0または1 (3)水平0次背景ブロックの面積/外接矩形面積 >
しきい値1 (4)最大水平0次背景長/外接矩形幅 > しきい値
【0108】また、図31(b)に示すようなカテゴリ
7の認識結果がカテゴリ9になっているような場合は、
前記選択された構造的特徴量からループ数、垂直1次背
景ブロックの個数に注目し、以下の(1)(2)(3)
の条件を満たす場合は、認識結果を第2候補のカテゴリ
7に修正し最終認識結果とする。 (1)認識結果の第1候補が9、第2候補が7 (2)ループ数が0 (3)垂直1次背景ブロックの個数が1
【0109】別の例としては、カテゴリ1、7のように
明らかにループが存在しないようなカテゴリが、通常の
書き方ではループが存在するカテゴリと認識されている
場合には、第2候補のカテゴリに、また、ループの大き
さが非常に大きいにもかかわらす、カテゴリ6、9に認
識されている場合は、カテゴリ0に認識結果を修正す
る。
【0110】他のカテゴリについても認識部4から出力
されたカテゴリに基づいて第1の構造的特徴抽出部5で
抽出された特徴の中から適切な特徴量を選択して、第2
の選択構造的特徴識別部73で最終的なカテゴリを決定
する。なお、認識部4から出力されるカテゴリによって
は第1の手書き処理部52で処理を行わず、認識部4か
ら出力された認識結果のカテゴリをそのまま最終的なカ
テゴリとして構わない。また、認識部4から認識保留信
号が出力され、かつ第1の手書き処理部52でどの構造
的特徴にも当てはまらないことが判明した場合は、最終
的なカテゴリを決定せず、リジェクト(読み取り拒否)
としても構わない。
【0111】このように、本実施の形態1によれば、基
本特徴抽出部2では統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出することにより構成の共
通化が可能になり、また第1の構造的特徴抽出部5では
認識部4では識別が困難な類似カテゴリの分離に有効な
構造的特徴を中心に抽出することにより処理の効率化が
可能になり、統計的特徴を用いて識別を行う認識部4か
ら出力された認識結果に基づいて、第1の構造識別部7
において必要な構造的特徴を選択し最終的なカテゴリを
決定することによって更なる処理の効率化と類似カテゴ
リの認識性能の向上が可能になる。
【0112】(実施の形態2)図33は、本発明の第2
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図33において、文字切り出し
部1、基本特徴抽出部2、統計的特徴抽出部3、認識部
4、字種判定部6、第1の構造識別部7、経路11、経
路12、経路13、経路14、経路15は上述した第1
の実施の形態におけるものと同様であり、動作も同様で
ある。本実施の形態が図1と異なる構成は、第1の構造
的特徴抽出部5に代えて第2の構造的特徴抽出部8を設
けた点である。
【0113】図34は第2の構造的特徴抽出部8の構成
を具体的に示すブロック図である。図34において、局
所背景特徴抽出部41、局所ストローク形状抽出部4
2、背景ブロック抽出部46、背景ラベル抽出部47、
上述した第1の実施の形態におけるものと同様であり、
動作も同様である。本実施の形態が図4と異なる構成
は、第1のループ抽出部43に代えて第2のループ抽出
部48を設けた点である。
【0114】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。第2のルー
プ抽出部48の動作以外は、実施の形態1と同様なので
省略する。第2のループ抽出部48では、背景ラベル抽
出部47から出力したラベル情報に基づいて、文字パタ
ーンのストロークによって発生するループを抽出する。
具体的な抽出方法は、文字外接矩形のどの辺とも接触し
ない背景ラベルをストロークのループとして抽出する。
図35の例において、数字は背景ラベルのラベル番号、
符号+は黒画素とすると、図35の網掛けされたラベル
番号3の背景ラベルがストロークのループとして抽出さ
れる。ここで、一定以上白画素が存在する場合のみルー
プとして抽出するという制限を設けノイズ除去を行って
も良い。
【0115】このように、本実施の形態2によれば、基
本特徴抽出部2では統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出することにより構成の共
通化が可能になり、また第2の構造的特徴抽出部8では
認識部4では識別が困難な類似カテゴリの分離に有効な
構造的特徴を中心に抽出することにより処理の効率化が
可能になり、統計的特徴を用いて識別を行う認識部4か
ら出力された認識結果に基づいて、第1の構造識別部7
において必要な構造的特徴を選択し最終的なカテゴリを
決定することによって更なる処理の効率化と類似カテゴ
リの認識性能の向上が可能になる。また、ループ数をラ
ベル情報のみに基づいて抽出することにより、処理の効
率化が図れる。
【0116】(実施の形態3)図36は本発明の第3の
実施の形態における光学的文字読み取り装置のブロック
図を示すものである。図36において、文字切り出し部
1、基本特徴抽出部2、統計的特徴抽出部3、第1の構
造的特徴抽出部5、字種判定部6、経路11、経路1
2、経路13、経路14は上述した第1の実施の形態に
おけるものと同様であり、動作も同様である。本実施の
形態が図1と異なる構成は第1の構造識別部7に代え
て、認識部4から出力された類似度を第1の構造的特徴
抽出部5から出力された構造的特徴に基づいて修正し、
修正類似度の大きさから最終的なカテゴリを決定する第
2の構造識別部9を設けた点である。
【0117】図37は第2の構造識別部9の構成を具体
的に示すブロック図である。371は第2の活字処理部
であり、字種判定部6で活字と判定された場合に、第1
の構造的特徴抽出部5から出力した構造的特徴と認識部
4から出力する少なくとも一つのカテゴリに基づいて類
似度修正値を求める。372は第2の手書き処理部であ
り、字種判定部6で手書きと判定された場合に、第1の
構造的特徴抽出部5から出力した構造的特徴と認識部4
から出力する少なくとも一つのカテゴリに基づいて類似
度修正値を求める。373は加算器であり、認識部4か
ら出力した類似度上位のものから複数のカテゴリの類似
度と第2の活字処理部371または第2の手書き処理部
372から出力した類似度修正値を加算して修正類似度
を求める。374は修正決定部であり、加算器373か
ら出力した修正類似度の大きさに基づいて修正類似度最
大のカテゴリ番号を出力する。
【0118】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。認識部4で
は、統計的特徴抽出部3で求めた輪郭方向統計特徴と外
郭方向統計特徴と背景距離統計特徴に基づいてカテゴリ
毎の類似度を求め、類似度上位から順番に複数のカテゴ
リの類似度と少なくとも一つのカテゴリ番号を出力す
る。次に、第2の構造識別部9の第2の活字処理部37
1では、字種判定部6で活字と判定された場合に、第1
の構造的特徴抽出部5から出力した構造的特徴と認識部
4から出力する少なくとも一つのカテゴリに基づいて類
似度修正値を求める。具体的な類似度修正値の算出方法
を図20を使用して説明する。まず全ての類似度修正値
を0に設定する。次に認識部4から、認識上位から順番
にカテゴリ3及びカテゴリ9の2つのカテゴリが出力さ
れたとき、第1の構造的特徴抽出部5から出力された構
造的特徴の中で図20(a)(b)(c) を選択し、まず図20
(a)の中央左背景が凸という特徴が第1の構造的特徴抽
出部5で抽出されているかどうかを調べる。抽出されて
いた場合はカテゴリ3の類似度修正値を上げる。抽出さ
れていない場合はカテゴリ3の類似度修正値を下げ、か
つ図20(c) の下部左背景の凸が抽出されているかどう
かを調べる。抽出されていた場合はカテゴリ5とカテゴ
リ9の類似度修正値を上げる。抽出されていない場合は
カテゴリ5とカテゴリ9の類似度修正値を下げる。かつ
図20(b) の上部右背景の凸が抽出されているかどうか
を調べる。抽出されていた場合はカテゴリ5とカテゴリ
9の類似度修正値を上げ、抽出されていない場合はカテ
ゴリ5とカテゴリ9の類似度修正値を下げる。各々の場
合における類似度修正値の上下幅は一定にする必要はな
く、構造的特徴の重要性、認識部4から出力される類似
度の分布、及び第1の構造的特徴抽出部5における各々
の構造的特徴の抽出の確信度に応じて変えても構わな
い。また類似度修正値を求めるカテゴリを認識部4から
出力する複数の類似度に対応するカテゴリだけに限定し
ても構わない。
【0119】第2の構造識別部9の第2の手書き処理部
372では、字種判定部6で手書きと判定された場合
に、第1の構造的特徴抽出部5から出力した構造的特徴
と認識部4から出力する少なくとも一つのカテゴリに基
づいて類似度修正値を求める。具体的な類似度修正値の
算出方法は第2の活字処理部371と同様である。加算
器373では、認識部4から出力する複数の類似度と第
2の活字処理部371または第2の手書き処理部372
から出力する類似度修正値を加算して修正類似度を求め
る。修正決定部374では、加算器373から出力され
る修正類似度をカテゴリ毎に大きさを比較して、最大の
修正類似度を持つカテゴリを出力し、最終的なカテゴリ
として決定する。なお、修正決定部374から出力され
る最大の修正類似度が低い場合や、最大の修正類似度と
第2位以下の修正類似度との差が小さい場合は最終的な
カテゴリ決定を行わず、リジェクト(読み取り拒否)と
しても良い。
【0120】このように、本実施の形態3によれば、認
識部4から出力された類似度と、第2の活字処理部37
1または第2の手書き処理部372から出力された類似
度修正値とを加算した修正類似度に基づいて修正決定部
374で最終的なカテゴリを決定することにより、認識
部4から出力された類似度の微妙な差を最終的なカテゴ
リ決定に反映させることができ、また第2の活字処理部
371と第2の手書き処理部372で構造的特徴検出の
信頼度を類似度修正値として反映させることができるた
めに認識性能が向上する。
【0121】(実施の形態4)図38は、本発明の第3
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図38において、基本特徴抽出
部2、統計的特徴抽出部3、認識部4、第1構造的特徴
抽出部5、字種判定部6、第1の構造識別部7、経路1
1、経路12、経路13、経路14、経路15は上述し
た第1の実施の形態におけるものと同様であり、動作も
同様である。なお、第1の構造識別部7を第2の構造認
識部9に置き換えても構わない。
【0122】本実施の形態が図1と異なる構成は、文字
切り出し部1に代えて、光電変換された文字列データに
対して個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさと切り出し画像を出力
し、後述する第1の切り出しエラー判定部382から再
切り出し指示信号が出力された場合は切り出しエラー判
定された番号の文字の切り出しを再実行する第2の文字
切り出し部381を設けた点と、第2の文字切り出し部
381から出力された個々の文字パターンの外接矩形の
大きさから切り出しエラーを判定し、切り出しエラーの
場合は再切り出し指示信号と切り出しエラー文字番号を
第2の文字切り出し部381に出力する第1の切り出し
エラー判定部382を設けた点である。
【0123】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。第2の文字
切り出し部381では、通常の場合は文字切り出し部1
と同様に、複数の文字が含まれる原画像に対して、1文
字単位の切り出しを実行し、各々の文字の外接矩形の大
きさと切り出し画像を出力する。第1の切り出しエラー
判定部382で切り出しエラーが検出された場合は異な
る動作を実行するので、その動作は後述する。
【0124】次に第1の切り出しエラー判定部382で
は、第2の文字切り出し部381から出力された各々の
文字の外接矩形の大きさに基づいて切り出しエラーの判
定を行う。具体的な動作を図39を利用して説明する。
図39(a) が原画像であり、図39(b) 〜(e) が切り出
し文字の外接矩形の大きさであり、図39(f) 〜(i)が
切り出し画像である。図39(a) の原画像を第2の文字
切り出し部381で最初に切り出すと、図39(f) のよ
うに文字枠が分離できずに残る場合、図39(g) のよ
うに枠からはみ出している文字の一部が削除された場
合、図39(h) のように文字枠が1文字として切り出さ
れた場合、図39(i) のように近接する2文字が1文字
として切り出されることがある。これらの切り出された
文字画像の外接矩形の大きさは、図39(b) 〜(e) のよ
うに本来あるべき1文字分の外接矩形の大きさとは異な
る場合が多いため、次に各々の文字の外接矩形の大きさ
を第1の切り出しエラー判定部382に入力して、同一
欄の文字の外接矩形の高さや幅と比較してかけ離れてい
る文字を発見した場合や、予め定められている外接矩形
の高さや幅の範囲から外れている場合は、切り出しエラ
ーとして第2の文字切り出し部381に再切り出し指示
信号、エラー文字番号、エラー内容を出力する。第2の
文字切り出し部381では、第1の切り出しエラー判定
部382から再切り出し指示信号を入力すると、同時に
入力したエラー文字番号の切り出し領域をエラー内容に
従って再切り出しを実行する。例えば、図39(b) では
外接矩形の幅が大きいというエラー内容になるため、図
40のような水平・垂直方向の黒画素ヒストグラムに基
づいて切り出し位置を再検討する。図39(c) 〜(e) に
関しても同様の方法で切り出し位置を再検討する。
【0125】このように、本実施の形態4によれば、第
2の文字切り出し部381から出力された文字パターン
の外接矩形の大きさに基づいて、第1の切り出しエラー
判定部382において切り出し失敗文字を検出して再切
り出し指示信号を第2の文字切り出し部381に送り、
第2の文字切りだし部381において切り出し失敗原因
を分析して再切り出し処理を実行することにより、切り
出し誤りの減少が可能になり、切り出し誤りによる認識
部4や第1の構造識別部7における誤認識を減少させる
ことができる。
【0126】(実施の形態5)図41は、本発明の第5
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図41において、第2の文字切
り出し部381、基本特徴抽出部2、統計的特徴抽出部
3、識部4、構第1の造的特徴抽出部5、字種判定部
6、認第1の構造識別部7、経路11、経路12、経路
13、経路14、経路15は上述した第4の実施の形態
におけるものと同様であり、動作も同様である。なお、
第1の構造識別部7を第2の構造認識部9に置き換えて
も構わない。
【0127】本発明の形態が図38と異なる構成は、第
1の切り出しエラー判定部382に代えて、第2の文字
切り出し部381から出力された個々の文字パターンの
外接矩形の大きさと認識部4から出力された複数のカテ
ゴリの類似度から切り出しエラーを判定し、切り出しエ
ラーの場合は再切り出し指示信号と切り出しエラー文字
番号を第2の文字切り出し部381に出力する第2の切
り出しエラー判定部411を設けたことである。
【0128】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。第2の切り
出しエラー判定部411では、個々の文字パターンの外
接矩形の大きさから切り出しエラーを判定する方法は第
1の切り出しエラー判定部382と同様であるが、認識
部4から出力された複数のカテゴリの類似度を利用して
切り出しエラーを判定することが異なる。具体的には、
第1位の類似度の大きさが他の文字に比べて極端に低い
場合や、第1位の類似度と第2位以下の類似度の大きさ
の差が少ない場合は、切り出しエラーの可能性が高いと
判定して再切り出し指示信号と切り出しエラー文字番号
を第2の文字切り出し部381に出力する。
【0129】このように、本実施の形態5によれば、第
2の文字切り出し部381から出力された文字パターン
の外接矩形の大きさに、認識部4の出力も第2の切り出
しエラー判定部411における切り出しエラーの判定基
準に加えることによって、外接矩形の大きさから明確に
切り出しエラーが判定できない場合でも、認識部4にお
ける類似度から判定できる認識結果の確信度に基づいて
切り出しエラーを判定できる。
【0130】(実施の形態6)図42は、本発明の第6
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図42において、文字切り出し
部1、基本特徴抽出部2、統計的特徴抽出部3、認識部
4、第1の構造的特徴抽出部5、字種判定部6、第1の
構造識別部7、経路11、経路12、経路13、経路1
4、経路15は上述した第1の実施の形態におけるもの
と同様であり、動作も同様である。なお、第1の構造識
別部7を第2の構造認識部9に置き換えても構わない。
【0131】本実施の形態が図1と異なる構成は、認識
部4から出力される大きい方から2番目の類似度と最大
類似度の比、及び最大類似度の大きさ、及び第1の構造
的特徴抽出部5の前記背景情報算出部24で算出した背
景情報に基づく背景複雑度により、リジェクトの有無を
判定する第1の認識結果算出部421を設けた点であ
る。
【0132】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。実施の形態
1と同様にして、入力文字列データに対して認識部4か
ら複数のカテゴリ類似度、大きい方から少なくとも1つ
のカテゴリが出力される。認識部4から出力された複数
のカテゴリ類似度の大きい方から2つのカテゴリ類似度
を選択し、2番目の類似度と最大類似度の比の値が、予
め設定されているしきい値aの値より大きい(すなわ
ち、2番目の類似度が最大類似度に近い)か、最大類似
度の値が予め設定されたしきい値bの値より小さいか、
垂直及び水平方向の背景次数の最大値の和である背景複
雑度が予め設定されたしきい値cの値より大きい場合に
リジェクト信号を出力し、それ以外の場合には、認識部
4から出力されたカテゴリ類似度、カテゴリを第1の構
造識別部7に出力する。第1の構造識別部7は、実施の
形態1と同様にして構造特徴を用いて最終認識結果を判
定する。なお、背景複雑度は垂直及び水平方向の背景次
数の最大値の和に限定するものではなく、ある一定の値
以上の背景次数のライン数の和等、背景情報に基づくも
のであればよい。
【0133】本実施の形態においては、最大類似度の
値、及び2番目の類似度と最大類似度の比の値を用いる
場合を説明する。ここで、リジェクト判定のしきい値
a、bは、図43に示すように予め複数の文字データに
対して大きい方から2番目の類似度(第2位類似度)と
最大類似度の比、最大類似度の値を求め、認識結果の正
解・不正解別にグラフにプロットする事により経験的に
決定される。図43の場合、最大類似度が小さい領域に
は、類似度の比の値とは関係なく不正解文字のみが分布
している。例えば最大類似度の値が500以下の文字パ
ターン(147文字)を調べると、ほとんど(144文
字)が前処理エラーである。図44にその最大類似度の
値が500以下の文字の一例を列挙する。図44より、
ノイズを有する文字、枠線残り、金額訂正部の切り出
し、つながり文字分離エラー、認識対象外文字の切り出
し等の前処理エラー文字が、最大類似度の大きさをリジ
ェクト判定の基準に追加することによりリジェクトでき
るようになることが分かる。
【0134】このように、本実施の形態6によれば、リ
ジェクト判定に類似度の比の値だけでなく、最大類似度
の大きさを併用する事で、前処理エラーを効率的にリジ
ェクトを行う事が可能となる。更に背景複雑度を用いれ
ばより効率的にリジェクトを行うことが可能となる。
【0135】(実施の形態7)図45は、本発明の第7
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図45において、文字切り出し
部1、基本特徴抽出部2、統計的特徴抽出部3、認識部
4、第1の構造的特徴抽出部5、字種判定部6、第1の
構造識別部7、経路11、経路12、経路13、経路1
4、経路15は上述した第6の実施の形態におけるもの
と同様であり、動作も同様である。なお、第1の構造識
別部7を第2の構造認識部9に置き換えても構わない。
【0136】本実施の形態が図42と異なる構成は、第
1の認識結果算出部421に代えて、認識部4から出力
される大きい方から2番目の類似度と最大類似度の比、
最大類似度の大きさ、及び第1の構造的特徴抽出部5の
前記背景情報算出部24で算出した背景情報に基づく背
景複雑度により、リジェクトの有無を判定する第2の認
識結果算出部451を設けた点である。
【0137】図46は、第2の認識結果算出部451の
構成を具体的に示すブロック図である。461は、認識
部4から出力されるカテゴリ類似度の大きい方から2つ
を選択し、2番目のカテゴリ類似度(第2位類似度)と
最大類似度の比を算出する類似度比算出部である。46
6は、背景情報算出部24から出力される背景情報に基
づき背景複雑度を算出する背景複雑度算出部である。4
62は、前記算出された類似度比と最大類似度と背景複
雑度を入力として、それらの値に応じてその文字パター
ンが正解(非リジェクト)か不正解(リジェクト)かを
出力するリジェクト判定部である。ここでは、上記リジ
ェクト判定部を予め複数のデータについて学習させた階
層型ニューラルネットワークにより構成した例について
説明する。463は、前記リジェクト判定部の学習に用
いる文字データの正解カテゴリを記憶した正解カテゴリ
テーブルである。464は、学習時には、認識部4から
出力される最大類似度カテゴリと前記正解カテゴリテー
ブルに書き込まれた正解カテゴリとリジェクト判定部の
出力から学習の有無を判定し、認識時には、リジェクト
判定部の出力から、リジェクトの判定をする出力判定部
である。465は、学習時に前記出力判定部464で学
習が必要であると判定された場合にリジェクト判定部を
構成する階層型ニューラルネットワークの結合荷重を更
新する結合荷重更新部である。
【0138】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。実施の形態
1と同様にして、入力文字列データに対して認識部4か
ら複数のカテゴリ類似度、大きい方から少なくとも1つ
のカテゴリが出力される。第2の認識結果算出部451
は、予め用意した複数の文字データに対する類似度と背
景複雑度とリジェクトの有無の関係を学習する学習モー
ドと、学習結果に基づいてリジェクト判定をする認識モ
ードからなる。
【0139】まず、学習モードについて説明する。類似
度比算出部461は、認識部4から出力されたカテゴリ
類似度から、第2位類似度と最大類似度の比を算出しリ
ジェクト判定部462に出力する。背景複雑度算出部4
66は、背景情報算出部24から出力される背景情報に
基づいて、垂直及び水平方向の背景次数の最大値の和を
背景複雑度として算出しリジェクト判定部462に出力
する。なお、背景複雑度は垂直及び水平方向の背景次数
の最大値の和に限定するものではなく、ある一定の値以
上の背景次数のライン数の和等、背景情報に基づくもの
であればよい。リジェクト判定部462を構成する階層
型ニューラルネットワークは、類似度比と最大類似度比
と背景複雑度を入力として、その時点での結合荷重によ
り出力層から出力信号を出力する。ここでは、出力層の
ニューロン数を2とし、一方の出力がリジェクト、もう
一方のリジェクトが非リジェクトを表す。出力判定部4
64は、前記リジェクト判定部の出力のうち大きい方を
選択すると同時に、現在入力されているパターンの最大
類似度カテゴリと正解カテゴリテーブル463から出力
される正解カテゴリを比較する。最大カテゴリが正解カ
テゴリと一致する(正解)場合で、リジェクト判定部4
62の出力のリジェクトを表すニューロンの出力が大き
いか、最大類似度カテゴリと正解カテゴリが一致しない
(不正解)場合で、リジェクト判定部462の出力の非
リジェクトを表すニューロンの出力が大きい時には、学
習信号を結合荷重更新部に出力する。学習信号が出力判
定部464から出力されると、結合荷重更新部は、最急
降下法等のアルゴリズムにより、リジェクト判定部46
2を構成する階層型ニューラルネットワークの結合荷重
を更新する。以上の動作を、全ての学習データに対して
出力判定部464から学習信号が出力されなくなるか、
リジェクト判定部の2つの出力値の大小関係が変化しな
くなるまで繰り返す。この学習モードにより、類似度比
と最大類似度と背景複雑度の大きさに応じたリジェクト
判定が可能になる。
【0140】次に、認識モードについて説明する。上記
学習後の結合荷重値に基づいて、類似度比と最大類似度
の大きさと背景複雑度に応じた出力がリジェクト判定部
462から出力されると出力判定部464は、その出力
値の大きい方を選択し、リジェクトを表す出力が大きい
場合にはリジェクト信号を、非リジェクトを表す出力が
大きい場合には、最大類似度カテゴリを認識結果として
出力する。類似度比と最大類似度と背景複雑度の空間上
での正解文字(リジェクトしない文字)領域と不正解文
字(リジェクトすべき文字)領域の境界は非常に複雑で
ある。例えば、類似度比と最大類似度の2次元空間上で
も図43に示すように線形分離が不可能であると考えら
れるが、本実施の形態によれば非線形分離可能な階層型
ニューラルネットワークでリジェクト判定部462を構
成し、この境界を学習させることにより、より精度が高
く効果的なリジェクト判定が可能となる。なお、リジェ
クト判定部462を、階層型ニューラルネットワーク以
外のニューラルネットワークモデルで構成しても構わな
い。また、本実施の形態では、類似度比と最大類似度と
背景複雑度の3つをリジェクト判定部462への入力と
したが、3つのうちの任意の1つまたは2つを入力する
構成としても構わない。
【0141】(実施の形態8)次に、帳票のような枠罫
線と文字を含む文書画像において、枠罫線の構造を認識
し、帳票を識別し、帳票内に記入されている特定の文字
領域を切り出し、そこに記載された文字を認識する帳票
文書認識方法および帳票文書認識装置、ならびにその認
識した文字を識別コードに変換し処理する帳票自動処理
システムについて説明する。
【0142】まず、従来の帳票文書認識装置について、
図51を参照して説明する。まず、画像入力手段501
により帳票上に記載された文書画像が2値画像に変換さ
れる。そして、文字位置検出手段502で、画像信号の
うち所望の文字領域が抽出される。文字位置検出の方法
としては、例えば特開平2−217977号公報のよう
に局部的な枠線構造の相違から帳票の種類を識別し、予
め指示された領域を読み取る方法がある。次に、文字切
り出し手段503により、1文字単位に切り出され、文
字認識手段504により文字認識される。次に単語認識
手段505において、文字認識手段503で認識された
文字列に対して、予め単語が格納された単語辞書506
から単語が読み出され、その読み出した単語と認識され
た文字列とを比較照合することで最終認識結果が得られ
る。例えば、この文字列が住所である場合、読み取りの
対象となる住所名を予め住所辞書に登録しておき、文字
認識結果と住所辞書から読み出した住所名とを比較照合
して、住所名を認識する方法については、特開平2−1
81287号公報に開示されている。
【0143】しかしながら、このような従来の帳票文書
認識装置では、読み取り対象となる単語を全て単語辞書
を登録しなければならないため、比較照合すべき件数が
きわめて多くなり、処理速度が非常に遅いという問題も
あった。
【0144】そこで本実施の形態8では、このような従
来の問題を解決すべく、処理速度の速い、高精度な帳票
文書認識方法と装置および帳票自動処理システムを提供
することを目的し、予め個々の帳票の枠構造特徴および
その枠構造特徴を有する帳票に記載される候補文字列を
枠構造参照テーブルに登録し、このテーブルを参照して
枠構造特徴を照合することにより、帳票の種別をおおま
かに分類して帳票内の文字読取対象領域を検出し、次い
で文字領域を切り出し、切り出された文字を認識し、認
識結果と枠構造参照テーブル登録された候補文字列とを
照合して最終認識結果とするものであり、単語辞書を用
いた従来の方法に比べ、高速、高精度な帳票文書認識が
可能となる。
【0145】以下、本発明の実施の形態8について、図
47〜図50を用いて説明する。図47は本発明の実施
の形態8における帳票文書認識装置のブロック図であ
る。図1において、101は画像入力手段であり、枠罫
線と文字を含む帳票を読み取って2値画像に変換するも
のである。102はその2値画像を記憶する画像メモリ
である。103は枠罫線抽出手段であり、画像メモリ1
02に記憶された2値画像から枠罫線を抽出するもので
ある。104は枠構造抽出手段であり、枠罫線抽出手段
103で抽出された枠罫線から帳票の様式を識別するの
に必要な枠構造特徴を抽出するものである。105は枠
構造参照テーブルであり、予め個々の帳票の枠構造特徴
およびその枠構造特徴を有する帳票に記載される候補文
字列を登録したものである。106は枠構造照合手段で
あり、枠構造参照テーブル105を参照して枠構造特徴
抽出手段104で抽出した枠構造特徴を照合することに
より、入力された帳票の種別を識別し、文字読取対象領
域を検出するものである。107は上記実施の形態1か
ら7における文字切り出し部1に相当する文字切り出し
手段であり、枠構造照合手段106で検出された文字読
取対象領域に基づいて画像メモリ102から文字列を1
文字ずつ切り出すものである。108は上記実施の形態
1から7における文字切り出し部1以降の手段により構
成される文字認識手段であり、文字切り出し手段107
で切り出された文字を認識するものである。109は後
処理手段であり、認識手段108で認識された認識結果
と枠構造参照テーブル105に登録されている入力帳票
に対応する候補文字列とを照合して最終認識結果とする
ものである。
【0146】以上のように構成された帳票文書認識装置
について、以下その動作を、図48に示す帳票が入力さ
れ、帳票上に記載された地方公共団体名を認識対象文字
列とする場合を例にとり説明する。図49は枠構造参照
テーブル105の一例を示した図である。入力される帳
票はグループA〜Dの4種類があるとする。枠構造参照
テーブル105には、予め入力される帳票の外形枠の構
造および個々の外形枠の内部の構造、文字読取対象領域
および記載される地方公共団体名を登録しておく。
【0147】まず、認識動作について説明する。帳票2
01が入力されると、画像入力手段101において、枠
罫線と文字列を含む文書画像は2値化され、画像メモリ
102に格納される。次に枠罫線抽出手段103におい
て、画像メモリ102に格納された2値画像から枠罫線
のみを抽出する。
【0148】次に、枠構造特徴抽出手段104におい
て、枠罫線抽出手段103で抽出された枠罫線から、帳
票の様式を識別するのに必要な外形枠の構造および個々
の外形枠の内部の構造等の枠構造特徴を抽出する。抽出
された枠構造特徴は、枠構造照合手段106において、
枠構造参照テーブル105に予め登録されている枠構造
特徴と照合され、入力帳票301はグループAに属する
と判断される。次に、文字切り出し手段107では、枠
構造参照テーブル105のグループAに対応する入力帳
票201の文字読取対象領域202から1文字単位で文
字を切り出す。次に文字認識手段108において文字認
識を行う。
【0149】次に、後処理手段109の動作について説
明する。文字認識手段108での認識結果として「神奈
川県厚木市」が得られたとする。後処理手段109にお
いては、枠構造参照テーブル105を検索し、グループ
Aに記載される候補文字列として登録されている地方公
共団体名「神奈川県厚木市」「福岡市」「東京都港区」
「大阪府吹田市」「鹿児島県隼人町」と認識結果「神奈
川県厚木市」との照合を行い、最終認識結果として「神
奈川県厚木市」を出力する。また、文字切り出しミス、
ノイズの影響等により、文字認識手段108の認識結果
が間違っている場合、例えば、「神奈川県」「柚奈川県
厚本市」が認識結果として得られた場合にも、候補文字
列の中から最も確からしい地方公共団体名が選択され、
最終認識結果としては、「神奈川県厚木市」が得られ
る。
【0150】本実施の形態8において、地方公共団体と
認識された文字列を、識別コード、例えば地方公共団体
コードに変換し、さらにバーコード等に変換して、その
バーコードを識別コードに代えてまたは識別コードとと
もに帳票上に印刷すれば、帳票自動処理システムの処理
を非常に効率化することができる。この場合の帳票自動
処理システムの概要を図50に例示する。図50におい
て、401は帳票文書認識手段、402は識別コード変
換手段、403は識別コード変換テーブル、404は識
別コード印字手段、405は処理手段である。
【0151】この帳票自動処理システムでは、帳票が、
上記実施の形態1と同様な帳票文書認識装置である帳票
文書認識手段401に入力されると、帳票上に記載され
た地方公共団体名を認識する。次に識別コード変換手段
402では、帳票文書認識手段401の認識結果を、識
別コード変換テーブルを参照して識別コードに変換す
る。ここで、識別コードとは地方公共団体に一意に対応
していればよい。例えば、地方公共団体コードがある。
認識結果が「神奈川県厚木市」であったらなら、対応す
る地方公共団体コードは「142123」である。な
お、識別コードは、地方公共団体コードに限定するもの
ではなく、独自に決定してもよい。次に、識別コード印
字手段404においては、前記変換された識別コード
を、前記入力帳票の所定の位置に印字する。なお、識別
コードそのものでなく、バーコードに変換して、バーコ
ードを印字してもよい。次に処理手段405において
は、前記印字された識別コードを読み取り、前記識別コ
ードに基づき帳票の仕訳処理を行う。
【0152】以上のように、本実施の形態8によれば、
予め個々の帳票の枠構造特徴およびその枠構造特徴を有
する帳票に記載される候補文字列を枠構造参照テーブル
に登録し、このテーブルを参照して枠構造特徴を照合す
ることにより、帳票の種別をおおまかに分類して帳票内
の文字読取対象領域を検出し、次いで文字領域を切り出
し、切り出された文字を認識し、認識結果と枠構造参照
テーブル登録された候補文字列とを照合して最終認識結
果とするものであり、単語辞書を用いた従来の方法に比
べ、高速、高精度な帳票文書認識が可能となる。
【0153】
【発明の効果】以上説明したように、本発明によれば、
以下のような効果を有する。本発明の請求項1に記載の
光学的文字読み取り方法によれば、統計的特徴と構造的
特徴の両方に利用できるような基本特徴を抽出して処理
の共通化を図り、統計的特徴を利用した認識部では識別
が困難な類似カテゴリを分離する構造的特徴を中心に抽
出することで効率的な特徴抽出が可能になり、認識結果
に基づいて必要な構造的特徴を選択して最終的なカテゴ
リを決定することによって更なる処理の効率化と類似カ
テゴリの認識性能の向上が可能となる。
【0154】本発明の請求項2に記載の発明によれば、
統計的特徴と構造的特徴の両方に利用できるような基本
特徴を抽出して処理の共通化を図り、統計的特徴を利用
した認識部では識別が困難な類似カテゴリに関して、構
造的特徴に基づいた類似度修正値を加算した修正後類似
度に基づいて最終的なカテゴリを決定することにより、
統計的特徴を利用した認識部から出力された類似度の微
妙な差を最終的なカテゴリ決定に反映させることがで
き、また構造的特徴検出の信頼度を類似度修正値として
反映させることができるため、認識性能の向上が可能と
なる。
【0155】本発明の請求項3に記載の発明によれば、
字種に応じて専門化処理を行うことにより活字・手書き
特有の構造的特徴を混同することなく利用できるため、
類似カテゴリ間の認識性能が向上し、また予め字種に応
じた構造的特徴を分離して抽出することにより処理の効
率化が図れる。
【0156】本発明の請求項4に記載の発明によれば、
文字パターンの外接矩形の大きさや、類似度に基づい
て、外接矩形が他の文字の外接矩形と大きく相違してい
たり規定の外接矩形から外れている場合や、類似度が他
の文字の類似度に比べて極端に低い場合や、第1位の類
似度と第2位以下の類似度との差が少ない場合などに、
切り出し失敗文字を検出して失敗原因を分析して再切り
出しを実行することにより、切り出し誤りを減らし、切
り出し誤りに起因する誤認識を減少させることが可能と
なる。
【0157】本発明の請求項5に記載の発明によれば、
類似度の比、最大類似度の大きさ、背景複雑度に基づい
てリジェクト判定を行うことにより、リジェクト困難な
前処理エラー文字を効率的なリジェクトが可能となる。
【0158】本発明の請求項6に記載の光学的文字読み
取り装置によれば、統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出して処理の共通化を図
り、統計的特徴を利用した認識部では識別が困難な類似
カテゴリを分離する構造的特徴を中心に抽出することで
効率的な特徴抽出が可能になり、認識結果に基づいて必
要な構造的特徴を選択して最終的なカテゴリを決定する
ことによって更なる処理の効率化と類似カテゴリの認識
性能の向上が可能となる。
【0159】本発明の請求項7に記載の発明によれば、
統計的特徴を用いた認識結果に基づいて、類似カテゴリ
の識別に必要な構造的特徴のみを選択し最終的なカテゴ
リを決定することによって更なる処理の効率化と類似カ
テゴリの認識性能の向上が可能となる。
【0160】本発明の請求項8に記載の発明によれば、
字種に応じて専門化処理を行うことにより活字・手書き
特有の構造的特徴を混同することなく利用できるため、
類似カテゴリ間の認識性能が向上し、また予め字種に応
じた構造的特徴を分離して抽出することにより処理の効
率化が図れる。
【0161】本発明の請求項9に記載の発明よれば、活
字に関して、統計的特徴を用いた認識結果に基づいて、
類似カテゴリの識別に必要な構造的特徴のみを選択し最
終的なカテゴリを決定することによって更なる処理の効
率化と類似カテゴリの認識性能の向上が可能となる。
【0162】本発明の請求項10に記載の発明よれば、
活字に関して、外接矩形の大きさだけで判別可能なカテ
ゴリを最初に判定することで効率的にカテゴリを分離
し、次に認識部の結果に応じて類似カテゴリ分離に必要
な構造的特徴を選択して最終カテゴリ判断を行うことで
効率的かつ効果的な類似カテゴリ分離が可能となる。
【0163】本発明の請求項11に記載の発明によれ
ば、手書き文字に関して統計的特徴を用いた認識結果に
基づいて、類似カテゴリの識別に必要な構造的特徴のみ
を選択し最終的なカテゴリを決定することによって更な
る処理の効率化と類似カテゴリの認識性能の向上が可能
となる。
【0164】本発明の請求項12に記載の発明によれ
ば、手書き文字に関して、外接矩形の大きさだけで判別
可能なカテゴリを最初に判定することで効率的にカテゴ
リを分離し、次に認識部の結果に応じて類似カテゴリ分
離に必要な構造的特徴を選択して最終カテゴリ判断を行
うことで効率的かつ効果的な類似カテゴリ分離が可能と
なる。
【0165】本発明の請求項13に記載の発明によれ
ば、統計的特徴と構造的特徴の両方に利用できるような
基本特徴を抽出して処理の共通化を図り、統計的特徴を
利用した認識部では識別が困難な類似カテゴリに関し
て、構造的特徴に基づいた類似度修正値を加算した修正
後類似度に基づいて最終的なカテゴリを決定することに
より、統計的特徴を利用した認識部から出力された類似
度の微妙な差を最終的なカテゴリ決定に反映させること
ができ、また構造的特徴検出の信頼度を類似度修正値と
して反映させることができるため、認識性能の向上が可
能となる。
【0166】本発明の請求項14に記載の発明によれ
ば、類似度修正値を加算した修正後類似度に基づいて最
終的なカテゴリを決定することにより、統計的特徴を利
用した認識部から出力された類似度の微妙な差を最終的
なカテゴリ決定に反映させることができ、また構造的特
徴検出の信頼度を類似度修正値として反映させることが
できるため、認識性能の向上が可能となる。
【0167】本発明の請求項15に記載の発明によれ
ば、字種に応じて専門化処理を行うことにより活字・手
書き特有の構造的特徴を混同することなく利用できるた
め、類似カテゴリ間の認識性能が向上し、また予め字種
に応じた構造的特徴を分離して抽出することにより処理
の効率化が図れる。
【0168】本発明の請求項16に記載の発明によれ
ば、活字に関して、類似度修正値を加算した修正後類似
度に基づいて最終的なカテゴリを決定することにより、
統計的特徴を利用した認識部から出力された類似度の微
妙な差を最終的なカテゴリ決定に反映させることがで
き、また構造的特徴検出の信頼度を類似度修正値として
反映させることができるため、認識性能の向上が可能と
なる。
【0169】本発明の請求項17に記載の発明によれ
ば、手書き文字に関して、類似度修正値を加算した修正
後類似度に基づいて最終的なカテゴリを決定することに
より、統計的特徴を利用した認識部から出力された類似
度の微妙な差を最終的なカテゴリ決定に反映させること
ができ、また構造的特徴検出の信頼度を類似度修正値と
して反映させることができるため、認識性能の向上が可
能となる。
【0170】本発明の請求項18に記載の発明によれ
ば、輪郭方向成分の算出、外接矩形の各々の辺から文字
パターンまでの背景距離の算出、背景情報算出のための
共通の前処理として文字パターンの輪郭点を抽出するこ
とにより、基本特徴抽出の効率が向上する。また、基本
特徴として輪郭点、輪郭方向成分、背景距離、背景情報
を抽出する事により統計的特徴だけでなく、文字構造を
反映した構造特徴量にも流用が可能になり特徴抽出処理
の効率化が可能となる。
【0171】本発明の請求項19に記載の発明によれ
ば、基本特徴からブロックの統計的特徴を抽出すること
でき、ブロック単位で抽出した統計的特徴をブロックの
大きさで正規化することにより、認識対象の変化に影響
を受けにくい特徴の抽出が可能となる。
【0172】本発明の請求項20に記載の発明によれ
ば、基本特徴に基づいて、特定のカテゴリ間の識別に有
効である背景部の部分的な凹凸情報、類似カテゴリ間の
ストロークの屈曲方向や直線性の相違、ストロークのル
ープ数、文字背景部の構造、文字背景部の大きさ、外接
矩形との位置関係、端点・交点の情報、直線を抽出する
ことにより、文字の構造的な特徴をより明示的に表す構
造的特徴の効率的な抽出が可能であり、これらの構造的
特徴を用いることにより統計的特徴量のみを利用する識
別方法では識別が困難な類似カテゴリ間の認識性能の向
上が可能となる。
【0173】本発明の請求項21に記載の発明によれ
ば、基本特徴に基づいて、特定のカテゴリ間の識別に有
効である背景部の部分的な凹凸情報、類似カテゴリ間の
ストロークの屈曲方向や直線性の相違、ストロークのル
ープ数、文字背景部の構造、文字背景部の大きさ、外接
矩形との位置関係、端点・交点の情報、直線を抽出する
ことにより、文字の構造的な特徴をより明示的に表す構
造的特徴の効率的な抽出が可能であり、これらの構造的
特徴を用いることにより統計的特徴量のみを利用する識
別方法では識別が困難な類似カテゴリ間の認識性能の向
上が可能となる。また、ループ数をラベル情報のみに基
づいて抽出することにより、処理の効率化が可能とな
る。
【0174】本発明の請求項22に記載の発明よれば、
基本特徴として予め抽出した背景情報を利用すること
で、隣接するラインの背景情報を比較して相違を調べる
だけの簡単な処理で端点および交点の候補を抽出するこ
とが可能であり、端点と交点候補の位置関係に基づいて
他の端点または交点候補との距離が近すぎる端点または
交点を除去することで、ノイズによる端点や交点の誤抽
出を減少させ、手書きのカテゴリ2とカテゴリ3のよう
な類似カテゴリの分離に効果的な端点や交点の情報をよ
り高精度に抽出することが可能となる。
【0175】本発明の請求項23に記載の発明よれば、
基本特徴として予め抽出した背景情報を利用して、黒画
素の連続度および複数ラインへの連続度を調べるだけの
簡単な処理で直線を抽出することが可能であり、また端
点および交点の位置情報を用いて、線の合流や分岐に伴
って発生する誤った直線候補を除去し、残った直線候補
を近傍の線との接続状態に対応して分類することによ
り、水平方向の短い直線に特徴のある手書きのカテゴリ
¥のようなカテゴリを分離するために有効な直線をより
高精度に抽出することが可能となる。
【0176】本発明の請求項24に記載の発明よれば、
文字パターンの外接矩形の大きさや、類似度に基づい
て、外接矩形が他の文字の外接矩形と大きく相違してい
たり規定の外接矩形から外れている場合や、類似度が他
の文字の類似度に比べて極端に低い場合や、第1位の類
似度と第2位以下の類似度との差が少ない場合などに、
切り出し失敗文字を検出して失敗原因を分析して再切り
出しを実行することにより、切り出し誤りを減らし、切
り出し誤りに起因する誤認識を減少させることが可能と
なる。
【0177】本発明の請求項25に記載の発明よれば、
類似度の比、最大類似度の大きさ、背景複雑度に基づい
てリジェクト判定を行うことにより、リジェクト困難な
前処理エラー文字を効率的なリジェクトが可能となる。
【0178】本発明の請求項26に記載の発明によれ
ば、類似度の比と最大類似度と背景複雑度の少なくとも
1つを軸とした空間上でのリジェクト領域と非リジェク
ト領域の非線形な境界を、予め階層型ニューラルネット
ワークに学習させてあるので、より高精度なリジェクト
判定処理が可能となる。
【0179】本発明の請求項27に記載の発明によれ
ば、枠構造特徴により帳票をおおまかに分類し、その形
式の帳票に記載される可能性のある候補文字列と認識結
果とを照合するという2段階の処理を行うことにより、
高速、高精度に帳票上に記載された文字を認識すること
が可能になる。
【0180】本発明の請求項28に記載の発明によれ
ば、枠構造特徴により帳票をおおまかに分類し、その形
式の帳票に記載される可能性のある候補文字列と認識結
果とを照合するという2段階の処理を行うことにより、
高速、高精度に帳票上に記載された文字を認識すること
が可能となる。
【0181】本発明の請求項29に記載の発明によれ
ば、文字認識手段による認識結果が間違いがあっても、
候補文字列の中から最も確からしい文字列を選択するこ
とが可能となる。
【0182】本発明の請求項30に記載の発明によれ
ば、認識された文字列を識別コード変換テーブルを参照
して識別コードに変換することにより、帳票の仕訳を効
率的に行うことが可能となる。
【0183】本発明の請求項31に記載の発明によれ
ば、識別コードに対応するバーコードを印字することに
より、バーコードシステムに対応することが可能とな
る。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における光学的文字
読み取り装置の構成を示すブロック図
【図2】第1の実施の形態における基本特徴抽出部の構
成を示すブロック図
【図3】第1の実施の形態における統計的特徴抽出部の
構成を示すブロック図
【図4】第1の実施の形態における第1の構造的特徴抽
出部の構成を示すブロック図
【図5】第1の実施の形態における第1の構造識別部の
構成を示すブロック図
【図6】第1の実施の形態における第1の活字処理部の
構成を示すブロック図
【図7】第1の実施の形態における第1の手書き処理部
の構成を示すブロック図
【図8】第1の実施の形態における端点・交点抽出部の
構成を示すブロック図
【図9】第1の実施の形態における直線抽出部の構成を
示すブロック図
【図10】第1の実施の形態における文字切り出し方法
を説明するための摸式図
【図11】第1の実施の形態における輪郭点抽出方法を
説明するための摸式図
【図12】第1の実施の形態における輪郭方向と符号化
の対応付けを説明するための摸式図
【図13】第1の実施の形態におけるを輪郭方向符号化
方法を説明するための摸式図
【図14】第1の実施の形態におけるを背景距離算出方
法を説明するための摸式図
【図15】第1の実施の形態におけるを背景情報算出方
法を説明するための摸式図
【図16】第1の実施の形態におけるブロック分割方法
を説明するための摸式図
【図17】第1の実施の形態における輪郭方向集計方法
を説明するための摸式図
【図18】第1の実施の形態における外郭点発見方法を
説明するための摸式図
【図19】第1の実施の形態における認識部の構成の一
例である階層型ニューラルネットワークの摸式図
【図20】第1の実施の形態における局所背景特徴抽出
方法を説明するための摸式図
【図21】第1の実施の形態における局所ストローク形
状抽出方法を説明するための摸式図
【図22】第1の実施の形態におけるループ抽出方法を
説明するための摸式図
【図23】第1の実施の形態における背景ブロック抽出
方法を説明するための摸式図
【図24】第1の実施の形態における個のラインの状態
比較による端点・交点抽出方法を説明するための模式図
【図25】第1の実施の形態における不適当な端点また
は交点の除去条件を説明するための模式図
【図26】第1の実施の形態における水平方向の直線の
抽出基準を説明するための模式図
【図27】第1の実施の形態における外接矩形の大きさ
によるカテゴリ分離方法を説明するための摸式図
【図28】第1の実施の形態における右上部が閉じる寸
前のカテゴリ6の一例を示す摸式図
【図29】第1の実施の形態における左側から見た端点
数の違いによるカテゴリ分離方法を説明するための模式
【図30】第1の実施の形態における直線抽出による類
似カテゴリ分離方法を説明するための模式図
【図31】第1の実施の形態における背景ブロック情報
による認識結果修正方法を説明するための模式図
【図32】第1の実施の形態における背景ラベル抽出方
法を説明するための摸式図
【図33】本発明の第2の実施の形態における光学的文
字読み取り装置の構成を示すブロック図
【図34】第2の実施の形態における第2の構造的特徴
抽出部の構成を示すブロック図
【図35】第2の実施の形態におけるループ抽出方法を
説明するための摸式図
【図36】本発明の第3の実施の形態における光学的文
字読み取り装置の構成を示すブロック図
【図37】第3の実施の形態における第2 の構造識別
部の構成を示すブロック図
【図38】本発明の第4の実施の形態における光学的文
字読み取り装置の構成を示すブロック図
【図39】第4の実施の形態における文字切り出し失敗
による外接矩形の大きさの変化を示す模式図
【図40】第4の実施の形態におけるヒストグラムによ
る文字切り出し修正手法を説明するための模式図
【図41】本発明の第5の実施の形態における光学的文
字読み取り装置の構成を示すブロック図
【図42】本発明の第6の実施の形態における光学的文
字読み取り装置の構成を示すブロック図
【図43】類似度比と最大類似度の空間上における正解
文字と不正解文字の分布例を示す特性図
【図44】最大類似度が小さい(<500)文字パター
ンの文字イメージ例を示す模式図
【図45】本発明の第7の実施の形態におけるリ光学的
文字読み取り装置の構成を示すブロック図
【図46】第7の実施の形態における第2の認識結果算
出部の構成を示すブロック図
【図47】第8の実施の形態における帳票文書認識装置
の構成を示すブロック図
【図48】第8の実施の形態における入力帳票の一例を
示す模式図
【図49】第8の実施の形態における枠構造参照テーブ
ルの一例を示す模式図
【図50】第8の実施実施の形態における帳票自動処理
システムの構成を示すブロック図
【図51】従来の帳票文書認識装置の構成を示すブロッ
ク図
【符号の説明】
1 文字切り出し部 2 基本特徴抽出部 3 統計的特徴抽出部 4 認識部 5 第1の構造的特徴抽出部 6 字種判定部 7 第1の構造識別部 8 第2の構造的特徴抽出部 9 第2の構造識別部 11 (外接矩形の大きさを出力する)経路 12 (切り出し画像を出力する)経路 13 (輪郭方向成分を出力する)経路 14 (背景距離を出力する)経路 15 (背景情報を出力する)経路 21 輪郭点抽出部 22 輪郭方向算出部 23 背景距離算出部 24 背景情報算出部 31 両方向ブロック分割部 32 水平方向ブロック分割部 33 垂直方向ブロック分割部 34 輪郭方向集計部 35 輪郭方向正規化部 36 外郭方向集計部 37 外郭方向正規化部 38 背景距離集計部 39 背景距離正規化部 41 局所背景特徴抽出部 42 局所ストローク形状抽出部 43 第1のループ抽出部 44 端点・交点抽出部 45 直線抽出部 46 背景ブロック抽出部 47 背景ラベル抽出部 48 第2のループ抽出部 51 第1の活字処理部 52 第1の手書き処理部 61 第1の外接矩形カテゴリ判定部 62 第1の認識依存特徴選択部 63 第1の選択構造的特徴識別部 71 第2の外接矩形カテゴリ判定部 72 第2の認識依存特徴選択部 73 第2の選択構造的特徴識別部 81 端点・交点候補抽出部 82 端点・交点判定部 91 黒画素連続領域抽出部 92 直線候補抽出部 93 直線判定部 101 画像入力手段 102 画像メモリ 103 枠罫線抽出手段 104 枠構造抽出手段 105 枠構造参照テーブル 106 枠構造照合手段 107 文字切り出し手段 108 文字認識手段 109 後処理手段 371 第2の活字処理部 372 第2の手書き処理部 373 加算器 374 修正カテゴリ決定部 381 第2の文字切り出し部 382 第1の切り出しエラー判定部 411 第2の切り出しエラー判定部 421 第1の認識結果算出部 451 第2の認識結果算出部 461 類似度比算出部 462 リジェクト判定部 463 正解カテゴリテーブル 464 出力判定部 465 結合荷重更新部 466 背景複雑度算出部
───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号 特願平10−62991 (32)優先日 平10(1998)3月13日 (33)優先権主張国 日本(JP)

Claims (31)

    【特許請求の範囲】
  1. 【請求項1】 光電変換された文字枠線を含む文字列デ
    ータに対して、文字枠線と文字列パターンを分離し、分
    離された文字列パターンから個々の文字パターンを切り
    出し、個々の文字パターンに対する外接矩形の大きさと
    外接矩形に囲まれた切り出し文字画像を求め、前記切り
    出された個々の切り出し文字画像に対する輪郭情報と背
    景構造情報とを基本特徴として抽出し、前記抽出された
    基本特徴に基づいて少なくとも一種類の統計的特徴を抽
    出し、前記切り出された個々の切り出し文字画像と前記
    抽出された基本特徴に基づいて少なくとも一種類の構造
    的特徴を抽出し、前記抽出された統計的特徴から前記切
    り出し文字画像の各カテゴリに対する類似度を求め、前
    記類似度が最大のカテゴリを個々の文字パターンの属す
    るカテゴリと判定し、前記判定された文字パターンの属
    するカテゴリと前記カテゴリに対する類似度と前記抽出
    されたた構造的特徴とに基づいて最終的な文字パターン
    の属するカテゴリを判定する各ステップを備えたことを
    特徴とする光学的文字読み取り方法。
  2. 【請求項2】 光電変換された文字枠線を含む文字列デ
    ータに対して、文字枠線と文字列パターンを分離し、分
    離された文字列パターンから個々の文字パターンを切り
    出し、個々の文字パターンに対する外接矩形の大きさと
    外接矩形に囲まれた切り出し文字画像を求め、前記切り
    出された個々の切り出し文字画像に対する輪郭情報と背
    景構造情報とを基本特徴として抽出し、前記抽出された
    基本特徴に基づいて少なくとも一種類の統計的特徴を抽
    出し、前記切り出された個々の切り出し文字画像と前記
    抽出された基本特徴に基づいて少なくとも一種類の構造
    的特徴を抽出し、前記抽出された統計的特徴から前記切
    り出し文字画像の各カテゴリに対する類似度を求め、前
    記類似度が最大のカテゴリを個々の文字パターンの属す
    るカテゴリと判定し、前記切り出された個々の文字パタ
    ーンに対する外接矩形の大きさと前記判定された文字パ
    ターンの属するカテゴリと前記抽出された構造的特徴と
    の少なくとも一つに基づいて前記類似度を修正し、修正
    後の類似度に基づいて最終的な文字パターンの属するカ
    テゴリを判定する各ステップを備えたことを特徴とする
    光学的文字読み取り方法。
  3. 【請求項3】 前記切り出された文字パターンに対する
    外接矩形の大きさに基づいて活字または手書きの字種判
    定を行い、前記字種判定の結果と前記切り出された文字
    パターンに対する外接矩形の大きさと前記判定された文
    字パターンの属するカテゴリと前記カテゴリに対する類
    似度と前記抽出された構造的特徴の少なくとも一つに基
    づいて最終的な文字パターンの属するカテゴリを判定す
    る各ステップを備えたことを特徴とする請求項1または
    2記載の光学的文字読み取り方法。
  4. 【請求項4】 前記切り出された文字パターンに対する
    外接矩形の大きさと前記判定されたカテゴリに対する類
    似度と前記抽出された構造的特徴との少なくとも一つに
    基づいて切り出しエラーを判定し、切り出しエラーと判
    定された場合に文字パターンの再切り出しを行う各ステ
    ップを備えたことを特徴とする請求項1または2または
    3記載の光学的文字読み取り方法。
  5. 【請求項5】 前記切り出された文字パターンの最大類
    似度、2番目の類似度と最大類似度の比の値、前記切り
    出された文字パターンの背景の複雑度に基づいて、前記
    判定された文字パターンの属するカテゴリの信頼度が低
    い場合にはリジェクト処理を行い、それ以外の場合は前
    記判定された文字パターンの属するカテゴリを最終的な
    認識結果とする各ステップを備えたことを特徴とする請
    求項1から4のいずれかに記載の光学的文字読み取り方
    法。
  6. 【請求項6】 光電変換された文字枠線を含む文字列デ
    ータに対して、文字枠線と文字列パターンを分離し、分
    離された文字列パターンから個々の文字パターンを切り
    出し、個々の文字パターンに対する外接矩形の大きさと
    外接矩形に囲まれた切り出し文字画像を出力する文字切
    り出し手段と、前記文字切り出し手段で切り出された個
    々の切り出し文字画像に対する基本特徴として輪郭情報
    と背景構造情報を求める基本特徴抽出手段と、前記基本
    特徴抽出手段から出力された基本特徴に基づいて少なく
    とも一種類の統計的特徴を求める統計的特徴抽出手段
    と、前記文字切り出し手段で切出された個々の切り出し
    文字画像と前記基本特徴抽出手段から出力された基本特
    徴に基づいて少なくとも一種類の構造的特徴を求める構
    造的特徴抽出手段と、前記統計的特徴抽出手段から出力
    された統計的特徴から切り出し文字画像の各カテゴリに
    対する類似度を求め、類似度の大きい順に選んだ少なく
    とも1つのカテゴリの類似度と、同じ順に選んだ少なく
    とも一つのカテゴリとを出力する認識手段と、前記認識
    手段から出力されたカテゴリと前記カテゴリに対する類
    似度と前記構造的特徴抽出手段から出力された構造的特
    徴とに基づいて最終的な文字パターンの属するカテゴリ
    を判定する第1の構造識別手段とを備えたことを特徴と
    する光学的文字読み取り装置。
  7. 【請求項7】 前記第1の構造識別手段が、前記認識手
    段から出力されたカテゴリに基づいて、前記構造特徴抽
    出手段から出力された少なくとも一つの構造的特徴の中
    から有効な構造的特徴を選択する認識依存特徴選択手段
    と、選択された構造的特徴に基づいてカテゴリを判定す
    る選択構造的特徴識別手段とを備えたことを特徴とする
    請求項6記載の光学的文字読み取り装置。
  8. 【請求項8】 前記文字切り出し手段から出力された外
    接矩形の大きさに基づき活字または手書きの判定を行う
    字種判定手段を備え、前記第1の構造識別手段が、前記
    字種判定手段で活字と判定された文字に対して、個々の
    文字パターンが属するカテゴリを判定する第1の活字処
    理手段と、前記字種判定手段で手書きと判定された文字
    に対して、個々の文字パターンが属するカテゴリを判定
    する第1の手書き処理手段とを備えたことを特徴とする
    請求項6または7記載の光学的文字読み取り装置。
  9. 【請求項9】 前記第1の活字処理手段が、前記文字切
    り出し手段から出力された外接矩形の大きさと認識手段
    から出力されたカテゴリに基づいて構造的特徴抽出手段
    から出力された少なくとも一つの構造的特徴の中から有
    効な構造的特徴を選択する認識依存特徴選択手段と、認
    識依存特徴選択手段で選択された構造的特徴に基づいて
    カテゴリ判定を行う選択構造的特徴識別手段とを備えた
    ことを特徴とする請求項8記載の光学的文字読み取り装
    置。
  10. 【請求項10】 前記第1の活字処理手段が、前記文字
    切り出し手段から出力された外接矩形の大きさと認識手
    段から出力されたカテゴリに基づいて一部のカテゴリに
    対する最終的なカテゴリ判定を行う外接矩形カテゴリ判
    定手段と、外接矩形カテゴリ判定手段で判定できない文
    字に対して認識手段から出力されたカテゴリに基づいて
    構造的特徴抽出手段から出力された少なくとも一つの構
    造的特徴の中から有効な構造的特徴を選択する認識依存
    特徴選択手段と、前記認識依存特徴選択手段で選択され
    た構造的特徴に基づいてカテゴリ判定を行う選択構造的
    特徴識別手段とを備えたことを特徴とする請求項8記載
    の光学的文字読み取り装置。
  11. 【請求項11】 前記第1の手書き処理手段が、前記文
    字切り出し手段から出力された外接矩形の大きさと認識
    手段から出力されたカテゴリに基づいて構造的特徴抽出
    手段から出力された少なくとも一つの構造的特徴の中か
    ら有効な構造的特徴を選択する認識依存特徴選択手段
    と、前記認識依存特徴選択手段で選択された構造的特徴
    に基づいてカテゴリ判定を行う選択構造的特徴識別手段
    とを備えたことを特徴とする請求項8記載の光学的文字
    読み取り装置。
  12. 【請求項12】 前記第1の手書き処理手段が、前記文
    字切り出し手段から出力された外接矩形の大きさと認識
    手段から出力されたカテゴリに基づいて一部のカテゴリ
    に対する最終的なカテゴリ判定を行う外接矩形カテゴリ
    判定手段と、外接矩形カテゴリ判定手段で判定できない
    文字に対して認識手段から出力されたカテゴリに基づい
    て構造的特徴抽出手段から出力された少なくとも一つの
    構造的特徴の中から有効な構造的特徴を選択する認識依
    存特徴選択手段と、前記認識依存特徴選択手段で選択さ
    れた構造的特徴に基づいてカテゴリ判定を行う選択構造
    的特徴識別手段とを備えたことを特徴とする請求項8記
    載の光学的文字読み取り装置。
  13. 【請求項13】 光電変換された文字枠線を含む文字列
    データに対して、文字枠線と文字列パターンを分離し、
    分離された文字列パターンから個々の文字パターンを切
    り出し、個々の文字パターンに対する外接矩形の大きさ
    と外接矩形に囲まれた切り出し文字画像を出力する文字
    切り出し手段と、前記文字切り出し手段で切り出された
    個々の切り出し文字画像に対する基本特徴として輪郭情
    報と背景構造情報を求める基本特徴抽出手段と、前記基
    本特徴抽出手段から出力された基本特徴に基づいて少な
    くとも一種類の統計的特徴を求める統計的特徴抽出手段
    と、前記文字切り出し手段で切出された個々の切り出し
    文字画像と前記基本特徴抽出手段から出力された基本特
    徴に基づいて少なくとも一種類の構造的特徴を求める構
    造的特徴抽出手段と、前記統計的特徴抽出手段から出力
    された統計的特徴から切り出し文字画像の各カテゴリに
    対する類似度を求め、類似度の大きい順に選んだ少なく
    とも1つのカテゴリの類似度と、同じ順に選んだ少なく
    とも一つのカテゴリとを出力する認識手段と、前記文字
    切り出し手段から出力された文字パターンの外接矩形の
    大きさと前記認識手段から出力されたカテゴリと前記構
    造的特徴抽出手段から出力された構造的特徴との少なく
    とも一つに基づいて前記認識手段から出力された類似度
    を修正し、修正後の類似度に基づいて文字パターンが属
    するカテゴリを最終的に判定する第2の構造識別手段と
    を備えたことを特徴とする光学的文字読み取り装置。
  14. 【請求項14】 前記第2の構造識別手段が、前記文字
    切り出し手段から出力された文字パターンの外接矩形の
    大きさと前記認識手段から出力された少なくとも一つの
    カテゴリと前記構造的特徴抽出手段から出力された構造
    的特徴に基づいて、前記認識手段から出力された類似度
    を修正する類似度修正手段と、前記認識手段から出力さ
    れた少なくとも一つのカテゴリの類似度と前記類似度修
    正手段により修正された類似度と加算して修正類似度を
    算出する加算器と、前記加算器から出力された修正類似
    度から個々の文字パターンが属するカテゴリを決定する
    修正カテゴリ判定手段とを備えたことを特徴とする請求
    項13記載の光学的文字読み取り装置。
  15. 【請求項15】 前記文字切り出し手段から出力された
    外接矩形の大きさに基づき活字または手書きの判定を行
    う字種判定手段を備え、前記第2の構造識別手段が、前
    記字種判定手段で活字と判定された文字に対して、個々
    の文字パターンが属するカテゴリを判定する第2の活字
    処理手段と、前記字種判定手段で手書きと判定された文
    字に対して、個々の文字パターンが属するカテゴリを判
    定する第2の手書き処理手段とを備えたことを特徴とす
    る請求項13または14記載の光学的文字読み取り装
    置。
  16. 【請求項16】 前記第2の活字処理手段が、前記文字
    切り出し手段から出力された文字パターンの外接矩形の
    大きさと前記認識手段から出力された少なくとも一つの
    カテゴリと前記構造的特徴抽出手段から出力された構造
    的特徴に基づいて、前記認識手段から出力された類似度
    を修正する類似度修正手段と、前記認識手段から出力さ
    れた少なくとも一つのカテゴリの類似度と前記類似度修
    正手段により修正された類似度と加算して修正類似度を
    算出する加算器と、前記加算器から出力された修正類似
    度から個々の文字パターンが属するカテゴリを決定する
    修正カテゴリ判定手段とを備えたことを特徴とする請求
    項15記載の光学的文字読み取り装置。
  17. 【請求項17】 前記第2の手書き処理手段が、前記文
    字切り出し手段から出力された文字パターンの外接矩形
    の大きさと前記認識手段から出力された少なくとも一つ
    のカテゴリと前記構造的特徴抽出手段から出力された構
    造的特徴に基づいて、前記認識手段から出力された類似
    度を修正する類似度修正手段と、前記認識手段から出力
    された少なくとも一つのカテゴリの類似度と前記類似度
    修正手段により修正された類似度と加算して修正類似度
    を算出する加算器と、前記加算器から出力された修正類
    似度から個々の文字パターンが属するカテゴリを決定す
    る修正カテゴリ判定手段とを備えたことを特徴とする請
    求項15記載の光学的文字読み取り装置。
  18. 【請求項18】 前記基本特徴抽出手段が、 前記文字
    切り出し手段から出力される切り出し画像中の文字パタ
    ーンの輪郭点を抽出する輪郭点抽出手段と、前記輪郭点
    抽出手段から出力された個々の輪郭点の隣接関係から画
    素単位の輪郭方向成分を算出する輪郭方向算出手段と、
    前記輪郭点抽出手段から出力された輪郭点の位置に基づ
    いて文字パターンの外接矩形の各々の辺から文字パター
    ンまでの背景距離を求める背景距離算出手段と前記文字
    切り出し手段から出力された切り出し画像を水平及び垂
    直方向のライン毎に走査し、一定画素以上連続する白画
    素(背景)の連続する長さ・位置情報とその背景の走査
    方向に沿った発生順番である背景次数を算出する背景情
    報算出手段とを備えたことを特徴とする請求項6、8、
    13、15のいずれかに記載の光学的文字読み取り装
    置。
  19. 【請求項19】 前記統計的特徴抽出手段が、前記文字
    切り出し手段から出力された切り出し画像を水平・垂直
    両方向で複数のブロックに分割する両方向ブロック分割
    手段と、前記両方向ブロック分割手段で分割したブロッ
    ク単位で、前記基本特徴抽出手段の輪郭方向算出手段か
    ら出力された輪郭方向成分について輪郭方向毎の個数を
    集計する輪郭方向集計手段と、輪郭方向集計手段から出
    力されたブロック単位の輪郭方向毎の輪郭方向成分の個
    数をブロックの大きさで割ることで得られる輪郭方向毎
    の輪郭統計特徴量を求める輪郭方向正規化手段と、前記
    文字切り出し手段から出力された切り出し画像を水平方
    向で複数のブロックに分割する水平方向ブロック分割手
    段と、前記文字切り出し手段から出力された切り出し画
    像を垂直方向で複数のブロックに分割する垂直方向ブロ
    ック分割手段と、前記基本特徴抽出手段から出力された
    輪郭方向成分に基づいて、前記水平方向ブロック分割部
    及び垂直方向ブロック分割手段で分割したブロック単位
    で、ブロック分割境界線に垂直な外接矩形の辺からブロ
    ック分割境界線に平行方向に走査して最初に存在する文
    字パターンを構成する画素の輪郭方向毎の輪郭方向成分
    の個数である外郭方向成分の個数を集計する外郭方向集
    計手段と、外郭方向集計手段から出力されたブロック単
    位の輪郭方向毎の外郭方向成分の個数をブロックの大き
    さで割ることで得られる輪郭方向毎の外郭統計特徴量を
    求める外郭方向正規化手段と、前記基本特徴抽出手段の
    背景距離算出手段から出力された背景距離に基づいて、
    前記水平方向ブロック分割部及び垂直方向ブロック分割
    部で分割したブロック単位でブロック分割方向の背景距
    離を合計する背景距離合計手段と、背景距離集計手段か
    ら出力されたブロック単位の集計背景距離をブロックの
    大きさで割ることで得られる背景距離特徴量を求める背
    景距離正規化手段とを備えたことを特徴とする請求項
    6、8、13、15のいずれかに記載の光学的文字読み
    取り装置。
  20. 【請求項20】 前記構造的特徴抽出手段が、前記基本
    特徴抽出手段の背景距離算出手段から出力された背景距
    離に基づいて局所的な背景距離特徴を抽出する局所背景
    特徴抽出手段と、前記基本特徴抽出手段の輪郭方向算出
    手段から出力された輪郭方向成分に基づいて局所的なス
    トローク方向の変化を抽出する局所ストローク形状抽出
    手段と、 前記文字切り出し手段から出力された切り出
    し文字画像と前記基本特徴抽出手段の輪郭方向算出手段
    から出力された輪郭方向成分に基づいて文字パターンの
    ループを抽出する第1のループ抽出手段と、前記基本特
    徴抽出手段の背景情報算出手段で算出した背景情報に基
    づいて背景次数毎に隣接する背景画素の塊を背景ブロッ
    クとして求めると共に、その大きさ情報と位置情報を算
    出する背景ブロック抽出手段と、前記基本特徴抽出手段
    の背景情報算出手段で算出した背景情報に基づいて隣接
    する白画素の塊を背景ラベルとして求めラベル番号を付
    与すると共に、その大きさ、位置、その背景ラベルが外
    接矩形のどの辺と接するかを表わすラベル情報を算出す
    る背景ラベル抽出手段と、前記基本特徴抽出手段の背景
    情報算出手段で算出した背景情報に基づいて文字パター
    ンを構成するストロークの端点と交点と抽出する端点・
    交点抽出手段と、前記基本特徴抽出手段の背景情報算出
    手段で算出した背景情報と前記端点・交点抽出手段で抽
    出された端点と交点とに基づいて直線を抽出する直線抽
    出手段とを備えたことを特徴とする請求項6、8、1
    3、15のいずれかに記載の光学的文字読み取り装置。
  21. 【請求項21】 前記構造的特徴抽出部が、前記基本特
    徴抽出手段の背景距離算出手段から出力された背景距離
    に基づいて局所的な背景距離特徴を抽出する局所背景特
    徴抽出手段と、前記基本特徴抽出手段の輪郭方向算出手
    段から出力された輪郭方向成分に基づいて局所的なスト
    ローク方向の変化を抽出する局所ストローク形状抽出手
    段と、前記基本特徴抽出手段の背景情報算出手段で算出
    した背景情報から、背景次数毎に隣接する背景画素の塊
    を背景ブロックとして求めると共に、その大きさ情報と
    位置情報を算出する背景ブロック抽出手段と、前記基本
    特徴抽出手段の背景情報算出手段で算出した背景情報か
    ら、隣接する白画素の塊を背景ラベルとして求めラベル
    番号を付与すると共に、その大きさ、位置、その背景ラ
    ベルが外接矩形のどの辺と接するかを表わすラベル情報
    を算出する背景ラベル抽出手段と、前記基本特徴抽出手
    段の背景情報算出手段で算出した背景情報に基づいて文
    字パターンを構成するストロークの端点と交点と抽出す
    る端点・交点抽出手段と、前記基本特徴抽出手段の背景
    情報算出手段で算出した背景情報と前記端点・交点抽出
    手段で抽出された端点と交点とに基づいて直線を抽出す
    る直線抽出手段と、前記背景ラベル抽出手段で算出した
    ラベル情報に基づいて文字パターンのループを抽出する
    第2のループ抽出手段とを備えたことを特徴とする請求
    項6、8、13、15のいずれかに記載の光学的文字読
    み取り装置。
  22. 【請求項22】 前記端点・交点抽出手段が、前記背景
    情報算出手段から出力された垂直及び水平方向の各ライ
    ンの背景情報に基づき文字パターンの端点及び交点の候
    補を抽出する端点・交点候補抽出手段と、前記抽出され
    た端点及び交点候補の個々の位置関係を比較することに
    より不適切な端点及び交点候補を除去して適切な端点及
    び交点を抽出する端点・交点判定手段とを備えたことを
    特徴とする請求項20または21記載の光学的文字読み
    取り装置。
  23. 【請求項23】 前記直線抽出手段が、前記背景情報算
    出手段から出力された垂直及び水平方向の各ラインの背
    景情報に基づき黒画素が予め定められた閾値よりも長く
    連続する領域を抽出する黒画素連続領域抽出手段と、前
    記黒画素連続領域抽出手段から出力された黒画素連続領
    域に基づき垂直及び水平方向の直線候補を抽出する直線
    候補抽出手段と、前記端点・交点抽出手段から出力され
    た端点及び交点の位置情報に基づき前記直線候補抽出手
    段から出力された直線候補の中から直線でないものを除
    去し、残った直線候補の中から近傍の線との接続状態に
    応じて種類を判定する直線判定手段とを備えたことを特
    徴とする請求項20または21記載の光学的文字読み取
    り装置。
  24. 【請求項24】 前記文字切り出し手段から出力された
    文字パターンの外接矩形の大きさ、前記認識手段から出
    力された少なくとも一つの類似度、前記背景情報算出手
    段で算出した背景情報に基づく背景複雑度の中の少なく
    とも一つに基づいて切り出しエラーを判定し、前記文字
    切り出し手段に再切り出しの指示を与えるエラー判定手
    段を備えたことを特徴とする請求項6、8、13、1
    5、24のいずれかに記載の光学的文字読み取り装置。
  25. 【請求項25】 前記認識手段で算出されたカテゴリ類
    似度の大きい方から2つのカテゴリ類似度を選択し、2
    番目の類似度と最大類似度の比の値が予め設定されてい
    る閾値aより大きいか、または最大類似度が予め設定さ
    れている閾値bより小さいか、または前記背景情報算出
    手段で算出した背景情報に基づく背景複雑度が予め設定
    されている閾値cより大きい場合にリジェクト信号を出
    力し、それ以外の場合は認識結果として最大類似度のカ
    テゴリを出力する第1の認識結果算出手段を備えたこと
    を特徴とする請求項6、8、13、15、24のいずれ
    かに記載の光学的文字読み取り装置。
  26. 【請求項26】 複数の文字パターンに対して、予め大
    きい方から2番目の類似度と最大類似度の比、最大類似
    度、前記背景情報算出手段で算出した背景情報に基づく
    背景複雑度、前記認識手段が出力する認識結果を算出
    し、前記類似度比と前記最大類似度と前記背景複雑度の
    少なくとも1つを入力とし、前記認識結果が不正解の場
    合は、リジェクト信号を出力し、正解の場合はリジェク
    ト信号を出力しないように予め学習させた階層型ニュー
    ラルネットワークで構成した第2の認識結果算出手段を
    備えたことを特徴とする請求項6、8、13、15、2
    4のいずれかに記載の光学的文字読み取り装置。
  27. 【請求項27】 枠罫線と文字を含む帳票を光電的に読
    み取って2値画像に変換し、前記2値画像を画像メモリ
    に記憶し、前記2値画像から枠罫線を抽出し、前記抽出
    された枠罫線から前記帳票の特徴を表わす枠構造特徴を
    抽出し、予め個々の帳票の枠構造特徴およびこの枠構造
    特徴を有する帳票に記載される少なくとも1つの候補文
    字列を登録する枠構造参照テーブルを参照し、前記枠構
    造特徴を照合することにより前記帳票の種別をおおまか
    に分類し、前記帳票内の文字読取対象領域を検出し、前
    記文字読取対象領域に基づき、前記画像メモリから文字
    領域を切り出し、切り出された文字を認識し、少なくと
    も1つの認識結果と前記枠構造参照テーブルに登録され
    た候補文字列とを照合し、最終認識結果とすることを特
    徴とする光学的文字読み取り方法。
  28. 【請求項28】 枠罫線と文字を含む帳票を光電的に読
    み取って2値画像に変換する画像入力手段と、前記2値
    画像を記憶する画像メモリと、前記2値画像から枠罫線
    を抽出する枠罫線抽出手段と、前記抽出された枠罫線か
    ら前記帳票の特徴を表わす枠構造特徴を抽出する枠構造
    特徴抽出手段と、予め個々の帳票の枠構造特徴およびこ
    の枠構造特徴を有する帳票に記載される少なくとも1つ
    の候補文字列を登録する枠構造参照テーブルと、前記枠
    構造参照テーブルを参照し、前記枠構造特徴を照合する
    ことにより前記帳票の種別をおおまかに分類し、前記帳
    票内の文字読取対象領域を検出する枠構造照合手段と、
    前記文字読取対象領域に基づき、前記画像メモリから文
    字領域を切り出す文字切り出し手段と、切り出された文
    字を認識する文字認識手段とを備えた光学的文字読み取
    り装置。
  29. 【請求項29】 前記文字認識手段より出力される少な
    くとも1つの認識結果と前記枠構造参照テーブルに登録
    された候補文字列とを照合し、最終認識結果とする後処
    理手段を備えた請求項28記載の光学的文字読み取り装
    置。
  30. 【請求項30】 搬送されてくる帳票に記載された文字
    列を請求項28または29記載の帳票文書認識装置によ
    り認識する帳票文書認識手段と、前記帳票文書認識手段
    により認識された文字列を識別コード変換テーブルを参
    照し、識別コードに変換する識別コード変換手段と、前
    記識別コードを前記帳票上に印字する識別コード印字手
    段と、前記識別コードに従って前記帳票を処理する処理
    手段とを備えた光学的文字読み取り装置。
  31. 【請求項31】 前記識別コードに代えて、または前記
    識別コードとともに、前記識別コードに対応するバーコ
    ードを印字する手段を備えた請求項30記載の光学的文
    字読み取り装置。
JP15629598A 1997-06-05 1998-06-04 光学的文字読み取り方法とその装置 Expired - Fee Related JP3370934B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP15629598A JP3370934B2 (ja) 1997-06-05 1998-06-04 光学的文字読み取り方法とその装置
EP99304385A EP0965943A3 (en) 1998-06-04 1999-06-04 Optical character reading method and system for a document with ruled lines and their application
US09/325,546 US6636631B2 (en) 1998-06-04 1999-06-04 Optical character reading method and system for a document with ruled lines and its application

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
JP16204897 1997-06-05
JP29178397 1997-10-09
JP29791097 1997-10-16
JP9-162048 1998-03-13
JP9-297910 1998-03-13
JP10-62991 1998-03-13
JP9-291783 1998-03-13
JP6299198 1998-03-13
JP15629598A JP3370934B2 (ja) 1997-06-05 1998-06-04 光学的文字読み取り方法とその装置

Publications (2)

Publication Number Publication Date
JPH11328309A true JPH11328309A (ja) 1999-11-30
JP3370934B2 JP3370934B2 (ja) 2003-01-27

Family

ID=27523746

Family Applications (1)

Application Number Title Priority Date Filing Date
JP15629598A Expired - Fee Related JP3370934B2 (ja) 1997-06-05 1998-06-04 光学的文字読み取り方法とその装置

Country Status (1)

Country Link
JP (1) JP3370934B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004179997A (ja) * 2002-11-27 2004-06-24 Sony Corp 双方向コミュニケーションシステム,映像通信装置,および映像通信装置の映像データ配信方法
JP2007122500A (ja) * 2005-10-28 2007-05-17 Ricoh Co Ltd 文字認識装置、文字認識方法及び文字データ
CN100357957C (zh) * 2004-08-10 2007-12-26 富士通株式会社 用于识别图像中的字符的字符识别装置和字符识别方法
US8160402B2 (en) 2007-07-23 2012-04-17 Sharp Kabushiki Kaisha Document image processing apparatus
CN107147820A (zh) * 2016-03-01 2017-09-08 京瓷办公信息系统株式会社 信息处理装置
CN111739013A (zh) * 2020-06-30 2020-10-02 北京酷豹科技有限公司 基于图像处理的图像优化方法及相关装置
JP2022146746A (ja) * 2021-03-22 2022-10-05 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004179997A (ja) * 2002-11-27 2004-06-24 Sony Corp 双方向コミュニケーションシステム,映像通信装置,および映像通信装置の映像データ配信方法
CN100357957C (zh) * 2004-08-10 2007-12-26 富士通株式会社 用于识别图像中的字符的字符识别装置和字符识别方法
JP2007122500A (ja) * 2005-10-28 2007-05-17 Ricoh Co Ltd 文字認識装置、文字認識方法及び文字データ
US8160402B2 (en) 2007-07-23 2012-04-17 Sharp Kabushiki Kaisha Document image processing apparatus
CN107147820A (zh) * 2016-03-01 2017-09-08 京瓷办公信息系统株式会社 信息处理装置
US10425556B2 (en) 2016-03-01 2019-09-24 Kyocera Document Solutions Inc. Information processing apparatus
CN107147820B (zh) * 2016-03-01 2019-10-11 京瓷办公信息系统株式会社 信息处理装置
US10681245B2 (en) 2016-03-01 2020-06-09 Kyocera Document Solutions Inc. Information processing apparatus
US10715699B2 (en) 2016-03-01 2020-07-14 Kyocera Document Solutions Inc. Information processing apparatus
CN111739013A (zh) * 2020-06-30 2020-10-02 北京酷豹科技有限公司 基于图像处理的图像优化方法及相关装置
CN111739013B (zh) * 2020-06-30 2024-04-23 北京酷豹科技有限公司 基于图像处理的图像优化方法及相关装置
JP2022146746A (ja) * 2021-03-22 2022-10-05 楽天グループ株式会社 情報処理装置、情報処理方法およびプログラム

Also Published As

Publication number Publication date
JP3370934B2 (ja) 2003-01-27

Similar Documents

Publication Publication Date Title
US6636631B2 (en) Optical character reading method and system for a document with ruled lines and its application
US6259812B1 (en) Key character extraction and lexicon reduction cursive text recognition
US6339651B1 (en) Robust identification code recognition system
US5787194A (en) System and method for image processing using segmentation of images and classification and merging of image segments using a cost function
EP0385009A1 (en) Apparatus and method for use in image processing
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
Kennard et al. Separating lines of text in free-form handwritten historical documents
Verma et al. A novel approach for structural feature extraction: contour vs. direction
JPH11328309A (ja) 光学的文字読み取り方法とその装置
Ullmann Picture analysis in character recognition
Baird Global-to-local layout analysis
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
Djematene et al. A geometrical method for printed and handwritten berber character recognition
Koga et al. Segmentation of Japanese handwritten characters using peripheral feature analysis
JP2985893B2 (ja) パターン認識装置
JP3673616B2 (ja) 商品券識別方法及び装置
JP4026738B2 (ja) パターン認識方法及び装置、並びに記録媒体
JP2000113110A (ja) 光学的文字読み取り装置
JP2965165B2 (ja) パターン認識方法及び認識用辞書作成方法
JP3344062B2 (ja) カタカナ手書き文字切り出し回路
Humied Segmentation accuracy for offline Arabic handwritten recognition based on bounding box algorithm
JP2906758B2 (ja) 文字読取装置
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
Graf et al. Analysis of complex and noisy check images
JP2003115028A (ja) 帳票識別辞書自動生成方法及び帳票処理システム

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees