JPH11328309A

JPH11328309A - 光学的文字読み取り方法とその装置

Info

Publication number: JPH11328309A
Application number: JP10156295A
Authority: JP
Inventors: Keiichi Miyazaki; 崎桂一宮; Masato Minami; 正人南; Toshiyuki Koda; 田敏行香
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1997-06-05
Filing date: 1998-06-04
Publication date: 1999-11-30
Anticipated expiration: 2018-06-04
Also published as: JP3370934B2

Abstract

(57)【要約】【課題】従来の統計的特徴による認識方法をベース
に、構造的特徴は類似カテゴリの分離に必要なものを中
心に限定して抽出することにより、辞書作成を効率化
し、統計的特徴による認識方法で誤りやすい類似カテゴ
リの識別を構造的特徴を利用して行うことにより、類似
カテゴリの認識性能を向上させる。【解決手段】統計的特徴と構造的特徴共通の基本特徴
を抽出する基本特徴抽出部２と、統計的特徴を抽出する
統計的特徴抽出部３と、統計的特徴に基づく認識を実行
する認識部４と、認識部４の認識傾向に応じて類似カテ
ゴリの分離特徴を中心に抽出する第１の構造的特徴抽出
部５と、手書きと活字を分離する字種判定部６と、認識
部４の認識結果に応じて適切な構造的特徴を用いて最終
的なカテゴリ判断を行う第１の構造識別部７とを設ける
ことにより、辞書作成の効率化と類似カテゴリの認識性
能の向上が可能となる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、帳票あるいは、文書上
の手書き、印刷文字を読み取る光学的文字読み取り方法
とその装置に関するものである。

【０００２】

【従来の技術】従来の光学的文字読み取り装置における
類似度算出方式としては、距離尺度に基づく類似度算出
法が一般的である。距離尺度は、大きく分けるとパター
ンベクトルの個々の次元に着目した距離尺度と、次元全
体の分布を考慮した距離尺度とに分類され、電子情報通
信学会論文誌Ｄ−IIVol.J79-D-II No.1 pp.45 - 52「改
良型マハラノビス距離を用いた高精度な手書き文字認
識」に示されているように、後者の次元全体の分布を考
慮した距離尺度に基づく類似度算出方式の方が有効であ
ることが知られている。中でも、複合類似度法は、既に
実用化された一般的な類似度算出方式の１つである。

【０００３】複合類似度法の類似度算出方式は、ある１
つの文字カテゴリについて、それに含まれる学習用文字
パターンが作り出すパターン空間内の分布について主成
分分析を行い、その主成分としてえられるＮ個の固有ベ
クトルψｉ（ｉ= １，２，．．．．，Ｎ）をそのカテゴ
リの辞書として、以下で定義される複合類似度Ｓに基づ
いて入力文字パターンベクトルｆに対する類似度を算出
する。

【数１】ここで、λi は、固有値である。認識結果としては、大
きい方から２番目の類似度と最大類似度の比の大きさに
より、リジェクトの有無を判定し、リジェクト出ない場
合は、最大類似度のカテゴリを認識結果とするのが一般
的である。

【０００４】従来の光学的文字読み取り装置における構
造特徴を用いた認識方式としては、東芝レビュー、Vol.
41, No.12, pp.1012-1015(1986) 「自由手書き文字認
識」に示されている輪郭構造マッチング方が知られてい
る。

【０００５】この方式によれば、８方向にコード化され
たフリーマン・コード・チェインを最初の段階の特徴量
として抽出し、平滑化後曲率により分割される。分割さ
れた部分輪郭はセグメントと呼ばれ凸、直線、凹の三種
類に分類され、各セグメントには、長さ、曲率、位置、
方向等の属性情報が与えられる。

【０００６】一方、辞書には同様の輪郭セグメントのシ
ーケンスが記述されており、これらには前記属性情報に
関して、その値の上限、下限の値がセットされている。
入力パターンと辞書に記述されている属性情報を比較す
ることにより、入力パターンのセグメントと辞書セグメ
ントの対応関係を調べ認識が実行される。

【０００７】

【発明が解決しようとする課題】しかしながら、従来の
光学的文字読み取り装置では、主成分分析によって得ら
れた統計的特徴のみを用いているために人間の認識特性
とのずれが生じ、文字形状の構造的な相違点を反映でき
ないために、人間には容易に分離できる類似カテゴリ
が、統計的特徴を用いた認識方法では分離が困難である
という課題があった。また、構造的特徴のみを用いる認
識方法では、辞書作成の効率が悪いという課題があっ
た。

【０００８】また、枠線（非ドロップアウト）を有する
帳票等に書かれた文字を対象にする場合、文字が枠線と
接触または、枠をはみ出し・金額等の訂正により、枠線
の１部が文字に結合したり、文字の一部がかけたり、訂
正部分や訂正印の一部が文字として切り出されるなどの
文字切りだしエラーが発生しやすく、それらのパターン
を認識し類似度の比のみでリジェクトを判定するとリジ
ェクトされずに、誤読となることが多いと言う課題もあ
った。

【０００９】本発明は、前記従来の問題点に鑑み、従来
の統計的特徴による認識方法をベースに、構造的特徴は
類似カテゴリの分離に必要なものを中心に限定して抽出
することにより辞書作成を効率化し、また統計的特徴に
よる認識方法で誤りやすい類似カテゴリの識別を構造的
特徴を利用して行うことにより、類似カテゴリの分離能
力すなわち認識性能を向上させると共に、文字パターン
の類似度の比だけではなく、類似度の大きさも併用する
事で文字切りだしエラー文字を効率的にリジェクトする
ようにした光学的文字読み取り方法とその装置を提供す
ることを目的とする。

【００１０】

【課題を解決するための手段】上記目的を達成するた
め、本発明は、光電変換された文字枠線を含む文字列デ
ータに対して、文字枠線と文字列パターンを分離し、分
離された文字列パターンから個々の文字パターンを切り
出し、個々の文字パターンに対する外接矩形の大きさと
外接矩形に囲まれた切り出し文字画像を出力する文字切
り出し手段と、前記文字切り出し手段で切り出された個
々の切り出し文字画像に対する輪郭情報と背景構造情報
を求める基本特徴抽出手段と、前記基本特徴抽出手段か
ら出力された輪郭方向成分と背景距離に基づいて少なく
とも一種類の統計的特徴を求める統計的特徴抽出手段
と、前記基本特徴抽出手段から出力された基本特徴に基
づいて少なくとも一種類の構造的特徴を求める構造的特
徴抽出手段と、前記統計的特徴抽出手段から出力された
統計的特徴から切り出し文字画像の各カテゴリに対する
類似度を求め、類似度の大きい順に選んだ少なくとも１
つのカテゴリの類似度と、同じ順に選んだ少なくとも一
つのカテゴリを出力する認識手段と、前記認識手段から
出力されたカテゴリと前記カテゴリに対する類似度と前
記構造的特徴抽出手段から出力された構造的特徴とに基
づいて最終的な文字パターンの属するカテゴリを判定す
る第１の構造識別手段とを備えたものである。

【００１１】この構成により、基本特徴抽出手段におい
て統計的特徴と構造的特徴の両方に利用できるような基
本特徴を抽出して構成の共通化を図り、構造的特徴抽出
手段では認識手段で識別が困難な類似カテゴリを分離す
るのに有効な構造的特徴を中心に限定して抽出すること
により、辞書作成を効率化し、統計的特徴を用いた認識
手段の認識結果に基づいて、構造識別手段において類似
カテゴリの分離に必要な特徴を選択して最終的なカテゴ
リの決定を行うことにより、効率的な処理と類似カテゴ
リの認識性能の向上の両方を可能にする。

【００１２】

【発明の実施の形態】本発明の請求項１に記載の発明
は、光電変換された文字枠線を含む文字列データに対し
て、文字枠線と文字列パターンを分離し、分離された文
字列パターンから個々の文字パターンを切り出し、個々
の文字パターンに対する外接矩形の大きさと外接矩形に
囲まれた切り出し文字画像を求め、前記切り出された個
々の切り出し文字画像に対する輪郭情報と背景構造情報
とを基本特徴として抽出し、前記抽出された基本特徴に
基づいて少なくとも一種類の統計的特徴を抽出し、前記
切り出された個々の切り出し文字画像と前記抽出された
基本特徴に基づいて少なくとも一種類の構造的特徴を抽
出し、前記抽出された統計的特徴から前記切り出し文字
画像の各カテゴリに対する類似度を求め、前記類似度が
最大のカテゴリを個々の文字パターンの属するカテゴリ
と判定し、前記判定された文字パターンの属するカテゴ
リと前記カテゴリに対する類似度と前記抽出されたた構
造的特徴とに基づいて最終的な文字パターンの属するカ
テゴリを判定する各ステップを備えたことを特徴とする
光学的文字読み取り方法である。

【００１３】この構成により、統計的特徴と構造的特徴
の両方に利用できるような基本特徴を抽出することによ
り構成の共通化が可能になり、統計的特徴による認識処
理では識別が困難な類似カテゴリの分離に有効な構造的
特徴を中心に限定して抽出することにより辞書作成を効
率化し、統計的特徴を用いて識別を行う認識手段から出
力された認識結果に基づいて、構造識別手段において必
要な構造的特徴を選択し最終的なカテゴリを決定するこ
とによって処理の効率化と類似カテゴリの認識性能の向
上が可能になるという作用を有する。

【００１４】本発明の請求項２に記載の発明は、光電変
換された文字枠線を含む文字列データに対して、文字枠
線と文字列パターンを分離し、分離された文字列パター
ンから個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさと外接矩形に囲まれた切
り出し文字画像を求め、前記切り出された個々の切り出
し文字画像に対する輪郭情報と背景構造情報とを基本特
徴として抽出し、前記抽出された基本特徴に基づいて少
なくとも一種類の統計的特徴を抽出し、前記切り出され
た個々の切り出し文字画像と前記抽出された基本特徴に
基づいて少なくとも一種類の構造的特徴を抽出し、前記
抽出された統計的特徴から前記切り出し文字画像の各カ
テゴリに対する類似度を求め、前記類似度が最大のカテ
ゴリを個々の文字パターンの属するカテゴリと判定し、
前記切り出された個々の文字パターンに対する外接矩形
の大きさと前記判定された文字パターンの属するカテゴ
リと前記抽出された構造的特徴との少なくとも一つに基
づいて前記類似度を修正し、修正後の類似度に基づいて
最終的な文字パターンの属するカテゴリを判定する各ス
テップを備えたことを特徴とする光学的文字読み取り方
法である。

【００１５】この構成により、前記切り出し文字画像の
各カテゴリに対する類似度の微妙な差を最終的なカテゴ
リ決定に反映させることができ、また、構造的特徴の検
出結果を定量的に類似度の修正値に反映させることがで
きるため、認識性能が向上するという作用を有する。

【００１６】本発明の請求項３に記載の発明は、前記切
り出された文字パターンに対する外接矩形の大きさに基
づいて活字または手書きの字種判定を行い、前記字種判
定の結果と前記切り出された文字パターンに対する外接
矩形の大きさと前記判定された文字パターンの属するカ
テゴリと前記カテゴリに対する類似度と前記抽出された
構造的特徴の少なくとも一つに基づいて最終的な文字パ
ターンの属するカテゴリを判定する各ステップを備えた
ことを特徴とする請求項１または２記載の光学的文字読
み取り方法である。

【００１７】この構成により、字種に応じて専門化処理
を行うことにより活字・手書き特有の構造的特徴を混同
することなく利用して、類似カテゴリ間の認識性能を高
め、処理の効率化が図れるという作用を有する。

【００１８】本発明の請求項４に記載の発明は、前記切
り出された文字パターンに対する外接矩形の大きさと前
記判定されたカテゴリに対する類似度と前記抽出された
構造的特徴との少なくとも一つに基づいて切り出しエラ
ーを判定し、切り出しエラーと判定された場合に文字パ
ターンの再切り出しを行う各ステップを備えたことを特
徴とする請求項１または２または３記載の光学的文字読
み取り方法である。

【００１９】この構成により、外接矩形が他の文字の外
接矩形と大きく相違していたり規定の外接矩形から外れ
ている場合や、類似度が他の文字の類似度に比べて極端
に低い場合や、第１位の類似度と第２位以下の類似度と
の差が少ない場合などに切り出しエラーがあると判定し
再切り出しを行うことにより、切り出し誤りを減らし、
切り出し誤りに起因する誤認識を減少させることができ
るという作用を有する。

【００２０】本発明の請求項５に記載の発明は、前記切
り出された文字パターンの最大類似度、２番目の類似度
と最大類似度の比の値、前記切り出された文字パターン
の背景の複雑度に基づいて、前記判定された文字パター
ンの属するカテゴリの信頼度が低い場合にはリジェクト
処理を行い、それ以外の場合は前記判定された文字パタ
ーンの属するカテゴリを最終的な認識結果とする各ステ
ップを備えたことを特徴とする請求項１から４のいずれ
かに記載の光学的文字読み取り方法である。

【００２１】この構成により、最大類似度の大きさ及び
背景複雑度もリジェクト判定に利用する事により、類似
度の比だけではリジェクト困難な前処理エラー文字を効
率よくリジェクトできるという作用を有する。

【００２２】本発明の請求項６に記載の発明は、光電変
換された文字枠線を含む文字列データに対して、文字枠
線と文字列パターンを分離し、分離された文字列パター
ンから個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさと外接矩形に囲まれた切
り出し文字画像を出力する文字切り出し手段と、前記文
字切り出し手段で切り出された個々の切り出し文字画像
に対する基本特徴として輪郭情報と背景構造情報を求め
る基本特徴抽出手段と、前記基本特徴抽出手段から出力
された基本特徴に基づいて少なくとも一種類の統計的特
徴を求める統計的特徴抽出手段と、前記文字切り出し手
段で切出された個々の切り出し文字画像と前記基本特徴
抽出手段から出力された基本特徴に基づいて少なくとも
一種類の構造的特徴を求める構造的特徴抽出手段と、前
記統計的特徴抽出手段から出力された統計的特徴から切
り出し文字画像の各カテゴリに対する類似度を求め、類
似度の大きい順に選んだ少なくとも１つのカテゴリの類
似度と、同じ順に選んだ少なくとも一つのカテゴリとを
出力する認識手段と、前記認識手段から出力されたカテ
ゴリと前記カテゴリに対する類似度と前記構造的特徴抽
出手段から出力された構造的特徴とに基づいて最終的な
文字パターンの属するカテゴリを判定する第１の構造識
別手段とを備えたことを特徴とする光学的文字読み取り
装置である。

【００２３】この構成により、基本特徴抽出手段では統
計的特徴と構造的特徴の両方に利用できるような基本特
徴を抽出することにより構成の共通化が可能になり、ま
た構造的特徴抽出手段では認識手段では識別が困難な類
似カテゴリの分離に有効な構造的特徴を中心に限定して
抽出することにより辞書作成を効率化し、統計的特徴を
用いて識別を行う認識手段から出力された認識結果に基
づいて、構造識別手段において必要な構造的特徴を選択
し最終的なカテゴリを決定することによって、処理の効
率化と類似カテゴリの認識性能の向上が可能になるとい
う作用を有する。

【００２４】本発明の請求項７に記載の発明は、前記第
１の構造識別手段が、前記認識手段から出力されたカテ
ゴリに基づいて、前記構造特徴抽出手段から出力された
少なくとも一つの構造的特徴の中から有効な構造的特徴
を選択する認識依存特徴選択手段と、選択された構造的
特徴に基づいてカテゴリを判定する選択構造的特徴識別
手段とを備えたことを特徴とする請求項６記載の光学的
文字読み取り装置である。

【００２５】この構成により、統計的特徴を用いて識別
を行う認識手段から出力された認識結果に基づいて、構
造識別手段において必要な構造的特徴を選択し最終的な
カテゴリを決定することによって、更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になるという作
用を有する。

【００２６】本発明の請求項８に記載の発明は、前記文
字切り出し手段から出力された外接矩形の大きさに基づ
き活字または手書きの判定を行う字種判定手段を備え、
前記第１の構造識別手段が、前記字種判定手段で活字と
判定された文字に対して、個々の文字パターンが属する
カテゴリを判定する第１の活字処理手段と、前記字種判
定手段で手書きと判定された文字に対して、個々の文字
パターンが属するカテゴリを判定する第１の手書き処理
手段とを備えたことを特徴とする請求項６または７記載
の光学的文字読み取り装置である。

【００２７】この構成により、字種に応じて専門化処理
を行うことにより活字・手書き特有の構造的特徴を混同
することなく利用して、類似カテゴリ間の認識性能を高
め、処理の効率化が図れるという作用を有する。

【００２８】本発明の請求項９に記載の発明は、前記第
１の活字処理手段が、前記文字切り出し手段から出力さ
れた外接矩形の大きさと認識手段から出力されたカテゴ
リに基づいて構造的特徴抽出手段から出力された少なく
とも一つの構造的特徴の中から有効な構造的特徴を選択
する認識依存特徴選択手段と、認識依存特徴選択手段で
選択された構造的特徴に基づいてカテゴリ判定を行う選
択構造的特徴識別手段とを備えたことを特徴とする請求
項８記載の光学的文字読み取り装置である。

【００２９】この構成により、統計的特徴を用いて識別
を行う認識手段から出力された認識結果に基づいて、構
造識別手段において必要な構造的特徴を選択し最終的な
カテゴリを決定することによって、更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になるという作
用を有する。

【００３０】本発明の請求項１０に記載の発明は、前記
第１の活字処理手段が、前記文字切り出し手段から出力
された外接矩形の大きさと認識手段から出力されたカテ
ゴリに基づいて一部のカテゴリに対する最終的なカテゴ
リ判定を行う外接矩形カテゴリ判定手段と、外接矩形カ
テゴリ判定手段で判定できない文字に対して認識手段か
ら出力されたカテゴリに基づいて構造的特徴抽出手段か
ら出力された少なくとも一つの構造的特徴の中から有効
な構造的特徴を選択する認識依存特徴選択手段と、前記
認識依存特徴選択手段で選択された構造的特徴に基づい
てカテゴリ判定を行う選択構造的特徴識別手段とを備え
たことを特徴とする請求項８記載の光学的文字読み取り
装置である。

【００３１】この構成により、外接矩形カテゴリ判定手
段で外接矩形の大きさだけで判別可能なカテゴリを最初
に判定することで効率的にカテゴリを分離し、認識依存
特徴選択手段で認識手段の結果に応じて類似カテゴリ分
離に必要な構造的特徴を選択して、選択構造的特徴識別
手段で選択した構造的特徴に応じて最終カテゴリ判断を
行うことで、効率的かつ効果的な類似カテゴリ分離が可
能であるという作用を有する。

【００３２】本発明の請求項１１に記載の発明は、前記
第１の手書き処理手段が、前記文字切り出し手段から出
力された外接矩形の大きさと認識手段から出力されたカ
テゴリに基づいて構造的特徴抽出手段から出力された少
なくとも一つの構造的特徴の中から有効な構造的特徴を
選択する認識依存特徴選択手段と、前記認識依存特徴選
択手段で選択された構造的特徴に基づいてカテゴリ判定
を行う選択構造的特徴識別手段とを備えたことを特徴と
する請求項８記載の光学的文字読み取り装置である。

【００３３】この構成により、統計的特徴を用いて識別
を行う認識手段から出力された認識結果に基づいて、構
造識別手段において必要な構造的特徴を選択し最終的な
カテゴリを決定することによって、更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になるという作
用を有する。

【００３４】本発明の請求項１２に記載の発明は、前記
第１の手書き処理手段が、前記文字切り出し手段から出
力された外接矩形の大きさと認識手段から出力されたカ
テゴリに基づいて一部のカテゴリに対する最終的なカテ
ゴリ判定を行う外接矩形カテゴリ判定手段と、外接矩形
カテゴリ判定手段で判定できない文字に対して認識手段
から出力されたカテゴリに基づいて構造的特徴抽出手段
から出力された少なくとも一つの構造的特徴の中から有
効な構造的特徴を選択する認識依存特徴選択手段と、前
記認識依存特徴選択手段で選択された構造的特徴に基づ
いてカテゴリ判定を行う選択構造的特徴識別手段とを備
えたことを特徴とする請求項８記載の光学的文字読み取
り装置である。

【００３５】この構成により、外接矩形カテゴリ判定手
段で外接矩形の大きさだけで判別可能なカテゴリを最初
に判定することで効率的にカテゴリを分離し、認識依存
特徴選択手段で認識手段の結果に応じて類似カテゴリ分
離に必要な構造的特徴を選択して、選択構造的特徴識別
手段で選択した構造的特徴に応じて最終カテゴリ判断を
行うことで効率的かつ効果的な類似カテゴリ分離が可能
であるという作用を有する。

【００３６】本発明の請求項１３に記載の発明は、光電
変換された文字枠線を含む文字列データに対して、文字
枠線と文字列パターンを分離し、分離された文字列パタ
ーンから個々の文字パターンを切り出し、個々の文字パ
ターンに対する外接矩形の大きさと外接矩形に囲まれた
切り出し文字画像を出力する文字切り出し手段と、前記
文字切り出し手段で切り出された個々の切り出し文字画
像に対する基本特徴として輪郭情報と背景構造情報を求
める基本特徴抽出手段と、前記基本特徴抽出手段から出
力された基本特徴に基づいて少なくとも一種類の統計的
特徴を求める統計的特徴抽出手段と、前記文字切り出し
手段で切出された個々の切り出し文字画像と前記基本特
徴抽出手段から出力された基本特徴に基づいて少なくと
も一種類の構造的特徴を求める構造的特徴抽出手段と、
前記統計的特徴抽出手段から出力された統計的特徴から
切り出し文字画像の各カテゴリに対する類似度を求め、
類似度の大きい順に選んだ少なくとも１つのカテゴリの
類似度と、同じ順に選んだ少なくとも一つのカテゴリを
出力する認識手段と、前記文字切り出し手段から出力さ
れた文字パターンの外接矩形の大きさと前記認識手段か
ら出力されたカテゴリと前記構造的特徴抽出手段から出
力された構造的特徴との少なくとも一つに基づいて前記
認識手段から出力された類似度を修正し、修正後の類似
度に基づいて文字パターンが属するカテゴリを最終的に
判定する第２の構造識別手段とを備えたことを特徴とす
る光学的文字読み取り装置である。

【００３７】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。

【００３８】本発明の請求項１４に記載の発明は、前記
第２の構造識別手段が、前記文字切り出し手段から出力
された文字パターンの外接矩形の大きさと前記認識手段
から出力された少なくとも一つのカテゴリと前記構造的
特徴抽出手段から出力された構造的特徴に基づいて、前
記認識手段から出力された類似度を修正する類似度修正
手段と、前記認識手段から出力された少なくとも一つの
カテゴリの類似度と前記類似度修正手段により修正され
た類似度と加算して修正類似度を算出する加算器と、前
記加算器から出力された修正類似度から個々の文字パタ
ーンが属するカテゴリを決定する修正カテゴリ判定手段
とを備えたことを特徴とする請求項１３記載の光学的文
字読み取り装置である。

【００３９】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。

【００４０】本発明の請求項１５に記載の発明は、前記
文字切り出し手段から出力された外接矩形の大きさに基
づき活字または手書きの判定を行う字種判定手段を備
え、前記第２の構造識別手段が、前記字種判定手段で活
字と判定された文字に対して、個々の文字パターンが属
するカテゴリを判定する第２の活字処理手段と、前記字
種判定手段で手書きと判定された文字に対して、個々の
文字パターンが属するカテゴリを判定する第２の手書き
処理手段とを備えたことを特徴とする請求項１３または
１４記載の光学的文字読み取り装置である。

【００４１】この構成により、字種に応じて専門化処理
を行うことにより活字・手書き特有の構造的特徴を混同
することなく利用して、類似カテゴリ間の認識性能を高
め、処理の効率化が図れるという作用を有する。

【００４２】本発明の請求項１６に記載の発明は、前記
第２の活字処理手段が、前記文字切り出し手段から出力
された文字パターンの外接矩形の大きさと前記認識手段
から出力された少なくとも一つのカテゴリと前記構造的
特徴抽出手段から出力された構造的特徴に基づいて、前
記認識手段から出力された類似度を修正する類似度修正
手段と、前記認識手段から出力された少なくとも一つの
カテゴリの類似度と前記類似度修正手段により修正され
た類似度と加算して修正類似度を算出する加算器と、前
記加算器から出力された修正類似度から個々の文字パタ
ーンが属するカテゴリを決定する修正カテゴリ判定手段
とを備えたことを特徴とする請求項１５記載の光学的文
字読み取り装置である。

【００４３】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。

【００４４】本発明の請求項１７に記載の発明は、前記
第２の手書き処理手段が、前記文字切り出し手段から出
力された文字パターンの外接矩形の大きさと前記認識手
段から出力された少なくとも一つのカテゴリと前記構造
的特徴抽出手段から出力された構造的特徴に基づいて、
前記認識手段から出力された類似度を修正する類似度修
正手段と、前記認識手段から出力された少なくとも一つ
のカテゴリの類似度と前記類似度修正手段により修正さ
れた類似度と加算して修正類似度を算出する加算器と、
前記加算器から出力された修正類似度から個々の文字パ
ターンが属するカテゴリを決定する修正カテゴリ判定手
段とを備えたことを特徴とする請求項１５記載の光学的
文字読み取り装置である。

【００４５】この構成により、認識手段から出力された
類似度の微妙な差を最終的なカテゴリ決定に反映させる
ことができ、また、構造的特徴の検出結果を定量的に類
似度の修正値に反映させることができるため、認識性能
が向上するという作用を有する。

【００４６】本発明の請求項１８に記載の発明は、前記
基本特徴抽出手段が、前記文字切り出し手段から出力
される切り出し画像中の文字パターンの輪郭点を抽出す
る輪郭点抽出手段と、前記輪郭点抽出手段から出力され
た個々の輪郭点の隣接関係から画素単位の輪郭方向成分
を算出する輪郭方向算出手段と、前記輪郭点抽出手段か
ら出力された輪郭点の位置に基づいて文字パターンの外
接矩形の各々の辺から文字パターンまでの背景距離を求
める背景距離算出手段と前記文字切り出し手段から出力
された切り出し画像を水平及び垂直方向のライン毎に走
査し、一定画素以上連続する白画素（背景）の連続する
長さ・位置情報とその背景の走査方向に沿った発生順番
である背景次数を算出する背景情報算出手段とを備えた
ことを特徴とする請求項６、８、１３、１５のいずれか
に記載の光学的文字読み取り装置である。

【００４７】この構成により、輪郭方向算出部における
輪郭方向成分の算出、背景距離算出部における外接矩形
の各々の辺から文字パターンまでの背景距離の算出、背
景情報算出部における背景情報算出のための共通の前処
理として輪郭点抽出部で文字パターンの輪郭点を抽出す
ることにより、基本特徴抽出の効率が向上する。また、
基本特徴として輪郭点、輪郭方向成分、背景距離、背景
情報を抽出する事により統計的特徴だけでなく、文字構
造を反映した構造特徴量にも流用が可能になり特徴抽出
処理の効率化が図れるという作用を有する。

【００４８】本発明の請求項１９に記載の発明は、前記
統計的特徴抽出手段が、前記文字切り出し手段から出力
された切り出し画像を水平・垂直両方向で複数のブロッ
クに分割する両方向ブロック分割手段と、前記両方向ブ
ロック分割手段で分割したブロック単位で、前記基本特
徴抽出手段の輪郭方向算出手段から出力された輪郭方向
成分について輪郭方向毎の個数を集計する輪郭方向集計
手段と、輪郭方向集計手段から出力されたブロック単位
の輪郭方向毎の輪郭方向成分の個数をブロックの大きさ
で割ることで得られる輪郭方向毎の輪郭統計特徴量を求
める輪郭方向正規化手段と、前記文字切り出し手段から
出力された切り出し画像を水平方向で複数のブロックに
分割する水平方向ブロック分割手段と、前記文字切り出
し手段から出力された切り出し画像を垂直方向で複数の
ブロックに分割する垂直方向ブロック分割手段と、前記
基本特徴抽出手段から出力された輪郭方向成分に基づい
て、前記水平方向ブロック分割部及び垂直方向ブロック
分割手段で分割したブロック単位で、ブロック分割境界
線に垂直な外接矩形の辺からブロック分割境界線に平行
方向に走査して最初に存在する文字パターンを構成する
画素の輪郭方向毎の輪郭方向成分の個数である外郭方向
成分の個数を集計する外郭方向集計手段と、外郭方向集
計手段から出力されたブロック単位の輪郭方向毎の外郭
方向成分の個数をブロックの大きさで割ることで得られ
る輪郭方向毎の外郭統計特徴量を求める外郭方向正規化
手段と、前記基本特徴抽出手段の背景距離算出手段から
出力された背景距離に基づいて、前記水平方向ブロック
分割部及び垂直方向ブロック分割部で分割したブロック
単位でブロック分割方向の背景距離を合計する背景距離
合計手段と、背景距離集計手段から出力されたブロック
単位の集計背景距離をブロックの大きさで割ることで得
られる背景距離特徴量を求める背景距離正規化手段とを
備えたことを特徴とする請求項６、８、１３、１５のい
ずれかに記載の光学的文字読み取り装置である。

【００４９】この構成により、両方向ブロック分割手
段、水平方向ブロック分割部及び垂直方向ブロック分割
手段によって文字パターンを複数のブロックに分割し、
輪郭方向集計手段、外郭方向集計手段及び背景距離集計
手段で各々のブロック全体の特徴量を加算集計すること
により、基本特徴抽出手段で抽出した基本特徴からブロ
ックの統計的特徴を抽出することでき、さらに輪郭方向
正規化手段、外郭方向正規化手段、及び背景距離正規化
手段でブロックの統計的特徴を正規化することにより、
認識対象の変化に影響されにくい特徴を抽出できるとい
う作用を有する。

【００５０】本発明の請求項２０に記載の発明は、前記
構造的特徴抽出手段が、前記基本特徴抽出手段の背景距
離算出手段から出力された背景距離に基づいて局所的な
背景距離特徴を抽出する局所背景特徴抽出手段と、前記
基本特徴抽出手段の輪郭方向算出手段から出力された輪
郭方向成分に基づいて局所的なストローク方向の変化を
抽出する局所ストローク形状抽出手段と、前記文字切
り出し手段から出力された切り出し文字画像と前記基本
特徴抽出手段の輪郭方向算出手段から出力された輪郭方
向成分に基づいて文字パターンのループを抽出する第１
のループ抽出手段と、前記基本特徴抽出手段の背景情報
算出手段で算出した背景情報に基づいて背景次数毎に隣
接する背景画素の塊を背景ブロックとして求めると共
に、その大きさ情報と位置情報を算出する背景ブロック
抽出手段と、前記基本特徴抽出手段の背景情報算出手段
で算出した背景情報に基づいて隣接する白画素の塊を背
景ラベルとして求めラベル番号を付与すると共に、その
大きさ、位置、その背景ラベルが外接矩形のどの辺と接
するかを表わすラベル情報を算出する背景ラベル抽出手
段と、前記基本特徴抽出手段の背景情報算出手段で算出
した背景情報に基づいて文字パターンを構成するストロ
ークの端点と交点と抽出する端点・交点抽出手段と、前
記基本特徴抽出手段の背景情報算出手段で算出した背景
情報と前記端点・交点抽出手段で抽出された端点と交点
とに基づいて直線を抽出する直線抽出手段とを備えたこ
とを特徴とする請求項６、８、１３、１５のいずれかに
記載の光学的文字読み取り装置である。

【００５１】この構成により、基本特徴抽出部で抽出さ
れた基本特徴に基づいて、局所背景特徴抽出部におい
て、特定のカテゴリ間の識別に有効である背景部の部分
的な凹凸情報を抽出し、局所ストローク形状抽出部にお
いて普遍性の高い類似カテゴリ間のストロークの屈曲方
向や直線性の相違を抽出し、第１のループ抽出部におい
て普遍性の高い特徴であるストロークのループ数を抽出
し、背景ブロック抽出部において文字背景部の構造を抽
出し、背景ラベル抽出部において文字背景部の大きさ、
外接矩形との位置関係を抽出し、端点・交点抽出部にお
いて端点・交点の情報を抽出し、直線抽出部で直線を抽
出することにより、文字の構造的な特徴をより明示的に
表す構造的特徴の効率的な抽出が可能で、これらの構造
的特徴を用いることにより統計的特徴量のみを利用する
識別方法では識別が困難な類似カテゴリ間の認識性能の
向上が可能であるという作用を有する。

【００５２】本発明の請求項２１に記載の発明は、前記
構造的特徴抽出部が、前記基本特徴抽出手段の背景距離
算出手段から出力された背景距離に基づいて局所的な背
景距離特徴を抽出する局所背景特徴抽出手段と、前記基
本特徴抽出手段の輪郭方向算出手段から出力された輪郭
方向成分に基づいて局所的なストローク方向の変化を抽
出する局所ストローク形状抽出手段と、前記基本特徴抽
出手段の背景情報算出手段で算出した背景情報から、背
景次数毎に隣接する背景画素の塊を背景ブロックとして
求めると共に、その大きさ情報と位置情報を算出する背
景ブロック抽出手段と、前記基本特徴抽出手段の背景情
報算出手段で算出した背景情報から、隣接する白画素の
塊を背景ラベルとして求めラベル番号を付与すると共
に、その大きさ、位置、その背景ラベルが外接矩形のど
の辺と接するかを表わすラベル情報を算出する背景ラベ
ル抽出手段と、前記基本特徴抽出手段の背景情報算出手
段で算出した背景情報に基づいて文字パターンを構成す
るストロークの端点と交点と抽出する端点・交点抽出手
段と、前記基本特徴抽出手段の背景情報算出手段で算出
した背景情報と前記端点・交点抽出手段で抽出された端
点と交点とに基づいて直線を抽出する直線抽出手段と、
前記背景ラベル抽出手段で算出したラベル情報に基づい
て文字パターンのループを抽出する第２のループ抽出手
段とを備えたことを特徴とする請求項６、８、１３、１
５のいずれかに記載の光学的文字読み取り装置である。

【００５３】この構成により、基本特徴抽出部で抽出さ
れた基本特徴に基づいて、局所背景特徴抽出部において
特定のカテゴリ間の識別に有効である背景部の部分的な
凹凸情報を抽出し、局所ストローク形状抽出部において
普遍性の高い類似カテゴリ間のストロークの屈曲方向や
直線性の相違を抽出し、背景ブロック抽出部において文
字背景部の構造を抽出し、背景ラベル抽出部において文
字背景部の大きさ、外接矩形との位置関係を抽出し、端
点・交点抽出部において端点・交点の情報を抽出し、直線
抽出部で直線を抽出し、第２のループ抽出部において普
遍性の高い特徴であるストロークのループ数を抽出する
ことにより、文字の構造的な特徴をより明示的に表す構
造的特徴の効率的な抽出が可能で、これらの構造的特徴
を用いることにより統計的特徴量のみを利用する識別方
法では識別が困難な類似カテゴリ間の認識性能の向上が
可能であるという作用を有する。また、ループ数をラベ
ル情報のみに基づいて抽出することにより、処理の効率
化が図れるという作用を有する。

【００５４】本発明の請求項２２に記載の発明は、前記
端点・交点抽出手段が、前記背景情報算出手段から出力
された垂直及び水平方向の各ラインの背景情報に基づき
文字パターンの端点及び交点の候補を抽出する端点・交
点候補抽出手段と、前記抽出された端点及び交点候補の
個々の位置関係を比較することにより不適切な端点及び
交点候補を除去して適切な端点及び交点を抽出する端点
・交点判定手段とを備えたことを特徴とする請求項２０
または２１記載の光学的文字読み取り装置である。

【００５５】この構成により、端点・交点抽出手段にお
いて、基本特徴抽出手段の背景情報で予め抽出した背景
情報を利用することにより隣接するラインの背景情報を
比較して相違を調べるだけの簡単な処理により端点及び
交点の候補を抽出することができ、端点・交点判定部に
おいて、端点と交点候補の位置関係に基づき他の端点ま
たは交点候補との距離が近すぎる端点または交点候補を
除去することにより、ノイズによる端点または交点の誤
抽出を減少させ、カテゴリ２とカテゴリ３のような類似
カテゴリの分離に効果的な端点及び交点の情報をより高
精度に抽出できるという作用を有する。

【００５６】本発明の請求項２３に記載の発明は、前記
直線抽出手段が、前記背景情報算出手段から出力された
垂直及び水平方向の各ラインの背景情報に基づき黒画素
が予め定められた閾値よりも長く連続する領域を抽出す
る黒画素連続領域抽出手段と、前記黒画素連続領域抽出
手段から出力された黒画素連続領域に基づき垂直及び水
平方向の直線候補を抽出する直線候補抽出手段と、前記
端点・交点抽出手段から出力された端点及び交点の位置
情報に基づき前記直線候補抽出手段から出力された直線
候補の中から直線でないものを除去し、残った直線候補
の中から近傍の線との接続状態に応じて種類を判定する
直線判定手段とを備えたことを特徴とする請求項２０ま
たは２１記載の光学的文字読み取り装置である。

【００５７】この構成により、黒画素連続領域抽出手段
及び直線候補抽出手段において、基本特徴抽出手段の背
景情報算出手段で予め抽出した背景情報を利用して、黒
画素の連続度及び複数ラインへの連続度を調べるだけの
簡単な処理により直線候補を抽出することができ、また
直線判定部において端点及び交点の位置情報を用いて線
の合流や分岐に伴なって発生する誤った直線候補を除去
し、残った直線候補を近傍の線との接続状態に応じて分
類することにしたことにより、水平方向の短い直線に特
徴のあるカテゴリ￥のようなカテゴリを分離に効果的な
直線を高精度に抽出できるという作用を有する。

【００５８】本発明の請求項２４に記載の発明は、前記
文字切り出し手段から出力された文字パターンの外接矩
形の大きさ、前記認識手段から出力された少なくとも一
つの類似度、前記背景情報算出手段で算出した背景情報
に基づく背景複雑度の中の少なくとも一つに基づいて切
り出しエラーを判定し、前記文字切り出し手段に再切り
出しの指示を与えるエラー判定手段を備えたことを特徴
とする請求項６、８、１３、１５、２４のいずれかに記
載の光学的文字読み取り装置である。

【００５９】この構成により、外接矩形が他の文字の外
接矩形と大きく相違していたり規定の外接矩形から外れ
ている場合や、類似度が他の文字の類似度に比べて極端
に低い場合や、第１位の類似度と第２位以下の類似度と
の差が少ない場合などに切り出しエラーがあると判定し
再切り出しを行うことにより、切り出し誤りを減らし、
切り出し誤りに起因する誤認識を減少させることができ
るという作用を有する。

【００６０】本発明の請求項２５に記載の発明は、前記
認識手段で算出されたカテゴリ類似度の大きい方から２
つのカテゴリ類似度を選択し、２番目の類似度と最大類
似度の比の値が予め設定されている閾値ａより大きい
か、または最大類似度が予め設定されている閾値ｂより
小さいか、または前記背景情報算出手段で算出した背景
情報に基づく背景複雑度が予め設定されている閾値ｃよ
り大きい場合にリジェクト信号を出力し、それ以外の場
合は認識結果として最大類似度のカテゴリを出力する第
１の認識結果算出手段を備えたことを特徴とする請求項
６、８、１３、１５、２４のいずれかに記載の光学的文
字読み取り装置である。

【００６１】この構成により、最大類似度の大きさ及び
背景複雑度もリジェクト判定に利用する事により、類似
度の比だけではリジェクト困難な前処理エラー文字を効
率よくリジェクトできるという作用を有する。

【００６２】本発明の請求項２６に記載の発明は、複数
の文字パターンに対して、予め大きい方から２番目の類
似度と最大類似度の比、最大類似度、前記背景情報算出
手段で算出した背景情報に基づく背景複雑度、前記認識
手段が出力する認識結果を算出し、前記類似度比と前記
最大類似度と前記背景複雑度の少なくとも１つを入力と
し、前記認識結果が不正解の場合は、リジェクト信号を
出力し、正解の場合はリジェクト信号を出力しないよう
に予め学習させた階層型ニューラルネットワークで構成
した第２の認識結果算出手段を備えたことを特徴とする
請求項６、８、１３、１５、２４のいずれかに記載の光
学的文字読み取り装置である。

【００６３】この構成により、類似度の比と最大類似度
と背景複雑度の少なくとも１つを軸とした空間上でのリ
ジェクト領域と非リジェクト領域の非線形な境界を、予
め階層型ニューラルネットワークに学習させてあるの
で、より高精度なリジェクト判定処理が可能になるとい
う作用を有する。

【００６４】本発明の請求項２７に記載の発明は、枠罫
線と文字を含む帳票を読み取って２値画像に変換し、前
記２値画像を画像メモリに記憶し、前記２値画像から枠
罫線を抽出し、前記抽出された枠罫線から前記帳票の特
徴を表わす枠構造特徴を抽出し、予め個々の帳票の枠構
造特徴およびこの枠構造特徴を有する帳票に記載される
少なくとも１つの候補文字列を登録する枠構造参照テー
ブルを参照し、前記枠構造特徴を照合することにより前
記帳票の種別をおおまかに分類し、前記帳票内の文字読
取対象領域を検出し、前記文字読取対象領域に基づき、
前記画像メモリから文字領域を切り出し、切り出された
文字を認識し、少なくとも１つの認識結果と前記枠構造
参照テーブルに登録された候補文字列とを照合し、最終
認識結果とすることを特徴とする光学的文字読み取り方
法であり、枠構造特徴により帳票をおおまかに分類し、
その形式の帳票に記載される可能性のある候補文字列と
認識結果とを照合するという２段階の処理を行うことに
より、高速、高精度に帳票上に記載された文字を認識す
るという作用を有する。

【００６５】本発明の請求項２８に記載の発明は、枠罫
線と文字を含む帳票を読み取って２値画像に変換する画
像入力手段と、前記２値画像を記憶する画像メモリと、
前記２値画像から枠罫線を抽出する枠罫線抽出手段と、
前記抽出された枠罫線から前記帳票の特徴を表わす枠構
造特徴を抽出する枠構造特徴抽出手段と、予め個々の帳
票の枠構造特徴およびこの枠構造特徴を有する帳票に記
載される少なくとも１つの候補文字列を登録する枠構造
参照テーブルと、前記枠構造参照テーブルを参照し、前
記枠構造特徴を照合することにより前記帳票の種別をお
おまかに分類し、前記帳票内の文字読取対象領域を検出
する枠構造照合手段と、前記文字読取対象領域に基づ
き、前記画像メモリから文字領域を切り出す文字切り出
し手段と、切り出された文字を認識する文字認識手段と
を備えた光学的文字読み取り装置であり、枠構造特徴に
より帳票をおおまかに分類し、その形式の帳票に記載さ
れる可能性のある候補文字列と認識結果とを照合すると
いう２段階の処理を行うことにより、高速、高精度に帳
票上に記載された文字を認識するという作用を有する。

【００６６】本発明の請求項２９に記載の発明は、前記
文字認識手段より出力される少なくとも１つの認識結果
と前記枠構造参照テーブルに登録された候補文字列とを
照合して最終認識結果とする後処理手段を備えた請求項
２８記載の光学的文字読み取り装置であり、前記文字認
識手段による認識結果が間違いがあっても、候補文字列
の中から最も確からしい文字列を選択できるという作用
を有する。

【００６７】本発明の請求項３０に記載の発明は、搬送
されてくる帳票に記載された文字列を請求項２８または
２９記載の帳票文書認識装置により認識する帳票文書認
識手段と、前記帳票文書認識手段により認識された文字
列を識別コード変換テーブルを参照し、識別コードに変
換する識別コード変換手段と、前記識別コードを前記帳
票上に印字する識別コード印字手段と、前記識別コード
に従って前記帳票を処理する処理手段とを備えた光学的
文字読み取り装置であり、帳票の仕訳を効率的に行える
という作用を有する。

【００６８】本発明の請求項３１に記載の発明は、前記
識別コードに代えて、または前記識別コードとともに、
前記識別コードに対応するバーコードを印字する手段を
備えた請求項３０記載の光学的文字読み取り装置であ
り、バーコードシステムに対応できるという作用を有す
る。

【００６９】（実施の形態１）以下、本発明の第１の実
施の形態を図面に基づいて説明する。図１は本発明の第
１の実施の形態における光学的文字読取装置のブロック
図を示すものである。図１において、１は文字切り出し
部で、文字枠線を含む文字列データを入力して、文字枠
線と文字列パターンを分離し、分離された文字列パター
ンから個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさを経路１１を経由して出
力し、切り出し文字画像を経路１２を経由して出力す
る。２は基本特徴抽出部（図２参照）で、第１の文字切
り出し部１から経路１２を経由して出力された各文字の
切り出し画像に基づいて、文字パターンの輪郭方向成
分、外接矩形の各辺から文字パターンまでの背景距離、
水平及び垂直ライン毎の文字部以外の白画素の連続であ
る背景情報を求め、輪郭方向成分を経路１３、背景距離
を経路１４、背景情報を経路１５を経由して出力して出
力する。３は統計的特徴抽出部（図３参照）で、第１の
文字切り出し部１から経路１２を経由して出力した文字
パターンの切り出し画像と、基本特徴抽出部２から経路
１３を経由して出力した輪郭方向成分及び経路１４を経
由して出力した背景距離に基づいて統計的特徴量を求め
る。４は認識部で、統計的特徴抽出部３から出力した統
計的特徴量に基づいて、文字パターンの各カテゴリに対
する類似度を求め、類似度の大きい順に複数のカテゴリ
類似度と少なくとの１つのカテゴリを出力する。５は第
１の構造的特徴抽出部（図４参照）で、基本特徴抽出部
２から経路１３を経由して出力した輪郭方向成分、経路
１４を経由して出力した背景距離、経路１５を経由して
出力した背景情報に基づいて、構造的特徴を求める。６
は字種判定部で、文字切り出し部１から経路１２を経由
して出力した外接矩形の大きさに基づいて、字種が手書
きか活字であるかを判定する。７は第１の構造識別部７
（図５参照）で、文字切り出し部１から出力された文字
パターンの外接矩形の大きさ、認識部４から出力したカ
テゴリ、第１の構造的特徴抽出部５から出力した構造的
特徴、及び字種判定部６から出力した字種判定結果に基
づいて文字パターンの属する最終的なカテゴリを決定す
る。

【００７０】図２は基本特徴抽出部２の構成を具体的に
示すブロック図である。２１は輪郭点抽出部で、文字切
り出し部１から経路１１を経由して出力した外接矩形の
大きさと文字切り出し部１から経路１２を経由して出力
した切り出し画像から文字パターンの輪郭点を抽出す
る。２２は輪郭方向算出部で、輪郭点抽出部２１から出
力した文字パターンの輪郭点の隣接関係に基づいて各輪
郭点の輪郭方向成分を求める。２３は背景距離算出部
で、輪郭点抽出部２１から出力した文字パターンの輪郭
点の位置に基づいて文字パターンの外接矩形の各辺から
文字パターンまでの背景距離を求める。２４は背景情報
算出部で、輪郭点抽出部２１から出力した文字パターン
の輪郭点の位置に基づいて、水平及び垂直方向のライン
毎に一定画素以上連続する白画素の連続（背景）する長
さ・位置情報とその背景の走査方向に沿った発生順番で
ある背景次数を算出する。

【００７１】図３は統計的特徴抽出部３の構成を具体的
に示すブロック図である。３１は両方向ブロック分割部
で、文字切り出し部１から経路１１を経由して出力した
切り出し画像に基づいて切り出し領域全体を水平・垂直
の両方向で分割する。３２は水平方向ブロック分割部
で、文字切り出し部１から経路１１を経由して出力した
切り出し画像に基づいて切り出し領域を水平方向で分割
する。３３は垂直方向ブロック分割部で、文字切り出し
部１から経路１１を経由して出力した切り出し画像に基
づいて切り出し領域を垂直方向で分割する。３４は輪郭
方向集計部で、両方向ブロック分割部３１で分割したブ
ロック毎かつ輪郭方向毎に、基本特徴抽出部２から経路
１３を経由して出力した各画素の輪郭方向成分の個数を
集計する。３５は輪郭方向正規化部で、両方向ブロック
分割部３１で分割したブロック毎に、輪郭方向集計部３
４でブロック内で集計した輪郭方向成分をブロックの大
きさで割って正規化して、統計的輪郭方向統計量を求め
る。３６は外郭方向集計部で、水平方向ブロック分割部
３２で分割したブロック毎と垂直方向ブロック分割部３
３で分割したブロック毎の両方について、ブロック分割
境界線に垂直な外接矩形の辺から、基本特徴抽出部２か
ら経路１３を経由して出力した輪郭方向成分の中で、ブ
ロック分割境界線に平行に走査して最初に存在する文字
パターン画素の輪郭方向成分毎の輪郭方向成分の個数を
集計する。３７は外郭方向正規化部で、水平方向ブロッ
ク分割部３２で分割したブロック毎と垂直方向ブロック
分割部３３で分割したブロック毎の両方について、外郭
方向集計部３６で集計した輪郭方向成分（外郭方向成
分）をブロックの大きさで割って正規化して、統計的外
郭方向統計量を求める。３８は背景距離集計部で、水平
方向ブロック分割部３２で分割した各々のブロックの、
ブロック分割境界線に垂直な外接矩形の各々の辺と垂直
方向ブロック分割部３３で分割した各々のブロックのブ
ロック分割境界線に垂直な外接矩形の各々の辺につい
て、基本特徴抽出部２から経路１４を経由して出力した
背景距離の中で、前記外接矩形の各々の辺からブロック
分割境界線に平行な方向に計測した背景距離を選択して
集計する。３９は背景距離正規化部で、背景距離集計部
３８で集計した背景距離をブロック境界線に垂直な外接
矩形の辺の長さで割って正規化して、統計的背景距離特
徴を求める。

【００７２】図４は第１の構造的特徴抽出部５の構成を
具体的に示すブロック図である。４１は局所背景特徴抽
出部で、基本特徴抽出部２から経路１３を経由して出力
した背景距離に基づいて、類似カテゴリを識別するため
の局所的な背景距離の変化と距離の相違を抽出する。４
２は局所ストローク形状抽出部で、基本特徴抽出部２か
ら経路１４を経由して出力した輪郭方向成分に基づい
て、類似カテゴリを識別するための局所的なストローク
の傾きの変化を抽出する。４３はループ抽出部で、第１
の文字切り出し部１から出力した切り出し画像と基本特
徴抽出部２から経路１４を経由して出力した輪郭方向成
分に基づいて、文字パターンのストロークによって発生
するループを抽出する。４４は端点・交点抽出部で、基
本特徴抽出部２から経路１５を経由して出力した背景情
報に基づいて、垂直と水平方向の両方について、隣接す
るラインの背景情報の相違から、文字パターンを構成す
るストロークの端点と交点を抽出する。４５は直線抽出
部で、基本特徴抽出部２から経路１５を経由して出力し
た背景情報に基づいて、文字パターンを構成する直線候
補を抽出し、端点・交点抽出部４４から出力した端点と
交点の位置情報を利用して、直線候補の種類を判定す
る。４６は背景ブロック抽出部で、前記基本特徴抽出部
２の背景情報算出部２４で算出し経路１５を経由して出
力した背景情報に基づいて、背景次数毎に隣接する背景
画素の塊を背景ブロックとして求めると共に、その大き
さ情報と位置情報を算出する。４７は背景ラベル抽出部
で、前記基本特徴抽出部２の背景情報算出部２４で算出
し経路１５を経由して出力した背景情報に基づいて、隣
接する白画素の塊を背景ラベルとして求めラベル番号を
付与すると共に、その大きさ、位置、その背景ラベルが
外接矩形のどの辺と接するかを表わすラベル情報を算出
する。

【００７３】図５は第１の構造識別部７の構成を具体的
に示すブロック図である。５１は第１の活字処理部（図
６参照）で、字種判定部６において文字パターンが活字
と判定された場合に、第１の文字切り出し部から出力さ
れた文字パターンに対する外接矩形の大きさと認識部４
で判定したカテゴリに基づいて第１の構造的特徴抽出部
５で抽出した構造的特徴を選択して最終的なカテゴリを
判定する。５２は第１の手書き処理部（図７参照）で、
字種判定部６において文字パターンが手書きと判定され
た場合に、第１の文字切り出し部から出力された文字パ
ターンに対する外接矩形の大きさと認識部４で判定した
カテゴリに基づいて第１の構造的特徴抽出部５で抽出し
た構造的特徴を選択して最終的なカテゴリを判定する。

【００７４】図６は第１の活字処理部５１の構成を具体
的に示すブロック図である。６１は第１の外接矩形カテ
ゴリ判定部で、文字切り出し部１から出力された外接矩
形の大きさによってある１つのカテゴリに判定できる可
能性が高い場合に、前記カテゴリが認識部４から出力さ
れたカテゴリの中に含まれている場合は、前記カテゴリ
に決定する。６２は第１の認識依存特徴選択部で、第１
の外接矩形カテゴリ判定部６１でカテゴリ判定できなか
った文字に対して、認識部４から出力されたカテゴリに
基づいて第１の構造的特徴抽出部５から出力された複数
の構造的特徴の中で有効な構造的特徴を選択する。６３
は第１の選択構造的特徴識別部で、第１の認識依存特徴
選択部６２で選択した構造的特徴を利用して最終的なカ
テゴリ判定を行う。

【００７５】図７は第１の手書き処理部５２の構成を具
体的に示すブロック図である。７１は第２の外接矩形カ
テゴリ判定部で、文字切り出し部１から出力された外接
矩形の大きさによってある１つのカテゴリに判定できる
可能性が高い場合に、前記カテゴリが認識部４から出力
されたカテゴリの中に含まれている場合は、前記カテゴ
リに決定する。７２は第２の認識依存特徴選択部で、第
２の外接矩形カテゴリ判定部７１でカテゴリ判定できな
かった文字に対して、認識部４から出力されたカテゴリ
に基づいて第１の構造的特徴抽出部５から出力された複
数の構造的特徴の中で有効な構造的特徴を選択する。７
３は第２の選択構造的特徴識別部で、認識依存特徴選択
部７２で選択した構造的特徴を利用して最終的なカテゴ
リ判定を行う。

【００７６】図８は端点・交点抽出部４４の構成を具体
的に示すブロック図である。８１は端点・交点候補抽出
部で、背景情報算出部２３から出力される垂直および水
平方向の各ラインの白画素連続領域情報に基づいて文字
パターンの端点および交点の候補を抽出する。８２は端
点・交点判定部で、端点・交点候補抽出部８１から出力
される端点および交点の候補の個々の位置関係を比較し
て、端点と別の端点あるいは端点と交点の距離が近い場
合は、端点と交点を除去する。

【００７７】図９は直線抽出部４５の構成を具体的に示
すブロック図である。９１は黒画素連続領域抽出部で、
背景情報算出部２３から出力される垂直および水平方向
の各ラインの白画素連続領域情報に基づいて、黒画素が
予め定められた閾値より長く連続する領域を求め、領域
の始点と終点を記憶する。９２は直線候補抽出部で、黒
画素連続領域抽出部９１から出力される黒画素連続領域
に基づいて垂直および水平方向の直線候補を抽出する。
９３は直線判定部で、直線候補抽出部９２から出力され
る直線候補と端点・交点抽出部４４から出力される端点
および交点の位置情報とを照合して、直線候補から直線
ではないものを除去し、残った直線候補から近傍の線と
の接続状態に応じて直線の種類を判定する。

【００７８】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。以下では、
認識対象が主に数字の場合について説明しているが、実
際の認識対象は数字以外の文字でも構わない。まず、文
字切り出し部１では、図１０に示すように、複数の枠線
と文字文字列データで構成される多値の原画像におい
て、枠線と文字列を分離し文字列を抽出した後、１文字
単位に切り出し、各文字の外接矩形で囲まれた切り出し
画像と外接矩形の幅と高さを求め、外接矩形の幅と高さ
を経路１１を経由して出力し、白黒に２値化した切り出
し画像を経路１２を経由して出力する。基本特徴抽出部
２の輪郭点抽出部２１では、図１１に示すように、文字
切り出し部１から出力した切り出し文字画像から輪郭点
を抽出し、輪郭画像を求める。具体的な輪郭点抽出方法
としては、任意の黒画素に対して縦横斜方向に隣接する
画素が全て黒の場合に、前記任意の黒画素を白に置換
し、最終的に残った黒画素を輪郭点とする方法がある。

【００７９】輪郭方向算出部２２では、輪郭方向を図１
２のように符号化して、輪郭点抽出部２１で抽出した輪
郭画像に対して、図１３に示すようなマスクパターンと
のマッチングによって中心画素の輪郭点の方向を決定す
る。例えば、図１３(a)(b)の３×３マスクにおいて灰色
で示した画素は白画素もしくは黒画素のどちらでも構わ
ず、その他の白や黒で示した画素は必ず同一の色にマッ
チングする必要があるマッチング方法では、輪郭画像の
任意の３×３領域で図１３(a) の３×３マスクと同一の
パターンが存在する場合は、前記３×３領域の中央画素
を７に符号化し、図１３(b) と同一の場合は、４に符号
化する。なお、輪郭方向の符号化数は８以外でも良く、
４や１６でも構わない。また、輪郭方向を決定するパタ
ーンマッチングのマスクの大きさも３×３以外でも良
く、輪郭方向の符号化数に応じて２×２や５×５でも構
わない。

【００８０】背景距離算出部２３では、輪郭点抽出部２
１で抽出した輪郭画像に対して、図１４(a) に示すよう
に外接矩形の左辺の地点を原点として、画像の各行につ
いて右方向に走査して最初に発見される輪郭画素までの
距離と、図１４(b) に示すように外接矩形の右辺の地点
を原点として、画像の各行について左方向に走査して最
初に発見される輪郭画素までの距離と、図１４(c) に示
すように外接矩形の上辺の地点を原点として、画像の各
列について下方向に走査して最初に発見される輪郭画素
までの距離と、図１４(d) に示すように外接矩形の下辺
の地点を原点として、画像の各列について上方向に走査
して最初に発見される輪郭画素までの距離を全て求め
る。

【００８１】背景情報算出部２４では、輪郭点抽出部２
１で抽出した輪郭画像に対して、図１５に示すように外
接矩形の左辺から水平方向に走査し白画素の連続である
文字背景を検出する。ラインａの場合は、外接矩形左端
と１番目の輪郭点、１番目の輪郭点と２番目の輪郭点、
２番目の輪郭点と外接矩形右端に挟まれる白画素の連続
をそれぞれ０次背景、１次背景とし、それぞれの連続長
（ｘ、ｙ）、位置情報としての開始点、終了点を算出す
る。ラインｂの場合のように、外接矩形端と輪郭点に挟
まれる領域については、白画素の連続が０であっても背
景と見なし、この場合背景次数は２（背景数は３）とな
る。同様にして、水平方向の外接矩形右端からの走査、
垂直方向の外接矩形上・下端からの走査についても同様
である。ここで、輪郭点に挟まれる背景の検出時に、一
定以上白画素が連続する場合のみ背景と見なし背景次数
にカウントするという制限を設け背景のノイズ除去を行
っても良い。

【００８２】次に統計距離特徴抽出部３の両方向ブロッ
ク分割部３１では、文字切り出し部１から入力される切
り出し画像を複数の領域に分割する。具体的には図１６
に示すように、重心分割を行って各領域に含まれる黒画
素数が均等になるように水平・垂直方向に複数の領域に
分割する。なお、領域分割方法としては重心分割以外で
も良く、重心分割以外の不均等分割方法や均等分割方法
でも構わない。水平方向ブロック分割部３２や垂直方向
ブロック分割部３３でも同様の方法で分割を行う。な
お、両方向ブロック分割部３１における水平方向の分割
位置と水平方向ブロック分割部３２における分割位置を
同一にし、両方向ブロック分割部３１における垂直方向
の分割位置と垂直方向ブロック分割部３３における分割
位置を同一にしても構わない。

【００８３】輪郭方向集計部３４では、基本特徴抽出部
２から経路１３を経由して出力した輪郭方向成分につい
て、両方向ブロック分割部３１で分割したブロック単位
かつ輪郭方向毎の個数を計算する。例えば図１７(a) の
輪郭方向画像において、太線をブロック境界とし、その
中の各々の数字は各画素の輪郭方向成分の符号を表すも
のとすると、ブロック単位かつ輪郭方向毎に数を集計し
た結果は図１７(b) 〜(e) のようになる。

【００８４】輪郭方向正規化部３５では、輪郭方向集計
部３４で集計したブロック毎かつ輪郭方向毎の輪郭方向
成分の個数を、両方向ブロック分割部から出力した輪郭
方向集計対象のブロックの大きさで割って正規化して、
輪郭方向統計特徴量を求める。ブロックの大きさを表す
ものとしては、高さまたは幅のどちらか長い方や、高さ
と幅から求められる面積がある。なお、正規化の前に隣
接する輪郭方向成分の個数を重み付けして統合しても構
わない。

【００８５】外郭方向集計部３６では、基本特徴抽出部
２から経路１３を経由して出力した輪郭方向成分につい
て、水平方向ブロック分割部３２及び垂直方向ブロック
分割部３３で分割したブロック毎に、ブロック分割境界
線に平行に走査して最初に存在する文字パターン画素の
輪郭方向成分（外郭方向成分）毎の輪郭方向成分の個数
を計算する。例えば水平方向ブロック分割部３２で分割
された、あるブロックの輪郭方向画像である図１８にお
いて、各々の数字は各画素の輪郭方向成分の符号を表す
ものとし、符号−は輪郭点でない画素とし、走査方向を
矢印の通り左端から右方向とすると、ブロック分割境界
線に平行に走査して最初に存在する文字パターン画素は
網掛けされた画素であり、前記網掛けされた画素全体の
輪郭方向成分（外郭方向成分）の個数を輪郭方向毎（例
では０〜３）に集計する。水平方向ブロック分割部で分
割されたブロックにおいては、左端から右方向と、右端
から左方向の二方向で走査し、垂直方向ブロック分割部
で分割されたブロックにおいては、上端から下方向と、
下端から上方向の二方向で走査する。

【００８６】外郭方向正規化部３７では、外郭方向集計
部３６で集計したブロック毎かつ輪郭方向毎の外郭方向
成分の個数を、水平方向ブロック分割部３２または垂直
方向ブロック分割部３３から出力した外郭方向集計対象
のブロックの大きさで割って正規化して、外郭方向統計
特徴量を求める。

【００８７】背景距離合計部３８では、基本特徴抽出部
２から経路１４を経由して出力した背景距離について、
水平方向ブロック分割部３２で分割したブロックでは、
左端から右方向への背景距離の合計と、右端から左方向
への背景距離の合計を計算し、垂直方向ブロック分割部
３３で分割したブロックでは、上端から下方向への背景
距離の合計と、下端から上方向への背景距離の合計を計
算する。

【００８８】背景距離正規化部３９では、背景距離合計
部３８から出力したブロック毎の合計四方向の背景距離
の合計を、水平方向ブロック分割部３２または垂直方向
ブロック分割部３３から出力した外郭方向集計対象のブ
ロックの大きさで割って正規化して、背景距離統計特徴
量を求める。

【００８９】次に認識部４では、統計的特徴抽出部３で
求めた輪郭方向統計特徴量と外郭方向統計特徴量と背景
距離統計特徴量に基づいて、文字パターンが属するカテ
ゴリを求める。図１９では、学習完了後の階層型ニュー
ラルネットワークを用いて認識部４を構成する場合を示
している。第１層のニューロンに輪郭方向統計特徴量、
外郭方向統計特徴量、及び背景距離統計特徴量を入力
し、中間層を経由して最終層へ信号を流すことによって
各々の最終層ニューロンから各カテゴリの類似度に相当
する出力信号が発生するようになっており、出力信号の
大きい方から、出力値とそのカテゴリが認識部４から出
力される。図１９の例では、出力カテゴリ数を２とする
と、左端の最終層ニューロン出力が最大で、右端の最終
層ニューロン出力が２番目であるため、認識部４から
は、それらの出力値とカテゴリ（カテゴリ０、２）が出
力される。なお、認識部４を、図１９以外の階層型ニュ
ーラルネットワークや、階層型ニューラルネットワーク
以外の統計的特徴量を利用して識別カテゴリを出力でき
る認識手段で構成しても構わない。

【００９０】次に第１の構造的特徴抽出部５の局所特徴
抽出部４１では、基本特徴抽出部２から経路１３を経由
して出力した背景距離に基づいて、類似カテゴリを分離
するための局所的な特徴を求める。図２０(a) では、網
掛け領域（中央領域）において外接矩形の左端から見た
背景距離の外接矩形幅に対する比率が第１の閾値より大
きくなる回数を計数し、最終的にその回数が第２の閾値
を超えた場合は、中央左背景が凸であると判定する。類
似カテゴリであるカテゴリ０、カテゴリ６、カテゴリ
８、カテゴリ９では中央左背景が凸であるとは通常は判
定されないため、中央左背景が凸であるという構造的特
徴はカテゴリ３の分離に有効である。同様の抽出方法を
用いることで、図２０(b) では、カテゴリ６（及びカテ
ゴリ５）の有力な抽出材料である上部右背景の凸を判定
し、図２０(c) では、カテゴリ９（及びカテゴリ５）の
有力な抽出材料である下部左背景の凸を判定することを
示している。なお、実際の場合の凸背景の抽出領域・方
向は、認識部４の誤りを分析して、その誤りを減少する
ものを採用しても構わない。また、上記の方法以外に
も、例えば近傍の背景距離の変化の大きさから外側スト
ロークの曲線性（直線性）を判定するという方法があ
り、例えば図２０(d) は背景距離の変化の大きさが一定
に近いために、上部ストロークは直線として判定され、
図２０(e) は背景距離の変化の大きさが場所によってか
なり異なるため、上部ストロークは曲線として判定され
るので、カテゴリ５とカテゴリ６の分離に有効な構造的
特徴を抽出できる。また、第１の構造識別部７で効果的
なカテゴリ判定を行わせるために、抽出する構造的特徴
を手書き用、活字用、手書き・活字兼用に分けても構わ
ない。

【００９１】局所ストローク形状抽出部４２では、基本
特徴抽出部２から経路１４を経由して出力した輪郭方向
成分から、局所領域中の輪郭線を追跡して、追跡してい
る輪郭線上の輪郭方向成分の分布を調べることで、類似
カテゴリを分離するための局所的な構造的特徴を求め
る。図２１は、中央網掛け領域中の輪郭線上の輪郭方向
成分から輪郭線を追跡して、輪郭線の形状が上に凸か下
に凸であるかを調べることで、カテゴリ６とカテゴリ８
の分離に有効な構造的特徴を抽出することを表してい
る。図２１の例では、図２１(a) のカテゴリ６では上下
輪郭線の形状は両方とも上に凸であり、図２１(b) のカ
テゴリ８では上の輪郭線の形状は下に凸であり、下の輪
郭線の形状は上に凸であると判定される。具体的な輪郭
線形状の判定方法の例としては、輪郭方向成分を表す符
号として図１２の符号を用いると、局所領域の左側で
５、６、７、中央で０、１、７、右側で１、２、３の輪
郭方向成分符号が多く存在する場合は、輪郭線の形状が
上に凸であると判定し、左側で１、２、３、中央で０、
１、７、右側で５、６、７が多く存在する場合は、輪郭
線の形状が下に凸であると判定するという方法がある。

【００９２】第１のループ抽出部４３では、文字切り出
し部１から出力した切り出し画像と基本特徴抽出部２か
ら経路１４を経由して出力した輪郭方向成分に基づい
て、文字パターンのストロークによって発生するループ
を抽出する。具体的な抽出方法は、輪郭方向成分を持つ
画素から輪郭線を追跡して、最終的に追跡開始地点に戻
ったものを輪郭線ループとし、次に切り出し画像を参照
して、輪郭線ループの内部に白画素が存在すればストロ
ークのループとして抽出する。図２２の例において、数
字は図１２で示した輪郭方向成分符号、符号−は白画
素、符号＋は黒画素とすると、図２２(a) の網掛けされ
た符号−がストロークのループとして抽出され、図２２
(b) は輪郭線ループの内側に符号−が存在しないためス
トロークのループが存在しないことになる。ここで、一
定以上白画素が存在する場合のみループとして抽出する
という制限を設けノイズ除去を行っても良い。

【００９３】端点・交点抽出部４４の端点・交点候補抽
出部８１では、基本特徴抽出部２から経路１５を経由し
て出力した垂直および水平方向の各ラインの背景情報に
基づいて、隣接するラインの白画素連続領域の数や位置
関係を比較して、端点として図２４(a) のような発生点
や図２４(b) のような消滅点を、交点として図２４(c)
のような合流点や図２４(d) のような分岐点を抽出
し、端点・交点判定部８２において、端点および交点候
補の各々の位置関係から不適切な端点および交点候補を
除去して、最終的な端点および交点を得る。端点・交点
候補抽出部８１における具体的な端点および交点候補の
抽出方法を以下に説明する。図２４(a) のように前ライ
ンでは白画素の領域に後ラインでは黒画素が発生してい
る場合は「発生」とし、図２４(b) のように、前のライ
ンでは黒画素の領域が後ラインでは全て白画素になって
いる場合は「消滅」とする。また、図２４(c) のよう
に、あるライン（前ライン）上の２個の黒画素連続領域
が後ライン上で１個に合流している場合は「合流」と
し、逆に図２４(d) のように、１個の黒画素連続領域が
２個に分岐している場合は「分岐」とする。以上の「合
流」「分岐」「発生」「消滅」に分類された点を、端点
および交点候補とし、垂直方向ラインの走査と水平方向
ラインの走査に分けて出力する。

【００９４】同じ端点・交点抽出部４４の端点・交点判
定部８２では、端点・交点候補抽出部８１から出力され
る同一方向の走査で得られた端点および交点候補の各々
の位置関係を調べ、端点候補と端点候補、および端点候
補と交点候補の距離が近い場合は、端点や交点の候補を
除去する。例えば、外接矩形が大きい（例：高さ・幅が
５０画素以上）文字パターンについて、図２５(a) のよ
うにある端点候補と別の同じ種類の端点候補（「発生」
ならば「発生」、「消滅」ならば「消滅」）の距離が非
常に近く、その２点の間に交点候補が存在（端点が「発
生」なら「合流」、「消滅」なら「分岐」）する場合
や、図２５(b) のようにある端点候補の近傍かつすぐ隣
のラインに交点候補があり、その２点の間に別の種類の
端点（「発生」ならば「消滅」、「消滅」ならば「発
生」）がない場合は、端点および交点を除去する。残っ
た端点候補を端点、交点候補を交点と決定する。

【００９５】直線抽出部４５において、黒画素連続領域
抽出部９１では、基本特徴抽出部２から経路１５を経由
して出力した垂直および水平方向の各ラインの背景情報
に基づいて、黒画素がライン上で予め定められた閾値
（黒画素ライン上連続閾値）以上連続して存在している
場合は、その始点および終点の座標を記録する。例え
ば、黒画素ライン上連続閾値を１０とすると、図２６
(a)では２行目〜４行目が閾値以上である。

【００９６】直線候補抽出部９２では、黒画素連続領域
抽出部９１から出力される黒画素連続領域の始点および
終点の座標から、黒画素連続領域が予め定められた閾値
以上のライン数（連続ライン数閾値）で連続している場
合を直線と判定する。例えば、黒画素ライン上連続閾値
を１０、連続ライン数閾値を３とすると、図２６(a)は
（水平方向の）直線と判定され、図２６(b) は直線と判
定されない。連続ライン数閾値を導入して判定を行うこ
とによって、手書きの線の太さを考慮し、図２６(b) の
ような枠やノイズ等による本来の線以外の直線による影
響を除くことができる。

【００９７】背景ブロック抽出部４６では、背景情報算
出部２４で算出されたライン毎の背景情報から、隣接す
る同一次数の背景を結合することにより背景ブロックを
検出する。外接矩形左端から走査した場合、図２３に示
すように、０次背景については第１ブロックと、第２ブ
ロックが検出され、１次背景については、第１ブロック
が検出される。このとき、背景ブロックの大きさ情報と
して背景ブロックを構成する画素数、位置情報として背
景ブロックに外接する矩形の左上と右下の座標が算出さ
れる。

【００９８】背景ラベル抽出部４７では、背景情報算出
部２４で算出されたライン毎の背景情報から、隣接する
白画素を結合することにより背景ラベルを検出する。外
接矩形左端から走査した場合、図３２に示すように、４
つの背景ラベルが検出されラベル番号が付与される。こ
のとき、ラベル情報として背景ラベルを構成する画素
数、位置情報として背景ラベルに外接する矩形の左上と
右下の座標、文字外接矩形の各辺との接触の有無が算出
される。

【００９９】次に字種判定部６では、文字切り出し部１
から経路１１を経由して出力した文字パターンの外接矩
形の幅と高さの内、高さのばらつきの大きさで字種が手
書きか活字かを判定する。具体的には、振り込み伝票の
場合は同一欄に記入された文字は基本的に同一字体であ
るため、同一欄に記入された文字全体の高さのばらつき
を調べ、高さのばらつきが大きい場合は全て手書き文字
と判定し、ばらつきが小さい場合は全て活字文字と判定
する。また、その他の場合は伝票の同一欄に相当する領
域に存在する文字全体の高さのばらつきを調べ、同様の
判定を行う。伝票の同一欄に相当する領域の例として
は、文書や郵便葉書住所欄の一行分（あるいは一列分）
がある。

【０１００】次に第１の構造識別部７の第１の活字処理
部５１の第１の外接矩形カテゴリ判定部６１では、文字
切り出し部１から出力された外接矩形の大きさによって
ある１つのカテゴリに判定できる可能性が高い場合に、
前記カテゴリが認識部４から出力されたカテゴリの中に
含まれている場合は、前記カテゴリに決定する。具体的
な例を挙げると、図２７(a) に示すようなカテゴリ１
は、図２７(b) のカテゴリ５に比べると外接矩形の横幅
が非常に狭く、また他のカテゴリの数字も図２７(b) と
同程度の横幅であるため、外接矩形の幅が極端に狭い数
字はカテゴリ１に強制的に修正する方法がある。

【０１０１】第１の認識依存特徴選択部６２では、第１
の外接矩形カテゴリ判定部６１で判定できない文字に対
して認識部４から出力されたカテゴリに基づいて第１の
構造的特徴抽出部５から出力された複数の構造的特徴の
中で有効な構造的特徴を選択する。具体的な例として、
図２８の右上部背景が閉じる寸前のカテゴリ６は統計的
特徴を用いた認識方法ではカテゴリ８に誤認識される傾
向が強いため、認識部４で第１位がカテゴリ８であると
判定された場合は、局所ストローク形状抽出部４２及び
ループ抽出部４３で抽出される構造的特徴を選択し、更
に局所ストローク特徴４２で抽出される複数の構造的特
徴の中から図２１の構造的特徴を選択する。また、認識
部４で認識上位から順番にカテゴリ３及びカテゴリ９が
出力された場合は、局所背景特徴抽出部４１から出力さ
れた構造的特徴の中で図２０(a)(b)(c)を選択する。

【０１０２】第１の選択構造的特徴識別部６３では、第
１の認識依存特徴選択部で選択された構造的特徴に基づ
いて最終的なカテゴリ判定を行う。具体的な例として、
図２８の文字に関しては、選択された図２１の局所スト
ローク特徴とループ特徴を用い、以下の 1 2 の両方の
判定方法でカテゴリを判定することにより判定の信頼性
を高める。両方の判定方法で判定結果が同一の場合はそ
のカテゴリに決定し、逆に判定結果が異なっていた場合
は、認識部４で判定されたカテゴリに決定する。 1 ループ特徴を用い、ループ数が０なら、カテゴリ３
と推定。ループ数が１なら、ループ位置が中央より上に
あればカテゴリ９に、中央より下にあればカテゴリ６と
推定。ループ数が２なら、カテゴリ８と推定。 2 局所ストローク特徴を用い、中央部の上下ストロー
クが共に上に凸なら、カテゴリ６と推定。上ストローク
が下に凸、下ストロークが上に凸なら、カテゴリ３かカ
テゴリ８と推定。上下ストロークが共に下に凸なら、カ
テゴリ９と推定。

【０１０３】また、図２０(a)(b)(c) の文字に対して
は、まず図２０(a) の中央左背景が凸という特徴が第１
の構造的特徴抽出部５で抽出されているかどうかを調べ
る。抽出されていた場合はカテゴリ３に最終決定し、そ
うでない場合は、次に図２０(c) の下部左背景の凸が
抽出されているかどうかを調べる。抽出されていた場合
はカテゴリ９に最終決定し、そうでない場合は次に図２
０(b) についても同様の調査を行う。図２０(b) の特徴
が抽出されていた場合はカテゴリ６に、そうでない場合
はカテゴリ８に最終決定する。また、認識最上位から順
番にカテゴリ５及びカテゴリ６の場合は、図２０(c) の
下部左背景の凸や図２０(d) の上部ストロークの直線性
が抽出されているかを調べて、最終的なカテゴリを決定
する。他のカテゴリについても同様に認識部４から出力
されたカテゴリに基づいて第１の構造的特徴抽出部５で
抽出される特徴を選択して、最終的なカテゴリを決定す
る。

【０１０４】なお、認識部４から出力されるカテゴリに
よっては第１の活字処理部５１で処理を行わず、認識部
４から出力された認識結果のカテゴリをそのまま最終的
なカテゴリとして構わない。また、認識部４から認識保
留信号が出力され、かつ第１の活字処理部５１でどの構
造的特徴にも当てはまらないことが判明した場合は、最
終的なカテゴリを決定せず、リジェクト（読み取り拒
否）としても構わない。

【０１０５】次に第１の構造識別部７の第１の手書き処
理部５２の第２の外接矩形カテゴリ判定部７１では、文
字切り出し部１から出力された外接矩形の大きさによっ
てある１つのカテゴリに判定できる可能性が高い場合
に、前記カテゴリが認識部４から出力されたカテゴリの
中に含まれている場合は、前記カテゴリに決定する。第
１の手書き処理部５２の第２の認識依存特徴選択部７２
では字種判定部６において文字パターンが手書きと判定
された場合に、認識部４から出力されたカテゴリに基づ
いて第１の構造的特徴抽出部５から出力された複数の構
造的特徴の中で有効な構造的特徴を選択する。具体的な
例として、手書きのカテゴリ３は統計的特徴を用いた認
識方法ではカテゴリ８に誤認識する傾向が強いため、認
識部４で第１候補（最大類似度のカテゴリ）がカテゴリ
８で、第２候補（類似度が２番目のカテゴリ）がカテゴ
リ３であると判定された場合は、背景ブロック抽出部４
６及びループ抽出部４３で抽出される構造的特徴を選択
する。また、ループ個数、大きさ、位置から判断して認
識結果が明らかに矛盾する場合は、第1のループ抽出部
４３で抽出される構造的特徴を選択する。第２の選択構
造的特徴識別部７３では、第２の認識依存特徴選択部７
２で選択された構造的特徴に基づいて最終的なカテゴリ
判定を行う。

【０１０６】具体的な例として、図２９(a)(b)に代表さ
れる手書きのカテゴリ２とカテゴリ３の文字は、お互い
に混同される可能性が高く、認識部４の認識結果の第１
位がカテゴリ２で第２位がカテゴリ３、またはその反対
になっていることが多い。このような認識結果でかつ字
種判定部６で手書き判定されている場合は、端点・交点
抽出部４４から出力される水平方向の発生点（端点）の
数や位置の違いによって判定する。例えば、上下領域に
それぞれ１個、合計２個の発生点がある場合はカテゴリ
２に決定し、上中下領域にそれぞれ１個、合計３個の発
生点がある場合はカテゴリ３に決定する。また、図３０
(a) の形状の手書きのカテゴリ￥、図３０(b) の形状の
手書きのカテゴリ７、図３０(c) の形状の手書きのカテ
ゴリ９が多く見られ、これらの形状が類似しているた
め、認識部４では図３０(a) のカテゴリ￥はカテゴリ７
やカテゴリ９に誤って認識されていることが多い。この
ような誤りに対しては、直線抽出部４５でカテゴリ￥の
中央部に存在する２本の水平線を抽出することで、カテ
ゴリ７やカテゴリ９と分離することが可能である。ま
た、図２８の右上部背景が閉じる寸前のカテゴリ６は、
統計的特徴を用いた認識方法ではカテゴリ８に誤認識さ
れる傾向が強いため、認識部４で第１位がカテゴリ８で
あると判定された場合は、局所ストローク形状抽出部４
２及びループ抽出部４３で抽出される構造的特徴を選択
し、更に局所ストローク特徴４２で抽出される複数の構
造的特徴の中から図２１の構造的特徴を選択する。ま
た、認識部４で認識上位から順番にカテゴリ３及びカテ
ゴリ９が出力される場合は、局所背景特徴抽出部４１か
ら出力される構造的特徴の中で図２０(a)(b)(c) を選択
する。

【０１０７】また、図３１（ａ）に示すようなカテゴリ
３の認識結果がカテゴリ８になっているような場合は、
前記選択された構造的特徴量からループ数、水平０次背
景ブロックの大きさ、最大水平０次背景長に注目し、以
下の（１）（２）（３）（４）の条件を満たす場合は、
認識結果を第２候補のカテゴリ３に修正し最終認識結果
とする。（１）認識結果の第１候補が８、第２候補が３（２）ループ数が０または１（３）水平０次背景ブロックの面積／外接矩形面積＞
しきい値１（４）最大水平０次背景長／外接矩形幅＞しきい値
２

【０１０８】また、図３１（ｂ）に示すようなカテゴリ
７の認識結果がカテゴリ９になっているような場合は、
前記選択された構造的特徴量からループ数、垂直１次背
景ブロックの個数に注目し、以下の（１）（２）（３）
の条件を満たす場合は、認識結果を第２候補のカテゴリ
７に修正し最終認識結果とする。（１）認識結果の第１候補が９、第２候補が７（２）ループ数が０（３）垂直１次背景ブロックの個数が1

【０１０９】別の例としては、カテゴリ１、７のように
明らかにループが存在しないようなカテゴリが、通常の
書き方ではループが存在するカテゴリと認識されている
場合には、第２候補のカテゴリに、また、ループの大き
さが非常に大きいにもかかわらす、カテゴリ６、９に認
識されている場合は、カテゴリ０に認識結果を修正す
る。

【０１１０】他のカテゴリについても認識部４から出力
されたカテゴリに基づいて第１の構造的特徴抽出部５で
抽出された特徴の中から適切な特徴量を選択して、第２
の選択構造的特徴識別部７３で最終的なカテゴリを決定
する。なお、認識部４から出力されるカテゴリによって
は第１の手書き処理部５２で処理を行わず、認識部４か
ら出力された認識結果のカテゴリをそのまま最終的なカ
テゴリとして構わない。また、認識部４から認識保留信
号が出力され、かつ第１の手書き処理部５２でどの構造
的特徴にも当てはまらないことが判明した場合は、最終
的なカテゴリを決定せず、リジェクト（読み取り拒否）
としても構わない。

【０１１１】このように、本実施の形態１によれば、基
本特徴抽出部２では統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出することにより構成の共
通化が可能になり、また第１の構造的特徴抽出部５では
認識部４では識別が困難な類似カテゴリの分離に有効な
構造的特徴を中心に抽出することにより処理の効率化が
可能になり、統計的特徴を用いて識別を行う認識部４か
ら出力された認識結果に基づいて、第１の構造識別部７
において必要な構造的特徴を選択し最終的なカテゴリを
決定することによって更なる処理の効率化と類似カテゴ
リの認識性能の向上が可能になる。

【０１１２】（実施の形態２）図３３は、本発明の第２
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図３３において、文字切り出し
部１、基本特徴抽出部２、統計的特徴抽出部３、認識部
４、字種判定部６、第１の構造識別部７、経路１１、経
路１２、経路１３、経路１４、経路１５は上述した第１
の実施の形態におけるものと同様であり、動作も同様で
ある。本実施の形態が図１と異なる構成は、第１の構造
的特徴抽出部５に代えて第２の構造的特徴抽出部８を設
けた点である。

【０１１３】図３４は第２の構造的特徴抽出部８の構成
を具体的に示すブロック図である。図３４において、局
所背景特徴抽出部４１、局所ストローク形状抽出部４
２、背景ブロック抽出部４６、背景ラベル抽出部４７、
上述した第１の実施の形態におけるものと同様であり、
動作も同様である。本実施の形態が図４と異なる構成
は、第１のループ抽出部４３に代えて第２のループ抽出
部４８を設けた点である。

【０１１４】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。第２のルー
プ抽出部４８の動作以外は、実施の形態１と同様なので
省略する。第２のループ抽出部４８では、背景ラベル抽
出部４７から出力したラベル情報に基づいて、文字パタ
ーンのストロークによって発生するループを抽出する。
具体的な抽出方法は、文字外接矩形のどの辺とも接触し
ない背景ラベルをストロークのループとして抽出する。
図３５の例において、数字は背景ラベルのラベル番号、
符号＋は黒画素とすると、図３５の網掛けされたラベル
番号３の背景ラベルがストロークのループとして抽出さ
れる。ここで、一定以上白画素が存在する場合のみルー
プとして抽出するという制限を設けノイズ除去を行って
も良い。

【０１１５】このように、本実施の形態２によれば、基
本特徴抽出部２では統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出することにより構成の共
通化が可能になり、また第２の構造的特徴抽出部８では
認識部４では識別が困難な類似カテゴリの分離に有効な
構造的特徴を中心に抽出することにより処理の効率化が
可能になり、統計的特徴を用いて識別を行う認識部４か
ら出力された認識結果に基づいて、第１の構造識別部７
において必要な構造的特徴を選択し最終的なカテゴリを
決定することによって更なる処理の効率化と類似カテゴ
リの認識性能の向上が可能になる。また、ループ数をラ
ベル情報のみに基づいて抽出することにより、処理の効
率化が図れる。

【０１１６】（実施の形態３）図３６は本発明の第３の
実施の形態における光学的文字読み取り装置のブロック
図を示すものである。図３６において、文字切り出し部
１、基本特徴抽出部２、統計的特徴抽出部３、第１の構
造的特徴抽出部５、字種判定部６、経路１１、経路１
２、経路１３、経路１４は上述した第１の実施の形態に
おけるものと同様であり、動作も同様である。本実施の
形態が図１と異なる構成は第１の構造識別部７に代え
て、認識部４から出力された類似度を第１の構造的特徴
抽出部５から出力された構造的特徴に基づいて修正し、
修正類似度の大きさから最終的なカテゴリを決定する第
２の構造識別部９を設けた点である。

【０１１７】図３７は第２の構造識別部９の構成を具体
的に示すブロック図である。３７１は第２の活字処理部
であり、字種判定部６で活字と判定された場合に、第１
の構造的特徴抽出部５から出力した構造的特徴と認識部
４から出力する少なくとも一つのカテゴリに基づいて類
似度修正値を求める。３７２は第２の手書き処理部であ
り、字種判定部６で手書きと判定された場合に、第１の
構造的特徴抽出部５から出力した構造的特徴と認識部４
から出力する少なくとも一つのカテゴリに基づいて類似
度修正値を求める。３７３は加算器であり、認識部４か
ら出力した類似度上位のものから複数のカテゴリの類似
度と第２の活字処理部３７１または第２の手書き処理部
３７２から出力した類似度修正値を加算して修正類似度
を求める。３７４は修正決定部であり、加算器３７３か
ら出力した修正類似度の大きさに基づいて修正類似度最
大のカテゴリ番号を出力する。

【０１１８】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。認識部４で
は、統計的特徴抽出部３で求めた輪郭方向統計特徴と外
郭方向統計特徴と背景距離統計特徴に基づいてカテゴリ
毎の類似度を求め、類似度上位から順番に複数のカテゴ
リの類似度と少なくとも一つのカテゴリ番号を出力す
る。次に、第２の構造識別部９の第２の活字処理部３７
１では、字種判定部６で活字と判定された場合に、第１
の構造的特徴抽出部５から出力した構造的特徴と認識部
４から出力する少なくとも一つのカテゴリに基づいて類
似度修正値を求める。具体的な類似度修正値の算出方法
を図２０を使用して説明する。まず全ての類似度修正値
を０に設定する。次に認識部４から、認識上位から順番
にカテゴリ３及びカテゴリ９の２つのカテゴリが出力さ
れたとき、第１の構造的特徴抽出部５から出力された構
造的特徴の中で図２０(a)(b)(c) を選択し、まず図２０
(a)の中央左背景が凸という特徴が第１の構造的特徴抽
出部５で抽出されているかどうかを調べる。抽出されて
いた場合はカテゴリ３の類似度修正値を上げる。抽出さ
れていない場合はカテゴリ３の類似度修正値を下げ、か
つ図２０(c) の下部左背景の凸が抽出されているかどう
かを調べる。抽出されていた場合はカテゴリ５とカテゴ
リ９の類似度修正値を上げる。抽出されていない場合は
カテゴリ５とカテゴリ９の類似度修正値を下げる。かつ
図２０(b) の上部右背景の凸が抽出されているかどうか
を調べる。抽出されていた場合はカテゴリ５とカテゴリ
９の類似度修正値を上げ、抽出されていない場合はカテ
ゴリ５とカテゴリ９の類似度修正値を下げる。各々の場
合における類似度修正値の上下幅は一定にする必要はな
く、構造的特徴の重要性、認識部４から出力される類似
度の分布、及び第１の構造的特徴抽出部５における各々
の構造的特徴の抽出の確信度に応じて変えても構わな
い。また類似度修正値を求めるカテゴリを認識部４から
出力する複数の類似度に対応するカテゴリだけに限定し
ても構わない。

【０１１９】第２の構造識別部９の第２の手書き処理部
３７２では、字種判定部６で手書きと判定された場合
に、第１の構造的特徴抽出部５から出力した構造的特徴
と認識部４から出力する少なくとも一つのカテゴリに基
づいて類似度修正値を求める。具体的な類似度修正値の
算出方法は第２の活字処理部３７１と同様である。加算
器３７３では、認識部４から出力する複数の類似度と第
２の活字処理部３７１または第２の手書き処理部３７２
から出力する類似度修正値を加算して修正類似度を求め
る。修正決定部３７４では、加算器３７３から出力され
る修正類似度をカテゴリ毎に大きさを比較して、最大の
修正類似度を持つカテゴリを出力し、最終的なカテゴリ
として決定する。なお、修正決定部３７４から出力され
る最大の修正類似度が低い場合や、最大の修正類似度と
第２位以下の修正類似度との差が小さい場合は最終的な
カテゴリ決定を行わず、リジェクト（読み取り拒否）と
しても良い。

【０１２０】このように、本実施の形態３によれば、認
識部４から出力された類似度と、第２の活字処理部３７
１または第２の手書き処理部３７２から出力された類似
度修正値とを加算した修正類似度に基づいて修正決定部
３７４で最終的なカテゴリを決定することにより、認識
部４から出力された類似度の微妙な差を最終的なカテゴ
リ決定に反映させることができ、また第２の活字処理部
３７１と第２の手書き処理部３７２で構造的特徴検出の
信頼度を類似度修正値として反映させることができるた
めに認識性能が向上する。

【０１２１】（実施の形態４）図３８は、本発明の第３
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図３８において、基本特徴抽出
部２、統計的特徴抽出部３、認識部４、第1構造的特徴
抽出部５、字種判定部６、第１の構造識別部７、経路１
１、経路１２、経路１３、経路１４、経路１５は上述し
た第１の実施の形態におけるものと同様であり、動作も
同様である。なお、第１の構造識別部７を第２の構造認
識部９に置き換えても構わない。

【０１２２】本実施の形態が図１と異なる構成は、文字
切り出し部１に代えて、光電変換された文字列データに
対して個々の文字パターンを切り出し、個々の文字パタ
ーンに対する外接矩形の大きさと切り出し画像を出力
し、後述する第１の切り出しエラー判定部３８２から再
切り出し指示信号が出力された場合は切り出しエラー判
定された番号の文字の切り出しを再実行する第２の文字
切り出し部３８１を設けた点と、第２の文字切り出し部
３８１から出力された個々の文字パターンの外接矩形の
大きさから切り出しエラーを判定し、切り出しエラーの
場合は再切り出し指示信号と切り出しエラー文字番号を
第２の文字切り出し部３８１に出力する第１の切り出し
エラー判定部３８２を設けた点である。

【０１２３】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。第２の文字
切り出し部３８１では、通常の場合は文字切り出し部１
と同様に、複数の文字が含まれる原画像に対して、１文
字単位の切り出しを実行し、各々の文字の外接矩形の大
きさと切り出し画像を出力する。第１の切り出しエラー
判定部３８２で切り出しエラーが検出された場合は異な
る動作を実行するので、その動作は後述する。

【０１２４】次に第１の切り出しエラー判定部３８２で
は、第２の文字切り出し部３８１から出力された各々の
文字の外接矩形の大きさに基づいて切り出しエラーの判
定を行う。具体的な動作を図３９を利用して説明する。
図３９(a) が原画像であり、図３９(b) 〜(e) が切り出
し文字の外接矩形の大きさであり、図３９(f) 〜(i)が
切り出し画像である。図３９(a) の原画像を第２の文字
切り出し部３８１で最初に切り出すと、図３９(f) のよ
うに文字枠が分離できずに残る場合、図３９(g) のよ
うに枠からはみ出している文字の一部が削除された場
合、図３９(h) のように文字枠が１文字として切り出さ
れた場合、図３９(i) のように近接する２文字が１文字
として切り出されることがある。これらの切り出された
文字画像の外接矩形の大きさは、図３９(b) 〜(e) のよ
うに本来あるべき１文字分の外接矩形の大きさとは異な
る場合が多いため、次に各々の文字の外接矩形の大きさ
を第１の切り出しエラー判定部３８２に入力して、同一
欄の文字の外接矩形の高さや幅と比較してかけ離れてい
る文字を発見した場合や、予め定められている外接矩形
の高さや幅の範囲から外れている場合は、切り出しエラ
ーとして第２の文字切り出し部３８１に再切り出し指示
信号、エラー文字番号、エラー内容を出力する。第２の
文字切り出し部３８１では、第１の切り出しエラー判定
部３８２から再切り出し指示信号を入力すると、同時に
入力したエラー文字番号の切り出し領域をエラー内容に
従って再切り出しを実行する。例えば、図３９(b) では
外接矩形の幅が大きいというエラー内容になるため、図
４０のような水平・垂直方向の黒画素ヒストグラムに基
づいて切り出し位置を再検討する。図３９(c) 〜(e) に
関しても同様の方法で切り出し位置を再検討する。

【０１２５】このように、本実施の形態４によれば、第
２の文字切り出し部３８１から出力された文字パターン
の外接矩形の大きさに基づいて、第１の切り出しエラー
判定部３８２において切り出し失敗文字を検出して再切
り出し指示信号を第２の文字切り出し部３８１に送り、
第２の文字切りだし部３８１において切り出し失敗原因
を分析して再切り出し処理を実行することにより、切り
出し誤りの減少が可能になり、切り出し誤りによる認識
部４や第１の構造識別部７における誤認識を減少させる
ことができる。

【０１２６】（実施の形態５）図４１は、本発明の第５
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図４１において、第２の文字切
り出し部３８１、基本特徴抽出部２、統計的特徴抽出部
３、識部４、構第1の造的特徴抽出部５、字種判定部
６、認第１の構造識別部７、経路１１、経路１２、経路
１３、経路１４、経路１５は上述した第４の実施の形態
におけるものと同様であり、動作も同様である。なお、
第１の構造識別部７を第２の構造認識部９に置き換えて
も構わない。

【０１２７】本発明の形態が図３８と異なる構成は、第
１の切り出しエラー判定部３８２に代えて、第２の文字
切り出し部３８１から出力された個々の文字パターンの
外接矩形の大きさと認識部４から出力された複数のカテ
ゴリの類似度から切り出しエラーを判定し、切り出しエ
ラーの場合は再切り出し指示信号と切り出しエラー文字
番号を第２の文字切り出し部３８１に出力する第２の切
り出しエラー判定部４１１を設けたことである。

【０１２８】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。第２の切り
出しエラー判定部４１１では、個々の文字パターンの外
接矩形の大きさから切り出しエラーを判定する方法は第
１の切り出しエラー判定部３８２と同様であるが、認識
部４から出力された複数のカテゴリの類似度を利用して
切り出しエラーを判定することが異なる。具体的には、
第１位の類似度の大きさが他の文字に比べて極端に低い
場合や、第１位の類似度と第２位以下の類似度の大きさ
の差が少ない場合は、切り出しエラーの可能性が高いと
判定して再切り出し指示信号と切り出しエラー文字番号
を第２の文字切り出し部３８１に出力する。

【０１２９】このように、本実施の形態５によれば、第
２の文字切り出し部３８１から出力された文字パターン
の外接矩形の大きさに、認識部４の出力も第２の切り出
しエラー判定部４１１における切り出しエラーの判定基
準に加えることによって、外接矩形の大きさから明確に
切り出しエラーが判定できない場合でも、認識部４にお
ける類似度から判定できる認識結果の確信度に基づいて
切り出しエラーを判定できる。

【０１３０】（実施の形態６）図４２は、本発明の第６
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図４２において、文字切り出し
部１、基本特徴抽出部２、統計的特徴抽出部３、認識部
４、第１の構造的特徴抽出部５、字種判定部６、第１の
構造識別部７、経路１１、経路１２、経路１３、経路１
４、経路１５は上述した第１の実施の形態におけるもの
と同様であり、動作も同様である。なお、第１の構造識
別部７を第２の構造認識部９に置き換えても構わない。

【０１３１】本実施の形態が図１と異なる構成は、認識
部４から出力される大きい方から２番目の類似度と最大
類似度の比、及び最大類似度の大きさ、及び第１の構造
的特徴抽出部５の前記背景情報算出部２４で算出した背
景情報に基づく背景複雑度により、リジェクトの有無を
判定する第１の認識結果算出部４２１を設けた点であ
る。

【０１３２】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。実施の形態
１と同様にして、入力文字列データに対して認識部４か
ら複数のカテゴリ類似度、大きい方から少なくとも１つ
のカテゴリが出力される。認識部４から出力された複数
のカテゴリ類似度の大きい方から２つのカテゴリ類似度
を選択し、２番目の類似度と最大類似度の比の値が、予
め設定されているしきい値ａの値より大きい（すなわ
ち、２番目の類似度が最大類似度に近い）か、最大類似
度の値が予め設定されたしきい値ｂの値より小さいか、
垂直及び水平方向の背景次数の最大値の和である背景複
雑度が予め設定されたしきい値ｃの値より大きい場合に
リジェクト信号を出力し、それ以外の場合には、認識部
４から出力されたカテゴリ類似度、カテゴリを第１の構
造識別部７に出力する。第１の構造識別部７は、実施の
形態１と同様にして構造特徴を用いて最終認識結果を判
定する。なお、背景複雑度は垂直及び水平方向の背景次
数の最大値の和に限定するものではなく、ある一定の値
以上の背景次数のライン数の和等、背景情報に基づくも
のであればよい。

【０１３３】本実施の形態においては、最大類似度の
値、及び２番目の類似度と最大類似度の比の値を用いる
場合を説明する。ここで、リジェクト判定のしきい値
ａ、ｂは、図４３に示すように予め複数の文字データに
対して大きい方から２番目の類似度（第２位類似度）と
最大類似度の比、最大類似度の値を求め、認識結果の正
解・不正解別にグラフにプロットする事により経験的に
決定される。図４３の場合、最大類似度が小さい領域に
は、類似度の比の値とは関係なく不正解文字のみが分布
している。例えば最大類似度の値が５００以下の文字パ
ターン（１４７文字）を調べると、ほとんど（１４４文
字）が前処理エラーである。図４４にその最大類似度の
値が５００以下の文字の一例を列挙する。図４４より、
ノイズを有する文字、枠線残り、金額訂正部の切り出
し、つながり文字分離エラー、認識対象外文字の切り出
し等の前処理エラー文字が、最大類似度の大きさをリジ
ェクト判定の基準に追加することによりリジェクトでき
るようになることが分かる。

【０１３４】このように、本実施の形態６によれば、リ
ジェクト判定に類似度の比の値だけでなく、最大類似度
の大きさを併用する事で、前処理エラーを効率的にリジ
ェクトを行う事が可能となる。更に背景複雑度を用いれ
ばより効率的にリジェクトを行うことが可能となる。

【０１３５】（実施の形態７）図４５は、本発明の第７
の実施の形態における光学的文字読み取り装置のブロッ
ク図を示すものである。図４５において、文字切り出し
部１、基本特徴抽出部２、統計的特徴抽出部３、認識部
４、第１の構造的特徴抽出部５、字種判定部６、第１の
構造識別部７、経路１１、経路１２、経路１３、経路１
４、経路１５は上述した第６の実施の形態におけるもの
と同様であり、動作も同様である。なお、第１の構造識
別部７を第２の構造認識部９に置き換えても構わない。

【０１３６】本実施の形態が図４２と異なる構成は、第
１の認識結果算出部４２１に代えて、認識部４から出力
される大きい方から２番目の類似度と最大類似度の比、
最大類似度の大きさ、及び第１の構造的特徴抽出部５の
前記背景情報算出部２４で算出した背景情報に基づく背
景複雑度により、リジェクトの有無を判定する第２の認
識結果算出部４５１を設けた点である。

【０１３７】図４６は、第２の認識結果算出部４５１の
構成を具体的に示すブロック図である。４６１は、認識
部４から出力されるカテゴリ類似度の大きい方から２つ
を選択し、２番目のカテゴリ類似度（第２位類似度）と
最大類似度の比を算出する類似度比算出部である。４６
６は、背景情報算出部２４から出力される背景情報に基
づき背景複雑度を算出する背景複雑度算出部である。４
６２は、前記算出された類似度比と最大類似度と背景複
雑度を入力として、それらの値に応じてその文字パター
ンが正解（非リジェクト）か不正解（リジェクト）かを
出力するリジェクト判定部である。ここでは、上記リジ
ェクト判定部を予め複数のデータについて学習させた階
層型ニューラルネットワークにより構成した例について
説明する。４６３は、前記リジェクト判定部の学習に用
いる文字データの正解カテゴリを記憶した正解カテゴリ
テーブルである。４６４は、学習時には、認識部４から
出力される最大類似度カテゴリと前記正解カテゴリテー
ブルに書き込まれた正解カテゴリとリジェクト判定部の
出力から学習の有無を判定し、認識時には、リジェクト
判定部の出力から、リジェクトの判定をする出力判定部
である。４６５は、学習時に前記出力判定部４６４で学
習が必要であると判定された場合にリジェクト判定部を
構成する階層型ニューラルネットワークの結合荷重を更
新する結合荷重更新部である。

【０１３８】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。実施の形態
１と同様にして、入力文字列データに対して認識部４か
ら複数のカテゴリ類似度、大きい方から少なくとも１つ
のカテゴリが出力される。第２の認識結果算出部４５１
は、予め用意した複数の文字データに対する類似度と背
景複雑度とリジェクトの有無の関係を学習する学習モー
ドと、学習結果に基づいてリジェクト判定をする認識モ
ードからなる。

【０１３９】まず、学習モードについて説明する。類似
度比算出部４６１は、認識部４から出力されたカテゴリ
類似度から、第２位類似度と最大類似度の比を算出しリ
ジェクト判定部４６２に出力する。背景複雑度算出部４
６６は、背景情報算出部２４から出力される背景情報に
基づいて、垂直及び水平方向の背景次数の最大値の和を
背景複雑度として算出しリジェクト判定部４６２に出力
する。なお、背景複雑度は垂直及び水平方向の背景次数
の最大値の和に限定するものではなく、ある一定の値以
上の背景次数のライン数の和等、背景情報に基づくもの
であればよい。リジェクト判定部４６２を構成する階層
型ニューラルネットワークは、類似度比と最大類似度比
と背景複雑度を入力として、その時点での結合荷重によ
り出力層から出力信号を出力する。ここでは、出力層の
ニューロン数を２とし、一方の出力がリジェクト、もう
一方のリジェクトが非リジェクトを表す。出力判定部４
６４は、前記リジェクト判定部の出力のうち大きい方を
選択すると同時に、現在入力されているパターンの最大
類似度カテゴリと正解カテゴリテーブル４６３から出力
される正解カテゴリを比較する。最大カテゴリが正解カ
テゴリと一致する（正解）場合で、リジェクト判定部４
６２の出力のリジェクトを表すニューロンの出力が大き
いか、最大類似度カテゴリと正解カテゴリが一致しない
（不正解）場合で、リジェクト判定部４６２の出力の非
リジェクトを表すニューロンの出力が大きい時には、学
習信号を結合荷重更新部に出力する。学習信号が出力判
定部４６４から出力されると、結合荷重更新部は、最急
降下法等のアルゴリズムにより、リジェクト判定部４６
２を構成する階層型ニューラルネットワークの結合荷重
を更新する。以上の動作を、全ての学習データに対して
出力判定部４６４から学習信号が出力されなくなるか、
リジェクト判定部の２つの出力値の大小関係が変化しな
くなるまで繰り返す。この学習モードにより、類似度比
と最大類似度と背景複雑度の大きさに応じたリジェクト
判定が可能になる。

【０１４０】次に、認識モードについて説明する。上記
学習後の結合荷重値に基づいて、類似度比と最大類似度
の大きさと背景複雑度に応じた出力がリジェクト判定部
４６２から出力されると出力判定部４６４は、その出力
値の大きい方を選択し、リジェクトを表す出力が大きい
場合にはリジェクト信号を、非リジェクトを表す出力が
大きい場合には、最大類似度カテゴリを認識結果として
出力する。類似度比と最大類似度と背景複雑度の空間上
での正解文字（リジェクトしない文字）領域と不正解文
字（リジェクトすべき文字）領域の境界は非常に複雑で
ある。例えば、類似度比と最大類似度の２次元空間上で
も図４３に示すように線形分離が不可能であると考えら
れるが、本実施の形態によれば非線形分離可能な階層型
ニューラルネットワークでリジェクト判定部４６２を構
成し、この境界を学習させることにより、より精度が高
く効果的なリジェクト判定が可能となる。なお、リジェ
クト判定部４６２を、階層型ニューラルネットワーク以
外のニューラルネットワークモデルで構成しても構わな
い。また、本実施の形態では、類似度比と最大類似度と
背景複雑度の３つをリジェクト判定部４６２への入力と
したが、３つのうちの任意の１つまたは２つを入力する
構成としても構わない。

【０１４１】（実施の形態８）次に、帳票のような枠罫
線と文字を含む文書画像において、枠罫線の構造を認識
し、帳票を識別し、帳票内に記入されている特定の文字
領域を切り出し、そこに記載された文字を認識する帳票
文書認識方法および帳票文書認識装置、ならびにその認
識した文字を識別コードに変換し処理する帳票自動処理
システムについて説明する。

【０１４２】まず、従来の帳票文書認識装置について、
図５１を参照して説明する。まず、画像入力手段５０１
により帳票上に記載された文書画像が２値画像に変換さ
れる。そして、文字位置検出手段５０２で、画像信号の
うち所望の文字領域が抽出される。文字位置検出の方法
としては、例えば特開平２−２１７９７７号公報のよう
に局部的な枠線構造の相違から帳票の種類を識別し、予
め指示された領域を読み取る方法がある。次に、文字切
り出し手段５０３により、１文字単位に切り出され、文
字認識手段５０４により文字認識される。次に単語認識
手段５０５において、文字認識手段５０３で認識された
文字列に対して、予め単語が格納された単語辞書５０６
から単語が読み出され、その読み出した単語と認識され
た文字列とを比較照合することで最終認識結果が得られ
る。例えば、この文字列が住所である場合、読み取りの
対象となる住所名を予め住所辞書に登録しておき、文字
認識結果と住所辞書から読み出した住所名とを比較照合
して、住所名を認識する方法については、特開平２−１
８１２８７号公報に開示されている。

【０１４３】しかしながら、このような従来の帳票文書
認識装置では、読み取り対象となる単語を全て単語辞書
を登録しなければならないため、比較照合すべき件数が
きわめて多くなり、処理速度が非常に遅いという問題も
あった。

【０１４４】そこで本実施の形態８では、このような従
来の問題を解決すべく、処理速度の速い、高精度な帳票
文書認識方法と装置および帳票自動処理システムを提供
することを目的し、予め個々の帳票の枠構造特徴および
その枠構造特徴を有する帳票に記載される候補文字列を
枠構造参照テーブルに登録し、このテーブルを参照して
枠構造特徴を照合することにより、帳票の種別をおおま
かに分類して帳票内の文字読取対象領域を検出し、次い
で文字領域を切り出し、切り出された文字を認識し、認
識結果と枠構造参照テーブル登録された候補文字列とを
照合して最終認識結果とするものであり、単語辞書を用
いた従来の方法に比べ、高速、高精度な帳票文書認識が
可能となる。

【０１４５】以下、本発明の実施の形態８について、図
４７〜図５０を用いて説明する。図４７は本発明の実施
の形態８における帳票文書認識装置のブロック図であ
る。図１において、１０１は画像入力手段であり、枠罫
線と文字を含む帳票を読み取って２値画像に変換するも
のである。１０２はその２値画像を記憶する画像メモリ
である。１０３は枠罫線抽出手段であり、画像メモリ１
０２に記憶された２値画像から枠罫線を抽出するもので
ある。１０４は枠構造抽出手段であり、枠罫線抽出手段
１０３で抽出された枠罫線から帳票の様式を識別するの
に必要な枠構造特徴を抽出するものである。１０５は枠
構造参照テーブルであり、予め個々の帳票の枠構造特徴
およびその枠構造特徴を有する帳票に記載される候補文
字列を登録したものである。１０６は枠構造照合手段で
あり、枠構造参照テーブル１０５を参照して枠構造特徴
抽出手段１０４で抽出した枠構造特徴を照合することに
より、入力された帳票の種別を識別し、文字読取対象領
域を検出するものである。１０７は上記実施の形態１か
ら７における文字切り出し部１に相当する文字切り出し
手段であり、枠構造照合手段１０６で検出された文字読
取対象領域に基づいて画像メモリ１０２から文字列を１
文字ずつ切り出すものである。１０８は上記実施の形態
１から７における文字切り出し部１以降の手段により構
成される文字認識手段であり、文字切り出し手段１０７
で切り出された文字を認識するものである。１０９は後
処理手段であり、認識手段１０８で認識された認識結果
と枠構造参照テーブル１０５に登録されている入力帳票
に対応する候補文字列とを照合して最終認識結果とする
ものである。

【０１４６】以上のように構成された帳票文書認識装置
について、以下その動作を、図４８に示す帳票が入力さ
れ、帳票上に記載された地方公共団体名を認識対象文字
列とする場合を例にとり説明する。図４９は枠構造参照
テーブル１０５の一例を示した図である。入力される帳
票はグループＡ〜Ｄの４種類があるとする。枠構造参照
テーブル１０５には、予め入力される帳票の外形枠の構
造および個々の外形枠の内部の構造、文字読取対象領域
および記載される地方公共団体名を登録しておく。

【０１４７】まず、認識動作について説明する。帳票２
０１が入力されると、画像入力手段１０１において、枠
罫線と文字列を含む文書画像は２値化され、画像メモリ
１０２に格納される。次に枠罫線抽出手段１０３におい
て、画像メモリ１０２に格納された２値画像から枠罫線
のみを抽出する。

【０１４８】次に、枠構造特徴抽出手段１０４におい
て、枠罫線抽出手段１０３で抽出された枠罫線から、帳
票の様式を識別するのに必要な外形枠の構造および個々
の外形枠の内部の構造等の枠構造特徴を抽出する。抽出
された枠構造特徴は、枠構造照合手段１０６において、
枠構造参照テーブル１０５に予め登録されている枠構造
特徴と照合され、入力帳票３０１はグループＡに属する
と判断される。次に、文字切り出し手段１０７では、枠
構造参照テーブル１０５のグループＡに対応する入力帳
票２０１の文字読取対象領域２０２から１文字単位で文
字を切り出す。次に文字認識手段１０８において文字認
識を行う。

【０１４９】次に、後処理手段１０９の動作について説
明する。文字認識手段１０８での認識結果として「神奈
川県厚木市」が得られたとする。後処理手段１０９にお
いては、枠構造参照テーブル１０５を検索し、グループ
Ａに記載される候補文字列として登録されている地方公
共団体名「神奈川県厚木市」「福岡市」「東京都港区」
「大阪府吹田市」「鹿児島県隼人町」と認識結果「神奈
川県厚木市」との照合を行い、最終認識結果として「神
奈川県厚木市」を出力する。また、文字切り出しミス、
ノイズの影響等により、文字認識手段１０８の認識結果
が間違っている場合、例えば、「神奈川県」「柚奈川県
厚本市」が認識結果として得られた場合にも、候補文字
列の中から最も確からしい地方公共団体名が選択され、
最終認識結果としては、「神奈川県厚木市」が得られ
る。

【０１５０】本実施の形態８において、地方公共団体と
認識された文字列を、識別コード、例えば地方公共団体
コードに変換し、さらにバーコード等に変換して、その
バーコードを識別コードに代えてまたは識別コードとと
もに帳票上に印刷すれば、帳票自動処理システムの処理
を非常に効率化することができる。この場合の帳票自動
処理システムの概要を図５０に例示する。図５０におい
て、４０１は帳票文書認識手段、４０２は識別コード変
換手段、４０３は識別コード変換テーブル、４０４は識
別コード印字手段、４０５は処理手段である。

【０１５１】この帳票自動処理システムでは、帳票が、
上記実施の形態１と同様な帳票文書認識装置である帳票
文書認識手段４０１に入力されると、帳票上に記載され
た地方公共団体名を認識する。次に識別コード変換手段
４０２では、帳票文書認識手段４０１の認識結果を、識
別コード変換テーブルを参照して識別コードに変換す
る。ここで、識別コードとは地方公共団体に一意に対応
していればよい。例えば、地方公共団体コードがある。
認識結果が「神奈川県厚木市」であったらなら、対応す
る地方公共団体コードは「１４２１２３」である。な
お、識別コードは、地方公共団体コードに限定するもの
ではなく、独自に決定してもよい。次に、識別コード印
字手段４０４においては、前記変換された識別コード
を、前記入力帳票の所定の位置に印字する。なお、識別
コードそのものでなく、バーコードに変換して、バーコ
ードを印字してもよい。次に処理手段４０５において
は、前記印字された識別コードを読み取り、前記識別コ
ードに基づき帳票の仕訳処理を行う。

【０１５２】以上のように、本実施の形態８によれば、
予め個々の帳票の枠構造特徴およびその枠構造特徴を有
する帳票に記載される候補文字列を枠構造参照テーブル
に登録し、このテーブルを参照して枠構造特徴を照合す
ることにより、帳票の種別をおおまかに分類して帳票内
の文字読取対象領域を検出し、次いで文字領域を切り出
し、切り出された文字を認識し、認識結果と枠構造参照
テーブル登録された候補文字列とを照合して最終認識結
果とするものであり、単語辞書を用いた従来の方法に比
べ、高速、高精度な帳票文書認識が可能となる。

【０１５３】

【発明の効果】以上説明したように、本発明によれば、
以下のような効果を有する。本発明の請求項１に記載の
光学的文字読み取り方法によれば、統計的特徴と構造的
特徴の両方に利用できるような基本特徴を抽出して処理
の共通化を図り、統計的特徴を利用した認識部では識別
が困難な類似カテゴリを分離する構造的特徴を中心に抽
出することで効率的な特徴抽出が可能になり、認識結果
に基づいて必要な構造的特徴を選択して最終的なカテゴ
リを決定することによって更なる処理の効率化と類似カ
テゴリの認識性能の向上が可能となる。

【０１５４】本発明の請求項２に記載の発明によれば、
統計的特徴と構造的特徴の両方に利用できるような基本
特徴を抽出して処理の共通化を図り、統計的特徴を利用
した認識部では識別が困難な類似カテゴリに関して、構
造的特徴に基づいた類似度修正値を加算した修正後類似
度に基づいて最終的なカテゴリを決定することにより、
統計的特徴を利用した認識部から出力された類似度の微
妙な差を最終的なカテゴリ決定に反映させることがで
き、また構造的特徴検出の信頼度を類似度修正値として
反映させることができるため、認識性能の向上が可能と
なる。

【０１５５】本発明の請求項３に記載の発明によれば、
字種に応じて専門化処理を行うことにより活字・手書き
特有の構造的特徴を混同することなく利用できるため、
類似カテゴリ間の認識性能が向上し、また予め字種に応
じた構造的特徴を分離して抽出することにより処理の効
率化が図れる。

【０１５６】本発明の請求項４に記載の発明によれば、
文字パターンの外接矩形の大きさや、類似度に基づい
て、外接矩形が他の文字の外接矩形と大きく相違してい
たり規定の外接矩形から外れている場合や、類似度が他
の文字の類似度に比べて極端に低い場合や、第１位の類
似度と第２位以下の類似度との差が少ない場合などに、
切り出し失敗文字を検出して失敗原因を分析して再切り
出しを実行することにより、切り出し誤りを減らし、切
り出し誤りに起因する誤認識を減少させることが可能と
なる。

【０１５７】本発明の請求項５に記載の発明によれば、
類似度の比、最大類似度の大きさ、背景複雑度に基づい
てリジェクト判定を行うことにより、リジェクト困難な
前処理エラー文字を効率的なリジェクトが可能となる。

【０１５８】本発明の請求項６に記載の光学的文字読み
取り装置によれば、統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出して処理の共通化を図
り、統計的特徴を利用した認識部では識別が困難な類似
カテゴリを分離する構造的特徴を中心に抽出することで
効率的な特徴抽出が可能になり、認識結果に基づいて必
要な構造的特徴を選択して最終的なカテゴリを決定する
ことによって更なる処理の効率化と類似カテゴリの認識
性能の向上が可能となる。

【０１５９】本発明の請求項７に記載の発明によれば、
統計的特徴を用いた認識結果に基づいて、類似カテゴリ
の識別に必要な構造的特徴のみを選択し最終的なカテゴ
リを決定することによって更なる処理の効率化と類似カ
テゴリの認識性能の向上が可能となる。

【０１６０】本発明の請求項８に記載の発明によれば、
字種に応じて専門化処理を行うことにより活字・手書き
特有の構造的特徴を混同することなく利用できるため、
類似カテゴリ間の認識性能が向上し、また予め字種に応
じた構造的特徴を分離して抽出することにより処理の効
率化が図れる。

【０１６１】本発明の請求項９に記載の発明よれば、活
字に関して、統計的特徴を用いた認識結果に基づいて、
類似カテゴリの識別に必要な構造的特徴のみを選択し最
終的なカテゴリを決定することによって更なる処理の効
率化と類似カテゴリの認識性能の向上が可能となる。

【０１６２】本発明の請求項１０に記載の発明よれば、
活字に関して、外接矩形の大きさだけで判別可能なカテ
ゴリを最初に判定することで効率的にカテゴリを分離
し、次に認識部の結果に応じて類似カテゴリ分離に必要
な構造的特徴を選択して最終カテゴリ判断を行うことで
効率的かつ効果的な類似カテゴリ分離が可能となる。

【０１６３】本発明の請求項１１に記載の発明によれ
ば、手書き文字に関して統計的特徴を用いた認識結果に
基づいて、類似カテゴリの識別に必要な構造的特徴のみ
を選択し最終的なカテゴリを決定することによって更な
る処理の効率化と類似カテゴリの認識性能の向上が可能
となる。

【０１６４】本発明の請求項１２に記載の発明によれ
ば、手書き文字に関して、外接矩形の大きさだけで判別
可能なカテゴリを最初に判定することで効率的にカテゴ
リを分離し、次に認識部の結果に応じて類似カテゴリ分
離に必要な構造的特徴を選択して最終カテゴリ判断を行
うことで効率的かつ効果的な類似カテゴリ分離が可能と
なる。

【０１６５】本発明の請求項１３に記載の発明によれ
ば、統計的特徴と構造的特徴の両方に利用できるような
基本特徴を抽出して処理の共通化を図り、統計的特徴を
利用した認識部では識別が困難な類似カテゴリに関し
て、構造的特徴に基づいた類似度修正値を加算した修正
後類似度に基づいて最終的なカテゴリを決定することに
より、統計的特徴を利用した認識部から出力された類似
度の微妙な差を最終的なカテゴリ決定に反映させること
ができ、また構造的特徴検出の信頼度を類似度修正値と
して反映させることができるため、認識性能の向上が可
能となる。

【０１６６】本発明の請求項１４に記載の発明によれ
ば、類似度修正値を加算した修正後類似度に基づいて最
終的なカテゴリを決定することにより、統計的特徴を利
用した認識部から出力された類似度の微妙な差を最終的
なカテゴリ決定に反映させることができ、また構造的特
徴検出の信頼度を類似度修正値として反映させることが
できるため、認識性能の向上が可能となる。

【０１６７】本発明の請求項１５に記載の発明によれ
ば、字種に応じて専門化処理を行うことにより活字・手
書き特有の構造的特徴を混同することなく利用できるた
め、類似カテゴリ間の認識性能が向上し、また予め字種
に応じた構造的特徴を分離して抽出することにより処理
の効率化が図れる。

【０１６８】本発明の請求項１６に記載の発明によれ
ば、活字に関して、類似度修正値を加算した修正後類似
度に基づいて最終的なカテゴリを決定することにより、
統計的特徴を利用した認識部から出力された類似度の微
妙な差を最終的なカテゴリ決定に反映させることがで
き、また構造的特徴検出の信頼度を類似度修正値として
反映させることができるため、認識性能の向上が可能と
なる。

【０１６９】本発明の請求項１７に記載の発明によれ
ば、手書き文字に関して、類似度修正値を加算した修正
後類似度に基づいて最終的なカテゴリを決定することに
より、統計的特徴を利用した認識部から出力された類似
度の微妙な差を最終的なカテゴリ決定に反映させること
ができ、また構造的特徴検出の信頼度を類似度修正値と
して反映させることができるため、認識性能の向上が可
能となる。

【０１７０】本発明の請求項１８に記載の発明によれ
ば、輪郭方向成分の算出、外接矩形の各々の辺から文字
パターンまでの背景距離の算出、背景情報算出のための
共通の前処理として文字パターンの輪郭点を抽出するこ
とにより、基本特徴抽出の効率が向上する。また、基本
特徴として輪郭点、輪郭方向成分、背景距離、背景情報
を抽出する事により統計的特徴だけでなく、文字構造を
反映した構造特徴量にも流用が可能になり特徴抽出処理
の効率化が可能となる。

【０１７１】本発明の請求項１９に記載の発明によれ
ば、基本特徴からブロックの統計的特徴を抽出すること
でき、ブロック単位で抽出した統計的特徴をブロックの
大きさで正規化することにより、認識対象の変化に影響
を受けにくい特徴の抽出が可能となる。

【０１７２】本発明の請求項２０に記載の発明によれ
ば、基本特徴に基づいて、特定のカテゴリ間の識別に有
効である背景部の部分的な凹凸情報、類似カテゴリ間の
ストロークの屈曲方向や直線性の相違、ストロークのル
ープ数、文字背景部の構造、文字背景部の大きさ、外接
矩形との位置関係、端点・交点の情報、直線を抽出する
ことにより、文字の構造的な特徴をより明示的に表す構
造的特徴の効率的な抽出が可能であり、これらの構造的
特徴を用いることにより統計的特徴量のみを利用する識
別方法では識別が困難な類似カテゴリ間の認識性能の向
上が可能となる。

【０１７３】本発明の請求項２１に記載の発明によれ
ば、基本特徴に基づいて、特定のカテゴリ間の識別に有
効である背景部の部分的な凹凸情報、類似カテゴリ間の
ストロークの屈曲方向や直線性の相違、ストロークのル
ープ数、文字背景部の構造、文字背景部の大きさ、外接
矩形との位置関係、端点・交点の情報、直線を抽出する
ことにより、文字の構造的な特徴をより明示的に表す構
造的特徴の効率的な抽出が可能であり、これらの構造的
特徴を用いることにより統計的特徴量のみを利用する識
別方法では識別が困難な類似カテゴリ間の認識性能の向
上が可能となる。また、ループ数をラベル情報のみに基
づいて抽出することにより、処理の効率化が可能とな
る。

【０１７４】本発明の請求項２２に記載の発明よれば、
基本特徴として予め抽出した背景情報を利用すること
で、隣接するラインの背景情報を比較して相違を調べる
だけの簡単な処理で端点および交点の候補を抽出するこ
とが可能であり、端点と交点候補の位置関係に基づいて
他の端点または交点候補との距離が近すぎる端点または
交点を除去することで、ノイズによる端点や交点の誤抽
出を減少させ、手書きのカテゴリ２とカテゴリ３のよう
な類似カテゴリの分離に効果的な端点や交点の情報をよ
り高精度に抽出することが可能となる。

【０１７５】本発明の請求項２３に記載の発明よれば、
基本特徴として予め抽出した背景情報を利用して、黒画
素の連続度および複数ラインへの連続度を調べるだけの
簡単な処理で直線を抽出することが可能であり、また端
点および交点の位置情報を用いて、線の合流や分岐に伴
って発生する誤った直線候補を除去し、残った直線候補
を近傍の線との接続状態に対応して分類することによ
り、水平方向の短い直線に特徴のある手書きのカテゴリ
￥のようなカテゴリを分離するために有効な直線をより
高精度に抽出することが可能となる。

【０１７６】本発明の請求項２４に記載の発明よれば、
文字パターンの外接矩形の大きさや、類似度に基づい
て、外接矩形が他の文字の外接矩形と大きく相違してい
たり規定の外接矩形から外れている場合や、類似度が他
の文字の類似度に比べて極端に低い場合や、第１位の類
似度と第２位以下の類似度との差が少ない場合などに、
切り出し失敗文字を検出して失敗原因を分析して再切り
出しを実行することにより、切り出し誤りを減らし、切
り出し誤りに起因する誤認識を減少させることが可能と
なる。

【０１７７】本発明の請求項２５に記載の発明よれば、
類似度の比、最大類似度の大きさ、背景複雑度に基づい
てリジェクト判定を行うことにより、リジェクト困難な
前処理エラー文字を効率的なリジェクトが可能となる。

【０１７８】本発明の請求項２６に記載の発明によれ
ば、類似度の比と最大類似度と背景複雑度の少なくとも
１つを軸とした空間上でのリジェクト領域と非リジェク
ト領域の非線形な境界を、予め階層型ニューラルネット
ワークに学習させてあるので、より高精度なリジェクト
判定処理が可能となる。

【０１７９】本発明の請求項２７に記載の発明によれ
ば、枠構造特徴により帳票をおおまかに分類し、その形
式の帳票に記載される可能性のある候補文字列と認識結
果とを照合するという２段階の処理を行うことにより、
高速、高精度に帳票上に記載された文字を認識すること
が可能になる。

【０１８０】本発明の請求項２８に記載の発明によれ
ば、枠構造特徴により帳票をおおまかに分類し、その形
式の帳票に記載される可能性のある候補文字列と認識結
果とを照合するという２段階の処理を行うことにより、
高速、高精度に帳票上に記載された文字を認識すること
が可能となる。

【０１８１】本発明の請求項２９に記載の発明によれ
ば、文字認識手段による認識結果が間違いがあっても、
候補文字列の中から最も確からしい文字列を選択するこ
とが可能となる。

【０１８２】本発明の請求項３０に記載の発明によれ
ば、認識された文字列を識別コード変換テーブルを参照
して識別コードに変換することにより、帳票の仕訳を効
率的に行うことが可能となる。

【０１８３】本発明の請求項３１に記載の発明によれ
ば、識別コードに対応するバーコードを印字することに
より、バーコードシステムに対応することが可能とな
る。

【図面の簡単な説明】

【図１】本発明の第１の実施の形態における光学的文字
読み取り装置の構成を示すブロック図

【図２】第１の実施の形態における基本特徴抽出部の構
成を示すブロック図

【図３】第１の実施の形態における統計的特徴抽出部の
構成を示すブロック図

【図４】第１の実施の形態における第１の構造的特徴抽
出部の構成を示すブロック図

【図５】第１の実施の形態における第１の構造識別部の
構成を示すブロック図

【図６】第１の実施の形態における第１の活字処理部の
構成を示すブロック図

【図７】第１の実施の形態における第１の手書き処理部
の構成を示すブロック図

【図８】第１の実施の形態における端点・交点抽出部の
構成を示すブロック図

【図９】第１の実施の形態における直線抽出部の構成を
示すブロック図

【図１０】第１の実施の形態における文字切り出し方法
を説明するための摸式図

【図１１】第１の実施の形態における輪郭点抽出方法を
説明するための摸式図

【図１２】第１の実施の形態における輪郭方向と符号化
の対応付けを説明するための摸式図

【図１３】第１の実施の形態におけるを輪郭方向符号化
方法を説明するための摸式図

【図１４】第１の実施の形態におけるを背景距離算出方
法を説明するための摸式図

【図１５】第１の実施の形態におけるを背景情報算出方
法を説明するための摸式図

【図１６】第１の実施の形態におけるブロック分割方法
を説明するための摸式図

【図１７】第１の実施の形態における輪郭方向集計方法
を説明するための摸式図

【図１８】第１の実施の形態における外郭点発見方法を
説明するための摸式図

【図１９】第１の実施の形態における認識部の構成の一
例である階層型ニューラルネットワークの摸式図

【図２０】第１の実施の形態における局所背景特徴抽出
方法を説明するための摸式図

【図２１】第１の実施の形態における局所ストローク形
状抽出方法を説明するための摸式図

【図２２】第１の実施の形態におけるループ抽出方法を
説明するための摸式図

【図２３】第１の実施の形態における背景ブロック抽出
方法を説明するための摸式図

【図２４】第１の実施の形態における個のラインの状態
比較による端点・交点抽出方法を説明するための模式図

【図２５】第１の実施の形態における不適当な端点また
は交点の除去条件を説明するための模式図

【図２６】第１の実施の形態における水平方向の直線の
抽出基準を説明するための模式図

【図２７】第１の実施の形態における外接矩形の大きさ
によるカテゴリ分離方法を説明するための摸式図

【図２８】第１の実施の形態における右上部が閉じる寸
前のカテゴリ６の一例を示す摸式図

【図２９】第１の実施の形態における左側から見た端点
数の違いによるカテゴリ分離方法を説明するための模式
図

【図３０】第１の実施の形態における直線抽出による類
似カテゴリ分離方法を説明するための模式図

【図３１】第１の実施の形態における背景ブロック情報
による認識結果修正方法を説明するための模式図

【図３２】第１の実施の形態における背景ラベル抽出方
法を説明するための摸式図

【図３３】本発明の第２の実施の形態における光学的文
字読み取り装置の構成を示すブロック図

【図３４】第２の実施の形態における第２の構造的特徴
抽出部の構成を示すブロック図

【図３５】第２の実施の形態におけるループ抽出方法を
説明するための摸式図

【図３６】本発明の第３の実施の形態における光学的文
字読み取り装置の構成を示すブロック図

【図３７】第３の実施の形態における第２の構造識別
部の構成を示すブロック図

【図３８】本発明の第４の実施の形態における光学的文
字読み取り装置の構成を示すブロック図

【図３９】第４の実施の形態における文字切り出し失敗
による外接矩形の大きさの変化を示す模式図

【図４０】第４の実施の形態におけるヒストグラムによ
る文字切り出し修正手法を説明するための模式図

【図４１】本発明の第５の実施の形態における光学的文
字読み取り装置の構成を示すブロック図

【図４２】本発明の第６の実施の形態における光学的文
字読み取り装置の構成を示すブロック図

【図４３】類似度比と最大類似度の空間上における正解
文字と不正解文字の分布例を示す特性図

【図４４】最大類似度が小さい（＜５００）文字パター
ンの文字イメージ例を示す模式図

【図４５】本発明の第７の実施の形態におけるリ光学的
文字読み取り装置の構成を示すブロック図

【図４６】第７の実施の形態における第２の認識結果算
出部の構成を示すブロック図

【図４７】第８の実施の形態における帳票文書認識装置
の構成を示すブロック図

【図４８】第８の実施の形態における入力帳票の一例を
示す模式図

【図４９】第８の実施の形態における枠構造参照テーブ
ルの一例を示す模式図

【図５０】第８の実施実施の形態における帳票自動処理
システムの構成を示すブロック図

【図５１】従来の帳票文書認識装置の構成を示すブロッ
ク図

【符号の説明】

１文字切り出し部２基本特徴抽出部３統計的特徴抽出部４認識部５第１の構造的特徴抽出部６字種判定部７第１の構造識別部８第２の構造的特徴抽出部９第２の構造識別部１１（外接矩形の大きさを出力する）経路１２（切り出し画像を出力する）経路１３（輪郭方向成分を出力する）経路１４（背景距離を出力する）経路１５（背景情報を出力する）経路２１輪郭点抽出部２２輪郭方向算出部２３背景距離算出部２４背景情報算出部３１両方向ブロック分割部３２水平方向ブロック分割部３３垂直方向ブロック分割部３４輪郭方向集計部３５輪郭方向正規化部３６外郭方向集計部３７外郭方向正規化部３８背景距離集計部３９背景距離正規化部４１局所背景特徴抽出部４２局所ストローク形状抽出部４３第１のループ抽出部４４端点・交点抽出部４５直線抽出部４６背景ブロック抽出部４７背景ラベル抽出部４８第２のループ抽出部５１第１の活字処理部５２第１の手書き処理部６１第１の外接矩形カテゴリ判定部６２第１の認識依存特徴選択部６３第１の選択構造的特徴識別部７１第２の外接矩形カテゴリ判定部７２第２の認識依存特徴選択部７３第２の選択構造的特徴識別部８１端点・交点候補抽出部８２端点・交点判定部９１黒画素連続領域抽出部９２直線候補抽出部９３直線判定部１０１画像入力手段１０２画像メモリ１０３枠罫線抽出手段１０４枠構造抽出手段１０５枠構造参照テーブル１０６枠構造照合手段１０７文字切り出し手段１０８文字認識手段１０９後処理手段３７１第２の活字処理部３７２第２の手書き処理部３７３加算器３７４修正カテゴリ決定部３８１第２の文字切り出し部３８２第１の切り出しエラー判定部４１１第２の切り出しエラー判定部４２１第１の認識結果算出部４５１第２の認識結果算出部４６１類似度比算出部４６２リジェクト判定部４６３正解カテゴリテーブル４６４出力判定部４６５結合荷重更新部４６６背景複雑度算出部

───────────────────────────────────────────────────── フロントページの続き (31)優先権主張番号特願平10−62991 (32)優先日平10(1998)３月13日 (33)優先権主張国日本（ＪＰ）

Claims

【特許請求の範囲】

【請求項１】光電変換された文字枠線を含む文字列デ
ータに対して、文字枠線と文字列パターンを分離し、分
離された文字列パターンから個々の文字パターンを切り
出し、個々の文字パターンに対する外接矩形の大きさと
外接矩形に囲まれた切り出し文字画像を求め、前記切り
出された個々の切り出し文字画像に対する輪郭情報と背
景構造情報とを基本特徴として抽出し、前記抽出された
基本特徴に基づいて少なくとも一種類の統計的特徴を抽
出し、前記切り出された個々の切り出し文字画像と前記
抽出された基本特徴に基づいて少なくとも一種類の構造
的特徴を抽出し、前記抽出された統計的特徴から前記切
り出し文字画像の各カテゴリに対する類似度を求め、前
記類似度が最大のカテゴリを個々の文字パターンの属す
るカテゴリと判定し、前記判定された文字パターンの属
するカテゴリと前記カテゴリに対する類似度と前記抽出
されたた構造的特徴とに基づいて最終的な文字パターン
の属するカテゴリを判定する各ステップを備えたことを
特徴とする光学的文字読み取り方法。
【請求項２】光電変換された文字枠線を含む文字列デ
ータに対して、文字枠線と文字列パターンを分離し、分
離された文字列パターンから個々の文字パターンを切り
出し、個々の文字パターンに対する外接矩形の大きさと
外接矩形に囲まれた切り出し文字画像を求め、前記切り
出された個々の切り出し文字画像に対する輪郭情報と背
景構造情報とを基本特徴として抽出し、前記抽出された
基本特徴に基づいて少なくとも一種類の統計的特徴を抽
出し、前記切り出された個々の切り出し文字画像と前記
抽出された基本特徴に基づいて少なくとも一種類の構造
的特徴を抽出し、前記抽出された統計的特徴から前記切
り出し文字画像の各カテゴリに対する類似度を求め、前
記類似度が最大のカテゴリを個々の文字パターンの属す
るカテゴリと判定し、前記切り出された個々の文字パタ
ーンに対する外接矩形の大きさと前記判定された文字パ
ターンの属するカテゴリと前記抽出された構造的特徴と
の少なくとも一つに基づいて前記類似度を修正し、修正
後の類似度に基づいて最終的な文字パターンの属するカ
テゴリを判定する各ステップを備えたことを特徴とする
光学的文字読み取り方法。
【請求項３】前記切り出された文字パターンに対する
外接矩形の大きさに基づいて活字または手書きの字種判
定を行い、前記字種判定の結果と前記切り出された文字
パターンに対する外接矩形の大きさと前記判定された文
字パターンの属するカテゴリと前記カテゴリに対する類
似度と前記抽出された構造的特徴の少なくとも一つに基
づいて最終的な文字パターンの属するカテゴリを判定す
る各ステップを備えたことを特徴とする請求項１または
２記載の光学的文字読み取り方法。
【請求項４】前記切り出された文字パターンに対する
外接矩形の大きさと前記判定されたカテゴリに対する類
似度と前記抽出された構造的特徴との少なくとも一つに
基づいて切り出しエラーを判定し、切り出しエラーと判
定された場合に文字パターンの再切り出しを行う各ステ
ップを備えたことを特徴とする請求項１または２または
３記載の光学的文字読み取り方法。
【請求項５】前記切り出された文字パターンの最大類
似度、２番目の類似度と最大類似度の比の値、前記切り
出された文字パターンの背景の複雑度に基づいて、前記
判定された文字パターンの属するカテゴリの信頼度が低
い場合にはリジェクト処理を行い、それ以外の場合は前
記判定された文字パターンの属するカテゴリを最終的な
認識結果とする各ステップを備えたことを特徴とする請
求項１から４のいずれかに記載の光学的文字読み取り方
法。
【請求項６】光電変換された文字枠線を含む文字列デ
ータに対して、文字枠線と文字列パターンを分離し、分
離された文字列パターンから個々の文字パターンを切り
出し、個々の文字パターンに対する外接矩形の大きさと
外接矩形に囲まれた切り出し文字画像を出力する文字切
り出し手段と、前記文字切り出し手段で切り出された個
々の切り出し文字画像に対する基本特徴として輪郭情報
と背景構造情報を求める基本特徴抽出手段と、前記基本
特徴抽出手段から出力された基本特徴に基づいて少なく
とも一種類の統計的特徴を求める統計的特徴抽出手段
と、前記文字切り出し手段で切出された個々の切り出し
文字画像と前記基本特徴抽出手段から出力された基本特
徴に基づいて少なくとも一種類の構造的特徴を求める構
造的特徴抽出手段と、前記統計的特徴抽出手段から出力
された統計的特徴から切り出し文字画像の各カテゴリに
対する類似度を求め、類似度の大きい順に選んだ少なく
とも１つのカテゴリの類似度と、同じ順に選んだ少なく
とも一つのカテゴリとを出力する認識手段と、前記認識
手段から出力されたカテゴリと前記カテゴリに対する類
似度と前記構造的特徴抽出手段から出力された構造的特
徴とに基づいて最終的な文字パターンの属するカテゴリ
を判定する第１の構造識別手段とを備えたことを特徴と
する光学的文字読み取り装置。
【請求項７】前記第１の構造識別手段が、前記認識手
段から出力されたカテゴリに基づいて、前記構造特徴抽
出手段から出力された少なくとも一つの構造的特徴の中
から有効な構造的特徴を選択する認識依存特徴選択手段
と、選択された構造的特徴に基づいてカテゴリを判定す
る選択構造的特徴識別手段とを備えたことを特徴とする
請求項６記載の光学的文字読み取り装置。
【請求項８】前記文字切り出し手段から出力された外
接矩形の大きさに基づき活字または手書きの判定を行う
字種判定手段を備え、前記第１の構造識別手段が、前記
字種判定手段で活字と判定された文字に対して、個々の
文字パターンが属するカテゴリを判定する第１の活字処
理手段と、前記字種判定手段で手書きと判定された文字
に対して、個々の文字パターンが属するカテゴリを判定
する第１の手書き処理手段とを備えたことを特徴とする
請求項６または７記載の光学的文字読み取り装置。
【請求項９】前記第１の活字処理手段が、前記文字切
り出し手段から出力された外接矩形の大きさと認識手段
から出力されたカテゴリに基づいて構造的特徴抽出手段
から出力された少なくとも一つの構造的特徴の中から有
効な構造的特徴を選択する認識依存特徴選択手段と、認
識依存特徴選択手段で選択された構造的特徴に基づいて
カテゴリ判定を行う選択構造的特徴識別手段とを備えた
ことを特徴とする請求項８記載の光学的文字読み取り装
置。
【請求項１０】前記第１の活字処理手段が、前記文字
切り出し手段から出力された外接矩形の大きさと認識手
段から出力されたカテゴリに基づいて一部のカテゴリに
対する最終的なカテゴリ判定を行う外接矩形カテゴリ判
定手段と、外接矩形カテゴリ判定手段で判定できない文
字に対して認識手段から出力されたカテゴリに基づいて
構造的特徴抽出手段から出力された少なくとも一つの構
造的特徴の中から有効な構造的特徴を選択する認識依存
特徴選択手段と、前記認識依存特徴選択手段で選択され
た構造的特徴に基づいてカテゴリ判定を行う選択構造的
特徴識別手段とを備えたことを特徴とする請求項８記載
の光学的文字読み取り装置。
【請求項１１】前記第１の手書き処理手段が、前記文
字切り出し手段から出力された外接矩形の大きさと認識
手段から出力されたカテゴリに基づいて構造的特徴抽出
手段から出力された少なくとも一つの構造的特徴の中か
ら有効な構造的特徴を選択する認識依存特徴選択手段
と、前記認識依存特徴選択手段で選択された構造的特徴
に基づいてカテゴリ判定を行う選択構造的特徴識別手段
とを備えたことを特徴とする請求項８記載の光学的文字
読み取り装置。
【請求項１２】前記第１の手書き処理手段が、前記文
字切り出し手段から出力された外接矩形の大きさと認識
手段から出力されたカテゴリに基づいて一部のカテゴリ
に対する最終的なカテゴリ判定を行う外接矩形カテゴリ
判定手段と、外接矩形カテゴリ判定手段で判定できない
文字に対して認識手段から出力されたカテゴリに基づい
て構造的特徴抽出手段から出力された少なくとも一つの
構造的特徴の中から有効な構造的特徴を選択する認識依
存特徴選択手段と、前記認識依存特徴選択手段で選択さ
れた構造的特徴に基づいてカテゴリ判定を行う選択構造
的特徴識別手段とを備えたことを特徴とする請求項８記
載の光学的文字読み取り装置。
【請求項１３】光電変換された文字枠線を含む文字列
データに対して、文字枠線と文字列パターンを分離し、
分離された文字列パターンから個々の文字パターンを切
り出し、個々の文字パターンに対する外接矩形の大きさ
と外接矩形に囲まれた切り出し文字画像を出力する文字
切り出し手段と、前記文字切り出し手段で切り出された
個々の切り出し文字画像に対する基本特徴として輪郭情
報と背景構造情報を求める基本特徴抽出手段と、前記基
本特徴抽出手段から出力された基本特徴に基づいて少な
くとも一種類の統計的特徴を求める統計的特徴抽出手段
と、前記文字切り出し手段で切出された個々の切り出し
文字画像と前記基本特徴抽出手段から出力された基本特
徴に基づいて少なくとも一種類の構造的特徴を求める構
造的特徴抽出手段と、前記統計的特徴抽出手段から出力
された統計的特徴から切り出し文字画像の各カテゴリに
対する類似度を求め、類似度の大きい順に選んだ少なく
とも１つのカテゴリの類似度と、同じ順に選んだ少なく
とも一つのカテゴリとを出力する認識手段と、前記文字
切り出し手段から出力された文字パターンの外接矩形の
大きさと前記認識手段から出力されたカテゴリと前記構
造的特徴抽出手段から出力された構造的特徴との少なく
とも一つに基づいて前記認識手段から出力された類似度
を修正し、修正後の類似度に基づいて文字パターンが属
するカテゴリを最終的に判定する第２の構造識別手段と
を備えたことを特徴とする光学的文字読み取り装置。
【請求項１４】前記第２の構造識別手段が、前記文字
切り出し手段から出力された文字パターンの外接矩形の
大きさと前記認識手段から出力された少なくとも一つの
カテゴリと前記構造的特徴抽出手段から出力された構造
的特徴に基づいて、前記認識手段から出力された類似度
を修正する類似度修正手段と、前記認識手段から出力さ
れた少なくとも一つのカテゴリの類似度と前記類似度修
正手段により修正された類似度と加算して修正類似度を
算出する加算器と、前記加算器から出力された修正類似
度から個々の文字パターンが属するカテゴリを決定する
修正カテゴリ判定手段とを備えたことを特徴とする請求
項１３記載の光学的文字読み取り装置。
【請求項１５】前記文字切り出し手段から出力された
外接矩形の大きさに基づき活字または手書きの判定を行
う字種判定手段を備え、前記第２の構造識別手段が、前
記字種判定手段で活字と判定された文字に対して、個々
の文字パターンが属するカテゴリを判定する第２の活字
処理手段と、前記字種判定手段で手書きと判定された文
字に対して、個々の文字パターンが属するカテゴリを判
定する第２の手書き処理手段とを備えたことを特徴とす
る請求項１３または１４記載の光学的文字読み取り装
置。
【請求項１６】前記第２の活字処理手段が、前記文字
切り出し手段から出力された文字パターンの外接矩形の
大きさと前記認識手段から出力された少なくとも一つの
カテゴリと前記構造的特徴抽出手段から出力された構造
的特徴に基づいて、前記認識手段から出力された類似度
を修正する類似度修正手段と、前記認識手段から出力さ
れた少なくとも一つのカテゴリの類似度と前記類似度修
正手段により修正された類似度と加算して修正類似度を
算出する加算器と、前記加算器から出力された修正類似
度から個々の文字パターンが属するカテゴリを決定する
修正カテゴリ判定手段とを備えたことを特徴とする請求
項１５記載の光学的文字読み取り装置。
【請求項１７】前記第２の手書き処理手段が、前記文
字切り出し手段から出力された文字パターンの外接矩形
の大きさと前記認識手段から出力された少なくとも一つ
のカテゴリと前記構造的特徴抽出手段から出力された構
造的特徴に基づいて、前記認識手段から出力された類似
度を修正する類似度修正手段と、前記認識手段から出力
された少なくとも一つのカテゴリの類似度と前記類似度
修正手段により修正された類似度と加算して修正類似度
を算出する加算器と、前記加算器から出力された修正類
似度から個々の文字パターンが属するカテゴリを決定す
る修正カテゴリ判定手段とを備えたことを特徴とする請
求項１５記載の光学的文字読み取り装置。
【請求項１８】前記基本特徴抽出手段が、前記文字
切り出し手段から出力される切り出し画像中の文字パタ
ーンの輪郭点を抽出する輪郭点抽出手段と、前記輪郭点
抽出手段から出力された個々の輪郭点の隣接関係から画
素単位の輪郭方向成分を算出する輪郭方向算出手段と、
前記輪郭点抽出手段から出力された輪郭点の位置に基づ
いて文字パターンの外接矩形の各々の辺から文字パター
ンまでの背景距離を求める背景距離算出手段と前記文字
切り出し手段から出力された切り出し画像を水平及び垂
直方向のライン毎に走査し、一定画素以上連続する白画
素（背景）の連続する長さ・位置情報とその背景の走査
方向に沿った発生順番である背景次数を算出する背景情
報算出手段とを備えたことを特徴とする請求項６、８、
１３、１５のいずれかに記載の光学的文字読み取り装
置。
【請求項１９】前記統計的特徴抽出手段が、前記文字
切り出し手段から出力された切り出し画像を水平・垂直
両方向で複数のブロックに分割する両方向ブロック分割
手段と、前記両方向ブロック分割手段で分割したブロッ
ク単位で、前記基本特徴抽出手段の輪郭方向算出手段か
ら出力された輪郭方向成分について輪郭方向毎の個数を
集計する輪郭方向集計手段と、輪郭方向集計手段から出
力されたブロック単位の輪郭方向毎の輪郭方向成分の個
数をブロックの大きさで割ることで得られる輪郭方向毎
の輪郭統計特徴量を求める輪郭方向正規化手段と、前記
文字切り出し手段から出力された切り出し画像を水平方
向で複数のブロックに分割する水平方向ブロック分割手
段と、前記文字切り出し手段から出力された切り出し画
像を垂直方向で複数のブロックに分割する垂直方向ブロ
ック分割手段と、前記基本特徴抽出手段から出力された
輪郭方向成分に基づいて、前記水平方向ブロック分割部
及び垂直方向ブロック分割手段で分割したブロック単位
で、ブロック分割境界線に垂直な外接矩形の辺からブロ
ック分割境界線に平行方向に走査して最初に存在する文
字パターンを構成する画素の輪郭方向毎の輪郭方向成分
の個数である外郭方向成分の個数を集計する外郭方向集
計手段と、外郭方向集計手段から出力されたブロック単
位の輪郭方向毎の外郭方向成分の個数をブロックの大き
さで割ることで得られる輪郭方向毎の外郭統計特徴量を
求める外郭方向正規化手段と、前記基本特徴抽出手段の
背景距離算出手段から出力された背景距離に基づいて、
前記水平方向ブロック分割部及び垂直方向ブロック分割
部で分割したブロック単位でブロック分割方向の背景距
離を合計する背景距離合計手段と、背景距離集計手段か
ら出力されたブロック単位の集計背景距離をブロックの
大きさで割ることで得られる背景距離特徴量を求める背
景距離正規化手段とを備えたことを特徴とする請求項
６、８、１３、１５のいずれかに記載の光学的文字読み
取り装置。
【請求項２０】前記構造的特徴抽出手段が、前記基本
特徴抽出手段の背景距離算出手段から出力された背景距
離に基づいて局所的な背景距離特徴を抽出する局所背景
特徴抽出手段と、前記基本特徴抽出手段の輪郭方向算出
手段から出力された輪郭方向成分に基づいて局所的なス
トローク方向の変化を抽出する局所ストローク形状抽出
手段と、前記文字切り出し手段から出力された切り出
し文字画像と前記基本特徴抽出手段の輪郭方向算出手段
から出力された輪郭方向成分に基づいて文字パターンの
ループを抽出する第１のループ抽出手段と、前記基本特
徴抽出手段の背景情報算出手段で算出した背景情報に基
づいて背景次数毎に隣接する背景画素の塊を背景ブロッ
クとして求めると共に、その大きさ情報と位置情報を算
出する背景ブロック抽出手段と、前記基本特徴抽出手段
の背景情報算出手段で算出した背景情報に基づいて隣接
する白画素の塊を背景ラベルとして求めラベル番号を付
与すると共に、その大きさ、位置、その背景ラベルが外
接矩形のどの辺と接するかを表わすラベル情報を算出す
る背景ラベル抽出手段と、前記基本特徴抽出手段の背景
情報算出手段で算出した背景情報に基づいて文字パター
ンを構成するストロークの端点と交点と抽出する端点・
交点抽出手段と、前記基本特徴抽出手段の背景情報算出
手段で算出した背景情報と前記端点・交点抽出手段で抽
出された端点と交点とに基づいて直線を抽出する直線抽
出手段とを備えたことを特徴とする請求項６、８、１
３、１５のいずれかに記載の光学的文字読み取り装置。
【請求項２１】前記構造的特徴抽出部が、前記基本特
徴抽出手段の背景距離算出手段から出力された背景距離
に基づいて局所的な背景距離特徴を抽出する局所背景特
徴抽出手段と、前記基本特徴抽出手段の輪郭方向算出手
段から出力された輪郭方向成分に基づいて局所的なスト
ローク方向の変化を抽出する局所ストローク形状抽出手
段と、前記基本特徴抽出手段の背景情報算出手段で算出
した背景情報から、背景次数毎に隣接する背景画素の塊
を背景ブロックとして求めると共に、その大きさ情報と
位置情報を算出する背景ブロック抽出手段と、前記基本
特徴抽出手段の背景情報算出手段で算出した背景情報か
ら、隣接する白画素の塊を背景ラベルとして求めラベル
番号を付与すると共に、その大きさ、位置、その背景ラ
ベルが外接矩形のどの辺と接するかを表わすラベル情報
を算出する背景ラベル抽出手段と、前記基本特徴抽出手
段の背景情報算出手段で算出した背景情報に基づいて文
字パターンを構成するストロークの端点と交点と抽出す
る端点・交点抽出手段と、前記基本特徴抽出手段の背景
情報算出手段で算出した背景情報と前記端点・交点抽出
手段で抽出された端点と交点とに基づいて直線を抽出す
る直線抽出手段と、前記背景ラベル抽出手段で算出した
ラベル情報に基づいて文字パターンのループを抽出する
第２のループ抽出手段とを備えたことを特徴とする請求
項６、８、１３、１５のいずれかに記載の光学的文字読
み取り装置。
【請求項２２】前記端点・交点抽出手段が、前記背景
情報算出手段から出力された垂直及び水平方向の各ライ
ンの背景情報に基づき文字パターンの端点及び交点の候
補を抽出する端点・交点候補抽出手段と、前記抽出され
た端点及び交点候補の個々の位置関係を比較することに
より不適切な端点及び交点候補を除去して適切な端点及
び交点を抽出する端点・交点判定手段とを備えたことを
特徴とする請求項２０または２１記載の光学的文字読み
取り装置。
【請求項２３】前記直線抽出手段が、前記背景情報算
出手段から出力された垂直及び水平方向の各ラインの背
景情報に基づき黒画素が予め定められた閾値よりも長く
連続する領域を抽出する黒画素連続領域抽出手段と、前
記黒画素連続領域抽出手段から出力された黒画素連続領
域に基づき垂直及び水平方向の直線候補を抽出する直線
候補抽出手段と、前記端点・交点抽出手段から出力され
た端点及び交点の位置情報に基づき前記直線候補抽出手
段から出力された直線候補の中から直線でないものを除
去し、残った直線候補の中から近傍の線との接続状態に
応じて種類を判定する直線判定手段とを備えたことを特
徴とする請求項２０または２１記載の光学的文字読み取
り装置。
【請求項２４】前記文字切り出し手段から出力された
文字パターンの外接矩形の大きさ、前記認識手段から出
力された少なくとも一つの類似度、前記背景情報算出手
段で算出した背景情報に基づく背景複雑度の中の少なく
とも一つに基づいて切り出しエラーを判定し、前記文字
切り出し手段に再切り出しの指示を与えるエラー判定手
段を備えたことを特徴とする請求項６、８、１３、１
５、２４のいずれかに記載の光学的文字読み取り装置。
【請求項２５】前記認識手段で算出されたカテゴリ類
似度の大きい方から２つのカテゴリ類似度を選択し、２
番目の類似度と最大類似度の比の値が予め設定されてい
る閾値ａより大きいか、または最大類似度が予め設定さ
れている閾値ｂより小さいか、または前記背景情報算出
手段で算出した背景情報に基づく背景複雑度が予め設定
されている閾値ｃより大きい場合にリジェクト信号を出
力し、それ以外の場合は認識結果として最大類似度のカ
テゴリを出力する第１の認識結果算出手段を備えたこと
を特徴とする請求項６、８、１３、１５、２４のいずれ
かに記載の光学的文字読み取り装置。
【請求項２６】複数の文字パターンに対して、予め大
きい方から２番目の類似度と最大類似度の比、最大類似
度、前記背景情報算出手段で算出した背景情報に基づく
背景複雑度、前記認識手段が出力する認識結果を算出
し、前記類似度比と前記最大類似度と前記背景複雑度の
少なくとも１つを入力とし、前記認識結果が不正解の場
合は、リジェクト信号を出力し、正解の場合はリジェク
ト信号を出力しないように予め学習させた階層型ニュー
ラルネットワークで構成した第２の認識結果算出手段を
備えたことを特徴とする請求項６、８、１３、１５、２
４のいずれかに記載の光学的文字読み取り装置。
【請求項２７】枠罫線と文字を含む帳票を光電的に読
み取って２値画像に変換し、前記２値画像を画像メモリ
に記憶し、前記２値画像から枠罫線を抽出し、前記抽出
された枠罫線から前記帳票の特徴を表わす枠構造特徴を
抽出し、予め個々の帳票の枠構造特徴およびこの枠構造
特徴を有する帳票に記載される少なくとも１つの候補文
字列を登録する枠構造参照テーブルを参照し、前記枠構
造特徴を照合することにより前記帳票の種別をおおまか
に分類し、前記帳票内の文字読取対象領域を検出し、前
記文字読取対象領域に基づき、前記画像メモリから文字
領域を切り出し、切り出された文字を認識し、少なくと
も１つの認識結果と前記枠構造参照テーブルに登録され
た候補文字列とを照合し、最終認識結果とすることを特
徴とする光学的文字読み取り方法。
【請求項２８】枠罫線と文字を含む帳票を光電的に読
み取って２値画像に変換する画像入力手段と、前記２値
画像を記憶する画像メモリと、前記２値画像から枠罫線
を抽出する枠罫線抽出手段と、前記抽出された枠罫線か
ら前記帳票の特徴を表わす枠構造特徴を抽出する枠構造
特徴抽出手段と、予め個々の帳票の枠構造特徴およびこ
の枠構造特徴を有する帳票に記載される少なくとも１つ
の候補文字列を登録する枠構造参照テーブルと、前記枠
構造参照テーブルを参照し、前記枠構造特徴を照合する
ことにより前記帳票の種別をおおまかに分類し、前記帳
票内の文字読取対象領域を検出する枠構造照合手段と、
前記文字読取対象領域に基づき、前記画像メモリから文
字領域を切り出す文字切り出し手段と、切り出された文
字を認識する文字認識手段とを備えた光学的文字読み取
り装置。
【請求項２９】前記文字認識手段より出力される少な
くとも１つの認識結果と前記枠構造参照テーブルに登録
された候補文字列とを照合し、最終認識結果とする後処
理手段を備えた請求項２８記載の光学的文字読み取り装
置。
【請求項３０】搬送されてくる帳票に記載された文字
列を請求項２８または２９記載の帳票文書認識装置によ
り認識する帳票文書認識手段と、前記帳票文書認識手段
により認識された文字列を識別コード変換テーブルを参
照し、識別コードに変換する識別コード変換手段と、前
記識別コードを前記帳票上に印字する識別コード印字手
段と、前記識別コードに従って前記帳票を処理する処理
手段とを備えた光学的文字読み取り装置。
【請求項３１】前記識別コードに代えて、または前記
識別コードとともに、前記識別コードに対応するバーコ
ードを印字する手段を備えた請求項３０記載の光学的文
字読み取り装置。