JP2000113110A - 光学的文字読み取り装置 - Google Patents

光学的文字読み取り装置

Info

Publication number
JP2000113110A
JP2000113110A JP10278779A JP27877998A JP2000113110A JP 2000113110 A JP2000113110 A JP 2000113110A JP 10278779 A JP10278779 A JP 10278779A JP 27877998 A JP27877998 A JP 27877998A JP 2000113110 A JP2000113110 A JP 2000113110A
Authority
JP
Japan
Prior art keywords
unit
character
background
output
category
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10278779A
Other languages
English (en)
Inventor
Keiichi Miyazaki
崎 桂 一 宮
Toshiyuki Koda
田 敏 行 香
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP10278779A priority Critical patent/JP2000113110A/ja
Publication of JP2000113110A publication Critical patent/JP2000113110A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 辞書作成の効率化と類似カテゴリの認識性能
を向上させる。 【解決手段】 統計的特徴と構造的特徴共通の基本特徴
を抽出する基本特徴抽出部2と、統計的特徴を抽出する
統計的特徴抽出部3と、統計的特徴に基づく認識を実行
する第1の認識部4と、第1の認識部の認識傾向に応じ
て類似カテゴリの分離特徴を中心に抽出する第1の構造
的特徴抽出部5と、手書きと活字を分離する字種判定部
6と、第1の認識部4の認識結果に応じて適切な構造的
特徴を用いて最終的なカテゴリ判断を行う第1の構造識
別部7とを設ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、帳票あるいは文書上の
手書き文字や印刷文字を読み取る光学的文字読み取り装
置に関するものである。
【0002】
【従来の技術】従来の光学的文字読み取り装置における
類似度算出方式としては、距離尺度に基づく類似度算出
法が一般的である。距離尺度は、大きく分けるとパター
ンベクトルの個々の次元に着目した距離尺度と、次元全
体の分布を考慮した距離尺度とに分類され、電子情報通
信学会論文誌D−IIVol.J79-D-II No.1 pp.45 - 52「改
良型マハラノビス距離を用いた高精度な手書き文字認
識」に示されているように、後者の次元全体の分布を考
慮した距離尺度に基づく類似度算出方式の方が有効であ
ることが知られている。中でも、複合類似度法は、既に
実用化された一般的な類似度算出方式の1つである。
【0003】複合類似度法の類似度算出方式は、ある1
つの文字カテゴリについて、それに含まれる学習用文字
パターンが作り出すパターン空間内の分布について主成
分分析を行い、その主成分として得られるN個の固有ベ
クトルψi(i =1,2,...,N)をそのカテゴリ
の辞書として、以下で定義される複合類似度Sに基づい
て入力文字パターンベクトルfに対する類似度を算出す
る。
【0004】
【数1】 ここで、λi は、固有値である。認識結果としては、大
きい方から2番目の類似度と最大類似度の比の大きさに
より、リジェクトの有無を判定し、リジェクト出ない場
合は、最大類似度のカテゴリを認識結果とするのが一般
的である。
【0005】従来の光学的文字読み取り装置における構
造特徴を用いた認識方式としては、東芝レビュー、Vol.
41, No.12, pp.1012-1015(1986)「自由手書き文字認
識」に示されている輪郭構造マッチング方が知られてい
る。この方式によれば、8方向にコード化されたフリー
マン・コード・チェインを最初の段階の特徴量として抽
出し、平滑化後曲率により分割される。分割された部分
輪郭はセグメントと呼ばれ凸、直線、凹の三種類に分類
され、各セグメントには、長さ、曲率、位置、方向等の
属性情報が与えられる。一方、辞書には同様の輪郭セグ
メントのシーケンスが記述されており、これらには前記
属性情報に関して、その値の上限、下限の値がセットさ
れている。入力パターンと辞書に記述されている属性情
報を比較することにより、入力パターンのセグメントと
辞書セグメントの対応関係を調べ認識が実行される。
【0006】
【発明が解決しようとする課題】しかしながら、従来の
光学的文字読み取り装置では、主成分分析によって得ら
れた統計的特徴のみを用いているために人間の認識特性
とのずれが生じ、文字形状の構造的な相違点を反映でき
ないため、人間には容易に分離できる類似カテゴリが、
統計的特徴を用いた認識方法では分離が困難であるとい
う課題があった。また、構造的特徴のみを用いる認識方
法では、辞書作成の効率が悪いという課題があった。
【0007】また、枠線(非ドロップアウト)を有する
帳票等に書かれた文字を対象にする場合、文字が枠線と
接触または、枠をはみ出し・金額等の訂正により、枠線
の1部が文字に結合したり、文字の一部がかけたり、訂
正部分や訂正印の一部が文字として切り出されるなどの
文字切りだしエラーが発生しやすく、それらのパターン
を認識し類似度の比のみでリジェクトを判定するとリジ
ェクトされずに、誤読となることが多いと言う課題もあ
った。
【0008】本発明は、上記従来の問題点に鑑み、辞書
作成の効率化と、類似カテゴリの分離能力すなわち認識
性能を向上させることのできる光学的文字読み取り装置
を提供することを目的とする。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、基本特徴抽出部において統計的特徴と構
造的特徴の両方に利用できるような基本特徴を抽出して
構成の共通化を図り、第1の構造的特徴抽出部では第1
の認識部で識別が困難な類似カテゴリを分離するのに有
効な構造的特徴を中心に限定して抽出することにより、
辞書作成を効率化し、統計的特徴を用いた第1の認識部
の認識結果に基づいて、第1の構造認識部において類似
カテゴリの分離に必要な特徴を選択して最終的なカテゴ
リの決定を行うことにより、効率的な処理と類似カテゴ
リの認識性能の向上の両方を可能にしたものである。
【0010】
【発明の実施の形態】本発明の請求項1に記載の発明
は、光電変換された文字枠線を含む文字列データに対し
て、文字枠線と文字列パターンを分離し、分離された文
字列パターンから個々の文字パターンを切り出し、個々
の文字パターンに対する外接矩形の大きさと外接矩形に
囲まれた切り出し文字画像を出力する第1の文字切り出
し部と、前記文字切り出し部で切り出された個々の切り
出し文字画像に対する輪郭情報と背景構造情報を求める
基本特徴抽出部と、 前記基本特徴抽出部から出力され
る輪郭方向成分と背景距離に基づいて少なくとも一種類
の統計的特徴量を求める統計的特徴抽出部と、前記統計
的特徴抽出部から出力される統計的特徴量から切り出し
文字画像の各カテゴリに対する類似度を求め、類似度の
大きい順に複数のカテゴリの類似度と少なくとも一つ以
上のカテゴリを出力する第1の認識部と、前記基本特徴
抽出部から出力される基本特徴に基づいて少なくとも一
種類の構造的特徴を求める第1の構造的特徴抽出部と、
前記第1の文字切り出し部から出力された文字パターン
に対する外接矩形の大きさと前記第1の認識部で判定さ
れたカテゴリと前記字種判定部から出力される字種判定
結果と前記第1の構造的特徴抽出部から出力される構造
的特徴に基づいて最終的な文字パターンの属するカテゴ
リを判定する第1の構造識別部とを備えたものである。
【0011】以上の構成により、基本特徴抽出部では統
計的特徴と構造的特徴の両方に利用できるような基本特
徴を抽出することにより構成の共通化が可能になり、ま
た第1の構造的特徴抽出部では第1の認識部では識別が
困難な類似カテゴリの分離に有効な構造的特徴を中心に
抽出することにより処理の効率化が可能になり、統計的
特徴を用いて識別を行う第1の認識部から出力された認
識結果に基づいて、第1の構造識別部において必要な構
造的特徴を選択し最終的なカテゴリを決定することによ
って更なる処理の効率化と類似カテゴリの認識性能の向
上が可能になるという作用を有する。
【0012】本発明の請求項2に記載の発明は、請求項
1記載の発明において、基本特徴抽出部を、前記第1の
文字切り出し部から出力される切り出し画像中の文字パ
ターンの輪郭点を抽出する輪郭点抽出部と、前記輪郭点
抽出部から出力された個々の輪郭点の隣接関係から画素
単位の輪郭方向成分を算出する輪郭方向算出部と、前記
輪郭点抽出部から出力された輪郭点の位置に基づいて文
字パターンの外接矩形の各々の辺から文字パターンまで
の背景距離を求める背景距離算出部と、前記第1の文字
切り出し部から出力された切り出し画像を水平及び垂直
方向のライン毎に走査し、一定画素以上連続する白画素
の連続(背景)する長さ・位置情報とその背景の走査方
向に沿った発生順番である背景次数を算出する背景情報
算出部とで構成した光学的文字読み取り装置である。
【0013】以上の構成により、輪郭方向算出部におけ
る輪郭方向成分の算出、背景距離算出部における外接矩
形の各々の辺から文字パターンまでの背景距離の算出、
背景情報算出部における背景情報算出のための共通の前
処理として輪郭点抽出部で文字パターンの輪郭点を抽出
することにより、基本特徴抽出の効率が向上する。ま
た、基本特徴として輪郭点、輪郭方向成分、背景距離、
背景情報を抽出する事により統計的特徴だけでなく、文
字構造を反映した構造特徴量にも流用が可能になり特徴
抽出処理の効率化が図れるという作用を有する。
【0014】本発明の請求項3に記載の発明は、請求項
1記載の発明において、統計的特徴抽出部を、第1の文
字切り出し部から出力された切り出し画像を水平・垂直
両方向で複数のブロックに分割する両方向ブロック分割
部と、前記両方向ブロック分割部で分割したブロック単
位で、前記基本特徴抽出部の輪郭方向算出部から出力さ
れた輪郭方向成分について輪郭方向毎の個数を集計する
輪郭方向集計部と、輪郭方向集計部から出力されたブロ
ック単位の輪郭方向毎の輪郭方向成分の個数をブロック
の大きさで割ることで得られる輪郭方向毎の輪郭統計特
徴量を求める輪郭方向正規化部と、第1の文字切り出し
部から出力された切り出し画像を水平方向で複数のブロ
ックに分割する水平方向ブロック分割部と、第1の文字
切り出し部から出力された切り出し画像を垂直方向で複
数のブロックに分割する垂直方向ブロック分割部と、基
本特徴抽出部2から経路13を経由して出力した輪郭方
向成分に基づいて、前記水平方向ブロック分割部及び垂
直方向ブロック分割部で分割したブロック単位で、ブロ
ック分割境界線に垂直な外接矩形の辺からブロック分割
境界線に平行方向に走査して最初に存在する文字パター
ンを構成する画素の輪郭方向毎の輪郭方向成分の個数で
ある外郭方向成分の個数を集計する外郭方向集計部と、
外郭方向集計部から出力されたブロック単位の輪郭方向
毎の外郭方向成分の個数をブロックの大きさで割ること
で得られる輪郭方向毎の外郭統計特徴量を求める外郭方
向正規化部と、前記基本特徴抽出部の背景距離算出部か
ら出力された背景距離に基づいて、前記水平方向ブロッ
ク分割部及び垂直方向ブロック分割部で分割したブロッ
ク単位でブロック分割方向の背景距離を合計する背景距
離合計部と、背景距離集計部から出力されたブロック単
位の集計背景距離をブロックの大きさで割ることで得ら
れる背景距離特徴量を求める背景距離正規化部とで構成
した光学的文字読み取り装置である。
【0015】以上の構成により、両方向ブロック分割
部、水平方向ブロック分割部及び垂直方向ブロック分割
部によって文字パターンを複数のブロックに分割し、輪
郭方向集計部、外郭方向集計部及び背景距離集計部で各
々のブロック全体の特徴量を加算集計することにより、
基本特徴抽出部で抽出した基本特徴からブロックの統計
的特徴を抽出することでき、さらに輪郭方向正規化部、
外郭方向正規化部、及び背景距離正規化部でブロックの
統計的特徴を正規化することにより、認識対象の変化に
影響されにくい特徴を抽出できるという作用を有する。
【0016】本発明の請求項4に記載の発明は、請求項
1記載の発明において、第1の構造的特徴抽出部を、前
記基本特徴抽出部の背景距離算出部から出力された背景
距離に基づいて局所的な背景距離特徴を抽出する局所背
景特徴抽出部と、前記基本特徴抽出部の輪郭方向算出部
から出力された輪郭方向成分に基づいて局所的なストロ
ーク方向の変化を抽出する局所ストローク形状抽出部
と、前記第1の文字切り出し部から出力された切り出し
画像と前記基本特徴抽出部の輪郭方向算出部から出力さ
れた輪郭方向成分に基づいて文字パターンのループを抽
出するループ抽出部と、前記基本特徴抽出部の背景情報
算出部で算出した背景情報から、背景次数毎に隣接する
背景画素の塊を背景ブロックとして求めると共に、その
大きさ情報と位置情報を算出する背景ブロック抽出部
と、前記基本特徴抽出部の背景情報算出部で算出した背
景情報から、隣接する白画素の塊を背景ラベルとして求
めラベル番号を付与すると共に、その大きさ、位置、そ
の背景ラベルが外接矩形のどの辺と接するかを表わすラ
ベル情報を算出する背景ラベル抽出部とで構成した光学
的文字読み取り装置である。
【0017】以上の構成により、局所背景特徴抽出部に
おいて特定のカテゴリ間の識別に有効である背景部の部
分的な凹凸情報を抽出し、局所ストローク形状抽出部に
おいて普遍性の高い類似カテゴリ間のストロークの屈曲
方向や直線性の相違を抽出し、ループ抽出部において普
遍性の高い特徴であるストロークのループ数を抽出し、
背景ブロック抽出部において文字背景部の構造を抽出
し、背景ラベル抽出部において文字背景部の大きさ、外
接矩形との位置関係を抽出することにより、文字の構造
的な特徴をより明示的に表す構造的特徴の抽出が可能
で、それを用いることで統計的特徴量のみを利用する識
別方法では識別が困難な類似カテゴリ間の認識性能の向
上が可能であるという作用を有する。
【0018】本発明の請求項5に記載の発明は、請求項
1記載の発明において、第1の構造的特徴抽出部を、前
記基本特徴抽出部の背景距離算出部から出力された背景
距離に基づいて局所的な背景距離特徴を抽出する局所背
景特徴抽出部と、前記基本特徴抽出部の輪郭方向算出部
から出力された輪郭方向成分に基づいて局所的なストロ
ーク方向の変化を抽出する局所ストローク形状抽出部
と、前記基本特徴抽出部の背景情報算出部で算出した背
景情報から、背景次数毎に隣接する背景画素の塊を背景
ブロックとして求めると共に、その大きさ情報と位置情
報を算出する背景ブロック抽出部と、前記基本特徴抽出
部の背景情報算出部で算出した背景情報から、隣接する
白画素の塊を背景ラベルとして求めラベル番号を付与す
ると共に、その大きさ、位置、その背景ラベルが外接矩
形のどの辺と接するかを表わすラベル情報を算出する背
景ラベル抽出部と、前記背景ラベル抽出部で算出したラ
ベル情報に基づいて文字パターンのループを抽出する第
2のループ抽出部とで構成した光学的文字読み取り装置
である。
【0019】以上の構成により、局所背景特徴抽出部に
おいて特定のカテゴリ間の識別に有効である背景部の部
分的な凹凸情報を抽出し、局所ストローク形状抽出部に
おいて普遍性の高い類似カテゴリ間のストロークの屈曲
方向や直線性の相違を抽出し、背景ブロック抽出部にお
いて文字背景部の構造を抽出し、背景ラベル抽出部にお
いて文字背景部の大きさ、外接矩形との位置関係を抽出
し、第2のループ抽出部において普遍性の高い特徴であ
るストロークのループ数を抽出することにより、文字の
構造的な特徴をより明示的に表す構造的特徴の抽出が可
能で、それを用いることで統計的特徴量のみを利用する
識別方法では識別が困難な類似カテゴリ間の認識性能の
向上が可能であるという作用を有する。また、ループ数
をラベル情報のみに基づいて抽出することにより、処理
の効率化が図れるという作用を有する。
【0020】本発明の請求項6に記載の発明は、請求項
1または5記載の発明において、前記第1の文字切り出
し部から出力された外接矩形の大きさから手書きまたは
活字の字種判定を行う字種判定部とを備え、第1の構造
識別部を、字種判定部で活字と判定された文字に対し
て、第1の文字切り出し部から出力された文字パターン
に対する外接矩形の大きさと第1の構造的特徴抽出部か
ら出力された構造的特徴に基づいて個々の文字パターン
が属するカテゴリを判定する第1の活字処理部と、字種
判定部で手書きと判定された文字に対して、第1の文字
切り出し部から出力された文字パターンに対する外接矩
形の大きさと第1の構造的特徴抽出部から出力された構
造的特徴に基づいて個々の文字パターンが属するカテゴ
リを判定する第1の手書き処理部とで構成した光学的文
字読み取り装置である。
【0021】以上の構成により、字種判定部で判定した
字種に応じて第1の手書き処理部または第1の活字処理
部を選択して専門化処理を実行することにより、字形が
大きく異なる手書き・活字のそれぞれに適した構造的特
徴が利用可能になり、類似カテゴリ間の認識性能が向上
するという作用を有する。
【0022】本発明の請求項7に記載の発明は、請求項
6記載の発明において、第1の活字処理部を、第1の文
字切り出し部から出力された外接矩形の大きさと第1の
認識部4から出力されたカテゴリに基づいて一部のカテ
ゴリに対する最終的なカテゴリ判定を行う外接矩形カテ
ゴリ判定部と、外接矩形カテゴリ判定部で判定できない
文字に対して第1の認識部から出力されたカテゴリに基
づいて第1の構造的特徴抽出部から出力された複数の構
造的特徴の中で有効な構造的特徴を選択する第1の認識
部依存特徴選択部と、第1の認識部依存特徴選択部で選
択された構造的特徴に基づいてカテゴリ判定を行う第1
の選択構造的特徴識別部とで構成した光学的文字読み取
り装置である。
【0023】以上の構成により、外接矩形カテゴリ判定
部で外接矩形の大きさだけで判別可能なカテゴリを最初
に判定することで効率的にカテゴリを分離し、第1の認
識部依存特徴選択部で第1の認識部の結果に応じて類似
カテゴリ分離に必要な構造的特徴を選択して、第1の選
択構造的特徴識別部で選択した構造的特徴に応じた最終
カテゴリ判断を行うことで効率的かつ効果的な類似カテ
ゴリ分離が可能であるという作用を有する。
【0024】本発明の請求項8に記載の発明は、請求項
6記載の発明において、第1の手書き処理部を、第1の
文字切り出し部から出力された外接矩形の大きさと第1
の認識部4から出力されたカテゴリに基づいて第1の構
造的特徴抽出部から出力された複数の構造的特徴の中で
有効な構造的特徴を選択する第2の認識部依存特徴選択
部と、第2の認識部依存特徴選択部で選択された構造的
特徴に基づいてカテゴリ判定を行う第2の選択構造的特
徴識別部とで構成した光学的文字読み取り装置である。
【0025】以上の構成により、第2の認識部依存特徴
選択部で第1の認識部の結果に応じて類似カテゴリ分離
に必要な構造的特徴を選択して、第2の選択構造的特徴
識別部で選択した構造的特徴に応じた最終カテゴリ判断
を行うことで効率的かつ効果的な類似カテゴリ分離が可
能であるという作用を有する。
【0026】本発明の請求項9に記載の発明は、請求項
1または5記載の発明において、前記算出されたカテゴ
リ類似度の大きい方から2つのカテゴリ類似度を選択
し、2番目の類似度と最大類似度の比の値が予め設定さ
れているしきい値1より大きいかまたは、最大類似度が
予め設定されているしきい値2より小さい場合にリジェ
クト信号を出力し、それ以外の場合は第1段階の認識結
果として最大類似度のカテゴリを出力する第1の認識結
果算出部を備えた光学的文字読み取り装置であるる。
【0027】以上の構成により、最大類似度の大きさも
リジェクト判定に利用する事により、類似度の比だけで
はリジェクト困難な前処理エラー文字を効率よくリジェ
クトできるという作用を有する。
【0028】本発明の請求項10に記載の発明は、請求
項1または5記載の発明において、複数の文字パターン
に対して、予め大きい方から2番目の類似度と最大類似
度の比、最大類似度、前記背景情報算出部で算出した背
景情報に基づく背景複雑度、前記第1の認識部が出力す
る認識結果を算出し、その類似度比と最も大きい類似度
と背景複雑度の少なくとも1つを入力とし、前記認識結
果が不正解の場合は、リジェクト信号を出力し、正解の
場合はリジェクト信号を出力しないように予め学習させ
た階層型ニューラルネットワークで構成した第2の認識
結果算出部を備えた光学的文字読み取り装置である。
【0029】以上の構成により、類似度の比と最大類似
度と背景複雑度の少なくとも1つを軸とした空間上での
リジェクト領域と非リジェクト領域の非線形な境界を、
予め階層型ニューラルネットワークに学習させてあるの
で、より高精度なリジェクト判定処理が可能になるとい
う作用を有する。
【0030】(実施の形態1)以下、本発明の第1の実
施の形態を図面に基づいて説明する。図1は本発明の第
1の実施の形態における光学的文字読取装置のブロック
図を示すものである。図1において、1は第1の文字切
り出し部で、文字枠線を含む文字列データを入力して、
文字枠線と文字列パターンを分離し、分離された文字列
パターンから個々の文字パターンを切り出し、個々の文
字パターンに対する外接矩形の大きさを経路11を経由
して出力し、切り出し文字画像を経路12を経由して出
力する。2は基本特徴抽出部(図2参照)で、第1の文
字切り出し部1から経路12を経由して出力された各文
字の切り出し画像に基づいて、文字パターンの輪郭方向
成分、外接矩形の各辺から文字パターンまでの背景距
離、水平及び垂直ライン毎の文字部以外の白画素の連続
である背景情報を求め、輪郭方向成分を経路13、背景
距離を経路14、背景情報経路15を経由して出力して
出力する。3は統計的特徴抽出部(図3参照)で、第1
の文字切り出し部1から経路12を経由して出力した文
字パターンの切り出し画像と、基本特徴抽出部2から経
路13を経由して出力した輪郭方向成分及び経路14を
経由して出力した背景距離に基づいて統計的特徴量を求
める。4は第1の認識部で、統計的特徴抽出部3から出
力した統計的特徴量に基づいて、文字パターンの各カテ
ゴリに対する類似度を求め、類似度の大きい順に複数の
カテゴリ類似度と少なくとの1つのカテゴリを出力す
る。5は第1の構造的特徴抽出部(図4参照)で、基本
特徴抽出部2から経路13を経由して出力した輪郭方向
成分、経路14を経由して出力した背景距離、経路15
を経由して出力した背景情報に基づいて、構造的特徴を
求める。6は字種判定部で、第1の文字切り出し部から
経路12を経由して出力した外接矩形の大きさに基づい
て、字種が手書きか活字であるかを判定する。7は第1
の構造識別部(図5参照)で、第1の文字切り出し部1
から出力された文字パターンの外接矩形の大きさ、第1
の認識部4から出力したカテゴリ、第1の構造的特徴抽
出部5から出力した構造的特徴、及び字種判定部6から
出力した字種判定結果に基づいて文字パターンの属する
最終的なカテゴリを決定する。
【0031】図2は基本特徴抽出部2の構成を具体的に
示すブロック図である。図2において、21は輪郭点抽
出部で、第1の文字切り出し部1から経路12を経由し
て出力した切り出し画像から文字パターンの輪郭点を抽
出する。22は輪郭方向算出部で、輪郭点抽出部21か
ら出力した文字パターンの輪郭点の隣接関係に基づいて
各輪郭点の輪郭方向成分を求める。23は背景距離算出
部で、輪郭点抽出部21から出力した文字パターンの輪
郭点の位置に基づいて文字パターンの外接矩形の各辺か
ら文字パターンまでの背景距離を求める。24は背景情
報算出部で、郭点抽出部21から出力した文字パターン
の輪郭点の位置に基づいて、水平及び垂直方向のライン
毎に一定画素以上連続する白画素の連続(背景)する長
さ・位置情報とその背景の走査方向に沿った発生順番で
ある背景次数を算出する。
【0032】図3は統計的特徴抽出部3の構成を具体的
に示すブロック図である。図3において、31は両方向
ブロック分割部で、第1の文字切り出し部1から経路1
1を経由して出力した切り出し画像に基づいて切り出し
領域全体を水平・垂直の両方向で分割する。32は水平
方向ブロック分割部で、第1の文字切り出し部1から経
路11を経由して出力した切り出し画像に基づいて切り
出し領域を水平方向で分割する。33は垂直方向ブロッ
ク分割部で、第1の文字切り出し部1から経路11を経
由して出力した切り出し画像に基づいて切り出し領域を
垂直方向で分割する。34は輪郭方向集計部で、両方向
ブロック分割部31で分割したブロック毎かつ輪郭方向
毎に、基本特徴抽出部2から経路13を経由して出力し
た各画素の輪郭方向成分の個数を集計する。35は輪郭
方向正規化部で、両方向ブロック分割部31で分割した
ブロック毎に、輪郭方向集計部34でブロック内で集計
した輪郭方向成分をブロックの大きさで割って正規化し
て、統計的輪郭方向統計量を求める。36は外郭方向集
計部で、水平方向ブロック分割部32で分割したブロッ
ク毎と垂直方向ブロック分割部33で分割したブロック
毎の両方について、ブロック分割境界線に垂直な外接矩
形の辺から、基本特徴抽出部2から経路13を経由して
出力した輪郭方向成分の中で、ブロック分割境界線に平
行に走査して最初に存在する文字パターン画素の輪郭方
向成分毎の輪郭方向成分の個数を集計する。37は外郭
方向正規化部で、水平方向ブロック分割部32で分割し
たブロック毎と垂直方向ブロック分割部33で分割した
ブロック毎の両方について、外郭方向集計部36で集計
した輪郭方向成分(外郭方向成分)をブロックの大きさ
で割って正規化して、統計的外郭方向統計量を求める。
38は背景距離集計部で、水平方向ブロック分割部32
で分割した各々のブロックの、ブロック分割境界線に垂
直な外接矩形の各々の辺と垂直方向ブロック分割部33
で分割した各々のブロックのブロック分割境界線に垂直
な外接矩形の各々の辺について、基本特徴抽出部2から
経路14を経由して出力した背景距離の中で、前記外接
矩形の各々の辺からブロック分割境界線に平行な方向に
計測した背景距離を選択して集計する。39は背景距離
正規化部で、背景距離集計部38で集計した背景距離を
ブロック境界線に垂直な外接矩形の辺の長さで割って正
規化して、統計的背景距離特徴を求める。
【0033】図4は第1の構造的特徴抽出部5の構成を
具体的に示すブロック図である。図4において、41は
局所背景特徴抽出部で、基本特徴抽出部2から経路13
を経由して出力した背景距離に基づいて、類似カテゴリ
を識別するための局所的な背景距離の変化と距離の相違
を抽出する。42は局所ストローク形状抽出部で、基本
特徴抽出部2から経路14を経由して出力した輪郭方向
成分に基づいて、類似カテゴリを識別するための局所的
なストロークの傾きの変化を抽出する。43はループ抽
出部で、第1の文字切り出し部1から出力した切り出し
画像と基本特徴抽出部2から経路14を経由して出力し
た輪郭方向成分に基づいて、文字パターンのストローク
によって発生するループを抽出する。44は背景ブロッ
ク抽出部で、前記基本特徴抽出部2の背景情報算出部2
4で算出し経路15を経由して出力した背景情報に基づ
いて、背景次数毎に隣接する背景画素の塊を背景ブロッ
クとして求めると共に、その大きさ情報と位置情報を算
出する。45は背景ラベル抽出部で、前記基本特徴抽出
部2の背景情報算出部24で算出し経路15を経由して
出力した背景情報に基づいて、隣接する白画素の塊を背
景ラベルとして求めラベル番号を付与すると共に、その
大きさ、位置、その背景ラベルが外接矩形のどの辺と接
するかを表わすラベル情報を算出する。
【0034】図5は第1の構造判定部7の構成を具体的
に示すブロック図である。図5において、51は第1の
活字処理部(図6参照)で、字種判定部6において文字
パターンが活字と判定された場合に、第1の文字切り出
し部から出力された文字パターンに対する外接矩形の大
きさと第1の認識部4で判定したカテゴリに基づいて第
1の構造的特徴抽出部5で抽出した構造的特徴を選択し
て最終的なカテゴリを判定する。52は第1の手書き処
理部( 図7参照)で、字種判定部6において文字パター
ンが手書きと判定された場合に、第1の文字切り出し部
から出力された文字パターンに対する外接矩形の大きさ
と第1の第1の認識部4で判定したカテゴリに基づいて
第1の構造的特徴抽出部5で抽出した構造的特徴を選択
して最終的なカテゴリを判定する。
【0035】図6は第1の活字処理部51の構成を具体
的に示すブロック図である。図6において、61は外接
矩形カテゴリ判定部で、第1の文字切り出し部から出力
された外接矩形の大きさによってある1つのカテゴリに
判定できる可能性が高い場合に、前記カテゴリが第1の
認識部4から出力されたカテゴリの中に含まれている場
合は、前記カテゴリに決定する。62は第1の認識部依
存特徴選択部で、外接矩形カテゴリ判定部でカテゴリ判
定できなかった文字に対して、第1の認識部4から出力
されたカテゴリに基づいて第1の構造的特徴抽出部5か
ら出力された複数の構造的特徴の中で有効な構造的特徴
を選択する。63は第1の選択構造的特徴識別部で、第
1の認識部依存特徴選択部62で選択した構造的特徴を
利用して最終的なカテゴリ判定を行う。
【0036】図7は第1の手書き処理部52の構成を具
体的に示すブロック図である。図7において、71は第
2の認識部依存特徴選択部で、第1の認識部4から出力
されたカテゴリに基づいて第1の構造的特徴抽出部5か
ら出力された複数の構造的特徴の中で有効な構造的特徴
を選択する。72は第2の選択構造的特徴識別部で、第
2の認識部依存特徴選択部71で選択した構造的特徴を
利用して最終的なカテゴリ判定を行う。
【0037】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。以下では、
認識対象が主に数字の場合について説明しているが、実
際の認識対象は数字以外の文字でも構わない。
【0038】まず、第1の文字切り出し部1では、図8
に示すように、複数の枠線と文字文字列データで構成さ
れる多値の原画像において、枠線と文字列を分離し文字
列を抽出した後、1文字単位に切り出し、各文字の外接
矩形で囲まれた切り出し画像と外接矩形の幅と高さを求
め、外接矩形の幅と高さを経路11を経由して出力し、
白黒に2値化した切り出し画像を経路12を経由して出
力する。
【0039】基本特徴抽出部2の輪郭点抽出部21で
は、図9に示すように、第1の文字切り出し部1から出
力した切り出し文字画像から輪郭点を抽出し、輪郭画像
を求める。具体的な輪郭点抽出方法としては、任意の黒
画素に対して縦横斜方向に隣接する画素が全て黒の場合
に、前記任意の黒画素を白に置換し、最終的に残った黒
画素を輪郭点とする方法がある。
【0040】輪郭方向算出部22では、輪郭方向を図1
0のように符号化して、輪郭点抽出部21で抽出した輪
郭画像に対して、図11に示すようなマスクパターンと
のマッチングによって中心画素の輪郭点の方向を決定す
る。例えば、図11(a)、(b)の3×3マスクにお
いて灰色で示した画素は白画素もしくは黒画素のどちら
でも構わず、その他の白や黒で示した画素は必ず同一の
色にマッチングする必要があるマッチング方法では、輪
郭画像の任意の3×3領域で図11(a)の3×3マス
クと同一のパターンが存在する場合は、前記3×3領域
の中央画素を7に符号化し、図11(b)と同一の場合
は、4に符号化する。なお、輪郭方向の符号化数は8以
外でも良く、4や16でも構わない。また、輪郭方向を
決定するパターンマッチングのマスクの大きさも3×3
以外でも良く、輪郭方向の符号化数に応じて2×2や5
×5でも構わない。
【0041】背景距離算出部23では、輪郭点抽出部2
1で抽出した輪郭画像に対して、図12(a)に示すよ
うに外接矩形の左辺の地点を原点として、画像の各行に
ついて右方向に走査して最初に発見される輪郭画素まで
の距離と、図12(b)に示すように外接矩形の右辺の
地点を原点として、画像の各行について左方向に走査し
て最初に発見される輪郭画素までの距離と、図12
(c)に示すように外接矩形の上辺の地点を原点とし
て、画像の各列について下方向に走査して最初に発見さ
れる輪郭画素までの距離と、図12(d)に示すように
外接矩形の下辺の地点を原点として、画像の各列につい
て上方向に走査して最初に発見される輪郭画素までの距
離を全て求める。
【0042】背景情報算出部24では、輪郭点抽出部2
1で抽出した輪郭画像に対して、図13に示すように外
接矩形の左辺から水平方向に走査し白画素の連続である
文字背景を検出する。ラインaの場合は、外接矩形左端
と文字輪郭輪郭点と外接矩形右端に挟まれる白画素の連
続をそれぞれ0次背景、1次背景とし、それぞれの連続
長(x、y)、位置情報としての開始点、終了点を算出
する。ラインbの場合のように、外接矩形端と輪郭点に
挟まれる領域については、白画素の連続が0であっても
背景と見なし、この場合背景次数は2(背景数は3)と
なる。
【0043】同様にして、水平方向の外接矩形右端から
の走査、垂直方向の外接矩形上・下端からの走査につい
ても同様である。ここで、輪郭点に挟まれる背景の検出
時に、一定以上白画素が連続する場合のみ背景と見なし
背景次数にカウントするという制限を設け背景のノイズ
除去を行っても良い。
【0044】次に統計距離特徴抽出部3の両方向ブロッ
ク分割部31では、第1の文字切り出し部1から入力さ
れる切り出し画像を複数の領域に分割する。具体的には
図14に示すように、重心分割を行って各領域に含まれ
る黒画素数が均等になるように水平・垂直方向に複数の
領域に分割する。なお、領域分割方法としては重心分割
以外でも良く、重心分割以外の不均等分割方法や均等分
割方法でも構わない。水平方向ブロック分割部32や垂
直方向ブロック分割部33でも同様の方法で分割を行
う。なお、両方向ブロック分割部31における水平方向
の分割位置と水平方向ブロック分割部32における分割
位置を同一にし、両方向ブロック分割部31における垂
直方向の分割位置と垂直方向ブロック分割部33におけ
る分割位置を同一にしても構わない。
【0045】輪郭方向集計部34では、基本特徴抽出部
2から経路13を経由して出力した輪郭方向成分につい
て、両方向ブロック分割部31で分割したブロック単位
かつ輪郭方向毎の個数を計算する。例えば図15(a)
の輪郭方向画像において、太線をブロック境界とし、そ
の中の各々の数字は各画素の輪郭方向成分の符号を表す
ものとすると、ブロック単位かつ輪郭方向毎に数を集計
した結果は図15(b)(e)のようになる。
【0046】輪郭方向正規化部35では、輪郭方向集計
部34で集計したブロック毎かつ輪郭方向毎の輪郭方向
成分の個数を、両方向ブロック分割部から出力した輪郭
方向集計対象のブロックの大きさで割って正規化して、
輪郭方向統計特徴量を求める。ブロックの大きさを表す
ものとしては、高さまたは幅のどちらか長い方や、高さ
と幅から求められる面積がある。なお、正規化の前に隣
接する輪郭方向成分の個数を重み付けして統合しても構
わない。
【0047】外郭方向集計部36では、基本特徴抽出部
2から経路13を経由して出力した輪郭方向成分につい
て、水平方向ブロック分割部32及び垂直方向ブロック
分割部33で分割したブロック毎に、ブロック分割境界
線に平行に走査して最初に存在する文字パターン画素の
輪郭方向成分(外郭方向成分)毎の輪郭方向成分の個数
を計算する。例えば水平方向ブロック分割部32で分割
された、あるブロックの輪郭方向画像である図16にお
いて、各々の数字は各画素の輪郭方向成分の符号を表す
ものとし、符号−は輪郭点でない画素とし、走査方向を
矢印の通り左端から右方向とすると、ブロック分割境界
線に平行に走査して最初に存在する文字パターン画素は
網掛けされた画素であり、前記網掛けされた画素全体の
輪郭方向成分(外郭方向成分)の個数を輪郭方向毎(例
では0〜3)に集計する。水平方向ブロック分割部で分
割されたブロックにおいては、左端から右方向と、右端
から左方向の二方向で走査し、垂直方向ブロック分割部
で分割されたブロックにおいては、上端から下方向と、
下端から上方向の二方向で走査する。
【0048】外郭方向正規化部37では、外郭方向集計
部36で集計したブロック毎かつ輪郭方向毎の外郭方向
成分の個数を、水平方向ブロック分割部32または垂直
方向ブロック分割部33から出力した外郭方向集計対象
のブロックの大きさで割って正規化して、外郭方向統計
特徴量を求める。
【0049】背景距離合計部38では、基本特徴抽出部
2から経路14を経由して出力した背景距離について、
水平方向ブロック分割部32で分割したブロックでは、
左端から右方向への背景距離の合計と、右端から左方向
への背景距離の合計を計算し、垂直方向ブロック分割部
33で分割したブロックでは、上端から下方向への背景
距離の合計と、下端から上方向への背景距離の合計を計
算する。
【0050】背景距離正規化部39では、背景距離合計
部38から出力したブロック毎の合計四方向の背景距離
の合計を、水平方向ブロック分割部32または垂直方向
ブロック分割部33から出力した外郭方向集計対象のブ
ロックの大きさで割って正規化して、背景距離統計特徴
量を求める。
【0051】次に第1の認識部4では、統計的特徴抽出
部3で求めた輪郭方向統計特徴量と外郭方向統計特徴量
と背景距離統計特徴量に基づいて、文字パターンが属す
るカテゴリを求める。図17では、学習完了後の階層型
ニューラルネットワークを用いて第1の認識部4を構成
する場合を示している。第1層のニューロンに輪郭方向
統計特徴量、外郭方向統計特徴量、及び背景距離統計特
徴量を入力し、中間層を経由して最終層へ信号を流すこ
とによって各々の最終層ニューロンから各カテゴリの類
似度に相当する出力信号が発生するようになっており、
出力信号の大きい方から、出力値とそのカテゴリが第1
の認識部4から出力される。図17の例では、出力カテ
ゴリ数を2とすると、左端の最終層ニューロン出力が最
大で、右端の最終層ニューロン出力が2番目であるた
め、第1の認識部4からは、それらの出力値とカテゴリ
(カテゴリ0、2)が出力される。なお、第1の認識部
4を図17以外の階層型ニューラルネットワークや、階
層型ニューラルネットワーク以外の統計的特徴量を利用
して識別カテゴリを出力できる認識手段で構成しても構
わない。
【0052】次に第1の構造的特徴抽出部5の局所特徴
抽出部41では、基本特徴抽出部2から経路13を経由
して出力した背景距離に基づいて、類似カテゴリを分離
するための局所的な特徴を求める。図18(a)では、
網掛け領域(中央領域)において外接矩形の左端から見
た背景距離の外接矩形幅に対する比率が第1の閾値より
大きくなる回数を計数し、最終的にその回数が第2の閾
値を超えた場合は、中央左背景が凸であると判定する。
類似カテゴリであるカテゴリ0、カテゴリ6、カテゴリ
8、カテゴリ9では中央左背景が凸であるとは通常は判
定されないため、中央左背景が凸であるという構造的特
徴はカテゴリ3の分離に有効である。同様の抽出方法を
用いることで、図18(b)では、カテゴリ6(及びカ
テゴリ5)有力な抽出材料である上部右背景の凸を判定
し、図18(c)では、カテゴリ9(及びカテゴリ5)
の有力な抽出材料である下部左背景の凸を判定すること
を示している。なお、実際の場合の凸背景の抽出領域・
方向は、第1の認識部4の誤りを分析して、その誤りを
減少するものを採用しても構わない。また、上記の方法
以外にも、例えば近傍の背景距離の変化の大きさから外
側ストロークの曲線性(直線性)を判定するという方法
があり、例えば図18(d)は背景距離の変化の大きさ
が一定に近いために、上部ストロークは直線として判定
され、図16(e)は背景距離の変化の大きさが場所に
よってかなり異なるため、上部ストロークは曲線として
判定されるので、カテゴリ5とカテゴリ6の分離に有効
な構造的特徴を抽出できる。また、第1の構造識別部7
で効果的なカテゴリ判定を行わせるために、抽出する構
造的特徴を手書き用、活字用、手書き・活字兼用に分け
ても構わない。
【0053】局所ストローク形状抽出部42では、基本
特徴抽出部2から経路14を経由して出力した輪郭方向
成分から、局所領域中の輪郭線を追跡して、追跡してい
る輪郭線上の輪郭方向成分の分布を調べることで、類似
カテゴリを分離するための局所的な構造的特徴を求め
る。図19は、中央網掛け領域中の輪郭線上の輪郭方向
成分から輪郭線を追跡して、輪郭線の形状が上に凸か下
に凸であるかを調べることで、カテゴリ6とカテゴリ8
の分離に有効な構造的特徴を抽出することを表してい
る。図19の例では、図19(a)のカテゴリ6では上
下輪郭線の形状は両方とも上に凸であり、図19(b)
のカテゴリ8では上の輪郭線の形状は下に凸であり、下
の輪郭線の形状は上に凸であると判定される。具体的な
輪郭線形状の判定方法の例としては、輪郭方向成分を表
す符号として図10の符号を用いると、局所領域の左側
で5、6、7、中央で0、1、7、右側で1、2、3の
輪郭方向成分符号が多く存在する場合は、輪郭線の形状
が上に凸であると判定し、左側で1、2、3、中央で
0、1、7、右側で5、6、7が多く存在する場合は、
輪郭線の形状が下に凸であると判定するという方法があ
る。
【0054】ループ抽出部43では、第1の文字切り出
し部1から出力した切り出し画像と基本特徴抽出部2か
ら経路14を経由して出力した輪郭方向成分に基づい
て、文字パターンのストロークによって発生するループ
を抽出する。具体的な抽出方法は、輪郭方向成分を持つ
画素から輪郭線を追跡して、最終的に追跡開始地点に戻
ったものを輪郭線ループとし、次に切り出し画像を参照
して、輪郭線ループの内部に白画素が存在すればストロ
ークのループとして抽出する。図20の例において、数
字は図10で示した輪郭方向成分符号、符号−は白画
素、符号+は黒画素とすると、図20(a)の網掛けさ
れた符号−がストロークのループとして抽出され、図2
0(b)は輪郭線ループの内側に符号−が存在しないた
めストロークのループが存在しないことになる。ここ
で、一定以上白画素が存在する場合のみループとして抽
出するという制限を設けノイズ除去を行っても良い。
【0055】背景ブロック抽出部44では、背景情報算
出部24で算出されたライン毎の背景情報から、隣接す
る同一次数の背景を結合することにより背景ブロックを
検出する。外接矩形左端から走査した場合、図21に示
す用に、0次背景については第1ブロックと、第2ブロ
ックが検出され、1次背景については、第1ブロックが
検出される。このとき、背景ブロックの大きさ情報とし
て背景ブロックを構成する画素数、位置情報として背景
ブロックに外接する矩形の左上と右下の座標が算出され
る。
【0056】背景ラベル抽出部45では、背景情報算出
部24で算出されたライン毎の背景情報から、隣接する
白画素を結合することにより背景ラベルを検出する。外
接矩形左端から走査した場合、図30に示す用に、4つ
の背景ラベルが検出されラベル番号が付与される。この
とき、ラベル情報として背景ラベルを構成する画素数、
位置情報として背景ラベルに外接する矩形の左上と右下
の座標、文字外接矩形の各辺との接触の有無が算出され
る。
【0057】次に字種判定部6では、第1の文字切り出
し部1から経路11を経由して出力した文字パターンの
外接矩形の幅と高さの内、高さのばらつきの大きさで字
種が手書きか活字かを判定する。具体的には、振り込み
伝票の場合は同一欄に記入された文字は基本的に同一字
体であるため、同一欄に記入された文字全体の高さのば
らつきを調べ、高さのばらつきが大きい場合は全て手書
き文字と判定し、ばらつきが小さい場合は全て活字文字
と判定する。また、その他の場合は伝票の同一欄に相当
する領域に存在する文字全体の高さのばらつきを調べ、
同様の判定を行う。伝票の同一欄に相当する領域の例と
しては、文書や郵便葉書住所欄の一行分(あるいは一列
分)がある。
【0058】次に第1の構造判定部7の第1の活字処理
部51の外接矩形カテゴリ判定部61では、第1の文字
切り出し部から出力された外接矩形の大きさによってあ
る1つのカテゴリに判定できる可能性が高い場合に、前
記カテゴリが第1の認識部4から出力されたカテゴリの
中に含まれている場合は、前記カテゴリに決定する。具
体的な例を挙げると、図22(a)に示すようなカテゴ
リ1は、図22(b)のカテゴリ5に比べると外接矩形
の横幅が非常に狭く、また他のカテゴリの数字も図22
(b)と同程度の横幅であるため、外接矩形の幅が極端
に狭い数字はカテゴリ1であると判定することができ
る。
【0059】第1の認識部依存特徴選択部62では、外
接矩形カテゴリ判定部で判定できない文字に対して第1
の認識部4から出力されたカテゴリに基づいて第1の構
造的特徴抽出部5から出力された複数の構造的特徴の中
で有効な構造的特徴を選択する。具体的な例として、図
23の右上部背景が閉じる寸前のカテゴリ6は統計的特
徴を用いた認識方法ではカテゴリ8に誤認識される傾向
が強いため、第1の認識部4で第1位がカテゴリ8であ
ると判定された場合は、局所ストローク形状抽出部42
及びループ抽出部43で抽出される構造的特徴を選択
し、更に局所ストローク特徴42で抽出される複数の構
造的特徴の中から図19の構造的特徴を選択する。ま
た、第1の認識部4で認識上位から順番にカテゴリ3及
びカテゴリ9が出力された場合は、局所背景特徴抽出部
41から出力された構造的特徴の中で図18(a)
(b)(c)を選択する。
【0060】第1の選択構造的特徴識別部63では、第
1の認識部依存特徴選択部で選択された構造的特徴に基
づいて最終的なカテゴリ判定を行う。具体的な例とし
て、図23の文字に関しては、選択された図19の局所
ストローク特徴とループ特徴を用い、以下の〔1〕
〔2〕の両方の判定方法でカテゴリを判定することによ
り判定の信頼性を高める。両方の判定方法で判定結果が
同一の場合はそのカテゴリに決定し、逆に判定結果が異
なっていた場合は、第1の認識部4で判定されたカテゴ
リに決定する。 〔1〕ループ特徴を用い、ループ数が0なら、カテゴリ
3と推定 ループ数が1なら、ループ位置が中央より上にあればカ
テゴリ9に、中央より下にあればカテゴリ6と推定 ループ数が2なら、カテゴリ8と推定 〔2〕局所ストローク特徴を用い、中央部の上下ストロ
ークが共に上に凸ならカテゴリ6と推定 上ストロークが下に凸、下ストロークが上に凸なら、カ
テゴリ3かカテゴリ8と推定 上下ストロークが共に下に凸なら、カテゴリ9と推定
【0061】また、図18(a)(b)(c)の文字に
対しては、まず図18(a)の中央左背景が凸という特
徴が構造的特徴抽出部5で抽出されているかどうかを調
べる。抽出されていた場合はカテゴリ3に最終決定し、
そうでない場合は、次に図18()の下部左背景の凸が
抽出されているかどうかを調べる。抽出されていた場合
はカテゴリ9に最終決定し、そうでない場合は、次に図
18(b)についても同様の調査を行う。図18(b)
の特徴が抽出されていた場合はカテゴリ6に、そうでな
い場合はカテゴリ8に最終決定する。また、認識最上位
から順番にカテゴリ5及びカテゴリ6の場合は、図16
(c)の下部左背景の凸や図18(d)の上部ストロー
クの直線性が抽出されているかを調べて、最終的なカテ
ゴリを決定する。他のカテゴリについても同様に第1の
認識部4から出力されたカテゴリに基づいて第1の構造
的特徴抽出部5で抽出される特徴を選択して、最終的な
カテゴリを決定する。なお、第1の認識部4から出力さ
れるカテゴリによっては第1の活字処理部52で処理を
行わず、第1の認識部4から出力された認識結果のカテ
ゴリをそのまま最終的なカテゴリとして構わない。
【0062】第1の手書き処理部52の第2の認識部依
存特徴選択部71では字種判定部6において文字パター
ンが手書きと判定された場合に、第1の認識部4から出
力されたカテゴリに基づいて第1の構造的特徴抽出部5
から出力された複数の構造的特徴の中で有効な構造的特
徴を選択する。具体的な例として、手書きのカテゴリ3
は統計的特徴を用いた認識方法ではカテゴリ8に誤認識
する傾向が強いため、第1の認識部4で第1候補(最大
類似度のカテゴリ)がカテゴリ8で、第2候補(類似度
が2番目のカテゴリ)がカテゴリ3であると判定された
場合は、背景ブロック抽出部44及びループ抽出部43
で抽出される構造的特徴を選択する。また、ループ個
数、大きさ、位置から判断して認識結果が明らかに矛盾
する場合は、ループ抽出部43で抽出される構造的特徴
を選択する。
【0063】第2の選択構造的特徴識別部72では、第
2の認識部依存特徴選択部71で選択された構造的特徴
に基づいて最終的なカテゴリ判定を行う。具体的な例と
して、図24(a)に示すようなカテゴリ3の認識結果
がカテゴリ8になっているような場合は、前記選択され
た構造的特徴量からループ数、水平0次背景ブロックの
大きさ、最大水平0次背景長に注目し、以下の(1)
(2)(3)(4)の条件を満たす場合は、認識結果を
第2候補のカテゴリ3に修正し最終認識結果とする。 (1)認識結果の第1候補が8、第2候補が3 (2)ループ数が0または1 (3)水平0次背景ブロックの面積/外接矩形面積 >
しきい値1 (4)最大水平0次背景長/外接矩形幅 >しきい値2
【0064】また、図24(b)に示すようなカテゴリ
7の認識結果がカテゴリ9になっているような場合は、
前記選択された構造的特徴量からループ数、垂直1次背
景ブロックの個数に注目し、以下の(1)(2)(3)
の条件を満たす場合は、認識結果を第2候補のカテゴリ
7に修正し最終認識結果とする。 (1)認識結果の第1候補が9、第2候補が7 (2)ループ数が0 (3)垂直1次背景ブロックの個数が1
【0065】別の例としては、カテゴリ1、7の用に明
らかにループが存在しないようなカテゴリが、通常の書
き方ではループが存在するカテゴリと認識されている場
合には、第2候補のカテゴリに、また、ループの大きさ
が非常に大きいにもかかわらす、カテゴリ6、9に認識
されている場合は、カテゴリ0に認識結果を修正する。
【0066】他のカテゴリについても第1の認識部4か
ら出力されたカテゴリに基づいて第1の構造的特徴抽出
部5で抽出された特徴の中から適切な特徴量を選択し
て、第2の選択構造的特徴識別部72で最終的なカテゴ
リを決定する。なお、第1の認識部4から出力されるカ
テゴリによっては第1の手書き処理部52で処理を行わ
ず、第1の認識部4から出力された認識結果のカテゴリ
をそのまま最終的なカテゴリとして構わない。
【0067】このように、本実施の形態1によれば、基
本特徴抽出部2では統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出することにより構成の共
通化が可能になり、また第1の構造的特徴抽出部5では
第1の認識部4では識別が困難な類似カテゴリの分離に
有効な構造的特徴を中心に抽出することにより処理の効
率化が可能になり、統計的特徴を用いて識別を行う第1
の認識部4から出力された認識結果に基づいて、第1の
構造識別部7において必要な構造的特徴を選択し最終的
なカテゴリを決定することによって更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になる。
【0068】(実施の形態2)図31は本発明の第2の
実施の形態における光学的文字読み取り装置のブロック
図を示すものである。図31において、第1の文字切り
出し部1、基本特徴抽出部2、統計的特徴抽出部3、第
1の認識部4、字種判定部6、第1の構造識別部7、経
路11、経路12、経路13、経路14、経路15は上
述した第1の実施の形態におけるものと同様であり、動
作も同様である。本実施の形態が図1と異なる構成は、
第1の構造的特徴抽出部5に代えて第2の構造的特徴抽
出部10を設けた点である。
【0069】図32は第2の構造的特徴抽出部10の構
成を具体的に示すブロック図である。図32において、
局所背景特徴抽出部41、局所ストローク形状抽出部4
2、背景ブロック抽出部44、背景ラベル抽出部45、
上述した第1の実施の形態におけるものと同様であり、
動作も同様である。本実施の形態が図4と異なる構成
は、ループ抽出部43に代えて第2のループ抽出部46
を設けた点である。
【0070】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。第2のルー
プ抽出部46の動作以外は、実施の形態1と同様なので
省略する。第2のループ抽出部46では、背景ラベル抽
出部45から出力したラベル情報に基づいて、文字パタ
ーンのストロークによって発生するループを抽出する。
具体的な抽出方法は、文字外接矩形のどの辺とも接触し
ない背景ラベルをストロークのループとして抽出する。
図33の例において、数字は背景ラベルのラベル番号、
符号+は黒画素とすると、図33の網掛けされたラベル
番号3の背景ラベルがストロークのループとして抽出さ
れる。ここで、一定以上白画素が存在する場合のみルー
プとして抽出するという制限を設けノイズ除去を行って
も良い。
【0071】このように、本実施の形態2によれば、基
本特徴抽出部2では統計的特徴と構造的特徴の両方に利
用できるような基本特徴を抽出することにより構成の共
通化が可能になり、また第2の構造的特徴抽出部5では
第1の認識部4では識別が困難な類似カテゴリの分離に
有効な構造的特徴を中心に抽出することにより処理の効
率化が可能になり、統計的特徴を用いて識別を行う第1
の認識部4から出力された認識結果に基づいて、第1の
構造識別部7において必要な構造的特徴を選択し最終的
なカテゴリを決定することによって更なる処理の効率化
と類似カテゴリの認識性能の向上が可能になる。また、
ループ数をラベル情報のみに基づいて抽出することによ
り、処理の効率化が図れる。
【0072】(実施の形態3)図25は本発明の第3の
実施の形態における光学的文字読み取り装置のブロック
図を示すものである。図25において、第1の文字切り
出し部1、基本特徴抽出部2、統計的特徴抽出部3、第
1の認識部4、第1の構造的特徴抽出部5、字種判定部
6、第1の構造識別部7、経路11、経路12、経路1
3、経路14、経路15は上述した第1の実施の形態に
おけるものと同様であり、動作も同様である。本実施の
形態が図1と異なる構成は、第1の認識部4から出力さ
れる大きい方から2番目の類似度と最大類似度の比、及
び最大類似度の大きさにより、リジェクトの有無を判定
する第1の認識結果算出部8を設けた点である。
【0073】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。実施の形態
1と同様にして、入力文字列データに対して第1の認識
部4から複数のカテゴリ類似度、大きい方から少なくと
も1つのカテゴリが出力される。第1の認識部から出力
された複数のカテゴリ類似度の大きい方から2つのカテ
ゴリ類似度を選択し、2番目の類似度と最大類似度の比
の値が、予め設定されているしきい値1の値より大きい
(すなわち、2番目の類似度が最大類似度に近い)か、
最大類似度の値が予め設定されたしきい値2の値より小
さい場合にリジェクト信号を出力し、それ以外の場合に
は、第1の認識部から出力されたカテゴリ類似度、カテ
ゴリを第1の構造識別部に出力する。第1の構造識別部
は、実施の形態1と同様にして構造特徴を用いて最終認
識結果を判定する。
【0074】ここで、リジェクト判定のしきい値1、2
は、図26に示すように予め複数の文字データに対して
最大類似度の値、大きい方から2番目の類似度(第2位
類似度)と最大類似度の比を求め、認識結果の正解・不
正解別にグラフにプロットする事により経験的に決定さ
れる。図26の場合、最大類似度が小さい領域には、類
似度の比の値とは関係なく不正解文字のみが分布してい
る。例えば最大類似度の値が500以下の文字パターン
(147文字)を調べると、ほとんど(144文字)が
前処理エラーである。図27にその最大類似度の値が5
00以下の文字の一例を列挙する。図27より、ノイズ
を有する文字、枠線残り、金額訂正部の切り出し、つな
がり文字分離エラー、認識対象外文字の切り出し等の前
処理エラー文字が、最大類似度の大きさをリジェクト判
定の基準に追加することによりリジェクトできるように
なることが分かる。
【0075】このように、本実施の形態3によれば、リ
ジェクト判定に類似度の比の値だけでなく、最大類似度
の大きさを併用する事で、前処理エラーを効率的にリジ
ェクトする事が可能となる。
【0076】(実施の形態4)図28は本発明の第4の
実施の形態における光学的文字読み取り装置のブロック
図を示すものである。図28において、第1の文字切り
出し部1、基本特徴抽出部2、統計的特徴抽出部3、第
1の認識部4、第1の構造的特徴抽出部5、字種判定部
6、第1の構造識別部7、経路11、経路12、経路1
3、経路14、経路15は上述した第1の実施の形態に
おけるものと同様であり、動作も同様である。本実施の
形態が図1と異なる構成は、第1の認識部4から出力さ
れる大きい方から2番目の類似度と最大類似度の比、最
大類似度の大きさ、及び背景複雑度により、リジェクト
の有無を判定する第2の認識結果算出部9を設けた点で
ある。
【0077】図29は第2の認識結果算出部9の構成を
具体的に示すブロック図である。291は、第1の認識
部4から出力されるカテゴリ類似度の大きい方から2つ
を選択し、2番目のカテゴリ類似度(第2位類似度)と
最大類似度の比を算出する類似度比算出部である。29
6は、背景情報算出部24から出力される背景情報に基
づき背景複雑度を算出する背景複雑度算出部である。2
92は、前記算出された類似度比と最大類似度と背景複
雑度を入力として、それらの値に応じてその文字パター
ンが正解(非リジェクト)か不正解(リジェクト)かを
出力するリジェクト判定部である。ここでは、上記リジ
ェクト判定部を予め複数のデータについて学習させた階
層型ニューラルネットワークにより構成した例について
説明する。293は、前記リジェクト判定部の学習に用
いる文字データの正解カテゴリを記憶した正解カテゴリ
テーブルである。294は、学習時には、第1の認識部
4から出力される最大類似度カテゴリと前記正解カテゴ
リテーブルに書き込まれた正解カテゴリとリジェクト判
定部の出力から学習の有無を判定し、認識時には、リジ
ェクト判定部の出力から、リジェクトの判定をする出力
判定部である。295は、学習時に前記出力判定部29
4で学習が必要であると判定された場合にリジェクト判
定部を構成する階層型ニューラルネットワークの結合荷
重を更新する結合荷重更新部である。
【0078】以上のように構成された光学的文字読み取
り装置について、以下その動作を説明する。実施の形態
1と同様にして、入力文字列データに対して第1の認識
部4から複数のカテゴリ類似度、大きい方から少なくと
も1つのカテゴリが出力される。第2の認識結果算出部
9は、予め用意した複数の文字データに対する類似度と
背景複雑度とリジェクトの有無の関係を学習する学習モ
ードと、学習結果に基づいてリジェクト判定をする認識
モードからなる。
【0079】まず、学習モードについて説明する。類似
度比算出部291は、第1の認識部4から出力されたカ
テゴリ類似度から、第2位類似度と最大類似度の比を算
出しリジェクト判定部292に出力する。背景複雑度算
出部296は、背景情報算出部24から出力される背景
情報に基づいて、垂直及び水平方向の背景次数の最大値
の和を背景複雑度として算出しリジェクト判定部292
に出力する。尚、背景複雑度は垂直及び水平方向の背景
次数の最大値の和に限定するものではなく、ある一定の
値以上の背景次数のライン数の和等、背景情報に基づく
ものであればよい。リジェクト判定部292を構成する
階層型ニューラルネットワークは、類似度比と最大類似
度比と背景複雑度を入力として、その時点での結合荷重
により出力層から出力信号を出力する。ここでは、出力
層のニューロン数を2とし、一方の出力がリジェクト、
もう一方のリジェクトが非リジェクトを表す。出力判定
部294は、前記リジェクト判定部の出力のうち大きい
方を選択すると同時に、現在入力されているパターンの
最大類似度カテゴリと正解カテゴリテーブル293から
出力される正解カテゴリを比較する。最大カテゴリが正
解カテゴリと一致する(正解)場合で、リジェクト判定
部292の出力のリジェクトを表すニューロンの出力が
大きいか、最大類似度カテゴリと正解カテゴリが一致し
ない(不正解)場合で、リジェクト判定部292の出力
の非リジェクトを表すニューロンの出力が大きい時に
は、学習信号を結合荷重更新部に出力する。学習信号が
出力判定部294から出力されると、結合荷重更新部
は、最急降下法等のアルゴリズムにより、リジェクト判
定部292を構成する階層型ニューラルネットワークの
結合荷重を更新する。
【0080】以上の動作を、全ての学習データに対して
出力判定部294から学習信号が出力されなくなるか、
リジェクト判定部の2つの出力値の大小関係が変化しな
くなるまで繰り返す。この学習モードにより、類似度比
と最大類似度と背景複雑度の大きさに応じたリジェクト
判定が可能になる。
【0081】次に、認識モードについて説明する。上記
学習後の結合荷重値に基づいて、類似度比と最大類似度
の大きさと背景複雑度に応じた出力がリジェクト判定部
292から出力されると出力判定部294は、その出力
値の大きい方を選択し、リジェクトを表す出力が大きい
場合にはリジェクト信号を、非リジェクトを表す出力が
大きい場合には、最大類似度カテゴリを認識結果として
出力する。類似度比と最大類似度と背景複雑度の空間上
での正解文字(リジェクトしない文字)領域と不正解文
字(リジェクトすべき文字)領域の境界は非常に複雑で
ある。例えば、類似度比と最大類似度の2次元空間上で
も図26に示すように線形分離が不可能であると考えら
れるが、本実施の形態4によれば、非線形分離可能な階
層型ニューラルネットワークでリジェクト判定部292
を構成し、この境界を学習させることにより、より精度
が高く効果的なリジェクト判定が可能となる。
【0082】なお、リジェクト判定部292を、階層型
ニューラルネットワーク以外のニューラルネットワーク
モデルで構成しても構わない。また、本実施の形態で
は、類似度比と最大類似度と背景複雑度の3つをリジェ
クト判定部292への入力したが、3つのうちの任意の
1つまたは2つを入力する構成としても構わない。
【0083】
【発明の効果】以上説明したように、本発明の光学的文
字読み取り装置によれば、統計的特徴と構造的特徴の両
方に利用できるような基本特徴を抽出して処理の共通化
を図り、統計的特徴を利用した認識部でな識別が困難な
類似カテゴリを分離する構造的特徴を中心に抽出するこ
とで効率的な特徴抽出が可能になり、認識結果に基づい
て必要な構造的特徴を選択して最終的なカテゴリを決定
することによって更なる処理の効率化と類似カテゴリの
認識性能の向上が可能になる。
【図面の簡単な説明】
【図1】本発明の第1の実施の形態における光学的文字
読み取り装置の構成を示すブロック図
【図2】第1の実施の形態における基本特徴抽出部の構
成を示すブロック図
【図3】第1の実施の形態における統計的特徴抽出部の
構成を示すブロック図
【図4】第1の実施の形態における第1の構造的特徴抽
出部の構成を示すブロック図
【図5】第1の実施の形態における第1の構造識別部の
構成を示すブロック図
【図6】第1の実施の形態における第1の活字処理部の
構成を示すブロック図
【図7】第1の実施の形態における第1の手書き処理部
の構成を示すブロック図
【図8】第1の実施の形態における文字切り出し方法を
説明するための摸式図
【図9】第1の実施の形態における輪郭点抽出方法を説
明するための摸式図
【図10】第1の実施の形態における輪郭方向と符号化
の対応付けを説明するための摸式図
【図11】第1の実施の形態におけるを輪郭方向符号化
方法を説明するための摸式図
【図12】第1の実施の形態におけるを背景距離算出方
法を説明するための摸式図
【図13】第1の実施の形態におけるを背景情報算出方
法を説明するための摸式図
【図14】第1の実施の形態におけるブロック分割方法
を説明するための摸式図
【図15】第1の実施の形態における輪郭方向集計方法
を説明するための摸式図
【図16】第1の実施の形態における外郭点発見方法を
説明するための摸式図
【図17】第1の実施の形態における第1の認識部の構
成の一例である階層型ニューラルネットワークの摸式図
【図18】第1の実施の形態における局所背景特徴抽出
方法を説明するための摸式図
【図19】第1の実施の形態における局所ストローク形
状抽出方法を説明するための摸式図
【図20】第1の実施の形態におけるループ抽出方法を
説明するための摸式図
【図21】第1の実施の形態における背景ブロック抽出
方法を説明するための摸式図
【図22】第1の実施の形態における外接矩形の大きさ
によるカテゴリ分離方法を説明するための摸式図
【図23】第1の実施の形態における右上部が閉じる寸
前のカテゴリ6の一例を示す摸式図
【図24】第1の実施の形態における背景ブロック情報
による認識結果修正方法の説明するための模式図
【図25】第3の実施の形態における光学的文字読み取
り装置の構成を示すブロック図
【図26】類似度比と最大類似度の空間上における正解
文字と不正解文字の分布例を示す模式図
【図27】最大類似度が小さい(<500)文字パター
ンの文字イメージ例を示す模式図
【図28】第4の実施の形態におけるリ光学的文字読み
取り装置の構成を示すブロック図
【図29】第3の実施の形態における第2の認識結果算
出部の構成を示すブロック図
【図30】第1の実施の形態における背景ラベル抽出方
法を説明するための摸式図
【図31】本発明の第2の実施の形態における光学的文
字読み取り装置の構成を示すブロック図
【図32】第2の実施の形態における第2の構造的特徴
抽出部の構成を示すブロック図
【図33】第2の実施の形態におけるループ抽出方法を
説明するための摸式図
【符号の説明】
1 第1の文字切り出し部 2 基本特徴抽出部 3 統計的特徴抽出部 4 第1の認識部 5 第1の構造的特徴抽出部 6 字種判定部 7 第1の構造識別部 8 第1の認識結果算出部 9 第2の認識結果算出部 10 第2の構造的特徴抽出部 11 (外接矩形の大きさを出力する)経路 12 (切り出し画像を出力する)経路 13 (輪郭方向成分を出力する9経路 14 (背景距離を出力する)経路 21 輪郭点抽出部 22 輪郭方向算出部 23 背景距離算出部 24 背景情報算出部 31 両方向ブロック分割部 32 水平方向ブロック分割部 33 垂直方向ブロック分割部 34 輪郭方向集計部 35 輪郭方向正規化部 36 外郭方向集計部 37 外郭方向正規化部 38 背景距離集計部 39 背景距離正規化部 41 局所背景特徴抽出部 42 局所ストローク形状抽出部 43 ループ抽出部 44 背景ブロック抽出部 45 背景ラベル抽出部 46 第2のループ抽出部 51 第1の活字処理部 52 第1の手書き処理部 61 外接矩形カテゴリ判定部 62 第1の認識部依存特徴選択部 63 第1の選択構造的特徴識別部 71 第2の認識部依存特徴選択部 72 第2の選択構造的特徴識別部 291 類似度比算出部 292 リジェクト判定部 293 正解カテゴリテーブル 294 出力判定部 295 結合荷重更新部 296 背景複雑度算出部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 光電変換された文字枠線を含む文字列デ
    ータに対して、文字枠線と文字列パターンを分離し、分
    離された文字列パターンから個々の文字パターンを切り
    出し、個々の文字パターンに対する外接矩形の大きさと
    外接矩形に囲まれた切り出し文字画像を出力する第1の
    文字切り出し部と、 前記文字切り出し部で切り出された個々の切り出し文字
    画像に対する輪郭情報と背景構造情報を求める基本特徴
    抽出部と、 前記基本特徴抽出部から出力される輪郭方向成分と背景
    距離に基づいて少なくとも一種類の統計的特徴量を求め
    る統計的特徴抽出部と、 前記統計的特徴抽出部から出力される統計的特徴量から
    切り出し文字画像の各カテゴリに対する類似度を求め、
    類似度の大きい順に複数のカテゴリの類似度と少なくと
    も一つ以上のカテゴリを出力する第1の認識部と、 前記基本特徴抽出部から出力される基本特徴に基づいて
    少なくとも一種類の構造的特徴を求める第1の構造的特
    徴抽出部と、 前記第1の文字切り出し部から出力される外接矩形の大
    きさから手書きまたは活字の字種判定を行う字種判定部
    と、 前記第1の文字切り出し部から出力された文字パターン
    に対する外接矩形の大きさと前記第1の認識部で判定さ
    れたカテゴリと前記字種判定部から出力される字種判定
    結果と前記第1の構造的特徴抽出部から出力される構造
    的特徴に基づいて最終的な文字パターンの属するカテゴ
    リを判定する第1の構造識別部とで構成した光学的文字
    読み取り装置。
  2. 【請求項2】 基本特徴抽出部を、 前記第1の文字切り出し部から出力される切り出し画像
    中の文字パターンの輪郭点を抽出する輪郭点抽出部と、 前記輪郭点抽出部から出力された個々の輪郭点の隣接関
    係から画素単位の輪郭方向成分を算出する輪郭方向算出
    部と、 前記輪郭点抽出部から出力された輪郭点の位置に基づい
    て文字パターンの外接矩形の各々の辺から文字パターン
    までの背景距離を求める背景距離算出部と、 前記第1の文字切り出し部から出力された切り出し画像
    を水平及び垂直方向のライン毎に走査し、一定画素以上
    連続する白画素の連続(背景)する長さ・位置情報とそ
    の背景の走査方向に沿った発生順番である背景次数を算
    出する背景情報算出部とで構成した請求項1記載の光学
    的文字読み取り装置。
  3. 【請求項3】 統計的特徴抽出部を、 第1の文字切り出し部から出力された切り出し画像を水
    平・垂直両方向で複数のブロックに分割する両方向ブロ
    ック分割部と、 前記両方向ブロック分割部で分割したブロック単位で、
    前記基本特徴抽出部の輪郭方向算出部から出力された輪
    郭方向成分について輪郭方向毎の個数を集計する輪郭方
    向集計部と、 輪郭方向集計部から出力されたブロック単位の輪郭方向
    毎の輪郭方向成分の個数をブロックの大きさで割ること
    で得られる輪郭方向毎の輪郭統計特徴量を求める輪郭方
    向正規化部と、 第1の文字切り出し部から出力された切り出し画像を水
    平方向で複数のブロックに分割する水平方向ブロック分
    割部と、 第1の文字切り出し部から出力された切り出し画像を垂
    直方向で複数のブロックに分割する垂直方向ブロック分
    割部と、 基本特徴抽出部2から経路13を経由して出力した輪郭
    方向成分に基づいて、前記水平方向ブロック分割部及び
    垂直方向ブロック分割部で分割したブロック単位で、ブ
    ロック分割境界線に垂直な外接矩形の辺からブロック分
    割境界線に平行方向に走査して最初に存在する文字パタ
    ーンを構成する画素の輪郭方向毎の輪郭方向成分の個数
    である外郭方向成分の個数を集計する外郭方向集計部
    と、 外郭方向集計部から出力されたブロック単位の輪郭方向
    毎の外郭方向成分の個数をブロックの大きさで割ること
    で得られる輪郭方向毎の外郭統計特徴量を求める外郭方
    向正規化部と、 前記基本特徴抽出部の背景距離算出部から出力された背
    景距離に基づいて、前記水平方向ブロック分割部及び垂
    直方向ブロック分割部で分割したブロック単位でブロッ
    ク分割方向の背景距離を合計する背景距離合計部と、 背景距離集計部から出力されたブロック単位の集計背景
    距離をブロックの大きさで割ることで得られる背景距離
    特徴量を求める背景距離正規化部とで構成した請求項1
    記載の光学的文字読み取り装置。
  4. 【請求項4】 第1の構造的特徴抽出部を、 前記基本特徴抽出部の背景距離算出部から出力された背
    景距離に基づいて局所的な背景距離特徴を抽出する局所
    背景特徴抽出部と、 前記基本特徴抽出部の輪郭方向算出部から出力された輪
    郭方向成分に基づいて局所的なストローク方向の変化を
    抽出する局所ストローク形状抽出部と、 前記第1の文字切り出し部から出力された切り出し画像
    と前記基本特徴抽出部の輪郭方向算出部から出力された
    輪郭方向成分に基づいて文字パターンのループを抽出す
    るループ抽出部と、 前記基本特徴抽出部の背景情報算出部で算出した背景情
    報から、背景次数毎に隣接する背景画素の塊を背景ブロ
    ックとして求めると共に、その大きさ情報と位置情報を
    算出する背景ブロック抽出部と、 前記基本特徴抽出部の背景情報算出部で算出した背景情
    報から、隣接する白画素の塊を背景ラベルとして求めラ
    ベル番号を付与すると共に、その大きさ、位置、その背
    景ラベルが外接矩形のどの辺と接するかを表わすラベル
    情報を算出する背景ラベル抽出部とで構成した請求項1
    記載の光学的文字読み取り装置。
  5. 【請求項5】 第1の構造的特徴抽出部に代えて、 前記基本特徴抽出部の背景距離算出部から出力された背
    景距離に基づいて局所的な背景距離特徴を抽出する局所
    背景特徴抽出部と、 前記基本特徴抽出部の輪郭方向算出部から出力された輪
    郭方向成分に基づいて局所的なストローク方向の変化を
    抽出する局所ストローク形状抽出部と、 前記基本特徴抽出部の背景情報算出部で算出した背景情
    報から、背景次数毎に隣接する背景画素の塊を背景ブロ
    ックとして求めると共に、その大きさ情報と位置情報を
    算出する背景ブロック抽出部と、 前記基本特徴抽出部の背景情報算出部で算出した背景情
    報から、隣接する白画素の塊を背景ラベルとして求めラ
    ベル番号を付与すると共に、その大きさ、位置、その背
    景ラベルが外接矩形のどの辺と接するかを表わすラベル
    情報を算出する背景ラベル抽出部と、 前記背景ラベル抽出部で算出したラベル情報に基づいて
    文字パターンのループを抽出する第2のループ抽出部で
    構成した第2の構造的特徴抽出部を備えた請求項1記載
    の光学的文字読み取り装置。
  6. 【請求項6】 第1の文字切り出し部から出力された外
    接矩形の大きさから手書きまたは活字の字種判定を行う
    字種判定部とを備え、 第1の構造識別部を、 字種判定部で活字と判定された文字に対して、第1の文
    字切り出し部から出力された文字パターンに対する外接
    矩形の大きさと第1の構造的特徴抽出部から出力された
    構造的特徴に基づいて個々の文字パターンが属するカテ
    ゴリを判定する第1の活字処理部と、 字種判定部で手書きと判定された文字に対して、第1の
    文字切り出し部から出力された文字パターンに対する外
    接矩形の大きさと第1の構造的特徴抽出部から出力され
    た構造的特徴に基づいて個々の文字パターンが属するカ
    テゴリを判定する第1の手書き処理部とで構成した請求
    項1または5記載の光学的文字読み取り装置。
  7. 【請求項7】 第1の活字処理部を、 第1の文字切り出し部から出力された外接矩形の大きさ
    と第1の認識部4から出力されたカテゴリに基づいて一
    部のカテゴリに対する最終的なカテゴリ判定を行う外接
    矩形カテゴリ判定部と、 外接矩形カテゴリ判定部で判定できない文字に対して第
    1の認識部から出力されたカテゴリに基づいて第1の構
    造的特徴抽出部から出力された複数の構造的特徴の中で
    有効な構造的特徴を選択する第1の認識部依存特徴選択
    部と、 第1の認識部依存特徴選択部で選択された構造的特徴に
    基づいてカテゴリ判定を行う第1の選択構造的特徴識別
    部で構成した請求項6記載の光学的文字読み取り装置。
  8. 【請求項8】 第1の手書き処理部を、 第1の文字切り出し部から出力された外接矩形の大きさ
    と第1の認識部4から出力されたカテゴリに基づいて第
    1の構造的特徴抽出部から出力された複数の構造的特徴
    の中で有効な構造的特徴を選択する第2の認識部依存特
    徴選択部と、 第2の認識部依存特徴選択部で選択された構造的特徴に
    基づいてカテゴリ判定を行う第2の選択構造的特徴識別
    部で構成した請求項6記載の光学的文字読み取り装置。
  9. 【請求項9】 前記算出されたカテゴリ類似度の大きい
    方から2つのカテゴリ類似度を選択し、2番目の類似度
    と最大類似度の比の値が予め設定されているしきい値1
    より大きいかまたは、最大類似度が予め設定されている
    しきい値2より小さい場合にリジェクト信号を出力し、
    それ以外の場合は第1段階の認識結果として最大類似度
    のカテゴリを出力する第1の認識結果算出部を備えた請
    求項1または5記載の光学的文字読み取り装置。
  10. 【請求項10】 第1の認識結果算出部に代えて、複数
    の文字パターンに対して、予め大きい方から2番目の類
    似度と最大類似度の比、最大類似度、前記背景情報算出
    部で算出した背景情報に基づく背景複雑度、前記第1の
    認識部が出力する認識結果を算出し、その類似度比と最
    も大きい類似度と背景複雑度の少なくとも1つを入力と
    し、前記認識結果が不正解の場合は、リジェクト信号を
    出力し、正解の場合はリジェクト信号を出力しないよう
    に予め学習させた階層型ニューラルネットワークで構成
    した第2の認識結果算出部を備えた請求項1または5記
    載の光学的文字読み取り装置。
JP10278779A 1998-09-30 1998-09-30 光学的文字読み取り装置 Pending JP2000113110A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10278779A JP2000113110A (ja) 1998-09-30 1998-09-30 光学的文字読み取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10278779A JP2000113110A (ja) 1998-09-30 1998-09-30 光学的文字読み取り装置

Publications (1)

Publication Number Publication Date
JP2000113110A true JP2000113110A (ja) 2000-04-21

Family

ID=17602070

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10278779A Pending JP2000113110A (ja) 1998-09-30 1998-09-30 光学的文字読み取り装置

Country Status (1)

Country Link
JP (1) JP2000113110A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021174327A (ja) * 2020-04-27 2021-11-01 Arithmer株式会社 処理装置、学習装置、処理プログラム、及び学習プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021174327A (ja) * 2020-04-27 2021-11-01 Arithmer株式会社 処理装置、学習装置、処理プログラム、及び学習プログラム

Similar Documents

Publication Publication Date Title
US6636631B2 (en) Optical character reading method and system for a document with ruled lines and its application
US5787194A (en) System and method for image processing using segmentation of images and classification and merging of image segments using a cost function
US6335986B1 (en) Pattern recognizing apparatus and method
US6259812B1 (en) Key character extraction and lexicon reduction cursive text recognition
Palacios et al. A system for processing handwritten bank checks automatically
CN109389050B (zh) 一种流程图连接关系识别方法
JP5003051B2 (ja) 郵便自動区分機及び郵便自動区分方法
JP2007058882A (ja) パターン認識装置
Verma et al. A novel approach for structural feature extraction: contour vs. direction
JP3370934B2 (ja) 光学的文字読み取り方法とその装置
JP5630689B2 (ja) 文字認識方法及び文字認識装置
JP2898562B2 (ja) ナンバープレート決定方法
JP4176175B2 (ja) パターン認識装置
JP2000113110A (ja) 光学的文字読み取り装置
JP2985893B2 (ja) パターン認識装置
EP0684576A2 (en) Improvements in image processing
JP4194020B2 (ja) 文字認識方法、該方法の実行に用いるプログラム及び文字認識装置
Muñoz Mathematical expression recognition based on probabilistic grammars
JP2965165B2 (ja) パターン認識方法及び認識用辞書作成方法
Koga et al. Segmentation of Japanese handwritten characters using peripheral feature analysis
JP4026738B2 (ja) パターン認識方法及び装置、並びに記録媒体
JPH0877293A (ja) 文字認識装置および文字認識用辞書作成方法
JP2007026470A (ja) パターン認識装置
JP2906758B2 (ja) 文字読取装置
JP3662967B2 (ja) 文字ループ候補抽出装置及び文字補完装置