JPH05258106A - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JPH05258106A
JPH05258106A JP4054694A JP5469492A JPH05258106A JP H05258106 A JPH05258106 A JP H05258106A JP 4054694 A JP4054694 A JP 4054694A JP 5469492 A JP5469492 A JP 5469492A JP H05258106 A JPH05258106 A JP H05258106A
Authority
JP
Japan
Prior art keywords
character
pattern
unit
value
coordinate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4054694A
Other languages
English (en)
Inventor
Masakatsu Izoe
正勝 井添
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4054694A priority Critical patent/JPH05258106A/ja
Publication of JPH05258106A publication Critical patent/JPH05258106A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 オペレータの負担軽減を図り、効率的に帳票
の読取処理を行うことの可能な光学的文字読取装置を提
供する。 【構成】 文字以外にごみ,汚れ等が付着した帳票10
をスキャナ1により光学的に走査した場合に、得られる
帳票イメージには、文字のパターン以外にそのごみ,汚
れ等もパターンとして含まれる。射影検出部3は、得ら
れた帳票イメージに基づいてパターン毎にその座標情報
を検出する。文字抽出部7は、座標情報からパターンの
高さの中心座標を求め、それらを平均した高さの平均中
心座標を求め、パターン毎にその高さの中心座標と高さ
の平均中心座標とを比較して、その比較結果が許容値内
となるパターンのみを抽出する。パターンの座標情報
は、ごみ,汚れ等と文字とでは通常異なるものとなるた
め、文字抽出部7が抽出したパターンは、文字のパター
ンのみとなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、光学的文字読取装置に
関する。
【0002】
【従来の技術】従来より、帳票の読取フィールドにフリ
ーピッチで記入された文字列について、効率良く文字認
識処理を行うために、フォーマットコントロール情報と
して指定された桁数と、文字切出しにより得られたパタ
ーンの桁数とが一致するかどうかの判断を行い、一致し
た場合には、正しく文字切出しが行われたと判断して後
に続く文字認識処理を行うようにしている。
【0003】
【発明が解決しようとする課題】しかしながら、例え
ば、図5に示すように、帳票10の読取フィールド11
内に文字12以外にごみ,汚れ等13が付着している場
合は、切出したパターンの桁数がフォーマットコントロ
ール情報として指定された桁数よりも多くなるため、
「桁数エラー」として、全ての文字をリジェクトしてい
た。このため、全ての文字をリジェクトした後は、オペ
レータによる修正作業が必要となったり、ごみ,汚れ等
を取り除き再度読取処理を行わなければならないという
問題があった。
【0004】そこで、本発明は上記事情に鑑みてなされ
たものであり、オペレータの負担軽減を図り、効率的に
帳票の読取処理を行うことの可能な光学的文字読取装置
を提供することを目的とする。
【0005】
【課題を解決するための手段】上記目的を達成するため
に請求項1記載の発明は、文字と認め得る属性値を有す
るパターンが記録された帳票を、光学的に走査して帳票
イメージを検出し、その帳票イメージに含まれるパター
ンを切出して、その切出したパターンについて文字認識
処理を行う光学的文字読取装置において、前記文字と認
め得る属性値の許容値を記憶する記憶手段と、前記帳票
イメージに基づいて、前記パターン毎にその属性値を検
出する検出手段と、前記切出されたパターン毎にその属
性値が前記許容値内であるか否かの判断を行い、許容値
内となるパターンのみを抽出して前記文字認識処理に供
する抽出手段とを有することを特徴とするものである。
【0006】また、請求項2記載の発明は、請求項1記
載の発明において、文字と認め得る属性値を文字の中心
位置としたものである。
【0007】
【作用】このように構成された請求項1記載の発明によ
れば、文字以外にごみ,汚れ等が付着した帳票を光学的
に走査した場合には、その光学的走査により得られる帳
票イメージには、文字のパターン以外にそのごみ,汚れ
等もパターンとして含まれる。検出手段は、得られた帳
票イメージに基づいてパターン毎にその属性値を検出す
る。抽出手段は、切出されたパターン毎にその属性値が
許容値内であるか否かの判断を行い、許容値内となるパ
ターンのみを抽出して文字認識処理に供する。パターン
の属性値は、ごみ,汚れ等と文字とでは通常異なるもの
となるため、抽出手段が抽出したパターンは、文字のパ
ターンのみとなる。
【0008】従って、文字のパターンのみについて文字
認識処理が行われる。
【0009】また、請求項2記載の発明によれば、帳票
に記録される文字が横又は縦方向の文字列であった場合
は、文字と認め得る属性値を文字の中心位置とすること
により、その文字列からはみでた文字以外のパターンを
文字認識処理の対象から排除できる。
【0010】
【実施例】以下、本発明の実施例を図面を参照して詳述
する。
【0011】図1は本発明の光学的文字読取装置の一実
施例を示す概略構成図である。
【0012】本装置は、文字12と認め得る属性値(H
i)を有するパターンが記録された帳票10全体を、光
学的に走査して帳票イメージを検出するスキャナ1と、
このスキャナ1が検出した帳票イメージを1帳票分格納
するシートバッファ2と、このシートバッファ2に格納
された帳票イメージから射影を検出し、その射影により
パターン毎の属性値(Hi)を検出する検出手段として
の射影検出部3と、帳票イメージから各パターンを切出
すと共にパターンの数(桁数)を求める文字切出し部4
と、文字切出し部4が求めた桁数と図示しない制御部か
ら送出されたフォーマットコントロール情報(以下「F
C情報」と略す。)として指定された桁数とを比較し
て、「桁数エラー」か否かを判別する桁数エラー判別部
5と、文字12と認め得る属性値(Hi)の許容値dを
予め記憶する記憶手段としての許容値記憶部6と、桁数
エラー判別部5による判別結果が「桁数エラー」の場合
に前記許容値dを用いて文字12のパターンのみを抽出
する抽出手段としての文字抽出部7と、桁数エラー判別
部5又は文字抽出部7からの文字12のパターンについ
て文字認識処理を行う認識部8と、この認識部8の認識
結果を一時保持する出力バッファ9とを有して構成され
ている。
【0013】本装置が読取対象とする帳票10は、主に
1又は2以上の読取フィールド11に、フリーピッチで
文字と認め得る属性値(Hi)を有するパターンの文字
12が横書きで手書き又は印刷により記録されたもので
ある。
【0014】前記スキャナ1は、帳票10上に光を照射
する光源と、帳票10からの反射光を受けて電気信号に
変換する光電変換素子とを備え、帳票10全体を光学的
に走査して帳票イメージを検出するものである。
【0015】前記射影検出部3は、シートバッファ2に
格納された帳票イメージの内、FC情報として指定され
た読取フィールド11について垂直射影,水平射影を検
出し、その検出結果から縦,横方向における各パターン
の属性値としての両端座標(x,y)を測定して求め、
その座標情報と共に帳票イメージを文字切出し部4に出
力するものである。
【0016】前記文字切出し部4は、射影検出部3から
の座標情報に基づいて、射影検出部3から出力された帳
票イメージからパターンを切出して、その切出したパタ
ーンの数(又は座標情報)から桁数を求め、射影検出部
3からの座標情報と共にパターン情報及び桁数情報を桁
数エラー判別部5に出力するものである。なお、この文
字切出しにより得られるパターンには、帳票10に文字
12以外のごみ,汚れ13等が付着していた場合には、
そのパターンも含まれる。
【0017】前記桁数エラー判別部5は、文字切出し部
4が求めた桁数と図示しない制御部から送出されたFC
情報として指定された桁数とを比較して、文字切出し部
4が求めた桁数がFC情報として指定された桁数に一致
する場合以外は、「桁数エラー」として判別するもので
ある。また、桁数エラー判別部5は、判別結果が「桁数
エラー」の場合は、文字切出し部4から出力されたパタ
ーン情報(座標情報,桁数情報含む)を文字抽出部7に
出力し、判別結果が「桁数エラー」でない場合は、その
パターン情報(座標情報,桁数情報含む)を認識部8に
出力するものである。
【0018】前記文字抽出部7は、文字12のパターン
と文字以外13のパターンとを識別するための識別値Δ
Hを求め、その識別値ΔHと許容値記憶部6が記憶する
許容値dとを比較して、識別値ΔHが許容値d内となる
文字12のパターンのみを抽出するものである。
【0019】まず、識別値ΔHは、最初に各パターンの
高さの中心座標(文字と認め得る属性値)Hiを求め、
次に読取フィールド11内全体についての高さの平均中
心座標THを求めた後、中心座標Hiと平均中心座標T
Hとの差を識別値ΔHとして求めるようにしている。
【0020】その高さの中心座標Hiは、図2に示すよ
うに、射影検出部3が検出したパターンの座標情報の
内、パターンの上端座標YUiと、パターンの下端座標Y
Diとから次に示す式(1) により求めるようにしている。
【0021】 Hi=(YUi+YDi)/2 …(1)
【0022】また、高さの平均中心座標THは、図3に
示すように、パターンの上端座標YUiと、パターンの下
端座標YDiとから次に示す式(2) により求めるようにし
ている。なお、Nは文字切出し部4が求めた桁数を示
す。
【0023】 TH={Σ(YUi+YDi)/2}/N …(2)
【0024】そして中心座標Hiと平均中心座標THと
の差である識別値ΔHは、次に示す式(3) により求める
ようにしている。
【0025】 ΔH=|Hi−TH| …(3)
【0026】次に、識別値ΔHと許容値記憶部6に記憶
されている許容値dとを各パターン毎に比較して、識別
値ΔHが許容値d以下の場合はそのパターンは文字12
のパターンと判断し、識別値ΔHが許容値d以下の場合
はそのパターンはごみ,汚れ等の文字以外13のパター
ンと判断し、文字切出し部4が切出したパターンから文
字12のパターンのみを抽出し、文字認識部5に出力す
るようにしている。
【0027】前記認識部8は、候補文字パターンを記憶
する候補文字メモリを備え、桁数エラー判別部5又は文
字抽出部7からの文字12のパターンについて例えば重
ね合せ法(パターンマッチング法)により文字認識処理
を行い、候補文字群を出力バッファ9に出力するもので
ある。
【0028】次に、上記実施例の光学的文字読取装置の
作用を図4に示すフローチャートをも参照して説明す
る。
【0029】スキャナ1は、帳票10全体を光学的に走
査して帳票イメージを検出すると、その帳票イメージを
シートバッファ2に出力する(S1)。シートバッファ
2は、スキャナ1からの帳票イメージを格納する。射影
検出部3は、シートバッファ2に格納された帳票イメー
ジから射影を検出して、パターンの座標情報を測定して
求め、その座標情報と共に帳票イメージを文字切出し部
4に出力する(S2)。文字切出し部4は、検出部3が
求めたパターンの座標情報に基づき、帳票イメージから
パターンを切出して、桁数を求め、射影検出部3からの
座標情報と共にパターン情報及び桁数情報を桁数エラー
判別部5に出力する(S3)。
【0030】桁数エラー判別部5は、文字切出し部4が
切出した桁数と、FC情報として指定された桁数とを比
較し、切出した桁数が指定された桁数に一致しない場合
は、「桁数エラー」として、文字切出し部4から出力さ
れたパターン情報(座標情報,桁数情報含む)を文字抽
出部7に出力する(S4)。このステップS4で「桁数
エラー」の場合は(Y)、文字抽出部7は、式(1) によ
り各パターンの高さの中心座標Hiを求め、次に式(2)
により読取フィールド11全体についての高さの平均中
心座標THを求めた後、式(3) により中心座標Hiと平
均中心座標THとの差を識別値ΔHとして求める。そし
て、文字抽出部7は、識別値ΔHと許容値記憶部6に記
憶されている許容値dとを各パターン毎に比較して、識
別値ΔHが許容値d以下の場合はそのパターンは文字1
2のパターンと判断し、識別値ΔHが許容値d以下の場
合はそのパターンはごみ,汚れ等の文字以外13のパタ
ーンと判断し、文字切出し部4が切り出したパターンか
ら文字12のパターンのみを抽出し(S5)、文字12
のパターンのみを認識部8に出力する。認識部8では、
文字抽出部7から出力されたパターンについて、文字認
識処理を行い(S6)、その認識結果を出力バッファ9
に出力する(S7)。
【0031】前記ステップS4で切出した桁数が指定さ
れた桁数に一致した場合は「桁数エラー」とせず
(N)、文字切出し部4から出力されたパターン情報
(座標情報,桁数情報含む)を認識部8に出力する。認
識部8は、桁数エラー判別部5から出力されたパターン
について文字認識処理を行い(S6)、その認識結果を
出力バッファ9に出力する(S7)。
【0032】このような上記実施例の光学的文字読取装
置によれば、帳票10にごみ,汚れ13等が付着してい
る場合であっても、文字12のパターンのみを抽出して
文字認識処理を行うようにしているので、効率良く文字
認識処理を行うことができる。
【0033】また、文字抽出部7がパターンの抽出に用
いる属性値としては、文字の中心位置のみであるので、
文字のパターン抽出処理が迅速に行える。
【0034】更に、文字切出し部4が求めた桁数とFC
情報として指定された桁数とを比較して、「桁数エラ
ー」か否かを判別して、求めた桁数が指定された桁数に
一致する場合のみ文字認識処理を行うようにしているの
で、効率良く文字認識処理を行うことができる。
【0035】尚、本発明は上記実施例に限定されず、そ
の要旨を変更しない範囲内で種々に変形実施できる。例
えば、文字抽出部がパターンの抽出に用いる属性値とし
ては、パターンの縦又は横サイズやフォント,色等の他
の属性値を用いてもよく、2つ以上の属性値を組合わせ
て用いてもよい。また、読取フィールドを設けていない
帳票に対しても同様に適用可能である。更に、縦書きの
文字列に対しても同様に適用可能である。この場合は、
文字の横方向の中心座標を用いればよい。
【0036】
【発明の効果】以上詳述した請求項1記載の発明によれ
ば、帳票にごみ,汚れ等が付着している場合であって
も、文字のパターンのみを抽出して文字認識処理に供す
るようにしているので、文字読取率が向上し、これによ
り読取結果に対するオペレータによる修正作業や、再度
読み取りし直す作業等を低減できるので、オペレータの
負担軽減を図り、効率的に帳票の読取処理を行うことの
可能な光学的文字読取装置を提供することができる。
【0037】請求項2記載の発明によれば、帳票に記録
される文字が横又は縦書きの文字列であった場合は、文
字と認め得る属性値を文字の中心位置とすることによ
り、その文字列からはみでた文字以外のパターンを文字
認識処理の対象から有効に排除できるので、オペレータ
の負担軽減を図ると共に、請求項1記載と比較してより
効率的に帳票の読取処理を行うことの可能な光学的文字
読取装置を提供することができる。
【図面の簡単な説明】
【図1】本発明の光学的文字読取装置の一実施例を示す
概略構成図である。
【図2】図1に示す光学的文字読取装置の文字抽出部の
作用を説明するための図である。
【図3】図1に示す光学的文字読取装置の文字抽出部の
作用を説明するための図である。
【図4】図1に示す光学的文字読取装置の動作手順を説
明するためのフローチャートである。
【図5】文字以外にごみ,汚れ等が付着している帳票を
示す図である。
【符号の説明】
3 射影検出部(検出手段) 6 文字抽出部(抽出手段) 7 許容値記憶部(記憶手段) 8 認識部 10 帳票 12 文字 13 文字以外(ごみ,汚れ等) d 許容値 Hi 高さの中心座標(文字と認め得る属性値)

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 文字と認め得る属性値を有するパターン
    が記録された帳票を、光学的に走査して帳票イメージを
    検出し、その帳票イメージに含まれるパターンを切出し
    て、その切出したパターンについて文字認識処理を行う
    光学的文字読取装置において、前記文字と認め得る属性
    値の許容値を記憶する記憶手段と、前記帳票イメージに
    基づいて、前記パターン毎にその属性値を検出する検出
    手段と、前記切出されたパターン毎にその属性値が前記
    許容値内であるか否かの判断を行い、許容値内となるパ
    ターンのみを抽出して前記文字認識処理に供する抽出手
    段とを有することを特徴とする光学的文字読取装置。
  2. 【請求項2】 前記文字と認め得る属性値は、文字の中
    心位置とする請求項1記載の光学的文字読取装置。
JP4054694A 1992-03-13 1992-03-13 光学的文字読取装置 Pending JPH05258106A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4054694A JPH05258106A (ja) 1992-03-13 1992-03-13 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4054694A JPH05258106A (ja) 1992-03-13 1992-03-13 光学的文字読取装置

Publications (1)

Publication Number Publication Date
JPH05258106A true JPH05258106A (ja) 1993-10-08

Family

ID=12977909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4054694A Pending JPH05258106A (ja) 1992-03-13 1992-03-13 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JPH05258106A (ja)

Similar Documents

Publication Publication Date Title
JPH0546591B2 (ja)
JP3571128B2 (ja) 図面の寸法数値認識方法及びその装置
JPH05258106A (ja) 光学的文字読取装置
JPS63204487A (ja) 文字読取方法
JP2613959B2 (ja) 指紋紋様分類装置
JPH0291789A (ja) 文字認識方法
JPS6162983A (ja) 楽譜読取装置
JPH07230525A (ja) 罫線認識方法及び表処理方法
JP2894111B2 (ja) 光学式活字文字認識装置における認識結果の総合判定方式
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2925270B2 (ja) 文字読取装置
JP2877380B2 (ja) 光学的文字読取装置
JPH06111057A (ja) 光学的文字読取装置
JP2606816B2 (ja) 文字読取装置
JPH0855185A (ja) 文字認識装置
JPS5949671A (ja) 光学的文字読取装置
JPH06274689A (ja) 文字認識装置
JP2832035B2 (ja) 文字認識装置
JPH11161739A (ja) 文字認識装置
JPH0557632B2 (ja)
JPH0628521A (ja) 光学的文字読取装置
JPH11250179A (ja) 文字認識装置および文字認識方法
JP4218179B2 (ja) パターン検出装置及び方法
JP2643092B2 (ja) 文書書式上の事前定義されたフィールドの外側に位置する標準外データを処理する方法およびシステム
JPH05298488A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees