JP2877380B2 - 光学的文字読取装置 - Google Patents

光学的文字読取装置

Info

Publication number
JP2877380B2
JP2877380B2 JP1258772A JP25877289A JP2877380B2 JP 2877380 B2 JP2877380 B2 JP 2877380B2 JP 1258772 A JP1258772 A JP 1258772A JP 25877289 A JP25877289 A JP 25877289A JP 2877380 B2 JP2877380 B2 JP 2877380B2
Authority
JP
Japan
Prior art keywords
character
pattern
contact
protruding
entry frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1258772A
Other languages
English (en)
Other versions
JPH03122786A (ja
Inventor
豊志 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP1258772A priority Critical patent/JP2877380B2/ja
Publication of JPH03122786A publication Critical patent/JPH03122786A/ja
Application granted granted Critical
Publication of JP2877380B2 publication Critical patent/JP2877380B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、帳票に設けられた非ドロップアウトカラー
による文字記入枠内に記入された文字の読取りを行なう
光学的文字読取装置に関する。
(従来の技術) 一般に、帳票に記入された文字を読取る光学的文字読
取装置においては、帳票に設けられた文字記入位置を示
す枠内を文字読取りの対象としている。帳票に設けられ
た文字記入位置を示す枠(文字記入枠)が黒い枠(非ド
ロップアウトカラー)によって印刷等がされている場
合、文字記入枠内に記入する文字が枠に接触したり、は
み出さないことが文字記入条件となっている。
近年では、第2図に示す払込通知票のような、一般の
人によって文字が記録される帳票を、光学的文字読取装
置によって読取りを行なう場合が増えてきている。しか
しながら、一般の人によって文字の記入が行われるた
め、文字が文字記入枠へ接触したり、はみ出して記入さ
れる場合が非常に多くなっている。このような文字が正
確に記入されない場合であっても、そのまま文字認識処
理が実行されてしまう。このため、正確に文字記入枠内
に記入されない文字については、文字認識率が大きく低
下してしまうことがあった。特に、払込通知票等におけ
る口座番号や、金額等の数字文字データについて誤読す
ると大きな問題が生じてしまう。
(発明が解決しようとする課題) このように、帳票に設けられた文字記入枠内に記入さ
れた文字が、枠に接触したり、はみ出しているような場
合には、文字認識率が低下してしまうという問題があっ
た。
本発明は前記のような点に鑑みてなされたもので、文
字記入枠に記入された文字が、枠に接触・はみ出してい
るような場合であっても、好適な文字読取り結果を得る
ことが可能な光学的文字読取装置を提供することを目的
とする。
[発明の構成] (課題を解決するための手段) 本発明は、帳票の文字記入枠内に記入された文字の前
記文字記入枠に対する接触・はみ出し状態を検出する接
触・はみ出し状態検出手段と、この接触・はみ出し状態
検出手段によって接触・はみ出しが検出された文字につ
いて、接触・はみ出した部分を除いた前記文字記入枠内
に存在する部分文字パターンを検出する文字パターン検
出手段と、読取りの対象とする複数の文字毎に、文字記
入枠への接触・はみ出しによって形成される部分文字パ
ターンの文字認識処理に用いられる標準文字パターンを
格納するための辞書格納手段と、接触・はみ出し状態検
出手段によって検出された文字の前記文字記入枠に対す
る接触・はみ出し状態に応じて、辞書格納手段に格納さ
れた標準パターンを読出し、文字パターン検出手段によ
って検出された前記部分文字パターンについて文字認識
処理を行なう文字認識処理手段とを具備して構成するも
のである。
さらに、接触・はみ出し状態は、文字記入枠の上下左
右の各方向に対する文字の接触・はみ出し数によって示
し、標準パターンは文字記入枠の上下左右の各方向にお
ける接触・はみ出し数毎にそれぞれ対応して辞書格納手
段に格納されるようにするものである。
(作用) このような構成によれば、文字記入枠に接触・はみ出
しで記入された文字については、辞書格納部に格納され
た一般の標準文字パターンと異なった接触・はみ出して
記入された文字用の特定の標準文字パターンを用いて文
字認識処理が実行される。また、接触・はみ出して記入
された文字用の標準文字パターンは、読取り対象とする
文字のそれぞれについて辞書格納部に格納されるため、
文字記入枠への接触・はみ出しによって形成される部分
文字パターンが、他の文字に類似するような場合であっ
ても、少なくとも誤読することを防ぐ(リジェクトさせ
る)ことができる。
(実施例) 以下、図面を参照して本発明の一実施例を説明する。
第1図は同実施例に係わる光学的文字読取装置における
文字認識処理を行なう機能部分の構成を示すブロック図
である。同図において、11は帳票から光学的に読み取っ
た文字行一行分の2値化パターンを格納するためのライ
ンバッファである。ラインバッファ11には、文字切出し
回路12、及び文字認識回路13が接続されている。文字認
識回路12は、ラインバッファ11に格納された文字行一行
分の2値化パターンから、1文字分の文字パターンを検
出するものである。文字認識回路13は、文字切出し回路
12によって検出された文字パターンについて、辞書メモ
リ14に格納された標準パターンをもとに、1文字毎に文
字認識処理を行なうものである。辞書メモリ14には、文
字記入枠への接触・はみ出しがないように記入された文
字の文字パターンを認識するための標準パターンをはじ
め、接触・はみ出しによる部分文字パターン(文字記入
枠内に存在するパターン)を認識するための標準パター
ンが文字記入枠への接触・はみ出し状態毎に格納されて
いる。
次に、同実施例の動作を説明する。
ここでは、第2図に示すような帳票を文字読取り処理
の対象とするものとする。まず、第2図に示す帳票につ
いて、スキャナ装置等において光学的に走査を行ない、
帳票イメージの検出を行なう。帳票イメージが検出され
ると、予め設定された読取制御情報に基づいて、文字読
取り処理の対象とする領域(行)のイメージが検出され
る。なお、読取り制御情報に基づいて実行される処理に
ついては説明を省略する。第2図に示す帳票の場合、デ
ータ行(口座番号,金額が記入される行)の行イメージ
が検出され、図中Aのデータラインを介して、ラインバ
ッファ11に転送される。ラインはバッファ11に1行分の
イメージデータが転送されると、図示せぬ回路(例えば
装置全体の制御を司る制御回路)から図中Bの制御ライ
ンを介して、文字切出し回路12に対して文字切出し開始
信号が与えられる。文字切出し回路12は、文字切出し開
始信号を入力すると、図中Cのデータラインを介してラ
インバッファ11を走査して、1文字分の文字パターンの
検出を行なう。文字切出し回路12は、次のようにして文
字パターンの検出を行なう。まず、ラインバッファ11に
格納された1行分のイメージパターンから、第3図に示
すように、水平(X方向)・垂直(Y方向)のそれぞれ
の方向別ヒストグラムを求め、この方向別ヒストグラム
をもとに文字記入枠の抽出を行なう。文字記入枠の判別
は、X方向,Y方向のそれぞれのヒストグラムにおいて、
ヒストグラム値があるスライスレベル以上であり、尚且
つそのヒストグラムの座標が、予め想定された枠サイズ
を示すピッチ(例えば読取制御情報によって与えられ
る)の誤差範囲内であるか否かによって行なう。文字記
入枠の抽出が終了すると、文字切出し回路12は、上下左
右のそれぞれの文字記入枠線と文字パターン(文字線)
とが交差(接触)している数(接触・はみ出しクリップ
数)を第4図に示すようにして求める。ここでは、左側
文字枠線に対しての接触・はみ出しクリップ数を
(L)、同様にして右側(R)、上側(T)、下側
(B)とする。第4図は、数字「0」が左側文字枠線に
対してはみ出している例を示すものである。接触・はみ
出しクリップ数の検出方法は、例えば各文字記入枠線の
内側(文字側)の1ビットを走査して、白ビット(例え
ば“0")から黒ビット(例えば“1")に変化する変化点
数を求める。第4図においては、C1,C2において白から
黒に変化していることが検出され、変化点数=2が左側
文字記入枠線の接触・はみ出しクリップ数(L)とな
る。こうして、第4図に示す数字「0」の接触・はみ出
しクリップ数は、(L)=2、(R)=0、(T)=
0、(B)=0となる。次に、文字切出し回路12は、文
字記入枠のパターンを除去し、文字記入枠内に位置する
文字パターン(部分文字パターン)を抽出する。こうし
て得られた文字パターン(部分文字パターン)は、デー
タラインCを介して文字認識回路13に転送される。ただ
し、文字記入枠に対する接触・はみ出しのない文字パタ
ーンについては、通常の文字パターンが転送されること
になる。また、文字切出し回路12は、文字記入枠におけ
る接触・はみ出しクリップ数を、部分文字パターン(文
字パターン)の付加情報として文字認識回路13に転送す
ると共に、信号ラインDを介して文字認識処理の開始を
指示する認識開始信号を出力する。文字認識回路13は、
文字切出し回路12からの認識開始信号を入力すると、デ
ータラインCを介して入力した文字パターン(部分文字
パターン)について、辞書メモリ14に予め格納された読
取りの対象とする各文字についての標準パターンとの照
合を行なうことによって文字認識処理を行なう。文字認
識処理に用いられる辞書メモリ14には、第5図に示すよ
うに、辞書エントリポイントが設定され、標準パターン
が格納されている。第5図は、数字の文字パターンを認
識するために用いられる辞書のエントリポイントを示す
ものである。すなわち、辞書メモリ14には、読取りの対
象とする文字のそれぞれについて、各文字記入枠線への
接触・はみ出しクリップ数の組(接触・はみ出し状態)
毎に辞書エントリポイントが設定され、接触・はみ出し
状態に応じた標準パターンが格納される。例えば、数字
「0」の文字パターンを認識するための認識辞書は、上
下左右の文字記入枠への接触・はみ出しがないパターン
用の辞書(L=0,R=0,T=0,B=0)、左側文字記入枠
線のみにクリップ数=2ではみ出したパターン(第4図
に示すようなパターン)用辞書(L=2,R=0,T=0,B=
0)、下側文字記入枠線のみにクリップ数=2ではみ出
したパターン用辞書(L=0,R=0,T=0,B=2)、及び
前記条件を満足しないその他のパターン用辞書(L=
*,R=*,T=*,B=*)で構成されている。同様に、他
の文字についても、各文字によって可能性のある接触・
はみ出し状態毎に辞書が構成される。
文字認識回路13は、認識対象とする文字パターン(部
分文字パターン)の付加情報として入力した接触・はみ
出しクリップ数に応じた辞書エントリポイントによって
示される辞書(標準パターン)を辞書メモリ14から呼出
し、文字パターンと照合を行なうことによって文字を認
識する。こうして文字認識結果(文字コード)が得られ
ると、文字認識回路13は、この認識結果をデータライン
Eへ出力する。さらに、文字認識回路13は、1文字分の
文字認識が終了すると、信号ラインFを介して、1文字
認識終了信号を文字切出し回路12に出力する。これによ
って、文字切出し回路12は、ラインバッファ11に格納さ
れたイメージから、次の文字認識処理の対象とする文字
パターンの切出しを開始する。
以下同様な処理を繰り返して、各文字記入枠内に存在
する文字パターン(部分文字パターン)を切出して、文
字認識処理を行なう。
ここで、文字認識処理の一例について説明する。第2
図中の(a)の文字記入枠における文字パターンは、下
側枠線をクリップ数=2ではみ出しているため(第3図
参照)、文字切出しの際の枠パターン除去によって第6
図(a)のような部分文字パターンとなる。このような
部分文字パターンについても、辞書メモリ14に文字パタ
ーンの下部が欠けた文字パターン用の辞書が格納されて
いれば数字「6」であると認識することができる。ま
た、第2図中(b)の文字記入枠内における文字パター
ンは、左側枠線をクリップ数=3ではみ出しているた
め、文字切出しの際の枠パターン除去によって第6図
(b)のどうな部分文字パターンとなる。この部分文字
パターンは、数字「3」と類似しているが、左側文字枠
へのクリップ数=3の辞書(数字「8」用の辞書として
容易される)を用いて文字認識処理されるので、少なく
ともリジェクトして数字「3」に誤読されることを防ぐ
ことができる(ただし、数字「3」用の辞書に左側文字
枠へのクリップ数=3の辞書が用意されていない場
合)。同様に、第2図中(c)の文字記入枠における文
字パターンは、枠パターン除去によって第6図(c)の
ような部分文字パターンとなるが、この部分文字パター
ン用の辞書を用意することによって、数字「7」に誤読
されることを防ぐことができる。なお、第2図中(d)
の文字記入枠における部分文字パターンは、図中に示す
ようなクリップによって他と間違い易い相手文字が無
い。このため、特にクリップして得られる部分文字パタ
ーン用の辞書を用意する必要がなく、一般的な数字
「5」用の辞書を用いて文字認識処理を行なうようにす
れば良い。また、数字「3」も同様に、左側文字枠へク
リップした場合であっても、他と間違い易い相手文字が
無いため、一般的な数字「3」用の辞書を用いて文字認
識処理を行なうようにすれば良い。これより、左側枠線
をクリップ数=3ではみだし数字「8」の部分文字パタ
ーンについて文字認識を行なう場合に、数字「3」用の
辞書が選択されない。
このようにして、文字記入枠への接触・はみ出し方
向、及びクリップ数別に、部分文字パターンについて文
字認識処理に用いられる認識辞書(標準パターン)を用
意することにより、帳票に記入された文字が文字記入枠
(黒枠等の非ドロップアウトカラー)に接触・はみ出し
ている場合であっても、部分文字パターン用の認識辞書
を用いて対処するので、少なくとも誤読することを防ぐ
ことができる。
また、従来、非ドロップアウトカラーによる文字記入
枠に接触・はみ出した文字パターンを切り出すことが困
難であるために、文字記入枠はドロップアウトカラーに
よって印刷等されていた。しかしながら、本発明では、
文字記入枠に対する接触・はみ出しによる部分文字パタ
ーンについて認識処理を実行することができる。従っ
て、文字記入枠を必ずしもドロップアウトカラーにする
必要がないため、これに応じた特定の光源を用いる必要
がなく、一つの光源を用いて帳票のイメージを検出し、
文字認識を行なうことができる。
[発明の効果] 以上のように本発明によれば、帳票に設けられた文字
記入枠に接触・はみ出して記入された文字の文字パター
ン(部分文字パターン)について文字認識処理を行なう
ための辞書を接触・はみ出し状態毎に用意しているの
で、文字が枠に接触・はみ出している場合であっても、
この辞書を用いて文字認識処理を行なうことにより、好
適な文字読取り結果を得ることができるものである。
【図面の簡単な説明】
第1図は本発明の一実施例に係わる光学的文字読取装置
における文字認識装置を行なう機能部分の構成を示すブ
ロック図、第2図は文字読取処理の対象とする帳票の一
例を示す図、第3図は文字記入枠抽出の処理を説明する
ための図、第4図は文字記入枠に対する文字パターンの
接触・はみ出しクリップ数を求める処理を説明するため
の図、第5図は各文字の接触・はみ出しクリップ数と辞
書エントリポイントとの対応を示す図、第6図は部分文
字パターンの一例を示す図である。 11…ラインバッファ、12…文字切出し回路、13…文字認
識回路、14…辞書メモリ

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】帳票に設けられた文字記入枠内に記入され
    た文字の読取りを行なう光学的文字読取装置において、 前記帳票の文字記入枠内に記入された文字の前記文字記
    入枠に対する接触・はみ出し状態を検出する接触・はみ
    出し状態検出手段と、 前記接触・はみ出し状態検出手段によって接触・はみ出
    しが検出された文字について、接触・はみ出した部分を
    除いた前記文字記入枠内に存在する部分文字パターンを
    検出する文字パターン検出手段と、 読取りの対象とする複数の文字のそれぞれについて、文
    字記入枠への接触・はみ出しによって形成される部分文
    字パターンの文字認識処理に用いられる標準文字パター
    ンを、前記接触・はみ出し状態毎に格納するための辞書
    格納手段と、 前記接触・はみ出し状態検出手段によって検出された文
    字の前記文字記入枠に対する接触・はみ出し状態に応じ
    て、前記辞書格納手段に格納された標準パターンを読出
    し、前記文字パターン検出手段によって検出された前記
    部分文字パターンについて文字認識処理を行なう文字認
    識処理手段と、 を具備したことを特徴とする光学的文字読取装置。
  2. 【請求項2】前記接触・はみ出し状態は、前記文字記入
    枠の上下左右の各方向に対する文字の接触・はみ出し数
    によって示し、前記標準パターンは、前記文字記入枠の
    上下左右の各方向における接触・はみ出し数毎にそれぞ
    れ対応して前記辞書格納手段に格納されることを特徴と
    する第1請求項記載の光学的文字読取装置。
JP1258772A 1989-10-05 1989-10-05 光学的文字読取装置 Expired - Lifetime JP2877380B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1258772A JP2877380B2 (ja) 1989-10-05 1989-10-05 光学的文字読取装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1258772A JP2877380B2 (ja) 1989-10-05 1989-10-05 光学的文字読取装置

Publications (2)

Publication Number Publication Date
JPH03122786A JPH03122786A (ja) 1991-05-24
JP2877380B2 true JP2877380B2 (ja) 1999-03-31

Family

ID=17324870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1258772A Expired - Lifetime JP2877380B2 (ja) 1989-10-05 1989-10-05 光学的文字読取装置

Country Status (1)

Country Link
JP (1) JP2877380B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003099708A (ja) * 2001-09-21 2003-04-04 Toshiba Corp 文字認識装置、区分機、文字認識方法及び区分方法
JP5677139B2 (ja) * 2011-03-07 2015-02-25 三菱電機株式会社 帳票文字認識装置

Also Published As

Publication number Publication date
JPH03122786A (ja) 1991-05-24

Similar Documents

Publication Publication Date Title
JP2877380B2 (ja) 光学的文字読取装置
JP3794285B2 (ja) 光学式文字読取装置
JPS6316795B2 (ja)
JP2630261B2 (ja) 文字認識装置
JP2925270B2 (ja) 文字読取装置
JPH06111057A (ja) 光学的文字読取装置
JPS6160184A (ja) 光学的文字読取装置
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP3006294B2 (ja) 光学的文字読取装置
JP2573665B2 (ja) 光学文字読取装置
JP2978801B2 (ja) 手書き文字認識の文字入力方式
JP3045086B2 (ja) 光学式文字読取方法および装置
JP2002074269A (ja) 文字認識方法
JPS5972577A (ja) 図面読取装置
JPS61290581A (ja) 検索情報抽出記憶装置
JPS62134767A (ja) 記号名・線分名の自動抽出装置
JPS61163477A (ja) 文字認識装置
JPS6020786B2 (ja) 文字読取装置
JPS62295191A (ja) 光学文字画像読取装置
JPH01280886A (ja) 光学文字読取装置
JPH01177177A (ja) 光学文字読取装置
JPH1040338A (ja) 光学式文字読取装置
JPH0221384A (ja) 光学文字読取装置
JPH08185475A (ja) 画像認識装置
JPH10307892A (ja) 文字認識装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080122

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090122

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100122

Year of fee payment: 11