JP2000020641A - 文字認識システム - Google Patents

文字認識システム

Info

Publication number
JP2000020641A
JP2000020641A JP10191724A JP19172498A JP2000020641A JP 2000020641 A JP2000020641 A JP 2000020641A JP 10191724 A JP10191724 A JP 10191724A JP 19172498 A JP19172498 A JP 19172498A JP 2000020641 A JP2000020641 A JP 2000020641A
Authority
JP
Japan
Prior art keywords
character
contact
frame
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP10191724A
Other languages
English (en)
Inventor
Mitsuru Takiguchi
充 瀧口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10191724A priority Critical patent/JP2000020641A/ja
Publication of JP2000020641A publication Critical patent/JP2000020641A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 枠線に囲まれた枠に記載された文字の認識率
を向上する。 【構成】 イメージバッファ61に保持された帳票イメ
ージ中の枠位置が、枠線検出部63によって検出され、
該枠線における文字の線分が接触した部分が接触検出部
65及び形状抽出部に67によって求められる。この文
字の線分に接触した部分以外の枠線が、イメージ消去部
59によって消去される。文字切出し部64は、枠に接
触を有する文字に対しては、その枠内ばかりでなく、枠
外に範囲を拡張したイメージから文字領域を切出す。こ
の切出された領域の特徴に基づき、文字認識部65が、
文字認識を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、読取対象の帳票イメー
ジ中の文字の認識を行う文字認識装置(以下、CRUと
いう)を使用し、文字認識結果とそれに対応するイメー
ジの両方を表示する文字認識システム等に関するもので
ある。
【0002】
【従来の技術】図2は、従来の文字認識システムの全体
を示す構成図であり、図3は、図2中のワークステーシ
ョン10を示す構成図であり、図4は、図2中のCRU
20を示す構成図である。この文字認識システムは、ワ
ークステーション(WS)10と、該ワークステーショ
ン10に接続されたCRU20とで構成されている。ワ
ークステーション10には、ディスプレイ10a等の表
示手段と図示しないキーボードやスキャナ等の入力手段
とが設けられている。
【0003】ワークステーション10の内部には、帳票
イメージを保存する帳票イメージ部11と、帳票イメー
ジの読取フィールドを切出して保存するフィールドイメ
ージ部12と、読取対象の読取フィールドのイメージに
おける枠線に関する情報や書式形態等を表わすフォーマ
ット情報を格納するフォーマット情報部13と、認識結
果保存部14と、イメージをディスプレイ10aに表示
するイメージ表示部15と、認識結果を該ディスプレイ
10aに表示する認識結果表示部16と、これらの各部
11〜16を制御するワークステーション制御部(WS
制御部)17とを備えている。認識結果保存部14は、
CRU20から受信した認識結果を保存するものであ
る。CRU20は、イメージを格納するイメージバッフ
ァ21と、フォーマット情報を格納するフォーマットバ
ッファ22と、イメージ中の枠位置を検出する枠検出部
23と、イメージから文字単位の領域を切出す文字切出
し部24と、文字単位の領域中の文字パタンに対する文
字認識を行う文字認識部25と、これら各部21〜25
の制御を行うと共にワークステーション制御部17に対
して通信を行う制御部26とを、備えている。
【0004】次に、従来の図2の文字認識システムの動
作を、次の図5〜図11を参照しつつ、説明する。図5
は、帳票イメージの例を示す図であり、図6は、図5の
読取フィールドイメージを示す図である。ワークステー
ション10側では、例えば汎用のスキャナー等の入力手
段を使用して読取り対象の帳票イメージ30を取得し、
帳票イメージ部11に保存する。認識対象の帳票に例え
ば枠線で囲まれた複数の枠があり、そこに手書き文字が
記入されている場合、図5のように、帳票イメージ30
にも枠線31で囲まれた枠32と文字パターン33とが
現れる。ワークステーション制御部17は、予め、フォ
ーマット情報部に格納されたフォーマット情報に基づ
き、帳票イメージ30中の所定位置の読取フィールドの
イメージ34を切出してフィールドイメージ部12に保
存すると共に、該イメージ34をCRU20の制御部2
6に送信する。
【0005】図7は、図6に関するフォーマット情報を
示す図である。フィールド情報には、図7のように、図
6のイメージ34中で枠線31で囲まれた記載領域の枠
32の高さh、ピッチP及び文字数の情報が含まれてい
る。ワークステーション制御部17は、高さhとピッチ
Pと文字数とで構成された情報も、イメージ34と同時
に送信する。CRU20側の制御部26は、ワークステ
ーション10から送られた読取フィールドのイメージ3
4をイメージバッファ21に格納し、フォーマット情報
をフォーマットバッファ22に格納する。
【0006】図8は、図2中のCRU20で行う文字認
識のフローチャートである。図9は、図8中の枠検出処
理S1の概要を示す図であり、図10は、図8中の文字
切出し処理S2の概要を示す図である。CRU20は、
次のようにして図8の処理S1〜S4を行うことによ
り、文字認識を行う。
【0007】まず、最初の枠検出処理S1において、枠
検出部23は、図9のように、イメージバッファ21に
格納されたイメージ34の垂直投影と水平投影とを行
い、垂直投影結果35のヒストグラム及び水平投影結果
36のヒストグラムと、フォーマットバッファ22に格
納されたフォーマット情報とから、イメージ34におけ
る枠線31の位置37を求め、これらから枠位置38を
求めて保持する。枠検出処理S1の後の文字切出し処理
S2において、文字切出し部24は、図10のように、
枠位置38に基づき枠32の内側39における文字パタ
ーン33が含まれた文字領域40を切出す。文字切出し
処理S2の後の、文字認識処理S3において、文字認識
部25は、文字領域40の特徴から文字認識を行い、文
字パターン33に対応する文字コードを抽出して制御部
26に与える。文字認識処理S3の次の処理S4では、
制御部26が全文字に対する文字認識が終了したか否か
を判定し、終了していなければ、処理を処理S2に戻
し、全文字の文字認識が終了していれば、CRU20で
文字認識のフローを停止し、認識結果をワークステーシ
ョン制御部17に転送する。
【0008】図11は、図2中のディスプレイ10aの
表示を示す図である。認識結果が転送されたワークステ
ーション制御部17は、認識結果を認識結果保存部14
に保存する。イメージ表示部15は、フィールドイメー
ジ部12に保存されたイメージ34をディスプレイ1a
に表示し、認識結果表示部16は、認識結果保存部14
に保持された認識結果41を、イメージ34と同時にデ
ィスプレイ1aに表示し、オペレータに確認や訂正を実
施させる。
【0009】
【発明が解決しようとする課題】しかしながら、従来の
図2の文字認識システムでは、次のような課題があっ
た。図12は、図2の課題を示す説明図である。読取帳
票の設定された枠内に、正規に文字が記入されている場
合には、イメージ34でも、枠32の内側に文字パター
ン33が存在するので、文字切出し処理S2及び文字認
識処理S3で、正しい文字コードを抽出できる。ところ
が、図12のように、文字が枠からはみ出して記載され
た場合に、文字切出し処理S2によって切出される領域
40には、図12のように、文字パターン33の一部が
欠けた文字パターン42が切出される。そのため、文字
認識処理S3を行っても、結果的に誤読或いは不読にな
ってしまうという課題があった。
【0010】
【課題を解決するための手段】前記課題を解決するため
に、本発明の内の第1の発明は、文字認識システムにお
いて、次のような構成にしている。即ち、枠線に囲まれ
た枠に文字が記載された帳票のイメージを入力する入力
手段と、前記イメージ中の前記枠線の位置を検出する枠
線検出部と、前記枠線のうちの前記文字を形成する線分
に接触を有する接触枠線を検出し、該文字が前記枠に接
触を持つ接触文字か接触を持たない非接触文字かを判断
する接触検出部と、前記接触枠線の前記枠の内側に接触
する前記接触文字の線分数及びその接触箇所の開始点と
終点の座標と、該接触枠線の該枠の外側に接触する線分
数及びその接触箇所の開始点と終点の座標とを接触情報
として求める形状抽出部と、前記接触情報に基づき、前
記接触枠線の前記線分に接触していない部分を求め、前
記イメージから消去するイメージ消去部と、前記非接触
文字に対しては、前記イメージの前記枠内の部分から該
非接触文字が含まれる領域を切出し、前記接触文字に対
しては、該枠外で該接触文字が終了する位置を求め、該
イメージの該枠内から該接触文字が終了する位置までの
部分から該接触文字が含まれる領域を切出す文字切出し
部と、前記切出されたイメージに基づき前記文字に対す
る認識を行って文字コードを求める文字認識部とを、備
えている。
【0011】このような構成を採用したことにより、接
触枠線に接触或いは交差する線分を持つ接触文字が接触
検出部の判断により、求められる。接触文字が接する接
触枠線の接触部分以外のところが、イメージ消去部によ
って消去され、文字切出し部によって、接触文字が含ま
れるイメージの領域が切出される。この領域は、非接触
文字の場合の領域よりも、枠の外側に拡張されていると
共、認識の障害になる枠線がない。
【0012】第2の発明は、文字認識システムにおい
て、次のような構成にしている。即ち、第1の発明にお
ける入力手段、枠線検出部、接触検出部、形状抽出部、
イメージ消去部及び文字認識部と、前記接触文字以外の
印刷文字が前記枠外に有るか無いかを判断し、該印刷文
字が有る場合には該接触文字と該印刷文字との間の接触
の有無を調べ、該接触が有る場合には、該接触文字に不
読の認識結果を強制的に与えるプレ印刷接触部と、前記
非接触文字に対しては、前記イメージの前記枠内の部分
から該接触文字が含まれる領域を切出し、前記接触文字
のうち前記不読の認識結果が与えられていない文字に対
しては、前記枠外で前記接触文字が終了する位置を求
め、前記線分に接触していない部分が消去されたイメー
ジにおける該枠内から該接触文字が終了する位置までの
部分から該接触文字が含まれる領域を切出す文字切出し
部とを備えている。このような構成を採用したことによ
り、接触文字の内の印刷文字と接触する文字に対して
は、プレ印刷接触部により、強制的に不読の認識結果が
与えられる。
【0013】第3の発明では、文字認識システムにおい
て、次のような構成にしている。即ち、第1の発明にお
ける入力手段、枠線検出部、接触検出部、形状抽出部、
イメージ消去部及び文字認識部と、前記接触文字以外の
印刷文字が前記枠外に有るか無いかを判断し、該印刷文
字が有る場合には該接触文字と該印刷文字と間の接触の
有無を検出すると共に該印刷文字の端部の前記枠線から
の位置を求めるプレ印刷接触部と、前記プレ印刷接触部
で接触があると検出された前記接触文字を前記印刷文字
の端部の位置で切断するプレ印刷切断部と、前記非接触
文字に対しては、前記イメージの前記枠内の部分から該
非接触文字が含まれる領域を切出し、前記接触文字に対
しては、前記枠外で前記文字が終了する位置を求め、前
記線分に接触していない部分が消去されたイメージにお
ける該枠内から該接触文字が終了する位置までの部分か
ら該該イメージの該枠内から該接触文字が含まれる領域
を切出すか、または該枠内から前記切断の位置までの部
分から該接触文字が含まれる領域を切出す文字切出し部
とを、備えている。このような構成を採用したことによ
り、印刷文字と接触する接触文字がプレ印刷切断部によ
ってされた上で、文字認識部によって認識される。
【0014】第4の発明は、第3の発明の発明の文字認
識システムに、前記プレ印刷切断部で切断された接触文
字の欠落部分を補完する文字補完部を設けている。この
ような構成を採用したことにより、切断によって欠落し
た接触文字の欠落箇所が、文字補完部により、補完され
る。第5の発明は、第2〜第4の発明の文字認識システ
ムにおいて、前記印刷文字の有無と該印刷文字の位置と
は、前記枠線に沿って設定された任意数の探査線に接す
る線分数から求めるようにしている。
【0015】第6の発明では、文字認識システムにおい
て、次のような構成にしている。即ち、枠線に囲まれた
枠に文字が記載された表形式の帳票のイメージを入力す
る入力手段と、前記イメージ中の枠線の位置を検出する
枠線検出部と、前記枠線のうちの前記文字を形成する線
分に接触を持つ接触枠線を検出し、該文字が前記枠に接
触を持つ接触文字か接触を持たない非接触文字かを判断
する接触検出部と、前記接触枠線の前記枠内側に接触す
る前記接触文字の線分数及びその接触箇所の開始点と終
点の座標と、該接触枠線の前記枠外側に接触する線分数
及びその接触箇所の開始点と終点の座標とを接触情報と
して求める形状抽出部と、前記接触情報に基づき、前記
接触枠線の前記線分に接触していない部分を前記イメー
ジから消去するイメージ消去部と、前記接触文字の場合
には、前記イメージが前記表形式の帳票のイメージか否
かを判定し、表形式の場合には前記枠外側を探査するこ
とにより、該枠に記載された該接触文字と該枠外に記載
された該接触文字以外の別行文字との接触の有無を判断
し、該接触がある場合に、該接触文字に強制的に不読の
認識結果を与える外部記入接触部と、前記非接触文字に
対しては、前記イメージの前記枠内の部分から前記非接
触文字が含まれる領域を切出し、前記接触文字のうち前
記不読の認識結果が与えられていない文字に対しては、
該枠外で該接触文字が終了する位置を求め、前記線分に
接触していない部分が消去されたイメージにおける該枠
内から該接触文字が終了する位置までの部分から該接触
文字が含まれる領域を切出す文字切出し部と、前記切出
されたイメージに基づき前記文字に対する認識を行って
文字コードを求める文字認識部とを備えている。
【0016】このような構成を採用したことにより、外
部記入接触部により、表形式か否かが判断され、表形式
の場合には接触文字のうちの別行文字との接触の有る文
字には、強制的に不読の認識結果が与えられる。
【0017】第7の発明では、文字認識システムにおい
て、次のように構成している。即ち、第6の発明におけ
る入力手段、枠線検出部、接触検出部、形状抽出部、イ
メージ消去部及び文字認識部と、前記接触文字の場合に
は、前記イメージが前記表形式の帳票のイメージか否か
を判定する外部記入接触部と、前記イメージが前記表形
式の帳票のイメージと判断された場合に、前記枠外のイ
メージを解析することにより、該枠に記載された前記接
触文字と該枠外に記載された前記別行文字とが重なって
いるかどうかを判断し、重なっていると判断した場合に
は、該接触文字に強制的に不読の認識結果を与える外部
記入解析部と、前記非接触文字に対しては、前記イメー
ジの前記枠内の部分から該非接触文字が含まれる領域を
切出し、前記接触文字のうち前記不読の認識結果が与え
られていない文字に対しては、該枠外で該接触文字が終
了する位置を求め、前記線分に接触していない部分が消
去されたイメージにおける該枠内から該接触文字が終了
する位置までの部分から該接触文字が含まれる領域を切
出す文字切出し部とを備えている。このような構成を採
用することにより、外部記入解析部により、接触文字と
別行文字とが重なっているかどうかが判断され、重なっ
ている場合には、該接触文字に強制的に不読の認識結果
を与えられる。
【0018】第8の発明では、文字認識システムにおい
て、次のように構成している。即ち、第6の発明におけ
る入力手段、枠線検出部、接触検出部、形状抽出部、イ
メージ消去部及び文字認識部と、前記イメージが前記表
形式の帳票のイメージか否かを判定し、該表形式の帳票
のイメージの場合には前記枠内を探査し、該枠内に記載
された前記文字と該枠内に外部から侵入した別行文字の
端部との間に白領域が存在するか否かを判定して接触状
態を検出する侵入接触部と、前記枠内に記載された文字
と前記別行文字との端部との間に白領域が存在しない場
合に、該枠内を解析して該文字と該別行文字に重なりが
有る否かを検出し、該重なりが有る場合には、該枠に記
載された文字に対して強制的に不読の認識結果を与える
侵9解析部と、前記非接触文字のうちの前記不読の認識
結果が与えられていない文字に対しては、前記イメージ
の前記枠内の部分から該非接触文字が含まれる領域を切
出し、前記接触文字の該不読の認識結果が与えられてい
ない文字に対しては、該枠外で該接触文字が終了する位
置を求め、前記線分に接触していない部分が消去された
イメージにおける該枠内から該接触文字が終了する位置
までの部分から該接触文字が含まれる領域を切出す文字
切出し部とを備えている。このような構成を採用したこ
とにより、枠の外部から侵入した別行文字がある場合
に、枠内の文字のうち別行文字に接触した文字に対して
は強制的に不読の認識結果が与えられる。
【0019】第9の発明では、第1〜第8の発明の文字
認識システムにおいて、次のような構成にしている。即
ち、前記イメージと前記文字コードとを同時に表示する
表示手段手段と、前記イメージにおける前記文字を他の
部分に対して異なる色に設定して前記表示手段に表示す
る表示イメージ加工手段とを設けている。このような構
成にしたことにより、認識結果である文字と、イメージ
の文字とが表示手段に表示されるが、イメージにおける
文字が他の部分とは異なる色で表示される。
【0020】
【発明の実施の形態】第1の実施形態 図13は、本発明の第1の実施形態を示す文字認識シス
テムの構成図であり、図14は、図13中のワークステ
ーション50を示す構成図である。図1は、図13の文
字認識システムにおける本発明の第1の実施形態を示す
CRU60の構成図である。この文字認識システムは、
ワークステーション50と、該ワークステーション50
に接続されたCRU60とで構成されている。ワークス
テーション50には、ディスプレイ50a等の表示手段
と、図示しないキーボードやスキャナ等の入力手段とが
設けられている。
【0021】ワークステーション50の内部は、従来の
図3のワークステーション10と同様の構成であり、帳
票イメージを保存する帳票イメージ部51、帳票イメー
ジの読取フィールドを切出して保存するフィールドイメ
ージ部52と、読取対象のイメージにおける枠線に関す
る情報や書式形態等を表わすフォーマット情報を格納す
るフォーマット情報部53と、認識結果保存部54と、
該フィールドイメージ部52に保存されたイメージをデ
ィスプレイ50aに表示するイメージ表示部55と、認
識結果をディスプレイ50aに表示するイメージ表示部
56と、これらの各部51〜56を制御するワークステ
ーション制御部(WS制御部)57とを備えている。C
RU60は、図4のCRU20と同様に、イメージを格
納するイメージバッファ61と、フォーマット情報を格
納するフォーマットバッファ62と、帳票イメージ中の
枠位置を検出する枠検出部63と、イメージから文字単
位の領域を切出す文字切出し部64と、文字単位の領域
中の文字パタンに対する文字認識を行う文字認識部65
とを備えている。このCRU60には、さらに、従来に
はない、接触検出部66、形状抽出部67、文字推定部
68及びイメージ消去部69が設けられている。
【0022】接触検出部66は、文字と枠の接触を検出
するものであり、形状抽出部67は、文字が接触した枠
線の近傍の画像状態を求め、保存する手段である。文字
推定部68は、枠線上の文字部分を推定する手段であ
る。イメージ消去部69は、イメージ中の枠線の一部を
消去する手段である。以上の各部61〜69が制御部7
0に接続されている。制御部70は、各部61〜69を
制御すると共に、ワークステーション制御部57に対し
て通信する機能を有している。
【0023】次に、図13の文字認識システムの動作
を、従来技術の説明で用いた図5〜図7と、以下の図1
5〜図20とを参照しつつ、説明する。ワークステーシ
ョン50は、従来と同様に、汎用のスキャナー等を使用
して図5のような帳票イメージ30を取得し、帳票イメ
ージ部51に保存する。認識対9の帳票に、枠線で囲ま
れた複数の枠があり、そこに手書き文字が記入されてい
る場合、帳票のイメージ30にも枠線31で囲まれて枠
32と文字パターン33とが現れる。ワークステーショ
ン制御部57は、予め、フォーマット情報部53に格納
されたフォーマット情報に基づき、図6のように、帳票
イメージ30中の所定位置の読取フィールドのイメージ
34を切出し、フィールドイメージ部52に保存すると
共に、CRU60の制御部70に送信する。フィールド
情報には、図7のように、図6のイメージ34中で枠線
31で囲まれた記載領域の高さh、ピッチP及び文字数
の情報が含まれている。ワークステーション制御部17
は、高さhとピッチPと文字数とで構成された情報も、
読取フィールドのイメージ34と同時に制御部70へ送
信する。CRU60側の制御部70は、ワークステーシ
ョン50から送られたイメージ34をイメージバッファ
61に格納し、フォーマット情報をフォーマットバッフ
ァ62に格納する。
【0024】図15は、図1のCRU60で行う文字認
識のフローチャートである。CRU60は、次のように
して図15の処理S11〜S18を行うことにより、文
字認識結果を出力する。まず、最初の枠検出処理S11
において、枠検出部63は、従来の枠検出部23と同様
に、イメージバッファ61に格納されたイメージ34に
対し、図9の垂直投影と水平投影とを行い、垂直投影結
果35のヒストグラム及び水平投影結果36のヒストグ
ラムと、フォーマットバッファ62に格納されたフォー
マット情報とから、イメージ34における枠線31の位
置37を求め、これらから枠位置38を求めて保持す
る。
【0025】図16(a),(b)は、図15中の接触
判断処理S12の概要を示す図である。枠検出処理S1
1の後の接触判断処理S12において、接触検出部66
は、枠線31の内側近傍に沿線71を仮定し、図16
(a),(b)のように、該沿線71上の黒画素の探索
し、黒画素がない場合を接触無し、黒画素がある場合を
接触有りと判断する。即ち、枠32のうちの接触枠線と
これに接触を有する接触文字と、非接触の非接触文字と
が判断される。処理S12の判断結果が接触無しの場合
には、接触有りの場合に行われる処理S13〜S15が
省略されて文字切出し処理S16に進む。この文字切出
し処理S16では、文字切出し部64が従来の文字切出
し部24と同様に、図10の枠32の内側の領域中の文
字パターン33が含まれた領域40を切出す。続く文字
認識処理S17において、文字認識部65が、従来の文
字認識部25と同様に、領域40中の文字パターン33
の特徴から文字認識を行って文字コードを抽出し、制御
部70に出力する。処理S12の判断結果が接触有りの
場合には、初めに、次の図17のような接触抽出処理S
13を行う。
【0026】図17(a),(b)は、図15中の接触
抽出処理S13の概要を示す図である。接触抽出処理S
13において、形状抽出部67は、図17(a)のよう
に、イメージ34の枠32における枠線31の内側近傍
に沿線に探査線72を設定すると共に、外側近傍に沿線
に探査線73を設定し、該各探査線72,73上を探査
する。そして、形状抽出部67は、白画素が連続する部
分と黒画素が連続する部分との変化点の座標を求め、文
字の線分の交差箇所の開始点と終点を求め、枠線31と
文字パターン33の線分の接触情報として保持する。
【0027】例えば、図17において、内側の探査線7
2上で、最初に白画素が黒画素に変化する変化点IL1
と黒画素から白画素に変化する変化点IR1とから、文
字パターンの線分の1本が、枠32の内側から枠線31
に交わっていることが分かる。内側の探査線72上で、
次に白画素が黒画素に変化する変化点IL2と黒画素か
ら白画素に変化する変化点IR2とから、文字パターン
33の線分のさらにもう一本が、枠32の内側から枠線
31に交わっていることが分かる。形状抽出部67は、
この内側の交差情報の「2」と、各変化点IL1,IR
1,IL2,IR2の座標とを接触情報として保持す
る。同様に、外側の探査線73上で、最初に白画素が黒
画素に変化する変化点OL1と黒画素から白画素に変化
する変化点OR1とから、文字パターン33の線分の1
本が、枠32の外側に突出していることが分かる。外側
の沿線73上で、次に白画素が黒画素に変化する変化点
OL2と黒画素から白画素に変化する変化点OR2とか
ら、文字パターン33の線分のさらにもう一本が、枠3
2の外側に突出していることが分かる。形状抽出部67
は、この外側の交差情報の「2」と、各変化点OL1,
OR1,OL2,OR2の座標とを、接触情報として保
持する。
【0028】図18(a),(b)は、図15中の文字
推定処理S14の概要を示す図である。接触抽出処理S
13の後の文字推定処理S14において、文字推定部6
8は、形状抽出部67が保持する接触情報から、図18
(a)のように、枠線31上の文字パターン33の部分
74を推定し、文字パターン33以外の枠線31を消去
するための消去情報を図18(b)のように生成する。
文字パターン33の部分74は、例えば、図18の変化
点IL1,IR1,OR1,OL1に囲まれた領域と、
変化点IL2,IR2,OR2,OL2に囲まれた領域
の2個であると推定される。そのため、消去情報は、枠
線31の左端部の座標をILE,OLE、右端部の座標
IRE,OREとすると、図18(b)のように、枠線
31の消去領域が、座標ILE,IL1,OLE,OL
1で囲まれた領域と、座標IR1,IL2,OR1,O
L2で囲まれた領域と、座標IR2,IRE,OR2,
OREで囲まれた領域の合計3個になる。文字推定部6
8は、これらの領域の座標と、消去領域の個数を消去情
報として保持する。
【0029】図19は、図15中の枠消去処理S15の
概要を示す図である。文字推定処理S14の後の枠消去
処理S15において、イメージ消去部69は、イメージ
バッファ61に保持されたイメージ34から、文字推定
部68で保持された消去情報に対応する領域を除去す
る。これにより、図19のように、枠線に接触しない文
字パターン75が得られる。この文字パターン75は、
領域74で繋がっているので、本来、帳票に記載された
文字に極めて近いものになる。
【0030】図20(a),(b)は、図15中の文字
切出し処理S16の概要を示す図である。処理S12の
判断結果が接触有りの場合に行われる枠消去処理S15
の後の文字切出し処理S16では、枠32の内側の領域
を拡張した上で、文字パターン75を含む領域76を切
出す。枠32の内側の領域の拡張は、枠検出処理S11
で求めた枠位置の下側を、図20(b)のように枠線3
1に平行にスライスして探索し、黒画素が無くなる所ま
でに拡張する。文字切出し処理S16の後に行われる文
字認識処理S17は、処理S12の判断結果が接触ない
場合と同様に行われる。
【0031】文字認識処理S17の次の処理S18で
は、制御部70が全文字に対する文字認識が終了したか
否かを判定し、終了していなければ、処理をS12に戻
し、全文字の文字認識が終了していれば、CRU60で
文字認識のフローを停止し、認識結果をワークステーシ
ョン制御部57に転送する。認識結果が転送されたワー
クステーション制御部57は、認識結果を認識結果保存
部54に保持する。イメージ表示部55は、フィールド
イメージ部52に保存されたイメージ34をディスプレ
イ50aに表示し、認識結果表示部56は、認識結果保
存部54に保持された認識結果を、イメージ34と同時
にディスプレイ50aに表示し、オペレータに確認や訂
正を実施させる。
【0032】以上のように、この第1の実施形態では、
CRU60に接触検出部66、形状抽出部67、文字推
定部68、及びイメージ消去部69を設け、枠線31へ
の文字パターン33の接触情報を求め、枠線31上の文
字の領域74を求め、該領域74を除く枠線31を消去
するようにしたので、枠32からはみ出した文字や、枠
線31に接触した文字でも、適切な文字パターン75が
再現される。よって、文字認識システムの文字認識率を
向上できる。さらに、枠線31に接触した線分を抽出し
て他を消去するという簡便な方法を用いるので、公知技
術のラべリングや輪郭抽出等を行う場合によりも、短時
間に処理ができる。そのうえ、接触検出部66で接触の
有無を判断し、接触のあった文字のみ、処理S13〜S
15を行うので、枠線31に非接触の文字に対する処理
に対する処理速度を低下させることがない。
【0033】第2の実施形態 図21は、本発明の第2の実施形態を示す文字認識シス
テムの構成図であり、図22は、図21中のCRU80
を示す構成図である。これらの図21及び図22におい
て、第1の実施形態の図1及び図13中の要素と共通の
要素には共通の符号が付されている。この文字認識シス
テムは、第1の実施形態と同様のワークステーション5
0と、該ワークステーション50に接続された第1の実
施形態とは異なるCRU80とで構成されている。CR
U80は、図22のように、第1の実施形態のCRU6
0と同様のイメージバッファ61、フォーマットバッフ
ァ62、枠検出部63、文字切出し部64、文字認識部
65、接触検出部66、形状抽出部67、文字推定部6
8及びイメージ消去部69と、新たに設けられたプレ印
刷接触部81とを備えている。プレ印刷接触部81は、
イメージ34における枠32の近傍にある不要文字の検
出を行う機能を有している。このプレ印刷接触部81と
各部61〜69とが制御部82に接続されている。制御
部82はCRU80全体の制御を行うと共に、ワークス
テーション50中のワークステーション制御部57に対
して通信を行う機能を有している。
【0034】次に、図21の文字認識システムの動作
を、これまでの説明に用いた図7〜図20と、以下の図
23〜図25とを参照しつつ、説明する。図5のような
帳票イメージ30を取り込み、帳票の読取フィールドの
イメージ34を求め、該イメージ34における枠31の
高さhとピッチPと文字数とで構成された枠31に関す
るフィールド情報をイメージ34と共にCRU80に送
信するまでのワークステーション50の動作は、第1の
実施形態と同様である。CRU80側の制御部82は、
ワークステーション50から送られた読取フィールドイ
メージ34をイメージバッファ61に格納し、フォーマ
ット情報をフォーマットバッファ62に格納する。
【0035】図23は、図22中のCRU80で行う文
字認識のフローチャートである。この図23における図
15中の処理と共通の処理には共通の符号が付されてい
る。CRU80は、次のようにして、図23の第1の実
施形態と同様の処理S11〜S18と新たな処理S20
とを行うことにより、文字認識結果を出力する。まず最
初に、CRU80では、枠検出処理S11と接触判断処
理S12とを第1の実施形態と同様に行う。即ち、枠検
出処理S11において、枠検出部63は、イメージバッ
ファ61に格納されたイメージ34に対し、図9の垂直
投影と水平投影とを行い、垂直投影結果35のヒストグ
ラム及び水平投影結果36のヒストグラムと、フォーマ
ットバッファ62に格納されたフォーマット情報とか
ら、イメージ34における枠線31の位置37を求め、
これらから枠位置38を求めて保持する。接触判断処理
S12において、接触検出部66が、図16(a),
(b)のように、枠線31の内側近傍に探査線71を仮
定し、該探査線71上の黒画素の探索し、黒画素がない
場合を接触無し、黒画素がある場合を接触有りと判断す
る。
【0036】処理S12の判断結果が接触無しの場合に
は、図23の処理S13〜S15が省略されると共にプ
レ印刷接触処理S20とを省略し、文字切出し処理S1
6と文字認識処理S17とを第1の実施形態と同様に行
う。文字切出し処理S16と、該文字切出し処理16に
続く文字認識処理S17とによって、文字切出し処理1
6で切出された領域40中の文字パターン33に対応す
る文字コードが抽出され、これが制御部82に出力され
る。処理S12の判断結果が接触有りの場合には、第1
の実施形態と同様の接触抽出処理S13、文字推定処理
S14及び枠消去処理15とを行う。これらの処理S1
3〜S15により、枠線31と文字パターン33との接
触情報が求められ、該接触情報から枠線31上の文字パ
ターン33の部分74を除いた部分を消去するための消
去情報が求められ、該消去情報に基づきイメージ34中
の文字パターン33と接触した枠線31が消去され、図
19の文字パターン75が形成される。
【0037】図24は、プレ印刷文字を含むイメージ3
4を示す図である。図25は、図23中のプレ印刷接触
処理S20を示すフローチャートである。図26
(a),(b)は、図25中の形状抽出処理S20aの
概要を示す図である。図27(a),(b)は、図26
中のプレ印刷判断処理S20bの判断例を示す図であ
る。図28(a),(b)は、図25中の接触判断処理
S20cの概要を示す図である。帳票には、記入者の便
宜をはかるために、枠32の近傍にガイド文字等のプレ
印刷文字が印刷されたものがある。このような帳票に対
応するイメージ34には、図24のように、枠32の下
方に、プレ印刷文字83が現れる。
【0038】枠消去処理S15の次に行われるプレ印刷
接触処理S20では、次のようにして、図25の処理S
20a〜S20dを行うことにより、図24のイメージ
34中の文字パターン75における枠32の外側の形状
を求め、該イメージ34におけるプレ印刷文字83と文
字パターン75との接触状態を判別する。まず、最初の
形状抽出処理S20aにおいて、プレ印刷接触部81
は、図26(a)のように、イメージ34で消去された
枠線31の外側に、該枠線31に平行な探査線O1,O
2,…,ONを仮定し、該各探査線O1〜ONにおい
て、連続する黒画素と白画素の変化点の座標O1L1,
O1R1,O1L2,O1R2,…、O2L1,O2R
1,O2L2,O2R2,…、〜、ONL1,ONR
1,ONL2,ONR2,…をそれぞれ求めて各探査線
上O1〜ONに接触する接触線分数を求め、図26
(b)のように、形状情報として保持する。
【0039】形状抽出処理S20aの後のプレ印刷判断
処理S20bでは、プレ印刷接触部81は、保持した形
状情報に基づき、プレ印刷文字83の有無を判断する。
例えば、各探査線O1〜ONの接触線数が、図26
(b)のように、「2」「2」「1」「5」「6」
「9」…と多く、それがある値を越えたときには、プレ
印刷文字83が有ると判断すると共に、該プレ印刷文字
83の位置84を推定する。これに対し、図27(a)
のように、プレ印刷文字83がイメージ34の場合に
は、探査線O1〜ONの接触線分数が、図27(b)の
ように途中から「0」になり、合計線分数が少ないの
で、プレ印刷文字83が無いと判断する。プレ印刷文字
83が無い場合には、プレ印刷処理S20を終了する。
プレ印刷文字83が有る場合には、次の接触処理S20
cを行う。
【0040】接触処理S20cにおいて、プレ印刷接触
部81は、推定したプレ印刷文字83の位置84より
も、枠線31側の接触線分数に「0」があるか否かに、
よって文字パターン75とプレ印刷文字83とが接触し
ているか否かを判定する。例えば、図26(a),
(b)では、プレ印刷文字83の位置84が探査線O4
よりも下にあるので、探査線O4よりも枠線31に近い
探査線O1〜O3における接触線分数に「0」の有無を
調べる。接触線分数に「0」が無いので、文字パターン
75とプレ印刷文字83とが接触していると判断する。
図28(a),(b)のように、探査線O4よりも枠線
31に近い探査線O2に、接触線分数の「0」がある場
合には、文字パターン75とプレ印刷文字83との接触
は無いと判断する。接触が無いと判断した場合は、プレ
印刷接触処理S20を終了し、接触が有ると判断した場
合には、強制不読処理S20dを行う。処理S20cの
後の強制不読処理S20dにおいて、プレ印刷接触部8
1は、プレ印刷文字83に接触した文字パターン75に
対して、不読文字の認識結果を与えて、プレ印刷接触処
理S20を終了する。
【0041】プレ印刷接触処理S20の後に、不読とな
っていない文字パターンに対し、第1の実施形態と同様
の文字切出し処理S16と文字認識処理S17とを行
う。これらの文字切出し処理S16と文字認識処理S1
7により、枠32の内側の領域を拡張した上で、文字パ
ターン75を含む領域76が切出され、文字パターン7
5の特徴に応じた文字コードが抽出され、制御部82に
与えられる。文字認識処理S17の次の処理S18で
は、制御部82が全文字に対する文字認識が終了したか
否かを判定し、終了していなければ、処理をS12に戻
し、全文字の文字認識が終了していれば、CRU80で
文字認識のフローを停止し、認識結果をワークステーシ
ョン制御部57に転送する。
【0042】認識結果が転送されたワークステーション
制御部57は、認識結果を認識結果保存部54に保持す
る。イメージ表示部55は、フィールドイメージ部52
に保存されたイメージ34をディスプレイ50aに表示
し、認識結果表示部56は、認識結果保存部54に保持
された認識結果を、イメージ34と同時にディスプレイ
50aに表示し、オペレータに確認や訂正を実施させ
る。以上のように、この第2の実施形態では、CRU8
0に新たにプレ印刷接触部81を設けたので、第1の実
施形態と同様の効果を奏するばかりでなく、プレ印刷文
字83等の文字認識に不要な画像に接触した文字パター
ン75に対する文字認識結果を強制的に不読とするの
で、誤った認識結果を表示することを防止でき、オペレ
ータの負担を軽減できる。
【0043】第3の実施形態 図29は、本発明の第3の実施形態を示す文字認識シス
テムの構成図であり、図30は、図29中のCRU90
を示す構成図である。これらの図29及び図30におい
て、第2の実施形態の図21及び図22中の要素と共通
の要素には共通の符号が付されている。この文字認識シ
ステムは、第2の実施形態と同様のワークステーション
50と、該ワークステーション50に接続された第2の
実施形態とは異なるCRU90とで構成されている。
【0044】CRU90は、図30のように、第1の実
施形態のCRU60と同様のイメージバッファ61、フ
ォーマットバッファ62、枠検出部63、文字切出し部
64、文字認識部65、接触検出部66、形状抽出部6
7、文字推定部68及びイメージ消去部69と、第2の
実施形態のプレ印刷接触部81と、新たに設けられプレ
印刷切断部91とを備えている。プレ印刷切断部91
は、イメージにおける枠の外側近傍にある不要画像と文
字パターンとの切断を行う機能を有している。このプレ
印刷切断部91と図22と同様の各部61〜69,81
とが制御部92に接続されている。制御部92はCRU
90全体の制御を行うと共に、ワークステーション50
中のワークステーション制御部57に対して通信を行う
機能を有している。
【0045】次に、図29の文字認識システムの動作
を、これまでの説明に用いた図5〜図28と、以下の図
31〜図33とを参照しつつ、説明する。図5のような
帳票イメージ30を取り込み、帳票の読取フィールドの
イメージ34を求め、該イメージ34における枠31の
高さhとピッチPと文字数とで構成された枠31に関す
るフィールド情報をイメージ34と共にCRU90に送
信するまでのワークステーション50の動作は、第2の
実施形態と同様である。CRU90側の制御部92は、
ワークステーション50から送られた読取フィールドイ
メージ34をイメージバッファ61に格納し、フォーマ
ット情報をフォーマットバッファ62に格納する。
【0046】図31は、図30中のCRU90で行う文
字認識のフローチャートであり、第2の実施形態の図2
3中の処理と共通の処理には共通の符号が付されてい
る。CRU90は、次のようにして図31の処理S11
〜S18と新たな処理S30とを行うことにより、文字
認識結果を出力する。最初に、CRU90では、第1の
実施形態と同様の枠検出処理S11と接触判断処理S1
2とを行う。即ち、枠検出処理S11において、枠検出
部63は、イメージバッファ61に格納されたイメージ
34に対し、図9の垂直投影と水平投影とを行い、垂直
投影結果35のヒストグラム及び水平投影結果36のヒ
ストグラムと、フォーマットバッファ62に格納された
フォーマット情報とから、イメージ34における枠線3
1の位置37を求め、これらから枠位置38を求めて保
持する。
【0047】接触判断処理S12において、図16
(a),(b)のように、接触検出部66が、枠線31
の内側近傍に探査線71を仮定し、該探査線71上の黒
画素の探索し、黒画素がない場合を接触無し、黒画素が
ある場合を接触有りと判断する。処理S12の判断結果
が接触無しの場合には、図31の処理S13〜S15を
省略する共にプレ印刷接触処理S30を省略し、文字切
出し処理S16と文字認識処理S17とを第2の実施形
態と同様に行う。文字切出し処理S16と該文字切出し
処理S16に続く文字認識処理S17とによって、イメ
ージ34から切出された領域中の文字パターンに対応す
る文字コードが抽出され、これが制御部92に出力され
る。一方、処理S12の判断結果が接触有りの場合に
は、初めに、第1の実施形態の接触抽出処理S13、文
字推定処理S14及び枠消去処理S15とを、第1の実
施形態と同様に行う。これらの処理S13〜S15によ
り、枠線31と文字パターン33との接触情報が求めら
れ、該接触情報から枠線31上の文字パターンの部分7
4を除く枠線31を消去するための消去情報が求めら
れ、該消去情報に基づきイメージ34中の文字パターン
33と接触した枠線31が消去され、図19の文字パタ
ーン75が形成される。
【0048】図32は、図31中のプレ印刷接触処理S
30の詳細を示すフローチャートである。枠消去処理S
15の次には、第2の実施形態とは異なるプレ印刷接触
処理S30を行う。このプレ印刷接触処理S30では、
次のようにして、図32の処理S30a〜S30dを行
うことにより、図24におけるイメージ34中の文字パ
ターン75の枠32の外側の形状を求め、該イメージ3
4におけるプレ印刷文字83と文字パターン75との接
触状態を判別する。
【0049】まず、最初の形状抽出処理S30aにおい
て、プレ印刷接触部81は、図26(a)のように、イ
メージ34で消去された枠線31の外側に、該枠線31
に平行な探査線O1,O2,…,ONを仮定し、該各探
査線O1〜ONにおいて、連続する黒画素と白画素の変
化点の座標O1L1,O1R1,O1L2,O1R2,
…、O2L1,O2R1,O2L2,O2R2,…、〜
ONL1,ONR1,ONL2,ONR2,…をそれぞ
れ求めて各探査線上O1〜ONに接触する接触線分数を
求め、図26(b)のように、形状情報として保持す
る。形状抽出処理S30aの後のプレ印刷判断処理S3
0bでは、プレ印刷接触部81は、保持した形状情報に
基づき、プレ印刷文字83の有無を判断する。
【0050】例えば、各探査線O1〜ONの接触線数
が、図26(b)のように、「2」「2」「1」「5」
「6」「9」…と多く、それがある値を越えたときに
は、プレ印刷文字83が有ると判断すると共に、該プレ
印刷文字83の位置84を推定する。これに対し、図2
7(a)のように、プレ印刷文字83がイメージ34の
場合には、探査線O1〜ONの接触線分数が、図27
(b)のように途中から「0」になり、合計線分数が少
ないので、プレ印刷文字83が無いと判断する。プレ印
刷文字83が無い場合には、プレ印刷接触処理S30を
終了する。プレ印刷文字83が有る場合には、接触処理
S30cを行う。
【0051】接触処理S30cにおいて、プレ印刷接触
部81は、推定したプレ印刷文字83の位置84より
も、枠線31側の接触線分数に「0」があるか否かに、
よって文字パターン75とプレ印刷文字83とが接触し
ているか否かを判定する。例えば、図26(a),
(b)では、プレ印刷文字83の位置84が探査線O4
よりも下にあるので、探査線O4よりも枠線31に近い
探査線O1〜O3における接触線分数に「0」の有無を
調べる。接触線分数に「0」が無いので、文字パターン
75とプレ印刷文字83とが接触していると判断する。
図28(a),(b)のように、探査線O4よりも枠線
31に近い探査線O2に、接触線分数の「0」がある場
合には、文字パターン75とプレ印刷文字83との接触
は無いと判断する。接触が無いと判断した場合は、プレ
印刷接触処理S30を終了し、接触が有ると判断した場
合には、次の切断処理S30dを行う。
【0052】図33は、図32中の切断処理S30dの
概要を示す図である。接触処理S30cの後の切断処理
S30dにおいて、プレ印刷切断部91は、プレ印刷判
断処理S30bで推定したプレ印刷文字83の位置84
から数画素文枠32側に近い探査線を切断位置93と設
定する。切断処理S30dが終了すると、図31の文字
切出し処理S16に処理が移される。プレ印刷接触処理
S30の後の文字切出し処理S16では、枠32の内側
の領域を拡張した上で、図20(a)のように文字パタ
ーン75を含む領域76を切出す。ここで、枠32の内
側の領域の拡張において、枠検出処理S11で求めた枠
位置38の下側を、図20(b)のように枠線31に平
行にスライスして探索し、黒画素が無くなる所までに拡
張する。ただし、切断処理S30dが行われた文字パタ
ーンの場合には、領域76の下端を切断処理S30dで
求めた切断位置93とする。
【0053】文字切出し処理S16の後に行われる文字
認識処理S17は、処理12の判断結果が接触無しの場
合と同様に行われる。文字認識処理S17の次の処理S
18では、制御部92が全文字に対する文字認識が終了
したか否かを判定し、終了していなければ、処理をS1
2に戻し、全文字の文字認識が終了していれば、CRU
90での文字認識のフローを停止し、認識結果をワーク
ステーション制御部57に転送する。認識結果が転送さ
れたワークステーション制御部57は、認識結果を認識
結果保存部54に保持する。イメージ表示部55は、フ
ィールドイメージ部52に保存されたイメージ34をデ
ィスプレイ50aに表示し、認識結果表示部56は、認
識結果保存部54に保持された認識結果を、イメージ3
4と同時にディスプレイ50aに表示し、オペレータに
確認や訂正を実施させる。以上のように、この第3の実
施形態では、CRU90にプレ印刷切断部91を設けた
ので、第1の実施形態と同様の効果を奏するばかりでな
く、枠32の外側のプレ印刷文字83に文字パターン7
5が接触しても、適当な位置で切断した上で文字認識を
行うので、第1及び第2の実施形態よりも、文字認識率
を向上できる。
【0054】第4の実施形態 図34は、本発明の第4の実施形態を示す文字認識シス
テムの構成図であり、図35は、図34中のCRU10
0を示す構成図である。これらの図34及び図35にお
いて、第3の実施形態の図29及び図30中の要素と共
通の要素には共通の符号が付されている。この文字認識
システムは、第1の実施形態と同様のワークステーショ
ン50と、該ワークステーション50に接続された第1
の実施形態とは異なるCRU100とで構成されてい
る。
【0055】CRU100は、図34のように、第1の
実施形態のCRU60と同様のイメージバッファ61、
フォーマットバッファ62、枠検出部63、文字切出し
部64、文字認識部65、接触検出部66、形状抽出部
67、文字推定部68及びイメージ消去部69と、第3
の実施形態のCRU90と同様のプレ印刷接触部81及
びプレ印刷切断部91と、新たに設けられ文字補完部1
01とを備えている。文字補完部101は、切断された
文字パターンの欠落部分を補完する機能を有している。
この文字補完部101と各部61〜69,81,91と
が制御部102に接続されている。制御部102はCR
U100全体の制御を行うと共に、ワークステーション
50中のワークステーション制御部57に対して通信を
行う機能を有している。
【0056】次に、図34の文字認識システムの動作
を、これまでに使用した図5〜図33と、以下の図36
〜図38とを参照しつつ、説明する。帳票イメージ30
を取り込み、帳票の読取フィールドのイメージ34を求
め、該イメージ34における枠31の高さhとピッチP
と文字数とで構成された枠31に関するフィールド情報
をイメージ34と共にCRU100に送信するまでのワ
ークステーション50の動作は、第3の実施形態と同様
である。CRU100側の制御部102は、ワークステ
ーション50から送られたイメージ34をイメージバッ
ファ61に格納し、フォーマット情報をフォーマットバ
ッファ62に格納する。
【0057】図36は、図35中のCRU100で行う
文字認識のフローチャートであり、第3の実施形態の図
31中の処理と共通の処理には共通の符号が付されてい
る。CRU90は、次のようにして図35の第1の実施
形態と同様の処理S11〜S18と新たな処理S40と
を行うことにより、文字認識結果を出力する。最初に、
CRU100は、第1の実施形態と同様の枠検出処理S
11と接触判断処理S12とを行う。即ち、枠検出処理
S11において、枠検出部63は、イメージバッファ6
1に格納されたイメージ34に対し、図9の垂直投影と
水平投影とを行い、垂直投影結果35のヒストグラム及
び水平投影結果36のヒストグラムと、フォーマットバ
ッファ62に格納されたフォーマット情報とから、イメ
ージ34における枠線31の位置37を求め、これらか
ら枠位置38を求めて保持する。接触判断処理S12に
おいて、図16(a),(b)のように、接触検出部6
6が枠線31の内側近傍に探査線71を仮定し、該探査
線71上の黒画素の探索することにより、黒画素がない
場合を接触無し、黒画素がある場合を接触有りと判断す
る。
【0058】処理S12の判断結果が接触無しの場合に
は、図36の処理S13〜S15を省略する共にプレ印
刷接触処理S40を省略し、文字切出し処理S16と文
字認識処理S17とを第1〜第3の実施形態と同様に行
う。文字切出し処理S16とこの文字切出し処理S16
に続く文字認識処理S17とによって、イメージ34か
ら切出された領域中の文字パターンに対応する文字コー
ドが抽出され、これが制御部102に出力される。一
方、処理S12の判断結果が接触有りの場合には、初め
に、第1の実施形態の接触抽出処理S13、文字推定処
理S14及び枠消去処理S15とを行う。これらの処理
S13〜S15により、枠線31と文字パターン33と
の接触情報が求められ、該接触情報から枠線31上の文
字パターンに接触した部分74以外のところの枠線31
を消去するための消去情報が求められ、該消去情報に基
づきイメージ34中の文字パターンと接触した枠線31
が図19のように消去され、文字パターン75が形成さ
れる。
【0059】図37は、図36中のプレ印刷接触処理S
40の詳細を示すフローチャートである。枠消去処理S
15の次には、第3の実施形態とは異なるプレ印刷接触
処理S40を行う。このプレ印刷接触処理S40では、
次のようにして図32の処理S30a〜S30dと同様
の図37の処理S40a〜S40dと、図32にはない
処理S40eとを行う。まず、最初の形状抽出処理S4
0aにおいて、プレ印刷接触部81は、図26(a)の
ように、イメージ34で消去された枠線31の外側に、
該枠線31に平行な探査線O1,O2,…,ONを仮定
し、該各探査線O1〜ONにおいて、連続する黒画素と
白画素の変化点の座標O1L1,O1R1,O1L2,
O1R2,…、O2L1,O2R1,O2L2,O2R
2,…、〜ONL1,ONR1,ONL2,ONR2,
…をそれぞれ求めて各探査線上O1〜ONに接触する接
触線分数を求め、図26(b)のように、形状情報とし
て保持する。
【0060】形状抽出処理S40aの後のプレ印刷判断
処理S40bでは、プレ印刷接触部81が、保持した形
状情報に基づき、プレ印刷文字83の有無を判断する。
例えば、各探査線O1〜ONの接触線数が、図26
(b)のように、「2」「2」「1」「5」「6」
「9」…と多く、それがある値を越えたときには、プレ
印刷文字83が有ると判断すると共に、該プレ印刷文字
83の位置84を推定する。これに対し、図27(a)
のように、プレ印刷文字83がイメージ34の場合に
は、探査線O1〜ONの接触線分数が、図27(b)の
ように途中から「0」になり、合計線分数が少ないの
で、プレ印刷文字83が無いと判断する。プレ印刷文字
83が無い場合には、プレ印刷接触処理S40を終了す
る。プレ印刷文字83が有る場合には、接触処理S40
cを行う。
【0061】接触処理S40cにおいて、プレ印刷接触
部81は、推定したプレ印刷文字83の位置84より
も、枠線31側の接触線分数に「0」があるか否かに、
よって文字パターン75とプレ印刷文字83とが接触し
ているか否かを判定する。例えば、図26(a),
(b)では、プレ印刷文字83の位置84が探査線O4
よりも下にあるので、探査線O4よりも枠線31に近い
探査線O1〜O3における接触線分数に「0」の有無を
調べる。接触線分数に「0」が無いので、文字パターン
75とプレ印刷文字83とが接触していると判断する。
図28(a),(b)のように、探査線O4よりも枠線
31に近い探査線O2に、接触線分数の「0」がある場
合には、文字パターン75とプレ印刷文字83との接触
は無いと判断する。接触が無いと判断した場合は、プレ
印刷接触処理S40を終了し、接触が有ると判断した場
合には、切断処理S40dを行う。接触処理S40cの
後の切断処理S40dにおいて、プレ印刷切断部91
は、プレ印刷判断処理S40bで推定したプレ印刷文字
83の位置84から数画素分枠32側に近い探査線を切
断位置93と設定する。
【0062】図38(a),(b)は、図37中の補完
処理S40eの概要を示す図である。切断処理S40d
が終了すると、補完処理S40eに処理が移される。補
完処理S40eにおいて、文字補完部101は、形状抽
出処理S20aで求めた図38(b)の形状情報のう
ち、切断位置93(例えば図38の探査線O3)に設定
された探査線の接触線分数が「2」に着目し、座標O3
R1及びO3L2の間がある値よりも狭ければ、図38
(a)のように、イメージ34における該座標O3R1
及びO3L2の間に線103を追加する。これにより、
切断された文字イメージ75が補完される。補完処理S
40eが終了すると、プレ印刷接触処理S40が終了
し、処理が図36の文字切出し処理S16及び文字認識
処理S17に進む。
【0063】プレ印刷接触処理S40の後の文字切出し
処理S16では、枠32の内側の領域を拡張した上で、
図20(a)のように文字パターン75を含む領域76
を切出す。ここで、枠32の内側の領域の拡張におい
て、枠検出処理S11で求めた枠位置38の下側を、図
20(b)のように枠線31に平行にスライスして探索
し、黒画素が無くなる所までに拡張する。ただし、切断
処理S40dが行われた文字パターンの場合には、領域
76の下端を切断処理S40dで求めた切断位置93と
する。文字切出し処理S16の後に行われる文字認識処
理S17は、処理S12の判断結果が接触無しの場合と
同様に行われる。文字認識処理S17の次の処理S18
では、制御部102が全文字に対する文字認識が終了し
たか否かを判定し、終了していなければ、処理をS12
に戻し、全文字の文字認識が終了していれば、CRU1
00での文字認識のフローを停止し、認識結果をワーク
ステーション制御部57に転送する。認識結果が転送さ
れたワークステーション制御部57は、認識結果を認識
結果保存部54に保持する。イメージ表示部55は、フ
ィールドイメージ部52に保存されたイメージ34をデ
ィスプレイ50aに表示し、認識結果表示部56は、認
識結果保存部54に保持された認識結果を、イメージ3
4と同時にディスプレイ50aに表示し、オペレータに
確認や訂正を実施させる。
【0064】以上のように、この第4の実施形態では、
CRU100に、文字補完部101を設けたので、第3
の実施形態と同様の効果を奏するばかりでなく、枠32
の外側のプレ印刷文字83に文字パターン75が接触し
ても、適当な位置で切断すると共に、切断によって欠落
する部分を補完するようにしたので、第3の実施形態よ
りも、文字認識率を向上できる。
【0065】第5の実施形態 図39は、本発明の第5の実施形態を示す文字認識シス
テムの構成図であり、図40は、図39中のCRU11
0を示す構成図である。これらの図39及び図40にお
いて、第1の実施形態の図1及び図13中の要素と共通
の要素には共通の符号が付されている。この文字認識シ
ステムは、第1の実施形態と同様のワークステーション
50と、該ワークステーション50に接続された第1の
実施形態とは異なるCRU110とで構成されている。
【0066】CRU110は、図40のように、第1の
実施形態のCRU60と同様のイメージバッファ61、
フォーマットバッファ62、枠検出部63、文字切出し
部64、文字認識部65、接触検出部66、形状抽出部
67、文字推定部68及びイメージ消去部69を備える
と共に、新たに設けられた外部記入接触部111を備え
ている。外部記入接触部111は、イメージ34におけ
る枠32の近傍に記入された不要画像を検出する機能を
有している。この外部記入接触部111と図1と同様の
各部61〜69とが制御部112に接続されている。制
御部112は、CRU110全体の制御を行うと共に、
ワークステーション50中のワークステーション制御部
57に対して通信を行う機能を有している。
【0067】次に、図39の文字認識システムの動作
を、これまでの説明に用いた図5〜図20と、以下の図
41〜図44とを参照しつつ、説明する。図5のように
帳票イメージ30を取り込み、帳票の読取フィールドの
イメージ34を求め、該イメージ34における枠31の
高さhとピッチPと文字数とで構成された枠31に関す
るフィールド情報をイメージ34と共にCRU110に
送信するまでのワークステーション50の動作は、第1
の実施形態と同様である。CRU110側の制御部11
2は、ワークステーション50から送られた読取フィー
ルドイメージ34をイメージバッファ61に格納し、フ
ォーマット情報をフォーマットバッファ62に格納す
る。
【0068】図41は、図40のCRU110で行う文
字認識のフローチャートであり、図15中の処理と共通
の処理には共通の符号が付されている。CRU110
は、次のようにして図40の第1の実施形態と同様の処
理S11〜S18と新たな処理S50とを行うことによ
り、文字認識結果を出力する。CRU110では、最初
に、第1の実施形態と同様の枠検出処理S11と接触判
断処理S12とを行う。即ち、枠検出処理S11におい
て、枠検出部63は、イメージバッファ61に格納され
たイメージ34に対し、図9の垂直投影と水平投影とを
行い、垂直投影結果35のヒストグラム及び水平投影結
果36のヒストグラムと、フォーマットバッファ62に
格納されたフォーマット情報とから、イメージ34にお
ける枠線31の位置37を求め、これらから枠位置38
を求めて保持する。続く、接触判断処理S12におい
て、接触検出部66が、図16(a),(b)のよう
に、枠線31の内側近傍に探査線71を仮定し、該探査
線71上の黒画素の探索し、黒画素がない場合を接触無
し、黒画素がある場合を接触有りと判断する。
【0069】処理S12の判断結果が接触無しの場合に
は、図41の処理S13〜S15を省略すると共に外部
記入接触S50を省略し、文字切出し処理S16と文字
認識処理S17とを第1の実施形態と同様に行う。文字
切出し処理S16とこれに続く文字認識処理S17とに
より、文字切出し処理S16で切出された領域40中の
文字パターン33に対応する文字コードが抽出され、こ
れが制御部112に出力される。一方、処理S12の判
断結果が接触有りの場合には、第1の実施形態の接触抽
出処理S13、文字推定処理S14及び枠消去処理S1
5とを、第1の実施形態と同様に行う。これらの処理S
13〜S15により、枠線31と文字パターンとの接触
情報が求められ、該接触情報から枠線31上の文字パタ
ーンの部分74以外の枠線31を消去するための消去情
報が求められ、該消去情報に基づきイメージ34中の文
字パターン33と接触した枠線31の一部が消去され、
図19の文字パターン75が形成される。
【0070】図42(a),(b)は、表形式と単独行
形式のイメージ34を示す図である。図43は、図41
中の外部記入接触処理S50の詳細を示すフローチャー
トである。図44(a),(b)は、図41の外部記入
接触処理S50の概要を示す図である。枠線を持つ帳票
には、表形式のものと、記載領域のみが単独に枠線で囲
まれた単独行形式のものとがある。表形式の帳票イメー
ジから切出された認識対象のイメージ34には、図42
(a)のように、例えば枠32よりも下に枠線31の延
長線113が現れる。これに対して単独行形式の帳票の
イメージ34には、延長線113が現れない。即ち、枠
線31が表の罫線に相当する。延長線113は、認識対
象の次の行の枠114を形成するものであり、この枠1
14には、認識対象以外の文字が記入されるので、認識
対象の枠32に記入された文字がはみ出した場合、図4
4(a)のように、文字パターン75が枠114に記入
され外部記入文字のパターン115と接触する可能性が
ある。
【0071】枠消去処理S15の次に行われる外部記入
接触処理S50では、次のようにして、図43の処理S
50a〜S50dを行うことにより、外部記入文字の文
字パターン115に接触した文字に対して不読の認識結
果を与える。まず、外部記入接触処理S50の最初の枠
解析処理S50aにおいて、外部記入接触部111は、
延長線113の有無を検出する。続く、表形式判断処理
S50bにおいて、延長線113が検出されない場合
(N)に、イメージ34が表形式ではなく、文字パター
ン115と接触がないもの判断し、外部記入接触処理S
50を終了する。延長線113が検出された場合
(Y)、外部記入接触部111は、処理を接触判断処理
S50cに進める。
【0072】接触判断処理S50cにおいて、外部記入
接触部111は、図44(a),(b)のように、イメ
ージ34における枠32の外側の枠114に、探査領域
116を設定し、文字パターン75と文字パターン11
5との間の白領域117を探索する。外部記入接触部1
11は、図44(b)のように、白領域117があった
場合には、文字パターン75と文字パターン115とが
接触していないと判断し、外部記入接触処理S60を終
了する。白領域117が検出され無かった場合には、強
制不読処理S50dにより、文字パターン75に強制的
に不読文字の認識結を与え、制御部112に出力する。
外部記入接触処理S50の後に、不読となっていない文
字パターン75に対し、第1の実施形態と同様の文字切
出し処理S16と文字認識処理S17を行う。これらの
文字切出し処理S16と文字認識処理S17とにより、
枠32の内側の領域を拡張した上で、文字パターン75
を含む領域76が切出され、文字パターン75の特徴に
応じた文字コードが抽出され、制御部112に与えられ
る。
【0073】文字認識処理S17の次の処理S18で
は、制御部112が全文字に対する文字認識が終了した
か否かを判定し、終了していなければ、処理をS12に
戻し、全文字の文字認識が終了していれば、CRU11
0での文字認識のフローを停止し、認識結果をワークス
テーション制御部57に転送する。認識結果が転送され
たワークステーション制御部57は、認識結果を認識結
果保存部54に保持する。イメージ表示部55は、フィ
ールドイメージ部52に保存されたイメージ34をディ
スプレイ50aに表示し、認識結果表示部56は、認識
結果保存部54に保持された認識結果を、イメージ34
と同時にディスプレイ50aに表示し、オペレータに確
認や訂正を実施させる。
【0074】以上のように、この第5の実施形態は、第
1の実施形態と同様のCRU110に、外部記入文字接
触部111を設け、イメージ34が表形式か単独行形式
かを判断し、表形式の場合には、枠32の隣接する枠1
14の文字パターン115と枠32に記載された文字の
文字パターン75とが接触しているか否かを判定し、接
触している場合には強制的に不読文字の認識結果を与え
るようにしたので、第1の実施形態と同様の効果を奏す
るばかりでなく、例えば、文字パターン75が“0”で
文字パターン115が“1”の場合に、“9”と誤読さ
れることがなくなり、オペレータの負担を軽減できる。
【0075】第6の実施形態 図45は、本発明の第6の実施形態を示す文字認識シス
テムの構成図であり、図46は、図45中のCRU12
0を示す構成図である。これらの図45及び図46にお
いて、第5の実施形態の図39及び図40中の要素と共
通の要素には共通の符号が付されている。この文字認識
システムは、第1の実施形態と同様のワークステーショ
ン50と、該ワークステーション50に接続された第5
の実施形態とは異なるCRU120とで構成されてい
る。
【0076】CRU120は、図46のように、第1の
実施形態のCRU60と同様のイメージバッファ61、
フォーマットバッファ62、枠検出部63、文字切出し
部64、文字認識部65、接触検出部66、形状抽出部
67、文字推定部68及びイメージ消去部69と、第5
の実施形態と同様の外部記入接触部111と、新たに設
けられた外部記入解析部121とを備えている。この外
部記入解析部121は、枠32の外側の領域の解析を行
し、不要文字と文字パターンとが接触していれば、枠内
の文字パターン75に不読文字の認識結果を与える機能
を有している。この外部記入解析分121と図40と同
様の各部61〜69,111とが制御部122に接続さ
れている。制御部122はCRU120全体の制御を行
うと共に、ワークステーション50中のワークステーシ
ョン制御部57に対して通信を行う機能を有している。
【0077】次に、図45の文字認識システムの動作
を、これまでの説明に用いた図5〜図20及び図41〜
図44と、以下の図46〜図50とを参照しつつ、説明
する。図5のように、帳票イメージ30を取り込み、帳
票の読取フィールドのイメージ34を求め、該イメージ
34における枠31の高さhとピッチPと文字数とで構
成された枠31に関するフィールド情報をイメージ34
と共にCRU120に送信するまでのワークステーショ
ン50の動作は、第1の実施形態と同様である。図47
は、図46のCRU120で行う文字認識のフローチャ
ートであり、第5の実施形態の図41中の処理と共通の
処理には共通の符号が付されている。CRU120は、
次のように図47の処理S11〜S18と処理S60と
を行うことにより、文字認識結果を出力する。
【0078】CRU120では、最初に、第1〜第5の
実施形態と同様の枠検出処理S11と接触判断処理S1
2とを行う。即ち、枠検出処理S11において、枠検出
部63は、イメージバッファ61に格納されたイメージ
34に対し、図9の垂直投影と水平投影とを行い、垂直
投影結果35のヒストグラム及び水平投影結果36のヒ
ストグラムと、フォーマットバッファ62に格納された
フォーマット情報とから、イメージ34における枠線3
1の位置37を求め、これらから枠位置38を求めて保
持する。接触判断処理S12において、接触検出部66
が、枠線31の内側近傍に探査線71を仮定し、図16
(a),(b)のように、該探査線71上の黒画素の探
索し、黒画素がない場合を接触無し、黒画素がある場合
を接触有りと判断する。
【0079】処理S12の判断結果が接触無しの場合に
は、図47の処理S13〜S15を省略すると共に外部
記入接触処理S60を省略し、文字切出し処理S16と
文字認識処理S17とを第1〜第5の実施形態と同様に
行う。文字切出し処理S16とこれに続く文字認識処理
S17とにより、イメージ34から切出された領域中の
文字パターン33に対応する文字コードが抽出され、こ
れが制御部122に出力される。一方、処理S12の判
断結果が接触有りの場合には、初めに、第1の実施形態
と同様の接触抽出処理S13、文字推定処理S14及び
枠消去処理S15を行う。これらの処理S13〜S15
により、枠線31と文字パターンとの接触情報が求めら
れ、該接触情報から枠線31上の文字パターンに接触し
た部分74以外のところの枠線31を消去するための消
去情報が求められ、該消去情報に基づきイメージ34中
の文字パターンと接触した枠線31が図19のように消
去され、文字パターン75が形成される。
【0080】図48は、図47中の外部記入接触処理S
60の詳細を示すフローチャートである。枠消去処理S
15の後には、次のようにして第5の実施形態とは異な
る図47の外部記入接触処理S60を行う。まず、外部
記入接触処理S60の最初の枠解析処理S60aにおい
て、外部記入接触部121は、図42の延長線113の
有無を検出する。続く、表形式判断処理S60bでは、
延長線113が検出されない場合(N)にはイメージ3
4が表形式ではなく、図44の文字パターン115と接
触がないもの判断し、外部記入接触処理S60を終了す
る。延長線113が検出された場合(Y)、外部記入接
触部121は、処理を白領域判断処理S60cに進める
【0081】白領域判断処理S60cにおいて、外部記
入接触部111は、図44(a),(b)のように、イ
メージ34における枠32の外側の枠114に、探査領
域116を設定し、文字パターン75と文字パターン1
15との間の白領域117を探索する。外部記入接触部
111は、図44(b)のように、白領域117が有る
場合には、文字パターン75と文字パターン115とが
接触していないと判断し、外部記入接触処理S60を終
了する。白領域117がない場合には、次の形状抽出処
理S60dに処理を移す。
【0082】図49は、図48中の形状抽出処理S60
dの概要を示す図であり、図50は、図48中の領域分
析処理S60eの概要を示す図である。形状抽出処理S
60dにおいて、外部記入解析部121は、枠32の枠
線31に沿う外側の複数の探査線O1〜Onを探査し、
文字パターン75及び文字パターン115の線分と接触
する座標を各探査線毎O1〜Onに求め、形状情報とし
て保持する。探査の終端は、イメージ34の終端とす
る。形状抽出処理S60dの後の領域分析処理S60e
において、外部記入解析部121は、形状抽出処理S6
0dで求めた形状情報の各座標を枠線31側から連結す
ることにより、文字パターン75のエッジの軌跡を図5
0のように求めて文字パターン75の領域RAを求め、
形状情報の各座標をイメージ34の終端側から連結する
ことにより、文字パターン115のエッジの軌跡を求め
て文字パターン115の領域RBを求める。
【0083】領域分析処理S60eの後の接触判断処理
S60fにおいて、外部記入解析部121は、領域RA
と領域RBとに重なりが有るか否かを判断し、重なりが
無い場合には、領域保存処理S60gで領域RA及び領
域RBを保存した上で、外部記入接触処理S60を終了
する。重なりが有る場合には、外部記入解析部121が
強制不読処理S60hで文字パターン75に不読文字の
認識結果を設定して制御部122に出力した上で外部記
入接触処理S60を終了する。
【0084】外部記入接触処理S60の後に、不読とな
っていない文字パターン75に対し、第1の実施形態と
同様の文字切出し処理S16と文字認識処理S17とを
行う。これらの文字切出し処理S16と文字認識処理S
17とにより、枠32の内側の領域を拡張した上で、文
字パターン75を含む領域76が切出され、文字パター
ン75の特徴に応じた文字コードが抽出されて制御部1
22に与えられる。ここで、外部記入接触処理S60で
領域RAが保存された文字パターン75に対しては、そ
の領域RAが拡張される領域となる。文字認識処理S1
7の次の処理S18では、制御部122が全文字に対す
る文字認識が終了したか否かを判定し、終了していなけ
れば、処理をS12に戻し、全文字の文字認識が終了し
ていれば、CRU120での文字認識のフローを停止
し、認識結果をワークステーション制御部57に転送す
る。認識結果が転送されたワークステーション制御部5
7は、認識結果を認識結果保存部54に保持する。イメ
ージ表示部55は、フィールドイメージ部52に保存さ
れたイメージ34をディスプレイ50aに表示し、認識
結果表示部56は、認識結果保存部54に保持された認
識結果を、イメージ34と同時にディスプレイ50aに
表示し、オペレータに確認や訂正を実施させる。
【0085】以上のように、この第6の実施形態では、
第5の実施形態のCRU110に外部記入接触部121
を加えてCRU120を構成したので、イメージ34が
表形式か単独行形式かを判断し、表形式の場合には、枠
32に隣接する枠114の文字パターン115と枠32
に記載された文字の文字パターン75とが重なっている
か否かを判定し、重なっている場合には強制的に不読文
字の認識結果を与えるので、文字パターン115と文字
パターン75とが、入り組んだ場合でも、適切に接触の
有無を判定できるので、第5の実施形態よりも認識率が
向上する。
【0086】第7の実施形態 図51は、本発明の第7の実施形態を示す文字認識シス
テムの構成図であり、図52は、図51中のCRU13
0を示す構成図である。これらの図51及び図52にお
いて、第1の実施形態の図1及び図13中の要素と共通
の要素には共通の符号が付されている。この文字認識シ
ステムは、第1の実施形態と同様のワークステーション
50と、該ワークステーション50に接続された第1の
実施形態とは異なるCRU130とで構成されている。
【0087】CRU130は、図52のように、第1の
実施形態のCRU60と同様のイメージバッファ61、
フォーマットバッファ62、枠検出部63、文字切出し
部64、文字認識部65、接触検出部66、形状抽出部
67、文字推定部68及びイメージ消去部69を備える
と共に、新たに設けられた侵入接触部131及び侵入解
析部132とを備えている。侵入接触部131は、枠3
2に侵入した不要画像を検出するものであり、侵入解析
部132は、枠32内の領域の解析を行う機能を有して
いる。これらの侵入接触部131及び侵入解析部132
と、図1と同様の各部61〜69とが制御部133に接
続されている。制御部133は、CRU130全体の制
御を行うと共に、ワークステーション50中のワークス
テーション制御部57に対して通信を行う機能を有して
いる。
【0088】次に、図51の文字認識システムの動作
を、これまでの説明に使用した図5〜20と、以下の図
52〜図56とを参照しつつ、説明する。図5のような
帳票イメージ30を取り込み、帳票の読取フィールドの
イメージ34を求め、該イメージ34における枠31の
高さhとピッチPと文字数とで構成された枠31に関す
るフィールド情報をイメージ34と共にCRU130に
送信するまでのワークステーション50の動作は、第1
の実施形態と同様である。CRU130側の制御部13
3は、ワークステーション50から送られたイメージ3
4をイメージバッファ61に格納し、フォーマット情報
をフォーマットバッファ62に格納する。
【0089】図53は、図52のCRU130で行う文
字認識のフローチャートであり、第1の実施形態の図1
5中の処理と共通の処理には共通の符号が付されてい
る。CRU130は、次のようにして図53の第1の実
施形態と同様の処理S11〜S18と新たな処理S70
とを行うことにより、文字認識結果を出力する。CRU
130では、最初に、第1の実施形態と同様の枠検出処
理S11と接触判断処理S12とを行う。即ち、枠検出
処理S11において、枠検出部63は、イメージバッフ
ァ61に格納されたイメージ34に対し、図9の垂直投
影と水平投影とを行い、垂直投影結果35のヒストグラ
ム及び水平投影結果36のヒストグラムと、フォーマッ
トバッファ62に格納されたフォーマット情報とから、
イメージ34における枠線31の位置37を求め、これ
らから枠位置38を求めて保持する。接触判断処理S1
2において、接触検出部66が、枠線31の内側近傍に
探査線71を仮定し、図16(a),(b)のように、
該探査線71上の黒画素の探索し、黒画素がない場合を
接触無し、黒画素がある場合を接触有りと判断する。
【0090】処理S12の判断結果が接触無しの場合に
は、図53の処理S13〜S15を省略すると共に侵入
接触処理S70を省略し、文字切出し処理S16と文字
認識処理S17とを第1の実施形態と同様に行う。文字
切出し処理S16とこれに続く文字認識処理S17とに
より、イメージ34から切出された領域中の文字パター
ン33に対応する文字コードが抽出され、これが制御部
133に出力される。一方、処理S12の判断結果が接
触有りの場合には、初めに、第1の実施形態と同様の接
触抽出処理S13、文字推定処理S14及び枠消去処理
S15を行う。これらの処理S13〜S15により、枠
線31と文字パターンとの接触情報が求められ、該接触
情報から枠線31上の文字パターンに接触した部分74
以外のところの枠線31を消去するための消去情報が求
められ、該消去情報に基づきイメージ34中の文字パタ
ーンと接触した枠線31が図19のように消去され、文
字パターン75が形成される。
【0091】図54(a)〜(c)は、図53中の侵入
接触処理S70の概要を示す図であり、図55は、図5
3中の侵入接触処理S70の詳細を示すフローチャート
である。帳票が表形式である場合には、図54(a)〜
(c)のように、隣接行の枠114の別行文字の文字パ
ターン115が枠32に侵入し、認識対象の枠32内に
記載された文字に対応する文字パターン75に重なるこ
とがある。そのため、次のようにして図55の処理S7
0a〜S70hを行う。侵入接触処理S70の最初の枠
解析処理S70aにおいて、侵入接触部131は、図4
2のように、枠線31の延長線113の有無を検出す
る。続く、表形式判断処理S70bにおいて、延長線1
13が検出されない場合(N)に、イメージ34が表形
式ではなく、文字パターン115が無いので接触がない
ものと判断し、侵入接触処理S70を終了する。延長線
113が検出された場合(Y)、侵入接触部131は、
処理を白領域判断処理S70cに進める。
【0092】白領域判断処理S70cにおいて、侵入接
触部131は、図54(a)〜(c)のように、イメー
ジ34における枠32の内側に探査領域134を設定
し、文字パターン75と文字パターン115との間のイ
メージから白領域135を探索する。侵入接触部131
は、図54(b)のように、白領域135が有る場合に
は、枠32内の文字パターン75と文字パターン115
とが接触していないと判断し、領域保存処理S70d
で、その白領域135を保存した上で、侵入接触処理S
70を終了する。図54(a),(c)のように、白領
域135が得られない場合には、形状抽出処理S70e
を行う。形状抽出処理S70eにおいて、侵入解析部1
32は、図49と同様の探査線O1〜Onを枠32内に
設定して解析し、文字パターン75及び文字パターン1
15の線分と接触する座標を各探査線毎O1〜Onに求
め、形状情報として保持する。
【0093】形状抽出処理S70eの後の領域分析処理
S70fにおいて、侵入解析部132は、形状抽出処理
S70eで求めた形状情報の各座標を枠線31内側から
連結することにより、文字パターン75のエッジの軌跡
を図50のように求めて文字パターン75の領域RAを
求め、形状情報の各座標をイメージ34の枠線31の外
側側から連結することにより、文字パターン115のエ
ッジの軌跡を求めて文字パターン115の領域RBを求
める。領域分析処理S70fの後の接触判断処理S70
gにおいて、侵入解析部132は、領域RA及び領域R
Bの重なりを判定し、重なりが有るときには、強制不読
処理S70hにより、強制的に不読の認識結果を与え、
制御部133に出力する。重なりが無いときには、領域
RA及び領域RBを保存する。
【0094】図56(a),(b)は、図53中の切出
し処理S16で切出す領域を示す図である。強制不読処
理S70hが終了することで、図53の侵入接触処理S
70が終了し、処理は文字切出し処理S16に進む。こ
の侵入接触処理S70の後の文字切出し処理S16で
は、枠位置38の外側を探索し、文字パターン75の端
部の位置まで枠32を拡大した領域から、文字パターン
75を含む領域40を抽出する。ここで、白領域135
の位置が保存されている文字の文字パターン75に対し
ては、図56(a)のように、該白領域135の位置を
文字パターンの端部75の端部とする。また、領域RA
が保存された文字パターン75の場合には、領域RAを
切出す領域40とする。文字切出し処理S16の後に第
1の実施形態と同様の文字認識処理S17を行う。文字
パターン75の特徴に応じた文字コードが抽出されて制
御部133に与えられる。文字認識処理S17の次の処
理S18では、制御部133が全文字に対する文字認識
が終了したか否かを判定し、終了していなければ、処理
をS12に戻し、全文字の文字認識が終了していれば、
CRU130での文字認識のフローを停止し、認識結果
をワークステーション制御部57に転送する。
【0095】認識結果が転送されたワークステーション
制御部57は、認識結果を認識結果保存部54に保持す
る。イメージ表示部55は、フィールドイメージ部52
に保存されたイメージ34をディスプレイ50aに表示
し、認識結果表示部56は、認識結果保存部54に保持
された認識結果を、イメージ34と同時にディスプレイ
50aに表示し、オペレータに確認や訂正を実施させ
る。以上のように、この第7の実施形態では、第1の実
施形態のCRU60に侵入接触部131と侵入解析部1
32とを設けたCRU130を用いて文字認識システム
を構成したので、第1の実施形態と同様の効果に加え、
表形式の帳票イメージ30の枠32に、外部から認識に
不要な別行文字の文字パターン115が侵入しても、そ
れが文字パターン75に接触した場合には、強制的に不
読の認識結果を与えるようにしたので、接触による誤読
が防止できる。さらに、領域RAと領域RBとを求め
て、文字パターン75と文字パターンの重なりを検出
し、重なった場合に不読の認識結果を与えるようにした
ので、これらが入り組んでいてもよいため、認識率を向
上できる。
【0096】第8の実施形態 図57は、本発明の第8の実施形態を示す文字認識シス
テムの構成図であり、図58は、図57中のワークステ
ーション140の構成図であり、図59は、図57中の
CRU150を示す構成図である。これらの図57〜図
59における第1の実施形態の図1、図13及び図14
中の要素と共通の要素には共通の符号が付されている。
この文字認識システムは、ワークステーション140
と、該ワークステーション140に接続されたCRU1
50とで構成されている。ワークステーション140に
は、ディスプレイ140a等で構成された表示手段と、
図示しないキーボードやスキャナ等で構成された入力手
段とが設けられている。
【0097】ワークステーション140の内部は、第1
の実施形態と同様の、帳票イメージを保存する帳票イメ
ージ部51、帳票イメージの読取フィールドを切出して
保存するフィールドイメージ部52と、読取対象のイメ
ージにおける枠線に関する情報や書式形態等を表わすフ
ォーマット情報を格納するフォーマット情報部53と、
認識結果保存部54と、該フィールドイメージ部52に
保存されたイメージをディスプレイ50aに表示するイ
メージ表示部55と、認識結果をディスプレイ50aに
表示するイメージ表示部56とを備えると共に、新たに
設けられたパターン情報部141及び表示イメージ加工
部142を備えている。パターン情報部141は、CR
U150から送られた文字パターンに関する情報を保存
するものであり、表示イメージ加工部142はディスプ
レイ140aに表示するイメージを加工するものであ
る。これらのパターン情報部141及び表示イメージ加
工部142と各部51〜56とがワークステーション制
御部(WS制御部)143に接続されている。
【0098】CRU150は、第1の実施形態のCRU
60と同様のイメージバッファ61、フォーマットバッ
ファ62、枠検出部63、文字切出し部64、文字認識
部65、接触検出部66、形状抽出部67、文字推定部
68、及びイメージ消去部69を備えると共に、新たに
設けられたパターン保存部151を備えている。パター
ン保存部151は、イメージから切出した文字単位の領
域中の文字パターンに関するパターン情報を保存するも
のである。このパターン保存部151と各部61〜69
とが、制御部152に接続されている。制御部152は
CRU150全体の動作を制御すると共に、ワークステ
ーション制御部143に対して通信を行う機能を有して
いる。
【0099】次に、図57の文字認識システムの動作を
説明する。この文字認識システムでは、図5のような帳
票イメージ30を取り込み、帳票の読取フィールドのイ
メージ34を求め、該イメージ34における枠31の高
さhとピッチPと文字数とで構成された枠31に関する
フィールド情報をイメージ34と共にCRU150に送
信するまでのワークステーション140の動作は、第1
の実施形態と同様である。CRU150側の制御部15
2は、ワークステーション140から送られた読取フィ
ールドイメージ34をイメージバッファ61に格納し、
フォーマット情報をフォーマットバッファ62に格納す
る。図60は、図57中のCRU150で行う文字認識
のフローチャートである。この図60における図15中
の処理と共通の処理には共通の符号が付されている。こ
のCRU150ではパターン保存処理S80を行う以外
は、第1の実施形態とまったく同様の処理S11〜S1
8を行うことにより、文字認識結果を出力する。パター
ン保存処理S80は、文字切出し処理S16と文字認識
処理S17との間に行われる。
【0100】図61は、パターン情報を示す図である。
パターン処理S80において、図61にように、パター
ン保存部151が文字切出し処理S16でイメージ34
から切出された文字単位の領域40に対し、該領域40
の例えば左上の座標と、該領域40中の文字パターン3
3または75とをパターン情報として格納する。制御部
152は全文字に対する認識が終わった段階で、文字認
識結果と共にパターン保存部151に保存された全文字
のパターン情報をワークステーション制御部143に転
送する。ワークステーション制御部143は、認識結果
を認識結果保存部54に保持すると共に、パターン情報
をパターン情報部141に保存する。表示イメージ加工
部142は、パターン情報部141に保存されたパター
ン情報の座標を起点とし、フィールドイメージ部52に
格納されたイメージ34と該パターン情報の文字パター
ン33または75との論理積をとり、結果として“1”
になった画素をイメージ34の他の部分と異なる色にな
るように、画素のカラーデータを変更する。
【0101】図62は、ディスプレイ140aの表示例
を示す図である。イメージ表示部55は、画素のカラー
データが変更されたパターン33または75をディスプ
レイ140aにイメージ34の他の部分と共に表示し、
認識結果表示部56は、認識結果保存部54に保持され
た認識結果を、イメージ34と同時にディスプレイ14
0aに表示し、オペレータに確認や訂正を実施させる。
以上のように、この第8の実施形態では、ワークステー
ション140に表示イメージ加工部142を設け、文字
パターン33または75がイメージ34の他の部分と異
なる色になるように、画素のカラーデータを変更するよ
うにしたので、オペレータが確認と修正を行うときに見
る文字パターン33または75の表示が、強調され、オ
ペレータの負担を軽減できる。とくに、枠32からはみ
出した文字や接した文字等では、枠線31との境界が明
瞭になり、より一層の負担の軽減になる。
【0102】なお、本発明は、上記実施形態に限定され
ず種々の変形が可能である。その変形例としては、例え
ば次のようなものがある。(1) 第1〜第8の実施形
態では、各ワークステーション50,140と各CRU
60〜150とを分離した文字認識システムの例を示し
ているが、本発明は、これらのワークステーション5
0,140及びCRU60〜150を一体に組み込んだ
文字認識システムにも適用できる。(2) 第8の実施
形態は、第1の実施形態と同様のワークステーション5
0及びCRU60に、パターン情報部141、表示イメ
ージ加工部142及びパターン保持部151を設けた
が、該パターン情報部141、表示イメージ加工部14
2及びパターン保持部151第2〜第7の実施形態に適
用することにより、第8の実施形態と同様の効果を奏す
ることになる。
【0103】
【発明の効果】以上詳細に説明したように、第1の発明
によれば、イメージ中の文字が枠に接触する接触文字か
非接触文字かを判断する接触検出部と、枠線との接触情
報を求める形状抽出部と、枠線の一部を消去するイメー
ジ消去部と、文字の状態に応じた切出しを行う文字切出
し部と、文字認識部とを文字認識システムに設けたの
で、接触文字であっても、それに接触する枠線の一部が
消去された上で認識されるので、文字認識の認識率が向
上できる。第2の発明によれば、第1の発明と同様の文
字認識システムに、プレ印刷接触部を設け、接触文字が
枠外で印刷文字に接触した場合には、強制的に不読する
ようにしたので、誤認識がなくなり、オペレータの負担
が軽減できる。第3の発明によれば、プレ印刷接触部と
印刷切断部とを設け、接触文字が印刷文字に接触して
も、それが印刷文字の端部で切断されるようにしたの
で、誤認識が減少し、オペレータの負担が軽減できる。
【0104】第4の発明によれば、第3の発明のシステ
ムに文字補完部を設けたので、切断によって欠落した部
分が補完され、第3の発明よりも、文字認識の認識率が
向上する。第5の発明によれば、印刷文字の有無と該印
刷文字の位置とを、枠線に沿って設定された任意数の探
査線に接する線分数から求める構成にしたので、簡単に
該印刷文字の有無と該印刷文字の位置が求められる。第
6の発明によれば、外部記入接触部を設け、接触文字が
枠外で、別行文字に接触した場合には、強制的に不読の
認識結果を与えるようにしたので、誤認識が減少し、オ
ペレータの負担が軽減できる。
【0105】第7の発明によれば、外部記入接触部と外
部記入解析部とを設け、接触文字と別行文字とに重なり
がある場合にのみ、強制的に不読の認識結果を与えるよ
うにしたので、誤認識が減少するばかりでなく、接触文
字と別行文字とが入り組んでいても、接触文字の認識が
可能になる。第8の発明によれば、侵入接触部と侵入解
析部とを設け、枠内の文字が外部から侵入した別行文字
と接触した場合に、強制的に不読の認識結果を与えるよ
うにしたので、誤認識が減少し、オペレータの負担が軽
減できる。第9の発明によれば、表示手段と表示加工手
段とを設けたので、イメージ中の文字が他の部分とは別
の色で表示され、修正や確認の作業効率が向上する。
【図面の簡単な説明】
【図1】本発明の第1の実施形態を示すCRU60の構
成図である。
【図2】従来の文字認識システムの全体を示す構成図で
ある。
【図3】図2中のワークステーション10を示す構成図
である。
【図4】図2中のCRU20を示す構成図である。
【図5】帳票イメージの例を示す図である。
【図6】図5の読取フィールドのイメージを示す図であ
る。
【図7】図6に関するフォーマット情報を示す図であ
る。
【図8】図2中のCRU20で行う文字認識のフローチ
ャートである。
【図9】図8中の枠検出処理S1の概要を示す図であ
る。
【図10】図8中の文字切出し処理S2の概要を示す図
である。
【図11】図2中のディスプレイ10aの表示を示す図
である。
【図12】図2の課題を示す説明図である
【図13】本発明の第1の実施形態を示す文字認識シス
テムの構成図である。
【図14】図13中のワークステーション50を示す構
成図である。
【図15】図1で行う文字認識のフローチャートであ
る。
【図16】図15中の接触判断処理S12の概要を示す
図である。
【図17】図15中の接触抽出処理S13の概要を示す
図である。
【図18】図15中の文字推定処理S14の概要を示す
図である。
【図19】図15中の枠消去処理S15の概要を示す図
である。
【図20】図15中の文字切出し処理S16の概要を示
す図である。
【図21】本発明の第2の実施形態を示す文字認識シス
テムの構成図である。
【図22】図21中のCRU80を示す構成図である。
【図23】図22で行う文字認識のフローチャートであ
る。
【図24】プレ印刷文字を含むイメージ34を示す図で
ある。
【図25】図23中のプレ印刷接触処理S20を示すフ
ローチャートである。
【図26】図25中の形状抽出処理S20aの概要を示
す図である。
【図27】図26中のプレ印刷判断処理S20bの判断
例を示す図である。
【図28】図25中の接触判断処理S20cの概要を示
す図である。
【図29】本発明の第3の実施形態を示す文字認識シス
テムの構成図である。
【図30】図29中のCRU90を示す構成図である。
【図31】図30で行う文字認識のフローチャートであ
る。
【図32】図31中のプレ印刷接触処理S30の詳細を
示すフローチャートである。
【図33】図32中の切断処理S30dの概要を示す図
である。
【図34】本発明の第4の実施形態を示す文字認識シス
テムの構成図である。
【図35】図34中のCRU100を示す構成図であ
る。
【図36】図35で行う文字認識のフローチャートであ
る。
【図37】図36中のプレ印刷接触処理S40の詳細を
示すフローチャートである。
【図38】図37中の補完処理S40eの概要を示す図
である。
【図39】本発明の第5の実施形態を示す文字認識シス
テムの構成図である。
【図40】図39中のCRU110を示す構成図であ
る。
【図41】図40で行う文字認識のフローチャートであ
る。
【図42】表形式と単独行形式のイメージ34を示す図
である。
【図43】図41中の外部記入接触処理S50の詳細を
示すフローチャートである。
【図44】図41の外部記入接触処理S50の概要を示
す図である。
【図45】本発明の第6の実施形態を示す文字認識シス
テムの構成図である。
【図46】図45中のCRU120を示す構成図であ
る。
【図47】図46で行う文字認識のフローチャートであ
る。
【図48】図47中の外部記入接触処理S60の詳細を
示すフローチャートである。
【図49】図48中の形状抽出処理S60dの概要を示
す図である。
【図50】図48中の領域分析処理S60eの概要を示
す図である。
【図51】本発明の第7の実施形態を示す文字認識シス
テムの構成図である。
【図52】図51中のCRU130を示す構成図であ
る。
【図53】図52で行う文字認識のフローチャートであ
る。
【図54】図53中の侵入接触処理S70の概要を示す
図である。
【図55】図53中の侵入接触処理S70の詳細を示す
フローチャートである。
【図56】図53中の文字切出し処理S16で切出す領
域を示す図である。
【図57】本発明の第8の実施形態を示す文字認識シス
テムの構成図である。
【図58】図57中のワークステーション140の構成
図である。
【図59】図57中のCRU150を示す構成図であ
る。
【図60】図57で行う文字認識のフローチャートであ
る。
【図61】パターン情報を示す図である。
【図62】ディスプレイ140aの表示例を示す図であ
る。
【符号の説明】
50,140 ワークステーション 50a,140a ディスプレイ 60,80,90,100,120,130,150
CRU 61 イメージバッファ 62 フォーマットバッファ 63 枠検出部 64 文字切出し部 65 文字認識部 66 接触検出部 67 形状検出部 68 文字推定部 69 イメージ消去部 81 プレ印刷接触部 91 プレ印刷切断部 101 文字補完部 111 外部記入接触部 121 外部記入解析部 131 侵入接触部 132 侵入解析部 142 表示イメージ加工部

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 枠線に囲まれた枠に文字が記載された帳
    票のイメージを入力する入力手段と、 前記イメージ中の前記枠線の位置を検出する枠線検出部
    と、 前記枠線のうちの前記文字を形成する線分に接触を有す
    る接触枠線を検出し、該文字が前記枠に接触を持つ接触
    文字か接触を持たない非接触文字かを判断する接触検出
    部と、 前記接触枠線の前記枠の内側に接触する前記接触文字の
    線分数及びその接触箇所の開始点と終点の座標と、該接
    触枠線の該枠の外側に接触する線分数及びその接触箇所
    の開始点と終点の座標とを接触情報として求める形状抽
    出部と、 前記接触情報に基づき、前記接触枠線の前記線分に接触
    していない部分を求め、前記イメージから消去するイメ
    ージ消去部と、 前記非接触文字に対しては、前記イメージの前記枠内の
    部分から該非接触文字が含まれる領域を切出し、前記接
    触文字に対しては、該枠外で該接触文字が終了する位置
    を求め、前記線分に接触していない部分が消去されたイ
    メージにおける該枠内から該接触文字が終了する位置ま
    での部分から該接触文字が含まれる領域を切出す文字切
    出し部と、 前記切出されたイメージに基づき前記文字に対する認識
    を行って文字コードを求める文字認識部とを、備えたこ
    とを特徴とする文字認識システム。
  2. 【請求項2】 請求項1記載の入力手段、枠線検出部、
    接触検出部、形状抽出部及びイメージ消去部と、 前記接触文字以外の印刷文字が前記枠外に有るか無いか
    を判断し、該印刷文字が有る場合には該接触文字と該印
    刷文字との間の接触の有無を調べ、該接触が有る場合に
    は、該接触文字に不読の認識結果を強制的に与えるプレ
    印刷接触部と、 前記非接触文字に対しては、前記イメージの前記枠内の
    部分から該接触文字が含まれる領域を切出し、前記接触
    文字のうち前記不読の認識結果が与えられていない文字
    に対しては、前記枠外で前記接触文字が終了する位置を
    求め、前記線分に接触していない部分が消去されたイメ
    ージにおける該枠内から該接触文字が終了する位置まで
    の部分から該接触文字が含まれる領域を切出す文字切出
    し部と、 請求項1記載の文字認識部とを、備えたことを特徴とす
    る文字認識システム。
  3. 【請求項3】 請求項1記載の入力手段、枠線検出部、
    接触検出部、形状抽出部及びイメージ消去部と、 前記接触文字以外の印刷文字が前記枠外に有るか無いか
    を判断し、該印刷文字が有る場合には該接触文字と該印
    刷文字と間の接触の有無を検出すると共に該印刷文字の
    端部の前記枠線からの位置を求めるプレ印刷接触部と、 前記プレ印刷接触部で接触があると検出された前記接触
    文字を前記印刷文字の端部の位置で切断するプレ印刷切
    断部と、 前記非接触文字に対しては、前記イメージの前記枠内の
    部分から該非接触文字が含まれる領域を切出し、前記接
    触文字に対しては、前記枠外で前記文字が終了する位置
    を求め、前記線分に接触していない部分が消去されたイ
    メージにおける該枠内から該接触文字が終了する位置ま
    での部分から該イメージの該枠内から該接触文字が含ま
    れる領域を切出すか、または該枠内から前記切断の位置
    までの部分から該接触文字が含まれる領域を切出す文字
    切出し部と、 請求項1記載の文字認識部とを、備えたことを特徴とす
    る文字認識システム。
  4. 【請求項4】 前記プレ印刷切断部で切断された接触文
    字の欠落部分を補完する文字補完部を設けたことを特徴
    とする請求項3記載の文字認識システム。
  5. 【請求項5】 前記印刷文字の有無と該印刷文字の位置
    とは、前記枠線に沿って設定された任意数の探査線に接
    する線分数から求める構成にしたことを特徴とする請求
    項2、3または4記載の文字認識システム。
  6. 【請求項6】 枠線に囲まれた枠に文字が記載された表
    形式の帳票のイメージを入力する入力手段と、 前記イメージ中の枠線の位置を検出する枠線検出部と、 前記枠線のうちの前記文字を形成する線分に接触を持つ
    接触枠線を検出し、該文字が前記枠に接触を持つ接触文
    字か接触を持たない非接触文字かを判断する接触検出部
    と、 前記接触枠線の前記枠内側に接触する前記接触文字の線
    分数及びその接触箇所の開始点と終点の座標と、該接触
    枠線の前記枠外側に接触する線分数及びその接触箇所の
    開始点と終点の座標とを接触情報として求める形状抽出
    部と、 前記接触情報に基づき、前記接触枠線の前記線分に接触
    していない部分を前記イメージから消去するイメージ消
    去部と、 前記接触文字の場合には、前記イメージが前記表形式の
    帳票のイメージか否かを判定し、表形式の場合には前記
    枠外側を探査することにより、該枠に記載された該接触
    文字と該枠外に記載された該接触文字以外の別行文字と
    の接触の有無を判断し、該接触がある場合に、該接触文
    字に強制的に不読の認識結果を与える外部記入接触部
    と、 前記非接触文字に対しては、前記イメージの前記枠内の
    部分から前記非接触文字が含まれる領域を切出し、前記
    接触文字のうち前記不読の認識結果が与えられていない
    文字に対しては、該枠外で該接触文字が終了する位置を
    求め、前記線分に接触していない部分が消去されたイメ
    ージにおける該枠内から該接触文字が終了する位置まで
    の部分から該接触文字が含まれる領域を切出す文字切出
    し部と、 前記切出されたイメージに基づき前記文字に対する認識
    を行って文字コードを求める文字認識部とを、備えたこ
    とを特徴とする文字認識システム。
  7. 【請求項7】 請求項6記載の入力手段、枠線検出部、
    接触検出部、形状抽出部及びイメージ消去部と、 前記接触文字の場合には、前記イメージが前記表形式の
    帳票のイメージか否かを判定する外部記入接触部と、 前記イメージが前記表形式の帳票のイメージと判断され
    た場合に、前記枠外のイメージを解析することにより、
    該枠に記載された前記接触文字と該枠外に記載された前
    記別行文字とが重なっているかどうかを判断し、重なっ
    ていると判断した場合には、該接触文字に強制的に不読
    の認識結果を与える外部記入解析部と、 前記非接触文字に対しては、前記イメージの前記枠内の
    部分から該非接触文字が含まれる領域を切出し、前記接
    触文字のうち前記不読の認識結果が与えられていない文
    字に対しては、該枠外で該接触文字が終了する位置を求
    め、前記線分に接触していない部分が消去されたイメー
    ジにおける該枠内から該接触文字が終了する位置までの
    部分から該接触文字が含まれる領域を切出す文字切出し
    部と、 請求項6記載の文字認識部とを、備えたことを特徴とす
    る文字認識システム。
  8. 【請求項8】 請求項6記載の入力手段、枠線検出部、
    接触検出部、形状抽出部及びイメージ消去部と、 前記イメージが前記表形式の帳票のイメージか否かを判
    定し、該表形式の帳票のイメージの場合には前記枠内を
    探査し、該枠内に記載された前記文字と該枠内に外部か
    ら侵入した別行文字の端部との間に白領域が存在するか
    否かを判定して接触状態を検出する侵入接触部と、 前記枠内に記載された文字と前記別行文字との端部との
    間に白領域が存在しない場合に、該枠内を解析して該文
    字と該別行文字に重なりが有る否かを検出し、該重なり
    が有る場合には、該枠に記載された文字に対して強制的
    に不読の認識結果を与える侵入解析部と、 前記非接触文字のうちの前記不読の認識結果が与えられ
    ていない文字に対しては、前記イメージの前記枠内の部
    分から該非接触文字が含まれる領域を切出し、前記接触
    文字の該不読の認識結果が与えられていない文字に対し
    ては、該枠外で該接触文字が終了する位置を求め、前記
    線分に接触していない部分が消去されたイメージにおけ
    る該枠内から該接触文字が終了する位置までの部分から
    該接触文字が含まれる領域を切出す文字切出し部と、 請求項6記載の文字認識部とを、備えたことを特徴とす
    る文字認識システム。
  9. 【請求項9】 前記文字を含むイメージと前記文字コー
    ドに対応する文字とを同時に表示する表示手段と、 前記イメージにおける前記文字を他の部分に対して異な
    る色に設定して前記表示手段に表示する表示イメージ加
    工手段とを、設けたことを特徴とする請求項1、2、
    3、4、5、6、7または8記載の文字認識システム。
JP10191724A 1998-07-07 1998-07-07 文字認識システム Withdrawn JP2000020641A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10191724A JP2000020641A (ja) 1998-07-07 1998-07-07 文字認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10191724A JP2000020641A (ja) 1998-07-07 1998-07-07 文字認識システム

Publications (1)

Publication Number Publication Date
JP2000020641A true JP2000020641A (ja) 2000-01-21

Family

ID=16279441

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10191724A Withdrawn JP2000020641A (ja) 1998-07-07 1998-07-07 文字認識システム

Country Status (1)

Country Link
JP (1) JP2000020641A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030585A (ja) * 2001-07-12 2003-01-31 Canon Inc 画像処理装置、方法、プログラム及び記憶媒体
JP2018180872A (ja) * 2017-04-12 2018-11-15 富士ゼロックス株式会社 文書処理装置及びプログラム
JP2020087320A (ja) * 2018-11-30 2020-06-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003030585A (ja) * 2001-07-12 2003-01-31 Canon Inc 画像処理装置、方法、プログラム及び記憶媒体
JP2018180872A (ja) * 2017-04-12 2018-11-15 富士ゼロックス株式会社 文書処理装置及びプログラム
JP2020087320A (ja) * 2018-11-30 2020-06-04 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム
JP7301529B2 (ja) 2018-11-30 2023-07-03 キヤノン株式会社 画像処理装置、画像処理方法、及びプログラム

Similar Documents

Publication Publication Date Title
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2000020641A (ja) 文字認識システム
JP3422634B2 (ja) 手書き文字認識方法及び装置
JP3794285B2 (ja) 光学式文字読取装置
JP2000082110A (ja) 罫線消去装置および文字画像抽出装置および罫線消去方法および文字画像抽出方法および記録媒体
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP3133797B2 (ja) 文字認識方法及びその装置
JP2002074264A (ja) 画像処理装置、画像処理方法および記録媒体
JP3045086B2 (ja) 光学式文字読取方法および装置
JPH08263588A (ja) 文字認識装置
JPH0573725A (ja) 手書き文字・図形認識装置
JPH10134145A (ja) 文字切り出し方法およびそれを用いた文字認識装置と、その文字切り出し方法を実行するプログラムを格納した、コンピュータが読取可能な記憶媒体
JP3454939B2 (ja) 文字認識方法及び文字入力装置
JP4442977B2 (ja) 文字認識装置、文字イメージ補間方法及び文字イメージ補間プログラムを記録した記録媒体
JPH0644406A (ja) 画像処理方法及び装置
JPH1185904A (ja) 文字切り出し方法及びこれを用いた文字認識装置
JPH01292586A (ja) 文字認識支援装置
JP2000207490A (ja) 文字切出装置、および文字切出方法
JP2000207486A (ja) 文字認識装置、誤認文字等検出方法及び誤認文字等検出プログラムを記録した媒体
JPH07141468A (ja) 手書入力文字装置における手書文字認識処理方法
JPH09237321A (ja) 手書き文字認識装置
JPH08221518A (ja) 光学文字読取装置
JPH1069522A (ja) 文字認識装置及び文字認識方法並びに文字認識方法を記録した記録媒体
JPH10124610A (ja) 光学式文字読取装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20051004