JPH09259222A - フォーマット認識装置及び文字読取り装置 - Google Patents

フォーマット認識装置及び文字読取り装置

Info

Publication number
JPH09259222A
JPH09259222A JP8064970A JP6497096A JPH09259222A JP H09259222 A JPH09259222 A JP H09259222A JP 8064970 A JP8064970 A JP 8064970A JP 6497096 A JP6497096 A JP 6497096A JP H09259222 A JPH09259222 A JP H09259222A
Authority
JP
Japan
Prior art keywords
format
character
recognition
reference data
ruled line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP8064970A
Other languages
English (en)
Other versions
JP3276555B2 (ja
Inventor
Kazuhiro Ishikawa
和弘 石川
Keita Okada
惠太 岡田
Koichi Higuchi
浩一 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP06497096A priority Critical patent/JP3276555B2/ja
Publication of JPH09259222A publication Critical patent/JPH09259222A/ja
Application granted granted Critical
Publication of JP3276555B2 publication Critical patent/JP3276555B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 帳票フォーマットの種別を表す識別番号が記
載されていない帳票であっても、帳票フォーマットを識
別する。 【解決手段】 帳票イメージデータを水平及び垂直方向
に走査して、各走査線上で所定の長さ以上連続する黒ビ
ットを水平罫線パタン及び垂直罫線パタンの黒ビットと
して抽出する。抽出した水平罫線パタン及び垂直罫線パ
タンにより表される帳票フォーマットの特徴を、帳票フ
ォーマットの辞書データと照合して、帳票フォーマット
の種別を認識する。当該認識結果を得た帳票フォーマッ
ト未知の帳票イメージデータと、当該認識結果に対応す
る既知の帳票フォーマットの特徴とを、同一の表示画面
に同時に表示して、オペレータによる認識結果の確認作
業を助ける。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、帳票フォーマッ
トの種別を認識するフォーマット認識装置と、帳票フォ
ーマットの種別を認識しその認識結果に応じた文字読取
りを行なう文字読取り装置とに関する。
【0002】
【従来の技術】文字記入された帳票の文字読取りを行な
う装置においては、一般に、各帳票フォーマットの種別
に対応した読取り制御データを用いて文字パタンを切出
し認識することが行なわれている(例えば文献「橋本新
一郎 編著、文字認識概論 p203〜206 昭和5
7年3月20日、オーム社」参照)。文字パタンの切出
しには例えば文字行の位置、フィールドの位置及び個
数、文字のピッチ及び個数が、また文字パタンの認識に
は例えば文字種、字体が、読取り制御データに用いられ
る。従来一般に、この種の装置に供する帳票には各帳票
フォーマットの各種別毎に設定された帳票種別番号が印
刷されており、この種別番号の認識結果に基づいて読取
り制御データを読み出している。
【0003】
【発明が解決しようとする課題】しかしながら帳票のな
かには、帳票種別番号が印刷されていないものもある。
例えば振込依頼書などの私製の帳票や、市販の一般伝票
には、帳票種別番号が印刷されておらず、従って上述し
た従来装置では、この種の帳票につき文字パタンの切出
し及び認識を行なう場合に、読取り制御データを利用で
きない。
【0004】そこでこの出願の発明者等は種々の検討を
行った結果、帳票フォーマットに関わる罫線を利用すれ
ば、帳票種別番号が印刷されていない場合でも、帳票フ
ォーマットの種別を認識できることに気付いた。
【0005】この出願はこのような点に鑑み成されたも
のであり、この出願の第一の目的は、帳票フォーマット
に関わる罫線を利用して帳票フォーマットの種別を認識
する帳票フォーマット認識装置と、帳票フォーマットに
関わる罫線を利用して帳票フォーマットの種別を認識し
この認識結果に対応した読取り制御データを用いて文字
パタンの切出し及び認識を行なう文字読取り装置とを提
供することにある。
【0006】このような帳票フォーマットの認識技術に
類似する技術として、例えば特開平4−158487号
公報に開示されている表認識装置がある。この装置は、
表の構造及び内部の文字を認識する装置であって、連結
黒画素の外接矩形リストを作成する手段、外接矩形の辺
の長さから矩形内の連結黒画素が文字であるか否かを推
定する手段、この推定結果に基づいて矩形内の文字認識
を行なう手段、矩形内の文字を文字認識終了後に消去す
る手段、矩形内の文字消去後に黒画素のヒストグラムか
ら罫線の位置を推定し、推定した罫線位置に基づきイメ
ージデータを部分的に走査して表を構成する罫線の位置
を認識する手段とを備える。
【0007】しかしながらこの表認識装置は、表を構成
する各罫線の位置を認識するに留まるものであって、読
取り制御データの選択のために罫線を利用して帳票フォ
ーマットの種別を認識するものではない。従って読取り
制御データを用いることができないので、読取りを行な
いたい特定の領域の文字パタンだけを切り出して認識す
るということは、できない。
【0008】
【課題を解決するための手段】上述した課題を解決する
ため、請求項1のフォーマット認識装置は、帳票フォー
マット未知の帳票イメージデータから、帳票フォーマッ
トを表す罫線パタンを抽出する罫線抽出部と、抽出され
た罫線パタンを格納する罫線パタンメモリと、帳票フォ
ーマットの辞書データを保持するフォーマット認識辞書
と、抽出された罫線パタンを、帳票フォーマットの辞書
データと照合し、該照合結果に基づいて罫線パタンによ
り表される帳票フォーマットについて一又は複数の認識
結果を出力するフォーマット認識部と、既知の帳票フォ
ーマットの特徴を表す参照データを保持する参照データ
メモリと、帳票フォーマットの認識結果に対応した既知
の帳票フォーマットの参照データを表示する表示部と、
オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えることを特徴と
する。
【0009】請求項2のフォーマット認識装置にあって
は、請求項1記載のフォーマット認識装置において、表
示部は、帳票フォーマット未知の帳票イメージデータと
当該イメージデータの認識結果に対応する参照データと
を、表示部の同一画面に同時に表示することを特徴とす
る。
【0010】このような構成によれば、オペレータは帳
票フォーマット未知の帳票イメージデータと当該イメー
ジデータの認識結果に対応する参照データとを、比較参
照して、最も確からしい認識結果を判断決定できるの
で、その決定作業を正確に行なえる。
【0011】請求項3のフォーマット認識装置にあって
は、請求項1又は2記載のフォーマット認識装置におい
て、表示部は、帳票フォーマットの複数の認識結果に対
応する参照データを、認識の確からしさの高い順に表示
することを特徴とする。
【0012】このような構成によれば、オペレータは、
帳票フォーマットの複数の認識結果に対応する参照デー
タを、認識の確からしさの高い順に参照して、最も確か
らしい認識結果を判断決定できるので、その決定作業を
迅速に行なえる。
【0013】また請求項17の文字読取り装置は、帳票
フォーマットの認識処理を行なうフォーマット認識系
と、読取り制御データを保持する制御データメモリと、
帳票フォーマットの認識結果に対応した読取り制御デー
タに従って文字の認識処理を行なう文字認識系とを備
え、文字認識系は、帳票イメージデータから文字パタン
を切り出す文字切出し部と、切り出された文字パタンを
格納する文字パタンメモリと、文字の辞書データを保持
する文字認識辞書と、切り出された文字パタンを、文字
の辞書データと照合し、該照合結果に基づいて文字パタ
ンを認識する文字認識部とを備え、フォーマット認識系
を、帳票フォーマット未知の帳票イメージデータから、
帳票フォーマットを表す罫線パタンを抽出する罫線抽出
部と、抽出された罫線パタンを格納する罫線パタンメモ
リと、帳票フォーマットの辞書データを保持するフォー
マット認識辞書と、抽出された罫線パタンを、帳票フォ
ーマットの辞書データと照合し、該照合結果に基づいて
罫線パタンにより表される帳票フォーマットについて一
又は複数の認識結果を出力するフォーマット認識部とに
より構成し、既知の帳票フォーマットの特徴を表す参照
データを保持する参照データメモリと、前記帳票フォー
マットの認識結果に対応した既知の帳票フォーマットの
参照データを表示する表示部と、オペレータが表示され
た参照データに基づいて帳票フォーマットの認識結果を
決定する作業において、オペレータによる決定結果の入
力操作に対応したフォーマット決定信号を出力する入力
デバイスとを設け、文字認識系は、フォーマット決定信
号に対応する読取り制御データに従って、文字の認識処
理を行なうことを特徴とする。
【0014】このような構成によれば、帳票イメージデ
ータから罫線パタンを抽出し、抽出された罫線パタンを
帳票フォーマットの辞書データと照合して、帳票フォー
マットの認識を行なうので、帳票フォーマットの種別を
表す種別番号が帳票に印刷されていない場合でも、帳票
フォーマットを認識しその認識結果に基づいて帳票フォ
ーマットの種別を知ることができる。
【0015】帳票にあっては、一般に、帳票の紙面を罫
線によって複数の領域に区分し、罫線によって区分され
た各区分領域毎に、予め定められた事項(以下、所定事
項)が記載される。所定事項が記載される区分領域に
は、帳票使用前に空白となっていて使用時に所定事項
(例えば住所、氏名、取引先の名称、金額、数量、チェ
ック印)が書き込まれるものもあれば、帳票使用前に予
め何らかの所定事項(例えば数量、金額といった属性を
表すもの)が印刷されているものもある。帳票フォーマ
ットとは、このように利用される区分領域の形態(例え
ば各区分領域の大きさ、相対的位置関係、個数、形状)
を表すものである。各区分領域は罫線によって仕切られ
画成されるものであるから、帳票イメージから抽出され
た罫線パタンにより、区分領域の形態すなわち帳票フォ
ーマットを表すことができる。
【0016】帳票の用途によって種々の帳票フォーマッ
トが存在するが、一般に、用途の同じ帳票であれば同じ
帳票フォーマットが用いられる。従って帳票フォーマッ
トの種別を表す種別番号が帳票に印刷されていない場合
でも、その帳票イメージデータから抽出された罫線パタ
ンを帳票フォーマットの辞書データと照合し、照合結果
に基づいてその帳票フォーマットの種別を知ることがで
きる。
【0017】従って帳票フォーマットの種別を表す識別
番号を、帳票に記載するという手間を省ける利点もあ
る。
【0018】さらにフォーマット認識部は、帳票フォー
マットが未知である帳票イメージデータから抽出された
罫線パタンを、帳票フォーマットの辞書データと照合
し、その照合結果に基づいて、未知の帳票フォーマット
の種別の候補となる一又は複数の種別を認識結果として
出力する。そして表示部はその認識結果に対応した既知
の帳票フォーマットの参照データを表示する。
【0019】参照データは、既知の帳票フォーマットの
特徴を表すデータであり予め調べてメモリに記憶させて
おくものである。オペレータは、表示された参照データ
を参照して、最も確からしい認識結果を判断決定できる
ので、その決定作業を正確に行なえる。
【0020】請求項18の文字読取り装置にあっては、
請求項17記載の文字読取り装置において、表示部は、
帳票フォーマット未知の帳票イメージデータと当該イメ
ージデータの認識結果に対応する参照データとを、表示
部の同一画面に同時に表示することを特徴とする。
【0021】このような構成によれば、オペレータは帳
票フォーマット未知の帳票イメージデータと当該イメー
ジデータの認識結果に対応する参照データとを、比較参
照して、最も確からしい認識結果を判断決定できるの
で、その決定作業を正確に行なえる。
【0022】請求項19の文字読取り装置にあっては、
請求項17又は18記載の文字読取り装置において、表
示部は、帳票フォーマットの複数の認識結果に対応する
参照データを、認識の確からしさの高い順に表示するこ
とを特徴とする。
【0023】このような構成によれば、オペレータは、
帳票フォーマットの複数の認識結果に対応する参照デー
タを、認識の確からしさの高い順に参照して、最も確か
らしい認識結果を判断決定できるので、その決定作業を
迅速に行なえる。
【0024】請求項20の文字読取り装置にあっては、
請求項17記載の文字読取り装置において、参照データ
メモリを、制御データメモリとし、表示部は、参照デー
タとして読取り制御データを表示することを特徴とす
る。
【0025】このような構成によれば、参照データメモ
リを、制御データメモリとするので、装置構成を簡略化
できる。
【0026】請求項21の文字読取り装置にあっては、
請求項17記載の文字読取り装置において、罫線パタン
により表される帳票フォーマットの認識結果が一つであ
るときは、文字認識系は、当該帳票フォーマットの認識
結果に対応する読取り制御データに従って文字の認識処
理を行なうことを特徴とする。
【0027】このような構成によれば、帳票フォーマッ
トの認識結果が一つであるときは、文字認識系は、最も
確からしい認識結果を判断決定するオペレータの作業を
経ることなく、文字の認識処理を行なえるので、処理時
間を短縮できる。
【0028】
【発明の実施の形態】図1は文字読取り装置の構成を概
略的に示す機能ブロック図である。同図に示す文字読取
り装置は、請求項9の文字読取り装置の実施形態となる
ものであって、請求項1のフォーマット認識装置の実施
形態を含んでいる。以下の説明では、請求項9の文字読
取り装置の実施形態の説明と共に、請求項1のフォーマ
ット認識装置の実施形態につき説明する。
【0029】同図に示す文字読取り装置10は、帳票フ
ォーマットの認識処理を行なうフォーマット認識系12
と、読取り制御データを保持する制御データメモリ14
と、帳票フォーマットの認識結果に対応した読取り制御
データに従って文字の認識処理を行なう文字認識系16
と、制御部17とを備える。
【0030】フォーマット認識系12を、帳票フォーマ
ット未知の帳票イメージデータから、帳票フォーマット
を表す罫線パタンを抽出する罫線抽出部18と、抽出さ
れた罫線パタンを格納する罫線パタンメモリ20と、帳
票フォーマットの辞書データを保持するフォーマット認
識辞書22と、抽出された罫線パタンを、パターンマッ
チング法により、帳票フォーマットの辞書データと照合
し、該照合結果に基づいて罫線パタンにより表される帳
票フォーマットについて一又は複数の認識結果を出力す
るフォーマット認識部24とにより構成する。
【0031】そして既知の帳票フォーマットの特徴を表
す参照データを保持する参照データメモリ26と、前記
帳票フォーマットの認識結果に対応した既知の帳票フォ
ーマットの参照データを表示する表示部28と、オペレ
ータが表示された参照データに基づいて帳票フォーマッ
トの認識結果を決定する作業において、オペレータによ
る決定結果の入力操作に対応したフォーマット決定信号
を出力する入力デバイス30とを設ける。
【0032】文字認識系16は、帳票イメージデータか
ら文字パタンを切り出す文字切出し部32と、切り出さ
れた文字パタンを格納する文字パタンメモリ34と、文
字の辞書データを保持する文字認識辞書36と、切り出
された文字パタンを、パターンマッチング法により、文
字の辞書データと照合し、該照合結果に基づいて文字パ
タンを認識する文字認識部38とを備え、この文字認識
系16は、フォーマット決定信号に対応する読取り制御
データに従って、文字の認識処理を行なう。
【0033】制御部17は、フォーマット認識系12及
び文字認識系16の動作制御と、表示部28の表示制御
とを行なう。
【0034】(フォーマット認識の原理的な説明)図2
は帳票の一例を示す平面図である。図2(A)に示す帳
票40の紙面40a上には、帳票フォーマットの種別を
表す識別番号42(図示例では01234で表される5
桁の数字)と、所定事項が記載される領域を区分する罫
線44と、書き込まれるべき所定事項の属性を表す文字
46(図示例では01、02で表される文字)と、所定
事項を伝達すべく書き込まれた文字48(図示例ではA
BC、あいうえお、DEF、かきくけこ、アイウエオカ
キクケコで表される文字)とが記載されている。識別番
号42、罫線44及び文字46は帳票使用前に予め印刷
されていたものであり、また文字48は帳票使用時に書
き加えられたものである。文字48の書き加えられた領
域は、それ以前には空白となっている。
【0035】罫線44を印刷することにより、紙面40
aを複数の領域50に区分し、罫線44によって区分さ
れた各区分領域50に、所定事項を記載する。尚、所定
事項は、文字、記号、図形そのほか種々のものにより表
すことができる。
【0036】帳票フォーマットは、罫線44によって区
分された区分領域50の形態(例えば紙面40a上に存
在する区分領域50の大きさ、個数及び形状や、各区分
領域50の相対的位置関係)を表したものである。
【0037】図2(B)に示す帳票40は、図2(A)
の帳票40と同じ用途に供するものであって、紙面40
a上に識別番号42を記載していないほかは、図2
(A)の帳票40と全く同様となっている。図2(B)
及び(A)にも示すように、同じ用途に供する帳票にあ
っては、識別番号42の有無に相違があっても殆どの場
合、同じ帳票フォーマットを用いるか、極めて類似した
帳票フォーマットを用いる。
【0038】従って識別番号42を記載していない図2
(B)の帳票40であっても、帳票イメージデータから
罫線パタンを抽出し、抽出した罫線パタンにより表され
る帳票フォーマットを認識することにより、帳票フォー
マットの種別を知ることができる。
【0039】(全体的な動作の流れ)次に文字読取り装
置の全体的な動作の流れにつき説明する。図3はこの実
施形態の文字読取り装置の全体的な動作の流れを示す図
である。
【0040】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。線描
画素は紙面40a内に在る線を表す画素、背景画素は紙
面40aの地の部分(線の背景となる部分)を表す画素
である。スキャナ52にセットした帳票40を押える押
え面は帳票40の紙面40aの地と同様に背景画素に変
換される色例えば白色となっており、従ってここでは押
え面も白ビットで表わされる。
【0041】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
【0042】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
【0043】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
【0044】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
【0045】制御部17は、入力した帳票フォーマット
の認識結果に対応した読取り制御データを既知の帳票フ
ォーマットの参照データとして参照データメモリ26
(14)から読み出し、読み出した参照データを表示部
28に表示させると共に、当該認識結果を得た帳票フォ
ーマット未知の帳票イメージデータを帳票イメージメモ
リ54から読み出し表示部28に表示させ(S4)、然
る後、オペレータによるフォーマット決定信号の入力を
待つ(S5)。
【0046】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
【0047】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S5)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S6)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
【0048】ここでは読取り制御データメモリ14(2
6)には、文字パタンの切出しに関わる読取り制御デー
タと文字パタンの認識に関わる読取り制御データとを記
憶させてあり、制御部17は、フォーマット決定信号に
より決定された認識結果に対応する読取り制御データを
読出し済みの読取り制御データのなかから選択し、選択
した読取り制御データのうち文字パタンの切出しに関わ
る読取り制御データを文字切出し部32へ、また選択し
た読取り制御データのうち文字パタンの認識に関わる読
取り制御データを文字認識部38へ出力する。
【0049】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S7)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S8)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S9)。制
御部17は、1文字単位に、文字パタンの認識結果を入
力しそして帳票紙面40a上のすべての文字について認
識を終了したか否かを判定する(S10)。
【0050】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS7〜S
9の処理を繰り返す。また帳票紙面40a上のすべての
文字について認識を終了したならば、帳票1枚分の文字
読取りを終了し、帳票1枚につき得た文字認識結果を後
段の装置へ出力する(終了)。
【0051】(罫線パタンの抽出)次に罫線抽出部18
が行なう罫線パタンの抽出につき説明する。罫線抽出部
18は、帳票40全面にわたり帳票イメージデータを走
査し、帳票フォーマットを表す罫線パタンとして水平罫
線パタンと垂直罫線パタンとを抽出する。
【0052】水平罫線パタンを抽出するときは、帳票イ
メージデータを水平走査し、水平走査線上で水平罫線閾
値TH(Lh)以上の長さLhだけ連続する帳票イメー
ジデータの線描画素を、水平罫線パタンの線描画素とし
て抽出する。連続する長さLhが水平罫線閾値TH(L
h)未満となる帳票イメージデータの線描画素(水平走
査線上で連続せずに孤立して存在する1個の線描画素を
含む)は、水平罫線パタンの背景画素として抽出する。
帳票イメージデータの背景画素もまた、水平罫線パタン
の背景画素として抽出する。水平罫線パタンはこのよう
にして帳票イメージデータから抽出した線描画素及び背
景画素から成るパタンである。
【0053】同様に垂直罫線パタンを抽出するときは、
帳票イメージデータを垂直走査し、垂直走査線上で垂直
罫線閾値TH(Lv)以上の長さLvだけ連続する帳票
イメージデータの線描画素を、垂直罫線パタンの線描画
素として抽出する。連続する長さLvが垂直罫線閾値T
H(Lv)未満となる帳票イメージデータの線描画素
(垂直走査線上で連続せずに孤立して存在する1個の線
描画素を含む)は、垂直罫線パタンの背景画素として抽
出する。帳票イメージデータの背景画素もまた、垂直罫
線パタンの背景画素として抽出する。垂直罫線パタンは
このようにして帳票イメージデータから抽出した線描画
素及び背景画素から成るパタンである。
【0054】抽出した水平罫線パタン及び垂直罫線パタ
ンに共通の格納領域(以下、罫線共通格納領域)を罫線
パタンメモリ20に設け、水平罫線パタン及び垂直罫線
パタンを重ね合わせて罫線共通格納領域に格納しても良
いし、抽出した水平罫線パタン及び垂直罫線パタンの各
パタン毎に個別の格納領域(以下、罫線個別格納領域)
を罫線パタンメモリ20に設け、水平罫線パタン及び垂
直罫線パタンをそれぞれ別々の罫線個別格納領域に格納
するようにしても良い。
【0055】罫線共通格納領域に格納する場合には、罫
線共通格納領域全面に背景画素を格納し(罫線共通格納
領域の初期化)、然る後、抽出した水平罫線パタンの線
描画素を共通格納領域に格納すると共に抽出した垂直罫
線パタンの線描画素を共通格納領域に格納する。
【0056】また罫線個別格納領域に格納する場合に
は、水平罫線パタンに対し設けた罫線個別格納領域全面
に背景画素を格納し(罫線個別格納領域の初期化)、然
る後、水平罫線パタンに対し設けた罫線個別格納領域
に、抽出した水平罫線パタンの線描画素を格納する。ま
た垂直罫線パタンに対し設けた罫線個別領域全面に背景
画素を格納し(罫線個別格納領域の初期化)、然る後、
垂直罫線パタンに対し設けた罫線個別格納領域に、抽出
した垂直罫線パタンの線描画素を格納する。
【0057】図4はこの実施形態の罫線抽出部の動作の
説明に供する図であって、罫線パタンの線描画素を抽出
する動作に着目した動作の流れの具体的な一例を示す。
【0058】まず、水平罫線パタンと垂直罫線パタンと
を重ね合わせて、罫線パタンメモリ20の罫線共通格納
領域に格納する場合について説明する。この場合、帳票
イメージメモリ54の帳票イメージデータ格納領域上と
罫線パタンメモリ20の罫線共通格納領域上とには、相
対応させたx−y座標系を設定してあり(例えば、水平
方向x軸方向及び垂直方向をy軸方向とする。)、この
座標系で表される画素位置の格納領域から画素データを
読み出し、或はまた、この座標系で表される画素位置の
格納領域へ画素データを書き込むことができるようにな
っているものとする。さらに帳票40の左辺がこれらx
−y座標系のy軸と、帳票40の上辺がこれらx−y座
標系のx軸と重なるように、帳票40をスキャナ52に
セットして、スキャナ52により帳票イメージデータを
得、従ってこれらx−y座標系のx、y軸上に帳票40
の上辺、左辺が載るように位置決めされた帳票イメージ
データ、罫線パタンを格納するものとする。
【0059】制御部17により起動された罫線抽出部1
8は、罫線パタンメモリ20の罫線共通格納領域全面に
わたって背景画素ここでは白ビットを格納する(罫線共
通格納領域の初期化)。
【0060】然る後、罫線抽出部18は走査方向を水平
方向として水平罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして水平罫線閾値TH
(Lh)を用い、また連続の長さLとして水平走査線上
で連続する線描画素の長さLhを求めることとなる。
【0061】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを水平走査し、帳
票イメージデータの画素データを読み出す(S2)。画
素データは1画素分のデータを表す。
【0062】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
【0063】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に水平
罫線パタンに関する線描画素の候補位置(以下、水平罫
線候補位置)として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
ここでは、S3で画素データが線描画素であるとの判定
結果を得た場合に連続の長さLを1カウントアップする
ことによって従って連続する線描画素の個数を計数する
ことによって、連続の長さLを求める。
【0064】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
【0065】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは水平罫線パタンを抽
出する場合であるので求めた連続の長さLは水平走査線
上における連続の長さLhであり、そして閾値THには
水平罫線閾値TH(Lh)を用いることとなる。
【0066】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、罫線パタンメモリ20に格納する
(S7)。ここでは記憶していた水平罫線候補位置の罫
線共通格納領域に線描画素を格納することとなる。S7
の次に、連続の長さLを初期化すると共に記憶していた
水平罫線候補位置を消去し(S8)、然る後、帳票40
全面にわたって帳票イメージデータの走査を終了したか
否かを判定する(S9)。またS6で連続の長さLは閾
値TH未満であるとの判定結果を得た場合は、S7を行
なわずに、S8〜S9を行なう。
【0067】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から水平罫線パタンを抽出する処
理を終了する(終了)。
【0068】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
【0069】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた水平罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
【0070】次に、罫線抽出部18は走査方向を垂直方
向として垂直罫線パタンを抽出する処理を開始する(開
始)。この場合、閾値THとして垂直罫線閾値TH(L
v)を用い、また連続の長さLとして垂直走査線上で連
続する線描画素の長さLvを求めることとなる。
【0071】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを垂直走査し、帳
票イメージデータの画素データを読み出す(S2)。
【0072】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
【0073】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に垂直
罫線パタンに関する線描画素の候補位置(以下、垂直罫
線候補位置)として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
【0074】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
【0075】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは垂直罫線パタンを抽
出する場合であるので求めた連続の長さLは垂直走査線
上における連続の長さLvであり、そして閾値THには
垂直罫線閾値TH(Lv)を用いることとなる。
【0076】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、罫線パタンメモリ20に格納する
(S7)。ここでは記憶していた垂直罫線候補位置の罫
線共通格納領域に線描画素を格納することとなる。S7
の次に、連続の長さLを初期化すると共に記憶していた
垂直罫線候補位置を消去し(S8)、然る後、帳票40
全面にわたって帳票イメージデータの走査を終了したか
否かを判定する(S9)。またS6で連続の長さLは閾
値TH未満であるとの判定結果を得た場合は、S7を行
なわずに、S8〜S9を行なう。
【0077】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から垂直罫線パタンを抽出する処
理を終了する(終了)。
【0078】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
【0079】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた垂直罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
【0080】以上のようにして、図2(B)に示す帳票
40について水平及び垂直罫線パタンの線描画素を抽出
し、これらパタンの線描画素を重ね合わせて罫線共通格
納領域に格納した例を、図5に示す。図中、20aは罫
線パタンメモリ20の罫線共通格納領域、20bは罫線
共通格納領域20aにおいて帳票紙面40aに対応する
領域、44aは水平罫線パタン及び垂直罫線パタンの重
ね合わせパタンを示す。重ね合わせパタン44aは、水
平罫線パタンの線描画素と垂直罫線パタンの線描画素
と、水平罫線パタンの背景画素でありかつ垂直罫線パタ
ンの背景画素である画素とから成る。
【0081】次に、水平罫線パタンと垂直罫線パタンと
を個別に、罫線パタンメモリ20の罫線個別格納領域に
格納する場合について説明する。この場合、帳票イメー
ジメモリ54の帳票イメージデータ格納領域上と罫線パ
タンメモリ20の各罫線個別格納領域上(水平罫線パタ
ンに対して設けた罫線個別格納領域上及び垂直罫線パタ
ンに対して設けた罫線個別格納領域上)とには、相対応
させたx−y座標系を設定してあり(例えば、水平方向
x軸方向及び垂直方向をy軸方向とする。)、この座標
系で表される画素位置の格納領域から画素データを読み
出し、或はまた、この座標系で表される画素位置の格納
領域へ画素データを書き込むことができるようになって
いるものとする。さらに帳票40の左辺がこれらx−y
座標系のy軸と、帳票40の上辺がこれらx−y座標系
のx軸と重なるように、帳票40をスキャナ52にセッ
トして、スキャナ52により帳票イメージデータを得、
従ってこれらx−y座標系のx、y軸上に帳票40の上
辺、左辺が載るように位置決めされた帳票イメージデー
タ、罫線パタンを格納するものとする。
【0082】制御部17により起動された罫線抽出部1
8は、水平罫線パタンに対して設けた罫線個別格納領域
全面にわたって背景画素ここでは白ビットを格納する
(水平罫線パタンに対して設けた罫線個別格納領域の初
期化)。
【0083】然る後、罫線抽出部18は走査方向を水平
方向として水平罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして水平罫線閾値TH
(Lh)を用い、また連続の長さLとして水平走査線上
で連続する線描画素の長さLhを求めることとなる。
【0084】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを水平走査し、帳
票イメージデータの画素データを読み出す(S2)。
【0085】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
【0086】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に水平
罫線候補位置として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
【0087】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
【0088】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは水平罫線パタンを抽
出する場合であるので求めた連続の長さLは水平走査線
上における連続の長さLhであり、そして閾値THには
水平罫線閾値TH(Lh)を用いることとなる。
【0089】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、水平罫線パタンに対して設けた罫線
個別格納領域に格納する(S7)。ここでは記憶してい
た水平罫線候補位置の罫線個別格納領域に線描画素を格
納することとなる。S7の次に、連続の長さLを初期化
すると共に記憶していた水平罫線候補位置を消去し(S
8)、然る後、帳票40全面にわたって帳票イメージデ
ータの走査を終了したか否かを判定する(S9)。また
S6で連続の長さLは閾値TH未満であるとの判定結果
を得た場合は、S7を行なわずに、S8〜S9を行な
う。
【0090】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から水平罫線パタンを抽出する処
理を終了する(終了)。
【0091】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
【0092】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた水平罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
【0093】次に罫線抽出部18は、垂直罫線パタンに
対して設けた罫線個別格納領域全面にわたって背景画素
ここでは白ビットを格納する(垂直罫線パタンに対して
設けた罫線個別格納領域の初期化)。
【0094】然る後、罫線抽出部18は走査方向を垂直
方向として垂直罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして垂直罫線閾値TH
(Lv)を用い、また連続の長さLとして垂直走査線上
で連続する線描画素の長さLvを求めることとなる。
【0095】次に罫線抽出部18は、連続の長さLを零
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを垂直走査し、帳
票イメージデータの画素データを読み出す(S2)。
【0096】次に罫線抽出部18は、読み出した帳票イ
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
【0097】S3で画素データが線描画素であるとの判
定結果を得た場合は、連続の長さLを求めると共に垂直
罫線候補位置として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
【0098】S5で現走査線1ラインの走査を終了して
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
【0099】S5の判定で現走査線1ラインの走査を終
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは垂直罫線パタンを抽
出する場合であるので求めた連続の長さLは垂直走査線
上における連続の長さLvであり、そして閾値THには
垂直罫線閾値TH(Lv)を用いることとなる。
【0100】S6で連続の長さLは閾値TH以上である
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、垂直罫線パタンに対して設けた罫線
個別格納領域に格納する(S7)。ここでは記憶してい
た垂直罫線候補位置の罫線個別格納領域に線描画素を格
納することとなる。S7の次に、連続の長さLを初期化
すると共に記憶していた垂直罫線候補位置を消去し(S
8)、然る後、帳票40全面にわたって帳票イメージデ
ータの走査を終了したか否かを判定する(S9)。また
S6で連続の長さLは閾値TH未満であるとの判定結果
を得た場合は、S7を行なわずに、S8〜S9を行な
う。
【0101】S9で帳票40全面にわたって帳票イメー
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から垂直罫線パタンを抽出する処
理を終了する(終了)。
【0102】さらにS3の判定で読み出した画素データ
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
【0103】S10で連続の長さLは閾値TH以上であ
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた垂直罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
【0104】以上のようにして、図2(B)に示す帳票
40について水平及び垂直罫線パタンの線描画素を抽出
し、これらパタンの線描画素をそれぞれ別々の罫線個別
格納領域に格納した例を、図6に示す。図6(A)中、
20cは水平罫線パタンに対して設けた罫線個別格納領
域、20dは罫線個別格納領域20cにおいて帳票紙面
40aに対応する領域、及び44bは水平罫線パタンを
示す。また図6(B)中、20eは垂直罫線パタンに対
して設けた罫線個別格納領域、20fは罫線個別格納領
域20eにおいて帳票紙面40aに対応する領域、及び
44cは垂直罫線パタンを示す。
【0105】(帳票フォーマットの認識)次にフォーマ
ット認識部24が行なう帳票フォーマットの認識につい
て説明する。ここではフォーマット認識辞書22は、帳
票イメージデータから予め抽出しておいた帳票標準フォ
ーマットの特徴を、辞書データとして保持し、フォーマ
ット認識部24は、抽出された罫線パタンを走査して罫
線パタンにより表される帳票フォーマットの特徴を抽出
し、該抽出特徴を帳票標準フォーマットの特徴と比較し
て認識の確からしさを求めることにより、照合を行な
う。認識の確からしさとして例えば距離や確信度を用い
ることができる。
【0106】辞書データの作成に当っては、帳票標準フ
ォーマット(標準的な帳票フォーマット)を有する帳票
を複数用意し、各帳票毎に、帳票イメージデータから罫
線抽出部18の場合と同様にして罫線パタンを抽出し、
抽出した罫線パタンを走査して特徴を抽出する。この抽
出特徴は、帳票標準フォーマットを有する帳票イメージ
データから抽出したものであるので、帳票標準フォーマ
ットの特徴となる。この帳票標準フォーマットの特徴を
辞書データとしてフォーマット認識辞書22に記憶させ
る。帳票標準フォーマットの特徴と帳票標準フォーマッ
トの種別とを、帳票標準フォーマットの各種別毎に個別
に、相対応づけて記憶させる。
【0107】帳票フォーマットの認識に当っては、帳票
フォーマット未知の帳票イメージデータを走査して、罫
線抽出部18により罫線パタンを抽出する。そして抽出
した罫線パタンを走査して特徴を抽出し、この抽出特徴
を、帳票標準フォーマットの各種別毎に、帳票標準フォ
ーマットの特徴と照合する。例えば、帳票フォーマット
未知の帳票から抽出した罫線パタンの特徴と帳票標準フ
ォーマットの特徴との間の距離を認識の確からしさに用
いて照合を行なう。そしてフォーマット認識辞書22に
記憶させた帳票標準フォーマットの種別のなかから、各
種別毎に求めた認識の確からしさに基づいて、一又は複
数の種別を選択し、選択した種別を帳票フォーマットの
認識結果として出力する。例えば、帳票標準フォーマッ
トの種別を、認識の確からしさの高いものから低いもの
の順に並べ、n=1、2、……として第n番目の認識の
確からしさと第n+1番目の認識の確からしさとの差を
調べ、当該差が閾値以上となったときの第1番から第n
番目までの認識の確からしさに対応する帳票標準フォー
マットの種別を、認識結果として選択する。
【0108】或はまたフォーマット認識辞書22は、帳
票イメージデータから予め抽出しておいた帳票標準フォ
ーマットを表す罫線標準パタンを、辞書データとして保
持し、フォーマット認識部24は、抽出された罫線パタ
ンを罫線標準パタンと比較して認識の確からしさを求め
ることにより、照合を行なうようにしても良い。認識の
確からしさとしては例えば一致の程度や確信度を用いる
ことができる。
【0109】この場合の辞書データ作成に当っては、帳
票標準フォーマットを有する帳票を複数用意し、各帳票
毎に、帳票イメージデータから罫線抽出部18の場合と
同様にして罫線パタンを抽出する。この罫線パタンは帳
票標準フォーマットを有する帳票のイメージデータから
抽出したものであるので、罫線標準パタンとなるもので
ある。この罫線標準パタンを、辞書データとしてフォー
マット認識辞書22に記憶させる。罫線標準パタンと帳
票標準フォーマットの種別とを、帳票標準フォーマット
の各種別毎に個別に、相対応づけて記憶させる。
【0110】帳票フォーマットの認識に当っては、帳票
フォーマット未知の帳票イメージデータを走査して、罫
線抽出部18により罫線パタンを抽出する。そして抽出
した罫線パタンを、帳票標準フォーマットの各種別毎
に、罫線標準パタンと照合する。例えば、帳票フォーマ
ット未知の帳票から抽出した罫線パタンと、罫線標準パ
タンとの間の一致の程度を認識の確からしさに用いて照
合を行なう。そしてフォーマット認識辞書22に記憶さ
せた帳票標準フォーマットの種別のなかから、各種別毎
に求めた認識の確からしさに基づいて、一又は複数の種
別を選択し、選択した種別を帳票フォーマットの認識結
果として出力する。例えば、帳票標準フォーマットの種
別を、認識の確からしさの高いものから低いものの順に
並べ、n=1、2、……として第n番目の認識の確から
しさと第n+1番目の認識の確からしさとの差を調べ、
当該差が閾値以上となったときの第1番から第n番目ま
での認識の確からしさに対応する帳票標準フォーマット
の種別を、認識結果として選択する。
【0111】(参照データの表示)次に表示部28が行
なう表示につき説明する。図7は表示部の表示の説明に
供する図であって、帳票フォーマットの認識結果が得ら
れた後に、オペレータが認識結果を確認決定する作業を
助けるため、表示部28が行なう表示の一例を示す。
【0112】図7の例において、表示部28は、帳票イ
メージデータメモリ54から制御部17により読み出さ
れた帳票フォーマット未知の帳票イメージデータ52と
当該イメージデータ52の認識結果に対応する参照デー
タ54とを、並列させて、表示部28の同一表示画面2
8aに同時に表示している。従ってオペレータは、帳票
フォーマットの帳票イメージデータ52と当該イメージ
データ52に対応する参照データ54とを比較すること
ができるので、最も確からしい認識結果を判断決定する
作業を、正確に行なうことができる。
【0113】入力デバイス30としてはポインティング
デバイス例えばマウス若しくはトラックボールや、キー
ボードを用い、オペレータはこのような入力デバイス3
0を操作することにより、最も確からしいと判断決定し
た認識結果を指示する信号を制御部17へ入力する。
【0114】さらに図7の例において、表示部28は、
帳票フォーマットの複数の認識結果に対応する参照デー
タ54を、認識の確からしさの高い順に表示する。この
場合、制御部17は、帳票フォーマットの認識結果と当
該認識結果の認識の確からしさとをフォーマット認識部
28から入力し、認識の確からしさに基づいて認識の確
からしさの高い順に認識結果をソートし、その順番に対
応させて参照データ54を表示部28に表示させる。オ
ペレータは、認識の確からしさの高い順に表示された参
照データを順番に見て、帳票イメージデータ52と比較
することができるので、最も確からしい認識結果を判断
決定する作業を、正確にしかも迅速に行なえる。
【0115】さらに図7の例において、表示部28は、
参照データ54として読取り制御データを表示する。従
って参照データメモリ26として、読取り制御データメ
モリ14を用いるものであって、図1に示すフォーマッ
ト認識装置52(この装置52は請求項1のフォーマッ
ト認識装置の実施形態となるものである)は、フォーマ
ット認識系12と表示部28と入力デバイス30と参照
データメモリ26(14)とフォーマット認識系12及
び表示部28の制御を行なう制御部17とを備える。
尚、読取り制御データを、帳票フォーマットの各種別毎
に個別に用意し、読取り制御データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて読取り制御データメモリ14に記憶させる。
【0116】表示部28に表示させる参照データとし
て、例えば、文字パタンの切出しに関わる読取り制御デ
ータ(以下、第一の参照データとも言う)を用いる。文
字パタンの切出しに関わる読取り制御データは、例え
ば、帳票幅、帳票高さ、帳票内の行数、帳票内の行位
置、帳票内のフィールド数、帳票内のフィールド位置、
前記行内若しくはフィールド内の文字数、及び、前記行
内若しくはフィールド内の文字ピッチであって、これら
文字パタンの切出しに関わる読取り制御データを、図
形、記号、文字、色、輝度若しくはこれらの組み合わせ
により区別して表して、表示する。
【0117】図示例では、帳票の輪郭線を表す枠で、帳
票1枚分の参照データを囲むと共に、その枠の幅及び高
さにより帳票幅及び帳票高さを表している。また行、フ
ィールド、文字を表す矩形で、行の位置及び個数とフィ
ールドの位置及び個数と、行及びフィールド内の文字数
とを表し、さらに文字を表す矩形の配設ピッチにより、
文字ピッチを表している。この他、1行分の領域、フィ
ールド1個分の領域、文字1個分の領域を、点線、一転
鎖線等の線種の異なる線で囲んで表したり、色を異なら
せて表したり、輝度を異ならせて表したりしても良い。
或は、1行分の領域、フィールド1個分の領域、文字1
個分の領域を、輪郭形状が異なる枠で囲んで表しても良
い(例えば行を矩形で、フィールドを横に細長い長楕円
で、文字を三角で表す)。或は、文字の個数及びピッチ
を、文字で表して表示するようにしても良い。例えば文
字の個数5個とか、文字のピッチ10mmというように
表す。
【0118】さらに表示部28に表示させる参照データ
として、前記第一の参照データと、これに加え文字パタ
ンの認識に用いる読取り制御データ(以下、第二の参照
データとも言う)とを用いても良い。第二の参照データ
は、例えば帳票内に記載される文字の字種若しくは字体
であって、これら第一及び第二の参照データを、図形、
記号、文字、色、輝度若しくはこれらの組み合わせによ
り区別して表して表示し、第二の参照データを、第一の
参照データの表示位置の近傍位置若しくは第一の参照デ
ータの表示位置と重なる位置に表示する。例えば、字種
及び字体を、記号、文字、図形により表し、字種及び字
体が異なる各領域毎に、字種及び字体を表す記号等を表
示すれば良い。例えば、帳票内の行及びフィールドを、
矩形枠等の図形で表して表示し、帳票内の行及びフィー
ルドに記載される文字の字種、字体を、色で表し、行及
びフィールドを表す図形が囲む領域の色を、対応する字
種、字体を表す色にして表示を行なうようにする。或
は、行及びフィールドに記載される文字の字種、字体
を、色で表し、行及びフィールドを表す図形の外形線
を、対応する字種、字体を表す色の線にして表示するよ
うにしても良い。或は、行及びフィールドに記載される
文字の字種、字体を、線種で表し、行及びフィールドを
表す図形の外形線を、対応する字種、字体を表す線種の
線にして表示するようにしても良い。或はまた、帳票内
の行及びフィールドを矩形枠等の図形で表して表示し、
帳票内の行及びフィールドに記載される文字の字種、字
体の名称を、文字で表して表示し、行及びフィールドを
表す図形の、上側、下側、左側或は右側の近傍位置に、
字種、字体の名称を表す文字を表示するようにしても良
い。
【0119】さらにフォーマット認識部24が帳票フォ
ーマットの認識結果を得るのに用いた認識の確からしさ
を表す数値を、参照データ54と対応づけて、参照デー
タ54と同一の表示画面28aに表示するようにしても
良い。このように帳票フォーマットの認識結果の認識の
確からしさを表す数値と当該認識結果の参照データ54
とを相対応づけて同一の表示画面28aに同時に表示す
ることにより、オペレータが最も確からしい認識結果を
判断決定する作業を、行ない易くすることができる。
【0120】さらに図示例では、帳票イメージデータ5
2に含まれる行領域、フィールド領域、1文字分の記載
領域或は文字の拡大・縮小率と、参照データ54に含ま
れる行領域、フィールド領域若しくは1文字分の記載領
域を表す図形若しくは参照データ54に含まれる文字の
拡大・縮小率とを異ならせこれらデータ52、54を表
示しているが、これらの拡大・縮小率を等しくしこれら
を並列させて表示するようにしても良い。これらの拡大
・縮小率を等しくして表示することにより、オペレータ
が最も確からしい認識結果を判断決定する作業を、行な
い易くすることができる。
【0121】さらに、帳票イメージデータ52に含まれ
る行領域、フィールド領域、1文字分の記載領域若しく
は文字の拡大・縮小率と、参照データ54に含まれる行
領域、フィールド領域、1文字分の記載領域を表す図形
若しくは参照データ54に含まれる文字の拡大・縮小率
とを等しくし、これら拡大・縮小率の等しいデータ5
2、54を重ね合わせて表示するようにしても良い。例
えば、帳票イメージデータ52を得た帳票の左辺、上辺
と、参照データ54が表す帳票の左辺、上辺とが重なり
合うように位置決めして、これらデータ52、54を表
示する。このように重ね合わせて表示することにより、
オペレータが最も確か確からしい認識結果を判断決定す
る作業を、行ない易くすることができる。
【0122】(文字パタンの認識)次に文字認識部38
が行なう文字パタンの認識について説明する。ここでは
文字認識辞書36は、文字標準パタンの特徴を辞書デー
タとして保持し、文字認識部38は、切り出された文字
パタンを走査して切り出された文字パタンの特徴を抽出
し、該抽出特徴を文字標準パタンの特徴と比較して認識
の確からしさを求めることにより、照合を行なう。認識
の確からしさとして例えば距離や確信度を用いることが
できる。
【0123】辞書データの作成に当っては、標準文字を
光学的に走査して得た文字標準パタンを複数用意し、各
標準文字パタン毎に、文字標準パタンを走査して文字標
準パタンの特徴を抽出する。そして抽出した文字標準パ
タンの特徴を、辞書データとして文字認識辞書36に記
憶させる。文字標準パタンの特徴と文字名とを、各文字
標準パタン毎に個別に、相対応づけて記憶させる。
【0124】文字パタンの認識に当っては、文字読取り
を行なうべき帳票イメージデータから、文字パタンを切
出し、切り出した文字パタンを走査して切出し文字パタ
ンの特徴を抽出する。この抽出特徴を、各文字標準パタ
ン毎に、文字標準パタンの特徴と照合する。例えば、切
出した文字パタンの特徴と文字標準パタンの特徴との間
の距離を認識の確からしさに用いて照合を行なう。そし
て文字認識辞書36に記憶させた文字名のなかから、各
文字標準パタン毎に求めた認識の確からしさに基づい
て、一又は複数の文字名を選択し、選択した文字名を文
字パタンの認識結果として出力する。
【0125】或はまた文字認識辞書36は、文字標準パ
タンを辞書データとして保持し、文字認識部38は、切
り出された文字パタンを文字標準パタンと比較して認識
の確からしさを求めることにより、照合を行なうように
しても良い。
【0126】この場合の辞書データ作成に当っては、標
準文字を光学的に走査して文字標準パタンを得、文字標
準パタンを辞書データとして文字認識辞書36に記憶さ
せる。複数の文字標準パタンを用意し、文字標準パタン
と文字名とを、各文字標準パタン毎に個別に、相対応づ
けて記憶させる。
【0127】文字パタンの認識に当っては、文字読取り
を行なうべき帳票イメージデータから文字パタンを切り
出し、そして切り出した文字パタンを、各文字標準パタ
ン毎に、文字標準パタンと照合する。例えば、切り出し
た文字パタンと、文字標準パタンとの間の一致の程度を
認識の確からしさに用いて照合を行なう。そして文字認
識辞書36に記憶させた文字名のなかから、各文字標準
パタン毎に求めた認識の確からしさに基づいて、一又は
複数の文字名を選択し、選択した文字名を文字パタンの
認識結果として出力する。
【0128】この実施形態によれば、帳票フォーマット
の種別を表す識別番号が記載されていない帳票であって
も(図2(B)の帳票参照)、帳票フォーマットの種別
に対応した読取り制御データを利用して、文字パタンの
切出し及び認識が行なえる。読取り制御データを利用す
ることにより、文字パタンの切出し及び認識のための処
理を高速に行なえる。また読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を簡単化できるので、装置のハードウエア規模或はソフ
トウエア規模を小さくすることができる。
【0129】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
【0130】図8は文字読取り装置の構成を概略的に示
す機能ブロック図である。同図に示す文字読取り装置
は、請求項9の文字読取り装置の実施形態となるもので
あって、請求項1のフォーマット認識装置の実施形態を
含んでいる。以下の説明では、請求項9の文字読取り装
置の実施形態の説明と共に、請求項1のフォーマット認
識装置の実施形態につき説明する。以下、図1の実施形
態と相違する点につき説明し、図1の実施形態と同様の
点についてはその詳細な説明を省略する。
【0131】この実施形態では、参照データメモリ26
としてフォーマット画像メモリ56を設け、読取り制御
データメモリ14を参照データメモリ26としては用い
ない。従ってフォーマット認識装置52は、フォーマッ
ト認識系12、表示部28、入力デバイス30及び制御
部17と、フォーマット画像メモリ56(26)とから
成る。
【0132】フォーマット画像メモリ56は、参照デー
タとして、帳票標準フォーマットの辞書データを得るの
に用いた帳票のイメージデータ(参照用イメージデー
タ)、或は、読取り制御データを得るのに用いた帳票の
イメージデータ(参照用イメージデータ)を保持するも
のであって、このような参照データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて、フォーマット画像メモリ56に記憶させて
いる。
【0133】図9は表示部の表示の説明に供する図であ
って、帳票フォーマットの認識結果が得られた後に、オ
ペレータが認識結果を確認決定する作業を助けるために
表示部28が行なう表示の一例を示す。同図にも示すよ
うに、参照データ54として、読取り制御データに代え
て、帳票標準フォーマットの辞書データ或は読取り制御
データを得るのに用いた帳票のイメージデータを表示す
る。
【0134】制御部17は、フォーマット認識部24か
ら帳票フォーマットの認識結果を入力すると、入力した
認識結果に対応した参照用イメージデータを、フォーマ
ット画像メモリ56(26)から読み出して表示部28
に表示させる。
【0135】次にこの実施形態の全体的な動作の流れに
ついて図3を参照して説明する。S1〜S3は図1の実
施形態の場合と同様である。
【0136】次に制御部17は、入力した帳票フォーマ
ットの認識結果に対応した既知の帳票フォーマットの帳
票イメージデータを参照データとして参照データメモリ
26(56)から読み出し、読み出した参照データを表
示部28に表示させると共に、当該認識結果を得た帳票
フォーマット未知の帳票イメージデータを帳票イメージ
メモリ54から読み出し表示部28に表示させ(S
4)、然る後、オペレータによるフォーマット決定信号
の入力を待つ(S5)。
【0137】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
【0138】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S5)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S6)。この受け渡しは、制御部17と、読取
り制御データメモリ14及び文字認識系16との間で行
なわれる。
【0139】ここでは読取り制御データメモリ14に
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読取り
制御データメモリ14から読み出し、そして文字パタン
の切出しに関わる読取り制御データを文字切出し部32
へ、また文字パタンの認識に関わる読取り制御データを
文字認識部38へ出力する。S6以降のS7〜S10は
図1の実施形態と同様である。
【0140】この実施形態でも、帳票フォーマットの種
別を表す識別番号が記載されていない帳票であっても
(図2(B)の帳票参照)、帳票フォーマットの種別に
対応した読取り制御データを利用して、文字パタンの切
出し及び認識が行なえる。読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を高速に行なえる。また読取り制御データを利用するこ
とにより、文字パタンの切出し及び認識のための処理を
簡単化できるので、装置のハードウエア規模或はソフト
ウエア規模を小さくすることができる。
【0141】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
【0142】図10は文字読取り装置の構成を概略的に
示す機能ブロック図である。同図に示す文字読取り装置
は、請求項9の文字読取り装置の実施形態となるもので
あって、請求項1のフォーマット認識装置の実施形態を
含んでいる。以下の説明では、請求項9の文字読取り装
置の実施形態の説明と共に、請求項1のフォーマット認
識装置の実施形態につき説明する。以下、図1の実施形
態と相違する点につき説明し、図1の実施形態と同様の
点についてはその詳細な説明を省略する。
【0143】この実施形態では、参照データメモリ26
としてフォーマット画像メモリ56を設け、読取り制御
データメモリ14とフォーマット画像メモリ56とを双
方ともに参照データメモリ26として用いる。従ってフ
ォーマット認識装置52は、フォーマット認識系12、
表示部28、入力デバイス30及び制御部17と、読取
り制御データメモリ14(26)及びフォーマット画像
メモリ56(26)とから成る。
【0144】フォーマット画像メモリ56は、参照デー
タとして、帳票標準フォーマットの辞書データを得るの
に用いた帳票のイメージデータ、或は、読取り制御デー
タを得るのに用いた帳票のイメージデータを保持するも
のであって、このような参照データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて、フォーマット画像メモリ56に記憶させて
いる。
【0145】表示部28は、参照データ54として、読
取り制御データに加え、帳票標準フォーマットの辞書デ
ータ或は読取り制御データを得るのに用いた帳票のイメ
ージデータ(参照用イメージデータ)を表示するもので
あって、参照データ54として表示する参照用イメージ
データに含まれる行領域、フィールド領域、1文字分の
記載領域若しくは文字の拡大・縮小率と、参照データ5
4として表示する読取り制御データに含まれる行領域、
フィールド領域、1文字分の記載領域を表す図形若しく
は参照データ54として表示する読取り制御データに含
まれる文字の拡大・縮小率とを等しくして、これら参照
データ54としての参照用イメージデータ及び読取り制
御データを重ね合わせて表示する。例えば、参照データ
として表示する参照用イメージデータ52を得た帳票の
左辺、上辺と、参照データ54として表示する読取り制
御データが表す帳票の左辺、上辺とが重なり合うように
位置決めして、これら参照用イメージデータ及び読取り
制御データを表示する。このように重ね合わせて表示す
ることにより、オペレータが最も確か確からしい認識結
果を判断決定する作業を、行ない易くすることができ
る。尚、参照データ54としての参照用イメージデータ
に、文字パタンの切出しに関わる読取り制御データを参
照データとして重ね合わせて表示したり、参照データ5
4としての参照用イメージデータに、文字パタンの切出
し及び認識に関わる読取り制御データを参照データとし
て重ね合わせて表示したりすることができる。
【0146】制御部17は、フォーマット認識部24か
ら帳票フォーマットの認識結果を入力すると、入力した
認識結果に対応した参照用イメージデータを、フォーマ
ット画像メモリ56(26)から読み出して表示部28
に表示させると共に入力した認識結果に対応した読取り
制御データを、読取り制御データメモリ14(26)か
ら読み出して表示部28に表示させる。
【0147】次にこの実施形態の全体的な動作の流れに
ついて図3を参照して説明する。S1〜S3は図1の実
施形態の場合と同様である。
【0148】次に制御部17は、入力した帳票フォーマ
ットの認識結果に対応した参照用イメージデータを参照
データとして参照データメモリ26(56)から読み出
しさらに入力した帳票フォーマットの認識結果に対応し
た読取り制御データを参照データとして参照データメモ
リ26(14)から読み出して、これら読み出した参照
データを重ね合わせて表示部28に表示させ、これと共
に、当該認識結果を得た帳票フォーマット未知の帳票イ
メージデータを帳票イメージデータから読み出して参照
データとは別の位置に並列させて表示部28に表示させ
る(S4)。S4以降のS5〜S10は図1の実施形態
と同様である。
【0149】この実施形態でも、帳票フォーマットの種
別を表す識別番号が記載されていない帳票であっても
(図2(B)の帳票参照)、帳票フォーマットの種別に
対応した読取り制御データを利用して、文字パタンの切
出し及び認識が行なえる。読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を高速に行なえる。また読取り制御データを利用するこ
とにより、文字パタンの切出し及び認識のための処理を
簡単化できるので、装置のハードウエア規模或はソフト
ウエア規模を小さくすることができる。
【0150】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
【0151】次に図1の実施形態の変形例について説明
する。図11はこの変形例の文字読取り装置の全体的な
動作の流れを示す図である。この変形例は、動作が異な
るほかは、図1の実施形態と同様の構成であるので、適
宜図1を参照されたい。
【0152】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
【0153】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
【0154】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
【0155】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
【0156】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
【0157】制御部17は、入力した帳票フォーマット
の認識結果に対応した読取り制御データを既知の帳票フ
ォーマットの参照データとして参照データメモリ26
(14)から読み出し(S4)、然る後、制御部17
は、入力した帳票フォーマットの認識結果が1つであっ
たか否かを判定する(S5)。
【0158】S5で入力した帳票フォーマットの認識結
果は複数であるとの判定結果を得た場合は、制御部17
は、参照データとして読み出した読取り制御データを表
示部28に表示させると共に、当該認識結果を得た帳票
フォーマット未知の帳票イメージデータを帳票イメージ
メモリ54から読み出して表示部28に表示させ(S
6)、然る後、オペレータによるフォーマット決定信号
の入力を待つ(S7)。
【0159】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
【0160】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S7)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S8)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
【0161】ここでは読取り制御データメモリ14(2
6)には、文字パタンの切出しに関わる読取り制御デー
タと文字パタンの認識に関わる読取り制御データとを記
憶させてあり、制御部17は、フォーマット決定信号に
より決定された認識結果に対応する読取り制御データを
読出し済みの読取り制御データのなかから選択し、選択
した読取り制御データのうち文字パタンの切出しに関わ
る読取り制御データを文字切出し部32へ、また選択し
た読取り制御データのうち文字パタンの認識に関わる読
取り制御データを文字認識部38へ出力する。
【0162】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S9)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S10)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S11)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S12)。
【0163】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS9〜S
12の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
【0164】またS5の判定で入力した帳票フォーマッ
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを既に読出し済みの読取り制御データメモリのなか
から選択し、選択した読取り制御データのうち文字パタ
ンの切出しに関わる読取り制御データを文字切出し部3
2へ、また選択した読取り制御データのうち文字パタン
の認識に関わる読取り制御データを文字認識部38へ出
力する(S13)。然る後、制御部17は文字切出し部
32及び文字認識部38を起動する。この場合、S6〜
S8は行なわれず従って最も確からしい認識結果に関し
てオペレータによる判断決定は行なわれずにS9〜S1
2が行なわれることとなる。
【0165】この変形例でも、帳票フォーマットの種別
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
【0166】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
【0167】また帳票フォーマットの認識結果が1つで
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
【0168】次に図8の実施形態の変形例につき説明す
る。図12はこの変形例の文字読取り装置の全体的な動
作の流れを示す図である。この変形例は、動作が異なる
ほかは、図8の実施形態と同様の構成であるので、適宜
図8を参照されたい。
【0169】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
【0170】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
【0171】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
【0172】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
【0173】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
【0174】次に制御部17は、入力した帳票フォーマ
ットの認識結果が1つであったか否かを判定する(S
4)。
【0175】S4での判定で入力した帳票フォーマット
の認識結果は複数であったとの判定結果を得た場合、制
御部17は、入力した帳票フォーマットの認識結果に対
応した既知の帳票フォーマットの帳票イメージデータ
(参照用イメージデータ)を参照データとして参照デー
タメモリ26(56)から読み出し、読み出した参照デ
ータを表示部28に表示させると共に、当該認識結果を
得た帳票フォーマット未知の帳票イメージデータを帳票
イメージメモリ54から読み出して表示部28に表示さ
せ(S5)、然る後、オペレータによるフォーマット決
定信号の入力を待つ(S6)。
【0176】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
【0177】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S6)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S7)。この受け渡しは、制御部17と、読取
り制御データメモリ14及び文字認識系16との間で行
なわれる。
【0178】ここでは読取り制御データメモリ14に
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読取り
制御データメモリ14から読み出し、そして読み出した
読取り制御データのうち文字パタンの切出しに関わる読
取り制御データを文字切出し部32へ、また読み出した
読取り制御データのうち文字パタンの認識に関わる読取
り制御データを文字認識部38へ出力する。
【0179】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S8)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S9)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S10)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S11)。
【0180】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS8〜S
11の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
【0181】またS4の判定で入力した帳票フォーマッ
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを読取り制御データメモリ14から読み出し、読み
出した読取り制御データのうち文字パタンの切出しに関
わる読取り制御データを文字切出し部32へ、また読み
出した読取り制御データのうち文字パタンの認識に関わ
る読取り制御データを文字認識部38へ出力する(S1
2)。然る後、制御部17は文字切出し部32及び文字
認識部38を起動する。この場合、S5〜S7は行なわ
れず従って最も確からしい認識結果に関してオペレータ
による判断決定は行なわれずにS8〜S11が行なわれ
ることとなる。
【0182】この変形例でも、帳票フォーマットの種別
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
【0183】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
【0184】また帳票フォーマットの認識結果が1つで
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
【0185】次に図10の実施形態の変形例について説
明する。この変形例は、動作が異なるほかは、図10の
実施形態と同様の構成であるので、適宜図10を参照さ
れたい。以下、この変形例の文字読取り装置の全体的な
動作の流れにつき、図11を参照して説明する。
【0186】まずスキャナ52により帳票イメージデー
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
【0187】帳票イメージメモリ54に帳票イメージデ
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
【0188】起動された罫線抽出部18は、帳票イメー
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
【0189】罫線抽出部18が罫線パタンの抽出を終了
すると、制御部17はフォーマット認識部24を起動す
る。
【0190】起動されたフォーマット認識部24は、罫
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
【0191】次に制御部17は、入力した帳票フォーマ
ットの認識結果に対応した既知の帳票フォーマットの帳
票イメージデータ(参照用イメージデータ)を参照デー
タとして参照データメモリ26(56)から読み出しさ
らに入力した帳票フォーマットの認識結果に対応した読
取り制御データを参照データとして参照データメモリ2
6(14)から読み出し(S4)、然る後、制御部17
は入力した帳票フォーマットの認識結果が1つであった
か否かを判定する(S5)。
【0192】S5で入力した帳票フォーマットの認識結
果は複数であるとの判定結果を得た場合は、制御部17
は、参照データとして読み出した読取り制御データと既
知の帳票フォーマットの帳票イメージデータとを表示部
28に表示させると共に、当該認識結果を得た帳票フォ
ーマット未知の帳票イメージデータを帳票イメージメモ
リ54から読み出して表示部28に表示させ(S6)、
然る後、オペレータによるフォーマット決定信号の入力
を待つ(S7)。
【0193】オペレータは、参照データと帳票フォーマ
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
【0194】制御部17は、オペレータによるフォーマ
ット決定信号の入力を確認すると(S7)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S8)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
【0195】ここでは読取り制御データメモリ14に
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読出し
済みの読取り制御データのなかから選択し、選択した読
取り制御データのうち文字パタンの切出しに関わる読取
り制御データを文字切出し部32へ、また選択した読取
り制御データのうち文字パタンの認識に関わる読取り制
御データを文字認識部38へ出力する。
【0196】次に制御部17は文字切出し部32及び文
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S9)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S10)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S11)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S12)。
【0197】帳票紙面40a上のすべての文字について
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS9〜S
12の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
【0198】またS5の判定で入力した帳票フォーマッ
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを既に読出し済みの読取り制御データメモリのなか
から選択し、選択した読取り制御データのうち文字パタ
ンの切出しに関わる読取り制御データを文字切出し部3
2へ、また選択した読取り制御データのうち文字パタン
の認識に関わる読取り制御データを文字認識部38へ出
力する(S13)。然る後、制御部17は文字切出し部
32及び文字認識部38を起動する。この場合、S6〜
S8は行なわれず従って最も確からしい認識結果に関し
てオペレータによる判断決定は行なわれずにS9〜S1
2が行なわれることとなる。
【0199】この変形例でも、帳票フォーマットの種別
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
【0200】また帳票フォーマット未知の帳票イメージ
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
【0201】また帳票フォーマットの認識結果が1つで
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
【0202】上述した実施形態では、参照データが表示
部28に表示された場合に、オペレータが参照データに
対応する認識結果を選択指示するフォーマット決定信号
を入力し、このフォーマット決定信号に対応する読取り
制御データに基づいて文字パタンの切出し及び認識を行
なうようにしたが、参照データが表示部28に表示され
た場合に、参照データに対応する認識結果の中にオペレ
ータが満足できる認識結果を見出せなかったときは、オ
ペレータが適切な読取り制御データを指示する帳票フォ
ーマットの種別をフォーマット決定信号として入力デバ
イス30を介し制御部17に入力し、このフォーマット
決定信号として入力した帳票フォーマットの種別に基づ
いて文字パタンの切出し及び認識を行なうようにしても
良い。
【0203】また上述したいずれの実施形態及び変形例
においても、スキャナ52にセットした帳票を押える押
え面を、帳票内に在る線と同様に線描画素に変換される
色例えば黒色として、帳票イメージデータを得、領域検
出に関わる周知の画像技術により、帳票イメージデータ
において帳票紙面に対応する領域を検出するようにして
も良い。この帳票紙面に対応する領域内の帳票イメージ
データを走査して、罫線パタンを検出し、またこの帳票
紙面に対応する領域内の帳票イメージデータを、帳票イ
メージメモリ54から読み出して表示部28の表示画面
に表示するようにすることができる。
【0204】
【発明の効果】上述した説明からも明らかなように、請
求項1のフォーマット認識装置によれば、帳票イメージ
データから罫線パタンを抽出し、抽出された罫線パタン
を帳票フォーマットの辞書データと照合して、帳票フォ
ーマットの認識を行なうので、帳票フォーマットの種別
を表す種別番号が帳票に印刷されていない場合でも、帳
票フォーマットを認識しその認識結果に基づいて帳票フ
ォーマットの種別を知ることができる。
【0205】さらに表示部は、帳票フォーマットの認識
結果に対応した既知帳票フォーマットの特徴を表す参照
データを表示するので、オペレータは、参照データを参
照して最も確からしい認識結果を判断決定する作業を、
正確に行なえる。
【0206】また請求項4の文字読取り装置によれば、
帳票イメージデータから罫線パタンを抽出し、抽出され
た罫線パタンを帳票フォーマットの辞書データと照合し
て、帳票フォーマットの認識を行なうので、帳票フォー
マットの種別を表す種別番号が帳票に印刷されていない
場合でも、帳票フォーマットを認識しその認識結果に基
づいて帳票フォーマットの種別を知り、その種別に対応
した読取り制御データを用いて文字パタンの切出し及び
認識を行なうことができる。
【0207】さらに表示部は、帳票フォーマットの認識
結果に対応した既知帳票フォーマットの特徴を表す参照
データを表示するので、オペレータは、参照データを参
照して最も確からしい認識結果を判断決定する作業を、
正確に行なえる。
【図面の簡単な説明】
【図1】文字読取り装置及びフォーマット認識装置の実
施形態について構成の説明に供する機能ブロック図であ
る。
【図2】(A)及び(B)は帳票の説明に供する図であ
る。
【図3】文字読取り装置及びフォーマット認識装置の実
施形態について動作の流れを説明するための図である。
【図4】罫線抽出部の動作の流れを示す図である。
【図5】水平罫線パタン及び垂直罫線パタンを重ね合わ
せて格納した例を示す図である。
【図6】(A)及び(B)は個別に格納した水平罫線パ
タン及び垂直罫線パタンの例を示す図である。
【図7】表示部の表示の説明に供する図である。
【図8】文字読取り装置及びフォーマット認識装置の実
施形態の構成の説明に供する図である。
【図9】表示部の表示の説明に供する図である。
【図10】文字読取り装置及びフォーマット認識装置の
実施形態の構成の説明に供する図である。
【図11】文字読取り装置及びフォーマット認識装置の
実施形態の変形例について動作の流れを説明するための
図である。
【図12】文字読取り装置及びフォーマット認識装置の
実施形態の変形例について動作の流れを説明するための
図である。
【符号の説明】 10:文字読取り装置 12:フォーマット認識系 14:読取り制御データメモリ 16:文字認識系 17:制御部 18:罫線抽出部 20:罫線パタンメモリ 22:フォーマット認識辞書 24:フォーマット認識部 26:参照データメモリ 28:表示部 30:入力デバイス 32:文字切出し部 34:文字パタンメモリ 36:文字認識辞書 38:文字認識部

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 帳票フォーマット未知の帳票イメージデ
    ータから、帳票フォーマットを表す罫線パタンを抽出す
    る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
    認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
    タと照合し、該照合結果に基づいて罫線パタンにより表
    される帳票フォーマットについて一又は複数の認識結果
    を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
    する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
    フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
    ーマットの認識結果を決定する作業において、オペレー
    タによる決定結果の入力操作に対応したフォーマット決
    定信号を出力する入力デバイスとを備えることを特徴と
    するフォーマット認識装置。
  2. 【請求項2】 請求項1記載のフォーマット認識装置に
    おいて、 表示部は、帳票フォーマット未知の帳票イメージデータ
    と当該イメージデータの認識結果に対応する参照データ
    とを、表示部の同一画面に同時に表示することを特徴と
    するフォーマット認識装置。
  3. 【請求項3】 請求項1又は2記載のフォーマット認識
    装置において、 表示部は、帳票フォーマットの複数の認識結果に対応す
    る参照データを、認識の確からしさの高い順に表示する
    ことを特徴とするフォーマット認識装置。
  4. 【請求項4】 請求項1記載のフォーマット認識装置に
    おいて、 参照データを、図形、記号、文字、色、輝度若しくはこ
    れらの組み合わせにより表して表示することを特徴とす
    るフォーマット認識装置。
  5. 【請求項5】 請求項1記載のフォーマット認識装置に
    おいて、 種類の異なる参照データを、図形、記号、文字、色、輝
    度若しくはこれらの組み合わせを異ならせることにより
    区別して表示することを特徴とするフォーマット認識装
    置。
  6. 【請求項6】 請求項1記載のフォーマット認識装置に
    おいて、 図形により表した帳票、行及びフィールドを、参照デー
    タとして表示することを特徴とするフォーマット認識装
    置。
  7. 【請求項7】 請求項1記載のフォーマット認識装置に
    おいて、 参照データを、帳票幅、帳票高さ、帳票内の行数、帳票
    内の行位置、帳票内のフィールド数、帳票内のフィール
    ド位置、前記行内若しくはフィールド内の文字数、前記
    行内若しくはフィールド内の文字ピッチ、前記行内若し
    くはフィールド内の文字の字体、及び、前記行内若しく
    はフィールド内の文字の字種のなかから選んだ一又は複
    数の参照データとしたことを特徴とするフォーマット認
    識装置。
  8. 【請求項8】 請求項1記載のフォーマット認識装置に
    おいて、 第一の参照データを、帳票内の行数、帳票内の行位置、
    帳票内のフィールド数、及び、帳票内のフィールド位置
    のなかから選んだ一又は複数の参照データとし、 第二の参照データを、帳票内の文字の字体及び帳票内の
    文字の字種のなかから選んだ一又は複数の参照データと
    し、 第二の参照データを、第一の参照データの表示位置の近
    傍位置若しくは第一の参照データの表示位置と重なる位
    置に、表示することを特徴とするフォーマット認識装
    置。
  9. 【請求項9】 請求項1記載のフォーマット認識装置に
    おいて、 図形により表した行を、第一の参照データとして表示
    し、 行内の文字の字種若しくは字体を、第二の参照データと
    して表示し、 第二の参照データを、第一の参照データの表示位置の近
    傍位置若しくは第一の参照データの表示位置と重なる位
    置に、表示することを特徴とするフォーマット認識装
    置。
  10. 【請求項10】 請求項1記載のフォーマット認識装置
    において、 図形により表したフィールドを、第一の参照データとし
    て表示し、 フィールド内の文字の字種若しくは字体を、第二の参照
    データとして表示し、 第二の参照データを、第一の参照データの表示位置の近
    傍位置若しくは第一の参照データの表示位置と重なる位
    置に、表示することを特徴とするフォーマット認識装
    置。
  11. 【請求項11】 請求項1記載のフォーマット認識装置
    において、 参照データを、帳票フォーマット既知の帳票から予め得
    た参照用イメージデータとしたことを特徴とするフォー
    マット認識装置。
  12. 【請求項12】 請求項1記載のフォーマット認識装置
    において、 帳票フォーマット未知の帳票イメージデータと当該イメ
    ージデータに対応する参照データとを、重ね合わせて表
    示することを特徴とするフォーマット認識装置。
  13. 【請求項13】 請求項1記載のフォーマット認識装置
    において、 帳票フォーマット未知の帳票イメージデータと当該イメ
    ージデータに対応する参照データとを、重ね合わせて表
    示し、 該参照データを請求項7〜10のいずれか一項の参照デ
    ータとしたことを特徴とするフォーマット認識装置。
  14. 【請求項14】 請求項1記載のフォーマット認識装置
    において、 請求項7〜10のいずれか一項の参照データと、請求項
    11の参照データとを、重ね合わせて表示することを特
    徴とするフォーマット認識装置。
  15. 【請求項15】 請求項1記載のフォーマット認識装置
    において、 フォーマット認識部が帳票フォーマットの認識結果を得
    るのに用いた認識の確からしさを表す数値を、参照デー
    タと対応づけて、参照データと同一の表示画面に表示す
    ることを特徴とするフォーマット認識装置。
  16. 【請求項16】 請求項1記載のフォーマット認識装置
    において、 入力デバイスをポインティングデバイスとしたことを特
    徴とするフォーマット認識装置。
  17. 【請求項17】 帳票フォーマットの認識処理を行なう
    フォーマット認識系と、読取り制御データを保持する制
    御データメモリと、帳票フォーマットの認識結果に対応
    した読取り制御データに従って文字の認識処理を行なう
    文字認識系とを備え、 文字認識系は、帳票イメージデータから文字パタンを切
    り出す文字切出し部と、切り出された文字パタンを格納
    する文字パタンメモリと、文字の辞書データを保持する
    文字認識辞書と、切り出された文字パタンを、文字の辞
    書データと照合し、該照合結果に基づいて文字パタンを
    認識する文字認識部とを備え、 フォーマット認識系を、帳票フォーマット未知の帳票イ
    メージデータから、帳票フォーマットを表す罫線パタン
    を抽出する罫線抽出部と、抽出された罫線パタンを格納
    する罫線パタンメモリと、帳票フォーマットの辞書デー
    タを保持するフォーマット認識辞書と、抽出された罫線
    パタンを、帳票フォーマットの辞書データと照合し、該
    照合結果に基づいて罫線パタンにより表される帳票フォ
    ーマットについて一又は複数の認識結果を出力するフォ
    ーマット認識部とにより構成し、既知の帳票フォーマッ
    トの特徴を表す参照データを保持する参照データメモリ
    と、前記帳票フォーマットの認識結果に対応した既知の
    帳票フォーマットの参照データを表示する表示部と、オ
    ペレータが表示された参照データに基づいて帳票フォー
    マットの認識結果を決定する作業において、オペレータ
    による決定結果の入力操作に対応したフォーマット決定
    信号を出力する入力デバイスとを設け、 文字認識系は、フォーマット決定信号に対応する読取り
    制御データに従って、文字の認識処理を行なうことを特
    徴とする文字読取り装置。
  18. 【請求項18】 請求項17記載の文字読取り装置にお
    いて、 表示部は、帳票フォーマット未知の帳票イメージデータ
    と当該イメージデータの認識結果に対応する参照データ
    とを、表示部の同一画面に同時に表示することを特徴と
    する文字読取り装置。
  19. 【請求項19】 請求項17又は18記載の文字読取り
    装置において、 表示部は、帳票フォーマットの複数の認識結果に対応す
    る参照データを、認識の確からしさの高い順に表示する
    ことを特徴とする文字読取り装置。
  20. 【請求項20】 請求項17記載の文字読取り装置にお
    いて、 参照データメモリを、制御データメモリとし、表示部
    は、参照データとして読取り制御データを表示すること
    を特徴とする文字読取り装置。
  21. 【請求項21】 請求項17記載の文字読取り装置にお
    いて、 罫線パタンにより表される帳票フォーマットの認識結果
    が一つであるときは、文字認識系は、当該帳票フォーマ
    ットの認識結果に対応する読取り制御データに従って文
    字の認識処理を行なうことを特徴とする文字読取り装
    置。
JP06497096A 1996-03-21 1996-03-21 フォーマット認識装置及び文字読取り装置 Expired - Fee Related JP3276555B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06497096A JP3276555B2 (ja) 1996-03-21 1996-03-21 フォーマット認識装置及び文字読取り装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06497096A JP3276555B2 (ja) 1996-03-21 1996-03-21 フォーマット認識装置及び文字読取り装置

Publications (2)

Publication Number Publication Date
JPH09259222A true JPH09259222A (ja) 1997-10-03
JP3276555B2 JP3276555B2 (ja) 2002-04-22

Family

ID=13273424

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06497096A Expired - Fee Related JP3276555B2 (ja) 1996-03-21 1996-03-21 フォーマット認識装置及び文字読取り装置

Country Status (1)

Country Link
JP (1) JP3276555B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100372588B1 (ko) * 1999-03-01 2003-02-17 가부시키가이샤 히타치세이사쿠쇼 전표 처리 방법 및 시스템
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2008165506A (ja) * 2006-12-28 2008-07-17 Hitachi Computer Peripherals Co Ltd 帳票識別装置、及び帳票識別プログラム
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置
JP2009230498A (ja) * 2008-03-24 2009-10-08 Oki Electric Ind Co Ltd 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100372588B1 (ko) * 1999-03-01 2003-02-17 가부시키가이샤 히타치세이사쿠쇼 전표 처리 방법 및 시스템
US6625313B1 (en) 1999-03-01 2003-09-23 Hitachi, Ltd. Business form handling method and system for carrying out the same
KR100411651B1 (ko) * 1999-03-01 2003-12-18 가부시키가이샤 히타치세이사쿠쇼 전표처리방법 및 시스템
KR100411650B1 (ko) * 1999-03-01 2003-12-18 가부시키가이샤 히타치세이사쿠쇼 전표처리방법 및 시스템
US6801658B2 (en) 1999-03-01 2004-10-05 Hitachi, Ltd. Business form handling method and system for carrying out the same
US6885769B2 (en) 1999-03-01 2005-04-26 Hitachi, Ltd. Business form handling method and system for carrying out the same
US6778712B1 (en) 1999-12-20 2004-08-17 Fujitsu Limited Data sheet identification device
JP2008165506A (ja) * 2006-12-28 2008-07-17 Hitachi Computer Peripherals Co Ltd 帳票識別装置、及び帳票識別プログラム
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置
JP2009230498A (ja) * 2008-03-24 2009-10-08 Oki Electric Ind Co Ltd 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム

Also Published As

Publication number Publication date
JP3276555B2 (ja) 2002-04-22

Similar Documents

Publication Publication Date Title
KR100658119B1 (ko) 문자 인식 장치 및 방법
US7519226B2 (en) Form search apparatus and method
US4933979A (en) Data reading apparatus for reading data from form sheet
US5696841A (en) Image processing method and apparatus for extracting vertically and horizontally written text
JP3294995B2 (ja) 帳票読取装置
US5164996A (en) Optical character recognition by detecting geo features
EP0266140B1 (en) Optical character recognition by forming and detecting matrices of geographical features
JPH08305796A (ja) パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
US20050123199A1 (en) Method for optical recognition of a multi-language set of letters with diacritics
US6549662B1 (en) Method of recognizing characters
US20020051574A1 (en) Character recognition method, program and recording medium
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3573945B2 (ja) フォーマット認識装置及び文字読み取り装置
JP3923474B2 (ja) 文字読み取り装置
US5119441A (en) Optical character recognition apparatus and method using masks operation
JPH09319824A (ja) 帳票認識方法
JPH0773271A (ja) 領域分割方法
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JP2537973B2 (ja) 文字認識装置
JP2917427B2 (ja) 図面読取装置
JP2993533B2 (ja) 情報処理装置及び文字認識装置
JPH05135204A (ja) 文字認識装置
JPH0916712A (ja) 文書読取装置
JPS61190676A (ja) 帳票登録装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020129

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090208

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100208

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110208

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120208

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130208

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140208

Year of fee payment: 12

LAPS Cancellation because of no payment of annual fees