JPH09259222A - フォーマット認識装置及び文字読取り装置 - Google Patents
フォーマット認識装置及び文字読取り装置Info
- Publication number
- JPH09259222A JPH09259222A JP8064970A JP6497096A JPH09259222A JP H09259222 A JPH09259222 A JP H09259222A JP 8064970 A JP8064970 A JP 8064970A JP 6497096 A JP6497096 A JP 6497096A JP H09259222 A JPH09259222 A JP H09259222A
- Authority
- JP
- Japan
- Prior art keywords
- format
- character
- recognition
- reference data
- ruled line
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
Abstract
載されていない帳票であっても、帳票フォーマットを識
別する。 【解決手段】 帳票イメージデータを水平及び垂直方向
に走査して、各走査線上で所定の長さ以上連続する黒ビ
ットを水平罫線パタン及び垂直罫線パタンの黒ビットと
して抽出する。抽出した水平罫線パタン及び垂直罫線パ
タンにより表される帳票フォーマットの特徴を、帳票フ
ォーマットの辞書データと照合して、帳票フォーマット
の種別を認識する。当該認識結果を得た帳票フォーマッ
ト未知の帳票イメージデータと、当該認識結果に対応す
る既知の帳票フォーマットの特徴とを、同一の表示画面
に同時に表示して、オペレータによる認識結果の確認作
業を助ける。
Description
トの種別を認識するフォーマット認識装置と、帳票フォ
ーマットの種別を認識しその認識結果に応じた文字読取
りを行なう文字読取り装置とに関する。
う装置においては、一般に、各帳票フォーマットの種別
に対応した読取り制御データを用いて文字パタンを切出
し認識することが行なわれている(例えば文献「橋本新
一郎 編著、文字認識概論 p203〜206 昭和5
7年3月20日、オーム社」参照)。文字パタンの切出
しには例えば文字行の位置、フィールドの位置及び個
数、文字のピッチ及び個数が、また文字パタンの認識に
は例えば文字種、字体が、読取り制御データに用いられ
る。従来一般に、この種の装置に供する帳票には各帳票
フォーマットの各種別毎に設定された帳票種別番号が印
刷されており、この種別番号の認識結果に基づいて読取
り制御データを読み出している。
かには、帳票種別番号が印刷されていないものもある。
例えば振込依頼書などの私製の帳票や、市販の一般伝票
には、帳票種別番号が印刷されておらず、従って上述し
た従来装置では、この種の帳票につき文字パタンの切出
し及び認識を行なう場合に、読取り制御データを利用で
きない。
行った結果、帳票フォーマットに関わる罫線を利用すれ
ば、帳票種別番号が印刷されていない場合でも、帳票フ
ォーマットの種別を認識できることに気付いた。
のであり、この出願の第一の目的は、帳票フォーマット
に関わる罫線を利用して帳票フォーマットの種別を認識
する帳票フォーマット認識装置と、帳票フォーマットに
関わる罫線を利用して帳票フォーマットの種別を認識し
この認識結果に対応した読取り制御データを用いて文字
パタンの切出し及び認識を行なう文字読取り装置とを提
供することにある。
類似する技術として、例えば特開平4−158487号
公報に開示されている表認識装置がある。この装置は、
表の構造及び内部の文字を認識する装置であって、連結
黒画素の外接矩形リストを作成する手段、外接矩形の辺
の長さから矩形内の連結黒画素が文字であるか否かを推
定する手段、この推定結果に基づいて矩形内の文字認識
を行なう手段、矩形内の文字を文字認識終了後に消去す
る手段、矩形内の文字消去後に黒画素のヒストグラムか
ら罫線の位置を推定し、推定した罫線位置に基づきイメ
ージデータを部分的に走査して表を構成する罫線の位置
を認識する手段とを備える。
する各罫線の位置を認識するに留まるものであって、読
取り制御データの選択のために罫線を利用して帳票フォ
ーマットの種別を認識するものではない。従って読取り
制御データを用いることができないので、読取りを行な
いたい特定の領域の文字パタンだけを切り出して認識す
るということは、できない。
ため、請求項1のフォーマット認識装置は、帳票フォー
マット未知の帳票イメージデータから、帳票フォーマッ
トを表す罫線パタンを抽出する罫線抽出部と、抽出され
た罫線パタンを格納する罫線パタンメモリと、帳票フォ
ーマットの辞書データを保持するフォーマット認識辞書
と、抽出された罫線パタンを、帳票フォーマットの辞書
データと照合し、該照合結果に基づいて罫線パタンによ
り表される帳票フォーマットについて一又は複数の認識
結果を出力するフォーマット認識部と、既知の帳票フォ
ーマットの特徴を表す参照データを保持する参照データ
メモリと、帳票フォーマットの認識結果に対応した既知
の帳票フォーマットの参照データを表示する表示部と、
オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えることを特徴と
する。
は、請求項1記載のフォーマット認識装置において、表
示部は、帳票フォーマット未知の帳票イメージデータと
当該イメージデータの認識結果に対応する参照データと
を、表示部の同一画面に同時に表示することを特徴とす
る。
票フォーマット未知の帳票イメージデータと当該イメー
ジデータの認識結果に対応する参照データとを、比較参
照して、最も確からしい認識結果を判断決定できるの
で、その決定作業を正確に行なえる。
は、請求項1又は2記載のフォーマット認識装置におい
て、表示部は、帳票フォーマットの複数の認識結果に対
応する参照データを、認識の確からしさの高い順に表示
することを特徴とする。
帳票フォーマットの複数の認識結果に対応する参照デー
タを、認識の確からしさの高い順に参照して、最も確か
らしい認識結果を判断決定できるので、その決定作業を
迅速に行なえる。
フォーマットの認識処理を行なうフォーマット認識系
と、読取り制御データを保持する制御データメモリと、
帳票フォーマットの認識結果に対応した読取り制御デー
タに従って文字の認識処理を行なう文字認識系とを備
え、文字認識系は、帳票イメージデータから文字パタン
を切り出す文字切出し部と、切り出された文字パタンを
格納する文字パタンメモリと、文字の辞書データを保持
する文字認識辞書と、切り出された文字パタンを、文字
の辞書データと照合し、該照合結果に基づいて文字パタ
ンを認識する文字認識部とを備え、フォーマット認識系
を、帳票フォーマット未知の帳票イメージデータから、
帳票フォーマットを表す罫線パタンを抽出する罫線抽出
部と、抽出された罫線パタンを格納する罫線パタンメモ
リと、帳票フォーマットの辞書データを保持するフォー
マット認識辞書と、抽出された罫線パタンを、帳票フォ
ーマットの辞書データと照合し、該照合結果に基づいて
罫線パタンにより表される帳票フォーマットについて一
又は複数の認識結果を出力するフォーマット認識部とに
より構成し、既知の帳票フォーマットの特徴を表す参照
データを保持する参照データメモリと、前記帳票フォー
マットの認識結果に対応した既知の帳票フォーマットの
参照データを表示する表示部と、オペレータが表示され
た参照データに基づいて帳票フォーマットの認識結果を
決定する作業において、オペレータによる決定結果の入
力操作に対応したフォーマット決定信号を出力する入力
デバイスとを設け、文字認識系は、フォーマット決定信
号に対応する読取り制御データに従って、文字の認識処
理を行なうことを特徴とする。
ータから罫線パタンを抽出し、抽出された罫線パタンを
帳票フォーマットの辞書データと照合して、帳票フォー
マットの認識を行なうので、帳票フォーマットの種別を
表す種別番号が帳票に印刷されていない場合でも、帳票
フォーマットを認識しその認識結果に基づいて帳票フォ
ーマットの種別を知ることができる。
線によって複数の領域に区分し、罫線によって区分され
た各区分領域毎に、予め定められた事項(以下、所定事
項)が記載される。所定事項が記載される区分領域に
は、帳票使用前に空白となっていて使用時に所定事項
(例えば住所、氏名、取引先の名称、金額、数量、チェ
ック印)が書き込まれるものもあれば、帳票使用前に予
め何らかの所定事項(例えば数量、金額といった属性を
表すもの)が印刷されているものもある。帳票フォーマ
ットとは、このように利用される区分領域の形態(例え
ば各区分領域の大きさ、相対的位置関係、個数、形状)
を表すものである。各区分領域は罫線によって仕切られ
画成されるものであるから、帳票イメージから抽出され
た罫線パタンにより、区分領域の形態すなわち帳票フォ
ーマットを表すことができる。
トが存在するが、一般に、用途の同じ帳票であれば同じ
帳票フォーマットが用いられる。従って帳票フォーマッ
トの種別を表す種別番号が帳票に印刷されていない場合
でも、その帳票イメージデータから抽出された罫線パタ
ンを帳票フォーマットの辞書データと照合し、照合結果
に基づいてその帳票フォーマットの種別を知ることがで
きる。
番号を、帳票に記載するという手間を省ける利点もあ
る。
マットが未知である帳票イメージデータから抽出された
罫線パタンを、帳票フォーマットの辞書データと照合
し、その照合結果に基づいて、未知の帳票フォーマット
の種別の候補となる一又は複数の種別を認識結果として
出力する。そして表示部はその認識結果に対応した既知
の帳票フォーマットの参照データを表示する。
特徴を表すデータであり予め調べてメモリに記憶させて
おくものである。オペレータは、表示された参照データ
を参照して、最も確からしい認識結果を判断決定できる
ので、その決定作業を正確に行なえる。
請求項17記載の文字読取り装置において、表示部は、
帳票フォーマット未知の帳票イメージデータと当該イメ
ージデータの認識結果に対応する参照データとを、表示
部の同一画面に同時に表示することを特徴とする。
票フォーマット未知の帳票イメージデータと当該イメー
ジデータの認識結果に対応する参照データとを、比較参
照して、最も確からしい認識結果を判断決定できるの
で、その決定作業を正確に行なえる。
請求項17又は18記載の文字読取り装置において、表
示部は、帳票フォーマットの複数の認識結果に対応する
参照データを、認識の確からしさの高い順に表示するこ
とを特徴とする。
帳票フォーマットの複数の認識結果に対応する参照デー
タを、認識の確からしさの高い順に参照して、最も確か
らしい認識結果を判断決定できるので、その決定作業を
迅速に行なえる。
請求項17記載の文字読取り装置において、参照データ
メモリを、制御データメモリとし、表示部は、参照デー
タとして読取り制御データを表示することを特徴とす
る。
リを、制御データメモリとするので、装置構成を簡略化
できる。
請求項17記載の文字読取り装置において、罫線パタン
により表される帳票フォーマットの認識結果が一つであ
るときは、文字認識系は、当該帳票フォーマットの認識
結果に対応する読取り制御データに従って文字の認識処
理を行なうことを特徴とする。
トの認識結果が一つであるときは、文字認識系は、最も
確からしい認識結果を判断決定するオペレータの作業を
経ることなく、文字の認識処理を行なえるので、処理時
間を短縮できる。
略的に示す機能ブロック図である。同図に示す文字読取
り装置は、請求項9の文字読取り装置の実施形態となる
ものであって、請求項1のフォーマット認識装置の実施
形態を含んでいる。以下の説明では、請求項9の文字読
取り装置の実施形態の説明と共に、請求項1のフォーマ
ット認識装置の実施形態につき説明する。
ォーマットの認識処理を行なうフォーマット認識系12
と、読取り制御データを保持する制御データメモリ14
と、帳票フォーマットの認識結果に対応した読取り制御
データに従って文字の認識処理を行なう文字認識系16
と、制御部17とを備える。
ット未知の帳票イメージデータから、帳票フォーマット
を表す罫線パタンを抽出する罫線抽出部18と、抽出さ
れた罫線パタンを格納する罫線パタンメモリ20と、帳
票フォーマットの辞書データを保持するフォーマット認
識辞書22と、抽出された罫線パタンを、パターンマッ
チング法により、帳票フォーマットの辞書データと照合
し、該照合結果に基づいて罫線パタンにより表される帳
票フォーマットについて一又は複数の認識結果を出力す
るフォーマット認識部24とにより構成する。
す参照データを保持する参照データメモリ26と、前記
帳票フォーマットの認識結果に対応した既知の帳票フォ
ーマットの参照データを表示する表示部28と、オペレ
ータが表示された参照データに基づいて帳票フォーマッ
トの認識結果を決定する作業において、オペレータによ
る決定結果の入力操作に対応したフォーマット決定信号
を出力する入力デバイス30とを設ける。
ら文字パタンを切り出す文字切出し部32と、切り出さ
れた文字パタンを格納する文字パタンメモリ34と、文
字の辞書データを保持する文字認識辞書36と、切り出
された文字パタンを、パターンマッチング法により、文
字の辞書データと照合し、該照合結果に基づいて文字パ
タンを認識する文字認識部38とを備え、この文字認識
系16は、フォーマット決定信号に対応する読取り制御
データに従って、文字の認識処理を行なう。
び文字認識系16の動作制御と、表示部28の表示制御
とを行なう。
は帳票の一例を示す平面図である。図2(A)に示す帳
票40の紙面40a上には、帳票フォーマットの種別を
表す識別番号42(図示例では01234で表される5
桁の数字)と、所定事項が記載される領域を区分する罫
線44と、書き込まれるべき所定事項の属性を表す文字
46(図示例では01、02で表される文字)と、所定
事項を伝達すべく書き込まれた文字48(図示例ではA
BC、あいうえお、DEF、かきくけこ、アイウエオカ
キクケコで表される文字)とが記載されている。識別番
号42、罫線44及び文字46は帳票使用前に予め印刷
されていたものであり、また文字48は帳票使用時に書
き加えられたものである。文字48の書き加えられた領
域は、それ以前には空白となっている。
aを複数の領域50に区分し、罫線44によって区分さ
れた各区分領域50に、所定事項を記載する。尚、所定
事項は、文字、記号、図形そのほか種々のものにより表
すことができる。
分された区分領域50の形態(例えば紙面40a上に存
在する区分領域50の大きさ、個数及び形状や、各区分
領域50の相対的位置関係)を表したものである。
の帳票40と同じ用途に供するものであって、紙面40
a上に識別番号42を記載していないほかは、図2
(A)の帳票40と全く同様となっている。図2(B)
及び(A)にも示すように、同じ用途に供する帳票にあ
っては、識別番号42の有無に相違があっても殆どの場
合、同じ帳票フォーマットを用いるか、極めて類似した
帳票フォーマットを用いる。
(B)の帳票40であっても、帳票イメージデータから
罫線パタンを抽出し、抽出した罫線パタンにより表され
る帳票フォーマットを認識することにより、帳票フォー
マットの種別を知ることができる。
置の全体的な動作の流れにつき説明する。図3はこの実
施形態の文字読取り装置の全体的な動作の流れを示す図
である。
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。線描
画素は紙面40a内に在る線を表す画素、背景画素は紙
面40aの地の部分(線の背景となる部分)を表す画素
である。スキャナ52にセットした帳票40を押える押
え面は帳票40の紙面40aの地と同様に背景画素に変
換される色例えば白色となっており、従ってここでは押
え面も白ビットで表わされる。
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
すると、制御部17はフォーマット認識部24を起動す
る。
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
の認識結果に対応した読取り制御データを既知の帳票フ
ォーマットの参照データとして参照データメモリ26
(14)から読み出し、読み出した参照データを表示部
28に表示させると共に、当該認識結果を得た帳票フォ
ーマット未知の帳票イメージデータを帳票イメージメモ
リ54から読み出し表示部28に表示させ(S4)、然
る後、オペレータによるフォーマット決定信号の入力を
待つ(S5)。
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
ット決定信号の入力を確認すると(S5)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S6)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
6)には、文字パタンの切出しに関わる読取り制御デー
タと文字パタンの認識に関わる読取り制御データとを記
憶させてあり、制御部17は、フォーマット決定信号に
より決定された認識結果に対応する読取り制御データを
読出し済みの読取り制御データのなかから選択し、選択
した読取り制御データのうち文字パタンの切出しに関わ
る読取り制御データを文字切出し部32へ、また選択し
た読取り制御データのうち文字パタンの認識に関わる読
取り制御データを文字認識部38へ出力する。
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S7)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S8)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S9)。制
御部17は、1文字単位に、文字パタンの認識結果を入
力しそして帳票紙面40a上のすべての文字について認
識を終了したか否かを判定する(S10)。
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS7〜S
9の処理を繰り返す。また帳票紙面40a上のすべての
文字について認識を終了したならば、帳票1枚分の文字
読取りを終了し、帳票1枚につき得た文字認識結果を後
段の装置へ出力する(終了)。
が行なう罫線パタンの抽出につき説明する。罫線抽出部
18は、帳票40全面にわたり帳票イメージデータを走
査し、帳票フォーマットを表す罫線パタンとして水平罫
線パタンと垂直罫線パタンとを抽出する。
メージデータを水平走査し、水平走査線上で水平罫線閾
値TH(Lh)以上の長さLhだけ連続する帳票イメー
ジデータの線描画素を、水平罫線パタンの線描画素とし
て抽出する。連続する長さLhが水平罫線閾値TH(L
h)未満となる帳票イメージデータの線描画素(水平走
査線上で連続せずに孤立して存在する1個の線描画素を
含む)は、水平罫線パタンの背景画素として抽出する。
帳票イメージデータの背景画素もまた、水平罫線パタン
の背景画素として抽出する。水平罫線パタンはこのよう
にして帳票イメージデータから抽出した線描画素及び背
景画素から成るパタンである。
帳票イメージデータを垂直走査し、垂直走査線上で垂直
罫線閾値TH(Lv)以上の長さLvだけ連続する帳票
イメージデータの線描画素を、垂直罫線パタンの線描画
素として抽出する。連続する長さLvが垂直罫線閾値T
H(Lv)未満となる帳票イメージデータの線描画素
(垂直走査線上で連続せずに孤立して存在する1個の線
描画素を含む)は、垂直罫線パタンの背景画素として抽
出する。帳票イメージデータの背景画素もまた、垂直罫
線パタンの背景画素として抽出する。垂直罫線パタンは
このようにして帳票イメージデータから抽出した線描画
素及び背景画素から成るパタンである。
ンに共通の格納領域(以下、罫線共通格納領域)を罫線
パタンメモリ20に設け、水平罫線パタン及び垂直罫線
パタンを重ね合わせて罫線共通格納領域に格納しても良
いし、抽出した水平罫線パタン及び垂直罫線パタンの各
パタン毎に個別の格納領域(以下、罫線個別格納領域)
を罫線パタンメモリ20に設け、水平罫線パタン及び垂
直罫線パタンをそれぞれ別々の罫線個別格納領域に格納
するようにしても良い。
線共通格納領域全面に背景画素を格納し(罫線共通格納
領域の初期化)、然る後、抽出した水平罫線パタンの線
描画素を共通格納領域に格納すると共に抽出した垂直罫
線パタンの線描画素を共通格納領域に格納する。
は、水平罫線パタンに対し設けた罫線個別格納領域全面
に背景画素を格納し(罫線個別格納領域の初期化)、然
る後、水平罫線パタンに対し設けた罫線個別格納領域
に、抽出した水平罫線パタンの線描画素を格納する。ま
た垂直罫線パタンに対し設けた罫線個別領域全面に背景
画素を格納し(罫線個別格納領域の初期化)、然る後、
垂直罫線パタンに対し設けた罫線個別格納領域に、抽出
した垂直罫線パタンの線描画素を格納する。
説明に供する図であって、罫線パタンの線描画素を抽出
する動作に着目した動作の流れの具体的な一例を示す。
を重ね合わせて、罫線パタンメモリ20の罫線共通格納
領域に格納する場合について説明する。この場合、帳票
イメージメモリ54の帳票イメージデータ格納領域上と
罫線パタンメモリ20の罫線共通格納領域上とには、相
対応させたx−y座標系を設定してあり(例えば、水平
方向x軸方向及び垂直方向をy軸方向とする。)、この
座標系で表される画素位置の格納領域から画素データを
読み出し、或はまた、この座標系で表される画素位置の
格納領域へ画素データを書き込むことができるようにな
っているものとする。さらに帳票40の左辺がこれらx
−y座標系のy軸と、帳票40の上辺がこれらx−y座
標系のx軸と重なるように、帳票40をスキャナ52に
セットして、スキャナ52により帳票イメージデータを
得、従ってこれらx−y座標系のx、y軸上に帳票40
の上辺、左辺が載るように位置決めされた帳票イメージ
データ、罫線パタンを格納するものとする。
8は、罫線パタンメモリ20の罫線共通格納領域全面に
わたって背景画素ここでは白ビットを格納する(罫線共
通格納領域の初期化)。
方向として水平罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして水平罫線閾値TH
(Lh)を用い、また連続の長さLとして水平走査線上
で連続する線描画素の長さLhを求めることとなる。
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを水平走査し、帳
票イメージデータの画素データを読み出す(S2)。画
素データは1画素分のデータを表す。
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
定結果を得た場合は、連続の長さLを求めると共に水平
罫線パタンに関する線描画素の候補位置(以下、水平罫
線候補位置)として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
ここでは、S3で画素データが線描画素であるとの判定
結果を得た場合に連続の長さLを1カウントアップする
ことによって従って連続する線描画素の個数を計数する
ことによって、連続の長さLを求める。
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは水平罫線パタンを抽
出する場合であるので求めた連続の長さLは水平走査線
上における連続の長さLhであり、そして閾値THには
水平罫線閾値TH(Lh)を用いることとなる。
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、罫線パタンメモリ20に格納する
(S7)。ここでは記憶していた水平罫線候補位置の罫
線共通格納領域に線描画素を格納することとなる。S7
の次に、連続の長さLを初期化すると共に記憶していた
水平罫線候補位置を消去し(S8)、然る後、帳票40
全面にわたって帳票イメージデータの走査を終了したか
否かを判定する(S9)。またS6で連続の長さLは閾
値TH未満であるとの判定結果を得た場合は、S7を行
なわずに、S8〜S9を行なう。
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から水平罫線パタンを抽出する処
理を終了する(終了)。
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた水平罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
向として垂直罫線パタンを抽出する処理を開始する(開
始)。この場合、閾値THとして垂直罫線閾値TH(L
v)を用い、また連続の長さLとして垂直走査線上で連
続する線描画素の長さLvを求めることとなる。
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを垂直走査し、帳
票イメージデータの画素データを読み出す(S2)。
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
定結果を得た場合は、連続の長さLを求めると共に垂直
罫線パタンに関する線描画素の候補位置(以下、垂直罫
線候補位置)として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは垂直罫線パタンを抽
出する場合であるので求めた連続の長さLは垂直走査線
上における連続の長さLvであり、そして閾値THには
垂直罫線閾値TH(Lv)を用いることとなる。
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、罫線パタンメモリ20に格納する
(S7)。ここでは記憶していた垂直罫線候補位置の罫
線共通格納領域に線描画素を格納することとなる。S7
の次に、連続の長さLを初期化すると共に記憶していた
垂直罫線候補位置を消去し(S8)、然る後、帳票40
全面にわたって帳票イメージデータの走査を終了したか
否かを判定する(S9)。またS6で連続の長さLは閾
値TH未満であるとの判定結果を得た場合は、S7を行
なわずに、S8〜S9を行なう。
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から垂直罫線パタンを抽出する処
理を終了する(終了)。
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた垂直罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
40について水平及び垂直罫線パタンの線描画素を抽出
し、これらパタンの線描画素を重ね合わせて罫線共通格
納領域に格納した例を、図5に示す。図中、20aは罫
線パタンメモリ20の罫線共通格納領域、20bは罫線
共通格納領域20aにおいて帳票紙面40aに対応する
領域、44aは水平罫線パタン及び垂直罫線パタンの重
ね合わせパタンを示す。重ね合わせパタン44aは、水
平罫線パタンの線描画素と垂直罫線パタンの線描画素
と、水平罫線パタンの背景画素でありかつ垂直罫線パタ
ンの背景画素である画素とから成る。
を個別に、罫線パタンメモリ20の罫線個別格納領域に
格納する場合について説明する。この場合、帳票イメー
ジメモリ54の帳票イメージデータ格納領域上と罫線パ
タンメモリ20の各罫線個別格納領域上(水平罫線パタ
ンに対して設けた罫線個別格納領域上及び垂直罫線パタ
ンに対して設けた罫線個別格納領域上)とには、相対応
させたx−y座標系を設定してあり(例えば、水平方向
x軸方向及び垂直方向をy軸方向とする。)、この座標
系で表される画素位置の格納領域から画素データを読み
出し、或はまた、この座標系で表される画素位置の格納
領域へ画素データを書き込むことができるようになって
いるものとする。さらに帳票40の左辺がこれらx−y
座標系のy軸と、帳票40の上辺がこれらx−y座標系
のx軸と重なるように、帳票40をスキャナ52にセッ
トして、スキャナ52により帳票イメージデータを得、
従ってこれらx−y座標系のx、y軸上に帳票40の上
辺、左辺が載るように位置決めされた帳票イメージデー
タ、罫線パタンを格納するものとする。
8は、水平罫線パタンに対して設けた罫線個別格納領域
全面にわたって背景画素ここでは白ビットを格納する
(水平罫線パタンに対して設けた罫線個別格納領域の初
期化)。
方向として水平罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして水平罫線閾値TH
(Lh)を用い、また連続の長さLとして水平走査線上
で連続する線描画素の長さLhを求めることとなる。
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを水平走査し、帳
票イメージデータの画素データを読み出す(S2)。
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
定結果を得た場合は、連続の長さLを求めると共に水平
罫線候補位置として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは水平罫線パタンを抽
出する場合であるので求めた連続の長さLは水平走査線
上における連続の長さLhであり、そして閾値THには
水平罫線閾値TH(Lh)を用いることとなる。
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、水平罫線パタンに対して設けた罫線
個別格納領域に格納する(S7)。ここでは記憶してい
た水平罫線候補位置の罫線個別格納領域に線描画素を格
納することとなる。S7の次に、連続の長さLを初期化
すると共に記憶していた水平罫線候補位置を消去し(S
8)、然る後、帳票40全面にわたって帳票イメージデ
ータの走査を終了したか否かを判定する(S9)。また
S6で連続の長さLは閾値TH未満であるとの判定結果
を得た場合は、S7を行なわずに、S8〜S9を行な
う。
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から水平罫線パタンを抽出する処
理を終了する(終了)。
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた水平罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
対して設けた罫線個別格納領域全面にわたって背景画素
ここでは白ビットを格納する(垂直罫線パタンに対して
設けた罫線個別格納領域の初期化)。
方向として垂直罫線パタンを抽出する処理を開始する
(開始)。この場合、閾値THとして垂直罫線閾値TH
(Lv)を用い、また連続の長さLとして垂直走査線上
で連続する線描画素の長さLvを求めることとなる。
に初期化し(S1)、然る後、帳票イメージメモリ54
に格納されている帳票イメージデータを垂直走査し、帳
票イメージデータの画素データを読み出す(S2)。
メージデータの画素データが、線描画素ここでは黒ビッ
トであるか否かを判定する(S3)。
定結果を得た場合は、連続の長さLを求めると共に垂直
罫線候補位置として当該画素データの画素位置を記憶し
(S4)、然る後、帳票イメージデータにつき現走査線
1ラインの走査を終了したか否かを判定する(S5)。
いないとの判定結果を得た場合は、現走査線上の次の画
素データを読み出すべくS2に戻る。
了したとの判定結果を得た場合は、連続の長さLを閾値
THと比較する(S6)。ここでは垂直罫線パタンを抽
出する場合であるので求めた連続の長さLは垂直走査線
上における連続の長さLvであり、そして閾値THには
垂直罫線閾値TH(Lv)を用いることとなる。
との判定結果を得た場合、罫線抽出部18は長さLの連
続する線描画素を、垂直罫線パタンに対して設けた罫線
個別格納領域に格納する(S7)。ここでは記憶してい
た垂直罫線候補位置の罫線個別格納領域に線描画素を格
納することとなる。S7の次に、連続の長さLを初期化
すると共に記憶していた垂直罫線候補位置を消去し(S
8)、然る後、帳票40全面にわたって帳票イメージデ
ータの走査を終了したか否かを判定する(S9)。また
S6で連続の長さLは閾値TH未満であるとの判定結果
を得た場合は、S7を行なわずに、S8〜S9を行な
う。
ジデータの走査を終了していないとの判定結果を得た場
合は、現走査線の次の走査線上に在る画素データを読み
出すべくS2に戻る。またS9で帳票全面にわたって帳
票イメージデータの走査を終了したとの判定結果を得た
場合は、当該帳票40から垂直罫線パタンを抽出する処
理を終了する(終了)。
は線描画素でないとの判定結果を得た場合は、連続の長
さLを閾値THと比較する(S10)。
るとの判定結果を得た場合、罫線抽出部18は長さLの
連続する線描画素を、罫線パタンメモリ20に格納する
(S11)。次に連続の長さLを零に初期化すると共に
記憶していた垂直罫線候補位置を消去し(S12)、然
る後、現走査線一ラインの走査を終了したか否かを判定
する(S13)。現走査線一ラインの走査を終了してい
なければ(S13)、現走査線上の次の画素データを読
み出すべくS2に戻る。現走査線一ラインの走査を終了
したならば(S13)、S9を行なう。またS10で連
続の長さLは閾値TH未満であるとの判定結果を得た場
合は、S11を行なわずにS12〜S13を行なう。
40について水平及び垂直罫線パタンの線描画素を抽出
し、これらパタンの線描画素をそれぞれ別々の罫線個別
格納領域に格納した例を、図6に示す。図6(A)中、
20cは水平罫線パタンに対して設けた罫線個別格納領
域、20dは罫線個別格納領域20cにおいて帳票紙面
40aに対応する領域、及び44bは水平罫線パタンを
示す。また図6(B)中、20eは垂直罫線パタンに対
して設けた罫線個別格納領域、20fは罫線個別格納領
域20eにおいて帳票紙面40aに対応する領域、及び
44cは垂直罫線パタンを示す。
ット認識部24が行なう帳票フォーマットの認識につい
て説明する。ここではフォーマット認識辞書22は、帳
票イメージデータから予め抽出しておいた帳票標準フォ
ーマットの特徴を、辞書データとして保持し、フォーマ
ット認識部24は、抽出された罫線パタンを走査して罫
線パタンにより表される帳票フォーマットの特徴を抽出
し、該抽出特徴を帳票標準フォーマットの特徴と比較し
て認識の確からしさを求めることにより、照合を行な
う。認識の確からしさとして例えば距離や確信度を用い
ることができる。
ォーマット(標準的な帳票フォーマット)を有する帳票
を複数用意し、各帳票毎に、帳票イメージデータから罫
線抽出部18の場合と同様にして罫線パタンを抽出し、
抽出した罫線パタンを走査して特徴を抽出する。この抽
出特徴は、帳票標準フォーマットを有する帳票イメージ
データから抽出したものであるので、帳票標準フォーマ
ットの特徴となる。この帳票標準フォーマットの特徴を
辞書データとしてフォーマット認識辞書22に記憶させ
る。帳票標準フォーマットの特徴と帳票標準フォーマッ
トの種別とを、帳票標準フォーマットの各種別毎に個別
に、相対応づけて記憶させる。
フォーマット未知の帳票イメージデータを走査して、罫
線抽出部18により罫線パタンを抽出する。そして抽出
した罫線パタンを走査して特徴を抽出し、この抽出特徴
を、帳票標準フォーマットの各種別毎に、帳票標準フォ
ーマットの特徴と照合する。例えば、帳票フォーマット
未知の帳票から抽出した罫線パタンの特徴と帳票標準フ
ォーマットの特徴との間の距離を認識の確からしさに用
いて照合を行なう。そしてフォーマット認識辞書22に
記憶させた帳票標準フォーマットの種別のなかから、各
種別毎に求めた認識の確からしさに基づいて、一又は複
数の種別を選択し、選択した種別を帳票フォーマットの
認識結果として出力する。例えば、帳票標準フォーマッ
トの種別を、認識の確からしさの高いものから低いもの
の順に並べ、n=1、2、……として第n番目の認識の
確からしさと第n+1番目の認識の確からしさとの差を
調べ、当該差が閾値以上となったときの第1番から第n
番目までの認識の確からしさに対応する帳票標準フォー
マットの種別を、認識結果として選択する。
票イメージデータから予め抽出しておいた帳票標準フォ
ーマットを表す罫線標準パタンを、辞書データとして保
持し、フォーマット認識部24は、抽出された罫線パタ
ンを罫線標準パタンと比較して認識の確からしさを求め
ることにより、照合を行なうようにしても良い。認識の
確からしさとしては例えば一致の程度や確信度を用いる
ことができる。
票標準フォーマットを有する帳票を複数用意し、各帳票
毎に、帳票イメージデータから罫線抽出部18の場合と
同様にして罫線パタンを抽出する。この罫線パタンは帳
票標準フォーマットを有する帳票のイメージデータから
抽出したものであるので、罫線標準パタンとなるもので
ある。この罫線標準パタンを、辞書データとしてフォー
マット認識辞書22に記憶させる。罫線標準パタンと帳
票標準フォーマットの種別とを、帳票標準フォーマット
の各種別毎に個別に、相対応づけて記憶させる。
フォーマット未知の帳票イメージデータを走査して、罫
線抽出部18により罫線パタンを抽出する。そして抽出
した罫線パタンを、帳票標準フォーマットの各種別毎
に、罫線標準パタンと照合する。例えば、帳票フォーマ
ット未知の帳票から抽出した罫線パタンと、罫線標準パ
タンとの間の一致の程度を認識の確からしさに用いて照
合を行なう。そしてフォーマット認識辞書22に記憶さ
せた帳票標準フォーマットの種別のなかから、各種別毎
に求めた認識の確からしさに基づいて、一又は複数の種
別を選択し、選択した種別を帳票フォーマットの認識結
果として出力する。例えば、帳票標準フォーマットの種
別を、認識の確からしさの高いものから低いものの順に
並べ、n=1、2、……として第n番目の認識の確から
しさと第n+1番目の認識の確からしさとの差を調べ、
当該差が閾値以上となったときの第1番から第n番目ま
での認識の確からしさに対応する帳票標準フォーマット
の種別を、認識結果として選択する。
なう表示につき説明する。図7は表示部の表示の説明に
供する図であって、帳票フォーマットの認識結果が得ら
れた後に、オペレータが認識結果を確認決定する作業を
助けるため、表示部28が行なう表示の一例を示す。
メージデータメモリ54から制御部17により読み出さ
れた帳票フォーマット未知の帳票イメージデータ52と
当該イメージデータ52の認識結果に対応する参照デー
タ54とを、並列させて、表示部28の同一表示画面2
8aに同時に表示している。従ってオペレータは、帳票
フォーマットの帳票イメージデータ52と当該イメージ
データ52に対応する参照データ54とを比較すること
ができるので、最も確からしい認識結果を判断決定する
作業を、正確に行なうことができる。
デバイス例えばマウス若しくはトラックボールや、キー
ボードを用い、オペレータはこのような入力デバイス3
0を操作することにより、最も確からしいと判断決定し
た認識結果を指示する信号を制御部17へ入力する。
帳票フォーマットの複数の認識結果に対応する参照デー
タ54を、認識の確からしさの高い順に表示する。この
場合、制御部17は、帳票フォーマットの認識結果と当
該認識結果の認識の確からしさとをフォーマット認識部
28から入力し、認識の確からしさに基づいて認識の確
からしさの高い順に認識結果をソートし、その順番に対
応させて参照データ54を表示部28に表示させる。オ
ペレータは、認識の確からしさの高い順に表示された参
照データを順番に見て、帳票イメージデータ52と比較
することができるので、最も確からしい認識結果を判断
決定する作業を、正確にしかも迅速に行なえる。
参照データ54として読取り制御データを表示する。従
って参照データメモリ26として、読取り制御データメ
モリ14を用いるものであって、図1に示すフォーマッ
ト認識装置52(この装置52は請求項1のフォーマッ
ト認識装置の実施形態となるものである)は、フォーマ
ット認識系12と表示部28と入力デバイス30と参照
データメモリ26(14)とフォーマット認識系12及
び表示部28の制御を行なう制御部17とを備える。
尚、読取り制御データを、帳票フォーマットの各種別毎
に個別に用意し、読取り制御データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて読取り制御データメモリ14に記憶させる。
て、例えば、文字パタンの切出しに関わる読取り制御デ
ータ(以下、第一の参照データとも言う)を用いる。文
字パタンの切出しに関わる読取り制御データは、例え
ば、帳票幅、帳票高さ、帳票内の行数、帳票内の行位
置、帳票内のフィールド数、帳票内のフィールド位置、
前記行内若しくはフィールド内の文字数、及び、前記行
内若しくはフィールド内の文字ピッチであって、これら
文字パタンの切出しに関わる読取り制御データを、図
形、記号、文字、色、輝度若しくはこれらの組み合わせ
により区別して表して、表示する。
票1枚分の参照データを囲むと共に、その枠の幅及び高
さにより帳票幅及び帳票高さを表している。また行、フ
ィールド、文字を表す矩形で、行の位置及び個数とフィ
ールドの位置及び個数と、行及びフィールド内の文字数
とを表し、さらに文字を表す矩形の配設ピッチにより、
文字ピッチを表している。この他、1行分の領域、フィ
ールド1個分の領域、文字1個分の領域を、点線、一転
鎖線等の線種の異なる線で囲んで表したり、色を異なら
せて表したり、輝度を異ならせて表したりしても良い。
或は、1行分の領域、フィールド1個分の領域、文字1
個分の領域を、輪郭形状が異なる枠で囲んで表しても良
い(例えば行を矩形で、フィールドを横に細長い長楕円
で、文字を三角で表す)。或は、文字の個数及びピッチ
を、文字で表して表示するようにしても良い。例えば文
字の個数5個とか、文字のピッチ10mmというように
表す。
として、前記第一の参照データと、これに加え文字パタ
ンの認識に用いる読取り制御データ(以下、第二の参照
データとも言う)とを用いても良い。第二の参照データ
は、例えば帳票内に記載される文字の字種若しくは字体
であって、これら第一及び第二の参照データを、図形、
記号、文字、色、輝度若しくはこれらの組み合わせによ
り区別して表して表示し、第二の参照データを、第一の
参照データの表示位置の近傍位置若しくは第一の参照デ
ータの表示位置と重なる位置に表示する。例えば、字種
及び字体を、記号、文字、図形により表し、字種及び字
体が異なる各領域毎に、字種及び字体を表す記号等を表
示すれば良い。例えば、帳票内の行及びフィールドを、
矩形枠等の図形で表して表示し、帳票内の行及びフィー
ルドに記載される文字の字種、字体を、色で表し、行及
びフィールドを表す図形が囲む領域の色を、対応する字
種、字体を表す色にして表示を行なうようにする。或
は、行及びフィールドに記載される文字の字種、字体
を、色で表し、行及びフィールドを表す図形の外形線
を、対応する字種、字体を表す色の線にして表示するよ
うにしても良い。或は、行及びフィールドに記載される
文字の字種、字体を、線種で表し、行及びフィールドを
表す図形の外形線を、対応する字種、字体を表す線種の
線にして表示するようにしても良い。或はまた、帳票内
の行及びフィールドを矩形枠等の図形で表して表示し、
帳票内の行及びフィールドに記載される文字の字種、字
体の名称を、文字で表して表示し、行及びフィールドを
表す図形の、上側、下側、左側或は右側の近傍位置に、
字種、字体の名称を表す文字を表示するようにしても良
い。
ーマットの認識結果を得るのに用いた認識の確からしさ
を表す数値を、参照データ54と対応づけて、参照デー
タ54と同一の表示画面28aに表示するようにしても
良い。このように帳票フォーマットの認識結果の認識の
確からしさを表す数値と当該認識結果の参照データ54
とを相対応づけて同一の表示画面28aに同時に表示す
ることにより、オペレータが最も確からしい認識結果を
判断決定する作業を、行ない易くすることができる。
2に含まれる行領域、フィールド領域、1文字分の記載
領域或は文字の拡大・縮小率と、参照データ54に含ま
れる行領域、フィールド領域若しくは1文字分の記載領
域を表す図形若しくは参照データ54に含まれる文字の
拡大・縮小率とを異ならせこれらデータ52、54を表
示しているが、これらの拡大・縮小率を等しくしこれら
を並列させて表示するようにしても良い。これらの拡大
・縮小率を等しくして表示することにより、オペレータ
が最も確からしい認識結果を判断決定する作業を、行な
い易くすることができる。
る行領域、フィールド領域、1文字分の記載領域若しく
は文字の拡大・縮小率と、参照データ54に含まれる行
領域、フィールド領域、1文字分の記載領域を表す図形
若しくは参照データ54に含まれる文字の拡大・縮小率
とを等しくし、これら拡大・縮小率の等しいデータ5
2、54を重ね合わせて表示するようにしても良い。例
えば、帳票イメージデータ52を得た帳票の左辺、上辺
と、参照データ54が表す帳票の左辺、上辺とが重なり
合うように位置決めして、これらデータ52、54を表
示する。このように重ね合わせて表示することにより、
オペレータが最も確か確からしい認識結果を判断決定す
る作業を、行ない易くすることができる。
が行なう文字パタンの認識について説明する。ここでは
文字認識辞書36は、文字標準パタンの特徴を辞書デー
タとして保持し、文字認識部38は、切り出された文字
パタンを走査して切り出された文字パタンの特徴を抽出
し、該抽出特徴を文字標準パタンの特徴と比較して認識
の確からしさを求めることにより、照合を行なう。認識
の確からしさとして例えば距離や確信度を用いることが
できる。
光学的に走査して得た文字標準パタンを複数用意し、各
標準文字パタン毎に、文字標準パタンを走査して文字標
準パタンの特徴を抽出する。そして抽出した文字標準パ
タンの特徴を、辞書データとして文字認識辞書36に記
憶させる。文字標準パタンの特徴と文字名とを、各文字
標準パタン毎に個別に、相対応づけて記憶させる。
を行なうべき帳票イメージデータから、文字パタンを切
出し、切り出した文字パタンを走査して切出し文字パタ
ンの特徴を抽出する。この抽出特徴を、各文字標準パタ
ン毎に、文字標準パタンの特徴と照合する。例えば、切
出した文字パタンの特徴と文字標準パタンの特徴との間
の距離を認識の確からしさに用いて照合を行なう。そし
て文字認識辞書36に記憶させた文字名のなかから、各
文字標準パタン毎に求めた認識の確からしさに基づい
て、一又は複数の文字名を選択し、選択した文字名を文
字パタンの認識結果として出力する。
タンを辞書データとして保持し、文字認識部38は、切
り出された文字パタンを文字標準パタンと比較して認識
の確からしさを求めることにより、照合を行なうように
しても良い。
準文字を光学的に走査して文字標準パタンを得、文字標
準パタンを辞書データとして文字認識辞書36に記憶さ
せる。複数の文字標準パタンを用意し、文字標準パタン
と文字名とを、各文字標準パタン毎に個別に、相対応づ
けて記憶させる。
を行なうべき帳票イメージデータから文字パタンを切り
出し、そして切り出した文字パタンを、各文字標準パタ
ン毎に、文字標準パタンと照合する。例えば、切り出し
た文字パタンと、文字標準パタンとの間の一致の程度を
認識の確からしさに用いて照合を行なう。そして文字認
識辞書36に記憶させた文字名のなかから、各文字標準
パタン毎に求めた認識の確からしさに基づいて、一又は
複数の文字名を選択し、選択した文字名を文字パタンの
認識結果として出力する。
の種別を表す識別番号が記載されていない帳票であって
も(図2(B)の帳票参照)、帳票フォーマットの種別
に対応した読取り制御データを利用して、文字パタンの
切出し及び認識が行なえる。読取り制御データを利用す
ることにより、文字パタンの切出し及び認識のための処
理を高速に行なえる。また読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を簡単化できるので、装置のハードウエア規模或はソフ
トウエア規模を小さくすることができる。
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
す機能ブロック図である。同図に示す文字読取り装置
は、請求項9の文字読取り装置の実施形態となるもので
あって、請求項1のフォーマット認識装置の実施形態を
含んでいる。以下の説明では、請求項9の文字読取り装
置の実施形態の説明と共に、請求項1のフォーマット認
識装置の実施形態につき説明する。以下、図1の実施形
態と相違する点につき説明し、図1の実施形態と同様の
点についてはその詳細な説明を省略する。
としてフォーマット画像メモリ56を設け、読取り制御
データメモリ14を参照データメモリ26としては用い
ない。従ってフォーマット認識装置52は、フォーマッ
ト認識系12、表示部28、入力デバイス30及び制御
部17と、フォーマット画像メモリ56(26)とから
成る。
タとして、帳票標準フォーマットの辞書データを得るの
に用いた帳票のイメージデータ(参照用イメージデー
タ)、或は、読取り制御データを得るのに用いた帳票の
イメージデータ(参照用イメージデータ)を保持するも
のであって、このような参照データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて、フォーマット画像メモリ56に記憶させて
いる。
って、帳票フォーマットの認識結果が得られた後に、オ
ペレータが認識結果を確認決定する作業を助けるために
表示部28が行なう表示の一例を示す。同図にも示すよ
うに、参照データ54として、読取り制御データに代え
て、帳票標準フォーマットの辞書データ或は読取り制御
データを得るのに用いた帳票のイメージデータを表示す
る。
ら帳票フォーマットの認識結果を入力すると、入力した
認識結果に対応した参照用イメージデータを、フォーマ
ット画像メモリ56(26)から読み出して表示部28
に表示させる。
ついて図3を参照して説明する。S1〜S3は図1の実
施形態の場合と同様である。
ットの認識結果に対応した既知の帳票フォーマットの帳
票イメージデータを参照データとして参照データメモリ
26(56)から読み出し、読み出した参照データを表
示部28に表示させると共に、当該認識結果を得た帳票
フォーマット未知の帳票イメージデータを帳票イメージ
メモリ54から読み出し表示部28に表示させ(S
4)、然る後、オペレータによるフォーマット決定信号
の入力を待つ(S5)。
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
ット決定信号の入力を確認すると(S5)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S6)。この受け渡しは、制御部17と、読取
り制御データメモリ14及び文字認識系16との間で行
なわれる。
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読取り
制御データメモリ14から読み出し、そして文字パタン
の切出しに関わる読取り制御データを文字切出し部32
へ、また文字パタンの認識に関わる読取り制御データを
文字認識部38へ出力する。S6以降のS7〜S10は
図1の実施形態と同様である。
別を表す識別番号が記載されていない帳票であっても
(図2(B)の帳票参照)、帳票フォーマットの種別に
対応した読取り制御データを利用して、文字パタンの切
出し及び認識が行なえる。読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を高速に行なえる。また読取り制御データを利用するこ
とにより、文字パタンの切出し及び認識のための処理を
簡単化できるので、装置のハードウエア規模或はソフト
ウエア規模を小さくすることができる。
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
示す機能ブロック図である。同図に示す文字読取り装置
は、請求項9の文字読取り装置の実施形態となるもので
あって、請求項1のフォーマット認識装置の実施形態を
含んでいる。以下の説明では、請求項9の文字読取り装
置の実施形態の説明と共に、請求項1のフォーマット認
識装置の実施形態につき説明する。以下、図1の実施形
態と相違する点につき説明し、図1の実施形態と同様の
点についてはその詳細な説明を省略する。
としてフォーマット画像メモリ56を設け、読取り制御
データメモリ14とフォーマット画像メモリ56とを双
方ともに参照データメモリ26として用いる。従ってフ
ォーマット認識装置52は、フォーマット認識系12、
表示部28、入力デバイス30及び制御部17と、読取
り制御データメモリ14(26)及びフォーマット画像
メモリ56(26)とから成る。
タとして、帳票標準フォーマットの辞書データを得るの
に用いた帳票のイメージデータ、或は、読取り制御デー
タを得るのに用いた帳票のイメージデータを保持するも
のであって、このような参照データと帳票フォーマット
の種別とを、帳票フォーマットの各種別毎に個別に、相
対応づけて、フォーマット画像メモリ56に記憶させて
いる。
取り制御データに加え、帳票標準フォーマットの辞書デ
ータ或は読取り制御データを得るのに用いた帳票のイメ
ージデータ(参照用イメージデータ)を表示するもので
あって、参照データ54として表示する参照用イメージ
データに含まれる行領域、フィールド領域、1文字分の
記載領域若しくは文字の拡大・縮小率と、参照データ5
4として表示する読取り制御データに含まれる行領域、
フィールド領域、1文字分の記載領域を表す図形若しく
は参照データ54として表示する読取り制御データに含
まれる文字の拡大・縮小率とを等しくして、これら参照
データ54としての参照用イメージデータ及び読取り制
御データを重ね合わせて表示する。例えば、参照データ
として表示する参照用イメージデータ52を得た帳票の
左辺、上辺と、参照データ54として表示する読取り制
御データが表す帳票の左辺、上辺とが重なり合うように
位置決めして、これら参照用イメージデータ及び読取り
制御データを表示する。このように重ね合わせて表示す
ることにより、オペレータが最も確か確からしい認識結
果を判断決定する作業を、行ない易くすることができ
る。尚、参照データ54としての参照用イメージデータ
に、文字パタンの切出しに関わる読取り制御データを参
照データとして重ね合わせて表示したり、参照データ5
4としての参照用イメージデータに、文字パタンの切出
し及び認識に関わる読取り制御データを参照データとし
て重ね合わせて表示したりすることができる。
ら帳票フォーマットの認識結果を入力すると、入力した
認識結果に対応した参照用イメージデータを、フォーマ
ット画像メモリ56(26)から読み出して表示部28
に表示させると共に入力した認識結果に対応した読取り
制御データを、読取り制御データメモリ14(26)か
ら読み出して表示部28に表示させる。
ついて図3を参照して説明する。S1〜S3は図1の実
施形態の場合と同様である。
ットの認識結果に対応した参照用イメージデータを参照
データとして参照データメモリ26(56)から読み出
しさらに入力した帳票フォーマットの認識結果に対応し
た読取り制御データを参照データとして参照データメモ
リ26(14)から読み出して、これら読み出した参照
データを重ね合わせて表示部28に表示させ、これと共
に、当該認識結果を得た帳票フォーマット未知の帳票イ
メージデータを帳票イメージデータから読み出して参照
データとは別の位置に並列させて表示部28に表示させ
る(S4)。S4以降のS5〜S10は図1の実施形態
と同様である。
別を表す識別番号が記載されていない帳票であっても
(図2(B)の帳票参照)、帳票フォーマットの種別に
対応した読取り制御データを利用して、文字パタンの切
出し及び認識が行なえる。読取り制御データを利用する
ことにより、文字パタンの切出し及び認識のための処理
を高速に行なえる。また読取り制御データを利用するこ
とにより、文字パタンの切出し及び認識のための処理を
簡単化できるので、装置のハードウエア規模或はソフト
ウエア規模を小さくすることができる。
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
する。図11はこの変形例の文字読取り装置の全体的な
動作の流れを示す図である。この変形例は、動作が異な
るほかは、図1の実施形態と同様の構成であるので、適
宜図1を参照されたい。
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
すると、制御部17はフォーマット認識部24を起動す
る。
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
の認識結果に対応した読取り制御データを既知の帳票フ
ォーマットの参照データとして参照データメモリ26
(14)から読み出し(S4)、然る後、制御部17
は、入力した帳票フォーマットの認識結果が1つであっ
たか否かを判定する(S5)。
果は複数であるとの判定結果を得た場合は、制御部17
は、参照データとして読み出した読取り制御データを表
示部28に表示させると共に、当該認識結果を得た帳票
フォーマット未知の帳票イメージデータを帳票イメージ
メモリ54から読み出して表示部28に表示させ(S
6)、然る後、オペレータによるフォーマット決定信号
の入力を待つ(S7)。
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
ット決定信号の入力を確認すると(S7)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S8)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
6)には、文字パタンの切出しに関わる読取り制御デー
タと文字パタンの認識に関わる読取り制御データとを記
憶させてあり、制御部17は、フォーマット決定信号に
より決定された認識結果に対応する読取り制御データを
読出し済みの読取り制御データのなかから選択し、選択
した読取り制御データのうち文字パタンの切出しに関わ
る読取り制御データを文字切出し部32へ、また選択し
た読取り制御データのうち文字パタンの認識に関わる読
取り制御データを文字認識部38へ出力する。
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S9)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S10)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S11)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S12)。
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS9〜S
12の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを既に読出し済みの読取り制御データメモリのなか
から選択し、選択した読取り制御データのうち文字パタ
ンの切出しに関わる読取り制御データを文字切出し部3
2へ、また選択した読取り制御データのうち文字パタン
の認識に関わる読取り制御データを文字認識部38へ出
力する(S13)。然る後、制御部17は文字切出し部
32及び文字認識部38を起動する。この場合、S6〜
S8は行なわれず従って最も確からしい認識結果に関し
てオペレータによる判断決定は行なわれずにS9〜S1
2が行なわれることとなる。
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
る。図12はこの変形例の文字読取り装置の全体的な動
作の流れを示す図である。この変形例は、動作が異なる
ほかは、図8の実施形態と同様の構成であるので、適宜
図8を参照されたい。
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
すると、制御部17はフォーマット認識部24を起動す
る。
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
ットの認識結果が1つであったか否かを判定する(S
4)。
の認識結果は複数であったとの判定結果を得た場合、制
御部17は、入力した帳票フォーマットの認識結果に対
応した既知の帳票フォーマットの帳票イメージデータ
(参照用イメージデータ)を参照データとして参照デー
タメモリ26(56)から読み出し、読み出した参照デ
ータを表示部28に表示させると共に、当該認識結果を
得た帳票フォーマット未知の帳票イメージデータを帳票
イメージメモリ54から読み出して表示部28に表示さ
せ(S5)、然る後、オペレータによるフォーマット決
定信号の入力を待つ(S6)。
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
ット決定信号の入力を確認すると(S6)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S7)。この受け渡しは、制御部17と、読取
り制御データメモリ14及び文字認識系16との間で行
なわれる。
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読取り
制御データメモリ14から読み出し、そして読み出した
読取り制御データのうち文字パタンの切出しに関わる読
取り制御データを文字切出し部32へ、また読み出した
読取り制御データのうち文字パタンの認識に関わる読取
り制御データを文字認識部38へ出力する。
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S8)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S9)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S10)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S11)。
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS8〜S
11の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを読取り制御データメモリ14から読み出し、読み
出した読取り制御データのうち文字パタンの切出しに関
わる読取り制御データを文字切出し部32へ、また読み
出した読取り制御データのうち文字パタンの認識に関わ
る読取り制御データを文字認識部38へ出力する(S1
2)。然る後、制御部17は文字切出し部32及び文字
認識部38を起動する。この場合、S5〜S7は行なわ
れず従って最も確からしい認識結果に関してオペレータ
による判断決定は行なわれずにS8〜S11が行なわれ
ることとなる。
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
明する。この変形例は、動作が異なるほかは、図10の
実施形態と同様の構成であるので、適宜図10を参照さ
れたい。以下、この変形例の文字読取り装置の全体的な
動作の流れにつき、図11を参照して説明する。
タを得る。スキャナ52は帳票40の紙面40aを光学
的に走査して、量子化された電気信号例えば白黒2値の
電気信号から成る帳票イメージデータを生成し、このデ
ータを帳票イメージメモリ54に格納する。ここでは線
描画素を黒ビットで、背景画素を白ビットで表す。尚、
線描画素は紙面40a内に在る線を表す画素、背景画素
は紙面40aの地の部分(線の背景となる部分)を表す
画素である。
ータが格納されると、制御部17は罫線抽出部18を起
動する(開始)。
ジメモリ54に格納されている帳票イメージデータを走
査して、罫線パタンを抽出し、抽出した罫線パタンを罫
線パタンメモリ20に格納する(S1)。
すると、制御部17はフォーマット認識部24を起動す
る。
線パタンメモリ20に格納されている罫線パタンを、フ
ォーマット認識辞書22に格納されている帳票フォーマ
ットの辞書データと照合し(S2)、この照合結果に基
づいて、罫線パタンにより表される帳票フォーマットを
認識し、この認識結果を制御部17へ出力する(S
3)。
ットの認識結果に対応した既知の帳票フォーマットの帳
票イメージデータ(参照用イメージデータ)を参照デー
タとして参照データメモリ26(56)から読み出しさ
らに入力した帳票フォーマットの認識結果に対応した読
取り制御データを参照データとして参照データメモリ2
6(14)から読み出し(S4)、然る後、制御部17
は入力した帳票フォーマットの認識結果が1つであった
か否かを判定する(S5)。
果は複数であるとの判定結果を得た場合は、制御部17
は、参照データとして読み出した読取り制御データと既
知の帳票フォーマットの帳票イメージデータとを表示部
28に表示させると共に、当該認識結果を得た帳票フォ
ーマット未知の帳票イメージデータを帳票イメージメモ
リ54から読み出して表示部28に表示させ(S6)、
然る後、オペレータによるフォーマット決定信号の入力
を待つ(S7)。
ット未知の帳票イメージデータとを比較参照し、最も確
からしい認識結果を判断決定し、入力デバイス30を操
作して、その判断結果に対応したフォーマット決定信号
を入力する。
ット決定信号の入力を確認すると(S7)、フォーマッ
ト決定信号に基づいて、読取り制御データの受け渡しを
行なう(S8)。この受け渡しは、制御部17と、文字
認識系16との間で行なわれる。
は、文字パタンの切出しに関わる読取り制御データと文
字パタンの認識に関わる読取り制御データとを記憶させ
てあり、制御部17は、フォーマット決定信号により決
定された認識結果に対応する読取り制御データを読出し
済みの読取り制御データのなかから選択し、選択した読
取り制御データのうち文字パタンの切出しに関わる読取
り制御データを文字切出し部32へ、また選択した読取
り制御データのうち文字パタンの認識に関わる読取り制
御データを文字認識部38へ出力する。
字認識部38を起動する。すると文字切出し部32は、
帳票イメージデータから、1文字単位に、文字パタンを
切出し、切り出した文字パタンを文字パタンメモリ34
に格納する(S9)。文字認識部38は、切り出された
文字パタンを文字認識辞書36の辞書データと照合し
(S10)、この照合結果に基づいて文字パタンを認識
し、その認識結果を制御部17へ出力する(S11)。
制御部17は、1文字単位に、文字パタンの認識結果を
入力しそして帳票紙面40a上のすべての文字について
認識を終了したか否かを判定する(S12)。
認識を終了していなければ、文字切出し部32及び文字
認識部38は、制御部17の動作制御に従ってS9〜S
12の処理を繰り返す。また帳票紙面40a上のすべて
の文字について認識を終了したならば、帳票1枚分の文
字読取りを終了し、帳票1枚につき得た文字認識結果を
後段の装置へ出力する(終了)。
トの認識結果は1つであるとの判定結果を得た場合に
は、制御部17は当該認識結果に対応する読取り制御デ
ータを既に読出し済みの読取り制御データメモリのなか
から選択し、選択した読取り制御データのうち文字パタ
ンの切出しに関わる読取り制御データを文字切出し部3
2へ、また選択した読取り制御データのうち文字パタン
の認識に関わる読取り制御データを文字認識部38へ出
力する(S13)。然る後、制御部17は文字切出し部
32及び文字認識部38を起動する。この場合、S6〜
S8は行なわれず従って最も確からしい認識結果に関し
てオペレータによる判断決定は行なわれずにS9〜S1
2が行なわれることとなる。
を表す識別番号が記載されていない帳票であっても(図
2(B)の帳票参照)、帳票フォーマットの種別に対応
した読取り制御データを利用して、文字パタンの切出し
及び認識が行なえる。読取り制御データを利用すること
により、文字パタンの切出し及び認識のための処理を高
速に行なえる。また読取り制御データを利用することに
より、文字パタンの切出し及び認識のための処理を簡単
化できるので、装置のハードウエア規模或はソフトウエ
ア規模を小さくすることができる。
データ52と当該データ52の認識結果に対応する参照
データ54とを、同一の表示画面28aに同時に表示す
るようにしたので、オペレータは、最も確からしい認識
結果を判断決定する作業を、正確に行なえる。
ある場合には、最も確からしい認識結果に関してオペレ
ータによる判断決定は行なわれないので、オペレータの
作業軽減を図れると共に処理時間の短縮を図ることがで
きる。
部28に表示された場合に、オペレータが参照データに
対応する認識結果を選択指示するフォーマット決定信号
を入力し、このフォーマット決定信号に対応する読取り
制御データに基づいて文字パタンの切出し及び認識を行
なうようにしたが、参照データが表示部28に表示され
た場合に、参照データに対応する認識結果の中にオペレ
ータが満足できる認識結果を見出せなかったときは、オ
ペレータが適切な読取り制御データを指示する帳票フォ
ーマットの種別をフォーマット決定信号として入力デバ
イス30を介し制御部17に入力し、このフォーマット
決定信号として入力した帳票フォーマットの種別に基づ
いて文字パタンの切出し及び認識を行なうようにしても
良い。
においても、スキャナ52にセットした帳票を押える押
え面を、帳票内に在る線と同様に線描画素に変換される
色例えば黒色として、帳票イメージデータを得、領域検
出に関わる周知の画像技術により、帳票イメージデータ
において帳票紙面に対応する領域を検出するようにして
も良い。この帳票紙面に対応する領域内の帳票イメージ
データを走査して、罫線パタンを検出し、またこの帳票
紙面に対応する領域内の帳票イメージデータを、帳票イ
メージメモリ54から読み出して表示部28の表示画面
に表示するようにすることができる。
求項1のフォーマット認識装置によれば、帳票イメージ
データから罫線パタンを抽出し、抽出された罫線パタン
を帳票フォーマットの辞書データと照合して、帳票フォ
ーマットの認識を行なうので、帳票フォーマットの種別
を表す種別番号が帳票に印刷されていない場合でも、帳
票フォーマットを認識しその認識結果に基づいて帳票フ
ォーマットの種別を知ることができる。
結果に対応した既知帳票フォーマットの特徴を表す参照
データを表示するので、オペレータは、参照データを参
照して最も確からしい認識結果を判断決定する作業を、
正確に行なえる。
帳票イメージデータから罫線パタンを抽出し、抽出され
た罫線パタンを帳票フォーマットの辞書データと照合し
て、帳票フォーマットの認識を行なうので、帳票フォー
マットの種別を表す種別番号が帳票に印刷されていない
場合でも、帳票フォーマットを認識しその認識結果に基
づいて帳票フォーマットの種別を知り、その種別に対応
した読取り制御データを用いて文字パタンの切出し及び
認識を行なうことができる。
結果に対応した既知帳票フォーマットの特徴を表す参照
データを表示するので、オペレータは、参照データを参
照して最も確からしい認識結果を判断決定する作業を、
正確に行なえる。
施形態について構成の説明に供する機能ブロック図であ
る。
る。
施形態について動作の流れを説明するための図である。
せて格納した例を示す図である。
タン及び垂直罫線パタンの例を示す図である。
施形態の構成の説明に供する図である。
実施形態の構成の説明に供する図である。
実施形態の変形例について動作の流れを説明するための
図である。
実施形態の変形例について動作の流れを説明するための
図である。
Claims (21)
- 【請求項1】 帳票フォーマット未知の帳票イメージデ
ータから、帳票フォーマットを表す罫線パタンを抽出す
る罫線抽出部と、 抽出された罫線パタンを格納する罫線パタンメモリと、 帳票フォーマットの辞書データを保持するフォーマット
認識辞書と、 抽出された罫線パタンを、帳票フォーマットの辞書デー
タと照合し、該照合結果に基づいて罫線パタンにより表
される帳票フォーマットについて一又は複数の認識結果
を出力するフォーマット認識部と、 既知の帳票フォーマットの特徴を表す参照データを保持
する参照データメモリと、 前記帳票フォーマットの認識結果に対応した既知の帳票
フォーマットの参照データを表示する表示部と、 オペレータが表示された参照データに基づいて帳票フォ
ーマットの認識結果を決定する作業において、オペレー
タによる決定結果の入力操作に対応したフォーマット決
定信号を出力する入力デバイスとを備えることを特徴と
するフォーマット認識装置。 - 【請求項2】 請求項1記載のフォーマット認識装置に
おいて、 表示部は、帳票フォーマット未知の帳票イメージデータ
と当該イメージデータの認識結果に対応する参照データ
とを、表示部の同一画面に同時に表示することを特徴と
するフォーマット認識装置。 - 【請求項3】 請求項1又は2記載のフォーマット認識
装置において、 表示部は、帳票フォーマットの複数の認識結果に対応す
る参照データを、認識の確からしさの高い順に表示する
ことを特徴とするフォーマット認識装置。 - 【請求項4】 請求項1記載のフォーマット認識装置に
おいて、 参照データを、図形、記号、文字、色、輝度若しくはこ
れらの組み合わせにより表して表示することを特徴とす
るフォーマット認識装置。 - 【請求項5】 請求項1記載のフォーマット認識装置に
おいて、 種類の異なる参照データを、図形、記号、文字、色、輝
度若しくはこれらの組み合わせを異ならせることにより
区別して表示することを特徴とするフォーマット認識装
置。 - 【請求項6】 請求項1記載のフォーマット認識装置に
おいて、 図形により表した帳票、行及びフィールドを、参照デー
タとして表示することを特徴とするフォーマット認識装
置。 - 【請求項7】 請求項1記載のフォーマット認識装置に
おいて、 参照データを、帳票幅、帳票高さ、帳票内の行数、帳票
内の行位置、帳票内のフィールド数、帳票内のフィール
ド位置、前記行内若しくはフィールド内の文字数、前記
行内若しくはフィールド内の文字ピッチ、前記行内若し
くはフィールド内の文字の字体、及び、前記行内若しく
はフィールド内の文字の字種のなかから選んだ一又は複
数の参照データとしたことを特徴とするフォーマット認
識装置。 - 【請求項8】 請求項1記載のフォーマット認識装置に
おいて、 第一の参照データを、帳票内の行数、帳票内の行位置、
帳票内のフィールド数、及び、帳票内のフィールド位置
のなかから選んだ一又は複数の参照データとし、 第二の参照データを、帳票内の文字の字体及び帳票内の
文字の字種のなかから選んだ一又は複数の参照データと
し、 第二の参照データを、第一の参照データの表示位置の近
傍位置若しくは第一の参照データの表示位置と重なる位
置に、表示することを特徴とするフォーマット認識装
置。 - 【請求項9】 請求項1記載のフォーマット認識装置に
おいて、 図形により表した行を、第一の参照データとして表示
し、 行内の文字の字種若しくは字体を、第二の参照データと
して表示し、 第二の参照データを、第一の参照データの表示位置の近
傍位置若しくは第一の参照データの表示位置と重なる位
置に、表示することを特徴とするフォーマット認識装
置。 - 【請求項10】 請求項1記載のフォーマット認識装置
において、 図形により表したフィールドを、第一の参照データとし
て表示し、 フィールド内の文字の字種若しくは字体を、第二の参照
データとして表示し、 第二の参照データを、第一の参照データの表示位置の近
傍位置若しくは第一の参照データの表示位置と重なる位
置に、表示することを特徴とするフォーマット認識装
置。 - 【請求項11】 請求項1記載のフォーマット認識装置
において、 参照データを、帳票フォーマット既知の帳票から予め得
た参照用イメージデータとしたことを特徴とするフォー
マット認識装置。 - 【請求項12】 請求項1記載のフォーマット認識装置
において、 帳票フォーマット未知の帳票イメージデータと当該イメ
ージデータに対応する参照データとを、重ね合わせて表
示することを特徴とするフォーマット認識装置。 - 【請求項13】 請求項1記載のフォーマット認識装置
において、 帳票フォーマット未知の帳票イメージデータと当該イメ
ージデータに対応する参照データとを、重ね合わせて表
示し、 該参照データを請求項7〜10のいずれか一項の参照デ
ータとしたことを特徴とするフォーマット認識装置。 - 【請求項14】 請求項1記載のフォーマット認識装置
において、 請求項7〜10のいずれか一項の参照データと、請求項
11の参照データとを、重ね合わせて表示することを特
徴とするフォーマット認識装置。 - 【請求項15】 請求項1記載のフォーマット認識装置
において、 フォーマット認識部が帳票フォーマットの認識結果を得
るのに用いた認識の確からしさを表す数値を、参照デー
タと対応づけて、参照データと同一の表示画面に表示す
ることを特徴とするフォーマット認識装置。 - 【請求項16】 請求項1記載のフォーマット認識装置
において、 入力デバイスをポインティングデバイスとしたことを特
徴とするフォーマット認識装置。 - 【請求項17】 帳票フォーマットの認識処理を行なう
フォーマット認識系と、読取り制御データを保持する制
御データメモリと、帳票フォーマットの認識結果に対応
した読取り制御データに従って文字の認識処理を行なう
文字認識系とを備え、 文字認識系は、帳票イメージデータから文字パタンを切
り出す文字切出し部と、切り出された文字パタンを格納
する文字パタンメモリと、文字の辞書データを保持する
文字認識辞書と、切り出された文字パタンを、文字の辞
書データと照合し、該照合結果に基づいて文字パタンを
認識する文字認識部とを備え、 フォーマット認識系を、帳票フォーマット未知の帳票イ
メージデータから、帳票フォーマットを表す罫線パタン
を抽出する罫線抽出部と、抽出された罫線パタンを格納
する罫線パタンメモリと、帳票フォーマットの辞書デー
タを保持するフォーマット認識辞書と、抽出された罫線
パタンを、帳票フォーマットの辞書データと照合し、該
照合結果に基づいて罫線パタンにより表される帳票フォ
ーマットについて一又は複数の認識結果を出力するフォ
ーマット認識部とにより構成し、既知の帳票フォーマッ
トの特徴を表す参照データを保持する参照データメモリ
と、前記帳票フォーマットの認識結果に対応した既知の
帳票フォーマットの参照データを表示する表示部と、オ
ペレータが表示された参照データに基づいて帳票フォー
マットの認識結果を決定する作業において、オペレータ
による決定結果の入力操作に対応したフォーマット決定
信号を出力する入力デバイスとを設け、 文字認識系は、フォーマット決定信号に対応する読取り
制御データに従って、文字の認識処理を行なうことを特
徴とする文字読取り装置。 - 【請求項18】 請求項17記載の文字読取り装置にお
いて、 表示部は、帳票フォーマット未知の帳票イメージデータ
と当該イメージデータの認識結果に対応する参照データ
とを、表示部の同一画面に同時に表示することを特徴と
する文字読取り装置。 - 【請求項19】 請求項17又は18記載の文字読取り
装置において、 表示部は、帳票フォーマットの複数の認識結果に対応す
る参照データを、認識の確からしさの高い順に表示する
ことを特徴とする文字読取り装置。 - 【請求項20】 請求項17記載の文字読取り装置にお
いて、 参照データメモリを、制御データメモリとし、表示部
は、参照データとして読取り制御データを表示すること
を特徴とする文字読取り装置。 - 【請求項21】 請求項17記載の文字読取り装置にお
いて、 罫線パタンにより表される帳票フォーマットの認識結果
が一つであるときは、文字認識系は、当該帳票フォーマ
ットの認識結果に対応する読取り制御データに従って文
字の認識処理を行なうことを特徴とする文字読取り装
置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06497096A JP3276555B2 (ja) | 1996-03-21 | 1996-03-21 | フォーマット認識装置及び文字読取り装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06497096A JP3276555B2 (ja) | 1996-03-21 | 1996-03-21 | フォーマット認識装置及び文字読取り装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09259222A true JPH09259222A (ja) | 1997-10-03 |
JP3276555B2 JP3276555B2 (ja) | 2002-04-22 |
Family
ID=13273424
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06497096A Expired - Fee Related JP3276555B2 (ja) | 1996-03-21 | 1996-03-21 | フォーマット認識装置及び文字読取り装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3276555B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100372588B1 (ko) * | 1999-03-01 | 2003-02-17 | 가부시키가이샤 히타치세이사쿠쇼 | 전표 처리 방법 및 시스템 |
US6778712B1 (en) | 1999-12-20 | 2004-08-17 | Fujitsu Limited | Data sheet identification device |
JP2008165506A (ja) * | 2006-12-28 | 2008-07-17 | Hitachi Computer Peripherals Co Ltd | 帳票識別装置、及び帳票識別プログラム |
JP2009025856A (ja) * | 2007-07-17 | 2009-02-05 | Hitachi Computer Peripherals Co Ltd | 帳票識別プログラム及び帳票識別装置 |
JP2009230498A (ja) * | 2008-03-24 | 2009-10-08 | Oki Electric Ind Co Ltd | 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム |
-
1996
- 1996-03-21 JP JP06497096A patent/JP3276555B2/ja not_active Expired - Fee Related
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100372588B1 (ko) * | 1999-03-01 | 2003-02-17 | 가부시키가이샤 히타치세이사쿠쇼 | 전표 처리 방법 및 시스템 |
US6625313B1 (en) | 1999-03-01 | 2003-09-23 | Hitachi, Ltd. | Business form handling method and system for carrying out the same |
KR100411651B1 (ko) * | 1999-03-01 | 2003-12-18 | 가부시키가이샤 히타치세이사쿠쇼 | 전표처리방법 및 시스템 |
KR100411650B1 (ko) * | 1999-03-01 | 2003-12-18 | 가부시키가이샤 히타치세이사쿠쇼 | 전표처리방법 및 시스템 |
US6801658B2 (en) | 1999-03-01 | 2004-10-05 | Hitachi, Ltd. | Business form handling method and system for carrying out the same |
US6885769B2 (en) | 1999-03-01 | 2005-04-26 | Hitachi, Ltd. | Business form handling method and system for carrying out the same |
US6778712B1 (en) | 1999-12-20 | 2004-08-17 | Fujitsu Limited | Data sheet identification device |
JP2008165506A (ja) * | 2006-12-28 | 2008-07-17 | Hitachi Computer Peripherals Co Ltd | 帳票識別装置、及び帳票識別プログラム |
JP2009025856A (ja) * | 2007-07-17 | 2009-02-05 | Hitachi Computer Peripherals Co Ltd | 帳票識別プログラム及び帳票識別装置 |
JP2009230498A (ja) * | 2008-03-24 | 2009-10-08 | Oki Electric Ind Co Ltd | 帳票処理方法、帳票処理プログラム、帳票処理装置、および、帳票処理システム |
Also Published As
Publication number | Publication date |
---|---|
JP3276555B2 (ja) | 2002-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100658119B1 (ko) | 문자 인식 장치 및 방법 | |
US7519226B2 (en) | Form search apparatus and method | |
US4933979A (en) | Data reading apparatus for reading data from form sheet | |
US5696841A (en) | Image processing method and apparatus for extracting vertically and horizontally written text | |
JP3294995B2 (ja) | 帳票読取装置 | |
US5164996A (en) | Optical character recognition by detecting geo features | |
EP0266140B1 (en) | Optical character recognition by forming and detecting matrices of geographical features | |
JPH08305796A (ja) | パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置 | |
US20050123199A1 (en) | Method for optical recognition of a multi-language set of letters with diacritics | |
US6549662B1 (en) | Method of recognizing characters | |
US20020051574A1 (en) | Character recognition method, program and recording medium | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JP3573945B2 (ja) | フォーマット認識装置及び文字読み取り装置 | |
JP3923474B2 (ja) | 文字読み取り装置 | |
US5119441A (en) | Optical character recognition apparatus and method using masks operation | |
JPH09319824A (ja) | 帳票認識方法 | |
JPH0773271A (ja) | 領域分割方法 | |
JP4810853B2 (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP3276554B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JP2537973B2 (ja) | 文字認識装置 | |
JP2917427B2 (ja) | 図面読取装置 | |
JP2993533B2 (ja) | 情報処理装置及び文字認識装置 | |
JPH05135204A (ja) | 文字認識装置 | |
JPH0916712A (ja) | 文書読取装置 | |
JPS61190676A (ja) | 帳票登録装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20020129 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090208 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090208 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100208 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110208 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110208 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120208 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130208 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140208 Year of fee payment: 12 |
|
LAPS | Cancellation because of no payment of annual fees |