JPH11102416A - 帳票読取方向判定装置および帳票読取方向判定方法 - Google Patents

帳票読取方向判定装置および帳票読取方向判定方法

Info

Publication number
JPH11102416A
JPH11102416A JP9262543A JP26254397A JPH11102416A JP H11102416 A JPH11102416 A JP H11102416A JP 9262543 A JP9262543 A JP 9262543A JP 26254397 A JP26254397 A JP 26254397A JP H11102416 A JPH11102416 A JP H11102416A
Authority
JP
Japan
Prior art keywords
ruled line
determination
block
determining
line items
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9262543A
Other languages
English (en)
Inventor
Yoshihiro Nagano
義博 永野
Shinichi Eguchi
真一 江口
Hideki Matsuno
秀樹 松野
Nobukazu Chiba
亘一 千葉
Katsutoshi Obara
勝利 小原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP9262543A priority Critical patent/JPH11102416A/ja
Publication of JPH11102416A publication Critical patent/JPH11102416A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 帳票に補正マーク等の特定情報を付加せず、
また帳票の読み込み時にオペレータが回転方向を指定し
なくても、帳票の読み取り方向を正確に確認できるよう
にすることを課題とする。 【解決手段】 処理システム100の制御下において、
レイアウト認識プログラム200ではレイアウト認識エ
ンジン制御部201の制御に従って、ラベリング処理部
202および罫線項目抽出処理部203により読み取ら
れた帳票のイメージから罫線項目およびブロックを抽出
し、回転方向判定処理部204により、横長,縦長の罫
線項目の割合、複数のブロックが接触する位置の関係、
ブロックとそのブロック外の文字列との位置関係、およ
び行列方向での罫線項目内の記入によるピーク位置の関
係から最終的に帳票の読み取り方向を判定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、例えば金融機関
等で使用される帳票処理装置に適用され、読み取られた
帳票の方向を判定する帳票読取方向判定装置およびその
方法であって、特に、私製伝票等のように多種多様なフ
ォーマットを有する帳票の読み取り方向を判定するため
の帳票読取方向判定装置およびその方法に関する。
【0002】
【従来の技術】近年、文字情報をイメージデータ(イメ
ージ)として読み取ってから文字認識する装置として、
光学式文字読み取り装置(OCR装置)等のイメージデ
ータ読取装置が開発され、各種産業においては、このイ
メージデータ読取装置を幅広く利用することにより、業
務の効率化等を図っている。
【0003】例えば、金融機関等における窓口業務を行
なうオペレータは、上述のイメージデータ読取装置を用
いて、帳票媒体(帳票)を効率的に処理することを通じ
て、業務の効率化を図っている。
【0004】特に、上述のような帳票処理を行なうよう
な業務の効率化を図るためには、同一種類の帳票媒体
(認識処理専用帳票)の多量処理を行なうだけでなく、
多種多様なフォーマットを有する帳票を自動的に処理す
ることが要求されている。
【0005】そこで、複数種類の帳票媒体について、イ
メージデータ読取装置を用いた帳票媒体の処理について
図15,図16,図17を参照して説明する。図15は
一般的な帳票処理装置のシステム構成を示す模式図、図
16は図15に示した帳票処理装置の動作の一例を説明
する図、そして、図17は図15に示した帳票処理装置
の動作の変形例を示す図である。
【0006】帳票処理装置1000は、図15に示した
如く、帳票についてのイメージデータを読み取るイメー
ジデータ読取装置1001、演算処理を行う電子計算機
1002、およびデータの書き込みおよび読み出しを行
うハードディスク1003より構成される。イメージデ
ータ読取装置1001は、電子計算機1002に接続さ
れ、電子計算機1002からの制御に基づいてイメージ
データの読取動作を行なう。なお、このイメージデータ
読取装置1001としては、例えばイメージスキャナや
FAXが用いられている。
【0007】また、イメージデータ読取装置1001を
制御する制御装置としての電子計算機1002は、オペ
レータからの命令,データ等を入力するキーボードある
いはマウス等の入力部(図15においてはキーボードの
み図示)1002−1,計算機本体1002−2および
データあるいは制御情報等を表示するディスプレイ10
02−3により構成されている。なお、イメージデータ
読取装置1001により読み取られたイメージデータの
文字認識処理は、電子計算機本体1002−2により行
なわれる。
【0008】さらに、1003はハードディスクであ
り、このハードディスク1003は、電子計算機100
2に接続され、例えば図16に示すように、予め帳票種
類毎に認識すべき文字データの位置情報および文字の種
類、桁数等を指定した情報(以下「定義体情報」と称
す)1003A〜1003C,…を格納する。
【0009】なお、上述のイメージデータ読取装置10
01の代わりに、図16,図17に示すような、イメー
ジデータ読取認識装置1005を用いることもできる。
このイメージ読取認識装置1005は、イメージデータ
読取装置1001と同様のイメージデータの読取動作を
行なうとともに文字認識をも行なうことができる。
【0010】このイメージデータ読取認識装置1005
を用いて、例えば図16に示すように、電気料金払込通
知書1004上に記載された文字データを認識する場合
について説明する。その際には、まず、オペレータによ
るキーボード1002−1の操作により帳票種別(この
場合は電気料金払込通知書(帳票B)1004に対応す
る定義体情報1003B)を指示する。
【0011】続いて、電子計算機1002では、ハード
ディスク1003のアクセスを通じで、指示された帳票
の定義体情報1003Bを引出してイメージデータ読取
認識装置1005に通知する。
【0012】これにより、イメージデータ読取認識装置
1005では、電子計算機1002からの制御情報とし
ての定義体情報1003Bに基づいて、イメージデータ
の読み取りと文字認識処理とを行なうことができる。
【0013】しかしながら、上述の図16に示すような
帳票を処理する手法においては、オペレータの指示によ
り読み取りたい帳票毎に定義体情報を指示する必要があ
る。この手法では、オペレータに負担がかかるほか、定
義体が多くなると指示を間違えたりする。さらに、数千
種類もの帳票を処理することが要求される場合には、オ
ペレータが指示することは現実的に困難となる。
【0014】このため、図17に示すように、帳票10
04の定められた位置1004aには、予め帳票毎に異
なった帳票を識別するためのID番号(この場合は‘0
102’)を記載することにより、上述したようにオペ
レータが帳票種別を指示することなく、自動的に帳票の
読取処理を行なうという方法が考えられている。
【0015】この方法によれば、イメージデータ読取認
識装置1005にて帳票のイメージデータを読み取る際
に、最初に定められた位置1004aに記されたID番
号を認識し、続いて認識したID番号に対応した定義体
情報(この場合は1003B)を使用することにより、
文字認識を行なうことができる。
【0016】ところが、イメージデータを読み取る際
に、イメージデータ読取装置1001やイメージデータ
読取認識装置1005等の光学的読取装置(例えば帳票
処理装置)において帳票等をセットする位置が変動する
場合がある。このような場合には、例えばハードディス
ク1003に定義体情報が予め格納されている帳票と同
一の帳票が読み取られた場合でも、文字データの領域や
図形領域等のイメージの基準点(物理原点)からの座標
が定義体情報におけるものと同一にならないため、帳票
処理装置等においては、同一のレイアウトではないと判
定される。
【0017】帳票処理装置等においては、読み取られた
イメージデータのレイアウトと定義体情報におけるレイ
アウトとを一致させてからイメージデータの文字認識を
行なわないと、文字認識処理が正常に行なわれないこと
がある。このため、まず、それぞれのイメージの基準点
を抽出してそれぞれのイメージの基準点からの座標を比
較しでレイアウトの一致の判定を行なっている。
【0018】ここで、イメージデータの基準点の抽出方
法は、以下の2つの方法が主流となっており、それらを
図18(a),(b)を参照して説明する。図18
(a),(b)は従来例によるイメージデータの基準点
の抽出方法を説明する図である。
【0019】なお、前提条件として、読み取り対象の帳
票は予め印刷された帳票であり、用紙における帳票の印
刷位置が高い精度で管理されているものとする。1つめ
の方法は、図18(a)に示すように、読み取られる帳
票の用紙端面1006と読取背景1007とが識別でき
るようなイメージデータ読取装置により帳票のイメージ
データを読み取る場合には、用紙端面1006の左上端
位置Pを基準点とするものである。
【0020】また、2つめの方法は、イメージスキャナ
やFAXにより帳票のイメージデータを読み取る場合に
は、図18(b)に示すように、読取背景1009と読
み取られた用紙端面1008とが識別できないため、予
め読み取り対象の帳票用紙に基準マークRを印刷してお
き、この基準マークRをイメージデータから抽出して基
準点とするものである。
【0021】この2つめの方法においては、予め基準点
位置が基準マークRとして印刷されているため、読取装
置に帳票をセットする位置が変動した場合でも、安定し
て基準点を抽出することが可能である利点がある。
【0022】ところが、帳票処理装置等においては、上
述の方法により基準点が正確に抽出された場合でも、イ
メージデータの読取方向が正しい方向でなければ、イメ
ージデータの文字記述方向が正しい方向とならないた
め、文字認識処理を行なうことができない。そこで、図
19を参照して読み取り方向の補正方法について説明す
る。図19は従来例によるイメージデータの回転補正処
理を説明する図である。
【0023】例えば図19に示すように、横方向で情報
が記述された振込伝票(帳票C)1010が、イメージ
データ読取装置1001により誤った方向(図19では
縦方向)から読み取られた場合には、読み取られた振込
伝票1010のイメージデータは、ディスプレイ100
2−3に符号1010Aで示すように誤った向きで表示
される。
【0024】このため、帳票処理装置等による文字認識
処理の際には、オペレータが、ディスプレイ1002−
3を目視して帳票の読み取り方向が正しいか否かを判断
する。その結果、帳票の読み取り方向が正しくない場
合、オペレータは、読み取られた帳票のイメージデータ
を時計回りに90度または180度回転させる指示をキ
ーボード1002−1から入力して、帳票のイメージデ
ータがディスプレイ1002−3に符号1010Bで示
すように正しい方向に表示させる。このように、読み取
り方向が正しくない場合には、イメージデータの回転補
正処理を行なう必要があった。
【0025】このように、従来、イメージスキャナ等で
帳票を読み込む際に、帳票の回転方向をオペレータが指
定し、その指定された方向に帳票のイメージデータを回
転させた後に、文字認識等の各種の処理が行われてい
た。あるいは、あらかじめ定められた帳票については、
その帳票上の補正マーク等の特定情報が利用され、正方
向に帳票を回転させる等の方法が採られていた。
【0026】
【発明が解決しようとする課題】ところが、上述した従
来例による帳票処理装置では、帳票上にあらかじめ補正
マーク等の特定情報を設定しておく必要があるので、企
業から金融機関への持ち込み伝票のように、帳票作成元
がシステムの運用場所とは異なる場合には、マークの設
定が困難、あるいは不可能であった。
【0027】また、オペレータが帳票の回転方向を指定
するために、あらかじめ同じ向きの帳票を揃えた後、イ
メージスキャナで読み込ませる等の運用が行われていた
ので、ミスが発生する可能性が高くなるとともに、作業
性が悪くなるという危惧があった。
【0028】この発明は、上述した従来例による問題を
解消するため、帳票に補正マーク等の特定情報を付加せ
ず、また帳票の読み込み時にオペレータが回転方向を指
定しなくても、帳票の読み取り方向を正確に確認するこ
とが可能な帳票読取方向判定装置およびその方法を提供
することを第1の目的とする。
【0029】この発明は、第1の目的に加え、正確な帳
票の読み取り方向に従って帳票のイメージを正確に補正
することが可能な帳票読取方向判定装置およびその方法
を提供することを第2の目的とする。
【0030】
【課題を解決するための手段】上述した課題を解決し、
目的を達成するため、請求項1の発明に係る帳票読取方
向判定装置は、任意のフォーマットで情報が記入された
帳票から読み取られたイメージから、該帳票に記入され
たフォーマットのレイアウトの特徴を抽出する特徴抽出
手段と、前記特徴抽出手段により抽出されたレイアウト
の特徴に基づいて前記帳票の読み取り方向を判定する判
定手段と、を備えたことを特徴とする。
【0031】この請求項1の発明によれば、帳票フォー
マットのレイアウトの特徴から帳票の読み取り方向を判
定するようにしたので、帳票に補正マーク等の特定情報
を付加した帳票を用意する必要はなく、任意のフォーマ
ットをもつ帳票が使用でき、また帳票の読み込み時にオ
ペレータが回転方向を指定した場合に生じる人為的な回
転方向の誤入力を防止することができ、これによって、
私製帳票等のように任意のフォーマットをもつ帳票であ
っても帳票の読み取り方向を正確に確認することが可能
である。
【0032】また、請求項2の発明に係る帳票読取方向
判定装置は、縦横方向に配列された罫線で囲まれた矩形
の内でこれ以上細分化できない矩形によって形成される
複数の罫線項目を有する帳票であって、該帳票を任意の
一辺から読み取って得られたイメージデータに基づいて
前記帳票を形成する罫線項目を抽出する抽出手段と、前
記抽出手段により抽出された罫線項目の形状および配列
に従って前記帳票の読み取り方向を判定する判定手段
と、を備えたことを特徴とする。
【0033】この請求項2の発明によれば、読み取られ
た帳票のイメージから罫線項目を抽出して、その罫線項
目の形状および配列から帳票の読み取り方向を判定する
ようにしたので、帳票に補正マーク等の特定情報を付加
した帳票を用意する必要はなく、どのような形状やサイ
ズの罫線項目をもつ帳票でも使用することができ、また
帳票の読み込み時にオペレータが回転方向を指定した場
合に生じる人為的な回転方向の誤入力を防止することが
でき、これによって、私製帳票等のように任意のフォー
マットをもつ帳票であっても帳票の読み取り方向を正確
に確認することが可能である。
【0034】また、請求項3の発明に係る帳票読取方向
判定装置は、縦横方向に配列された罫線で囲まれた矩形
の内でこれ以上細分化できない矩形によって形成される
複数の罫線項目を有する帳票であって、該帳票を任意の
一辺から読み取って得られたイメージデータに基づいて
前記帳票を形成する罫線項目を抽出する抽出手段と、前
記抽出手段により抽出された罫線項目の内で横長の形状
をもつ罫線項目の数に対する縦長の罫線項目の数の割合
に従って前記帳票の読み取り方向を判定する判定手段
と、を備えたことを特徴とする。
【0035】この請求項3の発明によれば、読み取られ
た帳票のイメージから罫線項目を抽出して、横長の罫線
項目と縦長の罫線項目の割合から帳票の読み取り方向を
判定するようにしたので、帳票に補正マーク等の特定情
報を付加した帳票を用意する必要はなく、縦長の罫線項
目と横長の罫線項目とが混在した帳票でも使用すること
ができ、また帳票の読み込み時にオペレータが回転方向
を指定した場合に生じる人為的な回転方向の誤入力を防
止することができ、これによって、私製帳票等のように
任意のフォーマットをもつ帳票であっても帳票の読み取
り方向を正確に確認することが可能である。
【0036】また、請求項4の発明に係る帳票読取方向
判定装置は、縦横方向に配列された罫線で囲まれた矩形
の内でこれ以上細分化できない矩形によって形成される
複数の罫線項目を有する帳票であって、該帳票を任意の
一辺から読み取って得られたイメージデータに基づい
て、前記帳票を形成する罫線項目、および罫線で囲まれ
た矩形の内でこれ以上罫線項目を結合できない矩形によ
って形成されるブロックを抽出する抽出手段と、前記抽
出手段により複数のブロックが抽出された場合にのみ、
前記複数のブロック間で矩形サイズが一番大きいブロッ
クに接触する他のブロックの接触位置を判定し、該判定
された接触位置に基づいて前記帳票の読み取り方向を判
定する判定手段と、を備えたことを特徴とする。
【0037】この請求項4の発明によれば、読み取られ
た帳票のイメージから罫線項目およびブロックを抽出し
て、複数のブロックが接触する位置関係から帳票の読み
取り方向を判定するようにしたので、複数のブロックが
存在する帳票でも使用することができ、また帳票の読み
込み時にオペレータが回転方向を指定した場合に生じる
人為的な回転方向の誤入力を防止することができ、これ
によって、私製帳票等のように任意のフォーマットをも
つ帳票であっても帳票の読み取り方向を正確に確認する
ことが可能である。
【0038】また、請求項5の発明に係る帳票読取方向
判定装置は、縦横方向に配列された罫線で囲まれた矩形
の内でこれ以上細分化できない矩形によって形成される
複数の罫線項目を有する帳票であって、該帳票を任意の
一辺から読み取って得られたイメージデータに基づい
て、前記帳票を形成する罫線項目、および罫線で囲まれ
た矩形の内でこれ以上罫線項目を結合できない矩形によ
って形成されるブロックを抽出する抽出手段と、前記イ
メージデータに基づいて前記抽出手段により抽出された
ブロック外に有効な文字列のイメージが存在するか否か
を判定し、前記有効な文字列のイメージが存在する場合
に前記抽出手段により抽出されたブロックと前記有効な
イメージとの位置関係に従って前記帳票の読み取り方向
を判定する判定手段と、を備えたことを特徴とする。
【0039】この請求項5の発明によれば、読み取られ
た帳票のイメージから罫線項目およびブロックを抽出し
て、ブロックとそのブロックの外に存在する文字列との
位置関係から帳票の読み取り方向を判定するようにした
ので、ブロックがひとつだけ存在する帳票でもブロック
外に文字列がある帳票であれば使用可能となり、また帳
票の読み込み時にオペレータが回転方向を指定した場合
に生じる人為的な回転方向の誤入力を防止することがで
き、これによって、私製帳票等のように任意のフォーマ
ットをもつ帳票であっても帳票の読み取り方向を正確に
確認することが可能である。
【0040】また、請求項6の発明に係る帳票読取方向
判定装置は、請求項3〜5のいずれか一つの発明におい
て、前記判定手段は、前記イメージデータに基づいて前
記抽出手段により抽出された罫線項目の行列方向に向か
って前記各罫線項目内の記入の有無をカウントして各行
列の合計カウント値を求めるカウント手段と、前記カウ
ント手段により求められた前記各行列の合計カウント値
に基づいて行方向,列方向それぞれのピーク位置を判定
するピーク位置判定手段と、を有し、判定の際に、前記
ピーク位置判定手段により判定された行方向のピーク位
置と列方向のピーク位置との関係を加味することを特徴
とする。
【0041】この請求項6の発明によれば、読み取り方
向を判定する際に、さらに、行列方向での罫線項目内の
記入の有無をカウントして行方向での記入のピーク位置
と列方向での記入のピーク位置との関係を加味するよう
にしたので、一般的な帳票によくある第1行および/ま
たは第1列にあらかじめ記入される項目名の存在からも
読み取り方向の判定に確実性を与えることが可能であ
る。
【0042】また、請求項7の発明に係る帳票読取方向
判定装置は、請求項6の発明において、前記判定手段
は、前記ピーク位置判定手段により行方向と列方向との
いずれか一方にしかピーク位置が判定されなかった場
合、罫線で囲まれた矩形の内でこれ以上罫線項目を結合
できない矩形によって形成されるブロックにおいて前記
判定されたピーク位置がくる辺側を前記帳票の正位置で
の上辺側として判定に加味することを特徴とする。
【0043】請求項6の発明は、この請求項7の発明の
ように、行列のいずれか一方にしかピーク位置がない場
合にブロック上でピーク位置がくる辺側を帳票の正位置
での上辺側として判定に加味するようにしてもよい。
【0044】また、請求項8の発明に係る帳票読取方向
判定装置は、請求項6の発明において、前記判定手段
は、前記ピーク位置判定手段により行方向と列方向との
両方にピーク位置が判定された場合、罫線で囲まれた矩
形の内でこれ以上罫線項目を結合できない矩形によって
形成されるブロックにおいて前記判定されたピーク位置
がくる辺側を前記帳票の正位置での上辺側もしくは左辺
側として判定に加味することを特徴とする。
【0045】請求項6の発明は、この請求項8の発明の
ように、行列の両方にピーク位置がある場合にブロック
上でピーク位置がくる辺側を帳票の正位置での上辺側も
しくは左辺側として判定に加味するようにしてもよい。
【0046】また、請求項9の発明に係る帳票読取方向
判定装置は、縦横方向に配列された罫線で囲まれた矩形
の内でこれ以上細分化できない矩形によって形成される
複数の罫線項目を有する帳票であって、該帳票を任意の
一辺から読み取って得られたイメージデータに基づい
て、前記帳票を形成する罫線項目、および罫線で囲まれ
た矩形の内でこれ以上罫線項目を結合できない矩形によ
って形成されるブロックを抽出する抽出手段と、前記抽
出手段により抽出された罫線項目の内で横長の形状をも
つ罫線項目の数に対する縦長の罫線項目の数の割合に従
って前記帳票の読み取り方向を判定する第1判定手段
と、前記抽出手段により複数のブロックが抽出された場
合にのみ、前記複数のブロック間で矩形サイズが一番大
きいブロックに接触する他のブロックの接触位置を判定
し、該判定された接触位置に基づいて前記帳票の読み取
り方向を判定する第2判定手段と、前記イメージデータ
に基づいて前記抽出手段により抽出されたブロック外に
有効な文字列のイメージが存在するか否かを判定し、前
記有効な文字列のイメージが存在する場合に前記抽出手
段により抽出されたブロックと前記有効なイメージとの
位置関係に従って前記帳票の読み取り方向を判定する第
3判定手段と、前記イメージデータに基づいて前記抽出
手段により抽出された罫線項目の行列方向に向かって前
記各罫線項目内の記入の有無をカウントして行方向,列
方向それぞれのピーク位置を判定し、その判定された行
方向のピーク位置と列方向のピーク位置との関係から前
記帳票の読み取り方向を判定する第4判定手段と、前記
第1〜第4判定手段の内の少なくとも2つ以上の組み合
わせにより得られた判定結果を加重合計して最終的に前
記帳票の読み取り方向を判定する判定手段と、を備えた
ことを特徴とする。
【0047】この請求項9の発明によれば、読み取られ
た帳票のイメージから罫線項目およびブロックを抽出し
て、横長,縦長の罫線項目の割合、複数のブロックが接
触する位置の関係、ブロックとそのブロック外の文字列
との位置関係、および行列方向での罫線項目内の記入に
よるピーク位置の関係の2つ以上の組み合わせで最終的
に帳票の読み取り方向を判定するようにしたので、ひと
つの判定基準だけにとらわれず、複数の判定基準により
判定結果の偏りが分散され、これによって、より正確な
帳票の読み取り方向を確認することが可能である。
【0048】また、請求項10の発明に係る帳票読取方
向判定装置は、請求項1〜9のいずれか一つの発明にお
いて、さらに、前記判定手段により判定された前記帳票
の読み取り方向に従って前記帳票のイメージデータを正
位置に回転補正するイメージ回転手段を有したことを特
徴とする。
【0049】この請求項10の発明によれば、帳票の読
み取り方向に従って帳票のイメージデータを正位置に回
転補正するようにしたので、請求項1〜9のいずれかの
発明により得られた帳票の読み取り方向に従って自動的
に帳票のイメージを正確に補正することが可能である。
【0050】また、請求項11の発明に係る帳票読取方
向判定方法は、縦横方向に配列された罫線で囲まれた矩
形の内でこれ以上細分化できない矩形によって形成され
る複数の罫線項目を有する帳票であって、該帳票を任意
の一辺から読み取って得られたイメージデータに基づい
て前記帳票を形成する罫線項目を抽出する第1工程と、
前記第1工程により抽出された罫線項目の内で横長の形
状をもつ罫線項目の数に対する縦長の罫線項目の数の割
合に従って前記帳票の読み取り方向を判定する第2工程
と、を含んだことを特徴とする。
【0051】この請求項11の発明によれば、読み取ら
れた帳票のイメージから罫線項目を抽出して、横長の罫
線項目と縦長の罫線項目の割合から帳票の読み取り方向
を判定する工程にしたので、帳票に補正マーク等の特定
情報を付加した帳票を用意する必要はなく、縦長の罫線
項目と横長の罫線項目とが混在した帳票でも使用するこ
とができ、また帳票の読み込み時にオペレータが回転方
向を指定した場合に生じる人為的な回転方向の誤入力を
防止することができ、これによって、私製帳票等のよう
に任意のフォーマットをもつ帳票であっても帳票の読み
取り方向を正確に確認することが可能である。
【0052】また、請求項12の発明に係る帳票読取方
向判定方法は、縦横方向に配列された罫線で囲まれた矩
形の内でこれ以上細分化できない矩形によって形成され
る複数の罫線項目を有する帳票であって、該帳票を任意
の一辺から読み取って得られたイメージデータに基づい
て、前記帳票を形成する罫線項目、および罫線で囲まれ
た矩形の内でこれ以上罫線項目を結合できない矩形によ
って形成されるブロックを抽出する第1工程と、前記第
1工程により複数のブロックが抽出された場合にのみ、
前記複数のブロック間で矩形サイズが一番大きいブロッ
クに接触する他のブロックの接触位置を判定し、該判定
された接触位置に基づいて前記帳票の読み取り方向を判
定する第2工程と、を含んだことを特徴とする。
【0053】この請求項12の発明によれば、読み取ら
れた帳票のイメージから罫線項目およびブロックを抽出
して、複数のブロックが接触する位置関係から帳票の読
み取り方向を判定する工程にしたので、複数のブロック
が存在する帳票でも使用することができ、また帳票の読
み込み時にオペレータが回転方向を指定した場合に生じ
る人為的な回転方向の誤入力を防止することができ、こ
れによって、私製帳票等のように任意のフォーマットを
もつ帳票であっても帳票の読み取り方向を正確に確認す
ることが可能である。
【0054】また、請求項13の発明に係る帳票読取方
向判定方法は、縦横方向に配列された罫線で囲まれた矩
形の内でこれ以上細分化できない矩形によって形成され
る複数の罫線項目を有する帳票であって、該帳票を任意
の一辺から読み取って得られたイメージデータに基づい
て、前記帳票を形成する罫線項目、および罫線で囲まれ
た矩形の内でこれ以上罫線項目を結合できない矩形によ
って形成されるブロックを抽出する第1工程と、前記イ
メージデータに基づいて前記第1工程により抽出された
ブロック外に有効な文字列のイメージが存在するか否か
を判定し、前記有効な文字列のイメージが存在する場合
に前記第1工程により抽出されたブロックと前記有効な
イメージとの位置関係に従って前記帳票の読み取り方向
を判定する第2工程と、を含んだことを特徴とする。
【0055】この請求項13の発明によれば、読み取ら
れた帳票のイメージから罫線項目およびブロックを抽出
して、ブロックとそのブロックの外に存在する文字列と
の位置関係から帳票の読み取り方向を判定する工程にし
たので、ブロックがひとつだけ存在する帳票でもブロッ
ク外に文字列がある帳票であれば使用可能となり、また
帳票の読み込み時にオペレータが回転方向を指定した場
合に生じる人為的な回転方向の誤入力を防止することが
でき、これによって、私製帳票等のように任意のフォー
マットをもつ帳票であっても帳票の読み取り方向を正確
に確認することが可能である。
【0056】また、請求項14の発明に係る帳票読取方
向判定方法は、請求項11〜13のいずれか一つの発明
において、前記第2工程は、前記イメージデータに基づ
いて前記抽出手段により抽出された罫線項目の行列方向
に向かって前記各罫線項目内の記入の有無をカウントし
て各行列の合計カウント値を求める第3工程と、前記第
3工程により求められた前記各行列の合計カウント値に
基づいて行方向,列方向それぞれのピーク位置を判定す
る第4工程と、を含み、判定の際に、前記第4工程によ
り判定された行方向のピーク位置と列方向のピーク位置
との関係を加味することを特徴とする。
【0057】この請求項14の発明によれば、読み取り
方向を判定する際に、さらに、行列方向での罫線項目内
の記入の有無をカウントして行方向での記入のピーク位
置と列方向での記入のピーク位置との関係を加味する工
程にしたので、一般的な帳票によくある第1行および/
または第1列にあらかじめ記入される項目名の存在から
も読み取り方向の判定に確実性を与えることが可能であ
る。
【0058】また、請求項15の発明に係る帳票読取方
向判定方法は、請求項14の発明において、前記第2工
程は、前記第4工程により行方向と列方向とのいずれか
一方にしかピーク位置が判定されなかった場合、罫線で
囲まれた矩形の内でこれ以上罫線項目を結合できない矩
形によって形成されるブロックにおいて前記判定された
ピーク位置がくる辺側を前記帳票の正位置での上辺側と
して判定に加味することを特徴とする。
【0059】請求項14の発明は、この請求項15の発
明のように、行列のいずれか一方にしかピーク位置がな
い場合にブロック上でピーク位置がくる辺側を帳票の正
位置での上辺側として判定に加味するようにしてもよ
い。
【0060】また、請求項16の発明に係る帳票読取方
向判定方法は、請求項14の発明において、前記第2工
程は、前記第4工程により行方向と列方向との両方にピ
ーク位置が判定された場合、罫線で囲まれた矩形の内で
これ以上罫線項目を結合できない矩形によって形成され
るブロックにおいて前記判定されたピーク位置がくる辺
側を前記帳票の正位置での上辺側もしくは左辺側として
判定に加味することを特徴とする。
【0061】請求項14の発明は、この請求項16の発
明のように、行列の両方にピーク位置がある場合にブロ
ック上でピーク位置がくる辺側を帳票の正位置での上辺
側もしくは左辺側として判定に加味するようにしてもよ
い。
【0062】また、請求項17の発明に係る帳票読取方
向判定方法は、縦横方向に配列された罫線で囲まれた矩
形の内でこれ以上細分化できない矩形によって形成され
る複数の罫線項目を有する帳票であって、該帳票を任意
の一辺から読み取って得られたイメージデータに基づい
て、前記帳票を形成する罫線項目、および罫線で囲まれ
た矩形の内でこれ以上罫線項目を結合できない矩形によ
って形成されるブロックを抽出する第1工程と、前記第
1工程により抽出された罫線項目の内で横長の形状をも
つ罫線項目の数に対する縦長の罫線項目の数の割合に従
って前記帳票の読み取り方向を判定する第2工程手段
と、前記第1工程により複数のブロックが抽出された場
合にのみ、前記複数のブロック間で矩形サイズが一番大
きいブロックに接触する他のブロックの接触位置を判定
し、該判定された接触位置に基づいて前記帳票の読み取
り方向を判定する第3工程と、前記イメージデータに基
づいて前記第1工程により抽出されたブロック外に有効
な文字列のイメージが存在するか否かを判定し、前記有
効な文字列のイメージが存在する場合に前記抽出手段に
より抽出されたブロックと前記有効なイメージとの位置
関係に従って前記帳票の読み取り方向を判定する第4工
程と、前記イメージデータに基づいて前記第1工程によ
り抽出された罫線項目の行列方向に向かって前記各罫線
項目内の記入の有無をカウントして行方向,列方向それ
ぞれのピーク位置を判定し、その判定された行方向のピ
ーク位置と列方向のピーク位置との関係から前記帳票の
読み取り方向を判定する第5工程と、前記第2〜第5工
程の内の少なくとも2つ以上の組み合わせにより得られ
た判定結果を加重合計して最終的に前記帳票の読み取り
方向を判定する第6工程と、を含んだことを特徴とす
る。
【0063】この請求項17の発明によれば、読み取ら
れた帳票のイメージから罫線項目およびブロックを抽出
して、横長,縦長の罫線項目の割合、複数のブロックが
接触する位置の関係、ブロックとそのブロック外の文字
列との位置関係、および行列方向での罫線項目内の記入
によるピーク位置の関係の2つ以上の組み合わせで最終
的に帳票の読み取り方向を判定する工程にしたので、ひ
とつの判定基準だけにとらわれず、複数の判定基準によ
り判定結果の偏りが分散され、これによって、より正確
な帳票の読み取り方向を確認することが可能である。
【0064】また、請求項18の発明に係る帳票読取方
向判定方法は、請求項11〜17のいずれか一つの発明
において、さらに、前記判定された前記帳票の読み取り
方向に従って前記帳票のイメージデータを正位置に回転
補正する工程を含んだことを特徴とする。
【0065】この請求項18の発明によれば、帳票の読
み取り方向に従って帳票のイメージデータを正位置に回
転補正する工程にしたので、請求項11〜17のいずれ
かの発明により得られた帳票の読み取り方向に従って自
動的に帳票のイメージを正確に補正することが可能であ
る。
【0066】
【発明の実施の形態】以下に添付図面を参照して、この
発明の帳票読取方向判定装置および帳票読取方向判定方
法に係る好適な実施の形態を詳細に説明する。
【0067】まず、構成について説明する。図1はこの
発明の一実施の形態にかかる帳票処理装置の全体構成を
示す機能ブロック図である。ここで、図1に示す帳票処
理装置30は、私製伝票等のように多種多様なフォーマ
ットを有する帳票から読み取ったイメージデータ(イメ
ージ)に基づいて、この情報の認識を行なうものであ
る。
【0068】この帳票処理装置30は、例えば金融機関
の各支店(営業店)毎に設置されたクライアントと、地
区センタに設置されたサーバとが、交換回線等を介して
接続されることにより構成され、客営業店における帳票
処理を地区センタのサーバにより一括して行なうシステ
ムに適用可能である。
【0069】この帳票処理装置30は、上記システムに
おいて、帳票のイメージデータのレイアウトを解析する
ことにより処理対象の帳票のフォーマットを認識し、こ
の帳票のフォーマットの認識結果に基づいて帳票の文字
認識を実施する。これにより、帳票処理装置専用に作成
された帳票だけでなく、任意のフォーマットで情報が記
入された帳票の認識処理を行なうことができる。ここ
で、帳票処理装置30は、機能的には図1に示すよう
に、レイアウト認識処理ブロック16,文字認識処理ブ
ロック17およびオペレータ確認/修正処理ブロック1
8を備えている。
【0070】レイアウト認識処理ブロック16は、イメ
ージデータ読取装置により読み取られたイメージデータ
19のレイアウト認識処理を行なうブロックであり、解
析前処理部1,レイアウト解析処理部2,レイアウト照
合処理部3およびレイアウト編集処理部4を備えてい
る。
【0071】ここで、解析前処理部1は、レイアウト解
析処理に先立って、レイアウトの変動要因を少なくして
解析精度を高めるものである。この解析前処理部1は、
認識対象イメージデータ19の形式変換後に、解析処理
用の低密度イメージの作成を行うとともに、解析処理時
に精度低下の要因となるイメージデータ上のゴミ等の除
去を行う。
【0072】また、レイアウト解析処理部2は、解析用
辞書13を参照して、読み取ったイメージデータからレ
イアウトの特徴である罫線項目および項目データを抽出
して、レイアウトの構成を解析し、この抽出した罫線項
目および項目データによりレイアウトを論理的に表現す
る。
【0073】すなわち、レイアウト解析処理部2は、読
み取ったイメージデータから、帳票固有の特徴を抽出
し、この特徴により認識すべき情報の存在する位置を特
定する手段として機能する。
【0074】具体的には、レイアウト解析処理部2は、
認識対象イメージのレイアウトを解析して、レイアウト
を構成している各種の構成要素(罫線項目および項目デ
ータ)をレイアウト特徴として抽出する。さらに、この
レイアウト解析処理部2は、後段のレイアウト照合処理
部3でのレイアウト照合処理時に登録済レイアウト情報
を検索するために、この抽出されたレイアウト特徴から
レイアウトの大まかな制約条件であるレイアウトのキー
情報を作成する。
【0075】このレイアウト解析処理部2は、イメージ
のレイアウトの特徴を抽出し、その抽出されたレイアウ
トの特徴に基づいてレイアウトの構成を解析する。ま
た、レイアウトの特徴抽出では、罫線の抽出や罫線項目
の抽出等が実施されるとともに、レイアウト解析すなわ
ち表構造解析が実施される。
【0076】ここで、レイアウトが罫線により構成され
る表構造を有している場合には、罫線抽出処理でレイア
ウトの罫線から形成される最小矩形である罫線項目が抽
出され、抽出された罫線項目に基づいて、表構造解析処
理で罫線項目により構成される表構造が解析されるよう
になっている。
【0077】また、レイアウトが罫線を持たない無罫線
表構造を有している場合には、罫線項目抽出処理でレイ
アウトの項目データが抽出され、抽出されたレイアウト
の項目データに基づいて、表構造解析処理で無罫線表構
造が解析されるようになっている。
【0078】さらに、レイアウト解析処理部2が罫線項
目や項目データを抽出してから、レイアウトの論理的な
原点(論理原点)を抽出するように構成されている。具
体的には、レイアウト解析処理部2においては、ラベリ
ング処理によるラベル画像の作成,レイアウト照合用の
帳票イメージの論理原点および斜度情報の抽出,罫線デ
ータの抽出と罫線項目により構成される表構造の解析,
項目データの抽出と無罫線表時の項目表構造の解析およ
び見出し領域の決定と見出し項目の認識,対応する項目
データの決定(見出し解析処理)、が行なわれる。
【0079】なお、ラベリング処理によるラベル画像の
作成処理は、入力されたイメージデータ(2値画像デー
タ)から連結成分(2値画像において1つに繋がった画
像の成分)を算出して、冬連結成分母にラベルを付けた
ラベル画像を作成する処理のことである。なお、このラ
ベリング処理については、例えば「連結領域の抽出装置
および方法」(特開平08−55219号)が公知であ
る。
【0080】また、罫線項目の抽出処理は、罫線に囲ま
れた文字や図形等のデータから罫線部分を抽出して、罫
線部分とデータ部分とを分離する処理のことである。な
お、この罫線項目の抽出処理については、例えば「画像
抽出方式」(特開平06−309498号)が公知であ
る。
【0081】さらに、見出し解析処理は、イメージ中の
見出し領域(見出し項目)を決定して、この見出し領域
中の見出し項目情報を認識して、対応する項目データを
決定するものである。
【0082】すなわち、この実施の形態においては、レ
イアウト解析処理部2において見出し項目および見出し
項目と対応する項目データを識別することにより、文字
認識処理ブロック17において見出し項目の文字認識処
理を行なうことなく直ちに項目データの文字認識を行な
えるようにしている。
【0083】ところで、レイアウト照合処理部3は、レ
イアウト解析処理部2で抽出されたレイアウトの特徴
(罫線項目および項目データ)を制約検索条件として、
レイアウトデータベース(レイアウトDB)14から候
補レイアウトを検索する。さらに、このレイアウト照合
処理部3は、一致している候補レイアウトがあるかどう
かを照合して、レイアウト解析処理部2で特定された位
置でのイメージを認識し、特定された位置における情報
を判別する。
【0084】ここで、レイアウトDB14は、候補レイ
アウト情報を記憶している候補レイアウト記憶部であ
り、この実施の形態においては、候補レイアウト情報と
して圧縮された候補レイアウト情報を記憶している。な
お、このときのレイアウト情報の圧縮処理については、
後述にて詳細に説明する。
【0085】また、レイアウトDB14には、レイアウ
ト解析処理部2でのレイアウト解析結果を補正するため
のレイアウト補正情報が格納されている。この実施の形
態においては、後述するレイアウト編集処理部4におい
て、このレイアウト補正情報を用いでレイアウト解析結
果を補正することにより、その後の処理を高い精度で行
なえるようになっている。
【0086】さらに、レイアウトDB14の内容は、後
述するように、候補レイアウト情報を、レイアウト認識
処理ブロック16やオペレータ確認/修正処理ブロック
18での処理結果に基づいて学習,更新されるようにな
っており、これにより、オペレータ等による候補レイア
ウト情報のレイアウトDB14への登録操作を不要とし
て操作の簡素化を図っている。
【0087】また、レイアウト照合処理部3は、レイア
ウト解析処理部2で抽出された論理原点を基準にして、
一致している候補レイアウトがあるかどうかを照合する
ようにしている。
【0088】すなわち、レイアウト照合処理部3は、レ
イアウト解析処理部2で作成されたレイアウトキー情報
を使用して、レイアウトDB14に格納されているレイ
アウト情報を検索照合し、一致するレイアウト情報を取
得するものである。
【0089】また、上述のレイアウト照合処理部3は、
レイアウトの検索照合を行なう際には、まず大まかな制
約条件であるレイアウトキー情報を制約条件としてレイ
アウトDB14を検索し、検索の結果得られた複数の候
補レイアウトに対して、更に詳細な照合を行うことによ
り一致するレイアウトを決定する。
【0090】具体的には、レイアウト照合処理部3にお
いては、候補レイアウトに対する詳細な照合処理の際
に、制約条件の大まかなものから順に、罫線項目ビット
マトリクスの照合,罫線項目位置と罫線項目属性の詳細
な照合,項目デ一夕位置の照合,見出し位置と見出し内
容の照合および領域イメージ(ユニークイメージ)の特
徴デ一夕照合、が行われる。
【0091】ここで、罫線項目ビットマトリクスの照合
処理とは、レイアウト解析処理部2で抽出されたレイア
ウトの特徴を圧縮処理し、この圧縮したレイアウトの特
徴を制約検索条件として、レイアウトDB14から圧縮
した候補レイアウトを検索することにより、一致してい
る候補レイアウトがあるかどうかを照合するものであ
る。
【0092】すなわち、この実施の形態においては、レ
イアウトDB14が圧縮した候補レイアウト情報を記憶
して、レイアウト照合処理蔀3において圧縮処理したレ
イアウト情報を作成して圧縮したレイアウト情報どうし
を照合することにより、レイアウト照合処理の高速化を
図っているのである。
【0093】さらに、レイアウト編集処理部4は、レイ
アウト照合処理部3でレイアウトDB14を検索照合し
た結果、レイアウトDB14に一致するレイアウトが存
在する場合には、前述のごとく、レイアウトDB14か
ら取得したレイアウト補正情報に基づいてレイアウト解
析結果を補正した後に、補正されたレイアウト情報をレ
イアウト認識結果20として出力する。
【0094】なお、レイアウト補正情報を用いた補正内
容は、見出し位置と見出し内容の補正と、見出しにリン
クする項目データ位置および項目データ属性の補正であ
る。
【0095】また、レイアウト編集処理部4は、レイア
ウト照合処理部3でレイアウトDB14を検索照合した
結果、レイアウトDB14に一致するレイアウトが存在
しない場合には、新規レイアウトとして、レイアウト解
析結果をそのままレイアウト情報(レイアウト認識結果
20)として出力する。
【0096】ところで、文字認識処理ブロック17は、
レイアウト認識処理ブロック16からのレイアウト認識
結果20の文字認識処理を行なうブロックであり、文字
認識用定義体作成部5,文字認識処理部6および知識処
理部7を備えている。
【0097】ここで、文字認識用定義体作成部5は、レ
イアウト認識結果20として出力されるレイアウト情報
をもとに、文字認識処理部6で使用する文字認識対象の
項目データ位置と項目データ属性を定義した文字認識用
定義体(一時定義体)21を作成するものである。
【0098】レイアウト認識結果20の項目データ情報
は、解析対象イメージの左上端からの絶対座標で出力す
るが、イメージ読み取り時の用紙位置の変動により、解
析対象イメージの左上端が常に一定の位置になるとは限
らない。このため、文字認識用定義体処理部5では、解
析対象イメージに合わせてその都度、文字認識用定義体
21を動的に作成する。
【0099】また、文字認識処理部6は、文字認識定義
体作成処理部5で、レイアウト情報より作成された文字
認識用定義体21を使用して、文字認識対象の項目デー
タについて文字認識処理を行ない、認識結果のコードデ
ータを取得する。
【0100】さらに、知識処理部7は、文字認識処理部
6の認識結果コードデータを、認識結果の補正情報を記
録した知識データベース(知識DB)15を参照しで補
正し、文字認識結果22としで出力する。
【0101】そして、オペレータ確認/修正処理ブロッ
ク18は、レイアウト認識結果20および文字認識結果
22が、端末装置(例えば図1におけるクライアント1
0)に表示されて、オペレータによりイメージデータの
処理結果の確認および修正処理が行なわれるブロックで
ある。このオペレータ確認/修正処理ブロック18は、
レイアウト画面表示処理部8および文字認識結果画面表
示処理部9を備えている。
【0102】ここで、レイアウト画面表示処理部8は、
オペレータによるレイアウト認識結果20および文字認
識結果22の修正および確認のため、レイアウト認識結
果20のレイアウト情報をもとに、認識対象イメージと
見出し位置や見出し内容および対応する項目位置等の解
析結果をクライアント10のディスプレイに表示する。
【0103】この実施の形態においては、従来の修正お
よび確認処理を拡張して、認識結果のコードデータと、
対応する帳票イメージ上の見出し内容や項目データとを
リンクしてクライアント10のディスプレイに表示する
ことにより、レイアウト情報の修正および確認処理を行
えるようになっている。
【0104】また、文字認識結果画面表示処理部9は、
レイアウト画面表示処理部8の表示に合わせて、文字認
識対象イメージの認識項目に対応する文字認識結果のコ
ードデータを画面表示する。
【0105】さらに、クライアント10においては、デ
ィスプレイ表示された認識対象イメージと対応するレイ
アウト認識結果20や文字認識結果22がオペレータに
より確認され、必要に応じでレイアウト認識結果20お
よび文字認識結果22の修正が行なわれる。
【0106】なお、図1に示す帳票処理装置30は、上
述したレイアウト認識処理ブロック16,文字認識処理
ブロック17およびオペレータ確認/修正処理ブロック
18のほかに、レイアウト情報作成処理部11および知
識ログ情報作成処理部12も備えている。
【0107】ここで、レイアウトログ情報作成処理部1
1は、レイアウト認識結果20のレイアウト情報に、オ
ペレータによる修正内容を補正データとして付加してレ
イアウトDB学習情報25を作成することにより、レイ
アウトDB14に格納されるレイアウト補正情報を作成
する。なお、作成されたレイアウト補正情報は、補正内
容が判断された上、レイアウトDB14に学習登録され
る。
【0108】また、レイアウトログ情報作成処理部11
は、レイアウト認識結果20のレイアウト情報に、オペ
レータによる修正内容を補正データとして付加して解析
用辞書学習情報24を作成する。その作成された解析用
辞書学習情報24は、補正内容が判断された上、解析用
辞書13に学習登録される。
【0109】さらに、知識ログ情報作成処理部12は、
文字認識結果22のコートデータに、オペレータによる
修正内容を補正データとして付加して知識DB15用の
知識学習情報23を作成する。その作成された学習デー
タは、知識DB15に学習登録される。
【0110】上述の構成により、この発明の一実施の形
態にかかる帳票処理装置30においては、任意のフォー
マットを有する帳票のイメージデータ19が読み取られ
ると、このイメージデータ19のレイアウトが解析され
ることにより処理対象の帳票のフォーマットが認識さ
れ、この帳票のフォーマットの認識結果に基づいて帳票
の文字認識が行なわれる。そして、レイアウト認識結果
20および文字認識結果22は、オペレータにより確認
され、必要に応じて修正される。
【0111】つぎに、帳票処理装置30において、帳票
の読み取り方向を判定する帳票読取方向判定装置につい
て具体的に説明する。図2はこの発明の一実施の形態に
よる帳票処理装置に適用される帳票読取方向判定装置の
構成を機能的に示す機能ブロック図である。
【0112】図2に示した帳票読取方向判定装置は、装
置全体の制御を行う処理システム100およびこの処理
システム100の制御に従って帳票のレイアウトを認識
する機能を果たすためのレイアウト認識プログラム20
0に加えて、上述したレイアウト認識を支援するデバイ
スとして、データをキー入力するためのキーボード30
0、帳票などのイメージを読み取るためのイメージスキ
ャナ400、各種データの書き込みおよび読み出しを行
うためのハードディスク500および各種データを可視
表示するためのディスプレイ600より構成される。こ
の図2に示した帳票読取方向判定装置は、図1に示した
レイアウト認識処理ブロック16の内のレイアウト解析
処理部2を具体的に実現するための構成を示している。
【0113】処理システム100は、レイアウト認識プ
ログラム200を使用するアプリケーションプログラム
101、このアプリケーションプログラム101を動作
させるオペレーティングシステム(OS)102、この
OS102の制御に従ってI/Oデバイス群104を制
御するデバイスドライバ103、および、このデバイス
ドライバ103の制御で各種デバイス(キーボード30
0,イメージスキャナ400,ハードディスク500お
よびディスプレイ600)の入出力を制御するI/Oド
ライバ群104より構成される。この処理システム10
0は、図示せぬが、各種のプログラム実行中のワークエ
リアとして使用するRAMを備えている。
【0114】レイアウト認識プログラム200は、レイ
アウト認識エンジン制御部201、ラベリング処理部2
02、罫線項目抽出処理部203、回転方向判定処理部
204、イメージ回転処理部205、レイアウト解析処
理部206、認識項目抽出処理部207、および文字認
識処理部208より構成される。
【0115】レイアウト認識エンジン制御部201は、
レイアウト認識全体の処理を制御する機能を果たす部分
である。ラベリング処理部202は、レイアウト認識エ
ンジン制御部201から読み取られた帳票のイメージデ
ータを受け取り、ラベリング処理を施す機能を果たす部
分である。ここで、ラベリング処理とは、イメージデー
タに対してその黒画素の連結する部分を同一のラベルと
して同一番号を与える処理をいう。以下に、このラベリ
ング処理で得られた情報をラベリング情報とする。
【0116】罫線項目抽出処理部203は、ラベリング
処理部202で得られたラベリング情報に基づいて罫線
項目情報およびブロック情報を抽出する機能を果たす部
分である。この罫線項目抽出処理部203で得られた罫
線項目情報およびブロック情報はレイアウト認識エンジ
ン制御部201に送出される。
【0117】ここで、罫線項目情報とは、ラベリング情
報から罫線項目に相当すると判断された罫線項目の情報
をいう。なお、罫線項目の詳細な定義として、罫線項目
を罫線で囲まれた矩形の内でこれ以上細分化できない矩
形と定義する。また、ブロック情報とは、ラベリング情
報から得られた罫線項目を結合してこれ以上矩形を形成
できない範囲の矩形すなわちブロックの情報をいう。
【0118】回転方向判定処理部204は、罫線項目抽
出処理部203で得られた罫線項目情報およびブロック
情報に基づいて読み取られた帳票について正方向からの
回転方向(時計方向に0度、90度、180度、およ
び、270度の内のいずれか一つ)を判定する機能を果
たす部分である。この回転方向判定処理部204で得ら
れた判定結果はレイアウト認識エンジン制御部201に
送出される。
【0119】イメージ回転処理部205は、回転方向判
定処理部204で得られた読み取り帳票の回転方向に応
じてイメージデータを正位置に回転させ、帳票が正方向
を向くように方向の補正を行う機能を果たす部分であ
る。このイメージ回転処理部205のイメージ回転処理
で得られたイメージデータは、回転済みのフラグを付加
されて、レイアウト認識エンジン制御部201に送出さ
れる。
【0120】レイアウト解析処理部206は、レイアウ
ト解析処理部2に相当し、罫線項目抽出処理部203で
得られた罫線項目情報およびブロック情報に基づいて帳
票レイアウトの解析処理を行う機能を果たす部分であ
る。このレイアウト解析処理部206で得られた解析結
果すなわちレイアウト解析情報は、レイアウト認識エン
ジン制御部201に送出される。
【0121】認識項目抽出処理部207は、帳票のイメ
ージデータ、罫線項目抽出処理部203で得られた罫線
項目情報、およびレイアウト解析処理部206で得られ
たレイアウト解析情報に基づいて文字認識をすべき領域
を表す認識項目情報を抽出する機能を果たす部分であ
る。この認識項目抽出処理部207で得られた認識項目
情報は、レイアウト認識エンジン制御部201に送出さ
れる。
【0122】文字認識処理部208は、帳票のイメージ
データおよび認識項目抽出処理部207で得られた認識
項目情報に基づいて文字認識処理を行う機能を果たす部
分である。この文字認識処理部208で得られた文字認
識結果は、レイアウト認識エンジン制御部201に送出
される。
【0123】また、レイアウト認識エンジン制御部20
1は、上述した回転後のイメージデータ、レイアウト解
析情報、認識項目情報、および文字認識結果を処理結果
としてアプリケーションプログラム101に送出して、
帳票読取方向判定の処理を終了する。
【0124】なお、レイアウト認識エンジン制御部20
1は、そのほかに、図1に示したレイアウト照合処理部
3およびレイアウト編集処理部4についての制御も受け
持つが、帳票読取方向判定装置としては上述した機能ブ
ロックとなる。
【0125】つぎに、上述した帳票読取方向判定装置で
使用する帳票のフォーマットの種類について図3〜図5
を参照して説明する。図3〜図5は帳票のフォーマット
の種類を示す図である。
【0126】図3において、Aは帳票の一種である振り
込み依頼書を示している。すなわち、この振り込み依頼
書Aは、罫線によって5行4列に区分される罫線項目で
ブロックを構成した主表aで構成される。この振り込み
依頼書Aの場合、各罫線項目は、情報を横書きで記入す
ることから、横長にスペースがとられている。これは一
般的な振り込み依頼書の特徴である。
【0127】この振り込み依頼書Aでは、主表aにおい
て、先頭行の罫線項目に、横方向に金融機関,口座番
号,受け取り人名,金額の順に項目名が記入され、次行
以降に4つの記入欄が形成されている。この振り込み依
頼書Aにより全部で4つの振込先に対して情報を書き込
むことができる。
【0128】上述した振り込み依頼書Aは、主表aだけ
の1ブロック構成である。したがって、この振り込み依
頼書Aの場合には、読み取りが行われた際に、縦長の罫
線項目の数と横長の罫線項目の数とを比較して正方向か
らの回転方向が判定される。通常、正方向(正位置)で
は、縦長の罫線項目の数よりも横長の罫線項目の数の方
が多くとられることから、横長の罫線項目の数の方が縦
長の罫線項目の数よりも多い場合には、読み取り方向が
正方向もしくは180度回転していると判定される。一
方、縦長の罫線項目の数の方が横長の罫線項目の数より
も多い場合には、読み取り方向が90度もしくは270
度回転している判定される。
【0129】さらに、正確な読み取り方向を判定するた
めには、振り込み依頼書Aの“振り込み依頼書”(図3
参照)というタイトルの位置が主表aの4辺のどこに位
置するかを確認したり(文字認識せず、黒画素での判
断)、後述するが、列方向もしくは行方向に対する罫線
項目内の文字の存在を確認することで、正位置からの回
転方向を判定することができる。
【0130】また、図4において、Bは帳票の一種であ
る振り込み依頼書を示している。この振り込み依頼書B
は、罫線によって5行4列に区分される罫線項目でブロ
ックを構成した主表b1と、この主表b1の3列目およ
び4列目の最下行に接続された1行2列分の副表b2と
により構成される。
【0131】この振り込み依頼書Bでは、主表b1にお
いて、先頭行の罫線項目に、金融機関,口座番号,受け
取り人名,金額の項目名が記入され、次行以降に4つの
記入欄が形成されている。この振り込み依頼書Bにより
全部で4つの振込先に対して情報を書き込むことができ
る。副表b2では、主表b1の合計金額を書き込む欄が
金額欄の列に配置され、その合計という項目名が受け取
り人名欄の列に配置されている。なお、各罫線項目は、
情報を横書きで記入することから、横長にスペースがと
られている。
【0132】このように、上述した振り込み依頼書B
は、主表b1下辺の右側に副表b2を接触させた2ブロ
ック構成である。したがって、この振り込み依頼書Bの
場合には、読み取りが行われた際に、前述の振り込み依
頼書Aでの判定方法の他に、主表b1下辺の右側に副表
b2が接触する位置がきたときを正方向(正位置)とし
て判定することができる。
【0133】さらに、図5において、Cは帳票の一種で
ある振り込み依頼書を示している。この振り込み依頼書
Cは、罫線によって5行4列に区分される罫線項目でブ
ロックを構成した主表c1と、この主表c1の3列目お
よび4列目の最上行に接続された1行2列分の副表c2
とにより構成される。
【0134】この振り込み依頼書Cでは、主表c1にお
いて、先頭行の罫線項目に、金融機関,口座番号,受け
取り人名,金額の項目名が記入され、次行以降に4つの
記入欄が形成されている。この振り込み依頼書Cにより
全部で4つの振込先に対して情報を書き込むことができ
る。副表c2では、この振り込み依頼書Cの依頼人の名
前を書き込む欄が金額欄の列に配置され、その依頼人と
いう項目名が受け取り人名欄の列に配置されている。な
お、各罫線項目は、情報を横書きで記入することから、
横長にスペースがとられている。
【0135】このように、上述した振り込み依頼書C
は、主表c1上辺の右側に副表c2を接触させた2ブロ
ック構成である。したがって、この振り込み依頼書Cの
場合には、読み取りが行われた際に、前述の振り込み依
頼書Bとは副表の位置判定が主表の上下辺逆となり、主
表c1上辺の右側に副表c2が接触する位置がきたとき
を正方向(正位置)として判定することができる。
【0136】つぎに、動作について説明する。図6はこ
の実施の形態による帳票読取方向判定処理を説明するフ
ローチャートであり、図7はラベリング処理を視覚的に
説明する図である。以下の説明では、図3,図4および
図5にそれぞれ示した振り込み依頼書A,B,Cを例に
挙げて説明する。
【0137】一般的に、帳票処理装置等においては、処
理対象の帳票の読取方向が正しい方向でなければ、イメ
ージデータ(イメージ)の文字記述方向が正しい方向と
ならないため、文字認識処理を行なうことができない。
【0138】このため、帳票処理装置30においては、
帳票読取方向判定装置により、帳票の読み取られたイメ
ージの方向を判定して、イメージの方向が誤っていた場
合には、正しい方向となるようにイメージの回転補正処
理を行ない、処理対象の帳票の読取方向が誤っていた場
合でも、後述するイメージのレイアウト解析処理や文字
認識処理を行なうことができるようになっている。
【0139】この帳票読取方向判定処理では、まず、前
回の判定結果がRAMよりクリアされ(ステップS
1)、最初の処理としてラベリング処理が実施される
(ステップS2)。このラベリング処理は、前述のラベ
リング処理部202の機能として実施されるものであ
る。図7(a)には、ラベリング対象となるイメージデ
ータの一部である11画素×11画素のマトリクスより
なるイメージデータが示されている。
【0140】イメージスキャナ400により読み取られ
た振り込み依頼書のイメージにおいて、図7(a)に示
したイメージから黒画素が上下左右および斜めで連結す
る部分を抽出すると、P1,P2,P3,P4の4つの
領域が得られる。これら4つの領域P1,P2,P3,
P4には、図7(b)に示したように、それぞれ同一領
域の各画素に対してラベル番号(1),(2),
(3),(4)が付与される。
【0141】この後、ラベル番号(1),(2),
(3),(4)をそれぞれ付与した画素の外接矩形が求
められ、それぞれの外接矩形はラベル矩形Q1,Q2,
Q3,Q4となる。ラベル矩形Q1,Q2,Q3,Q4
はラベリング情報としてRAMに格納される。
【0142】以上のラベリング処理(ステップS2)に
よりラベリング情報が求められると、続いて罫線項目の
抽出が実行される(ステップS3)。この罫線項目抽出
処理は、前述の罫線項目抽出処理部203の機能として
実施されるものである。この罫線項目抽出処理では、読
み取られたイメージデータを探索して、罫線から形成さ
れる最小矩形である罫線項目を自動的に抽出する処理が
実行される。この罫線項目抽出処理により抽出された罫
線項目情報は処理システム100内のRAMに格納され
る。
【0143】このようにして罫線項目情報が得られる
と、今度はブロックの抽出が行われる(ステップS
4)。このブロック抽出も、前述の罫線項目抽出処理部
203の機能として実施されるものである。このブロッ
ク抽出では、罫線で囲まれた矩形の内でこれ以上結合で
きない矩形を求め、その矩形をひとつのブロックとして
規定する処理が実行される。
【0144】読み取った帳票が図3に示した振り込み依
頼書Aであった場合には、ブロック抽出処理により得ら
れる矩形は1つだけとなる。このため、図3に示した如
く、1つのブロックaだけが抽出されることになる。ま
た、図4に示した振り込み依頼書Bでは、ブロック抽出
処理により得られる矩形は2つとなる。このため、図4
に示した如く、2つのブロックb1,b2が抽出される
ことになる。図5に示した振り込み依頼書Cでは、振り
込み依頼書Bの場合と同様に、2つのブロックc1,c
2が抽出されることになる。
【0145】このブロック抽出処理により抽出されたブ
ロック情報は、上述の罫線項目情報とともに処理システ
ム100内のRAMに格納される。
【0146】続いて、横長判定処理が実施される(ステ
ップS5)。この横長判定処理は、RAMに格納された
罫線項目情報に基づいて罫線項目(表構造)を解析し
て、罫線項目の形状が縦長/横長のいずれであるかを判
定、すなわちイメージデータの読取方向が縦読み/横読
みのいずれであるかを判定するものである。
【0147】この横長判定処理は、前述の回転方向判定
処理部204の機能の一つとして実施されるものであ
る。この横長判定処理により得られた判定結果は、処理
システム100内のRAMに格納される。
【0148】ここで、銀行や企業等で取り扱う帳票や文
書類は、通常は横方向に記述されたものが多い。このた
め、帳票の正位置では、罫線項目も横長となることが多
くなる。そこで、この実施の形態では、横長判定処理が
必要となり、読み取り帳票の正位置を判断する上で、横
長の罫線項目が縦長の罫線項目より多いという条件を判
定条件として使用する。
【0149】続いて、ブロック判定処理が実施される
(ステップS6)。このブロック判定処理は、処理シス
テム100のRAMに格納されたブロック情報に基づい
て読み取られた振り込み依頼書に複数のブロックが存在
しているか否かを判断し、複数のブロックが存在してい
る場合にはブロック間の接触位置に従って正位置からの
回転方向を判定する。
【0150】このブロック判定処理は、前述の回転方向
判定処理部204の機能の一つとして実施されるもので
ある。このブロック判定処理により得られた判定結果
は、処理システム100内のRAMに格納される。
【0151】例えば、振り込み依頼書Aは、図3に示し
たように、1つのブロックで構成されるため、上記ブロ
ック判定処理による回転方向の判断を仰ぐことはない。
一方、振り込み依頼書BもしくはCは、図4および図5
に示したように、接触する複数(2つ)のブロックで構
成されるため、上記ブロック判定処理による回転方向の
判断を仰ぐことになる。
【0152】続いて、文字列判定処理が実施される(ス
テップS7)。この文字列判定処理は、処理システム1
00のRAMに格納されたブロック情報およびイメージ
データに基づいてブロックの外に位置する文字列(1文
字または複数文字)の存在を確認し、その文字列がブロ
ックの4辺の内でどこに存在するかに従って正位置から
の回転方向を判定する。
【0153】この文字列判定処理は、前述の回転方向判
定処理部204の機能の一つとして実施されるものであ
る。この文字列判定処理により得られた判定結果は、処
理システム100内のRAMに格納される。
【0154】例えば、振り込み依頼書Aでは、図3に示
したように、主表a(ブロック)の外に文字列“振り込
み依頼書”が配置されている。このため、その文字列
“振り込み依頼書”とブロック(主表a)の辺との位置
関係から、振り込み依頼書Aにおける正位置からの回転
方向が判定可能となる。
【0155】また、振り込み依頼書Bでは、図4に示し
たように、主表b1および副表b2の外に文字列“振り
込み依頼書”が配置されている。同様に、振り込み依頼
書Cでは、図5に示したように、主表c1および副表c
2の外に文字列“振り込み依頼書”が配置されている。
このため、振り込み依頼書B,Cの各文字列“振り込み
依頼書”とブロック(主表b1および副表b2/主表c
1および副表c2)の辺との位置関係から、振り込み依
頼書B,Cにおける正位置からの回転方向が判定可能と
なる。
【0156】続いて、記入判定処理が実施される(ステ
ップS8)。この記入判定処理は、処理システム100
のRAMに格納された罫線項目およびイメージデータに
基づいて罫線項目内に記入されている文字が行,列の各
方向でどこまで記入されているか、そのピークを判定
し、その行,列の各ピーク位置から正位置からの回転方
向を判定する。
【0157】この記入判定処理は、前述の回転方向判定
処理部204の機能の一つとして実施されるものであ
る。この記入判定処理により得られた判定結果は、処理
システム100内のRAMに格納される。
【0158】続いて、総合判定が行われる(ステップS
9)。この総合判定は、前述した横長判定処理(ステッ
プS5)、ブロック判定処理(ステップS6)、文字列
判定処理(ステップS7)および記入判定処理(ステッ
プS8)の各判定結果を加重合計することにより、最終
的に振り込み依頼書の読み取り方向を判定する。この総
合判定は、前述の回転方向判定処理部204の機能の一
つとして実施されるものである。
【0159】続いて横長判定処理(図6:ステップS
5)について説明する。図8は図6に示した帳票読取方
向判定処理における横長判定処理を説明するフローチャ
ートである。
【0160】この横長判定処理では、まず、縦長罫線項
目のカウント数VNを格納する縦長数カウンタと横長罫
線項目のカウント数HNを格納する横長数カウンタとが
ゼロにクリアされる(ステップS501)。これら縦長
数カウンタおよび横長数カウンタはあらかじめ処理シス
テム100のRAMに設定される。
【0161】この後、罫線項目が順次読み出され、縦横
判定される。この横長判定処理では、あらかじめ設定さ
れたしきい値以下のサイズの罫線項目についてはカウン
トの対象外としていることから、縦横判定の際に、まず
縦横判定する対象の罫線項目のサイズがしきい値以上か
否かを判断する(ステップS502)。その際、しきい
値に満たないサイズの罫線項目については対象外と判断
して、イメージデータから罫線項目がさらに存在するか
否か判断される(ステップS506)。
【0162】また、ステップS502において、しきい
値以上のサイズをもつ罫線項目が確認されると、続くス
テップS503において縦、横の罫線の長さから罫線項
目の縦横判定が下される。その結果、縦長の罫線項目で
あるという判定結果が得られた場合には、処理はステッ
プS504に移行して、縦長数カウンタのカウント数V
Nを1つインクリメントする。
【0163】また、横長の罫線項目であるという判定結
果が得られた場合には、処理はステップS505に移行
して、横長数カウンタのカウント数HNを1つインクリ
メントする。また、縦横の罫線の長さが等しく、縦長、
横長のいずれにも属さない罫線項目であった場合には、
カウント数VN,HNのいずれもインクリメントせず、
処理はステップS506に移行する。
【0164】処理がステップS507に移行すると、つ
ぎの縦横判定を行うための罫線項目が存在するかを判定
する。この縦横判定がすべて終了した場合には、処理は
ステップS507に移行して、横長のカウント数HNに
対する縦長のカウント数VNの比率を求める。
【0165】処理システム100のRAMには、あらか
じめ正位置からの回転方向0度、90度、180度、2
70度の4方向に対して判定結果の重み付けを行うため
の判定領域が設けられている。そこで、もし横長の罫線
項目の数が縦長の罫線項目の数の2倍以上存在していた
場合には(ステップS507)、振り込み依頼書の読み
込み方向が正位置から0度とする判定領域、正位置から
180度とする判定領域にそれぞれ横長判定結果として
の重みが加算される(ステップS508)。すなわち、
この横長判定では、振り込み依頼書が0度もしくは18
0度回転させて読み込まれたものとして判定結果が得ら
れる。
【0166】また、もし縦長の罫線項目の数が横長の罫
線項目の数の2倍以上損z死していた場合には(ステッ
プS507)、振り込み依頼書の読み込み方向が正位置
から90度とする判定領域、正位置から270度とする
判定領域にそれぞれ横長判定結果としての重みが加算さ
れる(ステップS509)。すなわち、この横長判定で
は、振り込み依頼書が90度もしくは270度回転させ
て読み込まれたものとして判定結果が得られる。
【0167】また、縦長の罫線項目の数と横長の罫線項
目の数との関係が上述のいずれにも該当しない場合には
(ステップS507)、回転方向0度、90度、180
度、270度の4方向のいずれに対しても重み付けせず
に、横長判定処理が終了する。
【0168】なお、図3,図4,図5の各振り込み依頼
書A,B,Cはどれもすべて横長の罫線項目より構成さ
れているので、ステップS507の判定では、ステップ
S508もしくはステップS509のいずれかに処理が
移行することになる。
【0169】続いてブロック判定処理(図6:ステップ
S6)について説明する。図9は図6に示した帳票読取
方向判定処理におけるブロック判定処理を説明するフロ
ーチャートである。
【0170】このブロック判定処理では、まず、ブロッ
ク情報からブロック数が確認され、そのブロック数が1
つだけの場合にはそのまま処理が終了する(ステップS
601)。振り込み依頼書Aの場合には、ブロック数が
ひとつなので(図3参照)、このブロック判定をせずに
処理が終了する。
【0171】一方、ブロック数が2つ以上存在する場合
には(ステップS601)、さらにつぎのステップS6
02においてブロック間の接触の有無が判定される。振
り込み依頼書B,Cの場合には、いずれも2つのブロッ
クを有しているので(図4および図5参照)、このブロ
ック判定を行うため、処理はさらにステップS602に
進む。
【0172】振り込み依頼書Bでは主表b1と副表b2
との接触があることから(振り込み依頼書Cも同様)、
ステップS602においてその接触が確認され、処理は
さらにステップS603に移行する。なお、帳票のブロ
ック間で接触が確認されなかった場合にも、ブロック判
定をせずに処理が終了する。
【0173】ステップS603において、さらに主表と
副表との接触する辺の長さが確認される。もし一方のブ
ロック(主表側)の辺と他方のブロック(副表側)の辺
とが同一の長さであった場合には(ステップS60
3)、イメージの読み取りエラーか、あるいは特殊な帳
票として判断され、このフローでは帳票のイメージをブ
ロック判定の対象外とする。このため、処理は終了す
る。
【0174】また、振り込み依頼書BやCのように、主
表と副表との接触辺の長さが異なっている場合には(ス
テップS603)、振り込み依頼書BやCのイメージは
ブロック判定対象となり、処理はさらにステップS60
4に移行する。
【0175】ステップS604では、副表が主表の4辺
のうちでどの辺に接触するか判定される。その結果、副
表が主表の上辺に接触していた場合には、さらに副表が
その上辺のうちで右側、左側、それとも他の位置に接触
しているか判定される(ステップS605)。これは、
振り込み依頼書B(図4参照)が正位置から時計方向に
180度回転させた状態で読み取られた場合に相当す
る。
【0176】このとき、副表b2は主表b1の上辺の左
側で接触することになる。この場合には、処理はステッ
プS611に移行する。このステップS611では、正
位置から180度とする判定領域にブロック判定の重み
が加算される。すなわち、振り込み依頼書B(図4参
照)が正位置から時計方向に180度回転させた状態で
読み取られたという判定結果を得ることになる。この
後、処理は図6のメイン処理に戻る。
【0177】また、振り込み依頼書Bに関して、副表b
2が主表b1の左辺に接触していた場合には(ステップ
S604)、副表b2はその左辺のうちで下側に接触し
ていることになる(ステップS606)。この場合に
は、処理はステップS610に移行する。このステップ
S610では、正位置から90度とする判定領域にブロ
ック判定の重みが加算される。すなわち、振り込み依頼
書B(図4参照)が正位置から時計方向に90度回転さ
せた状態で読み取られたという判定結果を得ることにな
る。この後、処理は図6のメイン処理に戻る。
【0178】また、振り込み依頼書Bに関して、副表b
2が主表b1の下辺に接触していた場合には(ステップ
S604)、副表b2はその下辺のうちで右側に接触し
ていることになる(ステップS607)。この場合に
は、処理はステップS609に移行する。このステップ
S609では、正位置から0度とする判定領域にブロッ
ク判定の重みが加算される。すなわち、振り込み依頼書
B(図4参照)が正位置から時計方向に0度回転させた
状態で読み取られたという判定結果を得ることになる。
この後、処理は図6のメイン処理に戻る。
【0179】また、振り込み依頼書Bに関して、副表b
2が主表b1の右辺に接触していた場合には(ステップ
S604)、副表b2はその右辺のうちで上側に接触し
ていることになる(ステップS608)。この場合に
は、処理はステップS612に移行する。このステップ
S612では、正位置から270度とする判定領域にブ
ロック判定の重みが加算される。すなわち、振り込み依
頼書B(図4参照)が正位置から時計方向に270度回
転させた状態で読み取られたという判定結果を得ること
になる。この後、処理は図6のメイン処理に戻る。
【0180】さらに振り込み依頼書Cの場合についても
説明する(図5参照)。副表c2が主表c1の上辺に接
触していた場合には(ステップS604)、副表c2は
その上辺のうちで右側に接触していることになる(ステ
ップS608)。この場合には、処理はステップS60
9に移行する。このステップS609では、正位置から
0度とする判定領域にブロック判定の重みが加算され
る。すなわち、振り込み依頼書C(図5参照)が正位置
から時計方向に0度回転させた状態で読み取られたとい
う判定結果を得ることになる。この後、処理は図6のメ
イン処理に戻る。
【0181】また、振り込み依頼書Cに関して、副表c
2が主表c1の左辺に接触していた場合には(ステップ
S604)、副表c2はその左辺のうちで上側に接触し
ていることになる(ステップS606)。この場合に
は、処理はステップS612に移行する。このステップ
S612では、正位置から270度とする判定領域にブ
ロック判定の重みが加算される。すなわち、振り込み依
頼書C(図5参照)が正位置から時計方向に270度回
転させた状態で読み取られたという判定結果を得ること
になる。この後、処理は図6のメイン処理に戻る。
【0182】また、振り込み依頼書Cに関して、副表c
2が主表c1の下辺に接触していた場合には(ステップ
S604)、副表c2はその下辺のうちで左側に接触し
ていることになる(ステップS607)。この場合に
は、処理はステップS611に移行する。このステップ
S611では、正位置から180度とする判定領域にブ
ロック判定の重みが加算される。すなわち、振り込み依
頼書C(図5参照)が正位置から時計方向に180度回
転させた状態で読み取られたという判定結果を得ること
になる。この後、処理は図6のメイン処理に戻る。
【0183】また、振り込み依頼書Cに関して、副表c
2が主表c1の右辺に接触していた場合には(ステップ
S604)、副表c2はその右辺のうちで下側に接触し
ていることになる(ステップS608)。この場合に
は、処理はステップS610に移行する。このステップ
S610では、正位置から90度とする判定領域にブロ
ック判定の重みが加算される。すなわち、振り込み依頼
書C(図5参照)が正位置から時計方向に90度回転さ
せた状態で読み取られたという判定結果を得ることにな
る。この後、処理は図6のメイン処理に戻る。
【0184】なお、ステップS605〜ステップS60
8のいずれかにおいて、接触位置が上下左右のいずれに
も該当しなかった場合には、ブロック判定の対象外、も
しくは特殊な帳票としてブロック判定結果得ることな
く、処理はこのブロック判定処理から抜ける。
【0185】続いて文字列判定処理(図6:ステップS
7)について説明する。図10は図6に示した帳票読取
方向判定処理における文字列判定処理を説明するフロー
チャートである。
【0186】この文字列判定処理では、まず、イメージ
データに基づいてブロック外に配置される文字列の抽出
が行われる(ステップS701)。この抽出では、一定
以上の画素数で構成される領域が文字列として認識され
る。すなわち、文字認識を経ることなく、文字列の存在
を確認することになる。
【0187】続くステップS702において、さらに文
字列としての確実性を得るために、あらかじめ定めたし
きい値のサイズ以下の文字列については、ノイズもしく
はゴミとして文字列の抽出が解除される。
【0188】さらにステップS703において、ステッ
プS702でゴミなどを取り除いた上で有効な文字列が
存在するか判定する。そして、有効文字列が存在すると
いう判定結果が得られた場合には、続くステップS70
4において、ブロックに対すいる文字列の位置が判定さ
れる。すなわち、振り込み依頼書A,B,Cにおいて
は、いずれも正位置での上辺の位置に文字列“振り込み
依頼書”が配置されている。
【0189】したがって、文字列がブロックの上側に位
置していた場合には(ステップS704)、正位置から
0度とする判定領域に文字列判定の重みが加算される
(ステップS705)。すなわち、振り込み依頼書が正
位置から時計方向に0度回転させた状態で読み取られた
という判定結果を得ることになる。この後、処理は図6
のメイン処理に戻る。
【0190】また、文字列がブロックの左側に位置して
いた場合には(ステップS704)、正位置から270
度とする判定領域に文字列判定の重みが加算される(ス
テップS706)。すなわち、振り込み依頼書が正位置
から時計方向に270度回転させた状態で読み取られた
という判定結果を得ることになる。この後、処理は図6
のメイン処理に戻る。
【0191】また、文字列がブロックの下側に位置して
いた場合には(ステップS704)、正位置から180
度とする判定領域に文字列判定の重みが加算される(ス
テップS707)。すなわち、振り込み依頼書が正位置
から時計方向に180度回転させた状態で読み取られた
という判定結果を得ることになる。この後、処理は図6
のメイン処理に戻る。
【0192】また、文字列がブロックの右側に位置して
いた場合には(ステップS704)、正位置から90度
とする判定領域に文字列判定の重みが加算される(ステ
ップS708)。すなわち、振り込み依頼書が正位置か
ら時計方向に90度回転させた状態で読み取られたとい
う判定結果を得ることになる。この後、処理は図6のメ
イン処理に戻る。
【0193】なお、文字列がブロックのどの辺にも位置
していない場合には(ステップS704)、この文字列
判定の対象外、あるいは特殊な帳票として判断され、処
理はこの文字列判定処理から抜ける。
【0194】続いて記入判定処理(図6:ステップS
8)について説明する。図11および図12は図6に示
した帳票読取方向判定処理における記入判定処理を説明
するフローチャートであり、図13および図14は記入
判定処理を説明する帳票の一例を示す図である。
【0195】この記入判定処理では、まず、処理システ
ム100のRAMにあらかじめ設けられた行カウンタの
カウント値LNおよび列カウンタのカウント値CNがゼ
ロにクリアされる(ステップS801)。そして、ブロ
ック内の罫線項目を順番に移動しながら、各罫線項目内
に文字の記入があるか否か判定される。
【0196】記入の有無を判定する罫線項目はひとつず
つ移動させ、罫線項目内に記入があると(ステップS8
02)、該当する行カウンタ,列カウンタのそれぞれの
カウント値LN,CNがひとつインクリメントされる
(ステップS803)。その後、つぎに記入の有無を判
定するための罫線項目の存在が確認され(ステップS8
04)、まだ罫線項目が存在していれば、処理はステッ
プS802に戻り、上述した処理を繰り返し実行する。
【0197】なお、ステップS802において、罫線項
目内の記入なしという判定があった場合には、処理はそ
のままステップS804に移行して、つぎの罫線項目の
存在を確認する。
【0198】ステップS804において、つぎの罫線項
目がないことが確認された場合には、処理はステップS
805に移行する。
【0199】ここで、図13に示した内容の振り込み依
頼書Aを例に挙げる。この振り込み依頼書Aには、上か
ら3行目までに文字の記入がある。1行目には、1列目
より4列目に向かって、金融機関、口座番号、受け取り
人名、金額の項目名が記入されている。2行目には、そ
れぞれ1行目の各項目名に対応させて、東銀行、123
4、ABC社、10,000(円)が記入され、3行目
には、それぞれ1行目の各項目名に対応させて、西銀
行、5678、DEF社、20,000(円)が記入さ
れている。
【0200】この場合、1列目〜4列目のすべてのカウ
ント値CNは3となる。このため、1列目〜4列目すべ
てに共通して3行目までの記入が確認される。この列方
向の場合には、ピークはすべてカウント値“3”で共通
することから、ピークの存在はないことになる。また、
1行目〜5行目の各カウント値LNは、4,4,4,
0,0となる。このため、1行目〜3行目すべてに共通
して4列目までの記入が確認されるとともに、4行目と
5行目すべてに共通して記入が1列もないことが確認さ
れる。したがって、この行方向の場合には、カウント値
“4”のところでピークが存在することになる。
【0201】ステップS805では、各カウント値L
N,CNから行方向、列方向それぞれのピークが抽出さ
れる。図13の状態で読み取られた場合には、行方向に
はピークが存在するが、列方向にはピークが存在しない
ことになる。このように、行方向だけにピークが存在す
る場合には(ステップS806)、処理はステップS8
07に移行して、ピーク位置がどこにくるのかを判定す
る。図13の例では、行方向のピーク位置が真中よりも
上側に位置していることから、上側という判定結果が得
られる。
【0202】したがって、ステップS807において上
側という判定結果が得られるので、処理はさらにステッ
プS813に移行する。このステップS813では、正
位置から0度とする判定領域に記入判定の重みが加算さ
れる。すなわち、振り込み依頼書Aが正位置から時計方
向に0度回転させた状態で読み取られたという判定結果
を得ることになる。この後、処理は図6のメイン処理に
戻る。
【0203】また、振り込み依頼書Aが図13とは異な
る記入状態であり、ステップS807においてピーク位
置が下側にきていた場合には、処理はステップS815
に移行する。このステップS815では、正位置から1
80度とする判定領域に記入判定の重みが加算される。
すなわち、振り込み依頼書Aが正位置から時計方向に0
度回転させた状態で読み取られたという判定結果を得る
ことになる。この後、処理は図6のメイン処理に戻る。
【0204】また、ステップS807においてピーク位
置が上側でも下側でもなく、例えば真中にきていた場合
には、記入判定としての確実な判定結果が得られないこ
とから、そのまま処理が終了してメイン処理(図6参
照)に戻る。
【0205】また、図13に示した振り込み依頼書Aが
正位置から90度回転させて読み込まれた場合には、行
方向ではカウント値がすべて3となってピークが得られ
ず、一方、列方向では右側にピークがくることになる。
したがって、ステップS806において列だけがピーク
ありと判定され、処理はステップS808に移行する。
【0206】そこで、ピーク位置が右側という判定結果
が得られることから(ステップS808)、処理はステ
ップS814に移行する。このステップS814では、
正位置から90度とする判定領域に記入判定の重みが加
算される。すなわち、振り込み依頼書Aが正位置から時
計方向に90度回転させた状態で読み取られたという判
定結果を得ることになる。この後、処理は図6のメイン
処理に戻る。
【0207】また、振り込み依頼書Aが図13とは異な
る記入状態であり、ステップS808においてピーク位
置が左側にきていた場合には、処理はステップS816
に移行する。このステップS816では、正位置から2
70度とする判定領域に記入判定の重みが加算される。
すなわち、振り込み依頼書Aが正位置から時計方向に2
70度回転させた状態で読み取られたという判定結果を
得ることになる。この後、処理は図6のメイン処理に戻
る。
【0208】また、ステップS808においてピーク位
置が右側でも左側でもなく、例えば真中にきていた場合
には、記入判定としての確実な判定結果が得られないこ
とから、そのまま処理が終了してメイン処理(図6参
照)に戻る。
【0209】なお、ステップS806において行方向に
も列方向にもピーク無しという判定結果が得られた場合
には、この記入判定処理からは正位置からの回転方向を
確認することができないため、処理はそのままメイン処
理(図6参照)に戻る。
【0210】さて、以上の例は図13に示した振り込み
依頼書Aを例に挙げたものであるが、図14に示した振
り込み依頼書AAについても同様の処理手順で記入判定
を行うことが出来る。図14に示した振り込み依頼書A
Aでは、主表aaの第1列に行番号が列方向に向かって
1,2,3,4の順であらかじめ付与されている。な
お、振り込み依頼書AAへの記入内容は図13に示した
振り込み依頼書Aと同様の内容とする。
【0211】したがって、図14に示した振り込み依頼
書AAの場合には、行方向のカウント値は1行目〜5行
目に向かって、5,5,5,1,1となり、列方向のカ
ウント値は1列目〜5列目に向かって、5,3,3,
3,3となる。図13に示した振り込み依頼書Aには、
行番号のための罫線項目が設けられていないが、図14
に示した振り込み依頼書AAには、行番号のための罫線
項目が設けられている。このため、図14のように、項
目名のための行を除いての第3行目(No.3)と第4
行目(No.4)とが空欄になると、第1列がカウント
値フルの“5”となって他の列のカウント値“3”と相
違する。すなわち、第1列目がピーク位置となる。
【0212】以上のことから、図14に示した読み取り
状態での振り込み依頼書AAの場合には、行列ともにピ
ークが存在する。したがって、ステップS806におい
て行列ともにピークありという判定結果が得られ、さら
に処理はステップS809に移行する。
【0213】このステップS809では、まず、行方向
のピーク位置が判定される。図14の例では、行方向の
ピーク位置は図13のときと同様に上側となることか
ら、処理はステップS810に移行する。このステップ
S810では、さらに列方向のピーク位置が判定され
る。図14の例では、列方向のピーク位置が左側となる
ことから、処理はステップS813に移行する。このス
テップS813では、正位置から0度とする判定領域に
記入判定の重みが加算される。すなわち、振り込み依頼
書Aが正位置から時計方向に0度回転させた状態で読み
取られたという判定結果を得ることになる。この後、処
理は図6のメイン処理に戻る。
【0214】また、図14に示した振り込み依頼書AA
が正位置より90度回転させて読み込まれた場合には、
行方向のピーク位置は上側となり(ステップS80
9)、列方向のピーク位置は右側となる(ステップS8
10)。したがって、処理はステップS814に移行す
る。このステップS814では、正位置から90度とす
る判定領域に記入判定の重みが加算される。すなわち、
振り込み依頼書Aが正位置から時計方向に90度回転さ
せた状態で読み取られたという判定結果を得ることにな
る。この後、処理は図6のメイン処理に戻る。
【0215】また、ステップS810において列方向の
ピーク位置が真中であった場合には、行方向のピーク位
置の判定が重要視され、処理はステップS813に移行
する。すなわち、振り込み依頼書Aが正位置から時計方
向に0度回転させた状態で読み取られたという判定結果
を得ることになる。
【0216】また、図14に示した振り込み依頼書AA
が正位置より180度回転させて読み込まれた場合に
は、行方向のピーク位置は下側となり(ステップS80
9)、列方向のピーク位置は右側となる(ステップS8
11)。したがって、処理はステップS815に移行す
る。このステップS815では、正位置から180度と
する判定領域に記入判定の重みが加算される。すなわ
ち、振り込み依頼書Aが正位置から時計方向に180度
回転させた状態で読み取られたという判定結果を得るこ
とになる。この後、処理は図6のメイン処理に戻る。
【0217】また、図14に示した振り込み依頼書AA
が正位置より270度回転させて読み込まれた場合に
は、行方向のピーク位置は下側となり(ステップS80
9)、列方向のピーク位置は左側となる(ステップS8
11)。したがって、処理はステップS816に移行す
る。このステップS816では、正位置から270度と
する判定領域に記入判定の重みが加算される。すなわ
ち、振り込み依頼書Aが正位置から時計方向に270度
回転させた状態で読み取られたという判定結果を得るこ
とになる。この後、処理は図6のメイン処理に戻る。
【0218】また、ステップS811において列方向の
ピーク位置が真中であった場合には、行方向のピーク位
置の判定が重要視され、処理はステップS815に移行
する。すなわち、振り込み依頼書Aが正位置から時計方
向に180度回転させた状態で読み取られたという判定
結果を得ることになる。この後、処理は図6のメイン処
理に戻る。
【0219】また、図14に示した振り込み依頼書AA
の記入内容が異なり、ステップS809において行方向
のピーク位置が真中という判定結果が得られた場合に
は、処理はステップS812に移行する。このステップ
S812において、さらに列方向のピーク位置が判定さ
れる。そして、列方向のピーク位置が左側という判定結
果が得られた場合には(ステップS812)、列方向の
ピーク位置が重要視され、処理はステップS813に移
行する。すなわち、振り込み依頼書Aが正位置から時計
方向に0度回転させた状態で読み取られたという判定結
果を得ることになる。この後、処理は図6のメイン処理
に戻る。
【0220】また、列方向のピーク位置が右側という判
定結果が得られた場合には(ステップS812)、列方
向のピーク位置が重要視され、処理はステップS815
に移行する。すなわち、振り込み依頼書Aが正位置から
時計方向に180度回転させた状態で読み取られたとい
う判定結果を得ることになる。この後、処理は図6のメ
イン処理に戻る。
【0221】なお、列方向のピーク位置が真中という判
定結果が得られた場合には(ステップS812)、行列
のいずれからも判定不可能のため、そのまま処理はメイ
ン処理(図6参照)に戻る。
【0222】さて、以上の動作説明では、0度、90
度、180度、270度それぞれについて重みを加算し
れたものが回転方向別の最終的な重みとなる。これらの
重みは、回転方向判定処理部204において加重合計さ
れることになるが、上記0度、90度、180度、27
0度の各回転方向は正位置からどれだけ回転しているか
を示すものである。したがって、イメージ回転処理部2
05で回転補正する場合には、読み取ったイメージデー
タについて、最終的に得られた回転方向に戻すか、それ
とも360度からその回転方向を差し引いた結果だけさ
らに回転を進めて正位置を得るようにする。
【0223】以上説明したように、この実施の形態によ
れば、読み取られた帳票のイメージから罫線項目を抽出
して、横長の罫線項目と縦長の罫線項目の割合から帳票
の読み取り方向(回転方向)を判定するようにしたの
で、帳票に補正マーク等の特定情報を付加した帳票を用
意する必要はなく、縦長の罫線項目と横長の罫線項目と
が混在した帳票でも使用することができ、また帳票の読
み込み時にオペレータが回転方向を指定した場合に生じ
る人為的な回転方向の誤入力を防止することができる。
【0224】また、読み取られた帳票のイメージから罫
線項目およびブロックを抽出して、複数のブロックが接
触する位置関係から帳票の読み取り方向を判定するよう
にしたので、複数のブロックが存在する帳票でも使用す
ることができ、また帳票の読み込み時にオペレータが回
転方向を指定した場合に生じる人為的な回転方向の誤入
力を防止することができる。
【0225】また、読み取られた帳票のイメージから罫
線項目およびブロックを抽出して、ブロックとそのブロ
ックの外に存在する文字列との位置関係から帳票の読み
取り方向を判定するようにしたので、ブロックがひとつ
だけ存在する帳票でもブロック外に文字列がある帳票で
あれば使用可能となり、また帳票の読み込み時にオペレ
ータが回転方向を指定した場合に生じる人為的な回転方
向の誤入力を防止することができる。
【0226】また、読み取り方向を判定する際に、さら
に、行列方向での罫線項目内の記入の有無をカウントし
て行方向での記入のピーク位置と列方向での記入のピー
ク位置との関係を加味するようにしたので、一般的な帳
票によくある第1行および/または第1列にあらかじめ
記入される項目名の存在からも読み取り方向の判定に確
実性を与えることが可能である。特に、行列のいずれか
一方にしかピーク位置がない場合にブロック上でピーク
位置がくる辺側を帳票の正位置での上辺側として判定に
加味すればよい。また、行列の両方にピーク位置がある
場合にブロック上でピーク位置がくる辺側を帳票の正位
置での上辺側もしくは左辺側として判定に加味すればよ
い。
【0227】また、読み取られた帳票のイメージから罫
線項目およびブロックを抽出した後、横長,縦長の罫線
項目の割合、複数のブロックが接触する位置の関係、ブ
ロックとそのブロック外の文字列との位置関係、および
行列方向での罫線項目内の記入によるピーク位置の関係
を少なくとも2つ以上の組み合わせて最終的に帳票の読
み取り方向を判定するようにすれば、ひとつの判定基準
だけにとらわれず、複数の判定基準により判定結果の偏
りが分散される。これによって、より正確な帳票の読み
取り方向を確認することが可能である。
【0228】また、帳票の読み取り方向に従って帳票の
イメージデータを正位置に回転補正するようにしたの
で、帳票の読み取り方向に従って自動的に帳票のイメー
ジを正確に補正することが可能である。
【0229】また、オペレータがいちいち帳票の読み取
り方向を指定したり、複数枚の帳票を読み込む際に、す
べての帳票をあらかじめ一定方向にそろえておく必要が
ないので、オペレータの負荷を軽減することが可能であ
る。
【0230】また、帳票のフォーマットに制限がないこ
とから、従来より使用している既存の帳票がそのまま使
用できるほか、本装置のために新たに帳票の設計を行う
必要がないので、帳票設計の自由度が増す。
【0231】以上、この発明を実施の形態により説明し
たが、この発明の主旨の範囲内で種々の変形が可能であ
り、これらをこの発明の範囲から排除するものではな
い。
【0232】
【発明の効果】以上説明したように、請求項1の発明に
よれば、帳票フォーマットのレイアウトの特徴から帳票
の読み取り方向を判定するようにしたので、帳票に補正
マーク等の特定情報を付加した帳票を用意する必要はな
く、任意のフォーマットをもつ帳票が使用でき、また帳
票の読み込み時にオペレータが回転方向を指定した場合
に生じる人為的な回転方向の誤入力を防止することがで
き、これによって、私製帳票等のように任意のフォーマ
ットをもつ帳票であっても帳票の読み取り方向を正確に
確認することが可能な帳票読取方向判定装置が得られる
という効果を奏する。
【0233】また、請求項2の発明によれば、読み取ら
れた帳票のイメージから罫線項目を抽出して、その罫線
項目の形状および配列から帳票の読み取り方向を判定す
るようにしたので、帳票に補正マーク等の特定情報を付
加した帳票を用意する必要はなく、どのような形状やサ
イズの罫線項目をもつ帳票でも使用することができ、ま
た帳票の読み込み時にオペレータが回転方向を指定した
場合に生じる人為的な回転方向の誤入力を防止すること
ができ、これによって、私製帳票等のように任意のフォ
ーマットをもつ帳票であっても帳票の読み取り方向を正
確に確認することが可能な帳票読取方向判定装置が得ら
れるという効果を奏する。
【0234】また、請求項3の発明によれば、読み取ら
れた帳票のイメージから罫線項目を抽出して、横長の罫
線項目と縦長の罫線項目の割合から帳票の読み取り方向
を判定するようにしたので、帳票に補正マーク等の特定
情報を付加した帳票を用意する必要はなく、縦長の罫線
項目と横長の罫線項目とが混在した帳票でも使用するこ
とができ、また帳票の読み込み時にオペレータが回転方
向を指定した場合に生じる人為的な回転方向の誤入力を
防止することができ、これによって、私製帳票等のよう
に任意のフォーマットをもつ帳票であっても帳票の読み
取り方向を正確に確認することが可能な帳票読取方向判
定装置が得られるという効果を奏する。
【0235】また、請求項4の発明によれば、読み取ら
れた帳票のイメージから罫線項目およびブロックを抽出
して、複数のブロックが接触する位置関係から帳票の読
み取り方向を判定するようにしたので、複数のブロック
が存在する帳票でも使用することができ、また帳票の読
み込み時にオペレータが回転方向を指定した場合に生じ
る人為的な回転方向の誤入力を防止することができ、こ
れによって、私製帳票等のように任意のフォーマットを
もつ帳票であっても帳票の読み取り方向を正確に確認す
ることが可能な帳票読取方向判定装置が得られるという
効果を奏する。
【0236】また、請求項5の発明によれば、読み取ら
れた帳票のイメージから罫線項目およびブロックを抽出
して、ブロックとそのブロックの外に存在する文字列と
の位置関係から帳票の読み取り方向を判定するようにし
たので、ブロックがひとつだけ存在する帳票でもブロッ
ク外に文字列がある帳票であれば使用可能となり、また
帳票の読み込み時にオペレータが回転方向を指定した場
合に生じる人為的な回転方向の誤入力を防止することが
でき、これによって、私製帳票等のように任意のフォー
マットをもつ帳票であっても帳票の読み取り方向を正確
に確認することが可能な帳票読取方向判定装置が得られ
るという効果を奏する。
【0237】また、請求項6の発明によれば、請求項3
〜5のいずれか一つの発明において、読み取り方向を判
定する際に、さらに、行列方向での罫線項目内の記入の
有無をカウントして行方向での記入のピーク位置と列方
向での記入のピーク位置との関係を加味するようにした
ので、一般的な帳票によくある第1行および/または第
1列にあらかじめ記入される項目名の存在からも読み取
り方向の判定に確実性を与えることが可能な帳票読取方
向判定装置が得られるという効果を奏する。
【0238】また、請求項7の発明によれば、請求項6
の発明において、行列のいずれか一方にしかピーク位置
がない場合にブロック上でピーク位置がくる辺側を帳票
の正位置での上辺側として判定に加味することが可能な
帳票読取方向判定装置が得られるという効果を奏する。
【0239】また、請求項8の発明によれば、請求項6
の発明において、行列の両方にピーク位置がある場合に
ブロック上でピーク位置がくる辺側を帳票の正位置での
上辺側もしくは左辺側として判定に加味することが可能
な帳票読取方向判定装置が得られるという効果を奏す
る。
【0240】また、請求項9の発明によれば、読み取ら
れた帳票のイメージから罫線項目およびブロックを抽出
して、横長,縦長の罫線項目の割合、複数のブロックが
接触する位置の関係、ブロックとそのブロック外の文字
列との位置関係、および行列方向での罫線項目内の記入
によるピーク位置の関係の2つ以上の組み合わせで最終
的に帳票の読み取り方向を判定するようにしたので、ひ
とつの判定基準だけにとらわれず、複数の判定基準によ
り判定結果の偏りが分散され、これによって、より正確
な帳票の読み取り方向を確認することが可能な帳票読取
方向判定装置が得られるという効果を奏する。
【0241】また、請求項10の発明によれば、請求項
1〜9のいずれか一つの発明において、帳票の読み取り
方向に従って帳票のイメージデータを正位置に回転補正
するようにしたので、請求項1〜9のいずれかの発明に
より得られた帳票の読み取り方向に従って自動的に帳票
のイメージを正確に補正することが可能な帳票読取方向
判定装置が得られるという効果を奏する。
【0242】また、請求項11の発明によれば、読み取
られた帳票のイメージから罫線項目を抽出して、横長の
罫線項目と縦長の罫線項目の割合から帳票の読み取り方
向を判定する工程にしたので、帳票に補正マーク等の特
定情報を付加した帳票を用意する必要はなく、縦長の罫
線項目と横長の罫線項目とが混在した帳票でも使用する
ことができ、また帳票の読み込み時にオペレータが回転
方向を指定した場合に生じる人為的な回転方向の誤入力
を防止することができ、これによって、私製帳票等のよ
うに任意のフォーマットをもつ帳票であっても帳票の読
み取り方向を正確に確認することが可能な帳票読取方向
判定方法が得られるという効果を奏する。
【0243】また、請求項12の発明によれば、読み取
られた帳票のイメージから罫線項目およびブロックを抽
出して、複数のブロックが接触する位置関係から帳票の
読み取り方向を判定する工程にしたので、複数のブロッ
クが存在する帳票でも使用することができ、また帳票の
読み込み時にオペレータが回転方向を指定した場合に生
じる人為的な回転方向の誤入力を防止することができ、
これによって、私製帳票等のように任意のフォーマット
をもつ帳票であっても帳票の読み取り方向を正確に確認
することが可能な帳票読取方向判定方法が得られるとい
う効果を奏する。
【0244】また、請求項13の発明によれば、読み取
られた帳票のイメージから罫線項目およびブロックを抽
出して、ブロックとそのブロックの外に存在する文字列
との位置関係から帳票の読み取り方向を判定する工程に
したので、ブロックがひとつだけ存在する帳票でもブロ
ック外に文字列がある帳票であれば使用可能となり、ま
た帳票の読み込み時にオペレータが回転方向を指定した
場合に生じる人為的な回転方向の誤入力を防止すること
ができ、これによって、私製帳票等のように任意のフォ
ーマットをもつ帳票であっても帳票の読み取り方向を正
確に確認することが可能な帳票読取方向判定方法が得ら
れるという効果を奏する。
【0245】また、請求項14の発明によれば、請求項
11〜13のいずれか一つの発明において、読み取り方
向を判定する際に、さらに、行列方向での罫線項目内の
記入の有無をカウントして行方向での記入のピーク位置
と列方向での記入のピーク位置との関係を加味する工程
にしたので、一般的な帳票によくある第1行および/ま
たは第1列にあらかじめ記入される項目名の存在からも
読み取り方向の判定に確実性を与えることが可能な帳票
読取方向判定方法が得られるという効果を奏する。
【0246】また、請求項15の発明によれば、請求項
14の発明において、行列のいずれか一方にしかピーク
位置がない場合にブロック上でピーク位置がくる辺側を
帳票の正位置での上辺側として判定に加味することが可
能な帳票読取方向判定方法が得られるという効果を奏す
る。
【0247】また、請求項16の発明によれば、請求項
14の発明において、行列の両方にピーク位置がある場
合にブロック上でピーク位置がくる辺側を帳票の正位置
での上辺側もしくは左辺側として判定に加味することが
可能な帳票読取方向判定方法が得られるという効果を奏
する。
【0248】また、請求項17の発明によれば、読み取
られた帳票のイメージから罫線項目およびブロックを抽
出して、横長,縦長の罫線項目の割合、複数のブロック
が接触する位置の関係、ブロックとそのブロック外の文
字列との位置関係、および行列方向での罫線項目内の記
入によるピーク位置の関係の2つ以上の組み合わせで最
終的に帳票の読み取り方向を判定する工程にしたので、
ひとつの判定基準だけにとらわれず、複数の判定基準に
より判定結果の偏りが分散され、これによって、より正
確な帳票の読み取り方向を確認することが可能な帳票読
取方向判定方法が得られるという効果を奏する。
【0249】また、請求項18の発明によれば、請求項
11〜17のいずれか一つの発明において、帳票の読み
取り方向に従って帳票のイメージデータを正位置に回転
補正する工程にしたので、請求項11〜17のいずれか
の発明により得られた帳票の読み取り方向に従って自動
的に帳票のイメージを正確に補正することが可能な帳票
読取方向判定方法が得られるという効果を奏する。
【図面の簡単な説明】
【図1】この発明の一実施の形態にかかる帳票処理装置
の全体構成を示す機能ブロック図である。
【図2】この発明の一実施の形態による帳票処理装置に
適用される帳票読取方向判定装置の構成を機能的に示す
機能ブロック図である。
【図3】この実施の形態において帳票のフォーマットの
一例を示す図である。
【図4】この実施の形態において帳票のフォーマットの
他の例を示す図である。
【図5】この実施の形態において帳票のフォーマットの
さらに他の例を示す図である。
【図6】この実施の形態による帳票読取方向判定処理を
説明するフローチャートである。
【図7】この実施の形態においてラベリング処理を視覚
的に説明する図である。
【図8】図6に示した帳票読取方向判定処理における横
長判定処理を説明するフローチャートである。
【図9】図6に示した帳票読取方向判定処理におけるブ
ロック判定処理を説明するフローチャートである。
【図10】図6に示した帳票読取方向判定処理における
文字列判定処理を説明するフローチャートである。
【図11】図6に示した帳票読取方向判定処理における
記入判定処理を説明するフローチャートである。
【図12】図6に示した帳票読取方向判定処理における
記入判定処理を説明するフローチャートである。
【図13】図12の記入判定処理を説明する帳票の一例
を示す図である。
【図14】図12の記入判定処理を説明する帳票の一例
を示す図である。
【図15】一般的な帳票処理装置のシステム構成を示す
模式図である。
【図16】図15に示した帳票処理装置の動作の一例を
説明する図である。
【図17】図15に示した帳票処理装置の動作の変形例
を示す図である。
【図18】従来例によるイメージデータの基準点の抽出
方法を説明する図である。
【図19】従来例によるイメージデータの回転補正処理
を説明する図である。
【符号の説明】
100 処理システム 101 アプリケーションプログラム 200 レイアウト認識プログラム 201 レイアウト認識エンジン制御部 202 ラベリング処理部 203 罫線項目抽出処理部 204 回転方向判定処理部 205 イメージ回転処理部 206 レイアウト解析処理部 207 認識項目抽出処理部 208 文字認識処理部 300 キーボード 400 イメージスキャナ 500 ハードディスク 600 ディスプレイ
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成10年6月9日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0017
【補正方法】変更
【補正内容】
【0017】帳票処理装置等においては、読み取られた
イメージデータのレイアウトと定義体情報におけるレイ
アウトとを一致させてからイメージデータの文字認識を
行なわないと、文字認識処理が正常に行なわれないこと
がある。このため、まず、それぞれのイメージの基準点
を抽出してそれぞれのイメージの基準点からの座標を比
較しレイアウトの一致の判定を行なっている。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0068
【補正方法】変更
【補正内容】
【0068】この帳票処理装置30は、例えば金融機関
の各支店(営業店)毎に設置されたクライアントと、地
区センタに設置されたサーバとが、交換回線等を介して
接続されることにより構成され、営業店における帳票
処理を地区センタのサーバにより一括して行なうシステ
ムに適用可能である。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0079
【補正方法】変更
【補正内容】
【0079】なお、ラベリング処理によるラベル画像の
作成処理は、入力されたイメージデータ(2値画像デー
タ)から連結成分(2値画像において1つに繋がった画
像の成分)を算出して、連結成分にラベルを付けたラ
ベル画像を作成する処理のことである。なお、このラベ
リング処理については、例えば「連結領域の抽出装置お
よび方法」(特開平08−55219号)が公知であ
る。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0085
【補正方法】変更
【補正内容】
【0085】また、レイアウトDB14には、レイアウ
ト解析処理部2でのレイアウト解析結果を補正するため
のレイアウト補正情報が格納されている。この実施の形
態においては、後述するレイアウト編集処理部4におい
て、このレイアウト補正情報を用いレイアウト解析結
果を補正することにより、その後の処理を高い精度で行
なえるようになっている。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0092
【補正方法】変更
【補正内容】
【0092】すなわち、この実施の形態においては、レ
イアウトDB14が圧縮した候補レイアウト情報を記憶
して、レイアウト照合処理3において圧縮処理したレ
イアウト情報を作成して圧縮したレイアウト情報どうし
を照合することにより、レイアウト照合処理の高速化を
図っているのである。
【手続補正6】
【補正対象書類名】明細書
【補正対象項目名】0100
【補正方法】変更
【補正内容】
【0100】さらに、知識処理部7は、文字認識処理部
6の認識結果コードデータを、認識結果の補正情報を記
録した知識データベース(知識DB)15を参照し
正し、文字認識結果22とし出力する。
【手続補正7】
【補正対象書類名】明細書
【補正対象項目名】0105
【補正方法】変更
【補正内容】
【0105】さらに、クライアント10においては、デ
ィスプレイ表示された認識対象イメージと対応するレイ
アウト認識結果20や文字認識結果22がオペレータに
より確認され、必要に応じレイアウト認識結果20お
よび文字認識結果22の修正が行なわれる。
【手続補正8】
【補正対象書類名】明細書
【補正対象項目名】0106
【補正方法】変更
【補正内容】
【0106】なお、図1に示す帳票処理装置30は、上
述したレイアウト認識処理ブロック16,文字認識処理
ブロック17およびオペレータ確認/修正処理ブロック
18のほかに、レイアウトログ情報作成処理部11およ
び知識ログ情報作成処理部12も備えている。
【手続補正9】
【補正対象書類名】明細書
【補正対象項目名】0164
【補正方法】変更
【補正内容】
【0164】処理がステップS50に移行すると、つ
ぎの縦横判定を行うための罫線項目が存在するかを判定
する。この縦横判定がすべて終了した場合には、処理は
ステップS507に移行して、横長のカウント数HNに
対する縦長のカウント数VNの比率を求める。
【手続補正10】
【補正対象書類名】明細書
【補正対象項目名】0166
【補正方法】変更
【補正内容】
【0166】また、もし縦長の罫線項目の数が横長の罫
線項目の数の2倍以上存在していた場合には(ステップ
S507)、振り込み依頼書の読み込み方向が正位置か
ら90度とする判定領域、正位置から270度とする判
定領域にそれぞれ横長判定結果としての重みが加算され
る(ステップS509)。すなわち、この横長判定で
は、振り込み依頼書が90度もしくは270度回転させ
て読み込まれたものとして判定結果が得られる。
【手続補正11】
【補正対象書類名】明細書
【補正対象項目名】0213
【補正方法】変更
【補正内容】
【0213】このステップS809では、まず、行方向
のピーク位置が判定される。図14の例では、行方向の
ピーク位置は図13のときと同様に上側となることか
ら、処理はステップS810に移行する。このステップ
S810では、さらに列方向のピーク位置が判定され
る。図14の例では、列方向のピーク位置が左側となる
ことから、処理はステップS813に移行する。このス
テップS813では、正位置から0度とする判定領域に
記入判定の重みが加算される。すなわち、振り込み依頼
AAが正位置から時計方向に0度回転させた状態で読
み取られたという判定結果を得ることになる。この後、
処理は図6のメイン処理に戻る。
【手続補正12】
【補正対象書類名】明細書
【補正対象項目名】0214
【補正方法】変更
【補正内容】
【0214】また、図14に示した振り込み依頼書AA
が正位置より90度回転させて読み込まれた場合には、
行方向のピーク位置は上側となり(ステップS80
9)、列方向のピーク位置は右側となる(ステップS8
10)。したがって、処理はステップS814に移行す
る。このステップS814では、正位置から90度とす
る判定領域に記入判定の重みが加算される。すなわち、
振り込み依頼書AAが正位置から時計方向に90度回転
させた状態で読み取られたという判定結果を得ることに
なる。この後、処理は図6のメイン処理に戻る。
【手続補正13】
【補正対象書類名】明細書
【補正対象項目名】0215
【補正方法】変更
【補正内容】
【0215】また、ステップS810において列方向の
ピーク位置が真中であった場合には、行方向のピーク位
置の判定が重要視され、処理はステップS813に移行
する。すなわち、振り込み依頼書AAが正位置から時計
方向に0度回転させた状態で読み取られたという判定結
果を得ることになる。
【手続補正14】
【補正対象書類名】明細書
【補正対象項目名】0216
【補正方法】変更
【補正内容】
【0216】また、図14に示した振り込み依頼書AA
が正位置より180度回転させて読み込まれた場合に
は、行方向のピーク位置は下側となり(ステップS80
9)、列方向のピーク位置は右側となる(ステップS8
11)。したがって、処理はステップS815に移行す
る。このステップS815では、正位置から180度と
する判定領域に記入判定の重みが加算される。すなわ
ち、振り込み依頼書AAが正位置から時計方向に180
度回転させた状態で読み取られたという判定結果を得る
ことになる。この後、処理は図6のメイン処理に戻る。
【手続補正15】
【補正対象書類名】明細書
【補正対象項目名】0217
【補正方法】変更
【補正内容】
【0217】また、図14に示した振り込み依頼書AA
が正位置より270度回転させて読み込まれた場合に
は、行方向のピーク位置は下側となり(ステップS80
9)、列方向のピーク位置は左側となる(ステップS8
11)。したがって、処理はステップS816に移行す
る。このステップS816では、正位置から270度と
する判定領域に記入判定の重みが加算される。すなわ
ち、振り込み依頼書AAが正位置から時計方向に270
度回転させた状態で読み取られたという判定結果を得る
ことになる。この後、処理は図6のメイン処理に戻る。
【手続補正16】
【補正対象書類名】明細書
【補正対象項目名】0218
【補正方法】変更
【補正内容】
【0218】また、ステップS811において列方向の
ピーク位置が真中であった場合には、行方向のピーク位
置の判定が重要視され、処理はステップS815に移行
する。すなわち、振り込み依頼書AAが正位置から時計
方向に180度回転させた状態で読み取られたという判
定結果を得ることになる。この後、処理は図6のメイン
処理に戻る。
【手続補正17】
【補正対象書類名】明細書
【補正対象項目名】0219
【補正方法】変更
【補正内容】
【0219】また、図14に示した振り込み依頼書AA
の記入内容が異なり、ステップS809において行方向
のピーク位置が真中という判定結果が得られた場合に
は、処理はステップS812に移行する。このステップ
S812において、さらに列方向のピーク位置が判定さ
れる。そして、列方向のピーク位置が左側という判定結
果が得られた場合には(ステップS812)、列方向の
ピーク位置が重要視され、処理はステップS813に移
行する。すなわち、振り込み依頼書AAが正位置から時
計方向に0度回転させた状態で読み取られたという判定
結果を得ることになる。この後、処理は図6のメイン処
理に戻る。
【手続補正18】
【補正対象書類名】明細書
【補正対象項目名】0220
【補正方法】変更
【補正内容】
【0220】また、列方向のピーク位置が右側という判
定結果が得られた場合には(ステップS812)、列方
向のピーク位置が重要視され、処理はステップS815
に移行する。すなわち、振り込み依頼書AAが正位置か
ら時計方向に180度回転させた状態で読み取られたと
いう判定結果を得ることになる。この後、処理は図6の
メイン処理に戻る。
【手続補正19】
【補正対象書類名】明細書
【補正対象項目名】0222
【補正方法】変更
【補正内容】
【0222】さて、以上の動作説明では、0度、90
度、180度、270度それぞれについて重みを加算
ものが回転方向別の最終的な重みとなる。これらの重
みは、回転方向判定処理部204において加重合計され
ることになるが、上記0度、90度、180度、270
度の各回転方向は正位置からどれだけ回転しているかを
示すものである。したがって、イメージ回転処理部20
5で回転補正する場合には、読み取ったイメージデータ
について、最終的に得られた回転方向に戻すか、それと
も360度からその回転方向を差し引いた結果だけさら
に回転を進めて正位置を得るようにする。
【手続補正20】
【補正対象書類名】図面
【補正対象項目名】図1
【補正方法】変更
【補正内容】
【図1】
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松野 秀樹 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 千葉 亘一 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内 (72)発明者 小原 勝利 神奈川県川崎市中原区上小田中4丁目1番 1号 富士通株式会社内

Claims (18)

    【特許請求の範囲】
  1. 【請求項1】 任意のフォーマットで情報が記入された
    帳票から読み取られたイメージから、該帳票に記入され
    たフォーマットのレイアウトの特徴を抽出する特徴抽出
    手段と、 前記特徴抽出手段により抽出されたレイアウトの特徴に
    基づいて前記帳票の読み取り方向を判定する判定手段
    と、 を備えたことを特徴とする帳票読取方向判定装置。
  2. 【請求項2】 縦横方向に配列された罫線で囲まれた矩
    形の内でこれ以上細分化できない矩形によって形成され
    る複数の罫線項目を有する帳票であって、該帳票を任意
    の一辺から読み取って得られたイメージデータに基づい
    て前記帳票を形成する罫線項目を抽出する抽出手段と、 前記抽出手段により抽出された罫線項目の形状および配
    列に従って前記帳票の読み取り方向を判定する判定手段
    と、 を備えたことを特徴とする帳票読取方向判定装置。
  3. 【請求項3】 縦横方向に配列された罫線で囲まれた矩
    形の内でこれ以上細分化できない矩形によって形成され
    る複数の罫線項目を有する帳票であって、該帳票を任意
    の一辺から読み取って得られたイメージデータに基づい
    て前記帳票を形成する罫線項目を抽出する抽出手段と、 前記抽出手段により抽出された罫線項目の内で横長の形
    状をもつ罫線項目の数に対する縦長の罫線項目の数の割
    合に従って前記帳票の読み取り方向を判定する判定手段
    と、 を備えたことを特徴とする帳票読取方向判定装置。
  4. 【請求項4】 縦横方向に配列された罫線で囲まれた矩
    形の内でこれ以上細分化できない矩形によって形成され
    る複数の罫線項目を有する帳票であって、該帳票を任意
    の一辺から読み取って得られたイメージデータに基づい
    て、前記帳票を形成する罫線項目、および罫線で囲まれ
    た矩形の内でこれ以上罫線項目を結合できない矩形によ
    って形成されるブロックを抽出する抽出手段と、 前記抽出手段により複数のブロックが抽出された場合に
    のみ、前記複数のブロック間で矩形サイズが一番大きい
    ブロックに接触する他のブロックの接触位置を判定し、
    該判定された接触位置に基づいて前記帳票の読み取り方
    向を判定する判定手段と、 を備えたことを特徴とする帳票読取方向判定装置。
  5. 【請求項5】 縦横方向に配列された罫線で囲まれた矩
    形の内でこれ以上細分化できない矩形によって形成され
    る複数の罫線項目を有する帳票であって、該帳票を任意
    の一辺から読み取って得られたイメージデータに基づい
    て、前記帳票を形成する罫線項目、および罫線で囲まれ
    た矩形の内でこれ以上罫線項目を結合できない矩形によ
    って形成されるブロックを抽出する抽出手段と、 前記イメージデータに基づいて前記抽出手段により抽出
    されたブロック外に有効な文字列のイメージが存在する
    か否かを判定し、前記有効な文字列のイメージが存在す
    る場合に前記抽出手段により抽出されたブロックと前記
    有効なイメージとの位置関係に従って前記帳票の読み取
    り方向を判定する判定手段と、 を備えたことを特徴とする帳票読取方向判定装置。
  6. 【請求項6】 前記判定手段は、 前記イメージデータに基づいて前記抽出手段により抽出
    された罫線項目の行列方向に向かって前記各罫線項目内
    の記入の有無をカウントして各行列の合計カウント値を
    求めるカウント手段と、 前記カウント手段により求められた前記各行列の合計カ
    ウント値に基づいて行方向,列方向それぞれのピーク位
    置を判定するピーク位置判定手段と、 を有し、 判定の際に、前記ピーク位置判定手段により判定された
    行方向のピーク位置と列方向のピーク位置との関係を加
    味することを特徴とする請求項3〜5のいずれか一つに
    記載の帳票読取方向判定装置。
  7. 【請求項7】 前記判定手段は、前記ピーク位置判定手
    段により行方向と列方向とのいずれか一方にしかピーク
    位置が判定されなかった場合、罫線で囲まれた矩形の内
    でこれ以上罫線項目を結合できない矩形によって形成さ
    れるブロックにおいて前記判定されたピーク位置がくる
    辺側を前記帳票の正位置での上辺側として判定に加味す
    ることを特徴とする請求項6に記載の帳票読取方向判定
    装置。
  8. 【請求項8】 前記判定手段は、前記ピーク位置判定手
    段により行方向と列方向との両方にピーク位置が判定さ
    れた場合、罫線で囲まれた矩形の内でこれ以上罫線項目
    を結合できない矩形によって形成されるブロックにおい
    て前記判定されたピーク位置がくる辺側を前記帳票の正
    位置での上辺側もしくは左辺側として判定に加味するこ
    とを特徴とする請求項6に記載の帳票読取方向判定装
    置。
  9. 【請求項9】 縦横方向に配列された罫線で囲まれた矩
    形の内でこれ以上細分化できない矩形によって形成され
    る複数の罫線項目を有する帳票であって、該帳票を任意
    の一辺から読み取って得られたイメージデータに基づい
    て、前記帳票を形成する罫線項目、および罫線で囲まれ
    た矩形の内でこれ以上罫線項目を結合できない矩形によ
    って形成されるブロックを抽出する抽出手段と、 前記抽出手段により抽出された罫線項目の内で横長の形
    状をもつ罫線項目の数に対する縦長の罫線項目の数の割
    合に従って前記帳票の読み取り方向を判定する第1判定
    手段と、 前記抽出手段により複数のブロックが抽出された場合に
    のみ、前記複数のブロック間で矩形サイズが一番大きい
    ブロックに接触する他のブロックの接触位置を判定し、
    該判定された接触位置に基づいて前記帳票の読み取り方
    向を判定する第2判定手段と、 前記イメージデータに基づいて前記抽出手段により抽出
    されたブロック外に有効な文字列のイメージが存在する
    か否かを判定し、前記有効な文字列のイメージが存在す
    る場合に前記抽出手段により抽出されたブロックと前記
    有効なイメージとの位置関係に従って前記帳票の読み取
    り方向を判定する第3判定手段と、 前記イメージデータに基づいて前記抽出手段により抽出
    された罫線項目の行列方向に向かって前記各罫線項目内
    の記入の有無をカウントして行方向,列方向それぞれの
    ピーク位置を判定し、その判定された行方向のピーク位
    置と列方向のピーク位置との関係から前記帳票の読み取
    り方向を判定する第4判定手段と、 前記第1〜第4判定手段の内の少なくとも2つ以上の組
    み合わせにより得られた判定結果を加重合計して最終的
    に前記帳票の読み取り方向を判定する判定手段と、 を備えたことを特徴とする帳票読取方向判定装置。
  10. 【請求項10】 さらに、前記判定手段により判定され
    た前記帳票の読み取り方向に従って前記帳票のイメージ
    データを正位置に回転補正するイメージ回転手段を有し
    たことを特徴とする請求項1〜9のいずれか一つに記載
    の帳票読取方向判定装置。
  11. 【請求項11】 縦横方向に配列された罫線で囲まれた
    矩形の内でこれ以上細分化できない矩形によって形成さ
    れる複数の罫線項目を有する帳票であって、該帳票を任
    意の一辺から読み取って得られたイメージデータに基づ
    いて前記帳票を形成する罫線項目を抽出する第1工程
    と、 前記第1工程により抽出された罫線項目の内で横長の形
    状をもつ罫線項目の数に対する縦長の罫線項目の数の割
    合に従って前記帳票の読み取り方向を判定する第2工程
    と、 を含んだことを特徴とする帳票読取方向判定方法。
  12. 【請求項12】 縦横方向に配列された罫線で囲まれた
    矩形の内でこれ以上細分化できない矩形によって形成さ
    れる複数の罫線項目を有する帳票であって、該帳票を任
    意の一辺から読み取って得られたイメージデータに基づ
    いて、前記帳票を形成する罫線項目、および罫線で囲ま
    れた矩形の内でこれ以上罫線項目を結合できない矩形に
    よって形成されるブロックを抽出する第1工程と、 前記第1工程により複数のブロックが抽出された場合に
    のみ、前記複数のブロック間で矩形サイズが一番大きい
    ブロックに接触する他のブロックの接触位置を判定し、
    該判定された接触位置に基づいて前記帳票の読み取り方
    向を判定する第2工程と、 を含んだことを特徴とする帳票読取方向判定方法。
  13. 【請求項13】 縦横方向に配列された罫線で囲まれた
    矩形の内でこれ以上細分化できない矩形によって形成さ
    れる複数の罫線項目を有する帳票であって、該帳票を任
    意の一辺から読み取って得られたイメージデータに基づ
    いて、前記帳票を形成する罫線項目、および罫線で囲ま
    れた矩形の内でこれ以上罫線項目を結合できない矩形に
    よって形成されるブロックを抽出する第1工程と、 前記イメージデータに基づいて前記第1工程により抽出
    されたブロック外に有効な文字列のイメージが存在する
    か否かを判定し、前記有効な文字列のイメージが存在す
    る場合に前記第1工程により抽出されたブロックと前記
    有効なイメージとの位置関係に従って前記帳票の読み取
    り方向を判定する第2工程と、 を含んだことを特徴とする帳票読取方向判定方法。
  14. 【請求項14】 前記第2工程は、 前記イメージデータに基づいて前記抽出手段により抽出
    された罫線項目の行列方向に向かって前記各罫線項目内
    の記入の有無をカウントして各行列の合計カウント値を
    求める第3工程と、 前記第3工程により求められた前記各行列の合計カウン
    ト値に基づいて行方向,列方向それぞれのピーク位置を
    判定する第4工程と、 を含み、 判定の際に、前記第4工程により判定された行方向のピ
    ーク位置と列方向のピーク位置との関係を加味すること
    を特徴とする請求項11〜13のいずれか一つに記載の
    帳票読取方向判定方法。
  15. 【請求項15】 前記第2工程は、前記第4工程により
    行方向と列方向とのいずれか一方にしかピーク位置が判
    定されなかった場合、罫線で囲まれた矩形の内でこれ以
    上罫線項目を結合できない矩形によって形成されるブロ
    ックにおいて前記判定されたピーク位置がくる辺側を前
    記帳票の正位置での上辺側として判定に加味することを
    特徴とする請求項14に記載の帳票読取方向判定方法。
  16. 【請求項16】 前記第2工程は、前記第4工程により
    行方向と列方向との両方にピーク位置が判定された場
    合、罫線で囲まれた矩形の内でこれ以上罫線項目を結合
    できない矩形によって形成されるブロックにおいて前記
    判定されたピーク位置がくる辺側を前記帳票の正位置で
    の上辺側もしくは左辺側として判定に加味することを特
    徴とする請求項14に記載の帳票読取方向判定方法。
  17. 【請求項17】 縦横方向に配列された罫線で囲まれた
    矩形の内でこれ以上細分化できない矩形によって形成さ
    れる複数の罫線項目を有する帳票であって、該帳票を任
    意の一辺から読み取って得られたイメージデータに基づ
    いて、前記帳票を形成する罫線項目、および罫線で囲ま
    れた矩形の内でこれ以上罫線項目を結合できない矩形に
    よって形成されるブロックを抽出する第1工程と、 前記第1工程により抽出された罫線項目の内で横長の形
    状をもつ罫線項目の数に対する縦長の罫線項目の数の割
    合に従って前記帳票の読み取り方向を判定する第2工程
    手段と、 前記第1工程により複数のブロックが抽出された場合に
    のみ、前記複数のブロック間で矩形サイズが一番大きい
    ブロックに接触する他のブロックの接触位置を判定し、
    該判定された接触位置に基づいて前記帳票の読み取り方
    向を判定する第3工程と、 前記イメージデータに基づいて前記第1工程により抽出
    されたブロック外に有効な文字列のイメージが存在する
    か否かを判定し、前記有効な文字列のイメージが存在す
    る場合に前記抽出手段により抽出されたブロックと前記
    有効なイメージとの位置関係に従って前記帳票の読み取
    り方向を判定する第4工程と、 前記イメージデータに基づいて前記第1工程により抽出
    された罫線項目の行列方向に向かって前記各罫線項目内
    の記入の有無をカウントして行方向,列方向それぞれの
    ピーク位置を判定し、その判定された行方向のピーク位
    置と列方向のピーク位置との関係から前記帳票の読み取
    り方向を判定する第5工程と、 前記第2〜第5工程の内の少なくとも2つ以上の組み合
    わせにより得られた判定結果を加重合計して最終的に前
    記帳票の読み取り方向を判定する第6工程と、 を含んだことを特徴とする帳票読取方向判定方法。
  18. 【請求項18】 さらに、前記判定された前記帳票の読
    み取り方向に従って前記帳票のイメージデータを正位置
    に回転補正する工程を含んだことを特徴とする請求項1
    1〜17のいずれか一つに記載の帳票読取方向判定方
    法。
JP9262543A 1997-09-26 1997-09-26 帳票読取方向判定装置および帳票読取方向判定方法 Pending JPH11102416A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9262543A JPH11102416A (ja) 1997-09-26 1997-09-26 帳票読取方向判定装置および帳票読取方向判定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9262543A JPH11102416A (ja) 1997-09-26 1997-09-26 帳票読取方向判定装置および帳票読取方向判定方法

Publications (1)

Publication Number Publication Date
JPH11102416A true JPH11102416A (ja) 1999-04-13

Family

ID=17377280

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9262543A Pending JPH11102416A (ja) 1997-09-26 1997-09-26 帳票読取方向判定装置および帳票読取方向判定方法

Country Status (1)

Country Link
JP (1) JPH11102416A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280346A (ja) * 2006-03-15 2007-10-25 Ricoh Co Ltd 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP2016081380A (ja) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 帳票処理プログラム及び帳票処理装置
JP2018032076A (ja) * 2016-08-22 2018-03-01 富士通フロンテック株式会社 帳票処理プログラム、帳票処理装置及び帳票処理方法
JP2020046860A (ja) * 2018-09-18 2020-03-26 株式会社三菱Ufj銀行 帳票読取装置
JP2022029645A (ja) * 2020-08-05 2022-02-18 booost technologies株式会社 電力会社切替システム、電力会社の切替方法および電力会社切替プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0423185A (ja) * 1990-05-18 1992-01-27 Fuji Facom Corp 自動セル属性判定機能を有する表読取装置
JPH05120356A (ja) * 1991-10-29 1993-05-18 Konica Corp 個人情報読取り記憶装置
WO1997005561A1 (fr) * 1995-07-31 1997-02-13 Fujitsu Limited Processeur de supports et procede de traitement de supports

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0423185A (ja) * 1990-05-18 1992-01-27 Fuji Facom Corp 自動セル属性判定機能を有する表読取装置
JPH05120356A (ja) * 1991-10-29 1993-05-18 Konica Corp 個人情報読取り記憶装置
WO1997005561A1 (fr) * 1995-07-31 1997-02-13 Fujitsu Limited Processeur de supports et procede de traitement de supports

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007280346A (ja) * 2006-03-15 2007-10-25 Ricoh Co Ltd 画像処理装置、画像方向判別方法、および画像方向判別プログラム
JP2016081380A (ja) * 2014-10-20 2016-05-16 富士通フロンテック株式会社 帳票処理プログラム及び帳票処理装置
JP2018032076A (ja) * 2016-08-22 2018-03-01 富士通フロンテック株式会社 帳票処理プログラム、帳票処理装置及び帳票処理方法
JP2020046860A (ja) * 2018-09-18 2020-03-26 株式会社三菱Ufj銀行 帳票読取装置
JP2022029645A (ja) * 2020-08-05 2022-02-18 booost technologies株式会社 電力会社切替システム、電力会社の切替方法および電力会社切替プログラム

Similar Documents

Publication Publication Date Title
JP3088019B2 (ja) 媒体処理装置及び媒体処理方法
US6885769B2 (en) Business form handling method and system for carrying out the same
US5251273A (en) Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms
Casey et al. Intelligent forms processing system
US7106904B2 (en) Form identification method
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
EP0011388B1 (en) System and method for processing documents
US5235654A (en) Advanced data capture architecture data processing system and method for scanned images of document forms
US8270721B2 (en) Method and system for acquiring data from machine-readable documents
JPH04195692A (ja) 文書読取装置
JPH11102416A (ja) 帳票読取方向判定装置および帳票読取方向判定方法
JP3463008B2 (ja) 媒体処理方法及び媒体処理装置
JP3463009B2 (ja) 媒体処理方法及び媒体処理装置
JPH1173472A (ja) フォーマット情報登録方法及びocrシステム
US11475686B2 (en) Extracting data from tables detected in electronic documents
JP3732254B2 (ja) フォーマット情報生成方法及びフォーマット情報生成装置
US7110600B1 (en) Document identifying device and method
JP2001005804A (ja) 文字認識装置を利用したデータベース登録方法
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
JPH0520494A (ja) 帳票属性認識・表示方法
JP4418823B2 (ja) 帳票識別装置及びその識別方法
JP3790575B2 (ja) 帳簿発行管理装置
JP3648270B2 (ja) 帳票類読取装置及び会計帳票読取装置
CN113610074A (zh) 一种卷式浮动发票识别方法及装置
JPH10154157A (ja) 電子ファイリングシステム

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20030128