JP2001291055A - 帳票認識装置およびそのプログラム記録媒体 - Google Patents

帳票認識装置およびそのプログラム記録媒体

Info

Publication number
JP2001291055A
JP2001291055A JP2000103009A JP2000103009A JP2001291055A JP 2001291055 A JP2001291055 A JP 2001291055A JP 2000103009 A JP2000103009 A JP 2000103009A JP 2000103009 A JP2000103009 A JP 2000103009A JP 2001291055 A JP2001291055 A JP 2001291055A
Authority
JP
Japan
Prior art keywords
definition information
recognition
format
definition
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000103009A
Other languages
English (en)
Other versions
JP4092849B2 (ja
JP2001291055A5 (ja
Inventor
Yukihiro Shinto
幸博 新堂
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2000103009A priority Critical patent/JP4092849B2/ja
Publication of JP2001291055A publication Critical patent/JP2001291055A/ja
Publication of JP2001291055A5 publication Critical patent/JP2001291055A5/ja
Application granted granted Critical
Publication of JP4092849B2 publication Critical patent/JP4092849B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】業務を単に指定するだけで、当該業務対応の複
数の帳票フォーマット定義情報を動的に合成するように
したから、この合成フォーマットに基づいて帳票イメー
ジを文字認識することにより、帳票イメージの読み取り
からその種別を確定するまでの一連の処理を1回の処理
で実行することができ、帳票種別の確定を効率良く実行
する。 【解決手段】処理対象の業務が指定入力された際に、C
PU1は、指定業務に基づいて業務情報ファイルを参照
し、当該業務対応の各帳票を特定すると共に、特定した
各帳票毎に、基本定義ファイルおよびフィールド定義フ
ァイルから読み出した各帳票フォーマット定義情報を合
成する。そして、CPU1はこの基本定義、フィールド
定義の合成フォーマット定義情報にしたがって帳票イメ
ージを文字認識すると共に、その認識結果を帳票毎に分
割してその認識率を比較し、最も認識率の良い帳票を当
該帳票イメージの帳票種別として確定する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、予め設定されて
いる各種の帳票フォーマットを参照して帳票イメージを
文字認識すると共に、その認識状態に応じて当該帳票イ
メージの帳票種別を確定する帳票認識装置およびそのプ
ログラム記録媒体に関する。
【0002】
【従来の技術】従来、帳票イメージを読み取ってデータ
処理する業務用のコンピュータ装置においては、予め設
定されている各種の帳票フォーマットを参照して帳票イ
メージを文字認識した後、各帳票フォーマット毎に文字
認識した認識率に応じて当該帳票イメージの種別を確定
するようにしている。すなわち、帳票毎に設定されてい
る帳票フォーマットを1つずつ読み出し、この帳票フォ
ーマットに基づいて帳票イメージを文字認識する動作を
設定帳票数分繰り返し行うと共に、帳票毎に文字認識し
た認識率を比較し、最も認識率が高い帳票を当該帳票イ
メージの帳票種別として確定するようにしていた。
【0003】
【発明が解決しようとする課題】このように帳票フォー
マット毎にその認識率を求めて比較する方法において
は、予め設定されている帳票フォーマット情報を個別に
順次読出して文字認識する必要があるため、帳票イメー
ジを読み取ってからその種別を確定するまでに行われる
一連の処理は、帳票フォーマット情報の設定数に応じた
回数分必要となる。したがって、その設定数が多い程、
処理回数は増え、帳票種別の確定までに時間がかかり、
処理効率が悪くなって業務処理全体に悪影響を与えてし
まう要因となっていた。
【0004】この発明の課題は、帳票グループを単に指
定するだけで、当該指定グループ対応の複数の帳票フォ
ーマット定義情報を動的に合成するこができ、この合成
フォーマットに基づいて帳票イメージを文字認識するこ
とにより、帳票イメージの読み取りからその種別を確定
するまでの一連の処理を1回の処理で実行することがで
き、帳票種別の確定を効率良く実行できるようにするこ
とである。
【0005】この発明の手段は、次の通りである。請求
項第1記載の発明は、予め設定されている各種の帳票フ
ォーマットを参照して帳票イメージを文字認識すると共
に、各帳票フォーマット毎に文字認識した認識状態に応
じて当該帳票イメージの種別を確定する帳票認識装置に
おいて、帳票毎に設定されている帳票フォーマットを定
義する定義情報を記憶する帳票定義記憶手段と、帳票グ
ループと当該グループに属する各帳票との対応関係を記
憶する帳票グループ記憶手段と、帳票グループが指定さ
れた際に、指定グループに対応付けられている各帳票を
前記帳票グループ記憶手段から読み出すと共に、読み出
した帳票毎にその帳票フォーマット定義情報を前記帳票
定義記憶手段から読み出す読出手段と、この読出手段に
よって読み出された各帳票フォーマット定義情報を合成
した合成フォーマット定義情報を作成する定義合成手段
と、この定義合成手段によって得られた合成フォーマッ
ト定義情報に基づいて帳票イメージを文字認識する文字
認識手段と、この文字認識手段によって認識された認識
結果を各帳票毎に分割すると共に、分割した認識結果の
認識状態を比較検討することにより最も認識状態が良好
な帳票を当該帳票イメージの種別として確定する帳票種
別確定手段とを具備し、帳票グループの指定に基づいて
当該指定グループ対応の各帳票フォーマット定義情報を
動的に合成して帳票種別を確定するようにしたものであ
る。また、コンピュータに対して、上述した各機能を実
行させるためのプログラムコードをそれぞれ記録したコ
ンピュータが読み取り可能な記録媒体を提供するもので
ある。
【0006】なお、この発明は次のようなものであって
もよい。 (1)前記定義合成手段は、合成フォーマット定義情報
を作成する際に、各帳票毎に、そのフォーマット定義情
報を区分して合成し、前記文字認識手段は、前記合成フ
ォーマット定義情報に基づいて帳票イメージを文字認識
する際に、各帳票区分毎に文字認識する。 (2)帳票毎に設定されている帳票フォーマット定義情
報は、基本定義情報と、帳票を構成する各フィールドを
定義するフィールド定義情報とから成り、前記定義合成
手段は、合成フォーマット定義情報を作成する際に、前
記基本定義情報毎、フィールド定義情報毎に分けて合成
する。 (3)前記定義合成手段は、合成フォーマット定義情報
を作成する際に、前記基本定義情報の内容を解析し、そ
の解析結果に基づいて複数の合成フォーマット定義情報
を作成し、前記文字認識手段は、前記基本定義情報の解
析結果に基づいて作成された前記複数の合成フォーマッ
ト定義情報毎に帳票イメージを文字認識し、前記帳票種
別確定手段は、合成フォーマット定義情報毎の認識結果
に基づいて最も認識状態が良好な帳票を当該帳票イメー
ジの種別として確定する。
【0007】したがって、請求項1記載の発明において
は、帳票グループが指定された際に、指定グループに対
応付けられている各帳票毎にその帳票フォーマット定義
情報に基づいて合成フォーマット定義情報を作成し、合
成フォーマット定義情報に基づいて帳票イメージを文字
認識すると共に、その認識結果を各帳票毎に分割して、
その認識状態を比較検討することにより、最も認識状態
が良好な帳票を当該帳票イメージの帳票種別として確定
するようにしたから、帳票グループを単に指定するだけ
で、当該指定グループ対応の複数の帳票フォーマット定
義情報を動的に合成するこができ、この合成フォーマッ
トに基づいて帳票イメージを文字認識することにより、
帳票イメージの読み取りからその種別を確定するまでの
一連の処理を1回の処理で実行することができる。
【0008】
【発明の実施の形態】(第1実施形態)以下、図1〜図
13を参照してこの発明の第1実施形態を説明する。図
1は、この実施形態における帳票認識機能付データ処理
装置の全体構成を示したブロック図である。この帳票認
識機能付データ処理装置は、帳票イメージを読み取ると
共に、読み取った帳票イメージを文字認識し、その認識
率に応じて当該帳票の種別を確定するようにしたもので
ある。すなわち、処理対象の業務が指定されると、当該
業務対応の各帳票フォーマット定義情報を動的に合成
し、この合成フォーマット定義情報にしたがって帳票イ
メージを文字認識し、その認識結果を帳票毎に分割して
その認識率を比較することにより、その認識率に応じて
当該帳票の種別を確定するようにしたものであり、帳票
イメージの読み取りからその種別を確定するまでの一連
の処理を1回の処理で実行可能とし、処理効率の大幅な
向上を期待できるようにしたことを特徴としている。な
お、この実施形態の特徴部分を詳述する前に、この実施
形態のハードウェア上の構成について以下、説明してお
く。
【0009】CPU1は、記憶装置2内のオペレーティ
ングシステムや各種アプリケーションソフトにしたがっ
て帳票認識機能付データ処理装置の全体動作を制御する
中央演算処理装置である。記憶装置2は、オペレーティ
ングシステムや各種アプリケーションソフトの他、デー
タベース、文字フォント等が格納され、磁気的、光学
的、半導体メモリ等によって構成されている記録媒体3
やその駆動系を有している。この記録媒体3はハードデ
ィスク等の固定的な媒体若しくは着脱自在に装着可能な
CD−ROM、フロッピィデスク、RAMカード、磁気
カード等の可搬型の媒体である。また、この記録媒体3
内のプログラムやデータは、必要に応じてCPU1の制
御によりRAM(例えば、スタティクRAM)4にロー
ドされたり、RAM4内のデータが記録媒体3にセーブ
される。更に、記録媒体はサーバ等の外部機器側に設け
られているものであってもよく、CPU1は伝送媒体を
介してこの記録媒体内のプログラム/データを直接アク
セスして使用することもできる。また、CPU1は記録
媒体3内に格納されるその一部あるいは全部を他の機器
側から伝送媒体を介して取り込み、記録媒体3に新規登
録あるいは追加登録することもできる。すなわち、コン
ピュータ通信システムを構成する他の機器から通信回線
やケーブル等の有線伝送路あるいは電波、マイクロウエ
ーブ、赤外線等の無線伝送路を介して送信されてきたプ
ログラム/データを伝送制御部5によって受信して記録
媒体3内にインストールすることができる。更に、プロ
グラム/データはサーバ等の外部機器側で記憶管理され
ているものであってもよく、CPU1は伝送媒体を介し
て外部機器側のプログラム/データを直接アクセスして
使用することもできる。
【0010】一方、CPU1にはその入出力周辺デバイ
スである伝送制御部5、入力部6、表示部7、イメージ
スキャナ8がバスラインを介して接続されており、入出
力プログラムにしたがってCPU1はそれらの動作を制
御する。伝送制御部5は、例えば、通信モデムや赤外線
モジュールあるいはアンテナ等を含む通信インターフェ
イスである。入力部6はキーボードやタッチパネルある
いはマウスやタッチ入力ペン等のポインティングデバイ
スを構成する操作部であり、文字列データや各種コマン
ドを入力する。なお、表示部7は、フルカラー表示を行
う液晶やCRTあるいはプラズマ表示装置などであり、
イメージスキャナ8は帳票イメージを読み取る定置式ス
キャナである。
【0011】図2は、このデータ処理装置内に格納され
ている各種のファイルを示した図である。業務情報ファ
イルF1は、業務内容に応じて当該業務で使用される各
種の帳票を定義するもので、図7(A)、図8(B)
は、業務情報ファイルF1の内容を例示している。すな
わち、図7(A)は業務で使用される帳票、、
を示し、図8(B)は、業務で使用される帳票、
を示している。このように業務情報ファイルF1は、グ
ループ(業務)毎に、その業務で使用される各帳票との
対応関係を記憶する構成となっている。基本定義ファイ
ルF2は、全業務分の各帳票に対応して帳票サイズ、位
置合わせ用のエッジマーク有無等を定義する基本定義情
報を記憶し、フィールド定義ファイルF3は、各帳票に
対応して帳票を構成する各フィールドを定義する定義情
報を記憶する構成となっている。
【0012】図3〜図6において(A)は、帳票、
、、のフォーマットを概念的に示した図であり、
(B)は帳票、、、に対応する基本定義ファイ
ルF2の記憶内容を示している。また、(C)は帳票
、、、に対応するフィールド定義ファイルF3
の記憶内容を示している。基本定義ファイルF2には、
帳票サイズとして横サイズ、縦サイズが設定されている
と共に、エッジマークの有無を示す情報およびエッジマ
ークが有る場合には、そのマークの開始位置、間隔が設
定され、更に、タイミングマークの有無等が設定されて
いる。例えば、帳票の基本フォーマットは、帳票サイ
ズが横200mm、縦150mm、エッジマークが有
り、その開始(20mm、20mm)、間隔(150m
m、110mm)、タイミングマーク無しが設定されて
いる。フィールド定義ファイルF3には、各フィールド
毎に、「文字種」、「文字数」、「領域」を示すフィー
ルド情報が設定されている。例えば、帳票は、3つの
フィールドを有し、各フィールドの文字種として、「活
字数字」が設定され、また、その文字数として「26」
が設定され、更に、各領域を特定する左上始点座標、右
下終点座標が設定されている。
【0013】合成基本定義ファイルF4は、業務で使用
される各帳票の基本定義を合成することによって得られ
た合成基本定義情報を記憶するもので、図7(B)は、
業務の合成基本定義情報、図8(B)は、業務の合
成基本定義情報を例示している。なお、業務対応の各帳
票に対応付けられている基本定義ファイルF2の内容を
どのように合成するの合成方法については、後述する。
図7(C)は、帳票、、の各フィールドを概念的
に重ね合わせた状態を示した図、図8(C)は、帳票
、の各フィールドを概念的に重ね合わせた状態を示
した図である。合成フィールド定義ファイルF5は、業
務で使用される各帳票のフィールド定義を合成すること
によって得られた合成フィールド定義情報を記憶するも
ので、図7(D)は、業務の合成フィールド定義情
報、図8(D)は、業務の合成フィールド定義情報を
例示している。ここで、業務対応の各帳票に対応付けら
れている基本定義ファイルF2の内容を合成する場合、
一連のシリアルNo.である合成フィールドNo.に対応し
て、帳票毎、フィールド毎にフィールド定義情報を順次
書き込むことにより複数帳票分の合成フィールド定義を
生成するようにしている。なお、合成フィールド定義フ
ァイルF5に1帳票分のフィールド定義情報を書き込む
毎に、そのフィールド定義情報の書き込み範囲と帳票と
の対応関係を記憶管理するようにしている。
【0014】帳票画像ファイルF6は、イメージスキャ
ナ8によって読み取られた帳票イメージが一時記憶され
るものであり、CPU1はこの帳票画像ファイルF6内
の帳票イメージに基づいて文字認識する。認識データフ
ァイルF7は、各帳票フォーマットの定義情報を参照し
て帳票イメージを文字認識した際に、その認識結果を帳
票毎に記憶保持するもので、図9は、この認識データフ
ァイルF7のデータ構成を示している。すなわち、認識
データファイルF7は、帳票毎、フィールド毎に、「フ
ィールド番号」、「認識データ」、「認識率」、「フィ
ールド番号」、‥‥を記憶する構成となっている。この
場合、CPU1は、この認識データファイルF7の内容
を帳票別に読出し、各フィールドの「認識率」を合計し
た値を比較することで、その値が最も大きい帳票を当該
帳票の種別として確定するようにしている。
【0015】次に、この第1実施形態における帳票認識
処理を図10〜図13に示すフローチャートを参照して
説明する。ここで、これらのフローチャートに記述され
ている各機能を実現するためのプログラムは、読み取り
可能なプログラムコードの形態で記録媒体3に格納され
ており、CPU1はこのプログラムコードにしたがった
動作を逐次実行する。また、CPU1は伝送媒体を介し
て伝送されてきた上述のプログラムコードにしたがった
動作を逐次実行することもできる。このことは後述する
他の実施形態においても同様であり、記録媒体の他、伝
送媒体を介して外部供給されたプログラム/データを利
用してこの実施形態特有の動作を実行することもでき
る。
【0016】図10は、帳票認識処理の全体動作を示し
たフローチャートである。先ず、会社組織において、帳
票を処理する際に、自己の業務を指定すると、CPU1
は指定業務に基づいて業務情報ファイルF1を検索し、
当該業務で使用される複数の帳票が選択候補として取得
する(ステップA1)。いま、業務が指定されたもの
とすると、図7(A)に示すように、当該業務対応の候
補として帳票、、が選択される。そして、選択さ
れた複数の帳票に基づいて基本定義ファイルF2、フィ
ールド定義ファイルF3をアクセスし、該当する基本定
義情報、フィールド定義情報を取得すると共に(ステッ
プA2)、取得した各基本定義情報、フィールド定義情
報をRAM4内のワーク域に格納しておく(ステップA
3)。この状態において、指定業務対応の複数の基本定
義情報を合成する基本定義合成処理を行い、その合成結
果を合成基本定義ファイルF4内に格納すると共に、指
定業務対応の複数のフィールド定義情報を合成するフィ
ールド定義合成処理を行いながらその合成結果を合成フ
ィールド定義ファイルF5内に格納する(ステップA4
〜A6)。
【0017】図11は、基本定義合成処理を示したフロ
ーチャートである。先ず、選択候補として取得したワー
ク域内の全帳票の基本定義を読み出して、それらを比較
し、「帳票サイズ」が全て同一かを調べる(ステップB
1)。ここで、同一であれば、その基本サイズを合成サ
イズとして決定するが(ステップB2)、全てが同一で
なければ、各基本定義の帳票サイズを構成する縦幅・横
幅毎に、その値が最も大きいサイズを抽出して、それを
合成サイズとして決定する(ステップB3)。いま、帳
票、、対応の基本定義は、図3(A)〜図5
(A)に示すように設定されており、その中で最大サイ
ズは横幅(200mm)、縦幅(150mm)であるた
め、それが帳票、、の基本定義を合成した合成帳
票サイズとなる。
【0018】次に、選択候補として取得した全帳票の基
本定義のうち、「エッジマークの有無」を比較し、全て
が「エッジマーク有り」に設定されているかを調べ(ス
テップB4)、全てが「エッジマーク有り」に設定され
ていれば、それを基本合成定義として決定するが(ステ
ップB5)、各基本定義の中に「エッジマーク無し」が
1つでも含まれていれば、「エッジマーク無し」を基本
合成定義として決定する(ステップB6)。上述の例で
は、基本合成定義として、「エッジマーク無し」が設定
される。最後に、全帳票の基本定義のうち、「タイミン
グマークの有無」を比較し、全てが「タイミングマーク
有り」が設定されているかを調べ(ステップB7)、全
てが「タイミングマーク有り」であれば、それを基本合
成定義として決定するが(ステップB8)、「タイミン
グマーク無し」が1つでも含まれていれば、「タイミン
グマーク無し」を基本合成定義として決定する(ステッ
プB9)。この場合、基本合成定義として、「タイミン
グマーク無し」が設定される。このようにして合成され
た各基本合成定義情報は、合成基本定義ファイルF4内
に格納される(図10のステップA5)。
【0019】図12は、フィールド定義合成処理を示し
たフローチャートである。先ず、このフィールド定義合
成処理で使用する「合成フィールド番号N」と「書き込
みポインタM」に初期値“1”をセットしておくと共に
(ステップC1)、「読み込みポインタn」に初期値
“1”をセットしておく(ステップC2)。ここで、
「合成フィールド番号N」は、合成フィールド定義ファ
イルF5にセットされる一連番号である。また、「書き
込みポインタM」は、合成フィールド定義ファイルF5
の書き込みアドレスを指定するポインタであり、更に、
「読み込みポインタn」は、RAM4のワーク域内に選
択候補としてセットされている全帳票分のフィールド定
義を1つずつアドレス指定して読み出すためのポインタ
である。そして、RAM4のワーク域内に選択候補とし
てセットされている全帳票分のうち、「読み込みポイン
タn」の値に対応する1帳票分のフィールド定義を読出
し対象として範囲指定しておく(ステップC3)。最初
は、その先頭の帳票フィールド定義が指定される。
【0020】この状態において、「読み込みポインタ
n」で示されるn番目の帳票フィールド定義を取得し
(ステップC4)、このフィールド定義情報を「書き込
みポインタM」で示される合成フィールド定義ファイル
F5のアドレス領域に書き込む(ステップC5)。そし
て、「合成フィールド番号N」を「書き込みポインタ
M」で示される合成フィールド定義ファイルF5のアド
レス領域に書き込む(ステップC6)。そして、「合成
フィールド番号N」、「書き込みポインタM」、「読み
込みポインタn」の値をぞれぞれ「+1」する更新処理
を行った後(ステップC7)、未書き込みのフィールド
定義情報は、ワーク域内にまだ残っているかを判別し
(ステップC8)、あればステップC4に戻り、「読み
込みポインタn」で指定される次のフィールド定義情報
を読出し、以下、上述の動作を繰り返す。これによって
1帳票分のフィールド定義情報が「合成フィールド番号
N」に対応して合成フィールド定義ファイルF5に順次
書き込まれる。
【0021】そして、1帳票分のフィールド定義情報の
書き込みが終わると、その書き込み範囲はN1〜Nnの
アドレス範囲となるので、このN1〜Nnのアドレス範
囲に対応付けて、当該帳票No.を合成フィールド定義フ
ァイルF5に書き込む(ステップC9)。次に、他の未
処理の帳票はまだあるかを調べる(ステップC10)。
いま、最初の帳票を処理し終わった段階であるから、未
処理帳票有りが判別されてステップC2に戻り、「読み
込みポインタn」の値を“1”に初期化すると共に、次
の帳票を指定したのち(ステップC3)、当該指定帳票
の先頭からフィールド定義情報を読み出してゆき、「合
成フィールド番号N」と共に、合成フィールド定義ファ
イルF5に書き込む(ステップC4〜C8)。以下、選
択候補の全ての帳票に対してフィールド定義情報を合成
フィールド定義ファイルF5に順次書き込む合成処理を
繰り返す(ステップC2〜C10)。
【0022】このようにして合成基本定義ファイルF
4、合成フィールド定義ファイルF5を生成した後は、
図10のステップA7に移り、帳票原稿をイメージスキ
ャナ8にセツトすることによって読み取られた帳票イメ
ージは、帳票画像ファイルF6に格納されると共に、こ
の帳票イメージは、合成基本定義ファイルF4、合成フ
ィールド定義ファイルF5の内容に基づいて帳票毎、フ
ィールド毎に文字認識される(ステップA8)。この場
合、帳票毎、フィールド毎に文字認識された認識結果
は、認識データファイルF7に帳票毎、フィールド毎に
順次書き込まれるが、その際、フィールド毎にその認識
率が算出されて、認識データファイルF7の対応位置に
セットされる(ステップA9、A10)。そして、次の
ステップA11では、認識データファイルF7の内容を
解析する認識結果解析処理が行われる。
【0023】図13は、この認識結果解析処理を示した
フローチャートであり、この解析処理は、認識結果を帳
票毎に分割すると共に、分割した認識結果の認識率を比
較検討することにより最も認識率が高い帳票を当該帳票
イメージの帳票種別として確定するようにしている。す
なわち、認識データファイルF7内には、帳票毎、フィ
ールド毎に文字認識された認識結果が書き込まれている
ので、先ず、帳票毎の認識データを帳票毎に分離すると
共に(ステップD1)、帳票別に各フィールド対応の認
識率を合計する(ステップD2)。そして、帳票毎に算
出された各認識率合計を比較し、その値が一番大きい帳
票を特定し、この帳票を今回読み取った帳票イメージの
種別として確定する(ステップD3)。そして、確定し
た帳票に対応する認識データを元の帳票の基本定義およ
びフィールド定義に沿ってフィールド番号を打ち直し、
ワークメモリに処理対象のデータとして格納する(ステ
ップD4)。なお、このワークメモリに処理対象として
格納されたデータに基づいてCPU1は、通常の帳票処
理を実行することができる。
【0024】以上のように、この第1実施形態おいて
は、処理対象の業務が指定入力された際に、指定業務に
基づいて業務情報ファイルF1を参照し、当該業務対応
の各帳票を特定すると共に、特定した各帳票毎に、基本
定義ファイルF2、フィールド定義ファイルF3から読
み出した各帳票フォーマット定義情報を合成し、この合
成フォーマット定義情報にしたがって帳票イメージを文
字認識すると共に、その認識結果を帳票毎に分割してそ
の認識率を比較し、最も認識率の良い帳票を当該帳票イ
メージの帳票種別として確定するようにしたから、単に
業務を指定するだけで、当該業務対応の各帳票フォーマ
ット定義情報を動的に合成するこができ、帳票イメージ
の読み取りからその種別を確定するまでの一連の処理が
1回の処理で実行可能となり、帳票種別を効率良く確定
することができる。
【0025】また、合成フォーマット定義情報を作成す
る際に、各帳票毎に、そのフォーマット定義情報を区分
して合成し、この合成フォーマット定義情報に基づいて
帳票イメージを文字認識する際に、各帳票区分毎に文字
認識するようにしたから、更に、処理効率の向上を期待
することができる。また、帳票毎に予め設定されている
帳票フォーマットは、基本定義情報と、フィールド定義
情報とから成り、合成フォーマット定義情報を作成する
際に、基本定義情報毎、フィールド定義情報毎に分けて
合成するようにしたから、合成フォーマット定義情報を
通常のフォーマット情報と同様に取り扱うことができ
る。
【0026】(第2実施形態)以下、この発明の第2実
施形態について図14〜図16を参照して説明する。な
お、上述した第1実施形態は、指定業務に対応する複数
の帳票フォーマット情報に基づいて1つの合成フォーマ
ット定義情報を作成するようにしたが、この第2実施形
態は基本定義情報の相違に基づいて複数の合成フォーマ
ット定義情報を作成するようにしたものである。ここ
で、両実施形態において基本的に同一のものは、同一符
号を付して示し、その説明を省略する他、以下、第2実
施形態の特徴部分を中心に説明するものとする。
【0027】図14は、この第2実施形態における帳票
認識処理を示したフローチャートであり、図15、図1
6は、この場合の具体例を示したもので、図15(A)
は、業務に対応する業務情報ファイルF1の内容を示
している。先ず、処理対処業務が指定されると、指定業
務に基づいて業務情報ファイルF1を参照し、指定業務
対応の各帳票を取得すると共に(ステップE1)、取得
した各帳票に基づいて基本定義ファイルF2を検索し、
帳票毎の基本定義情報を取得する(ステップE2)。そ
して、各帳票の基本定義情報を比較し、その「エッジマ
ークの有無」に基づいて帳票を分類する(ステップE
3)。いま、業務が指定された場合、その指定業務対
応の帳票、帳票、帳票において、その基本定義情
報は、図3〜図5の各(B)に示すように、帳票のみ
が「エッジマークの有り」となっているので、帳票分類
としては、帳票のみの分類と、帳票、帳票を含む
分類に分けられる。
【0028】そして、分類別に各帳票の基本定義情報を
合成する基本定義合成処理が行われる(ステップE
4)。すなわち、図15(B)、図16(A)は、業務
に対応して分類別に合成された合成基本定義ファイル
F4の内容を例示したもので、「エッジマークの有り」
の帳票のみから成る分類に基づいてその基本定義の合
成が行われ、また、「エッジマークの無し」の帳票、
を含む分類に基づいてその基本定義の合成が行われ
る。なお、基本定義の合成は、上述した第1実施形態と
同様であるので、その説明は省略する。
【0029】次に、分類別に各帳票のフィールド定義情
報を合成するフィールド定義合成処理が行われるが、こ
の場合の合成についても、上述した第1実施形態と同様
である(ステップE5)。図15(C、D)、図16
(B、C)は、この場合の具体例を示している。このよ
うにして分類別に基本定義、フィールド定義を合成する
処理が終わると、分類数分の合成定義情報に基づいて帳
票イメージを各分類毎にそれぞれ文字認識する認識処理
が行われると共に(ステップE6)、分類数分の認識結
果を解析して、帳票種別を確定する(ステップE7)。
なお、この場合の文字認識および確定処理についても、
上述の第1実施形態と同様である。
【0030】以上のように、この第2実施形態おいて
は、指定業務対応の各帳票フォーマット定義情報を合成
する際に、その基本定義情報の内容に基づいて複数の合
成フォーマット定義情報を作成すると共に、複数の合成
フォーマット定義情報毎に帳票イメージを文字認識し、
各合成フォーマット定義毎の認識結果に基づいて帳票種
別を確定するようにしたから、異種の帳票が多数混在し
ているような場合でも、認識率を低下させずに、効率良
く帳票種別を確定することができる。
【0031】なお、上述した各実施形態においては、業
務に対応して複数の帳票を業務情報ファイルF1に設定
したが、帳票グループは業務に限らず、任意であり、例
えば、部署単位を帳票グループとしてもよい。また、基
本定義やフィールド定義の合成は、上述した合成手法に
限らず、任意である。また、上述した第2実施形態は、
「エッジマークの有無」に基づいて帳票を分類するよう
にしたが、「タイミングマークの有無」に基づいて帳票
を分類するようにしてもよい。
【0032】
【発明の効果】この発明によれば、帳票グループを単に
指定するだけで、当該指定グループに対応付けられてい
る複数の帳票フォーマットの定義情報を呼び出してそれ
らを動的に合成するようにしたから、この合成フォーマ
ットに基づいて帳票イメージを文字認識してその種別を
確定することにより、帳票イメージの読み取りからその
種別を確定するまでの一連の処理を1回の処理で実行す
ることができ、帳票種別の確定を効率良く実行すること
が可能となる。
【図面の簡単な説明】
【図1】帳票認識機能付データ処理装置の全体構成を示
したブロック図。
【図2】データ処理装置内に格納されている各種のファ
イルを示した図。
【図3】(A)は、帳票のフォーマットを概念的に示
した図、(B)は帳票に対応する基本定義ファイルF
2の記憶内容を示し、(C)は帳票に対応するフィー
ルド定義ファイルF3の記憶内容を示した図。
【図4】(A)は、帳票のフォーマットを概念的に示
した図、(B)は帳票に対応する基本定義ファイルF
2の記憶内容を示し、(C)は帳票に対応するフィー
ルド定義ファイルF3の記憶内容を示した図。
【図5】(A)は、帳票のフォーマットを概念的に示
した図、(B)は帳票に対応する基本定義ファイルF
2の記憶内容を示し、(C)は帳票に対応するフィー
ルド定義ファイルF3の記憶内容を示した図。
【図6】(A)は、帳票のフォーマットを概念的に示
した図、(B)は帳票に対応する基本定義ファイルF
2の記憶内容を示し、(C)は帳票に対応するフィー
ルド定義ファイルF3の記憶内容を示した図。
【図7】(A)は、業務情報ファイルF1の内容を例示
したもので、業務で使用される帳票、、を示
し、(B)は、業務の合成基本定義ファイルF4、
(C)は、帳票、、の各フィールドを概念的に重
ね合わせた状態を示した図、(D)は、業務の合成フ
ィールド定義ファイルF5の内容を例示した図。
【図8】(A)は、業務情報ファイルF1の内容を例示
したもので、業務で使用される帳票、を示し、
(B)は、業務の合成基本定義ファイルF4、(C)
は、帳票、の各フィールドを概念的に重ね合わせた
状態を示した図、(D)は、業務の合成フィールド定
義ファイルF5の内容を例示した図。
【図9】認識データファイルF7のデータ構成を示した
図。
【図10】帳票認識処理の全体動作を示したフローチャ
ート。
【図11】図10で示した基本定義合成処理を詳述する
ためのフローチャート。
【図12】図10で示したフィールド定義合成処理を詳
述するためのフローチャート。
【図13】図10で示した認識結果解析処理を詳述する
ためのフローチャート。
【図14】第2実施形態における帳票認識処理を示した
フローチャート。
【図15】(A)は、業務に対応する業務情報ファイ
ルF1の内容を示した図、(B)は、「エッジマークの
有り」の帳票のみから成る分類に基づいて合成された
合成基本定義ファイルの内容を示し、(C)は、当該分
類に対応して合成された帳票のフィールドを概念的に重
ね合わせた状態を示した図、(D)は、当該分類に対応
して合成された合成フィールド定義ファイルF5の内容
を例示した図。
【図16】(A)は、「エッジマークの有り」の帳票
、を含む分類に基づいて合成された合成基本定義フ
ァイルの内容を示し、(B)は、当該分類に対応して合
成された各帳票のフィールドを概念的に重ね合わせた状
態を示した図、(C)は、当該分類に対応して合成され
た合成フィールド定義ファイルF5の内容を例示した
図。
【符号の説明】
1 CPU 2 記憶装置 3 記録媒体 5 伝送制御部 6 入力部 7 表示部 8 イメージスキャナ F1 業務情報ファイル F2 基本定義ファイル F3 フィールド定義ファイル F4 合成基本定義ファイル F5 合成フィールド定義ファイル F6 帳票画像ファイル F7 認識データファイル

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】予め設定されている各種の帳票フォーマッ
    トを参照して帳票イメージを文字認識すると共に、各帳
    票フォーマット毎に文字認識した認識状態に応じて当該
    帳票イメージの種別を確定する帳票認識装置において、 帳票毎に設定されている帳票フォーマットを定義する定
    義情報を記憶する帳票定義記憶手段と、 帳票グループと当該グループに属する各帳票との対応関
    係を記憶する帳票グループ記憶手段と、 帳票グループが指定された際に、指定グループに対応付
    けられている各帳票を前記帳票グループ記憶手段から読
    み出すと共に、読み出した帳票毎にその帳票フォーマッ
    ト定義情報を前記帳票定義記憶手段から読み出す読出手
    段と、 この読出手段によって読み出された各帳票フォーマット
    定義情報を合成した合成フォーマット定義情報を作成す
    る定義合成手段と、 この定義合成手段によって得られた合成フォーマット定
    義情報に基づいて帳票イメージを文字認識する文字認識
    手段と、 この文字認識手段によって認識された認識結果を各帳票
    毎に分割すると共に、分割した認識結果の認識状態を比
    較検討することにより最も認識状態が良好な帳票を当該
    帳票イメージの種別として確定する帳票種別確定手段と
    を具備し、 帳票グループの指定に基づいて当該指定グループ対応の
    各帳票フォーマット定義情報を動的に合成して帳票種別
    を確定するようにしたことを特徴とする帳票認識装置。
  2. 【請求項2】前記定義合成手段は、合成フォーマット定
    義情報を作成する際に、各帳票毎に、そのフォーマット
    定義情報を区分して合成し、 前記文字認識手段は、前記合成フォーマット定義情報に
    基づいて帳票イメージを文字認識する際に、各帳票区分
    毎に文字認識するようにしたことを特徴とする請求項1
    記載の帳票認識装置。
  3. 【請求項3】帳票毎に設定されている帳票フォーマット
    定義情報は、基本定義情報と、帳票を構成する各フィー
    ルドを定義するフィールド定義情報とから成り、 前記定義合成手段は、合成フォーマット定義情報を作成
    する際に、前記基本定義情報毎、フィールド定義情報毎
    に分けて合成するようにしたことを特徴とする請求項1
    記載の帳票認識装置。
  4. 【請求項4】前記定義合成手段は、合成フォーマット定
    義情報を作成する際に、前記基本定義情報の内容を解析
    し、その解析結果に基づいて複数の合成フォーマット定
    義情報を作成し、 前記文字認識手段は、前記基本定義情報の解析結果に基
    づいて作成された前記複数の合成フォーマット定義情報
    毎に帳票イメージを文字認識し、 前記帳票種別確定手段は、合成フォーマット定義情報毎
    の認識結果に基づいて最も認識状態が良好な帳票を当該
    帳票イメージの種別として確定するようにしたことを特
    徴とする請求項3記載の帳票認識装置。
  5. 【請求項5】コンピュータが読み取り可能なプログラム
    コードを有する記録媒体であって、 帳票毎に設定されている帳票フォーマットの定義情報を
    記憶管理させるコンピュータが読み取り可能なプログラ
    ムコードと、 帳票グループと当該グループに属する各帳票との対応関
    係を記憶管理させるコンピュータが読み取り可能なプロ
    グラムコードと、 帳票グループが指定された際に、指定グループに対応付
    けられている各帳票毎にその帳票フォーマット定義情報
    を読み出させるコンピュータが読み取り可能なプログラ
    ムコードと、 読み出された各帳票フォーマット定義情報に基づいて合
    成フォーマット定義情報を作成させるコンピュータが読
    み取り可能なプログラムコードと、 合成フォーマット定義情報に基づいて帳票イメージを文
    字認識させるコンピュータが読み取り可能なプログラム
    コードと、 文字認識された認識結果を各帳票毎に分割すると共に、
    分割した認識結果の認識状態を比較検討することにより
    最も認識状態が良好な帳票を当該帳票イメージの種別と
    して確定させるコンピュータが読み取り可能なプログラ
    ムコードとを有する記録媒体。
JP2000103009A 2000-04-05 2000-04-05 帳票認識装置および記録媒体 Expired - Fee Related JP4092849B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000103009A JP4092849B2 (ja) 2000-04-05 2000-04-05 帳票認識装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000103009A JP4092849B2 (ja) 2000-04-05 2000-04-05 帳票認識装置および記録媒体

Publications (3)

Publication Number Publication Date
JP2001291055A true JP2001291055A (ja) 2001-10-19
JP2001291055A5 JP2001291055A5 (ja) 2005-02-17
JP4092849B2 JP4092849B2 (ja) 2008-05-28

Family

ID=18616781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000103009A Expired - Fee Related JP4092849B2 (ja) 2000-04-05 2000-04-05 帳票認識装置および記録媒体

Country Status (1)

Country Link
JP (1) JP4092849B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003244404A (ja) * 2002-02-15 2003-08-29 Ricoh Co Ltd 原稿画像処理装置、原稿画像処理方法およびその方法によってプログラムを記憶した記憶媒体
WO2014061257A1 (ja) * 2012-10-15 2014-04-24 パナソニック株式会社 認識装置、認識方法、遠隔制御装置、認識プログラム、及びサーバ
CN113643260A (zh) * 2021-08-13 2021-11-12 北京百度网讯科技有限公司 用于检测图像质量的方法、装置、设备、介质和产品

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06133019A (ja) * 1992-10-15 1994-05-13 Toray Ind Inc 自動発信装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003244404A (ja) * 2002-02-15 2003-08-29 Ricoh Co Ltd 原稿画像処理装置、原稿画像処理方法およびその方法によってプログラムを記憶した記憶媒体
WO2014061257A1 (ja) * 2012-10-15 2014-04-24 パナソニック株式会社 認識装置、認識方法、遠隔制御装置、認識プログラム、及びサーバ
CN113643260A (zh) * 2021-08-13 2021-11-12 北京百度网讯科技有限公司 用于检测图像质量的方法、装置、设备、介质和产品

Also Published As

Publication number Publication date
JP4092849B2 (ja) 2008-05-28

Similar Documents

Publication Publication Date Title
US7528990B2 (en) Image-forming system with improved workability by displaying image finish and setting items in course of processing
JP2000115476A (ja) 走査画像の領域を操作するためのシステム及び方法
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
US6317762B1 (en) Document creating apparatus creates free format document from handwritten data converting into normalized size
US20210227083A1 (en) Image processing system that computerizes document, control method thereof, and storage medium
CN1250205A (zh) 文献图象处理装置及其方法和录有所用程序的记录介质
JP2002202837A (ja) 情報処理装置およびデバイスリスト表示処理方法および記憶媒体
JP4092849B2 (ja) 帳票認識装置および記録媒体
US7739593B2 (en) Information processing apparatus and method for handling forms
JP4136282B2 (ja) 画像処理装置及び画像処理方法並びに記憶媒体
US20030154462A1 (en) Software maintenance material generation apparatus and generation program therefor
JP2001005911A (ja) 文字入力装置及び表示制御方法
JPH08221558A (ja) 文書ファイリング方法及び装置
JP4693167B2 (ja) 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体
JP2005165978A (ja) 帳票ocrプログラム、方法及び装置
JPH10187751A (ja) 認識データ処理装置およびそのプログラム記録媒体
WO2004081809A1 (ja) データ処理装置、データ処理方法、データ処理プログラムおよび該プログラムを記録した記録媒体
JPH1166065A (ja) 画像配置装置およびそのプログラム記録媒体
JP2006165863A (ja) 情報処理システム
KR102572130B1 (ko) 문서 이미지에서 문서 양식을 추출하는 방법 및 시스템
JPH11203282A (ja) データ処理装置およびデータ処理装置の目次データ処理方法およびコンピュータが読み出し可能なプログラムを格納した記憶媒体
JP2002366880A (ja) フォーム編集装置及び方法及びコンピュータ読取り可能なプログラムが格納された記憶媒体
CN113378610A (zh) 信息处理装置以及计算机可读介质
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP2001118030A (ja) 書式データ編集方法および装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040315

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040315

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060203

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060413

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070814

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071011

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071205

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20080121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080225

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110314

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120314

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130314

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140314

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees