JP2017142606A - 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム - Google Patents

帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム Download PDF

Info

Publication number
JP2017142606A
JP2017142606A JP2016022733A JP2016022733A JP2017142606A JP 2017142606 A JP2017142606 A JP 2017142606A JP 2016022733 A JP2016022733 A JP 2016022733A JP 2016022733 A JP2016022733 A JP 2016022733A JP 2017142606 A JP2017142606 A JP 2017142606A
Authority
JP
Japan
Prior art keywords
design
field
recognition
reading setting
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016022733A
Other languages
English (en)
Other versions
JP6743401B2 (ja
Inventor
陽菜 竹中
Haruna Takenaka
陽菜 竹中
勇輔 竹中
Yusuke Takenaka
勇輔 竹中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2016022733A priority Critical patent/JP6743401B2/ja
Publication of JP2017142606A publication Critical patent/JP2017142606A/ja
Application granted granted Critical
Publication of JP6743401B2 publication Critical patent/JP6743401B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Input (AREA)

Abstract

【課題】事案毎に異なるフォーマットの帳票を作成設計できると共に、既存の帳票に記入された文字を認識する場合でも読取設定値の再設定回数が削減できるようにする。【解決手段】文字が記入されるフィールドを備えた帳票の設計及び当該帳票に記入された文字の認識する際に用いる帳票設計・読取設定支援装置5であって、帳票の設計仕様をフォーマットファイルとして記憶すると共に、帳票設計時及び帳票認識時において帳票一般に共通する推奨帳票設計値及び推奨読取設定値を含む解析データを記憶する記憶ユニットを有する。帳票設計時には、ユーザが設定した帳票設定値に基づきフォーマットファイルを作成すると共に、解析データから推奨帳票設計値を抽出して設計ガイダンス情報を作成するユーザによる帳票設計を支援する設計ユニットと、帳票認識時の認識結果とフォーマットファイルとからなる運用ログに基づき解析データを作成する解析ユニットと、を備える。【選択図】図1

Description

本発明は、帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システムに関する。
新聞記事や帳票等のドキュメントの記載内容を電子データにするための装置として、光学文字認識(OCR:Optical character recognition)装置が実用化されている。
この光学文字認識装置では、ドキュメントを撮像して画像を取得し、この画像に含まれる文字等のキャラクタを認識する。このとき、認識対象となるキャラクタの状態は千差万別であり、認識率を向上させるための開発が行われている。
新聞等と異なり帳票のように書式(フォーマット)が決まっているドキュメントの認識においても同様である。特に、帳票の場合には活字以外にも手書き文字が用いられるため、帳票設計用のアプリケーションの開発と共に認識率向上のための開発が盛んに行われている。
しかし、帳票設計アプリケーションで設計された帳票を用いた場合であっても、認識不能となる箇所や誤認識が多い箇所が存在することがある。以下、認識不能や誤認識を総称して、認識エラーと記載する。
このような認識エラーが発生した場合には、読取設定値を再設定して、認識処理を再度行う必要がある。かかるトライアンドエラーの作業は、ユーザの技量、経験、感覚に依存して多くの時間を要するため、作業負荷増大の一因となっている。
そこで、例えば特開平8−339419号公報においては、フォーマット情報を作成するフォーマット情報作成手段を設けて、自動的にフォーマット情報を作成してオペレータ(ユーザ)の負担を軽減すると共に、文字種を簡単かつ容易に修正できるようにした技術が開示されている。
特開平8−339419号公報
しかしながら、帳票は事案毎に作成されるが、仕様通りに帳票設計できていない場合や記入者の書き癖がある場合等が存在するため、全ての状況に対応した帳票作成することが困難であり、単にフォーマット情報を自動しても十分に認識率を向上させることができない問題があった。
例えば、文字記入枠となるフィールド(非ドロップアウト領域)から文字がはみ出して記入されていることがある。今、帳票に複数のフィールドがある場合を考える。そして、その内の1つのフィールド(このフィールドを認識対象フィールドとする)に記入された文字を認識する場合を考える。
この場合、認識対象フィールドに近接して非認識情報(記入済みの他のフィールド、プレプリントコメント、絵図等の認識対象でない領域(非ドロップアウト領域))が存在していると、非ドロップアウト領域の情報が認識対象フィールドの文字認識に影響を与えてしまうことがある。また、フィールドを設計する際には、フィールドの周囲には、当該フィールドの認識にの邪魔とならないよういようにクリアエリアを設けることが帳票設計仕様により要求されている。しかし、このようにクリアエリアを設けた場合であっても、記入された文字がフィールドからはみ出して記入されているときがある。この場合、文字がはみ出した部分のクリアエリアは、適正にクリアエリアとして機能しないことがあり、認識エラーとなる確率が高くなってしまう。
しかし、上記特開平8−339419号公報では、かかる事情を考慮することなくフォーマット情報を作成するため、認識エラーを効率的に少なくすることが出来ず、結局のところユーザの技量、経験、感覚に応じた処理が必要になる問題がある。
そこで、本発明の主目的は、事案毎に異なるフォーマットの帳票を作成する場合でも認識率の高い帳票が設計できると共に、既存の帳票に記入された文字を認識する場合でも読取設定値の再設定回数が削減できる帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システムを提供することである。
上記課題を解決するため、少なくとも1つ以上の文字が記入されるフィールドを備えた帳票の設計及び当該帳票に記入された文字の認識する際に用いる帳票設計・読取設定支援装置にかかる発明は、帳票の設計仕様をフォーマットファイルとして記憶すると共に、帳票設計時及び帳票認識時において帳票一般に共通して推奨される帳票設計値及び読取設定値を、推奨帳票設計値及び推奨読取設定値として含む解析データを記憶する記憶ユニットと、帳票設計時には、ユーザが設定した帳票設定値に基づきフォーマットファイルを作成すると共に、その際に解析データから推奨帳票設計値を抽出して設計ガイダンス情報を作成することにより、ユーザによる帳票設計を支援する設計ユニットと、帳票のフィールド毎の帳票認識結果とフォーマットファイルとからなる運用ログに基づき解析データを作成する解析ユニットと、を備えることを特徴とする。
また、光学文字認識システムにかかる発明は、上記記載の帳票設計・読取設定支援装置と、帳票を撮像して帳票画像を取得し、ユーザが設定した読取設定値に従い帳票画像から文字認識処理を行う文字認識装置と、を備えることを特徴とする。
さらに、少なくとも1つ以上の文字が記入されるフィールドを備えた帳票の設計及び当該帳票に記入された文字の認識する際に用いる帳票設計・読取設定支援方法にかかる発明は、帳票の設計仕様をフォーマットファイルとして記憶すると共に、帳票設計時及び帳票認識時において帳票一般に共通して推奨される帳票設計値及び読取設定値を推奨帳票設計値及び推奨読取設定値として含む解析データを記憶し、帳票設計時には、ユーザが設定した帳票設定値に基づきフォーマットファイルを作成すると共に、その際に解析データから推奨帳票設計値を抽出して設計ガイダンス情報を作成することにより、ユーザによる帳票設計を支援し、帳票のフィールド毎の帳票認識結果とフォーマットファイルとからなる運用ログに基づき解析データを作成する、ことを特徴とする。
本発明によれば、運用ログに基づき帳票一般に共通して推奨される推奨帳票設計値及び推奨読取設定値を含む解析データを作成して、帳票設計時や帳票読取時において推奨帳票設計値及び推奨読取設定値を表示するので、事案毎に異なるフォーマットの帳票を作成する場合でも認識率の高い帳票が設計できる。また、既存の帳票に記入された文字の認識率を向上させるために設定値を変更する場合でも、ユーザの経験、技量、感覚に応じたトライアンドエラーを繰り返すことが抑制できて、作業負荷が軽減できるようになる。
光学文字認識システム2のブロック図である。 帳票を例示した図である。 フォーマットファイルを例示した図である。 運用ログを例示した図である。 解析データを例示した図である。 帳票読取処理手順を示すフローチャートである。 帳票作成処理手順を示すフローチャートである。 図8に示すような2つのフィールドF1,F2からなる帳票を例に説明する。
実施形態を説明する。図1は、光学文字認識システム2のブロック図である。この光学文字認識システム2は、ユーザインタフェース3、OCR装置4、帳票設計・読取設定支援装置5を備える。なお、図中のブロックを繋ぐ線の矢印は一例であることを付言する。
なお、以下において光学文字認識システム2を利用して帳票等のドキュメントの設計/読取を行う人をユーザと言い、ドキュメントに記入する人を記入者と記載する。また、ドキュメントを帳票として記載するが、帳票に限定するものではなく、フォーマット(書式)が設定されるドキュメントであればよい。即ち、本実施形態においては、帳票をフォーマット(書式)が設定されるドキュメントと定義する。
ユーザインタフェース3は、キーボード3aや液晶等のディスプレイ3bを備える。また、OCR装置4は、画像取得部11、認識部12、読取/修正部13を備える。さらに、帳票設計・読取設定支援装置5は、解析ユニット20、設計ユニット30、記憶ユニット40を備える。解析ユニット20は、運用ログ作成部21、解析部22を含む。設計ユニット30は、帳票作成部31、ガイダンス作成部32を含む。記憶ユニット40は、記憶部41、解析データ保持部42を含む。
なお、認識部12、読取/修正部13、運用ログ作成部21、解析部22、解析データ保持部42、ガイダンス作成部32、帳票作成部31、記憶部41の一部又は全てをコンピュータにより構成してもよい。そして、1台のコンピュータに複数のOCR装置4を接続し、又は複数のコンピュータに1台のOCR装置4を接続してもよい。また、解析データ保持部42は、画像取得部11に対応して設けても良く、コンピュータに設けても良い。さらに、複数のOCR装置4を設けた場合でも、解析データを1台の解析データ保持部42で保持することも可能である。このような構成により、運用ログや解析データを共有化することができるようになる。
そして、この光学文字認識システム2は大きく分けて帳票設計処理、文字認識処理を行う。これらの処理の概略は以下の通りである。
文字認識処理では、ユーザインタフェース3から読取設定値が設定されて、該読取設定値に基づき認識部12が画像取得部11で取得された画像から認識に用いる認識画像を抽出する。その後、認識部12は、この認識画像に対して文字認識処理を行い、ユーザに帳票認識結果の確認を求める。ユーザが帳票認識結果に余りにも多い認識エラーを発見した場合には、読取設定値を変更して再度文字認識を行う。なお、読取設定値を変更する等においてユーザに読取設定値をガイダンスすることで、読取設定値の修正し、この修正値に基づき再度認識処理を行う処理を1サイクルとしたトライアンドエラーの回数が減らせるように読取設定支援を行う。かかるガイダンス機能を発揮するため、実際の読取結果である帳票認識結果と帳票の設計仕様(フォーマットファイル)とに基づき運用ログを作成し、該運用ログに基づき帳票に依存しない帳票認識結果を高めるための情報(解析データ)を作成している。
一方、帳票設計処理では、ユーザが設定した文字入力欄(フィールド)の設定仕様に対して、過去の読取実績及びフォーマットファイルから作成された運用ログに基づく解析データを参照して設定値の推奨値をガイダンスすることで帳票設計支援を行う。
ここで以下の説明を容易にするために、帳票、フォーマットファイル、運用ログ、解析データを図2〜図4に例示して説明する。
<帳票>
図2は、帳票Kを例示した図である。帳票Kは、認識対象領域K3,K4,K6と、認識対象領域でない領域K1,K2とから構成されている。
領域K3,K4、K6は認識対象となる領域であるが、文字が記入される領域(以下、フィールドと記載する)K3,K4と、帳票Kの種類を特定するために予め記入(印刷)されている帳票識別領域K6とを含んでいる。
以下、帳票識別領域K6に記載された文字を帳票識別番号という。この帳票識別番号の周囲には十分なクリアエリアが設けられ、また帳票識別領域K6の裏面には何らの情報も記載されていない。これは読取設定値が不適切な場合であっても、帳票識別番号だけは確実に正しく認識されるようにするためである。
領域K1,K2は、注意書きや絵図等の認識対象以外の情報が記載された領域である。
フィールドK3は1つ以上の文字枠K5からなり、各文字枠K5に1文字が記入される。また、フィールドK4は任意の文字数で、任意の文字種の文字が記入される記入欄である。フィールドK3に記入される文字種(フィールドタイプ)として、日本文字(漢字、ひらがな、カタカナ)、外国文字(アルファベット等)、数字(アラビア数字等)、他(日本文字や数字等が混じっている)がある。
<フォーマットファイル>
図3は、フォーマットファイルLを例示した図である。このフォーマットファイルLは、帳票Kの仕様を示す情報で、当該帳票Kの設計時に帳票作成部31が作成して記憶部41に記憶されている。
このようなフォーマットファイルLは、帳票認識番号L1毎に作成されて、フィールド番号L2、フィールド座標L3、フィールドタイプL4、文字枠数L5、文字枠サイズL6、フォーマット文字枠間隔L7、フォーマットフィールド間隔L8、フォーマット非ドロップアウト領域間隔L9、裏面情報L10を少なくとも1つ含んでいる。
図2に示したように、帳票Kには複数のフィールドが含まれている。そこで、各フィールドにはフィールド番号L2が付されて識別できるようにすると共に、各フィールドの位置がフィールド座標L3として規定されている。フィールド座標L3は、例えば帳票Kの横方向をX軸、縦方向をY軸とする2次元座標で考えたときの位置であり、その原点は帳票Kの特定の点(例えば左下のコーナ点)が予め設定されている。例えばフィールド番号「1」のフィールド座標L3は、X座標が「15」で、Y座標が「12」であることを示している。なお、本実施形態では、寸法の単位としてmmを考えるが、インチ等であっても良い。
フィールドタイプL4は、このフィールドに記入される文字種を示し、フィールド番号「1」のフィールドタイプL4は「カタカナ」で記入されることを示している。文字枠数L5は、フィールドを構成する文字枠K5の数を示し、フィールド番号「1」の文字枠数L5は「10」である。
フォーマット文字枠間隔L7は、図2の符号D1で示すように、隣接する文字枠K5の間の寸法を示し、フィールド番号「1」のフォーマット文字枠間隔L7は「2」である。即ち、「2」mm間隔で文字枠K5が並んでいることを示している。
フォーマットフィールド間隔L8は、図2の符号D2で示すように、隣接するフィールドとの間隔を示し、フィールド番号「1」のフォーマットフィールド間隔L8は「2」である。なお、このとき隣接するフィールドが複数存在することがある。このような場合には、最も近いフィールドとの間隔を示すものとする。フィールド番号「1」のフィールドでは、寸法「2」の所に別のフィールドが存在することが分かる。
フォーマット非ドロップアウト領域間隔L9は、図2の符号D3で示すように、フィールドに隣接する非ドロップアウト領域との間の寸法である。フォーマットフィールド間隔L8と同様に、隣接するドロップアウト領域が複数存在することがあるので、最も近いドロップアウト領域との間隔を示すものとする。フィールド番号「1」のフィールドでは、寸法「2」の所にドロップアウト領域が存在することが分かる。
裏面情報L10は、該当するフィールドの裏面に情報が印刷等により記載されているか否か、記入者が記入するフィールドがあるか否かを示している。
<運用ログの作成>
運用ログは、認識処理や認識結果の修正処理が行われるたびに、運用ログ作成部21が帳票認識結果に基づき作成して解析部22に出力される運用実績である。
即ち、運用ログ作成部21は、帳票認識結果から実際に記入された帳票Kに対して認識処理を行って得られた運用実績(正認識や認識エラーの認識結果で、認識エラーの場合に読取設定値を変更したときは、変更後の読取結果)を取得する。そして、各フィールドに対する認識結果(認識エラー、正認識)に対して重付けした運用ログを作成する。なお、認識エラーについては、フィールドの先頭から何番目文字枠の文字で認識エラーが生じたかを示す番号(文字数目)と、帳票裏面に情報が記載されているか否かの情報(裏面情報)やフィールドの周囲にプレプリントが有るか否かの周辺情報とを回数で重付けする。
図4は、運用ログを例示した図である。図4においては、「930」の帳票識別番号が付されている帳票における帳票認識結果とこの帳票認識結果に基づき作成された運用ログが例示されている。図4に示す帳票識別番号「930」の帳票のフィールド(ここでは、Aフィールドと記載)は、全文字が5文字からなる。そして、2回目以後の帳票認識結果(2回目〜5回目)は、それより前の帳票認識結果に対して読取設定値を修正した結果で、累積5回認識処理が行われている。
なお、図中、符号Gは正しく認識された正認識を示し、Eは間違って認識された誤認識を示している。また、Rは、文字が潰れていたり、記入された文字種が設定されたフィールドタイプと一致しなかったりした場合等において、文字として認識することが出来なかった認識不能を示している。また、符号P1〜P3は、誤認識や認識不能等の認識エラーとなりうる原因を示し、P1はフィールドの裏面に記載された裏面情報の影響、P2はプレプリントの影響、P3は他の理由(フィールドサイズやフィールド間隔等)による影響であることを示している。無論、認識エラーとなる原因は、他にも多く考えられ、P1〜P3の原因に限定するものではない。
また、複数の原因が関与する場合もある。
図4において、認識1回目は読取設定値が「40」で認識画像取得が行われ、その帳票認識結果は「NO」であり、Aフィールド全体が正しく認識されなかったことを示している。そして、正しく認識されなかったのは3文字目が認識不能Rであり、その原因はプレプリント(P2)が関与していることを示唆している。
プレプリント等が存在するか否かの判断は、帳票識別番号の帳票のフォーマットファイルの情報から得る。例えば、「930」の帳票識別番号が付されている帳票のフォーマットファイルを記憶部41から検索する。そして、このフォーマットファイルでは、Aフィールドは「カタカナ」であったとする。フォーマットファイルには、図3に例示するように、裏面情報の有無がフィールドタイプに応じて記載されている。このことから、裏面情報を得る。
同様に、認識4回目は読取設定値が「40」で認識画像取得が行われ、その帳票認識結果は「NO」となり、Aフィールド全体が正しく認識されなかったことを示している。そして、正しく認識されなかったのは4文字目で認識不能Rが生じたためであり、その原因に関与する要素として裏面フィールド(P1)があることを示している。
一方、認識5回目は読取設定値が「35」で認識画像取得が行われ、その帳票認識結果は「OK」となり、Aフィールド全体が正しく認識されたことを示している。
従って、認識5回目までの帳票認識結果のうち、Aフィールドは認識5回目の1回だけしか正認識されていないので、5回終了時点でのAフィールドの重み係数は1/5となる。また、最適な読取設定値は「35」となる。
更に、Aフィールドを構成する各文字枠に対する重み係数は以下のようになる。即ち、1文字目、2文字目及び5文字目は認識エラーが起きていないので当該文字枠の全てのエラー要因に対して重み係数は5/5、3文字目はプレプリントP2に関係していると推測される認識不能が1回起きているので、プレプリントP2の要因に対して4/5、他の要因に対して5/5となる。4文字目は他の理由P3に関係していると推測される誤認識が1回起きているので、他の理由P3の要因に対して4/5、裏面フィールドP1に関係していると推測される認識不能が2回起きているので、裏面フィールドP1の要因に対して3/5となる。
<解析データ>
運用ログは、帳票とリンクした帳票認識結果を重付けしたものであり、帳票に特有な情報である。そこで、解析部22は、運用ログを用いて帳票に関係しない情報(解析データ)を生成する。
図5は、解析データMを例示した図である。解析データMは、フォーマット設定推奨値Ma、読取推奨値Mbからなり、運用ログに基づき作成される。
フォーマット設定推奨値Maは、推奨フィールド間隔Ma_1、推奨文字枠サイズMa_2、推奨文字枠間隔Ma_3、推奨ドロップアウト領域間隔Ma_4等の項目からなり、各項目に対する推奨される設定値(設定推奨値)が、フィールドタイプ毎に示されている。また、読取推奨値Mbには、フィールドタイプ毎に、裏面情報が有るか否かに応じて推奨される読取設定値(推奨読取値)が示されている。
なお、図5においては、フィールドタイプを日本文字、外国文字、数字、他等を例示しているが、日本文字であっても漢字、ひらがな、カタカナがある。そこで、フィールドタイプを細かく漢字、ひらがな、カタカナ等に分けても良い。
また、読取推奨値Mbは、1つの条件(例えば、フィールドタイプが日本文字で裏面情報がある場合には「40」)の場合を示しているが、各フォーマット設定推奨値Maの組み合わせに対応して読取推奨値Mbを設定しても良い。例えば、推奨フィールド間隔Ma_1、推奨文字枠サイズMa_2、推奨文字枠間隔Ma_3、推奨ドロップアウト領域間隔Ma_4を、それぞれ3段階に分けてそれぞれの組み合わせに対して読取推奨値Mbを設定する。
フォーマット設定推奨値Maや読取推奨値Mbは、所定の認識率(正しく認識された割合で、これを基準認識率と記載する)を達成するための設定値である。なお、フォーマット設定推奨値Maや読取推奨値Mbの項目は、例示であって限定するものではないことを敢えて付言する。
ここで注意すべき点は、解析データMは、帳票K毎のデータではなく、複数の帳票Kに対する複数のフィールドに共通して適用可能な推奨値で構成されていることである。即ち、この解析データMに従って帳票Kを設計するかぎり、基準認識率が達成されることを意味している。無論、フィールドへの記入は、記入者の手書きによる場合が多いので、書き癖が強かったり、文字がかすれたり、潰れたりしているような場合でも、基準認識率の達成が保証されるものではない。但し、解析データMは多くの記入者が書いた多くの帳票Kに対する帳票認識結果(運用ログ)を基に作成されているので、ある程度の書き癖、かすれ、潰れにも対応することができる。この意味で、解析データMは、学習データと言うことができる。
推奨フィールド間隔Ma_1とは、隣接するフィールド間の推奨する寸法をいう。図5の解析データMでは、フィールドタイプが「日本文字」の場合、「3」mmにすることが推奨されている。日本文字の場合には、漢字のように画数の多い文字や、ひらがなのように崩しが多い文字が含まれ、これらの文字は、フィールドをはみ出して記載されることがある。フィールドからはみ出された文字は、他のフィールドの文字や非ドロップアウトのプレプリント文字や図等と区別がつかなくなってしまうことがあり(フィールド間の干渉)、認識率の低下をもたらす。そこで、かかるフィールド間の干渉を防ぐために必要な間隔として推奨フィールド間隔(クリアエリア)を設定する。
推奨文字枠サイズMa_2とは、文字枠K5の推奨する寸法を言う。また、推奨文字枠間隔Ma_3とは、隣接する文字枠K5の間の寸法をいう。文字枠K5は矩形状であるため、X軸サイズとY軸サイズとに分けて規定することも可能であるが、図5においては対角線の長さで定義している。1つの文字枠K5には1文字が記入されるが、画数の多い漢字を小さな文字枠に記入すると、潰れてしまう場合が多い。そこで、フィールドタイプに応じて推奨文字枠サイズや推奨文字枠間隔を設定している。
推奨ドロップアウト領域間隔Ma_4とは、非ドロップアウト領域(フィールド)とフィールド領域との間の推奨する最短寸法を言う。先に述べたように、非ドロップアウト領域には、プレプリントコメント、絵図等の認識対象とならない情報が記載されている。認識処理では、このようなドロップアウト領域の情報は、記入文字が黒色の場合に、この黒文字より輝度値が低い色等の非ドロップアウトカラーで記載されて、認識対象とならないようにしている。しかし、記入者には、このドロップアウト領域の情報が視認できる。この結果、記載に際してドロップアウト領域の情報を避けるような心理が働き、文字が大きく歪む等により認識率を低下させてしまうことがある。また、文字が記入されるフィールド付近に非ドロップアウトカラーで印刷された文字や図がある場合、フィールドからはみだした文字と非ドロップアウトカラーで印刷された文字や図等が繋がる(認識処理の上から繋がって見える場合を含む)ことによって、認識に影響を与える場合がある。そこで、フィールドとドロップアウト領域との間隔を確保して認識率の低下を抑制するために推奨ドロップアウト領域間隔を設定している。
読取推奨値Mbとしては、裏面情報の有無に応じた画像濃度閾値が例示できる。無論、読取推奨値Mbとして認識範囲等の他の情報を含めることは可能である。この画像濃度閾値は、後述するように画像取得部11で取得された画像から認識対象とする画像データを選択するための基準をなす輝度値である。
即ち、画像濃度閾値が小さい場合には、裏面に記載されている情報が透けて取り込まれたり、非ドロップアウト領域の情報が取り込まれたりする。一方、画像濃度閾値が大きい場合には、かすれた文字が読めなかったりする。そこで、認識率を高める上で最適な濃度閾値を読取推奨値Mbとしている。ユーザは帳票Kに対して最適な画像濃度閾値は知らないので、トライアンドエラーを繰り返すことになる。しかし、画像濃度閾値を設定する際に、読取推奨値Mbを表示してユーザに知らせることができれば、トライアンドエラーの回数を少なくできる。
次に、このような光学文字認識システム2を詳細に説明する。
ユーザインタフェース3は、キーボード3aや液晶等のディスプレイ3bを含んでいる。そして、ユーザが、キーボード3aを介してフォーマットの作成時においては読取設定値を、帳票作成・修正時においては帳票作成値を入力する。このとき、ディスプレイ3bには、読取設定画面や帳票作成画面が表示されると共にガイダンス画面が表示される。
OCR装置4は、画像取得部11、認識部12、読取/修正部13を備える。
この画像取得部11は、CCD等の撮像手段を備える。そして、認識部12からの指示に従い帳票等のドキュメントを撮像することにより、当該ドキュメントの画像を取得して、認識部12に出力する。
認識部12は、読取/修正部13から読取の指示及び読取設定値を受け取り、これに従い画像取得部11に画像取得を指示し、取得された画像から認識対象の画像データを抽出する。読取設定値は、ユーザがユーザインタフェース3を介してと帳票設計・読取設定支援装置5に指示した値である。そして、画像データに対して文字認識処理を行い、帳票認識結果を読取/修正部13に返す。
読取/修正部13は、認識部12に読取の指示及び読取設定値を出力し、また得られた読取結果についての修正を行う。
帳票設計・読取設定支援装置5は、読取設定値を受け取り、認識部12に出力する。このとき、ユーザが初めて用いる帳票の場合等においては、どのような値に読取設定値を設定すればよいか知らない。従って、ユーザは、経験や感覚に基づき読取設定値を決め、認識処理を繰り返していた。従って、良好な帳票認識結果を得るためには、多くのトライアンドエラーが必要であった。特に帳票を作成する際には、帳票作成→読取設定値の設定(フォーマットファイルの作成)→認識処理を繰り返して認識率の高い帳票を作成する必要があるため、多くの工数と手間が必要となる。
しかし、本実施形態では、読取/修正部13は、帳票認識時には読取対象の帳票に関するフォーマットファイルを記憶部41から読み出して、この帳票に適した設定値読取推奨値Mbを表示させることにより、ユーザの負荷軽減を図る。また、帳票作成時又はフォーマットファイル作成時には設定されたフィールド等に対してフォーマット設定推奨値Maを表示させることにより、ユーザの負荷軽減を図る。
帳票設計・読取設定支援装置5は、解析ユニット20、設計ユニット30を主要構成とする。解析ユニット20は、運用ログ作成部21、解析部22、解析データ保持部42を備える。また、設計ユニット30は、ガイダンス作成部32、帳票作成部31、記憶部41を備える。
運用ログ作成部21は、フォーマットファイルLと関連づけて読取/修正部13から送られてきた帳票認識結果に基づき運用ログを作成する。帳票認識結果情報及び運用ログの詳細については、後述する。
解析部22は、運用ログ作成部21で作成された運用ログを解析して、帳票Kに依存しない解析データを作成して解析データ保持部42に出力する。
解析データ保持部42は、解析データMを格納して要求に応じて出力する。
帳票作成部31は、ユーザインタフェース3からの指示(帳票フォーマット設定値)に従い帳票の作成又はフォーマットファイルの作成を行う。ガイダンス作成部32は、帳票作成又はフォーマットファイルの作成においてユーザが帳票作成又はフォーマットファイルの作成の具体的な設定を行う際に、認識率が高くなるような支援情報を作成して、ディスプレイ3bに表示させる。記憶部41は、作成された帳票のフォーマットをフォーマットファイルとして記憶し、要求に応じて出力する。
次に、このような光学文字認識システム2における帳票読取処理と帳票作成処理とを説明する。
<帳票読取処理>
図6は、帳票読取処理手順を示すフローチャートである。
ステップSA1,SA2: 先ず、ユーザは、帳票Kを光学文字認識システム2の画像取得部11にセットして、読取/修正部13から読取設定値を設定する。読取設定値が設定されると、読取/修正部13は、読取設定値を認識部12に出力すると共に、画像読取を指示する。認識部12は、画像取得部11に帳票画像の取得を行わせる。これにより、画像取得部11は帳票画像を読取って認識部12に出力する。
ステップSA3: 認識部12は、読取設定値に含まれる画像濃度閾値を画像取得部11からの画像に適用して、当該画像濃度閾値より輝度値が大きいデータを抽出して認識画像を得る。そして、認識部12は得られた認識画像に対して文字認識処理を行い、その結果を帳票認識結果として読取/修正部13に出力する。
ステップSA4,SA5: 読取/修正部13は、帳票認識結果をディスプレイに表示してユーザの確認を受ける。この結果、ユーザが帳票認識結果に読取不能や誤認識があと判断した場合には、読取結果を修正する。これによって、読取エラーが誤認識なのか認識不能なのかの判断が行える。この判断結果が運用ログに格納される。また、ユーザは、満足する帳票認識結果が得られるまで、読取設定値を修正し、認識処理をするトライアンドエラーを繰り返すことになる。即ち、ユーザがディスプレイに表示された帳票認識結果に認識エラーがあると判断した場合には読取設定値を修正するためにステップSA6に進む。一方、ユーザが帳票認識結果に満足した場合にはステップSA7に進む。
ステップSA6: 読取設定値を設定/修正する場合において、認識処理する帳票Kが新しい帳票Kであったり、認識ユーザが初めて使用する帳票Kであると、ユーザは当該帳票Kに対する認識処理の経験が無いので、トライアンドエラーの回数も多くなって、ユーザの負荷が増大する。
また、認識エラーとなる領域には、何らかの共通要因が存在することがある。この共通要因は、OCR装置4に固有の要因であったり、帳票Kの読み取り領域(フィールド)に固有の要因であったりする。このような共通要因に基づく認識エラーは、他の帳票Kでも発生しているはずである。しかし、経験の浅いユーザは、認識エラーがどの様な原因により生じたかは分からない場合が多い。
先に、帳票Kには、帳票識別領域K6が設けられていることを述べた。そして、帳票識別領域K6には、幅広い読取設定値に対して確実に正認識ができるような条件で帳票識別番号が記載されている。従って、ユーザの設定した読取値が不適切であっても、少なくとも帳票識別番号に関しては正しく認識できる。
そこで、読取/修正部13は、取得した帳票識別番号をガイダンス作成部32に出力して、当該ガイダンス作成部32に読取推奨値を作成させる。ガイダンス作成部32は、作成した読取推奨値をディスプレイ3bに表示する。これにより、認識エラーの原因が分からないユーザであっても、表示された読取推奨値を参考にして読取設定値を設定/修正することが出来る。
ガイダンス作成部32における読取推奨値は、以下のようにして作成される。先ず、ガイダンス作成部32は、帳票識別番号を用いて記憶部41を検索し、図3に示すような当該帳票のフォーマットファイルLを取得する。次に、取得したフォーマットファイルLからフィールドタイプを抽出する。このとき、フィールドタイプが複数存在する場合には、「日本文字」「数字」等の予め設定された優先順位の高いフィールドタイプを選択する。即ち、フィールドタイプには、読取設定値を設定する際の優先度が読取優先度として記憶部41に記憶されている。
例えば、図3では、帳票識別番号が「930」で、フィールドタイプが「カタカナ」「漢字」「数字」「アルファベット」「他」となっている。そして、読取優先度が「漢字」が最も高い場合には、「漢字」のフォーマット文字枠間隔L7の「3」、フォーマットフィールド間隔L8の「3」、フォーマット非ドロップアウト領域間隔L9の「4」が選択される。
次に、ガイダンス作成部32は、図5に示すような解析データを検索し、選択された値に最も近い(最も類似した)フォーマット設定推奨値Maに対する読取推奨値Mbを取得する。上記例では、フォーマット文字枠間隔L7が「3」、フォーマットフィールド間隔L8が「3」、フォーマット非ドロップアウト領域間隔L9が「4」、裏面情報L10が「無」なので、取得される読取推奨値Mbは「50」となる。なお、選択しているフィールドタイプから推奨設定値を検索して、設定されている値と比較することによりガイダンス情報を作成し、表示してもよい。
この読取推奨値Mbは、ユーザインタフェース3に出力され、ディスプレイ3bに表示されることになる。ユーザは、表示された読取推奨値Mbを見て、読取設定値を設定することになる。従って、初めて使用する帳票であっても、効率的に目標設定値が設定できて、トライアンドエラーの回数を削減することが可能になる。
ステップSA7: このような処理を経て、帳票設計・読取設定支援装置5は読取設定値(フォーンマットファイル)を、読取/修正部13は、帳票認識結果を、帳票識別番号と共に運用ログ作成部21に出力して、運用ログのデータが蓄積される。そして、ユーザが読取結果に満足するまで上述の処理が繰り返される。作成された運用ログは、解析部22で解析されて解析データ保持部42において記憶される(保持される)。
<帳票作成処理>
次に、帳票作成処理手順を、図7に示すフローチャートを参照して説明する。
ステップSB1: 帳票作成部31が帳票作成画面を表示して帳票作成処理が開始する。ここでは、図8に示すような2つのフィールドF1,F2からなる帳票を例に説明する。そこで、ユーザは、帳票作成画面に対してフォールドF1,F2を設定する。ここで、フィールドF1は漢字で5文字が記入され、フィールドF2にはカタカナで6文字記入されるとして、フィールドF1とフィールドF2と間の寸法は「2」mmに設定されたとする。
ステップSB2: フィールドF1,F2の設定値(フォーマット設定値)は、ガイダンス作成部32に送られる。ガイダンス作成部32は、解析データ保持部42からフィールドF1,F2との関係(例えば、フィールド間隔)と類似したデータを解析データから抽出する。
フィールドタイプが漢字とカタカナであるので、読取優先度の高いタイプ(ここでは、漢字とする)の推奨フィールド間隔が類似したデータとして抽出されることになる。
しかし、ユーザが設定したフィールド間隔は「2」mmであり、解析データから取得した推奨フィールド間隔は「3」mmなので、認識エラーを起こす可能性が高い。そこで、ガイダンス作成部32は、このことをユーザに通知するガイダンス情報を表示する。図8においては、「上に位置する4点のマークで囲まれた点線枠が読取結果に影響を及ぼす可能性があります。後1mm離すと解消される可能性があります。」と表示されている。従って、ユーザは、このガイダンスに従いフィールドF1とフィールドF2との間隔を「1」mm増やすならば、認識エラーを起こす可能性の少ない帳票が、容易に作成できるようになる。
ステップSB3: ユーザは表示されたガイダンスに従いフォーマット設定値を修正する場合には、ステップSB1に戻り、修正しない場合にはステップSB4に進む。
ステップSB4: このようにして帳票が作成されると、当該帳票のフォーマット設定値が纏められて、フォーマットファイルとして記憶部41に記憶される。
上記実施の形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
<付記1>
少なくとも1つ以上の文字が記入されるフィールドを備えた帳票の設計及び当該帳票に記入された文字の認識する際に用いる帳票設計・読取設定支援装置であって、
前記帳票の設計仕様をフォーマットファイルとして記憶すると共に、帳票設計時及び帳票認識時において帳票一般に共通して推奨される帳票設計値及び読取設定値を、推奨帳票設計値及び推奨読取設定値として含む解析データを記憶する記憶ユニットと、
前記帳票設計時には、ユーザが設定した帳票設定値に基づき前記フォーマットファイルを作成すると共に、その際に前記解析データから前記推奨帳票設計値を抽出して設計ガイダンス情報を作成することにより、ユーザによる帳票設計を支援する設計ユニットと、
前記帳票のフィールド毎の帳票認識結果と前記フォーマットファイルとからなる運用ログに基づき前記解析データを作成する解析ユニットと、
を備えることを特徴とする帳票設計・読取設定支援装置。
<付記2>
付記1に記載の帳票設計・読取設定支援装置であって、
前記設計ユニットは、前記帳票認識時には、前記記憶ユニットから前記推奨読取設定値を抽出して、ユーザの読取設定値の設定を支援する読取ガイダンス情報を作成する、
ことを特徴とする帳票設計・読取設定支援装置。
<付記3>
付記1又は2に記載の帳票設計・読取設定支援装置であって、
前記記憶ユニットは、
前記フォーマットファイルを記憶する記憶部と、
前記解析データを保持する解析データ保持部と、
を備えることを特徴とする帳票設計・読取設定支援装置。
<付記4>
付記1乃至3のいずれか1項に記載の帳票設計・読取設定支援装置であって、
前記設計ユニットは、
前記帳票を作成する帳票作成部と、
前記記憶ユニットから前記ファイルフォーマット及び前記解析データを取得して、前記設定ガイダンス情報及び前記読取ガイダンス情報を作成するガイダンス作成部と、
を備えることを特徴とする帳票設計・読取設定支援装置。
<付記5>
付記1乃至4のいずれか1項に記載の帳票設計・読取設定支援装置であって、
前記解析ユニットは、
前記帳票認識結果と前記フォーマットファイルとから、当該帳票に対する前記運用ログを作成する運用ログ作成部と、
前記運用ログから前記帳票設計値及び前記帳票読取設定値を抽出して、類似した前記フィールド毎に纏めてなる前記解析データを作成する解析部と、
を備えることを特徴とする帳票設計・読取設定支援装置。
<付記6>
付記1乃至5のいずれか1項に記載の帳票設計・読取設定支援装置であって、
前記フォーマットファイルは、
前記帳票を特徴付ける帳票識別番号と、
前記フィールドの座標を示すフィールド座標、該フィールドに記入される文字のタイプを示すフィールドタイプ、前記フィールドを形成する1文字記入スペースをなす文字枠の数、隣接する前記文字枠の間隔を示すフォーマット文字枠間隔、最隣接するフィールドとの間隔をなすフォーマットフィールド間隔、最隣接する文字認識対象でない情報が記載されたドロップアウト領域との間隔をなすフォーマットフィールド間隔、前記フィールド位置の帳票裏面に情報が記載されているか否かを示す裏面情報、のうちの少なくとも1つが前記フィールドを特徴付けるフィールド番号と対応付けされてなるフィールド情報と、
からなることを特徴とする帳票設計・読取設定支援装置。
<付記7>
付記1乃至6のいずれか1項に記載の帳票設計・読取設定支援装置であって、
前記運用ログは、前記帳票認識結果が認識エラーを示す場合には、該認識エラーを起こした前記フィールドの前記フィールド情報から前記認識エラーに関与する原因を得ると共に、当該要因毎の認識エラー回数を認識処理累積回数で規格化して重付けされている、
ことを特徴とする帳票設計・読取設定支援装置。
<付記8>
付記1乃至7のいずれか1項に記載の帳票設計・読取設定支援装置であって、
前記解析データに含まれる前記推奨読取設定値又は前記推奨帳票設計値は、前記フィールド情報に類似している前記フィールドに対する前記帳票認識結果から、所望の認識率が達成できる前記読取設定値又は前記帳票設計値である、
ことを特徴とする帳票設計・読取設定支援装置。
<付記9>
付記1乃至8の何れか1項に記載の帳票設計・読取設定支援装置と、
前記帳票を撮像して帳票画像を取得し、ユーザが設定した前記読取設定値に従い前記帳票画像から文字認識処理を行う文字認識装置と、
を備えることを特徴とする光学文字認識システム。
<付記10>
少なくとも1つ以上の文字が記入されるフィールドを備えた帳票の設計及び当該帳票に記入された文字の認識する際に用いる帳票設計・読取設定支援方法であって、
前記帳票の設計仕様をフォーマットファイルとして記憶すると共に、帳票設計時及び帳票認識時において帳票一般に共通して推奨される帳票設計値及び読取設定値を推奨帳票設計値及び推奨読取設定値として含む解析データを記憶し、
前記帳票設計時には、ユーザが設定した帳票設定値に基づき前記フォーマットファイルを作成すると共に、その際に前記解析データから前記推奨帳票設計値を抽出して設計ガイダンス情報を作成することにより、ユーザによる帳票設計を支援し、
前記帳票のフィールド毎の帳票認識結果と前記フォーマットファイルとからなる運用ログに基づき前記解析データを作成する、
ことを特徴とする帳票設計・読取設定支援方法。
<付記11>
付記10に記載の帳票設計・読取設定支援方法であって、
前記設計ユニットは、前記帳票認識時には、前記記憶ユニットから前記推奨読取設定値を抽出して、ユーザの読取設定値の設定を支援する読取ガイダンス情報を作成する、
ことを特徴とする帳票設計・読取設定支援方法。
<付記12>
付記10又は11に記載の帳票設計・読取設定支援方法であって、
ユーザの帳票設定値に従い前記帳票を作成し、
前記ファイルフォーマット及び前記解析データから、前記設定ガイダンス情報及び前記読取ガイダンス情報を作成する、
ことを特徴とする帳票設計・読取設定支援方法。
<付記13>
付記10乃至13のいずれか1項に記載の帳票設計・読取設定支援方法であって、
前記帳票認識結果と前記フォーマットファイルとから、当該帳票に対する前記運用ログを作成し、
前記運用ログから前記帳票設計値及び前記帳票読取設定値を抽出して、類似した前記フィールド毎に纏めてなる前記解析データを作成する、
ことを特徴とする帳票設計・読取設定支援方法。
<付記14>
付記10乃至13のいずれか1項に記載の帳票設計・読取設定支援方法であって、
前記フォーマットファイルは、
前記帳票を特徴付ける帳票識別番号と、
前記フィールドの座標を示すフィールド座標、該フィールドに記入される文字のタイプを示すフィールドタイプ、前記フィールドを形成する1文字記入スペースをなす文字枠の数、隣接する前記文字枠の間隔を示すフォーマット文字枠間隔、最隣接するフィールドとの間隔をなすフォーマットフィールド間隔、最隣接する文字認識対象でない情報が記載されたドロップアウト領域との間隔をなすフォーマットフィールド間隔、前記フィールド位置の帳票裏面に情報が記載されているか否かを示す裏面情報、のうちの少なくとも1つが前記フィールドを特徴付けるフィールド番号と対応付けされてなるフィールド情報と、
からなることを特徴とする帳票設計・読取設定支援方法。
<付記15>
付記10乃至14のいずれか1項に記載の帳票設計・読取設定支援方法であって、
前記運用ログは、前記帳票認識結果が認識エラーを示す場合には、該認識エラーを起こした前記フィールドの前記フィールド情報から前記認識エラーに関与する原因を得ると共に、当該要因毎の認識エラー回数を認識処理累積回数で規格化して重付けされている、
ことを特徴とする帳票設計・読取設定支援方法。
<付記16>
付記10乃至15のいずれか1項に記載の帳票設計・読取設定支援方法であって、
前記解析データに含まれる前記推奨読取設定値又は前記推奨帳票設計値は、前記フィールド情報に類似している前記フィールドに対する前記帳票認識結果から、所望の認識率が達成できる前記読取設定値又は前記帳票設計値である、
ことを特徴とする帳票設計・読取設定支援方法。
以上、実施形態(及び実施例)を参照して本願発明を説明したが、本願発明は上記実施形態(及び実施例)に限定されるものではない。
2 光学文字認識システム
3 ユーザインタフェース
3b ディスプレイ
3a キーボード
4 OCR装置
5 帳票設計・読取設定支援装置
11 画像取得部
12 認識部
13 読取/修正部
20 解析ユニット
21 運用ログ作成部
22 解析部
30 設計ユニット
31 帳票作成部
32 ガイダンス作成部
40 記憶ユニット
41 記憶部
42 解析データ保持部

Claims (10)

  1. 少なくとも1つ以上の文字が記入されるフィールドを備えた帳票の設計及び当該帳票に記入された文字の認識する際に用いる帳票設計・読取設定支援装置であって、
    前記帳票の設計仕様をフォーマットファイルとして記憶すると共に、帳票設計時及び帳票認識時において帳票一般に共通して推奨される帳票設計値及び読取設定値を、推奨帳票設計値及び推奨読取設定値として含む解析データを記憶する記憶ユニットと、
    前記帳票設計時には、ユーザが設定した帳票設定値に基づき前記フォーマットファイルを作成すると共に、その際に前記解析データから前記推奨帳票設計値を抽出して設計ガイダンス情報を作成することにより、ユーザによる帳票設計を支援する設計ユニットと、
    前記帳票のフィールド毎の帳票認識結果と前記フォーマットファイルとからなる運用ログに基づき前記解析データを作成する解析ユニットと、
    を備えることを特徴とする帳票設計・読取設定支援装置。
  2. 請求項1に記載の帳票設計・読取設定支援装置であって、
    前記設計ユニットは、前記帳票認識時には、前記記憶ユニットから前記推奨読取設定値を抽出して、ユーザの読取設定値の設定を支援する読取ガイダンス情報を作成する、
    ことを特徴とする帳票設計・読取設定支援装置。
  3. 請求項1又は2に記載の帳票設計・読取設定支援装置であって、
    前記記憶ユニットは、
    前記フォーマットファイルを記憶する記憶部と、
    前記解析データを保持する解析データ保持部と、
    を備えることを特徴とする帳票設計・読取設定支援装置。
  4. 請求項1乃至3のいずれか1項に記載の帳票設計・読取設定支援装置であって、
    前記設計ユニットは、
    前記帳票を作成する帳票作成部と、
    前記記憶ユニットから前記ファイルフォーマット及び前記解析データを取得して、前記設定ガイダンス情報及び前記読取ガイダンス情報を作成するガイダンス作成部と、
    を備えることを特徴とする帳票設計・読取設定支援装置。
  5. 請求項1乃至4のいずれか1項に記載の帳票設計・読取設定支援装置であって、
    前記解析ユニットは、
    前記帳票認識結果と前記フォーマットファイルとから、当該帳票に対する前記運用ログを作成する運用ログ作成部と、
    前記運用ログから前記帳票設計値及び前記帳票読取設定値を抽出して、類似した前記フィールド毎に纏めてなる前記解析データを作成する解析部と、
    を備えることを特徴とする帳票設計・読取設定支援装置。
  6. 請求項1乃至5のいずれか1項に記載の帳票設計・読取設定支援装置であって、
    前記フォーマットファイルは、
    前記帳票を特徴付ける帳票識別番号と、
    前記フィールドの座標を示すフィールド座標、該フィールドに記入される文字のタイプを示すフィールドタイプ、前記フィールドを形成する1文字記入スペースをなす文字枠の数、隣接する前記文字枠の間隔を示すフォーマット文字枠間隔、最隣接するフィールドとの間隔をなすフォーマットフィールド間隔、最隣接する文字認識対象でない情報が記載されたドロップアウト領域との間隔をなすフォーマットフィールド間隔、前記フィールド位置の帳票裏面に情報が記載されているか否かを示す裏面情報、のうちの少なくとも1つが前記フィールドを特徴付けるフィールド番号と対応付けされてなるフィールド情報と、
    からなることを特徴とする帳票設計・読取設定支援装置。
  7. 請求項1乃至6のいずれか1項に記載の帳票設計・読取設定支援装置であって、
    前記運用ログは、前記帳票認識結果が認識エラーを示す場合には、該認識エラーを起こした前記フィールドの前記フィールド情報から前記認識エラーに関与する原因を得ると共に、当該要因毎の認識エラー回数を認識処理累積回数で規格化して重付けされている、
    ことを特徴とする帳票設計・読取設定支援装置。
  8. 請求項1乃至7のいずれか1項に記載の帳票設計・読取設定支援装置であって、
    前記解析データに含まれる前記推奨読取設定値又は前記推奨帳票設計値は、前記フィールド情報に類似している前記フィールドに対する前記帳票認識結果から、所望の認識率が達成できる前記読取設定値又は前記帳票設計値である、
    ことを特徴とする帳票設計・読取設定支援装置。
  9. 請求項1乃至8の何れか1項に記載の帳票設計・読取設定支援装置と、
    前記帳票を撮像して帳票画像を取得し、ユーザが設定した前記読取設定値に従い前記帳票画像から文字認識処理を行う文字認識装置と、
    を備えることを特徴とする光学文字認識システム。
  10. 少なくとも1つ以上の文字が記入されるフィールドを備えた帳票の設計及び当該帳票に記入された文字の認識する際に用いる帳票設計・読取設定支援方法であって、
    前記帳票の設計仕様をフォーマットファイルとして記憶すると共に、帳票設計時及び帳票認識時において帳票一般に共通して推奨される帳票設計値及び読取設定値を推奨帳票設計値及び推奨読取設定値として含む解析データを記憶し、
    前記帳票設計時には、ユーザが設定した帳票設定値に基づき前記フォーマットファイルを作成すると共に、その際に前記解析データから前記推奨帳票設計値を抽出して設計ガイダンス情報を作成することにより、ユーザによる帳票設計を支援し、
    前記帳票のフィールド毎の帳票認識結果と前記フォーマットファイルとからなる運用ログに基づき前記解析データを作成する、
    ことを特徴とする帳票設計・読取設定支援方法。
JP2016022733A 2016-02-09 2016-02-09 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム Active JP6743401B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016022733A JP6743401B2 (ja) 2016-02-09 2016-02-09 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016022733A JP6743401B2 (ja) 2016-02-09 2016-02-09 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム

Publications (2)

Publication Number Publication Date
JP2017142606A true JP2017142606A (ja) 2017-08-17
JP6743401B2 JP6743401B2 (ja) 2020-08-19

Family

ID=59627470

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016022733A Active JP6743401B2 (ja) 2016-02-09 2016-02-09 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム

Country Status (1)

Country Link
JP (1) JP6743401B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235316A (ja) * 1995-02-27 1996-09-13 Fujitsu Ltd 文字認識装置
JP2007323474A (ja) * 2006-06-02 2007-12-13 Nec Corp Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体
JP2014170309A (ja) * 2013-03-01 2014-09-18 Nec Corp 帳票設計装置、帳票設計方法、及び、帳票設計プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08235316A (ja) * 1995-02-27 1996-09-13 Fujitsu Ltd 文字認識装置
JP2007323474A (ja) * 2006-06-02 2007-12-13 Nec Corp Ocrシステム、ocrフォーマットパラメータ作成方法、そのプログラムおよびプログラム記録媒体
JP2014170309A (ja) * 2013-03-01 2014-09-18 Nec Corp 帳票設計装置、帳票設計方法、及び、帳票設計プログラム

Also Published As

Publication number Publication date
JP6743401B2 (ja) 2020-08-19

Similar Documents

Publication Publication Date Title
JP3996579B2 (ja) 機械可読フォームのアクティブ領域を識別するためのフォーム処理システム
JP4347677B2 (ja) 帳票ocrプログラム、方法及び装置
US7840092B2 (en) Medium processing method, copying apparatus, and data filing apparatus
US8675260B2 (en) Image processing method and apparatus, and document management server, performing character recognition on a difference image
KR100570224B1 (ko) 전표정의데이터 작성방법 및 전표처리장치
US11418658B2 (en) Image processing apparatus, image processing system, image processing method, and storage medium
CN107133615B (zh) 信息处理设备和信息处理方法
JP2008145611A (ja) 情報処理装置、プログラム
US20220415008A1 (en) Image box filtering for optical character recognition
US9396389B2 (en) Techniques for detecting user-entered check marks
JP2021043775A (ja) 情報処理装置及びプログラム
RU2597163C2 (ru) Сравнение документов с использованием достоверного источника
JP2017212575A (ja) 画像読込み装置及びプログラム
JP4983464B2 (ja) 帳票画像処理装置及び帳票画像処理プログラム
JP7241506B2 (ja) 光学式文字認識結果の修正支援装置および修正支援用プログラム
JP6080586B2 (ja) 文字認識システム、文字認識プログラム及び文字認識方法
JP2017142606A (ja) 帳票設計・読取設定支援装置、帳票設計・読取設定支援方法、及び、光学文字認識システム
JP2017228092A (ja) 審査業務支援装置および審査業務支援方法
US20210042555A1 (en) Information Processing Apparatus and Table Recognition Method
JP4347675B2 (ja) 帳票ocrプログラム、方法及び装置
JP2017208655A (ja) 情報処理装置、情報処理方法及びプログラム
JP7150809B2 (ja) 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム
US11462014B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP5277750B2 (ja) 画像処理プログラム、画像処理装置及び画像処理システム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190115

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191021

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20191126

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200713

R150 Certificate of patent or registration of utility model

Ref document number: 6743401

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150