JP7408340B2 - 画像処理装置の制御方法、プログラム及び画像処理装置 - Google Patents
画像処理装置の制御方法、プログラム及び画像処理装置 Download PDFInfo
- Publication number
- JP7408340B2 JP7408340B2 JP2019187926A JP2019187926A JP7408340B2 JP 7408340 B2 JP7408340 B2 JP 7408340B2 JP 2019187926 A JP2019187926 A JP 2019187926A JP 2019187926 A JP2019187926 A JP 2019187926A JP 7408340 B2 JP7408340 B2 JP 7408340B2
- Authority
- JP
- Japan
- Prior art keywords
- character recognition
- character
- item
- correction
- processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 158
- 238000000034 method Methods 0.000 title claims description 150
- 238000012937 correction Methods 0.000 claims description 140
- 230000008569 process Effects 0.000 claims description 132
- 238000000605 extraction Methods 0.000 claims description 104
- 239000000284 extract Substances 0.000 claims description 8
- 238000012790 confirmation Methods 0.000 description 28
- 238000007476 Maximum Likelihood Methods 0.000 description 23
- 230000006870 function Effects 0.000 description 17
- 238000004891 communication Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000013479 data entry Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 4
- 238000010191 image analysis Methods 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
- Character Input (AREA)
Description
さらに、スキャン文書画像に対して、文字認識処理(Optical Character Recognition:OCR)を行い、コンピュータが利用可能な文字コードに変換する技術が広く使われるようになってきている。文字認識処理を用いることで、一般的なオフィスで実施されている経費精算作業に代表される、帳票などの紙媒体からデジタルデータへの変換を伴うデータ入力作業を自動化することできるようになった。これにより、データ入力作業における生産性の向上が図られている。
しかし、特許文献1のような補正処理を行ったとしても、正解テキストのような辞書に存在しない未知の文字認識の誤りが発生する場合があるため、補正処理により誤認識された文字を完全に修復することができない。そのため、データ入力作業においては、スキャンした文書に対する文字認識処理の結果を、ユーザが確認して、誤認識された文字については修正を行う必要がある
以下、図面を用いて、本発明の実施例について説明する。
図1に、本実施例に係るデータ入力システム100のシステム構成の概略である。典型的には、データ入力システム100は、複合機(MFP)から構成される。以下、図1のデータ入力システムに示された各デバイスについて説明する。
CPU(Central Processing Unit)101は、データ入力システムにおける大部分の制御や処理を実行する。CPU101が実行する制御や処理は、後述するROM102やRAM103上のプログラムによって指示される。CPU101自身の機能や計算機プログラムの機能により、CPU101は複数の計算機プログラムを並列に動作させることもできる。
ROM(Read Only Memory)102は、CPU101による制御の手順を記憶させた計算機プログラムやデータを格納する。
RAM(Random Access Memory)103は、CPU101が処理するための制御プログラムを格納するとともに、CPU101が各種制御を実行する際の様々なデータの作業領域を提供する。
バス105は、データ入力システム内の各デバイスに接続されているアドレスバス、データバスなどであり、各デバイス間の情報交換・通信機能を提供する。これにより、各デバイスは連携して動作することができる。
外部記憶装置106は、各種データ等を記憶する。外部記憶装置106は、ハードディスクやフロッピーディスク、光ディスク、磁気ディスク、磁気テープ、不揮発性のメモリカード等の記録媒体と、記憶媒体を駆動し情報を記録するドライブなどで構成される。保管された計算機プログラムやデータの全体や一部は、キーボード等の指示や、各種計算機プログラムの指示により、必要な時にRAM103上に呼び出される。
GPU(Graphics Processing Unit)108は、CPU101などにより与えられた表示指示や計算指示に従い、表示内容の画像の作成や表示位置などの計算を行い、その計算結果を表示装置109へ送信して描画させる。また、GPU108は、バス105を経由して、計算結果をCPU101に返信することで、CPU101と連携した計算処理を行うこともできる。
スキャナ110は、文書上の画像を読み取り、画像データに変換する。スキャナ110は、NCU107の通信機能を介して接続されてもよいし、それ以外の独自の外部I/Fを介して接続される形態でもよい。
また、データ入力システムを構成する内部構成は、単一のシステム内に備えられることには限られず、複数のシステムに分散して備えられてもよい。この場合、各システムにおけるNCU107を利用した情報交換・共有等を行い連携させることで、各システムをサーバやクライアント等として構成する方法で実現しても構わない。すなわち、このような複数のシステムである場合、各内部構成が物理的に異なる場所にあって、LANやインターネットなどを介して連携動作する場合でもよいし、また、仮想的にソフトウエアで作り出されたものが含まれていても構わない。さらに、複数のサーバやPCクライアント等の各システムの全部もしくは一部を、単一の内部構成において共有して動作させるような利用方法であっても構わない。
スキャン文書画像201は、紙などの媒体に手書き文字が記載されたり活字が印刷されたりした文書を光学的にスキャンすることによって得られた画像情報である。スキャン文書画像201は、スキャナ110で文書に対してスキャンが行われることにより取得される。スキャン文書画像201は、基本的に、外部記憶装置106やRAM103に格納され、外部記憶装置106にある場合には、利用時にRAM103にコピーされる。
文書画像解析部210は、後述する文書画像処理211と文字認識処理212の機能と、文字認識辞書213の情報を有している。
文字認識処理212は、スキャン文書画像201の全体について文字認識処理を行う以外にも、スキャン文書画像201内の一部の領域に対してのみ文字認識処理を行うことが可能である。また、文字認識処理を行う際に、文字の種類、使用言語、文字列の記載方向等の制約を与えることも可能である。
特定情報抽出部220は、後述する文書分類・抽出項目選択処理221、項目名・項目値推定処理223、辞書・文字パターン突合処理225の機能を有している。また、特定情報抽出部220は、後述する文書分類データ(抽出項目データ)212、項目名・項目値制約データ214、文字認識誤りパターン辞書216、辞書・文字パターンデータ217の情報を有している。なお、本実施例における「項目」や「項目値」については、3を用いて後述する。
この例では、文書300の種別は、帳票の一種である請求書である。文書内には、文書の内容を示す単位として区別可能な項目が複数含まれている。そして、各項目について、その内容を示す項目値が記載されている。例えば、図3の文書300には、文書タイトル301、作成日付302、請求先名称303、請求元情報304、請求金額305、請求内容306、請求元の振込先情報307などの各種項目が含まれている。
作成日付302、請求先名称303、請求元情報304、請求金額305、請求内容306、請求元の振込先情報307について、それぞれ、それらに対応する項目値が記載されている。例えば、作成日付302の項目は、それに対応する日付(ここでは、「2019年2月1日」)が項目値として記載されている。
次に、S402において、CPU101は、スキャン文書画像201を二値化する処理を行う。この処理は、図2におけるスキャン文書画像201に対する文書画像処理211に相当する。
次に、S403において、CPU101は、スキャン文書画像201から罫線を除去する。この処理も、図2におけるスキャン文書画像201に対する文書画像処理211に相当する。
なお、図3に示した文書300を用いた文字認識処理の結果の例については、図5を用いて後述する。
なお、割当処理の詳細については、図6のフローチャートを用いて後述する。また、図3に示した文書300を用いた場合の割当処理の結果については、図7の表を用いて後述する。
なお、補正処理の詳細については、図8のフローチャートを用いて後述する。また、図3に示した文書300を用いた場合の補正処理の結果については、図11の表を用いて後述する。
文字認識誤りパターン情報抽出処理の詳細については、図12のフローチャートを用いて後述する。また、図3に示した文書300を用いた場合の文字認識誤りパターン情報抽出処理の結果については、図14の表を用いて後述する。
S409の処理が終了したら、本フローチャートは終了する。
図5(a)は、図3に示した文書300に対する文字認識結果を表形式により示したものである。これは、図4のフローチャートのS404における文字認識処理により取得される。
文字認識結果は、文字列単位で管理される。そして、図5(a)中の「文字認識結果ID」として示されているように、文字列毎に識別番号として文字認識結果IDが付与される。
また、各文字認識結果は、文字列を構成する文字毎に、文字コードと位置・座標情報を有している。文字コードは、各文字認識結果は、文字列を構成する文字毎に、最尤候補に加えて、最尤候補より尤度が低い下位候補の情報を含んでいる。なお、図5(a)中では、「文字認識結果(最尤候補文字列)」として、各文字認識結果について、最尤候補の文字コードの文字列のみを示している。
同様に、「文字認識結果ID」の「20」と「21」は、それぞれ、文書300の請求金額305内の「御請求金額」と金額に対応する。
また、「文字認識結果ID」の「30」と「31」は、それぞれ、文書300の請求内容306内の「合計」と合計金額に対応する。
図5(b)は、「文字認識結果ID」の「1」についての文字認識結果である。
開始点511は文字認識結果の開始を示す印であり、終了点512は文字認識結果の終了を示す印である。開始点511から終了点512の間に、文字認識結果である文字列が配置される。
矢印513は、文字の列の流れを示している。文字列514は、最尤候補の文字521~524の文字列(最尤候補文字列)を示している。
図5(b)と同様に、開始点531は文字認識結果の開始を示す印であり、終了点532は文字認識結果の終了を示す印である。開始点531から終了点532の間に、文字認識結果である文字列が配置される。
矢印533は、文字の列の流れを示している。文字列534は、最尤候補の文字541~547の文字列(最尤候補文字列)を示している。
項目値の記載位置が「固定」である場合、S602へ進む。「可変」の場合、S603へ進む。
S602の処理が終了したら、S608へ進む。
項目名の検索結果があった場合、S605へ進む。項目名の検索結果がなかった場合、S608へ進む。
S605の処理が終了したら、S606へ進む。
項目値の検索結果があった場合、S607へ進む。項目値の検索結果がなかった場合、S608へ進む。
項目値の検索結果があった場合、S607において、CPU101は、検索結果の文字認識結果を項目値として割り当てる。
S607の処理が終了したら、S608へ進む。
項目値の割り当てができた場合、S610へ進む。項目値の割り当てができなかった場合、S609へ進む。
項目値の割り当てができなかった場合、S609において、CPU101は、項目値に該当する文字認識結果情報は該当なしとする。
S609の処理が終了したら、本フローチャートは終了する。
項目値の割り当てができた場合、S610において、CPU101は、割り当てられた文字認識結果から、項目値の文字認識結果情報を作成する。
S610の処理が終了したら、本フローチャートは終了する。
図7(a)は、図3に示した文書300についての抽出項目の例を、表形式により示したものである。これは、図4のフローチャートのS405の抽出項目選択処理の結果として得られるものである。
文書300について図4のフローチャートのS404で文字認識処理により得られた文字認識結果(図5(a))に対し、S405の抽出項目選択処理を行うと、文書の種別として、「請求書」が得られる。そして、文書が請求書である場合、抽出項目として、図7(a)に示したような項目が抽出される。
各抽出項目は、「項目値の位置」として、文書上における項目値の記載位置に関する情報を有している。項目値の位置が「固定」である場合は、項目値の記載位置として、文書中の特定された位置(範囲)の情報が含まれる(ただし、図7(a)では不表示)。一方、項目値の位置が「可変」である場合は、項目値の記載位置に関する情報は含まれない。その代わりに、「項目名の文字列」の情報と「項目名の位置に対する項目値の相対方向」の情報が含まれる。
なお、「項目値の文字列」に複数の文字列がある場合は、それぞれに検索が行われ、先頭に記載されている方から優先的に検索結果とする。また、「項目名の位置」が「固定」である場合は、「項目名の文字列」と「項目名の位置に対する項目名の相対位置」に関する情報はないため、「(なし)」になっている。
「抽出項目ID」が「4」~「10」の抽出項目については、図7(a)に示したように、「項目名の位置」が「可変」で、「項目値の文字列」が指定されているため、「項目名の文字認識結果(最尤候補文字列)」に検索した結果の項目名が記載されている。また、「項目名の文字認識時の制約」として、その文字認識処理を行った際の制約が記載されている。
なお、抽出項目IDが「1」~「3」の抽出項目については、図7(a)に示されているように、「項目名の位置」が「固定」であるため、「項目名の文字認識結果(最尤候補文字列)」と「項目名の文字認識時の制約」は「(なし)」になっている。
抽出項目毎に、「項目値の文字認識結果(最尤候補文字列)」に、項目値として検索した文字認識結果が記載されている。また、「項目名の文字認識時の制約」に、その文字認識処理を行った際の制約が記載されている。
なお、「抽出項目ID」が「1」~「3」の抽出項目については、「項目名の位置」が「固定」であるため、「項目値の文字認識結果(最尤候補文字列)」には、文書中の特定された位置(範囲)の情報に基づいて検索された結果が記載されている。
「項目値の再文字認識制約」において、再文字認識処理を行う際の文字種等の制約が設定されている場合、再文字認識処理が必要であるとして、S802へ進む。制約が設定されていない場合、再文字認識処理が不要であるとして、S804へ進む。
S802の処理が終了したら、S803へ進む。
S803の処理が終了したら、S804へ進む。
辞書・文字パターン設定がある場合、辞書・文字パターンを用いた補正を行うため、S805へ進む。辞書・文字パターン設定がない場合、辞書・文字パターンを用いた補正を行うことなく、本フローチャートの処理は終了する。
なお、文字認識誤りパターン辞書に基づくラティス構造の追加の詳細については、図10を用いて後述する。
S805の処理が終了したら、S806へ進む。
なお、文字認識処理の際の制約毎に用意された辞書及び文字パターンの詳細については、図11を用いて後述する。
S806の処理が終了したら、S807へ進む。
S807の処理が終了したら、本フローチャートの処理は終了する。
図9(a)は、図3で示した文書300に対する項目値の再文字認識処理の例を、表形式を用いて示したもので、図4のフローチャートのS405の抽出項目選択処理により得られる結果の一部である。
文書300に対して得られた文字認識結果(図5(a))に対し、図4のフローチャートのS405の抽出項目選択処理を行うと、文書の種別とともに、図9(a)に示されるような情報が得られる。すなわち、各項目値について、再文字認識処理する際の制約や、辞書・文字パターンを用いた補正を行う際の設定に関する情報が得られる。
また、「項目値補正の辞書・文字パターン設定」で、辞書・文字パターンが設定されている場合、設定されている内容で、(再)文字認識結果に対して補正処理が行われる。なお、補正処理が不要な場合は、「項目値補正の辞書・文字パターン設定」は「(なし)」となっている。
例えば、「文字認識制約ID」が「1」の「全文字種」では、「文字認識制約内容」が「(制限なし)」であり、すなわち、再文字認識処理においてすべての文字が使用可能となっている。また、「文字認識制約ID」が「3」の「金額文字種」では、「文字認識制約内容」として「0」から「9」の数字、「,」、「¥」、「円」が記載されており、再文字認識処理においてこれらの文字のみが使用可能であることが示されている。
なお、再文字認識処理を行わない項目値については、図7(c)で示した元の「項目値の文字認識結果(最尤候補文字列)」のままとなっている。
図10(a)と(b)は、図8のフローチャートのS805で使用する文字認識誤りパターン辞書の例を、表形式を使って示したものである。文字認識誤りパターン辞書は、文字認識処理の際の制約毎に事前に用意されているもので、文字認識処理の際の制約に応じて異なる辞書が使用される。
本実施例では、各文字認識誤りパターン辞書は、「補正結果」として、対応する文字認識処理の際の制約に応じて使用可能な文字のみから構成される。これにより、不必要な「補正結果」の追加が抑止され、辞書・文字パターンを用いた補正処理を効率よく行うことができる。
図10(c)は、図5(b)の文字認識結果(「抽出項目ID」の「1」の項目値)に対して、図10(a)の文字認識処理の際の制約が「全文字種」である場合に使用される文字認識誤りパターン辞書1001に基づいて補正処理を行ったラティス構造である。
「抽出項目ID」の「1」については、図9(a)の「項目値の再文字認識の制約」(「なし」)に従い、再文字認識処理は行われないため、図10(c)のラティス構造は図5(b)の内容をすべて含んでいる。すなわち、図5(b)中の文字521から524と、図10(b)中の文字1021から1024は、それぞれ同じ文字である。
「抽出項目ID」の「6」については、図9(a)の「項目値の再文字認識の制約」(「金額文字種」)に従って再文字認識処理が行われたため、図5(c)ラティス構造における文字の一部が削除されている。すなわち、図5(c)の文字541、552、553、554、555、556は、「項目値の再文字認識の制約」の利用可能な文字でないため、図10(d)のラティス構造においては削除されている。なお、図10(d)中の、文字1042から1047は、図5(c)中の文字542から547と、それぞれ同じ文字である。
さらに、文字1045(「6」)が、図10(b)の文字認識誤りパターン辞書1002における「誤りパターンID」の「1」の「文字認識結果」と一致している。そのため、文字認識誤りパターン辞書1002の「誤りパターンID」の「1」の「補正結果」である「5」が、文字1071として文字1045の下位候補に追加されている。
図11(a)と(b)は、図8のフローチャートのS806で使用する項目毎の補正用の辞書と文字パターンを、表形式を用いて示したものである。補正用の辞書・文字パターンは、抽出項目の内容に応じて事前に作成されており、抽出項目の「項目値補正の辞書・文字パターン設定」(図9(a)を参照)に応じて選択され使用される。
各抽出項目について、使用される補正用の辞書・文字パターンは、図9(a)の各抽出項目について「項目値補正の辞書・文字パターン設定」で指定されたものである。そして、「項目値」として、補正用の辞書・文字パターンを用いて補正された結果が示されている。また、「補正内容」として、補正用の辞書・文字パターンを用いた補正前と補正後の内容が示されている。また、「項目値の(再)文字認識の制約」として、(再)文字認識処理を行った際の制約が示されている。
すなわち、図10(c)のラティス構造の開始点1011から終了点1012の間にある、文字1061、1023、1024で構成される文字列に「請求書」がある。これは補正用の辞書1101の「辞書項目ID」の「1」の「標準文字列」である「請求書」と一致している。そのため、図11(c)に示したように、「抽出項目ID」が「1」の「文書タイトル」の項目値は、「請求書」に補正されている。
すなわち、図10(d)のラティス構造の開始点1031から終了点1032の間にある、文字1051、1042、1043、1044、1045、1046、1047で構成される文字列「10,162円」は、「文字パターン規則」に一致する。そのため、図11(c)に示したように、「抽出項目ID」が「6」の項目値は、「10,162円」となっている。
なお、最も類似した文字列を算出する手法としては、文字認識結果の尤度や、文字の連接尤度、文字パターンや辞書内の文字の一致度などを使用する様々なものが知られている。例えば、文字列の動的計画法を用いた編集距離計算手法や、ビタビアルゴリズムなどが周知である。本発明においては、これらのいずれの手法を用いても構わない。
S1201の処理が終了したら、S1202へ進む。
ユーザが確認して修正が必要ないと判断した場合、ユーザが確認・修正用画面上で修正不要の旨を指示することにより、修正が不要であることを直接的に取得することができる。また、一定時間が経過するなどにより、修正が不要であることを間接的に取得することもできる。一方、ユーザが確認・修正用画面上で修正をした場合は、修正が必要であることと、修正内容を直接的に取得することができる。
S1202の処理が終了したら、S1203へ進む。
ユーザによる修正が行われた場合、S1204へ進む。修正が行われなかった場合、本フローチャートの処理は終了する。
これにより、文字認識処理において誤認識された文字(列)と、ユーザにより修正された正しい文字(列)とが対応付けられた文字認識誤りパターン情報が、文字認識処理の制約毎に、新たに作成される。
S1204の処理が終了したら、S1205へ進む。
文字認識誤りパターン情報を登録すべきすべての文字認識誤りパターン辞書が存在する場合、S1207へ進む。登録すべき文字認識誤りパターン辞書に存在しないものがある場合は、S1206へ進む。
S1206の処理が終了したら、S1207へ進む。
S1207の処理が終了したら、本フローチャートは終了する。
一時保存ボタン1302が押下されると、確認・修正用画面1300上での確認・修正作業の内容が一時保存され、確認・修正作業を一時的に終了させ、確認・修正用画面1300が閉じられる。この後、確認・修正用画面1300が開かれると、一時保存された作業内容が再び表示され、確認・修正作業を再開することができるようになる。
完了ボタン1303が押下されると、確認・修正用画面1300での確認・修正作業の内容を作業結果として保存した後、確認・修正用画面1300が閉じられて、確認・修正作業が終了する。
表示領域1320には、図4のフローチャートのS407で得られた抽出項目の項目値が表示される。ユーザは表示領域1320において項目値の確認・修正を行うことができる。
1331には抽出項目の名称が表示されており、ボックス1330が「文書タイトル」の項目値に関するものであることを示している。1332には、文書画像内の位置・サイズに基づいて切り抜かれたスキャン文書画像201の項目値の領域が、部分画像として表示されている。1333には、1332に表示された部分画像を文字認識処理した項目値の文字列が表示されている。1332に表示された文字列は、ユーザが確認・修正することができる。
1333に表示された文字列が編集されない場合、文字認識結果が正しいとユーザが確認したこととなる。一方、1333に表示された文字列を編集して内容を変更した場合は、ユーザが修正を行ったこととなる。これは、他のボックス1340、1350、1360に表示された項目値についても同様である。
この状態において、ユーザは、カーソル1334が位置している抽出項目「文書タイトル」の項目値(「請求書」)を編集することができる。
このようにして、ユーザは、確認・修正用画面1300において、全抽出項目の項目値の確認・修正を行うことができる。
図14(a)に示されるように、「抽出項目ID」毎に、「項目値の出力結果(ユーザ修正前)」と「ユーザ修正後の項目値」が記録されており、また、それらを比較した「修正内容」が検出されている。また、「項目値の文字認識制約」の情報も含まれている。
「項目値の出力結果(ユーザ修正前)」は、図11(c)で示した項目値と同じものである。この例では、「抽出項目名ID」の「5」、「6」、「10」において、文字認識処理の誤りで、再文字認識処理や辞書・文字パターンを用いた補正処理で修正できなかったものが、ユーザによって修正されたことが示されている。また、ユーザにより修正された内容が、「項目値の文字認識の制約」と対応付けられて、「修正内容」として示されている。
各文字認識誤りパターン情報は、それらを識別するために「誤りパターンの追加ID」が付与される。そして、「文字認識の制約」毎に、文字認識処理による誤った「文字認識結果」と、ユーザによる「修正結果」が記載されている。「文字認識結果」と「修正結果」は図10(a)や(b)に示したものに対応し、「文字認識の制約」は図9などに示したものに対応する。
これにより、文字認識処理の際の制約毎に文字認識誤りパターン辞書を利用することができるため、文字認識処理の際の制約に応じて効率の良い文字認識誤りパターン情報の利用が実現される。
前述のとおり、実施例1では、例えば、図3に示した文書300に記載されている「口座番号」については、「請求元の振込先口座番号」として、一つの項目として取り扱った。しかし、「口座番号」は、文書300に記載されているように、口座種別である「普通」、「当座」と口座番号である数字列という、区別可能な複数の単位がまとめて記載されたものである。そのため、実施例1では、このような項目値については、文字認識結果をそれぞれの単位に分割し、文字認識処理の際の制約や、補正用の辞書・文字パターンの設定を、単位毎に行う必要があった。
このため、例えば、「口座番号」のように、区別可能な複数の単位がまとめて記載されている項目については、割当処理において、単位毎に分割し、別々の項目として抽出する方が好ましい。ただし、これらの単位の内容は、互いに密接に関連しているため、補正処理においては一括して行う方がよい。
図15(a)は、実施例1における図7(a)を置き換えたものである。
図15(a)の「抽出項目ID」の「1」から「10」は、図7(a)の「抽出項目ID」の「1」から「10」にそれぞれ対応する。ただし、図7(a)の「抽出項目ID」の「8」と「9」は分割されて削除され、図15(a)では、その代わりに、「抽出項目ID」の「14」から「17」が追加されている。また、「抽出項目ID」の「11」から「13」も追加されている。
例えば、「抽出項目ID」の「11」の抽出項目である「請求元郵便番号」は、「抽出項目ID」の「3」の抽出項目である「請求書名称」の位置を基準にして、「下」方向にあることが指定されている。このようにすることで、項目値に対する文字認識結果の割当処理をより詳細に行うことができる。
図15(a)と同様に、図15(b)の「抽出項目ID」の「1」から「10」は、図9(a)の「抽出項目ID」の「1」から「10」にそれぞれ対応する。ただし、図9(a)の「抽出項目ID」の「8」と「9」は分割されて削除され、図15(b)では、その代わりに、「抽出項目ID」の「14」から「17」が追加されている。また、「抽出項目ID」の「11」から「13」も追加されている。
同様に、「抽出項目ID」の「14」の「請求元の振込先銀行名」と「抽出項目ID」の「15」の「請求元の振込先銀行支店名」についても、両者には密接な関係があるため、同一の補正用の辞書を用いた一括した補正処理が行われる。
以上のように、実施例2によれば、文字認識結果に対する補正処理をさらに正確に行うことができる。
本発明は、上述の実施例の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。
本発明は上述の実施例に限定されるものではなく、本発明の趣旨に基づき種々の変形が可能であり、それらを本発明の範囲から除外するものではない。すなわち、上述した各実施例及びその変形例を組み合わせた構成もすべて本発明に含まれるものである。
Claims (6)
- 画像処理装置の制御方法であって、
スキャン文書画像の文字に対して、文字認識処理を行うことにより第1の文字認識結果の文字列を生成する文字認識工程と、
前記スキャン文書画像の文書分類を行い、抽出する項目を選択する選択工程と、
前記項目の文字種の制約に基づいて再文字認識処理を行い前記第1の文字認識結果を更新する再文字認識工程と、
前記更新した第1の文字認識結果に、前記項目の文字種の制約に応じた文字認識誤りパターン辞書から得た第2の文字認識結果を追加する追加工程と、
文字種の制約に応じた辞書及び文字パターンを用いて、前記第2の文字認識結果が追加された第1の文字認識結果を補正する補正工程
とを有することを特徴とする画像処理装置の制御方法。 - ユーザにより修正された項目値の内容から文字認識誤りパターンを抽出し登録する登録工程を有する
ことを特徴とする請求項1に記載の画像処理装置の制御方法。 - 前記選択工程は、文書分類の内容、文書画像内の配置及び抽出項目の情報を利用して抽出する項目を選択する
ことを特徴とする請求項1又は2に記載の画像処理装置の制御方法。 - 前記再文字認識工程は、文字種の制約が設定されている場合に行うことを特徴とする請求項1~3のいずれか1項に記載の画像処理装置の制御方法。
- 請求項1~4のいずれか1項に記載の画像処理装置の制御方法を、コンピュータに実行させるためのプログラム。
- 請求項5に記載のプログラムがインストールされた画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019187926A JP7408340B2 (ja) | 2019-10-11 | 2019-10-11 | 画像処理装置の制御方法、プログラム及び画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019187926A JP7408340B2 (ja) | 2019-10-11 | 2019-10-11 | 画像処理装置の制御方法、プログラム及び画像処理装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021064122A JP2021064122A (ja) | 2021-04-22 |
JP7408340B2 true JP7408340B2 (ja) | 2024-01-05 |
Family
ID=75486306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019187926A Active JP7408340B2 (ja) | 2019-10-11 | 2019-10-11 | 画像処理装置の制御方法、プログラム及び画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7408340B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2023041155A (ja) * | 2021-09-13 | 2023-03-24 | キヤノン株式会社 | 情報処理装置、情報処理装置の制御方法、及びプログラム |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040467A (ja) | 2017-08-25 | 2019-03-14 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
JP2019169026A (ja) | 2018-03-26 | 2019-10-03 | 株式会社Pfu | 情報処理装置、文字認識エンジン最適化方法及びプログラム |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08263587A (ja) * | 1995-03-20 | 1996-10-11 | Matsushita Electric Ind Co Ltd | 文書入力方法および文書入力装置 |
-
2019
- 2019-10-11 JP JP2019187926A patent/JP7408340B2/ja active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019040467A (ja) | 2017-08-25 | 2019-03-14 | キヤノン株式会社 | 画像処理装置およびその制御方法 |
JP2019169026A (ja) | 2018-03-26 | 2019-10-03 | 株式会社Pfu | 情報処理装置、文字認識エンジン最適化方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP2021064122A (ja) | 2021-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5623079B2 (ja) | ハード・コピーの書式からの書式定義の自動発生 | |
US8418050B2 (en) | Computer readable recording medium on which form data extracting program is recorded, form data extracting apparatus, and form data extracting method | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2008059157A (ja) | 書類確認支援システム、書類確認支援装置およびプログラム | |
JP2013164740A (ja) | 会計情報読取りシステム、会計情報読取り方法、及びプログラム | |
JP2022170175A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP7408313B2 (ja) | 画像処理装置、その制御方法及びプログラム | |
JP6755926B2 (ja) | 帳票情報認識装置および帳票情報認識方法 | |
JP7408340B2 (ja) | 画像処理装置の制御方法、プログラム及び画像処理装置 | |
JP6786658B2 (ja) | 書類読取システム | |
JP6856916B1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP2016192223A (ja) | 会計情報読取りシステム及びプログラム | |
JP7379987B2 (ja) | 情報処理装置及びプログラム | |
JP7439435B2 (ja) | 情報処理装置及びプログラム | |
JP2020201822A (ja) | 画像処理装置、その制御方法、及びプログラム | |
JP2020135172A (ja) | 情報処理装置及びプログラム | |
JP7271987B2 (ja) | 情報処理装置及びプログラム | |
WO2021140682A1 (ja) | 情報処理装置、情報処理方法及び情報処理プログラム | |
JP6870159B1 (ja) | データ処理装置、データ処理方法及びプログラム | |
JP5481965B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2019057115A (ja) | 帳票情報認識装置および帳票情報認識方法 | |
JP7157245B2 (ja) | ファイル管理装置、ファイル管理方法、及びプログラム | |
JP2023053491A (ja) | 情報処理装置およびプログラム | |
JP2022101136A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JP2023041155A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221007 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230808 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230815 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231121 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231220 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7408340 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |