JP2021005160A - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP2021005160A
JP2021005160A JP2019117615A JP2019117615A JP2021005160A JP 2021005160 A JP2021005160 A JP 2021005160A JP 2019117615 A JP2019117615 A JP 2019117615A JP 2019117615 A JP2019117615 A JP 2019117615A JP 2021005160 A JP2021005160 A JP 2021005160A
Authority
JP
Japan
Prior art keywords
frame
correct answer
answer rate
size
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2019117615A
Other languages
English (en)
Other versions
JP7226136B2 (ja
Inventor
曽我 和浩
Kazuhiro Soga
和浩 曽我
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2019117615A priority Critical patent/JP7226136B2/ja
Priority to US16/665,781 priority patent/US20200410043A1/en
Publication of JP2021005160A publication Critical patent/JP2021005160A/ja
Application granted granted Critical
Publication of JP7226136B2 publication Critical patent/JP7226136B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

【課題】帳票を定義する際に、枠の大きさに起因して、認識精度が低下する可能性のある枠を、ユーザが予め把握することができる情報処理装置及びプログラムを提供する。【解決手段】サーバ装置10Aは、帳票画像の項目に対応して設けられた枠毎の認識結果に関する統計データであって、枠の属性毎に、枠のサイズ、及び、枠内の画像が正しく認識された割合を示す正答率が対応付けられた統計データから、枠の属性毎の正答率を取得する取得部30と、取得部30により取得された枠の属性毎の正答率が閾値以下となる枠が存在する場合に、帳票画像の定義を行う画面である帳票定義画面において枠の表示形態を変化させる制御を行う表示制御部32と、を備える。【選択図】図3

Description

本発明は、情報処理装置及びプログラムに関する。
例えば、特許文献1には、複数の項目に関して、その記入欄と予めプリントされた項目名とが配列され、記入欄と項目名とがそれぞれ罫線によって区画された帳票を読み取った帳票イメージから、記入欄内の文字を認識する帳票OCR処理をコンピュータに実行させる帳票OCRプログラムが記載されている。この帳票OCRプログラムは、帳票イメージの全面に対してOCR処理を実行し、記入欄を区画する記入枠の位置、項目名を取り囲む項目名枠の位置、及びこれらの枠内の文字列を認識するとともに、認識した情報を枠毎に1つのレコードとしてまとめる全面OCR処理ステップを含む。また、この帳票OCRプログラムは、各項目名毎に再度OCR処理が必要か否かを予め定義した再OCR指定情報を参照して、再度OCR処理が必要な項目名に対応するレコードを読み出すとともに、各項目名毎に対応する記入欄との相対的な位置関係を予め定義した記入欄の位置情報を参照して、読み出したレコードに含まれる項目名枠の位置から再度OCR処理をすべき記入欄を特定する記入欄特定処理ステップを含む。また、この帳票OCRプログラムは、予め定義された各項目の文字属性情報に基づいて、対象となる記入欄の属性に適合した辞書データを使用し、記入欄特定処理ステップで特定された記入欄に対して部分的にOCR処理を実行する部分OCR処理ステップを含む。
また、特許文献2には、OCR読み取り用の文字情報等を記入するために使用されるOCR用帳票フォーム作成処理装置が記載されている。このOCR用帳票フォーム作成処理装置は、対象とするOCR装置に応じて、帳票フォームの制約条件を示すデータを提供する第1の手段と、所望の帳票詳細フォームを定義する情報の入力を受け付ける第2の手段と、受け付けた詳細フォーム定義情報が前記制約条件を満足するか否かを判定するエラーチェックを行なう第3の手段と、を備える。
特許第4347677号公報 特開平7−160802号公報
ところで、帳票には、記入者が記入するための枠が項目に対応して設けられている。このとき、枠の大きさが小さ過ぎると、記入者が文字を書き難くなるため、OCR処理で誤認識が発生し易くなり、認識精度が低下する場合がある。しかしながら、帳票を定義する際に、枠の大きさに起因して、認識精度が低下する可能性のある枠を予め把握することは難しい。
本発明は、帳票を定義する際に、枠の大きさに起因して、認識精度が低下する可能性のある枠を、ユーザが予め把握することができる情報処理装置及びプログラムを提供することを目的とする。
上記目的を達成するために、第1態様に係る情報処理装置は、メモリと、前記メモリに接続されたプロセッサとを備え、前記プロセッサが、帳票画像の項目に対応して設けられた枠毎の認識結果に関する統計データであって、枠の属性毎に、枠のサイズ、及び、枠内の画像が正しく認識された割合を示す正答率が対応付けられた前記統計データから、枠の属性毎の正答率を取得し、前記取得された枠の属性毎の正答率が閾値以下となる枠が存在する場合に、前記帳票画像の定義を行う画面である帳票定義画面において前記枠の表示形態を変化させる制御を行う。
また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記統計データから導出される、枠のサイズと正答率との関係を前記帳票定義画面に表示する制御を更に行う。
また、第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記表示制御部が、前記帳票定義画面から、前記表示形態を変化させた枠のサイズの変更を受け付けた場合に、前記関係において前記変更の前後の状態を表示する制御を更に行う。
また、第4態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる、前記表示形態を変化させた枠の周辺に位置する枠である周辺枠の正答率が低下する場合に、前記周辺枠の表示形態を変化させる制御を更に行う。
また、第5態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる、前記表示形態を変化させた枠以外の複数の枠の中で正答率の低下が最も小さい枠の表示形態を変化させる制御を更に行う。
また、第6態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記統計データが、枠の属性毎に、認識用辞書が更に対応付けられており、前記プロセッサが、認識用辞書毎に、前記関係を前記帳票定義画面に表示する制御を更に行う。
また、第7態様に係る情報処理装置は、第6態様に係る情報処理装置において、前記プロセッサが、前記帳票定義画面から、前記表示形態を変化させた枠の認識用辞書の変更を受け付けた場合に、前記変更に応じて、前記関係を変化させる制御を更に行う。
また、第8態様に係る情報処理装置は、第1態様〜第7態様のいずれか1の態様に係る情報処理装置において、前記プロセッサが、前記帳票定義画面において、前記帳票画像の各枠の表示形態が前記各枠の正答率に応じて異なるように変化させる制御を更に行う。
更に、上記目的を達成するために、第9態様に係るプログラムは、帳票画像の項目に対応して設けられた枠毎の認識結果に関する統計データであって、枠の属性毎に、枠のサイズ、及び、枠内の画像が正しく認識された割合を示す正答率が対応付けられた前記統計データから、枠の属性毎の正答率を取得し、前記取得された枠の属性毎の正答率が閾値以下となる枠が存在する場合に、前記帳票画像の定義を行う画面である帳票定義画面において前記枠の表示形態を変化させる制御を行うことを、コンピュータに実行させる。
第1態様及び第9態様によれば、帳票を定義する際に、枠の大きさに起因して、認識精度が低下する可能性のある枠を、ユーザが予め把握することができる、という効果を有する。
第2態様によれば、枠のサイズと正答率との関係をユーザが予め把握することができる、という効果を有する。
第3態様によれば、枠のサイズを変更した場合に、枠のサイズと正答率との関係における変更前後の状態をユーザが予め把握することができる、という効果を有する。
第4態様によれば、枠のサイズを大きくすることに起因して、枠のサイズが小さくなる周辺枠をユーザが予め把握することができる、という効果を有する。
第5態様によれば、枠のサイズを大きくすることに起因して、枠のサイズが小さくなる複数の枠の中で正答率の低下が最も小さい枠をユーザが予め把握することができる、という効果を有する。
第6態様によれば、認識用辞書毎に、枠のサイズと正答率との関係をユーザが予め把握することができる、という効果を有する。
第7態様によれば、枠の認識用辞書を変更した場合に、変更によって変化する、枠のサイズと正答率との関係をユーザが予め把握することができる、という効果を有する。
第8態様によれば、帳票画像の各枠の正答率の状態をユーザが予め把握することができる、という効果を有する。
第1の実施形態に係る情報処理システムの構成の一例を示す図である。 第1の実施形態に係るサーバ装置の電気的な構成の一例を示すブロック図である。 第1の実施形態に係るサーバ装置の機能的な構成の一例を示すブロック図である。 実施形態に係る帳票定義画面の一例を示す正面図である。 実施形態に係る統計データの一例を示す図である。 第1の実施形態に係る確認処理プログラムによる確認処理の流れの一例を示すフローチャートである。 第1の実施形態に係る確認処理プログラムによる帳票設定処理の流れの一例を示すフローチャートである。 実施形態に係る帳票定義画面の別の例を示す正面図である。 実施形態に係る帳票定義画面の更に別の例を示す正面図である。 実施形態に係る帳票定義画面の更に別の例を示す正面図である。 実施形態に係る帳票定義画面の更に別の例を示す正面図である。 第2の実施形態に係るサーバ装置の機能的な構成の一例を示すブロック図である。 第2の実施形態に係る確認処理プログラムによる帳票設定処理の流れの一例を示すフローチャートである。 実施形態に係る帳票定義画面の更に別の例を示す正面図である。
以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。
[第1の実施形態]
図1は、第1の実施形態に係る情報処理システム90の構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム90は、サーバ装置10Aと、確認者用端末装置40A、40B、・・・と、画像読取装置50と、管理者用端末装置60と、を備えている。なお、サーバ装置10Aは、情報処理装置の一例である。
サーバ装置10Aは、ネットワークNを介して、確認者用端末装置40A、40B、・・・、画像読取装置50、及び管理者用端末装置60の各々と通信可能に接続されている。このサーバ装置10Aには、一例として、サーバコンピュータ、パーソナルコンピュータ(PC:Personal Computer)等の汎用的なコンピュータが適用される。また、このネットワークNには、一例として、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等が適用される。
画像読取装置50は、紙媒体の帳票等を光学的に読み取って画像を取得し、取得した画像(以下、「帳票画像」という。)をサーバ装置10Aに送信する機能を備えている。なお、ここでいう帳票としては、例えば、住所欄や氏名欄等の複数の項目を含む各種の帳票が用いられる。この帳票には、これら複数の項目の各々について手書き文字、印刷文字等が記入されている。サーバ装置10Aは、具体的には後述するように、画像読取装置50から受信した帳票画像に対して、光学的文字認識処理の一例であるOCR(Optical Character Recognition)処理を行い、複数の項目の各々に対応する画像についての認識結果を取得する。なお、この認識結果には、一例として、1文字以上の文字の連なりを示す文字列等が含まれる。また、帳票では、項目に対応する記載が記入されうる領域が枠等で定められており、記載が記入されうる領域が認識対象の領域として定義されている。定義された領域(以下、「定義領域」という。)を対象にOCR処理を行い、複数の項目の各々に対応する画像についての文字列を取得する。
確認者用端末装置40Aは、確認作業を行う確認者(ユーザ)U1が操作する端末装置であり、確認者用端末装置40Bは、確認作業を行う確認者U2が操作する端末装置である。これら複数の確認者用端末装置40A、40B、・・・を区別して説明する必要がない場合には、確認者用端末装置40A、40B、・・・を総称して確認者用端末装置40ともいう。また、これら複数の確認者U1、U2、・・・を区別して説明する必要がない場合には、確認者U1、U2、・・・を総称して確認者Uともいう。この確認者用端末装置40には、一例として、パーソナルコンピュータ(PC)等の汎用的なコンピュータや、スマートフォン、タブレット端末等の携帯可能な端末装置等が適用される。なお、確認者用端末装置40には、確認者Uが確認作業を行うための確認作業アプリケーション・プログラム(以下、「確認作業アプリ」ともいう。)がインストールされており、確認作業用のUI(User Interface)画面を生成して表示する。なお、ここでいう確認作業とは、帳票画像内に含まれる文字等の認識結果を確認したり訂正したりする作業を意味する。
管理者用端末装置60は、システム管理者SEが操作する端末装置であり、システム管理者SEにより後述する帳票定義画面を介して帳票定義データが設定される。この管理者用端末装置60には、一例として、パーソナルコンピュータ(PC)等の汎用的なコンピュータや、スマートフォン、タブレット端末等の携帯可能な端末装置等が適用される。
サーバ装置10Aは、帳票画像に含まれる各項目の画像(以下、「項目画像」という。)を認識して得られた認識結果の確信度が閾値未満である場合、人手による確認作業を行い、確信度が閾値以上である場合、人手による確認作業を行わず、最終的な認識結果として出力する。
上記確認作業を行う場合、サーバ装置10Aは、項目画像とOCR処理により得られた文字列とを対応付けて、確認者用端末装置40のUI画面に表示させる制御を行う。確認者Uは、当該項目画像を見ながら、当該項目画像に対応する文字列が正しいか否かを確認する。確認者Uは、確認の結果、正しい場合はそのまま、正しくない場合は正しい文字列をUI画面に入力する。確認者用端末装置40は、UI画面を介して入力を受け付けた文字列を確認結果としてサーバ装置10Aに送信する。サーバ装置10Aは、確認者用端末装置40からの確認結果に基づいて、最終的な認識結果を出力し、確認者用端末装置40のUI画面に表示させる制御を行う。
図2は、第1の実施形態に係るサーバ装置10Aの電気的な構成の一例を示すブロック図である。
図2に示すように、本実施形態に係るサーバ装置10Aは、制御部12と、記憶部14と、表示部16と、操作部18と、通信部20と、を備えている。
制御部12は、CPU(Central Processing Unit)12A、ROM(Read Only Memory)12B、RAM(Random Access Memory)12C、及び入出力インターフェース(I/O)12Dを備えており、これら各部がバスを介して各々接続されている。
I/O12Dには、記憶部14と、表示部16と、操作部18と、通信部20と、を含む各機能部が接続されている。これらの各機能部は、I/O12Dを介して、CPU12Aと相互に通信可能とされる。
制御部12は、サーバ装置10Aの一部の動作を制御するサブ制御部として構成されてもよいし、サーバ装置10Aの全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部12の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はIC(Integrated Circuit)チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部12の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。
記憶部14としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部14には、本実施形態に係る帳票確認処理及び帳票設定処理を行うための確認処理プログラム14Aが記憶される。なお、この確認処理プログラム14Aは、ROM12Bに記憶されていてもよい。
確認処理プログラム14Aは、例えば、サーバ装置10Aに予めインストールされていてもよい。確認処理プログラム14Aは、不揮発性の記憶媒体に記憶して、又はネットワークNを介して配布して、サーバ装置10Aに適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
表示部16には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部16は、タッチパネルを一体的に有していてもよい。操作部18には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部16及び操作部18は、サーバ装置10Aのユーザから各種の指示を受け付ける。表示部16は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
通信部20は、インターネット、LAN、WAN等のネットワークNに接続されており、画像読取装置50、確認者用端末装置40、及び管理者用端末装置60の各々との間でネットワークNを介して通信が可能とされる。
ところで、上述したように、帳票を定義する際に、枠の大きさに起因して、認識精度が低下する可能性のある枠を予め把握することは困難であった。
このため、本実施形態に係るサーバ装置10AのCPU12Aは、記憶部14に記憶されている確認処理プログラム14AをRAM12Cに書き込んで実行することにより、図3に示す各部として機能する。なお、CPU12Aは、プロセッサの一例である。
図3は、第1の実施形態に係るサーバ装置10Aの機能的な構成の一例を示すブロック図である。
図3に示すように、本実施形態に係るサーバ装置10AのCPU12Aは、取得部30及び表示制御部32として機能する。また、サーバ装置10AのCPU12Aは、認識設定部210、認識処理部220、確認処理実施判定部230、確認処理部240、最終確認処理部250、及び認識結果出力部260として機能する。
本実施形態に係る記憶部14には、一例として、後述の図5に示す統計データを記憶する統計データ記憶部14Bと、帳票定義データを記憶する帳票定義データ記憶部14Cと、が設けられている。
認識設定部210は、未記入帳票の帳票画像を入力として、認識設定を行う。認識設定部210は、一例として、図4に示す帳票定義画面62を、管理者用端末装置60に表示させて、帳票定義データの入力を受け付ける。
図4は、本実施形態に係る帳票定義画面62の一例を示す正面図である。
図4に示す帳票定義画面62は、管理者用端末装置60に表示され、システム管理者SEにより帳票定義データの入力を受け付けるための画面である。
図4に示す帳票定義画面62は、未記入帳票のプレビュー画像と、帳票定義データを表す認識枠の情報(以下、「プロパティ情報」ともいう。)と、を含んでいる。この認識枠の情報には、一例として、枠の種類、枠の名前、枠の座標、枠のサイズ(枠の高さ及び幅)、辞書、文字種、確信度の閾値、確認訂正、及びエントリー方式を含み、各々の設定内容は帳票定義データ記憶部14Cに記憶される。なお、辞書は認識用辞書を表す。図4に示す例では、「受給者氏名」に関する情報が表示されている。なお、確信度とは、認識結果の確からしさを示す指標であり、確信度の値が高いほど、項目画像とその認識結果とが一致する確率が高いことを示している。この確信度の導出方法としては、例えば、特開2016−212812号公報等に記載の公知の技術を用いればよい。なお、文字列を構成する各文字に対する確信度を用いる場合には、文字毎の確信度を文字列の確信度に変換する手法が用いられる。具体的には、下記に示す様々な手法の中から適切なものを選択すればよい。
・文字列内の各文字についての確信度の最大値を文字列の確信度とする。
・文字列内の各文字についての確信度の最小値を文字列の確信度とする。
・文字列内の各文字についての確信度の平均値(最頻値、中央値等)を文字列の確信度とする。
また、確認訂正とは、確認作業を行うか否かを設定するもので、一例として、「必須」又は「不要」が設定される。「必須」が設定された場合、毎回確認作業が実施され、「不要」が設定された場合、確認作業は実施されない。
また、エントリー方式とは、確認作業を行う方式を設定するもので、一例として、「ダブルエントリ」、「シングルエントリ」、「不要」、及び「なし」のいずれかが設定される。「ダブルエントリ」は、複数人の確認者で確認作業を行う方式であり、「シングルエントリ」は、1人の確認者で確認作業を行う方式である。なお、「不要」は、確認作業を不要とする方式である。「なし」は、確信度とその閾値(図4の例では「0.7」。)とを比較した結果に基づいて、「不要」、「シングルエントリ」、及び「ダブルエントリ」のいずれかが選択される方式である。この「なし」では、一例として、確信度が閾値未満である場合に、「シングルエントリ」又は「ダブルエントリ」が選択され、確信度が閾値以上である場合に、「不要」が選択される。
また、辞書とは、項目毎に認識用辞書を設定するもので、図4の例では、「氏名」に関する認識用辞書が設定される。
認識処理部220は、記入済み帳票の帳票画像を入力として、項目毎に、帳票定義データ記憶部14Cに記憶されている帳票定義データの設定内容に従って、OCR処理を実行する。認識処理部220は、項目毎に、項目画像、認識結果、及びその確信度を対応付けて出力する。
確認処理実施判定部230は、認識処理部220から出力された、項目毎の項目画像、認識結果、及びその確信度に基づいて、項目毎にエントリー方式を判定する。例えば、エントリー方式として、「シングルエントリ」又は「ダブルエントリ」が設定されている項目は、確信度による閾値判定を行わない。また、エントリー方式として、「なし」が設定されている項目は、確信度による閾値判定を行い、上述のように、エントリー方式を判定する。確認処理実施判定部230は、判定結果を確認処理部240に出力する。
確認処理部240は、確認処理実施判定部230から受け付けた判定結果に基づいて、項目毎にエントリー方式を切り替え、確認者Uに項目画像及び認識結果をフィードバックし、確認者Uに確認作業を行わせる。具体的に、確認処理部240は、認識結果のエントリー方式がシングルエントリと判定された場合、確認作業を行うための確認画面を、1台の確認者用端末装置40に表示させ、確認作業を行わせる。また、認識結果のエントリー方式がダブルエントリと判定された場合、確認作業を行うための確認画面を、複数台の確認者用端末装置40に表示させ、確認作業を行わせる。確認処理部240は、項目画像、認識結果、及び確認者Uによる確認結果を最終確認処理部250に出力する。
最終確認処理部250は、確認処理部240から受け付けた項目画像、認識結果、及び確認者Uによる確認結果に基づいて、確認者Uとは別の確認者Uに最終的な確認作業を行わせる。具体的に、最終確認処理部250は、最終的な確認作業を行うための確認画面を、別の確認者Uが使用する確認者用端末装置40に表示させ、別の確認者Uから最終確認結果を得る。最終確認処理部250は、別の確認者Uからの最終確認結果に基づいて、確認者Uの確認結果に誤りがある場合には、確認処理部240に差し戻し、入力された記入済み帳票に不備(一例として、ページ不足等)がある場合には、認識処理部220に差し戻す。そして、最終確認処理部250は、最終的な認識結果を認識結果出力部260に出力する。
認識結果出力部260は、最終確認処理部250から受け付けた最終的な認識結果を出力する。最終的な認識結果の出力先は、特に限定されるものではないが、表示部16、確認者用端末装置40、及び管理者用端末装置60の少なくとも1つを出力先としてもよい。
確認処理部240による確認結果、及び最終確認処理部250による最終的な確認結果は、記憶部14に蓄積される。これらの確認結果には、一例として、枠の属性毎に、辞書名、枠のサイズ、枠の種類、及び認識結果の正誤情報等が含まれる。ここでいう正誤情報とは、認識結果が訂正されていない場合、その認識結果は正しいと判断され、正しいことを示す情報として表される。一方、認識結果が訂正されている場合、その認識結果は誤りと判断され、誤っていることを示す情報として表される。記憶部14にある程度の確認結果(例えば、10000件以上)が蓄積されると、一例として、図5に示す統計データが生成され、統計データ記憶部14Bに記憶される。
図5は、本実施形態に係る統計データの一例を示す図である。
図5に示す統計データは、帳票画像の項目に対応して設けられた枠毎の認識結果に関するデータである。この統計データは、枠の属性毎に、辞書名、枠のサイズ、枠の種類、正答率、正答件数、及び認識件数が対応付けられたデータである。但し、本実施形態では、辞書名は必須ではなく、辞書名を含まない形態としてもよい。枠の属性とは、一例として、「受給者、氏名」のように枠の名前として表される。認識件数は、枠内の画像をOCR処理により認識して得られた認識結果の件数である。正答件数は、確認作業において訂正されなかった認識結果の件数である。正答率は、枠内の画像が正しく認識された割合を示し、正答件数を認識件数で除することで算出される。なお、本実施形態においては、特定のグループが記入する帳票が対象とされる。特定のグループとしては、例えば、年齢別のグループ、職業別のグループ、男女別のグループ等が挙げられる。
取得部30は、上述の図4に示す帳票定義画面62を介して帳票画像の定義を行う場合、一例として、図5に示す統計データから、枠の属性毎の正答率を取得する。
表示制御部32は、取得部30により取得された枠の属性毎の正答率が閾値以下となる枠が存在する場合に、帳票定義画面62において枠の表示形態を変化させる制御を行う。この場合、表示制御部32は、一例として、後述の図8に示すように、帳票定義画面62において、帳票画像の各枠の表示形態が各枠の正答率に応じて異なるように変化させる制御を行うようにしてもよい。つまり、正答率が低い枠の表示形態を他の枠の表示形態と異なるように制御することで、帳票画像の定義を行うユーザ(本実施形態ではシステム管理者SE)が一見して、正答率の低い枠を把握可能なようにしている。なお、枠の表示形態を変化させる形態としては、一例として、色、ハッチング、網掛け、マーク付与等のように各種の形態が挙げられる。
また、表示制御部32は、統計データから導出される、枠のサイズと正答率との関係を帳票定義画面62に表示する制御を行うようにしてもよい。枠のサイズと正答率との関係は、一例として、後述の図9に示すグラフG1として表される。
また、表示制御部32は、帳票定義画面62から、表示形態を変化させた枠のサイズの変更を受け付けた場合に、一例として、後述の図10に示すように、上記関係において変更の前後の状態を表示する制御を行うようにしてもよい。
また、表示制御部32は、表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる周辺枠の正答率が低下する場合に、周辺枠の表示形態を変化させる制御を行うようにしてもよい。この周辺枠とは、表示形態を変化させた枠の周辺に位置する枠であり、隣接していてもよいし、離れていてもよい。
また、表示制御部32は、表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる、表示形態を変化させた枠以外の複数の枠の中で正答率の低下が最も小さい枠の表示形態を変化させる制御を行うようにしてもよい。この正答率の低下が最も小さい枠とは、正答率があまり変化しない、つまり、正答率の低下率が最も小さい枠でもよいし、あるいは、正答率の低下率が最も小さく、かつ、正答率が最も高い枠でもよい。
次に、図6及び図7を参照して、第1の実施形態に係るサーバ装置10Aの作用を説明する。
図6は、第1の実施形態に係る確認処理プログラム14Aによる確認処理の流れの一例を示すフローチャートである。
まず、サーバ装置10Aに対して、確認処理の実行が指示されると、確認処理プログラム14Aが起動され、以下の各ステップを実行する。
図6のステップ100では、CPU12Aが、認識処理部220として、帳票画像の入力を受け付ける。
ステップ102では、CPU12Aが、認識処理部220として、ステップ100で入力を受け付けた帳票画像の項目毎に、項目画像に対して文字認識を行い、認識結果を取得する。
ステップ104では、CPU12Aが、確認処理部240及び最終確認処理部250として、確認者Uとの間で確認処理を実施する。具体的に、上述したように、確認者Uは、確認者用端末装置40のUI画面に表示された項目画像を見ながら、当該項目画像に対応する認識結果の文字列が正しいか否かを確認する。確認者Uは、確認の結果、正しい場合はそのまま、正しくない場合は正しい文字列をUI画面に入力する。サーバ装置10Aは、UI画面を介して入力を受け付けた文字列を確認結果として確認者用端末装置40から受信する。
ステップ106では、CPU12Aが、ステップ104での確認処理の結果を受け取り、帳票画像の項目毎、つまり、枠の属性毎に、一例として、上述の図5に示す統計データを生成し、生成した統計データを、統計データ記憶部14Bに蓄積し、本確認処理プログラム14Aによる確認処理を終了する。
図7は、第1の実施形態に係る確認処理プログラム14Aによる帳票設定処理の流れの一例を示すフローチャートである。
まず、サーバ装置10Aに対して、帳票設定処理の実行が指示されると、確認処理プログラム14Aが起動され、以下の各ステップを実行する。
図7のステップ110では、CPU12Aが、認識設定部210として、一例として、上述の図4に示す帳票定義画面62を、管理者用端末装置60に表示する。
ステップ112では、CPU12Aが、取得部30として、一例として、上述の図5に示す統計データから、枠の属性毎の正答率を取得する。
ステップ114では、CPU12Aが、表示制御部32として、ステップ112で取得した正答率が閾値以下となる枠が存在するか否かを判定する。正答率が閾値以下となる枠が存在すると判定した場合(肯定判定の場合)、ステップ116に移行し、正答率が閾値以下となる枠が存在しないと判定した場合(否定判定の場合)、ステップ118に移行する。
ステップ116では、CPU12Aが、表示制御部32として、帳票定義画面62において、ステップ114で正答率が閾値以下と判定された枠の表示形態を変化させる制御を行う。CPU12Aは、一例として、図8に示すように、帳票定義画面62において、帳票画像の各枠の表示形態が各枠の正答率に応じて異なるように変化させる制御を行う。
図8は、本実施形態に係る帳票定義画面62の別の例を示す正面図である。
図8に示す帳票定義画面62では、各枠の正答率に応じて色が異なるように変化している。なお、図8の例では、色の違いをハッチングの違いで表している。第1認識枠62Aは、例えば、緑色で示される枠であり、正答率が90%以上の枠を示している。第1認識枠62Aには、一例として、「受給者、氏名」、「受給者、生年月日」、「配偶者の職業、公務員勤務先」が含まれる。第2認識枠62Bは、例えば、水色で示される枠であり、正答率が80%以上90%未満の枠を示している。第2認識枠62Bには、一例として、「認定番号」、「提出日」、「配偶者の有無・氏名、氏名」、「18歳以下の扶養している児童、氏名1〜5」、「18歳以下の扶養している児童、続柄1〜5」、「18歳以下の扶養している児童、生年月日1〜5」、「18歳以下の扶養している児童、住所1、2、4、5」が含まれる。第3認識枠62Cは、例えば、黄色で示される枠であり、正答率が70%以上80%未満の枠を示している。第3認識枠62Cには、一例として、「受給者、フリガナ」、「受給者、住所」が含まれる。第4認識枠62Dは、例えば、赤色で示される枠であり、正答率が50%以下の枠を示している。第4認識枠62Dには、一例として、「受給者、電話番号」、「受給者、変更の場合」、「18歳以下の扶養している児童、住所3」が含まれる。
なお、上述の閾値を、一例として、50%とした場合、正答率が50%以下の第4認識枠62Dのみを赤色に変化させてもよいことは言うまでもない。図8に示す帳票定義画面62を一見するだけで、枠の大きさが起因して、認識精度が低下する可能性のある枠が、システム管理者SEによって予め把握される。
ステップ118では、CPU12Aが、表示制御部32として、帳票定義画面62において、システム管理者SEの操作により枠が選択されたか否かを判定する。枠が選択されたと判定した場合(肯定判定の場合)、ステップ120に移行し、枠が選択されていないと判定した場合(否定判定の場合)、ステップ126に移行する。
ステップ120では、CPU12Aが、表示制御部32として、一例として、図9に示すように、ステップ118で選択された枠について、枠のサイズと正答率との関係を含むプロパティ情報を帳票定義画面62に表示する制御を行う。
図9は、本実施形態に係る帳票定義画面62の更に別の例を示す正面図である。
図9に示す帳票定義画面62では、プロパティ情報が表示されている。このプロパティ情報には、一例として、枠の種類、枠の名前、枠の座標、枠のサイズ、辞書、枠のサイズと正答率との関係、及び文字種等が含まれる。枠のサイズと正答率との関係は、一例として、グラフG1として表される。このグラフG1は、上述の統計データから導出されるグラフである。グラフG1は、横軸が枠の高さを示し、縦軸が正答率を示す。図9の例では、属性が「受給者、フリガナ」である枠が選択されており、選択された枠の高さが20ptで、正答率が70%である。この場合、枠の高さ20pt、正答率70%がグラフG1にプロットされて表示される。
ステップ122では、CPU12Aが、表示制御部32として、一例として、上述の図9に示す帳票定義画面62から、ステップ120でプロパティ情報を表示した枠のサイズの変更を受け付けたか否かを判定する。枠のサイズの変更を受け付けたと判定した場合(肯定判定の場合)、ステップ124に移行し、枠のサイズの変更を受け付けていないと判定した場合(否定判定の場合)、ステップ126に移行する。
ステップ124では、CPU12Aが、表示制御部32として、一例として、図10に示すように、グラフG1において変更前後の状態を表示する制御を行う。なお、ここでは、枠の高さを一例として30ptに変更した場合について示す。
図10は、本実施形態に係る帳票定義画面62の更に別の例を示す正面図である。
図10に示す帳票定義画面62では、枠の高さが20ptから30ptに変更されており、枠の高さを30ptとした場合、正答率が80%に変化する。図10の例では、グラフG1自体は変化しないが、枠の高さの変更によって正答率が変化するため、変更前後の状態が一見して分かるようにグラフG1に表示される。具体的に、グラフG1において、変更前の状態が、枠の高さ20pt、正答率70%と表示され、変更後の状態が、枠の高さ30pt、正答率80%と表示される。
図11は、本実施形態に係る帳票定義画面62の更に別の例を示す正面図である。
図11に示す帳票定義画面62では、図8の例と同様に、色の違いをハッチングの違いで表している。第5認識枠62Eは、例えば、水色で示される枠であり、正答率が80%以上90%未満の枠を示している。第6認識枠62Fは、例えば、緑色で示される枠であり、正答率が90%以上の枠を示している。第7認識枠62Gは、例えば、赤色で示される枠であり、正答率が50%以下の枠を示している。
この場合、CPU12Aは、上述したように、表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる、表示形態を変化させた枠の周辺に位置する枠である周辺枠の正答率が低下する場合に、周辺枠の表示形態を変化させる制御を行うようにしてもよい。具体的に、図11の例において、第7認識枠62Gの一例である「受給者、電話番号」の枠の高さを高くした場合、この「受給者、電話番号」の枠に隣接する、第6認識枠62Fの一例である「受給者、住所」の枠の高さが低くなる。そして、枠の高さが低くなることで、正答率が低下する場合には、「受給者、住所」の枠の色を変化させるようにする。例えば、「受給者、住所」の枠の色である緑色を同系色の黄緑色に変化させる。あるいは、「受給者、住所」の枠の色である緑色を赤色に変化させるようにしてもよい。なお、枠の高さが低くなる枠は、隣接枠に限定されるものではなく、離れた枠であってもよい。つまり、ある枠の高さを高くすることに起因して、高さが低くなり得る周辺枠の全てが対象とされる。
また、CPU12Aは、上述したように、表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる、表示形態を変化させた枠以外の複数の枠の中で正答率の低下が最も小さい枠の表示形態を変化させる制御を行うようにしてもよい。具体的に、図11の例において、第7認識枠62Gの一例である「電話番号」の枠の高さを高くした結果、正答率の低下が最も小さい枠が第6認識枠62Fであった場合、第6認識枠62Fの色(ここでは緑色)を点滅させる。この点滅により、システム管理者SEに対して、どの枠の高さを低くすればよいかを知らせることが可能とされる。
ステップ126では、CPU12Aが、認識設定部210として、帳票定義が完了したか否かを判定する。帳票定義が完了したと判定した場合(肯定判定の場合)、ステップ128に移行し、帳票定義が完了していないと判定した場合(否定判定の場合)、ステップ118に戻り処理を繰り返す。
ステップ128では、CPU12Aが、認識設定部210として、帳票定義画面62を介して入力を受け付けた帳票定義データを、帳票定義データ記憶部14Cに記憶し、本確認処理プログラム14Aによる帳票設定処理を終了する。
このように本実施形態によれば、帳票画像を定義する際に、帳票定義画面を一見するだけで、枠の大きさが起因して、認識精度が低下する可能性のある枠が、ユーザによって予め把握される。また、認識精度が低下する可能性のある枠のサイズを変更することにより、認識精度の向上が図られる。
[第2の実施形態]
上記第1の実施形態では、枠のサイズを変更することで認識精度の向上を図る形態について説明した。本実施形態では、認識用辞書を変更することで認識精度の向上を図る形態について説明する。
図12は、第2の実施形態に係るサーバ装置10Bの機能的な構成の一例を示すブロック図である。
図12に示すように、本実施形態に係るサーバ装置10BのCPU12Aは、取得部30及び表示制御部34として機能する。また、サーバ装置10BのCPU12Aは、認識設定部210、認識処理部220、確認処理実施判定部230、確認処理部240、最終確認処理部250、及び認識結果出力部260として機能する。なお、上記第1の実施形態で説明したサーバ装置10Aと同様の機能を有する構成要素には同一の符号を付し、その繰り返しの説明は省略する。
本実施形態に係る記憶部14には、上述の図5に示す統計データを記憶する統計データ記憶部14Bと、帳票定義データを記憶する帳票定義データ記憶部14Cと、が設けられている。本実施形態に係る統計データでは、枠の属性毎に、認識用辞書の辞書名が対応付けられている。この辞書名は必須とされる。
表示制御部34は、一例として、後述の図14に示すように、認識用辞書毎に、枠のサイズと正答率との関係を帳票定義画面62に表示する制御を行う。
また、表示制御部34は、帳票定義画面62から、表示形態を変化させた枠の認識用辞書の変更を受け付けた場合に、この変更に応じて、上記関係を変化させる制御を行うようにしてもよい。
次に、図13を参照して、第2の実施形態に係るサーバ装置10Bの作用を説明する。
図13は、第2の実施形態に係る確認処理プログラム14Aによる帳票設定処理の流れの一例を示すフローチャートである。
まず、サーバ装置10Bに対して、帳票設定処理の実行が指示されると、確認処理プログラム14Aが起動され、以下の各ステップを実行する。
図13のステップ130では、CPU12Aが、認識設定部210として、一例として、上述の図4に示す帳票定義画面62を、管理者用端末装置60に表示する。
ステップ132では、CPU12Aが、取得部30として、一例として、上述の図5に示す統計データから、枠の属性毎の正答率を取得する。
ステップ134では、CPU12Aが、表示制御部34として、ステップ132で取得した正答率が閾値以下となる枠が存在するか否かを判定する。正答率が閾値以下となる枠が存在すると判定した場合(肯定判定の場合)、ステップ136に移行し、正答率が閾値以下となる枠が存在しないと判定した場合(否定判定の場合)、ステップ138に移行する。
ステップ136では、CPU12Aが、表示制御部34として、帳票定義画面62において、ステップ134で正答率が閾値以下と判定された枠の表示形態を変化させる制御を行う。CPU12Aは、一例として、上述の図8に示すように、帳票定義画面62において、帳票画像の各枠の表示形態が各枠の正答率に応じて異なるように変化させる制御を行う。
ステップ138では、CPU12Aが、表示制御部34として、帳票定義画面62において、システム管理者SEの操作により枠が選択されたか否かを判定する。枠が選択されたと判定した場合(肯定判定の場合)、ステップ140に移行し、枠が選択されていないと判定した場合(否定判定の場合)、ステップ146に移行する。
ステップ140では、CPU12Aが、表示制御部34として、一例として、上述の図9に示すように、ステップ138で選択された枠について、枠のサイズと正答率との関係を含むプロパティ情報を帳票定義画面62に表示する制御を行う。
ステップ142では、CPU12Aが、表示制御部34として、上述の図9に示す帳票定義画面62から、ステップ140でプロパティ情報を表示した枠の認識用辞書の変更を受け付けたか否かを判定する。枠の認識用辞書の変更を受け付けたと判定した場合(肯定判定の場合)、ステップ144に移行し、枠の認識用辞書の変更を受け付けていないと判定した場合(否定判定の場合)、ステップ146に移行する。
ステップ144では、CPU12Aが、表示制御部34として、一例として、図14に示すように、枠の認識用辞書の変更に応じて、枠のサイズと正答率との関係を変化させる制御を行う。なお、ここでは、枠の認識用辞書を一例として自由記入に変更した場合について示す。但し、枠のサイズの変更はないものとする。
図14は、本実施形態に係る帳票定義画面62の更に別の例を示す正面図である。
図14に示す帳票定義画面62では、枠の認識用辞書がカタカナから自由記入に変更されており、枠の認識用辞書を自由記入とした場合、正答率が85%に変化する、つまり、グラフ自体が変化する。図14の例では、変更前後の状態が一見して分かるように、変更前のグラフG2(点線)及び変更後のグラフG3(実線)が共に表示される。
ステップ146では、CPU12Aが、認識設定部210として、帳票定義が完了したか否かを判定する。帳票定義が完了したと判定した場合(肯定判定の場合)、ステップ148に移行し、帳票定義が完了していないと判定した場合(否定判定の場合)、ステップ138に戻り処理を繰り返す。
ステップ148では、CPU12Aが、認識設定部210として、帳票定義画面62を介して入力を受け付けた帳票定義データを、帳票定義データ記憶部14Cに記憶し、本確認処理プログラム14Aによる帳票設定処理を終了する。
このように本実施形態によれば、帳票画像を定義する際に、帳票定義画面を一見するだけで、枠の大きさが起因して、認識精度が低下する可能性のある枠が、ユーザによって予め把握される。また、認識精度が低下する可能性のある枠の認識用辞書を変更することにより、認識精度の向上が図られる。
以上、実施形態に係る情報処理装置の一例としてサーバ装置を例示して説明した。実施形態は、サーバ装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、これらのプログラムを記憶したコンピュータが読み取り可能な非一時的(non-transitory)記憶媒体の形態としてもよい。
その他、上記実施形態で説明したサーバ装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。
10A、10Bサーバ装置
12 制御部
12A CPU
12B ROM
12C RAM
12D I/O
14 記憶部
14A 確認処理プログラム
14B 統計データ記憶部
14C 帳票定義データ記憶部
16 表示部
18 操作部
20 通信部
30 取得部
32、34 表示制御部
40、40A、40B 確認者用端末装置
50 画像読取装置
60 管理者用端末装置
90 情報処理システム
210 認識設定部
220 認識処理部
230 確認処理実施判定部
240 確認処理部
250 最終確認処理部
260 認識結果出力部

Claims (9)

  1. メモリと、
    前記メモリと接続されたプロセッサと、
    を備え、
    前記プロセッサは、
    帳票画像の項目に対応して設けられた枠毎の認識結果に関する統計データであって、枠の属性毎に、枠のサイズ、及び、枠内の画像が正しく認識された割合を示す正答率が対応付けられた前記統計データから、枠の属性毎の正答率を取得し、
    前記取得された枠の属性毎の正答率が閾値以下となる枠が存在する場合に、前記帳票画像の定義を行う画面である帳票定義画面において前記枠の表示形態を変化させる制御を行う
    情報処理装置。
  2. 前記プロセッサは、前記統計データから導出される、枠のサイズと正答率との関係を前記帳票定義画面に表示する制御を更に行う
    請求項1に記載の情報処理装置。
  3. 前記プロセッサは、前記帳票定義画面から、前記表示形態を変化させた枠のサイズの変更を受け付けた場合に、前記関係において前記変更の前後の状態を表示する制御を更に行う
    請求項2に記載の情報処理装置。
  4. 前記プロセッサは、前記表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる、前記表示形態を変化させた枠の周辺に位置する枠である周辺枠の正答率が低下する場合に、前記周辺枠の表示形態を変化させる制御を更に行う
    請求項1に記載の情報処理装置。
  5. 前記プロセッサは、前記表示形態を変化させた枠のサイズを大きくすることで、枠のサイズが小さくなる、前記表示形態を変化させた枠以外の複数の枠の中で正答率の低下が最も小さい枠の表示形態を変化させる制御を更に行う
    請求項1に記載の情報処理装置。
  6. 前記統計データは、枠の属性毎に、認識用辞書が更に対応付けられており、
    前記プロセッサは、認識用辞書毎に、前記関係を前記帳票定義画面に表示する制御を更に行う
    請求項2に記載の情報処理装置。
  7. 前記プロセッサは、前記帳票定義画面から、前記表示形態を変化させた枠の認識用辞書の変更を受け付けた場合に、前記変更に応じて、前記関係を変化させる制御を更に行う
    請求項6に記載の情報処理装置。
  8. 前記プロセッサは、前記帳票定義画面において、前記帳票画像の各枠の表示形態が前記各枠の正答率に応じて異なるように変化させる制御を更に行う
    請求項1〜請求項7のいずれか1項に記載の情報処理装置。
  9. 帳票画像の項目に対応して設けられた枠毎の認識結果に関する統計データであって、枠の属性毎に、枠のサイズ、及び、枠内の画像が正しく認識された割合を示す正答率が対応付けられた前記統計データから、枠の属性毎の正答率を取得し、
    前記取得された枠の属性毎の正答率が閾値以下となる枠が存在する場合に、前記帳票画像の定義を行う画面である帳票定義画面において前記枠の表示形態を変化させる制御を行うことを、コンピュータに実行させるためのプログラム。
JP2019117615A 2019-06-25 2019-06-25 情報処理装置及びプログラム Active JP7226136B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019117615A JP7226136B2 (ja) 2019-06-25 2019-06-25 情報処理装置及びプログラム
US16/665,781 US20200410043A1 (en) 2019-06-25 2019-10-28 Information processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019117615A JP7226136B2 (ja) 2019-06-25 2019-06-25 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2021005160A true JP2021005160A (ja) 2021-01-14
JP7226136B2 JP7226136B2 (ja) 2023-02-21

Family

ID=74042602

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019117615A Active JP7226136B2 (ja) 2019-06-25 2019-06-25 情報処理装置及びプログラム

Country Status (2)

Country Link
US (1) US20200410043A1 (ja)
JP (1) JP7226136B2 (ja)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307638A (ja) * 1991-12-27 1993-11-19 Xerox Corp ビットマップ・イメージ・ドキュメントのコード化データへの変換方法
JPH11149520A (ja) * 1997-11-18 1999-06-02 Fujitsu Ltd 文書画像処理装置および方法
JPH11203399A (ja) * 1998-01-09 1999-07-30 Oki Electric Ind Co Ltd 光学式読取システム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5307638B2 (ja) 2009-06-11 2013-10-02 日本ダイスチール株式会社 罫線形成用溝部材

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05307638A (ja) * 1991-12-27 1993-11-19 Xerox Corp ビットマップ・イメージ・ドキュメントのコード化データへの変換方法
JPH11149520A (ja) * 1997-11-18 1999-06-02 Fujitsu Ltd 文書画像処理装置および方法
JPH11203399A (ja) * 1998-01-09 1999-07-30 Oki Electric Ind Co Ltd 光学式読取システム

Also Published As

Publication number Publication date
JP7226136B2 (ja) 2023-02-21
US20200410043A1 (en) 2020-12-31

Similar Documents

Publication Publication Date Title
US11631265B2 (en) Automated learning of document data fields
US7729013B2 (en) Image processing apparatus, image processing method, and computer program product
JP6878034B2 (ja) 情報処理装置、制御方法、およびプログラム
RU2571396C2 (ru) Способ и система для верификации в процессе чтения
US11200450B2 (en) Information processing apparatus and non-transitory computer readable medium for selecting a proper version of a recognition dictionary that is not necessarily a latest version
JP7263720B2 (ja) 情報処理装置及びプログラム
US20150261735A1 (en) Document processing system, document processing apparatus, and document processing method
US8548280B2 (en) Systems and methods for replacing non-image text
JP2021005160A (ja) 情報処理装置及びプログラム
JP7263721B2 (ja) 情報処理装置及びプログラム
US20180032244A1 (en) Input control device, input control method, character correction device, and character correction method
JP7268311B2 (ja) 情報処理装置及びプログラム
JP5310206B2 (ja) 文書処理装置、文書処理方法および文書処理プログラム
JP7383882B2 (ja) 情報処理装置、及び情報処理プログラム
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP2021018520A (ja) 情報処理装置、情報処理方法及びプログラム
US20220198190A1 (en) Information processing apparatus and non-transitory computer readable medium
JP7338265B2 (ja) 情報処理装置及びプログラム
JP2021039429A (ja) 情報処理装置及び情報処理プログラム
CN111079403B (zh) 一种页面对比方法及装置
JP2021033855A (ja) 情報処理装置及び情報処理プログラム
US20230108505A1 (en) Information processing apparatus
JP7268316B2 (ja) 情報処理装置及びプログラム
JP2021039507A (ja) 情報処理装置及び情報処理プログラム
JP2021189626A (ja) 情報処理装置及び情報処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230123

R150 Certificate of patent or registration of utility model

Ref document number: 7226136

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150