JP7331551B2 - 情報処理装置及び情報処理プログラム - Google Patents

情報処理装置及び情報処理プログラム Download PDF

Info

Publication number
JP7331551B2
JP7331551B2 JP2019149848A JP2019149848A JP7331551B2 JP 7331551 B2 JP7331551 B2 JP 7331551B2 JP 2019149848 A JP2019149848 A JP 2019149848A JP 2019149848 A JP2019149848 A JP 2019149848A JP 7331551 B2 JP7331551 B2 JP 7331551B2
Authority
JP
Japan
Prior art keywords
page
pages
data set
information processing
processing apparatus
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019149848A
Other languages
English (en)
Other versions
JP2021034778A (ja
Inventor
勇人 木下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2019149848A priority Critical patent/JP7331551B2/ja
Priority to US16/808,592 priority patent/US20210056254A1/en
Priority to CN202010161095.0A priority patent/CN112396046A/zh
Publication of JP2021034778A publication Critical patent/JP2021034778A/ja
Application granted granted Critical
Publication of JP7331551B2 publication Critical patent/JP7331551B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/22Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0482Interaction with lists of selectable items, e.g. menus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0484Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
    • G06F3/0486Drag-and-drop
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/114Pagination
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/418Document matching, e.g. of document images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/10Recognition assisted with metadata
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/00795Reading arrangements
    • H04N1/00798Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity
    • H04N1/00824Circuits or arrangements for the control thereof, e.g. using a programmed control device or according to a measured quantity for displaying or indicating, e.g. a condition or state

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • User Interface Of Digital Computer (AREA)
  • Collating Specific Patterns (AREA)
  • Character Discrimination (AREA)
  • Facsimiles In General (AREA)

Description

本発明は、情報処理装置及び情報処理プログラムに関する。
例えば、特許文献1には、申請書類をスキャンすることで生成される申請書類データを送信することが可能な画像形成装置と情報処理装置とを有する申請書類電子化システムが記載されている。この画像形成装置は、1又は複数ページで構成される申請書類を、1又は複数セット分スキャンして申請書類データを取得する申請書類データ取得手段と、申請書類データ取得手段で取得した申請書類データを情報処理装置に送信する申請書類データ送信手段と、を備える。また、この画像形成装置は、情報処理装置から申請書類データの分割情報を含む認識結果を受信する認識結果受信手段と、認識結果受信手段が受信した申請書類データの分割情報を含む認識結果を表示する認識結果表示手段と、を備える。この情報処理装置は、画像形成装置から送信される前記申請書類データを受信する申請書類データ受信手段と、申請書類データ受信手段により受信された申請書類データに所定の画像認識を行う画像認識手段と、を備える。この情報処理装置は、画像認識手段の認識結果に従って申請書類データを1セット毎の申請書類データに分割するための分割情報を生成する分割情報生成手段と、分割情報生成手段により生成された分割情報を含む認識結果を画像形成装置に送信する認識結果送信手段と、を備える。
特開2010-61551号公報
ところで、複数ページの原稿セットを1ページずつ連続的に読み取り認識を行って、電子データとしてのセットに区分することがある。その際、ユーザの不手際等により、例えば、原稿セットの中でページが重複したり、ページが不足したり、別の記入者のページが混在したり、あるいは、不明なページが混入したりする等、原稿セットに誤りがある場合がある。このような誤りがある原稿セットからは、適切なデータセットが得られなくなってしまう。
本発明は、原稿セットを読み取って区分されたデータセットにおける組み合わせが不適正な場合、不適正な組み合わせを含むデータセットから正しい組み合わせのデータセットを得ることができる情報処理装置及び情報処理プログラムを提供することを目的とする。
上記目的を達成するために、第1態様に係る情報処理装置は、プロセッサを備え、前記プロセッサが、複数ページの原稿を含む複数の原稿セットを読み取って区分された複数の第1データセットの各々の組み合わせが不適正な場合、前記第1データセットの各々をページ単位に分解し、前記分解して得られたページ群の中に適正な組み合わせが含まれている場合に、適正な組み合わせを第2データセットとして組み直す処理を行う。
また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記プロセッサが、前記第1データセットを分解した複数ページを表示すると共に、前記第1データセットが不適正である要因を示す情報を表示する制御を更に行う。
また、第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記要因が、前記第1データセットのページが不足していることであるとされている。
また、第4態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記要因が、前記第1データセットの中に余分なページが含まれていることであるとされている。
また、第5態様に係る情報処理装置は、第4態様に係る情報処理装置において、前記余分なページが、重複しているページ、別の記入者のページ、及び不明なページのうちのいずれかのページであるとされている。
また、第6態様に係る情報処理装置は、第1態様又は第2態様に係る情報処理装置において、前記プロセッサが、前記第1データセットのページが不足している場合、前記第1データセットの複数ページを予め定められたフォルダに格納する処理を更に行う。
また、第7態様に係る情報処理装置は、第6態様に係る情報処理装置において、前記プロセッサが、前記第1データセットの中に余分なページが含まれている場合、前記余分なページを前記フォルダに格納する処理を更に行う。
また、第8態様に係る情報処理装置は、第7態様に係る情報処理装置において、前記プロセッサが、前記第1データセットから前記余分なページを削除した残りのページを前記第2データセットとして組み直す処理を更に行う。
また、第9態様に係る情報処理装置は、第6態様~第8態様のいずれか1の態様に係る情報処理装置において、前記フォルダに格納されたページ群の各ページに、メタ情報が付与されており、前記プロセッサが、前記ページ群の各ページに付与されているメタ情報を用いて、前記ページ群の中から適正な組み合わせを特定する処理を行い、前記特定した適正な組み合わせを前記第2データセットとして識別可能に表示する制御を更に行う。
また、第10態様に係る情報処理装置は、第9態様に係る情報処理装置において、前記プロセッサが、前記第2データセットのいずれかのページが選択された場合に、前記選択されたページの内容を示す情報を拡大して表示する制御を更に行う。
また、第11態様に係る情報処理装置は、第6態様~第8態様のいずれか1の態様に係る情報処理装置において、前記フォルダに格納されたページ群の各ページに、メタ情報が付与されており、前記プロセッサが、前記ページ群の一覧の中から選択されたページのメタ情報に基づいて、前記ページ群の中から適正な組み合わせの候補を検索する処理を行い、前記検索した適正な組み合わせの候補を識別可能に表示する制御を更に行う。
また、第12態様に係る情報処理装置は、第11態様に係る情報処理装置において、前記プロセッサが、前記適正な組み合わせの候補を識別可能に表示する際に、前記適正な組み合わせの候補となるページの検索に用いたメタ情報をページ毎に付与して表示する制御を更に行う。
また、第13態様に係る情報処理装置は、第12態様に係る情報処理装置において、前記メタ情報が、筆跡を含み、前記プロセッサが、前記ページ群の一覧の中から選択されたページの筆跡と、他のページの筆跡との類似度を表す筆跡類似度を導出する処理を行い、前記適正な組み合わせの候補となるページの筆跡類似度の高低を識別可能に表示する制御を更に行う。
また、第14態様に係る情報処理装置は、第1態様~第13態様のいずれか1の態様に係る情報処理装置において、前記プロセッサが、前記原稿セットを読み取って得られた読取データの複数ページを認識することにより、前記複数ページに関するメタ情報を取得し、前記取得したメタ情報を用いて、前記第1データセットが不適正か否かを判定する処理を更に行う。
また、第15態様に係る情報処理装置は、第14態様に係る情報処理装置において、前記原稿が、帳票であり、前記メタ情報が、前記帳票のページ番号、レイアウト、特定フィールド、画像パッチ、帳票ID、筆跡、及び記入者IDの少なくとも1つであるとされている。
更に、上記目的を達成するために、第16態様に係る情報処理プログラムは、複数ページの原稿を含む複数の原稿セットを読み取って区分された第1データセットの組み合わせが不適正な場合、前記第1データセットの各々をページ単位に分解し、前記分解して得られたページ群の中に適正な組み合わせが含まれている場合に、適正な組み合わせを第2データセットとして組み直す処理を行うことを、コンピュータに実行させる。
第1態様及び第16態様によれば、原稿セットを読み取って区分されたデータセットにおける組み合わせが不適正な場合、不適正な組み合わせを含むデータセットから正しい組み合わせのデータセットを得ることができる、という効果を有する。
第2態様によれば、データセットを分解した複数ページ及び不適正である要因を把握することができる、という効果を有する。
第3態様によれば、不適正の要因がページ不足であることを把握することができる、という効果を有する。
第4態様によれば、不適正の要因が余分なページであることを把握することができる、という効果を有する。
第5態様によれば、余分なページが重複ページ、別の記入者のページ、不明ページのいずれであるかを把握することができる、という効果を有する。
第6態様によれば、ページが不足するデータセットが含まれている場合であっても、原稿セットを再度読み取ることなく、適正な組み合わせのデータセットを得ることができる、という効果を有する。
第7態様によれば、余分なページを含むデータセットが含まれている場合であっても、原稿セットを再度読み取ることなく、適正な組み合わせのデータセットを得ることができる、という効果を有する。
第8態様によれば、余分なページを削除しない場合と比較して、適正な組み合わせのデータセットを容易に得ることができる、という効果を有する。
第9態様によれば、フォルダに格納されたページ群の各ページのメタ情報を考慮しない場合と比較して、適正な組み合わせを容易に把握することができる、という効果を有する。
第10態様によれば、ページの内容を示す情報を拡大表示しない場合と比較して、ページの内容を容易に把握することができる、という効果を有する。
第11態様によれば、フォルダに格納されたページ群から選択されたページのメタ情報を考慮しない場合と比較して、適正な組み合わせの候補を容易に把握することができる、という効果を有する。
第12態様によれば、適正な組み合わせの候補の検索に用いたメタ情報を表示しない場合と比較して、検索に用いたメタ情報を容易に把握することができる、という効果を有する。
第13態様によれば、筆跡類似度の高低を識別可能に表示しない場合と比較して、適正な組み合わせの候補を容易に把握することができる、という効果を有する。
第14態様によれば、不適正なデータセットの判定にメタ情報を用いない場合と比較して、不適正なデータセットを精度良く特定することができる、という効果を有する。
第15態様によれば、メタ情報として、帳票のページ番号、レイアウト、特定フィールド、画像パッチ、帳票ID、筆跡、及び記入者IDの少なくとも1つを考慮しない場合と比較して、不適正なデータセットを精度良く特定することができる、という効果を有する。
実施形態に係る情報処理システムの構成の一例を示す図である。 実施形態に係るサーバ装置の電気的な構成の一例を示すブロック図である。 実施形態に係るサーバ装置の機能的な構成の一例を示すブロック図である。 実施形態に係る情報処理プログラムによる処理の流れの一例を示すフローチャートである。 実施形態に係る第1データセットの不適正判定処理の流れの一例を示すフローチャートである。 (A)は重複ページを含む第1データセットのUI画面の一例を示す正面図である。(B)はページが不足している第1データセットのUI画面の一例を示す正面図である。(C)は別記入者のページを含む第1データセットのUI画面の一例を示す図である。(D)は不明ページを含む第1データセットのUI画面の一例を示す正面図である。 実施形態に係る不適正フォルダ格納処理の説明に供する図である。 実施形態に係る別の不適正フォルダ格納処理の説明に供する図である。 実施形態に係る更に別の不適正フォルダ格納処理の説明に供する図である。 実施形態に係る不適正ページ一覧表示処理の流れの一例を示すフローチャートである。 実施形態に係る不適正ページ一覧画面の一例を示す正面図である。 ページ内容を拡大表示した状態の不適正ページ一覧画面の一例を示す正面図である。 ページビューワを表示した状態の不適正ページ一覧画面の一例を示す正面図である。 実施形態に係る不適正ページ一覧表示処理の流れの別の例を示すフローチャートである。 実施形態に係る筆跡類似度付与処理の流れの一例を示すフローチャートである。 実施形態に係る不適正ページ一覧表示処理の別の例の説明に供する図である。 実施形態に係る適正ページ結合処理の説明に供する図である。 実施形態に係る結合済みページ群格納処理の説明に供する図である。 実施形態に係る別の結合済みページ群格納処理の説明に供する図である。
以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。
図1は、本実施形態に係る情報処理システム90の構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム90は、サーバ装置10と、確認者用端末装置40A、40B、・・・と、画像読取装置60と、管理者用端末装置70と、を備えている。なお、サーバ装置10は、情報処理装置の一例である。
サーバ装置10は、ネットワークNを介して、確認者用端末装置40A、40B、・・・、画像読取装置60、及び管理者用端末装置70の各々と通信可能に接続されている。このサーバ装置10には、一例として、サーバコンピュータ、パーソナルコンピュータ(PC:Personal Computer)等の汎用的なコンピュータが適用される。また、このネットワークNには、一例として、インターネット、LAN(Local Area Network)、WAN(Wide Area Network)等が適用される。
画像読取装置60は、紙媒体の帳票等を光学的に読み取って画像を取得し、取得した画像(以下、「帳票画像」という。)をサーバ装置10に送信する機能を備えている。なお、ここでいう帳票としては、例えば、住所欄や氏名欄等の複数の項目を含む各種の帳票が用いられる。この帳票には、これら複数の項目の各々について手書き文字、印刷文字等が記入されている。サーバ装置10は、具体的には後述するように、画像読取装置60から受信した帳票画像に対して、光学的文字認識処理の一例であるOCR(Optical Character Recognition)処理を行い、複数の項目の各々に対応する画像についての認識結果を取得する。なお、この認識結果には、一例として、1文字以上の文字の連なりを示す文字列等が含まれる。また、帳票では、項目に対応する記載が記入されうる領域が枠等で定められており、記載が記入されうる領域が認識対象の領域として定義されている。定義された領域(以下、「定義領域」という。)を対象にOCR処理を行い、複数の項目の各々に対応する画像についての文字列を取得する。
確認者用端末装置40Aは、確認作業を行う確認者(ユーザ)U1が操作する端末装置であり、確認者用端末装置40Bは、確認作業を行う確認者U2が操作する端末装置である。これら複数の確認者用端末装置40A、40B、・・・を区別して説明する必要がない場合には、確認者用端末装置40A、40B、・・・を総称して確認者用端末装置40ともいう。また、これら複数の確認者U1、U2、・・・を区別して説明する必要がない場合には、確認者U1、U2、・・・を総称して確認者Uともいう。この確認者用端末装置40には、一例として、パーソナルコンピュータ(PC)等の汎用的なコンピュータや、スマートフォン、タブレット端末等の携帯可能な端末装置等が適用される。なお、確認者用端末装置40には、確認者Uが確認作業を行うための確認作業アプリケーション・プログラム(以下、「確認作業アプリ」ともいう。)がインストールされており、確認作業用のUI(User Interface)画面を生成して表示する。なお、ここでいう確認作業とは、帳票画像内に含まれる文字等の認識結果を確認する作業、あるいは、認識結果を確認及び訂正する作業を意味する。
管理者用端末装置70は、システム管理者SEが操作する端末装置であり、システム管理者SEにより帳票定義画面(図示省略)を介して帳票定義データが設定される。この管理者用端末装置70には、一例として、パーソナルコンピュータ(PC)等の汎用的なコンピュータや、スマートフォン、タブレット端末等の携帯可能な端末装置等が適用される。
サーバ装置10は、帳票画像に含まれる各項目の画像(以下、「項目画像」という。)を認識して得られた認識結果の確信度が閾値未満である場合、人手による確認作業を行い、確信度が閾値以上である場合、人手による確認作業を行わず、最終的な認識結果として出力する。
上記確認作業を行う場合、サーバ装置10は、項目画像とOCR処理により得られた文字列とを対応付けて、確認者用端末装置40のUI画面に表示させる制御を行う。確認者Uは、当該項目画像を見ながら、当該項目画像に対応する文字列が正しいか否かを確認する。確認者Uは、確認の結果、正しい場合はそのまま、正しくない場合は正しい文字列をUI画面に入力する。確認者用端末装置40は、UI画面を介して入力を受け付けた文字列を確認結果としてサーバ装置10に送信する。サーバ装置10は、確認者用端末装置40からの確認結果に基づいて、最終的な認識結果を出力し、確認者用端末装置40のUI画面に表示させる制御を行う。
図2は、本実施形態に係るサーバ装置10の電気的な構成の一例を示すブロック図である。
図2に示すように、本実施形態に係るサーバ装置10は、制御部11と、記憶部12と、表示部13と、操作部14と、通信部15と、を備えている。
制御部11は、CPU(Central Processing Unit)11A、ROM(Read Only Memory)11B、RAM(Random Access Memory)11C、及び入出力インターフェース(I/O)11Dを備えており、これら各部がバスを介して各々接続されている。
I/O11Dには、記憶部12と、表示部13と、操作部14と、通信部15と、を含む各機能部が接続されている。これらの各機能部は、I/O11Dを介して、CPU11Aと相互に通信可能とされる。
制御部11は、サーバ装置10の一部の動作を制御するサブ制御部として構成されてもよいし、サーバ装置10の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部11の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はIC(Integrated Circuit)チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部11の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。
記憶部12としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部12には、本実施形態に係る情報処理プログラム12Aが記憶される。なお、この情報処理プログラム12Aは、ROM11Bに記憶されていてもよい。
情報処理プログラム12Aは、例えば、サーバ装置10に予めインストールされていてもよい。情報処理プログラム12Aは、不揮発性の記憶媒体に記憶して、又はネットワークNを介して配布して、サーバ装置10に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
表示部13には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部13は、タッチパネルを一体的に有していてもよい。操作部14には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部13及び操作部14は、サーバ装置10のユーザから各種の指示を受け付ける。表示部13は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
通信部15は、インターネット、LAN、WAN等のネットワークNに接続されており、画像読取装置60、確認者用端末装置40、及び管理者用端末装置70の各々との間でネットワークNを介して通信が可能とされる。
ところで、上述したように、複数ページの原稿セットを1ページずつ連続的に読み取り認識を行って、電子データとしてのセットに区分することがある。その際、ユーザの不手際等により、原稿セットに誤りがある場合がある。このような誤りがある原稿セットからは、適切なデータセットが得られなくなってしまう。なお、ここでいう原稿セットとは、紙媒体の複数ページの原稿を含むセットとして定義される。データセットとは、この原稿セットを読み取って一定の規則に基づいて区分された複数ページのデータ(読取データ)を含むセットとして定義される。このデータセットは、原稿セットの各ページの読取データをOCR処理して得られた認識結果に基づいて、当該原稿セットの各ページの読取データを区分したものである。
本実施形態では、原稿の一例として、上述の帳票を挙げて説明するが、この原稿には、帳票に限らず、一般的な文書等も含まれる。
本実施形態に係るサーバ装置10のCPU11Aは、記憶部12に記憶されている情報処理プログラム12AをRAM11Cに書き込んで実行することにより、図3に示す各部として機能する。なお、CPU11Aは、プロセッサの一例である。
図3は、本実施形態に係るサーバ装置10の機能的な構成の一例を示すブロック図である。
図3に示すように、本実施形態に係るサーバ装置10のCPU11Aは、認識処理部20、帳票データ登録部21、不適正判定部22、ページ処理部23、表示制御部24、ページ登録部25、及び修正データ登録部26として機能する。
本実施形態に係る記憶部12には、一例として、帳票データを記憶する帳票データ記憶部12Bと、不適正データをページ単位で記憶するページ記憶部12Cと、が設けられている。
画像読取装置60は、複数ページの帳票を含む複数の帳票セットを読み取って読取データを取得し、取得した読取データをサーバ装置10に送信する。
認識処理部20は、画像読取装置60から受信した読取データを入力として、予め定められた帳票定義データの設定内容に従って、OCR処理を実行して認識結果を取得する。この際、認識処理部20は、このOCR処理により、読取データの複数ページに関するメタ情報を取得する。このメタ情報は、帳票のページ番号、レイアウト、特定フィールド、画像パッチ、帳票ID(Identification)、筆跡、及び記入者IDの少なくとも1つである。具体的に、例えば、帳票画像の各ページには、バーコード又は二次元コードが付与されており、このバーコード又は二次元コードを読み取ることで、例えば、帳票ID、ページ番号、及び記入者IDが取得される。また、レイアウトとは、ページの構成を表す情報である。レイアウトの場合、ページの構成がページ数に対応付けられて記憶される。特定フィールドとは、特定フィールドの場所を表す情報である。特定フィールドの場合、特定フィールドの場所がページ数に対応付けられて記憶される。画像パッチとは、特定の位置の特定の画像を表す情報である。画像パッチの場合、特定の位置の特定の画像がページ数に対応付けられて記憶される。筆跡とは、記入者の筆跡を表す情報である。認識処理部20は、これらの認識結果及びメタ情報を、読取データに対応付けて出力する。
帳票データ登録部21は、認識処理部20から出力された、認識結果及びメタ情報が対応付けられた読取データを、認識結果に基づいて区分する。区分された読取データの各々は、第1データセットとされる。例えば、複数の帳票セットの認識結果として、A-1/3、A-2/3、A-3/3、B-1/3、B-2/3、が得られたと仮定する。但し、A、Bは帳票ID、1/3~3/3はページ番号である。この場合、読取データは、Aセット1/3-3/3及びBセット1/3-2/3の2つの第1データセットに区分される。帳票データ登録部21は、読取データを区分して得られた複数の第1データセットを帳票データ記憶部12Bに格納する。
不適正判定部22は、帳票データ記憶部12Bに格納された複数の第1データセットの各々の組み合わせが不適正か否かを、メタ情報を用いて判定する。例えば、上記Aセット及びBセットの例では、Aセットは1/3~3/3が揃っているため適正と判定され、Bセットは3/3が不足しているため不適正と判定される。
ページ処理部23は、不適正判定部22による判定結果に基づいて、複数の第1データセットの各々の組み合わせが不適正な場合、第1データセットの各々をページ単位に分解し、分解して得られたページ群の中に適正な組み合わせが含まれている場合に、適正なページの組み合わせを第2データセットとして組み直す処理を行う。なお、第1データセットをページ単位に分解するとは、第1データセットのファイルを複数ページに分解することを意味する。また、適正なページの組み合わせを第2データセットとして組み直すとは、適正なページの組み合わせを第2データセットのファイルにすることを意味する。
表示制御部24は、一例として、後述の図6(A)~図6(D)に示すように、ページ処理部23により第1データセットを分解した複数ページを表示すると共に、第1データセットが不適正である要因を示す情報を表示する制御を行う。ここでいう要因とは、第1データセットのページが不足していること、及び第1データセットの中に余分なページが含まれていること、の少なくとも一方である。なお、余分なページとは、一例として、重複しているページ、別の記入者のページ、及び不明なページのうちのいずれかのページである。
ページ登録部25は、第1データセットのページが不足している場合、第1データセットの複数ページを予め定められたフォルダ(以下、「不適正フォルダ」という。)に格納する。この不適正フォルダは、ページ記憶部12Cに設けられている。また、ページ登録部25は、第1データセットの中に余分なページが含まれている場合、余分なページを不適正フォルダに格納する。この場合、ページ処理部23は、第1データセットから余分なページを削除した残りのページを第2データセットとして組み直す処理を行う。
不適正フォルダに格納されたページ群の各ページには、メタ情報が付与されている。例えば、ページ処理部23は、上記ページ群の各ページに付与されているメタ情報を用いて、ページ群の中から適正な組み合わせを特定する処理を行う。表示制御部24は、ページ処理部23により特定された適正な組み合わせを第2データセットとして識別可能に表示する制御を行う。このとき、表示制御部24は、第2データセットのいずれかのページが選択された場合、選択されたページの内容を示す情報を拡大して表示する制御を行うようにしてもよい。
また、ページ処理部23は、不適正フォルダに格納されたページ群の一覧の中から選択されたページのメタ情報に基づいて、ページ群の中から適正な組み合わせの候補を検索する処理を行うようにしてもよい。この場合、表示制御部24は、ページ処理部23により検索された適正な組み合わせの候補を識別可能に表示する制御を行う。表示制御部24は、適正な組み合わせの候補を識別可能に表示する際に、適正な組み合わせの候補となるページの検索に用いたメタ情報をページ毎に付与して表示する制御を行うようにしてもよい。また、ページ処理部23は、上記ページ群の一覧の中から選択されたページの筆跡と、他のページの筆跡との類似度を表す筆跡類似度を導出する処理を行うようにしてもよい。この筆跡類似度の導出には、公知の手法が用いられ、筆跡類似度(例えば、%で示す。)が高いほど、筆跡が同一である可能性が高いことを示している。この場合、表示制御部24は、適正な組み合わせの候補となるページの筆跡類似度の高低を識別可能に表示する制御を行うようにしてもよい。
修正データ登録部26は、不適正フォルダに格納されたページ群を修正して得られた修正データを帳票データ記憶部12Bに格納する。
次に、図4及び図5を参照して、本実施形態に係るサーバ装置10の作用を説明する。
図4は、本実施形態に係る情報処理プログラム12Aによる処理の流れの一例を示すフローチャートである。
まず、サーバ装置10に対して、OCR処理の実行が指示されると、CPU11Aにより情報処理プログラム12Aが起動され、以下の各ステップを実行する。
図4のステップ100では、CPU11Aが、画像読取装置60から、複数の帳票セットの読取データを取得する。
ステップ101では、CPU11Aが、ステップ100で取得した読取データに対してOCR処理を行い、認識結果を取得する。このとき、OCR処理によりメタ情報も取得する。なお、メタ情報とは、上述したように、帳票のページ番号、レイアウト、特定フィールド、画像パッチ、帳票ID、筆跡、及び記入者IDの少なくとも1つである。
ステップ102では、CPU11Aが、ステップ101で取得した認識結果に基づいて、読取データを複数の第1データセットに区分し、区分した複数の第1データセットを帳票データ記憶部12Bに格納する。
ステップ103では、CPU11Aが、ステップ102で区分した複数の第1データセットの各々について不適正判定処理を実行する。
図5は、本実施形態に係る第1データセットの不適正判定処理の流れの一例を示すフローチャートである。
図5のステップ120では、CPU11Aが、帳票データ記憶部12Bから第1データセットを取得する。
ステップ121では、CPU11Aが、ステップ120で取得した第1データセットのページ数を0にセットする。
ステップ122では、CPU11Aが、第1データセットのページ毎のレイアウト情報を取得する。
ステップ123では、CPU11Aが、第1データセットからページ(以下、「現ページ」という。)を取得する。
ステップ124では、CPU11Aが、第1データセットのページ数をインクリメントする。
ステップ125では、CPU11Aが、ステップ123で取得した現ページのメタ情報を抽出する。
ステップ126では、CPU11Aが、ステップ125で抽出したメタ情報に基づいて、ステップ123で取得した現ページが1ページ目か否かを判定する。現ページが1ページ目であると判定した場合(肯定判定の場合)、ステップ127に移行し、現ページが1ページ目ではないと判定した場合(否定判定の場合)、ステップ129に移行する。
ステップ127では、CPU11Aが、現ページ数とページ番号とが一致するか否かを判定する。現ページ数とページ番号とが一致すると判定した場合(肯定判定の場合)、ステップ128に移行し、現ページ数とページ番号とが一致しないと判定した場合(否定判定の場合)、ステップ133に移行する。
ステップ128では、CPU11Aが、第1データセットに次ページがあるか否かを判定する。第1データセットに次ページがあると判定した場合(肯定判定の場合)、ステップ123に移行し、第1データセットに次ページはないと判定した場合(否定判定の場合)、図4のステップ104にリターンする。
ステップ129では、CPU11Aが、現ページの帳票IDと1ページ目の帳票IDとが同一であるか否かを判定する。現ページの帳票IDと1ページ目の帳票IDとが同一であると判定した場合(肯定判定の場合)、ステップ130に移行し、現ページの帳票IDと1ページ目の帳票IDとが同一ではないと判定した場合(否定判定の場合)、ステップ132に移行する。
ステップ130では、CPU11Aが、現ページの筆跡と1ページ目の筆跡とが同一であるか否かを判定する。なお、筆跡判定には、公知の技術が用いられ、その手法について特に限定されるものではない。現ページの筆跡と1ページ目の筆跡とが同一であると判定した場合(肯定判定の場合)、ステップ127に移行し、現ページの筆跡と1ページ目の筆跡とが同一ではないと判定した場合(否定判定の場合)、ステップ131に移行する。
ステップ131では、CPU11Aが、現ページに別記入者フラグを設定し、ステップ128に移行する。
一方、ステップ132では、CPU11Aが、現ページに別帳票フラグを設定し、ステップ128に移行する。
一方、ステップ133では、CPU11Aが、現ページ数と前ページの番号とが一致するか否かを判定する。現ページ数と前ページの番号とが一致すると判定した場合(肯定判定の場合)、ステップ134に移行し、現ページ数と前ページの番号とが一致しないと判定した場合(否定判定の場合)、ステップ135に移行する。
ステップ134では、CPU11Aが、前ページ及び現ページに重複フラグを設定し、ステップ128に移行する。
ステップ135では、CPU11Aが、現ページ数と次ページの番号とが一致するか否かを判定する。現ページ数と次ページの番号とが一致すると判定した場合(肯定判定の場合)、ステップ136に移行し、現ページ数と次ページの番号とが一致しないと判定した場合(否定判定の場合)、ステップ137に移行する。
ステップ136では、CPU11Aが、現ページに不足フラグを設定し、ページ数を1加算し、ステップ128に移行する。
ステップ137では、CPU11Aが、現ページに不明フラグを設定し、ステップ128に移行する。
次に、図4に戻りステップ104では、CPU11Aが、全ての第1データセットについて実施したか否かを判定する。全ての第1データセットについて実施したと判定した場合(肯定判定の場合)、ステップ105に移行し、全ての第1データセットについて実施していないと判定した場合(否定判定の場合)、ステップ103に戻り処理を繰り返す。
ステップ105では、CPU11Aが、第1データセットを取得する。
ステップ106では、CPU11Aが、ステップ105で取得した第1データセットが不適正か否かを判定する。第1データセットが不適正であると判定した場合(肯定判定の場合)、ステップ107に移行し、第1データセットが不適正ではない、つまり、適正であると判定した場合(否定判定の場合)、ステップ112に移行する。
ステップ107では、CPU11Aが、第1データセットをページ単位に分解し、ページ単位に分解した第1データセットを例えば確認者用端末装置40に表示する制御を行う。具体的には、一例として、図6(A)~図6(D)に示すように、第1データセットを分解した複数ページを表示すると共に、第1データセットが不適正である要因を示す情報を表示する制御を行う。
図6(A)は、重複ページを含む第1データセットのUI画面の一例を示す正面図である。図6(B)は、ページが不足している第1データセットのUI画面の一例を示す正面図である。図6(C)は、別記入者のページを含む第1データセットのUI画面の一例を示す図である。図6(D)は、不明ページを含む第1データセットのUI画面の一例を示す正面図である。
図6(A)の例では、ページ1が重複している可能性があるため、「ページが重複している可能性があります」というメッセージが表示されている。また、図6(B)の例では、ページ2が不足している可能性があるため、「ページが不足している可能性があります」というメッセージが表示されている。また、図6(C)の例では、ページ2が別記入者のページである可能性があるため、「別の記入者のページが混在している可能性があります」というメッセージが表示されている。図6(D)の例では、不明ページが含まれている可能性があるため、「判別できない不明ページが存在します」というメッセージが表示されている。
ステップ108では、CPU11Aが、第1データセットのページが不足しているか、又は、第1データセットに余分なページが含まれているかを判定する。なお、余分なページとは、上述したように、重複しているページ、別の記入者のページ、及び不明なページのうちのいずれかのページである。第1データセットのページが不足していると判定した場合(ページ不足の場合)、ステップ109に移行し、第1データセットに余分なページが含まれていると判定した場合(余分なページの場合)、ステップ110に移行する。
ステップ109では、CPU11Aが、一例として、後述の図7~図9に示すように、第1データセットの複数ページを不適正フォルダに格納する。
一方、ステップ110では、CPU11Aが、一例として、後述の図7~図9に示すように、第1データセットの余分なページのみを不適正フォルダに格納する。
ステップ111では、CPU11Aが、第1データセットから余分なページを除いた残りページを適正な第2データセットとして組み直す。
ステップ112では、CPU11Aが、全ての第1データセットについて実施したか否かを判定する。全ての第1データセットについて実施していないと判定した場合(否定判定の場合)、ステップ105に移行し、全ての第1データセットについて実施したと判定した場合(肯定判定の場合)、本情報処理プログラム12Aによる一連の処理を終了する。
次に、図7~図9を参照して、第1データセットの不適正ページを不適正フォルダに格納する処理(以下、「不適正フォルダ格納処理」という。)を具体的に説明する。
図7は、本実施形態に係る不適正フォルダ格納処理の説明に供する図である。
図7のUI画面41及びUI画面42の各々は、確認者用端末装置40に表示される。UI画面41では、重複ページ(ここではページ1)を含む第1データセットが表示されている。UI画面41では、第1データセットの重複ページ(ページ1)のサムネイル画像がドラッグ&ドロップ操作により不適正フォルダに格納される。また、UI画面42では、ページ(ここではページ2)が不足している第1データセットが表示される。UI画面42では、ページ(ページ2)が不足している第1データセットのうち、複数ページ(ここではページ1、ページ3)のサムネイル画像がドラッグ&ドロップ操作により不適正フォルダに格納される。
図8は、本実施形態に係る別の不適正フォルダ格納処理の説明に供する図である。
図8のUI画面43及びUI画面44の各々は、確認者用端末装置40に表示される。UI画面43では、重複ページ(ここではページ1)を含む第1データセットが表示される。UI画面43では、第1データセットの重複ページ(ページ1)が選択され、サムネイル画像の右クリックメニューの「不適正ページとして登録」が選択操作されることにより重複ページ(ページ1)のサムネイル画像が不適正フォルダに格納される。また、UI画面44では、ページ(ここではページ2)が不足している第1データセットが表示される。UI画面44では、第1データセットの複数ページ(ここではページ1、ページ3)が選択され、サムネイル画像の右クリックメニューの「不適正ページとして登録」が選択操作されることにより複数ページ(ページ1、ページ3)のサムネイル画像が不適正フォルダに格納される。
図9は、本実施形態に係る更に別の不適正フォルダ格納処理の説明に供する図である。
図9のUI画面45、UI画面46、及びUI画面47の各々は、確認者用端末装置40に表示される。UI画面45では、重複ページ(ここではページ1)を含む第1データセットが表示される。UI画面45では、重複ページ(ページ1)のサムネイル画像ではなく、重複ページ(ページ1)のページ画像の右クリックメニューの「不適正ページとして登録」が選択操作されることにより重複ページ(ページ1)のページ画像が不適正フォルダに格納される。また、UI画面46では、訂正対象帳票リストが表示される。UI画面46では、訂正対象帳票リストの中から選択された特定ページのサムネイル画像群がドラッグ&ドロップ操作により不適正フォルダに格納される。また、UI画面47では、同様に、訂正対象帳票リストが表示される。UI画面47では、訂正対象帳票リストの中から特定ページのサムネイル画像群が選択され、右クリックメニューの「不適正ページとして登録」が選択操作されることにより特定ページのサムネイル画像群が不適正フォルダに格納される。
次に、図10を参照して、不適正フォルダに格納されたページ群の一覧を表示する処理(以下、「不適正ページ一覧表示処理」という。)について説明する。
図10は、本実施形態に係る不適正ページ一覧表示処理の流れの一例を示すフローチャートである。
まず、サーバ装置10に対して、不適正ページ一覧表示処理の実行が指示されると、CPU11Aにより情報処理プログラム12Aが起動され、以下の各ステップを実行する。
図10のステップ140では、CPU11Aが、確認者用端末装置40から、不適正ページ一覧の表示要求を受信する制御を行う。
ステップ141では、CPU11Aが、不適正フォルダから、不適正ページ群を取得する。
ステップ142では、CPU11Aが、ステップ141で取得した不適正ページ群について各ページ同士の帳票IDの合致判定を行う。
ステップ143では、CPU11Aが、ステップ141で取得した不適正ページ群について各ページ同士の記入者IDの合致判定を行う。
ステップ144では、CPU11Aが、帳票ID又は記入者IDが同一のページ群を検索する。
ステップ145では、CPU11Aが、ステップ144で検索して得られたページ群にグループIDを付与する。
ステップ146では、CPU11Aが、一例として、図11に示すように、ステップ145で付与した、同一のグループIDを持つページ群を識別可能なように、確認者用端末装置40に表示する制御を行い、本不適正ページ一覧表示処理を終了する。
図11は、本実施形態に係る不適正ページ一覧画面48の一例を示す正面図である。
図11に示す不適正ページ一覧画面48は、確認者用端末装置40に表示される。この不適正ページ一覧画面48では、同一のグループIDを持つページ群が点線の枠で囲まれた状態で表示される。この点線の枠で囲まれたページ群が第2データセットとされる。なお、図11の例では、点線の枠で囲む形態としているが、例えば、異なる色で表示する形態、異なるハッチングで表示する形態、異なるサイズで表示する形態等、適正なページの組み合わせが識別可能な形態であればよい。
図12は、ページ内容を拡大表示した状態の不適正ページ一覧画面48の一例を示す正面図である。
図12に示すように、CPU11Aは、不適正ページ一覧画面48において第2データセットのいずれかのページが選択された場合に、選択されたページの内容を示す情報を拡大して表示する制御を行うようにしてもよい。なお、ここでいう選択とは、例えば、マウスオーバーによる選択である。
図13は、ページビューワを表示した状態の不適正ページ一覧画面48の一例を示す正面図である。
図13に示すように、CPU11Aは、不適正ページ一覧画面48において第2データセットのいずれかのページがクリック操作された場合に、クリック操作されたページの内容を示す情報をページビューワで表示する制御を行うようにしてもよい。
次に、図14及び図15を参照して、不適正ページ一覧表示処理の別の例について説明する。
図14は、本実施形態に係る不適正ページ一覧表示処理の流れの別の例を示すフローチャートである。
まず、サーバ装置10に対して、不適正ページ一覧表示処理の実行が指示されると、CPU11Aにより情報処理プログラム12Aが起動され、以下の各ステップを実行する。
図14のステップ150では、CPU11Aが、確認者用端末装置40から、不適正ページ一覧の表示要求を受信する制御を行う。
ステップ151では、CPU11Aが、不適正フォルダから、不適正ページ群を取得する。
ステップ152では、CPU11Aが、ステップ151で取得した不適正ページ群に対して筆跡類似度付与処理を実行する。
図15は、本実施形態に係る筆跡類似度付与処理の流れの一例を示すフローチャートである。
図15のステップ160では、CPU11Aが、不適正ページ群から、1ページ取得する(以下、「ページA」という。)。
ステップ161では、CPU11Aが、ページAが存在するか否かを判定する。ページAが存在すると判定した場合(肯定判定の場合)、ステップ162に移行し、ページAが存在しないと判定した場合(否定判定の場合)、図14のステップ153にリターンする。
ステップ162では、CPU11Aが、ページA以外の中から1ページ取得する(以下、「ページB」という。)。
ステップ163では、CPU11Aが、ページBが存在するか否かを判定する。ページBが存在すると判定した場合(肯定判定の場合)、ステップ164に移行し、ページBが存在しないと判定した場合(否定判定の場合)、ステップ160に戻り処理を繰り返す。
ステップ164では、CPU11Aが、ページ同士、つまり、ページAとページBとの間で筆跡類似度を算出する。なお、上述したように、筆跡類似度(例えば、%で示す。)が高いほど、筆跡が同一である可能性が高いことを示している。
ステップ165では、CPU11Aが、ページBにページAとの筆跡類似度を付与し、ステップ162に戻り処理を繰り返す。
次に、図14に戻りステップ153では、CPU11Aが、不適正ページ群の一覧である不適正ページ一覧画面を確認者用端末装置40に表示する制御を行う。
ステップ154では、CPU11Aが、不適正ページ一覧画面から任意のページが選択されたか否かを判定する。任意のページが選択されたと判定した場合(肯定判定の場合)、ステップ155に移行し、任意のページが選択されていないと判定した場合(否定判定の場合)、ステップ154で待機となる。
ステップ155では、CPU11Aが、不適正ページ一覧画面に含まれる不適正ページ群から、ステップ154で選択されたページと帳票ID又は記入者IDが同一のページを検索する。
ステップ156では、CPU11Aが、ステップ155での検索結果に基づいて、帳票ID又は記入者IDが同一のページが存在するか否かを判定する。帳票ID又は記入者IDが同一のページが存在すると判定した場合(肯定判定の場合)、ステップ157に移行し、帳票ID又は記入者IDが同一のページは存在しないと判定した場合(否定判定の場合)、ステップ158に移行する。
ステップ157では、CPU11Aが、不適正ページ一覧画面において、帳票ID又は記入者IDが同一のページを識別可能に表示する制御を行う。具体的には、例えば、当該ページの色が他のページの色と異なるように変化させる。
ステップ158では、CPU11Aが、不適正ページ一覧画面に含まれる不適正ページ群から、ステップ154で選択されたページと筆跡が類似するページを検索する。例えば、筆跡類似度が50%以上のページを検索対象とする。
ステップ159では、CPU11Aが、ステップ158での検索結果に基づいて、筆跡が類似するページが存在するか否かを判定する。筆跡が類似するページが存在すると判定した場合(肯定判定の場合)、ステップ160に移行し、筆跡が類似するページは存在しないと判定した場合(否定判定の場合)、本情報処理プログラム12Aを終了する。
ステップ160では、CPU11Aが、不適正ページ一覧画面において、筆跡が類似するページを識別可能に表示する制御を行い、本情報処理プログラム12Aによる一連の処理を終了する。具体的には、例えば、当該ページの色を他のページの色と異なるように変化させる。そして、更に、筆跡類似度が50%以上70%未満のページの色の濃度を50%、筆跡類似度が70%以上100%以下のページの色の濃度を70%等とし、筆跡類似度の高低が識別可能としてもよい。
次に、図16を参照して、不適正ページ一覧表示処理の別の例について具体的に説明する。
図16は、本実施形態に係る不適正ページ一覧表示処理の別の例の説明に供する図である。
図16の不適正ページ一覧画面49Aでは、任意のページが選択された状態を示している。ここでは、マウスポインタが位置する場所(左上端)のページ1が選択されている。図16の不適正ページ一覧画面49Bでは、選択されたページ1と同一の帳票IDを持つページの色、及び、選択されたページ1と筆跡が類似するページの色が異なるように表示されている。なお、図16の例では、色の違いをハッチングの違いで表している。
すなわち、CPU11Aは、図16の不適正ページ一覧画面49Bに示すように、適正なページの組み合わせの候補を識別可能に表示する制御を行う。このとき、CPU11Aは、適正な組み合わせの候補となるページの検索に用いたメタ情報をページ毎に付与して表示する制御を行うようにしてもよい。図16の不適正ページ一覧画面49Bでは、メタ情報の一例として、帳票ID、筆跡が付与されている。
また、CPU11Aは、上述したように、選択されたページ(図16の例では左上端のページ1)の筆跡と、他のページの筆跡との類似度を表す筆跡類似度を導出する処理を行い、適正な組み合わせの候補となるページの筆跡類似度の高低を識別可能に表示する制御を行う。図16の不適正ページ一覧画面49Bでは、筆跡類似度が最も高い色の濃度を最も濃くし、筆跡類似度が最も低い色の濃度を最も薄くし、筆跡類似度が中間の色の濃度を中程度とした場合について示している。
次に、図17を参照して、不適正ページ一覧画面から選択された適正なページを結合する処理(以下、「適正ページ結合処理」という。)について具体的に説明する。
図17は、本実施形態に係る適正ページ結合処理の説明に供する図である。
図17の不適正ページ一覧画面50では、結合したいページを選択し、右クリックメニューの「結合」を選択操作することで、選択操作されたページ群は1つに結合される。また、図17の不適正ページ一覧画面51では、結合したいページに別のページをドラッグ&ドロップ操作により重ねることで、重ねられたページ群は1つに結合される。これらのページ群は結合済みページ群とされる。
次に、図18及び図19を参照して、上記結合済みページ群を確認作業用フォルダに格納する処理(以下、「結合済みページ群格納処理」という。)について具体的に説明する。
図18は、本実施形態に係る結合済みページ群格納処理の説明に供する図である。
図18の不適正ページ一覧画面52では、結合済みページ群の右クリックメニューから「確認訂正へ戻す」が選択され、更に、戻す先の帳票である「帳票B」が選択されると、結合済みページ群が「帳票B」のフォルダに格納され、確認作業へ戻される。
図19は、本実施形態に係る別の結合済みページ群格納処理の説明に供する図である。
図19の不適正ページ一覧画面53では、結合済みページ群をドラッグ&ドロップ操作により、戻す先の帳票である「帳票B」のフォルダに格納され、確認作業に戻される。
このように本実施形態によれば、原稿セットを読み取って区分されたデータセットにおける組み合わせが不適正な場合に、不適正な組み合わせを含むデータセットが分解され、正しい組み合わせのデータセットに組み直される。このため、原稿セットの組み合わせが不適正な場合であっても、正しい組み合わせのデータセットが得られる。
なお、上記実施形態でCPUがソフトウェア(プログラム)を読み込んで実行した情報処理を、CPU以外の各種のプロセッサが実行してもよい。この場合のプロセッサとしては、FPGA(Field-Programmable Gate Array)等の製造後に回路構成を変更可能なPLD(Programmable Logic Device)、及びASIC(Application Specific Integrated Circuit)等の特定の処理を実行させるために専用に設計された回路構成を有するプロセッサである専用電気回路等が例示される。また、この情報処理を、これらの各種のプロセッサのうちの1つで実行してもよいし、同種又は異種の2つ以上のプロセッサの組み合わせ(例えば、複数のFPGA、及びCPUとFPGAとの組み合わせ等)で実行してもよい。また、これらの各種のプロセッサのハードウェア的な構造は、より具体的には、半導体素子等の回路素子を組み合わせた電気回路である。
以上、実施形態に係る情報処理装置の一例としてサーバ装置を例示して説明した。実施形態は、サーバ装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、これらのプログラムを記憶したコンピュータが読み取り可能な非一時的(non-transitory)記憶媒体の形態としてもよい。
その他、上記実施形態で説明したサーバ装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。
10 サーバ装置
11 制御部
11A CPU
11B ROM
11C RAM
11D I/O
12 記憶部
12A 情報処理プログラム
12B 帳票データ記憶部
12C ページ記憶部
13 表示部
14 操作部
15 通信部
20 認識処理部
21 帳票データ登録部
22 不適正判定部
23 ページ処理部
24 表示制御部
25 ページ登録部
26 修正データ登録部
40、40A、40B 確認者用端末装置
60 画像読取装置
70 管理者用端末装置
90 情報処理システム

Claims (15)

  1. プロセッサを備え、
    前記プロセッサは、
    複数ページの原稿を含む複数の原稿セットを読み取って区分された複数の第1データセットの各々の組み合わせが不適正な場合、前記第1データセットの各々をページ単位に分解し、
    前記分解して得られたページ群の中に適正な組み合わせが含まれている場合に、適正な組み合わせを第2データセットとして組み直す処理を行い、
    前記プロセッサは、
    前記第1データセットのページが不足している場合、前記第1データセットの複数ページを予め定められたフォルダに格納する処理を行
    情報処理装置。
  2. 前記プロセッサは、前記第1データセットを分解した複数ページを表示すると共に、前記第1データセットが不適正である要因を示す情報を表示する制御を更に行う
    請求項1に記載の情報処理装置。
  3. 前記要因は、前記第1データセットのページが不足していることである
    請求項2に記載の情報処理装置。
  4. 前記要因は、前記第1データセットの中に余分なページが含まれていることである
    請求項2に記載の情報処理装置。
  5. 前記余分なページは、重複しているページ、別の記入者のページ、及び不明なページのうちのいずれかのページである
    請求項4に記載の情報処理装置。
  6. 前記プロセッサは、前記第1データセットの中に余分なページが含まれている場合、前記余分なページを前記フォルダに格納する処理を更に行う
    請求項1又は請求項2に記載の情報処理装置。
  7. 前記プロセッサは、前記第1データセットから前記余分なページを削除した残りのページを前記第2データセットとして組み直す処理を更に行う
    請求項に記載の情報処理装置。
  8. 前記フォルダに格納されたページ群の各ページは、メタ情報が付与されており、
    前記プロセッサは、前記ページ群の各ページに付与されているメタ情報を用いて、前記ページ群の中から適正な組み合わせを特定する処理を行い、
    前記特定した適正な組み合わせを前記第2データセットとして識別可能に表示する制御を更に行う
    請求項~請求項のいずれか1項に記載の情報処理装置。
  9. 前記プロセッサは、前記第2データセットのいずれかのページが選択された場合に、前記選択されたページの内容を示す情報を拡大して表示する制御を更に行う
    請求項に記載の情報処理装置。
  10. 前記フォルダに格納されたページ群の各ページは、メタ情報が付与されており、
    前記プロセッサは、前記ページ群の一覧の中から選択されたページのメタ情報に基づいて、前記ページ群の中から適正な組み合わせの候補を検索する処理を行い、
    前記検索した適正な組み合わせの候補を識別可能に表示する制御を更に行う
    請求項~請求項のいずれか1項に記載の情報処理装置。
  11. 前記プロセッサは、前記適正な組み合わせの候補を識別可能に表示する際に、前記適正な組み合わせの候補となるページの検索に用いたメタ情報をページ毎に付与して表示する制御を更に行う
    請求項10に記載の情報処理装置。
  12. 前記メタ情報は、筆跡を含み、
    前記プロセッサは、前記ページ群の一覧の中から選択されたページの筆跡と、他のページの筆跡との類似度を表す筆跡類似度を導出する処理を行い、
    前記適正な組み合わせの候補となるページの筆跡類似度の高低を識別可能に表示する制御を更に行う
    請求項11に記載の情報処理装置。
  13. 前記プロセッサは、前記原稿セットを読み取って得られた読取データの複数ページを認識することにより、前記複数ページに関するメタ情報を取得し、
    前記取得したメタ情報を用いて、前記第1データセットが不適正か否かを判定する処理を更に行う
    請求項1~請求項12のいずれか1項に記載の情報処理装置。
  14. 前記原稿は、帳票であり、
    前記メタ情報は、前記帳票のページ番号、レイアウト、特定フィールド、画像パッチ、帳票ID、筆跡、及び記入者IDの少なくとも1つである
    請求項13に記載の情報処理装置。
  15. 複数ページの原稿を含む複数の原稿セットを読み取って区分された第1データセットの組み合わせが不適正な場合、前記第1データセットの各々をページ単位に分解し、
    前記分解して得られたページ群の中に適正な組み合わせが含まれている場合に、適正な組み合わせを第2データセットとして組み直す処理を行い、
    前記第1データセットのページが不足している場合、前記第1データセットの複数ページを予め定められたフォルダに格納する処理を行うことを、コンピュータに実行させるための情報処理プログラム。
JP2019149848A 2019-08-19 2019-08-19 情報処理装置及び情報処理プログラム Active JP7331551B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2019149848A JP7331551B2 (ja) 2019-08-19 2019-08-19 情報処理装置及び情報処理プログラム
US16/808,592 US20210056254A1 (en) 2019-08-19 2020-03-04 Information processing apparatus and non-transitory computer readable medium
CN202010161095.0A CN112396046A (zh) 2019-08-19 2020-03-10 信息处理装置及记录媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019149848A JP7331551B2 (ja) 2019-08-19 2019-08-19 情報処理装置及び情報処理プログラム

Publications (2)

Publication Number Publication Date
JP2021034778A JP2021034778A (ja) 2021-03-01
JP7331551B2 true JP7331551B2 (ja) 2023-08-23

Family

ID=74603802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019149848A Active JP7331551B2 (ja) 2019-08-19 2019-08-19 情報処理装置及び情報処理プログラム

Country Status (3)

Country Link
US (1) US20210056254A1 (ja)
JP (1) JP7331551B2 (ja)
CN (1) CN112396046A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11531646B2 (en) * 2020-06-30 2022-12-20 Microsoft Technology Licensing, Llc Facilitating generation and utilization of group folders

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008278307A (ja) 2007-05-01 2008-11-13 Canon Inc 画像読取システム及び原稿読取システムの制御方法
JP2009302944A (ja) 2008-06-13 2009-12-24 Konica Minolta Business Technologies Inc 画像処理装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6237011B1 (en) * 1997-10-08 2001-05-22 Caere Corporation Computer-based document management system
US6466336B1 (en) * 1999-08-30 2002-10-15 Compaq Computer Corporation Method and apparatus for organizing scanned images
JP2006209261A (ja) * 2005-01-25 2006-08-10 Canon Inc 受信帳票ジョブ表示方法及び装置、並びにプログラム
US7529408B2 (en) * 2005-02-23 2009-05-05 Ichannex Corporation System and method for electronically processing document images
CA2601154C (en) * 2007-07-07 2016-09-13 Mathieu Audet Method and system for distinguising elements of information along a plurality of axes on a basis of a commonality
US20110019224A1 (en) * 2009-07-27 2011-01-27 Xerox Corporation Method and system for re-ordering at least one image of a scanned multi-page document
JP5774558B2 (ja) * 2012-08-10 2015-09-09 株式会社東芝 手書き文書処理装置、方法及びプログラム
JP6232940B2 (ja) * 2013-11-01 2017-11-22 富士ゼロックス株式会社 画像情報処理装置及びプログラム
US11449218B2 (en) * 2015-07-17 2022-09-20 Thomson Reuters Enterprise Centre Gmbh Systems and methods for data evaluation and classification
JP7271149B2 (ja) * 2018-11-30 2023-05-11 キヤノン株式会社 装置、方法、及びプログラム

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008278307A (ja) 2007-05-01 2008-11-13 Canon Inc 画像読取システム及び原稿読取システムの制御方法
JP2009302944A (ja) 2008-06-13 2009-12-24 Konica Minolta Business Technologies Inc 画像処理装置

Also Published As

Publication number Publication date
CN112396046A (zh) 2021-02-23
US20210056254A1 (en) 2021-02-25
JP2021034778A (ja) 2021-03-01

Similar Documents

Publication Publication Date Title
US9886669B2 (en) Interactive visualization of machine-learning performance
US8468167B2 (en) Automatic data validation and correction
US11321559B2 (en) Document structure identification using post-processing error correction
US8838657B1 (en) Document fingerprints using block encoding of text
US11263219B2 (en) Error identification, indexing and linking construction documents
JP2012221148A (ja) 画像処理方法、及び、画像処理システム
US10803233B2 (en) Method and system of extracting structured data from a document
US8571262B2 (en) Methods of object search and recognition
JP7331551B2 (ja) 情報処理装置及び情報処理プログラム
Yang et al. A large-scale dataset for end-to-end table recognition in the wild
WO2020090356A1 (ja) インクデータ生成装置、方法及びプログラム
US20200311059A1 (en) Multi-layer word search option
US9437020B2 (en) System and method to check the correct rendering of a font
JP2020087112A (ja) 帳票処理装置および帳票処理方法
US20220179524A1 (en) Information processing apparatus and non-transitory computer readable medium
US9600480B2 (en) Systems and methods for indexing and linking electronic documents
US20210064815A1 (en) Information processing apparatus and non-transitory computer readable medium
CN108733637B (zh) 信息处理设备和信息处理方法
JP2021114225A (ja) ファイル検索システム、ファイル検索方法及びプログラム
WO2009021563A1 (en) A data processing method, computer program product and data processing system
JP2014044555A (ja) 画像処理装置、画像処理システム及びプログラム
JP2006031129A (ja) 文書処理手法及び文書処理装置
JP2013182459A (ja) 情報処理装置、情報処理方法及びプログラム
JP7268316B2 (ja) 情報処理装置及びプログラム
US11507536B2 (en) Information processing apparatus and non-transitory computer readable medium for selecting file to be displayed

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220721

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20230327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230724

R150 Certificate of patent or registration of utility model

Ref document number: 7331551

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150