JP7259468B2 - 情報処理装置及びプログラム - Google Patents

情報処理装置及びプログラム Download PDF

Info

Publication number
JP7259468B2
JP7259468B2 JP2019057422A JP2019057422A JP7259468B2 JP 7259468 B2 JP7259468 B2 JP 7259468B2 JP 2019057422 A JP2019057422 A JP 2019057422A JP 2019057422 A JP2019057422 A JP 2019057422A JP 7259468 B2 JP7259468 B2 JP 7259468B2
Authority
JP
Japan
Prior art keywords
image area
image
area
recognition result
item
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019057422A
Other languages
English (en)
Other versions
JP2020160629A (ja
Inventor
啓太 浅井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2019057422A priority Critical patent/JP7259468B2/ja
Priority to US16/543,665 priority patent/US11100318B2/en
Publication of JP2020160629A publication Critical patent/JP2020160629A/ja
Application granted granted Critical
Publication of JP7259468B2 publication Critical patent/JP7259468B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/412Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
    • G06F3/0483Interaction with page-structured environments, e.g. book metaphor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/07Target detection

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

本発明は、情報処理装置及びプログラムに関する。
例えば、特許文献1には、帳票の文字認識処理を行う際に用いられる帳票定義データを作成する帳票定義データ作成方法が記載されている。この帳票定義データ作成方法は、帳票のイメージデータを取得し、イメージデータから文字情報のレイアウト情報を抽出し、指定された定義領域に対応するレイアウト情報から定義領域の位置に関する第1の定義データを抽出する。また、この帳票定義データ作成方法は、定義領域の周辺あるいは内部に存在する文字情報を認識し、認識結果を定義領域の属性に関する第2の定義データに変換する。
また、特許文献2には、認識辞書と、帳票画像の認識処理を行う帳票認識部とを備えた帳票認識装置が記載されている。この帳票認識部は、帳票画像内から文字列を検出し、検出された文字列に対し、項目名もしくは項目値らしさを表す認識優先度を設定する認識優先度設定部と、認識優先度の高い順にまとめられた認識グループを設定する認識グループ設定部と、を有する。また、この帳票認識部は、認識グループごとに認識グループ内の文字列のペアから項目名-項目値関係を抽出する項目名-項目値関係抽出部と、項目名-項目値関係抽出部によって抽出された項目名-項目値関係により、帳票画像内から読み取り対象の項目名-項目値関係全てが抽出されたかを判定する項目名-項目値関係抽出終了判定部と、を有する。この項目名-項目値関係抽出部により、認識優先度の高い認識グループの文字列から順に項目名-項目値関係の抽出を行い、項目名-項目値関係抽出終了判定部により、項目名-項目値関係の抽出が終了したと判定されれば帳票認識処理を終了する。
特開2004-258706号公報 特開2012-208589号公報
ところで、文書に記入された文字を認識した結果を表示し、ユーザが文字の認識結果を確認する際、予め認識対象として定義された文書中の領域以外の領域に、重要な事項が記入されている場合に、文字の認識結果には、領域外の記入が表示されない。このため、ユーザがその記入に気付かずに見落としてしまう場合がある。
本発明は、文書に記入された文字の認識結果を表示する際に、認識結果において、予め認識対象として定義された領域に記入された事項のみを表示する場合と比較して、文字の認識結果を確認するユーザが、予め認識対象として定義された領域以外の領域に記入された事項を見落とすことを抑制することができる情報処理装置及びプログラムを提供することを目的とする。
上記目的を達成するために、第1態様に係る情報処理装置は、文書に記入された文字の認識結果を表示する確認画面に、予め認識対象として定義された定義領域以外である定義外領域から抽出された画像領域を表示する制御を行う表示制御部、を備えている。
また、第2態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記表示制御部が、前記画像領域の認識結果である第1文字列を前記文書の認識結果の項目に追加する処理である第1処理、前記定義領域の認識結果である第2文字列を前記第1文字列に変更する処理である第2処理、もしくは、前記画像領域を前記確認画面において非表示にする処理である第3処理のいずれかの処理を選択的に行う処理部を更に備えている。
また、第3態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記処理部が、前記第1文字列に追加を表す文字が含まれている場合に、前記第1処理を行う。
また、第4態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記処理部が、前記第1文字列に変更を表す文字が含まれている場合に、前記第2処理を行う。
また、第5態様に係る情報処理装置は、第2態様に係る情報処理装置において、前記処理部が、前記画像領域に特定の画像が含まれている場合に、前記第3処理を行う。
また、第6態様に係る情報処理装置は、第5態様に係る情報処理装置において、前記特定の画像が、予め定められた刻印を表す画像とされている。
また、第7態様に係る情報処理装置は、第2態様又は第3態様に係る情報処理装置において、前記定義領域が、複数の項目を含み、前記処理部が、前記第1処理を行う場合に、前記複数の項目のうち、前記画像領域に最も近い項目に追加する処理を行う。
また、第8態様に係る情報処理装置は、第2態様又は第3態様に係る情報処理装置において、前記定義領域が、複数の項目を含み、前記処理部が、前記第1処理を行う場合に、前記複数の項目のうち、前記画像領域から延びる線の終端に最も近い項目に追加する処理を行う。
また、第9態様に係る情報処理装置は、第2態様又は第4態様に係る情報処理装置において、前記定義領域が、複数の項目を含み、前記処理部が、前記第2処理を行う場合に、前記複数の項目のうち、前記画像領域に最も近い項目の文字列を変更する処理を行う。
また、第10態様に係る情報処理装置は、第2態様又は第4態様に係る情報処理装置において、前記定義領域が、複数の項目を含み、前記処理部は、前記第2処理を行う場合に、前記複数の項目のうち、前記画像領域から延びる線の終端に最も近い項目の文字列を変更する処理を行う。
また、第11態様に係る情報処理装置は、第1態様に係る情報処理装置において、前記表示制御部が、前記画像領域の認識結果である第1文字列と、前記第1文字列に付与された項目とを対応付けて、前記文書の認識結果に追加する処理を行う処理部を更に備えている。
また、第12態様に係る情報処理装置は、第11態様に係る情報処理装置において、前記第1文字列が、複数の文字列として認識され、前記処理部が、前記複数の文字列の各々と、前記複数の文字列の各々に付与された項目とを対応付けて、前記文書の認識結果に追加する処理を行う。
また、第13態様に係る情報処理装置は、第1態様~第12態様のいずれか1の態様に係る情報処理装置において、前記確認画面が、前記定義領域の認識結果である第2文字列を表示する第1画面と、前記定義外領域から抽出された画像領域を表示する第2画面とを切り替え可能に表示する。
また、第14態様に係る情報処理装置は、第13態様に係る情報処理装置において、前記表示制御部が、前記定義外領域から前記画像領域が抽出されている場合に、前記第2画面を前記第1画面より強調して表示する制御を行う。
更に、上記目的を達成するために、第15態様に係るプログラムは、コンピュータを、第1態様~第14態様のいずれか1の態様に係る情報処理装置が備える各部として機能させる。
第1態様及び第15態様によれば、文書に記入された文字の認識結果を表示する際に、認識結果において、予め認識対象として定義された領域に記入された事項のみを表示する場合と比較して、文字の認識結果を確認するユーザが、予め認識対象として定義された領域以外の領域に記入された事項を見落とすことを抑制することができる、という効果を有する。
第2態様によれば、画像領域の認識結果を追加する処理、画像領域の認識結果へ変更する処理、及び画像領域を非表示にする処理を選択的に行わない場合と比較して、ユーザに負担をかけることなく、文書の認識結果に対して画像領域の認識結果を反映させることができる、という効果を有する。
第3態様によれば、追加を表す文字を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域の認識結果を追加する処理を行うことができる、という効果を有する。
第4態様によれば、変更を表す文字を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域の認識結果へ変更する処理を行うことができる、という効果を有する。
第5態様によれば、特定の画像を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域を非表示にする処理を行うことができる、という効果を有する。
第6態様によれば、刻印を表す画像を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域を非表示にする処理を行うことができる、という効果を有する。
第7態様によれば、画像領域と項目との距離を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域の認識結果を追加する処理を行うことができる、という効果を有する。
第8態様によれば、画像領域から項目に延びる線を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域の認識結果を追加する処理を行うことができる、という効果を有する。
第9態様によれば、画像領域と項目との距離を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域の認識結果へ変更する処理を行うことができる、という効果を有する。
第10態様によれば、画像領域から項目に延びる線を考慮しない場合と比較して、ユーザに負担をかけることなく、画像領域の認識結果へ変更する処理を行うことができる、という効果を有する。
第11態様によれば、文書の認識結果に対して、画像領域の認識結果に項目を対応付けない場合と比較して、ユーザに負担をかけることなく、文書の認識結果に項目を追加することができる、という効果を有する。
第12態様によれば、画像領域の複数の認識結果に複数の項目を対応付けない場合と比較して、ユーザに負担をかけることなく、文書の認識結果に複数の項目を追加することができる、という効果を有する。
第13態様によれば、確認画面を第1画面と第2画面とで切り替えない場合と比較して、画像領域に記入された事項を見落とすことを抑制することができる、という効果を有する。
第14態様によれば、画像領域が抽出されたか否かに係わらず第1画面と第2画面とを同様に表示する場合と比較して、一見して画像領域が抽出されていることを把握することができる、という効果を有する。
実施形態に係る情報処理システムの構成の一例を示す図である。 実施形態に係るサーバ装置の電気的な構成の一例を示すブロック図である。 実施形態に係るサーバ装置の機能的な構成の一例を示すブロック図である。 実施形態に係る帳票画像の一例を示す図である。 実施形態に確認画面の一例を示す正面図である。 実施形態に係るによる認識処理プログラムによる処理の流れの一例を示すフローチャートである。 実施形態に係る第2処理を行う場合のルール編集画面の一例を示す正面図である。 実施形態に係る文字列の置き換え処理の説明に供する図である。 実施形態に係る第1処理を行う場合のルール編集画面の一例を示す正面図である。 実施形態に係る第3処理を行う場合のルール編集画面の一例を示す正面図である。 実施形態に係る項目追加画面の一例を示す正面図である。 実施形態に係る認識結果編集画面の一例を示す正面図である。 実施形態に係る反映後認識結果の一例を示す図である。
以下、図面を参照して、本発明を実施するための形態の一例について詳細に説明する。
図1は、本実施形態に係る情報処理システム90の構成の一例を示す図である。
図1に示すように、本実施形態に係る情報処理システム90は、サーバ装置10と、端末装置40A、40B、・・・と、画像読取装置50と、を備えている。なお、サーバ装置10は、情報処理装置の一例である。
サーバ装置10は、ネットワークNを介して、端末装置40A、40B、・・・、及び画像読取装置50の各々と通信可能に接続されている。このサーバ装置10には、一例として、サーバコンピュータや、パーソナルコンピュータ(PC:Personal Computer)等の汎用的なコンピュータが適用される。また、このネットワークNには、一例として、インターネットや、LAN(Local Area Network)、WAN(Wide Area Network)等が適用される。
画像読取装置50は、紙媒体の帳票等を光学的に読み取って画像を取得し、取得した画像(以下、「帳票画像」という。)をサーバ装置10に送信する機能を備えている。なお、ここでいう帳票としては、例えば、製造指示書等の複数の項目を含む各種の帳票が用いられる。この帳票には、これら複数の項目の各々について手書き文字や、印刷文字等が記入されている。サーバ装置10は、具体的には後述するように、画像読取装置50から受信した帳票画像に対して、光学的文字認識処理の一例であるOCR(Optical Character Recognition)処理を行い、複数の項目の各々に対応する画像についてのテキストデータ(以下、「文字列」ともいう。)を取得する。なお、この文字列とは、1文字以上の文字の連なりを意味し、1文字であっても文字列と称する。帳票では、項目に対応する記載が記入されうる領域が枠等で定められており、記載が記入されうる領域を認識対象の領域として定義されている。定義された領域を対象にOCR処理を行い、複数の項目の各々に対応する画像についての文字列を取得する。
端末装置40Aは、確認作業を行う確認者(ユーザ)U1が操作する端末装置であり、端末装置40Bは、確認作業を行う確認者U2が操作する端末装置である。これら複数の端末装置40A、40B、・・・を区別して説明する必要がない場合には、端末装置40A、40B、・・・を総称して端末装置40ともいう。また、これら複数の確認者U1、U2、・・・を区別して説明する必要がない場合には、確認者U1、U2、・・・を総称して確認者Uともいう。この端末装置40には、一例として、パーソナルコンピュータ(PC)等の汎用的なコンピュータや、スマートフォン、タブレット端末等の携帯可能な端末装置等が適用される。なお、端末装置40には、確認者Uが確認作業を行うための確認作業アプリケーション・プログラム(以下、「確認作業アプリ」ともいう。)がインストールされており、確認作業用のUI(User Interface)画面を生成して表示する。
サーバ装置10は、帳票画像に含まれる各項目の画像(以下、「項目画像」という。)とOCR処理により得られた文字列とを対応付けて、端末装置40のUI画面に表示させる制御を行う。確認者Uは、当該項目画像を見ながら、当該項目画像に対応する文字列が正しいか否かを確認する。確認者Uは、確認の結果、正しい場合はそのまま、正しくない場合は正しい文字列をUI画面に入力する。端末装置40は、UI画面を介して入力を受け付けた文字列を確認結果としてサーバ装置10に送信する。サーバ装置10は、端末装置40からの確認結果に基づいて、最終的な認識結果を出力し、端末装置40のUI画面に表示させる制御を行う。
図2は、本実施形態に係るサーバ装置10の電気的な構成の一例を示すブロック図である。
図2に示すように、本実施形態に係るサーバ装置10は、制御部12と、記憶部14と、表示部16と、操作部18と、通信部20と、を備えている。
制御部12は、CPU(Central Processing Unit)12A、ROM(Read Only Memory)12B、RAM(Random Access Memory)12C、及び入出力インターフェース(I/O)12Dを備えており、これら各部がバスを介して各々接続されている。
I/O12Dには、記憶部14と、表示部16と、操作部18と、通信部20と、を含む各機能部が接続されている。これらの各機能部は、I/O12Dを介して、CPU12Aと相互に通信可能とされる。
制御部12は、サーバ装置10の一部の動作を制御するサブ制御部として構成されてもよいし、サーバ装置10の全体の動作を制御するメイン制御部の一部として構成されてもよい。制御部12の各ブロックの一部又は全部には、例えば、LSI(Large Scale Integration)等の集積回路又はIC(Integrated Circuit)チップセットが用いられる。上記各ブロックに個別の回路を用いてもよいし、一部又は全部を集積した回路を用いてもよい。上記各ブロック同士が一体として設けられてもよいし、一部のブロックが別に設けられてもよい。また、上記各ブロックのそれぞれにおいて、その一部が別に設けられてもよい。制御部12の集積化には、LSIに限らず、専用回路又は汎用プロセッサを用いてもよい。
記憶部14としては、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等が用いられる。記憶部14には、本実施形態に係る定義外領域の認識処理を行うための認識処理プログラム14Aが記憶される。なお、この認識処理プログラム14Aは、ROM12Bに記憶されていてもよい。
認識処理プログラム14Aは、例えば、サーバ装置10に予めインストールされていてもよい。認識処理プログラム14Aは、不揮発性の記憶媒体に記憶して、又はネットワークNを介して配布して、サーバ装置10に適宜インストールすることで実現してもよい。なお、不揮発性の記憶媒体の例としては、CD-ROM(Compact Disc Read Only Memory)、光磁気ディスク、HDD、DVD-ROM(Digital Versatile Disc Read Only Memory)、フラッシュメモリ、メモリカード等が想定される。
表示部16には、例えば、液晶ディスプレイ(LCD:Liquid Crystal Display)や有機EL(Electro Luminescence)ディスプレイ等が用いられる。表示部16は、タッチパネルを一体的に有していてもよい。操作部18には、例えば、キーボードやマウス等の操作入力用のデバイスが設けられている。表示部16及び操作部18は、サーバ装置10のユーザから各種の指示を受け付ける。表示部16は、ユーザから受け付けた指示に応じて実行された処理の結果や、処理に対する通知等の各種の情報を表示する。
通信部20は、インターネットや、LAN、WAN等のネットワークNに接続されており、画像読取装置50や端末装置40との間でネットワークNを介して通信が可能とされる。
ところで、上述したように、帳票等の文書に記入された文字を認識した結果を表示し、ユーザが文字の認識結果を確認する際、予め認識対象として定義された文書中の領域以外の領域に、重要な事項が記入されている場合がある。しかしながら、文字の認識結果には、領域外の記入が表示されないため、ユーザがその記入に気付かずに見落としてしまう場合がある。
このため、本実施形態に係るサーバ装置10のCPU12Aは、記憶部14に記憶されている認識処理プログラム14AをRAM12Cに書き込んで実行することにより、図3に示す各部として機能する。
図3は、本実施形態に係るサーバ装置10の機能的な構成の一例を示すブロック図である。
図3に示すように、本実施形態に係るサーバ装置10のCPU12Aは、認識処理部30、画像領域抽出部32、表示制御部34、及び認識結果出力部36として機能する。なお、本実施形態では、文書の一例として、製造指示書等の帳票を適用した場合について説明する。
本実施形態に係る記憶部14には、帳票定義データを記憶する帳票定義データ記憶部14Bと、後述する指示ルールを記憶する指示ルール記憶部14Cと、が設けられている。
本実施形態に係る認識処理部30は、帳票定義データ記憶部14Bに記憶されている帳票定義データに基づいて、一例として、後述の図4に示す帳票画像から、定義領域に含まれる画像の認識結果としての文字列を取得する。この帳票画像は、記入済み帳票の一例であり、予め認識対象として定義された定義領域を含んでいる。また、この定義領域は、複数の既存項目を含んでいる。
本実施形態に係る画像領域抽出部32は、上記帳票画像において予め認識対象として定義された領域以外の領域である定義外領域から、画像領域を抽出する。ここでいう画像領域とは、定義外領域において不特定の画像(例えば、手書き文字や刻印等。)を含む領域のことを意味する。この画像領域は、一例として、画像を囲む矩形領域として表される。
本実施形態に係る表示制御部34は、一例として、後述の図5に示す確認画面に、定義外領域から抽出された画像領域を表示する制御を行う。この確認画面は、帳票に記入された文字の認識結果を表示する画面である。すなわち、この確認画面は、認識処理部30により認識結果として取得された文字列及び画像領域抽出部32により抽出された画像領域を表示する画面である。
また、表示制御部34は、処理部34Aを含む。処理部34Aは、一例として、画像領域の認識結果である第1文字列を記入済み帳票の認識結果の項目に追加する処理である第1処理、定義領域の認識結果である第2文字列を第1文字列に変更する処理である第2処理、もしくは、画像領域を確認画面において非表示にする処理である第3処理のいずれかの処理を選択的に行う。これら第1処理、第2処理、及び第3処理の具体例については後述する。
また、処理部34Aは、画像領域の認識結果である第1文字列と、第1文字列に付与された項目とを対応付けて、帳票画像の認識結果に追加する処理を行う。なお、第1文字列が複数の文字列として認識される場合、処理部34Aは、複数の文字列の各々と、複数の文字列の各々に付与された項目とを対応付けて、帳票画像の認識結果に追加する処理(以下、「項目追加処理」という。)を行う。この項目追加処理の具体例については後述する。
本実施形態に係る認識結果出力部36は、上記確認画面での確認結果に基づいて、最終的な認識結果を出力する。なお、最終的な認識結果の出力先は、特に限定されるものではないが、一例として、表示部16、記憶部14、及び端末装置40の少なくとも1つを出力先とする。
図4は、本実施形態に係る帳票画像60の一例を示す図である。
図4に示す帳票画像60には、複数の定義領域60A~60Cと、複数の画像領域62A~62Dと、が含まれている。なお、この帳票画像60には、一例として、製造指示書を適用しているが、これに限定されるものではなく、帳票全般が適用される。
複数の定義領域60A~60Cの各々は、予め認識対象として定義された領域であり、その定義内容は帳票定義データとして帳票定義データ記憶部14Bに記憶されている。具体的に、定義領域60Aは、複数の既存項目として、推進/開発部門の担当者及び責任者の捺印、管理部門の担当者及び責任者の捺印、及び製造部門の担当者及び責任者の捺印が定義されている。また、定義領域60Bは、複数の既存項目として、商品名、推進/開発部門担当者名、管理部門担当者名、サンプル送付先住所、サンプル送付先部門、及び製造担当者が定義されている。また、定義領域60Cは、複数の既存項目として、管理番号、種類、個数、製造開始日、製造完了日、出荷開始日/切替日、及び備考が定義されている。
複数の画像領域62A~62Dの各々は、定義外領域に存在する画像を含む領域であり、図4の例では矩形領域として表される。画像領域62Aは、特定の画像の一例であるスタンプ画像として「秘」を含む領域である。また、画像領域62Bは、手書きコメントとして「9/6確認済」を含む領域である。また、画像領域62Cは、手書きコメントとして「HAKO102Xに変更 サイズ小さい」を含む領域である。また、画像領域62Dは、手書きコメントとして「付属品 ABCD004A」を含む領域である。
図5は、本実施形態に確認画面64の一例を示す正面図である。
図5に示す確認画面64は、端末装置40に表示される画面である。この確認画面64は、左側に帳票画像60が表示され、右側に認識結果確認画面64Aと定義外画像領域画面64Bとが切り替え可能に表示される。
認識結果確認画面64Aは、定義領域の認識結果である第2文字列を表示する第1画面の一例である。また、定義外画像領域画面64Bは、定義外領域から抽出された画像領域を表示する第2画面の一例である。図5の例では、認識結果確認画面64Aと定義外画像領域画面64Bとをタブにより切り替えて表示する場合について示している。なお、画面の切り替えは、タブに限定されるものではなく、矢印キー等で切り替えてもよい。
図5の例では、定義外画像領域画面64Bのタブが選択され、定義外画像領域画面64Bが表示されている。なお、定義外領域から画像領域が抽出されている場合には、定義外画像領域画面64Bが認識結果確認画面64Aより強調して表示される。このため、ユーザが一見するだけで定義外領域から画像領域が抽出されていることが把握される。この強調表示の制御は、表示制御部34により実行される。強調表示の一例として、図5に示すように、定義外画像領域画面64Bのタブに感嘆符マーク(エクスクラメーションマークともいう。)64Cが付与されている。但し、強調表示の例は、この感嘆符マーク64Cに限定されるものではなく、例えば、タブの背景色を赤色や黄色等の比較的目立つ色に変更する、タブの文字列(図5の例では「定義外画像領域」。)に下線を付与する、タブの文字列を太字にする、タブの文字列を斜体にする、タブの文字列にマーカを付与する、などの各種の方法を適用してもよい。
定義外画像領域画面64Bには、帳票画像60の定義外領域から抽出された複数の画像領域62A~62Dの一覧がスクロール可能に表示されている。図5の例では、画像領域62Bに対して設定項目群R1が設けられ、画像領域62Cに対して設定項目群R2が設けられている。設定項目群R2の内容は設定項目群R1の内容と同様である。また、画像領域62A及び画像領域62Dの各々についても設定項目群R1と同様の設定項目群が設けられている。なお、以下の説明において、これら複数の設定項目群R1、R2、・・・を区別して説明する必要がない場合には、設定項目群R1、R2、・・・を総称して設定項目群Rともいう。
設定項目群Rには、項目追加、ルール編集、認識結果編集、及びクリアが選択可能に設けられている。項目追加は、一例として、後述の図11に示すように、画像領域の手書きコメントの内容を踏まえて、画像領域に応じた新たな項目を設定し、新たな項目毎に対応する値の入力を行う項目である。また、ルール編集は、一例として、後述の図7~図10に示すように、画像領域の手書きコメントの内容を踏まえて、画像領域に応じた指示ルールを設定し、指示ルールに従って定義領域の既存項目に対して編集を行う項目である。また、認識結果編集は、一例として、後述の図12に示すように、画像領域の手書きコメントの内容を踏まえて、定義領域の既存項目に対して編集を行う項目である。また、クリアは、画像領域の手書きコメントが不要であれば、定義外画像領域の一覧から削除する項目である。
次に、図6を参照して、本実施形態に係るサーバ装置10の作用を説明する。
図6は、本実施形態に係るによる認識処理プログラム14Aによる処理の流れの一例を示すフローチャートである。
まず、サーバ装置10に対して、定義外領域の認識処理の開始が指示されると、認識処理プログラム14Aが起動され、以下の各ステップを実行する。
図6のステップ100では、認識処理部30が、記入済み帳票の一例として、上述の図4に示す帳票画像60の入力を受け付ける。
ステップ102では、認識処理部30が、帳票定義データ記憶部14Bに記憶されている帳票定義データに基づいて、帳票画像60から得られる複数の定義領域60A~60Cの各々の画像に対してOCR処理を行う。これにより、複数の定義領域60A~60Cの各々の画像についての認識結果を得る。
ステップ104では、画像領域抽出部32が、帳票画像60の定義外領域から、複数の画像領域62A~62Dを抽出する。
ステップ106では、表示制御部34が、一例として、上述の図5に示す確認画面64を端末装置40に表示する制御を行う。
ステップ108では、表示制御部34が、確認画面64から、第2画面の一例である定義外画像領域画面64Bが選択されたか否かを判定する。定義外画像領域画面64Bが選択されていない、つまり、第1画面の一例である認識結果確認画面64Aが選択されたと判定した場合(否定判定の場合)、ステップ110に移行する。一方、定義外画像領域画面64Bが選択されたと判定した場合(肯定判定の場合)、ステップ112に移行する。
ステップ110では、処理部34Aが、認識結果確認画面64Aから、複数の定義領域60A~60Cの各々の既存項目の画像についての認識結果の訂正を受け付け、受け付けた訂正の内容を認識結果に反映する処理を行う。
一方、ステップ112では、処理部34Aが、定義外画像領域画面64Bに含まれる複数の画像領域62A~62Dのうち確認対象とされた画像領域について、「ルール編集」が選択されたか否かを判定する。「ルール編集」が選択されたと判定した場合(肯定判定の場合)、ステップ114に移行し、「ルール編集」が選択されていないと判定した場合(否定判定の場合)、ステップ118に移行する。
ステップ114では、処理部34Aが、一例として、図7、図9、図10に示すルール編集画面を端末装置40に表示する制御を行い、指示ルールの設定を受け付ける。
図7は、本実施形態に係る第2処理を行う場合のルール編集画面66の一例を示す正面図である。
図7に示すルール編集画面66には、ルール名入力欄66A、条件指定部66B、実行処理指定部66C、及び画像全体表示ボタン66Dが表示される。
ルール編集画面66では、画像全体表示ボタン66Dが選択操作されると、帳票画像60が別ウィンドウで開いて表示される。ユーザは帳票画像60を確認しながら、ルール編集画面66から設定操作を行うことが可能とされる。
ルール編集画面66は、手書きコメントとして「HAKO102Xに変更 サイズ小さい」を含む画像領域62Cに対して、第2処理に関する指示ルールを設定するための画面である。
ルール名入力欄66Aは、画像領域62Cに設定するルール名を入力する欄であり、図7の例では、「変更指示」と入力される。また、条件指定部66Bでは、複数の条件C1、C2のうち、条件C1のチェックボックスがチェックされている。条件C1には、「定義外文字に”変更”が含まれる場合」という条件文が含まれる。なお、この条件文における定義外文字とは、画像領域62Cの認識結果としての第1文字列に対応している。また、この条件文において下線が付与された文字列(図7の例では”変更”。)をクリックすると、文字列候補一覧の別ウィンドウ(図示省略)が開き、別の文字列(図7の例では”追加”。)に変更可能とされている。
また、実行処理指定部66Cでは、複数の処理P1~P6のうち、処理P3のチェックボックスがチェックされている。なお、第2処理の場合、処理P2又は処理P4を指定してもよい。
処理P3には、「最近傍の項目を[変更対象文字]に置き換える」という処理内容が含まれる。なお、[ ]内の変更対象文字には、ユーザにより適切な値が指定可能とされている。図7の例では、「HAKO102X」が指定される。また、処理P2には、「[項目名]を[変更対象文字]に置き換える」という処理内容が含まれる。この処理P2は、予めどの項目の値を変更するか決まっている場合に指定される。なお、図7の例では、[ ]内の項目名として「HAKO101X」が指定され、[ ]内の変更対象文字として「HAKO102X」が指定される。また、処理P4には、「指示線の先の項目を[変更対象文字]に置き換える」という処理内容が含まれる。なお、[ ]内の変更対象文字には、処理P3と同様に、例えば、「HAKO102X」が指定される。
処理P3、P4において、[ ]内の変更対象文字には、固定文字だけでなく、例えば、正規表現等を用いて、画像領域62Cの「HAKO102Xに変更 サイズ小さい」から、「HAKO102X」だけを抽出してもよい。
図8は、本実施形態に係る文字列の置き換え処理の説明に供する図である。
図8に示すように、画像領域62Cの最近傍には、項目Kの文字列である「HAKO101X」が位置している。
ここで、第2処理は、上述したように、定義領域の認識結果である第2文字列(図8の例では「HAKO101X」。)を、画像領域62Cの認識結果である第1文字列(図8の例では「HAKO102X」。)に変更する処理である。具体的に、条件1、かつ、処理P3が指定された場合、つまり、第1文字列に変更を表す文字が含まれている場合、画像領域62Cに最も近い項目Kの第2文字列を、第1文字列に変更するように設定される。また、条件1、かつ、処理P4が指定された場合、つまり、第1文字列に変更を表す文字が含まれている場合、画像領域62Cから延びる指示線Lの終端に最も近い項目Kの第2文字列を、第1文字列に変更するように設定される。
なお、画像領域62Cと、定義領域中の各既存項目との位置関係は、一例として、座標を用いて導出される。例えば、画像領域62Cの中心座標と、各既存項目の中心座標との間の距離を求めることにより、画像領域62Cと各既存項目との位置関係が導出される。
上述の図7に示すルール編集画面66において、「保存」ボタンが選択操作されると、設定内容が指示ルール記憶部14Cに保存され、「キャンセル」ボタンが選択操作されると、設定内容はキャンセルされる。
図9は、本実施形態に係る第1処理を行う場合のルール編集画面68の一例を示す正面図である。
図9に示すルール編集画面68には、ルール名入力欄68A、条件指定部68B、実行処理指定部68C、及び画像全体表示ボタン68Dが表示される。
ルール編集画面68では、図7の例と同様に、画像全体表示ボタン68Dが選択操作されると、帳票画像60が別ウィンドウで開いて表示される。ユーザは帳票画像60を確認しながら、ルール編集画面68から設定操作を行うことが可能とされる。
ルール編集画面68は、手書きコメントとして「付属品 ABCD004追加」を含む画像領域62Dに対して、第1処理に関する指示ルールを設定するための画面である。
ルール名入力欄68Aは、画像領域62Dに設定するルール名を入力する欄であり、図9の例では、「追加指示」と入力される。また、条件指定部68Bでは、複数の条件C1、C2のうち、条件C1のチェックボックスがチェックされている。条件C1には、「定義外文字に”追加”が含まれる場合」という条件文が含まれる。なお、この条件文における定義外文字とは、画像領域62Dの認識結果としての第1文字列に対応している。また、この条件文において下線が付与された文字列(図9の例では”追加”。)をクリックすると、文字列候補一覧の別ウィンドウ(図示省略)が開き、別の文字列(図9の例では”変更”。)に変更可能とされている。
また、実行処理指定部68Cでは、複数の処理P1~P6のうち、処理P5のチェックボックスがチェックされている。なお、第1処理の場合、処理P6を指定してもよい。
処理P5には、「最近傍の項目に[追加対象文字]を追加する」という処理内容が含まれる。なお、[ ]内の追加対象文字には、ユーザにより適切な値が指定可能とされている。図9の例では、「ABCD004A」が指定される。また、処理P6には、「指示線の先の項目に[追加対象文字]を追加する」という処理内容が含まれる。なお、[ ]内の追加対象文字には、処理P5と同様に、例えば、「ABCD004A」が指定される。ここで、図示は省略するが、処理P7として、「[項目名]に[追加対象文字]を追加する」という処理内容を含んでもよい。この処理P7は、予めどの項目に追加するか決まっている場合に指定される。なお、図9の例では、[ ]内の項目名として「管理番号」が指定され、[ ]内の追加対象文字として「ABCD004A」が指定される。
処理P5、P6において、[ ]内の追加対象文字には、固定文字だけでなく、例えば、正規表現等を用いて、画像領域62Dの「付属品 ABCD004A追加」から、「ABCD004A」だけを抽出してもよい。
ここで、第1処理は、上述したように、画像領域62Dの認識結果である第1文字列(図9の例では「ABCD004A」。)を、定義領域の認識結果の項目(図9の例では「管理番号」。)に追加する処理である。具体的に、条件1、かつ、処理P5が指定された場合、つまり、第1文字列に追加を表す文字が含まれている場合、第1文字列を、画像領域62Dに最も近い項目に追加するように設定される。また、条件1、かつ、処理P6が指定された場合、つまり、第1文字列に追加を表す文字が含まれている場合、第1文字列を、画像領域62Dから延びる指示線Lの終端に最も近い項目に追加するように設定される。
なお、画像領域62Dと、定義領域中の各既存項目との位置関係は、上述したように、座標を用いて導出される。例えば、画像領域62Dの中心座標と、各既存項目の中心座標との間の距離を求めることにより、画像領域62Dと各既存項目との位置関係が導出される。
図9に示すルール編集画面68において、「保存」ボタンが選択操作されると、設定内容が指示ルール記憶部14Cに保存され、「キャンセル」ボタンが選択操作されると、設定内容はキャンセルされる。
図10は、本実施形態に係る第3処理を行う場合のルール編集画面70の一例を示す正面図である。
図10に示すルール編集画面70には、ルール名入力欄70A、条件指定部70B、実行処理指定部70C、及び画像全体表示ボタン70Dが表示される。
ルール編集画面70では、図7の例と同様に、画像全体表示ボタン70Dが選択操作されると、帳票画像60が別ウィンドウで開いて表示される。ユーザは帳票画像60を確認しながら、ルール編集画面70から設定操作を行うことが可能とされる。
ルール編集画面70は、スタンプ画像として「秘」を含む画像領域62Aに対して、第3処理に関する指示ルールを設定するための画面である。
ルール名入力欄70Aは、画像領域62Aに設定するルール名を入力する欄であり、図10の例では、「画像を削除」と入力される。また、条件指定部70Bでは、複数の条件C1、C2のうち、条件C2のチェックボックスがチェックされている。条件C2には、「[画像]が含まれる場合」という条件文が含まれる。なお、この条件文における画像とは、画像領域62Aの認識結果に対応している。また、この条件文の[画像]には、特定の画像が予め対応付けられており、図10の例では、スタンプ画像の一例である「秘」及び「検」が対応付けられている。この特定の画像は、これらのスタンプ画像に限定されるものではなく、予め定められた刻印を表す画像であればよい。この刻印としては、例えば、日付印や、その他の部門の確認印、更には、重要、回覧等の各種スタンプ類、等が挙げられる。
また、実行処理指定部70Cでは、複数の処理P1~P6のうち、処理P1のチェックボックスがチェックされている。
処理P1には、「定義外画像領域一覧から削除する」という処理内容が含まれる。なお、ここでいう定義外画像領域一覧とは、定義外画像領域画面64B(図5参照)に表示される一覧のことを意味する。
ここで、第3処理は、上述したように、画像領域62Aを確認画面64(図5参照)において非表示にする(確認画面64から削除する)処理である。具体的に、条件2、かつ、処理P1が指定された場合、つまり、画像領域62Aに特定の画像が含まれている場合に、画像領域62Aが定義外画像領域画面64Bに表示される一覧から自動的に削除されるように設定される。
図10に示すルール編集画面70において、「保存」ボタンが選択操作されると、設定内容が指示ルール記憶部14Cに保存され、「キャンセル」ボタンが選択操作されると、設定内容はキャンセルされる。
図6に戻り、ステップ116では、処理部34Aが、定義外画像領域画面64Bに含まれる複数の画像領域62A~62Dの全てについて確認処理が終了したか否かを判定する。複数の画像領域62A~62Dの全てについて確認処理が終了したと判定した場合(肯定判定の場合)、ステップ130に移行し、複数の画像領域62A~62Dの全てについて確認処理が終了していないと判定した場合(否定判定の場合)、ステップ112に戻り処理を繰り返す。
一方、ステップ118では、処理部34Aが、ステップ112で確認対象とされた画像領域について、「項目追加」が選択されたか否かを判定する。「項目追加」が選択されたと判定した場合(肯定判定の場合)、ステップ120に移行し、「項目追加」が選択されていないと判定した場合(否定判定の場合)、ステップ124に移行する。
ステップ120では、処理部34Aが、一例として、図11に示す項目追加画面を端末装置40に表示する制御を行い、項目追加の設定を受け付ける。
図11は、本実施形態に係る項目追加画面72の一例を示す正面図である。
図11に示す項目追加画面72には、第1項目追加部72A、第2項目追加部72B、項目追加ボタン72C、及び帳票定義反映部72Dが表示される。
項目追加画面72は、手書きコメントとして「HAKO102Xに変更 サイズ小さい」を含む画像領域62Cに対して、上述の項目追加処理に関する設定を行うための画面である。
画像領域62Cの内容を複数の項目に分けたい場合、項目追加ボタン72Cを選択操作すると、図11に示すように、複数の項目が設定可能な状態で表示される。図11に示す例では、「HAKO102Xに変更」と、「サイズ小さい」とが別々の追加項目として設定されている。なお、項目追加ボタン72Cが選択操作されない場合、画像領域62Cの内容は1つの追加項目として設定される。
第1項目追加部72Aには、項目名入力欄A1、値入力欄A2、OCRボタンA3、機械学習モジュール設定欄A4、及びマスク設定ボタンA5が含まれる。項目名入力欄A1には、追加する項目の項目名が入力される。図11の例では、「変更要求」が入力される。また、機械学習モジュール設定欄A4には、OCRに使用する機械学習モデルのタイプが設定される。図11の例では、「手書き日本語」が設定される。また、認識対象として、例えば、ひらがな、漢字、英大文字、及び数字が設定される。また、マスク設定ボタンA5は、OCRを行わない領域にマスクをし、OCRを行う領域を設定するボタンである。
一方、第2項目追加部72Bには、項目名入力欄B1、値入力欄B2、OCRボタンB3、機械学習モジュール設定欄B4、及びマスク設定ボタンB5が含まれる。項目名入力欄B1には、追加する項目の項目名が入力される。図11の例では、「コメント」が入力される。また、機械学習モジュール設定欄B4には、OCRに使用する機械学習モデルのタイプが設定される。図11の例では、「手書き日本語」が設定される。また、認識対象として、例えば、ひらがな、カタカナ、及び漢字が設定される。また、マスク設定ボタンB5は、OCRを行わない領域にマスクをし、OCRを行う領域を設定するボタンである。
ステップ122では、処理部34Aが、認識処理部30に対して、追加項目の再認識処理の実行を指示し、ステップ116に移行する。具体的に、図11の例では、OCRボタンA3が選択操作されると、機械学習モジュール設定欄A4及びマスク設定ボタンA5の各々の設定内容に従って、画像領域62Cに対してOCRを実行する。値入力欄A2には、OCRボタンA3の選択操作により実行されたOCRの結果が入力される。図11の例では、「HAKO102Xに変更」が入力される。なお、値入力欄A2には、手動での入力も可能とされる。同様に、OCRボタンB3が選択操作されると、機械学習モジュール設定欄B4及びマスク設定ボタンB5の各々の設定内容に従って、画像領域62Cに対してOCRを実行する。値入力欄B2には、OCRボタンB3の選択操作により実行されたOCRの結果が入力される。図11の例では、「サイズ小さい」が入力される。なお、値入力欄B2には、手動での入力も可能とされる。
なお、帳票定義反映部72Dのチェックボックスがチェックされると、設定内容が帳票定義に反映され、毎回必ず追加項目に対してOCRが実行される。
図11に示す項目追加画面72において、「保存」ボタンが選択操作されると、設定内容が記憶部14に保存され、「キャンセル」ボタンが選択操作されると、設定内容はキャンセルされる。
一方、ステップ124では、処理部34Aが、ステップ112で確認対象とされた画像領域について、「認識結果編集」が選択されたか否かを判定する。「認識結果編集」が選択されたと判定した場合(肯定判定の場合)、ステップ126に移行し、「認識結果編集」が選択されていないと判定した場合(否定判定の場合)、ステップ128に移行する。
ステップ126では、処理部34Aが、一例として、図12に示す認識結果編集画面を端末装置40に表示する制御を行い、認識結果の編集を受け付け、ステップ116に移行する。
図12は、本実施形態に係る認識結果編集画面74の一例を示す正面図である。
図12に示す認識結果編集画面74は、左側に帳票画像60が表示され、右側に認識結果編集部74Rが表示される。
認識結果編集部74Rには、一例として、画像領域62Cが表示されると共に、複数の認識結果74A~74Cがスクロール可能に表示される。これら複数の認識結果74A~74Cは、複数の定義領域60A~60Cの各々から得られる認識結果の一部である。
ユーザは、画像領域62Cの内容を確認し、画像領域62Cの内容に応じて、認識結果の編集を行う。図12の例では、認識結果74Aの「HAKO101X」が「HAKO102X」に編集される。
図12に示す認識結果編集画面74において、「保存」ボタンが選択操作されると、編集内容が記憶部14に保存され、「キャンセル」ボタンが選択操作されると、編集内容はキャンセルされる。
一方、ステップ128では、処理部34Aが、ステップ112で確認対象とされた画像領域について、「クリア」が選択されたと判定する。この場合、当該画像領域を定義外画像領域画面64Bの一覧から削除し、ステップ116に移行する。
ステップ130では、処理部34Aが、定義外画像領域画面64Bに含まれる複数の画像領域62A~62Dの各々に対して、指示ルールが設定されているか否かを判定する。指示ルールが設定されていると判定した場合(肯定判定の場合)、ステップ132に移行し、指示ルールが設定されていないと判定した場合(否定判定の場合)、ステップ134に移行する。
ステップ132では、処理部34Aが、認識処理部30に対して、ステップ114で設定された指示ルールに従って、画像領域の再認識処理の実行を指示し、この再認識結果に応じて、定義領域に含まれる既存項目の認識結果を編集する。例えば、第1処理を行う場合、複数の既存項目のうち、画像領域に最も近い項目に追加する処理を行う、あるいは、画像領域から延びる線の終端に最も近い項目に追加する処理を行う。また、第2処理を行う場合、複数の既存項目のうち、画像領域に最も近い項目の文字列を変更する処理を行う、あるいは、画像領域から延びる線の終端に最も近い項目の文字列を変更する処理を行う。また、第3処理を行う場合、画像領域を定義外画像領域画面64Bの一覧から削除する。
ステップ134では、認識結果出力部36が、定義領域の認識結果に対して、定義外領域から抽出された画像領域の再認識結果を反映して得られた反映後認識結果を出力し、本認識処理プログラム14Aによる一連の処理を終了する。この反映後認識結果の一例を図13に示す。
図13は、本実施形態に係る反映後認識結果76の一例を示す図である。
図13に示す反映後認識結果76は、複数の認識結果76A~76Dを含んでいる。
認識結果76Aは、図4に示す定義領域60Aに対応する認識結果であり、認識結果76Bは、図4に示す定義領域60Bに対応する認識結果であり、認識結果76Cは、図4に示す定義領域60Cに対応する認識結果である。認識結果76Dは、上述の項目追加処理により追加された認識結果である。この認識結果76Dは、図4に示す画像領域62Cに対応する認識結果である。
また、認識文字列N1は、上述の第2処理により既存項目の「HAKO101X」から変更された認識結果である。この認識文字列N1は、画像領域62Cを認識して得られた「HAKO102X」を表している。また、認識文字列N2は、上述の第1処理により既存項目の「管理番号」に追加された認識結果である。この認識文字列N2は、図4に示す画像領域62Dを認識して得られた「ABCD004A」を表している。
このように本実施形態によれば、記入済み帳票の認識結果を表示する際に、予め認識対象とされた定義領域に記入された事項に加え、定義領域以外の定義外領域から抽出された事項が表示される。このため、記入済み帳票の認識結果を確認するユーザが、定義外領域に記入された事項を見落とすことが抑制される。
以上、実施形態に係る情報処理装置の一例としてサーバ装置を例示して説明した。実施形態は、サーバ装置が備える各部の機能をコンピュータに実行させるためのプログラムの形態としてもよい。実施形態は、これらのプログラムを記憶したコンピュータが読み取り可能な記憶媒体の形態としてもよい。
その他、上記実施形態で説明したサーバ装置の構成は、一例であり、主旨を逸脱しない範囲内において状況に応じて変更してもよい。
また、上記実施形態で説明したプログラムの処理の流れも、一例であり、主旨を逸脱しない範囲内において不要なステップを削除したり、新たなステップを追加したり、処理順序を入れ替えたりしてもよい。
また、上記実施形態では、プログラムを実行することにより、実施形態に係る処理がコンピュータを利用してソフトウェア構成により実現される場合について説明したが、これに限らない。実施形態は、例えば、ハードウェア構成や、ハードウェア構成とソフトウェア構成との組み合わせによって実現してもよい。
10 サーバ装置
12 制御部
12A CPU
12B ROM
12C RAM
12D I/O
14 記憶部
14A 認識処理プログラム
14B 帳票定義データ記憶部
14C 指示ルール記憶部
16 表示部
18 操作部
20 通信部
30 認識処理部
32 画像領域抽出部
34 表示制御部
34A 処理部
36 認識結果出力部
40、40A、40B端末装置
50 画像読取装置
60 帳票画像
60A~60C定義領域
62A~62D画像領域
64 確認画面
64A 認識結果確認画面
64B 定義外画像領域画面
64C 感嘆符マーク
66~70ルール編集画面
72 項目追加画面
74 認識結果編集画面
76 反映後認識結果
90 情報処理システム

Claims (14)

  1. 文書に記入された文字の認識結果を表示する確認画面に、予め認識対象として定義された定義領域以外である定義外領域から抽出された画像領域を表示する制御を行う表示制御部、
    を備え
    前記確認画面は、前記定義領域の認識結果である文字列を表示する第1画面と、前記定義外領域から抽出された画像領域を表示する第2画面とを切り替え可能に表示する
    情報処理装置。
  2. 前記表示制御部は、前記画像領域の認識結果である第1文字列を前記文書の認識結果の項目に追加する処理である第1処理、前記定義領域の認識結果である第2文字列を前記第1文字列に変更する処理である第2処理、もしくは、前記画像領域を前記確認画面において非表示にする処理である第3処理のいずれかの処理を選択的に行う処理部を更に備えた請求項1に記載の情報処理装置。
  3. 前記処理部は、前記第1文字列に追加を表す文字が含まれている場合に、前記第1処理を行う請求項2に記載の情報処理装置。
  4. 前記処理部は、前記第1文字列に変更を表す文字が含まれている場合に、前記第2処理を行う請求項2に記載の情報処理装置。
  5. 前記処理部は、前記画像領域に特定の画像が含まれている場合に、前記第3処理を行う請求項2に記載の情報処理装置。
  6. 前記特定の画像は、予め定められた刻印を表す画像である請求項5に記載の情報処理装置。
  7. 前記定義領域は、複数の項目を含み、
    前記処理部は、前記第1処理を行う場合に、前記複数の項目のうち、前記画像領域に最も近い項目に追加する処理を行う請求項2又は3に記載の情報処理装置。
  8. 前記定義領域は、複数の項目を含み、
    前記処理部は、前記第1処理を行う場合に、前記複数の項目のうち、前記画像領域から延びる線の終端に最も近い項目に追加する処理を行う請求項2又は3に記載の情報処理装置。
  9. 前記定義領域は、複数の項目を含み、
    前記処理部は、前記第2処理を行う場合に、前記複数の項目のうち、前記画像領域に最も近い項目の文字列を変更する処理を行う請求項2又は4に記載の情報処理装置。
  10. 前記定義領域は、複数の項目を含み、
    前記処理部は、前記第2処理を行う場合に、前記複数の項目のうち、前記画像領域から延びる線の終端に最も近い項目の文字列を変更する処理を行う請求項2又は4に記載の情報処理装置。
  11. 前記表示制御部は、前記画像領域の認識結果である第1文字列と、前記第1文字列に付与された項目とを対応付けて、前記文書の認識結果に追加する処理を行う処理部を更に備えた請求項1に記載の情報処理装置。
  12. 前記第1文字列は、複数の文字列として認識され、
    前記処理部は、前記複数の文字列の各々と、前記複数の文字列の各々に付与された項目とを対応付けて、前記文書の認識結果に追加する処理を行う請求項11に記載の情報処理装置。
  13. 前記表示制御部は、前記定義外領域から前記画像領域が抽出されている場合に、前記第2画面を前記第1画面より強調して表示する制御を行う請求項1~12のいずれか1項に記載の情報処理装置。
  14. コンピュータを、請求項1~13のいずれか1項に記載の情報処理装置が備える各部として機能させるためのプログラム。
JP2019057422A 2019-03-25 2019-03-25 情報処理装置及びプログラム Active JP7259468B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2019057422A JP7259468B2 (ja) 2019-03-25 2019-03-25 情報処理装置及びプログラム
US16/543,665 US11100318B2 (en) 2019-03-25 2019-08-19 Information processing apparatus and non-transitory computer readable medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019057422A JP7259468B2 (ja) 2019-03-25 2019-03-25 情報処理装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020160629A JP2020160629A (ja) 2020-10-01
JP7259468B2 true JP7259468B2 (ja) 2023-04-18

Family

ID=72605936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019057422A Active JP7259468B2 (ja) 2019-03-25 2019-03-25 情報処理装置及びプログラム

Country Status (2)

Country Link
US (1) US11100318B2 (ja)
JP (1) JP7259468B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220138950A1 (en) * 2020-11-02 2022-05-05 Adobe Inc. Generating change comparisons during editing of digital images
JP2022096490A (ja) * 2020-12-17 2022-06-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006134079A (ja) 2004-11-05 2006-05-25 Fuji Xerox Co Ltd 画像処理装置及びプログラム
US20110141521A1 (en) 2009-12-15 2011-06-16 Xerox Corporation Preserving user applied markings made to a hardcopy original document
US20120026081A1 (en) 2010-07-31 2012-02-02 Suryaprakash Kompalli System and method for using paper as an interface to computer applications

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5685185A (en) * 1979-12-12 1981-07-11 Fujitsu Ltd Optical character reader
JPH0916712A (ja) * 1995-06-27 1997-01-17 Oki Electric Ind Co Ltd 文書読取装置
EP0790573B1 (en) * 1995-07-31 2007-05-09 Fujitsu Limited Document processor and document processing method
JPH10116315A (ja) * 1996-10-11 1998-05-06 Nec Eng Ltd 帳票及びそれを用いる光学的文字読取装置
JP4183527B2 (ja) 2003-02-24 2008-11-19 日立オムロンターミナルソリューションズ株式会社 帳票定義データ作成方法および帳票処理装置
US9373029B2 (en) * 2007-07-11 2016-06-21 Ricoh Co., Ltd. Invisible junction feature recognition for document security or annotation
JP2006209261A (ja) * 2005-01-25 2006-08-10 Canon Inc 受信帳票ジョブ表示方法及び装置、並びにプログラム
US8165974B2 (en) * 2009-06-08 2012-04-24 Xerox Corporation System and method for assisted document review
US8824785B2 (en) * 2010-01-27 2014-09-02 Dst Technologies, Inc. Segregation of handwritten information from typographic information on a document
JP5653817B2 (ja) 2011-03-29 2015-01-14 日立オムロンターミナルソリューションズ株式会社 帳票認識装置、帳票認識方法およびそのためのプログラム
US8380040B2 (en) * 2011-07-18 2013-02-19 Fuji Xerox Co., Ltd. Systems and methods of capturing and organizing annotated content on a mobile device
KR20140008987A (ko) * 2012-07-13 2014-01-22 삼성전자주식회사 필기 이미지 인식을 이용한 어플리케이션 제어 방법 및 장치
JP5931841B2 (ja) * 2013-11-28 2016-06-08 京セラドキュメントソリューションズ株式会社 原稿読取装置及び画像形成装置
US9910566B2 (en) * 2015-04-22 2018-03-06 Xerox Corporation Copy and paste operation using OCR with integrated correction application
US10049269B2 (en) * 2015-09-30 2018-08-14 Fuji Xerox Co., Ltd. Information processing apparatus, information processing method, and non-transitory computer readable medium
JP6578858B2 (ja) * 2015-09-30 2019-09-25 富士ゼロックス株式会社 情報処理装置及びプログラム
US10740638B1 (en) * 2016-12-30 2020-08-11 Business Imaging Systems, Inc. Data element profiles and overrides for dynamic optical character recognition based data extraction
JP6984145B2 (ja) * 2017-03-09 2021-12-17 富士フイルムビジネスイノベーション株式会社 情報処理装置
JP2019159875A (ja) * 2018-03-14 2019-09-19 セイコーエプソン株式会社 スキャン装置およびスキャン結果表示プログラム
US11416674B2 (en) * 2018-07-20 2022-08-16 Ricoh Company, Ltd. Information processing apparatus, method of processing information and storage medium
US10740545B2 (en) * 2018-09-28 2020-08-11 International Business Machines Corporation Information extraction from open-ended schema-less tables
US10701232B1 (en) * 2019-06-27 2020-06-30 Kyocera Document Solutions Inc. Automated running of image-processing instructions from sticky notes

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006134079A (ja) 2004-11-05 2006-05-25 Fuji Xerox Co Ltd 画像処理装置及びプログラム
US20110141521A1 (en) 2009-12-15 2011-06-16 Xerox Corporation Preserving user applied markings made to a hardcopy original document
US20120026081A1 (en) 2010-07-31 2012-02-02 Suryaprakash Kompalli System and method for using paper as an interface to computer applications

Also Published As

Publication number Publication date
JP2020160629A (ja) 2020-10-01
US11100318B2 (en) 2021-08-24
US20200311408A1 (en) 2020-10-01

Similar Documents

Publication Publication Date Title
US9881003B2 (en) Automatic translation of digital graphic novels
JP4935869B2 (ja) 電子機器及びプログラム
US8305393B2 (en) Electronic device, method of controlling display, and program
CN113383340A (zh) 专利文献撰写装置、方法、计算机程序、计算机可读记录介质、服务器及系统
JP5018939B2 (ja) 情報表示装置及び情報表示プログラム
JP7259468B2 (ja) 情報処理装置及びプログラム
US20180018315A1 (en) Information processing device, program, and information processing method
JP5309873B2 (ja) 手書き入力部を備えた辞書機能を有する電子装置およびプログラム
JP7275816B2 (ja) 情報処理装置及びプログラム
WO2024057589A1 (ja) 修正提案方法、修正提案システム、及び修正提案プログラム
US20230306193A1 (en) Information processing apparatus, non-transitory computer readable medium, and method for processing information
US20190318192A1 (en) Information processing apparatus, and non-transitory computer readable medium
JP5550959B2 (ja) 文書処理システム、及びプログラム
JP2006276912A (ja) 文書編集装置、文書編集方法およびプログラム
JP7222218B2 (ja) 文書校正支援システム、文書校正支援装置、文書校正支援方法、及びプログラム
CN114661961A (zh) 信息处理装置,存储介质及信息处理方法
JP2012168696A (ja) 辞書情報表示装置およびプログラム
JP4887243B2 (ja) 情報照合装置、情報照合方法、プログラムおよび記録媒体
JP4535186B2 (ja) 辞書機能を備えた電子装置およびプログラム
WO2024018694A1 (ja) 情報処理装置、情報処理プログラム及び情報処理方法
JP5569178B2 (ja) 辞書検索装置及びプログラム
JP4922030B2 (ja) 文字列検索装置、方法及びプログラム
JP6475288B2 (ja) プログラム比較方法、プログラム比較装置およびプログラム比較プログラム
JP2023129001A (ja) 情報処理装置及び情報処理プログラム
CN116956829A (zh) 词库构建方法、装置、设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20220228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221213

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230207

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230307

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230320

R150 Certificate of patent or registration of utility model

Ref document number: 7259468

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150