JP2024012448A - 画像処理装置、画像処理装置の制御方法及びそのプログラム - Google Patents
画像処理装置、画像処理装置の制御方法及びそのプログラム Download PDFInfo
- Publication number
- JP2024012448A JP2024012448A JP2023186748A JP2023186748A JP2024012448A JP 2024012448 A JP2024012448 A JP 2024012448A JP 2023186748 A JP2023186748 A JP 2023186748A JP 2023186748 A JP2023186748 A JP 2023186748A JP 2024012448 A JP2024012448 A JP 2024012448A
- Authority
- JP
- Japan
- Prior art keywords
- document
- processing
- file
- image
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 title claims abstract description 123
- 238000000034 method Methods 0.000 title description 102
- 238000012937 correction Methods 0.000 claims abstract description 64
- 238000000605 extraction Methods 0.000 claims abstract description 64
- 238000012790 confirmation Methods 0.000 abstract description 54
- 230000006870 function Effects 0.000 description 9
- 238000005192 partition Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 230000000717 retained effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000008929 regeneration Effects 0.000 description 2
- 238000011069 regeneration method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Control Or Security For Electrophotography (AREA)
- Facsimiles In General (AREA)
- Character Discrimination (AREA)
- Processing Or Creating Images (AREA)
Abstract
【課題】複数の文書を一度にスキャンして、文書を別々のファイルに分割した上でファイル名等をレコメンドする際、レコメンドからUIを通じてユーザの確認結果を受け付けるまでの一連の処理を、単純に繰り返すとユーザの待ち時間が長かった。【解決手段】複数の文書の画像データを取得、それを分割して複数のファイルを作成し、さらにOCR関連処理を実行し、ファイルの文書と登録済み文書とのマッチングを行って、文書の種類を判別する。登録済み文書に紐づいたインデックス抽出ルールに従って、前記ファイルの文書からインデックスに関するレコメンド内容を生成しユーザに提示して、ユーザの修正指示に基づきインデックス及びインデックス抽出ルールの修正処理を実行し、前記ファイルにインデックスを付与する。そしてOCR関連処理を含む第1の処理と、修正処理を含む第2の処理を並列処理する画像処理装置。【選択図】図3
Description
本発明は、複数の文書をスキャンした際にファイル分割を行い、それぞれの文書に対してファイル名等をレコメンドする機能を備えた画像処理装置、画像処理装置の制御方法及びそのプログラムに関するものである。
帳票等の紙文書を画像読み取り装置でスキャンしてデジタル化する業務フローが存在する。その際には、一般的に、デジタル化した文書画像に、文書の種類・内容に応じたファイル名やメタ情報をつけて、所定のフォルダに格納することが行われる。ここで、ファイル名づけ、メタ情報づけ、送付先の振り分けフォルダの指定を人手で行うことは、デジタル化する紙原稿の枚数が多くなると大きな負荷となる。特に、複合機(MFP)では、ユーザインターフェース(UI)の制約により、ソフトウェアキーボードでファイル名やメタ情報を入力する必要がある場合にはユーザへの負荷はより大きくなる。また、送付先を指定することも、新たなフォルダを作成することが必要な場合は、同様にユーザへの負荷が大きくなる。
これを解決する手法として、特許文献1の手法がある。この手法では、まず、あらかじめ、文書の種類と、ファイル名づけルール、メタ情報づけルール、送付先ルールなどのインデックス抽出ルールを関連づけして登録しておく。次に、同じ種類の文書がスキャンされた場合には、文書の種類を認識し、関連付けられたインデックス抽出ルールを利用して、自動的にファイル名、メタ情報、送付先を決定し、ユーザにレコメンドする。このようにすれば、ユーザ作業負荷を大きく軽減することが可能となる。
また、特許文献2の手法では、登録済み文書のレコメンドを行うだけでなく、ユーザによるレコメンド結果の修正や、未登録文書の命名操作を受け付ける確認用のUIを提供する。これにより、インデックス抽出ルールの初期設定を行うことなく、ユーザが命名操作や修正操作を繰り返して行うだけで、インデックス抽出ルールを自動的に学習することが可能となる。
また、特許文献2の手法では、登録済み文書のレコメンドを行うだけでなく、ユーザによるレコメンド結果の修正や、未登録文書の命名操作を受け付ける確認用のUIを提供する。これにより、インデックス抽出ルールの初期設定を行うことなく、ユーザが命名操作や修正操作を繰り返して行うだけで、インデックス抽出ルールを自動的に学習することが可能となる。
一方、複数の文書を一度にスキャンして、文書を別々のファイルに分割し、それぞれのファイルに対して、ファイル名やメタ情報、送付先をレコメンドして欲しいという要望がある。しかしながら、特許文献2の技術のように、インデックス抽出ルールを自動学習しながら、複数ファイルのレコメンドを実現するには課題がある。例えば、特許文献2に記載されているレコメンドからUIを通じてユーザの確認結果を受け付けるまでの一連の処理を、ファイル数分繰り返す場合、各ファイルの確認の前にレコメンドに係る処理時間分の待ち時間が毎回発生してしまう。また、待ち時間を減らすために、レコメンドに係る画像処理をユーザの確認操作のバックエンドで先に実施する場合、その場で新規に登録したインデックス抽出ルールを、同一スキャン内の他の文書に適用することができない。その場合、もし同一スキャン内に、未登録の同じ種類の文書や、インデックス抽出ルールに変更の必要がある同じ種類の文書があったとしても、同様の操作を繰り返し行う必要があり、ユーザの手間がかかってしまう。
本発明は、上記事情に鑑みてなされたものであり、インデックス抽出ルールを自動学習しながらの複数ファイルのレコメンドを実現するにあたり、ユーザの手間を減らすことを目的とする。
本発明は、上記事情に鑑みてなされたものであり、インデックス抽出ルールを自動学習しながらの複数ファイルのレコメンドを実現するにあたり、ユーザの手間を減らすことを目的とする。
画像処理装置であって、複数の文書の画像データを取得する取得手段と、前記画像データを分割して複数のファイルを作成する作成手段と、前記ファイルに対してOCR関連処理を実行するOCR関連処理手段と、前記ファイルの文書と登録済み文書とのマッチングを行い、文書の種類を判別する判別手段と、前記登録済み文書に紐づいたインデックス抽出ルールに従って、前記ファイルの文書からインデックスに関するレコメンド内容を生成する生成処理手段と、前記レコメンド内容をユーザに提示して、ユーザの修正指示に基づきインデックス及びインデックス抽出ルールの修正処理を実行する修正処理手段と、前記ファイルにインデックスを付与する付与手段と、を備え、前記OCR関連処理手段を含む第1の処理手段と、前記修正処理手段を含む第2の処理手段が並列して起動されることを特徴とする。
本発明によれば、複数の文書をスキャンした際にファイル分割を行い、それぞれの文書に対してファイル名等のインデックス項目をレコメンドする機能において、ユーザの手間を減らすことができる。特に、同一スキャン内に複数の同じ種類の文書があった場合、ユーザが登録・修正したルールをすぐに適用することができ、ユーザの負荷を削減できる。
以下、添付図面を参照して本発明の実施例を詳しく説明する。なお、以下の実施例は特許請求の範囲に係る本発明を限定するものでなく、また本実施例で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
<システム構成>
図1は、本実施例を適用可能なシステムの全体構成を示す図である。図1に示すように、画像処理装置100はLAN102に接続され、Internet 103等を介してPCなどの端末101等と通信可能になっている。なお、本実施例の実現にあたっては、PCなどの端末101に関しては、必ずしも必要なくてもよく、画像処理装置100のみの構成だけでも良い。
画像処理装置100は、例えば、表示・操作部、スキャナ部及び、プリンタ部を有する複合機(MFP)であり、スキャナ部を用いて文書原稿をスキャンするスキャン端末として利用することが可能である。また、タッチパネルやハードボタンなどの表示・操作部を有し、ファイル名や格納先のレコメンド結果を表示したり、ユーザからの指示を受け付けたりするためのユーザインタフェースの表示を行う。
なお、本実施例では、画像処理装置100単体で、スキャン処理、ファイル分割処理、OCR関連処理、レコメンド内容の生成処理、ファイル送信を行う例について説明するが、その一部を他の端末101で行うように構成したシステムであっても構わない。例えば、まず、スキャン処理とファイル分割処理とを画像処理装置100で実行して、スキャン画像を他の端末101にネットワークを介して送信する。そして、他の端末101においてOCR関連処理やレコメンド内容の生成処理を実行し、レコメンド結果を画像処理装置100に返信して、画像処理装置100でファイルを生成してファイル送信を行うようにしてもよい。
図1は、本実施例を適用可能なシステムの全体構成を示す図である。図1に示すように、画像処理装置100はLAN102に接続され、Internet 103等を介してPCなどの端末101等と通信可能になっている。なお、本実施例の実現にあたっては、PCなどの端末101に関しては、必ずしも必要なくてもよく、画像処理装置100のみの構成だけでも良い。
画像処理装置100は、例えば、表示・操作部、スキャナ部及び、プリンタ部を有する複合機(MFP)であり、スキャナ部を用いて文書原稿をスキャンするスキャン端末として利用することが可能である。また、タッチパネルやハードボタンなどの表示・操作部を有し、ファイル名や格納先のレコメンド結果を表示したり、ユーザからの指示を受け付けたりするためのユーザインタフェースの表示を行う。
なお、本実施例では、画像処理装置100単体で、スキャン処理、ファイル分割処理、OCR関連処理、レコメンド内容の生成処理、ファイル送信を行う例について説明するが、その一部を他の端末101で行うように構成したシステムであっても構わない。例えば、まず、スキャン処理とファイル分割処理とを画像処理装置100で実行して、スキャン画像を他の端末101にネットワークを介して送信する。そして、他の端末101においてOCR関連処理やレコメンド内容の生成処理を実行し、レコメンド結果を画像処理装置100に返信して、画像処理装置100でファイルを生成してファイル送信を行うようにしてもよい。
<画像処理装置のハードウェア構成>
図2は、画像処理装置100の構成を示すブロック図である。制御部110は、CPU111、記憶装置112、プリンタI/F部113、ネットワークI/F部114、スキャナI/F部115、表示・操作I/F部116がシステムバス117を介して互いに通信可能に接続されている。制御部110は、画像処理装置100全体の動作を制御する。
CPU111は、記憶装置112に記憶された制御プログラムを読み出し実行することにより、後述のフローチャートにおける各処理(読取制御や画像処理、表示制御など)を実行する手段として機能する。
記憶装置112は、上記プログラム、画像データ、メタデータ、設定データ及び処理結果データなどを格納し保持する。記憶装置112には、不揮発性メモリであるROM118、揮発性メモリであるRAM119及び大容量記憶領域であるHDD120などがある。
ROM118は、制御プログラムなどを保持する不揮発性メモリであり、CPU111はその制御プログラムを読み出し制御を行う。
RAM119は、CPU111の主メモリ、ワークエリア等の一時記憶領域として用いられる揮発性メモリである。
ネットワークI/F部114は、制御部110を、システムバス117を介してLAN102に接続する。ネットワークI/F部114は、LAN102上の外部装置に画像データを送信したり、LAN102上の外部装置から各種情報を受信したりする。
図2は、画像処理装置100の構成を示すブロック図である。制御部110は、CPU111、記憶装置112、プリンタI/F部113、ネットワークI/F部114、スキャナI/F部115、表示・操作I/F部116がシステムバス117を介して互いに通信可能に接続されている。制御部110は、画像処理装置100全体の動作を制御する。
CPU111は、記憶装置112に記憶された制御プログラムを読み出し実行することにより、後述のフローチャートにおける各処理(読取制御や画像処理、表示制御など)を実行する手段として機能する。
記憶装置112は、上記プログラム、画像データ、メタデータ、設定データ及び処理結果データなどを格納し保持する。記憶装置112には、不揮発性メモリであるROM118、揮発性メモリであるRAM119及び大容量記憶領域であるHDD120などがある。
ROM118は、制御プログラムなどを保持する不揮発性メモリであり、CPU111はその制御プログラムを読み出し制御を行う。
RAM119は、CPU111の主メモリ、ワークエリア等の一時記憶領域として用いられる揮発性メモリである。
ネットワークI/F部114は、制御部110を、システムバス117を介してLAN102に接続する。ネットワークI/F部114は、LAN102上の外部装置に画像データを送信したり、LAN102上の外部装置から各種情報を受信したりする。
スキャナI/F部115は、スキャナ部122と制御部110とを、システムバス117を介して接続する。スキャナ部122は、文書原稿を読み取ってスキャン画像データを生成し、スキャナI/F部115を介してスキャン画像データを制御部110に入力する。なお、スキャナ部122は、原稿フィーダを備え、トレイに置かれた複数の原稿を1枚ずつフィードして、連続的に読み取ることを可能とする。
表示・操作部I/F部116は、表示・操作部123と制御部110とを、システムバス117を介して接続する。表示・操作部123には、タッチパネル機能を有する液晶表示部やハードボタンなどが備えられている。
プリンタI/F部113は、プリンタ部121と制御部110とを、システムバス117を介して接続する。プリンタ部121は、CPU111で生成された画像データをプリンタI/F部113を介して受信し、当該受信した画像データを用いて記録紙へのプリント処理が行われる。
以上のように、本実施例に係る画像処理装置100では、上記のハードウェア構成によって、画像処理機能を提供することが可能である。
表示・操作部I/F部116は、表示・操作部123と制御部110とを、システムバス117を介して接続する。表示・操作部123には、タッチパネル機能を有する液晶表示部やハードボタンなどが備えられている。
プリンタI/F部113は、プリンタ部121と制御部110とを、システムバス117を介して接続する。プリンタ部121は、CPU111で生成された画像データをプリンタI/F部113を介して受信し、当該受信した画像データを用いて記録紙へのプリント処理が行われる。
以上のように、本実施例に係る画像処理装置100では、上記のハードウェア構成によって、画像処理機能を提供することが可能である。
<画像処理装置が実行する処理手順>
本実施例における処理の概要は、画像処理装置100が複数の文書原稿を読み取り、ファイル分割設定にしたがって画像データを複数のファイルに分割する。そして、それぞれのファイルに付与するファイル名を、インデックス抽出ルールに基づいて、各ファイルの先頭ページのOCR結果の文字列を利用して生成し、表示・操作部123を通じてユーザにレコメンド内容を提示する。ユーザは、表示・操作部123において、ファイル名が正しくレコメンド内容が提示されているかどうかを確認し、間違っている場合には修正指示を行う。ユーザの操作結果に基づいて、修正があった場合にはインデックス抽出ルールを更新する。分割後の全てのファイルについて、ユーザによる確認・修正処理が終わると、ファイル名を各ファイルに付与して送信する。
続いて、本実施例における画像処理装置100が実行する処理手順を図3のフローチャートを用いて詳述する。なお、画像処理装置100のCPU111が、ROM118に格納されている処理プログラムをRAM119にロードして実行することにより、図3の各ステップの処理を実行する処理部として機能する。
ステップS301において、画像処理装置100は、表示・操作部123からユーザの指示を受け付けると、スキャナ部122において、原稿フィーダのトレイから複数の文書原稿を1枚ずつ読み取り、画像データを取得する。
ステップS302において、CPU111は、記憶装置112からファイル分割設定を取得する。なお、ファイル分割設定は、事前に表示・操作部123からユーザの指示を受け付けたものを取得してもよいし、予め決められた固定の設定を取得してもよい。
本実施例における処理の概要は、画像処理装置100が複数の文書原稿を読み取り、ファイル分割設定にしたがって画像データを複数のファイルに分割する。そして、それぞれのファイルに付与するファイル名を、インデックス抽出ルールに基づいて、各ファイルの先頭ページのOCR結果の文字列を利用して生成し、表示・操作部123を通じてユーザにレコメンド内容を提示する。ユーザは、表示・操作部123において、ファイル名が正しくレコメンド内容が提示されているかどうかを確認し、間違っている場合には修正指示を行う。ユーザの操作結果に基づいて、修正があった場合にはインデックス抽出ルールを更新する。分割後の全てのファイルについて、ユーザによる確認・修正処理が終わると、ファイル名を各ファイルに付与して送信する。
続いて、本実施例における画像処理装置100が実行する処理手順を図3のフローチャートを用いて詳述する。なお、画像処理装置100のCPU111が、ROM118に格納されている処理プログラムをRAM119にロードして実行することにより、図3の各ステップの処理を実行する処理部として機能する。
ステップS301において、画像処理装置100は、表示・操作部123からユーザの指示を受け付けると、スキャナ部122において、原稿フィーダのトレイから複数の文書原稿を1枚ずつ読み取り、画像データを取得する。
ステップS302において、CPU111は、記憶装置112からファイル分割設定を取得する。なお、ファイル分割設定は、事前に表示・操作部123からユーザの指示を受け付けたものを取得してもよいし、予め決められた固定の設定を取得してもよい。
ステップS303において、CPU111は、ステップS302で取得したファイル分割設定に基づいて、ステップS301で取得した複数の画像データの分割位置を決定する。そして、分割位置にしたがって、S301で取得した画像データをグループ化する。このグループは、後述するファイル作成の際に1ファイルにする画像データであり、1つのグループには少なくとも1枚の画像データが含まれる。よって、画像データを分割して複数のファイルを生成する。ファイル分割の設定と分割位置決定の例については、図4を用いて後述する。
ステップS304において、CPU111は、ステップS309で示す確認・修正処理を並列で起動し、処理をステップS305へ進める。
以下のステップS305~ステップS307のOCR関連処理が終わり未確認属性の付与がされたファイルから並列にステップS309の処理が実行される。
ステップS305において、CPU111は、ステップS303で決定した画像グループのうち、OCR関連処理を実行していないファイルの1つを、読み取りの早い順にしたがって選択する。
ステップS306において、CPU111は、ステップS305で選択したファイルの先頭ページの画像に対して、OCR関連処理を実行する。OCR関連処理の詳細については後述する。
ステップS307において、CPU111は、ステップS305で選択し、ステップS306でOCR関連処理を実行したファイルについて、未確認属性を付与する。未確認属性とは、ステップS304で並列起動した確認・修正処理の処理待ちであることを表す属性のことである。
ステップS304において、CPU111は、ステップS309で示す確認・修正処理を並列で起動し、処理をステップS305へ進める。
以下のステップS305~ステップS307のOCR関連処理が終わり未確認属性の付与がされたファイルから並列にステップS309の処理が実行される。
ステップS305において、CPU111は、ステップS303で決定した画像グループのうち、OCR関連処理を実行していないファイルの1つを、読み取りの早い順にしたがって選択する。
ステップS306において、CPU111は、ステップS305で選択したファイルの先頭ページの画像に対して、OCR関連処理を実行する。OCR関連処理の詳細については後述する。
ステップS307において、CPU111は、ステップS305で選択し、ステップS306でOCR関連処理を実行したファイルについて、未確認属性を付与する。未確認属性とは、ステップS304で並列起動した確認・修正処理の処理待ちであることを表す属性のことである。
ステップS308において、CPU111は、ステップS303で決定したすべての画像グループについて、ステップS306のOCR関連処理が終わったかどうかを判定する。すべての画像グループについて、OCR関連処理が終わっていない場合、処理をステップS305に戻し、すべての画像グループについて、OCR関連処理が終わっている場合、処理をステップS310に進める。
一方、並列処理されるステップS309において、CPU111は、ステップS303で決定したすべての画像グループについて、ユーザにレコメンド内容であるファイル名を提示する。その後、ユーザの確認・修正指示に基づいてファイル名を確定する確認・修正処理を実行する。確認・修正処理の詳細については後述する。
ステップS310において、CPU111は、ステップS303で決定したすべての画像グループについて、確認・修正処理が終わったかどうかを判定する。すべての画像グループについて、確認・修正処理が終わるまで待機し、終わった場合には処理をステップS311に進める。
ステップS311において、CPU111は、ステップS309で確認・修正を終えて決定されたファイル名の一覧を、表示・操作部123に表示する。
ステップS312において、CPU111は、ステップS303で決定した画像グループのそれぞれからファイルを作成する。それぞれのファイルには、ステップS309において、ユーザによる確認・修正を終えて決定されたファイル名を付与する。本実施例ではPDF(Portable Document Format)化し、保存する例を示す。PDFの場合には、画像をページに分け保存することが可能であり、ステップS303で決定した画像グループ内の各画像データを、別々のページとして1つのファイルに保存する。
ステップS313において、CPU111は、ステップS312で作成したファイルを、LAN102を通じて送信先に送信する。
一方、並列処理されるステップS309において、CPU111は、ステップS303で決定したすべての画像グループについて、ユーザにレコメンド内容であるファイル名を提示する。その後、ユーザの確認・修正指示に基づいてファイル名を確定する確認・修正処理を実行する。確認・修正処理の詳細については後述する。
ステップS310において、CPU111は、ステップS303で決定したすべての画像グループについて、確認・修正処理が終わったかどうかを判定する。すべての画像グループについて、確認・修正処理が終わるまで待機し、終わった場合には処理をステップS311に進める。
ステップS311において、CPU111は、ステップS309で確認・修正を終えて決定されたファイル名の一覧を、表示・操作部123に表示する。
ステップS312において、CPU111は、ステップS303で決定した画像グループのそれぞれからファイルを作成する。それぞれのファイルには、ステップS309において、ユーザによる確認・修正を終えて決定されたファイル名を付与する。本実施例ではPDF(Portable Document Format)化し、保存する例を示す。PDFの場合には、画像をページに分け保存することが可能であり、ステップS303で決定した画像グループ内の各画像データを、別々のページとして1つのファイルに保存する。
ステップS313において、CPU111は、ステップS312で作成したファイルを、LAN102を通じて送信先に送信する。
<分割位置決定処理>
次に、ステップS303における分割位置決定処理について説明する。
図4に、ファイル分割設定ごとの、ページ分割処理の処理イメージを示す。
図4(A)は、ファイル分割設定として、ページ数分割を設定した場合の分割位置の例である。ページ数分割とは、あらかじめ設定されたページ数ごとに分割位置を決定する方法である。ページ数は、ユーザによって表示・操作部123で指示されたり、スキャン設定に従ってあらかじめ固定のページ数が指定されたりする。
例として、ステップS301で、6ページ分の画像データを取得され、2ページごとの分割が設定された場合、分割位置は2ページ目と3ページ目の間、4ページ目と5ページ目の間に設定される。
図4(B)は、ファイル分割設定として、仕切りページ分割を設定した場合の例である。仕切りページ分割とは、画像データを解析し、仕切りページとして認識した場合に、その仕切りページを取り除いた上で、仕切りページのあった位置に分割位置を設定する方法である。ユーザは、分割したい文書と文書の間に仕切りページを挿入した上で、原稿フィーダに文書群をセットする必要がある。
例として、ステップS301で、6ページ分の画像データを取得され、3ページ目と5ページ目が仕切りページであった場合には、まず、3ページ目と5ページ目の画像データが取り除かれる。そして、分割位置は2ページ目と4ページ目、4ページ目と6ページ目の画像の間に設定される。
仕切りページとしては、何も印刷されていない白紙や、バーコードや二次元コードを印刷した用紙を使用すればよい。白紙を仕切りページとして使用する場合には、画像データ内に含まれる一定の画素値以下の画素数や、一定の面積以上の有色画素塊が含まれるかなどを利用して、白紙であるかどうかを判定することで仕切りページの認識を行う。バーコードや二次元コードを印刷した用紙を使用する場合には、まず、画像データ内からバーコードや二次元コードを検出する。そして、検出したバーコードや二次元コードをデコードした結果に、仕切りページであることを識別する情報が含まれるかどうかによって仕切りページの認識を行う。バーコードや二次元コードを用いた仕切りページ用紙は、特定のPCアプリケーションを用いて印刷してもよい。または、画像処理装置100内のアプリケーションを用いて、表示・操作部123から枚数や用紙サイズなどを受け付け、プリンタ部121で印刷してもよい。
次に、ステップS303における分割位置決定処理について説明する。
図4に、ファイル分割設定ごとの、ページ分割処理の処理イメージを示す。
図4(A)は、ファイル分割設定として、ページ数分割を設定した場合の分割位置の例である。ページ数分割とは、あらかじめ設定されたページ数ごとに分割位置を決定する方法である。ページ数は、ユーザによって表示・操作部123で指示されたり、スキャン設定に従ってあらかじめ固定のページ数が指定されたりする。
例として、ステップS301で、6ページ分の画像データを取得され、2ページごとの分割が設定された場合、分割位置は2ページ目と3ページ目の間、4ページ目と5ページ目の間に設定される。
図4(B)は、ファイル分割設定として、仕切りページ分割を設定した場合の例である。仕切りページ分割とは、画像データを解析し、仕切りページとして認識した場合に、その仕切りページを取り除いた上で、仕切りページのあった位置に分割位置を設定する方法である。ユーザは、分割したい文書と文書の間に仕切りページを挿入した上で、原稿フィーダに文書群をセットする必要がある。
例として、ステップS301で、6ページ分の画像データを取得され、3ページ目と5ページ目が仕切りページであった場合には、まず、3ページ目と5ページ目の画像データが取り除かれる。そして、分割位置は2ページ目と4ページ目、4ページ目と6ページ目の画像の間に設定される。
仕切りページとしては、何も印刷されていない白紙や、バーコードや二次元コードを印刷した用紙を使用すればよい。白紙を仕切りページとして使用する場合には、画像データ内に含まれる一定の画素値以下の画素数や、一定の面積以上の有色画素塊が含まれるかなどを利用して、白紙であるかどうかを判定することで仕切りページの認識を行う。バーコードや二次元コードを印刷した用紙を使用する場合には、まず、画像データ内からバーコードや二次元コードを検出する。そして、検出したバーコードや二次元コードをデコードした結果に、仕切りページであることを識別する情報が含まれるかどうかによって仕切りページの認識を行う。バーコードや二次元コードを用いた仕切りページ用紙は、特定のPCアプリケーションを用いて印刷してもよい。または、画像処理装置100内のアプリケーションを用いて、表示・操作部123から枚数や用紙サイズなどを受け付け、プリンタ部121で印刷してもよい。
図4(C)は、ファイル分割設定として、表紙ページ分割を設定した場合の例である。表紙ページ分割とは、画像データを解析し、表紙ページとして認識した場合に、その1ページ前との間に分割位置を設定する方法である。
例として、ステップS301で、6ページ分の画像データが取得され、1ページ目、3ページ目、5ページ目が表紙ページとして認識された場合、分割位置は2ページ目と3ページ目の間、4ページ目と5ページ目の間に設定される。表示ページの認識方法としては、例えば表紙ページの画像データを事前に登録しておき、画像の比較によって認識する。表紙ページの画像データは、画像処理装置100内のアプリケーションを用いて、表紙ページとなる文書原稿をスキャナ部122で読み込んで登録してもよいし、外部からLAN102、ネットワークI/F部114を通じて登録してもよい。画像の比較では、画像から算出した局所特徴量の一致度に基づいて、登録された表紙ページと同じであるかどうかを認識する。なお、表紙ページの認識は、画像の比較に限定するものではない。
その他の方法として、例えば、画像内の文書に含まれる文字や罫線の配置といったレイアウト特徴を抽出し、レイアウト特徴の比較によって認識してもよい。また、表紙ページを事前に登録するのではなく、表紙ページに特定の文字列やバーコード、二次元コードが含まれるかどうかで認識してもよい。
例として、ステップS301で、6ページ分の画像データが取得され、1ページ目、3ページ目、5ページ目が表紙ページとして認識された場合、分割位置は2ページ目と3ページ目の間、4ページ目と5ページ目の間に設定される。表示ページの認識方法としては、例えば表紙ページの画像データを事前に登録しておき、画像の比較によって認識する。表紙ページの画像データは、画像処理装置100内のアプリケーションを用いて、表紙ページとなる文書原稿をスキャナ部122で読み込んで登録してもよいし、外部からLAN102、ネットワークI/F部114を通じて登録してもよい。画像の比較では、画像から算出した局所特徴量の一致度に基づいて、登録された表紙ページと同じであるかどうかを認識する。なお、表紙ページの認識は、画像の比較に限定するものではない。
その他の方法として、例えば、画像内の文書に含まれる文字や罫線の配置といったレイアウト特徴を抽出し、レイアウト特徴の比較によって認識してもよい。また、表紙ページを事前に登録するのではなく、表紙ページに特定の文字列やバーコード、二次元コードが含まれるかどうかで認識してもよい。
<OCR関連処理>
次にステップS306におけるOCR関連処理の詳細について、図5を用いて説明する。図5は、画像データ一枚に対して、OCRとその前処理を含めたOCR関連処理を実行する処理手順を示すフローチャートである。
ステップS501において、CPU111は、画像データから傾きの角度を検出し、検出した傾きだけ逆方向に画像を回転することで、傾きを補正した画像データを取得する。
傾き補正の対象となる傾きとは、スキャナ部122による読み取り時に、原稿フィーダ内のローラの摩耗などが原因でまっすぐに原稿が読み取られなかったり、原稿の印刷時にまっすぐ印字できなかったりするような傾きである。
傾き検出では、まず、画像データ内に含まれるオブジェクトを検出し、水平方向あるいは鉛直方向に隣り合うオブジェクト群を連結する。そして、連結されたオブジェクトの中心位置を結んだ角度が、水平方向あるいは鉛直方向からどれだけ傾いているかを取得することで傾きを求める。なお、傾き検出は上記の方法に限るものではない。例えば、画像データ内に含まれるオブジェクトの中心座標を取得し、0.1度単位で中心座標群を回転させながら、中心座標群が水平方向あるいは垂直方向に並ぶ割合がもっとも高い角度を傾きとして求めてもよい。この傾き補正によって、画像の傾きを補正することで、後述する回転補正およびブロックセレクション処理、OCRのそれぞれの処理精度を上げることが可能となる。
次にステップS306におけるOCR関連処理の詳細について、図5を用いて説明する。図5は、画像データ一枚に対して、OCRとその前処理を含めたOCR関連処理を実行する処理手順を示すフローチャートである。
ステップS501において、CPU111は、画像データから傾きの角度を検出し、検出した傾きだけ逆方向に画像を回転することで、傾きを補正した画像データを取得する。
傾き補正の対象となる傾きとは、スキャナ部122による読み取り時に、原稿フィーダ内のローラの摩耗などが原因でまっすぐに原稿が読み取られなかったり、原稿の印刷時にまっすぐ印字できなかったりするような傾きである。
傾き検出では、まず、画像データ内に含まれるオブジェクトを検出し、水平方向あるいは鉛直方向に隣り合うオブジェクト群を連結する。そして、連結されたオブジェクトの中心位置を結んだ角度が、水平方向あるいは鉛直方向からどれだけ傾いているかを取得することで傾きを求める。なお、傾き検出は上記の方法に限るものではない。例えば、画像データ内に含まれるオブジェクトの中心座標を取得し、0.1度単位で中心座標群を回転させながら、中心座標群が水平方向あるいは垂直方向に並ぶ割合がもっとも高い角度を傾きとして求めてもよい。この傾き補正によって、画像の傾きを補正することで、後述する回転補正およびブロックセレクション処理、OCRのそれぞれの処理精度を上げることが可能となる。
ステップS502において、CPU111は、ステップS501で取得した傾き補正後の画像に対して、原稿内の文字が正立する向きになるように、90度単位で画像を回転補正した画像を得る。ステップS501で取得した傾き補正後の画像を基準画像として、基準画像と90回転した画像、180度回転した画像、270度回転した画像の4枚の画像を用意する。そして、それぞれの画像に対し、高速処理が可能で簡易的なOCR処理を実行して、一定値以上の確信度を持って認識された文字の数が最も多い画像を回転補正後画像として取得する。なお、回転補正の方法は上記に限るものではない。
ステップS503において、CPU111は、ステップS502で取得した回転補正後画像に対し、ブロックセレクション処理を実行する。ブロックセレクション処理とは、画像を前景領域と背景領域に分類した上で、前景領域をテキストブロックやそれ以外のブロックに分割する判定処理である。
ステップS503において、CPU111は、ステップS502で取得した回転補正後画像に対し、ブロックセレクション処理を実行する。ブロックセレクション処理とは、画像を前景領域と背景領域に分類した上で、前景領域をテキストブロックやそれ以外のブロックに分割する判定処理である。
具体的には、まず白黒に二値化されたクエリ画像に対し輪郭線追跡を行って、黒画素輪郭で囲まれる画素の塊を抽出する。そして、面積が所定の面積よりも大きい黒画素の塊については、内部にある白画素に対しても輪郭線追跡を行い、白画素の塊を抽出し、さらに一定面積以上の白画素の塊の内部から再帰的に黒画素の塊を抽出する。こうして得られた黒画素の塊を前景領域とし、大きさ及び形状で分類し、異なる属性を持つ領域へ分類していく。例えば、縦横比が1に近く、大きさが一定の範囲のものを文字相当の画素塊とし、さらに近接する文字が整列良くグループ化され得る部分を文字領域(TEXT)とする。また、扁平な画素塊を線領域(LINE)とする。一定大きさ以上でかつ矩形の白画素塊を整列よく内包する黒画素塊の占める範囲を表領域(TABLE)とする。不定形の画素塊が散在している領域を写真領域(PHOTO)とする。そして、それ以外の任意形状の画素塊を図画領域(PICTURE)とする。こうしてオブジェクトの属性毎に領域分割されたものの中から、文字属性を持つと判定されたブロックがテキストブロックとして特定される。
図6は、ブロックセレクション処理の結果の一例を示す図である。図6(A)は回転補正後の画像を示し、図6(B)は当該クエリ画像のブロックセレクション処理結果を示している。本ステップで得られた各テキストブロックの情報(属性と各ブロックの位置を示す情報)は、後述のOCR処理や類似度計算等で用いられる。なお、本ステップでテキストブロックだけを抽出するのは、文字列の位置は文書画像の構造を良く表現し、スキャンアシスト情報と密接に関連するためである。したがって、写真領域や表領域等の他の属性を持つと判定されたブロックの情報を後続の処理で利用することを排除するものではない。
図5のフローチャートの説明に戻ると、ステップS504において、CPU111は、ステップS503で取得したテキストブロックに対してOCRを実行し、各テキストブロックに対応する文字列を結果として取得する。
図5のフローチャートの説明に戻ると、ステップS504において、CPU111は、ステップS503で取得したテキストブロックに対してOCRを実行し、各テキストブロックに対応する文字列を結果として取得する。
<確認・修正処理>
確認・修正処理(図3のS309)の詳細について説明する。本実施例において、確認・修正処理(S309)は、図3のステップS304で起動され、図3の処理フロー(S305~S308)と並列で動作する。確認・修正処理は、分割後の各ファイルに付与するファイル名をユーザにレコメンド内容を提示し、ユーザの指示に基づいて確定する処理である。図7は、確認・修正処理の処理ステップを表すフローチャートである。図8は、各画像グループの先頭ページの画像データであり、図8(A)、図8(B)、図8(C)の並び順は読み取りの早い順である。図8(A)と図8(B)は同じ種類の文書で、記載内容が一部異なる文書であり、図8(C)は異なる種類の文書である。以下に、図8の画像データを読み込んだ際の確認・修正処理の振る舞いを、図7のフローチャートを用いて説明する。
確認・修正処理(図3のS309)の詳細について説明する。本実施例において、確認・修正処理(S309)は、図3のステップS304で起動され、図3の処理フロー(S305~S308)と並列で動作する。確認・修正処理は、分割後の各ファイルに付与するファイル名をユーザにレコメンド内容を提示し、ユーザの指示に基づいて確定する処理である。図7は、確認・修正処理の処理ステップを表すフローチャートである。図8は、各画像グループの先頭ページの画像データであり、図8(A)、図8(B)、図8(C)の並び順は読み取りの早い順である。図8(A)と図8(B)は同じ種類の文書で、記載内容が一部異なる文書であり、図8(C)は異なる種類の文書である。以下に、図8の画像データを読み込んだ際の確認・修正処理の振る舞いを、図7のフローチャートを用いて説明する。
ステップS701において、CPU111は、図3のステップS301でスキャンされ、ステップS303で決定した画像グループのうち、未確認属性が付与されたグループがあるかどうかを確認する。未確認属性とは、図3のステップS307で付与される属性で本確認・修正処理の実行前であることを意味している。未確認属性の付与された画像グループが現れるまで待機し、1つでもあった場合には、処理をステップS702へ進める。
ステップS702において、CPU111は、未確認属性の付与された画像グループの1つを、読み取りの早い順にしたがって選択する。
ステップS703において、CPU111は、HDD120からインデックス抽出ルールを取得し、RAM119に展開した上で取得する。インデックス抽出ルールの例を図9A,Bに示す。図9Aは、文書ID「0001」という文書1種類が登録されている状態を表し、図9Bは、それに加え、文書ID「0002」という文書が登録されている状態を表す。インデックス抽出ルールは、登録文書1つについて、文書IDと文書識別情報とレコメンド情報の組み合わせであり、登録済み文書の数だけこれらの組み合わせを保持する。文書IDとは文書の種類を表すユニークなIDである。文書識別情報は、後述する文書マッチングで使用する文書の種類を識別するために必要な情報であり、OCR関連処理を実行して得られるテキストブロック群を利用する。レコメンド情報は、レコメンドする内容を、入力文書から抽出するためのルールであり、登録済み文書内の特定のテキストブロック群の座標および、そのテキストブロック群のOCR結果をどの順番でつなげてファイル名とするかという順番の情報を持つ。なお、本実施例では、ファイル名をレコメンドする場合の例の詳細を後述するが、レコメンド情報としてファイルの送付先のフォルダ情報や、テキストブロック群のOCR結果をメタデータとして付与するための情報を保持してもよい。また、図9A,Bに示したように、読み取った画像データのサムネイルを一緒に保持してもよい。
ステップS704において、CPU111は、ステップS703で取得したインデックス抽出ルールに基づいて、ステップS702で選択した画像グループに対してレコメンドするファイル名を生成するレコメンド内容生成処理を実行する。レコメンド内容生成処理の処理手順を示したフローチャートが図10である。
ステップS702において、CPU111は、未確認属性の付与された画像グループの1つを、読み取りの早い順にしたがって選択する。
ステップS703において、CPU111は、HDD120からインデックス抽出ルールを取得し、RAM119に展開した上で取得する。インデックス抽出ルールの例を図9A,Bに示す。図9Aは、文書ID「0001」という文書1種類が登録されている状態を表し、図9Bは、それに加え、文書ID「0002」という文書が登録されている状態を表す。インデックス抽出ルールは、登録文書1つについて、文書IDと文書識別情報とレコメンド情報の組み合わせであり、登録済み文書の数だけこれらの組み合わせを保持する。文書IDとは文書の種類を表すユニークなIDである。文書識別情報は、後述する文書マッチングで使用する文書の種類を識別するために必要な情報であり、OCR関連処理を実行して得られるテキストブロック群を利用する。レコメンド情報は、レコメンドする内容を、入力文書から抽出するためのルールであり、登録済み文書内の特定のテキストブロック群の座標および、そのテキストブロック群のOCR結果をどの順番でつなげてファイル名とするかという順番の情報を持つ。なお、本実施例では、ファイル名をレコメンドする場合の例の詳細を後述するが、レコメンド情報としてファイルの送付先のフォルダ情報や、テキストブロック群のOCR結果をメタデータとして付与するための情報を保持してもよい。また、図9A,Bに示したように、読み取った画像データのサムネイルを一緒に保持してもよい。
ステップS704において、CPU111は、ステップS703で取得したインデックス抽出ルールに基づいて、ステップS702で選択した画像グループに対してレコメンドするファイル名を生成するレコメンド内容生成処理を実行する。レコメンド内容生成処理の処理手順を示したフローチャートが図10である。
<レコメンド内容の生成処理>
ステップS1000において、CPU111は、文書マッチングを実行する。文書マッチングとは、入力された文書と同じ種類の文書が、インデックス抽出ルールと共に画像処理装置のデータベースに登録されている登録済みの文書の中にあるかどうかを判定し、同じ種類の文書があった場合にはその文書の種類を判別する処理である。本実施例では、まず、入力文書と各登録済み文書との間で、1対1で、OCR関連処理で得られるテキストブロックの形状や配置がどれだけ類似しているかを表す類似度の算出を行う。類似度算出では、まず、入力文書のテキストブロック全体と、登録済み文書のテキストブロック全体で位置合わせを行う。次に、入力文書内の各テキストブロックと、登録済み文書のテキストブロックと重なる面積の総和の二乗を、入力文書のテキストブロック面積の総和と登録済み文書のテキストブロック面積の総和の積で割った値を類似度とする。上述した類似度算出を、入力文書とすべての登録済み文書との間で行い、最も高い類似度が一定値以上であれば、その登録済み文書と同じ種類と判定し、最も高い類似度が一定値より小さければ、入力済み文書は登録済み文書内に無い種類であると判定する。なお、文書マッチングは上記の方法に限るものではない。例えば、文書識別情報として、OCR関連処理の結果として得られる文書内に含まれる文字列群を保持し、その類似性によってマッチングを行ってもよい。また、文書識別情報として画像データや画像データから得られる画像特徴量を保持しておき、画像特徴量の類似性を使っても行ってもよい。
ステップS1001において、CPU111は、ステップS1000で実行した文書マッチングの結果として、入力された文書が登録済み文書であった場合には、処理をステップS1002に進め、登録済み文書でなかった場合には、処理を終了する。
ステップS1002において、CPU111は、入力文書に対し、ステップS1000で同じ種類の文書であると判別された文書と、同じ文書IDを付与する。
ステップS1000において、CPU111は、文書マッチングを実行する。文書マッチングとは、入力された文書と同じ種類の文書が、インデックス抽出ルールと共に画像処理装置のデータベースに登録されている登録済みの文書の中にあるかどうかを判定し、同じ種類の文書があった場合にはその文書の種類を判別する処理である。本実施例では、まず、入力文書と各登録済み文書との間で、1対1で、OCR関連処理で得られるテキストブロックの形状や配置がどれだけ類似しているかを表す類似度の算出を行う。類似度算出では、まず、入力文書のテキストブロック全体と、登録済み文書のテキストブロック全体で位置合わせを行う。次に、入力文書内の各テキストブロックと、登録済み文書のテキストブロックと重なる面積の総和の二乗を、入力文書のテキストブロック面積の総和と登録済み文書のテキストブロック面積の総和の積で割った値を類似度とする。上述した類似度算出を、入力文書とすべての登録済み文書との間で行い、最も高い類似度が一定値以上であれば、その登録済み文書と同じ種類と判定し、最も高い類似度が一定値より小さければ、入力済み文書は登録済み文書内に無い種類であると判定する。なお、文書マッチングは上記の方法に限るものではない。例えば、文書識別情報として、OCR関連処理の結果として得られる文書内に含まれる文字列群を保持し、その類似性によってマッチングを行ってもよい。また、文書識別情報として画像データや画像データから得られる画像特徴量を保持しておき、画像特徴量の類似性を使っても行ってもよい。
ステップS1001において、CPU111は、ステップS1000で実行した文書マッチングの結果として、入力された文書が登録済み文書であった場合には、処理をステップS1002に進め、登録済み文書でなかった場合には、処理を終了する。
ステップS1002において、CPU111は、入力文書に対し、ステップS1000で同じ種類の文書であると判別された文書と、同じ文書IDを付与する。
ステップS1003において、CPU111は、インデックス抽出ルールの中から、ステップS1000で判別した文書の文書IDに紐づいたレコメンド情報を取得し、そのルールに基づいて、レコメンド内容であるファイル名を生成する。具体的には、まず、文書の種類毎に設定された位置のレコメンド用のテキストブロック群に対応する入力文書内のレコメンド用のテキストブロック群を取得する。その際、入力文書と登録文書とでは、スキャンタイミングによって画像全体の位置がずれていたり、記載内容にテキストブロックの大きさが変わったりすることがある。そこで、入力文書のテキストブロック全体と、登録済み文書のテキストブロック全体で位置合わせを行った上で、登録済み文書におけるレコメンド用テキストブロックと重なる入力文書内のレコメンド用のテキストブロック群を取得する。そして、取得された入力文書内のレコメンド用のテキストブロック群のOCR結果として得られる文字列をつなげた結果を、ファイル名としてレコメンドする。
<確認・修正画面>
図7のフローチャートの説明に戻る。
図7のステップS705において、CPU111は、操作・表示部123に、確認・修正画面を表示する。この確認・修正画面について図11A,Bを参照し説明する。なお、以下では、図11A及び図11Bを併せて図11という。
図11において、表示・操作部123は、タッチパネルディスプレイ領域1101と、ハードキー1102(数字キーや各種処理のスタートキーなど)とを備える。タッチパネルディスプレイ領域1101には、入力文書の読み取り画像データをプレビュー画像が表示される。プレビュー画像上をユーザがスワイプ操作することで、プレビュー画像を任意の方向のスクロールすることができる。また、ファイル名を表示・編集するためのテキストフィールド1103と、ファイル名を削除するための削除ボタン1104、プレビュー画像の表示倍率を拡大および縮小を可能とするボタン1105、1106が表示される。また、ファイル名の決定をキャンセルし、ひとつ前のファイルに戻るためのボタン1107と、ファイル名を決定するボタン1108が表示される。
ここで、図8(A)に示した文書が、ステップS702で選択され、図9Aに示したインデックス抽出ルールがステップS703で取得された場合、ステップS704では、選択中の文書は未登録の文書であると判定される。そのため、レコメンド内容であるファイル名が生成されず、図11(A)に示すように、ファイル名のテキストフィールド1103は空白の状態で表示される。ユーザは、この確認・修正画面において、プレビュー表示されている画像データ上のテキストブロックをタッチすることで、ファイルに付与するファイル名を指示することができる。例えば、図11(B)に示すように、送信元企業を表すテキストブロック1109をタッチした場合、テキストブロック1109がプレビュー上でハイライト表示される。そして、ファイル名のテキストフィールド1103には、テキストブロック1109のOCR結果のテキストである「ABCCo.」が表示される。同様に、書類番号を表すテキストブロック1110、日付を表すテキストブロック1111を順にタッチした結果を、それぞれ図11(C)と図11(D)に示す。このように、複数のテキストブロックをタッチした場合には、あらかじめ決められたセパレータであるアンダースコアでつなげた結果がファイル名となる。
一方、ステップS704において、レコメンド内容であるファイル名が生成された場合には、最初から、図11(D)に示すように、ファイル名に使用するテキストブロックがハイライトされ、ファイル名が表示された確認・修正画面が表示される。なお、必ずしもOCR結果のテキストをそのままファイル名に使用する必要はない。たとえば、図11(D)に示すように、テキストブロック1111のOCR結果として得られる「2019/04/01」というテキストであるとする。このテキストデータが日付であるYYYY/MM/DD形式であることを識別して、YYYYMMDD形式である「20190401」に変換してもよい。ユーザが決定ボタン1108を押下し、ファイル名を決定した場合には、処理をステップS706に進める。
図7のフローチャートの説明に戻る。
図7のステップS705において、CPU111は、操作・表示部123に、確認・修正画面を表示する。この確認・修正画面について図11A,Bを参照し説明する。なお、以下では、図11A及び図11Bを併せて図11という。
図11において、表示・操作部123は、タッチパネルディスプレイ領域1101と、ハードキー1102(数字キーや各種処理のスタートキーなど)とを備える。タッチパネルディスプレイ領域1101には、入力文書の読み取り画像データをプレビュー画像が表示される。プレビュー画像上をユーザがスワイプ操作することで、プレビュー画像を任意の方向のスクロールすることができる。また、ファイル名を表示・編集するためのテキストフィールド1103と、ファイル名を削除するための削除ボタン1104、プレビュー画像の表示倍率を拡大および縮小を可能とするボタン1105、1106が表示される。また、ファイル名の決定をキャンセルし、ひとつ前のファイルに戻るためのボタン1107と、ファイル名を決定するボタン1108が表示される。
ここで、図8(A)に示した文書が、ステップS702で選択され、図9Aに示したインデックス抽出ルールがステップS703で取得された場合、ステップS704では、選択中の文書は未登録の文書であると判定される。そのため、レコメンド内容であるファイル名が生成されず、図11(A)に示すように、ファイル名のテキストフィールド1103は空白の状態で表示される。ユーザは、この確認・修正画面において、プレビュー表示されている画像データ上のテキストブロックをタッチすることで、ファイルに付与するファイル名を指示することができる。例えば、図11(B)に示すように、送信元企業を表すテキストブロック1109をタッチした場合、テキストブロック1109がプレビュー上でハイライト表示される。そして、ファイル名のテキストフィールド1103には、テキストブロック1109のOCR結果のテキストである「ABCCo.」が表示される。同様に、書類番号を表すテキストブロック1110、日付を表すテキストブロック1111を順にタッチした結果を、それぞれ図11(C)と図11(D)に示す。このように、複数のテキストブロックをタッチした場合には、あらかじめ決められたセパレータであるアンダースコアでつなげた結果がファイル名となる。
一方、ステップS704において、レコメンド内容であるファイル名が生成された場合には、最初から、図11(D)に示すように、ファイル名に使用するテキストブロックがハイライトされ、ファイル名が表示された確認・修正画面が表示される。なお、必ずしもOCR結果のテキストをそのままファイル名に使用する必要はない。たとえば、図11(D)に示すように、テキストブロック1111のOCR結果として得られる「2019/04/01」というテキストであるとする。このテキストデータが日付であるYYYY/MM/DD形式であることを識別して、YYYYMMDD形式である「20190401」に変換してもよい。ユーザが決定ボタン1108を押下し、ファイル名を決定した場合には、処理をステップS706に進める。
ステップS706において、CPU111は、ステップS705において、ユーザから確認・修正画面を通じて指示された内容に基づいて、選択中の文書に対応するインデックス抽出ルールを作成する。
ステップS707において、CPU111は、ステップS704において生成されたファイル名を、ステップS705において、ユーザが修正したかを判定する。レコメンド内容を修正していた場合には、処理をステップS708に進め、修正していなかった場合には、処理をステップS711に進める。なお、ステップS704において、選択中の文書が登録済み文書ではないと判別された場合には、修正された場合と同様に、処理をステップS708に進める。
ステップS708において、CPU111は、選択中の画像グループに、文書IDが付与されているかどうかを判定する。文書IDが付与されている場合には、処理をステップS709へ進め、文書IDが付与されていない場合には、処理をステップS710に進める。
ステップS709において、CPU111は、該当する文書IDの文書識別情報およびレコメンド情報を、ステップS706で作成したインデックス抽出ルールに基づいて更新し、ステップS711に処理を進める。
ステップS710において、CPU111は、新規に文書IDを発行し、ステップS706で作成した文書識別情報およびレコメンド情報と組み合わせて新規にインデックス抽出ルールを登録し、ステップS711に処理を進める。
上記ステップS706~S708,S710によれば、ユーザが確認・修正画面においてファイル名を指示した場合(図11(B)~(D))、図9Bの文書ID「0002」に対応するインデックス抽出ルールが新規に登録される。
ステップS707において、CPU111は、ステップS704において生成されたファイル名を、ステップS705において、ユーザが修正したかを判定する。レコメンド内容を修正していた場合には、処理をステップS708に進め、修正していなかった場合には、処理をステップS711に進める。なお、ステップS704において、選択中の文書が登録済み文書ではないと判別された場合には、修正された場合と同様に、処理をステップS708に進める。
ステップS708において、CPU111は、選択中の画像グループに、文書IDが付与されているかどうかを判定する。文書IDが付与されている場合には、処理をステップS709へ進め、文書IDが付与されていない場合には、処理をステップS710に進める。
ステップS709において、CPU111は、該当する文書IDの文書識別情報およびレコメンド情報を、ステップS706で作成したインデックス抽出ルールに基づいて更新し、ステップS711に処理を進める。
ステップS710において、CPU111は、新規に文書IDを発行し、ステップS706で作成した文書識別情報およびレコメンド情報と組み合わせて新規にインデックス抽出ルールを登録し、ステップS711に処理を進める。
上記ステップS706~S708,S710によれば、ユーザが確認・修正画面においてファイル名を指示した場合(図11(B)~(D))、図9Bの文書ID「0002」に対応するインデックス抽出ルールが新規に登録される。
ステップS711において、CPU111は、選択中の画像グループの属性を、未確認属性から、確認済み属性に変更する。
ステップS712において、CPU111は、ステップS303で決定したすべての画像グループについて、確認済み属性が付与されているかどうか判定する。すべての画像グループについて、確認済み属性が付与されていれば、処理を終了し、そうでなければ、処理をステップS701へ戻る。
上述した確認・修正処理によって、図8(B)および図8(C)に示した画像を続けて処理する場合について説明する。
まず、ステップS702で図8(B)に示した文書が選択されると、ステップS703において、図9Bに示した更新済みのインデックス抽出ルールが取得される。ステップS704において、登録済み文書(文書ID「0002」)であると判定され、レコメンド結果のファイル名が取得される。この場合の、ステップS705において表示される確認・修正画面を、図12(A)に示す。このように、スキャン前に未登録であった同じ種類の文書が、一度にスキャンされた場合でも、1つの文書について、確認・修正画面においてユーザがファイル名を指示することで、もう1つの文書のファイル名をレコメンドすることができる。
ステップS712において、CPU111は、ステップS303で決定したすべての画像グループについて、確認済み属性が付与されているかどうか判定する。すべての画像グループについて、確認済み属性が付与されていれば、処理を終了し、そうでなければ、処理をステップS701へ戻る。
上述した確認・修正処理によって、図8(B)および図8(C)に示した画像を続けて処理する場合について説明する。
まず、ステップS702で図8(B)に示した文書が選択されると、ステップS703において、図9Bに示した更新済みのインデックス抽出ルールが取得される。ステップS704において、登録済み文書(文書ID「0002」)であると判定され、レコメンド結果のファイル名が取得される。この場合の、ステップS705において表示される確認・修正画面を、図12(A)に示す。このように、スキャン前に未登録であった同じ種類の文書が、一度にスキャンされた場合でも、1つの文書について、確認・修正画面においてユーザがファイル名を指示することで、もう1つの文書のファイル名をレコメンドすることができる。
次に、ステップS702において、図8(C)に示した文書が選択され、ステップS703において、図9Bに示した更新済みのインデックス抽出ルールが取得された場合について説明する。ステップS704において、選択中の文書は登録済み文書(文書ID「0001」)であると判定され、過去に登録していたインデックス抽出ルールに基づき、ファイル名がレコメンドされる。この場合の、ステップS705において表示される確認・修正画面を、図12(B)に示す。このように、一度に別々の種類のファイルがスキャンされた場合でも、過去に登録されているインデックス抽出ルールに基づいて、それぞれの文書の種類に応じたファイル名のレコメンドが可能になる。
以上、本実施例1によれば、複数の文書をスキャンした際にファイル分割を行い、それぞれの文書に対してファイル名等のインデックス項目をレコメンドする機能において、ユーザの手間を減らすことができる。また、同一スキャン内に複数の同じ種類の文書があった場合でも、その場で登録・修正したルールを適用することができる。さらに、ユーザによる確認・修正を行っているバックエンドで、先にすべての文書についてOCR関連の処理を実行しておくことで、ユーザの待ち時間を大きく減らすことができる。
以上、本実施例1によれば、複数の文書をスキャンした際にファイル分割を行い、それぞれの文書に対してファイル名等のインデックス項目をレコメンドする機能において、ユーザの手間を減らすことができる。また、同一スキャン内に複数の同じ種類の文書があった場合でも、その場で登録・修正したルールを適用することができる。さらに、ユーザによる確認・修正を行っているバックエンドで、先にすべての文書についてOCR関連の処理を実行しておくことで、ユーザの待ち時間を大きく減らすことができる。
実施例1では、確認・修正処理のバックエンドで、全画像グループについて図3のステップS306のOCR関連処理を実行し、各画像グループの確認・修正画面の表示前に、図7のS704に示すレコメンド内容生成処理を実行する例について説明した。実施例2では、確認・修正処理のバックエンドで、OCR関連処理だけでなく、レコメンド内容の生成までを行う。そして、各画像グループの確認・修正画面の表示前に、レコメンド内容を再生成する必要があるかどうかを判別し、再生成が必要な場合にのみ、インデックス抽出ルールの再生成処理を行う例について説明する。なお、以下では、実施例1と差異がある箇所についてのみ説明する。
図13は、本実施例に係る処理手順のフローチャートである。まず、図13と、図3に示した実施例1のフローチャートとの差異について説明する。
ステップS304において、確認/修正処理を並列起動した後、ステップS1301において、CPU111は、HDD120から第一のインデックス抽出ルールを取得し、RAM119に展開した上で取得する。第一のインデックス抽出ルールとは、本実施例において、一度だけ読み込まれ、ステップS303で分割された画像グループのそれぞれに対して一度適用されるものである。そして、後述するステップS1302のレコメンド内容生成処理において、利用されるインデックス抽出ルールである。
ステップS305~S306で、OCR関連処理が行われた後、ステップS1302において、CPU111は、レコメンド内容生成処理を実行する。ここでは、CPU111は、ステップS1301で取得した第一のインデックス抽出ルールに基づいて、ステップS305で選択した画像グループに対してレコメンドするファイル名を生成する。レコメンド内容生成処理の詳細は、実施例1において、図10を用いて説明した内容と同様である。
図13は、本実施例に係る処理手順のフローチャートである。まず、図13と、図3に示した実施例1のフローチャートとの差異について説明する。
ステップS304において、確認/修正処理を並列起動した後、ステップS1301において、CPU111は、HDD120から第一のインデックス抽出ルールを取得し、RAM119に展開した上で取得する。第一のインデックス抽出ルールとは、本実施例において、一度だけ読み込まれ、ステップS303で分割された画像グループのそれぞれに対して一度適用されるものである。そして、後述するステップS1302のレコメンド内容生成処理において、利用されるインデックス抽出ルールである。
ステップS305~S306で、OCR関連処理が行われた後、ステップS1302において、CPU111は、レコメンド内容生成処理を実行する。ここでは、CPU111は、ステップS1301で取得した第一のインデックス抽出ルールに基づいて、ステップS305で選択した画像グループに対してレコメンドするファイル名を生成する。レコメンド内容生成処理の詳細は、実施例1において、図10を用いて説明した内容と同様である。
並列処理のステップS1303では、CPU111は、ステップS303で分割したすべての画像グループについて、ユーザにファイル名をレコメンドし、ユーザの確認・修正指示に基づいてファイル名を確定する確認・修正処理を実行する。確認・修正処理の詳細については後述する。
<確認・修正処理の詳細説明>
図13のS1303で示す確認・修正処理の詳細について、図14のフローチャートを用いて説明する。本実施例において、確認・修正処理は、図13のステップS304で起動され、図13の処理フローと並列で動作する。なお、図14と、図7に示した実施例1のフローチャートとの差異についてのみ説明する。
ステップS1401において、CPU111は、第二のインデックス抽出ルールを作成し、RAM119に展開する。第二のインデックス抽出ルールとは、図13のステップS1301で取得した第一のインデックス抽出ルールに対して、確認・修正処理によってルールの更新や新規登録があった場合に、更新後の状態を一時的に保持するインデックス抽出ルールである。第二のインデックス抽出ルールでは、第一のインデックス抽出ルールに加えて、更新の有無や新規登録されたかといった更新情報を属性として持つ。第二のインデックス抽出ルールの初期状態は、ステップS1301で取得した第一のインデックス抽出ルールの内容である文書IDや文書識別情報、レコメンド情報と同じ内容で、初期の更新情報としては、更新なしの状態である。第二のインデックス抽出ルールの例を図15A,Bに示す。図15Aは、文書ID「0001」という文書1種類が登録されている第一のインデックス抽出ルールを元に生成した状態である。図15Bは、文書ID「0002」に対応するインデックス抽出ルールが新規に登録された状態を示している。
<確認・修正処理の詳細説明>
図13のS1303で示す確認・修正処理の詳細について、図14のフローチャートを用いて説明する。本実施例において、確認・修正処理は、図13のステップS304で起動され、図13の処理フローと並列で動作する。なお、図14と、図7に示した実施例1のフローチャートとの差異についてのみ説明する。
ステップS1401において、CPU111は、第二のインデックス抽出ルールを作成し、RAM119に展開する。第二のインデックス抽出ルールとは、図13のステップS1301で取得した第一のインデックス抽出ルールに対して、確認・修正処理によってルールの更新や新規登録があった場合に、更新後の状態を一時的に保持するインデックス抽出ルールである。第二のインデックス抽出ルールでは、第一のインデックス抽出ルールに加えて、更新の有無や新規登録されたかといった更新情報を属性として持つ。第二のインデックス抽出ルールの初期状態は、ステップS1301で取得した第一のインデックス抽出ルールの内容である文書IDや文書識別情報、レコメンド情報と同じ内容で、初期の更新情報としては、更新なしの状態である。第二のインデックス抽出ルールの例を図15A,Bに示す。図15Aは、文書ID「0001」という文書1種類が登録されている第一のインデックス抽出ルールを元に生成した状態である。図15Bは、文書ID「0002」に対応するインデックス抽出ルールが新規に登録された状態を示している。
ステップS1402において、CPU111は、RAM119に展開された第二のインデックス抽出ルールを取得する。
ステップS1403において、CPU111は、ステップS1402で取得した第二のインデックス抽出ルールに基づいて、第二のレコメンド内容生成処理を実行する。第二のレコメンド内容生成処理の詳細については後述する。
ステップS705、S706の後、第二のインデックス抽出ルールに修正があり(S707)、文書IDがある場合には(S708)、ステップS1404に処理を進め文書IDがない場合には、S1405に処理を進める。
ステップS1404において、CPU111は、該当する文書IDの文書識別情報およびレコメンド情報を、ステップS706で作成した第二のインデックス抽出ルールに基づいて更新し、更新情報を更新ありとして保持する。
ステップS1405において、CPU111は、新規に文書IDを発行し、ステップS706で作成した文書識別情報およびレコメンド情報と組み合わせて、第二のインデックス抽出ルールに新規登録し、更新状態を新規登録として保持する。
全グループの確認/修正処理が終了した場合には、続くステップS1406において、CPU111は、第二のインデックス抽出ルールを第一のインデックス抽出ルールに反映し、HDD120に格納する。
ステップS1403において、CPU111は、ステップS1402で取得した第二のインデックス抽出ルールに基づいて、第二のレコメンド内容生成処理を実行する。第二のレコメンド内容生成処理の詳細については後述する。
ステップS705、S706の後、第二のインデックス抽出ルールに修正があり(S707)、文書IDがある場合には(S708)、ステップS1404に処理を進め文書IDがない場合には、S1405に処理を進める。
ステップS1404において、CPU111は、該当する文書IDの文書識別情報およびレコメンド情報を、ステップS706で作成した第二のインデックス抽出ルールに基づいて更新し、更新情報を更新ありとして保持する。
ステップS1405において、CPU111は、新規に文書IDを発行し、ステップS706で作成した文書識別情報およびレコメンド情報と組み合わせて、第二のインデックス抽出ルールに新規登録し、更新状態を新規登録として保持する。
全グループの確認/修正処理が終了した場合には、続くステップS1406において、CPU111は、第二のインデックス抽出ルールを第一のインデックス抽出ルールに反映し、HDD120に格納する。
<第二のレコメンド内容生成処理の詳細説明>
第二のレコメンド内容生成処理のフローチャートを図16に示す。
ステップS1601において、CPU111は、図14のステップS702で選択された画像グループに対して、図13のステップS1302のレコメンド内容生成処理で登録済み文書として判定され、文書IDが付与されているかどうかを判定する。文書IDが付与されていない場合すなわち第二のインデックス抽出ルールに登録されていない文書画像の場合、処理をステップS1602へ進め、文書IDが付与されている場合、処理をステップS1607へ進める。
ステップS1602において、CPU111は、図14のステップS1402で取得した第二のインデックス抽出ルールの中に、更新情報の属性に新規のルールがあるかどうかを判定する。新規のルールがある場合、処理をステップS1603に進み、新規のルールがない場合には処理を終了する。これにより、新規のルールがない場合には、図14のステップS705において、図13のステップS1302のレコメンド内容生成処理の結果がレコメンドされ、確認・修正画面の表示にかかる時間を減らすことができる。
ステップS1603において、CPU111は、選択中の文書と、第二のインデックス抽出ルールのうち、新規に登録された文書のみとの間で文書マッチングを実行する。一般的に、文書マッチングは、マッチング対象の登録済み文書の数に応じて処理時間が増えるため、このようにマッチング対象を新規に登録された文書のみに限定することで、処理時間を減らすことができる。
ステップS1604において、CPU111は、ステップS1603で実行した文書マッチングの結果として、入力された文書が新規登録済み文書であった場合には、処理をステップS1605に進め、そうでなかった場合には、処理を終了する。新規文書登録済み文書でなかった場合には、レコメンド内容であるファイル名が生成されず、確認・表示画面において、ユーザによるファイル名の指示を受け付ける。
第二のレコメンド内容生成処理のフローチャートを図16に示す。
ステップS1601において、CPU111は、図14のステップS702で選択された画像グループに対して、図13のステップS1302のレコメンド内容生成処理で登録済み文書として判定され、文書IDが付与されているかどうかを判定する。文書IDが付与されていない場合すなわち第二のインデックス抽出ルールに登録されていない文書画像の場合、処理をステップS1602へ進め、文書IDが付与されている場合、処理をステップS1607へ進める。
ステップS1602において、CPU111は、図14のステップS1402で取得した第二のインデックス抽出ルールの中に、更新情報の属性に新規のルールがあるかどうかを判定する。新規のルールがある場合、処理をステップS1603に進み、新規のルールがない場合には処理を終了する。これにより、新規のルールがない場合には、図14のステップS705において、図13のステップS1302のレコメンド内容生成処理の結果がレコメンドされ、確認・修正画面の表示にかかる時間を減らすことができる。
ステップS1603において、CPU111は、選択中の文書と、第二のインデックス抽出ルールのうち、新規に登録された文書のみとの間で文書マッチングを実行する。一般的に、文書マッチングは、マッチング対象の登録済み文書の数に応じて処理時間が増えるため、このようにマッチング対象を新規に登録された文書のみに限定することで、処理時間を減らすことができる。
ステップS1604において、CPU111は、ステップS1603で実行した文書マッチングの結果として、入力された文書が新規登録済み文書であった場合には、処理をステップS1605に進め、そうでなかった場合には、処理を終了する。新規文書登録済み文書でなかった場合には、レコメンド内容であるファイル名が生成されず、確認・表示画面において、ユーザによるファイル名の指示を受け付ける。
ステップS1605において、CPU111は、入力文書に対し、ステップS1603の文書マッチングの結果として、同じ種類の文書であると判別された文書と、同じ文書IDを付与する。
続くステップS1606において、CPU111は、第二のインデックス抽出ルールの中から、ステップS1603で判別した文書の種類に紐づいたレコメンド情報を取得し、そのルールに基づいて、レコメンド内容であるファイル名を生成する。
一方、画像グループに文書IDがあった場合、ステップS1607において、CPU111は、第二のインデックス抽出ルールの、入力文書に付与された文書IDに紐づいた更新情報を参照し、更新ありかどうかを判定する。更新ありの場合、処理をステップS1608へ進め、更新なしの場合、処理を終了する。これにより、更新がなかった場合には、図14のステップS705において、図13のステップS1302のレコメンド内容生成処理の結果がレコメンドされ、確認・修正画面の表示にかかる時間を減らすことができる。また、更新があった場合でも、文書マッチングを行う必要がなく、後述のステップS1608において、レコメンド内容を生成するだけでよいため、確認・修正画面の表示にかかる時間を減らすことができる。
ステップS1608において、CPU111は、第二のインデックス抽出ルールの中から、入力文書の文書IDに紐づいたレコメンド情報を取得し、そのレコメンド情報に基づいて、レコメンド内容であるファイル名を生成する。
以上、実施例2によれば、ユーザによる確認・修正を行っているバックエンドで、先にすべての文書について一度レコメンド内容の生成処理を実行し、必要に応じてレコメンド内容の再生成処理を行う。これにより、1文書ごとの確認・修正画面の表示までにかかる時間を減らすことで、実施例1と比べて、さらにユーザの待ち時間を大きく減らすことができる。
続くステップS1606において、CPU111は、第二のインデックス抽出ルールの中から、ステップS1603で判別した文書の種類に紐づいたレコメンド情報を取得し、そのルールに基づいて、レコメンド内容であるファイル名を生成する。
一方、画像グループに文書IDがあった場合、ステップS1607において、CPU111は、第二のインデックス抽出ルールの、入力文書に付与された文書IDに紐づいた更新情報を参照し、更新ありかどうかを判定する。更新ありの場合、処理をステップS1608へ進め、更新なしの場合、処理を終了する。これにより、更新がなかった場合には、図14のステップS705において、図13のステップS1302のレコメンド内容生成処理の結果がレコメンドされ、確認・修正画面の表示にかかる時間を減らすことができる。また、更新があった場合でも、文書マッチングを行う必要がなく、後述のステップS1608において、レコメンド内容を生成するだけでよいため、確認・修正画面の表示にかかる時間を減らすことができる。
ステップS1608において、CPU111は、第二のインデックス抽出ルールの中から、入力文書の文書IDに紐づいたレコメンド情報を取得し、そのレコメンド情報に基づいて、レコメンド内容であるファイル名を生成する。
以上、実施例2によれば、ユーザによる確認・修正を行っているバックエンドで、先にすべての文書について一度レコメンド内容の生成処理を実行し、必要に応じてレコメンド内容の再生成処理を行う。これにより、1文書ごとの確認・修正画面の表示までにかかる時間を減らすことで、実施例1と比べて、さらにユーザの待ち時間を大きく減らすことができる。
(その他の実施例)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (1)
- 画像処理装置であって、
複数の文書の画像データを取得する取得手段と、
前記画像データを分割して複数のファイルを作成する作成手段と、
前記ファイルに対してOCR関連処理を実行するOCR関連処理手段と、
前記ファイルの文書と登録済み文書とのマッチングを行い、文書の種類を判別する判別手段と、
前記登録済み文書に紐づいたインデックス抽出ルールに従って、前記ファイルの文書からインデックスに関するレコメンド内容を生成する生成処理手段と、
前記レコメンド内容をユーザに提示して、ユーザの修正指示に基づきインデックス及びインデックス抽出ルールの修正処理を実行する修正処理手段と、
前記ファイルにインデックスを付与する付与手段と、
を備え、
前記OCR関連処理手段を含む第1の処理手段と、前記修正処理手段を含む第2の処理手段が並列して起動される
ことを特徴とする画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2023186748A JP2024012448A (ja) | 2019-09-30 | 2023-10-31 | 画像処理装置、画像処理装置の制御方法及びそのプログラム |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019179738A JP7379051B2 (ja) | 2019-09-30 | 2019-09-30 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
JP2023186748A JP2024012448A (ja) | 2019-09-30 | 2023-10-31 | 画像処理装置、画像処理装置の制御方法及びそのプログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179738A Division JP7379051B2 (ja) | 2019-09-30 | 2019-09-30 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024012448A true JP2024012448A (ja) | 2024-01-30 |
Family
ID=75161960
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179738A Active JP7379051B2 (ja) | 2019-09-30 | 2019-09-30 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
JP2023186748A Pending JP2024012448A (ja) | 2019-09-30 | 2023-10-31 | 画像処理装置、画像処理装置の制御方法及びそのプログラム |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179738A Active JP7379051B2 (ja) | 2019-09-30 | 2019-09-30 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US11620844B2 (ja) |
JP (2) | JP7379051B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11709640B2 (en) * | 2021-05-25 | 2023-07-25 | Toshiba Tec Kabushiki Kaisha | Method and system for managing pages of documents on a multi-function printer |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
JP3558493B2 (ja) * | 1997-06-10 | 2004-08-25 | 富士通株式会社 | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6289342B1 (en) * | 1998-01-05 | 2001-09-11 | Nec Research Institute, Inc. | Autonomous citation indexing and literature browsing using citation context |
US20030042319A1 (en) * | 2001-08-31 | 2003-03-06 | Xerox Corporation | Automatic and semi-automatic index generation for raster documents |
JP4298287B2 (ja) | 2002-12-27 | 2009-07-15 | キヤノンマーケティングジャパン株式会社 | データ処理装置およびデータ処理方法および制御プログラム |
US8176004B2 (en) * | 2005-10-24 | 2012-05-08 | Capsilon Corporation | Systems and methods for intelligent paperless document management |
JP5121557B2 (ja) * | 2008-05-12 | 2013-01-16 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
US8990235B2 (en) * | 2009-03-12 | 2015-03-24 | Google Inc. | Automatically providing content associated with captured information, such as information captured in real-time |
JP4940270B2 (ja) | 2009-07-06 | 2012-05-30 | シャープ株式会社 | 画像形成装置 |
US8824803B2 (en) * | 2012-08-31 | 2014-09-02 | Ancestry.Com Operations Inc. | Automated field position linking of indexed data to digital images |
US9588971B2 (en) * | 2014-02-03 | 2017-03-07 | Bluebeam Software, Inc. | Generating unique document page identifiers from content within a selected page region |
JP2015215878A (ja) | 2014-04-21 | 2015-12-03 | 株式会社リコー | 画像処理装置及び画像処理システム |
JP6881990B2 (ja) * | 2017-01-30 | 2021-06-02 | キヤノン株式会社 | 画像処理装置とその制御方法、及びプログラム |
-
2019
- 2019-09-30 JP JP2019179738A patent/JP7379051B2/ja active Active
-
2020
- 2020-09-25 US US17/032,083 patent/US11620844B2/en active Active
-
2023
- 2023-03-07 US US18/179,816 patent/US20230206672A1/en active Pending
- 2023-10-31 JP JP2023186748A patent/JP2024012448A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20210097275A1 (en) | 2021-04-01 |
US20230206672A1 (en) | 2023-06-29 |
JP7379051B2 (ja) | 2023-11-14 |
US11620844B2 (en) | 2023-04-04 |
JP2021057783A (ja) | 2021-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10984233B2 (en) | Image processing apparatus, control method, and non-transitory storage medium that obtain text data for an image | |
JP4405831B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP5223284B2 (ja) | 情報検索装置、方法およびプログラム | |
JP4533273B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
JP6849387B2 (ja) | 画像処理装置、画像処理システム、画像処理装置の制御方法、及びプログラム | |
JP2004265384A (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP2018124656A (ja) | 画像処理装置とその制御方法、及びプログラム | |
US11144189B2 (en) | Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas | |
US10757290B2 (en) | Image processing apparatus being able to simultaneously read and extract image data | |
KR20240020719A (ko) | 정보 처리 장치, 저장 매체, 및 저장 방법 | |
JP2024012448A (ja) | 画像処理装置、画像処理装置の制御方法及びそのプログラム | |
US11301675B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2022162908A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2022170175A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
JP2009048096A (ja) | 画像処理装置、画像形成装置、処理条件設定方法および処理条件設定プログラム | |
CN111580758B (zh) | 图像形成装置 | |
JP6700705B2 (ja) | 振り分けシステム、情報処理方法、及びプログラム | |
JP2006333248A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
CN111669478A (zh) | 图像处理装置、图像处理系统、存储介质及图像处理方法 | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2021144673A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP2019134364A (ja) | スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム | |
JP2019074875A (ja) | 情報処理装置、制御方法、およびプログラム | |
JP2021068289A (ja) | 画像処理装置、情報処理方法及びプログラム | |
JP2022044454A (ja) | プログラムおよびデバイス |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231128 |