JP2021057783A - 画像処理装置、画像処理装置の制御方法及びそのプログラム - Google Patents
画像処理装置、画像処理装置の制御方法及びそのプログラム Download PDFInfo
- Publication number
- JP2021057783A JP2021057783A JP2019179738A JP2019179738A JP2021057783A JP 2021057783 A JP2021057783 A JP 2021057783A JP 2019179738 A JP2019179738 A JP 2019179738A JP 2019179738 A JP2019179738 A JP 2019179738A JP 2021057783 A JP2021057783 A JP 2021057783A
- Authority
- JP
- Japan
- Prior art keywords
- document
- processing
- file
- image
- correction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012545 processing Methods 0.000 title claims abstract description 159
- 238000000034 method Methods 0.000 title claims description 99
- 238000012937 correction Methods 0.000 claims abstract description 76
- 238000000605 extraction Methods 0.000 claims abstract description 71
- 238000005192 partition Methods 0.000 claims description 14
- 238000012790 confirmation Methods 0.000 abstract description 55
- 230000006870 function Effects 0.000 description 8
- 230000000717 retained effect Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
Description
また、特許文献2の手法では、登録済み文書のレコメンドを行うだけでなく、ユーザによるレコメンド結果の修正や、未登録文書の命名操作を受け付ける確認用のUIを提供する。これにより、インデックス抽出ルールの初期設定を行うことなく、ユーザが命名操作や修正操作を繰り返して行うだけで、インデックス抽出ルールを自動的に学習することが可能となる。
本発明は、上記事情に鑑みてなされたものであり、インデックス抽出ルールを自動学習しながらの複数ファイルのレコメンドを実現するにあたり、ユーザの手間を減らすことを目的とする。
図1は、本実施例を適用可能なシステムの全体構成を示す図である。図1に示すように、画像処理装置100はLAN102に接続され、Internet 103等を介してPCなどの端末101等と通信可能になっている。なお、本実施例の実現にあたっては、PCなどの端末101に関しては、必ずしも必要なくてもよく、画像処理装置100のみの構成だけでも良い。
画像処理装置100は、例えば、表示・操作部、スキャナ部及び、プリンタ部を有する複合機(MFP)であり、スキャナ部を用いて文書原稿をスキャンするスキャン端末として利用することが可能である。また、タッチパネルやハードボタンなどの表示・操作部を有し、ファイル名や格納先のレコメンド結果を表示したり、ユーザからの指示を受け付けたりするためのユーザインタフェースの表示を行う。
なお、本実施例では、画像処理装置100単体で、スキャン処理、ファイル分割処理、OCR関連処理、レコメンド内容の生成処理、ファイル送信を行う例について説明するが、その一部を他の端末101で行うように構成したシステムであっても構わない。例えば、まず、スキャン処理とファイル分割処理とを画像処理装置100で実行して、スキャン画像を他の端末101にネットワークを介して送信する。そして、他の端末101においてOCR関連処理やレコメンド内容の生成処理を実行し、レコメンド結果を画像処理装置100に返信して、画像処理装置100でファイルを生成してファイル送信を行うようにしてもよい。
図2は、画像処理装置100の構成を示すブロック図である。制御部110は、CPU111、記憶装置112、プリンタI/F部113、ネットワークI/F部114、スキャナI/F部115、表示・操作I/F部116がシステムバス117を介して互いに通信可能に接続されている。制御部110は、画像処理装置100全体の動作を制御する。
CPU111は、記憶装置112に記憶された制御プログラムを読み出し実行することにより、後述のフローチャートにおける各処理(読取制御や画像処理、表示制御など)を実行する手段として機能する。
記憶装置112は、上記プログラム、画像データ、メタデータ、設定データ及び処理結果データなどを格納し保持する。記憶装置112には、不揮発性メモリであるROM118、揮発性メモリであるRAM119及び大容量記憶領域であるHDD120などがある。
ROM118は、制御プログラムなどを保持する不揮発性メモリであり、CPU111はその制御プログラムを読み出し制御を行う。
RAM119は、CPU111の主メモリ、ワークエリア等の一時記憶領域として用いられる揮発性メモリである。
ネットワークI/F部114は、制御部110を、システムバス117を介してLAN102に接続する。ネットワークI/F部114は、LAN102上の外部装置に画像データを送信したり、LAN102上の外部装置から各種情報を受信したりする。
表示・操作部I/F部116は、表示・操作部123と制御部110とを、システムバス117を介して接続する。表示・操作部123には、タッチパネル機能を有する液晶表示部やハードボタンなどが備えられている。
プリンタI/F部113は、プリンタ部121と制御部110とを、システムバス117を介して接続する。プリンタ部121は、CPU111で生成された画像データをプリンタI/F部113を介して受信し、当該受信した画像データを用いて記録紙へのプリント処理が行われる。
以上のように、本実施例に係る画像処理装置100では、上記のハードウェア構成によって、画像処理機能を提供することが可能である。
本実施例における処理の概要は、画像処理装置100が複数の文書原稿を読み取り、ファイル分割設定にしたがって画像データを複数のファイルに分割する。そして、それぞれのファイルに付与するファイル名を、インデックス抽出ルールに基づいて、各ファイルの先頭ページのOCR結果の文字列を利用して生成し、表示・操作部123を通じてユーザにレコメンド内容を提示する。ユーザは、表示・操作部123において、ファイル名が正しくレコメンド内容が提示されているかどうかを確認し、間違っている場合には修正指示を行う。ユーザの操作結果に基づいて、修正があった場合にはインデックス抽出ルールを更新する。分割後の全てのファイルについて、ユーザによる確認・修正処理が終わると、ファイル名を各ファイルに付与して送信する。
続いて、本実施例における画像処理装置100が実行する処理手順を図3のフローチャートを用いて詳述する。なお、画像処理装置100のCPU111が、ROM118に格納されている処理プログラムをRAM119にロードして実行することにより、図3の各ステップの処理を実行する処理部として機能する。
ステップS301において、画像処理装置100は、表示・操作部123からユーザの指示を受け付けると、スキャナ部122において、原稿フィーダのトレイから複数の文書原稿を1枚ずつ読み取り、画像データを取得する。
ステップS302において、CPU111は、記憶装置112からファイル分割設定を取得する。なお、ファイル分割設定は、事前に表示・操作部123からユーザの指示を受け付けたものを取得してもよいし、予め決められた固定の設定を取得してもよい。
ステップS304において、CPU111は、ステップS309で示す確認・修正処理を並列で起動し、処理をステップS305へ進める。
以下のステップS305〜ステップS307のOCR関連処理が終わり未確認属性の付与がされたファイルから並列にステップS309の処理が実行される。
ステップS305において、CPU111は、ステップS303で決定した画像グループのうち、OCR関連処理を実行していないファイルの1つを、読み取りの早い順にしたがって選択する。
ステップS306において、CPU111は、ステップS305で選択したファイルの先頭ページの画像に対して、OCR関連処理を実行する。OCR関連処理の詳細については後述する。
ステップS307において、CPU111は、ステップS305で選択し、ステップS306でOCR関連処理を実行したファイルについて、未確認属性を付与する。未確認属性とは、ステップS304で並列起動した確認・修正処理の処理待ちであることを表す属性のことである。
一方、並列処理されるステップS309において、CPU111は、ステップS303で決定したすべての画像グループについて、ユーザにレコメンド内容であるファイル名を提示する。その後、ユーザの確認・修正指示に基づいてファイル名を確定する確認・修正処理を実行する。確認・修正処理の詳細については後述する。
ステップS310において、CPU111は、ステップS303で決定したすべての画像グループについて、確認・修正処理が終わったかどうかを判定する。すべての画像グループについて、確認・修正処理が終わるまで待機し、終わった場合には処理をステップS311に進める。
ステップS311において、CPU111は、ステップS309で確認・修正を終えて決定されたファイル名の一覧を、表示・操作部123に表示する。
ステップS312において、CPU111は、ステップS303で決定した画像グループのそれぞれからファイルを作成する。それぞれのファイルには、ステップS309において、ユーザによる確認・修正を終えて決定されたファイル名を付与する。本実施例ではPDF(Portable Document Format)化し、保存する例を示す。PDFの場合には、画像をページに分け保存することが可能であり、ステップS303で決定した画像グループ内の各画像データを、別々のページとして1つのファイルに保存する。
ステップS313において、CPU111は、ステップS312で作成したファイルを、LAN102を通じて送信先に送信する。
次に、ステップS303における分割位置決定処理について説明する。
図4に、ファイル分割設定ごとの、ページ分割処理の処理イメージを示す。
図4(A)は、ファイル分割設定として、ページ数分割を設定した場合の分割位置の例である。ページ数分割とは、あらかじめ設定されたページ数ごとに分割位置を決定する方法である。ページ数は、ユーザによって表示・操作部123で指示されたり、スキャン設定に従ってあらかじめ固定のページ数が指定されたりする。
例として、ステップS301で、6ページ分の画像データを取得され、2ページごとの分割が設定された場合、分割位置は2ページ目と3ページ目の間、4ページ目と5ページ目の間に設定される。
図4(B)は、ファイル分割設定として、仕切りページ分割を設定した場合の例である。仕切りページ分割とは、画像データを解析し、仕切りページとして認識した場合に、その仕切りページを取り除いた上で、仕切りページのあった位置に分割位置を設定する方法である。ユーザは、分割したい文書と文書の間に仕切りページを挿入した上で、原稿フィーダに文書群をセットする必要がある。
例として、ステップS301で、6ページ分の画像データを取得され、3ページ目と5ページ目が仕切りページであった場合には、まず、3ページ目と5ページ目の画像データが取り除かれる。そして、分割位置は2ページ目と4ページ目、4ページ目と6ページ目の画像の間に設定される。
仕切りページとしては、何も印刷されていない白紙や、バーコードや二次元コードを印刷した用紙を使用すればよい。白紙を仕切りページとして使用する場合には、画像データ内に含まれる一定の画素値以下の画素数や、一定の面積以上の有色画素塊が含まれるかなどを利用して、白紙であるかどうかを判定することで仕切りページの認識を行う。バーコードや二次元コードを印刷した用紙を使用する場合には、まず、画像データ内からバーコードや二次元コードを検出する。そして、検出したバーコードや二次元コードをデコードした結果に、仕切りページであることを識別する情報が含まれるかどうかによって仕切りページの認識を行う。バーコードや二次元コードを用いた仕切りページ用紙は、特定のPCアプリケーションを用いて印刷してもよい。または、画像処理装置100内のアプリケーションを用いて、表示・操作部123から枚数や用紙サイズなどを受け付け、プリンタ部121で印刷してもよい。
例として、ステップS301で、6ページ分の画像データが取得され、1ページ目、3ページ目、5ページ目が表紙ページとして認識された場合、分割位置は2ページ目と3ページ目の間、4ページ目と5ページ目の間に設定される。表示ページの認識方法としては、例えば表紙ページの画像データを事前に登録しておき、画像の比較によって認識する。表紙ページの画像データは、画像処理装置100内のアプリケーションを用いて、表紙ページとなる文書原稿をスキャナ部122で読み込んで登録してもよいし、外部からLAN102、ネットワークI/F部114を通じて登録してもよい。画像の比較では、画像から算出した局所特徴量の一致度に基づいて、登録された表紙ページと同じであるかどうかを認識する。なお、表紙ページの認識は、画像の比較に限定するものではない。
その他の方法として、例えば、画像内の文書に含まれる文字や罫線の配置といったレイアウト特徴を抽出し、レイアウト特徴の比較によって認識してもよい。また、表紙ページを事前に登録するのではなく、表紙ページに特定の文字列やバーコード、二次元コードが含まれるかどうかで認識してもよい。
次にステップS306におけるOCR関連処理の詳細について、図5を用いて説明する。図5は、画像データ一枚に対して、OCRとその前処理を含めたOCR関連処理を実行する処理手順を示すフローチャートである。
ステップS501において、CPU111は、画像データから傾きの角度を検出し、検出した傾きだけ逆方向に画像を回転することで、傾きを補正した画像データを取得する。
傾き補正の対象となる傾きとは、スキャナ部122による読み取り時に、原稿フィーダ内のローラの摩耗などが原因でまっすぐに原稿が読み取られなかったり、原稿の印刷時にまっすぐ印字できなかったりするような傾きである。
傾き検出では、まず、画像データ内に含まれるオブジェクトを検出し、水平方向あるいは鉛直方向に隣り合うオブジェクト群を連結する。そして、連結されたオブジェクトの中心位置を結んだ角度が、水平方向あるいは鉛直方向からどれだけ傾いているかを取得することで傾きを求める。なお、傾き検出は上記の方法に限るものではない。例えば、画像データ内に含まれるオブジェクトの中心座標を取得し、0.1度単位で中心座標群を回転させながら、中心座標群が水平方向あるいは垂直方向に並ぶ割合がもっとも高い角度を傾きとして求めてもよい。この傾き補正によって、画像の傾きを補正することで、後述する回転補正およびブロックセレクション処理、OCRのそれぞれの処理精度を上げることが可能となる。
ステップS503において、CPU111は、ステップS502で取得した回転補正後画像に対し、ブロックセレクション処理を実行する。ブロックセレクション処理とは、画像を前景領域と背景領域に分類した上で、前景領域をテキストブロックやそれ以外のブロックに分割する判定処理である。
図5のフローチャートの説明に戻ると、ステップS504において、CPU111は、ステップS503で取得したテキストブロックに対してOCRを実行し、各テキストブロックに対応する文字列を結果として取得する。
確認・修正処理(図3のS309)の詳細について説明する。本実施例において、確認・修正処理(S309)は、図3のステップS304で起動され、図3の処理フロー(S305〜S308)と並列で動作する。確認・修正処理は、分割後の各ファイルに付与するファイル名をユーザにレコメンド内容を提示し、ユーザの指示に基づいて確定する処理である。図7は、確認・修正処理の処理ステップを表すフローチャートである。図8は、各画像グループの先頭ページの画像データであり、図8(A)、図8(B)、図8(C)の並び順は読み取りの早い順である。図8(A)と図8(B)は同じ種類の文書で、記載内容が一部異なる文書であり、図8(C)は異なる種類の文書である。以下に、図8の画像データを読み込んだ際の確認・修正処理の振る舞いを、図7のフローチャートを用いて説明する。
ステップS702において、CPU111は、未確認属性の付与された画像グループの1つを、読み取りの早い順にしたがって選択する。
ステップS703において、CPU111は、HDD120からインデックス抽出ルールを取得し、RAM119に展開した上で取得する。インデックス抽出ルールの例を図9A,Bに示す。図9Aは、文書ID「0001」という文書1種類が登録されている状態を表し、図9Bは、それに加え、文書ID「0002」という文書が登録されている状態を表す。インデックス抽出ルールは、登録文書1つについて、文書IDと文書識別情報とレコメンド情報の組み合わせであり、登録済み文書の数だけこれらの組み合わせを保持する。文書IDとは文書の種類を表すユニークなIDである。文書識別情報は、後述する文書マッチングで使用する文書の種類を識別するために必要な情報であり、OCR関連処理を実行して得られるテキストブロック群を利用する。レコメンド情報は、レコメンドする内容を、入力文書から抽出するためのルールであり、登録済み文書内の特定のテキストブロック群の座標および、そのテキストブロック群のOCR結果をどの順番でつなげてファイル名とするかという順番の情報を持つ。なお、本実施例では、ファイル名をレコメンドする場合の例の詳細を後述するが、レコメンド情報としてファイルの送付先のフォルダ情報や、テキストブロック群のOCR結果をメタデータとして付与するための情報を保持してもよい。また、図9A,Bに示したように、読み取った画像データのサムネイルを一緒に保持してもよい。
ステップS704において、CPU111は、ステップS703で取得したインデックス抽出ルールに基づいて、ステップS702で選択した画像グループに対してレコメンドするファイル名を生成するレコメンド内容生成処理を実行する。レコメンド内容生成処理の処理手順を示したフローチャートが図10である。
ステップS1000において、CPU111は、文書マッチングを実行する。文書マッチングとは、入力された文書と同じ種類の文書が、インデックス抽出ルールと共に画像処理装置のデータベースに登録されている登録済みの文書の中にあるかどうかを判定し、同じ種類の文書があった場合にはその文書の種類を判別する処理である。本実施例では、まず、入力文書と各登録済み文書との間で、1対1で、OCR関連処理で得られるテキストブロックの形状や配置がどれだけ類似しているかを表す類似度の算出を行う。類似度算出では、まず、入力文書のテキストブロック全体と、登録済み文書のテキストブロック全体で位置合わせを行う。次に、入力文書内の各テキストブロックと、登録済み文書のテキストブロックと重なる面積の総和の二乗を、入力文書のテキストブロック面積の総和と登録済み文書のテキストブロック面積の総和の積で割った値を類似度とする。上述した類似度算出を、入力文書とすべての登録済み文書との間で行い、最も高い類似度が一定値以上であれば、その登録済み文書と同じ種類と判定し、最も高い類似度が一定値より小さければ、入力済み文書は登録済み文書内に無い種類であると判定する。なお、文書マッチングは上記の方法に限るものではない。例えば、文書識別情報として、OCR関連処理の結果として得られる文書内に含まれる文字列群を保持し、その類似性によってマッチングを行ってもよい。また、文書識別情報として画像データや画像データから得られる画像特徴量を保持しておき、画像特徴量の類似性を使っても行ってもよい。
ステップS1001において、CPU111は、ステップS1000で実行した文書マッチングの結果として、入力された文書が登録済み文書であった場合には、処理をステップS1002に進め、登録済み文書でなかった場合には、処理を終了する。
ステップS1002において、CPU111は、入力文書に対し、ステップS1000で同じ種類の文書であると判別された文書と、同じ文書IDを付与する。
図7のフローチャートの説明に戻る。
図7のステップS705において、CPU111は、操作・表示部123に、確認・修正画面を表示する。この確認・修正画面について図11A,Bを参照し説明する。なお、以下では、図11A及び図11Bを併せて図11という。
図11において、表示・操作部123は、タッチパネルディスプレイ領域1101と、ハードキー1102(数字キーや各種処理のスタートキーなど)とを備える。タッチパネルディスプレイ領域1101には、入力文書の読み取り画像データをプレビュー画像が表示される。プレビュー画像上をユーザがスワイプ操作することで、プレビュー画像を任意の方向のスクロールすることができる。また、ファイル名を表示・編集するためのテキストフィールド1103と、ファイル名を削除するための削除ボタン1104、プレビュー画像の表示倍率を拡大および縮小を可能とするボタン1105、1106が表示される。また、ファイル名の決定をキャンセルし、ひとつ前のファイルに戻るためのボタン1107と、ファイル名を決定するボタン1108が表示される。
ここで、図8(A)に示した文書が、ステップS702で選択され、図9Aに示したインデックス抽出ルールがステップS703で取得された場合、ステップS704では、選択中の文書は未登録の文書であると判定される。そのため、レコメンド内容であるファイル名が生成されず、図11(A)に示すように、ファイル名のテキストフィールド1103は空白の状態で表示される。ユーザは、この確認・修正画面において、プレビュー表示されている画像データ上のテキストブロックをタッチすることで、ファイルに付与するファイル名を指示することができる。例えば、図11(B)に示すように、送信元企業を表すテキストブロック1109をタッチした場合、テキストブロック1109がプレビュー上でハイライト表示される。そして、ファイル名のテキストフィールド1103には、テキストブロック1109のOCR結果のテキストである「ABCCo.」が表示される。同様に、書類番号を表すテキストブロック1110、日付を表すテキストブロック1111を順にタッチした結果を、それぞれ図11(C)と図11(D)に示す。このように、複数のテキストブロックをタッチした場合には、あらかじめ決められたセパレータであるアンダースコアでつなげた結果がファイル名となる。
一方、ステップS704において、レコメンド内容であるファイル名が生成された場合には、最初から、図11(D)に示すように、ファイル名に使用するテキストブロックがハイライトされ、ファイル名が表示された確認・修正画面が表示される。なお、必ずしもOCR結果のテキストをそのままファイル名に使用する必要はない。たとえば、図11(D)に示すように、テキストブロック1111のOCR結果として得られる「2019/04/01」というテキストであるとする。このテキストデータが日付であるYYYY/MM/DD形式であることを識別して、YYYYMMDD形式である「20190401」に変換してもよい。ユーザが決定ボタン1108を押下し、ファイル名を決定した場合には、処理をステップS706に進める。
ステップS707において、CPU111は、ステップS704において生成されたファイル名を、ステップS705において、ユーザが修正したかを判定する。レコメンド内容を修正していた場合には、処理をステップS708に進め、修正していなかった場合には、処理をステップS711に進める。なお、ステップS704において、選択中の文書が登録済み文書ではないと判別された場合には、修正された場合と同様に、処理をステップS708に進める。
ステップS708において、CPU111は、選択中の画像グループに、文書IDが付与されているかどうかを判定する。文書IDが付与されている場合には、処理をステップS709へ進め、文書IDが付与されていない場合には、処理をステップS710に進める。
ステップS709において、CPU111は、該当する文書IDの文書識別情報およびレコメンド情報を、ステップS706で作成したインデックス抽出ルールに基づいて更新し、ステップS711に処理を進める。
ステップS710において、CPU111は、新規に文書IDを発行し、ステップS706で作成した文書識別情報およびレコメンド情報と組み合わせて新規にインデックス抽出ルールを登録し、ステップS711に処理を進める。
上記ステップS706〜S708,S710によれば、ユーザが確認・修正画面においてファイル名を指示した場合(図11(B)〜(D))、図9Bの文書ID「0002」に対応するインデックス抽出ルールが新規に登録される。
ステップS712において、CPU111は、ステップS303で決定したすべての画像グループについて、確認済み属性が付与されているかどうか判定する。すべての画像グループについて、確認済み属性が付与されていれば、処理を終了し、そうでなければ、処理をステップS701へ戻る。
上述した確認・修正処理によって、図8(B)および図8(C)に示した画像を続けて処理する場合について説明する。
まず、ステップS702で図8(B)に示した文書が選択されると、ステップS703において、図9Bに示した更新済みのインデックス抽出ルールが取得される。ステップS704において、登録済み文書(文書ID「0002」)であると判定され、レコメンド結果のファイル名が取得される。この場合の、ステップS705において表示される確認・修正画面を、図12(A)に示す。このように、スキャン前に未登録であった同じ種類の文書が、一度にスキャンされた場合でも、1つの文書について、確認・修正画面においてユーザがファイル名を指示することで、もう1つの文書のファイル名をレコメンドすることができる。
以上、本実施例1によれば、複数の文書をスキャンした際にファイル分割を行い、それぞれの文書に対してファイル名等のインデックス項目をレコメンドする機能において、ユーザの手間を減らすことができる。また、同一スキャン内に複数の同じ種類の文書があった場合でも、その場で登録・修正したルールを適用することができる。さらに、ユーザによる確認・修正を行っているバックエンドで、先にすべての文書についてOCR関連の処理を実行しておくことで、ユーザの待ち時間を大きく減らすことができる。
図13は、本実施例に係る処理手順のフローチャートである。まず、図13と、図3に示した実施例1のフローチャートとの差異について説明する。
ステップS304において、確認/修正処理を並列起動した後、ステップS1301において、CPU111は、HDD120から第一のインデックス抽出ルールを取得し、RAM119に展開した上で取得する。第一のインデックス抽出ルールとは、本実施例において、一度だけ読み込まれ、ステップS303で分割された画像グループのそれぞれに対して一度適用されるものである。そして、後述するステップS1302のレコメンド内容生成処理において、利用されるインデックス抽出ルールである。
ステップS305〜S306で、OCR関連処理が行われた後、ステップS1302において、CPU111は、レコメンド内容生成処理を実行する。ここでは、CPU111は、ステップS1301で取得した第一のインデックス抽出ルールに基づいて、ステップS305で選択した画像グループに対してレコメンドするファイル名を生成する。レコメンド内容生成処理の詳細は、実施例1において、図10を用いて説明した内容と同様である。
<確認・修正処理の詳細説明>
図13のS1303で示す確認・修正処理の詳細について、図14のフローチャートを用いて説明する。本実施例において、確認・修正処理は、図13のステップS304で起動され、図13の処理フローと並列で動作する。なお、図14と、図7に示した実施例1のフローチャートとの差異についてのみ説明する。
ステップS1401において、CPU111は、第二のインデックス抽出ルールを作成し、RAM119に展開する。第二のインデックス抽出ルールとは、図13のステップS1301で取得した第一のインデックス抽出ルールに対して、確認・修正処理によってルールの更新や新規登録があった場合に、更新後の状態を一時的に保持するインデックス抽出ルールである。第二のインデックス抽出ルールでは、第一のインデックス抽出ルールに加えて、更新の有無や新規登録されたかといった更新情報を属性として持つ。第二のインデックス抽出ルールの初期状態は、ステップS1301で取得した第一のインデックス抽出ルールの内容である文書IDや文書識別情報、レコメンド情報と同じ内容で、初期の更新情報としては、更新なしの状態である。第二のインデックス抽出ルールの例を図15A,Bに示す。図15Aは、文書ID「0001」という文書1種類が登録されている第一のインデックス抽出ルールを元に生成した状態である。図15Bは、文書ID「0002」に対応するインデックス抽出ルールが新規に登録された状態を示している。
ステップS1403において、CPU111は、ステップS1402で取得した第二のインデックス抽出ルールに基づいて、第二のレコメンド内容生成処理を実行する。第二のレコメンド内容生成処理の詳細については後述する。
ステップS705、S706の後、第二のインデックス抽出ルールに修正があり(S707)、文書IDがある場合には(S708)、ステップS1404に処理を進め文書IDがない場合には、S1405に処理を進める。
ステップS1404において、CPU111は、該当する文書IDの文書識別情報およびレコメンド情報を、ステップS706で作成した第二のインデックス抽出ルールに基づいて更新し、更新情報を更新ありとして保持する。
ステップS1405において、CPU111は、新規に文書IDを発行し、ステップS706で作成した文書識別情報およびレコメンド情報と組み合わせて、第二のインデックス抽出ルールに新規登録し、更新状態を新規登録として保持する。
全グループの確認/修正処理が終了した場合には、続くステップS1406において、CPU111は、第二のインデックス抽出ルールを第一のインデックス抽出ルールに反映し、HDD120に格納する。
第二のレコメンド内容生成処理のフローチャートを図16に示す。
ステップS1601において、CPU111は、図14のステップS702で選択された画像グループに対して、図13のステップS1302のレコメンド内容生成処理で登録済み文書として判定され、文書IDが付与されているかどうかを判定する。文書IDが付与されていない場合すなわち第二のインデックス抽出ルールに登録されていない文書画像の場合、処理をステップS1602へ進め、文書IDが付与されている場合、処理をステップS1607へ進める。
ステップS1602において、CPU111は、図14のステップS1402で取得した第二のインデックス抽出ルールの中に、更新情報の属性に新規のルールがあるかどうかを判定する。新規のルールがある場合、処理をステップS1603に進み、新規のルールがない場合には処理を終了する。これにより、新規のルールがない場合には、図14のステップS705において、図13のステップS1302のレコメンド内容生成処理の結果がレコメンドされ、確認・修正画面の表示にかかる時間を減らすことができる。
ステップS1603において、CPU111は、選択中の文書と、第二のインデックス抽出ルールのうち、新規に登録された文書のみとの間で文書マッチングを実行する。一般的に、文書マッチングは、マッチング対象の登録済み文書の数に応じて処理時間が増えるため、このようにマッチング対象を新規に登録された文書のみに限定することで、処理時間を減らすことができる。
ステップS1604において、CPU111は、ステップS1603で実行した文書マッチングの結果として、入力された文書が新規登録済み文書であった場合には、処理をステップS1605に進め、そうでなかった場合には、処理を終了する。新規文書登録済み文書でなかった場合には、レコメンド内容であるファイル名が生成されず、確認・表示画面において、ユーザによるファイル名の指示を受け付ける。
続くステップS1606において、CPU111は、第二のインデックス抽出ルールの中から、ステップS1603で判別した文書の種類に紐づいたレコメンド情報を取得し、そのルールに基づいて、レコメンド内容であるファイル名を生成する。
一方、画像グループに文書IDがあった場合、ステップS1607において、CPU111は、第二のインデックス抽出ルールの、入力文書に付与された文書IDに紐づいた更新情報を参照し、更新ありかどうかを判定する。更新ありの場合、処理をステップS1608へ進め、更新なしの場合、処理を終了する。これにより、更新がなかった場合には、図14のステップS705において、図13のステップS1302のレコメンド内容生成処理の結果がレコメンドされ、確認・修正画面の表示にかかる時間を減らすことができる。また、更新があった場合でも、文書マッチングを行う必要がなく、後述のステップS1608において、レコメンド内容を生成するだけでよいため、確認・修正画面の表示にかかる時間を減らすことができる。
ステップS1608において、CPU111は、第二のインデックス抽出ルールの中から、入力文書の文書IDに紐づいたレコメンド情報を取得し、そのレコメンド情報に基づいて、レコメンド内容であるファイル名を生成する。
以上、実施例2によれば、ユーザによる確認・修正を行っているバックエンドで、先にすべての文書について一度レコメンド内容の生成処理を実行し、必要に応じてレコメンド内容の再生成処理を行う。これにより、1文書ごとの確認・修正画面の表示までにかかる時間を減らすことで、実施例1と比べて、さらにユーザの待ち時間を大きく減らすことができる。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (13)
- 画像処理装置であって、
複数の文書の画像データを取得する取得手段と、
前記画像データを分割して複数のファイルを作成する作成手段と、
前記ファイルに対してOCR関連処理を実行するOCR関連処理手段と、
前記ファイルの文書と登録済み文書とのマッチングを行い、文書の種類を判別する判別手段と、
前記登録済み文書に紐づいたインデックス抽出ルールに従って、前記ファイルの文書からインデックスに関するレコメンド内容を生成する生成処理手段と、
前記レコメンド内容をユーザに提示して、ユーザの修正指示に基づきインデックス及びインデックス抽出ルールの修正処理を実行する修正処理手段と、
前記ファイルにインデックスを付与する付与手段と、
を備え、
前記OCR関連処理手段を含む第1の処理手段と、前記修正処理手段を含む第2の処理手段が並列して起動される
ことを特徴とする画像処理装置。 - 前記OCR関連処理は、傾き補正、回転補正、領域を選択する処理及びOCR処理である
ことを特徴とする請求項1に記載の画像処理装置。 - 前記修正手段は、
前記判別手段により、文書の種類が特定された場合、
前記レコメンド内容をユーザに提示して、ユーザによるインデックスの修正指示を受け付け、インデックス抽出ルールを更新し、
前記判別手段により、文書の種類が特定されなかった場合、
前記インデックス抽出ルールに、該ファイルの文書の特徴をユーザの指示に基づき登録する
ことを特徴とする請求項1〜2のいずれか1項に記載の画像処理装置。 - 前記OCR関連処理を終えたファイルに対して、未確認属性を付与する
ことを特徴とする請求項1〜3のいずれか1項に記載の画像処理装置。 - 前記第2の処理手段は、前記未確認属性が付与されているファイルについて、並列に処理を実行する
ことを特徴とする請求項4に記載の画像処理装置。 - 前記取得手段は、文書をスキャンして画像データを取得するスキャナである
ことを特徴とする請求項1〜5のいずれか1項に記載の画像処理装置。 - 前記作成手段は、仕切りページ又は表紙を認識することにより、画像データを分割する
ことを特徴とする請求項1〜6のいずれか1項に記載の画像処理装置。 - 前記作成手段は、設定されたページ数ごとに、画像データを分割する
ことを特徴とする請求項1〜6のいずれか1項に記載の画像処理装置。 - 前記第2の処理手段は、前記判別手段、前記レコメンド内容の生成手段、前記修正手段を含む
ことを特徴とする請求項1〜8のいずれか1項に記載の画像処理装置。 - 前記第1の処理手段は、前記OCR関連処理手段、前記判別手段、前記レコメンド内容の生成処理手段を含む
ことを特徴とする請求項1〜8のいずれか1項に記載の画像処理装置。 - 前記修正処理手段は、
ファイルの文書の種類が前記インデックス抽出ルールの新たな登録済み文書の種類である場合、又は前記インデックス抽出ルールが更新された登録済みの文書の種類に該当する場合は、レコメンド内容を再生成して、ユーザに提示する
ことを特徴とする請求項10に記載の画像処理装置。 - 複数の文書の画像データを取得する取得手段を有する画像処理装置の制御方法であって、
前記画像データを分割して複数のファイルを作成する作成ステップと、
前記ファイルに対してOCR関連処理を実行するOCR関連処理ステップと、
前記ファイルの文書と登録済み文書とのマッチングを行い、文書の種類を判別する判別ステップと、
前記登録済み文書に紐づいたインデックス抽出ルールに従って、前記ファイルの文書からインデックスに関するレコメンド内容を生成する生成処理ステップと、
前記レコメンド内容をユーザに提示して、ユーザの修正指示に基づきインデックス及びインデックス抽出ルールの修正処理を実行する修正処理ステップと、
前記ファイルにインデックスを付与する付与ステップと、
を備え、
前記OCR関連処理ステップを含む第1の処理ステップと、前記修正処理ステップを含む第2の処理ステップが並列して起動される
ことを特徴とする画像処理装置の制御方法。 - コンピュータを、請求項1〜12のいずれか1項に記載の画像処理装置の各手段として機能させるためのプログラム。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019179738A JP7379051B2 (ja) | 2019-09-30 | 2019-09-30 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
US17/032,083 US11620844B2 (en) | 2019-09-30 | 2020-09-25 | Image processing apparatus, control method of image processing apparatus, and storage medium |
US18/179,816 US20230206672A1 (en) | 2019-09-30 | 2023-03-07 | Image processing apparatus, control method of image processing apparatus, and storage medium |
JP2023186748A JP2024012448A (ja) | 2019-09-30 | 2023-10-31 | 画像処理装置、画像処理装置の制御方法及びそのプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019179738A JP7379051B2 (ja) | 2019-09-30 | 2019-09-30 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023186748A Division JP2024012448A (ja) | 2019-09-30 | 2023-10-31 | 画像処理装置、画像処理装置の制御方法及びそのプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021057783A true JP2021057783A (ja) | 2021-04-08 |
JP2021057783A5 JP2021057783A5 (ja) | 2023-04-06 |
JP7379051B2 JP7379051B2 (ja) | 2023-11-14 |
Family
ID=75161960
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019179738A Active JP7379051B2 (ja) | 2019-09-30 | 2019-09-30 | 情報処理装置、情報処理装置の制御方法及びそのプログラム |
JP2023186748A Pending JP2024012448A (ja) | 2019-09-30 | 2023-10-31 | 画像処理装置、画像処理装置の制御方法及びそのプログラム |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023186748A Pending JP2024012448A (ja) | 2019-09-30 | 2023-10-31 | 画像処理装置、画像処理装置の制御方法及びそのプログラム |
Country Status (2)
Country | Link |
---|---|
US (2) | US11620844B2 (ja) |
JP (2) | JP7379051B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11709640B2 (en) | 2021-05-25 | 2023-07-25 | Toshiba Tec Kabushiki Kaisha | Method and system for managing pages of documents on a multi-function printer |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5251273A (en) * | 1992-04-15 | 1993-10-05 | International Business Machines Corporation | Data processing system and method for sequentially repairing character recognition errors for scanned images of document forms |
JP3558493B2 (ja) * | 1997-06-10 | 2004-08-25 | 富士通株式会社 | 用紙位置合わせ装置、用紙位置合わせ方法及び用紙位置合わせプログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6289342B1 (en) * | 1998-01-05 | 2001-09-11 | Nec Research Institute, Inc. | Autonomous citation indexing and literature browsing using citation context |
US20030042319A1 (en) * | 2001-08-31 | 2003-03-06 | Xerox Corporation | Automatic and semi-automatic index generation for raster documents |
JP4298287B2 (ja) | 2002-12-27 | 2009-07-15 | キヤノンマーケティングジャパン株式会社 | データ処理装置およびデータ処理方法および制御プログラム |
US8176004B2 (en) * | 2005-10-24 | 2012-05-08 | Capsilon Corporation | Systems and methods for intelligent paperless document management |
JP5121557B2 (ja) * | 2008-05-12 | 2013-01-16 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
WO2010105245A2 (en) * | 2009-03-12 | 2010-09-16 | Exbiblio B.V. | Automatically providing content associated with captured information, such as information captured in real-time |
JP4940270B2 (ja) * | 2009-07-06 | 2012-05-30 | シャープ株式会社 | 画像形成装置 |
US8824803B2 (en) * | 2012-08-31 | 2014-09-02 | Ancestry.Com Operations Inc. | Automated field position linking of indexed data to digital images |
US9588971B2 (en) * | 2014-02-03 | 2017-03-07 | Bluebeam Software, Inc. | Generating unique document page identifiers from content within a selected page region |
JP2015215878A (ja) | 2014-04-21 | 2015-12-03 | 株式会社リコー | 画像処理装置及び画像処理システム |
JP6881990B2 (ja) | 2017-01-30 | 2021-06-02 | キヤノン株式会社 | 画像処理装置とその制御方法、及びプログラム |
-
2019
- 2019-09-30 JP JP2019179738A patent/JP7379051B2/ja active Active
-
2020
- 2020-09-25 US US17/032,083 patent/US11620844B2/en active Active
-
2023
- 2023-03-07 US US18/179,816 patent/US20230206672A1/en active Pending
- 2023-10-31 JP JP2023186748A patent/JP2024012448A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230206672A1 (en) | 2023-06-29 |
JP7379051B2 (ja) | 2023-11-14 |
US20210097275A1 (en) | 2021-04-01 |
US11620844B2 (en) | 2023-04-04 |
JP2024012448A (ja) | 2024-01-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4405831B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
JP5223284B2 (ja) | 情報検索装置、方法およびプログラム | |
JP6849387B2 (ja) | 画像処理装置、画像処理システム、画像処理装置の制御方法、及びプログラム | |
JP2019149788A (ja) | 画像処理装置、および画像処理装置の制御方法とプログラム | |
JP2004265384A (ja) | 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体 | |
JP6752864B2 (ja) | 画像処理装置及びその制御方法、プログラム | |
US11144189B2 (en) | Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas | |
US11301675B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2024012448A (ja) | 画像処理装置、画像処理装置の制御方法及びそのプログラム | |
JP2022162908A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
CN111580758B (zh) | 图像形成装置 | |
JP2009048096A (ja) | 画像処理装置、画像形成装置、処理条件設定方法および処理条件設定プログラム | |
US20220350956A1 (en) | Information processing apparatus, information processing method, and storage medium | |
JP2006333248A (ja) | 画像処理装置、画像処理方法、プログラム及び記憶媒体 | |
JP2017072941A (ja) | 文書振り分けシステム、情報処理方法及びプログラム | |
JP2021114225A (ja) | ファイル検索システム、ファイル検索方法及びプログラム | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2021144673A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
JP7218465B2 (ja) | プログラム、情報処理装置によって実行される情報処理方法、情報処理システム、及び情報処理装置 | |
JP6884913B2 (ja) | 画像処理装置及び画像処理方法、プログラム | |
US20230118845A1 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP2021068289A (ja) | 画像処理装置、情報処理方法及びプログラム | |
JP2022044454A (ja) | プログラムおよびデバイス | |
JP2023170130A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP2022100432A (ja) | 画像処理システム、画像処理装置、プログラム及び画像処理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220929 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230328 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230629 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230718 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230919 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231003 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231101 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7379051 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |