JP7520563B2 - 文書を電子化するための画像処理システム、その制御方法及びプログラム - Google Patents
文書を電子化するための画像処理システム、その制御方法及びプログラム Download PDFInfo
- Publication number
- JP7520563B2 JP7520563B2 JP2020074626A JP2020074626A JP7520563B2 JP 7520563 B2 JP7520563 B2 JP 7520563B2 JP 2020074626 A JP2020074626 A JP 2020074626A JP 2020074626 A JP2020074626 A JP 2020074626A JP 7520563 B2 JP7520563 B2 JP 7520563B2
- Authority
- JP
- Japan
- Prior art keywords
- ocr
- image
- text blocks
- document
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Facsimiles In General (AREA)
- Character Input (AREA)
Description
<システム構成>
図1は、本実施形態に係る、画像処理システムの全体構成を示す図である。画像処理システムは、MFP(Multifunction Peripheral)110と、インターネット上でクラウドサービスを提供するサーバ装置120及び130とを含む。MFP110は、インターネットを介してサーバ装置120及び130と通信可能に接続されている。
図2は、MFP110のハードウェア構成を示すブロック図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。制御部210は、以下の各部211~219で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された様々な制御プログラム(後述のソフトウェア構成図で示す各種機能に対応するプログラム)を読み出して実行する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施例では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける。なお、タッチパネルへのタッチ操作には、人の指による操作やタッチペンによる操作が含まれる。プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、紙等の記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を光学的に読み取ってスキャン画像データを生成し、スキャナI/F217を介して制御部210に入力する。スキャナ部222で生成されたスキャン画像データは、プリンタ部221にて印刷したり(コピー出力)、HDD214に保存したり、LANを介してMFP連携サーバ120等の外部装置にファイル送信したりすることができる。モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置(不図示)との間で画像データをファクシミリ通信する。ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いて、スキャン画像データをMFP連携サーバ120に送信したり、MFP連携サーバ120から各種データを受信したりする。以上説明したMFP110のハードウェア構成は一例であり、必要に応じてその他の構成を備えるものであってもよいし、一部の構成を有していなくてもよい。
図3は、MFP連携サーバ120/ストレージサーバ130のハードウェア構成を示すブロック図である。MFP連携サーバ120とストレージサーバ130は共通のハードウェア構成を有し、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、制御部310をインターネットに接続するインタフェースである。MFP連携サーバ120及びストレージサーバ130は、ネットワークI/F315を介して他の装置(MFP110など)から様々な処理のリクエストを受け、当該リクエストに応じた処理結果を返す。
図4は、本実施形態に係る、画像処理システム100のソフトウェア構成を示すブロック図である。以下、画像処理システム100を構成するMFP110及び、MFP連携サーバ120及びストレージサーバ130それぞれの役割に対応したソフトウェア構成を、順に説明する。なお、以下では、各装置が有する諸機能のうち、文書をスキャンして電子化(ファイル化)し、ストレージサーバ130に保存を行うまでの処理に関わる機能に絞って説明を行うものとする。
MFP110の機能モジュールは、ネイティブ機能モジュール410とアディショナル機能モジュール420の2つに大別される。ネイティブ機能モジュール410はMFP110に標準的に備えられたアプリケーションであるのに対し、アディショナル機能モジュール420はMFP110に追加的にインストールされたアプリケーションである。アディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていてもよい。
まず、MFP連携サーバ120のソフトウェア構成について説明する。MFP連携サーバ120は、リクエスト制御部431、画像処理部432、ストレージサーバアクセス部433、データ管理部434、表示制御部435を有する。リクエスト制御部431は、外部装置からのリクエストを受信できる状態で待機しており、受信したリクエスト内容に応じて、画像処理部432、ストレージサーバアクセス部433、データ管理部434に対し所定の処理の実行を指示する。画像処理部432は、MFP110から送られてくるスキャン画像データに対して、文字領域の検出処理、文字認識処理(OCR処理)、類似文書の判定処理といった画像解析処理の他、回転や傾き補正といった画像加工処理を行う。なお、以下では、スキャン画像から検出される文字領域のことを「テキストブロック」と呼ぶこととする。ストレージサーバアクセス部433は、ストレージサーバ130に対する処理のリクエストを行う。クラウドサービスでは、RESTやSOAPなどのプロトコルを用いてストレージサーバにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。ストレージサーバアクセス部433は、公開されたインタフェースを使用して、ストレージサーバ130に対するリクエストを行う。データ管理部434は、MFP連携サーバ120で管理するユーザ情報や各種設定データ等を保持・管理する。表示制御部435は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、登録されているユーザ情報を確認したり、スキャン設定を変更したりできる。
図5は、MFP110で文書をスキャンし、得られたスキャン画像をファイル化してストレージサーバ130に保存する際の、装置間の処理の流れを示すシーケンス図である。図6はMFP110の起動時に表示されるメインメニューのUI画面(以下、「メイン画面」と表記)の一例を示す図である。文書をスキャンしてファイル化し、クラウドストレージサービスの利用に必要な専用のアプリケーションをMFP110にインストールすることで、メイン画面600上に「スキャンしてクラウドストレージに保存」ボタン601が表示されるようになる。そして、ユーザがメイン画面600内に表示されたメニューボタンの中から「スキャンしてクラウドストレージに保存」ボタン601を押下すると、図5のシーケンス図で示される一連の処理が開始する。以下、図5のシーケンス図に沿って、装置間のやり取りを時系列に説明する。なお、シーケンス図や後述する各フローチャートにおける記号「S」はステップを表すものとする。
図10は、S516において実行される画像解析処理の詳細手順を説明するフローチャートである。まず、S1001では、処理対象のスキャン画像データに対して補正処理が実行される。ここで実行される補正処理は、後続の処理のための前処理であり、例えばスキャン画像データに対する回転補正や斜行補正処理である。続くS1002では、S1001にて得られた補正後のスキャン画像データ(以下、「補正画像データ」と表記)のアップロード指示がデータ管理部434に対しなされる。このアップロード指示を受けたデータ管理部434は、補正画像データを“processId“と紐づけて保存する。続くS1003では、S1001にて得られた補正画像データに対して、画像内のテキストブロックを検出する処理(以下、「ブロックセレクション処理」と呼ぶ。)が実行される。このブロックセレクション処理によって、補正画像内に存在するテキストブロックの位置・大きさが特定される。以下に示す表1は、図11に示す見積書のスキャン画像データ(補正画像データ)に対してブロックセレクション処理を実行して得られた結果を分かりやすくまとめたものである。
図20は、MFP110が描画データを取得する処理の流れを示すフローチャートである。図20のフローチャートに示す一連の処理は、前述のスキャン画像の解析リクエストの送信処理(S508)が完了したことを契機に実行される。
図21は、MFP110におけるファイル名設定処理の詳細手順を説明するフローチャートである。まず、S2101において、MFP110は、S525で取得した描画データに基づき、図18で示したファイル名設定画面を操作部220上に描画表示する。続くS2102において、MFP110は、操作部220のタッチパネルを介して、プレビュー領域1802内の任意のテキストブロックがユーザによってタッチされたか否かを判定する。この判定は、具体的には次の手順で行う。まず、ユーザによってタッチパネルがタッチされた場合に、そのタッチ座標を取得する。次に、描画データに含まれるOCR結果(表3及び図17を参照)を構成するテキストブロックのうち、取得したタッチ座標をその矩形領域に含むようなテキストブロックが存在するか否かを判定する。判定の結果、存在する場合にはテキストブロックがタッチされたと判定する。それ以外の場合、すなわち、ユーザによりタッチされていない場合や、タッチされた座標がどのテキストブロックの矩形領域にも含まれない場合にはタッチされていないと判定する。S2202の判定の結果、どのテキストブロックもタッチされていない場合はS2103に進み、タッチされたテキストブロックが存在する場合はS2104に進む。
図25は、画像処理部432が実行するファイル名設定の学習処理の詳細手順を説明するフローチャートである。まず、S2501では、S530でリクエスト制御部431からの学習指示が取得される。続くS2502では、S2501で取得した学習指示に含まれる情報、具体的には“processId”に紐づくブロックセレクション結果及びファイル名に使用されたテキストブロックの情報が、データ管理部434からダウンロードされる。続くS2503では、電子化対象の帳票のスキャン画像を一意に表すための“formId”がUUID形式で生成される。続くS2504では、ブロックセレクション結果とファイル名として使用されたテキストブロックの情報がマージされ、上述の“formId”と紐付けられた学習データが生成される。図26に、学習データの一例を示す。続くS2505では、S2504で生成した学習データがデータ管理部434にアップロードされる。このアップロードが完了すると、本フローを終了する。
次に、MFP連携サーバ120における処理の負荷状態に応じてOCR処理の対象ブロックを切り替えることでユーザに対する応答性のばらつきを抑える態様を、実施形態1の変形例として説明する。
次に、MFP連携サーバ120におけるOCR処理の完了状態を記憶してユーザの操作に対する逐次の応答時間を削減することで、ユーザの体感としての応答性を向上させる態様を、実施形態1のさらなる変形例として説明する。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (10)
- 文書を電子化する画像処理システムであって、
前記電子化の対象文書のスキャン画像からテキストブロックを検出する検出手段と、
前記スキャン画像に関するプロパティを設定するための設定画面が表示される前に、前記検出手段によって検出されたテキストブロックに対し文字認識処理を行うOCR手段と、
前記OCR手段による前記文字認識処理が完了した後に表示される前記設定画面において、前記OCR手段による前記文字認識処理の完了したテキストブロックがユーザにより選択された場合は、前記OCR手段によって認識された文字列を使用して前記スキャン画像に関するプロパティを設定する設定手段と、
を備え、
過去に前記電子化を行った電子化済み文書の中に前記対象文書に類似した文書が存在しない場合、前記OCR手段は、前記設定画面が表示される前に、前記検出手段によって検出されたテキストブロックのうち一定サイズ以上のテキストブロックのみに対して前記文字認識処理を行う、
ことを特徴とする画像処理システム。 - 前記電子化済み文書の中に前記対象文書に類似した文書が存在しない場合であって、前記検出手段によって検出されたテキストブロックの数が所定数より多い場合に、前記OCR手段は、前記検出手段によって検出されたテキストブロックのうち一定サイズ以上のテキストブロックに対して前記文字認識処理を行う、ことを特徴とする請求項1に記載の画像処理システム。
- 前記画像処理システムにおける負荷状態を示す情報を取得する取得手段をさらに備え、
前記電子化済み文書の中に前記対象文書に類似した文書が存在しない場合であって、前記取得手段によって取得された情報が一定レベル以上の負荷状態であることを示す場合、前記OCR手段は、前記検出手段によって検出されたテキストブロックのうち一定サイズ以上のテキストブロックに対して前記文字認識処理を行う、
ことを特徴とする請求項1に記載の画像処理システム。 - 前記電子化済み文書の中に前記対象文書に類似した文書が存在しない場合であって、前記検出手段によって検出されたテキストブロックの数が所定数以下である場合、前記OCR手段は、前記検出手段によって検出されたすべてのテキストブロックに対して前記文字認識処理を行う、ことを特徴とする請求項1乃至3のいずれか1項に記載の画像処理システム。
- 前記検出手段によって検出されたテキストブロックの中からいずれかのテキストブロックの選択を前記設定画面において受け付ける受付手段をさらに有し、
前記受付手段により前記選択を受け付けた時に前記検出手段によって検出された全てのテキストブロックに対する文字認識処理が完了していない場合、当該全てのテキストブロックに対する前記文字認識処理が行われることを特徴とする請求項1乃至4のいずれか1項に記載の画像処理システム。 - 前記電子化済み文書について、そのスキャン画像のプロパティに使用された文字列に対応するテキストブロックと前記検出手段による検出結果とを関連付ける学習を行う学習手段と、
前記学習によって得られた学習データを用いて、前記電子化済み文書の中に前記対象文書に類似した文書が存在するか否かを判定する判定手段と、
をさらに備えたことを特徴とする請求項1乃至5のいずれか1項に記載の画像処理システム。 - 前記プロパティは、前記スキャン画像をファイル化する際に付与されるファイル名であることを特徴とする請求項1乃至6のいずれか1項に記載の画像処理システム。
- 前記OCR手段は、過去に前記電子化を行った電子化済み文書の中に類似した文書が存在しない対象文書であって、所定数より多くのテキストブロックが検出された対象文書について、前記設定画面が表示される前に、前記検出手段によって検出されたテキストブロックのうち一定サイズ以上のテキストブロックのみに対して前記文字認識処理を行うことを特徴とする請求項1に記載の画像処理システム。
- 文書を電子化する画像処理システムの制御方法であって、
前記電子化の対象文書のスキャン画像からテキストブロックを検出する検出ステップと、
前記スキャン画像に関するプロパティを設定するための設定画面が表示される前に、前記検出ステップにて検出されたテキストブロックに対し文字認識処理を行うOCRステップと、
前記文字認識処理が完了した後に表示される前記設定画面において、前記文字認識処理の完了したテキストブロックがユーザにより選択された場合は、前記OCRステップにて認識された文字列を使用して前記スキャン画像に関するプロパティを設定する設定ステップと、
を含み、
過去に前記電子化を行った電子化済み文書の中に前記対象文書に類似した文書が存在しない場合、前記OCRステップでは、前記設定画面が表示される前に、前記検出ステップにて検出されたテキストブロックのうち一定サイズ以上のテキストブロックのみに対して前記文字認識処理を行う、
ことを特徴とする制御方法。 - コンピュータを、請求項1乃至8のいずれか1項に記載の画像処理システムの手段として機能させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US17/148,229 US11393234B2 (en) | 2020-01-21 | 2021-01-13 | Image processing system for computerizing document, control method thereof, and storage medium |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020007505 | 2020-01-21 | ||
| JP2020007505 | 2020-01-21 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2021118534A JP2021118534A (ja) | 2021-08-10 |
| JP2021118534A5 JP2021118534A5 (ja) | 2023-04-27 |
| JP7520563B2 true JP7520563B2 (ja) | 2024-07-23 |
Family
ID=77175330
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020074626A Active JP7520563B2 (ja) | 2020-01-21 | 2020-04-20 | 文書を電子化するための画像処理システム、その制御方法及びプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7520563B2 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005056315A (ja) | 2003-08-07 | 2005-03-03 | Ricoh Co Ltd | 情報処理装置、プログラム及び記憶媒体 |
| JP2018124656A (ja) | 2017-01-30 | 2018-08-09 | キヤノン株式会社 | 画像処理装置とその制御方法、及びプログラム |
| JP2019153919A (ja) | 2018-03-02 | 2019-09-12 | キヤノン株式会社 | 画像処理装置、その制御方法、及びプログラム |
-
2020
- 2020-04-20 JP JP2020074626A patent/JP7520563B2/ja active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005056315A (ja) | 2003-08-07 | 2005-03-03 | Ricoh Co Ltd | 情報処理装置、プログラム及び記憶媒体 |
| JP2018124656A (ja) | 2017-01-30 | 2018-08-09 | キヤノン株式会社 | 画像処理装置とその制御方法、及びプログラム |
| JP2019153919A (ja) | 2018-03-02 | 2019-09-12 | キヤノン株式会社 | 画像処理装置、その制御方法、及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2021118534A (ja) | 2021-08-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7391672B2 (ja) | 文書を電子化するための画像処理システム、その制御方法及びプログラム | |
| JP7608065B2 (ja) | 情報処理装置 | |
| JP7528323B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
| JP7467737B2 (ja) | ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム | |
| US11393234B2 (en) | Image processing system for computerizing document, control method thereof, and storage medium | |
| JP2022113038A (ja) | 画像処理装置、方法、及びプログラム | |
| JP7225017B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
| JP7330742B2 (ja) | スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム | |
| JP7520563B2 (ja) | 文書を電子化するための画像処理システム、その制御方法及びプログラム | |
| JP7387282B2 (ja) | スキャン画像のプレビュー表示を行なう画像処理装置、その制御方法及びプログラム | |
| JP7542980B2 (ja) | 画像処理システム、画像処理方法及びプログラム | |
| JP2023167871A (ja) | 画像処理装置、情報処理装置、画像処理システム、画像処理方法、情報処理方法、およびプログラム | |
| JP2023072812A (ja) | 情報処理装置、情報処理装置の制御方法、そのプログラム及び画像処理システム | |
| JP7543489B2 (ja) | 情報処理装置、その制御方法及びプログラム | |
| JP7358663B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
| JP7508199B2 (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム | |
| JP2024032563A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
| JP2023071227A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
| JP2020178284A (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム | |
| JP2020177526A (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230419 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230419 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240227 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240305 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240507 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240611 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240710 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7520563 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |


