JP7391672B2 - 文書を電子化するための画像処理システム、その制御方法及びプログラム - Google Patents
文書を電子化するための画像処理システム、その制御方法及びプログラム Download PDFInfo
- Publication number
- JP7391672B2 JP7391672B2 JP2020007525A JP2020007525A JP7391672B2 JP 7391672 B2 JP7391672 B2 JP 7391672B2 JP 2020007525 A JP2020007525 A JP 2020007525A JP 2020007525 A JP2020007525 A JP 2020007525A JP 7391672 B2 JP7391672 B2 JP 7391672B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- scanned
- processing system
- image processing
- list
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012545 processing Methods 0.000 title claims description 110
- 238000000034 method Methods 0.000 title claims description 96
- 230000008569 process Effects 0.000 claims description 83
- 230000006870 function Effects 0.000 claims description 20
- 238000004458 analytical method Methods 0.000 description 53
- 238000010586 diagram Methods 0.000 description 34
- 230000004044 response Effects 0.000 description 21
- 238000012015 optical character recognition Methods 0.000 description 13
- 238000013523 data management Methods 0.000 description 8
- 238000010191 image analysis Methods 0.000 description 8
- 238000003825 pressing Methods 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000012790 confirmation Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000008570 general process Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00095—Systems or arrangements for the transmission of the picture signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
- H04N1/00244—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server with a server, e.g. an internet server
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/94—Hardware or software architectures specially adapted for image or video understanding
- G06V10/945—User interactive design; Environments; Toolboxes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/96—Management of image or video recognition tasks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/62—Text, e.g. of license plates, overlay texts or captions on TV images
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/12—Detection or correction of errors, e.g. by rescanning the pattern
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/412—Layout analysis of documents structured with printed lines or input boxes, e.g. business forms or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/414—Extracting the geometrical structure, e.g. layout tree; Block segmentation, e.g. bounding boxes for graphics or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/418—Document matching, e.g. of document images
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00204—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a digital computer or a digital computer system, e.g. an internet server
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00127—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture
- H04N1/00326—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus
- H04N1/00328—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information
- H04N1/00331—Connection or combination of a still picture apparatus with another apparatus, e.g. for storage, processing or transmission of still picture signals or of information associated with a still picture with a data reading, recognizing or recording apparatus, e.g. with a bar-code apparatus with an apparatus processing optically-read information with an apparatus performing optical character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/0035—User-machine interface; Control console
- H04N1/00405—Output means
- H04N1/00408—Display of information to the user, e.g. menus
- H04N1/0044—Display of information to the user, e.g. menus for image preview or review, e.g. to help the user position a sheet
- H04N1/00442—Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails
- H04N1/00453—Simultaneous viewing of a plurality of images, e.g. using a mosaic display arrangement of thumbnails arranged in a two dimensional array
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
- H04N1/00763—Action taken as a result of detection
- H04N1/00766—Storing data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/00681—Detecting the presence, position or size of a sheet or correcting its position before scanning
- H04N1/00763—Action taken as a result of detection
- H04N1/00771—Indicating or reporting, e.g. issuing an alarm
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/04—Scanning arrangements, i.e. arrangements for the displacement of active reading or reproducing elements relative to the original or reproducing medium, or vice versa
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0081—Image reader
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/0077—Types of the still picture apparatus
- H04N2201/0094—Multifunctional device, i.e. a device capable of all of reading, reproducing, copying, facsimile transception, file transception
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3225—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document
- H04N2201/3226—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image
- H04N2201/3228—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information
- H04N2201/3229—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title of data relating to an image, a page or a document of identification information or the like, e.g. ID code, index, title, part of an image, reduced-size image further additional information (metadata) being comprised in the identification information further additional information (metadata) being comprised in the file name (including path, e.g. directory or folder names at one or more higher hierarchical levels)
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N2201/00—Indexing scheme relating to scanning, transmission or reproduction of documents or the like, and to details thereof
- H04N2201/32—Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
- H04N2201/3201—Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
- H04N2201/3274—Storage or retrieval of prestored additional information
Description
<システム構成>
図1は、本実施形態に係る、画像処理システムの全体構成を示す図である。画像処理システムは、MFP(Multifunction Peripheral)110と、インターネット上でクラウドサービスを提供するサーバ装置120及び130とを含む。MFP110は、インターネットを介してサーバ装置120及び130と通信可能に接続されている。
図2は、MFP110のハードウェア構成を示すブロック図である。MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223で構成される。制御部210は、以下の各部211~219で構成され、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された様々な制御プログラム(後述のソフトウェア構成図で示す各種機能に対応するプログラム)を読み出して実行する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施例では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザによる操作/入力/指示を受け付ける。なお、タッチパネルへのタッチ操作には、人の指による操作やタッチペンによる操作が含まれる。プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データはプリンタI/F216を介して制御部210からプリンタ部221へ転送され、紙等の記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を光学的に読み取ってスキャン画像データを生成し、スキャナI/F217を介して制御部210に入力する。スキャナ部222で生成されたスキャン画像データは、プリンタ部221にて印刷したり(コピー出力)、HDD214に保存したり、LANを介してMFP連携サーバ120等の外部装置にファイル送信したりすることができる。モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置(不図示)との間で画像データをファクシミリ通信する。ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いて、スキャン画像データをMFP連携サーバ120に送信したり、MFP連携サーバ120から各種データを受信したりする。以上説明したMFP110のハードウェア構成は一例であり、必要に応じてその他の構成を備えるものであってもよいし、一部の構成を有していなくてもよい。
図3は、MFP連携サーバ120/ストレージサーバ130のハードウェア構成を示すブロック図である。MFP連携サーバ120とストレージサーバ130は共通のハードウェア構成を有し、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315で構成される。CPU311は、ROM312に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。ネットワークI/F315は、制御部310をインターネットに接続するインタフェースである。MFP連携サーバ120及びストレージサーバ130は、ネットワークI/F315を介して他の装置(MFP110など)から様々な処理のリクエストを受け、当該リクエストに応じた処理結果を返す。
図4は、本実施形態に係る、画像処理システム100のソフトウェア構成を示すブロック図である。以下、画像処理システム100を構成するMFP110及び、MFP連携サーバ120及びストレージサーバ130それぞれの役割に対応したソフトウェア構成を、順に説明する。なお、以下では、各装置が有する諸機能のうち、文書をスキャンして電子化(ファイル化)し、ストレージサーバ130に保存を行うまでの処理に関わる機能に絞って説明を行うものとする。
MFP110の機能モジュールは、ネイティブ機能モジュール410とアディショナル機能モジュール420の2つに大別される。ネイティブ機能モジュール410はMFP110に標準的に備えられたアプリケーションであるのに対し、アディショナル機能モジュール420はMFP110に追加的にインストールされたアプリケーションである。アディショナル機能モジュール420は、Java(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていてもよい。
まず、MFP連携サーバ120のソフトウェア構成について説明する。MFP連携サーバ120は、リクエスト制御部431、画像処理部432、ストレージサーバアクセス部433、データ管理部434、表示制御部435を有する。リクエスト制御部431は、外部装置からのリクエストを受信できる状態で待機しており、受信したリクエスト内容に応じて、画像処理部432、ストレージサーバアクセス部433、データ管理部434に対し所定の処理の実行を指示する。画像処理部432は、MFP110から送られてくるスキャン画像データに対して、文字領域の検出処理、文字認識処理(OCR処理)、類似文書の判定処理といった解析処理の他、回転や傾き補正といった画像加工処理を行う。なお、以下では、スキャン画像から検出される文字領域のことを「テキストブロック」と呼ぶこととする。また、対象となる文書として、見積書や請求書といった帳票を例に説明を行うこととし、そのスキャン画像を「帳票画像」と呼ぶ場合がある。ストレージサーバアクセス部433は、ストレージサーバ130に対する処理のリクエストを行う。クラウドサービスでは、RESTやSOAPなどのプロトコルを用いてストレージサーバにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。ストレージサーバアクセス部433は、公開されたインタフェースを使用して、ストレージサーバ130に対するリクエストを行う。データ管理部434は、MFP連携サーバ120で管理するユーザ情報、画像解析結果、各種設定データ等を保持・管理する。表示制御部435は、インターネット経由で接続されたPCやモバイル端末(いずれも不図示)上で動作しているウェブブラウザからのリクエストを受けて、画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザは、ウェブブラウザで表示される画面経由で、登録されているユーザ情報を確認したり、スキャン設定を変更したりできる。
図5は、MFP110で文書(帳票)をスキャンし、得られた帳票画像をファイル化してストレージサーバに保存する際の、装置間の処理の流れを示すシーケンス図である。図6はMFP110の起動時に表示されるメインメニューのUI画面(以下、「メイン画面」と表記)の一例を示す図である。文書をスキャンしてファイル化し、クラウドストレージサービスの利用に必要な専用のアプリケーションをMFP110にインストールすることで、メイン画面600上に「スキャンしてクラウドストレージに保存」ボタン601が表示されるようになる。そして、ユーザがメイン画面600内に表示されたメニューボタンの中から「スキャンしてクラウドストレージに保存」ボタン601を押下すると、図5のシーケンス図で示される一連の処理が開始する。なお、図5のシーケンス図は、スキャン画像をファイル化する際に付与されるファイル名を設定する場合の説明となっているが、ファイル名の他、フォルダパスやメタデータといったプロパティ全般に適用可能である。
ユーザは、図11に例示したファイル名設定画面1100を用いて、ストレージサーバ130に保存する帳票画像についてのファイル名を設定する。以下、詳しく説明する。
続いて、画像処理部432が行う解析処理(S508)の詳細について、図13のフローチャートに沿って詳しく説明する。
次に、学習処理後にその学習結果をスキャン済み帳票一覧に反映させる処理(S517)について、2つのケースを例に詳しく説明する。ケース1は、解析処理時の帳票判別処理(S508)にて、類似帳票が存在しない(すなわち新規フォームの帳票である)と判定された帳票画像が、スキャン済み帳票一覧の中に複数存在しているケースである。ケース2は、解析処理時の帳票判別処理(S508)にて、類似帳票が存在すると判定された帳票画像が複数存在し、そのうちの1つに対してユーザがファイル名設定画面1100上でファイル名を修正したケースである。以下、それぞれのケースにおける学習結果反映処理について説明する。
ここでは、新規フォームの帳票であると判定された帳票画像がスキャン済み帳票一覧の中に複数存在し、ユーザがその中の任意の帳票画像に対してファイル名を設定したとの想定で、具体的な処理の流れについて説明する。図16は、本ケースに係る、学習結果反映処理の詳細を示すフローチャートである。以下、図16のフローチャートに沿って説明する。
次に、スキャン済み帳票一覧の中に、互いに類似し、かつ、ステータスが“学習済み”の帳票が複数存在する場合において、そのうちある1つの帳票に対してユーザがファイル名を修正したとの想定で、具体的な処理の流れについて説明する。図20は、本ケースに係る、学習結果反映処理の詳細を示すフローチャートである。また、図21は、本ケースにおける学習結果反映処理の実行前のストレージ保存画面の一例を示す図である。ここでは、スキャン済み帳票として5件の帳票が登録されており、そのうち帳票IDが“001”、“002”、“003”、“005”において、そのステータスが“学習済”となっている。この状態でユーザは、帳票IDが“001”の帳票を選択し、編集ボタン1003を押下したとする。そして、図12で示すファイル名設定画面1100が表示されたものとする。このとき、プレビュー領域1102内のプレビュー画像では“見積書”及び“品川株式会社”のテキストブロックが強調され、またファイル名入力欄1101には現在のファイル名である「見積書_品川株式会社」の文字が表示されている。その後、ユーザは、図22(a)に示すように、“R12-3500”の文字部分をタッチする。これにより、ファイル名入力欄1101の表示は、「見積書_品川株式会社_R12-3500」に変更される。その後、ユーザがOKボタン1107を押下すると、当該表示内容にてファイル名が更新され、それに続いて、図20に示すフローの実行が開始される。
上述のケース1及びケース2の場合ともに、スキャン済みファイル一覧の中に存在する所定の条件を満たす全ての帳票画像に対して学習結果反映処理を行っていた。しかしながら、ユーザが既に確認済みの帳票画像についてまで学習結果を反映させる必要はなく、一律に反映させることでユーザが意図しないファイル名に変更されてしまう等の弊害が生じる恐れもある。そこで、ユーザが既に確認済みの帳票画像に対しては、上述の学習結果反映処理の対象外としてもよい。具体的には、スキャン済み帳票一覧内の特定の帳票画像について一定の状況が検知された場合には、当該帳票画像に対して確認済みであることを示す情報(例えばフラグなど)を付加する。そして、フラグ等によって確認済みであることが示されている帳票画像については、上述の学習結果反映処理の対象から除外するようにする。この際、図23に示すストレージ保存画面1000’の帳票リスト領域1001’のように「確認状態」の項目をさらに設け、どの帳票が確認済みであるかどうかをユーザが視認できるようにしてもよい。さらには、文字による表記に代えて、確認状況を示すアイコン、各行の背景色の変更、専用のチェックボックスを設ける等によって、確認済みであるかどうかを示してもよい。
・プレビュー画像内の任意のテキストブロックに対するユーザ選択が検出された場合
・ファイル名入力欄1101に表示された文字列に対する修正が検出された場合
・同一のプレビュー画像が表示された状態のまま一定時間が経過した場合
・OKボタン1107或いは専用の確認済みボタン(不図示)の押下が検出された場合
上述の例では、スキャン済み帳票一覧に表示される帳票画像の範囲は、ログインユーザと対応付けられていた。すなわち、ストレージ保存画面1000の帳票リスト領域1001内に表示されるのは自身がスキャンした帳票画像のみであった。しかしながら、ログインユーザ自身がスキャンした帳票画像以外に、他のユーザがスキャンした帳票画像を含めるようにしてもよい。他のユーザがスキャンした帳票画像を含む場合も同様、所定の条件を満たす場合には学習結果反映処理の対象とすればよい。
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
Claims (14)
- 類似の文書フォームが学習データに登録されていない未学習のスキャン画像を含む複数のスキャン画像の一覧を表示させる表示手段と、
ユーザの指示に基づいて、前記一覧のうちの未学習の第1のスキャン画像についてのプロパティが、当該第1のスキャン画像に含まれる文字列のうちの少なくとも1つの文字列を用いて設定された場合、当該設定に用いられた文字列に関する位置情報を、当該第1のスキャン画像の文書フォームと関連付けて、新たな学習データとして登録する学習手段と、
前記一覧に含まれる前記第1のスキャン画像以外の複数のスキャン画像のうちの、前記登録された新たな学習データの文書フォームに類似する文書フォームを有する第2のスキャン画像に対して、前記登録された新たな学習データと当該第2のスキャン画像に含まれる文字列とに基づいて取得されるプロパティを反映する反映手段と、
を備えることを特徴とする画像処理システム。 - 前記未学習の第1のスキャン画像についてのプロパティは、前記ユーザの指示に基づいて当該第1のスキャン画像上で選択された文字列画像を文字認識処理することによって得られる文字列を用いて設定される、ことを特徴とする請求項1に記載の画像処理システム。
- 前記表示手段は、前記一覧に含まれる前記複数のスキャン画像の各々について、類似の文書フォームが既に学習データに登録されているか否かを示す情報を更に表示する、ことを特徴とする請求項1に記載の画像処理システム。
- 前記表示手段は、前記学習手段により前記新たな学習データが登録された後、前記一覧に含まれる前記第1のスキャン画像と前記第2のスキャン画像とについて、類似の文書フォームが既に学習データに登録されていることを示す情報を表示する、ことを特徴とする請求項3に記載の画像処理システム。
- 前記第1のスキャン画像の文書フォームは、前記第1のスキャン画像内の各文字列のブロックの位置を示す配置情報を含む、ことを特徴とする請求項1に記載の画像処理システム。
- 前記反映手段は、前記一覧に含まれ且つ前記第1のスキャン画像以外の未学習のスキャン画像の中から、前記登録された新たな学習データの文書フォームに類似する文書フォームを有する前記第2のスキャン画像を判定し、当該判定した第2のスキャン画像に対して、前記登録された新たな学習データと当該第2のスキャン画像に含まれる文字列とに基づいて取得されるプロパティを反映する、ことを特徴とする請求項1に記載の画像処理システム。
- 前記反映手段は、前記一覧に含まれ且つユーザによる確認が済んでいないスキャン画像の中から、前記登録された新たな学習データの文書フォームに類似する文書フォームを有する前記第2のスキャン画像を判定し、当該判定した第2のスキャン画像に対して、前記登録された新たな学習データと当該第2のスキャン画像に含まれる文字列とに基づいて取得されるプロパティを反映する、ことを特徴とする請求項1に記載の画像処理システム。
- 前記一覧は、スキャン機能を有する装置のUI画面に表示されることを特徴とする請求項1に記載の画像処理システム。
- 前記一覧は、クライアントPCのUI画面に表示されることを特徴とする請求項1に記載の画像処理システム。
- 前記学習手段での前記新たな学習データの登録は、サーバによって実行されることを特徴とする請求項1に記載の画像処理システム。
- 前記文字認識処理は、サーバによって実行されることを特徴とする請求項2に記載の画像処理システム。
- 前記プロパティとは、スキャン画像をファイル化する際に付与されるファイル名である、ことを特徴とする請求項1乃至11のいずれか1項に記載の画像処理システム。
- 類似の文書フォームが学習データに登録されていない未学習のスキャン画像を含む複数のスキャン画像の一覧を表示させる表示ステップと、
ユーザの指示に基づいて、前記一覧のうちの未学習の第1のスキャン画像についてのプロパティが、当該第1のスキャン画像に含まれる文字列のうちの少なくとも1つの文字列を用いて設定された場合、当該設定に用いられた文字列に関する位置情報を、当該第1のスキャン画像の文書フォームと関連付けて、新たな学習データとして登録する学習ステップと、
前記一覧に含まれる前記第1のスキャン画像以外の複数のスキャン画像のうちの、前記登録された新たな学習データの文書フォームに類似する文書フォームを有する第2のスキャン画像に対して、前記登録された新たな学習データと当該第2のスキャン画像に含まれる文字列とに基づいて取得されるプロパティを反映する反映ステップと、
を備えることを特徴とする画像処理システムの制御方法。 - コンピュータを、請求項1乃至12のいずれか1項に記載の画像処理システムの手段として機能させるためのプログラム。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020007525A JP7391672B2 (ja) | 2020-01-21 | 2020-01-21 | 文書を電子化するための画像処理システム、その制御方法及びプログラム |
KR1020210003746A KR20210094465A (ko) | 2020-01-21 | 2021-01-12 | 문서를 전자화하기 위한 화상 처리 시스템, 그 제어 방법, 및 저장 매체 |
EP21152292.5A EP3855717B1 (en) | 2020-01-21 | 2021-01-19 | Image processing system for computerizing document, control method thereof, and storage medium background |
US17/153,101 US11297192B2 (en) | 2020-01-21 | 2021-01-20 | Image processing system for computerizing document, control method thereof, and storage medium |
CN202110081831.6A CN113225446A (zh) | 2020-01-21 | 2021-01-21 | 使文档计算机化的图像处理系统及其控制方法和存储介质 |
US17/683,636 US11616884B2 (en) | 2020-01-21 | 2022-03-01 | Image processing system for computerizing document, control method thereof, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020007525A JP7391672B2 (ja) | 2020-01-21 | 2020-01-21 | 文書を電子化するための画像処理システム、その制御方法及びプログラム |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2021114736A JP2021114736A (ja) | 2021-08-05 |
JP2021114736A5 JP2021114736A5 (ja) | 2023-01-25 |
JP7391672B2 true JP7391672B2 (ja) | 2023-12-05 |
Family
ID=74191587
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020007525A Active JP7391672B2 (ja) | 2020-01-21 | 2020-01-21 | 文書を電子化するための画像処理システム、その制御方法及びプログラム |
Country Status (5)
Country | Link |
---|---|
US (2) | US11297192B2 (ja) |
EP (1) | EP3855717B1 (ja) |
JP (1) | JP7391672B2 (ja) |
KR (1) | KR20210094465A (ja) |
CN (1) | CN113225446A (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11477332B2 (en) | 2020-03-30 | 2022-10-18 | Canon Kabushiki Kaisha | Information processing apparatus and control method thereof setting a rule for property information to be used during storage |
JP7414554B2 (ja) * | 2020-01-27 | 2024-01-16 | シャープ株式会社 | 情報処理装置、制御方法及びプログラム |
JP2021129252A (ja) * | 2020-02-14 | 2021-09-02 | 株式会社リコー | 機器、処理実行システム、処理実行方法、プログラム |
CN113760824B (zh) * | 2021-08-30 | 2024-02-02 | 远光软件股份有限公司 | 扫描文件获取方法、计算机装置及计算机可读存储介质 |
JP2023040888A (ja) * | 2021-09-10 | 2023-03-23 | キヤノン株式会社 | 画像処理システム、サーバとその制御方法、及びプログラム |
TWI811789B (zh) * | 2021-09-10 | 2023-08-11 | 宏碁股份有限公司 | 智能放大方法及應用其之電子裝置 |
JP2023053602A (ja) * | 2021-10-01 | 2023-04-13 | キヤノン株式会社 | 装置、情報処理方法、及びプログラム |
CN115511473B (zh) * | 2022-11-02 | 2023-04-18 | 北京共识数信科技有限公司 | 一种基于大数据的智慧函证管理方法、系统和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002099559A (ja) | 2000-09-25 | 2002-04-05 | Fuji Xerox Co Ltd | ドキュメント管理システム |
JP2006229305A (ja) | 2005-02-15 | 2006-08-31 | Canon Inc | ネットワーク文書管理システム |
JP2019128727A (ja) | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
JP2019134364A (ja) | 2018-02-01 | 2019-08-08 | キヤノン株式会社 | スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム |
JP2019197325A (ja) | 2018-05-08 | 2019-11-14 | キヤノン株式会社 | 情報処理システム、情報処理装置とその制御方法及びプログラム |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100648926B1 (ko) * | 2005-07-11 | 2006-11-27 | 삼성전자주식회사 | 사용자 식별 정보 부가기능을 갖는 복합기 및 그 방법 |
KR20110040108A (ko) * | 2009-10-13 | 2011-04-20 | 삼성전자주식회사 | 화상형성장치 및 화상형성장치의 문서 관리방법 |
JP2015215878A (ja) * | 2014-04-21 | 2015-12-03 | 株式会社リコー | 画像処理装置及び画像処理システム |
JP6953230B2 (ja) * | 2017-08-22 | 2021-10-27 | キヤノン株式会社 | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム |
JP6891073B2 (ja) * | 2017-08-22 | 2021-06-18 | キヤノン株式会社 | スキャン画像にファイル名等を設定するための装置、その制御方法及びプログラム |
JP7013182B2 (ja) * | 2017-09-21 | 2022-01-31 | キヤノン株式会社 | 情報処理装置、情報処理方法およびプログラム |
JP6968647B2 (ja) * | 2017-10-03 | 2021-11-17 | キヤノン株式会社 | スキャン画像にファイル名を設定するための装置、その制御方法及びプログラム |
US10949662B2 (en) * | 2017-12-27 | 2021-03-16 | Seiko Epson Corporation | Image processing apparatus |
JP7131137B2 (ja) * | 2017-12-27 | 2022-09-06 | セイコーエプソン株式会社 | 画像処理装置および画像処理プログラム |
JP6983675B2 (ja) * | 2018-01-23 | 2021-12-17 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、プログラム、およびシステム |
JP7102170B2 (ja) * | 2018-02-28 | 2022-07-19 | キヤノン株式会社 | 画像処理装置、および画像処理装置の制御方法とプログラム |
JP2019159629A (ja) | 2018-03-12 | 2019-09-19 | 富士ゼロックス株式会社 | 情報処理システム、情報処理装置及び情報処理プログラム |
JP2019159875A (ja) * | 2018-03-14 | 2019-09-19 | セイコーエプソン株式会社 | スキャン装置およびスキャン結果表示プログラム |
JP6935809B2 (ja) * | 2019-03-14 | 2021-09-15 | セイコーエプソン株式会社 | 情報処理装置、およびプログラム |
-
2020
- 2020-01-21 JP JP2020007525A patent/JP7391672B2/ja active Active
-
2021
- 2021-01-12 KR KR1020210003746A patent/KR20210094465A/ko unknown
- 2021-01-19 EP EP21152292.5A patent/EP3855717B1/en active Active
- 2021-01-20 US US17/153,101 patent/US11297192B2/en active Active
- 2021-01-21 CN CN202110081831.6A patent/CN113225446A/zh active Pending
-
2022
- 2022-03-01 US US17/683,636 patent/US11616884B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002099559A (ja) | 2000-09-25 | 2002-04-05 | Fuji Xerox Co Ltd | ドキュメント管理システム |
JP2006229305A (ja) | 2005-02-15 | 2006-08-31 | Canon Inc | ネットワーク文書管理システム |
JP2019128727A (ja) | 2018-01-23 | 2019-08-01 | キヤノン株式会社 | スキャン画像に関連する情報を設定するための装置、方法、およびプログラム |
JP2019134364A (ja) | 2018-02-01 | 2019-08-08 | キヤノン株式会社 | スキャン画像データに関連する情報を設定するための装置、方法、及びプログラム |
JP2019197325A (ja) | 2018-05-08 | 2019-11-14 | キヤノン株式会社 | 情報処理システム、情報処理装置とその制御方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
KR20210094465A (ko) | 2021-07-29 |
US11616884B2 (en) | 2023-03-28 |
US20210227082A1 (en) | 2021-07-22 |
EP3855717B1 (en) | 2023-08-16 |
EP3855717A1 (en) | 2021-07-28 |
JP2021114736A (ja) | 2021-08-05 |
US11297192B2 (en) | 2022-04-05 |
CN113225446A (zh) | 2021-08-06 |
US20220417370A1 (en) | 2022-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7391672B2 (ja) | 文書を電子化するための画像処理システム、その制御方法及びプログラム | |
JP7317561B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
JP7467737B2 (ja) | ユーザ操作のためのガイダンスを表示する画像処理装置、その制御方法及びプログラム | |
JP7271149B2 (ja) | 装置、方法、及びプログラム | |
JP2021163178A (ja) | 情報処理装置 | |
US11765292B2 (en) | Information processing apparatus used for converting image to file, image processing system, method of controlling information processing apparatus, and storage medium | |
JP7225017B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
JP2021163983A (ja) | サーバー、情報処理方法、プログラム | |
JP2021184190A (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US11800032B2 (en) | Apparatus, information processing method, and storage medium | |
JP2023072812A (ja) | 情報処理装置、情報処理装置の制御方法、そのプログラム及び画像処理システム | |
JP2021164132A (ja) | 画像処理システム、及びプログラム | |
JP7330742B2 (ja) | スキャン画像にプロパティを設定するための画像処理装置、その制御方法及びプログラム | |
JP2021190834A (ja) | 情報処理装置、その処理方法、およびプログラム | |
JP7358663B2 (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム | |
JP7387282B2 (ja) | スキャン画像のプレビュー表示を行なう画像処理装置、その制御方法及びプログラム | |
JP2024032563A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
JP2022069405A (ja) | 情報処理装置、情報処理システム、情報処理装置の制御方法及びプログラム | |
JP2023071227A (ja) | 情報処理装置、情報処理装置の制御方法及びプログラム | |
JP2024040612A (ja) | 情報処理装置、情報処理装置の制御方法、及びプログラム | |
JP2020177526A (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム | |
JP2020178284A (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム | |
JP2020177523A (ja) | スキャン画像のプレビュー表示を行う画像処理装置、その制御方法及びプログラム | |
JP2023084495A (ja) | 情報処理装置、文書電子化システム、文書処理方法とプログラム | |
JP2023120267A (ja) | タッチパネルを用いた文字入力のための画像処理装置、その制御方法及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230117 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230117 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231013 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231122 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7391672 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |