JP2024040612A - Information processing device, method for controlling information processing device, and program - Google Patents
Information processing device, method for controlling information processing device, and program Download PDFInfo
- Publication number
- JP2024040612A JP2024040612A JP2022145066A JP2022145066A JP2024040612A JP 2024040612 A JP2024040612 A JP 2024040612A JP 2022145066 A JP2022145066 A JP 2022145066A JP 2022145066 A JP2022145066 A JP 2022145066A JP 2024040612 A JP2024040612 A JP 2024040612A
- Authority
- JP
- Japan
- Prior art keywords
- character string
- character
- file name
- mfp
- file
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000010365 information processing Effects 0.000 title claims abstract description 14
- 230000004044 response Effects 0.000 claims description 12
- 238000012545 processing Methods 0.000 abstract description 102
- 238000012937 correction Methods 0.000 abstract description 6
- 238000012790 confirmation Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 39
- 238000000605 extraction Methods 0.000 description 21
- 230000006870 function Effects 0.000 description 21
- 238000010586 diagram Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 13
- 238000012986 modification Methods 0.000 description 13
- 238000010191 image analysis Methods 0.000 description 9
- 238000004458 analytical method Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000013523 data management Methods 0.000 description 4
- 238000013500 data storage Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000012015 optical character recognition Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000003086 colorant Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 238000007639 printing Methods 0.000 description 2
- 239000000344 soap Substances 0.000 description 2
- 238000013475 authorization Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Landscapes
- Character Discrimination (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Facsimiles In General (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
本発明は、情報処理装置、情報処理装置の制御方法、及びプログラムに関する。 The present invention relates to an information processing device, a method of controlling the information processing device, and a program.
従来、紙帳票をスキャンして電子化し、電子化した帳票のファイル名を該帳票の記載内容に基づいて設定することで帳票を管理するシステムがある。
特許文献1には、事前に設定したファイルの命名ルールに従って、スキャンした帳票内から自動で文字列を抽出し、ファイル名生成を自動で行う技術が開示されている。
2. Description of the Related Art Conventionally, there is a system for managing a form by scanning a paper form, digitizing it, and setting a file name of the digitized form based on the written contents of the form.
Patent Document 1 discloses a technique for automatically extracting a character string from a scanned form and automatically generating a file name according to a file naming rule set in advance.
例えば、特許文献1のファイル命名ルールとして、属性「文書種別」、区切り文字「アンダーバー」、属性「会社名」が設定されていたとする。この場合において、スキャンした画像データに文字認識処理を実行した結果から属性「文書種別」と属性「会社名」に関連する文字列として、それぞれ「見積書」、「AACompany」を抽出し、ファイル名「見積書_AACompany」を生成し、画面に表示する。自動抽出されたファイル名を修正する場合に修正したい箇所を選択すると、その箇所の命名ルールに定義した属性に対応する帳票内の他の文字列候補を表示し、選択して修正することが可能となっている。例えば、「AACompany」を選択すると命名ルールでは属性「会社名」であるため、帳票内の「会社名」に対応する他の文字列「BBCompany」、「CCCompany」を表示する。 For example, assume that the attribute "document type", the delimiter "underbar", and the attribute "company name" are set as the file naming rule of Patent Document 1. In this case, from the results of character recognition processing performed on the scanned image data, "estimate" and "AACompany" are extracted as character strings related to the attribute "document type" and "company name", respectively, and the file name is Generate “Quote_AACompany” and display it on the screen. When modifying the automatically extracted file name, if you select the part you want to modify, other character string candidates in the form that correspond to the attributes defined in the naming rule for that part will be displayed, and you can select and modify them. It becomes. For example, if you select "AACompany", the attribute is "company name" according to the naming rule, so other character strings "BBCompany" and "CCCompany" corresponding to "company name" in the form are displayed.
しかし、特許文献1の技術では、候補表示の際に文字列表示のみであるため、帳票内のどの文字領域が使用されたか容易に確認することができない。また、文字認識処理結果に誤りがあった場合に候補を選択後に再度修正が必要となる。このように、従来の技術では、スキャンした帳票から生成したファイル名を修正する際の文字領域の確認や選択の操作が煩雑であった。 However, in the technique of Patent Document 1, only character strings are displayed when displaying candidates, so it is not possible to easily confirm which character area in the form has been used. Furthermore, if there is an error in the character recognition processing result, it will be necessary to correct it again after selecting a candidate. As described above, in the conventional technology, operations for checking and selecting character areas when modifying a file name generated from a scanned form are complicated.
本発明は、上記の課題を解決するためになされたものである。本発明は、スキャンした帳票から生成したファイル名を修正する際に、使用する文字領域の確認や選択を容易に行うことができる仕組みを提供することを目的とする。 The present invention has been made to solve the above problems. An object of the present invention is to provide a mechanism that allows easy confirmation and selection of character areas to be used when modifying a file name generated from a scanned form.
本発明は、文書画像に含まれる文字領域を文字認識し、当該文字認識結果の文字列のうち、所定のルールで指定された属性に対応する文字列を組み合わせることにより生成された前記文書画像のファイルに関する情報を、前記文書画像のプレビュー表示とともに表示する第1表示手段と、前記表示されたファイルに関する情報の中からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性と同じ属性の他の文字列に対応する前記文書画像内の領域を、前記プレビュー表示において強調表示する第2表示手段と、前記強調表示した領域に対する文字認識結果の複数の候補文字列をリスト表示する第3表示手段と、前記表示されたファイルに関する情報において選択された前記文字列を、前記リスト表示された複数の候補文字列の中からユーザーにより選択された候補文字列で置き換えて表示する第4表示手段と、を有することを特徴とする。 The present invention performs character recognition on a character region included in a document image, and combines character strings corresponding to attributes specified by a predetermined rule from among the character strings resulting from the character recognition. a first display means for displaying information regarding a file together with a preview display of the document image; a second display means for highlighting, in the preview display, an area in the document image corresponding to another character string having the same attribute as the attribute corresponding to the attribute; and a plurality of candidate characters of character recognition results for the highlighted area. a third display means for displaying a list of columns; and replacing the character string selected in the displayed information regarding the file with a candidate character string selected by the user from among the plurality of candidate character strings displayed in the list. and fourth display means for displaying.
本発明によれば、スキャンした帳票から生成したファイル名を修正する際に、使用する文字領域の確認や選択を容易に行うことができる。 According to the present invention, when modifying a file name generated from a scanned form, it is possible to easily confirm and select the character area to be used.
以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。 EMBODIMENT OF THE INVENTION Hereinafter, the form for implementing this invention is demonstrated using drawings. Note that the following embodiments do not limit the claimed invention, and not all combinations of features described in the embodiments are essential to the solution of the invention.
〔第1実施形態〕
<全体構成>
図1は、本発明の一実施形態を示す画像処理システムの全体構成の一例を示す図である。
本実施形態の画像処理システムは、MFP(Multifunction Peripheral)110、クライアントPC111、MFP連携サービス120およびクラウドストレージサービス(以下「クラウドストレージ」)130を含む。
[First embodiment]
<Overall configuration>
FIG. 1 is a diagram showing an example of the overall configuration of an image processing system according to an embodiment of the present invention.
The image processing system of this embodiment includes an MFP (Multifunction Peripheral) 110, a client PC 111, an MFP
MFP110及びクライアントPC111は、LAN(Local Area Network)経由でインターネット上の各種サービスを提供するサーバーに対して通信可能に接続されている。
MFP110は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置の一例である。
クライアントPC111は、MFP連携サービス120に対して依頼したサービスの提供を受けるコンピュータまたはアプリケーションプログラムである。
The MFP 110 and the client PC 111 are communicably connected to a server that provides various services on the Internet via a LAN (Local Area Network).
The MFP 110 is a multifunction device having multiple functions such as a scanner and a printer, and is an example of an image processing device.
The client PC 111 is a computer or an application program that receives services requested from the MFP
MFP連携サービス120は、MFP110でスキャンした画像ファイルを自サーバー上に保存したり、別のストレージサービス等のファイル保存が可能なサービスに転送したりする機能を持つサービスの一例である。
クラウドストレージ130は、インターネットを介してファイルを保存したりウェブブラウザでファイルを取得したりすることができるサービスである。
The MFP
本実施形態の画像処理システムは、MFP110、クライアントPC111、MFP連携サービス120およびクラウドストレージ130からなる構成としているがこれに限定されない。例えば、MFP110がクライアントPC111やMFP連携サービス120の役割を兼ね備えてもよい。また、MFP連携サービス120はインターネット上ではなくLAN上のサーバーに配置した接続形態であってもよい。また、クラウドストレージ130はメールサーバーなどに置き換えて、スキャンした画像をメールに添付し送信してもよい。
The image processing system of this embodiment has a configuration including an MFP 110, a client PC 111, an MFP
<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成の一例を示す図である。
MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223を有する。
<MFP hardware configuration>
FIG. 2 is a diagram illustrating an example of the hardware configuration of the
MFP 110 includes a control section 210, an
制御部210は、以下の各部211~219を有し、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された制御プログラムを読み出して、読取/印刷/通信などMFP110が有する各種機能を実行・制御する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施形態では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。なお、HDD(Hard Disk Drive)の代わりに又は併用してSSD(Solid State Drive)等の他の記憶装置を備える構成でもよい。
The control unit 210 includes the
操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザーによる操作/入力/指示を受け付ける。
プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データは、プリンタI/F216を介して制御部210からプリンタ部221へ転送され、記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を読み取って画像データを生成し、スキャナI/F217を介して制御部210に入力する。MFP110は、スキャナ部222で生成された画像データをプリンタ部221から印刷出力(コピー)する他、ファイル送信またはメール送信することができる。
The operation unit I/
The printer I/
モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置との間で画像データをファクシミリ通信する。
ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いてインターネット上の各サービスに画像データや情報を送信したり、各種情報を受信したりする。
Modem I/
The network I/
<クライアントPC、MFP連携サービスのハードウェア構成>
図3は、クライアントPC111及びMFP連携サービス120を構成可能な情報処理装置のハードウェア構成の一例を示す図である。
クライアントPC111及びMFP連携サービス120を構成可能な情報処理装置は、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315を有する。
<Hardware configuration of client PC and MFP cooperation service>
FIG. 3 is a diagram illustrating an example of the hardware configuration of an information processing device that can configure the
The information processing device that can configure the
CPU311は、ROM312やHDD314に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。なお、HDDの代わりに又は併用してSSD等の他の記憶装置を備える構成でもよい。
The
ネットワークI/F315は、MFP連携サービス120をインターネットに接続するインタフェースである。MFP連携サービス120およびクラウドストレージ130は、ネットワークI/F315を介して他の装置(MFP110など)から処理リスエストを受けて各種情報を送受信する。
なお、クライアントPC111は、上記の構成に加えて、ディスプレイ等の出力デバイス、キーボードやポインティングデバイス等の入力デバイス及びこれらを接続するためのインタフェース部を備える。なお、タッチパネル付きディスプレイのように入力デバイスと出力デバイスを兼用したデバイスを備えていてもよい。クライアントPC111は、パーソナルコンピュータ(PC)であっても、タブレット型端末やスマートフォンなどであってもよい。
Network I/
In addition to the above configuration, the
また、MFP連携サービス120は、1台のコンピュータにより実現されるものであっても、複数のコンピュータにより実現されるものであってもよい。例えば、MFP連携サービス120は、クラウドコンピューティングの技術を利用して実現される構成であってもよい。また、クラウドストレージ130もMFP連携サービス120と同様のハードウェア構成により実現可能である。
Furthermore, the
<画像処理システムのソフトウェア構成>
図4は、本実施形態に係る画像処理システムのソフトウェア構成の一例を示す図である。
MFP110は、ネイティブ機能部410と追加機能部420の大きく2つに分けられる。
<Software configuration of image processing system>
FIG. 4 is a diagram showing an example of the software configuration of the image processing system according to this embodiment.
The
ネイティブ機能部410に含まれる各部は、MFP110に標準的に備えられたものである。一方、追加機能部420は、MFP110に追加インストールされたアプリケーションプログラム(以下「アプリケーション」)である。追加機能部420はJava(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていても良い。
Each unit included in the native function unit 410 is provided as standard in the
ネイティブ機能部410は、スキャン実行部411、画像データ保存部412を有する。追加機能部420は、表示制御部421、スキャン指示部422、連携サービスリクエスト部423を有する。
The native function section 410 includes a
表示制御部421は、MFP110の操作部220のタッチパネル機能を有する液晶表示部に、ユーザーによる操作を受け付けるためのUI画面を表示する。例えば、MFP連携サービス120へアクセスするための認証情報の入力、スキャン設定、ならびに、スキャン開始の操作、プレビュー画面などのUI画面を表示する。
スキャン指示部422は、UI画面を介して入力されたユーザー指示に応じたスキャン設定と共にスキャン実行部411にスキャン処理を要求する。
The
The
スキャン実行部411は、スキャン指示部422からのスキャン設定を含んだスキャン要求を受け取る。スキャン実行部411は、スキャン要求に従い、スキャナI/F217を介してスキャナ部222で、原稿台ガラスに置かれた原稿を読み取ることでスキャン画像データを生成する。生成したスキャン画像データは、画像データ保存部412に送られる。スキャン実行部411は、保存したスキャン画像データを一意に示すスキャン画像識別子をスキャン指示部422へ送る。スキャン画像識別子は、MFP110においてスキャンした画像をユニークに識別するための番号や記号、アルファベットなどである(不図示)。
The
画像データ保存部412は、スキャン実行部411から受け取ったスキャン画像データをHDD214に保存する。
スキャン指示部422は、スキャン実行部411から受け取ったスキャン画像識別子に対応するスキャン画像データを画像データ保存部412から取得する。スキャン指示部422は、取得したスキャン画像データにMFP連携サービス120で処理を行う指示を連携サービスリクエスト部423に要求する。
The image
The
連携サービスリクエスト部423は、MFP連携サービス120に対して各種処理の要求を行う。例えば、ログイン、スキャン画像の解析、スキャン画像の送信などの要求を行う。MFP連携サービス120とのやり取りはRESTやSOAPなどのプロトコルを使用するが、その他の通信手段を用いてもよい。
The cooperation
MFP連携サービス120は、リクエスト制御部431、画像処理部432、クラウドストレージアクセス部433、データ管理部434、表示制御部435を有する。
The
リクエスト制御部431は、外部装置からの要求を受信できる状態で待機している。リクエスト制御部431は、処理要求を受けると、要求に応じて適宜、画像処理部432、クラウドストレージアクセス部433、データ管理部434に処理を指示する。
The
画像処理部432は、画像に対して文字領域解析、OCR(Optical Character Recognition)、設定された属性に基づく自動抽出処理(詳細はS510で記載する)、画像の回転や傾き補正などの画像に対する認識処理や画像の加工処理を行う。
The
クラウドストレージアクセス部433は、クラウドストレージに対する処理の要求を行う。クラウドサービスは一般的にRESTやSOAPなどのプロトコルで、クラウドストレージにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。クラウドストレージアクセス部433は、公開されたクラウドストレージのインタフェースを使用してクラウドストレージの操作を行う。
The cloud
データ管理部434は、MFP連携サービス120で管理するユーザー情報や各種設定データ等を保持する。
表示制御部435は、インターネット経由で接続されたPCやモバイル等の別端末(不図示)上で動作しているウェブブラウザからのリクエストを受けて画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザーは、ウェブブラウザで表示される画面経由でMFP連携サービス120に登録しているユーザー情報を確認したり、スキャンする際の設定を変更したりする。
The
The
なお、図4では、MFP110に追加機能部420をインストールする構成の例について説明したが、本件はこの構成に限定せず、クライアントPC111に追加機能部420の機能が含まれていてもよい。
Although FIG. 4 describes an example of a configuration in which the additional function unit 420 is installed in the
<全体の処理の流れ>
図5は、MFP110でスキャンした画像をファイル化してクラウドストレージに送信する際の各装置間の処理の流れを例示するシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図5では、MFP110がMFP連携サービス120とやり取りを行う記載としているが、後述する解析結果取得、画面の表示、学習の指示等はMFP110でなくクライアントPC111が実行する構成でもよい。以降、”MFP110またはクライアントPC111”が実行する処理について、クライアントPC111を省略し、”MFP110”とのみを記載する。
<Overall processing flow>
FIG. 5 is a sequence diagram illustrating the flow of processing between devices when an image scanned by the
MFP110は、通常の状態では提供する各機能を実施するためのボタンを並べたメイン画面をタッチパネル上に表示する。
MFP110にスキャン帳票をクラウドストレージに送信するための追加アプリケーション(以降「スキャンアプリ」と呼ぶ)をインストールすることで、アプリケーションの機能を使用するボタンがMFP110のメイン画面に表示される。なお、スキャンアプリは、追加機能部420に対応するアプリケーションとする。スキャンアプリの機能を使用するボタンを押すとスキャンした帳票をクラウドストレージに送信するための画面が表示され、図5のシーケンスで示す処理が行われる。
In a normal state, the
By installing an additional application (hereinafter referred to as a "scan application") on the
S501において、MFP110は、MFP連携サービス120にアクセスするための認証情報を入力するログイン画面(不図示)を表示する。このログイン画面にユーザーが認証情報(ユーザー名とパスワード)の入力を行ってOKボタンを押下すると、MFP110は、ユーザー名とパスワードを含むログイン要求を、MFP連携サービス120に送信する(S502)。
In S501, the
S503において、MFP連携サービス120は、ログイン要求に含まれるユーザー名とパスワードが正しいか検証し、正しければアクセストークンをMFP110に返す。以降のMFP110からMFP連携サービス120に対して行う各種リクエストには、このアクセストークンと共に要求が出され、この情報により処理対象のユーザーを特定することができる。ユーザー認証の方法は一般的に公知な手法(Basic認証、Digest認証、OAuthを用いた認可等)を用いて行う。
In S503, the
MFP110は、ログイン処理が完了したら、S504において、スキャン設定画面(不図示)を表示する。ユーザーは、このスキャン設定画面において、各種スキャンの読み込みに関する設定を行う。さらに、ユーザーが、原稿台ガラスまたはADFにスキャンする対象の紙帳票を置き、「スキャン開始」ボタンを押すと、MFP110は、S505において、スキャンを実行して紙帳票を電子化した画像データを生成する。
When the login process is completed, the
そして、S506において、MFP110は、スキャン処理により生成した画像(スキャン画像)とともにスキャン画像の解析要求をMFP連携サービス120に送信する。このときにスキャンした画像全てを送信してもよいし、解析対象だけ先に送信し、あとで全てのスキャン画像を送信してもよい。
Then, in S506, the
MFP連携サービス120は、スキャン画像の解析要求を受信すると、S507において、MFP連携サービス120の画像処理部432で画像解析を開始する。その後、MFP連携サービス120は、画像解析処理の終了を待たずに、MFP連携サービス120に依頼した解析を一意に示す識別子である”processId”をMFP110に返す。
When the
さらにS507において、MFP連携サービス120は、要求受信後、画像処理部432で画像解析処理を行う。画像解析処理では、画像処理部432は、まずS508において、画像内に存在する文字領域の解析を行う。その後、画像処理部432は、S509において、上記S508で解析した領域に対して文字認識処理を行う。さらに、画像処理部432は、S510において、上記S509の文字認識処理によって抽出された文字列のなかから、所定のルール(あらかじめ設定されたファイル名の命名ルール)の属性に従ってファイル名を自動抽出する。なお、S508~S510の処理の詳細については後述する図8で説明を行う。
Furthermore, in S507, after receiving the request, the
MFP110は、S511において、上記S506のレスポンスで受け取った”processId”を使用して、MFP連携サービス120に定期的(例えば数百ミリ秒から数ミリ秒程度毎など)に”processId”の画像解析の処理状況の確認を行う。図では省略するが、S511の処理はMFP連携サービス120の画像処理完了のレスポンスが取得できるまで(S512のタイミングまで)継続して行う。
In S511, the
MFP連携サービス120は、上記S511の処理状況確認の要求を受けると”processId”の処理の状況を確認し、レスポンスをMFP110に返す。レスポンスには、”status”に現在の処理状況を示す文字列が格納される。例えば”status”が”processing”の時は、MFP連携サービス120で処理が行われている最中であることを示し、”completed”の時は処理が完了している状態であることを示す。なお、処理が失敗した場合に”failed”など、この他のステータスが返ることもある。また、処理完了時(statusがcompletedの場合)のレスポンスは、ステータスと共にスキャン画像を解析した結果やスキャン設定等の情報を含む。
MFP連携サービス120は、S512において、処理完了のレスポンスをMFP110に返す。
When the
In S512, the
MFP110は処理の完了のレスポンスを検知すると、S513において、該レスポンスに含まれる結果情報が格納されたURLから結果情報を取得する。
次にS514において、MFP110は、上記S513で取得した結果情報を使用してファイル名設定画面600(図6)を表示する。例えば、MFP110は、上述の結果情報が格納されたURLにアクセスして、表示制御部435により提供されるファイル名設定画面600を取得して表示する。ファイル名設定画面の詳細については後述する。
When the
Next, in S514, the
ユーザーが、ファイル名設定画面600で、スキャン帳票にファイル名を確認し、必要に応じてファイル名設定の操作を行い、後述する「送信」ボタン606を押すと、MFP110は、S515において、送信要求を検出する。
送信要求を検出すると、S516において、MFP110は、入力情報として設定したファイル名をMFP連携サービス120に送信する。
When the user checks the file name on the scanned form on the file
Upon detecting the transmission request, the
ファイル名を受信すると、MFP連携サービス120のリクエスト制御部431は、S517において、画像処理部432にファイル生成を依頼する。画像処理部432は、MFP連携サービスに登録されたスキャン設定からクラウドストレージ130に送信するファイルフォーマットの情報を取得し、その設定に基づいてスキャン画像からファイルを生成する。
Upon receiving the file name, the
S518において、MFP連携サービス120は、クラウドストレージ130に、スキャン画像から生成したファイルとそのファイル名を送信する。
MFP110は、入力情報の送信のレスポンスを受けると処理を終了する。
In S518, the
The
なお、ユーザーは、スキャンすべき帳票が複数ある場合は、複数部の帳票を繰り返しスキャンする(S504~S513の処理を繰り返し行う)ことができる。また、スキャンする前にスキャンした文書を固定ページ数や仕切り紙を用いて分割する設定を指示することで、複数の帳票をまとめて一度にスキャンして複数の帳票に分割することもできる。 Note that if there are multiple documents to be scanned, the user can repeatedly scan multiple copies of the document (repeatedly perform the processes of S504 to S513). Additionally, by instructing the user to set a fixed number of pages or dividing a scanned document using partition paper before scanning, multiple documents can be scanned at once and divided into multiple documents.
また、S514~S516の処理を、例えば、ユーザーがクライアントPC111のウェブブラウザまたは専用のアプリケーション等からMFP連携サービス120にログインする。すると、上述のようにスキャンされたログインユーザーに対応する文書のうち、ファイルが生成されていない文書の一覧が表示される。ユーザーが、この文書の一覧からいずれかの文書を選択すると、MFP連携サービス120は、クライアントPC111のウェブブラウザまたは専用のアプリケーション等に、ファイル名設定画面600を送信し、ファイル名の修正対象箇所の選択を受け付けるものとする。
Further, the processing of S514 to S516 is performed by, for example, a user logging into the
図6は、ファイル名設定画面600の一例を示す図である。
ファイル名領域601は、ファイル名を表示する領域であり、あらかじめ設定されたファイル名の命名ルールとスキャンした画像の解析結果を基に生成されたファイル名が表示される。なお、ファイル名の命名ルールの設定は、図7のようなファイル名命名ルール設定画面において設定される。ここで図7を用いて、ファイル名命名ルールについて説明する。
FIG. 6 is a diagram showing an example of a file
A
図7は、本実施形態におけるファイル名命名ルール設定画面の一例を示す図である。
例えば、ユーザーがMFP110又はクライアントPC111のウェブブラウザ等からMFP連携サービス120にログインし、ファイル名命名ルール設定を選択した場合に、表示制御部435が図7のファイル名命名ルール設定画面700を返す。これにより、MFP110又はクライアントPC111のウェブブラウザ等に、ファイル名命名ルール設定画面700が表示される。
FIG. 7 is a diagram showing an example of a file name naming rule setting screen in this embodiment.
For example, when the user logs into the
図7のファイル名命名ルール設定画面700は、ルール設定後の画面の表示例を示している。ファイル名命名ルール設定画面700は、ルール設定領域701、システムトークン領域702、区切り文字トークン領域703、自動抽出トークン領域704の4つの領域を有している。各トークン領域702~704には、ファイル名の命名ルールを設定する際に組み合わせて利用可能な複数のトークン(構成要素)が表示されている。システムトークン702には、システムから取得可能な情報に関するトークン(ユーザー名、デバイス名、時刻、日付など)が表示されている。区切り文字トークン領域703には、各トークンの間に挿入する区切り文字に関するトークン(アンダースコア、ハイフン、スペース)が表示されている。自動抽出トークン704には、スキャン画像の文字認識処理した結果の文字列の中から、所望の属性(文書種別、文書作成日、文書番号、発行先の会社名、発行先の人名、発行元の会社名、発行元の人名、金額、など)に関する文字列を選択するためのトークンが表示されている。
A file name naming
ファイル名命名ルール設定画面700では、トークン領域702~704に表示されている複数のトークンの中からユーザが所望のトークンをドラッグして、ルール設定領域701にドロップして並べることで、命名ルールを設定することができる。ルール設定領域701に並べられたトークンに対応する情報を、その並び順にしたがって組み合わせることでファイル名が生成されることになる。また、ファイル名命名ルール設定画面700には、設定したルールを確定・保存するための「保存」ボタン705が備えられている。「保存」ボタン705が押下されると、ファイル名命名ルール設定画面700で設定したファイル名の命名ルールが確定され、MFP連携サービス120に送信されて保存される。
MFP連携サービス120は、このようなファイル名命名ルール設定画面を使用して設定されたファイル名の命名ルールを用いて、ファイル名を生成する。
On the file name naming
The
図7の例ように、命名ルールに、自動抽出トークンの属性「文書種別」と、区切り文字トークンの「アンダースコア」と、自動抽出トークンの属性「文書番号」とが含まれていた場合には、MFP連携サービス120は、スキャン画像の文字認識結果から、自動抽出トークンの属性情報に対応する文字列を選択してファイル名を生成する。
例えば、属性「文書種別」に対応する文字列として「見積書」が抽出され、属性「文書番号」に対応する文字列として「132343500」が抽出された場合、区切り文字の「アンダースコア」と組み合わせることにより、ファイル名「見積書_132343500」が生成される。そして、当該生成されたファイル名は、図6のファイル名設定画面600のファイル名領域601に表示される。
As shown in the example in Figure 7, if the naming rule includes the automatically extracted token attribute "document type", the delimiter token "underscore", and the automatically extracted token attribute "document number", , the
For example, if "estimate" is extracted as a string corresponding to the attribute "document type" and "132343500" is extracted as a string corresponding to the attribute "document number", it will be combined with the delimiter "underscore". As a result, the file name “Quote_132343500” is generated. The generated file name is then displayed in the
以下、図6の説明に戻る。
自動抽出トークンの属性情報に基づいて自動抽出された文字列が誤抽出であった場合、ユーザはファイル名を修正するために、まず、ファイル名領域601に表示されている誤抽出文字列を選択し、さらに、スキャン画像上の別の文字列を選択する。例えば、文書番号として自動抽出された「132343500」を別の領域の文字列にしたい場合は、次のように操作する。まず、ユーザは、ファイル名領域601で修正対象の「132343500」を選択し、次に「プレビュー領域」602に表示される帳票画像(スキャン画像)上で別の文字列画像「E20019-01」を選択すると、ファイル名領域601内の「132343500」を、当該選択された文字列画像に対応する文字認識結果文字列「E20019-01」に修正することができる。なお、修正文字列を選択した場合の処理の詳細については後述する。
また、ファイル名領域601の右側の空白部分をタッチすると、ソフトキーボードが表示され、当該ファイル名領域601に表示中のファイル名全体の修正、および任意の文字を追加入力することができる。
The description of FIG. 6 will now be returned to.
If the character string automatically extracted based on the attribute information of the automatic extraction token is incorrectly extracted, the user first selects the incorrectly extracted character string displayed in the
Furthermore, when a blank space on the right side of the
「プレビュー領域」602は、スキャン画像(帳票画像)をプレビュー表示する。さらに、このスキャン画像内の文字領域をタッチすると、タッチした位置に対応する文字領域に対応する文字認識結果文字列をファイル名に追加等することができる。ファイル名に使用されている文字列は、選択されていることがわかるように、当該文字領域に線、枠線などの形状や色などを付与して強調表示してもよい。複数の文字領域を選択した場合、それぞれの文字領域の色を異なる色にしてもよい。対応するプレビュー領域602上で選択された文字領域とファイル名領域601の文字列とのそれぞれに、同じ色や同じ網掛け枠を表示して、対応付けが分かりやすいようにしてもよい。図6の例では、プレビュー上の選択した文字領域とファイル名の表示領域を同じ網掛け枠を使用することで対応付けを分かりやすく表示している。
A "preview area" 602 displays a preview of the scanned image (form image). Furthermore, by touching a character area within this scanned image, a character recognition result character string corresponding to the character area corresponding to the touched position can be added to the file name. The character string used in the file name may be highlighted by adding a shape such as a line or frame line or color to the character area so that it can be seen that it has been selected. If multiple text areas are selected, each text area may be set to a different color. The character area selected on the
また、選択した文字領域が中央になるようにプレビュー表示位置の変更や、拡大率の変更を行ってもよい。また、文字領域が複数存在する場合、あらかじめ設定された領域数分の文字領域が表示されるように、プレビュー表示位置を算出してもよい。例えば、ファイル名に使用した領域のうち、一番上部の領域と一番下部の領域の中央部分が、プレビュー領域の縦方向の中央になるように表示位置と拡大率の変更を行い、プレビュー表示を行う。一度選択した文字領域を再度タッチすると、選択が解除されて対応するファイル名の文字列を削除して、文字領域に付与した線や色なども表示しない状態に戻す。例では、文字列が非選択時の場合に、文字領域はプレビュー上には表示されないように記載している。しかし、ユーザーにどの領域がタッチできるのかを示すために色や枠線を用いて文字領域がわかるように表示してもよい。また、文字領域がわかるようにする表示は、ボタンなどで表示と非表示が切り替えられるようにしてもよい。プレビュー領域に対してスワイプ操作を行うと、プレビュー領域で表示される画像の位置を移動することができる。 Furthermore, the preview display position may be changed or the enlargement ratio may be changed so that the selected character area is centered. Furthermore, when there are multiple character areas, the preview display position may be calculated so that a preset number of character areas are displayed. For example, change the display position and magnification so that the center of the top and bottom areas of the area used for the file name becomes the vertical center of the preview area, and then display the preview. I do. If you touch the selected text area again, the selection is canceled, the corresponding file name string is deleted, and the lines and colors added to the text area are returned to the state where they are not displayed. In the example, the text area is not displayed on the preview when the text string is not selected. However, in order to show the user which areas can be touched, the character areas may be displayed using colors or frames. Further, the display that makes the character area visible may be switched between display and non-display using a button or the like. By performing a swipe operation on the preview area, you can move the position of the image displayed in the preview area.
「ファイル名削除」ボタン603は、ファイル名のうち末尾に追加されている文字領域に対応する文字を削除する。「プレビュー拡大」ボタン604は、プレビュー領域に表示している画像の拡大倍率を大きくする。「プレビュー縮小」ボタン605は、プレビュー領域に表示している画像の拡大倍率を小さくする。拡大および縮小時にプレビュー領域の中央の座標が拡大および縮小前と同一となるように表示位置の調整を行う。
また、「送信」ボタン606を押下することで、設定したファイル名をMFP連携サービス120へ送信し、ファイル生成、ファイル名を付与したファイルの送信を行う。送信が完了するとスキャン前の画面に戻る。
A "delete file name"
Furthermore, by pressing the "Send"
図8は、本システムにおける画像処理部432が行う画像解析処理の詳細を示すフローチャートである。本フローは図5におけるS507~S510に相当する。
FIG. 8 is a flowchart showing details of image analysis processing performed by the
はじめにS801において、画像処理部432は、入力画像の文字領域を解析し、帳票内の文字領域群を取得する。
次にS802において、画像処理部432は、上記S801で取得した帳票の全文字領域に対して文字認識処理を実施し、文字列を抽出する。
First, in S801, the
Next, in S802, the
その後、S803において、画像処理部432は、あらかじめ設定されたファイル名の命名ルールに含まれている自動抽出トークンの属性情報に基づいて、属性情報に対応する文字列を自動抽出する。
例えば、属性情報として「文書種別」が定義されていた場合は、「見積書」や「請求書」など文書種別に相当する文字列を自動抽出する。また、「会社名(発行元)」が定義されていた場合は、帳票内の発行元の会社名に相当する文字列を自動抽出する。
文字認識(OCR)処理では1つの文字列画像に対して複数の候補文字列が順位付けされて抽出されるが、その中の最上位のものがその文字列画像の文字認識結果として利用される。さらに、自動抽出トークンで指定された属性情報に対応する文字列の候補が複数抽出された場合は、その中で順位付けを行って最上位のものがファイル名に利用される。文字認識処理結果の第2位以下の候補、ならびに、属性情報に対応する自動抽出処理結果の第2位以下の候補については、後述するファイル名修正時に使用する。詳細は後述する。
After that, in S803, the
For example, if "document type" is defined as attribute information, character strings corresponding to the document type, such as "estimate" or "invoice", are automatically extracted. Furthermore, if "company name (issuer)" is defined, a character string corresponding to the company name of the issuer in the form is automatically extracted.
In character recognition (OCR) processing, multiple candidate character strings are ranked and extracted for one character string image, and the highest ranked one is used as the character recognition result for that character string image. . Furthermore, if multiple character string candidates corresponding to the attribute information specified by the automatic extraction token are extracted, they are ranked and the highest ranked one is used as the file name. The second and lower candidates of the character recognition processing results and the second and lower candidates of the automatic extraction processing results corresponding to the attribute information are used when modifying the file name, which will be described later. Details will be described later.
ここからは、図6のファイル名設定画面で行う自動抽出されたファイル名の修正処理について、図9、図10を用いて詳細に説明を行う。
図9は、第1実施形態におけるファイル名修正処理の詳細を示すフローチャートである。このフローチャートの処理は、MFP110(又はクライアントPC111)で実行される構成でも、MFP連携サービス120で実行される構成でもよい。MFP連携サービス120で実行される場合、MFP連携サービス120での処理結果がMFP110に送信されて表示され、MFP110での操作情報がMFP110からMFP連携サービス120に送信されるものとする。
ここでは、まずMFP110が図9の処理を実行する場合について説明する。
From here on, the process of correcting automatically extracted file names performed on the file name setting screen of FIG. 6 will be explained in detail using FIGS. 9 and 10.
FIG. 9 is a flowchart showing details of the file name modification process in the first embodiment. The processing in this flowchart may be executed by the MFP 110 (or client PC 111) or by the
First, a case where the
図10は、第1実施形態におけるファイル名修正処理の画面の一例を示す図である。
図10のファイル名の「132343500」を属性情報に基づいて自動抽出された帳票内の別の文字列候補「E20019-01」に変更してファイル名を修正するフローについて具体的に説明する。
FIG. 10 is a diagram showing an example of a screen for file name modification processing in the first embodiment.
A flow of modifying the file name by changing the file name "132343500" in FIG. 10 to "E20019-01", another character string candidate in the form automatically extracted based on attribute information, will be specifically described.
ユーザーが、ファイル名領域601に表示されているファイル名の中から自動抽出された文字列のうち、修正したい文字列が選択すると、S901において、MFP110が、該選択操作を受け付ける。例えば、この時点では、図10のファイル名設定画面600でファイル名領域601には、順位が最上位の文字列(「見積書」ならびに「132343500」)が、その属性情報に適切な文字列として表示されている。そして、ユーザーが修正対象の文字列として、図10のファイル名設定画面600でファイル名領域601の文字列「132343500」を選択したとする。
When the user selects a character string to be modified from among the character strings automatically extracted from the file name displayed in the
S902において、MFP110は、上記S901で選択された文字列がどの属性情報から抽出された文字列なのかのチェックを行い、属性情報を抽出する。例えば、図10で文字列「132343500」を選択した場合、その文字列は属性「文書番号」を基に抽出された文字列であるため、属性情報として「文書番号」を取得する。
In S902, the
S903において、MFP110は、上記S902で取得した属性情報に対して、帳票内で自動抽出された他の候補が存在するか確認をする。例えば、図8のS803で属性「文書番号」に基づいて帳票内の文字列から順位付けて自動抽出された文字列候補群の中から最上位以外のものを修正候補とする。図10の帳票において、属性「文書番号」に基づいて自動抽出された文字列の順位が順に、課税登録番号1003、見積番号1004であったとする。この場合、課税登録番号1003は最上位のためファイル名として使用されている状態であるので、見積番号1004が修正候補として扱われることになる。
自動抽出された他の候補が存在しない場合(S903でNoの場合)、MFP110は、ファイル名の修正対象箇所の選択に応じた処理を終了する。
一方、自動抽出された他の候補が存在する場合(S903でYesの場合)、MFP110は、S904に処理を進める。
In S903, the
If there are no other automatically extracted candidates (No in S903), the
On the other hand, if there are other automatically extracted candidates (Yes in S903), the
S904において、MFP110は、上記S903で確認した自動抽出の候補の文字列領域を強調表示するよう制御する。候補が複数存在する場合は、それぞれ強調表示する。それぞれ視覚的に認識しやすいように異なる色、背景で強調表示してもよい。強調表示する領域がプレビュー表示外の場合は、プレビューの表示領域を縮小して候補の強調表示を行ってもよい。あわせて、ファイル名に使用されている他の文字列箇所の強調表示をオフにするように制御する。
In S904, the
図10は、自動抽出の候補である見積番号1004「E20019-91」を強調表示した例である。なお、このとき、ファイル名領域601に表示されているファイル名を構成する他の文字列(「見積書」)の強調表示を自動的にオフにしている。強調表示されるのはファイル名の修正対象文字列とその文字列の属性情報に基づいて自動抽出された文字列候補になる。これにより、ファイル名の命名ルールに設定された属性に基づいて自動抽出された他の候補の位置の把握と選択を簡単に行うことが可能となる。
FIG. 10 is an example in which
S905において、MFP110は、上記S904で強調表示した自動抽出候補の文字列に対して、文字認識処理結果の他の候補文字列が存在するか確認をする。候補の確認では、図8のS802の文字認識処理結果の中から、強調表示した自動抽出候補の文字列画像について、文字認識処理結果の他の候補が存在するか確認を行う。例えば、見積番号1004「E20019-91」の文字認識処理結果の候補として、「E20079-01」、「E20019-01」、「E20079-07」が得られていたものとする。
自動抽出候補の文字列に対して文字認識処理の候補が存在しない場合(S905でNoの場合)、MFP110は、ファイル名の修正対象箇所の選択に応じた処理を終了する。
一方、自動抽出候補の文字列に対して文字認識処理の候補が存在する場合(S905でYesの場合)、MFP110は、S906に処理を進める。
In S905, the
If there are no candidates for character recognition processing for the character string that is an automatic extraction candidate (No in S905), the
On the other hand, if there are candidates for character recognition processing for the character string that is an automatic extraction candidate (Yes in S905), the
S906において、MFP110は、上記S904で強調表示を行った自動抽出候補文字列の領域に、上記S905で確認した文字認識処理の候補を表示する。図10のように自動抽出の候補文字列の見積番号1004に対して、文字認識処理の候補文字列1005を表示する。図10では、例として、文字認識処理の候補として、「E20079-01」、「E20019-01」、「E20079-07」をリスト表示している。帳票の文字領域と重なる場合には、その文字領域に被らない位置に表示してもよい。スキャンしたユーザーは、リスト表示された文字列の中から適切なものを選択することが可能である。
In S906, the
図10の例では、プレビュー表示したスキャン画像上では文字列画像が「E20019-01」となっているが、文字認識処理を行った結果の第一候補は「E20079-01」となっており、文字認識処理結果が間違っている結果となっている。もしも、ファイル名修正時に、ユーザーにより選択された見積番号1004の領域の文字認識結果の第一候補をそのままファイル名として使用してしまうと、文字認識結果が間違っている「E20079-01」が選択されてしまう。そこで、本実施形態では、ユーザがファイル名領域601において修正対象の文字列を選択すると、当該選択された文字列の属性情報と同じ属性情報を有する文字列画像について、その文字認識結果の複数の候補文字列を表示する。これにより、当該表示された複数の文字認識処理結果の候補文字列の中から、ユーザーが正しいものを適切に選択することが可能となる。本例では、正しい文字列として、2番目の候補の「E20019-01」を選択することで、直接編集で修正することなく、適切な文字列を選択可能となる。また、ファイル名に使用する文字列の領域は適切であるが、自動抽出された文字列の文字認識処理結果が間違っていて、他の候補に変更する場合も想定して、ファイル名で選択した修正文字列の文字認識処理の候補の表示を行ってもよい。例えば、図10ではプレビュー表示したスキャン画像の「132343500」に文字認識処理の候補として、「732343500」などを表示してもよい(不図示)。
In the example of FIG. 10, the character string image is "E20019-01" on the previewed scanned image, but the first candidate as a result of character recognition processing is "E20079-01". The character recognition processing result is incorrect. If the first candidate of the character recognition result for the area of
S907において、MFP110は、上記S906で候補表示したものの中からユーザーにより選択された文字列をファイル名に反映する。本例では、ファイル名が「見積書_132343500」だったものが、「見積書_E20019-01」となる。このときに、上記S904でファイル名に使用されている他の文字列箇所(見積書)の強調表示をオフにしていたが、ファイル名が設定された後に元の強調表示に戻すものとする。
In S907, the
なお、ユーザーが、ファイル名設定画面600において、必要に応じて同様の操作を行い、「送信」ボタン606を押すと、MFP110は、ファイル名設定画面600において設定したファイル名をMFP連携サービス120に送信する(図5のS516に対応)。
Note that when the user performs similar operations as necessary on the file
次に、図9のフローチャートの処理を、MFP連携サービス120で実行する場合について説明する。すなわち、MFP連携サービス120から表示情報をMFP110に送信し、該表示情報に基づきMFP110で表示を行う。また、MFP110で受け付けた操作の情報をMFP連携サービス120に送信し、MFP連携サービス120で処理を行うものとする。
Next, a case will be described in which the process of the flowchart in FIG. 9 is executed by the
ユーザーが、ファイル名領域601に表示されているファイル名の中から自動抽出された文字列のうち、修正したい文字列が選択すると、その操作の情報がMFP連携サービス120に送信され、S901において、MFP連携サービス120が、該選択操作を受け付ける。
S902において、MFP連携サービス120は、上記S901で選択された文字列がどの属性情報から抽出された文字列なのかのチェックを行い、属性情報を抽出する。
When the user selects a character string to be modified from among the character strings automatically extracted from the file name displayed in the
In S902, the
S903において、MFP連携サービス120は、上記S902で取得した属性情報に対して、帳票内で自動抽出された他の候補が存在するか確認をする。自動抽出された他の候補が存在しない場合(S903でNoの場合)、MFP連携サービス120は、ファイル名の修正対象箇所の選択に対する処理を終了する。
一方、自動抽出された他の候補が存在する場合(S903でYesの場合)、MFP連携サービス120は、S904に処理を進める。
In S903, the
On the other hand, if there are other automatically extracted candidates (Yes in S903), the
S904において、MFP連携サービス120は、上記S903で確認した自動抽出の候補の文字列領域を強調表示するよう制御する。
S905において、MFP連携サービス120は、上記S904で強調表示した自動抽出候補の文字列に対して、文字認識処理結果の他の候補文字列が存在するか確認をする。自動抽出候補の文字列に対して文字認識処理の候補が存在しない場合(S905でNoの場合)、MFP連携サービス120は、ファイル名の修正対象箇所の選択に対する処理を終了する。
一方、自動抽出候補の文字列に対して文字認識処理の候補が存在する場合(S905でYesの場合)、MFP連携サービス120は、S906に処理を進める。
In S904, the
In S905, the
On the other hand, if there are candidates for character recognition processing for the character string that is an automatic extraction candidate (Yes in S905), the
S906において、MFP連携サービス120は、上記S904で強調表示を行った自動抽出候補文字列の領域に、上記S905で確認した文字認識処理の候補を表示する。これらの制御の結果は、MFP連携サービス120からMFP110に送信されて、ファイル名設定画面に反映される。
In S906, the
S907において、MFP連携サービス120は、上記S906で候補表示したものの中からユーザにより選択された文字列をファイル名に反映する。これらの制御の結果は、MFP連携サービス120からMFP110に送信されて、ファイル名設定画面に反映される。
In S907, the
ユーザーが、ファイル名設定画面600において、必要に応じて同様の操作を行い、「送信」ボタン606を押すと、MFP110は、ファイル名設定画面600において設定したファイル名をMFP連携サービス120に送信する(図5のS516に対応)。
When the user performs similar operations as necessary on the file
以上のように、あらかじめ設定されたファイル名の命名ルールに基づいて自動抽出された文字列を修正したい場合に、自動抽出の文字列の候補の強調表示と文字認識処理結果の候補表示を行うことで、適切な文字列を簡単に選択して修正することが可能となる。 As described above, when you want to modify a character string that has been automatically extracted based on a preset file name naming rule, you can highlight the automatically extracted character string candidates and display the character recognition processing result candidates. This allows you to easily select and modify appropriate strings.
〔第2実施形態〕
第1実施形態では、命名ルールに基づいて自動抽出された文字列の候補の強調表示と文字認識処理の候補の表示を行い、その候補の中から文字認識結果が正しいものを選択して、自動抽出された文字列を修正する構成について説明した。第2実施形態では、文字認識処理の候補の中に正しいものがなかった場合に文字列を少ない手順で修正するための構成について、図11、図12を用いて説明する。なお、第1実施形態と同様の処理については説明を省略する。
[Second embodiment]
In the first embodiment, character string candidates that are automatically extracted based on naming rules are highlighted, candidates for character recognition processing are displayed, and those with correct character recognition results are selected from among the candidates and automatically extracted. The configuration for modifying extracted character strings was explained. In the second embodiment, a configuration for correcting a character string with fewer steps when there is no correct candidate among the candidates for character recognition processing will be described with reference to FIGS. 11 and 12. Note that descriptions of processes similar to those in the first embodiment will be omitted.
図11は、第2実施形態におけるファイル名修正処理の詳細を示すフローチャートである。図9に示したフローチャートと同様に、MFP110(又はクライアントPC111)で実行される構成でも、MFP連携サービス120で実行される構成でもよい。
ここでは、MFP110が図11の処理を実行するものとして説明する。
図12は、第2実施形態におけるファイル名修正処理の画面の一例を示す図である。
FIG. 11 is a flowchart showing details of file name modification processing in the second embodiment. Similar to the flowchart shown in FIG. 9, the configuration may be executed by the MFP 110 (or client PC 111) or the
Here, the description will be made assuming that the
FIG. 12 is a diagram showing an example of a screen for file name modification processing in the second embodiment.
図11のS1101~S1105までは第1実施形態と同様の処理で、MFP110は、図12のファイル名の修正対象の文字列「132343500」が選択された場合に、自動抽出候補の見積番号1004「E20019-91」を強調表示する。あわせて、MFP110は、ファイル名に使用されている他の文字列箇所の強調表示をオフにする。なお、ここでは、「E20019-91」の文字認識処理の候補として、「E20079-01」、「E20019-01」、「E20079-07」が存在するとする。
Processes from S1101 to S1105 in FIG. 11 are similar to those in the first embodiment, and when the character string "132343500" to be corrected in the file name in FIG. Highlight "E20019-91". At the same time, the
S1106において、MFP110は、S1104で強調表示を行った自動抽出候補文字列の領域に、S1105で確認した文字認識処理の候補の表示と、この文字認識候補をさらに直接編集するためのボタンの表示を行う。例えば、図12のように、自動抽出候補の見積番号1204に対して、文字認識処理の候補文字列1205と、直接編集ボタン1206を表示して、文字認識候補をさらに直接編集可能に制御する。
In S1106, the
図12では、一例として、文字認識処理の候補として「E20079-01」、「E20019-07」、「E20079-07」をリスト表示し、その各候補の右側に直接編集ボタン1206それぞれを表示している。この例では、文字認識処理の結果の文字列がどれも正しくないため、選択した後に編集が必要となるが、直接編集ボタンを使用することで、編集までのステップを削減することが可能となる。ユーザーは、直接編集ボタンを選択して、該ボタンの左側の文字認識処理の候補文字列に対して編集を行うことが可能となる。これにより、それぞれの文字認識処理の候補に対する修正をそれぞれのボタン選択から直接行うことが可能となる。また、ファイル名で選択した修正文字列の文字認識処理の候補の表示を行った場合も同様に直接編集ボタンの表示を行う。
In FIG. 12, as an example, "E20079-01", "E20019-07", and "E20079-07" are displayed in a list as candidates for character recognition processing, and a
S1107~S1108の文字認識処理の候補を選択した場合の処理については、第1実施形態と同様である。
S1109において、文字認識候補をさらに直接編集は、直接編集ボタンを選択したか確認する。直接編集ボタンが押下されなかった場合(S1109でNoの場合)、MFP110は、ファイル名の修正対象箇所の選択に応じた処理を終了する。
一方、直接編集ボタンが押下された場合(S1109でYesの場合)、MFP110は、該選択した直接編集ボタンに対応する文字認識処理の候補を編集する候補編集画面(不図示)を表示し、編集可能に制御する。候補編集画面に表示されたソフトウェアキーボードから編集が行われて確定の操作が行われると、MFP110は、S1110に処理を進める。
The processing when a candidate for character recognition processing is selected in S1107 to S1108 is the same as in the first embodiment.
In S1109, if you want to further directly edit character recognition candidates, it is confirmed whether the direct edit button is selected. If the direct edit button is not pressed (No in S1109), the
On the other hand, if the direct edit button is pressed (Yes in S1109), the
S1110において、MFP110は、候補編集画面での編集結果をファイル名に反映する。
図12の例では、ユーザーが、文字認識処理の候補1205の「E20079-01」の編集ボタン1206を選択して直接編集して「E20019-01」とした場合、該編集結果が反映され、ファイル名「見積書_132343500」が「見積書_E20019-01」に変更される。
In S1110, the
In the example of FIG. 12, if the user selects the
これにより、文字認識処理結果の候補が適切でない場合でも直接編集ボタンから編集を行うことで、少ない手順で適切な文字列を簡単に設定することが可能となる。
なお、図11に示したフローチャートの処理を、MFP連携サービス120で実行する場合については説明を省略する。
また、上記各実施形態では、図6の画面で、文書画像のファイル名を設定する構成について説明したが、ファイルの設定に限定されるものではなく、ファイルのプロパティを設定する構成でもよい。
As a result, even if the candidates resulting from character recognition processing are not appropriate, by directly editing them using the edit button, it is possible to easily set an appropriate character string with fewer steps.
Note that a description of the case where the process of the flowchart shown in FIG. 11 is executed by the
Further, in each of the above embodiments, a configuration has been described in which a file name of a document image is set on the screen of FIG. 6, but the configuration is not limited to setting a file, and a configuration in which file properties are set may be used.
上記各実施形態では、文書画像に含まれる文字領域を文字認識し、その結果から属性ごとに文字列を抽出・選択し、ファイル名命名ルールに基づき生成された文書画像を保存するファイル名を、文書画像のプレビュー表示とともに表示する。そして、このファイル名の表示からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性で抽出された他の文字列が存在する前記文書画像内の領域を前記プレビュー画像において強調表示する。さらに、強調表示した領域を文字認識した際の候補をリスト表示し、該リスト表示から選択された候補を、ファイル名の表示から選択された文字列に置き換えて、ファイル名の表示に反映させる。これにより、スキャンした帳票から自動生成されたファイル名を修正する場合に、帳票のプレビュー画像を表示し、修正箇所の属性に対応する候補文字列の強調表示とその文字列の文字認識処理の候補文字列表示を行う。このように、属性情報の自動抽出文字列候補だけでなく、文字認識処理結果の文字列の候補も表示することで、プレビュー画像から容易にファイル名を修正する際に使用する文字領域の確認・選択を行うことが可能となる。 In each of the embodiments described above, character regions included in a document image are recognized, character strings are extracted and selected for each attribute from the result, and a file name for saving the generated document image is set based on the file name naming rule. Displayed along with a preview of the document image. Then, in response to any character string being selected from this file name display, an area in the document image where another character string extracted with an attribute corresponding to the selected character string exists is detected. Highlighted in the preview image. Furthermore, candidates obtained by character recognition in the highlighted area are displayed in a list, and the candidates selected from the list are replaced with the character strings selected from the file name display and reflected in the file name display. As a result, when modifying a file name automatically generated from a scanned form, a preview image of the form is displayed, candidate character strings corresponding to the attributes of the modified part are highlighted, and candidates for character recognition processing for that character string are displayed. Displays strings. In this way, by displaying not only automatically extracted character string candidates for attribute information but also character string candidates resulting from character recognition processing, you can easily check and confirm character areas used when modifying file names from preview images. It becomes possible to make a selection.
なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、上記各実施形態を組み合わせた構成も全て本発明に含まれるものである。
It goes without saying that the configurations and contents of the various data described above are not limited to these, and may be configured in various configurations and contents depending on the use and purpose.
Although one embodiment has been described above, the present invention can be implemented as, for example, a system, an apparatus, a method, a program, a storage medium, or the like. Specifically, the present invention may be applied to a system consisting of a plurality of devices, or may be applied to a device consisting of a single device.
Moreover, all configurations that combine the above embodiments are also included in the present invention.
(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施形態及びその変形例を組み合わせた構成も全て本発明に含まれるものである。
(Other embodiments)
The present invention provides a system or device with a program that implements one or more of the functions of the embodiments described above via a network or a storage medium, and one or more processors in the computer of the system or device reads and executes the program. This can also be achieved by processing. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.
Furthermore, the present invention may be applied to a system made up of a plurality of devices, or to a device made up of one device.
The present invention is not limited to the above embodiments, and various modifications (including organic combinations of each embodiment) are possible based on the spirit of the present invention, and these are excluded from the scope of the present invention. isn't it. That is, all configurations in which the above-described embodiments and their modifications are combined are also included in the present invention.
110 MFP
111 クライアントPC
120 MFP連携サービス
421 表示制御部
431 リクエスト制御部
432 画像処理部
434 データ管理部
435 表示制御部
110 MFP
111 Client PC
120
Claims (6)
前記表示されたファイルに関する情報の中からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性と同じ属性の他の文字列に対応する前記文書画像内の領域を、前記プレビュー表示において強調表示する第2表示手段と、
前記強調表示した領域に対する文字認識結果の複数の候補文字列をリスト表示する第3表示手段と、
前記表示されたファイルに関する情報において選択された前記文字列を、前記リスト表示された複数の候補文字列の中からユーザーにより選択された候補文字列で置き換えて表示する第4表示手段と、
を有することを特徴とする情報処理装置。 Information about the file of the document image is generated by character-recognizing a character area included in the document image, and combining character strings corresponding to attributes specified by a predetermined rule among the character strings resulting from the character recognition. , a first display means for displaying the document image along with a preview display;
In response to any character string being selected from the displayed information regarding the file, the character string in the document image corresponding to another character string having the same attribute as the attribute corresponding to the selected character string is selected. a second display means for highlighting a region in the preview display;
a third display means for displaying a list of a plurality of candidate character strings as character recognition results for the highlighted area;
a fourth display means for replacing and displaying the character string selected in the displayed information regarding the file with a candidate character string selected by the user from among the plurality of candidate character strings displayed in the list;
An information processing device comprising:
前記第4表示手段は、前記表示されたファイルに関する情報において選択された文字列を、前記編集手段により編集された候補文字列で置き換えて表示することを特徴とする請求項1に記載の情報処理装置。 comprising editing means for editing the plurality of candidate character strings displayed in the list;
The information processing according to claim 1, wherein the fourth display means replaces and displays the character string selected in the displayed information regarding the file with a candidate character string edited by the editing means. Device.
文書画像に含まれる文字領域を文字認識し、当該文字認識結果の文字列のうち、所定のルールで指定された属性に対応する文字列を組み合わせることにより生成された前記文書画像のファイルに関する情報を、前記文書画像のプレビュー表示とともに表示する第1表示工程と、
前記表示されたファイルに関する情報の中からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性と同じ属性の他の文字列に対応する前記文書画像内の領域を、前記プレビュー表示において強調表示する第2表示工程と、
前記強調表示した領域に対する文字認識結果の複数の候補文字列をリスト表示する第3表示工程と、
前記表示されたファイルに関する情報において選択された前記文字列を、前記リスト表示された複数の候補文字列の中からユーザーにより選択された候補文字列で置き換えて表示する第4表示工程と、
を有することを特徴とする情報処理装置の制御方法。 A method for controlling an information processing device, the method comprising:
Information about the file of the document image is generated by character-recognizing a character area included in the document image, and combining character strings corresponding to attributes specified by a predetermined rule among the character strings resulting from the character recognition. , a first display step of displaying the document image together with a preview display;
In response to any character string being selected from the displayed information regarding the file, the character string in the document image corresponding to another character string having the same attribute as the attribute corresponding to the selected character string is selected. a second display step of highlighting the region in the preview display;
a third display step of displaying a list of a plurality of candidate character strings as character recognition results for the highlighted area;
a fourth display step of replacing and displaying the character string selected in the displayed information regarding the file with a candidate character string selected by the user from among the plurality of candidate character strings displayed in the list;
A method for controlling an information processing device, comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022145066A JP2024040612A (en) | 2022-09-13 | 2022-09-13 | Information processing device, method for controlling information processing device, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022145066A JP2024040612A (en) | 2022-09-13 | 2022-09-13 | Information processing device, method for controlling information processing device, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024040612A true JP2024040612A (en) | 2024-03-26 |
Family
ID=90369156
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022145066A Pending JP2024040612A (en) | 2022-09-13 | 2022-09-13 | Information processing device, method for controlling information processing device, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2024040612A (en) |
-
2022
- 2022-09-13 JP JP2022145066A patent/JP2024040612A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6953230B2 (en) | A device for setting a file name, etc. on a scanned image, its control method, and a program. | |
JP6968647B2 (en) | A device for setting a file name for a scanned image, its control method, and a program. | |
JP7391672B2 (en) | Image processing system, control method and program for digitizing documents | |
JP2019128715A (en) | Device, method and program for setting information associated with scanned image | |
JP2019041150A (en) | Device for setting file name or the like to scan image, control method therefor and program | |
JP7317561B2 (en) | Image processing device for character input using touch panel, its control method and program | |
JP7467737B2 (en) | Image processing device that displays guidance for user operations, and control method and program thereof | |
JP7271149B2 (en) | Apparatus, method and program | |
JP2021163178A (en) | Information processing apparatus | |
JP7225017B2 (en) | Image processing device for character input using touch panel, its control method and program | |
JP7330742B2 (en) | IMAGE PROCESSING APPARATUS, CONTROL METHOD AND PROGRAM FOR SETTING PROPERTIES ON SCANNED IMAGES | |
US11991331B2 (en) | Server, method of controlling the server, and storage medium | |
JP2023072812A (en) | Information processing apparatus, method for controlling information processing apparatus, program therefor, and image processing system | |
JP7476557B2 (en) | DEVICE, PROCESSING EXECUTION SYSTEM, PROCESSING EXECUTION METHOD, AND PROGRAM | |
JP2019068323A (en) | Device for setting file name for scanned image, control method thereof, and program | |
JP2024040612A (en) | Information processing device, method for controlling information processing device, and program | |
JP2021164132A (en) | Image processing system and program | |
JP2023053602A (en) | Apparatus, information processing method, and program | |
JP7358663B2 (en) | Image processing device for character input using a touch panel, its control method, and program | |
JP7387282B2 (en) | Image processing device that displays a preview of a scanned image, its control method, and program | |
JP2024032563A (en) | Information processing apparatus, control method of information processing apparatus, and program | |
JP7150967B2 (en) | Apparatus, method, and program for setting information related to scanned images | |
JP2023120267A (en) | Image processing device for inputting text using touch panel, control method for the same, and program | |
JP2022069405A (en) | Information processing device, information processing system and method and program for controlling information processing device | |
JP2024086787A (en) | Image processing device that displays guidance for user operations, and control method and program thereof |