JP2024040612A - Information processing device, method for controlling information processing device, and program - Google Patents

Information processing device, method for controlling information processing device, and program Download PDF

Info

Publication number
JP2024040612A
JP2024040612A JP2022145066A JP2022145066A JP2024040612A JP 2024040612 A JP2024040612 A JP 2024040612A JP 2022145066 A JP2022145066 A JP 2022145066A JP 2022145066 A JP2022145066 A JP 2022145066A JP 2024040612 A JP2024040612 A JP 2024040612A
Authority
JP
Japan
Prior art keywords
character string
character
file name
mfp
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022145066A
Other languages
Japanese (ja)
Inventor
真也 曽我
Masaya Soga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2022145066A priority Critical patent/JP2024040612A/en
Publication of JP2024040612A publication Critical patent/JP2024040612A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimiles In General (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

PROBLEM TO BE SOLVED: To enabling facilitating troublesome correction of an automatically extracted character string when scanning and computerizing a sheet document and setting a file name of a document image computerized by using a naming rule of a preliminarily set file name and the character string automatically extracted from written contents of the document on the basis of the naming rule.
SOLUTION: According to the invention, when correcting a file name generated from a scanned document, a method and program enable facilitating confirmation and selection of a character area to be used for correcting the file name from a preview image of the document by controlling an information processing device to: display the preview image together with the file name (Fig. 6); and perform highlighting of a candidate character string corresponding to an attribute of a correction place and a candidate character string display of a character recognition processing result of the character string (S901 to S907).
SELECTED DRAWING: Figure 9
COPYRIGHT: (C)2024,JPO&INPIT

Description

本発明は、情報処理装置、情報処理装置の制御方法、及びプログラムに関する。 The present invention relates to an information processing device, a method of controlling the information processing device, and a program.

従来、紙帳票をスキャンして電子化し、電子化した帳票のファイル名を該帳票の記載内容に基づいて設定することで帳票を管理するシステムがある。
特許文献1には、事前に設定したファイルの命名ルールに従って、スキャンした帳票内から自動で文字列を抽出し、ファイル名生成を自動で行う技術が開示されている。
2. Description of the Related Art Conventionally, there is a system for managing a form by scanning a paper form, digitizing it, and setting a file name of the digitized form based on the written contents of the form.
Patent Document 1 discloses a technique for automatically extracting a character string from a scanned form and automatically generating a file name according to a file naming rule set in advance.

例えば、特許文献1のファイル命名ルールとして、属性「文書種別」、区切り文字「アンダーバー」、属性「会社名」が設定されていたとする。この場合において、スキャンした画像データに文字認識処理を実行した結果から属性「文書種別」と属性「会社名」に関連する文字列として、それぞれ「見積書」、「AACompany」を抽出し、ファイル名「見積書_AACompany」を生成し、画面に表示する。自動抽出されたファイル名を修正する場合に修正したい箇所を選択すると、その箇所の命名ルールに定義した属性に対応する帳票内の他の文字列候補を表示し、選択して修正することが可能となっている。例えば、「AACompany」を選択すると命名ルールでは属性「会社名」であるため、帳票内の「会社名」に対応する他の文字列「BBCompany」、「CCCompany」を表示する。 For example, assume that the attribute "document type", the delimiter "underbar", and the attribute "company name" are set as the file naming rule of Patent Document 1. In this case, from the results of character recognition processing performed on the scanned image data, "estimate" and "AACompany" are extracted as character strings related to the attribute "document type" and "company name", respectively, and the file name is Generate “Quote_AACompany” and display it on the screen. When modifying the automatically extracted file name, if you select the part you want to modify, other character string candidates in the form that correspond to the attributes defined in the naming rule for that part will be displayed, and you can select and modify them. It becomes. For example, if you select "AACompany", the attribute is "company name" according to the naming rule, so other character strings "BBCompany" and "CCCompany" corresponding to "company name" in the form are displayed.

特開2021-140328号公報JP 2021-140328 Publication

しかし、特許文献1の技術では、候補表示の際に文字列表示のみであるため、帳票内のどの文字領域が使用されたか容易に確認することができない。また、文字認識処理結果に誤りがあった場合に候補を選択後に再度修正が必要となる。このように、従来の技術では、スキャンした帳票から生成したファイル名を修正する際の文字領域の確認や選択の操作が煩雑であった。 However, in the technique of Patent Document 1, only character strings are displayed when displaying candidates, so it is not possible to easily confirm which character area in the form has been used. Furthermore, if there is an error in the character recognition processing result, it will be necessary to correct it again after selecting a candidate. As described above, in the conventional technology, operations for checking and selecting character areas when modifying a file name generated from a scanned form are complicated.

本発明は、上記の課題を解決するためになされたものである。本発明は、スキャンした帳票から生成したファイル名を修正する際に、使用する文字領域の確認や選択を容易に行うことができる仕組みを提供することを目的とする。 The present invention has been made to solve the above problems. An object of the present invention is to provide a mechanism that allows easy confirmation and selection of character areas to be used when modifying a file name generated from a scanned form.

本発明は、文書画像に含まれる文字領域を文字認識し、当該文字認識結果の文字列のうち、所定のルールで指定された属性に対応する文字列を組み合わせることにより生成された前記文書画像のファイルに関する情報を、前記文書画像のプレビュー表示とともに表示する第1表示手段と、前記表示されたファイルに関する情報の中からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性と同じ属性の他の文字列に対応する前記文書画像内の領域を、前記プレビュー表示において強調表示する第2表示手段と、前記強調表示した領域に対する文字認識結果の複数の候補文字列をリスト表示する第3表示手段と、前記表示されたファイルに関する情報において選択された前記文字列を、前記リスト表示された複数の候補文字列の中からユーザーにより選択された候補文字列で置き換えて表示する第4表示手段と、を有することを特徴とする。 The present invention performs character recognition on a character region included in a document image, and combines character strings corresponding to attributes specified by a predetermined rule from among the character strings resulting from the character recognition. a first display means for displaying information regarding a file together with a preview display of the document image; a second display means for highlighting, in the preview display, an area in the document image corresponding to another character string having the same attribute as the attribute corresponding to the attribute; and a plurality of candidate characters of character recognition results for the highlighted area. a third display means for displaying a list of columns; and replacing the character string selected in the displayed information regarding the file with a candidate character string selected by the user from among the plurality of candidate character strings displayed in the list. and fourth display means for displaying.

本発明によれば、スキャンした帳票から生成したファイル名を修正する際に、使用する文字領域の確認や選択を容易に行うことができる。 According to the present invention, when modifying a file name generated from a scanned form, it is possible to easily confirm and select the character area to be used.

本実施形態を示す画像処理システムの全体構成を示す図。FIG. 1 is a diagram showing the overall configuration of an image processing system according to an embodiment. 本実施形態のMFPのハードウェア構成を示す図。FIG. 1 is a diagram showing the hardware configuration of an MFP according to the present embodiment. 本実施形態のクライアントPC及びMFP連携サービスを構成可能な情報処理装置のハードウェア構成を示す図。FIG. 2 is a diagram showing a hardware configuration of an information processing device that can configure a client PC and an MFP cooperation service according to the present embodiment. 本実施形態に係る画像処理システムのソフトウェア構成を示す図。FIG. 1 is a diagram showing a software configuration of an image processing system according to an embodiment. 本実施形態における各装置間の処理の流れを示すシーケンス図。FIG. 3 is a sequence diagram showing the flow of processing between devices in this embodiment. 本実施形態におけるファイル名設定画面を示す図。The figure which shows the file name setting screen in this embodiment. 本実施形態におけるファイル名命名ルール設定画面を示す図。The figure which shows the file name naming rule setting screen in this embodiment. 本実施形態の画像解析処理を示すフローチャート。5 is a flowchart showing image analysis processing according to the present embodiment. 第1実施形態におけるファイル名修正処理を示すフローチャート。7 is a flowchart showing file name modification processing in the first embodiment. 第1実施形態におけるファイル名修正処理の画面を示す図。FIG. 3 is a diagram showing a screen for file name modification processing in the first embodiment. 第2実施形態におけるファイル名修正処理を示すフローチャート。7 is a flowchart showing file name modification processing in the second embodiment. 第2実施形態におけるファイル名修正処理の画面を示す図。FIG. 7 is a diagram showing a screen for file name modification processing in the second embodiment.

以下、本発明を実施するための形態について図面を用いて説明する。なお、以下の実施の形態は特許請求の範囲に係る発明を限定するものでなく、また実施の形態で説明されている特徴の組み合わせの全てが発明の解決手段に必須のものとは限らない。 EMBODIMENT OF THE INVENTION Hereinafter, the form for implementing this invention is demonstrated using drawings. Note that the following embodiments do not limit the claimed invention, and not all combinations of features described in the embodiments are essential to the solution of the invention.

〔第1実施形態〕
<全体構成>
図1は、本発明の一実施形態を示す画像処理システムの全体構成の一例を示す図である。
本実施形態の画像処理システムは、MFP(Multifunction Peripheral)110、クライアントPC111、MFP連携サービス120およびクラウドストレージサービス(以下「クラウドストレージ」)130を含む。
[First embodiment]
<Overall configuration>
FIG. 1 is a diagram showing an example of the overall configuration of an image processing system according to an embodiment of the present invention.
The image processing system of this embodiment includes an MFP (Multifunction Peripheral) 110, a client PC 111, an MFP cooperation service 120, and a cloud storage service (hereinafter referred to as "cloud storage") 130.

MFP110及びクライアントPC111は、LAN(Local Area Network)経由でインターネット上の各種サービスを提供するサーバーに対して通信可能に接続されている。
MFP110は、スキャナやプリンタといった複数の機能を有する複合機であり、画像処理装置の一例である。
クライアントPC111は、MFP連携サービス120に対して依頼したサービスの提供を受けるコンピュータまたはアプリケーションプログラムである。
The MFP 110 and the client PC 111 are communicably connected to a server that provides various services on the Internet via a LAN (Local Area Network).
The MFP 110 is a multifunction device having multiple functions such as a scanner and a printer, and is an example of an image processing device.
The client PC 111 is a computer or an application program that receives services requested from the MFP cooperation service 120.

MFP連携サービス120は、MFP110でスキャンした画像ファイルを自サーバー上に保存したり、別のストレージサービス等のファイル保存が可能なサービスに転送したりする機能を持つサービスの一例である。
クラウドストレージ130は、インターネットを介してファイルを保存したりウェブブラウザでファイルを取得したりすることができるサービスである。
The MFP cooperation service 120 is an example of a service that has a function of storing an image file scanned by the MFP 110 on its own server or transferring it to a service capable of storing files, such as another storage service.
Cloud storage 130 is a service that allows files to be saved via the Internet and files to be obtained using a web browser.

本実施形態の画像処理システムは、MFP110、クライアントPC111、MFP連携サービス120およびクラウドストレージ130からなる構成としているがこれに限定されない。例えば、MFP110がクライアントPC111やMFP連携サービス120の役割を兼ね備えてもよい。また、MFP連携サービス120はインターネット上ではなくLAN上のサーバーに配置した接続形態であってもよい。また、クラウドストレージ130はメールサーバーなどに置き換えて、スキャンした画像をメールに添付し送信してもよい。 The image processing system of this embodiment has a configuration including an MFP 110, a client PC 111, an MFP cooperation service 120, and a cloud storage 130, but is not limited thereto. For example, the MFP 110 may also serve as the client PC 111 and the MFP cooperation service 120. Furthermore, the MFP cooperation service 120 may be connected to a server on a LAN instead of on the Internet. Further, the cloud storage 130 may be replaced with a mail server or the like, and the scanned image may be attached to an e-mail and sent.

<MFPのハードウェア構成>
図2は、MFP110のハードウェア構成の一例を示す図である。
MFP110は、制御部210、操作部220、プリンタ部221、スキャナ部222、モデム223を有する。
<MFP hardware configuration>
FIG. 2 is a diagram illustrating an example of the hardware configuration of the MFP 110.
MFP 110 includes a control section 210, an operation section 220, a printer section 221, a scanner section 222, and a modem 223.

制御部210は、以下の各部211~219を有し、MFP110全体の動作を制御する。CPU211は、ROM212に記憶された制御プログラムを読み出して、読取/印刷/通信などMFP110が有する各種機能を実行・制御する。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、本実施形態では1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述のフローチャートに示す各処理を実行するものとするが、これに限定されない。例えば、複数のCPUや複数のRAMまたはHDDを協働させて各処理を実行してもよい。HDD214は、画像データや各種プログラムを記憶する大容量記憶部である。なお、HDD(Hard Disk Drive)の代わりに又は併用してSSD(Solid State Drive)等の他の記憶装置を備える構成でもよい。 The control unit 210 includes the following units 211 to 219, and controls the overall operation of the MFP 110. The CPU 211 reads a control program stored in the ROM 212 and executes and controls various functions of the MFP 110 such as reading/printing/communication. The RAM 213 is used as a main memory of the CPU 211, a temporary storage area such as a work area, etc. In this embodiment, one CPU 211 uses one memory (RAM 213 or HDD 214) to execute each process shown in a flowchart described later, but the present invention is not limited to this. For example, each process may be executed by making multiple CPUs, multiple RAMs, or HDDs work together. The HDD 214 is a large capacity storage unit that stores image data and various programs. Note that the configuration may include other storage devices such as an SSD (Solid State Drive) instead of or in combination with the HDD (Hard Disk Drive).

操作部I/F215は、操作部220と制御部210とを接続するインタフェースである。操作部220には、タッチパネルやキーボードなどが備えられており、ユーザーによる操作/入力/指示を受け付ける。
プリンタI/F216は、プリンタ部221と制御部210とを接続するインタフェースである。印刷用の画像データは、プリンタI/F216を介して制御部210からプリンタ部221へ転送され、記録媒体上に印刷される。スキャナI/F217は、スキャナ部222と制御部210とを接続するインタフェースである。スキャナ部222は、不図示の原稿台やADF(Auto Document Feeder)にセットされた原稿を読み取って画像データを生成し、スキャナI/F217を介して制御部210に入力する。MFP110は、スキャナ部222で生成された画像データをプリンタ部221から印刷出力(コピー)する他、ファイル送信またはメール送信することができる。
The operation unit I/F 215 is an interface that connects the operation unit 220 and the control unit 210. The operation unit 220 includes a touch panel, a keyboard, and the like, and receives operations/inputs/instructions from the user.
The printer I/F 216 is an interface that connects the printer section 221 and the control section 210. Image data for printing is transferred from the control unit 210 to the printer unit 221 via the printer I/F 216 and printed on a recording medium. The scanner I/F 217 is an interface that connects the scanner section 222 and the control section 210. The scanner unit 222 reads a document set on a document table (not shown) or an ADF (Auto Document Feeder), generates image data, and inputs the image data to the control unit 210 via the scanner I/F 217 . The MFP 110 can print out (copy) the image data generated by the scanner unit 222 from the printer unit 221, and can also send a file or email.

モデムI/F218は、モデム223と制御部210とを接続するインタフェースである。モデム223は、PSTN上のファクシミリ装置との間で画像データをファクシミリ通信する。
ネットワークI/F219は、制御部210(MFP110)をLANに接続するインタフェースである。MFP110は、ネットワークI/F219を用いてインターネット上の各サービスに画像データや情報を送信したり、各種情報を受信したりする。
Modem I/F 218 is an interface that connects modem 223 and control unit 210. The modem 223 performs facsimile communication of image data with a facsimile device on the PSTN.
The network I/F 219 is an interface that connects the control unit 210 (MFP 110) to the LAN. The MFP 110 uses the network I/F 219 to transmit image data and information to various services on the Internet, and to receive various information.

<クライアントPC、MFP連携サービスのハードウェア構成>
図3は、クライアントPC111及びMFP連携サービス120を構成可能な情報処理装置のハードウェア構成の一例を示す図である。
クライアントPC111及びMFP連携サービス120を構成可能な情報処理装置は、CPU311、ROM312、RAM313、HDD314及びネットワークI/F315を有する。
<Hardware configuration of client PC and MFP cooperation service>
FIG. 3 is a diagram illustrating an example of the hardware configuration of an information processing device that can configure the client PC 111 and the MFP cooperation service 120.
The information processing device that can configure the client PC 111 and the MFP cooperation service 120 includes a CPU 311, a ROM 312, a RAM 313, an HDD 314, and a network I/F 315.

CPU311は、ROM312やHDD314に記憶された制御プログラムを読み出して各種処理を実行することで、全体の動作を制御する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する大容量記憶部である。なお、HDDの代わりに又は併用してSSD等の他の記憶装置を備える構成でもよい。 The CPU 311 controls the overall operation by reading control programs stored in the ROM 312 and HDD 314 and executing various processes. The RAM 313 is used as a temporary storage area such as the main memory and work area of the CPU 311. The HDD 314 is a large capacity storage unit that stores image data and various programs. Note that a configuration may also be provided in which other storage devices such as an SSD are used instead of or in combination with the HDD.

ネットワークI/F315は、MFP連携サービス120をインターネットに接続するインタフェースである。MFP連携サービス120およびクラウドストレージ130は、ネットワークI/F315を介して他の装置(MFP110など)から処理リスエストを受けて各種情報を送受信する。
なお、クライアントPC111は、上記の構成に加えて、ディスプレイ等の出力デバイス、キーボードやポインティングデバイス等の入力デバイス及びこれらを接続するためのインタフェース部を備える。なお、タッチパネル付きディスプレイのように入力デバイスと出力デバイスを兼用したデバイスを備えていてもよい。クライアントPC111は、パーソナルコンピュータ(PC)であっても、タブレット型端末やスマートフォンなどであってもよい。
Network I/F 315 is an interface that connects MFP cooperation service 120 to the Internet. The MFP cooperation service 120 and the cloud storage 130 receive processing requests from other devices (such as the MFP 110) via the network I/F 315, and transmit and receive various information.
In addition to the above configuration, the client PC 111 includes an output device such as a display, an input device such as a keyboard or a pointing device, and an interface unit for connecting these devices. Note that a device serving as both an input device and an output device, such as a display with a touch panel, may be provided. The client PC 111 may be a personal computer (PC), a tablet terminal, a smartphone, or the like.

また、MFP連携サービス120は、1台のコンピュータにより実現されるものであっても、複数のコンピュータにより実現されるものであってもよい。例えば、MFP連携サービス120は、クラウドコンピューティングの技術を利用して実現される構成であってもよい。また、クラウドストレージ130もMFP連携サービス120と同様のハードウェア構成により実現可能である。 Furthermore, the MFP cooperation service 120 may be realized by one computer or by multiple computers. For example, the MFP cooperation service 120 may be implemented using cloud computing technology. Further, the cloud storage 130 can also be realized using the same hardware configuration as the MFP cooperation service 120.

<画像処理システムのソフトウェア構成>
図4は、本実施形態に係る画像処理システムのソフトウェア構成の一例を示す図である。
MFP110は、ネイティブ機能部410と追加機能部420の大きく2つに分けられる。
<Software configuration of image processing system>
FIG. 4 is a diagram showing an example of the software configuration of the image processing system according to this embodiment.
The MFP 110 is roughly divided into two parts: a native function section 410 and an additional function section 420.

ネイティブ機能部410に含まれる各部は、MFP110に標準的に備えられたものである。一方、追加機能部420は、MFP110に追加インストールされたアプリケーションプログラム(以下「アプリケーション」)である。追加機能部420はJava(登録商標)をベースとしたアプリケーションであり、MFP110への機能追加を容易に実現できる。なお、MFP110には図示しない他の追加アプリケーションがインストールされていても良い。 Each unit included in the native function unit 410 is provided as standard in the MFP 110. On the other hand, additional function unit 420 is an application program (hereinafter referred to as "application") additionally installed in MFP 110. The additional function unit 420 is an application based on Java (registered trademark), and can easily add functions to the MFP 110. Note that other additional applications (not shown) may be installed in the MFP 110.

ネイティブ機能部410は、スキャン実行部411、画像データ保存部412を有する。追加機能部420は、表示制御部421、スキャン指示部422、連携サービスリクエスト部423を有する。 The native function section 410 includes a scan execution section 411 and an image data storage section 412. The additional function section 420 includes a display control section 421, a scan instruction section 422, and a cooperation service request section 423.

表示制御部421は、MFP110の操作部220のタッチパネル機能を有する液晶表示部に、ユーザーによる操作を受け付けるためのUI画面を表示する。例えば、MFP連携サービス120へアクセスするための認証情報の入力、スキャン設定、ならびに、スキャン開始の操作、プレビュー画面などのUI画面を表示する。
スキャン指示部422は、UI画面を介して入力されたユーザー指示に応じたスキャン設定と共にスキャン実行部411にスキャン処理を要求する。
The display control unit 421 displays a UI screen for accepting user operations on a liquid crystal display unit having a touch panel function of the operation unit 220 of the MFP 110. For example, it displays UI screens such as input of authentication information for accessing the MFP cooperation service 120, scan settings, scan start operations, and preview screens.
The scan instruction unit 422 requests the scan execution unit 411 to perform a scan process along with scan settings according to a user instruction input via the UI screen.

スキャン実行部411は、スキャン指示部422からのスキャン設定を含んだスキャン要求を受け取る。スキャン実行部411は、スキャン要求に従い、スキャナI/F217を介してスキャナ部222で、原稿台ガラスに置かれた原稿を読み取ることでスキャン画像データを生成する。生成したスキャン画像データは、画像データ保存部412に送られる。スキャン実行部411は、保存したスキャン画像データを一意に示すスキャン画像識別子をスキャン指示部422へ送る。スキャン画像識別子は、MFP110においてスキャンした画像をユニークに識別するための番号や記号、アルファベットなどである(不図示)。 The scan execution unit 411 receives a scan request including scan settings from the scan instruction unit 422. The scan execution unit 411 generates scan image data by reading the document placed on the document platen glass with the scanner unit 222 via the scanner I/F 217 in accordance with the scan request. The generated scan image data is sent to the image data storage unit 412. The scan execution unit 411 sends a scan image identifier that uniquely indicates the saved scan image data to the scan instruction unit 422. The scanned image identifier is a number, symbol, alphabet, or the like (not shown) for uniquely identifying an image scanned by the MFP 110.

画像データ保存部412は、スキャン実行部411から受け取ったスキャン画像データをHDD214に保存する。
スキャン指示部422は、スキャン実行部411から受け取ったスキャン画像識別子に対応するスキャン画像データを画像データ保存部412から取得する。スキャン指示部422は、取得したスキャン画像データにMFP連携サービス120で処理を行う指示を連携サービスリクエスト部423に要求する。
The image data storage unit 412 stores the scanned image data received from the scan execution unit 411 in the HDD 214.
The scan instruction unit 422 acquires scan image data corresponding to the scan image identifier received from the scan execution unit 411 from the image data storage unit 412. The scan instruction unit 422 requests the cooperation service request unit 423 to instruct the MFP cooperation service 120 to process the acquired scan image data.

連携サービスリクエスト部423は、MFP連携サービス120に対して各種処理の要求を行う。例えば、ログイン、スキャン画像の解析、スキャン画像の送信などの要求を行う。MFP連携サービス120とのやり取りはRESTやSOAPなどのプロトコルを使用するが、その他の通信手段を用いてもよい。 The cooperation service request unit 423 requests various processes to the MFP cooperation service 120. For example, requests such as login, analysis of scanned images, and transmission of scanned images are made. Exchanges with the MFP cooperation service 120 use protocols such as REST and SOAP, but other communication means may also be used.

MFP連携サービス120は、リクエスト制御部431、画像処理部432、クラウドストレージアクセス部433、データ管理部434、表示制御部435を有する。 The MFP cooperation service 120 includes a request control section 431, an image processing section 432, a cloud storage access section 433, a data management section 434, and a display control section 435.

リクエスト制御部431は、外部装置からの要求を受信できる状態で待機している。リクエスト制御部431は、処理要求を受けると、要求に応じて適宜、画像処理部432、クラウドストレージアクセス部433、データ管理部434に処理を指示する。 The request control unit 431 is on standby in a state where it can receive a request from an external device. Upon receiving a processing request, the request control unit 431 instructs the image processing unit 432, cloud storage access unit 433, and data management unit 434 to perform processing as appropriate according to the request.

画像処理部432は、画像に対して文字領域解析、OCR(Optical Character Recognition)、設定された属性に基づく自動抽出処理(詳細はS510で記載する)、画像の回転や傾き補正などの画像に対する認識処理や画像の加工処理を行う。 The image processing unit 432 performs image recognition such as character area analysis, OCR (Optical Character Recognition), automatic extraction processing based on set attributes (details will be described in S510), and image rotation and tilt correction. Perform processing and image processing.

クラウドストレージアクセス部433は、クラウドストレージに対する処理の要求を行う。クラウドサービスは一般的にRESTやSOAPなどのプロトコルで、クラウドストレージにファイルを保存したり、保存したファイルを取得したりするための様々なインタフェースを公開している。クラウドストレージアクセス部433は、公開されたクラウドストレージのインタフェースを使用してクラウドストレージの操作を行う。 The cloud storage access unit 433 requests processing from cloud storage. Cloud services generally expose various interfaces for saving files to and retrieving files from cloud storage using protocols such as REST and SOAP. The cloud storage access unit 433 operates the cloud storage using the published cloud storage interface.

データ管理部434は、MFP連携サービス120で管理するユーザー情報や各種設定データ等を保持する。
表示制御部435は、インターネット経由で接続されたPCやモバイル等の別端末(不図示)上で動作しているウェブブラウザからのリクエストを受けて画面表示に必要な画面構成情報(HTML、CSS等)を返す。ユーザーは、ウェブブラウザで表示される画面経由でMFP連携サービス120に登録しているユーザー情報を確認したり、スキャンする際の設定を変更したりする。
The data management unit 434 holds user information, various setting data, etc. managed by the MFP cooperation service 120.
The display control unit 435 receives a request from a web browser running on another terminal (not shown) such as a PC or mobile connected via the Internet, and generates screen configuration information (HTML, CSS, etc.) necessary for screen display. )return it. The user checks user information registered in the MFP cooperation service 120 and changes settings for scanning via a screen displayed on a web browser.

なお、図4では、MFP110に追加機能部420をインストールする構成の例について説明したが、本件はこの構成に限定せず、クライアントPC111に追加機能部420の機能が含まれていてもよい。 Although FIG. 4 describes an example of a configuration in which the additional function unit 420 is installed in the MFP 110, the present invention is not limited to this configuration, and the function of the additional function unit 420 may be included in the client PC 111.

<全体の処理の流れ>
図5は、MFP110でスキャンした画像をファイル化してクラウドストレージに送信する際の各装置間の処理の流れを例示するシーケンス図である。ここでは、各装置間のやり取りを中心に説明する。なお、図5では、MFP110がMFP連携サービス120とやり取りを行う記載としているが、後述する解析結果取得、画面の表示、学習の指示等はMFP110でなくクライアントPC111が実行する構成でもよい。以降、”MFP110またはクライアントPC111”が実行する処理について、クライアントPC111を省略し、”MFP110”とのみを記載する。
<Overall processing flow>
FIG. 5 is a sequence diagram illustrating the flow of processing between devices when an image scanned by the MFP 110 is converted into a file and transmitted to cloud storage. Here, we will mainly explain the exchange between each device. Although FIG. 5 shows that the MFP 110 interacts with the MFP cooperation service 120, the client PC 111 may perform the acquisition of analysis results, screen display, learning instructions, etc., which will be described later, instead of the MFP 110. Hereinafter, regarding processes executed by "MFP 110 or client PC 111," client PC 111 will be omitted and only "MFP 110" will be described.

MFP110は、通常の状態では提供する各機能を実施するためのボタンを並べたメイン画面をタッチパネル上に表示する。
MFP110にスキャン帳票をクラウドストレージに送信するための追加アプリケーション(以降「スキャンアプリ」と呼ぶ)をインストールすることで、アプリケーションの機能を使用するボタンがMFP110のメイン画面に表示される。なお、スキャンアプリは、追加機能部420に対応するアプリケーションとする。スキャンアプリの機能を使用するボタンを押すとスキャンした帳票をクラウドストレージに送信するための画面が表示され、図5のシーケンスで示す処理が行われる。
In a normal state, the MFP 110 displays a main screen on the touch panel in which buttons for implementing each function provided are arranged.
By installing an additional application (hereinafter referred to as a "scan application") on the MFP 110 for transmitting scanned forms to cloud storage, buttons for using the functions of the application are displayed on the main screen of the MFP 110. Note that the scan application is an application that corresponds to the additional function section 420. When you press the button to use the function of the scan app, a screen for sending the scanned form to cloud storage is displayed, and the process shown in the sequence shown in FIG. 5 is performed.

S501において、MFP110は、MFP連携サービス120にアクセスするための認証情報を入力するログイン画面(不図示)を表示する。このログイン画面にユーザーが認証情報(ユーザー名とパスワード)の入力を行ってOKボタンを押下すると、MFP110は、ユーザー名とパスワードを含むログイン要求を、MFP連携サービス120に送信する(S502)。 In S501, the MFP 110 displays a login screen (not shown) for entering authentication information for accessing the MFP cooperation service 120. When the user enters authentication information (user name and password) on this login screen and presses the OK button, the MFP 110 transmits a login request including the user name and password to the MFP cooperation service 120 (S502).

S503において、MFP連携サービス120は、ログイン要求に含まれるユーザー名とパスワードが正しいか検証し、正しければアクセストークンをMFP110に返す。以降のMFP110からMFP連携サービス120に対して行う各種リクエストには、このアクセストークンと共に要求が出され、この情報により処理対象のユーザーを特定することができる。ユーザー認証の方法は一般的に公知な手法(Basic認証、Digest認証、OAuthを用いた認可等)を用いて行う。 In S503, the MFP cooperation service 120 verifies whether the user name and password included in the login request are correct, and if they are correct, returns an access token to the MFP 110. Various subsequent requests made from the MFP 110 to the MFP cooperation service 120 are made together with this access token, and the user to be processed can be specified using this information. User authentication is performed using generally known methods (Basic authentication, Digest authentication, authorization using OAuth, etc.).

MFP110は、ログイン処理が完了したら、S504において、スキャン設定画面(不図示)を表示する。ユーザーは、このスキャン設定画面において、各種スキャンの読み込みに関する設定を行う。さらに、ユーザーが、原稿台ガラスまたはADFにスキャンする対象の紙帳票を置き、「スキャン開始」ボタンを押すと、MFP110は、S505において、スキャンを実行して紙帳票を電子化した画像データを生成する。 When the login process is completed, the MFP 110 displays a scan setting screen (not shown) in S504. On this scan setting screen, the user makes settings related to reading various scans. Furthermore, when the user places a paper form to be scanned on the platen glass or ADF and presses the "Start Scan" button, the MFP 110 executes the scan in S505 and generates image data that digitizes the paper form. do.

そして、S506において、MFP110は、スキャン処理により生成した画像(スキャン画像)とともにスキャン画像の解析要求をMFP連携サービス120に送信する。このときにスキャンした画像全てを送信してもよいし、解析対象だけ先に送信し、あとで全てのスキャン画像を送信してもよい。 Then, in S506, the MFP 110 transmits an image generated by the scanning process (scanned image) and a scanned image analysis request to the MFP cooperation service 120. All scanned images may be transmitted at this time, or only the analysis target may be transmitted first, and all scanned images may be transmitted later.

MFP連携サービス120は、スキャン画像の解析要求を受信すると、S507において、MFP連携サービス120の画像処理部432で画像解析を開始する。その後、MFP連携サービス120は、画像解析処理の終了を待たずに、MFP連携サービス120に依頼した解析を一意に示す識別子である”processId”をMFP110に返す。 When the MFP cooperation service 120 receives the scan image analysis request, the image processing unit 432 of the MFP cooperation service 120 starts image analysis in S507. Thereafter, the MFP cooperation service 120 returns "processId", which is an identifier uniquely indicating the analysis requested to the MFP cooperation service 120, to the MFP 110 without waiting for the end of the image analysis process.

さらにS507において、MFP連携サービス120は、要求受信後、画像処理部432で画像解析処理を行う。画像解析処理では、画像処理部432は、まずS508において、画像内に存在する文字領域の解析を行う。その後、画像処理部432は、S509において、上記S508で解析した領域に対して文字認識処理を行う。さらに、画像処理部432は、S510において、上記S509の文字認識処理によって抽出された文字列のなかから、所定のルール(あらかじめ設定されたファイル名の命名ルール)の属性に従ってファイル名を自動抽出する。なお、S508~S510の処理の詳細については後述する図8で説明を行う。 Furthermore, in S507, after receiving the request, the MFP cooperation service 120 performs image analysis processing in the image processing unit 432. In the image analysis process, the image processing unit 432 first analyzes a character area existing in the image in S508. Thereafter, in S509, the image processing unit 432 performs character recognition processing on the area analyzed in S508. Further, in S510, the image processing unit 432 automatically extracts a file name from the character string extracted by the character recognition process in S509, according to the attributes of a predetermined rule (a preset file name naming rule). . Note that details of the processing in S508 to S510 will be explained later with reference to FIG. 8.

MFP110は、S511において、上記S506のレスポンスで受け取った”processId”を使用して、MFP連携サービス120に定期的(例えば数百ミリ秒から数ミリ秒程度毎など)に”processId”の画像解析の処理状況の確認を行う。図では省略するが、S511の処理はMFP連携サービス120の画像処理完了のレスポンスが取得できるまで(S512のタイミングまで)継続して行う。 In S511, the MFP 110 uses the "processId" received in the response in S506 above to periodically (for example, every several hundred milliseconds to several milliseconds) request image analysis for the "processId". Check the processing status. Although not shown in the figure, the process of S511 is continued until a response indicating the completion of image processing from the MFP cooperation service 120 is obtained (until the timing of S512).

MFP連携サービス120は、上記S511の処理状況確認の要求を受けると”processId”の処理の状況を確認し、レスポンスをMFP110に返す。レスポンスには、”status”に現在の処理状況を示す文字列が格納される。例えば”status”が”processing”の時は、MFP連携サービス120で処理が行われている最中であることを示し、”completed”の時は処理が完了している状態であることを示す。なお、処理が失敗した場合に”failed”など、この他のステータスが返ることもある。また、処理完了時(statusがcompletedの場合)のレスポンスは、ステータスと共にスキャン画像を解析した結果やスキャン設定等の情報を含む。
MFP連携サービス120は、S512において、処理完了のレスポンスをMFP110に返す。
When the MFP cooperation service 120 receives the request to confirm the processing status in step S511, it confirms the processing status of “processId” and returns a response to the MFP 110. In the response, a character string indicating the current processing status is stored in "status". For example, when "status" is "processing", it indicates that processing is being performed by the MFP cooperation service 120, and when "status" is "completed", it indicates that processing has been completed. Note that if the process fails, other statuses such as "failed" may be returned. Furthermore, the response when the process is completed (when the status is completed) includes information such as the results of analyzing the scanned image and scan settings as well as the status.
In S512, the MFP cooperation service 120 returns a processing completion response to the MFP 110.

MFP110は処理の完了のレスポンスを検知すると、S513において、該レスポンスに含まれる結果情報が格納されたURLから結果情報を取得する。
次にS514において、MFP110は、上記S513で取得した結果情報を使用してファイル名設定画面600(図6)を表示する。例えば、MFP110は、上述の結果情報が格納されたURLにアクセスして、表示制御部435により提供されるファイル名設定画面600を取得して表示する。ファイル名設定画面の詳細については後述する。
When the MFP 110 detects a response indicating completion of processing, in step S513, the MFP 110 acquires result information from the URL where the result information included in the response is stored.
Next, in S514, the MFP 110 displays the file name setting screen 600 (FIG. 6) using the result information obtained in S513 above. For example, the MFP 110 accesses the URL where the above-mentioned result information is stored, obtains the file name setting screen 600 provided by the display control unit 435, and displays the file name setting screen 600. Details of the file name setting screen will be described later.

ユーザーが、ファイル名設定画面600で、スキャン帳票にファイル名を確認し、必要に応じてファイル名設定の操作を行い、後述する「送信」ボタン606を押すと、MFP110は、S515において、送信要求を検出する。
送信要求を検出すると、S516において、MFP110は、入力情報として設定したファイル名をMFP連携サービス120に送信する。
When the user checks the file name on the scanned form on the file name setting screen 600, performs file name setting operations as necessary, and presses the "Send" button 606, which will be described later, the MFP 110 sends a transmission request in S515. Detect.
Upon detecting the transmission request, the MFP 110 transmits the file name set as input information to the MFP cooperation service 120 in S516.

ファイル名を受信すると、MFP連携サービス120のリクエスト制御部431は、S517において、画像処理部432にファイル生成を依頼する。画像処理部432は、MFP連携サービスに登録されたスキャン設定からクラウドストレージ130に送信するファイルフォーマットの情報を取得し、その設定に基づいてスキャン画像からファイルを生成する。 Upon receiving the file name, the request control unit 431 of the MFP cooperation service 120 requests the image processing unit 432 to generate a file in S517. The image processing unit 432 obtains information on the file format to be sent to the cloud storage 130 from the scan settings registered in the MFP cooperation service, and generates a file from the scanned image based on the settings.

S518において、MFP連携サービス120は、クラウドストレージ130に、スキャン画像から生成したファイルとそのファイル名を送信する。
MFP110は、入力情報の送信のレスポンスを受けると処理を終了する。
In S518, the MFP cooperation service 120 transmits the file generated from the scanned image and its file name to the cloud storage 130.
The MFP 110 ends the process upon receiving the response for transmitting the input information.

なお、ユーザーは、スキャンすべき帳票が複数ある場合は、複数部の帳票を繰り返しスキャンする(S504~S513の処理を繰り返し行う)ことができる。また、スキャンする前にスキャンした文書を固定ページ数や仕切り紙を用いて分割する設定を指示することで、複数の帳票をまとめて一度にスキャンして複数の帳票に分割することもできる。 Note that if there are multiple documents to be scanned, the user can repeatedly scan multiple copies of the document (repeatedly perform the processes of S504 to S513). Additionally, by instructing the user to set a fixed number of pages or dividing a scanned document using partition paper before scanning, multiple documents can be scanned at once and divided into multiple documents.

また、S514~S516の処理を、例えば、ユーザーがクライアントPC111のウェブブラウザまたは専用のアプリケーション等からMFP連携サービス120にログインする。すると、上述のようにスキャンされたログインユーザーに対応する文書のうち、ファイルが生成されていない文書の一覧が表示される。ユーザーが、この文書の一覧からいずれかの文書を選択すると、MFP連携サービス120は、クライアントPC111のウェブブラウザまたは専用のアプリケーション等に、ファイル名設定画面600を送信し、ファイル名の修正対象箇所の選択を受け付けるものとする。 Further, the processing of S514 to S516 is performed by, for example, a user logging into the MFP cooperation service 120 from a web browser of the client PC 111 or a dedicated application. Then, a list of documents for which files have not been generated among the scanned documents corresponding to the logged-in user as described above is displayed. When the user selects one of the documents from this list of documents, the MFP cooperation service 120 sends a file name setting screen 600 to the web browser or dedicated application of the client PC 111, and selects the location where the file name is to be corrected. Selection shall be accepted.

図6は、ファイル名設定画面600の一例を示す図である。
ファイル名領域601は、ファイル名を表示する領域であり、あらかじめ設定されたファイル名の命名ルールとスキャンした画像の解析結果を基に生成されたファイル名が表示される。なお、ファイル名の命名ルールの設定は、図7のようなファイル名命名ルール設定画面において設定される。ここで図7を用いて、ファイル名命名ルールについて説明する。
FIG. 6 is a diagram showing an example of a file name setting screen 600.
A file name area 601 is an area for displaying file names, and displays file names generated based on preset file name naming rules and analysis results of scanned images. Note that the file name naming rules are set on a file name naming rule setting screen as shown in FIG. Here, the file name naming rule will be explained using FIG. 7.

図7は、本実施形態におけるファイル名命名ルール設定画面の一例を示す図である。
例えば、ユーザーがMFP110又はクライアントPC111のウェブブラウザ等からMFP連携サービス120にログインし、ファイル名命名ルール設定を選択した場合に、表示制御部435が図7のファイル名命名ルール設定画面700を返す。これにより、MFP110又はクライアントPC111のウェブブラウザ等に、ファイル名命名ルール設定画面700が表示される。
FIG. 7 is a diagram showing an example of a file name naming rule setting screen in this embodiment.
For example, when the user logs into the MFP cooperation service 120 from a web browser of the MFP 110 or the client PC 111 and selects file name naming rule setting, the display control unit 435 returns the file name naming rule setting screen 700 shown in FIG. As a result, a file name naming rule setting screen 700 is displayed on the web browser of the MFP 110 or the client PC 111.

図7のファイル名命名ルール設定画面700は、ルール設定後の画面の表示例を示している。ファイル名命名ルール設定画面700は、ルール設定領域701、システムトークン領域702、区切り文字トークン領域703、自動抽出トークン領域704の4つの領域を有している。各トークン領域702~704には、ファイル名の命名ルールを設定する際に組み合わせて利用可能な複数のトークン(構成要素)が表示されている。システムトークン702には、システムから取得可能な情報に関するトークン(ユーザー名、デバイス名、時刻、日付など)が表示されている。区切り文字トークン領域703には、各トークンの間に挿入する区切り文字に関するトークン(アンダースコア、ハイフン、スペース)が表示されている。自動抽出トークン704には、スキャン画像の文字認識処理した結果の文字列の中から、所望の属性(文書種別、文書作成日、文書番号、発行先の会社名、発行先の人名、発行元の会社名、発行元の人名、金額、など)に関する文字列を選択するためのトークンが表示されている。 A file name naming rule setting screen 700 in FIG. 7 shows a display example of the screen after the rule is set. The file name naming rule setting screen 700 has four areas: a rule setting area 701 , a system token area 702 , a delimiter token area 703 , and an automatic extraction token area 704 . Each of the token areas 702 to 704 displays a plurality of tokens (components) that can be used in combination when setting a file name naming rule. The system token 702 displays tokens related to information obtainable from the system (user name, device name, time, date, etc.). The delimiter token area 703 displays tokens related to delimiters (underscore, hyphen, space) to be inserted between each token. The automatic extraction token 704 contains desired attributes (document type, document creation date, document number, issuer's company name, issuer's name, issuer's name) from the character string resulting from character recognition processing of the scanned image. Tokens are displayed for selecting character strings related to company name, name of issuer, amount, etc.).

ファイル名命名ルール設定画面700では、トークン領域702~704に表示されている複数のトークンの中からユーザが所望のトークンをドラッグして、ルール設定領域701にドロップして並べることで、命名ルールを設定することができる。ルール設定領域701に並べられたトークンに対応する情報を、その並び順にしたがって組み合わせることでファイル名が生成されることになる。また、ファイル名命名ルール設定画面700には、設定したルールを確定・保存するための「保存」ボタン705が備えられている。「保存」ボタン705が押下されると、ファイル名命名ルール設定画面700で設定したファイル名の命名ルールが確定され、MFP連携サービス120に送信されて保存される。
MFP連携サービス120は、このようなファイル名命名ルール設定画面を使用して設定されたファイル名の命名ルールを用いて、ファイル名を生成する。
On the file name naming rule setting screen 700, the user can set naming rules by dragging desired tokens from among the plurality of tokens displayed in the token areas 702 to 704 and dropping them onto the rule setting area 701 to arrange them. Can be set. A file name is generated by combining information corresponding to the tokens arranged in the rule setting area 701 in the order in which they are arranged. Further, the file name naming rule setting screen 700 is provided with a "save" button 705 for confirming and saving the set rule. When the "Save" button 705 is pressed, the file name naming rule set on the file name naming rule setting screen 700 is finalized, transmitted to the MFP cooperation service 120, and saved.
The MFP cooperation service 120 generates a file name using the file name naming rule set using such a file name naming rule setting screen.

図7の例ように、命名ルールに、自動抽出トークンの属性「文書種別」と、区切り文字トークンの「アンダースコア」と、自動抽出トークンの属性「文書番号」とが含まれていた場合には、MFP連携サービス120は、スキャン画像の文字認識結果から、自動抽出トークンの属性情報に対応する文字列を選択してファイル名を生成する。
例えば、属性「文書種別」に対応する文字列として「見積書」が抽出され、属性「文書番号」に対応する文字列として「132343500」が抽出された場合、区切り文字の「アンダースコア」と組み合わせることにより、ファイル名「見積書_132343500」が生成される。そして、当該生成されたファイル名は、図6のファイル名設定画面600のファイル名領域601に表示される。
As shown in the example in Figure 7, if the naming rule includes the automatically extracted token attribute "document type", the delimiter token "underscore", and the automatically extracted token attribute "document number", , the MFP cooperation service 120 selects a character string corresponding to the attribute information of the automatically extracted token from the character recognition result of the scanned image and generates a file name.
For example, if "estimate" is extracted as a string corresponding to the attribute "document type" and "132343500" is extracted as a string corresponding to the attribute "document number", it will be combined with the delimiter "underscore". As a result, the file name “Quote_132343500” is generated. The generated file name is then displayed in the file name area 601 of the file name setting screen 600 in FIG.

以下、図6の説明に戻る。
自動抽出トークンの属性情報に基づいて自動抽出された文字列が誤抽出であった場合、ユーザはファイル名を修正するために、まず、ファイル名領域601に表示されている誤抽出文字列を選択し、さらに、スキャン画像上の別の文字列を選択する。例えば、文書番号として自動抽出された「132343500」を別の領域の文字列にしたい場合は、次のように操作する。まず、ユーザは、ファイル名領域601で修正対象の「132343500」を選択し、次に「プレビュー領域」602に表示される帳票画像(スキャン画像)上で別の文字列画像「E20019-01」を選択すると、ファイル名領域601内の「132343500」を、当該選択された文字列画像に対応する文字認識結果文字列「E20019-01」に修正することができる。なお、修正文字列を選択した場合の処理の詳細については後述する。
また、ファイル名領域601の右側の空白部分をタッチすると、ソフトキーボードが表示され、当該ファイル名領域601に表示中のファイル名全体の修正、および任意の文字を追加入力することができる。
The description of FIG. 6 will now be returned to.
If the character string automatically extracted based on the attribute information of the automatic extraction token is incorrectly extracted, the user first selects the incorrectly extracted character string displayed in the file name area 601 in order to correct the file name. and then select another string on the scanned image. For example, if you want to convert "132343500", which was automatically extracted as a document number, to a character string in a different area, proceed as follows. First, the user selects “132343500” to be corrected in the file name area 601, and then selects another character string image “E20019-01” on the form image (scanned image) displayed in the “preview area” 602. When selected, "132343500" in the file name area 601 can be modified to the character recognition result character string "E20019-01" corresponding to the selected character string image. Note that the details of the process when a modified character string is selected will be described later.
Furthermore, when a blank space on the right side of the file name area 601 is touched, a soft keyboard is displayed, and it is possible to modify the entire file name displayed in the file name area 601 and input additional arbitrary characters.

「プレビュー領域」602は、スキャン画像(帳票画像)をプレビュー表示する。さらに、このスキャン画像内の文字領域をタッチすると、タッチした位置に対応する文字領域に対応する文字認識結果文字列をファイル名に追加等することができる。ファイル名に使用されている文字列は、選択されていることがわかるように、当該文字領域に線、枠線などの形状や色などを付与して強調表示してもよい。複数の文字領域を選択した場合、それぞれの文字領域の色を異なる色にしてもよい。対応するプレビュー領域602上で選択された文字領域とファイル名領域601の文字列とのそれぞれに、同じ色や同じ網掛け枠を表示して、対応付けが分かりやすいようにしてもよい。図6の例では、プレビュー上の選択した文字領域とファイル名の表示領域を同じ網掛け枠を使用することで対応付けを分かりやすく表示している。 A "preview area" 602 displays a preview of the scanned image (form image). Furthermore, by touching a character area within this scanned image, a character recognition result character string corresponding to the character area corresponding to the touched position can be added to the file name. The character string used in the file name may be highlighted by adding a shape such as a line or frame line or color to the character area so that it can be seen that it has been selected. If multiple text areas are selected, each text area may be set to a different color. The character area selected on the corresponding preview area 602 and the character string in the file name area 601 may each be displayed in the same color or the same shaded frame to make the correspondence easier to understand. In the example of FIG. 6, the correspondence is displayed in an easy-to-understand manner by using the same shaded frame for the selected character area on the preview and the file name display area.

また、選択した文字領域が中央になるようにプレビュー表示位置の変更や、拡大率の変更を行ってもよい。また、文字領域が複数存在する場合、あらかじめ設定された領域数分の文字領域が表示されるように、プレビュー表示位置を算出してもよい。例えば、ファイル名に使用した領域のうち、一番上部の領域と一番下部の領域の中央部分が、プレビュー領域の縦方向の中央になるように表示位置と拡大率の変更を行い、プレビュー表示を行う。一度選択した文字領域を再度タッチすると、選択が解除されて対応するファイル名の文字列を削除して、文字領域に付与した線や色なども表示しない状態に戻す。例では、文字列が非選択時の場合に、文字領域はプレビュー上には表示されないように記載している。しかし、ユーザーにどの領域がタッチできるのかを示すために色や枠線を用いて文字領域がわかるように表示してもよい。また、文字領域がわかるようにする表示は、ボタンなどで表示と非表示が切り替えられるようにしてもよい。プレビュー領域に対してスワイプ操作を行うと、プレビュー領域で表示される画像の位置を移動することができる。 Furthermore, the preview display position may be changed or the enlargement ratio may be changed so that the selected character area is centered. Furthermore, when there are multiple character areas, the preview display position may be calculated so that a preset number of character areas are displayed. For example, change the display position and magnification so that the center of the top and bottom areas of the area used for the file name becomes the vertical center of the preview area, and then display the preview. I do. If you touch the selected text area again, the selection is canceled, the corresponding file name string is deleted, and the lines and colors added to the text area are returned to the state where they are not displayed. In the example, the text area is not displayed on the preview when the text string is not selected. However, in order to show the user which areas can be touched, the character areas may be displayed using colors or frames. Further, the display that makes the character area visible may be switched between display and non-display using a button or the like. By performing a swipe operation on the preview area, you can move the position of the image displayed in the preview area.

「ファイル名削除」ボタン603は、ファイル名のうち末尾に追加されている文字領域に対応する文字を削除する。「プレビュー拡大」ボタン604は、プレビュー領域に表示している画像の拡大倍率を大きくする。「プレビュー縮小」ボタン605は、プレビュー領域に表示している画像の拡大倍率を小さくする。拡大および縮小時にプレビュー領域の中央の座標が拡大および縮小前と同一となるように表示位置の調整を行う。
また、「送信」ボタン606を押下することで、設定したファイル名をMFP連携サービス120へ送信し、ファイル生成、ファイル名を付与したファイルの送信を行う。送信が完了するとスキャン前の画面に戻る。
A "delete file name" button 603 deletes the characters corresponding to the character area added at the end of the file name. The "enlarge preview" button 604 increases the magnification of the image displayed in the preview area. A "preview reduction" button 605 reduces the magnification of the image displayed in the preview area. When enlarging and reducing, the display position is adjusted so that the coordinates of the center of the preview area are the same as before enlarging and reducing.
Furthermore, by pressing the "Send" button 606, the set file name is sent to the MFP cooperation service 120, and the file is generated and the file with the file name is sent. When the transmission is complete, the screen returns to the one before scanning.

図8は、本システムにおける画像処理部432が行う画像解析処理の詳細を示すフローチャートである。本フローは図5におけるS507~S510に相当する。 FIG. 8 is a flowchart showing details of image analysis processing performed by the image processing unit 432 in this system. This flow corresponds to S507 to S510 in FIG.

はじめにS801において、画像処理部432は、入力画像の文字領域を解析し、帳票内の文字領域群を取得する。
次にS802において、画像処理部432は、上記S801で取得した帳票の全文字領域に対して文字認識処理を実施し、文字列を抽出する。
First, in S801, the image processing unit 432 analyzes the character area of the input image and obtains a group of character areas in the form.
Next, in S802, the image processing unit 432 performs character recognition processing on the entire character area of the form acquired in S801 above, and extracts a character string.

その後、S803において、画像処理部432は、あらかじめ設定されたファイル名の命名ルールに含まれている自動抽出トークンの属性情報に基づいて、属性情報に対応する文字列を自動抽出する。
例えば、属性情報として「文書種別」が定義されていた場合は、「見積書」や「請求書」など文書種別に相当する文字列を自動抽出する。また、「会社名(発行元)」が定義されていた場合は、帳票内の発行元の会社名に相当する文字列を自動抽出する。
文字認識(OCR)処理では1つの文字列画像に対して複数の候補文字列が順位付けされて抽出されるが、その中の最上位のものがその文字列画像の文字認識結果として利用される。さらに、自動抽出トークンで指定された属性情報に対応する文字列の候補が複数抽出された場合は、その中で順位付けを行って最上位のものがファイル名に利用される。文字認識処理結果の第2位以下の候補、ならびに、属性情報に対応する自動抽出処理結果の第2位以下の候補については、後述するファイル名修正時に使用する。詳細は後述する。
After that, in S803, the image processing unit 432 automatically extracts a character string corresponding to the attribute information based on the attribute information of the automatic extraction token included in the preset file name naming rule.
For example, if "document type" is defined as attribute information, character strings corresponding to the document type, such as "estimate" or "invoice", are automatically extracted. Furthermore, if "company name (issuer)" is defined, a character string corresponding to the company name of the issuer in the form is automatically extracted.
In character recognition (OCR) processing, multiple candidate character strings are ranked and extracted for one character string image, and the highest ranked one is used as the character recognition result for that character string image. . Furthermore, if multiple character string candidates corresponding to the attribute information specified by the automatic extraction token are extracted, they are ranked and the highest ranked one is used as the file name. The second and lower candidates of the character recognition processing results and the second and lower candidates of the automatic extraction processing results corresponding to the attribute information are used when modifying the file name, which will be described later. Details will be described later.

ここからは、図6のファイル名設定画面で行う自動抽出されたファイル名の修正処理について、図9、図10を用いて詳細に説明を行う。
図9は、第1実施形態におけるファイル名修正処理の詳細を示すフローチャートである。このフローチャートの処理は、MFP110(又はクライアントPC111)で実行される構成でも、MFP連携サービス120で実行される構成でもよい。MFP連携サービス120で実行される場合、MFP連携サービス120での処理結果がMFP110に送信されて表示され、MFP110での操作情報がMFP110からMFP連携サービス120に送信されるものとする。
ここでは、まずMFP110が図9の処理を実行する場合について説明する。
From here on, the process of correcting automatically extracted file names performed on the file name setting screen of FIG. 6 will be explained in detail using FIGS. 9 and 10.
FIG. 9 is a flowchart showing details of the file name modification process in the first embodiment. The processing in this flowchart may be executed by the MFP 110 (or client PC 111) or by the MFP cooperation service 120. When executed by the MFP cooperation service 120, processing results in the MFP cooperation service 120 are sent to and displayed on the MFP 110, and operation information on the MFP 110 is sent from the MFP 110 to the MFP cooperation service 120.
First, a case where the MFP 110 executes the process shown in FIG. 9 will be described.

図10は、第1実施形態におけるファイル名修正処理の画面の一例を示す図である。
図10のファイル名の「132343500」を属性情報に基づいて自動抽出された帳票内の別の文字列候補「E20019-01」に変更してファイル名を修正するフローについて具体的に説明する。
FIG. 10 is a diagram showing an example of a screen for file name modification processing in the first embodiment.
A flow of modifying the file name by changing the file name "132343500" in FIG. 10 to "E20019-01", another character string candidate in the form automatically extracted based on attribute information, will be specifically described.

ユーザーが、ファイル名領域601に表示されているファイル名の中から自動抽出された文字列のうち、修正したい文字列が選択すると、S901において、MFP110が、該選択操作を受け付ける。例えば、この時点では、図10のファイル名設定画面600でファイル名領域601には、順位が最上位の文字列(「見積書」ならびに「132343500」)が、その属性情報に適切な文字列として表示されている。そして、ユーザーが修正対象の文字列として、図10のファイル名設定画面600でファイル名領域601の文字列「132343500」を選択したとする。 When the user selects a character string to be modified from among the character strings automatically extracted from the file name displayed in the file name area 601, the MFP 110 accepts the selection operation in S901. For example, at this point, in the file name area 601 of the file name setting screen 600 in FIG. Displayed. Assume that the user selects the character string "132343500" in the file name area 601 on the file name setting screen 600 in FIG. 10 as the character string to be modified.

S902において、MFP110は、上記S901で選択された文字列がどの属性情報から抽出された文字列なのかのチェックを行い、属性情報を抽出する。例えば、図10で文字列「132343500」を選択した場合、その文字列は属性「文書番号」を基に抽出された文字列であるため、属性情報として「文書番号」を取得する。 In S902, the MFP 110 checks from which attribute information the character string selected in S901 is extracted, and extracts the attribute information. For example, when the character string "132343500" is selected in FIG. 10, the character string is extracted based on the attribute "document number", so "document number" is acquired as the attribute information.

S903において、MFP110は、上記S902で取得した属性情報に対して、帳票内で自動抽出された他の候補が存在するか確認をする。例えば、図8のS803で属性「文書番号」に基づいて帳票内の文字列から順位付けて自動抽出された文字列候補群の中から最上位以外のものを修正候補とする。図10の帳票において、属性「文書番号」に基づいて自動抽出された文字列の順位が順に、課税登録番号1003、見積番号1004であったとする。この場合、課税登録番号1003は最上位のためファイル名として使用されている状態であるので、見積番号1004が修正候補として扱われることになる。
自動抽出された他の候補が存在しない場合(S903でNoの場合)、MFP110は、ファイル名の修正対象箇所の選択に応じた処理を終了する。
一方、自動抽出された他の候補が存在する場合(S903でYesの場合)、MFP110は、S904に処理を進める。
In S903, the MFP 110 checks whether there are any other automatically extracted candidates in the form based on the attribute information acquired in S902. For example, in S803 of FIG. 8, character strings in a form are ranked based on the attribute "document number" and from among the automatically extracted character string candidates, those other than the highest rank are determined as correction candidates. In the form of FIG. 10, it is assumed that the order of automatically extracted character strings based on the attribute "document number" is tax registration number 1003 and estimate number 1004. In this case, since the tax registration number 1003 is at the highest level and is used as a file name, the estimate number 1004 will be treated as a correction candidate.
If there are no other automatically extracted candidates (No in S903), the MFP 110 ends the process according to the selection of the file name modification target location.
On the other hand, if there are other automatically extracted candidates (Yes in S903), the MFP 110 advances the process to S904.

S904において、MFP110は、上記S903で確認した自動抽出の候補の文字列領域を強調表示するよう制御する。候補が複数存在する場合は、それぞれ強調表示する。それぞれ視覚的に認識しやすいように異なる色、背景で強調表示してもよい。強調表示する領域がプレビュー表示外の場合は、プレビューの表示領域を縮小して候補の強調表示を行ってもよい。あわせて、ファイル名に使用されている他の文字列箇所の強調表示をオフにするように制御する。 In S904, the MFP 110 controls to highlight the character string region of the automatic extraction candidate confirmed in S903 above. If there are multiple candidates, each is highlighted. Each may be highlighted with a different color or background to make it easier to recognize visually. If the area to be highlighted is outside the preview display, the preview display area may be reduced to highlight the candidate. At the same time, it controls highlighting of other character strings used in file names to be turned off.

図10は、自動抽出の候補である見積番号1004「E20019-91」を強調表示した例である。なお、このとき、ファイル名領域601に表示されているファイル名を構成する他の文字列(「見積書」)の強調表示を自動的にオフにしている。強調表示されるのはファイル名の修正対象文字列とその文字列の属性情報に基づいて自動抽出された文字列候補になる。これにより、ファイル名の命名ルールに設定された属性に基づいて自動抽出された他の候補の位置の把握と選択を簡単に行うことが可能となる。 FIG. 10 is an example in which quotation number 1004 "E20019-91", which is a candidate for automatic extraction, is highlighted. Note that at this time, the highlighting of the other character strings (“estimate”) forming the file name displayed in the file name area 601 is automatically turned off. What is highlighted is the character string to be corrected in the file name and character string candidates automatically extracted based on the attribute information of that character string. This makes it possible to easily grasp and select the positions of other candidates that are automatically extracted based on the attributes set in the file name naming rules.

S905において、MFP110は、上記S904で強調表示した自動抽出候補の文字列に対して、文字認識処理結果の他の候補文字列が存在するか確認をする。候補の確認では、図8のS802の文字認識処理結果の中から、強調表示した自動抽出候補の文字列画像について、文字認識処理結果の他の候補が存在するか確認を行う。例えば、見積番号1004「E20019-91」の文字認識処理結果の候補として、「E20079-01」、「E20019-01」、「E20079-07」が得られていたものとする。
自動抽出候補の文字列に対して文字認識処理の候補が存在しない場合(S905でNoの場合)、MFP110は、ファイル名の修正対象箇所の選択に応じた処理を終了する。
一方、自動抽出候補の文字列に対して文字認識処理の候補が存在する場合(S905でYesの場合)、MFP110は、S906に処理を進める。
In S905, the MFP 110 checks whether there are any other candidate character strings as a result of character recognition processing for the automatic extraction candidate character string highlighted in S904. In checking the candidates, it is checked whether there are other candidates as a result of the character recognition process for the highlighted character string image of the automatically extracted candidate from among the character recognition process results in S802 in FIG. For example, assume that "E20079-01,""E20019-01," and "E20079-07" are obtained as candidate character recognition processing results for estimate number 1004 "E20019-91."
If there are no candidates for character recognition processing for the character string that is an automatic extraction candidate (No in S905), the MFP 110 ends the processing according to the selection of the modification target portion of the file name.
On the other hand, if there are candidates for character recognition processing for the character string that is an automatic extraction candidate (Yes in S905), the MFP 110 advances the process to S906.

S906において、MFP110は、上記S904で強調表示を行った自動抽出候補文字列の領域に、上記S905で確認した文字認識処理の候補を表示する。図10のように自動抽出の候補文字列の見積番号1004に対して、文字認識処理の候補文字列1005を表示する。図10では、例として、文字認識処理の候補として、「E20079-01」、「E20019-01」、「E20079-07」をリスト表示している。帳票の文字領域と重なる場合には、その文字領域に被らない位置に表示してもよい。スキャンしたユーザーは、リスト表示された文字列の中から適切なものを選択することが可能である。 In S906, the MFP 110 displays the candidates for character recognition processing confirmed in S905 above in the region of the automatic extraction candidate character string highlighted in S904 above. As shown in FIG. 10, a candidate character string 1005 for character recognition processing is displayed for an estimate number 1004 of a candidate character string for automatic extraction. In FIG. 10, as an example, "E20079-01", "E20019-01", and "E20079-07" are displayed as a list as candidates for character recognition processing. If it overlaps the character area of the form, it may be displayed at a position that does not overlap the character area. The scanned user can select the appropriate string from the displayed list.

図10の例では、プレビュー表示したスキャン画像上では文字列画像が「E20019-01」となっているが、文字認識処理を行った結果の第一候補は「E20079-01」となっており、文字認識処理結果が間違っている結果となっている。もしも、ファイル名修正時に、ユーザーにより選択された見積番号1004の領域の文字認識結果の第一候補をそのままファイル名として使用してしまうと、文字認識結果が間違っている「E20079-01」が選択されてしまう。そこで、本実施形態では、ユーザがファイル名領域601において修正対象の文字列を選択すると、当該選択された文字列の属性情報と同じ属性情報を有する文字列画像について、その文字認識結果の複数の候補文字列を表示する。これにより、当該表示された複数の文字認識処理結果の候補文字列の中から、ユーザーが正しいものを適切に選択することが可能となる。本例では、正しい文字列として、2番目の候補の「E20019-01」を選択することで、直接編集で修正することなく、適切な文字列を選択可能となる。また、ファイル名に使用する文字列の領域は適切であるが、自動抽出された文字列の文字認識処理結果が間違っていて、他の候補に変更する場合も想定して、ファイル名で選択した修正文字列の文字認識処理の候補の表示を行ってもよい。例えば、図10ではプレビュー表示したスキャン画像の「132343500」に文字認識処理の候補として、「732343500」などを表示してもよい(不図示)。 In the example of FIG. 10, the character string image is "E20019-01" on the previewed scanned image, but the first candidate as a result of character recognition processing is "E20079-01". The character recognition processing result is incorrect. If the first candidate of the character recognition result for the area of estimate number 1004 selected by the user is used as the file name when modifying the file name, "E20079-01" with the wrong character recognition result will be selected. It will be done. Therefore, in this embodiment, when the user selects a character string to be modified in the file name area 601, multiple character recognition results are displayed for character string images having the same attribute information as that of the selected character string. Display candidate strings. This allows the user to appropriately select the correct character string from among the displayed candidate character strings of the plurality of character recognition processing results. In this example, by selecting the second candidate "E20019-01" as the correct character string, it becomes possible to select an appropriate character string without having to modify it by direct editing. In addition, the area for the character string used for the file name is appropriate, but the character recognition processing result of the automatically extracted character string is incorrect, and in case you want to change it to another candidate, select it for the file name. Candidates for character recognition processing of the modified character string may be displayed. For example, in FIG. 10, "732343500" may be displayed as a candidate for character recognition processing in place of "132343500" in the previewed scanned image (not shown).

S907において、MFP110は、上記S906で候補表示したものの中からユーザーにより選択された文字列をファイル名に反映する。本例では、ファイル名が「見積書_132343500」だったものが、「見積書_E20019-01」となる。このときに、上記S904でファイル名に使用されている他の文字列箇所(見積書)の強調表示をオフにしていたが、ファイル名が設定された後に元の強調表示に戻すものとする。 In S907, the MFP 110 reflects the character string selected by the user from the candidates displayed in S906 above in the file name. In this example, the file name "Estimate_132343500" becomes "Estimate_E20019-01." At this time, the highlighting of other character strings used in the file name (estimate) was turned off in step S904, but the highlighting is returned to the original highlighting after the file name is set.

なお、ユーザーが、ファイル名設定画面600において、必要に応じて同様の操作を行い、「送信」ボタン606を押すと、MFP110は、ファイル名設定画面600において設定したファイル名をMFP連携サービス120に送信する(図5のS516に対応)。 Note that when the user performs similar operations as necessary on the file name setting screen 600 and presses the "send" button 606, the MFP 110 sends the file name set on the file name setting screen 600 to the MFP cooperation service 120. (corresponding to S516 in FIG. 5).

次に、図9のフローチャートの処理を、MFP連携サービス120で実行する場合について説明する。すなわち、MFP連携サービス120から表示情報をMFP110に送信し、該表示情報に基づきMFP110で表示を行う。また、MFP110で受け付けた操作の情報をMFP連携サービス120に送信し、MFP連携サービス120で処理を行うものとする。 Next, a case will be described in which the process of the flowchart in FIG. 9 is executed by the MFP cooperation service 120. That is, the MFP cooperation service 120 transmits display information to the MFP 110, and the MFP 110 performs display based on the display information. It is also assumed that information on the operation received by the MFP 110 is transmitted to the MFP cooperation service 120 and processed by the MFP cooperation service 120.

ユーザーが、ファイル名領域601に表示されているファイル名の中から自動抽出された文字列のうち、修正したい文字列が選択すると、その操作の情報がMFP連携サービス120に送信され、S901において、MFP連携サービス120が、該選択操作を受け付ける。
S902において、MFP連携サービス120は、上記S901で選択された文字列がどの属性情報から抽出された文字列なのかのチェックを行い、属性情報を抽出する。
When the user selects a character string to be modified from among the character strings automatically extracted from the file name displayed in the file name area 601, information on the operation is sent to the MFP cooperation service 120, and in S901, The MFP cooperation service 120 accepts the selection operation.
In S902, the MFP cooperation service 120 checks from which attribute information the character string selected in S901 is extracted, and extracts the attribute information.

S903において、MFP連携サービス120は、上記S902で取得した属性情報に対して、帳票内で自動抽出された他の候補が存在するか確認をする。自動抽出された他の候補が存在しない場合(S903でNoの場合)、MFP連携サービス120は、ファイル名の修正対象箇所の選択に対する処理を終了する。
一方、自動抽出された他の候補が存在する場合(S903でYesの場合)、MFP連携サービス120は、S904に処理を進める。
In S903, the MFP cooperation service 120 checks whether there are any other automatically extracted candidates in the form based on the attribute information acquired in S902. If there are no other automatically extracted candidates (No in S903), the MFP cooperation service 120 ends the process for selecting the location to be modified in the file name.
On the other hand, if there are other automatically extracted candidates (Yes in S903), the MFP cooperation service 120 advances the process to S904.

S904において、MFP連携サービス120は、上記S903で確認した自動抽出の候補の文字列領域を強調表示するよう制御する。
S905において、MFP連携サービス120は、上記S904で強調表示した自動抽出候補の文字列に対して、文字認識処理結果の他の候補文字列が存在するか確認をする。自動抽出候補の文字列に対して文字認識処理の候補が存在しない場合(S905でNoの場合)、MFP連携サービス120は、ファイル名の修正対象箇所の選択に対する処理を終了する。
一方、自動抽出候補の文字列に対して文字認識処理の候補が存在する場合(S905でYesの場合)、MFP連携サービス120は、S906に処理を進める。
In S904, the MFP cooperation service 120 controls to highlight the automatic extraction candidate character string area confirmed in S903 above.
In S905, the MFP cooperation service 120 checks whether there are other candidate character strings as a result of character recognition processing for the automatic extraction candidate character string highlighted in S904. If there are no candidates for character recognition processing for the character string that is an automatic extraction candidate (No in S905), the MFP cooperation service 120 ends the process for selecting the correction target portion of the file name.
On the other hand, if there are candidates for character recognition processing for the character string that is an automatic extraction candidate (Yes in S905), the MFP cooperation service 120 advances the process to S906.

S906において、MFP連携サービス120は、上記S904で強調表示を行った自動抽出候補文字列の領域に、上記S905で確認した文字認識処理の候補を表示する。これらの制御の結果は、MFP連携サービス120からMFP110に送信されて、ファイル名設定画面に反映される。 In S906, the MFP cooperation service 120 displays the candidates for character recognition processing confirmed in S905 above in the area of the automatic extraction candidate character string highlighted in S904 above. The results of these controls are sent from the MFP cooperation service 120 to the MFP 110 and reflected on the file name setting screen.

S907において、MFP連携サービス120は、上記S906で候補表示したものの中からユーザにより選択された文字列をファイル名に反映する。これらの制御の結果は、MFP連携サービス120からMFP110に送信されて、ファイル名設定画面に反映される。 In S907, the MFP cooperation service 120 reflects the character string selected by the user from among the candidates displayed in S906 above in the file name. The results of these controls are sent from the MFP cooperation service 120 to the MFP 110 and reflected on the file name setting screen.

ユーザーが、ファイル名設定画面600において、必要に応じて同様の操作を行い、「送信」ボタン606を押すと、MFP110は、ファイル名設定画面600において設定したファイル名をMFP連携サービス120に送信する(図5のS516に対応)。 When the user performs similar operations as necessary on the file name setting screen 600 and presses the "send" button 606, the MFP 110 sends the file name set on the file name setting screen 600 to the MFP cooperation service 120. (Corresponding to S516 in FIG. 5).

以上のように、あらかじめ設定されたファイル名の命名ルールに基づいて自動抽出された文字列を修正したい場合に、自動抽出の文字列の候補の強調表示と文字認識処理結果の候補表示を行うことで、適切な文字列を簡単に選択して修正することが可能となる。 As described above, when you want to modify a character string that has been automatically extracted based on a preset file name naming rule, you can highlight the automatically extracted character string candidates and display the character recognition processing result candidates. This allows you to easily select and modify appropriate strings.

〔第2実施形態〕
第1実施形態では、命名ルールに基づいて自動抽出された文字列の候補の強調表示と文字認識処理の候補の表示を行い、その候補の中から文字認識結果が正しいものを選択して、自動抽出された文字列を修正する構成について説明した。第2実施形態では、文字認識処理の候補の中に正しいものがなかった場合に文字列を少ない手順で修正するための構成について、図11、図12を用いて説明する。なお、第1実施形態と同様の処理については説明を省略する。
[Second embodiment]
In the first embodiment, character string candidates that are automatically extracted based on naming rules are highlighted, candidates for character recognition processing are displayed, and those with correct character recognition results are selected from among the candidates and automatically extracted. The configuration for modifying extracted character strings was explained. In the second embodiment, a configuration for correcting a character string with fewer steps when there is no correct candidate among the candidates for character recognition processing will be described with reference to FIGS. 11 and 12. Note that descriptions of processes similar to those in the first embodiment will be omitted.

図11は、第2実施形態におけるファイル名修正処理の詳細を示すフローチャートである。図9に示したフローチャートと同様に、MFP110(又はクライアントPC111)で実行される構成でも、MFP連携サービス120で実行される構成でもよい。
ここでは、MFP110が図11の処理を実行するものとして説明する。
図12は、第2実施形態におけるファイル名修正処理の画面の一例を示す図である。
FIG. 11 is a flowchart showing details of file name modification processing in the second embodiment. Similar to the flowchart shown in FIG. 9, the configuration may be executed by the MFP 110 (or client PC 111) or the MFP cooperation service 120.
Here, the description will be made assuming that the MFP 110 executes the process shown in FIG.
FIG. 12 is a diagram showing an example of a screen for file name modification processing in the second embodiment.

図11のS1101~S1105までは第1実施形態と同様の処理で、MFP110は、図12のファイル名の修正対象の文字列「132343500」が選択された場合に、自動抽出候補の見積番号1004「E20019-91」を強調表示する。あわせて、MFP110は、ファイル名に使用されている他の文字列箇所の強調表示をオフにする。なお、ここでは、「E20019-91」の文字認識処理の候補として、「E20079-01」、「E20019-01」、「E20079-07」が存在するとする。 Processes from S1101 to S1105 in FIG. 11 are similar to those in the first embodiment, and when the character string "132343500" to be corrected in the file name in FIG. Highlight "E20019-91". At the same time, the MFP 110 turns off highlighting of other character strings used in the file name. Note that here, it is assumed that "E20079-01", "E20019-01", and "E20079-07" exist as candidates for character recognition processing of "E20019-91".

S1106において、MFP110は、S1104で強調表示を行った自動抽出候補文字列の領域に、S1105で確認した文字認識処理の候補の表示と、この文字認識候補をさらに直接編集するためのボタンの表示を行う。例えば、図12のように、自動抽出候補の見積番号1204に対して、文字認識処理の候補文字列1205と、直接編集ボタン1206を表示して、文字認識候補をさらに直接編集可能に制御する。 In S1106, the MFP 110 displays the character recognition processing candidates confirmed in S1105 and a button for further directly editing the character recognition candidates in the region of the automatic extraction candidate character string highlighted in S1104. conduct. For example, as shown in FIG. 12, a candidate character string 1205 for character recognition processing and a direct edit button 1206 are displayed for an estimate number 1204 of an automatic extraction candidate, thereby controlling the character recognition candidate to be further directly editable.

図12では、一例として、文字認識処理の候補として「E20079-01」、「E20019-07」、「E20079-07」をリスト表示し、その各候補の右側に直接編集ボタン1206それぞれを表示している。この例では、文字認識処理の結果の文字列がどれも正しくないため、選択した後に編集が必要となるが、直接編集ボタンを使用することで、編集までのステップを削減することが可能となる。ユーザーは、直接編集ボタンを選択して、該ボタンの左側の文字認識処理の候補文字列に対して編集を行うことが可能となる。これにより、それぞれの文字認識処理の候補に対する修正をそれぞれのボタン選択から直接行うことが可能となる。また、ファイル名で選択した修正文字列の文字認識処理の候補の表示を行った場合も同様に直接編集ボタンの表示を行う。 In FIG. 12, as an example, "E20079-01", "E20019-07", and "E20079-07" are displayed in a list as candidates for character recognition processing, and a direct edit button 1206 is displayed on the right side of each candidate. There is. In this example, none of the character strings resulting from the character recognition process is correct, so editing is required after selection, but by using the direct edit button, it is possible to reduce the steps required to edit. . The user can select the direct edit button and edit the candidate character string for character recognition processing to the left of the button. This makes it possible to directly modify each candidate for character recognition processing by selecting each button. Also, when displaying candidates for character recognition processing of a modified character string selected by file name, a direct edit button is similarly displayed.

S1107~S1108の文字認識処理の候補を選択した場合の処理については、第1実施形態と同様である。
S1109において、文字認識候補をさらに直接編集は、直接編集ボタンを選択したか確認する。直接編集ボタンが押下されなかった場合(S1109でNoの場合)、MFP110は、ファイル名の修正対象箇所の選択に応じた処理を終了する。
一方、直接編集ボタンが押下された場合(S1109でYesの場合)、MFP110は、該選択した直接編集ボタンに対応する文字認識処理の候補を編集する候補編集画面(不図示)を表示し、編集可能に制御する。候補編集画面に表示されたソフトウェアキーボードから編集が行われて確定の操作が行われると、MFP110は、S1110に処理を進める。
The processing when a candidate for character recognition processing is selected in S1107 to S1108 is the same as in the first embodiment.
In S1109, if you want to further directly edit character recognition candidates, it is confirmed whether the direct edit button is selected. If the direct edit button is not pressed (No in S1109), the MFP 110 ends the process according to the selection of the file name modification target location.
On the other hand, if the direct edit button is pressed (Yes in S1109), the MFP 110 displays a candidate edit screen (not shown) for editing candidates for character recognition processing corresponding to the selected direct edit button, and edits the candidates. control possible. When editing is performed using the software keyboard displayed on the candidate editing screen and a confirmation operation is performed, the MFP 110 advances the process to S1110.

S1110において、MFP110は、候補編集画面での編集結果をファイル名に反映する。
図12の例では、ユーザーが、文字認識処理の候補1205の「E20079-01」の編集ボタン1206を選択して直接編集して「E20019-01」とした場合、該編集結果が反映され、ファイル名「見積書_132343500」が「見積書_E20019-01」に変更される。
In S1110, the MFP 110 reflects the editing results on the candidate editing screen in the file name.
In the example of FIG. 12, if the user selects the edit button 1206 for "E20079-01" in the character recognition processing candidates 1205 and directly edits it to "E20019-01", the editing result is reflected and the file is The name "Estimate_132343500" is changed to "Estimate_E20019-01".

これにより、文字認識処理結果の候補が適切でない場合でも直接編集ボタンから編集を行うことで、少ない手順で適切な文字列を簡単に設定することが可能となる。
なお、図11に示したフローチャートの処理を、MFP連携サービス120で実行する場合については説明を省略する。
また、上記各実施形態では、図6の画面で、文書画像のファイル名を設定する構成について説明したが、ファイルの設定に限定されるものではなく、ファイルのプロパティを設定する構成でもよい。
As a result, even if the candidates resulting from character recognition processing are not appropriate, by directly editing them using the edit button, it is possible to easily set an appropriate character string with fewer steps.
Note that a description of the case where the process of the flowchart shown in FIG. 11 is executed by the MFP cooperation service 120 will be omitted.
Further, in each of the above embodiments, a configuration has been described in which a file name of a document image is set on the screen of FIG. 6, but the configuration is not limited to setting a file, and a configuration in which file properties are set may be used.

上記各実施形態では、文書画像に含まれる文字領域を文字認識し、その結果から属性ごとに文字列を抽出・選択し、ファイル名命名ルールに基づき生成された文書画像を保存するファイル名を、文書画像のプレビュー表示とともに表示する。そして、このファイル名の表示からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性で抽出された他の文字列が存在する前記文書画像内の領域を前記プレビュー画像において強調表示する。さらに、強調表示した領域を文字認識した際の候補をリスト表示し、該リスト表示から選択された候補を、ファイル名の表示から選択された文字列に置き換えて、ファイル名の表示に反映させる。これにより、スキャンした帳票から自動生成されたファイル名を修正する場合に、帳票のプレビュー画像を表示し、修正箇所の属性に対応する候補文字列の強調表示とその文字列の文字認識処理の候補文字列表示を行う。このように、属性情報の自動抽出文字列候補だけでなく、文字認識処理結果の文字列の候補も表示することで、プレビュー画像から容易にファイル名を修正する際に使用する文字領域の確認・選択を行うことが可能となる。 In each of the embodiments described above, character regions included in a document image are recognized, character strings are extracted and selected for each attribute from the result, and a file name for saving the generated document image is set based on the file name naming rule. Displayed along with a preview of the document image. Then, in response to any character string being selected from this file name display, an area in the document image where another character string extracted with an attribute corresponding to the selected character string exists is detected. Highlighted in the preview image. Furthermore, candidates obtained by character recognition in the highlighted area are displayed in a list, and the candidates selected from the list are replaced with the character strings selected from the file name display and reflected in the file name display. As a result, when modifying a file name automatically generated from a scanned form, a preview image of the form is displayed, candidate character strings corresponding to the attributes of the modified part are highlighted, and candidates for character recognition processing for that character string are displayed. Displays strings. In this way, by displaying not only automatically extracted character string candidates for attribute information but also character string candidates resulting from character recognition processing, you can easily check and confirm character areas used when modifying file names from preview images. It becomes possible to make a selection.

なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。
以上、一実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記憶媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
また、上記各実施形態を組み合わせた構成も全て本発明に含まれるものである。
It goes without saying that the configurations and contents of the various data described above are not limited to these, and may be configured in various configurations and contents depending on the use and purpose.
Although one embodiment has been described above, the present invention can be implemented as, for example, a system, an apparatus, a method, a program, a storage medium, or the like. Specifically, the present invention may be applied to a system consisting of a plurality of devices, or may be applied to a device consisting of a single device.
Moreover, all configurations that combine the above embodiments are also included in the present invention.

(その他の実施形態)
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。
本発明は上記実施形態に限定されるものではなく、本発明の趣旨に基づき種々の変形(各実施形態の有機的な組合せを含む)が可能であり、それらを本発明の範囲から除外するものではない。即ち、上述した各実施形態及びその変形例を組み合わせた構成も全て本発明に含まれるものである。
(Other embodiments)
The present invention provides a system or device with a program that implements one or more of the functions of the embodiments described above via a network or a storage medium, and one or more processors in the computer of the system or device reads and executes the program. This can also be achieved by processing. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.
Furthermore, the present invention may be applied to a system made up of a plurality of devices, or to a device made up of one device.
The present invention is not limited to the above embodiments, and various modifications (including organic combinations of each embodiment) are possible based on the spirit of the present invention, and these are excluded from the scope of the present invention. isn't it. That is, all configurations in which the above-described embodiments and their modifications are combined are also included in the present invention.

110 MFP
111 クライアントPC
120 MFP連携サービス
421 表示制御部
431 リクエスト制御部
432 画像処理部
434 データ管理部
435 表示制御部
110 MFP
111 Client PC
120 MFP cooperation service 421 Display control unit 431 Request control unit 432 Image processing unit 434 Data management unit 435 Display control unit

Claims (6)

文書画像に含まれる文字領域を文字認識し、当該文字認識結果の文字列のうち、所定のルールで指定された属性に対応する文字列を組み合わせることにより生成された前記文書画像のファイルに関する情報を、前記文書画像のプレビュー表示とともに表示する第1表示手段と、
前記表示されたファイルに関する情報の中からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性と同じ属性の他の文字列に対応する前記文書画像内の領域を、前記プレビュー表示において強調表示する第2表示手段と、
前記強調表示した領域に対する文字認識結果の複数の候補文字列をリスト表示する第3表示手段と、
前記表示されたファイルに関する情報において選択された前記文字列を、前記リスト表示された複数の候補文字列の中からユーザーにより選択された候補文字列で置き換えて表示する第4表示手段と、
を有することを特徴とする情報処理装置。
Information about the file of the document image is generated by character-recognizing a character area included in the document image, and combining character strings corresponding to attributes specified by a predetermined rule among the character strings resulting from the character recognition. , a first display means for displaying the document image along with a preview display;
In response to any character string being selected from the displayed information regarding the file, the character string in the document image corresponding to another character string having the same attribute as the attribute corresponding to the selected character string is selected. a second display means for highlighting a region in the preview display;
a third display means for displaying a list of a plurality of candidate character strings as character recognition results for the highlighted area;
a fourth display means for replacing and displaying the character string selected in the displayed information regarding the file with a candidate character string selected by the user from among the plurality of candidate character strings displayed in the list;
An information processing device comprising:
前記リスト表示された複数の候補文字列を編集するための編集手段を有し、
前記第4表示手段は、前記表示されたファイルに関する情報において選択された文字列を、前記編集手段により編集された候補文字列で置き換えて表示することを特徴とする請求項1に記載の情報処理装置。
comprising editing means for editing the plurality of candidate character strings displayed in the list;
The information processing according to claim 1, wherein the fourth display means replaces and displays the character string selected in the displayed information regarding the file with a candidate character string edited by the editing means. Device.
前記表示されているファイルに関する情報に基づき、前記文書画像を保存するように制御する制御手段を有することを特徴とする請求項1に記載の情報処理装置。 2. The information processing apparatus according to claim 1, further comprising control means for controlling the document image to be saved based on information regarding the displayed file. ファイルに関する情報は、ファイル名であることを特徴とする請求項1~3のいずれか1項に記載の情報処理装置。 4. The information processing apparatus according to claim 1, wherein the information regarding the file is a file name. 情報処理装置の制御方法であって、
文書画像に含まれる文字領域を文字認識し、当該文字認識結果の文字列のうち、所定のルールで指定された属性に対応する文字列を組み合わせることにより生成された前記文書画像のファイルに関する情報を、前記文書画像のプレビュー表示とともに表示する第1表示工程と、
前記表示されたファイルに関する情報の中からいずれかの文字列が選択されたことに応じて、該選択された文字列に対応する属性と同じ属性の他の文字列に対応する前記文書画像内の領域を、前記プレビュー表示において強調表示する第2表示工程と、
前記強調表示した領域に対する文字認識結果の複数の候補文字列をリスト表示する第3表示工程と、
前記表示されたファイルに関する情報において選択された前記文字列を、前記リスト表示された複数の候補文字列の中からユーザーにより選択された候補文字列で置き換えて表示する第4表示工程と、
を有することを特徴とする情報処理装置の制御方法。
A method for controlling an information processing device, the method comprising:
Information about the file of the document image is generated by character-recognizing a character area included in the document image, and combining character strings corresponding to attributes specified by a predetermined rule among the character strings resulting from the character recognition. , a first display step of displaying the document image together with a preview display;
In response to any character string being selected from the displayed information regarding the file, the character string in the document image corresponding to another character string having the same attribute as the attribute corresponding to the selected character string is selected. a second display step of highlighting the region in the preview display;
a third display step of displaying a list of a plurality of candidate character strings as character recognition results for the highlighted area;
a fourth display step of replacing and displaying the character string selected in the displayed information regarding the file with a candidate character string selected by the user from among the plurality of candidate character strings displayed in the list;
A method for controlling an information processing device, comprising:
コンピュータに、請求項5に記載の制御方法を実行させるためのプログラム。 A program for causing a computer to execute the control method according to claim 5.
JP2022145066A 2022-09-13 2022-09-13 Information processing device, method for controlling information processing device, and program Pending JP2024040612A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022145066A JP2024040612A (en) 2022-09-13 2022-09-13 Information processing device, method for controlling information processing device, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022145066A JP2024040612A (en) 2022-09-13 2022-09-13 Information processing device, method for controlling information processing device, and program

Publications (1)

Publication Number Publication Date
JP2024040612A true JP2024040612A (en) 2024-03-26

Family

ID=90369156

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022145066A Pending JP2024040612A (en) 2022-09-13 2022-09-13 Information processing device, method for controlling information processing device, and program

Country Status (1)

Country Link
JP (1) JP2024040612A (en)

Similar Documents

Publication Publication Date Title
JP6953230B2 (en) A device for setting a file name, etc. on a scanned image, its control method, and a program.
JP6968647B2 (en) A device for setting a file name for a scanned image, its control method, and a program.
JP7391672B2 (en) Image processing system, control method and program for digitizing documents
JP2019128715A (en) Device, method and program for setting information associated with scanned image
JP2019041150A (en) Device for setting file name or the like to scan image, control method therefor and program
JP7317561B2 (en) Image processing device for character input using touch panel, its control method and program
JP7467737B2 (en) Image processing device that displays guidance for user operations, and control method and program thereof
JP7271149B2 (en) Apparatus, method and program
JP2021163178A (en) Information processing apparatus
JP7225017B2 (en) Image processing device for character input using touch panel, its control method and program
JP7330742B2 (en) IMAGE PROCESSING APPARATUS, CONTROL METHOD AND PROGRAM FOR SETTING PROPERTIES ON SCANNED IMAGES
US11991331B2 (en) Server, method of controlling the server, and storage medium
JP2023072812A (en) Information processing apparatus, method for controlling information processing apparatus, program therefor, and image processing system
JP7476557B2 (en) DEVICE, PROCESSING EXECUTION SYSTEM, PROCESSING EXECUTION METHOD, AND PROGRAM
JP2019068323A (en) Device for setting file name for scanned image, control method thereof, and program
JP2024040612A (en) Information processing device, method for controlling information processing device, and program
JP2021164132A (en) Image processing system and program
JP2023053602A (en) Apparatus, information processing method, and program
JP7358663B2 (en) Image processing device for character input using a touch panel, its control method, and program
JP7387282B2 (en) Image processing device that displays a preview of a scanned image, its control method, and program
JP2024032563A (en) Information processing apparatus, control method of information processing apparatus, and program
JP7150967B2 (en) Apparatus, method, and program for setting information related to scanned images
JP2023120267A (en) Image processing device for inputting text using touch panel, control method for the same, and program
JP2022069405A (en) Information processing device, information processing system and method and program for controlling information processing device
JP2024086787A (en) Image processing device that displays guidance for user operations, and control method and program thereof