JP7077127B2 - Devices, methods, and programs for setting information related to scanned image data. - Google Patents

Devices, methods, and programs for setting information related to scanned image data. Download PDF

Info

Publication number
JP7077127B2
JP7077127B2 JP2018090707A JP2018090707A JP7077127B2 JP 7077127 B2 JP7077127 B2 JP 7077127B2 JP 2018090707 A JP2018090707 A JP 2018090707A JP 2018090707 A JP2018090707 A JP 2018090707A JP 7077127 B2 JP7077127 B2 JP 7077127B2
Authority
JP
Japan
Prior art keywords
area
character area
image data
character
scanned image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018090707A
Other languages
Japanese (ja)
Other versions
JP2019197989A (en
Inventor
広次 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2018090707A priority Critical patent/JP7077127B2/en
Publication of JP2019197989A publication Critical patent/JP2019197989A/en
Application granted granted Critical
Publication of JP7077127B2 publication Critical patent/JP7077127B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Facsimiles In General (AREA)

Description

本発明は、スキャン画像データ内の文字領域の表示を制御するための装置、方法、及びプログラムに関する。 The present invention relates to an apparatus, method, and program for controlling the display of a character area in scanned image data.

従来、紙文書(原稿ともいう)をスキャンして得られた画像データ(以下、スキャン画像データともいう)に対して文字認識処理(OCR処理)を行い、認識された文字を用いて、そのスキャン画像データのファイル名を設定する技術が知られている。 Conventionally, character recognition processing (OCR processing) is performed on image data (hereinafter, also referred to as scanned image data) obtained by scanning a paper document (also referred to as a manuscript), and the recognized characters are used for scanning. A technique for setting a file name of image data is known.

特許文献1には、スキャン画像データを表示し、表示されたスキャン画像データ上でユーザによって指定されたOCR対象領域の位置座標を受け取り、当該位置座標に基づいてOCR処理を行った結果をファイル名に用いる方法が開示されている。 In Patent Document 1, scan image data is displayed, the position coordinates of the OCR target area specified by the user on the displayed scan image data are received, and the result of performing OCR processing based on the position coordinates is a file name. The method used for is disclosed.

特許文献2には、スキャン画像データをレイアウト解析して文字領域であると判定された領域を示す矩形をスキャン画像データに重ねて表示し、ユーザによって指定された文字領域に対してOCR処理を行った結果をファイル名に用いる方法が開示されている。 In Patent Document 2, a rectangle showing an area determined to be a character area by layout analysis of scanned image data is displayed superimposed on the scanned image data, and OCR processing is performed on the character area designated by the user. A method of using the resulting result as a file name is disclosed.

特開2015-215878号公報Japanese Unexamined Patent Publication No. 2015-215878 特開2016-024488号公報Japanese Unexamined Patent Publication No. 2016-024488

特許文献1の方法では、精度よく文字認識結果を得ようとすると、ユーザがOCR対象領域の左上と右下の座標位置を正確に指定する必要がある。しかしながら、スキャン画像データを表示する画面のサイズが小さい場合や、スキャン画像データ内の文字サイズが小さく、複数の文字が密集している場合などは、ユーザが正確にOCR対象領域の位置を指定することは困難である。 In the method of Patent Document 1, the user needs to accurately specify the upper left and lower right coordinate positions of the OCR target area in order to obtain the character recognition result with high accuracy. However, when the size of the screen for displaying the scanned image data is small, or when the character size in the scanned image data is small and a plurality of characters are densely packed, the user accurately specifies the position of the OCR target area. That is difficult.

特許文献2の方法では、スキャン画像データ内の文字サイズが小さい場合、レイアウト解析結果として得られる文字領域の高さも小さくなる。操作画面におけるタッチ操作によって、そのような高さが小さい文字領域を選択する場合、タッチ位置が文字領域の範囲外となりやすく、ユーザが意図した通りの文字領域の選択が行われにくくなってしまう。 In the method of Patent Document 2, when the character size in the scanned image data is small, the height of the character area obtained as the layout analysis result is also small. When a character area having such a small height is selected by a touch operation on the operation screen, the touch position tends to be outside the range of the character area, and it becomes difficult to select the character area as intended by the user.

本発明は、このような問題に鑑みてなされたものであり、その目的とするところは、スキャン画像データを表示するプレビュー画面において、ユーザによる文字領域の選択を行いやすくすることにある。 The present invention has been made in view of such a problem, and an object of the present invention is to facilitate a user to select a character area on a preview screen for displaying scanned image data.

本発明の一実施形態において、文書をスキャンして得られたスキャン画像データに関連する情報を設定するための装置は、前記スキャン画像データに含まれる複数の文字領域を判定する領域判定手段と、前記判定された複数の文字領域の中から所望の文字領域をユーザが選択するために、前記スキャン画像データをプレビュー画面に表示する表示手段とを備え、前記ユーザが選択する際に用いる文字領域は、前記領域判定手段で判定された文字領域を拡大したものである。 In one embodiment of the present invention, the device for setting information related to the scanned image data obtained by scanning a document includes an area determining means for determining a plurality of character areas included in the scanned image data and an area determining means. A display means for displaying the scanned image data on the preview screen for the user to select a desired character area from the determined plurality of character areas is provided, and the character area used when the user selects the character area is provided. , The character area determined by the area determination means is enlarged.

本発明によると、スキャン画像データを表示するプレビュー画面において、ユーザによる文字領域の選択が行いやすくなる。 According to the present invention, it becomes easy for the user to select a character area on the preview screen for displaying the scanned image data.

システム全体図である。It is an overall system view. MFPのソフトウェア構成図である。It is a software block diagram of the MFP. スキャン画像データを生成してアップロードする処理を示すフローチャートである。It is a flowchart which shows the process of generating and uploading scan image data. MFPのスキャン設定画面を示す図である。It is a figure which shows the scan setting screen of the MFP. 画像解析処理を示すフローチャートである。It is a flowchart which shows the image analysis process. プレビュー画面表示処理を示すフローチャートである。It is a flowchart which shows the preview screen display process. MFPのプレビュー画面を示す図である。It is a figure which shows the preview screen of the MFP. MFPのプレビュー画面を示す図である。It is a figure which shows the preview screen of the MFP. ファイル名生成処理を示すフローチャートである。It is a flowchart which shows the file name generation process. MFPのアップロード設定画面を示す図である。It is a figure which shows the upload setting screen of the MFP. MFPのプレビュー画面を示す図である。It is a figure which shows the preview screen of the MFP. MFPのプレビュー画面を示す図である。It is a figure which shows the preview screen of the MFP. スキャン対象の帳票を示す図である。It is a figure which shows the form to be scanned. スキャン対象の帳票を示す図である。It is a figure which shows the form to be scanned.

以下、図面を参照して本発明の実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものでない。また、以下の実施形態で説明されている特徴の組み合わせの全てが、本発明に必須のものとは限らない。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. The following embodiments do not limit the invention according to the claims. In addition, not all combinations of features described in the following embodiments are essential to the present invention.

<第1の実施形態>
図1は、本実施形態に係る画像処理システムの全体構成を示すブロック図である。画像処理システムは、MFP(Multifunction Peripheral)101と、ファイルサーバ102とを有する。MFP101とファイルサーバ102は、ネットワーク(例えば、LAN:Local Area Network)100を介して互いに通信可能に接続されている。本実施形態では、MFP101とファイルサーバ102とで画像処理システムを構成しているが、ファイルサーバ102の機能をMFP101が併有する構成であってもよい。
<First Embodiment>
FIG. 1 is a block diagram showing an overall configuration of an image processing system according to the present embodiment. The image processing system includes an MFP (Multifunction Peripheral) 101 and a file server 102. The MFP 101 and the file server 102 are communicably connected to each other via a network (for example, LAN: Local Area Network) 100. In the present embodiment, the image processing system is configured by the MFP 101 and the file server 102, but the MFP 101 may also have the functions of the file server 102.

MFP101は、スキャン機能、FAX機能、及びコピー機能などの複数の機能を有する複合機であり、画像処理装置の一例である。MFP101は、制御部210、操作部220、プリンタ221、スキャナ222、及びモデム223を有する。 The MFP 101 is a multifunction device having a plurality of functions such as a scan function, a fax function, and a copy function, and is an example of an image processing device. The MFP 101 includes a control unit 210, an operation unit 220, a printer 221, a scanner 222, and a modem 223.

制御部210は、MFP101全体の動作を制御する。CPU211は、ROM212に記憶された制御プログラムを読み出して、読取、印刷、通信などの各種制御を行う。RAM213は、CPU211の主メモリ、ワークエリア等の一時記憶領域として用いられる。なお、MFP101は、1つのCPU211が1つのメモリ(RAM213またはHDD214)を用いて後述するフローチャートに示す各処理を実行するものとするが、複数のCPUや複数のRAMまたはHDDを協働させて実行するようにしてもよい。 The control unit 210 controls the operation of the entire MFP 101. The CPU 211 reads the control program stored in the ROM 212 and performs various controls such as reading, printing, and communication. The RAM 213 is used as a temporary storage area for the main memory, work area, etc. of the CPU 211. In the MFP 101, one CPU 211 uses one memory (RAM 213 or HDD 214) to execute each process shown in the flowchart described later, but a plurality of CPUs and a plurality of RAMs or HDDs are executed in cooperation with each other. You may try to do it.

HDD214は、画像データや各種プログラムを記憶する。操作部I/F215は、操作部220と制御部210を接続するインタフェースである。操作部220は、タッチパネル機能を有する液晶表示部やボタンボードなどを備えており、ユーザによる操作、入力、指示を受け付ける受付手段としての役割を担う。 HDD 214 stores image data and various programs. The operation unit I / F 215 is an interface for connecting the operation unit 220 and the control unit 210. The operation unit 220 includes a liquid crystal display unit having a touch panel function, a button board, and the like, and plays a role as a reception means for receiving operations, inputs, and instructions by the user.

プリンタI/F216は、プリンタ221と制御部210を接続するインタフェースである。プリンタ221で印刷される画像データは、プリンタI/F216を介して制御部210からプリンタ221へ転送され、プリンタ221により記録媒体上に印刷される。 The printer I / F 216 is an interface for connecting the printer 221 and the control unit 210. The image data printed by the printer 221 is transferred from the control unit 210 to the printer 221 via the printer I / F 216, and is printed on the recording medium by the printer 221.

スキャナI/F217は、スキャナ222と制御部210を接続する。スキャナ222は、原稿(文書)を読み取って画像データ(すなわち、スキャン画像データ)を生成し、スキャナI/F217を介して制御部210に入力する。MFP101は、スキャナ222で生成された画像データを、プリンタ221で印刷する他に、ファイル送信またはメール送信することができる。 The scanner I / F217 connects the scanner 222 and the control unit 210. The scanner 222 reads a document (document), generates image data (that is, scanned image data), and inputs the image data to the control unit 210 via the scanner I / F 217. The MFP 101 can print the image data generated by the scanner 222 by the printer 221 as well as send a file or send an e-mail.

モデムI/F218は、モデム223と制御部210を接続するインタフェースである。モデム223は、PSTN(Public Switched Telephone Networks)110を介して、不図示のファクシミリ装置との間における画像データのファクシミリ通信を実行する。ネットワークI/F219は、制御部210(すなわち、MFP101)をネットワーク100に接続するインタフェースである。MFP101は、ネットワークI/F219を用いてネットワーク100上の外部装置(ファイルサーバ102など)に画像データや情報を送信したり、各種情報を受信したりする。 The modem I / F 218 is an interface for connecting the modem 223 and the control unit 210. The modem 223 performs facsimile communication of image data with a facsimile machine (not shown) via a PSTN (Public Switched Telephone Network) 110. The network I / F 219 is an interface for connecting the control unit 210 (that is, the MFP 101) to the network 100. The MFP 101 uses the network I / F 219 to transmit image data and information to an external device (file server 102, etc.) on the network 100, and to receive various information.

ファイルサーバ102は、電子化された文書ファイルの保存や管理を行う外部サーバの一例である。ファイルサーバ102は、制御部310を有する。制御部310は、ファイルサーバ102全体の動作を制御する。CPU311は、ROM312に記憶された制御プログラムを読み出して各種制御処理を実行する。RAM313は、CPU311の主メモリ、ワークエリア等の一時記憶領域として用いられる。HDD314は、画像データや各種プログラムを記憶する。 The file server 102 is an example of an external server that stores and manages an electronic document file. The file server 102 has a control unit 310. The control unit 310 controls the operation of the entire file server 102. The CPU 311 reads out the control program stored in the ROM 312 and executes various control processes. The RAM 313 is used as a temporary storage area for the main memory, work area, etc. of the CPU 311. The HDD 314 stores image data and various programs.

ネットワークI/F315は、制御部310(すなわち、ファイルサーバ102)をネットワーク100に接続するインタフェースである。ファイルサーバ102は、ネットワークI/F315を介してネットワーク100上の他の装置との間で各種情報を送受信する。 The network I / F315 is an interface for connecting the control unit 310 (that is, the file server 102) to the network 100. The file server 102 transmits and receives various information to and from other devices on the network 100 via the network I / F 315.

図2は、本実施形態に係るMFP101のソフトウェア構成図である。MFP101のソフトウェアは、ネイティブ機能部410と追加アプリケーション420の大きく2つに分けられる。ネイティブ機能部410に含まれる各部は、MFP101に標準的に備えられたものである。一方、追加アプリケーション420は、MFP101に追加インストールされたアプリケーションである。追加アプリケーション420は、Java(登録商標)をベースとしたアプリケーションであり、MFP101への機能追加を容易に実現できる。なお、MFP101には図示しない他の追加アプリケーションがインストールされていても良い。 FIG. 2 is a software configuration diagram of the MFP 101 according to the present embodiment. The software of the MFP 101 can be roughly divided into two, a native function unit 410 and an additional application 420. Each part included in the native function part 410 is provided as standard in the MFP 101. On the other hand, the additional application 420 is an application additionally installed on the MFP 101. The additional application 420 is an application based on Java (registered trademark), and can easily realize the addition of functions to the MFP 101. Other additional applications (not shown) may be installed in the MFP 101.

アプリケーション表示部423は、MFP101の操作部220のタッチパネル機能を有する液晶表示部に、ユーザによる操作、入力、指示を受け付けるためのUI(User Interface)画面を表示する。表示するUI画面の詳細については後述する。 The application display unit 423 displays a UI (User Interface) screen for receiving operations, inputs, and instructions by the user on the liquid crystal display unit having the touch panel function of the operation unit 220 of the MFP 101. The details of the UI screen to be displayed will be described later.

スキャン指示部421は、アプリケーション表示部423を介して入力されたユーザからの情報を受けて、入力情報に含まれるスキャン設定や転送設定と共に、スキャン部411にスキャン処理を要求する。また、後述するアプリケーション転送部424が、画像データの転送先であるファイルサーバ102のフォルダパスの情報を一時的に保存する。 The scan instruction unit 421 receives information from the user input via the application display unit 423, and requests the scan unit 411 to perform a scan process together with the scan settings and transfer settings included in the input information. Further, the application transfer unit 424, which will be described later, temporarily stores the information of the folder path of the file server 102, which is the transfer destination of the image data.

スキャン部411は、スキャン指示部421からのスキャン設定を含んだスキャン要求を受けて、スキャン処理を実行する。スキャン部411は、スキャナI/F217を介してスキャナ222によって、原稿(文書)を読み取って画像データを生成し、画像データと転送設定を転送部412に渡す。 The scan unit 411 receives a scan request including scan settings from the scan instruction unit 421 and executes a scan process. The scanning unit 411 reads the original (document) by the scanner 222 via the scanner I / F 217 to generate image data, and passes the image data and the transfer setting to the transfer unit 412.

転送部412は、スキャン部411から受け取った画像データを、同じくスキャン部411から受け取った転送設定に従って転送する。画像データの転送先としては、ファイルサーバ102、ネットワーク100上のPC(不図示)等を設定可能である。なお、本実施形態では、スキャン部411が生成した画像データを一旦全て追加アプリケーション420に転送するように設定されているものとする。また、転送部412は、FTP(File Transfer Protocol)クライアント機能を有しており、FTPサーバ機能を有するアプリケーション受信部422に対してFTPで画像データを転送することができる。 The transfer unit 412 transfers the image data received from the scan unit 411 according to the transfer settings also received from the scan unit 411. As the image data transfer destination, a file server 102, a PC on the network 100 (not shown), or the like can be set. In this embodiment, it is assumed that all the image data generated by the scanning unit 411 is once set to be transferred to the additional application 420. Further, the transfer unit 412 has an FTP (File Transfer Protocol) client function, and can transfer image data by FTP to an application receiving unit 422 having an FTP server function.

アプリケーション受信部422は、転送部412から内部転送された画像データを受信し、アプリケーション転送部424に渡す。 The application receiving unit 422 receives the image data internally transferred from the transfer unit 412 and passes it to the application transfer unit 424.

アプリケーション転送部424は、受信した画像データを画像解析部425に渡す。 The application transfer unit 424 passes the received image data to the image analysis unit 425.

画像解析部425は、画像データを解析し、画像データ内の文字領域の判定、および文字列認識を行い、解析した情報をアプリケーション転送部424に渡す。 The image analysis unit 425 analyzes the image data, determines the character area in the image data, recognizes the character string, and passes the analyzed information to the application transfer unit 424.

また、アプリケーション転送部424は、画像データ、解析した文字領域情報、及び、ユーザが選択した文字領域の選択領域情報を、アプリケーション表示部423に渡す。 Further, the application transfer unit 424 passes the image data, the analyzed character area information, and the selection area information of the character area selected by the user to the application display unit 423.

アプリケーション表示部423は、アプリケーション転送部424から受信した画像データ、解析した文字領域情報、及び、選択領域情報を、プレビュー表示部426に渡す。 The application display unit 423 passes the image data received from the application transfer unit 424, the analyzed character area information, and the selected area information to the preview display unit 426.

プレビュー表示部426は、操作部220のタッチパネル機能を有する液晶表示部に、ユーザによる操作、入力、指示を受け付けるためのファイル名設定に関するUI画面を表示する。表示するUI画面の詳細については後述する。 The preview display unit 426 displays a UI screen related to file name setting for receiving operations, inputs, and instructions by the user on the liquid crystal display unit having the touch panel function of the operation unit 220. The details of the UI screen to be displayed will be described later.

アップロード指示部427は、操作部220のタッチパネル機能を有する液晶表示部にユーザによる操作、入力、指示を受け付けるためのフォルダパス設定に関するUI画面を表示する。表示するUI画面の詳細については後述する。また、アップロード指示部427は、UI画面に入力されたフォルダパスを受け取り、アプリケーション転送部424に渡す。 The upload instruction unit 427 displays a UI screen related to folder path setting for receiving operations, inputs, and instructions by the user on the liquid crystal display unit having the touch panel function of the operation unit 220. The details of the UI screen to be displayed will be described later. Further, the upload instruction unit 427 receives the folder path input on the UI screen and passes it to the application transfer unit 424.

また、アプリケーション転送部424は、アップロード指示部427が受け取ったフォルダパスに、プレビュー表示部426から受け取った文字列をフォルダやファイル名として追加する。そして、アプリケーション転送部424は、ファイルサーバ102に画像データを転送(送信)する。 Further, the application transfer unit 424 adds the character string received from the preview display unit 426 as a folder or file name to the folder path received by the upload instruction unit 427. Then, the application transfer unit 424 transfers (transmits) the image data to the file server 102.

アプリケーション転送部424は、転送が終了すると、アプリケーション表示部423に転送が終了したことを通知する。アプリケーション表示部423は、アプリケーション転送部424からの通知を受けて、表示内容を更新する。 When the transfer is completed, the application transfer unit 424 notifies the application display unit 423 that the transfer is completed. The application display unit 423 updates the display content in response to the notification from the application transfer unit 424.

また、アプリケーション転送部424は、SMB(Server Message Block)クライアント機能を有してもよい。これにより、アプリケーション転送部424は、SMBサーバ機能を有するファイルサーバ102に対してSMBを用いてファイル及びフォルダ操作を行うことができる。なお、SMBの他に、WebDAV(Distributed Authoring and Versioning protocol for the WWW)や、FTP(File Transfer Protocol)等を使用してもよい。また、SMTP(Simple Mail Transfer Protocol)等を使用してもよい。また、ファイル送信目的以外のSOAP(Simple Object Access Protocol)やREST(Representational State Transfer)等も使用可能である。 Further, the application transfer unit 424 may have an SMB (Server Message Block) client function. As a result, the application transfer unit 424 can perform file and folder operations on the file server 102 having the SMB server function by using the SMB. In addition to SMB, WebDAV (Distributed Instruction and Versioning protocol for the WWW), FTP (File Transfer Protocol), or the like may be used. Moreover, you may use SMTP (Simple Mail Transfer Protocol) or the like. In addition, SOAP (Simple Object Access Protocol), REST (Representational State Transfer), and the like can be used for purposes other than file transmission.

図3は、MFP101がスキャン画像データを生成してファイルサーバ102にアップロードする処理を示すフローチャートである。なお、フローチャートに示される一連の処理は、CPU211がHDD214等に記憶された制御プログラムをRAM213に展開し、実行することにより行われる。あるいはまた、フローチャートにおけるステップの一部または全部の機能をASICや電子回路等のハードウェアで実現してもよい。各処理の説明における記号「S」は、当該フローチャートにおけるステップを意味する。その他のフローチャートについても同様である。 FIG. 3 is a flowchart showing a process in which the MFP 101 generates scan image data and uploads it to the file server 102. The series of processes shown in the flowchart is performed by the CPU 211 expanding the control program stored in the HDD 214 or the like to the RAM 213 and executing the process. Alternatively, some or all the functions of the steps in the flowchart may be realized by hardware such as an ASIC or an electronic circuit. The symbol "S" in the description of each process means a step in the flowchart. The same applies to other flowcharts.

まず、S301で、アプリケーション表示部423が操作部220にスキャン設定画面を表示する。ユーザは、スキャン設定画面を介して、スキャン部411に行わせるスキャン処理の設定を行う。 First, in S301, the application display unit 423 displays the scan setting screen on the operation unit 220. The user sets the scan process to be performed by the scan unit 411 via the scan setting screen.

図4は、本実施形態に係るスキャン設定画面400の一例を示す。スキャン設定画面400は、5つのスキャン設定ボタン401乃至405を有する。[カラー設定]ボタン401は、原稿スキャン時のカラーまたはモノクロ設定を受け付ける。[解像度設定]ボタン402は、原稿スキャン時の解像度設定を受け付ける。[両面読み取り設定]ボタン403は、原稿スキャン時の両面読み取り設定を受け付ける。[原稿混載設定]ボタン404は、原稿スキャン時にサイズが異なる原稿をまとめてスキャンするかどうかの原稿混載の有無設定を受け付ける。[画像形式設定]ボタン405は、スキャン画像データの画像形式を受け付ける。ユーザがこれらのスキャン設定ボタン401乃至405を用いて設定を行う際には、MFP101がサポートしている範囲で設定項目の候補が表示される。ユーザは、表示された候補の中から所望の設定項目を選択する。なお、上述したスキャン設定ボタンは一例であって、これら全てのスキャン設定ボタンが存在しなくてもよいし、これら以外のスキャン設定ボタンが存在してもよい。ユーザは、このようなスキャン設定画面400を介して、スキャン処理についての詳細な設定を行なうことができる。[キャンセル]ボタン406は、スキャン設定を中止する場合に用いるボタンである。[スキャン開始]ボタン407は、原稿台等にセットした原稿に対するスキャン処理の開始を指示するためのボタンである。 FIG. 4 shows an example of the scan setting screen 400 according to the present embodiment. The scan setting screen 400 has five scan setting buttons 401 to 405. The [Color setting] button 401 accepts a color or monochrome setting at the time of document scanning. The [Resolution setting] button 402 accepts the resolution setting at the time of document scanning. The [Double-sided scanning setting] button 403 accepts the double-sided scanning setting at the time of document scanning. The [Original mixed loading setting] button 404 accepts the setting of whether or not the originals are mixedly loaded, depending on whether or not the originals of different sizes are collectively scanned when the originals are scanned. The [Image Format Setting] button 405 accepts the image format of the scanned image data. When the user makes a setting using these scan setting buttons 401 to 405, candidate setting items are displayed within the range supported by the MFP 101. The user selects a desired setting item from the displayed candidates. The above-mentioned scan setting button is an example, and all of these scan setting buttons may not exist, or scan setting buttons other than these may exist. The user can make detailed settings for the scan process through such a scan setting screen 400. The [Cancel] button 406 is a button used to cancel the scan setting. The [scan start] button 407 is a button for instructing the start of the scan process for the document set on the platen or the like.

図3に戻り、S302で、アプリケーション表示部423は、[スキャン開始]ボタン407が押されたか、[キャンセル]ボタン406が押されたかを判定する。[スキャン開始]ボタン407が押されたと判定すると、アプリケーション表示部423は、スキャン設定ボタン401乃至405で選択された設定項目を用いて、スキャン指示部421に対してスキャン処理を実行させる。[キャンセル]ボタン406が押されたと判定すると、処理を終了する。 Returning to FIG. 3, in S302, the application display unit 423 determines whether the [scan start] button 407 is pressed or the [cancel] button 406 is pressed. When it is determined that the [scan start] button 407 is pressed, the application display unit 423 causes the scan instruction unit 421 to execute the scan process using the setting items selected by the scan setting buttons 401 to 405. When it is determined that the [Cancel] button 406 has been pressed, the process ends.

S303で、スキャン指示部421は、スキャン部411にスキャン処理を指示し、原稿(文書)をスキャンする。原稿をスキャンして生成されたスキャン画像データは、S304において、転送部412を通じてアプリケーション受信部422にFTPで内部転送される。なお、図13に示す帳票1300を、スキャンされた原稿とする。 In S303, the scan instruction unit 421 instructs the scan unit 411 to perform a scan process and scans the document (document). The scanned image data generated by scanning the original is internally transferred by FTP to the application receiving unit 422 through the transfer unit 412 in S304. The form 1300 shown in FIG. 13 is used as the scanned document.

S305で、画像解析部425が、アプリケーション受信部422からの指示に従って、スキャン画像データの解析処理(レイアウト解析処理やOCR処理)を行う。画像解析部425は、例えば、スキャン画像データのヒストグラムを抽出したり、画素の塊を抽出したりして、文字領域や図形領域など、スキャン画像データのレイアウトを解析する。文字領域は、文字列と推認される領域である。文字領域は、一文字の領域も含む。 In S305, the image analysis unit 425 performs analysis processing (layout analysis processing and OCR processing) of the scanned image data according to the instruction from the application receiving unit 422. The image analysis unit 425 analyzes the layout of the scanned image data such as a character area and a graphic area by, for example, extracting a histogram of the scanned image data or extracting a block of pixels. The character area is an area presumed to be a character string. The character area also includes an area of one character.

図5は、S305の画像解析処理の詳細を示すフローチャートである。 FIG. 5 is a flowchart showing the details of the image analysis process of S305.

S501で、画像解析部425は、アプリケーション受信部422から受け取ったスキャン画像データを、解析できる形態にして読み込む。 In S501, the image analysis unit 425 reads the scanned image data received from the application receiving unit 422 into a form that can be analyzed.

S502で、画像解析部425は、読み込んだスキャン画像データを、領域判定や文字列解析しやすい状態に補正する。具体的には、画像解析部425は、スキャン時にずれた原稿の傾きがなくなるようにスキャン画像の傾きを補正したり、原稿の向きを検知してスキャン画像を回転させたりする。 In S502, the image analysis unit 425 corrects the read scanned image data to a state in which area determination and character string analysis are easy. Specifically, the image analysis unit 425 corrects the tilt of the scanned image so that the tilt of the document displaced during scanning disappears, or detects the orientation of the document and rotates the scanned image.

S503で、画像解析部425は、S502で補正したスキャン画像データの内容を解析して領域を判定し、領域の情報(以下、領域情報ともいう)を生成する。領域判定では、画像解析部425は、スキャン画像データ内のどこにテキスト、イメージ、表、ライン等の領域が存在するかを判定する。 In S503, the image analysis unit 425 analyzes the content of the scanned image data corrected in S502 to determine the region, and generates region information (hereinafter, also referred to as region information). In the area determination, the image analysis unit 425 determines where an area such as a text, an image, a table, or a line exists in the scanned image data.

表1は、画像解析部425によって生成された領域情報の一例を示す。表1の領域情報は、図13に示す帳票1300をスキャンして得られたスキャン画像データを解析して得られたものとする。以下では、領域情報の「種類」が「テキスト」である領域のことを、「文字領域」と称する。 Table 1 shows an example of the area information generated by the image analysis unit 425. The area information in Table 1 is assumed to be obtained by analyzing the scanned image data obtained by scanning the form 1300 shown in FIG. In the following, the area where the "type" of the area information is "text" is referred to as a "character area".

Figure 0007077127000001
Figure 0007077127000001

上記表1において、「番号」は、特定された各領域を一意に示す番号である。この例では、1から29までの通し番号が、領域が認識された順番に付けられている。「領域のX座標」は、特定された各領域の左上隅のX座標を示す。「領域のY座標」は、特定された各領域の左上隅のY座標を示す。以後、領域に対して“座標”と言う場合は、特に断らない限り、領域の左上隅の位置座標のことを意味するものとする。「領域の幅」は、特定された各領域の左辺から右辺までの距離を示す。「領域の高さ」は、特定された各領域の上辺から下辺までの距離を示す。「種類」は、特定された各領域が、「テキスト」、「イメージ」、「表」、「ライン」等のどの種類に該当する領域であるかを示す。本実施形態では、「領域のX座標」、「領域のY座標」、「領域の幅」、及び「領域の高さ」はいずれもピクセルで示すが、ポイントやインチ等で示してもよい。領域情報は、CSVまたはXMLのフォーマットで生成されるものとするが、他のフォーマットでもよい。 In Table 1 above, the "number" is a number uniquely indicating each specified area. In this example, serial numbers from 1 to 29 are assigned in the order in which the areas are recognized. "Region X coordinate" indicates the X coordinate of the upper left corner of each identified region. The "Y coordinate of the area" indicates the Y coordinate of the upper left corner of each identified area. Hereinafter, when the term "coordinates" is used with respect to an area, it means the position coordinates of the upper left corner of the area unless otherwise specified. "Area width" indicates the distance from the left side to the right side of each identified area. "Area height" indicates the distance from the upper side to the lower side of each specified area. The “type” indicates which type of “text”, “image”, “table”, “line”, etc. corresponds to each of the specified areas. In the present embodiment, the "X coordinate of the area", the "Y coordinate of the area", the "width of the area", and the "height of the area" are all indicated by pixels, but may be indicated by points, inches, or the like. The area information is assumed to be generated in CSV or XML format, but other formats may be used.

図3に戻り、S306で、アプリケーション転送部424は、画像解析部425がS503で生成した領域情報を取得する。アプリケーション転送部424は、画像解析部425がHDD214に一旦保存した領域情報を取得するようにしてもよい。 Returning to FIG. 3, in S306, the application transfer unit 424 acquires the area information generated by the image analysis unit 425 in S503. The application transfer unit 424 may acquire the area information temporarily stored in the HDD 214 by the image analysis unit 425.

S307で、プレビュー表示部426が、アプリケーション表示部423を介してアプリケーション転送部424から取得したスキャン画像データ及び領域情報に基づいて、プレビュー画面を操作部220に表示する。後述するように、ユーザは、プレビュー画面を介して、スキャン画像データに関連する情報(例えば、スキャン画像データのファイル名)を設定することができる。 In S307, the preview display unit 426 displays the preview screen on the operation unit 220 based on the scanned image data and the area information acquired from the application transfer unit 424 via the application display unit 423. As will be described later, the user can set information related to the scanned image data (for example, a file name of the scanned image data) via the preview screen.

図6は、S307のプレビュー画面表示処理の詳細を示すフローチャートである。図6(a)は、プレビュー画面表示処理の全体的な流れを示し、図6(b)は、プレビュー画面における文字領域の拡大幅の決定処理の流れを示す。上述したように、S303でスキャンした原稿は、図13に示す帳票1300であり、S305で得た領域情報は、表1に示す領域情報であるものとして説明する。 FIG. 6 is a flowchart showing the details of the preview screen display process of S307. FIG. 6A shows the overall flow of the preview screen display process, and FIG. 6B shows the flow of the process of determining the enlargement width of the character area on the preview screen. As described above, the document scanned in S303 is the form 1300 shown in FIG. 13, and the area information obtained in S305 will be described as the area information shown in Table 1.

S610で、プレビュー表示部426は、領域情報に基いて基準サイズを決定する。基準サイズとは、領域情報における文字領域の高さのうち、領域数が最も多い高さのことである。したがって、表1の例では、領域数が一番多い「13」(ピクセル)が基準サイズとなる。すなわち、基準サイズは、スキャン画像データに含まれる同じサイズの文字領域の数に応じて決定される。 In S610, the preview display unit 426 determines the reference size based on the area information. The reference size is the height in which the number of areas is the largest among the heights of the character areas in the area information. Therefore, in the example of Table 1, "13" (pixels) having the largest number of areas is the reference size. That is, the reference size is determined according to the number of character areas of the same size contained in the scanned image data.

S620で、プレビュー表示部426は、プレビュー画面における文字領域の拡大幅を決定する。具体的には、プレビュー表示部426は、図6(b)に示すS621乃至S623の処理を行い、文字領域の拡大幅を決定する。文字領域の拡大幅について、図7に示すプレビュー画面の例を用いて以下に説明する。 In S620, the preview display unit 426 determines the enlargement width of the character area on the preview screen. Specifically, the preview display unit 426 performs the processes of S621 to S623 shown in FIG. 6B to determine the enlargement width of the character area. The enlargement width of the character area will be described below using an example of the preview screen shown in FIG. 7.

図7(a)は、S610乃至S650の処理(すなわち、文字領域の拡大処理及びプレビュー表示自体の拡大処理)を行わずに、後述するS660のプレビュー表示処理を行った場合のプレビュー画面700の一例を示す。プレビュー画面700は、スキャン画像データのファイル名表示領域701、ファイル名のフォーマット等を設定するためのボタン702、及びスキャン画像データをプレビュー表示するためのプレビュー表示領域710を有する。また、プレビュー画面700は、[戻る]ボタン730、及び[次へ]ボタン731を有する。 FIG. 7A is an example of the preview screen 700 when the preview display processing of S660 described later is performed without performing the processing of S610 to S650 (that is, the enlargement processing of the character area and the enlargement processing of the preview display itself). Is shown. The preview screen 700 has a file name display area 701 for scanned image data, a button 702 for setting a file name format, and a preview display area 710 for previewing the scanned image data. Further, the preview screen 700 has a [Back] button 730 and a [Next] button 731.

プレビュー表示領域710は、スキャン画像データを表示するとともに、スキャン画像データの表示状態を変更するボタン711乃至714、及びファイル名文字列設定領域715乃至726を表示する。 The preview display area 710 displays the scanned image data, and also displays the buttons 711 to 714 for changing the display state of the scanned image data, and the file name character string setting areas 715 to 726.

[画面上部スクロール]ボタン711がユーザによって押されると、プレビュー表示部426は、プレビュー表示領域710に表示されているスキャン画像データの領域を上に向かってスクロールする。[画面下部スクロール]ボタン712がユーザによって押されると、プレビュー表示部426は、プレビュー表示領域710に表示されているスキャン画像データの領域を下に向かってスクロールする。なお、プレビュー表示領域710は、領域を左に向かってスクロールする画面左部スクロールボタン、あるいは領域を右に向かってスクロールする右部スクロールボタン(いずれも不図示)を表示しても良い。 When the [Scroll at the top of the screen] button 711 is pressed by the user, the preview display unit 426 scrolls the area of the scanned image data displayed in the preview display area 710 upward. When the [Scroll at the bottom of the screen] button 712 is pressed by the user, the preview display unit 426 scrolls the area of the scanned image data displayed in the preview display area 710 downward. The preview display area 710 may display a screen left scroll button that scrolls the area to the left or a right scroll button that scrolls the area to the right (both not shown).

[画面拡大]ボタン713がユーザによって押されると、プレビュー表示部426は、プレビュー表示領域710に表示されているスキャン画像データの領域を拡大表示する。[画面縮小]ボタン714がユーザによって押されると、プレビュー表示部426は、プレビュー表示領域710に表示されているスキャン画像データの領域を縮小表示する。 When the [Screen Enlargement] button 713 is pressed by the user, the preview display unit 426 enlarges and displays the area of the scanned image data displayed in the preview display area 710. When the [Screen reduction] button 714 is pressed by the user, the preview display unit 426 reduces and displays the area of the scanned image data displayed in the preview display area 710.

プレビュー表示部426は、ファイル名文字列設定領域715乃至726を、画像解析部425が生成した領域情報に従って、プレビュー表示領域710に表示する。図7(a)のプレビュー画面700では、プレビュー表示部426は、表1に示す領域情報の座標をそのまま用いて、文字列設定領域として表示している。 The preview display unit 426 displays the file name character string setting areas 715 to 726 in the preview display area 710 according to the area information generated by the image analysis unit 425. In the preview screen 700 of FIG. 7A, the preview display unit 426 uses the coordinates of the area information shown in Table 1 as they are and displays them as a character string setting area.

領域情報は、表1に示すように、スキャン画像データ上での各領域の位置を示している。ユーザがプレビュー画面700上で文字領域をタッチすると、プレビュー表示部426は、選択された文字領域に対して文字認識処理(OCR処理:Optical Character Recognition処理)を行う。プレビュー表示部426は、文字認識処理によって、選択された文字領域(画像領域)に含まれている文字(テキストデータ)を抽出する。 As shown in Table 1, the area information indicates the position of each area on the scanned image data. When the user touches the character area on the preview screen 700, the preview display unit 426 performs character recognition processing (OCR processing: Optical Character Recognition processing) on the selected character area. The preview display unit 426 extracts characters (text data) included in the selected character area (image area) by the character recognition process.

文字認識処理は、例えば、文字領域に含まれている画素群と、予め登録されている辞書とをマッチング処理することで、文字(テキストデータ)を認識する処理である。かかる文字認識処理は、処理に時間を要する場合がある。そのため、本実施形態では、画像解析によって抽出された文字領域に逐次的に文字認識処理を行わずに、ユーザが所望する文字領域に対して文字認識処理を行うことで、処理の高速化を図っている。 The character recognition process is, for example, a process of recognizing a character (text data) by matching a pixel group included in a character area with a dictionary registered in advance. Such character recognition processing may take time. Therefore, in the present embodiment, the character recognition process is performed on the character area desired by the user without sequentially performing the character recognition process on the character area extracted by the image analysis, thereby speeding up the processing. ing.

プレビュー表示部426は、ユーザによって選択された文字領域から抽出した文字(テキストデータ)を、ファイル名表示領域701に設定する。ユーザが文字領域を選択する際、文字領域が小さいと、タッチ操作により認識した座標が、ユーザが意図した領域から外れてしまうことがある。そこで、後述する図7(b)のプレビュー画面700に示すように、プレビュー表示部426は、ファイル名文字列設定領域715乃至726を拡大して表示し、ユーザが意図した文字領域を選択しやすくする。 The preview display unit 426 sets the character (text data) extracted from the character area selected by the user in the file name display area 701. When the user selects a character area, if the character area is small, the coordinates recognized by the touch operation may deviate from the area intended by the user. Therefore, as shown in the preview screen 700 of FIG. 7B, which will be described later, the preview display unit 426 enlarges and displays the file name character string setting areas 715 to 726, making it easy for the user to select the intended character area. do.

なお、ユーザが、ファイル名表示領域701の領域をタッチ(選択)すると、プレビュー表示部426は、ソフトウェアキーボード(不図示)を表示し、ユーザがソフトウェアキーボードを操作することによって、ファイル名の編集を可能にすることもできる。 When the user touches (selects) the area of the file name display area 701, the preview display unit 426 displays the software keyboard (not shown), and the user operates the software keyboard to edit the file name. It can also be made possible.

図7(a)、(b)に示したプレビュー画面700では、どのファイル名文字列設定領域715乃至726も、ユーザによって選択された状態ではない。 In the preview screen 700 shown in FIGS. 7A and 7B, none of the file name character string setting areas 715 to 726 is in the state of being selected by the user.

次に、図6(b)を参照して、プレビュー画面における文字領域の拡大幅の決定処理の流れについて説明する。 Next, with reference to FIG. 6B, the flow of the process of determining the enlargement width of the character area on the preview screen will be described.

S621で、プレビュー表示部426は、領域情報に基づいて、各文字領域間の間隔を算出し、そのうち最も小さい間隔の値を決定する。ここでは、番号7と番号9の領域間の間隔が最も小さく、値は10である。 In S621, the preview display unit 426 calculates the interval between each character area based on the area information, and determines the value of the smallest interval among them. Here, the distance between the regions of numbers 7 and 9 is the smallest, and the value is 10.

S622で、プレビュー表示部426は、文字領域の拡大幅を算出する。プレビュー表示部426は、S610で決定した基準サイズの文字領域を、規定のサイズまで拡大するために必要な拡大幅を算出する。規定のサイズとは、文字領域がプレビュー画面にファイル名文字列設定領域として表示された際に、ユーザが選択しやすいサイズとして予め規定されたサイズである。ここでは、規定サイズを30として、基準サイズ13を規定サイズまで拡大するものとする。この場合、30と13の差分である17が、文字領域の拡大幅として算出される。なお、拡大幅には上限を設けても良い。 In S622, the preview display unit 426 calculates the enlargement width of the character area. The preview display unit 426 calculates the enlargement width required to enlarge the character area of the reference size determined in S610 to a specified size. The specified size is a size predetermined as a size that can be easily selected by the user when the character area is displayed as a file name character string setting area on the preview screen. Here, it is assumed that the specified size is 30, and the standard size 13 is expanded to the specified size. In this case, 17 which is the difference between 30 and 13 is calculated as the enlargement width of the character area. An upper limit may be set for the expansion width.

S623で、プレビュー表示部426は、文字領域の拡大幅の補正を行う。上述したように、S622で、文字領域の拡大幅は17と算出された。一方、S621で、文字領域間の最小間隔の値は10と算出された。つまり、全ての文字領域を拡大幅の分だけ拡大してしまうと、間隔が拡大幅より小さい文字領域同士が重なってしまうことがあり、ユーザが意図した文字領域の選択をしにくくしてしまうことがある。よって、この場合、文字領域同士が重ならないように、文字領域の拡大幅を17ではなく、文字領域間の最小間隔である10として決定し、図6(a)のS630に進む。 In S623, the preview display unit 426 corrects the enlargement width of the character area. As described above, in S622, the enlargement width of the character area was calculated to be 17. On the other hand, in S621, the value of the minimum spacing between the character areas was calculated to be 10. In other words, if all the character areas are enlarged by the enlargement width, the character areas whose spacing is smaller than the enlargement width may overlap each other, making it difficult for the user to select the intended character area. There is. Therefore, in this case, the enlargement width of the character areas is determined not to be 17 but to 10 which is the minimum interval between the character areas so that the character areas do not overlap with each other, and the process proceeds to S630 in FIG. 6A.

S630で、プレビュー表示部426は、S620で決定した拡大幅を用いて、各文字領域を拡大する。ここでは、S620で決定された拡大幅が10であるため、プレビュー表示部426は、各文字領域を上下左右に5ずつ拡大させる。なお、文字領域の拡大は、上下左右ではなく、上下のみを拡大するようにしてもよい。 In S630, the preview display unit 426 enlarges each character area by using the enlargement width determined in S620. Here, since the enlargement width determined in S620 is 10, the preview display unit 426 enlarges each character area by 5 in the vertical and horizontal directions. The character area may be expanded only vertically and horizontally instead of vertically and horizontally.

図7(b)は、S640およびS650の処理(すなわち、プレビュー表示自体の拡大処理)を行わずに、後述するS660のプレビュー表示処理を行った場合のプレビュー画面700の一例を示す。図7(b)のプレビュー画面700は、図7(a)のプレビュー画面700と比較して、S620およびS630の処理(すなわち、文字領域の拡大処理)によって、ファイル名文字列設定領域が拡大されている点が異なる。 FIG. 7B shows an example of the preview screen 700 when the preview display processing of S660 described later is performed without performing the processing of S640 and S650 (that is, the enlargement processing of the preview display itself). In the preview screen 700 of FIG. 7B, the file name character string setting area is enlarged by the processing of S620 and S630 (that is, the enlargement processing of the character area) as compared with the preview screen 700 of FIG. 7A. The point is different.

S640で、プレビュー表示部426は、プレビュー表示されるスキャン画像データの拡大率を算出する。プレビュー表示部426は、プレビュー画面における文字領域の拡大だけでなく、プレビュー表示されるスキャン画像データ自体を拡大するために、スキャン画像データの拡大率を算出する。上述した例では、S630までの処理で、各文字領域のサイズは10拡大されている。例えば、基準サイズである文字領域のサイズ13は、23に拡大されている。しかしながら、領域が拡大されても、前述したS623で文字領域の拡大幅が文字領域の最小間隔に合わせて補正されるため、最も数の多い基準サイズの領域は、規定サイズ30よりも小さいままである。そこで、本ステップで、プレビュー表示部426は、拡大した文字領域を、さらにその文字領域が規定サイズよりも大きく表示されるようにするために必要な、プレビュー表示されるスキャン画像データ自体の拡大率を算出する。具体的には、基準サイズの領域に基づいて、拡大した文字領域のサイズ23が規定サイズ30で表示されるようにするための拡大率を決定する。拡大した文字領域のサイズは規定サイズ以上になればよく、この場合、拡大率は、小数点以下第2位まで求めるとすると、30÷23≒1.31倍とすることができる。算出した拡大率は、後述するS660のスキャン画像データのプレビュー表示において、スキャン画像データの拡大表示に用いられる。 In S640, the preview display unit 426 calculates the enlargement ratio of the scanned image data to be preview-displayed. The preview display unit 426 calculates the enlargement ratio of the scan image data in order not only to enlarge the character area on the preview screen but also to enlarge the scan image data itself to be preview-displayed. In the above-mentioned example, the size of each character area is expanded by 10 by the processing up to S630. For example, the size 13 of the character area, which is the reference size, is expanded to 23. However, even if the area is expanded, the expansion width of the character area is corrected according to the minimum interval of the character area in S623 described above, so that the area of the largest number of reference sizes remains smaller than the specified size 30. be. Therefore, in this step, the preview display unit 426 expands the enlarged character area itself, which is necessary for displaying the enlarged character area larger than the specified size. Is calculated. Specifically, based on the reference size area, the enlargement ratio for displaying the enlarged character area size 23 at the specified size 30 is determined. The size of the enlarged character area may be larger than the specified size, and in this case, the enlargement ratio can be 30/23 ≈ 1.31 times if it is obtained to the second decimal place. The calculated enlargement ratio is used for the enlarged display of the scanned image data in the preview display of the scanned image data of S660 described later.

S650で、プレビュー表示部426は、初期表示座標を決定する。ここでは、各領域のうち、最小のY座標と最小のX座標を、最初にプレビュー画面の左上に表示する初期表示座標とする。各文字領域のうち、最小のY座標は番号1の領域で値は41、最小のX座標は番号3の領域で値は48である。S630で文字領域が拡大されていることを考慮して各座標を5減算し、Y座標は36、X座標は43となる。さらに若干の余白を設けるために各座標を2減算し、Y座標は34、X座標は41としても良い。 In S650, the preview display unit 426 determines the initial display coordinates. Here, the minimum Y coordinate and the minimum X coordinate in each area are set as the initial display coordinates to be displayed at the upper left of the preview screen first. Of each character area, the minimum Y coordinate is the area of number 1 and the value is 41, and the minimum X coordinate is the area of number 3 and the value is 48. Considering that the character area is expanded in S630, each coordinate is subtracted by 5, and the Y coordinate becomes 36 and the X coordinate becomes 43. Further, each coordinate may be subtracted by 2 in order to provide a slight margin, and the Y coordinate may be 34 and the X coordinate may be 41.

S660で、プレビュー表示部426は、S650で決定した初期表示座標と、S640で算出した拡大率とを用いて、スキャン画像データのプレビュー表示を行う。 In S660, the preview display unit 426 performs a preview display of the scanned image data using the initial display coordinates determined in S650 and the enlargement ratio calculated in S640.

図8(a)は、S660でプレビュー表示処理を行った場合のプレビュー画面800の一例を示す。図8(a)のプレビュー画面800は、文字領域を拡大した図7(b)のプレビュー画面700と比較して、さらに、プレビュー表示自体が拡大されている。そうすることで、ユーザは、意図した領域を選択しやすくなる。 FIG. 8A shows an example of the preview screen 800 when the preview display process is performed in S660. In the preview screen 800 of FIG. 8A, the preview display itself is further enlarged as compared with the preview screen 700 of FIG. 7B in which the character area is enlarged. By doing so, the user can easily select the intended area.

図3に戻り、S308で、プレビュー表示部426は、プレビュー画面800を介してファイル名生成処理を実行する。 Returning to FIG. 3, in S308, the preview display unit 426 executes the file name generation process via the preview screen 800.

図9は、S308のファイル名生成処理の詳細を示すフローチャートである。 FIG. 9 is a flowchart showing the details of the file name generation process of S308.

S901で、プレビュー表示部426は、ユーザが操作部220に表示されたプレビュー画面にタッチしたかどうかを判定する。タッチされたと判定すると、S902へ進み、プレビュー表示部426は、タッチされた位置の座標を取得する。タッチされていないと判定するとS901へ戻る。 In S901, the preview display unit 426 determines whether or not the user has touched the preview screen displayed on the operation unit 220. If it is determined that the touch has been made, the process proceeds to S902, and the preview display unit 426 acquires the coordinates of the touched position. If it is determined that the touch is not made, the process returns to S901.

S903で、プレビュー表示部426は、タッチされた位置の座標が文字領域と重なるか判定する。重なるか否かの判定は、タッチされた位置の座標が、プレビュー表示領域710に表示されているファイル名文字列設定領域715乃至726の座標領域内にあるかどうかで判定する。重なると判定すると、S904へ進み、重なっていないと判定するとS909へ進む。 In S903, the preview display unit 426 determines whether the coordinates of the touched position overlap with the character area. The determination of whether or not they overlap is determined by whether or not the coordinates of the touched positions are within the coordinate areas of the file name character string setting areas 715 to 726 displayed in the preview display area 710. If it is determined that they overlap, the process proceeds to S904, and if it is determined that they do not overlap, the process proceeds to S909.

S909で、プレビュー表示部426は、[次へ]ボタン731もしくは[戻る]ボタン730が押下されたか判定する。押下されたと判定すると、図9の処理(すなわち、S308の処理)を終了し、図3のS309へ進む。一方、押下されてないと判定するとS901へ戻る。 In S909, the preview display unit 426 determines whether the [Next] button 731 or the [Back] button 730 is pressed. If it is determined that the button has been pressed, the process of FIG. 9 (that is, the process of S308) is terminated, and the process proceeds to S309 of FIG. On the other hand, if it is determined that the button is not pressed, the process returns to S901.

S904で、画像解析部425は、タッチされた位置の座標が重なった文字領域に対してOCR処理を行い、当該文字領域に含まれている文字列を取得する。画像解析部425は、取得した文字列を、解析結果としてプレビュー表示部426へ渡す。 In S904, the image analysis unit 425 performs OCR processing on the character area where the coordinates of the touched positions overlap, and acquires the character string included in the character area. The image analysis unit 425 passes the acquired character string to the preview display unit 426 as an analysis result.

S905で、プレビュー表示部426は、ファイル名表示領域701に表示中のファイル名を取得する。ファイル名表示領域701に何も表示されていない場合は、ファイル名を取得せずに、次に進む。 In S905, the preview display unit 426 acquires the file name displayed in the file name display area 701. If nothing is displayed in the file name display area 701, the process proceeds to the next step without acquiring the file name.

S906で、プレビュー表示部426は、S905で取得したファイル名の末尾に区切り文字を追加する。本実施形態では、区切り文字としてアンダーバー(“_”)を使用するが、その他の文字を使用してもよい。なお、S905でファイル名を取得できなかった場合は、区切り文字を追加せずに次に進む。 In S906, the preview display unit 426 adds a delimiter to the end of the file name acquired in S905. In this embodiment, the underscore (“_”) is used as the delimiter, but other characters may be used. If the file name cannot be obtained in S905, the process proceeds to the next step without adding the delimiter.

S907で、プレビュー表示部426は、S906で追加した区切り文字に続けて、S904で解析結果として取得した文字列を追加する。なお、S905でファイル名を取得できなかった場合には、S906で区切り文字も追加されないため、S904で取得した文字列が、ファイル名として最初の文字列となる。 In S907, the preview display unit 426 adds the character string acquired as the analysis result in S904, following the delimiter added in S906. If the file name cannot be acquired in S905, the delimiter is not added in S906, so the character string acquired in S904 becomes the first character string as the file name.

S908で、プレビュー表示部426は、S907で生成した文字列をファイル名としてファイル名表示領域701に設定し、S901へ戻る。 In S908, the preview display unit 426 sets the character string generated in S907 as the file name in the file name display area 701, and returns to S901.

なお、本実施形態では、S901乃至S908の処理を繰り返し、ファイル名文字列設定領域715、717、716の順に、文字領域が選択されたものとする。図8(b)は、ファイル名文字列設定領域715、717、716が選択された状態のプレビュー画面800を示す。図8(b)では、ファイル名表示領域701に、選択されたファイル名文字列設定領域715、717、716から取得した文字列が、区切り文字を介して連結されて設定されている。また、プレビュー画面800において、選択されたファイル名文字列設定領域715、717、716は、選択されていないファイル名文字列設定領域と区別可能なように表示される。 In this embodiment, it is assumed that the processing of S901 to S908 is repeated and the character area is selected in the order of the file name character string setting area 715, 717, 716. FIG. 8B shows a preview screen 800 in a state where the file name character string setting areas 715, 717, and 716 are selected. In FIG. 8B, the character strings acquired from the selected file name character string setting areas 715, 717, and 716 are concatenated and set in the file name display area 701 via the delimiter. Further, on the preview screen 800, the selected file name character string setting areas 715, 717, and 716 are displayed so as to be distinguishable from the non-selected file name character string setting areas.

以上説明したように、プレビュー表示部426は、プレビュー画面800を介してファイル名生成処理を実行する。 As described above, the preview display unit 426 executes the file name generation process via the preview screen 800.

次いで、図3に戻り、S309で、プレビュー表示部426は、上述したS909での操作内容を判定する。具体的には、プレビュー表示部426は、S909で[次へ]ボタン731が押されたのか、それとも[戻る]ボタン730が押下されたのかを判定する。[次へ]ボタン731が押されたと判定すると、S310へ進み、[戻る]ボタン730が押下されたと判定すると、S301へ戻る。 Next, returning to FIG. 3, in S309, the preview display unit 426 determines the operation content in S909 described above. Specifically, the preview display unit 426 determines whether the [Next] button 731 or the [Back] button 730 is pressed in S909. If it is determined that the [Next] button 731 is pressed, the process proceeds to S310, and if it is determined that the [Back] button 730 is pressed, the process returns to S301.

S310で、プレビュー表示部426は、ファイル名表示領域701に設定されたファイル名を取得する。プレビュー表示部426は、取得したファイル名をアップロード指示部427へ渡す。 In S310, the preview display unit 426 acquires the file name set in the file name display area 701. The preview display unit 426 passes the acquired file name to the upload instruction unit 427.

S311で、アップロード指示部427は、アップロード設定画面を操作部220に表示する。ユーザは、アップロード設定画面を介して、アプリケーション転送部424に行わせるファイルサーバ102への外部転送(アップロード)に関する設定を行うことができる。 In S311 the upload instruction unit 427 displays the upload setting screen on the operation unit 220. The user can make settings related to external transfer (upload) to the file server 102 to be performed by the application transfer unit 424 via the upload setting screen.

図10は、アップロード設定画面1000の一例を示す。アップロード設定画面1000において、フォルダパス入力欄1001は、外部転送先であるファイルサーバ102のフォルダパス設定を受け付ける。ユーザがフォルダパス入力欄1001をタップすると、アップロード指示部427は、ソフトウェアキーボード(不図示)を表示する。ユーザは、表示されたソフトウェアキーボードを介して、フォルダパス入力欄1001にフォルダパスを入力する。図10の例では、フォルダパス入力欄1001に文字列“2017_12_12”が入力されている。フォルダパスの設定の終了を受け付けると、アップロード指示部427は、設定されたフォルダパスを取得し、ソフトウェアキーボードを閉じる。なお、フォルダパスの設定は、フォルダパス入力欄1001以外から行えるようにしてもよい。例えば、MFP101が保持するアドレス帳からフォルダパスを設定可能なようにしても良い。 FIG. 10 shows an example of the upload setting screen 1000. On the upload setting screen 1000, the folder path input field 1001 accepts the folder path setting of the file server 102 which is the external transfer destination. When the user taps the folder path input field 1001, the upload instruction unit 427 displays a software keyboard (not shown). The user inputs the folder path in the folder path input field 1001 via the displayed software keyboard. In the example of FIG. 10, the character string "2017_12_12" is input in the folder path input field 1001. Upon receiving the completion of the folder path setting, the upload instruction unit 427 acquires the set folder path and closes the software keyboard. The folder path may be set from other than the folder path input field 1001. For example, the folder path may be set from the address book held by the MFP 101.

S312で、アップロード指示部427は、アップロード設定画面1000の[アップロード]ボタン1021が押下されたか、それとも、[戻る]ボタン1020が押下されたか判定する。[アップロード]ボタン1021が押下されたと判定すると、S313へ進み、[戻る]ボタン1020が押下されたと判定すると、S307へ戻る。 In S312, the upload instruction unit 427 determines whether the [upload] button 1021 on the upload setting screen 1000 is pressed or the [back] button 1020 is pressed. If it is determined that the [upload] button 1021 is pressed, the process proceeds to S313, and if it is determined that the [back] button 1020 is pressed, the process returns to S307.

S313で、アップロード指示部427は、HDD214等のメモリに予め記憶されたファイルサーバ設定を取得する。ファイルサーバ設定には、ファイルサーバ102のホスト名、フォルダパスの起点、ファイルサーバ102にログインするためのユーザ名及びパスワードが含まれる。アップロード指示部427は、取得したファイルサーバ設定、S311で取得したフォルダパス設定、及びS310で取得したファイル名を、アプリケーション転送部424へ渡す。 In S313, the upload instruction unit 427 acquires the file server settings stored in advance in the memory of the HDD 214 or the like. The file server settings include the host name of the file server 102, the origin of the folder path, the user name and the password for logging in to the file server 102. The upload instruction unit 427 passes the acquired file server setting, the folder path setting acquired in S311 and the file name acquired in S310 to the application transfer unit 424.

S314で、アプリケーション転送部424は、スキャン画像データの格納先となる格納先パスを生成する。格納先パスは、ファイルサーバ設定に含まれるファイルサーバ102のホスト名とフォルダパスの起点に、S311で取得したフォルダパスを加えて生成される。これにより、例えば“\\server01\Share\2017_12_12”という格納先パスが生成される。 In S314, the application transfer unit 424 generates a storage destination path for storing the scanned image data. The storage destination path is generated by adding the folder path acquired in S311 to the host name of the file server 102 and the starting point of the folder path included in the file server settings. As a result, for example, the storage destination path "\\ server01 \ Share \ 2017_12_12" is generated.

S315で、アプリケーション転送部424は、ファイルサーバ102にアクセスする。アプリケーション転送部424は、S313で取得したファイルサーバ設定に含まれるユーザ名とパスワードをファイルサーバ102に送信し、ファイルサーバ102によるユーザ認証の結果を受信する。 In S315, the application transfer unit 424 accesses the file server 102. The application transfer unit 424 sends the user name and password included in the file server settings acquired in S313 to the file server 102, and receives the result of user authentication by the file server 102.

S316で、アプリケーション転送部424は、受信したユーザ認証の結果に基づいて、ユーザ認証が成功したか(ファイルサーバ102にログインできたか)否かを判定する。ユーザ認証が成功した場合はS317に進み、ユーザ認証が失敗した場合は処理を終了する。 In S316, the application transfer unit 424 determines whether or not the user authentication is successful (whether or not the file server 102 can be logged in) based on the received user authentication result. If the user authentication is successful, the process proceeds to S317, and if the user authentication fails, the process ends.

S317で、アプリケーション転送部424は、S314で生成した格納先パスが示すフォルダに、スキャン画像データを外部転送(アップロード)する。 In S317, the application transfer unit 424 externally transfers (uploads) the scanned image data to the folder indicated by the storage destination path generated in S314.

以上説明したように、MFP101は、スキャン画像データを生成し、ユーザがプレビュー画面上で選択した文字領域に基づいてファイル名を生成し、ファイル名が設定されたスキャン画像データをファイルサーバ102にアップロードする。また、ユーザが文字領域を選択する際には、文字領域を拡大してファイル名文字列設定領域として用い、さらにプレビュー表示の拡大を行うことで、ユーザが意図した文字領域の選択を行いやすいようにする。 As described above, the MFP 101 generates scan image data, generates a file name based on the character area selected by the user on the preview screen, and uploads the scan image data in which the file name is set to the file server 102. do. In addition, when the user selects a character area, the character area is enlarged and used as a file name character string setting area, and the preview display is further enlarged so that the user can easily select the character area intended. To.

<第2の実施形態>
次に、本発明の第2の実施形態について説明する。本実施形態は、上述したS303のスキャン処理で図14に示す帳票1400をスキャンし、上述したS305の解析処理で、下記の表2に示す領域情報を得たものとして説明する。表2に示す領域情報を用いて第1の実施形態による処理を行うと、プレビュー表示が拡大され過ぎてしまい、かえってユーザによる文字領域の選択を行いにくくしてしまう。そこで、本実施形態では、帳票の表の中にある文字領域など、ファイル名の設定に使用しない文字領域を拡大の対象外とする。
<Second embodiment>
Next, a second embodiment of the present invention will be described. In this embodiment, it is assumed that the form 1400 shown in FIG. 14 is scanned by the scanning process of S303 described above, and the area information shown in Table 2 below is obtained by the analysis process of S305 described above. If the processing according to the first embodiment is performed using the area information shown in Table 2, the preview display will be enlarged too much, and it will be difficult for the user to select the character area. Therefore, in the present embodiment, the character area that is not used for setting the file name, such as the character area in the form table, is excluded from the expansion.

Figure 0007077127000002
Figure 0007077127000002

まず、図11を参照して、帳票1400に第1の実施形態による処理を適用した場合の例を説明する。 First, with reference to FIG. 11, an example in which the processing according to the first embodiment is applied to the form 1400 will be described.

S621の文字領域間の最小間隔を算出する処理では、番号18と番号22の領域間の間隔が一番小さく、値は0となる。したがって、S623の文字領域の拡大幅の補正処理では、文字領域の拡大幅が0に補正されるため、S630の文字領域の拡大処理では、各文字領域は拡大されない。 In the process of calculating the minimum space between the character areas of S621, the space between the areas of the numbers 18 and 22 is the smallest, and the value is 0. Therefore, in the correction process of the enlargement width of the character area of S623, the enlargement width of the character area is corrected to 0, so that each character area is not expanded in the enlargement process of the character area of S630.

図11(a)は、S640およびS650の処理(すなわち、プレビュー表示自体の拡大処理)を行わずに、後述するS660のプレビュー表示処理を行った場合のプレビュー画面1100の一例を示す。図11(a)のプレビュー表示領域710は、帳票1400に対応するファイル名文字列設定領域1115乃至1126を含む。上述したように、第1の実施形態の処理によると、文字領域の拡大幅は0に補正されるため、図11(a)のプレビュー画面1100では、各文字領域は拡大されていない。なお、図11(a)のプレビュー画面1100は、帳票1400の上部を示し、図11(b)のプレビュー画面1100は、プレビュー表示を下方にスクロールし、帳票1400の中部を示している。図11(b)のプレビュー領域710は、帳票1400に対応する表1130を含む。 FIG. 11A shows an example of the preview screen 1100 when the preview display processing of S660 described later is performed without performing the processing of S640 and S650 (that is, the enlargement processing of the preview display itself). The preview display area 710 of FIG. 11A includes the file name character string setting areas 1115 to 1126 corresponding to the form 1400. As described above, according to the process of the first embodiment, the enlarged width of the character area is corrected to 0, so that each character area is not enlarged in the preview screen 1100 of FIG. 11A. The preview screen 1100 of FIG. 11A shows the upper part of the form 1400, and the preview screen 1100 of FIG. 11B scrolls the preview display downward to show the middle part of the form 1400. The preview area 710 of FIG. 11B includes Table 1130 corresponding to Form 1400.

そして、S640のプレビュー表示の拡大率算出処理では、帳票1400の基準サイズ9の領域が、規定サイズ30以上で表示される拡大率が算出される。この場合、拡大率は、30÷9≒3.34倍(小数点以下第2位まで有効)と算出される。プレビュー表示部426は、算出した拡大率を用いてプレビュー表示を拡大し、基準サイズ9の領域が規定サイズ30以上で表示されるようにする。続いて、S650、およびS660の処理により、プレビュー表示部426は、図11(c)に示すようなプレビュー画面1100を表示する。図示されるように、第1の実施形態による処理では、プレビュー表示の拡大率が高くなってしまい、画面内に表示できるファイル名文字列設定領域が少なくなってしまう場合がある。この場合、ユーザは、意図したファイル名文字列設定領域を選択しにくくなってしまう。 Then, in the enlargement ratio calculation process of the preview display of S640, the enlargement ratio that the area of the reference size 9 of the form 1400 is displayed in the specified size 30 or more is calculated. In this case, the enlargement ratio is calculated as 30/9 ≈ 3.34 times (effective to the second decimal place). The preview display unit 426 enlarges the preview display using the calculated enlargement ratio so that the area of the reference size 9 is displayed in the specified size 30 or more. Subsequently, by the processing of S650 and S660, the preview display unit 426 displays the preview screen 1100 as shown in FIG. 11C. As shown in the figure, in the process according to the first embodiment, the enlargement ratio of the preview display becomes high, and the file name character string setting area that can be displayed in the screen may be reduced. In this case, it becomes difficult for the user to select the intended file name character string setting area.

次に、図12を参照して、第2の実施形態による処理について説明する。第2の実施形態では、ファイル名の設定に使用しない文字領域を拡大の対象外にすることで、ユーザが意図した文字領域を選択しやすいようにする。 Next, the process according to the second embodiment will be described with reference to FIG. In the second embodiment, the character area not used for setting the file name is excluded from the enlargement target, so that the user can easily select the intended character area.

まず、S621の文字領域間の最小間隔を算出する処理において、帳票の表内の文字領域を対象外とする。表2によると、文字領域間の間隔が一番小さいのは、番号18と番号22の文字領域間の間隔である。これらの文字領域は、番号13の領域内、すなわち表内の文字領域である。このような場合、さらに表以外に文字領域が存在する場合に、表内の文字領域を除いて、文字領域間の最小間隔を算出する。その結果、番号7と番号9の文字領域間の間隔が最も小さく、値は10である。そして、S623の拡大幅の補正処理では、まず、プレビュー表示部426は、S610の基準サイズ決定処理によって取得した基準サイズを修正する。表2によると、表内の文字領域を含めて決定した基準サイズは9であったが、表内の文字領域を除くと、基準サイズは13となり、拡大幅は17となる。さらに、文字領域の拡大幅は文字領域間の最小間隔に合わせて補正されるため、補正後の文字領域の拡大幅は10となる。 First, in the process of calculating the minimum spacing between the character areas of S621, the character areas in the form table are excluded. According to Table 2, the space between the character areas is the smallest in the space between the character areas of the numbers 18 and 22. These character areas are within the area of number 13, that is, the character area in the table. In such a case, if there is a character area other than the table, the minimum space between the character areas is calculated by excluding the character area in the table. As a result, the space between the character areas of the numbers 7 and 9 is the smallest, and the value is 10. Then, in the correction process of the enlargement width of S623, first, the preview display unit 426 corrects the reference size acquired by the reference size determination process of S610. According to Table 2, the standard size determined including the character area in the table was 9, but excluding the character area in the table, the standard size is 13 and the enlargement width is 17. Further, since the enlarged width of the character area is corrected according to the minimum spacing between the character areas, the enlarged width of the corrected character area is 10.

次いで、S630の文字領域の拡大処理では、S621の処理で対象外とした表内の文字領域以外の文字領域を拡大する。 Next, in the character area expansion processing of S630, the character area other than the character area in the table excluded by the processing of S621 is expanded.

図12(a)は、S640およびS650の処理(すなわち、プレビュー表示自体の拡大処理)を行わずに、後述するS660のプレビュー表示処理を行った場合のプレビュー画面1200の一例を示す。図12(b)は、プレビュー表示を下方にスクロールし、帳票1400の中部を表示しているプレビュー画面1200の一例を示す。両図に示されるように、本実施形態では、表内の文字領域を除く文字領域が拡大される。 FIG. 12A shows an example of the preview screen 1200 when the preview display processing of S660 described later is performed without performing the processing of S640 and S650 (that is, the enlargement processing of the preview display itself). FIG. 12B shows an example of the preview screen 1200 in which the preview display is scrolled downward and the central part of the form 1400 is displayed. As shown in both figures, in the present embodiment, the character area excluding the character area in the table is enlarged.

そして、S640のプレビュー表示の拡大率算出処理では、基準サイズ13を拡大してサイズが23となった領域が、規定サイズ30以上で表示されるようになる拡大率を算出する。さらに、S650、およびS660の処理により、図12(c)に示すようなプレビュー画面1200が表示される。 Then, in the enlargement ratio calculation process of the preview display of S640, the enlargement ratio at which the area where the reference size 13 is enlarged and the size becomes 23 is displayed at the specified size 30 or more is calculated. Further, by the processing of S650 and S660, the preview screen 1200 as shown in FIG. 12C is displayed.

ここでは、表内の文字領域を拡大対象から除外する例を説明したが、表以外から、ファイル名の設定に使用しない文字領域を除外するようにしてもよい。例えば、縦横比が所定値以上の文字領域を除くことで、ファイル名に使用されにくい長い文字列を含む文字領域を除外することができる。あるいは、原稿の下部にある文字領域を除外したり、サイズが所定値以下である文字領域を除外したりしてもよい。 Here, an example of excluding the character area in the table from the expansion target has been described, but the character area not used for setting the file name may be excluded from other than the table. For example, by excluding a character area having an aspect ratio of a predetermined value or more, it is possible to exclude a character area containing a long character string that is difficult to be used in a file name. Alternatively, the character area at the bottom of the document may be excluded, or the character area whose size is equal to or less than a predetermined value may be excluded.

<第3の実施形態>
上述した実施形態では、文字領域を拡大してファイル名文字列設定領域として表示する例を説明した。一方、本実施形態では、文字領域を拡大して表示せずに、ユーザが選択可能な領域自体を拡大することで、ユーザによる文字領域の選択を容易にする。本実施形態におけるプレビュー画面の例を、図7を参照して以下に説明する。
<Third embodiment>
In the above-described embodiment, an example of enlarging the character area and displaying it as a file name character string setting area has been described. On the other hand, in the present embodiment, the character area itself that can be selected by the user is enlarged without enlarging and displaying the character area, thereby facilitating the user's selection of the character area. An example of the preview screen in this embodiment will be described below with reference to FIG. 7.

図7(a)は、上述したように、文字領域が拡大して表示されていないプレビュー画面700を示している。一方、図7(b)は、文字領域が拡大して表示されているプレビュー画面700を示す。本実施形態では、あくまで表示上は、図7(a)のプレビュー画面700のように、文字領域を拡大せずに表示するが、ユーザがタッチして選択可能な領域は、図7(b)のプレビュー画面700のように、拡大した領域を用いる。 FIG. 7A shows a preview screen 700 in which the character area is not enlarged and displayed as described above. On the other hand, FIG. 7B shows a preview screen 700 in which the character area is enlarged and displayed. In the present embodiment, the character area is displayed without being enlarged as in the preview screen 700 of FIG. 7A, but the area that can be touched and selected by the user is shown in FIG. 7B. An enlarged area is used as in the preview screen 700 of.

このように、本発明におけるプレビュー画面では、文字領域を拡大して表示せずに、ユーザが選択可能な領域自体を拡大することで、ユーザによる文字領域の選択を容易にすることができる。 As described above, in the preview screen of the present invention, the user can easily select the character area by enlarging the area itself that can be selected by the user without enlarging and displaying the character area.

<その他の実施形態>
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
<Other embodiments>
The present invention supplies a program that realizes one or more functions of the above-described embodiment to a system or device via a network or storage medium, and one or more processors in the computer of the system or device reads and executes the program. It can also be realized by processing. It can also be realized by a circuit (for example, ASIC) that realizes one or more functions.

Claims (15)

文書をスキャンして得られたスキャン画像データに関連する情報を設定するための装置であって、
前記スキャン画像データに含まれる複数の文字領域を判定する領域判定手段と、
前記判定された複数の文字領域の中から所望の文字領域をユーザが選択するために、前記スキャン画像データをプレビュー画面に表示する表示手段とを備え、
前記ユーザが選択する際に用いる文字領域は、前記領域判定手段で判定された文字領域を拡大したものであることを特徴とする装置。
A device for setting information related to scanned image data obtained by scanning a document.
An area determination means for determining a plurality of character areas included in the scanned image data, and an area determination means.
A display means for displaying the scanned image data on the preview screen in order for the user to select a desired character area from the determined plurality of character areas is provided.
A device characterized in that the character area used when the user selects the character area is an enlargement of the character area determined by the area determination means.
前記文字領域を、前記文字領域の基準サイズから所定のサイズに拡大する拡大幅を算出し、
前記ユーザが選択する際に用いる文字領域は、前記拡大幅に基づいて、前記領域判定手段で判定された文字領域を拡大したものであることを特徴とする請求項1に記載の装置。
The enlargement width for expanding the character area from the reference size of the character area to a predetermined size is calculated.
The apparatus according to claim 1, wherein the character area used when the user selects the character area is an enlargement of the character area determined by the area determination means based on the enlargement width.
前記基準サイズは、前記スキャン画像データに含まれる同じサイズの文字領域の数に応じて決定されることを特徴とする請求項2に記載の装置。 The apparatus according to claim 2, wherein the reference size is determined according to the number of character areas of the same size included in the scanned image data. 前記基準サイズは、前記文字領域の高さであることを特徴とする請求項2または3に記載の装置。 The device according to claim 2 or 3, wherein the reference size is the height of the character area. 前記所定のサイズは、前記ユーザが前記スキャン画像データの前記文字領域を選択しやすいように予め規定されたサイズであることを特徴とする請求項2乃至4のいずれか1項に記載の装置。 The apparatus according to any one of claims 2 to 4, wherein the predetermined size is a size predetermined so that the user can easily select the character area of the scanned image data. 前記表示手段は、さらに、
文字領域間の間隔に応じて、文字領域同士が重ならないように前記拡大幅を補正することを特徴とする請求項2乃至5のいずれか1項に記載の装置。
The display means further
The apparatus according to any one of claims 2 to 5, wherein the enlarged width is corrected so that the character areas do not overlap each other according to the space between the character areas.
前記スキャン画像データにおける前記文字領域のうち、前記スキャン画像データに関連する情報の設定に使用しない文字領域を除いて、前記拡大幅を算出し、前記スキャン画像データに関連する情報の設定に使用しない文字領域以外の文字領域を拡大することを特徴とする請求項2乃至6のいずれか1項に記載の装置。 Of the character area in the scanned image data, the enlarged width is calculated except for the character area that is not used for setting the information related to the scanned image data, and is not used for setting the information related to the scanned image data. The apparatus according to any one of claims 2 to 6, wherein the character area other than the character area is enlarged. 前記スキャン画像データに関連する情報の設定に使用しない文字領域は、前記文書に含まれる表内の文字領域、縦横比が所定値以上の文字領域、または、サイズが所定値以下である文字領域を少なくとも含むことを特徴とする請求項7に記載の装置。 The character area not used for setting the information related to the scanned image data is a character area in the table included in the document, a character area having an aspect ratio of a predetermined value or more , or a character area having a size of a predetermined value or less. The apparatus according to claim 7, wherein the apparatus includes at least a character area. 前記表示手段は、さらに、
前記拡大した文字領域が前記所定のサイズより小さい場合に、前記拡大した文字領域が前記所定のサイズで表示されるように、前記スキャン画像データを拡大して表示することを特徴とする請求項2乃至8のいずれか1項に記載の装置。
The display means further
2. The second aspect of the present invention is to enlarge and display the scanned image data so that the enlarged character area is displayed in the predetermined size when the enlarged character area is smaller than the predetermined size. The apparatus according to any one of 8 to 8.
前記表示手段は、前記拡大した文字領域が前記所定のサイズで表示されるように前記スキャン画像データの拡大率を決定し、前記拡大率に基づいて前記スキャン画像データを拡大することを特徴とする請求項9に記載の装置。 The display means is characterized in that the enlargement ratio of the scan image data is determined so that the enlarged character area is displayed in the predetermined size, and the scan image data is enlarged based on the enlargement ratio. The device according to claim 9. 前記文字領域上下左右方向、または上下方向のみに拡大することを特徴とする請求項1乃至10のいずれか1項に記載の装置。 The apparatus according to any one of claims 1 to 10, wherein the character area is expanded only in the vertical and horizontal directions or in the vertical direction. 前記表示手段は、前記文字領域を拡大された状態で表示することを特徴とする請求項1乃至11のいずれか1項に記載の装置。 The device according to any one of claims 1 to 11, wherein the display means displays the character area in an enlarged state. 前記スキャン画像データに関連する情報は、前記スキャン画像データのファイル名であって、前記ファイル名は、前記ユーザにより選択された前記所望の文字領域を文字認識処理した結果に基づいて設定されることを特徴とする請求項1乃至12のいずれか1項に記載の装置。 The information related to the scanned image data is a file name of the scanned image data, and the file name is set based on the result of character recognition processing of the desired character area selected by the user. The apparatus according to any one of claims 1 to 12, wherein the apparatus is characterized by. コンピュータを、請求項1乃至13のいずれか1項に記載の装置として機能させるためのプログラム。 A program for operating a computer as the device according to any one of claims 1 to 13. 文書をスキャンして得られたスキャン画像データに関連する情報を設定するための方法であって、
前記スキャン画像データに含まれる複数の文字領域を判定する領域判定ステップと、
前記判定された複数の文字領域の中から所望の文字領域をユーザが選択するために、前記スキャン画像データをプレビュー画面に表示する表示ステップを含み、
前記ユーザが選択する際に用いる文字領域は、前記領域判定ステップで判定された文字領域を拡大したものであることを特徴とする方法。
A method for setting information related to scanned image data obtained by scanning a document.
An area determination step for determining a plurality of character areas included in the scanned image data, and
Including a display step of displaying the scanned image data on the preview screen in order for the user to select a desired character area from the plurality of determined character areas.
A method characterized in that the character area used when the user selects is an enlargement of the character area determined in the area determination step.
JP2018090707A 2018-05-09 2018-05-09 Devices, methods, and programs for setting information related to scanned image data. Active JP7077127B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018090707A JP7077127B2 (en) 2018-05-09 2018-05-09 Devices, methods, and programs for setting information related to scanned image data.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018090707A JP7077127B2 (en) 2018-05-09 2018-05-09 Devices, methods, and programs for setting information related to scanned image data.

Publications (2)

Publication Number Publication Date
JP2019197989A JP2019197989A (en) 2019-11-14
JP7077127B2 true JP7077127B2 (en) 2022-05-30

Family

ID=68537734

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018090707A Active JP7077127B2 (en) 2018-05-09 2018-05-09 Devices, methods, and programs for setting information related to scanned image data.

Country Status (1)

Country Link
JP (1) JP7077127B2 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021141379A (en) * 2020-03-03 2021-09-16 セイコーエプソン株式会社 Image reading device, image reading control method, and program
JP7404943B2 (en) 2020-03-10 2023-12-26 富士フイルムビジネスイノベーション株式会社 Information processing device and information processing program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005311729A (en) 2004-04-22 2005-11-04 Kyocera Mita Corp Device and program for preparing file name

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005311729A (en) 2004-04-22 2005-11-04 Kyocera Mita Corp Device and program for preparing file name

Also Published As

Publication number Publication date
JP2019197989A (en) 2019-11-14

Similar Documents

Publication Publication Date Title
JP6891073B2 (en) A device for setting a file name, etc. on a scanned image, its control method, and a program.
JP7034730B2 (en) Devices, methods, and programs for setting information related to scanned images
JP6953230B2 (en) A device for setting a file name, etc. on a scanned image, its control method, and a program.
JP6968647B2 (en) A device for setting a file name for a scanned image, its control method, and a program.
JP6983675B2 (en) Devices, methods, programs, and systems for setting information related to scanned images
JP7062388B2 (en) A device for setting a file name, etc. on a scanned image, its control method, and a program.
US11144189B2 (en) Determination and relocation of movement targets based on a drag-and-drop operation of a thumbnail across document areas
JP4557071B2 (en) Image processing system and image data transfer method
JP7077127B2 (en) Devices, methods, and programs for setting information related to scanned image data.
JP6983687B2 (en) Devices, methods, and programs for setting information related to scanned image data.
JP2017049865A (en) Document generation system, document server, document generation method and computer program
JP7476557B2 (en) DEVICE, PROCESSING EXECUTION SYSTEM, PROCESSING EXECUTION METHOD, AND PROGRAM
JP6458427B2 (en) Information processing apparatus, recording system, and program
CN114500761A (en) Computer-readable recording medium storing control program, and terminal
JP2021026604A (en) Image processing device, image processing method and program
JP2019068323A (en) Device for setting file name for scanned image, control method thereof, and program
JP7150967B2 (en) Apparatus, method, and program for setting information related to scanned images
JP6432249B2 (en) Information processing apparatus, recording system, and program
JP7036188B2 (en) Information processing equipment, recording systems, and programs
JP6813079B2 (en) Information processing equipment, recording systems, and programs
JP6642693B2 (en) Terminal device, recording system, and program
JP2012235296A (en) Image data processor, image data processing method, and computer program
JP7030505B2 (en) Devices, methods, and programs for setting information related to scanned images
JP2021149334A (en) Information processing apparatus, information processing method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210506

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220131

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220208

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220408

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220419

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220518

R151 Written notification of patent or utility model registration

Ref document number: 7077127

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151