JP2016024488A - Image processing apparatus and method of controlling the same - Google Patents

Image processing apparatus and method of controlling the same Download PDF

Info

Publication number
JP2016024488A
JP2016024488A JP2014145919A JP2014145919A JP2016024488A JP 2016024488 A JP2016024488 A JP 2016024488A JP 2014145919 A JP2014145919 A JP 2014145919A JP 2014145919 A JP2014145919 A JP 2014145919A JP 2016024488 A JP2016024488 A JP 2016024488A
Authority
JP
Japan
Prior art keywords
image data
character string
folder
unit
match
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014145919A
Other languages
Japanese (ja)
Inventor
みね子 佐藤
Mineko Sato
みね子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014145919A priority Critical patent/JP2016024488A/en
Publication of JP2016024488A publication Critical patent/JP2016024488A/en
Pending legal-status Critical Current

Links

Images

Abstract

PROBLEM TO BE SOLVED: To create a name of a folder/file for managing an electronic document, by use of a character string intended by a user, when a manuscript is converted into an electronic document.SOLUTION: An image processing apparatus includes: input means for inputting multiple pieces of image data; specifying means for specifying a position of a character string included in input first image data; determination means which determines coincidence between a first character string in the first image data corresponding to the specified position and a second character string in second image data corresponding to the specified position; and storage means which stores the first image data and the second image data in the same folder when the determination means determines that the first character string coincides with the second character string, and stores the first image data and the second image date in different folders when the determination means determines that the first character string does not coincide with the second character string.SELECTED DRAWING: Figure 8

Description

本発明は、画像データを用いて電子化文書を生成する画像処理装置および該画像処理装置の制御方法に関するものである。   The present invention relates to an image processing apparatus that generates an electronic document using image data and a control method for the image processing apparatus.

画像処理装置で、紙の原稿を読み取ることにより得られる画像データを、装置内部の記憶部に電子化して保存することができる。従来、このように電子化された画像データの保存を行う場合、装置固有のヘッダ情報や文字列に、通し番号を付与した文字列を、電子化された画像データのファイルのファイル名や、このファイルの保存先であるフォルダのフォルダ名に適用することが多い。このため、画像処理装置の使用者が、保存対象とするフォルダあるいはファイルに対して、任意のフォルダ名やファイル名を指定したい場合、装置の操作パネル等から、ファイル名や、フォルダ名の入力を必要とする。
そこで特許文献1では、画像処理装置が読取った画像データを電子化して保存する際、電子化された画像データが保存されるフォルダの名称或いは電子化された画像データのファイルの名称と原稿との相関性を高めて使用者の利便性を向上させる方法が開示される。
Image data obtained by reading a paper document with an image processing apparatus can be digitized and stored in a storage unit inside the apparatus. Conventionally, when storing digitized image data in this way, a character string in which a serial number is added to the header information and character string unique to the device, the file name of the digitized image data file, and this file It is often applied to the folder name of the folder where the file is saved. For this reason, when the user of the image processing apparatus wants to specify an arbitrary folder name or file name for the folder or file to be saved, input the file name or folder name from the operation panel of the apparatus. I need.
Therefore, in Patent Document 1, when the image data read by the image processing apparatus is digitized and saved, the name of the folder in which the digitized image data is saved or the name of the digitized image data file and the document. A method for improving the convenience of the user by increasing the correlation is disclosed.

その方法は、読取られた原稿中の所定位置に文字、文字列が認識出来た場合は認識した文字あるいは文字列をファイル名とし、認識できなかった場合は読み取った日時をファイル名とすることが示されている。   In the method, if a character or character string can be recognized at a predetermined position in the read document, the recognized character or character string is used as the file name. If the character or character string is not recognized, the read date is used as the file name. It is shown.

特開2005−56315号公報JP 2005-56315 A

しかしながら、特許文献1に示されている方法では、認識された文字、あるいは文字列が使用者にとって指定したいフォルダ名やファイル名と合致しない場合もある。また、読み取った日時がフォルダ名やファイル名となった場合においては、原稿を読み取ることで得られた画像データの内容と、この画像データを保存する際の保存先であるフォルダの名称と、保存時のファイルの名称との相関が取り辛い。   However, in the method disclosed in Patent Document 1, the recognized character or character string may not match the folder name or file name that the user wants to specify. In addition, when the read date / time is a folder name or file name, the contents of the image data obtained by reading the document, the name of the folder that is the save destination when saving the image data, and the save Correlation with the name of the file is difficult.

上記課題を解決するために本発明の画像処理装置は、複数の画像データを入力する入力手段と、
前記入力手段で入力された第1の画像データに含まれる文字列の位置を指定する指定手段と、
前記指定手段により指定された位置に対応する前記第1の画像データにおける第1の文字列と、前記指定手段によって指定された位置に対応する第2の画像データにおける第2の文字列との一致を判定する判定手段と、前記判定手段により前記第1の文字列と前記第2の文字列が一致すると判定された場合、前記第1の画像データと前記第2の画像データは同一のフォルダに保存し、
前記判定手段により前記第1の文字列と前記第2の文字列が一致しないと判定された場合、前記第1の画像データと前記第2の画像データは、別のフォルダに保存する保存手段と、を有することを特徴とする。
In order to solve the above problems, an image processing apparatus of the present invention includes an input unit that inputs a plurality of image data,
Designating means for designating the position of a character string included in the first image data input by the input means;
Matching between the first character string in the first image data corresponding to the position designated by the designation means and the second character string in the second image data corresponding to the position designated by the designation means When the determination unit determines that the first character string and the second character string match, the first image data and the second image data are stored in the same folder. Save and
Storage means for storing the first image data and the second image data in different folders when the determination means determines that the first character string and the second character string do not match; It is characterized by having.

本発明によれば、複数の画像データを電子化する場合、使用者に選択された位置にある文字列が一致または不一致または、一部のみ一致する場合のそれぞれに応じた形態でフォルダを構築できる。この結果、入力画像データの内容と、この入力画像データを保存する際のフォルダ(ファイル)管理の相関性を高めることが可能となる。   According to the present invention, when a plurality of image data is digitized, a folder can be constructed in a form corresponding to each of cases where a character string at a position selected by the user matches, does not match, or only partially matches. . As a result, it is possible to increase the correlation between the contents of the input image data and folder (file) management when the input image data is stored.

本実施形態1の構成を示す図。FIG. 3 is a diagram illustrating a configuration of the first embodiment. 文字判定部の構成図。The block diagram of a character determination part. 操作パネル部の構成図。The block diagram of an operation panel part. 文字判定結果の一例を示す図。The figure which shows an example of a character determination result. 入力画像データの一例。An example of input image data. 本実施形態1、2における表示形態の一例。An example of the display form in the first and second embodiments. 本実施形態1におけるフォルダ生成例。An example of folder generation in the first embodiment. 第1実施例の制御フロー。The control flow of 1st Example. 第2実施例の制御フロー。The control flow of 2nd Example. 第3実施例の制御フロー。The control flow of 3rd Example.

[第1実施例]
以下、本発明を実施するための形態について図面を用いて説明する。図1は、本実施例を実施するために必要な画像処理装置の構成を示す図である。本画像処理装置は、少なくとも主制御部40を中心に、画像入力部10、記憶部20、操作パネル部30により構成される。同図において、画像入力部10は、紙の原稿を光学的に読み取ることで得られる画像データ、あるいは図示しない通信網を経由して入力される画像データを受ける。記憶部20は、画像入力部10により入力される画像データの記憶、あるいは主制御部40の制御情報を記憶する。操作パネル部30は、本画像処理装置に対して動作指示を行う入力部と、動作状態を表示する表示部により構成される。図3に操作パネル部30の詳細構成を示す。図3において、表示部301は、例えばタッチパネル等により構成される。テンキー302は操作に係る設定項目等を設定し、スタートキー303は本画像処理装置に対しての動作起動の指示を受ける際に押下される。ストップキー304は本画像処理装置の動作の中止を指示するためのキーである。リセットキー305はテンキー302による設定の初期化に用いられる。動作モード設定キー306は本画像処理装置の動作モードの設定を指示するためのキーである。なお、これらの各キーはハードキーに限定されるものではなく、表示部301に構成したソフトキーであっても良い。
[First embodiment]
Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a configuration of an image processing apparatus necessary for implementing this embodiment. The image processing apparatus includes at least a main control unit 40 and an image input unit 10, a storage unit 20, and an operation panel unit 30. In the figure, an image input unit 10 receives image data obtained by optically reading a paper document or image data input via a communication network (not shown). The storage unit 20 stores image data input by the image input unit 10 or control information of the main control unit 40. The operation panel unit 30 includes an input unit that gives an operation instruction to the image processing apparatus and a display unit that displays an operation state. FIG. 3 shows a detailed configuration of the operation panel unit 30. In FIG. 3, the display unit 301 is configured by a touch panel, for example. The numeric keypad 302 sets setting items related to the operation, and the start key 303 is pressed when receiving an operation start instruction to the image processing apparatus. A stop key 304 is a key for instructing to stop the operation of the image processing apparatus. A reset key 305 is used for initialization of settings by the numeric keypad 302. An operation mode setting key 306 is a key for instructing setting of an operation mode of the image processing apparatus. Note that these keys are not limited to hard keys, and may be soft keys configured on the display unit 301.

図1の主制御部40は、CPU(Central Processing Unit)、CPUの起動プログラムを格納したROM、このプログラムの実行領域としてのRAM、過去に入力された画像データから生成された中間データ保存用のストレージとしてHDDやSSD、入出力インターフェース(いずれも不図示)を有する。そしてこの主制御部40は、画像入力部10、記憶部20、操作パネル部30を制御する。   The main control unit 40 in FIG. 1 includes a CPU (Central Processing Unit), a ROM storing a CPU startup program, a RAM as an execution area of the program, and an intermediate data storage generated from image data input in the past. The storage includes an HDD, an SSD, and an input / output interface (all not shown). The main control unit 40 controls the image input unit 10, the storage unit 20, and the operation panel unit 30.

また、主制御部40には、画像入力部10から入力される画像データ中に含まれる文字を判定する文字判定部401、複数枚の入力画像データのレイアウト位置をふまえた一致箇所、あるいは相違箇所を判定する一致判定部402を含む。さらに、主制御部40は、一致判定部402による判定結果に応じ、操作パネル部30に構成した表示部301に表示する情報を制御する表示制御部403、表示制御部403の制御により表示した内容の選択に応じてフォルダを生成するフォルダ生成部404を含む。   In addition, the main control unit 40 includes a character determination unit 401 that determines characters included in the image data input from the image input unit 10, a matching part based on layout positions of a plurality of input image data, or a different part A match determination unit 402 for determining Furthermore, the main control unit 40 controls the information displayed on the display unit 301 configured on the operation panel unit 30 according to the determination result by the coincidence determination unit 402, and the content displayed by the control of the display control unit 403. A folder generation unit 404 that generates a folder in response to the selection of.

図2に文字判定部401の内部構成を示す。文字判定部401は、主にOCR(Optical Character Reader)をもとに構成される。OCRとは、光学的文字認識のことである。入力画像データが、紙原稿を光学的に読取ることで得られるデータである場合、入力画像データから切り出したデータと、事前に記憶されたパターンとの照合によって、文字を特定し、テキストデータに変換出力するものである。したがって、文字判定部401は、OCRを構成する各処理部であるレイアウト解析部4011、切り出し部4012、特徴抽出部4013、照合部4014、辞書部4015、一時記憶部4016により構成される。   FIG. 2 shows an internal configuration of the character determination unit 401. The character determination unit 401 is mainly configured based on an OCR (Optical Character Reader). OCR is optical character recognition. If the input image data is data obtained by optically reading a paper document, characters are identified by matching the data extracted from the input image data with a pre-stored pattern and converted to text data Output. Therefore, the character determination unit 401 includes a layout analysis unit 4011, a cutout unit 4012, a feature extraction unit 4013, a collation unit 4014, a dictionary unit 4015, and a temporary storage unit 4016, which are processing units that constitute the OCR.

なお、入力画像データが通信網を経由して得られる画像データである場合、画像データに含まれるテキストデータを分析するテキストデータ分析部(不図示)が構成されていればよい。   If the input image data is image data obtained via a communication network, a text data analysis unit (not shown) that analyzes text data included in the image data may be configured.

レイアウト解析部4011は、画像入力部10から入力される画像データを、文字領域と画像領域に分離し、文字領域のかたまり配置の解析、および文字認識する順番を決定する。同一形態で構成される画像データを複数ページ分入力した場合、それぞれのページの画像データにおいて構成される文字領域および画像領域の配置結果は同一のものであるとレイアウト解析部4011により解析される。よって、それぞれの画像データにおいて文字認識される順番は同一になる。   The layout analysis unit 4011 separates the image data input from the image input unit 10 into a character area and an image area, analyzes the cluster arrangement of the character area, and determines the character recognition order. When a plurality of pages of image data configured in the same form are input, the layout analysis unit 4011 analyzes that the arrangement result of the character area and the image area configured in the image data of each page is the same. Therefore, the order of character recognition in each image data is the same.

つまり、レイアウト解析部4011の解析結果に準じて、以降の文字データの変換を行えば、複数のページにおける画像データ間の文字、文字列の一致箇所、相違箇所の判定が出来る。   That is, according to the analysis result of the layout analysis unit 4011, if the subsequent character data conversion is performed, it is possible to determine the character data, character string matching location, and different location between image data in a plurality of pages.

切り出し部4012は、レイアウト解析部4011で検出した文字領域のかたまりを、まず1行毎に分割し、分割した1行の文字領域を、更に1文字ずつに分解する。特徴抽出部4013は、分割された文字が持つ特徴、例えば縦方向、横方向、斜め方向にどのような線で構成されているかの抽出を行う。照合部4014は、特徴抽出部4013により抽出した特徴を辞書部4015に記憶した情報と照合し、文字データをテキストデータに変換する。照合部4014の照合により決定したテキストデータは、一時記憶部4016に記憶する。なお、入力画像データが通信網を経由して得られる画像データである場合、すでに画像データにテキストデータが含まれているため、このテキストデータを一時記憶部4016に記憶する。   The cutout unit 4012 first divides the chunk of the character area detected by the layout analysis unit 4011 into one line, and further decomposes the divided character area into one character. The feature extraction unit 4013 extracts features of the divided characters, for example, what lines are formed in the vertical direction, the horizontal direction, and the diagonal direction. The collation unit 4014 collates the feature extracted by the feature extraction unit 4013 with the information stored in the dictionary unit 4015, and converts the character data into text data. The text data determined by the collation by the collation unit 4014 is stored in the temporary storage unit 4016. Note that when the input image data is image data obtained via a communication network, the text data is already included in the image data, and thus the text data is stored in the temporary storage unit 4016.

別図を用いて、一時記憶部4016への記憶構成に関して説明する。図4(a)は取得された画像データの一例を示すものである。レイアウト解析部4011の解析により、図4(a)に示す画像データ中の文字領域は、図中の4(A)〜4(M)示すレイアウトとして解析される。切り出し部4012は、文字のかたまり番号の小さい方から順に1行ずつ切り出し、さらに1文字ずつ切り出す。切り出した文字データは、特徴抽出部4013により文字の特徴が抽出され、照合部4014による辞書部4015の情報との照合によりテキストデータに変換される。このとき、記憶部4016に記憶する構成を、変換されたテキストデータのブランク領域(白データ領域)で挟まれた1行構成とすると、記憶部4016には、図4(b)に示すように記憶される。   A storage configuration in the temporary storage unit 4016 will be described with reference to another drawing. FIG. 4A shows an example of the acquired image data. By the analysis of the layout analysis unit 4011, the character region in the image data shown in FIG. 4A is analyzed as a layout shown in 4 (A) to 4 (M) in the drawing. The cutout unit 4012 cuts out one line at a time in order from the smallest character group number, and cuts out one character at a time. Character features of the extracted character data are extracted by the feature extraction unit 4013 and converted to text data by collation with information in the dictionary unit 4015 by the collation unit 4014. At this time, if the configuration stored in the storage unit 4016 is a one-line configuration sandwiched between blank regions (white data regions) of converted text data, the storage unit 4016 has a configuration as shown in FIG. Remembered.

主制御部40は、1枚の原稿を読み取ることで得られた画像データをテキストデータへ変換する処理が完了すると、一時記憶部4016に記憶したテキストデータを用いて、中間のファイルデータ(テンポラリのファイルデータ等)を生成する。次に、主制御部40は、生成された中間ファイルデータを、一時記憶部4016から読み取ったテキストデータと関連付けした状態で記憶部20に記憶する。なお、生成される中間のファイルデータを参照することで一時記憶部4016に記憶したデータが、記憶されている順番で識別出来る場合、一時記憶部4016から読み取ったテキストデータを記憶部20に別途記憶する必要はない。   When the process of converting the image data obtained by reading one original into text data is completed, the main control unit 40 uses the text data stored in the temporary storage unit 4016 to generate intermediate file data (temporary file data). File data etc.). Next, the main control unit 40 stores the generated intermediate file data in the storage unit 20 in a state associated with the text data read from the temporary storage unit 4016. If the data stored in the temporary storage unit 4016 can be identified in the stored order by referring to the generated intermediate file data, the text data read from the temporary storage unit 4016 is separately stored in the storage unit 20. do not have to.

主制御部40の動作に関して、画像データの例を挙げて説明する。図5(a)〜(c)、(g)は画像入力部10に入力される画像データの一例である。いずれも、帳票データ、伝票データに見られる同一文書形態(同一レイアウト構成)の画像1ページ分を読取ることで取得され、記載内容の一部が異なるものとなっている。例えば、『御請求書』の文字列、請求先の後の『御中』の文字列、請求元の会社名、住所などはいずれも同じものとなっている。一方、請求先への金額や、担当欄の内容は各々異なったものとなっている。   The operation of the main control unit 40 will be described with an example of image data. FIGS. 5A to 5C are examples of image data input to the image input unit 10. Both are obtained by reading one page of images of the same document form (same layout configuration) found in the form data and slip data, and some of the description contents are different. For example, the character string of “Invoice”, the character string of “Gochu” after the billing party, the company name and address of the billing source are all the same. On the other hand, the amount to the billing destination and the contents of the charge column are different.

図5(a)〜図5(c)、(g)の画像データから抽出され、一時記憶部4016に記憶されるテキストデータに対し、文字判定部401によって行われた判定結果をそれぞれ図5(d)〜図5(f)、(h)に示す。主制御部40は、一時記憶部4016に記憶された図5(d)〜図5(f)、(h)のテキストデータと、図5(a)〜図5(c)、(g)の電子化した中間のファイルデータを記憶部20に記憶する。なお、本実施例では、画像入力部10に入力する図5(a)〜図5(c)、(g)から抽出された文字データを全てテキストデータに変換した後に、一時記憶部4016からテキストデータを読み出し、記憶部20に記憶するものとした。しかし、主制御部40による記憶部20への制御はこれに限定されるものではない。すなわち、画像入力部10に入力される画像データ毎に、一時記憶部4016に記憶されたテキストデータを記憶部20に記憶するように制御しても良い。   5 (a) to FIG. 5 (c) and FIG. 5 (g) are extracted from the image data and stored in the temporary storage unit 4016. The determination results performed by the character determination unit 401 are respectively shown in FIG. d) to FIG. 5 (f), (h). The main control unit 40 stores the text data of FIGS. 5D to 5F and 5H stored in the temporary storage unit 4016, and FIGS. 5A to 5C and 5G. The computerized intermediate file data is stored in the storage unit 20. In this embodiment, after all the character data extracted from FIG. 5A to FIG. 5C and FIG. 5G input to the image input unit 10 are converted into text data, the text is stored in the temporary storage unit 4016. Data was read out and stored in the storage unit 20. However, the control of the storage unit 20 by the main control unit 40 is not limited to this. That is, control may be performed so that the text data stored in the temporary storage unit 4016 is stored in the storage unit 20 for each image data input to the image input unit 10.

主制御部40は、文字判定部401によって行われた判定制御が終わると、表示制御部403による表示制御を行う。表示制御は、画像入力部10に入力された画像データを電子化することにより得た中間ファイルデータに対し、文字判定部401による判定結果を反映させる。図6(a)は、図5(a)の入力画像データを表示対象とした場合の操作パネル部30の表示状態を示す図である。   When the determination control performed by the character determination unit 401 ends, the main control unit 40 performs display control by the display control unit 403. In the display control, the determination result by the character determination unit 401 is reflected on the intermediate file data obtained by digitizing the image data input to the image input unit 10. FIG. 6A is a diagram illustrating a display state of the operation panel unit 30 when the input image data of FIG. 5A is a display target.

なお、表示方法は図6に示した各領域を矩形で囲う方法601に限定されるものではなく、たとえば、入力された画像データすべてを表示せずに、画像データから得られたテキスト情報をリスト化したものを表示しても良い。   Note that the display method is not limited to the method 601 in which each area shown in FIG. 6 is enclosed by a rectangle. For example, text information obtained from image data is listed without displaying all input image data. You may display the thing.

主制御部40は、表示制御部403による表示制御を終了すると、表示部301の表示に対する選択を待つ。表示されたレイアウトの選択方法は、表示部301が持つ機能に応じたものとなる。   When the display control by the display control unit 403 ends, the main control unit 40 waits for selection of the display on the display unit 301. The method for selecting the displayed layout depends on the function of the display unit 301.

主制御部40は、表示部301がタッチパネルであれば、押下された項目、および押下された座標位置に応じて制御を切り替える。また、表示部301がタッチパネルでない場合、主制御部40は、操作パネル部30に構成した不図示のキー操作による項目の選択結果に応じて制御を切り替える。   If the display unit 301 is a touch panel, the main control unit 40 switches control according to the pressed item and the pressed coordinate position. When the display unit 301 is not a touch panel, the main control unit 40 switches control according to the selection result of an item by key operation (not shown) configured on the operation panel unit 30.

主制御部40は表示部301にて押下された項目の一致判定制御を行う。主制御部40による一致判定制御は、一致判定部402により、記憶部20に記憶した各入力画像データから抽出した位置情報とそれぞれに含まれるテキストデータを抽出する。そして、各入力画像データにおいて共通の位置にあるテキストデータと比較し一致している場合に一致と判定する。
なお、画像データにおけるテキストデータの位置に関する情報は、テキストデータに含まれている。
The main control unit 40 performs matching determination control of the item pressed on the display unit 301. In the coincidence determination control by the main control unit 40, the coincidence determination unit 402 extracts position information extracted from each input image data stored in the storage unit 20 and text data included in each. Then, when the input image data matches the text data at the common position and matches, it is determined that they match.
Information regarding the position of the text data in the image data is included in the text data.

一致判定、不一致判定の詳細に関して説明する。表示部301の押下された項目が図5の(a)の“株式会社AAA御中”部分であった場合、図5(d)に示した範囲502と、(e)、(f)、(h)に含まれる範囲502が一致するか否かを一致判定部402により行う。   Details of the match determination and the mismatch determination will be described. When the item pressed on the display unit 301 is the “AAA Gochu” portion of FIG. 5A, the range 502 shown in FIG. 5D, and (e), (f), (h The coincidence determination unit 402 determines whether or not the ranges 502 included in () match.

図5(d)の範囲502のテキストデータは図5(e)、(f)の範囲502のテキストデータと内容が異なる。一方、図5(h)の範囲502のテキストデータと内容が一致していると判定される。つまり、図5(d)、(e)、(f)、(h)の範囲502に配置されるテキストデータは全て一致ではない(不一致)、しかし、この不一致箇所の中に図5(d)と(h)の範囲502に位置するテキストデータが一致であると判定される。   The text data in the range 502 in FIG. 5D is different in content from the text data in the range 502 in FIGS. On the other hand, it is determined that the content matches the text data in the range 502 in FIG. That is, the text data arranged in the range 502 shown in FIGS. 5D, 5E, 5F, and 5H are not all coincident (non-coincidence), but FIG. And the text data located in the range 502 of (h) are determined to match.

なお、一致判定部402による一致判定は、記憶部20に記憶されたテキストデータの完全一致でなくても良い。OCRによる文字データのテキストデータへの変換は、特徴抽出部4013により抽出された文字データの特徴と辞書部4015に記憶されているデータとの照合に基づくため、文字1つ1つに対しては誤判定を伴うことがある。したがって、文字列に対する一致判定数等に基づいて最終的な一致判定を行うようにしても良い。例えば、10文字分のテキストデータに対し、8文字分のテキストデータが一致していた場合、それらの文字列を一致と判断するように制御しても良い。   Note that the match determination by the match determination unit 402 may not be complete match of the text data stored in the storage unit 20. The conversion of character data into text data by OCR is based on collation between the characteristics of the character data extracted by the feature extraction unit 4013 and the data stored in the dictionary unit 4015. May be accompanied by misjudgment. Therefore, the final matching determination may be performed based on the number of matching determinations for the character string. For example, when text data for 8 characters matches text data for 10 characters, control may be performed so that these character strings are determined to match.

主制御部40は、各入力画像データにて選択された共通の領域にあるテキストデータが一致している場合、一致した文字列を使用した制御を行い、不一致の場合、選択された不一致判定位置に該当する不一致文字列を使用した制御を行う。   The main control unit 40 performs control using the matched character string when the text data in the common area selected in each input image data matches, and in the case of mismatch, the selected mismatch determination position Control using the mismatched character string corresponding to.

本実施例では、フォルダ生成部404による入力画像データの電子化結果を保存するフォルダ生成の方法を、選択された箇所にあるテキストデータが各入力画像データにて一致するか不一致であるかに応じて切り替える制御を行う。   In this embodiment, the folder generation method for storing the digitized result of the input image data by the folder generation unit 404 is determined according to whether the text data at the selected location matches or does not match in each input image data. To perform switching control.

また、選択された箇所にあるテキストデータが各入力画像データにて全て一致ではないが、一部一致することがある場合にも、入力画像データの電子化結果を保存するフォルダ生成の方法を切り替える。   Also, the text data at the selected location is not all the same in each input image data, but the folder generation method for saving the digitized result of the input image data is switched even when there is a partial match. .

以下、このフォルダ生成の方法について説明する。 図7(a)は、入力画像データが図5(a)〜(c)であり、各入力画像データにて選択された共通の領域にある文字列『御請求書』で一致した場合の、フォルダ生成部404によるフォルダ生成制御結果である。フォルダ生成部404は、選択された共通の位置にある一致した文字列を、記憶部20に生成するフォルダ名称として用いる。例えば、選択された領域にある文字列が『御請求書』であれば、『御請求書』をフォルダ名(701)とする。また、画像入力部10により入力された画像データを電子化した後の中間ファイルデータを統合ファイル(1つのファイル)とし、生成されたフォルダ内に記憶する。つまり、図5(a)、図5(b)、図5(c)の中間ファイルを統合し、各画像データの共通の位置にあり、一致と判定された文字列を使用した名称が付加されたフォルダに最終的な電子化ファイル(702)を記憶する。   Hereinafter, this folder generation method will be described. FIG. 7A shows the case where the input image data is that shown in FIGS. 5A to 5C and matches the character string “invoice” in the common area selected in each input image data. It is a folder generation control result by the folder generation unit 404. The folder generation unit 404 uses the matched character string at the selected common position as a folder name to be generated in the storage unit 20. For example, if the character string in the selected area is “invoice”, “invoice” is set as the folder name (701). Further, the intermediate file data after digitizing the image data input by the image input unit 10 is stored as an integrated file (one file) in the generated folder. That is, the intermediate files shown in FIGS. 5A, 5B, and 5C are integrated, and names using character strings that are determined to match at the common position of each image data are added. The final digitized file (702) is stored in the folder.

なお、記憶部20に記憶するファイル名称も、選択された領域にあり、各入力画像データにて一致と判定された文字列を用いてもよい。例えば、前記『御請求書』であれば、『御請求書』に通し番号等を付与したファイル名(例:御請求書_001)とする。このように制御することで、使用者の意図した文字列を使用したフォルダ名、およびファイル名を容易に生成することが出来る。   Note that the file name stored in the storage unit 20 may also be a character string that is in the selected area and determined to match in each input image data. For example, in the case of the “invoice”, a file name (eg, invoice_001) in which a serial number or the like is added to the “invoice”. By controlling in this way, it is possible to easily generate a folder name and a file name using a character string intended by the user.

次に、入力した画像データに対して選択された領域にある文字列が、入力した複数の画像データにおいて不一致の場合のフォルダ生成部404の制御に関して説明する。   Next, the control of the folder generation unit 404 when the character string in the selected area with respect to the input image data does not match in the plurality of input image data will be described.

図7(b)は、入力画像データが図5(a)〜(c)で、選択した領域に対応する各入力画像データの領域にある文字列が全て不一致と判定された領域である場合の、フォルダ生成部404によるフォルダ生成制御結果である。   FIG. 7B shows the case where the input image data is the area shown in FIGS. 5A to 5C and the character strings in the areas of the input image data corresponding to the selected area are all determined to be inconsistent. This is a folder generation control result by the folder generation unit 404.

フォルダ生成部404は、選択された領域にあるテキストデータが、各入力画像データにおいて不一致と判定された領域である場合、記憶部20に生成する各フォルダに付与する名を、この不一致と判定された領域にある文字列を用いる。   When the text data in the selected area is an area determined to be inconsistent in each input image data, the folder generation unit 404 determines that the name given to each folder generated in the storage unit 20 is this mismatch. The character string in the specified area is used.

本実施例において、各入力画像データにおいて、選択された領域に対応する文字列は、『株式会社AAA』、『BBB(株)』、『CCC工務店』である。よって、この不一致と判定される文字列を用いて、それぞれのフォルダに対してフォルダ名(703、704、705)を付与する。例えば『株式会社AAA』、『BBB(株)』、『CCC工務店』のというフォルダ名を各フォルダに付与する。   In this embodiment, in each input image data, the character strings corresponding to the selected area are “AAA Co., Ltd.”, “BBB Co., Ltd.”, and “CCC Contractor”. Therefore, folder names (703, 704, 705) are assigned to the respective folders using the character strings determined to be inconsistent. For example, folder names such as “AAA Co., Ltd.”, “BBB Co., Ltd.”, and “CCC Contractor” are assigned to each folder.

また、選択された領域にあるテキストデータが、各入力画像データにおいて不一致と判定された領域である場合、画像入力部10により入力された画像データを電子化し、それぞれ別のファイルとして、生成されたフォルダ内に記憶してもよい。つまり、入力画像データが図5(a)であれば、『株式会社AAA』というフォルダ名を有するフォルダ内に、図5(a)に示す入力画像データを電子化し、この中間ファイルデータ(706)を記憶する。同様に、入力画像データが図5(b)であれば、『BBB(株)』というフォルダ名を有するフォルダ内に、図5(b)に示す入力画像データを電子化し、この中間ファイルデータ(707)を記憶する。また同様にし、入力画像データが図5(c)であれば、『CCC工務店』というフォルダ名を有するフォルダ内に、図5(c)に示す入力画像データを電子化し、この中間ファイルデータ(708)を記憶する。   Further, when the text data in the selected area is an area determined to be inconsistent in each input image data, the image data input by the image input unit 10 is digitized and generated as separate files. It may be stored in a folder. That is, if the input image data is FIG. 5 (a), the input image data shown in FIG. 5 (a) is digitized in the folder having the folder name “AAA Inc.” and the intermediate file data (706). Remember. Similarly, if the input image data is FIG. 5B, the input image data shown in FIG. 5B is digitized in the folder having the folder name “BBB Co., Ltd.”, and this intermediate file data ( 707) is stored. Similarly, if the input image data is FIG. 5 (c), the input image data shown in FIG. 5 (c) is digitized in the folder having the folder name “CCC Engineering” and this intermediate file data ( 708).

なお、各々作成したフォルダ内に格納されるファイルに付与するファイル名に関しても、選択された領域にあり、各入力画像データにおいて不一致と判定された各文字列を用いてもよい。例えば、図5(a)に示す入力画像データであれば、フォルダ名が『株式会社AAA』であるフォルダ内に、『株式会社AAA』に通し番号等を付与したファイル名(例:株式会社AAA_001)を有するファイルを記憶する。すなわち、中間ファイルデータのリネームを行い記憶する。このように制御することで、使用者の意図した文字列を使用したフォルダ名を有するフォルダを生成することができる。またこのフォルダに格納されるファイルに対しても適切なファイル名を付与することが出来る。   In addition, regarding the file name assigned to the file stored in each created folder, each character string that is in the selected area and determined to be inconsistent in each input image data may be used. For example, in the case of the input image data shown in FIG. 5A, a file name in which a serial number or the like is assigned to “AAA” in a folder whose folder name is “AAA” (eg, AAA — 001). Store files with That is, the intermediate file data is renamed and stored. By controlling in this way, a folder having a folder name using a character string intended by the user can be generated. Appropriate file names can be assigned to files stored in this folder.

次に、入力画像データが図5(a)〜(c)、(g)であり、入力画像データに対して選択した領域にある文字列が、入力した複数の画像データにおいて一部のみ一致する場合のフォルダ生成部404の制御について説明する。   Next, the input image data is shown in FIGS. 5A to 5C and FIG. 5G, and the character string in the selected region with respect to the input image data only partially matches in the plurality of input image data. The control of the folder generation unit 404 will be described.

つまり、選択した領域に対応する各入力画像データの領域にある文字列がそれぞれ、『株式会社AAA』、『BBB(株)』、『CCC工務店』、『株式会社AAA』といったような、選択された領域にある文字列が一部のみ一致する場合の制御を説明する。   In other words, the character strings in the areas of the input image data corresponding to the selected area are selected as “AAA Co., Ltd.”, “BBB Co., Ltd.”, “CCC Corporation”, “AAA Corporation”, etc. The control when only a part of the character strings in the designated area matches will be described.

このとき、他の入力画像データと共通の文字列を有さない入力画像データに対しては、以下のように生成されるフォルダに格納される。すなわち、フォルダ生成部404により図7(c)に示すような、フォルダ名が『BBB(株)』(704)、『CCC工務店』(705)であるフォルダが生成され、フォルダにそれぞれ格納される
一方、他の入力画像データと共通の文字列を有する入力画像データに対しては、以下のように生成されるフォルダに格納される。すなわち、フォルダ生成部404により、図7(c)に示すような、フォルダ名が『株式会社AAA』(703)であるフォルダが生成され、この同フォルダ内に格納される。よって、このフォルダ内に別ファイルとして格納される。あるいは、同フォルダ内に1つのファイルにまとめて格納される。生成されるファイルを、図7(c)の709、710、または図7(d)の711に示す。
At this time, input image data not having a character string common to other input image data is stored in a folder generated as follows. That is, as shown in FIG. 7C, folders with the folder names “BBB Corporation” (704) and “CCC Contractor” (705) are generated by the folder generation unit 404 and stored in the folders. On the other hand, input image data having a character string common to other input image data is stored in a folder generated as follows. That is, the folder generation unit 404 generates a folder with the folder name “AAA Co., Ltd.” (703) as shown in FIG. 7C and stores it in the same folder. Therefore, it is stored as a separate file in this folder. Alternatively, they are stored together in one file in the same folder. The generated file is indicated by reference numerals 709 and 710 in FIG. 7C or 711 in FIG.

なお、各々作成したフォルダ内に格納されるファイルに付与するファイル名に関しても、選択された領域にあり、各入力画像データにおいて選択された一致と判定された文字列および不一致と判定された文字列を用いてもよい。   Note that the file name assigned to the file stored in each created folder is also in the selected area and the character string determined to match and the character string determined to be inconsistent in each input image data. May be used.

例えば、図5(a)、(g)に示す入力画像データに対して選択された領域にある文字列が『株式会社AAA』であれば、フォルダ名が『株式会社AAA』であるフォルダに、『株式会社AAA』に通し番号等のファイル名を付与したファイルを記憶する。例えば、株式会社AAA_001、株式会社AAA_002といったファイル名にする。   For example, if the character string in the area selected for the input image data shown in FIGS. 5A and 5G is “AAA”, the folder name is “AAA”. A file with a file name such as a serial number is stored in “AAA Corporation”. For example, file names such as AAA_001, Inc. and AAA_002, Inc. are used.

すなわち、中間ファイルデータのリネームを行い記憶する。このように制御することで、使用者の意図した文字列を使用したフォルダ名を有するフォルダを生成することができる。またこのフォルダに格納されるファイルに対しても適切なファイル名を付与することが出来る。   That is, the intermediate file data is renamed and stored. By controlling in this way, a folder having a folder name using a character string intended by the user can be generated. Appropriate file names can be assigned to files stored in this folder.

次に主制御部40の制御フローに関して説明する。図8は、第1実施例における制御フローを示す図である。なお、本フローの各ステップにおける処理は、以下に示す手順を記述したコンピュータ実行可能なプログラムをROM(405)からRAM(406)上に読み込んだ後に、CPU(407)によって該プログラムを実行することによって実施される。   Next, the control flow of the main control unit 40 will be described. FIG. 8 is a diagram showing a control flow in the first embodiment. The processing in each step of this flow is to read a computer-executable program describing the following procedure from the ROM (405) onto the RAM (406) and then execute the program by the CPU (407). Implemented by:

ステップS101にて使用者により、取得する画像データを電子化するための動作モードが選択されるとステップS102に進む。そしてステップS102にて、画像入力部10は画像データを取得する。取得された画像データは、光学的な読み取りを伴うものであればスキャンされた画像データとなり、通信網を介して入力されるものであれば受信データとなる。ステップS103にて画像入力部10は、全てのページの画像データが入力されたか否か判定を行い、画像入力部10により、全てのページの画像データが入力されたと判定されると、ステップS104に進む。そしてステップS104にて文字判定部401による文字判定処理を実施する。この文字判定部401による、文字判定処理は、画像入力部10により入力される1枚毎の画像データのレイアウト解析、データ切り出し、特徴抽出、照合、照合結果の記憶を行う。   When the user selects an operation mode for digitizing the acquired image data in step S101, the process proceeds to step S102. In step S102, the image input unit 10 acquires image data. The acquired image data is scanned image data if it is accompanied by optical reading, and is received data if it is input via a communication network. In step S103, the image input unit 10 determines whether image data of all pages has been input. If the image input unit 10 determines that image data of all pages has been input, the process proceeds to step S104. move on. In step S104, character determination processing by the character determination unit 401 is performed. The character determination processing by the character determination unit 401 performs layout analysis, data cutout, feature extraction, verification, and verification result storage for each piece of image data input by the image input unit 10.

ステップS105は使用者によって選択された画像データの電子化を行う時の動作モードを判断するものである。ステップS105では、画像データの電子化を行う動作モードの時、全てのページの画像データに共通する位置にある文字列の一致判定結果を用いるものでないと判断された場合、ステップS111に進む。そしてステップS111にて、生成するフォルダのフォルダ名を、日時を用いたものなど予め設定された所定のフォルダ名とする。そして、生成したフォルダ内に、文字判定部401により得たテキストデータを用いた電子化ファイルを記憶する。   In step S105, an operation mode for digitizing the image data selected by the user is determined. If it is determined in step S105 that the character string matching determination result at the position common to the image data of all pages is not used in the operation mode in which the image data is digitized, the process proceeds to step S111. In step S111, the folder name of the folder to be generated is set to a predetermined folder name set in advance, such as one using date and time. Then, an electronic file using text data obtained by the character determination unit 401 is stored in the generated folder.

ステップS105にて使用者によって設定された動作モードが、全てのページの画像データに共通する位置にある文字列の一致判定結果を用いるものであると判定された場合、ステップS106に進む。   If it is determined that the operation mode set by the user in step S105 uses the character string matching determination result at a position common to the image data of all pages, the process proceeds to step S106.

そしてステップS106では、表示制御部403にてレイアウトの結果を表示し、使用者はフォルダ名として利用したい文字列がある領域を選択する。次のステップS107にて、その選択領域にある文字列に対して一致判定部402による一致判定処理を実施する。   In step S106, the display control unit 403 displays the layout result, and the user selects an area having a character string to be used as a folder name. In the next step S107, a match determination process by the match determination unit 402 is performed on the character string in the selected area.

選択された領域にある文字列が、入力された複数の画像データで全て一致していないとステップS107で判断された場合はステップS108に進む。   If it is determined in step S107 that the character strings in the selected area do not match all the input image data, the process proceeds to step S108.

ステップS108にて、入力された複数の画像データで全て一致しない文字列の中に、一組でも一致する文字列がないかを一致判定部402が判断する。   In step S <b> 108, the match determination unit 402 determines whether there is a set of matching character strings in the character strings that do not match all of the input image data.

ステップS108で一組でも一致する文字列がある場合はステップS109に進む。
そして、ステップS109にて、フォルダ生成部404は選択された領域にあり、他の入力画像データの文字列と一致する文字列がない文字列として取得したテキストデータを用いたフォルダ名を有するフォルダ(図7の704、705)を生成する。また、他の入力画像データにある文字列と全て一致しないが一部一致する文字列として取得したテキストデータをフォルダ名としフォルダ(図7の703)を生成する。
If there is even one set of matching character strings in step S108, the process proceeds to step S109.
In step S109, the folder generation unit 404 is in the selected area and has a folder name using a folder name using text data acquired as a character string that has no character string that matches the character string of the other input image data ( 704 and 705) of FIG. 7 are generated. In addition, a folder (703 in FIG. 7) is generated with the text data acquired as a character string that does not match all the character strings in the other input image data but partially matches, as a folder name.

さらに、フォルダ生成部404はフォルダ(703)に、取得したテキストデータに対してそれぞれ別のファイル名(709、710)をつけて別のファイルとして記憶する。あるいは、生成したフォルダ(703)に、取得したテキストデータを1つのファイル(711)として名前を付けて記憶する。   Further, the folder generation unit 404 assigns different file names (709, 710) to the acquired text data and stores them as separate files in the folder (703). Alternatively, the acquired text data is named and stored as one file (711) in the generated folder (703).

一方、選択された領域にある文字列が、入力された複数の画像データにて、全て一致しない文字列の中に、一組でも一致する文字列がないとステップS108で判定された場合は、ステップS110に進む。そしてステップS110にて生成部404が、各入力された画像データにおける選択された領域にある文字列を用いた名称をそれぞれ有するフォルダを記憶部20に生成する。   On the other hand, if it is determined in step S108 that the character string in the selected area does not match at least one of the character strings that do not all match in the plurality of input image data, Proceed to step S110. In step S110, the generation unit 404 generates, in the storage unit 20, folders each having a name using a character string in the selected area in each input image data.

ステップS107で複数の画像データにて選択された領域にある文字列が一致している場合は、ステップS112に進。そしてステップS112にて、生成部404が、選択された文字列を用いた名称を有するフォルダを記憶部20に生成する。   If the character strings in the areas selected in the plurality of image data in step S107 match, the process proceeds to step S112. In step S112, the generation unit 404 generates a folder having a name using the selected character string in the storage unit 20.

なお、この生成されたフォルダは記憶部20に記憶されてもよいし、本実施例における画像処理装置に接続されたメモリに記憶されてもよい。   The generated folder may be stored in the storage unit 20, or may be stored in a memory connected to the image processing apparatus in the present embodiment.

以上、説明したように本実施例においては、帳票のような同一形態で構成される複数の画像データを電子化する場合、使用者に選択された位置にある文字列が一致または不一致または、一部のみ一致する場合のそれぞれに応じた形態でフォルダを構築できる。この結果、入力画像データの内容と、この入力画像データを保存する際のフォルダ(ファイル)管理の相関性を高めることが可能となる。   As described above, in the present embodiment, when a plurality of image data configured in the same form such as a form is digitized, the character strings at positions selected by the user match or do not match, Folders can be constructed in a form corresponding to each case where only the copies match. As a result, it is possible to increase the correlation between the contents of the input image data and folder (file) management when the input image data is stored.

更に、フォルダ内に記憶されるファイルの名称や記憶される形態も、使用者によって選択された文字列の一致または不一致または一部のみ一致のそれぞれに適合したものとなる。   Furthermore, the name of the file stored in the folder and the stored form are also adapted to match, match, or partially match the character strings selected by the user.

よって、画像データの電子化作業の効率化、および電子化後の視認性を向上させることが可能となる。   Therefore, it is possible to improve the efficiency of the digitization of image data and the visibility after digitization.

[第2実施例]
第1実施例は、使用者によって選択された領域にある文字列が、入力した複数の画像データの各領域にて全て一致したか否かまたは一部のみ一致しているかに応じてフォルダ構成、ファイル構成、さらにはフォルダ名、ファイル名を適宜制御するものであった。
[Second Embodiment]
In the first embodiment, the folder structure is determined depending on whether or not all the character strings in the area selected by the user match in each area of the plurality of input image data. The file structure, folder name, and file name were appropriately controlled.

本実施例では、この選択された領域にある文字列に対して一致判定を実施した後、使用者によって、領域を選択する例を説明する。   In the present embodiment, an example will be described in which a user selects a region after performing a match determination on a character string in the selected region.

実施例1と異なる部分を中心に図9のフロー図で説明する。なお、本フローの各ステップにおける処理は、以下に示す手順を記述したコンピュータ実行可能なプログラムをROM(405)からRAM(406)上に読み込んだ後に、CPU(407)によって該プログラムを実行することによって実施される。   A description will be given with reference to the flowchart of FIG. 9 focusing on the differences from the first embodiment. The processing in each step of this flow is to read a computer-executable program describing the following procedure from the ROM (405) onto the RAM (406) and then execute the program by the CPU (407). Implemented by:

ステップS205より前のステップは実施例1と同じであるため省略し、ステップS205以降を説明する。   Steps prior to step S205 are the same as those in the first embodiment, and will be omitted.

ステップS205にて、使用者によって設定された動作モードが、全ての画像データに共通する位置に対する文字列の一致判定結果を用いるものではないと判断された場合、ステップS212に進む。   If it is determined in step S205 that the operation mode set by the user does not use a character string match determination result for a position common to all image data, the process proceeds to step S212.

そしてステップS212にて、生成するフォルダ名を所定のものとする。そして、生成したフォルダ内に、文字判定部401により得たテキストデータを用いた名称を有する電子化ファイルを記憶する。一方、ステップS205にて、使用者によって設定された動作モードが、全ての画像データに共通する位置に対する文字列の一致判定結果を用いるものであると判定された場合、ステップS206に進む。そしてステップS206にて、一致判定部402による一致判定処理を実施する。一致判定部402による一致判定処理が終了すると、主制御部40の表示制御部403は、判定処理の結果を反映させた表示制御を行う。   In step S212, the folder name to be generated is a predetermined name. And the digitized file which has a name using the text data obtained by the character determination part 401 is memorize | stored in the produced | generated folder. On the other hand, if it is determined in step S205 that the operation mode set by the user uses a character string match determination result for a position common to all image data, the process proceeds to step S206. In step S <b> 206, a match determination process is performed by the match determination unit 402. When the coincidence determination process by the coincidence determination unit 402 ends, the display control unit 403 of the main control unit 40 performs display control that reflects the result of the determination process.

本実施形の表示制御部403による表示結果先の第1実施例にて説明した表示結果とはと異なる。本実施形の表示制御部403による表示結果を、図6(b)を用いて説明する。   The display result by the display control unit 403 of the present embodiment is different from the display result described in the first example. A display result by the display control unit 403 of the present embodiment will be described with reference to FIG.

図6(b)において、一致判定部402により、図5(a)〜図5(c)、(g)の複数の帳票の画像データにて共通する位置に対して記載されている内容が全ての画像データにて一致していると判定された文字列を符号602で示す網掛けで表示する。一方、図5(a)〜図5(c)、(g)複数の画像データの中で各画像データに共通する位置に対して記載されている内容が全ての画像データにて一致しない(不一致)と判定された文字列を符号603で示す網掛けで表示している。なお、一致および不一致の表示方法は前記表示形態に限定されるものではなく、一致した文字列と不一致の文字列とが判別出来るものであれば良い。例えば、操作パネル部30に構成した表示部301が、カラー表示可能なものであれば、一致した文字列と不一致の文字列を色分けで表示しても良い。また、表示部301が単色のみ表示可能なものであれば、点灯、点滅のような表示形態としても良い。   In FIG. 6B, all the contents described for the common positions in the image data of the plurality of forms in FIGS. 5A to 5C are all performed by the coincidence determination unit 402. A character string determined to match in the image data is displayed with shading indicated by reference numeral 602. On the other hand, the contents described in the positions common to the image data among the plurality of image data do not match in all the image data (disagreement) in FIGS. 5 (a) to 5 (c), (g). The character string determined as “” is displayed by shading indicated by reference numeral 603. Note that the display method of matching and mismatching is not limited to the above display form, and any display method can be used as long as it can distinguish between a matched character string and a mismatched character string. For example, if the display unit 301 configured in the operation panel unit 30 can display in color, the matched character string and the mismatched character string may be displayed in different colors. Further, if the display unit 301 can display only a single color, a display form such as lighting or blinking may be used.

更に、一致した文字列、不一致の文字列の全てを図6(a)のように表示する形態でなくても良い。例えば記憶部20に、一致および不一致の表示対象とする文字の大きさ(フォントサイズ)、文字列の長さ(テキストデータの長さ)を事前に指定(登録)する。そして指定された内容に該当する一致および不一致の文字列のみを識別可能な特別な形態で表示するようにしても良い。図6(b)は所定の閾値よりも大きな文字(フォント)、あるいは、所定の閾値よりも短い文字数を含む文字列に対して一致および不一致を識別可能な形態で表示する場合の表示形態の例である。まず、所定の閾値よりも大きな文字(フォント)のみ一致および不一致を識別可能な形態で表示する。これにより、図6(a)の小さい文字列が、一致および不一致を識別可能な形態で表示する文字列の対象外となる。また、所定の閾値よりも短い長さを有する文字数を有する文字列のみ一致および不一致を一致および不一致を識別可能な形態で表示する。これにより、図6(a)の日付や定型文のような長い文字列がこの形態で表示する文字列の対象外となる。   Furthermore, it is not necessary to display all the matched character strings and the mismatched character strings as shown in FIG. For example, the storage unit 20 designates (registers) in advance the size of the character (font size) and the length of the character string (the length of the text data) that are to be matched and mismatched. Then, only matching and mismatching character strings corresponding to the designated contents may be displayed in a special form that can be identified. FIG. 6B shows an example of a display form in which a match and a mismatch are displayed in a form that can be identified for a character (font) larger than a predetermined threshold or a character string including the number of characters shorter than the predetermined threshold. It is. First, only characters (fonts) larger than a predetermined threshold value are displayed in a form that can identify matching and mismatching. As a result, the small character string in FIG. 6A is excluded from the target of the character string that is displayed in a form that can identify the match and the mismatch. In addition, only a character string having the number of characters having a length shorter than a predetermined threshold value is displayed in a form in which matching and mismatching can be identified. As a result, long character strings such as dates and fixed phrases in FIG. 6A are excluded from character strings displayed in this form.

図6(c)は、指定されたキーワードを含む文字列のみ一致および不一致を識別可能な形態で表示する文字列の対象とする場合の表示状態の例である。   FIG. 6C shows an example of a display state in a case where a character string including only a character string including a designated keyword is displayed as a target of a character string that is displayed in a form that can be identified.

これにより、入力画像データのうち、特徴的な一致文字列および不一致文字列のみが表示対象となり選択時の利便性を向上させることが出来る。なおこの場合のキーワードは予め指定され、記憶部20に記憶される。   Thereby, only the characteristic matching character string and the non-matching character string in the input image data are displayed and the convenience at the time of selection can be improved. Note that the keyword in this case is designated in advance and stored in the storage unit 20.

ステップS207にて、使用者により、入力された画像データにて一致すると判定された文字列がある箇所が選択された場合、ステップS213に進む。そして、フォルダ生成部404は、選択された文字列を用いた名称を有するフォルダを生成する。そしてこのフォルダ内に入力した全てのページの画像データの中間ファイルを統合した単一のファイルを記憶する。一方、ステップS207において、不一致箇所が選択された場合、ステップS209に進む。   In step S207, if the user selects a location where there is a character string determined to match the input image data, the process proceeds to step S213. Then, the folder generation unit 404 generates a folder having a name using the selected character string. Then, a single file in which intermediate files of image data of all pages input in this folder are integrated is stored. On the other hand, when a non-matching part is selected in step S207, the process proceeds to step S209.

ステップS209〜ステップS212における各処理は、図8のステップS108〜ステップS111における各処理と同じであるため、ここでの説明は割愛する。   Since each process in step S209 to step S212 is the same as each process in step S108 to step S111 of FIG. 8, the description here is omitted.

以上、説明したように本実施例においては、帳票のような同一形態で構成される複数の画像データを電子化する場合、使用者に選択された位置にある文字列が一致または不一致または一部のみ一致する場合のそれぞれに応じた形態でフォルダを構築できる。   As described above, in the present embodiment, when a plurality of image data configured in the same form such as a form is digitized, the character string at the position selected by the user matches or does not match or partially Folders can be constructed in a form corresponding to each of the cases where only they match.

更に、フォルダ内に記憶される際のファイル名および記憶される形態も、使用者によって選択された文字列の一致または不一致または一部のみ一致のそれぞれに適合したものとなる。   Further, the file name and the stored form when stored in the folder are also adapted to match, mismatch or only partial match of the character string selected by the user.

また、複数の画像データに含まれる文字列に対して、一致および不一致を識別可能な形態で表示する際、予め設定された条件を満たした文字列のみを表示して選択対象とする。これによりフォルダ名に用いられる文字列を選択する時の利便性を向上させることが可能になる。   Further, when displaying matching and mismatching for character strings included in a plurality of image data, only character strings that satisfy a preset condition are displayed as selection targets. This makes it possible to improve convenience when selecting a character string used for a folder name.

[第3実施例]
次に、本発明の第3実施例に関して説明する。本実施例は、同一形態で構成される複数の画像データの電子化が過去に行われ、フォルダ(ファイル)が生成された後に、別途同一形態で構成される画像データを電子化する場合のファイル生成制御に関するものである。
[Third embodiment]
Next, a third embodiment of the present invention will be described. In this embodiment, a plurality of pieces of image data configured in the same form are digitized in the past, and after a folder (file) is generated, a file in the case of separately digitizing image data configured in the same form It relates to generation control.

なお、本実施例の画像処理装置の構成は、図1に示す構成であり、画像入力部10、記憶部20、操作パネル部30、主制御部40となる。また、以降の説明において、画像入力部10に入力される画像データは、図5に示した画像データとする。   The configuration of the image processing apparatus according to the present embodiment is the configuration illustrated in FIG. 1 and includes an image input unit 10, a storage unit 20, an operation panel unit 30, and a main control unit 40. In the following description, the image data input to the image input unit 10 is the image data shown in FIG.

本実施例にて実施される処理を図10のフローを用いて説明する。   Processing performed in the present embodiment will be described with reference to the flowchart of FIG.

なお、本フローの各ステップにおける処理は、以下に示す手順を記述したコンピュータ実行可能なプログラムをROM(405)からRAM(406)上に読み込んだ後に、CPU(407)によって該プログラムを実行することによって実施される。   The processing in each step of this flow is to read a computer-executable program describing the following procedure from the ROM (405) onto the RAM (406) and then execute the program by the CPU (407). Implemented by:

ステップS300にて、複数の画像データを入力し、これらの画像データの共通する位置にある文字列の一致判定結果を用いて、フォルダを生成する。この処理の詳細説明については、図8のステップS109、S110において実施される処理と同じであるため割愛する。   In step S300, a plurality of pieces of image data are input, and a folder is generated using the matching determination result of the character strings at positions common to these image data. Detailed description of this process is omitted because it is the same as the process executed in steps S109 and S110 of FIG.

次にステップS301にて、フォルダ生成部404が記憶部20にステップS300で生成されるフォルダのフォルダ名と同じフォルダ名のフォルダが既にあるか否かを確認する。   In step S301, the folder generation unit 404 checks whether there is already a folder having the same folder name as the folder name of the folder generated in step S300 in the storage unit 20.

ステップS301において、記憶部20に既存のフォルダがある場合は、ステップS302へ進む。そしてステップS302にて、S300で新たに作成されたファイルを破棄し、既存のフォルダに対して、入力された画像データを別ファイルとして格納する。あるいは既存のファイルに入力された画像データを追加して新たなファイルを生成する。一方、ステップS301において、記憶部20に既存のフォルダがある場合は、ステップS303へ進む。ステップS303では、ステップS300で作成されたフォルダに対して入力した画像データを格納する。図7(c)と(d)を用いて、既存フォルダがある場合を説明する。フォルダ生成部404でフォルダ名が『株式会社AAA』であるフォルダが既にあると判断した場合、この『株式会社AAA』フォルダ703に新規ファイル701を生成する。あるいは既存ファイルに追加して、新規のファイル711を生成する。   In step S301, if there is an existing folder in the storage unit 20, the process proceeds to step S302. In step S302, the file newly created in S300 is discarded, and the input image data is stored as a separate file in the existing folder. Alternatively, a new file is generated by adding input image data to an existing file. On the other hand, when there is an existing folder in the storage unit 20 in step S301, the process proceeds to step S303. In step S303, the input image data is stored in the folder created in step S300. A case where there is an existing folder will be described with reference to FIGS. If the folder generation unit 404 determines that there is already a folder whose folder name is “AAA”, a new file 701 is generated in this “AAA” folder 703. Alternatively, a new file 711 is generated by adding to the existing file.

よって、本実施例では、帳票等を読み取ることで得られる同一形態で構成される複数の画像データの電子化を行う場合、すでに同じ名称のフォルダやファイルが存在していても、使用者によって選択された位置にある文字列に応じた形態でフォルダが構築される。   Therefore, in this embodiment, when digitizing a plurality of image data configured in the same form obtained by reading a form or the like, even if a folder or file with the same name already exists, it is selected by the user. A folder is constructed in a form corresponding to the character string at the designated position.

更に、フォルダ内に記憶されるファイルの名称や記憶される形態も、使用者によって選択された文字列の一致または不一致または一部のみ一致のそれぞれに適合したものとなる。   Furthermore, the name of the file stored in the folder and the stored form are also adapted to match, match, or partially match the character strings selected by the user.

(その他の実施例)
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施例の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other examples)
The present invention is also realized by executing the following processing. That is, software (program) for realizing the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, etc.) of the system or apparatus reads the program. It is a process to be executed.

Claims (12)

複数の画像データを入力する入力手段と、
前記入力手段で入力された第1の画像データに含まれる文字列の位置を指定する指定手段と、
前記指定手段により指定された位置に対応する前記第1の画像データにおける第1の文字列と、前記指定手段によって指定された位置に対応する第2の画像データにおける第2の文字列との一致を判定する判定手段と、
前記判定手段により前記第1の文字列と前記第2の文字列が一致すると判定された場合、前記第1の画像データと前記第2の画像データは同一のフォルダに保存し、
前記判定手段により前記第1の文字列と前記第2の文字列が一致しないと判定された場合、前記第1の画像データと前記第2の画像データは、別のフォルダに保存する保存手段と、
を有することを特徴とする画像処理装置。
Input means for inputting a plurality of image data;
Designating means for designating the position of a character string included in the first image data input by the input means;
Matching between the first character string in the first image data corresponding to the position designated by the designation means and the second character string in the second image data corresponding to the position designated by the designation means Determining means for determining
If the determination means determines that the first character string and the second character string match, the first image data and the second image data are stored in the same folder;
Storage means for storing the first image data and the second image data in different folders when the determination means determines that the first character string and the second character string do not match; ,
An image processing apparatus comprising:
前記同一のフォルダに保存される前記第1の画像データと前記第2の画像データは、それぞれ異なるファイルとして保存されることを特徴とする請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the first image data and the second image data stored in the same folder are stored as different files. 前記同一のフォルダに保存される前記第1の画像データと前記第2の画像データは、1つのファイルとして保存されることを特徴とする請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the first image data and the second image data stored in the same folder are stored as one file. 前記保存手段にて用いられる画像データを保存するフォルダには、前記指定手段により指定された文字列を用いたフォルダ名が付与されることを特徴とする請求項1に記載の画像処理装置。 The image processing apparatus according to claim 1, wherein the folder that stores the image data used by the storage unit is given a folder name using a character string specified by the specification unit. 前記入力された画像データを表示部に表示する表示制御手段を有し、
前記表示制御手段は、前記複数の画像データのそれぞれに共通する位置にて一致と判定された文字列と一致と不一致と判定された文字列とを異なる表示形態で表示することを特徴とする請求項1に記載の画像処理装置。
Display control means for displaying the input image data on a display unit;
The display control means displays a character string determined to be matched and a character string determined to be matched and mismatched in different display forms at positions common to each of the plurality of image data. Item 8. The image processing apparatus according to Item 1.
前記表示制御手段により画像データを表示する表示部に対して指定が行われることで、前記指定手段による指定が実行されることを特徴とする請求項5に記載の画像処理装置。   The image processing apparatus according to claim 5, wherein the designation by the designation unit is executed by performing designation for a display unit that displays image data by the display control unit. 前記表示制御手段は、前記複数の画像データにおいて共通する位置にて、予め指定されたサイズよりも大きい文字を含む文字列のうち、一致と判定された文字列と一致と判定されなかった文字列とを異なる表示形態で前記表示部に表示することを特徴とする請求項5に記載の画像処理装置。   The display control means includes a character string that has not been determined to match a character string that has been determined to match among character strings that include characters larger than a predetermined size at a position common to the plurality of image data. The image processing apparatus according to claim 5, wherein the display unit is displayed in a different display form. 前記表示制御手段は、前記複数の画像データにおいて共通する位置にて、予め指定された文字数よりも短い文字数を含む文字列のうち、一致と判定された文字列と一致と判定されなかった文字列とを異なる表示形態で前記表示部に表示することを特徴とする請求項5に記載の画像処理装置。   The display control means, at a position common to the plurality of image data, out of character strings including a number of characters shorter than a predetermined number of characters, a character string that has not been determined to match the character string determined to match The image processing apparatus according to claim 5, wherein the display unit is displayed in a different display form. 前記表示制御手段は、前記複数の画像データにおいて共通する位置にて、予め指定された文字を含む文字列のうち、一致と判定された文字列と一致と判定されなかった文字列とを異なる表示形態で前記表示部に表示することを特徴とする請求項5に記載の画像処理装置。   The display control means displays differently between a character string that is determined to be matched and a character string that is not determined to be matched among character strings that include characters designated in advance at a position common to the plurality of image data. The image processing apparatus according to claim 5, wherein the image processing apparatus displays the image on the display unit in a form. 前記入力手段により入力される画像データは、原稿を読み取ることで取得されることを特徴とする請求項1に記載の画像処理装置。   The image processing apparatus according to claim 1, wherein the image data input by the input unit is acquired by reading a document. 複数の画像データを入力する入力ステップと、
前記入力ステップにて第1の画像データに含まれる文字列の位置を指定する指定ステップと、
前記指定ステップにより指定された位置に対応する前記第1の画像データにおける第1の文字列と、前記指定ステップによって指定された位置に対応する第2の画像データにおける第2の文字列との一致を判定する判定ステップと、
前記判定ステップにより前記第1の文字列と前記第2の文字列が一致すると判定された場合、前記第1の画像データと前記第2の画像データは同一のフォルダに保存し、
前記判定ステップにより前記第1の文字列と前記第2の文字列が一致しないと判定された場合、前記第1の画像データと前記第2の画像データは、別のフォルダに保存する保存ステップと、
を有することを特徴とする画像処理方法。
An input step for inputting a plurality of image data;
A designation step for designating a position of a character string included in the first image data in the input step;
A match between the first character string in the first image data corresponding to the position specified by the specifying step and the second character string in the second image data corresponding to the position specified by the specifying step A determination step for determining
If it is determined in the determination step that the first character string and the second character string match, the first image data and the second image data are stored in the same folder;
A storage step of storing the first image data and the second image data in different folders when the determination step determines that the first character string and the second character string do not match; ,
An image processing method comprising:
コンピュータに、請求項11に記載の画像処理方法を実行させるためのプログラム。   A program for causing a computer to execute the image processing method according to claim 11.
JP2014145919A 2014-07-16 2014-07-16 Image processing apparatus and method of controlling the same Pending JP2016024488A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014145919A JP2016024488A (en) 2014-07-16 2014-07-16 Image processing apparatus and method of controlling the same

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014145919A JP2016024488A (en) 2014-07-16 2014-07-16 Image processing apparatus and method of controlling the same

Publications (1)

Publication Number Publication Date
JP2016024488A true JP2016024488A (en) 2016-02-08

Family

ID=55271235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014145919A Pending JP2016024488A (en) 2014-07-16 2014-07-16 Image processing apparatus and method of controlling the same

Country Status (1)

Country Link
JP (1) JP2016024488A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018190062A (en) * 2017-04-28 2018-11-29 京セラドキュメントソリューションズ株式会社 Information processing apparatus and file name setting method
US20200162624A1 (en) * 2018-11-20 2020-05-21 Canon Kabushiki Kaisha Image processing apparatus, method for controlling the same, and storage medium
JP2020167618A (en) * 2019-03-29 2020-10-08 キヤノン株式会社 Image processing apparatus, method for controlling the same, and program
JP2020174414A (en) * 2020-07-31 2020-10-22 キヤノン株式会社 Image processing device, image processing method, and program
US11386046B2 (en) 2017-10-03 2022-07-12 Canon Kabushiki Kaisha Apparatus for setting file name for scan image, method of controlling same, and storage medium

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018190062A (en) * 2017-04-28 2018-11-29 京セラドキュメントソリューションズ株式会社 Information processing apparatus and file name setting method
US11386046B2 (en) 2017-10-03 2022-07-12 Canon Kabushiki Kaisha Apparatus for setting file name for scan image, method of controlling same, and storage medium
US20200162624A1 (en) * 2018-11-20 2020-05-21 Canon Kabushiki Kaisha Image processing apparatus, method for controlling the same, and storage medium
CN111200697A (en) * 2018-11-20 2020-05-26 佳能株式会社 Image processing apparatus, method of controlling image processing apparatus, and storage medium
JP2020086717A (en) * 2018-11-20 2020-06-04 キヤノン株式会社 Image processing device and control method thereof, and program
US11128767B2 (en) 2018-11-20 2021-09-21 Canon Kabushiki Kaisha Image processing apparatus, method for controlling the same, and storage medium for setting a folder path by using a character string in a document
JP2020167618A (en) * 2019-03-29 2020-10-08 キヤノン株式会社 Image processing apparatus, method for controlling the same, and program
CN111752498A (en) * 2019-03-29 2020-10-09 佳能株式会社 Image processing apparatus, control method thereof, and storage medium
JP2020174414A (en) * 2020-07-31 2020-10-22 キヤノン株式会社 Image processing device, image processing method, and program
JP2021121129A (en) * 2020-07-31 2021-08-19 キヤノン株式会社 Image processing device and control method thereof, and program
JP7114778B2 (en) 2020-07-31 2022-08-08 キヤノン株式会社 IMAGE PROCESSING APPARATUS, CONTROL METHOD THEREOF, AND PROGRAM

Similar Documents

Publication Publication Date Title
JP6881990B2 (en) Image processing device, its control method, and program
US10949662B2 (en) Image processing apparatus
KR101840643B1 (en) Image processing apparatus and method for controlling the same
JP2016024488A (en) Image processing apparatus and method of controlling the same
US11151367B2 (en) Image processing apparatus and image processing program
JP7131137B2 (en) Image processing device and image processing program
JP2018124657A (en) Image processing apparatus, control method thereof and program
JP2016018454A (en) Image processing system and controlling method thereof
US10936896B2 (en) Image processing apparatus and image processing program
JP5208540B2 (en) Image file distribution method, image file distribution device, and program
US20230206672A1 (en) Image processing apparatus, control method of image processing apparatus, and storage medium
JP2016111482A (en) Image processing device and control method of image processing device
JP2021056722A (en) Information processing device and program
JP2000322417A (en) Device and method for filing image and storage medium
JP7102284B2 (en) File management device, file management method, and program
TWI766360B (en) Character candidate proposal device, handwritten character recognition system, handwritten character recognition method and program
JP2015213289A (en) Image processing apparatus, and control method of image processing apparatus
JP2020047031A (en) Document retrieval device, document retrieval system and program
JP2007004429A (en) Document processor
JP7268316B2 (en) Information processing device and program
JP2016031538A (en) Image processing apparatus, image processing method, and program
JP2004206521A (en) Document search device and program
JP6325218B2 (en) Character recognition result verification device and character reading system
JP4906044B2 (en) Information retrieval apparatus, control method therefor, computer program, and storage medium
JP5942649B2 (en) Image forming apparatus and program