JP2016111482A - Image processing device and control method of image processing device - Google Patents
Image processing device and control method of image processing device Download PDFInfo
- Publication number
- JP2016111482A JP2016111482A JP2014246330A JP2014246330A JP2016111482A JP 2016111482 A JP2016111482 A JP 2016111482A JP 2014246330 A JP2014246330 A JP 2014246330A JP 2014246330 A JP2014246330 A JP 2014246330A JP 2016111482 A JP2016111482 A JP 2016111482A
- Authority
- JP
- Japan
- Prior art keywords
- image data
- character string
- unit
- input
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Processing Or Creating Images (AREA)
- Facsimiles In General (AREA)
- Storing Facsimile Image Data (AREA)
Abstract
Description
本発明は、画像データを用いて電子文書を生成する画像処理装置および画像処理装置の制御方法に関するものである。 The present invention relates to an image processing apparatus that generates an electronic document using image data and a control method for the image processing apparatus.
画像処理装置で、紙の原稿を読み取ることにより得られる画像データを、装置内部の記憶部に電子化して保存することができる。従来、このように電子化された画像データの保存を行う場合、装置固有のヘッダ情報や文字列に、通し番号を付与した文字列を、電子化された画像データのファイルのファイル名や、このファイルの保存先であるフォルダのフォルダ名に適用することが多い。このため、画像処理装置の使用者が、保存対象とするフォルダあるいはファイルに対して、任意のフォルダ名やファイル名を指定したい場合、装置の操作パネル等から、ファイル名や、フォルダ名の入力を必要とする。 Image data obtained by reading a paper document with an image processing apparatus can be digitized and stored in a storage unit inside the apparatus. Conventionally, when storing digitized image data in this way, a character string in which a serial number is added to the header information and character string unique to the device, the file name of the digitized image data file, and this file It is often applied to the folder name of the folder where the file is saved. For this reason, when the user of the image processing apparatus wants to specify an arbitrary folder name or file name for the folder or file to be saved, input the file name or folder name from the operation panel of the apparatus. I need.
そこで特許文献1は、画像処理装置が読み取った画像データを電子化して保存する場合、電子化された画像データが保存されるフォルダ名称或いはファイル名称と原稿画像データとの相関性を高め、使用者の利便性を向上させている。この方法は、原稿の所定位置に文字、文字列を認識出来た場合は認識した文字、あるいは文字列をファイル名とし、認識できなかった場合は読み取った日時をファイル名とすることが示されている。
Therefore, in
しかしながら、特許文献1に示されている方法では、認識された文字、あるいは文字列が使用者の指定したいフォルダ名やファイル名と合致しない場合もある。また、読み取った日時がフォルダ名やファイル名となった場合は、原稿を読み取ることで得られた画像データの内容とこの画像データを保存する際のファイルの名称やこのファイルの保存先であるフォルダの名称との相関がとり辛い。
However, in the method disclosed in
また、入力された画像データの保存時に、使用者がどのような文字列がフォルダおよびファイルに対する名称を指定すれば、この名称と入力された画像データの内容との相関が取れるのかわかりにくい場合がある。 In addition, when saving the input image data, it may be difficult to know what character string the user specifies the name for the folder and file so that the correlation between this name and the content of the input image data can be obtained. is there.
本発明は、前記課題を解決するためのものであり、複数ページからなる原稿のセットを複数セット読み取ることで得られた画像データを入力する入力手段と、前記入力手段により入力された画像データのうち、第1の原稿のセットに対応する第1の画像データに含まれる文字列と第2の原稿のセットに対応する第2の画像データに含まれる文字列とをページ毎に比較し、前記第1の画像データに含まれる文字列と前記第2の画像データに含まれる文字列とで共通する位置にて一致と判定された文字列と、一致と判定されなかった文字列とを異なる表示形態にて表示する表示制御手段と、前記表示制御手段により表示された文字列から指定された文字列を用いて前記第1の画像データを記憶部に記憶するように制御する制御手段と、を有することを特徴とする。 The present invention is to solve the above-described problem, and includes an input unit for inputting image data obtained by reading a plurality of sets of originals composed of a plurality of pages, and an image data input by the input unit. Of these, the character string included in the first image data corresponding to the first set of originals is compared with the character string included in the second image data corresponding to the second set of originals for each page, and A character string determined to match at a position common to the character string included in the first image data and the character string included in the second image data, and a character string not determined to match are displayed differently. Display control means for displaying in a form, and control means for controlling to store the first image data in a storage unit using a character string designated from the character string displayed by the display control means, Have The features.
本発明によれば、入力画像データの内容とこの入力画像データを保存する際のフォルダまたはファイルの名称との相関性を高めることが容易になる。この結果、画像データの電子化作業の効率化、および電子化後の認識性を向上させることが可能となり、電子化された画像データの管理が容易になる。 According to the present invention, it becomes easy to increase the correlation between the contents of input image data and the names of folders or files when the input image data is stored. As a result, it is possible to improve the efficiency of the digitization of the image data and to improve the recognition after the digitization, and the management of the digitized image data is facilitated.
[第1実施例]
以下、本発明を実施するための形態について図面を用いて説明する。図1は、本実施例を実施するために必要な画像処理装置の構成を示す図である。本画像処理装置は、少なくとも主制御部40を中心に、画像入力部10、記憶部20、操作パネル部30により構成される。同図において、画像入力部10は、紙の原稿を光学的に読み取ることで得られる画像データ、あるいは図示しない通信網を経由して入力される画像データを受ける。記憶部20は、画像入力部10により入力される画像データの記憶、あるいは主制御部40の制御情報の他、過去に入力された画像データおよびそれを解析し生成された特徴量等中間データを記憶する。
[First embodiment]
Hereinafter, embodiments for carrying out the present invention will be described with reference to the drawings. FIG. 1 is a diagram showing a configuration of an image processing apparatus necessary for implementing this embodiment. The image processing apparatus includes at least a
なお、この記憶部20は画像処理装置内に構成されていてもよいし、画像処理装置に接続可能な別の装置に構成されていてもよい。
The
操作パネル部30は、本画像処理装置に対して動作指示を行う入力部と、動作状態を表示する表示部により構成される。図3に操作パネル30の詳細構成を示す。図3において、表示部301は、例えばタッチパネル等により構成される。テンキー302は操作に係る設定項目等を設定し、スタートキー303は本画像処理装置に対しての動作起動の指示を受ける際に押下される。ストップキー304は本画像処理装置の動作の中止を指示するためのキーである。リセットキー305はテンキー302による設定の初期化に用いられる。動作モード設定キー306は本画像処理装置の動作モードの設定を指示するためのキーである。なお、これらの各キーはハードキーに限定されるものではなく、表示部301に構成したソフトキーであっても良い。
The
図1の主制御部40は以下を有する。すなわち、CPU、CPUの起動プログラムを格納したROM、このプログラムの実行領域としてのRAM、過去に入力された画像データから生成された中間データ保存用のストレージとしてHDDやSSD、入出力インターフェース(いずれも不図示)を有する。そしてこの主制御部40は、画像入力部10、記憶部20、操作パネル部30を制御する。また、主制御部40には、画像入力部10から入力される画像データ中に含まれる文字を判定する文字判定部401、入力された画像データのレイアウト位置をふまえた一致箇所、あるいは相違箇所を判定する一致判定部402を含む。また、主制御部40は、一致判定部402による判定結果に応じ、操作パネル部30に構成した表示部301に表示する情報を制御する表示制御部403と、表示制御部403により表示した内容の選択に応じてフォルダを生成するフォルダ生成部404を含む。
The
さらに、主制御部40は、画像入力部10から入力された画像データのうち、一致箇所あるいは不一致箇所の判定を実施するページを選択するページ選択部406を含む。
Further, the
図2に文字判定部401の内部構成を示す。文字判定部401は、主にOCR(Optical Character Reader)をもとに構成される。OCRとは、光学的文字認識のことである。入力された画像データが、紙原稿を光学的に読み取ることで得られるデータである場合、入力された画像データから切り出したデータと、事前に記憶されたパターンとの照合によって、文字を特定し、テキストデータに変換出力するものである。したがって、文字判定部401は、OCRを構成する各処理部であるレイアウト解析部4011、切り出し部4012、特徴抽出部4013、照合部4014、辞書部4015、一時記憶部4016により構成される。なお、入力された画像データが通信網を経由して得られる画像データである場合、画像データに含まれるテキストデータを分析するテキストデータ分析部(不図示)が構成されていればよい。
FIG. 2 shows an internal configuration of the
レイアウト解析部4011は、画像入力部10から入力される画像データを、文字領域と画像領域に分離し、文字領域のかたまり配置の解析、および文字認識する順番を決定する。同一形態で構成される画像データを複数ページ入力した場合、それぞれページの画像データにおいて構成される文字領域および画像領域の配置結果が同一であるものとレイアウト解析部4011により解析される。よって、それぞれの画像データにおいて文字認識される順番は同一になる。
The
つまり、レイアウト解析部4011の解析結果に準じて、以降の文字データの変換を行えば、複数の原稿データ間の文字、文字列の一致箇所、相違箇所の判定が出来る。
In other words, according to the analysis result of the
切り出し部4012は、レイアウト解析部4011で検出した文字領域のかたまりを、まず1行毎に分割し、分割した1行の文字領域を、更に1文字ずつに分解する。特徴抽出部4013は、分割された文字が持つ特徴、例えば縦方向、横方向、斜め方向にどのような線で構成されているかの抽出を行う。照合部4014は、特徴抽出部4013により抽出した特徴を辞書部4015に記憶した情報と照合し、文字データをテキストデータに変換する。照合部4014の照合により決定したテキストデータは、一時記憶部4016に記憶する。
The
なお、入力画像データが通信網を経由して得られる画像データである場合、すでに画像データにテキストデータが含まれているため、このテキストデータを一時記憶部4016に記憶する。このようにして求められたレイアウトの情報や文字領域の座標、文字数や行数の情報に加え、画像のサイズや向き(例えばA4の横向き等)の情報も併せて一時記憶部4016に特徴量として記憶する。そしてこの特徴量を、フォーマット照合部(不図示)で記憶されている別の文章との照合に用いる。なおこの画像のサイズは縦横の画素数およびデータ解像度(例えばdpi(dot per inch))から、また向きは文字認識結果の向きから解析が可能である。
Note that when the input image data is image data obtained via a communication network, the text data is already included in the image data, and thus the text data is stored in the
別図を用いて、一時記憶部4016へのテキストデータの記憶構成に関して説明する。
A storage configuration of text data in the
図4(a)は取得された画像データの一例を示すものである。レイアウト解析部4011の解析により、図4(a)に示す取得された画像データ中の文字領域は、図中の破線(1)〜(13)に示すレイアウトとして解析される。切り出し部4012は、文字のかたまり番号の小さい方から順に1行ずつ切り出し、さらに1文字ずつ切り出す。切り出した文字データは、特徴抽出部4013により文字の特徴が抽出され、照合部4014による辞書部4015の情報との照合によりテキストデータに変換される。このとき、記憶部4016に記憶するテキストデータの構成を、変換されたテキストデータのブランク領域(白データ領域)で挟まれた1行構成とすると、記憶部4016には、図4(b)に示すように記憶される。
FIG. 4A shows an example of the acquired image data. By the analysis of the
主制御部40は、1枚の原稿を読み取ることで得られた画像データの特徴量解析およびテキストデータへ変換する処理が完了すると、一時記憶部4016に記憶した特徴量とテキストデータを含めた、中間データ(テンポラリのファイルデータ等)を生成する。次に、主制御部40は、生成された中間データを、一時記憶部4016から読み取った特徴量とテキストデータと関連付けした状態で記憶部20に記憶する。
When the
主制御部40の動作に関して、画像データの例を挙げて説明する。
The operation of the
図5(a)〜図5(c)は画像入力部10に入力される画像データの一例である。いずれも、帳票データ、伝票データに見られる同一文書形態(同一レイアウト構成)を読み取ることで得られ、記載内容の一部が異なるものとなっている。例えば、『御請求書』の文字列、請求先の後の『御中』の文字列、請求元の会社名、住所などはいずれも同じものとなっている。一方、請求先への金額や、担当欄の内容は各々異なったものとなっている。
FIG. 5A to FIG. 5C are examples of image data input to the
図5(a)〜図5(c)の画像データから抽出され記憶されているテキストデータに対し、文字判定部401によって行われた判定結果をそれぞれ図5(d)〜図5(f)に示す。主制御部40は、図5(d)〜図5(f)のテキストデータと、図5(a)〜図5(c)の画像データとその特徴量を示した中間データを記憶部20に記憶する。なお、本実施例では、画像入力部10に入力する図5(a)〜図5(c)から抽出された文字データを全てテキストデータに変換した後に、一時記憶部4016からテキストデータを読み出し、記憶部20に記憶するものとした。しかし、主制御部40による記憶部20への制御はこれに限定されるものではない。すなわち、画像入力部10に入力される画像データ毎に、一時記憶部4016に記憶されたテキストデータを記憶部20に記憶するように制御しても良い。
The determination results performed by the
主制御部40は、画像入力部10の全ての入力画像データから抽出したテキストデータ、および電子化した中間ファイルを記憶部20に記憶させると、一致判定制御を行う。主制御部40による一致判定制御は、一致判定部402により、記憶部20に記憶した各入力画像データから抽出したテキストデータ同士の比較により実施する。なお、記憶部20に記憶したテキストデータの順番は、文字判定部401のレイアウト解析部4011の判定結果に基づくため、同じテキストデータであっても、異なる順番に記憶されているテキストデータとの一致判定は行われない。つまり、入力画像データから抽出したテキストデータの順番は、入力画像データの位置情報を含むものとなる。したがって、同じテキストデータが抽出されたとしても、抽出順番が異なっていれば、別の位置に存在するテキストデータと判断出来る。このため、一致判定は、記憶部20に記憶したテキストデータの内容と順番(位置情報)に基づいて行う。なお、本説明においては、入力画像データから抽出したテキストデータの位置情報を、テキストデータを抽出した順番に基づくものとしたが、本実施形態はこれに限定されるものではない。例えば、入力画像データ中の抽出したテキストデータの位置情報を別途作成する形態とし、抽出したテキストデータと、その位置情報を記憶部20に対応づけて記憶する。そして、一致判定部402による一致判定、あるいは不一致判定を、抽出したテキストデータと位置情報の2つの情報を用いて行う形態としても良い。
When the
次に一致判定、不一致判定の詳細に関して説明する。図5(a)の入力画像データを基準として、この入力画像データから抽出されたテキストデータ判定結果である図5(d)に示した範囲501、範囲503および範囲505に該当するテキストデータに着目する。範囲501、範囲503および範囲505に該当するテキストデータは、入力画像データ(e)、(f)に含まれる範囲501、範囲503、範囲505に該当するテキストデータと一致している。よって、図5(a)、図5(b)、図5(c)のそれぞれの入力画像データから抽出されるテキストデータの範囲501、範囲503、範囲505に対応する箇所は一致していると判定出来る。一方、図5(d)に示した範囲502、範囲504および範囲506に該当するテキストデータは、入力画像データ図5(e)、図5(f)に含まれる範囲502、範囲504、範囲506に該当するテキストデータと一致していない。よって、よって、図5(a)、図5(b)、図5(c)のそれぞれの入力画像データから抽出されるテキストデータの範囲502、範囲504、範囲506に対応する箇所は一致していないと判定出来る。
Next, details of match determination and mismatch determination will be described. Focusing on the text data corresponding to the
なお、一致判定部402による一致判定は、記憶部20に記憶されたテキストデータとの完全一致でなくても良い。OCRによる文字データのテキストデータへの変換は、特徴抽出部4013により抽出された文字データの特徴と辞書部4015に記憶されているデータとの照合に基づくため、文字1つ1つに対しては誤判定を伴うことがある。したがって、文字列に対する一致判定数等に基づいて最終的な一致判定を行うようにしても良い。例えば、10文字分のテキストデータに対し、8文字分のテキストデータが一致していた場合、その文字列を一致と判断するように制御しても良い。
Note that the match determination by the
主制御部40は、一致判定部402による一致判定制御が終わると、表示制御部403による表示制御を行う。表示制御は、画像入力部10に入力された画像データを電子化することにより得た中間ファイルデータに対し、一致判定部402による一致判定結果を反映させる。図6(a)は、図5(a)の入力画像データを表示対象とした場合の操作パネル部30の表示状態を示す図である。
When the match determination control by the
図6(a)において、一致判定部402により、図5(a)〜図5(c)の読取られた複数の帳票の中で各帳票に共通する位置に対して記載されている内容が全ての帳票にて一致していると判定された文字列を符号601で示す網掛けで表示する。一方、図5(a)〜図5(c)の読取られた複数の帳票の中で各帳票に共通する位置に対して記載されている内容が全ての帳票にて一致しない(不一致)と判定された文字列を符号602で示す網掛けで表示している。なお、一致および不一致の表示方法はこの表示形態に限定されるものではなく、一致した文字列と不一致の文字列とが判別出来るものであれば良い。例えば、操作パネル部30に構成した表示部301が、カラー表示可能なものであれば、一致した文字列と不一致の文字列を色分けで表示しても良い。また、表示部301が単色のみ表示可能なものであれば、点灯、点滅のような表示形態としても良い。
In FIG. 6A, all the contents described for the positions common to each form among the plurality of read forms in FIGS. 5A to 5C by the
更に、一致した文字列、不一致の文字列の全てを表示する形態でなくても良い。例えば、記憶部20に、一致、不一致の表示対象とする文字の大きさ(フォントの大きさ)、文字列の長さを事前登録し、登録された内容に該当する一致文字列、不一致文字列のみを判別可能な形態で表示するようにしても良い。図6(b)は、一致文字列、不一致文字列の表示を、所定閾値よりも大きな文字(フォント)、あるいは、文字列の長さを制限した場合の表示例である。まず、所定閾値よりも大きな文字(フォント)としていることで、図6(a)の小さい文字列が全て非表示となっている。また、文字列の長さを制限していることで、日付や定型文のような長い文字列が非表示となっている。
Furthermore, it is not necessary to display all the matched character strings and the mismatched character strings. For example, the
図6(c)は、記憶部20に、一致、不一致の表示対象として、キーワード、『御請求書』、『株式会社』、『(株)』を登録し、これら登録されたキーワードを含む文字列のみに対して一致、不一致を判別可能な形態で表示する場合の表示状態の例である。このように制御することで、入力画像データの特徴的な一致文字列、不一致文字列のみが表示対象となり、選択時の利便性を向上させることが出来る。
FIG. 6C shows keywords, “invoice”, “stock”, and “(stock)” registered in the
主制御部40は、表示制御部403による表示制御を終了すると、表示部301に表示した一致箇所、不一致箇所に対する選択を待つ。そして、以降の主制御部40による制御は、一致箇所が選択された場合と、不一致箇所が選択された場合とで異なる。なお、一致箇所、不一致箇所の選択方法は、表示部301が持つ機能に応じたものとなる。主制御部40は、表示部301がタッチパネルであれば、一致箇所あるいは不一致箇所の押下、および押下された座標位置に応じて制御を切り替える。また、表示部301がタッチパネルでない場合、主制御部40は、操作パネル部30に構成した不図示のキー操作による一致箇所、不一致箇所の選択結果に応じて制御を切り替える。
When the display control by the
主制御部40は、一致箇所が選択された場合、選択された一致判定の文字列を使用した制御を行い、不一致箇所が選択された場合、選択された不一致判定位置に該当する不一致文字列を使用した制御を行う。本実施例では、フォルダ生成部404による、入力画像データの電子化結果を保存するフォルダ生成の方法を、一致箇所が選択されたか不一致箇所が選択されたかに応じて切り替える制御について説明する。
The
図7(a)は、一致判定となった文字列『御請求書』が選択された場合の、フォルダ生成部404によるフォルダ生成制御結果である。フォルダ生成部404は、読み取った複数の画像データの中で一致判定となった文字列が選択された場合、記憶部20に生成するフォルダ名称として、選択された文字列を用いる。例えば、選択された一致判定の文字列が『御請求書』であれば、『御請求書』をフォルダ名(701)とする。また、一致判定となった文字列が選択された場合、画像入力部10により入力された電子化後の中間ファイルデータを統合ファイル(1つのファイル)として、生成されたフォルダ内に記憶する。つまり、図5(a)、図5(b)、図5(c)の中間ファイルを統合し、選択された一致判定文字列を使用して、生成したフォルダ内に最終的な電子化ファイルを記憶する(702)。なお、記憶部20に記憶するファイル名称に関しても、ファイル名称の一部に、選択された一致判定文字列を用いたものとする。例えば、前記『御請求書』であれば、『御請求書』に通し番号等を付与したファイル名(例:御請求書_001)とする。このように制御することで、使用者の意図した文字列を使用したフォルダ名、およびファイル名を容易に生成することが出来る。
FIG. 7A shows a folder generation control result by the
次に、読み取った複数の画像データの中で不一致箇所が選択された場合のフォルダ生成部404の制御に関して説明する。図7(b)は、不一致判定となった文字列『株式会社AAA』が選択された場合の、フォルダ生成部404によるフォルダ生成制御結果である。フォルダ生成部404は、不一致判定となった文字列が選択された場合、記憶部20に生成するフォルダ名称として、選択された文字列位置に存在する各文字列を用いる。本実施例において選択された不一致と判定された文字列は、『株式会社AAA』である。その為、各画像データにおける『株式会社AAA』の文字列の位置、すなわち、各入力画像データ中の『御中』の前に存在する文字列を、それぞれのフォルダ名(703、704、705)とする。つまり、『株式会社AAA』、『BBB(株)』、『CCC工務店』の名称のフォルダを生成する。また、不一致判定となった文字列が選択された場合、画像入力部10により入力された電子化後の画像データをそれぞれ別のファイルとして、生成されたフォルダ内に記憶する。
Next, the control of the
つまり、入力画像データが図5(a)であれば、『株式会社AAA』の名称のフォルダ内に、図5(a)の電子化された中間ファイルデータ(706)を記憶する。同様に入力画像データが図5(b)であれば、『BBB(株)』の名称のフォルダ内に、図5(b)の電子化された中間ファイルデータ(707)を記憶する。入力画像データが図5(c)であれば、『CCC工務店』の名称のフォルダ内に、図5(c)の電子化された中間ファイルデータ(708)を記憶する。なお、各々作成したフォルダ内のファイル名称に関しても、ファイル名称の一部に、選択された不一致判定位置に存在する各文字列を用いる。例えば、前記『AAA株式会社』であれば、『AAA株式会社』の名称のフォルダ内に、『AAA株式会社』に通し番号等を付与したファイル名(例:AAA株式会社_001)を記憶する(中間ファイルデータのリネームを行い記憶する)。このように制御することで、使用者の意図した文字列を使用したフォルダ名、およびファイル名それぞれを容易に生成することが出来る。 That is, if the input image data is FIG. 5A, the digitized intermediate file data (706) of FIG. 5A is stored in the folder named “AAA Corporation”. Similarly, if the input image data is FIG. 5B, the computerized intermediate file data (707) of FIG. 5B is stored in the folder named “BBB Co., Ltd.”. If the input image data is FIG. 5C, the digitized intermediate file data (708) of FIG. 5C is stored in the folder named “CCC construction company”. For each file name in the created folder, each character string existing at the selected mismatch determination position is used as part of the file name. For example, in the case of “AAA Co., Ltd.”, a file name (eg, AAA Co., Ltd._001) in which a serial number is assigned to “AAA Co., Ltd.” is stored in the folder named “AAA Co., Ltd.” (intermediate) Rename and store file data). By controlling in this way, the folder name and the file name using the character string intended by the user can be easily generated.
図14は、ページ選択部406の構成を示す図である。ページ選択部406は主制御部40内のCPUによって実行される。入力画像が複数ページで1文書を構成する複数文書である場合、ページ数設定部4051にて上記1文書を構成するページ数を設定する。これにより、主制御部40は、各文書の先頭ページ同士を比較する。図15は、具体的な入力画像のイメージを示す図である。まず、『株式会社AAA』あての請求書1501は、料金内訳書1502と2枚で1セットの文書である。『BBB株式会社』あての請求書1503は、料金内訳書1504と2枚で1セットの文書である。『CCC工務店』あての請求書1505は、料金内訳書1506と2枚で1セットの文書である。図15に示すような文書を入力する際に、ページ数設定部4051にはユーザー入力により2ページの指定をする。これにより、主制御部40は、請求書1501と請求書1503と請求書1505とを比較する。そして、これらの文書を格納する際には2ページで1つの文書とし、文書単位で1つのファイルとして格納する。ここでページ選択部406は、画像の比較結果に不一致個所が無い場合、文書内の別のページによる比較を実施する。
FIG. 14 is a diagram illustrating a configuration of the
図14の比較ページ位置設定部4052は、比較するページの文書内での位置を設定する。主制御部40は、ページ位置設定部4052で設定されたページ位置同士の画像を比較する。図15に示す文書で2ページ目が指定された場合は、主制御部40は、請求書1502、1504、1506を比較し、文書単位で1つのファイルとして格納する。
The comparison page
このように、2ページで構成される文書に対して、各文書のページ毎に比較をする。 In this way, a document composed of two pages is compared for each page of each document.
図14の近似判定部4053は、入力画像の先頭ページに対して画像の特徴量からその後のページの近似度を算出し、近似ページかそうでないかを判定する。例えば図15に示すような文書では、先頭の請求書1501に近似した1503、1505を近似ページとして選び出し、比較ページとする。近似判定部4053の特徴量算出方法は、線・輪郭線検出、ヒストグラムなどを主制御部40内のCPUやASICによって実施するが、手法は問わない。また、図14の閾値設定部4054は、先頭ページの特徴量と、その他のページで近似ページと判断する為のユーザーから指定された閾値を設定する。更にページ選択部406は、近似ページだけではなく文書内の最終頁も一致・不一致の比較対象とする。
The
図16は、具体的な入力画像のイメージを示す2つ目の図である。『株式会社AAA』あての請求書1601は、料金内訳書1602・1603と3枚で1セットの文書である。『BBB株式会社』あての請求書1604は1枚で1つの文書である。『CCC工務店』あての請求書1605は、料金内訳書1606と2枚で1セットの文書である。図16に示すような文書を入力する際に、ページ数設定部4051は近似判定部4053によって判定された対象ページ1601、1604、1605を設定する。主制御部40は、請求書1601、1604、1605を比較し、文書単位で1つのファイルとして格納する。ここでページ選択部406は、1601〜1603を1文書、1604を1文書、1605・1606を1文書と判定する。ここでページ選択部406は、各文書の最終ページに定型文書があることが考えられる為、ユーザーの指定にしたがって最終ページ同士の比較も実施する。しかし文書の最終ページ1603、1606の合計が比較したい対象であるケースのように、比較したい対象の位置が画像上の同じ位置にならない場合が考えられる。ここでページ選択部406は、最終ページ画像の後端余白よりも前の原稿部分を後端余白の生じる部分の位置に合せて比較を実施する。
FIG. 16 is a second diagram showing a specific input image. An
次に主制御部40の制御フローに関して説明する。図8は、第1実施例における制御フローを示す図である。なお、本フローの各ステップにおける処理は、以下に示す手順を記述したコンピュータ実行可能なプログラムをROM(不図示)からRAM(不図示)上に読み込んだ後に、CPU(不図示)によって該プログラムを実行することによって実施される。
Next, the control flow of the
使用者により、同一形態で構成される複数の画像データの電子化を行う動作モードが選択されると(ステップS101)、画像入力部10は画像データを受け付ける(ステップS102)。
When the user selects an operation mode for digitizing a plurality of pieces of image data configured in the same form (step S101), the
受け付けられた画像データは、光学的な読み取りを伴うものであればスキャンされた画像データとなり、通信網を介して入力されるものであれば受信データとなる。ステップS103にて画像入力部10は、全ての画像データが入力されたか否か判定を行い、画像入力部10により、全ての画像データが入力されたと判定されると、ステップS104に進む。
The received image data is scanned image data if it is accompanied by optical reading, and is received data if it is input via a communication network. In step S103, the
入力された画像データは複数ページで構成される原稿を1セットとし、この原稿のセットを複数セット読み取ることで入力される。 The input image data is input by reading a plurality of sets of originals including a set of originals composed of a plurality of pages.
そしてステップS104にて主制御部40は文字判定部401による文字判定処理を実施する。この文字判定部401による、文字判定処理は、画像入力部10により入力される1枚毎のレイアウト解析、データ切り出し、特徴抽出、照合、照合結果の記憶を行う。
In step S <b> 104, the
ステップS105にて、主制御部40により、使用者によって設定された動作モードが同一形態で構成される複数の画像データの電子化を行うものでないと判断された場合、ステップS112に進む。そしてステップS112にて、生成するフォルダ名を所定のものとする。そして、生成したフォルダ内に、文字判定部401により得たテキストデータを用いた電子化ファイルを記憶する。ステップS105にて主制御部40により、使用者によって設定された動作モードが、同一形態で構成される複数の画像データの電子化を行う動作モードであると判定された場合、ステップS120に進む。後述のステップS120のフローを経過し、処理対象ページが決定された後、ステップS106に進む。そしてステップS106にて、一致判定部402による一致判定処理を実施する。一致判定部402による一致判定処理が終了すると、ステップS107にて、主制御部40の表示制御部403は、一致箇所、不一致箇所の表示制御を行う。
If the
ステップS108にて、使用者により、一致箇所が選択された場合、ステップS109に進む。そして、主制御部40のフォルダ生成部404は、選択された一致箇所の内容を反映したフォルダを生成し、フォルダ内に、全ての入力画像データの中間ファイルを統合した単一のファイルを記憶する。一方、ステップS108において、不一致箇所が選択された場合、ステップS110に進む。そしてステップS110にて、相違箇所が選択されていると判定されると、ステップS111へ進む。そして、ステップS111にて、主制御部40のフォルダ生成部404は、各入力画像データ中の、選択された不一致箇所位置の内容を反映したフォルダを各々生成し、各フォルダ内に、対応する文書単位の中間ファイルを記憶する。なお、ステップS109、およびステップS111において記憶する中間ファイルの名称は、既に説明した一致箇所、不一致箇所の選択に対応した名称となる。
In step S108, when the coincidence portion is selected by the user, the process proceeds to step S109. Then, the
図17はステップS120で実行される処理の詳細を示すフローであり、ページ選択部406の制御フローである。この制御フローを実行し、読みこんだページが比較対象のページであるか否かを判断する。
FIG. 17 is a flow showing details of the processing executed in step S120, and is a control flow of the
ステップS401にて、主制御部40は、ユーザーから文書のページ数指定がされているかどうかを判定し、指定されている場合はステップS402に、自動検出指定されている場合はステップS403に進む。ステップS402にて、主制御部40は、現在のページが比較する対象ページかを判定し、対象ページであれば次のステップへ進むが、そうでない場合はステップS408に進む。ステップS403にて、主制御部40は、閾値指定がある場合はステップS404に進み、閾値指定がない場合はステップS405に進む。ステップS404にて、主制御部40は、ユーザーから指定された閾値を取得してステップS406に進む。ステップS405にて、主制御部40は、デフォルトの閾値を取得しステップS406に進む。ステップS406にて、主制御部40は、取得した閾値から特徴量の比較を実施してステップS407に進む。ステップS407にて、主制御部40は、特徴量の比較結果から比較ページの近似ページかどうかを判定し、近似ページであれば次のステップに進み、近似ページでないと判断すれば、ステップS408に進む。ステップS408にて、主制御部40は、直前のページの文書に属するページとして一次記録して、次のページの読み込みを行う(ステップS409)。
In step S401, the
以上、説明したように本第1実施例においては、全頁のフォーマットが必ずしも同一ではない複数の画像データの電子化を行う場合、使用者によって選択された内容(一致箇所選択/不一致箇所選択)に応じた形態で文書単位でフォルダが構築される。更に、フォルダ内に記憶される電子化ファイル名、ファイル形態も、使用者によって選択された内容(一致箇所選択/不一致箇所選択)に適合したものとなるため、使用者の利便性を高めることが出来る。 As described above, in the first embodiment, when digitizing a plurality of image data in which the format of all pages is not necessarily the same, the content selected by the user (selection of coincidence portion / non-coincidence portion selection) A folder is constructed for each document in a form corresponding to the above. Furthermore, the computerized file name and file format stored in the folder are also adapted to the contents selected by the user (selection of matching part / selection of non-matching part), so that convenience for the user can be improved. I can do it.
[第2実施例]
第1実施例は、使用者によって選択された内容に応じ、フォルダ構成、ファイル構成、さらにはフォルダ名、ファイル名を適宜制御するものであった。第2実施例では、使用者によって選択された内容に応じたファイル構成、ファイル名を制御する場合に関して説明する。
[Second Embodiment]
In the first embodiment, the folder configuration, file configuration, and further the folder name and file name are appropriately controlled according to the content selected by the user. In the second embodiment, a description will be given of a case where the file structure and the file name are controlled according to the content selected by the user.
なお、画像処理装置の構成は図1に代わって図9に示すような構成となり、本実施例ではフォルダ生成部404に代わってファイル生成部405を有している。
The configuration of the image processing apparatus is as shown in FIG. 9 instead of FIG. 1, and in this embodiment, a
図10は、本実施例にて、電子化された画像データのファイル管理方法について示す図である。同図において、第1実施例と同一機能を有するものは同一符号を付与しているが、本実施例特有の処理部は、主制御部40に構成したファイル生成部405のみである。したがって、画像入力部10、記憶部20、操作パネル部30、および主制御部40に構成した文字判定部401、一致判定部402、表示制御部403の機能、動作は第1実施例で説明したものと同一である。一方、本実施例では、主制御部40に構成した表示制御部403による表示制御後の動作が第1実施例と異なる。つまり、使用者による一致箇所、不一致箇所の選択後の制御が本実施例で実行される処理の特徴となる。このため、以下、一致箇所選択時、および不一致箇所選択時の制御に関して説明する。また、以下の説明に適用する入力画像データは図5に示したものとする。
FIG. 10 is a diagram showing a file management method for digitized image data in this embodiment. In the figure, components having the same functions as those in the first embodiment are given the same reference numerals, but the processing unit unique to this embodiment is only the
図10(a)は、一致判定となった文字列『御請求書』が選択された場合の、ファイル生成部405によるファイル生成制御結果である。ファイル生成部405は、一致判定となった文字列が選択された場合、記憶部20に生成するファイル名称として、選択された文字列を用いる。例えば、選択された一致判定の文字列が『御請求書』であれば、『御請求書』をファイル名(1001)とする。また、文字判定部401が生成した図5(a)、図5(b)、図5(c)の中間ファイルを統合した形態で記憶する。このように制御することで、使用者の意図した文字列を使用したファイル名を容易に生成することが出来る。
FIG. 10A shows a file generation control result by the
次に、不一致箇所が選択された場合のファイル生成部405の制御に関して説明する。図10(b)は、不一致判定となった文字列『株式会社AAA』が選択された場合の、ファイル生成部405によるフォルダ生成制御結果である。ファイル生成部405は、不一致判定となった文字列が選択された場合、記憶部20に生成するファイル名称として、選択された文字列位置に存在する各文字列を用いる。本説明において選択された不一致判定の文字列は、『株式会社AAA』である。そのため、各画像データにおける『株式会社AAA』の文字列の位置、すなわち、各入力画像データ中の『御中』の前に存在する文字列を、それぞれのファイル名(1002、1003、1004)とする。また、不一致判定となった文字列が選択された場合、画像入力部10により入力された電子化後の画像データをそれぞれ別のファイルとして記憶する。
Next, the control of the
つまり、入力画像データが図5(a)であれば、ファイル名株式会社AAAとして、図5(a)の電子化されたファイルを記憶する。同様に、入力画像データが図5(b)であれば、ファイル名をBBB(株)として、図5(b)の電子化されたファイルを記憶し、入力画像データが図5(c)であれば、ファイル名をCCC工務店として、図5(c)の電子化されたファイルを記憶する。つまり、本実施例においては、入力画像データ各々の中間ファイルがリネームされて記憶される。このように制御することで、使用者の意図した文字列を使用したファイル名を容易に生成することが出来る。 That is, if the input image data is FIG. 5A, the digitized file of FIG. 5A is stored as the file name AAA. Similarly, if the input image data is FIG. 5 (b), the file name is BBB, and the electronic file of FIG. 5 (b) is stored, and the input image data is FIG. 5 (c). If there is, the computerized file shown in FIG. 5C is stored with the file name as the CCC contractor. That is, in this embodiment, the intermediate file of each input image data is renamed and stored. By controlling in this way, a file name using a character string intended by the user can be easily generated.
次に主制御部40の制御フローに関して説明する。図11は、本実施例における制御フローを示す図である。なお、本フローの各ステップにおける処理は、以下に示す手順を記述したコンピュータ実行可能なプログラムをROM(不図示)からRAM(不図示)上に読み込んだ後に、CPU(不図示)によって該プログラムを実行することによって実施される。
Next, the control flow of the
使用者により、同一形態で構成される複数の画像データの電子化を行う動作モードが選択されると(ステップS201)、画像入力部10は画像データを受け付ける(ステップS202)。受け付ける画像データは、光学的な読み取りを伴うものであれば、スキャンされた画像データとなり、通信網を介して入力されるものであれば受信データとなる。ステップS203にて画像入力部10により、全ての画像データが入力されたと判断されるとステップS204に進む。
When the user selects an operation mode for digitizing a plurality of pieces of image data configured in the same form (step S201), the
入力された画像データは複数ページで構成される原稿を1セットとし、この原稿のセットを複数セット読み取ることで入力される。 The input image data is input by reading a plurality of sets of originals including a set of originals composed of a plurality of pages.
そしてステップS204にて、主制御部40は文字判定部401による文字判定処理を実施する。この文字判定部401による、文字判定処理は、画像入力部10により入力される1枚毎のレイアウト解析、データ切り出し、特徴抽出、照合、照合結果の記憶である。
In step S <b> 204, the
続いて、ステップS205にて、主制御部40は、使用者によって設定された動作モードが、同一形態で構成される複数の画像データの電子化を行うモードであるか否か判断し、そうでなければステップS212に進む。そしてステップS212にて、生成するファイル名を所定のものとして記憶する。一方、ステップS205にて主制御部40は、使用者によって設定された動作モードが、同一形態で構成される複数の画像データの電子化を行う動作モードであると判定された場合、ステップS120に進む。ステップS120のフローを経過し処理対象のページが決定された後、ステップS206へ進む。そしてステップS206にて一致判定部402による一致判定処理を実施する。この一致判定部402による一致判定処理が終了すると、ステップS207へ進み、主制御部40の表示制御部403は、一致箇所、不一致箇所の表示制御を行う。
Subsequently, in step S205, the
続いて、ステップS208にて使用者により、一致箇所が選択された場合ステップS209に進む。そしてステップS209にて、主制御部40のファイル生成部405は、選択された一致箇所の内容を反映したファイルを生成する。なお、生成するファイルは、全ての入力画像データの中間ファイルを統合した単一のファイルである。一方、ステップS208において、不一致箇所が選択されたと判定された場合は、ステップS210に進む。そして、ステップS210にて、ユーザーが選択した箇所が相違箇所であると判定されると、ステップS211に進む。そして、ステップS211にて、主制御部40のファイル生成部405は、各入力画像データ中の、選択された不一致箇所位置の内容を反映した文書単位のファイルを各々生成する。なお、ステップS209、およびステップS211において記憶するファイルの名称は、既に説明した一致箇所、不一致箇所の選択に対応した名称となる。
Subsequently, when the coincident part is selected by the user in step S208, the process proceeds to step S209. In step S209, the
以上、説明したように本実施例においては、全頁のフォーマットが必ずしも同一ではない複数の画像データの電子化を行う場合、使用者によって選択された内容(一致箇所選択/不一致箇所選択)に応じた形態で文書単位でファイルが構築される。更に、記憶される電子された画像データのファイル名も、使用者によって選択された内容(一致箇所選択/不一致箇所選択)に適合したものとなるため、使用者の利便性を高めることが出来る。 As described above, in this embodiment, when digitizing a plurality of image data in which the format of all pages is not necessarily the same, according to the content selected by the user (selection of coincidence / non-coincidence) A file is constructed for each document in the form. Furthermore, since the file name of the stored electronic image data is also adapted to the content selected by the user (matching location selection / non-matching location selection), user convenience can be improved.
[第3実施例]
次に、本発明の第3実施例に関して説明する。本実施例は、同一形態で構成される複数の画像データの電子化を行う場合、生成するファイルを統合して生成(単一ファイルとして生成)するか、個別に生成するかの動作モードが事前に設定された場合の制御に関するものである。なお、本実施例の画像処理装置の構成は、図1に示す構成であり、画像入力部10、記憶部20、操作パネル部30、主制御部40となる。また、以降の説明において、画像入力部10に入力される画像データは、図5に示した画像データとする。
[Third embodiment]
Next, a third embodiment of the present invention will be described. In this embodiment, when digitizing a plurality of pieces of image data configured in the same form, the operation mode of whether the files to be generated are integrated (generated as a single file) or individually generated is preliminarily set. It relates to control when set to. The configuration of the image processing apparatus according to the present embodiment is the configuration illustrated in FIG. 1 and includes an
以下、図面を用いて、本実施例における制御フローに関して説明する。図12は、本実施例における制御フローを示す図である。なお、本フローの各ステップにおける処理は、以下に示す手順を記述したコンピュータ実行可能なプログラムをROM(不図示)からRAM(不図示)上に読み込んだ後に、CPU(不図示)によって該プログラムを実行することによって実施される。 Hereinafter, the control flow in the present embodiment will be described with reference to the drawings. FIG. 12 is a diagram showing a control flow in the present embodiment. The processing in each step of this flow is performed by reading a computer-executable program describing the following procedure from a ROM (not shown) onto a RAM (not shown) and then executing the program by a CPU (not shown). Implemented by executing.
ステップS301にて、使用者により、同一形態で構成される複数の画像データの電子化を、統合して生成するか、個別で生成するかの動作モードが設定されると、ステップS302に進む。そして、ステップS302にて画像入力部10は画像データを受け付ける。受け付ける画像データは、第1実施例および第2実施例同様、光学的な読み取りを伴うものであれば、スキャンされた画像データとなり、通信網を介して入力されるものであれば受信データとなる。画像入力部10は、全ての画像データが入力されるまで画像データの受け付けを継続的に行う(ステップS303のNo)。
In step S301, when the user sets an operation mode for generating a plurality of pieces of image data configured in the same form in an integrated manner or individually, the process proceeds to step S302. In step S302, the
ステップS303にて画像入力部10により、全ての画像データの入力がされたと判定されると、ステップS304に進む。
If it is determined in step S303 that the
入力された画像データは複数ページで構成される原稿を1セットとし、この原稿のセットを複数セット読み取ることで入力される。 The input image data is input by reading a plurality of sets of originals including a set of originals composed of a plurality of pages.
そしてステップS304にて、主制御部40は、文字判定部401による文字判定処理を実施する。この文字判定部401による、文字判定処理は、画像入力部10により入力される1枚毎のレイアウト解析、データ切り出し、特徴抽出、照合、照合結果の記憶である。
In step S <b> 304, the
文字判定部401による文字判定が終了すると、ステップS120に進む。ステップS120のフローを経過し処理対象ページが決定された後、ステップS305に進み、主制御部40の一致判定部402は、一致判定処理を実施する。続いてステップS306にて主制御部40は、使用者により設定された動作モードが、入力画像データの電子化結果を統合して生成する動作モードである場合、ステップS307に進む。そして、ステップS307にて表示制御部403による処理により、一致判定部402で一致判定となった文字列を選択出来る形態で表示を行う。
When the character determination by the
この場合の操作パネル部30の状態例を図13(a)に示す。図13(a)において、網掛けで示した文字列は、一致判定部402により、入力画像データ、すなわち図5(a)、図5(b)、図5(c)それぞれで一致していると判定された文字列である。なお、この網掛けで示した文字列は、使用者が選択可能なものである。また、薄く示した文字列は、一致判定部402により、入力画像データで不一致と判定された文字列であり、使用者によって選択不可能なものである。なお、使用者により選択可能な一致判定された文字列の表示は、カラー表示での色分けでも良いし、点灯/点滅といった表示形態であっても良い。
An example of the state of the
ステップS308にて、使用者により、一致判定された文字列の選択がなされると、ステップS309に進み、主制御部40は、選択された文字列を用いたフォルダ名のフォルダを記憶部20に生成する。そして、記憶部20に記憶されている図5(a)、図5(b)、図5(c)の中間ファイルを統合し、選択された一致文字列を用いたファイル名でフォルダ内に記憶する。例えば、使用者により、一致判定の文字列『御請求書』が選択された場合、フォルダ名を『御請求書』とし、そのフォルダ内に、図5(a)、図5(b)、図5(c)を統合したファイルを、御請求書_001という名称で記憶する。
In step S308, when the user selects a character string determined to match, the process proceeds to step S309, and the
一方、ステップS306にて、主制御部40は、使用者により設定された動作モードが、入力画像データの電子化結果を個別に生成する動作モードである場合ステップS310に進む。そして、ステップS310にて、表示制御部403による処理により、一致判定部402で不一致判定となった文字列が選択出来る形態で表示を行う。
On the other hand, in step S306, the
この場合の操作パネル部30の状態例を図13(b)に示す。図13(b)において、網掛けで示した文字列は、一致判定部402により、入力画像データ、すなわち入力画像データで不一致と判定された文字列である。なお、この網掛けで示した文字列は、使用者が選択可能なものである。また、薄く示した文字列は、一致判定部402により、図5(a)、図5(b)、図5(c)全体で一致と判定された文字列であり、使用者によって選択不可能なものである。なお、使用者により選択可能な不一致判定された文字列の表示は、カラー表示での色分けでも良いし、点灯/点滅といった表示形態であっても良い。
An example of the state of the
ステップS311にて、主制御部40は、使用者により、不一致判定された文字列の選択がなされたと判断されるとステップS312に進む。そして、ステップS312にて、入力画像データ中の選択された不一致文字列位置の各文字列を用いたフォルダを記憶部20に生成し、生成した文書単位のファイルを記憶部20に記憶する。
In step S311, the
具体的には、図5(a)、図5(b)、図5(c)の中間ファイルを、各々該当するフォルダ内に記憶する。例えば、使用者により、不一致判定の文字列『株式会社AAA』が選択された場合、『株式会社AAA』、『BBB(株)』、『CCC工務店』の名称でフォルダを作成する。そして、その各フォルダ内に、図5(a)、図5(b)、図5(c)各々の中間ファイルを株式会社AAA_011、BBB(株)_001、CCC工務店_001にリネームして記憶する。 Specifically, the intermediate files shown in FIGS. 5A, 5B, and 5C are stored in the corresponding folders. For example, if the character string “AAA Co., Ltd.” for determining the inconsistency is selected by the user, a folder is created with the names “AAA Co., Ltd.”, “BBB Co., Ltd.”, and “CCC Contractor”. In each of the folders, the intermediate files shown in FIGS. 5A, 5B, and 5C are renamed and stored in AAA_011, BBB Co., Ltd._001, and CCC engineering company_001. .
なお、本実施例における、一致判定の文字列、あるいは不一致判定の文字列の表示部301への表示対象は、全ての一致判定文字列、全ての不一致判定文字列としなくても良い。例えば、記憶部20に、一致、不一致の表示対象とする文字の大きさ(フォントの大きさ)、文字列の長さを事前登録し、登録された内容に該当する一致文字列、不一致文字列のみを表示するようにしても良い。また、記憶部20に、キーワードを事前登録し、事前登録されたキーワードに該当する一致文字列、不一致文字列のみを表示するようにしても良い。
It should be noted that in the present embodiment, the match determination character string or the mismatch determination character string to be displayed on the
以上、説明したように、本実施例においては、事前に設定された動作モードに応じて、文書単位で生成するフォルダ名、ファイル名の候補を、一致判定された文字列、あるいは不一致判定された文字列とすることで使用者の利便性を向上させている。 As described above, according to the present embodiment, according to a preset operation mode, a folder name and a file name candidate generated for each document are determined as a character string determined to match or as a mismatch. User convenience is improved by using a character string.
(その他の実施例)
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施例の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
(Other examples)
The present invention is also realized by executing the following processing. That is, software (program) for realizing the functions of the above-described embodiments is supplied to a system or apparatus via a network or various storage media, and a computer (or CPU, MPU, etc.) of the system or apparatus reads the program. It is a process to be executed.
Claims (7)
前記入力手段により入力された画像データのうち、
第1の原稿のセットに対応する第1の画像データに含まれる文字列と第2の原稿のセットに対応する第2の画像データに含まれる文字列とをページ毎に比較し、
前記第1の画像データに含まれる文字列と前記第2の画像データに含まれる文字列とで共通する位置にて一致と判定された文字列と、一致と判定されなかった文字列とを異なる表示形態にて表示する表示制御手段と、
前記表示制御手段により表示された文字列から指定された文字列を用いて前記第1の画像データを記憶部に記憶するように制御する制御手段と、
を有す画像処理装置。 An input means for inputting image data obtained by reading a plurality of sets of originals composed of a plurality of pages;
Of the image data input by the input means,
A character string included in the first image data corresponding to the first document set is compared with a character string included in the second image data corresponding to the second document set for each page,
A character string determined to match at a position common to a character string included in the first image data and a character string included in the second image data is different from a character string not determined to match. Display control means for displaying in display form;
Control means for controlling to store the first image data in a storage unit using a character string designated from the character string displayed by the display control means;
An image processing apparatus.
前記入力ステップにて入力された画像データのうち、
第1の原稿のセットに対応する第1の画像データに含まれる文字列と第2の原稿のセットに対応する第2の画像データに含まれる文字列とをページ毎に比較し、
前記第1の画像データに含まれる文字列と前記第2の画像データに含まれる文字列とで共通する位置にて一致と判定された文字列と、一致と判定されなかった文字列とを異なる表示形態にて表示する表示制御ステップと、
前記表示制御ステップにて表示された文字列から指定された文字列を用いて前記第1の画像データを記憶部に記憶するように制御する制御ステップと、
を有す画像処理方法。 An input step for inputting image data obtained by reading a plurality of sets of originals composed of multiple pages;
Of the image data input in the input step,
A character string included in the first image data corresponding to the first document set is compared with a character string included in the second image data corresponding to the second document set for each page,
A character string determined to match at a position common to a character string included in the first image data and a character string included in the second image data is different from a character string not determined to match. A display control step for displaying in a display form;
A control step for controlling to store the first image data in a storage unit using a character string designated from the character string displayed in the display control step;
An image processing method.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014246330A JP2016111482A (en) | 2014-12-04 | 2014-12-04 | Image processing device and control method of image processing device |
US14/678,776 US9854121B2 (en) | 2014-04-18 | 2015-04-03 | Image processing apparatus for generating a digitized document by using image data and method for controlling the same |
KR1020150052876A KR101840643B1 (en) | 2014-04-18 | 2015-04-15 | Image processing apparatus and method for controlling the same |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014246330A JP2016111482A (en) | 2014-12-04 | 2014-12-04 | Image processing device and control method of image processing device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2016111482A true JP2016111482A (en) | 2016-06-20 |
Family
ID=56122323
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014246330A Pending JP2016111482A (en) | 2014-04-18 | 2014-12-04 | Image processing device and control method of image processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2016111482A (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019134364A (en) * | 2018-02-01 | 2019-08-08 | キヤノン株式会社 | Device, method and program for setting information about scan image data |
JP2020140564A (en) * | 2019-02-28 | 2020-09-03 | キヤノン株式会社 | Image processing device, method for controlling the same, and program |
-
2014
- 2014-12-04 JP JP2014246330A patent/JP2016111482A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2019134364A (en) * | 2018-02-01 | 2019-08-08 | キヤノン株式会社 | Device, method and program for setting information about scan image data |
JP2020140564A (en) * | 2019-02-28 | 2020-09-03 | キヤノン株式会社 | Image processing device, method for controlling the same, and program |
JP7353771B2 (en) | 2019-02-28 | 2023-10-02 | キヤノン株式会社 | Program, storage medium, information processing device control method, and information processing device |
US11811979B2 (en) | 2019-02-28 | 2023-11-07 | Canon Kabushiki Kaisha | Image processing apparatus, method for controlling the same, and storage medium |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101840643B1 (en) | Image processing apparatus and method for controlling the same | |
US10949662B2 (en) | Image processing apparatus | |
US9710524B2 (en) | Image processing apparatus, image processing method, and computer-readable storage medium | |
JP2018124656A (en) | Image processing apparatus, control method thereof and program | |
JP2016024488A (en) | Image processing apparatus and method of controlling the same | |
US10503993B2 (en) | Image processing apparatus | |
US8073256B2 (en) | Image processing apparatus and method therefor | |
US20230206672A1 (en) | Image processing apparatus, control method of image processing apparatus, and storage medium | |
US20230273952A1 (en) | Image processing apparatus, image processing method, and storage medium | |
JP2016018454A (en) | Image processing system and controlling method thereof | |
JP7102284B2 (en) | File management device, file management method, and program | |
JP2016111482A (en) | Image processing device and control method of image processing device | |
JP2018042067A (en) | Image processing system, image processing method, and information processing device | |
JP7532085B2 (en) | Image processing device, image processing method, and program | |
US11657367B2 (en) | Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program | |
JP4811133B2 (en) | Image forming apparatus and image processing apparatus | |
JP2007041709A (en) | Document processing system, control method of document processing system, document processing device, computer program and computer readable storage medium | |
JP6700705B2 (en) | Distribution system, information processing method, and program | |
US20230118845A1 (en) | Information processing apparatus and non-transitory computer readable medium storing information processing program | |
JP2018142066A (en) | Character recognition device, character recognition method, character recognition program, and computer-readable storage medium recording character recognition program | |
JP5381225B2 (en) | Information processing apparatus and program | |
JP2015213289A (en) | Image processing apparatus, and control method of image processing apparatus | |
CN112789624A (en) | Character candidate proposing device, handwritten character discriminating system, method and program | |
JP2020047031A (en) | Document retrieval device, document retrieval system and program | |
JP7570843B2 (en) | IMAGE PROCESSING APPARATUS, IMAGE FORMING SYSTEM, IMAGE PROCESSING METHOD, AND PROGRAM |