JP2017195492A - Image storage apparatus and image storage program - Google Patents

Image storage apparatus and image storage program Download PDF

Info

Publication number
JP2017195492A
JP2017195492A JP2016084276A JP2016084276A JP2017195492A JP 2017195492 A JP2017195492 A JP 2017195492A JP 2016084276 A JP2016084276 A JP 2016084276A JP 2016084276 A JP2016084276 A JP 2016084276A JP 2017195492 A JP2017195492 A JP 2017195492A
Authority
JP
Japan
Prior art keywords
image
characters
information
storage
resolution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016084276A
Other languages
Japanese (ja)
Other versions
JP6743470B2 (en
Inventor
祐 大竹
Hiroshi Otake
祐 大竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2016084276A priority Critical patent/JP6743470B2/en
Publication of JP2017195492A publication Critical patent/JP2017195492A/en
Application granted granted Critical
Publication of JP6743470B2 publication Critical patent/JP6743470B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

PROBLEM TO BE SOLVED: To provide an image storage apparatus in which, when the number of characters in an image is larger than or equal to a predetermined threshold value, characters having less capacity than the image are stored as a substitute for the image.SOLUTION: Accepting means of the image storage apparatus accepts an image from an image processing apparatus. Extracting means extracts characters from the image accepted by the accepting means. When the number of characters of the character extracted by the extraction means is larger than or equal to a predetermined threshold value, storage means accumulates the character as a substitute for the image.SELECTED DRAWING: Figure 1

Description

本発明は、画像蓄積装置及び画像蓄積プログラムに関する。   The present invention relates to an image storage device and an image storage program.

特許文献1には、外部から受信した画像データを外部メモリに一時的に保存するとともに、当該外部メモリを介した情報漏えいを好適に防止する画像形成装置、それらの制御方法、及びプログラムを提供することを課題とし、画像形成装置は、ネットワークを介して外部装置から画像データを受信すると、画像形成装置の記憶部に画像データを格納できるか否かと、外部メモリに画像データを格納する設定が行われているか否かとの判定結果に基づいて、画像データを前記記憶部へ格納するか、外部メモリに画像データを格納するか、又は、画像データの受信を拒否し、さらに、外部メモリに画像データを格納する設定が行われていると判定されると、設定が有効であるため外部メモリを用いた他の画像データの入出力処理を制限することが開示されている。   Patent Document 1 provides an image forming apparatus that temporarily stores image data received from the outside in an external memory, and suitably prevents information leakage through the external memory, a control method thereof, and a program When the image forming apparatus receives the image data from the external apparatus via the network, the image forming apparatus determines whether the image data can be stored in the storage unit of the image forming apparatus and sets the image data to be stored in the external memory. The image data is stored in the storage unit, the image data is stored in the external memory, or the reception of the image data is rejected, and the image data is further stored in the external memory. If it is determined that the setting for storing the image is made, the setting is valid, so input / output processing of other image data using the external memory may be restricted. It is shown.

特許文献2には、複数の画像データの重要度の組み合わせに応じた画像データの柔軟な保存種類の選択を行うことを課題とし、イメージデータの保存を行うサーバーであって、イメージデータの取引内容に関する情報を格納している各DBと、イメージデータと、当該イメージデータに関する取引内容が送受信部を介して受信されると、入力された取引内容に応じて、複数のイメージデータの圧縮方式から1つを決定する圧縮方式決定部と、決定した圧縮方式に従って、イメージデータを変換し、保存するイメージ圧縮部と、を有することが開示されている。   Patent Document 2 is a server for storing image data, which is to select a flexible storage type of image data according to a combination of importance levels of a plurality of image data. When each DB that stores information on the image, the image data, and the transaction content related to the image data are received via the transmission / reception unit, one of a plurality of image data compression methods is selected according to the input transaction content. And a compression method determination unit that determines the image data, and an image compression unit that converts and stores image data according to the determined compression method.

特開2013−090201号公報JP2013-090201A 特開2010−206450号公報JP 2010-206450 A

画像処理装置から画像を受け付け、その画像を蓄積することが行われている。
ところで、画像を蓄積するためには大容量の蓄積装置が必要となる。特許文献1等に記載の技術では、外部メモリに画像を格納すること等が行われている。しかし、画像が文字中心であったとしても、その画像を蓄積することとなってしまう。
本発明は、画像内の文字数が予め定められた閾値より多い又は以上である場合は、その画像の代替として、画像よりも容量が少ない文字を蓄積するようにした画像蓄積装置及び画像蓄積プログラムを提供することを目的としている。
An image is received from an image processing apparatus and stored.
By the way, in order to store images, a large-capacity storage device is required. In the technique described in Patent Document 1 or the like, an image is stored in an external memory. However, even if the image is centered on characters, the image is accumulated.
The present invention provides an image storage device and an image storage program for storing characters having a capacity smaller than that of an image as an alternative to the image when the number of characters in the image is greater than or greater than a predetermined threshold. It is intended to provide.

かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、画像処理装置から画像を受け付ける受付手段と、前記受付手段によって受け付けられた画像内から文字を抽出する抽出手段と、前記抽出手段によって抽出された文字の文字数が予め定められた閾値より多い又は以上である場合は、前記画像の代替として、該文字を蓄積する蓄積手段を有する画像蓄積装置である。
The gist of the present invention for achieving the object lies in the inventions of the following items.
According to the first aspect of the present invention, a receiving unit that receives an image from an image processing apparatus, an extracting unit that extracts characters from the image received by the receiving unit, and the number of characters extracted by the extracting unit are predetermined. If the number is greater than or equal to the threshold value, the image storage device includes a storage unit that stores the characters as an alternative to the image.

請求項2の発明は、前記蓄積手段は、前記画像内の文字数が前記閾値未満又は以下である場合は、前記画像を蓄積する、請求項1に記載の画像蓄積装置である。   The invention of claim 2 is the image storage device according to claim 1, wherein the storage means stores the image when the number of characters in the image is less than or less than the threshold.

請求項3の発明は、前記蓄積手段は、前記画像内の文字に、予め定められた文字列が含まれているか否かにしたがって、画像を蓄積するか、文字を蓄積するかを決定する、請求項1又は2に記載の画像蓄積装置である。   The invention according to claim 3 determines whether the storage means stores an image or a character according to whether or not a character string in the image includes a predetermined character string. An image storage device according to claim 1.

請求項4の発明は、前記蓄積手段は、文字数と予め定められた文字列によって決定した蓄積対象が異なる場合は、予め定められた文字列によって決定した蓄積対象にしたがって、蓄積を行う、請求項3に記載の画像蓄積装置である。   According to a fourth aspect of the present invention, in the case where the accumulation object determined by the number of characters and a predetermined character string is different, the accumulation means performs accumulation according to the accumulation object determined by the predetermined character string. 3. The image storage device according to 3.

請求項5の発明は、前記蓄積手段は、前記画像内の構造にしたがって、該画像を蓄積するか、文字を蓄積するかを決定する、請求項1又は2に記載の画像蓄積装置である。   The invention according to claim 5 is the image storage device according to claim 1 or 2, wherein the storage means determines whether to store the image or the character according to the structure in the image.

請求項6の発明は、前記蓄積手段は、文字数と構造によって決定した蓄積対象が異なる場合は、構造によって決定した蓄積対象にしたがって、蓄積を行う、請求項3に記載の画像蓄積装置である。   The invention according to claim 6 is the image storage device according to claim 3, wherein the storage means performs storage according to the storage object determined by the structure when the storage object determined by the number of characters and the structure is different.

請求項7の発明は、前記蓄積手段は、前記抽出手段によって抽出された文字の文字数が予め定められた第1の閾値より多い又は以上である場合は、前記画像の代替として、該文字を蓄積し、予め定められた第1の解像度になるように縮小した縮小画像を蓄積し、該文字数が該第1の閾値未満又は以下であって、第2の閾値より多い又は以上である場合は、該画像の代替として、該文字を蓄積し、前記第1の解像度よりも高い第2の解像度になるように縮小した縮小画像を蓄積し、該文字数が該第2の閾値未満又は以下である場合は、該画像を蓄積し、前記第1の解像度よりも低い第3の解像度になるように縮小した縮小画像を蓄積し、前記第2の閾値は、前記第1の閾値よりも低い、請求項1から6のいずれか一項に記載の画像蓄積装置である。   According to a seventh aspect of the present invention, when the number of characters extracted by the extraction unit is greater than or equal to a predetermined first threshold, the storage unit stores the character as a substitute for the image. And storing a reduced image that has been reduced to a predetermined first resolution, and the number of characters is less than or less than the first threshold and greater than or greater than the second threshold, As an alternative to the image, when the characters are accumulated, a reduced image reduced to have a second resolution higher than the first resolution is accumulated, and the number of characters is less than or less than the second threshold Storing the image, storing a reduced image reduced to a third resolution lower than the first resolution, and wherein the second threshold is lower than the first threshold. The image storage device according to any one of 1 to 6 .

請求項8の発明は、コンピュータを、画像処理装置から画像を受け付ける受付手段と、前記受付手段によって受け付けられた画像内から文字を抽出する抽出手段と、前記抽出手段によって抽出された文字の文字数が予め定められた閾値より多い又は以上である場合は、前記画像の代替として、該文字を蓄積する蓄積手段として機能させるための画像蓄積プログラムである。   The invention according to claim 8 is a computer that receives an image from an image processing apparatus, an extraction unit that extracts characters from the image received by the reception unit, and the number of characters extracted by the extraction unit. When the number is greater than or equal to a predetermined threshold value, an image storage program for functioning as storage means for storing the characters as an alternative to the image.

請求項1の画像蓄積装置によれば、画像内の文字数が予め定められた閾値より多い又は以上である場合は、その画像の代替として、画像よりも容量が少ない文字を蓄積することができる。   According to the image storage device of the first aspect, when the number of characters in the image is greater than or equal to a predetermined threshold value, it is possible to accumulate characters having a smaller capacity than the image as an alternative to the image.

請求項2の画像蓄積装置によれば、画像内の文字数が閾値未満又は以下である場合は、その画像を蓄積することができる。   According to the image storage device of the second aspect, when the number of characters in the image is less than or less than the threshold value, the image can be stored.

請求項3の画像蓄積装置によれば、画像内の文字に、予め定められた文字列が含まれているか否かにしたがって、画像を蓄積するか、文字を蓄積するかを決定することができる。   According to the image storage device of the third aspect, it is possible to determine whether to store an image or a character according to whether or not a character string in the image includes a predetermined character string. .

請求項4の画像蓄積装置によれば、文字数と予め定められた文字列によって決定した蓄積対象が異なる場合は、予め定められた文字列によって決定した蓄積対象にしたがって、蓄積を行うことができる。   According to the image storage device of the fourth aspect, when the storage target determined by the number of characters and the predetermined character string is different, the storage can be performed according to the storage target determined by the predetermined character string.

請求項5の画像蓄積装置によれば、画像内の構造にしたがって、その画像を蓄積するか、文字を蓄積するかを決定することができる。   According to the image storage device of the fifth aspect, it is possible to determine whether to store the image or the character according to the structure in the image.

請求項6の画像蓄積装置によれば、文字数と構造によって決定した蓄積対象が異なる場合は、構造によって決定した蓄積対象にしたがって、蓄積を行うことができる。   According to the image storage device of the sixth aspect, when the storage target determined by the number of characters and the structure is different, the storage can be performed according to the storage target determined by the structure.

請求項7の画像蓄積装置によれば、文字数に適した縮小画像を生成して蓄積することができる。   According to the image storage device of the seventh aspect, it is possible to generate and store a reduced image suitable for the number of characters.

請求項8の画像蓄積プログラムによれば、画像内の文字数が予め定められた閾値より多い又は以上である場合は、その画像の代替として、画像よりも容量が少ない文字を蓄積することができる。   According to the image storage program of the eighth aspect, when the number of characters in the image is greater than or equal to a predetermined threshold, characters having a smaller capacity than the image can be accumulated as an alternative to the image.

本実施の形態の構成例についての概念的なモジュール構成図である。It is a conceptual module block diagram about the structural example of this Embodiment. 本実施の形態を利用したシステム構成例を示す説明図である。It is explanatory drawing which shows the system configuration example using this Embodiment. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 保存情報決定テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a preservation | save information determination table. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 保存情報決定テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a preservation | save information determination table. 保存情報決定テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a preservation | save information determination table. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 保存情報決定テーブルのデータ構造例を示す説明図である。It is explanatory drawing which shows the example of a data structure of a preservation | save information determination table. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 本実施の形態による処理例を示すフローチャートである。It is a flowchart which shows the process example by this Embodiment. 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。It is a block diagram which shows the hardware structural example of the computer which implement | achieves this Embodiment.

以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という意味を有する記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスク、RAM(Random Access Memory)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unit)内のレジスタ等を含んでいてもよい。
Hereinafter, an example of a preferred embodiment for realizing the present invention will be described with reference to the drawings.
FIG. 1 shows a conceptual module configuration diagram of a configuration example of the present embodiment.
The module generally refers to components such as software (computer program) and hardware that can be logically separated. Therefore, the module in the present embodiment indicates not only a module in a computer program but also a module in a hardware configuration. Therefore, the present embodiment is a computer program for causing these modules to function (a program for causing a computer to execute each procedure, a program for causing a computer to function as each means, and a function for each computer. This also serves as an explanation of the program and system and method for realizing the above. However, for the sake of explanation, the words “store”, “store”, and equivalents thereof are used. However, when the embodiment is a computer program, these words are stored in a storage device or stored in memory. This means that control is performed so as to be stored in the apparatus. Modules may correspond to functions one-to-one, but in mounting, one module may be configured by one program, or a plurality of modules may be configured by one program, and conversely, one module May be composed of a plurality of programs. The plurality of modules may be executed by one computer, or one module may be executed by a plurality of computers in a distributed or parallel environment. Note that one module may include other modules. Hereinafter, “connection” is used not only for physical connection but also for logical connection (data exchange, instruction, reference relationship between data, etc.). “Predetermined” means that the process is determined before the target process, and not only before the process according to this embodiment starts but also after the process according to this embodiment starts. Also, if it is before the target processing, it is used in accordance with the situation / status at that time or with the intention to be decided according to the status / status up to that point. When there are a plurality of “predetermined values”, they may be different values, or two or more values (of course, including all values) may be the same. In addition, the description having the meaning of “do B when it is A” is used in the meaning of “determine whether or not it is A and do B when it is judged as A”. However, the case where it is not necessary to determine whether or not A is excluded.
In addition, the system or device is configured by connecting a plurality of computers, hardware, devices, and the like by communication means such as a network (including one-to-one correspondence communication connection), etc., and one computer, hardware, device. The case where it implement | achieves by etc. is included. “Apparatus” and “system” are used as synonymous terms. Of course, the “system” does not include a social “mechanism” (social system) that is an artificial arrangement.
In addition, when performing a plurality of processes in each module or in each module, the target information is read from the storage device for each process, and the processing result is written to the storage device after performing the processing. is there. Therefore, description of reading from the storage device before processing and writing to the storage device after processing may be omitted. Here, the storage device may include a hard disk, a RAM (Random Access Memory), an external storage medium, a storage device via a communication line, a register in a CPU (Central Processing Unit), and the like.

本実施の形態である画像蓄積装置100は、画像処理装置から画像を受け付け、その画像又はその画像内の文字を蓄積するものであって、図1の例に示すように、イメージ受信モジュール110、文字情報取得モジュール120、保存情報選択モジュール130、保存情報生成モジュール140、保存情報保存モジュール150、保存情報決定テーブル160を有している。   The image storage device 100 according to the present embodiment receives an image from the image processing device and stores the image or characters in the image. As shown in the example of FIG. A character information acquisition module 120, a storage information selection module 130, a storage information generation module 140, a storage information storage module 150, and a storage information determination table 160 are provided.

画像蓄積装置100は、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等の画像処理装置によって処理対象とされた画像(イメージともいわれる)又は処理された画像(つまり、処理前の画像又は処理後の画像)を蓄積しており、文書の流出が発覚した場合に、いつ誰が処理(印刷、画像読み取り等)したものであるかを追跡するシステム(一般的に、イメージログシステムともいわれる)に利用されるものである。具体的には、イメージログシステムとは、画像処理装置で処理した画像を予め定められた期間、蓄積し、情報漏えいが発覚した際に流出元を特定するために画像及び属性を蓄積するものである。なお、属性として、その画像に対して処理指示を行ったユーザー、その処理を行った日時(年、月、日、時、分、秒、秒以下、又はこれらの組み合わせであってもよい)、その処理を行った画像処理装置等を特定するための情報である。イメージログシステムは、例えば、対象としている企業の全ての画像処理装置を監視対象とすることが一般的であるため、対象とする画像(文書、ジョブ)数は多い。つまり、蓄積対象の画像数は膨大(例えば、数百万程度)であり、その保存容量も膨大(例えば、数TB)となる。そもそも画像であるため、保存容量もテキストデータに比べて大きくなる。   The image storage apparatus 100 is an image processing apparatus such as a copying machine, a fax machine, a scanner, a printer, or a multifunction machine (an image processing apparatus having any two or more functions such as a scanner, a printer, a copying machine, and a fax machine) It stores images to be processed (also referred to as images) or processed images (that is, images before processing or images after processing), and when a document leak is detected, who will process (print, It is used for a system (generally referred to as an image log system) that tracks whether an image is read. Specifically, an image log system is a system that stores images processed by an image processing apparatus for a predetermined period, and stores images and attributes in order to identify an outflow source when an information leak is detected. is there. As attributes, the user who issued the processing instruction for the image, the date and time when the processing was performed (may be year, month, day, hour, minute, second, less than second, or a combination thereof), This is information for specifying an image processing apparatus or the like that has performed the process. For example, since an image log system generally targets all image processing apparatuses of a target company as a monitoring target, the number of target images (documents, jobs) is large. That is, the number of images to be accumulated is enormous (for example, about several millions), and the storage capacity is enormous (for example, several TB). Since it is an image in the first place, the storage capacity is also larger than that of text data.

一方、文書の流出が発覚した場合の追跡に、必要となる情報として、以下のものがある。
・その文書の画像(イメージ)そのもの
・その文書に含まれている文字情報
例えば、図面などのように文字情報が少ない文書であれば、流出した文書を特定するためにはその文書の画像そのものが必要であるが、文字情報を主とした技術文書等であれば、文字情報があれば特定は可能となる。つまり、追跡可能性を担保した上で、保存容量を考慮した場合、文書内容に応じて最適な保存情報は異なるといえる。
On the other hand, the following information is necessary for tracking when a document leak is detected.
-The image of the document itself-Character information included in the document For example, if the document has little character information such as a drawing, the image of the document itself is used to identify the leaked document. Although it is necessary, if it is a technical document or the like mainly including character information, it can be specified if there is character information. That is, when the storage capacity is taken into consideration while ensuring traceability, it can be said that the optimal storage information differs depending on the document content.

本実施の形態ではその文書内容に注目した蓄積方法を選択する。具体的には、蓄積方法として、(1)画像で蓄積する場合、(2)画像内の文字で蓄積する場合、がある。
また、後述するように、蓄積方法の3つ目の選択肢として、(3)縮小画像(以下、サムネイルともいう)を選択可能としてもよい。ただし、これは前述の(1)又は(2)と組み合わせるものである。つまり、画像と縮小画像、文字と縮小画像がある。なお、縮小画像は、文書構成がわかる程度の解像度(画像処理装置における処理解像度(元の画像の解像度)よりも低い解像度)の画像である。また、縮小画像として、低解像度の縮小画像としてもよいし、中解像度の縮小画像をとしてもよい。
したがって、本実施の形態の具体例として、蓄積するデータの組み合わせは以下のものがある。
(1)蓄積情報(以下、保存情報ともいう)のパターン1
・画像(高解像度:元の画像の解像度)
(2)蓄積情報のパターン2
・文字
(3)蓄積情報のパターン3
・画像(高解像度:元の画像の解像度)
・縮小画像(低解像度)
(4)蓄積情報のパターン4
・文字
・縮小画像(低解像度)
(5)蓄積情報のパターン5
・文字
・縮小画像(中解像度)
この(3)以降のパターンは、省略可能(オプション)である。また、各パターンに、前述の属性を含ませてもよい。
In the present embodiment, an accumulation method focusing on the document content is selected. Specifically, there are (1) accumulation in an image and (2) accumulation in characters in an image as an accumulation method.
As will be described later, as a third option for the accumulation method, (3) a reduced image (hereinafter also referred to as a thumbnail) may be selectable. However, this is a combination with the above (1) or (2). That is, there are an image and a reduced image, and a character and a reduced image. Note that the reduced image is an image having a resolution that allows the document configuration to be understood (a resolution lower than the processing resolution (resolution of the original image) in the image processing apparatus). The reduced image may be a low-resolution reduced image or a medium-resolution reduced image.
Therefore, as a specific example of the present embodiment, there are the following combinations of accumulated data.
(1) Pattern 1 of accumulated information (hereinafter also referred to as stored information)
・ Image (High resolution: Original image resolution)
(2) Pattern 2 of stored information
-Character (3) pattern 3 of stored information
・ Image (High resolution: Original image resolution)
・ Reduced image (low resolution)
(4) Pattern 4 of stored information
・ Text and reduced images (low resolution)
(5) Accumulated information pattern 5
・ Text and reduced image (medium resolution)
The patterns after (3) can be omitted (optional). In addition, the above-described attributes may be included in each pattern.

なお、画像には、画像データそのもの(一般的に、ラスターイメージといわれており、圧縮された画像を含む)、印刷データ等があり、具体的には、スキャナで読み取った画像、プリンタが印刷対象とするデータ(PDL(Page−Description Language)、PDF(Portable Document Format)等)、ファックスで送信した画像、ファックスが受信した画像、複写機で複写した画像等が含まれる。   The image includes image data itself (generally referred to as a raster image, including a compressed image), print data, and the like. Specifically, an image read by a scanner, a printer to be printed Data (PDL (Page-Description Language), PDF (Portable Document Format), etc.), an image transmitted by fax, an image received by a fax, an image copied by a copying machine, and the like.

画像蓄積装置100内のイメージ受信モジュール110、文字情報取得モジュール120、保存情報選択モジュール130、保存情報生成モジュール140、保存情報保存モジュール150、保存情報決定テーブル160は、それぞれ接続されている。
イメージ受信モジュール110は、画像処理装置から画像を受け付ける。また、画像とともに属性を受信してもよい。画像処理装置からは画像データ(ラスターイメージ、画像の一種)が転送されるケースもあれば、PDL(画像の一種)等が転送されるケースもある。画像を受信し、後段の処理に渡す。
文字情報取得モジュール120は、イメージ受信モジュール110によって受け付けられた画像内から文字を抽出する。イメージ受信モジュール110によって受け付けられた画像がPDLである場合は、そのPDL内を構造解析することによって、文字を抽出する。また、イメージ受信モジュール110によって受け付けられた画像がラスターイメージである場合は、その画像を文字認識して文字情報を取得する。
The image reception module 110, the character information acquisition module 120, the storage information selection module 130, the storage information generation module 140, the storage information storage module 150, and the storage information determination table 160 in the image storage device 100 are connected to each other.
The image receiving module 110 receives an image from the image processing apparatus. Moreover, you may receive an attribute with an image. In some cases, image data (raster image, a kind of image) is transferred from the image processing apparatus, and in other cases, PDL (a kind of image) is transferred. The image is received and passed to the subsequent processing.
The character information acquisition module 120 extracts characters from the image received by the image reception module 110. If the image received by the image receiving module 110 is PDL, characters are extracted by analyzing the structure of the PDL. If the image received by the image receiving module 110 is a raster image, the image is recognized and character information is acquired.

保存情報選択モジュール130は、文字情報取得モジュール120によって抽出された文字の文字数が予め定められた閾値より多い又は以上である場合は、イメージ受信モジュール110によって受け付けられた画像の代替として、その文字を蓄積対象として選択する。
また、保存情報選択モジュール130は、文字情報取得モジュール120によって抽出された文字の文字数が閾値未満又は以下である場合は、その画像を蓄積対象として選択するようにしてもよい。
また、保存情報選択モジュール130は、文字情報取得モジュール120によって抽出された文字に、予め定められた文字列が含まれているか否かにしたがって、画像を蓄積するか、文字を蓄積するかを決定するようにしてもよい。
さらに、保存情報選択モジュール130は、文字数と予め定められた文字列によって決定した蓄積対象が異なる場合は、予め定められた文字列によって決定した蓄積対象にしたがって、蓄積を行わせるようにしてもよい。
また、保存情報選択モジュール130は、イメージ受信モジュール110によって受け付けられた画像内の構造にしたがって、その画像を蓄積するか、文字情報取得モジュール120によって抽出された文字を蓄積するかを決定するようにしてもよい。
さらに、保存情報選択モジュール130は、文字数と構造によって決定した蓄積対象が異なる場合は、構造によって決定した蓄積対象にしたがって、蓄積を行わせるようにしてもよい。
また、保存情報選択モジュール130は、文字情報取得モジュール120によって抽出された文字の文字数が予め定められた第1の閾値より多い又は以上である場合は、画像の代替として、文字を蓄積し、予め定められた第1の解像度になるように縮小した縮小画像を蓄積させるようにしてもよい。そして、その文字数が第1の閾値未満又は以下であって、第2の閾値より多い又は以上である場合は、画像の代替として、その文字を蓄積し、第1の解像度よりも高い第2の解像度になるように縮小した縮小画像を蓄積させるようにしてもよい。そして、その文字数が第2の閾値未満又は以下である場合は、その画像を蓄積し、第1の解像度よりも低い第3の解像度になるように縮小した縮小画像を蓄積させるようにしてもよい。なお、第2の閾値は、第1の閾値よりも低い値である。
具体的には、保存情報選択モジュール130は、文字情報取得モジュール120によって取得された文字を、保存情報決定テーブル160に適用して、蓄積対象(画像そのものか文字か)を選択する。
When the number of characters extracted by the character information acquisition module 120 is greater than or equal to a predetermined threshold, the saved information selection module 130 uses the character as an alternative to the image received by the image reception module 110. Select as accumulation target.
Further, when the number of characters extracted by the character information acquisition module 120 is less than or less than the threshold, the saved information selection module 130 may select the image as an accumulation target.
Further, the stored information selection module 130 determines whether to store an image or a character according to whether or not the character extracted by the character information acquisition module 120 includes a predetermined character string. You may make it do.
Furthermore, when the accumulation target determined by the number of characters and a predetermined character string is different, the storage information selection module 130 may perform accumulation according to the accumulation target determined by the predetermined character string. .
Further, the storage information selection module 130 determines whether to store the image or the characters extracted by the character information acquisition module 120 according to the structure in the image received by the image reception module 110. May be.
Furthermore, when the storage target determined by the number of characters and the structure is different, the storage information selection module 130 may perform storage according to the storage target determined by the structure.
Further, when the number of characters extracted by the character information acquisition module 120 is greater than or equal to a predetermined first threshold, the saved information selection module 130 accumulates characters as an alternative to the image, You may make it accumulate | store the reduced image reduced so that it might become the defined 1st resolution. If the number of characters is less than or less than the first threshold and greater than or equal to the second threshold, the character is stored as an alternative to the image, and the second is higher than the first resolution. You may make it accumulate | store the reduced image reduced so that it might become the resolution. If the number of characters is less than or less than the second threshold, the image may be stored, and a reduced image that has been reduced to a third resolution lower than the first resolution may be stored. . Note that the second threshold value is lower than the first threshold value.
Specifically, the storage information selection module 130 applies the character acquired by the character information acquisition module 120 to the storage information determination table 160 and selects an accumulation target (image itself or character).

保存情報生成モジュール140は、保存情報選択モジュール130によって選択された蓄積対象の情報を生成する。具体的には、イメージ受信モジュール110によって受け付けられた画像データそのものであったり(保存情報生成モジュール140による処理は不要)、文字情報取得モジュール120によって抽出された文字であったり(保存情報生成モジュール140による処理は不要)、PDLからラスターイメージへの変換を行ったりする。また、縮小画像を生成してもよい。さらに、これらと属性を対応付ける処理を行ってもよい。
具体的には、保存情報生成モジュール140は、蓄積情報を生成する。蓄積情報の候補は以下の通りである。
・画像
・文字
・属性
・縮小画像
ここで画像を蓄積するケースではラスターイメージを生成するのが一般的である。蓄積は長期間にわたるため、閲覧性が長期間保証されるフォーマットが適切である。具体的には、画像処理装置200からPDLを受信していたケースでは、そのPDLからラスターイメージへの変換を行う。
属性は、画像処理装置200上で処理を行うに発生したジョブ情報のことである。例えば、処理したユーザーを示すユーザーID、処理を行った日時、ジョブの種類(プリント、コピーなど)、用紙サイズ、ページ数等がある。なお、画像処理装置200を用いる際に、例えば、ICカード、生体認証等による認証を行うことによってユーザーIDを取得できる。
保存情報保存モジュール150は、保存情報生成モジュール140によって生成された蓄積対象を記憶装置に蓄積する。例えば、ハードディスク等の特定ディレクトリに格納するようにしてもよいし、データベースシステムを構築しておき、そのデータベースシステムに格納するようにしてもよい。
保存情報決定テーブル160は、保存情報選択モジュール130の選択処理に用いる判断基準(選択ルール)を記憶している。例えば、文字数の閾値と蓄積情報の対応付け(ひも付け)を記録している。また、用紙サイズ別に文字数の閾値と蓄積情報を設定できるようにしてもよい。具体的には、用紙サイズがA4である場合は、100文字を超えていれば文字を保存する。100文字以下であれば画像を保存するといった情報を記録する。具体的には、後述する図4の例に示す保存情報決定テーブル400、図6の例に示す保存情報決定テーブル600、図7の例に示す保存情報決定テーブル700、図9の例に示す保存情報決定テーブル900がある。
The storage information generation module 140 generates information to be accumulated selected by the storage information selection module 130. Specifically, the image data itself received by the image receiving module 110 (processing by the storage information generation module 140 is unnecessary), or the characters extracted by the character information acquisition module 120 (storage information generation module 140). Or processing from PDL to a raster image. A reduced image may be generated. Furthermore, you may perform the process which matches these and an attribute.
Specifically, the saved information generation module 140 generates accumulated information. The accumulated information candidates are as follows.
-Image / Character / Attribute / Reduced Image A raster image is generally generated in the case where images are stored. Since accumulation takes a long time, a format that ensures long-term browsing is appropriate. Specifically, in the case where the PDL is received from the image processing apparatus 200, the PDL is converted into a raster image.
The attribute is job information generated when processing is performed on the image processing apparatus 200. For example, there are a user ID indicating the user who has processed, date and time of processing, job type (print, copy, etc.), paper size, number of pages, and the like. Note that when the image processing apparatus 200 is used, a user ID can be acquired by performing authentication using, for example, an IC card or biometric authentication.
The storage information storage module 150 stores the storage target generated by the storage information generation module 140 in a storage device. For example, it may be stored in a specific directory such as a hard disk, or a database system may be constructed and stored in the database system.
The stored information determination table 160 stores determination criteria (selection rules) used for the selection process of the stored information selection module 130. For example, a correspondence (string attachment) between the threshold value of the number of characters and accumulated information is recorded. Further, a threshold value for the number of characters and accumulated information may be set for each paper size. Specifically, when the paper size is A4, the character is stored if it exceeds 100 characters. If it is 100 characters or less, information such as saving an image is recorded. Specifically, the storage information determination table 400 shown in the example of FIG. 4 described later, the storage information determination table 600 shown in the example of FIG. 6, the storage information determination table 700 shown in the example of FIG. 7, and the storage shown in the example of FIG. There is an information determination table 900.

図2は、本実施の形態を利用したシステム構成例を示す説明図である。
画像蓄積装置100と画像処理装置200は、通信回線290を介して接続されている。通信回線290は、無線、有線、これらの組み合わせであってもよく、例えば、通信インフラとしてのインターネット、イントラネット等であってもよい。また、画像蓄積装置100による機能は、クラウドサービスとして実現してもよい。
画像処理装置200は、前述の複写機、ファックス、スキャナ、プリンタ、複合機等の画像処理装置である。もちろんのことながら、プリンタのように紙での出力だけでなく、スキャナのように電子データの配付を行うこともできる。そして、電子データの配付を行うケースでは、その電子データの格納先となる。なお、格納先として、ファイルシステムやリポジトリなど文書を管理できる機能を有していてもよい。
画像蓄積装置100は、画像処理装置200で処理した画像(又は処理対象とした画像)を予め定められた期間保管するサーバーである。情報漏えい時、漏えいした画像とその画像の属性(出力等を行ったユーザーや出力日時の情報など)から漏えい元を特定することに利用する。
FIG. 2 is an explanatory diagram showing a system configuration example using the present embodiment.
The image storage device 100 and the image processing device 200 are connected via a communication line 290. The communication line 290 may be wireless, wired, or a combination thereof, and may be, for example, the Internet or an intranet as a communication infrastructure. Further, the function of the image storage device 100 may be realized as a cloud service.
The image processing apparatus 200 is an image processing apparatus such as the above-described copying machine, fax machine, scanner, printer, or multifunction machine. Of course, not only paper output as in a printer but also electronic data distribution as in a scanner can be performed. In the case where electronic data is distributed, the electronic data is stored. The storage destination may have a function for managing documents such as a file system and a repository.
The image storage device 100 is a server that stores an image (or an image to be processed) processed by the image processing device 200 for a predetermined period. At the time of information leakage, it is used to identify the leakage source from the leaked image and the attribute of the image (such as the user who performed the output and the information of the output date and time).

図3は、本実施の形態による処理例を示すフローチャートである。
ステップS302では、イメージを受信する。前述したように、イメージともに属性を受信してもよい。
ステップS304では、処理対象ページを取り出す。1ページずつ処理するために処理対象ページを取り出す。例えば、先頭のページから順に取り出す。なお、具体的なシステムにおいては、この後の処理はページ単位での処理は不要なケースもある。その場合は、本処理の後に続くページ単位での処理の手前で文書単位(複数ページまとめて)で処理を実行するように構成してもよい。
FIG. 3 is a flowchart showing an example of processing according to this embodiment.
In step S302, an image is received. As described above, attributes may be received for both images.
In step S304, the processing target page is extracted. A processing target page is taken out for processing one page at a time. For example, the pages are sequentially extracted from the first page. In a specific system, the subsequent processing may not be performed in units of pages. In this case, the process may be executed in document units (collectively including a plurality of pages) before the process in page units following this process.

ステップS306では、処理対象のページのサムネイルを生成する。ページ単位でのサムネイル生成が不要な場合は、必要なページのみサムネイル生成するように処理フローを構成してもよい。例えば、「必要なページ」として、先頭ページのみでよい場合等がある。
ステップS308では、受信したイメージから文字情報を抽出する。例えば、受信したイメージがPDL等の構造解析により文字情報を抽出できる場合はデータの構造解析を行って文字情報を抽出する。また、例えば受信したイメージがラスターイメージであれば、文字認識を行って文字情報を抽出する。
In step S306, a thumbnail of the page to be processed is generated. When it is not necessary to generate thumbnails in units of pages, the processing flow may be configured to generate thumbnails only for necessary pages. For example, as the “necessary page”, only the first page may be required.
In step S308, character information is extracted from the received image. For example, when the received image can extract character information by structural analysis such as PDL, the character information is extracted by analyzing the structure of the data. For example, if the received image is a raster image, character recognition is performed to extract character information.

ステップS310では、保存情報決定テーブルを参照する。具体的には、例えば、抽出した文字情報と、属性から取得した用紙サイズ情報を元に、保存情報決定テーブル400を参照し、保存情報の値を取得する。図4は、保存情報決定テーブル400のデータ構造例を示す説明図である。保存情報決定テーブル400は、設定ID欄410、用紙サイズ欄420、文字数欄430、保存情報欄440を有している。設定ID欄410は、本実施の形態において、設定を一意に識別するための情報(設定ID:IDentification)を記憶している。用紙サイズ欄420は、用紙サイズを記憶している。文字数欄430は、文字数を記憶している。保存情報欄440は、保存情報を記憶している。つまり、用紙サイズ欄420と文字数欄430を条件として、その条件を満たす行の保存情報欄440を保存情報として決定している。例えば、設定ID:1では、用紙サイズが「A4」で、文字数が「100未満」であるならば、イメージ(画像そのもの)で保存することを示しており、設定ID:2では、用紙サイズが「A4」で、文字数が「100以上」であるならば、文字(文字認識結果等)で保存することを示している。なお、用紙サイズ欄420を省略して、単に文字数(文字数欄430)から保存情報(保存情報欄440)を決定するようにしてもよい。   In step S310, the storage information determination table is referred to. Specifically, for example, based on the extracted character information and the paper size information acquired from the attribute, the storage information determination table 400 is referred to, and the value of the storage information is acquired. FIG. 4 is an explanatory diagram showing an example of the data structure of the storage information determination table 400. The storage information determination table 400 includes a setting ID column 410, a paper size column 420, a character number column 430, and a storage information column 440. The setting ID column 410 stores information (setting ID: IDentification) for uniquely identifying the setting in the present embodiment. The paper size column 420 stores the paper size. The character number column 430 stores the number of characters. The saved information column 440 stores saved information. In other words, the paper size column 420 and the character number column 430 are used as conditions, and the storage information column 440 of the line that satisfies the conditions is determined as the storage information. For example, if the setting ID is 1 and the paper size is “A4” and the number of characters is “less than 100”, this indicates that the image (the image itself) is saved. The setting ID: 2 indicates that the paper size is If “A4” and the number of characters is “100 or more”, it indicates that the characters (character recognition results, etc.) are to be stored. Note that the paper size column 420 may be omitted, and the storage information (storage information column 440) may be determined simply from the number of characters (character number column 430).

ステップS312では、文字情報を保存するか否かを判断し、保存する場合はステップS314へ進み、それ以外の場合はステップS316へ進む。前ステップで取得した保存情報により処理を分けている。
ステップS314では、保存情報へ文字情報を追加する。
ステップS316では、保存情報へイメージ情報を追加する。
ステップS318では、保存イメージを生成する。保存用のイメージは、通常、予め定められたフォーマットであるため、そのフォーマットに変換する。変換が不要な場合は、ここでの変換処理は不要である。例えば、画像処理装置200から受信したイメージのフォーマットは、画像処理装置200の機種等により異なるケースがある。その場合、画像蓄積装置100側で、例えばPDF等から、長期保存に適したフォーマット(例えば、ラスターイメージ等)に変換する。
In step S312, it is determined whether or not the character information is to be stored. If so, the process proceeds to step S314. Otherwise, the process proceeds to step S316. Processing is divided according to the storage information acquired in the previous step.
In step S314, character information is added to the saved information.
In step S316, image information is added to the saved information.
In step S318, a saved image is generated. Since the image for storage is usually in a predetermined format, it is converted into that format. If the conversion is unnecessary, the conversion process here is unnecessary. For example, the format of the image received from the image processing apparatus 200 may vary depending on the model of the image processing apparatus 200 and the like. In that case, the image storage apparatus 100 converts the format from, for example, PDF into a format suitable for long-term storage (for example, a raster image).

ステップS320では、ページ単位の保存情報を記録する。例えば、ページ単位でどの保存情報を保存するかの情報を一時記憶領域などに記録する。前ステップまでで決定した文字情報又はイメージ情報に加えて、共通の基本的な保存情報であるサムネイル等の情報を加えて、ページ単位の保存情報とする。
ステップS322では、未処理ページがないか否かを判断し、ない場合はステップS324へ進み、それ以外の場合はステップS304へ戻る。つまり、未処理のページがあればステップS304に戻る。
In step S320, storage information for each page is recorded. For example, information about which saved information is saved in units of pages is recorded in a temporary storage area or the like. In addition to the character information or image information determined up to the previous step, information such as thumbnails, which is common basic storage information, is added to obtain storage information for each page.
In step S322, it is determined whether or not there is an unprocessed page. If there is no unprocessed page, the process proceeds to step S324; otherwise, the process returns to step S304. That is, if there is an unprocessed page, the process returns to step S304.

ステップS324では、保存情報を保存する。例えば、ファイルシステム上の特定ディレクトリや文書データベースシステムに、保存対象の情報を記録する。文書単位で共通である文書の属性(画像処理装置200から受信した画像処理装置200上での処理に関する属性)とステップS320で一時領域等に保存したページ単位の保存情報を元に、保存対象の情報を記録する。
文書単位の保存情報として、例えば、文書の属性(画像処理装置200上での処理に関する属性)等がある。
ページ単位で共通しての保存情報として、サムネイルがある。ただし、サムネイルは全ページ分を必要としないケース(例えば、先頭のページだけのサムネイルを必要とするケース)があり、そのケースにおいては、文書単位で生成するように構成してもよい。
そして、ページ単位の保存情報として、文字情報、イメージのうち、どちらか一方を保存する。
In step S324, the storage information is stored. For example, information to be stored is recorded in a specific directory on the file system or a document database system. Based on the document attributes common to each document (attributes related to processing on the image processing apparatus 200 received from the image processing apparatus 200) and the storage information for each page stored in the temporary area or the like in step S320, Record information.
The stored information in document units includes, for example, document attributes (attributes related to processing on the image processing apparatus 200).
There is a thumbnail as common storage information for each page. However, there is a case where thumbnails do not require all pages (for example, a case where thumbnails of only the first page are required). In that case, the thumbnails may be generated in units of documents.
Then, either one of the character information and the image is stored as the storage information for each page.

図5は、本実施の形態による処理例を示すフローチャートである。サムネイルの解像度も変更対象とした処理例を示すものである。図3の例に示すフローチャートと異なる点は、主に、ステップS508、ステップS306の代わりにステップS518としたことである。
イメージを保存せず、文字情報を保存する決定をした場合、サムネイルの解像度を通常よりも高くするように構成してもよい。また、文字情報の量に応じてサムネイルの解像度を設定できるように構成してもよい。
このように構成することで、文字中心の文書の記録情報として文字情報に加えて、文書構成が確認できる程度の解像度(処理対象とした画像の解像度よりも低い解像度)のイメージ(縮小画像)を保存することができるようになる。
なお、通常400dpi〜600dpiといった画像処理装置200での処理の解像度と同程度の解像度でイメージを保存している。また、イメージログシステムで文書を検索した結果を表示する際に、イメージの一覧をサムネイル表示するために25dpi程度のサムネイル画像を作成して保存している。図5の例に示すフローチャートの処理では、サムネイルの解像度を文書に含まれている文字情報に応じて、50dpi〜72dpiなどプレビューでイメージの概略をつかむことができる程度の解像度にあげて保存するようにしている。
FIG. 5 is a flowchart showing an example of processing according to the present embodiment. A processing example in which the resolution of the thumbnail is also a change target is shown. The difference from the flowchart shown in the example of FIG. 3 is that step S518 is mainly performed instead of step S508 and step S306.
If it is decided to save the character information without saving the image, the resolution of the thumbnail may be set higher than usual. The thumbnail resolution may be set according to the amount of character information.
With this configuration, in addition to character information as character-centered document recording information, an image (reduced image) having a resolution (resolution lower than the resolution of the image to be processed) that can confirm the document structure is obtained. Can be saved.
Note that the image is stored at a resolution similar to the resolution of the processing performed by the image processing apparatus 200, typically 400 dpi to 600 dpi. Further, when displaying the result of searching for a document in the image log system, a thumbnail image of about 25 dpi is created and stored in order to display a thumbnail list of images. In the processing of the flowchart shown in the example of FIG. 5, the resolution of the thumbnail is increased to a resolution that can grasp the outline of the image by preview, such as 50 dpi to 72 dpi, according to the character information included in the document. I have to.

ステップS502では、イメージを受信する。
ステップS504では、処理対象ページを取り出す。
ステップS506では、文字情報を抽出する。
In step S502, an image is received.
In step S504, the processing target page is extracted.
In step S506, character information is extracted.

ステップS508では、保存情報決定テーブルを参照する。具体的には、例えば、抽出した文字情報と、属性から取得した用紙サイズ情報を元に、保存情報決定テーブル600を参照し、保存情報の値を取得する。図6は、保存情報決定テーブル600のデータ構造例を示す説明図である。保存情報決定テーブル600は、図4の例に示した保存情報決定テーブル400にサムネイル解像度欄650を付加したものである。保存情報をイメージとするか文字とするかを選択するとともに、サムネイル解像度も文書/ページに応じて変更できるように構成したものである。保存情報決定テーブル600は、設定ID欄610、用紙サイズ欄620、文字数欄630、保存情報欄640、サムネイル解像度欄650を有している。設定ID欄610は、設定IDを記憶している。用紙サイズ欄620は、用紙サイズを記憶している。文字数欄630は、文字数を記憶している。保存情報欄640は、保存情報を記憶している。サムネイル解像度欄650は、サムネイル解像度を記憶している。つまり、用紙サイズ欄620と文字数欄630を条件として、その条件を満たす行の保存情報欄640を保存情報とし、サムネイル解像度欄650をサムネイルの解像度として決定している。なお、用紙サイズ欄620を省略して、単に文字数(文字数欄630)から保存情報(保存情報欄640、サムネイル解像度欄650)を決定するようにしてもよい。
ここで、例えば、用紙サイズ:A3(設定ID:3〜5)について説明する。設定ID:3では、文字数:150未満の場合は、保存情報欄640はイメージとし、サムネイル解像度欄650は25dpi(Dots Per Inch)としている。この25dpiは、ここでは低解像度の例である。画像をイメージ(画像そのもの)として保存しているので、サムネイルは低解像度としている。つまり、その画像の詳細な内容を知りたい場合は、画像そのものを閲覧すればよいからである。設定ID:5では、文字数:200以上の場合は、保存情報欄640は文字とし、サムネイル解像度欄650は50dpiとしている。この50dpiは、ここでは中解像度の例である。文字を主体とした文書であるが、文字以外の情報(写真、図形等)もある可能性があるので、サムネイルの解像度を低解像度よりは高い解像度(中解像度)としている。そして、その中間である設定ID:4では、文字数:150以上200未満の場合は、保存情報欄640は文字とし、サムネイル解像度欄650は72dpiとしている。この72dpiは、ここでは高解像度の例である。文字と文字以外の情報(写真、図形等)が混在している可能性が高いので、サムネイルの解像度を中解像度よりも高い解像度(高解像度)としている。ここで、第1の閾値として200文字、第2の閾値として150文字を挙げ、第1の解像度として50dpi(中解像度)、第2の解像度として72dpi(高解像度)、第3の解像度として25dpi(低解像度)を挙げているが、もちろんのことながら、これらは例示である。第2の閾値は第1の閾値よりも低いという関係性を有していればよい。そして、第2の解像度は第1の解像度よりも高く、第3の解像度は第1の解像度よりも低いという関係性を有していればよい。ここでは、2つの閾値(第1の閾値、第2の閾値)を用いて、3つの範囲に分けたが、3以上の閾値を用いて、4以上の範囲に分けるようにしてもよい。その場合のサムネイルの解像度は、文字と文字以外の情報(写真、図形等)の混在度合いによって定めればよい。
In step S508, the storage information determination table is referred to. Specifically, for example, based on the extracted character information and the paper size information acquired from the attribute, the storage information determination table 600 is referred to, and the value of the storage information is acquired. FIG. 6 is an explanatory diagram showing an example of the data structure of the saved information determination table 600. The storage information determination table 600 is obtained by adding a thumbnail resolution column 650 to the storage information determination table 400 shown in the example of FIG. In addition to selecting whether the stored information is an image or a character, the thumbnail resolution can be changed according to the document / page. The storage information determination table 600 includes a setting ID column 610, a paper size column 620, a character number column 630, a storage information column 640, and a thumbnail resolution column 650. The setting ID column 610 stores setting IDs. The paper size column 620 stores the paper size. The character number column 630 stores the number of characters. The saved information column 640 stores saved information. The thumbnail resolution column 650 stores thumbnail resolution. In other words, the paper size column 620 and the character count column 630 are used as conditions, the storage information column 640 of the line satisfying the conditions is set as the storage information, and the thumbnail resolution column 650 is determined as the thumbnail resolution. Note that the paper size column 620 may be omitted, and the storage information (storage information column 640, thumbnail resolution column 650) may be determined simply from the number of characters (character number column 630).
Here, for example, paper size: A3 (setting ID: 3 to 5) will be described. When the setting ID is 3 and the number of characters is less than 150, the storage information column 640 is an image, and the thumbnail resolution column 650 is 25 dpi (Dots Per Inch). This 25 dpi is an example of low resolution here. Since the image is stored as an image (the image itself), the thumbnail has a low resolution. That is, when it is desired to know the detailed contents of the image, it is only necessary to browse the image itself. When the setting ID is 5 and the number of characters is 200 or more, the storage information column 640 is a character, and the thumbnail resolution column 650 is 50 dpi. This 50 dpi is an example of medium resolution here. Although the document is mainly composed of characters, there is a possibility that information other than characters (photographs, graphics, etc.) may be present, so the thumbnail resolution is set to a higher resolution (medium resolution) than a low resolution. In the middle setting ID: 4, when the number of characters is 150 or more and less than 200, the storage information column 640 is set to characters, and the thumbnail resolution column 650 is set to 72 dpi. This 72 dpi is an example of high resolution here. Since there is a high possibility that characters and information other than characters (photos, graphics, etc.) are mixed, the thumbnail resolution is set to a higher resolution (high resolution) than the medium resolution. Here, the first threshold is 200 characters, the second threshold is 150 characters, the first resolution is 50 dpi (medium resolution), the second resolution is 72 dpi (high resolution), and the third resolution is 25 dpi ( Of course, these are examples. It is sufficient that the second threshold value has a relationship that it is lower than the first threshold value. The second resolution may be higher than the first resolution and the third resolution may be lower than the first resolution. Here, two threshold values (first threshold value, second threshold value) are used to divide into three ranges, but three or more threshold values may be used to divide into four or more ranges. The resolution of the thumbnail in that case may be determined by the degree of mixing of characters and information other than characters (photos, graphics, etc.).

ステップS510では、文字情報を保存するか否かを判断し、保存する場合はステップS512へ進み、それ以外の場合はステップS514へ進む。
ステップS512では、保存情報へ文字情報を追加する。
ステップS514では、保存情報へイメージ情報を追加する。
ステップS516では、保存イメージを生成する。
ステップS518では、保存情報決定テーブル600にしたがってサムネイルを生成する。
ステップS520では、ページ単位の保存情報を記録する。
ステップS522では、未処理ページがないか否かを判断し、ない場合はステップS524へ進み、それ以外の場合はステップS504へ戻る。
ステップS524では、保存情報を保存する。
In step S510, it is determined whether or not the character information is to be stored. If so, the process proceeds to step S512. Otherwise, the process proceeds to step S514.
In step S512, character information is added to the saved information.
In step S514, image information is added to the saved information.
In step S516, a saved image is generated.
In step S518, a thumbnail is generated according to the storage information determination table 600.
In step S520, storage information for each page is recorded.
In step S522, it is determined whether or not there is an unprocessed page. If there is no unprocessed page, the process proceeds to step S524; otherwise, the process returns to step S504.
In step S524, the storage information is stored.

文字数だけで判定するのではなく、文書に含まれているキーワードを元に保存方法を選択するように構成してもよい。
含まれているキーワードと保存情報の関連付け(ひも付け)を記録したテーブル(例えば、保存情報決定テーブル700)を別途用意し、保存処理のフローの中で参照するように構成する。
文字数とキーワードの両方を併用した場合は、キーワードの設定を優先し、キーワードが無い場合は文字数のテーブル(例えば、保存情報決定テーブル400)で判断するようにしてもよい。
また、1つの文書/ページに複数のキーワードが見つかった場合は、その中に1つでもイメージ保存設定のキーワードがあればイメージ保存を選択するといった処理としてもよい。
図7は、保存情報決定テーブル700のデータ構造例を示す説明図である。保存情報決定テーブル700は、設定ID欄710、キーワード欄720、保存情報欄730を有している。設定ID欄710は、設定IDを記憶している。キーワード欄720は、キーワードを記憶している。保存情報欄730は、保存情報を記憶している。つまり、キーワード欄720を条件として、その条件を満たす行の保存情報欄730を保存情報として決定している。例えば、設定ID:101では、キーワードが「禁複写」であるならば、イメージ(画像そのもの)で保存することを示しており、設定ID:999では、キーワードが「公開情報」であるならば、文字(文字認識結果等)で保存することを示している。
Instead of determining only by the number of characters, a storage method may be selected based on a keyword included in the document.
A table (for example, a storage information determination table 700) in which an association (linkage) between the included keyword and storage information is recorded is prepared separately and referred to in the storage processing flow.
When both the number of characters and the keyword are used together, priority is given to the setting of the keyword, and when there is no keyword, the determination may be made with the table of the number of characters (for example, the storage information determination table 400).
Further, when a plurality of keywords are found in one document / page, the processing may be such that image storage is selected if there is at least one keyword for image storage setting.
FIG. 7 is an explanatory diagram showing an example of the data structure of the storage information determination table 700. As shown in FIG. The saved information determination table 700 has a setting ID column 710, a keyword column 720, and a saved information column 730. The setting ID column 710 stores setting IDs. The keyword column 720 stores keywords. The saved information column 730 stores saved information. That is, the keyword column 720 is used as a condition, and the storage information column 730 of the line that satisfies the condition is determined as the storage information. For example, if the keyword is “prohibited copying” in the setting ID: 101, it indicates that the image (the image itself) is stored. If the keyword is “public information” in the setting ID: 999, This indicates that the data is stored as characters (character recognition results, etc.).

図8は、本実施の形態による処理例を示すフローチャートである。この処理例は、保存情報決定テーブル400と保存情報決定テーブル700を併用して利用した場合の処理を示している。図3の例に示すフローチャートと異なる点は、主に、ステップS810、ステップS814、ステップS816である。
ステップS802では、イメージを受信する。
ステップS804では、処理対象ページを取り出す。
ステップS806では、サムネイルを生成する。
ステップS808では、文字情報を抽出する。
ステップS810では、保存情報決定テーブル700を参照する。
ステップS812では、保存情報決定テーブル400を参照する。
ステップS814では、ステップS810とステップS812での保存情報は同じか否かを判断し、同じ場合はステップS818へ進み、それ以外の場合はステップS816へ進む。
FIG. 8 is a flowchart showing an example of processing according to this embodiment. This processing example shows processing when the storage information determination table 400 and the storage information determination table 700 are used in combination. Differences from the flowchart shown in the example of FIG. 3 are mainly step S810, step S814, and step S816.
In step S802, an image is received.
In step S804, the processing target page is extracted.
In step S806, a thumbnail is generated.
In step S808, character information is extracted.
In step S810, the storage information determination table 700 is referred to.
In step S812, the storage information determination table 400 is referred to.
In step S814, it is determined whether the saved information in step S810 and step S812 is the same. If they are the same, the process proceeds to step S818. Otherwise, the process proceeds to step S816.

ステップS816では、ステップS810での保存情報を採用する。
ステップS818では、文字情報を保存するか否かを判断し、保存する場合はステップS820へ進み、それ以外の場合はステップS822へ進む。
ステップS820では、保存情報へ文字情報を追加する。
ステップS822では、保存情報へイメージ情報を追加する。
ステップS824では、保存イメージを生成する。
ステップS826では、ページ単位の保存情報を記録する。
ステップS828では、未処理ページがないか否かを判断し、ない場合はステップS830へ進み、それ以外の場合はステップS804へ戻る。
ステップS830では、保存情報を保存する。
In step S816, the storage information in step S810 is adopted.
In step S818, it is determined whether or not the character information is to be stored. If so, the process proceeds to step S820. Otherwise, the process proceeds to step S822.
In step S820, character information is added to the saved information.
In step S822, image information is added to the saved information.
In step S824, a saved image is generated.
In step S826, storage information for each page is recorded.
In step S828, it is determined whether there is an unprocessed page. If there is no unprocessed page, the process proceeds to step S830. Otherwise, the process returns to step S804.
In step S830, the storage information is stored.

さらに、文字情報(文字数、キーワード)でなく、文書に含まれるオブジェクト情報に基づいて、保存情報を決定するように構成してもよい。
例えば、非ラスターフォーマットであれば文書構造によってはどのような図形が含まれているか判断することも文書構造の解析によって可能であるため、図形の有無等によって保存情報を決定するように構成してもよい。
また、例えば、ラスターフォーマットであれば文字認識処理を応用して、文字認識処理が認識したオブジェクトの有無などで保存情報を決定するように構成してもよい。例えば、文字認識処理では表のオブジェクトがあるか否かを認識できるものもある。
図9は、保存情報決定テーブル900のデータ構造例を示す説明図である。保存情報決定テーブル900は、設定ID欄910、オブジェクト欄920、保存情報欄930を有している。設定ID欄910は、設定IDを記憶している。オブジェクト欄920は、オブジェクトを記憶している。保存情報欄930は、保存情報を記憶している。つまり、オブジェクト欄920を条件として、その条件を満たす行の保存情報欄930を保存情報として決定している。例えば、設定ID:1001では、オブジェクトが「組織図」であるならば、イメージ(画像そのもの)で保存することを示しており、設定ID:1002では、オブジェクトが「3行×3列以上の行又は列を有している表」であるならば、イメージ(画像そのもの)で保存することを示している。
Furthermore, the storage information may be determined based on object information included in the document instead of character information (number of characters, keywords).
For example, in the non-raster format, it is possible to determine what kind of figure is included depending on the document structure by analyzing the document structure. Also good.
Further, for example, in the case of a raster format, it may be configured to apply the character recognition process and determine the stored information based on the presence or absence of an object recognized by the character recognition process. For example, some character recognition processes can recognize whether or not there is a table object.
FIG. 9 is an explanatory diagram showing an example of the data structure of the saved information determination table 900. The saved information determination table 900 has a setting ID column 910, an object column 920, and a saved information column 930. The setting ID column 910 stores setting IDs. The object column 920 stores objects. The saved information column 930 stores saved information. In other words, the object column 920 is used as a condition, and the storage information column 930 of a row that satisfies the condition is determined as storage information. For example, the setting ID: 1001 indicates that if the object is an “organization chart”, it is stored as an image (the image itself). In the setting ID: 1002, the object is “rows of 3 rows × 3 columns or more. If it is a “table having a column”, it means that the image is stored as an image (the image itself).

図10は、本実施の形態による処理例を示すフローチャートである。この処理例は、保存情報決定テーブル900を利用した場合の処理を示している。図3の例に示すフローチャートと異なる点は、主に、ステップS1008、ステップS1010である。
ステップS1002では、イメージを受信する。
ステップS1004では、処理対象ページを取り出す。
ステップS1006では、サムネイルを生成する。
ステップS1008では、オブジェクトを抽出する。
ステップS1010では、保存情報決定テーブル900を参照する。
ステップS1012では、文字情報を保存するか否かを判断し、保存する場合はステップS1014へ進み、それ以外の場合はステップS1016へ進む。
ステップS1014では、保存情報へ文字情報を追加する。
ステップS1016では、保存情報へイメージ情報を追加する。
ステップS1018では、保存イメージを生成する。
ステップS1020では、ページ単位の保存情報を記録する。
ステップS1022では、未処理ページがないか否かを判断し、ない場合はステップS1024へ進み、それ以外の場合はステップS1004へ戻る。
ステップS1024では、保存情報を保存する。
FIG. 10 is a flowchart showing an example of processing according to this embodiment. This processing example shows processing when the saved information determination table 900 is used. The difference from the flowchart shown in the example of FIG. 3 is mainly steps S1008 and S1010.
In step S1002, an image is received.
In step S1004, the processing target page is extracted.
In step S1006, a thumbnail is generated.
In step S1008, an object is extracted.
In step S1010, the storage information determination table 900 is referred to.
In step S1012, it is determined whether or not character information is to be stored. If so, the process proceeds to step S1014. Otherwise, the process proceeds to step S1016.
In step S1014, character information is added to the saved information.
In step S1016, image information is added to the saved information.
In step S1018, a saved image is generated.
In step S1020, storage information for each page is recorded.
In step S1022, it is determined whether or not there is an unprocessed page. If not, the process proceeds to step S1024. Otherwise, the process returns to step S1004.
In step S1024, the storage information is stored.

図11は、本実施の形態による処理例を示すフローチャートである。この処理例は、保存情報決定テーブル400と保存情報決定テーブル900を併用して利用した場合の処理を示している。図3の例に示すフローチャートと異なる点は、主に、ステップS1108、ステップS1110、ステップS1114、ステップS1116である。
ステップS1102では、イメージを受信する。
ステップS1104では、処理対象ページを取り出す。
ステップS1106では、サムネイルを生成する。
ステップS1108では、オブジェクトを抽出する。
ステップS1110では、保存情報決定テーブル900を参照する。
ステップS1112では、保存情報決定テーブル400を参照する。
ステップS1114では、ステップS1110とステップS1112での保存情報は同じか否かを判断し、同じ場合はステップS1118へ進み、それ以外の場合はステップS1116へ進む。
FIG. 11 is a flowchart showing an example of processing according to the present embodiment. This processing example shows processing when the storage information determination table 400 and the storage information determination table 900 are used in combination. Differences from the flowchart shown in the example of FIG. 3 are mainly step S1108, step S1110, step S1114, and step S1116.
In step S1102, an image is received.
In step S1104, the processing target page is extracted.
In step S1106, a thumbnail is generated.
In step S1108, an object is extracted.
In step S1110, the storage information determination table 900 is referred to.
In step S1112, the stored information determination table 400 is referred to.
In step S1114, it is determined whether the stored information in step S1110 and step S1112 is the same. If they are the same, the process proceeds to step S1118. Otherwise, the process proceeds to step S1116.

ステップS1116では、ステップS1110での保存情報を採用する。
ステップS1118では、文字情報を保存するか否かを判断し、保存する場合はステップS1120へ進み、それ以外の場合はステップS1122へ進む。
ステップS1120では、保存情報へ文字情報を追加する。
ステップS1122では、保存情報へイメージ情報を追加する。
ステップS1124では、保存イメージを生成する。
ステップS1126では、ページ単位の保存情報を記録する。
ステップS1128では、未処理ページがないか否かを判断し、ない場合はステップS1130へ進み、それ以外の場合はステップS1104へ戻る。
ステップS1130では、保存情報を保存する。
In step S1116, the storage information in step S1110 is adopted.
In step S1118, it is determined whether or not the character information is to be stored. If so, the process proceeds to step S1120. Otherwise, the process proceeds to step S1122.
In step S1120, character information is added to the saved information.
In step S1122, image information is added to the saved information.
In step S1124, a saved image is generated.
In step S1126, storage information for each page is recorded.
In step S1128, it is determined whether or not there is an unprocessed page. If there is no unprocessed page, the process proceeds to step S1130. Otherwise, the process returns to step S1104.
In step S1130, the storage information is stored.

さらに、保存情報決定テーブル600と保存情報決定テーブル700の併用、保存情報決定テーブル600と保存情報決定テーブル900の併用、保存情報決定テーブル400と保存情報決定テーブル700と保存情報決定テーブル900の併用、保存情報決定テーブル600と保存情報決定テーブル700と保存情報決定テーブル900の併用等を行ってもよい。また、3つのテーブルを用いた場合で、異なる保存情報となった場合は、予め定められたテーブルの結果を優先するようにしてもよいし、多数決で決定するようにしてもよい。   Furthermore, a combination of the storage information determination table 600 and the storage information determination table 700, a combination of the storage information determination table 600 and the storage information determination table 900, a combination of the storage information determination table 400, the storage information determination table 700, and the storage information determination table 900, The storage information determination table 600, the storage information determination table 700, and the storage information determination table 900 may be used in combination. In addition, when three tables are used and different storage information is obtained, the result of a predetermined table may be prioritized or determined by majority vote.

図12を参照して、本実施の形態の画像蓄積装置のハードウェア構成例について説明する。図12に示す構成は、例えばパーソナルコンピュータ(PC)等によって構成されるものであり、スキャナ等のデータ読み取り部1217と、プリンタ等のデータ出力部1218を備えたハードウェア構成例を示している。   With reference to FIG. 12, an example of the hardware configuration of the image storage apparatus of the present embodiment will be described. The configuration shown in FIG. 12 is configured by a personal computer (PC), for example, and shows a hardware configuration example including a data reading unit 1217 such as a scanner and a data output unit 1218 such as a printer.

CPU(Central Processing Unit)1201は、前述の実施の形態において説明した各種のモジュール、すなわち、イメージ受信モジュール110、文字情報取得モジュール120、保存情報選択モジュール130、保存情報生成モジュール140等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。   A CPU (Central Processing Unit) 1201 includes various modules described in the above-described embodiments, that is, the modules such as the image reception module 110, the character information acquisition module 120, the storage information selection module 130, and the storage information generation module 140. It is a control part which performs the process according to the computer program which described the execution sequence.

ROM(Read Only Memory)1202は、CPU1201が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1203は、CPU1201の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバス等から構成されるホストバス1204により相互に接続されている。   A ROM (Read Only Memory) 1202 stores programs used by the CPU 1201, calculation parameters, and the like. A RAM (Random Access Memory) 1203 stores programs used in the execution of the CPU 1201, parameters that change as appropriate during the execution, and the like. These are connected to each other by a host bus 1204 configured by a CPU bus or the like.

ホストバス1204は、ブリッジ1205を介して、PCI(Peripheral Component Interconnect/Interface)バス等の外部バス1206に接続されている。   The host bus 1204 is connected to an external bus 1206 such as a PCI (Peripheral Component Interconnect / Interface) bus via a bridge 1205.

キーボード1208、マウス等のポインティングデバイス1209は、操作者により操作されるデバイスである。ディスプレイ1210は、液晶表示装置又はCRT(Cathode Ray Tube)等があり、各種情報をテキストやイメージ情報として表示する。また、ポインティングデバイス1209とディスプレイ1210の両方の機能を備えているタッチスクリーン等であってもよい。   A keyboard 1208 and a pointing device 1209 such as a mouse are devices operated by an operator. The display 1210 includes a liquid crystal display device or a CRT (Cathode Ray Tube), and displays various types of information as text or image information. Further, a touch screen or the like having both functions of the pointing device 1209 and the display 1210 may be used.

HDD(Hard Disk Drive)1211は、ハードディスク(フラッシュ・メモリ等であってもよい)を内蔵し、ハードディスクを駆動し、CPU1201によって実行するプログラムや情報を記録又は再生させる。ハードディスクは、保存情報保存モジュール150、保存情報決定テーブル160を記憶する記憶装置等としての機能を実現させる。さらに、その他の各種データ、各種コンピュータ・プログラム等が格納される。   An HDD (Hard Disk Drive) 1211 includes a hard disk (may be a flash memory or the like), drives the hard disk, and records or reproduces a program executed by the CPU 1201 and information. The hard disk realizes functions as a storage device for storing the storage information storage module 150 and the storage information determination table 160. Further, various other data, various computer programs, and the like are stored.

ドライブ1212は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1213に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1207、外部バス1206、ブリッジ1205、及びホストバス1204を介して接続されているRAM1203に供給する。なお、リムーバブル記録媒体1213も、データ記録領域として利用可能である。   The drive 1212 reads data or a program recorded in a removable recording medium 1213 such as a magnetic disk, an optical disk, a magneto-optical disk, or a semiconductor memory, and the data or program is read out to the interface 1207 and the external bus 1206. , The bridge 1205, and the RAM 1203 connected via the host bus 1204. Note that the removable recording medium 1213 can also be used as a data recording area.

接続ポート1214は、外部接続機器1215を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1214は、インタフェース1207、及び外部バス1206、ブリッジ1205、ホストバス1204等を介してCPU1201等に接続されている。通信部1216は、通信回線に接続され、外部とのデータ通信処理を実行する。データ読み取り部1217は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1218は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。   The connection port 1214 is a port for connecting the external connection device 1215 and has a connection unit such as USB, IEEE1394. The connection port 1214 is connected to the CPU 1201 and the like via the interface 1207, the external bus 1206, the bridge 1205, the host bus 1204, and the like. The communication unit 1216 is connected to a communication line and executes data communication processing with the outside. The data reading unit 1217 is a scanner, for example, and executes document reading processing. The data output unit 1218 is a printer, for example, and executes document data output processing.

なお、図12に示す画像蓄積装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図12に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図12に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。   Note that the hardware configuration of the image storage device shown in FIG. 12 shows one configuration example, and the present embodiment is not limited to the configuration shown in FIG. 12, and the modules described in this embodiment are executed. Any configuration is possible. For example, some modules may be configured with dedicated hardware (for example, Application Specific Integrated Circuit (ASIC), etc.), and some modules are in an external system and connected via a communication line Further, a plurality of systems shown in FIG. 12 may be connected to each other via communication lines so as to cooperate with each other. In particular, in addition to personal computers, portable information communication devices (including mobile phones, smartphones, mobile devices, wearable computers, etc.), information appliances, robots, copiers, fax machines, scanners, printers, multifunction devices (scanners, printers, An image processing apparatus having two or more functions such as a copying machine and a fax machine) may be incorporated.

また、前述の実施の形態の説明内での比較処理において、「以上」、「以下」、「より大きい」、「より小さい(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より大きい」、「より小さい(未満)」、「以上」、「以下」としてもよい。
保存情報の決定において、前述のようにページ単位で決定してもよいし、文書単位で決定してもよい。ここで、文書単位とは、画像処理装置200が1回の処理対象とした画像群であり、1ページのこともあるし、複数のページとなることもある。もちろんのことながら、文書単位の場合は、その文書に含まれるページ全てが同じ形態(文字又はイメージのいずれか)となる。
また、ページ単位で決定する場合、複数ページある文書を想定すると次のような選択結果になるケースが想定される。
1ページ目:イメージ
2ページ目:文字
3ページ目:イメージ
このケースでは、2ページ目のみ文字を保存して、他のページはイメージを保存するということになり、保存されたイメージファイル(2ページになっているもの)を、参照した場合は閲覧性が悪くなる。一般的に、表示アプリケーションは、イメージだけ、文字(テキスト)だけを表示対象としているので、両者を閲覧するためには、別々のアプリケーションを立ち上げなければならないことになる。特に、イメージのページを閲覧している場合は、テキストのページがあることを失念してしまうことがある。そこで、イメージと文字のページが混在していると判断した場合、文字で保存したページについては白紙上に文字を別途保存した旨のイメージを生成し、そのページ(本来の文字で構成されたページ)に挿入するようにしてもよい。これによって、文字のページがあるということが、ユーザーにわかりやすくする。また、文字をイメージに変換して、そのページに挿入するようにしてもよい。
In addition, in the comparison processing in the description of the above-described embodiment, “more than”, “less than”, “greater than”, and “less than (less than)” The values may be “larger”, “smaller (less than)”, “more”, and “less”, respectively.
In determining the stored information, it may be determined in units of pages as described above, or may be determined in units of documents. Here, the document unit is an image group that the image processing apparatus 200 has processed once, and may be one page or a plurality of pages. Needless to say, in the case of a document unit, all pages included in the document have the same form (either character or image).
Further, when the determination is made in units of pages, it is assumed that the following selection result is obtained when a document having a plurality of pages is assumed.
1st page: Image 2nd page: Character 3rd page: Image In this case, only the 2nd page will be saved, and the other pages will save the image. Saved image file (2 pages) If it is referred to), the viewability becomes worse. In general, since display applications are intended to display only images and only characters (text), in order to view both, separate applications must be launched. In particular, if you are browsing an image page, you may forget that you have a text page. Therefore, if it is determined that the image and character pages are mixed, an image indicating that the characters are separately saved on a blank page is generated for the page saved as characters, and the page (a page composed of original characters) is generated. ) May be inserted. This makes it easier for the user to know that there is a page of characters. Also, characters may be converted into images and inserted into the page.

なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digital)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分又は全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
The program described above may be provided by being stored in a recording medium, or the program may be provided by communication means. In that case, for example, the above-described program may be regarded as an invention of a “computer-readable recording medium recording the program”.
The “computer-readable recording medium on which a program is recorded” refers to a computer-readable recording medium on which a program is recorded, which is used for program installation, execution, program distribution, and the like.
The recording medium is, for example, a digital versatile disc (DVD), which is a standard established by the DVD Forum, such as “DVD-R, DVD-RW, DVD-RAM,” and DVD + RW. Standard “DVD + R, DVD + RW, etc.”, compact disc (CD), read-only memory (CD-ROM), CD recordable (CD-R), CD rewritable (CD-RW), Blu-ray disc ( Blu-ray (registered trademark) Disc), magneto-optical disk (MO), flexible disk (FD), magnetic tape, hard disk, read-only memory (ROM), electrically erasable and rewritable read-only memory (EEPROM (registered trademark)) )), Flash memory, Random access memory (RAM) SD (Secure Digital) memory card and the like.
Then, the whole or a part of the program may be recorded on the recording medium for storage or distribution. Also, by communication, for example, a local area network (LAN), a metropolitan area network (MAN), a wide area network (WAN), a wired network used for the Internet, an intranet, an extranet, or a wireless communication It may be transmitted using a transmission medium such as a network or a combination of these, or may be carried on a carrier wave.
Furthermore, the program may be a part or all of another program, or may be recorded on a recording medium together with a separate program. Moreover, it may be divided and recorded on a plurality of recording media. Further, it may be recorded in any manner as long as it can be restored, such as compression or encryption.

100…画像蓄積装置
110…イメージ受信モジュール
120…文字情報取得モジュール
130…保存情報選択モジュール
140…保存情報生成モジュール
150…保存情報保存モジュール
200…画像処理装置
290…通信回線
DESCRIPTION OF SYMBOLS 100 ... Image storage apparatus 110 ... Image receiving module 120 ... Character information acquisition module 130 ... Storage information selection module 140 ... Storage information generation module 150 ... Storage information storage module 200 ... Image processing apparatus 290 ... Communication line

Claims (8)

画像処理装置から画像を受け付ける受付手段と、
前記受付手段によって受け付けられた画像内から文字を抽出する抽出手段と、
前記抽出手段によって抽出された文字の文字数が予め定められた閾値より多い又は以上である場合は、前記画像の代替として、該文字を蓄積する蓄積手段
を有する画像蓄積装置。
Receiving means for receiving an image from the image processing apparatus;
Extracting means for extracting characters from the image received by the receiving means;
An image accumulating apparatus comprising accumulating means for accumulating characters as an alternative to the image when the number of characters extracted by the extracting means is greater than or greater than a predetermined threshold.
前記蓄積手段は、前記画像内の文字数が前記閾値未満又は以下である場合は、前記画像を蓄積する、
請求項1に記載の画像蓄積装置。
The storage means stores the image when the number of characters in the image is less than or less than the threshold;
The image storage device according to claim 1.
前記蓄積手段は、前記画像内の文字に、予め定められた文字列が含まれているか否かにしたがって、画像を蓄積するか、文字を蓄積するかを決定する、
請求項1又は2に記載の画像蓄積装置。
The storage means determines whether to store an image or a character according to whether or not a character string in the image includes a predetermined character string.
The image storage device according to claim 1.
前記蓄積手段は、文字数と予め定められた文字列によって決定した蓄積対象が異なる場合は、予め定められた文字列によって決定した蓄積対象にしたがって、蓄積を行う、
請求項3に記載の画像蓄積装置。
The accumulation means performs accumulation according to the accumulation object determined by the predetermined character string when the accumulation object determined by the number of characters and the predetermined character string is different.
The image storage device according to claim 3.
前記蓄積手段は、前記画像内の構造にしたがって、該画像を蓄積するか、文字を蓄積するかを決定する、
請求項1又は2に記載の画像蓄積装置。
The storage means determines whether to store the image or characters according to the structure in the image;
The image storage device according to claim 1.
前記蓄積手段は、文字数と構造によって決定した蓄積対象が異なる場合は、構造によって決定した蓄積対象にしたがって、蓄積を行う、
請求項3に記載の画像蓄積装置。
The accumulation means performs accumulation according to the accumulation object determined by the structure when the accumulation object determined by the number of characters and the structure is different.
The image storage device according to claim 3.
前記蓄積手段は、前記抽出手段によって抽出された文字の文字数が予め定められた第1の閾値より多い又は以上である場合は、前記画像の代替として、該文字を蓄積し、予め定められた第1の解像度になるように縮小した縮小画像を蓄積し、
該文字数が該第1の閾値未満又は以下であって、第2の閾値より多い又は以上である場合は、該画像の代替として、該文字を蓄積し、前記第1の解像度よりも高い第2の解像度になるように縮小した縮小画像を蓄積し、
該文字数が該第2の閾値未満又は以下である場合は、該画像を蓄積し、前記第1の解像度よりも低い第3の解像度になるように縮小した縮小画像を蓄積し、
前記第2の閾値は、前記第1の閾値よりも低い、
請求項1から6のいずれか一項に記載の画像蓄積装置。
If the number of characters extracted by the extraction unit is greater than or equal to a predetermined first threshold, the storage unit stores the character as a substitute for the image and stores a predetermined number of characters. Accumulate reduced images reduced to 1 resolution,
If the number of characters is less than or less than the first threshold and greater than or greater than the second threshold, the character is stored as an alternative to the image, and a second higher than the first resolution is stored. Accumulate reduced images that have been reduced to a resolution of
If the number of characters is less than or less than the second threshold, the image is accumulated, and a reduced image that is reduced to a third resolution lower than the first resolution is accumulated,
The second threshold is lower than the first threshold;
The image storage device according to claim 1.
コンピュータを、
画像処理装置から画像を受け付ける受付手段と、
前記受付手段によって受け付けられた画像内から文字を抽出する抽出手段と、
前記抽出手段によって抽出された文字の文字数が予め定められた閾値より多い又は以上である場合は、前記画像の代替として、該文字を蓄積する蓄積手段
として機能させるための画像蓄積プログラム。
Computer
Receiving means for receiving an image from the image processing apparatus;
Extracting means for extracting characters from the image received by the receiving means;
An image storage program for functioning as storage means for storing the characters as a substitute for the image when the number of characters extracted by the extraction means is greater than or greater than a predetermined threshold.
JP2016084276A 2016-04-20 2016-04-20 Image storage device and image storage program Active JP6743470B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016084276A JP6743470B2 (en) 2016-04-20 2016-04-20 Image storage device and image storage program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016084276A JP6743470B2 (en) 2016-04-20 2016-04-20 Image storage device and image storage program

Publications (2)

Publication Number Publication Date
JP2017195492A true JP2017195492A (en) 2017-10-26
JP6743470B2 JP6743470B2 (en) 2020-08-19

Family

ID=60156563

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016084276A Active JP6743470B2 (en) 2016-04-20 2016-04-20 Image storage device and image storage program

Country Status (1)

Country Link
JP (1) JP6743470B2 (en)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240468A (en) * 1996-12-27 1998-09-11 Canon Inc Print system, printer, controlling method and print controller and method
JP2000316077A (en) * 1999-04-28 2000-11-14 Canon Inc Image data storage device and method and storage medium
JP2001096818A (en) * 1999-09-28 2001-04-10 Canon Inc Method and apparatus for generating printing data
JP2007004453A (en) * 2005-06-23 2007-01-11 Canon Inc Document management system, document management method, image forming apparatus, and information processor
JP2007306499A (en) * 2006-05-15 2007-11-22 Ricoh Co Ltd Data management apparatus and program for data management apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10240468A (en) * 1996-12-27 1998-09-11 Canon Inc Print system, printer, controlling method and print controller and method
JP2000316077A (en) * 1999-04-28 2000-11-14 Canon Inc Image data storage device and method and storage medium
JP2001096818A (en) * 1999-09-28 2001-04-10 Canon Inc Method and apparatus for generating printing data
JP2007004453A (en) * 2005-06-23 2007-01-11 Canon Inc Document management system, document management method, image forming apparatus, and information processor
JP2007306499A (en) * 2006-05-15 2007-11-22 Ricoh Co Ltd Data management apparatus and program for data management apparatus

Also Published As

Publication number Publication date
JP6743470B2 (en) 2020-08-19

Similar Documents

Publication Publication Date Title
JP6503926B2 (en) Program and information processing apparatus
US9591169B2 (en) Image processing apparatus and program
JP2006120125A (en) Document image information management apparatus and document image information management program
JP5463780B2 (en) Information processing device
US9898236B2 (en) Image processing apparatus and program for printing template images using keyword data
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
JP4172478B2 (en) Document management apparatus and document management method
US20210295033A1 (en) Information processing apparatus and non-transitory computer readable medium
JP6743470B2 (en) Image storage device and image storage program
CN101206708A (en) Image processing apparatus and image processing method
JP2006252455A (en) File management device, file management method and file management program
JP6123519B2 (en) Information processing apparatus and information processing program
JP2011008584A (en) Apparatus and program for processing information
JP6682827B2 (en) Information processing apparatus and information processing program
JP6512000B2 (en) INFORMATION PROCESSING APPARATUS AND INFORMATION PROCESSING PROGRAM
JP6720734B2 (en) Image processing apparatus and image processing program
JP4823049B2 (en) Document image retrieval apparatus and program
US11206336B2 (en) Information processing apparatus, method, and non-transitory computer readable medium
JP6828287B2 (en) Information processing equipment and information processing programs
JP6672762B2 (en) Image processing apparatus and image processing program
JP2019036137A (en) Information processing device, information processing system, and information processing program
JP6996159B2 (en) Information processing equipment and information processing programs
US20220038601A1 (en) Information processing apparatus, information processing method, and nontransitory recording medium
JP2017195499A (en) Image storage apparatus and image storage program
JP2010033357A (en) Job control program and job control system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200401

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200630

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200713

R150 Certificate of patent or registration of utility model

Ref document number: 6743470

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350